AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
One Useful Thing·2026年3月12日 23:10·約14分で読める

ものの形

#AIエージェント#マルチモーダル#動画生成#METRベンチマーク#自律型作業
TL;DR

著者は2025年末以降、ChatGPT時代の「共知能」からAIエージェントによる自律作業を管理する新時代へ移行したと主張し、画像・動画生成の飛躍的進歩やMETRベンチマークによる能力指数関数的向上がその根拠であると分析している。

AI深層分析2026年4月26日 22:26
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

AI利用フェーズの転換

ChatGPT導入後の「プロンプトによる対話(共知能)」から、2025年末以降はClaude CodeやOpenAI Codexのようなエージェントに作業を委ねて結果を管理する「AI管理時代」へ移行したと定義している。

2

マルチモーダル能力の指数関数的向上

画像生成における「カワウソテスト」の進化や、TikTok(ByteDance)製AI動画モデルによる高品質な動画生成事例を示し、視覚・動画領域でも急速な進歩が続いていることを示唆している。

3

自律作業能力の定量的評価

METR Long Tasksなどのベンチマークグラフが、AIが人間の仕事のどの程度を自律的かつ信頼性高く完了できるかを示しており、これがAI能力の指数関数的成長を裏付けていると指摘している。

4

AIテストにおける急速な能力向上と限界

Google-Proof Q&AやGDPvalなどの複雑なテストにおいて、最新のAIは人間のトップパフォーマンスに追いつきつつあるが、能力はまだ不均一(jagged)であり、テストには欠陥がある。

5

組織への普及の遅れと新たな働き方の出現

多くの企業ではまだAI導入初期段階だが、StrongDMのような事例に見られるように、人間がコードを書かずレビューもしない「Software Factory」など、AIエージェントを活用した新しい組織形態が登場し始めている。

6

StrongDMの革新的な運用ルールとコスト

3人のチームが構築したシステムでは「人間はコードを書かず、人間はレビューしない」という2つのルールを採用し、エンジニアは日額1,000ドル相当のAIトークンを消費して運用を賄っている。

7

Software Factoryの自動化プロセス

人間の記した製品ロードマップをコーディングエージェントが構築し、テストエージェントがシミュレーション環境で検証するフィードバックループを経て、人間がコードを確認することなく製品を顧客に提供します。

影響分析・編集コメントを表示

影響分析

この記事は、単なる技術進化ではなく、人間とAIの関係性が「共同作業」から「監督・管理」へ根本的に変わるというパラダイムシフトを指摘しています。これにより、開発者や知識労働者の役割定義が再考され、エージェント型AIの活用が業務効率化の主要な手段となる未来像を描いています。

編集コメント

2025年末という未来の日付を起点としている点に注意が必要ですが、エージェント型AIの台頭とマルチモーダル能力の向上がもたらす「作業管理」へのシフトは、現在の業界トレンドを的確に捉えた重要な洞察です。

2023 年 10 月、私は「物の影の形」について書き、今後 AI がどのような存在へと変貌していくかについて推測しました。しかし今、私たちはその「物」をより明確に見ることができ、それに伴ういくつかの結果も理解できるようになっています。最近の投稿で議論してきた通り、私たちは AI の新たなフェーズに入りました。ChatGPT が登場した直後、人間と AI の協働は私が「共知性」と呼んだ形を取りました。これは、人間が AI に指示を出し合いながらタスクの支援を受けるという形態です。しかし 2025 年後半から、Claude Code や OpenAI の Codex、OpenClaw といった AI エージェント(AI agents)のおかげで、私たちは新たな時代へと突入しました。これらは、数時間にわたる人間の作業を任せるだけで、数分以内に合理的で有用な結果をもたらす AI システムです。これは AI と共に働く時代ではなく、AI を管理する時代なのです。

この新しい AI へのアプローチは、AI の能力における急速な指数関数的改善の結果です。つまり、AI の能力がどのように増大しているかを理解しなければ、現在がどこにあり、今後どこへ向かうのかを理解することはできません。

指数関数の波に乗って

指数関数的な改善を視覚化するのは難しいため、チャートやグラフではなく、カワウソから始めたいと思います。私の AI に関する執筆を追いかけていただいている方なら、私の「カワウソ・テスト」をご存知でしょう。これは、さまざまな AI 画像モデルに「Wi-Fi を使いながら飛行機に乗っているカワウソ」の画像を描かせるという挑戦です。以下にご覧いただける通り、2022 年(ChatGPT が登場した年)から 2025 年にかけての進歩は急速かつ驚異的なものでした。

image
image

では、2025 年 4 月のあの画像以降、何が起こったのでしょうか。ほぼ完璧な画像生成が可能になったことで、動画が新たなフロンティアとなり、ここでも指数関数的な進歩が見られています。その実例として、TikTok の親会社である字节跳动(Bytedance)が開発した、米国ではまだ未発売の最も先進的な AI 動画モデルに、「エタン・モリック氏の『カワウソテスト』についてのカドワシドキュメンタリー」というプロンプトを与えました。このテストは、飛行機に乗ったカワウソの画像を生成できる能力によって AI を評価するものです。これが最初の結果です——ぜひ音声もオンにしてください。

発音ミスが 1 箇所あるものの、これは非常に完璧な出来栄えで、カワウソが人間のような表情を持つようにアニメーション化されている点に至るまで正確です。もちろん、動画モデルは素晴らしいものですが、それが有用な自律型 AI(Agentic AI)が何ができるのかを示す指標になるとは限りません。では、AI の能力に関するベンチマークを見てみると、同じような指数曲線が見られるのでしょうか?

確かに、現在の AI 界で最も有名な評価基準である METR Long Tasks グラフにおいて、その傾向は明確に確認できます。このグラフは、ある程度の信頼性を持って AI がどの程度人間の作業を自律的に完了できるかを測定することで、AI の進歩を計ろうとするものです。批判も一定数寄せられており、METR 自身も潜在的な問題点を指摘しています。しかし、もし METR グラフが気に入らないとしても、AI の能力に関する他のグラフのほとんどが同じような曲線を描いていることに気づくでしょう。

例として、私は4 つの難易度が高く多様な AI テストを選び、下の画像に時間経過に伴う進歩をグラフ化しました。左上には Google-Proof Q&A ベンチマークでのスコアが表示されており、これは知識を試すテストです。このテストでは、Google を使用しながら専門分野外で graduate students が得るスコアは 34% に過ぎず、専門分野内でも約 70% ですが、現在の最良の AI は 94% のスコアを達成しています。あるいは GDPval もご覧ください。ここでは業界の専門家によって、複雑なタスクにおける AI と経験豊富な人間の性能が比較評価され、最新の AI はトップパフォーマンスを示す人間と同等かそれ以上の水準に達する頻度が 82% に達しています。同様のパターンは、大学教授らが作成した非常に難易度の高い問題群である「Humanity's Last Exam」でも見られます。これらを解答するには相当な専門知識が必要です。あるいは、AI のパズル解決能力を利用することもできます(ここでパズルを試すことができますが、とても面白いです!)。それぞれが、テストで可能な最高スコアに達するまで、少なくともその時点では減速の兆候をほとんど示さずに、同様の急速な能力向上を示しています。

image
image

指数関数的グラフはさておき、これらのテストにはそれぞれ独自の欠陥があり、AI は依然として凹凸があり、あるタスクについては高いレベルで処理できる一方で、他のタスクでは失敗することもあることを認識することが重要です。さらに、これらの驚異的な能力がテストで示されているにもかかわらず、企業はまだ AI の導入初期段階にあり、その結果、ほとんどの組織ではまだ劇的な変化は起きていません。ただし、「ほとんどの組織」にはすべての組織が含まれるわけではありません。すでに、AI エージェントの新しい能力を活用した組織運営の新たなアプローチの最初の兆候が見え始めています。

仕事への根本的な変化

数週間前、アクセス制御に焦点を当てたセキュリティソフトウェア企業である StrongDM の 3 人チームが、「Software Factory(ソフトウェア工場)」を構築したと発表しました。これは、AI エージェントと協働する新しい働き方で、生産用ソフトウェアの作成、テスト、リリースを人間が関与することなく完全に AI に任せるものです。このプロセスには 2 つの(非常に過激な)ルールが含まれていました。「コードは人間によって書かれてはならない」「コードは人間によってレビューされてはならない」です。この工場を稼働させるために、各エンジニアには自らの給与に相当する額の AI トークンを費やすことが求められ、少なくとも 1 日あたり 1,000 ドルが必要です。

ファクトリーの基本的な考え方は、人間が作成した将来の製品ロードマップを取得し、それを製品に変換することです。コーディングエージェントはこれらのロードマップを利用してソフトウェアを構築し、テストエージェントは必要に応じて構築するシミュレーションされた顧客環境でそのソフトウェアを試します。この一連のエージェントたちは互いにフィードバックを提供し合い、AI が結果に満足するまで往復ループを続けます。その後、人間が完成した製品を検証し、誰も下層のコードに触れたり見たりすることなく、結果は顧客へ出荷されます。

image
image

ソフトウェアファクトリーのテストエージェントによって構築された Slack のシミュレーション版で、多数の模擬顧客がコーディングエージェントによって作成されているツールをテストするためにリクエストを入力しています。

ここにはこのアプローチを機能させる多くの詳細があり、StrongDM チームはそれらの多くを公に共有しています。また、ファクトリーが稼働している様子を観察し、見たものについてコメントしてもらうために、いくつかの賢明な外部観察者を招き入れました。そのため、Simon Willison と Dan Shapiro の記述を読むことで、彼らのアプローチの強みと弱みをよりよく理解することができます。しかし、多くの点で、ソフトウェアファクトリーの具体的な詳細よりも重要なのは、どのように働くかという根本的な実験が今や可能であるだけでなく、おそらく必要となっているという事実です。AI は組織の運営方法を変えるのに十分であり、モデルが継続的に改善される中でも、この実験はまさに始まったばかりです。

ローリング・ディスラプション

実用的なエージェント、不規則な指数関数的な改善、そして仕事の性質を根本から実験する能力が組み合わさり、AI の進展に対する一種の連続的で予測不可能な環境を形成しています。AI の能力しきい値を超えると、人々の AI ができることへの見方を一夜にして変えるような、根本的に新しいユースケースが解放されます。同時に、AI を実験している組織は、それを自らのために機能させる方法を発見し、新たな戦略や企業が最も価値あると考える従業員の種類の突然の大規模な転換に関する発表が行われることになります。さらに、AI が継続して改善されるにつれて、より多くの政策立案者が AI ガバナンスに関心を持ち始め、AI 企業との対立が生じます。

これは単なる推測ではありません。私たちはこの一連の出来事をたった一週間で実際に目撃したのです。

2 月 22 日、あまり知られていない金融調査会社である Citrini Research が、AI の導入が 2028 年までに多くの確立されたビジネスを破壊する可能性についての架空のシナリオを発表しました。その記事には明らかにありえない要素も含まれていましたが、ウォール街に大きな衝撃を与え、株式市場で主要な価格変動を引き起こしました。

2 月 26 日、金融サービス企業の Block が 40% の人員削減を発表し、これが AI が原因であるかのような印象を与えました。実際には、AI の役割は大幅に誇張されており、大規模なリストラの口実に過ぎなかった可能性が高いです。

そしてその週の締めくくりとして、2 月 27 日、ペンタゴンと AI 企業 Anthropic の間で、政府が Claude をどのように使用するかに関するルールを誰が管理すべきかという公的な対立が発生しました。

多くの点において、これらの事例は当初見えたものとは実際には異なっていました。Citrini のレポートは架空のシナリオであり、Block 社のレイオフは AI が原因ではありませんでした。また、戦争における AI を巡る対立は、まだ完全に解明されていないいくつかの複雑な問題を中心に展開されていました。しかし、私はあの単なる一週間が、近い未来がどのような感覚を与えるかを示す良い例証だと考えています。AI の能力に関する突然の revelation(発見)による急速な市場反応。雇用に対する AI の影響がますます現実味を帯びてきていること(短期的にその影響が良いのか悪いのかについては多くの議論があるとしても)。そして、世界中で AI 企業と政策決定プロセスとの間の絡み合いが深まっていることです。リスクが高まるにつれ、状況はさらに不安定に感じられるようになるでしょう。

もちろん、事態が落ち着く可能性もあります。もしかすると AI の改善が行き詰まり、組織が変化を徐々に吸収し、人々が AI の能力と限界を理解するにつれて、連続的な混乱もより管理可能になるかもしれません。歴史には、一夜にしてすべてを変えるとされていた技術が、実際には経済を完全に再構築するのに数十年を要した例が数多くあります。

しかし、私はそれに賭けはしません。

一つの理由は、AI企業が非常に明確に次のステップを語っているからです。それは再帰的自己改善(recursive self-improvement)、あるいはRSIです。これは、AIシステムがより優れたAIシステムを構築するためにますます利用されるようになり、上記で示した曲線を加速させる可能性のあるフィードバックループを生み出すという考え方です。1月のダボス会議において、AnthropicのDario Amodeiは、コーディングやAI研究に優れたモデルを作成すれば、それらを用いて次世代のモデルを構築でき、そのループを加速させられると説明しました。彼はまた、Anthropic内のエンジニアたちはもはや自らコードを書くことがほとんどないと指摘しています。OpenAIが2月に最新のCodexモデルを発表した際、同社は「これは自己生成に決定的な役割を果たした最初のモデルである」と述べています。そしてGoogle DeepMindのDemis Hassabisは、同じダボスパネルで、自己改善ループを完成させることは主要な研究所すべてが現在積極的に取り組んでいる課題であると認めつつも、まだ欠けている機能や実際のリスクが残っているとも警告しました。

これがどこまで続くのか、私たちは知りません。RSI は数十年にわたり理論的な概念であり、ラボは計算能力、データ、あるいは AI 研究そのものの難しさにおいてボトルネックに直面する可能性があります。また、LLM ベースの AI が最終的にそれ以上改善できない天井に達するのか、あるいは荒々しいフロンティアが決して滑らかにならないままなのかについても、私たちは知りません。確実なことを何も知らないとは思いますが、再帰的自己改良がもはやSF小説の世界の話ではない段階をすでに超えているとも考えています。むしろ、それは主要な AI 企業のロードマップにおける明示的な項目となっています。もしこのループが完結すれば、これまで見てきた指数関数的曲線はより急峻になり、その終点は不確実なものとなるでしょう。

さて、現在の状況を整理しましょう。2 月のたった一週間の不安定さは、AI の能力が高まり続けることが市場・雇用・政府に同時に作用し始めたときにどのような感覚を伴うかを示す予行演習でした。この不確実性の感覚は、おそらくさらに広がっていくでしょう。しかし、不確実性は無力と同じではありません。技術がこれほど強力でありながら未だに不安定な状況にある今、個人や組織が下す選択の重要性はこれまで以上に高まっています。私たちは「そのもの(The Thing)」の姿を今まさに見ることができますが、それでもなお「そのもの」自体や、それが私たち全員にとって何を意味するかを影響下に置くことは可能です。職場・学校・政府における AI の利用方法について、明確なルールやロールモデルが存在しないのは事実です。これは問題ですが、同時に現在 AI をどのように活用すべきかを模索しているすべての組織が、他者に対する先例を築いていることを意味します。「そのもの」を形作るための窓は長くは開いていないかもしれませんが、今まさにそこにあります。

購読する

共有する

image
image
原文を表示

In October of 2023, I wrote about the “Shape of the Shadow of the Thing,” speculating on the Thing that AI might turn into in the coming years. I think we can see the Thing much more clearly now, and some of the consequences that come with it. As I have been discussing in recent posts, we have entered a new phase of AI. After ChatGPT was introduced, human-AI work took the form of what I called co-intelligence, where humans would prompt AI back-and-forth to get help on tasks. Starting in late 2025, we entered a new era thanks to AI agents like Claude Code, OpenAI’s Codex, and OpenClaw. These are AI systems that you can just give work to, sometimes hours of human work, and get back reasonable and useful results in minutes. This is an era of managing AIs, rather than working with them.

This new approach to AI is the outcome of the rapid exponential improvement in AI abilities. That means you can’t understand where we are, and where we might be going, without understanding the increasing capability of AI.

Riding up the Exponential

Exponential improvements are hard to visualize, so rather than charts or graphs, I want to start with otters. If you have followed my writing on AI, you know about my Otter Test, where I challenge various AI image models to show a picture of an “otter on a plane using wifi.” As you can see below, the progress from 2022 (the year ChatGPT launched) to 2025 was rapid and remarkable.

image
image

So, what has happened in the time since that April, 2025 image? With nearly perfect images, video has become the new frontier and has also seen exponential gains. To demonstrate, I gave the most advanced (and still unreleased in the US) AI video model from TikTok maker Bytedance, the prompt: A documentary about how otters view Ethan Mollick's "Otter Test" which judges AIs by their ability to create images of otters sitting in planes. This is the very first result — definitely turn on your sound:

Aside from a single pronunciation mistake, this is pretty perfect, down to the fact that the otters are animated to have human-like expressions. Of course, video models are cool, but they are not necessarily indicative of what useful agentic AI can do. So, what if we look at the benchmarks of AI ability, do we see the same exponential curve?

We certainly do in the most famous evaluation in AI today, the METR Long Tasks graph. It tries to measure AI progress by seeing how much human work an AI can complete autonomously with some measure of reliability. It has attracted its share of critics, and even METR has pointed out potential issues. But if you don’t like the METR graph, you will find most graphs of AI ability have that same curve.

image
image

As an example, I picked four hard and diverse AI tests and graphed progress over time in the image below. In the upper left are the scores on the Google-Proof Q&A benchmark, a test of knowledge where graduate students using Google only score 34% outside their field and 70% or so inside of it, but the best AIs now score 94%. Or look at GDPval, where industry experts judge AI versus experienced human performance on complex tasks, and where the latest AIs now reach or exceed parity with top-performing humans 82% of the time. The same pattern holds for Humanity’s Last Exam, a set of very hard problems written by college professors that require considerable expertise to answers. Or we can even use the ability of AI to solve puzzles (you can try the puzzles here, they are fun!). Each shows a similar rapid gain in ability with few signs of slowdown, at least until they reach the top possible score on the test.

image
image

Exponential graphs aside, it is important to recognize that all of these tests have their own flaws, and that AI remains jagged, capable of some tasks at a high level, while messing up others. Further, despite these amazing capabilities in tests, companies are still very early in adopting AI, meaning that, as of yet, remarkably little has changed in most organizations. But “most organizations” doesn’t mean every organization. We are already starting to see the first appearances of new approaches to organizing that take advantage of the new abilities of AI agents.

Radical Changes to Work

A few weeks ago, a three-person team at StrongDM, a security software company focusing on access control, announced they had built a Software Factory — a way of working with AI agents that relied entirely on the AI to write, test, and ship production software without human involvement. The process included two (quite radical) rules: “Code must not be written by humans” and “Code must not be reviewed by humans.” To power the factory, each human engineer is expected to spend amounts equivalent to their salary on AI tokens, at least $1,000 a day.

The basic idea of the Factory is that it takes future product roadmaps, written by humans, and turns those into products. Coding agents use those roadmaps to build software while testing agents try out the software in a simulated customer environment (which the testing agents build as needed). The sets of agents provide feedback to each other, looping back-and-forth until the results satisfy the AI. Then humans review the finished product and the results are shipped to customers without anyone every touching, or even seeing, the underlying code.

image
image

A simulated version of Slack built by the Software Factory’s testing agents, where a bunch of simulated customers put in requests to test the tools being made by the coding agents.

There are obviously a lot of details here that make this approach work, and the StrongDM team has shared a lot of them publicly. They also invited in some smart outside observers to watch the Factory in operation and comment on what they saw, so you can read the accounts of Simon Willison and Dan Shapiro to get a better sense of the strengths and weaknesses of their approaches. In many ways, however, the particular details of the Software Factory matter less than the fact that such radical experimentation into how we work is now not only possible, but likely necessary. AI is good enough to change how organizations operate, and the experimentation is just getting started, even as models continue to improve.

Rolling Disruption

Practical agents, jagged exponential improvement, and the ability to radically experiment with the nature of work combine to form a sort of rolling and unpredictable environment for AI advances. As AI capability crosses thresholds, it unlocks radical new use cases that change people’s views, sometimes overnight, about what AI can do. At the same time, organizations experimenting with AI will figure out how to make it work for them, leading to sudden announcements about new strategies or large-scale shifts in which kinds of employees companies value most. Plus, as AI continues to improve, more policymakers will become interested in AI governance, creating conflicts with AI companies.

This isn’t speculation because we saw this all happen in a single week. On February 22nd, a little-known financial firm, Citrini Research, published a fictional scenario about how AI adoption might destroy a number of established businesses by 2028. There were many elements in the piece that were clearly farfetched, but it struck a nerve on Wall Street, leading to major stock market price shifts. On February 26, financial services company Block announced 40% layoffs, implying this was due to AI. It is likely that the role of AI was greatly exaggerated, and AI was merely used as cover for large-scale layoffs. And then, to cap off the week, on February 27 a very public conflict occurred between the Pentagon and AI company Anthropic over who should be able to control the rules for how Claude could be used by the government.

image
image

In a lot of ways, each of those cases were not what they first appeared to be. The Citrini report was a fictional scenario, the Block layoffs were not about AI, and the conflict over AI at war revolved around a number of complicated issues that are still not completely clear. But I think that single week is a good illustration of what the near future will feel like. Sudden revelations about AI capability leading to rapid market reactions. Increasingly real impacts of AI on jobs (even if there is a lot of debate over whether those impacts will be good or bad in the short term). And increasing entanglement between AI companies and policymaking around the world. As the stakes go up, it is likely things will feel even more unstable.

It is possible, of course, that things settle down. Maybe AI improvement hits a wall, organizations absorb the changes gradually, and the rolling disruptions become more manageable as people learn what AI can and can’t do. History is full of technologies that were supposed to change everything overnight but instead took decades to fully reshape the economy.

But I wouldn’t bet on it.

One reason is that AI companies are telling us, fairly explicitly, what comes next: recursive self-improvement, or RSI. This is the idea that AI systems are increasingly being used to build better AI systems, creating a feedback loop that could accelerate the very curves I showed you above. At Davos in January, Anthropic’s Dario Amodei explained that if you make models that are good at coding and good at AI research, you can use them to build the next generation of models, speeding up the loop. He noted that engineers within Anthropic barely write code themselves anymore. When OpenAI released its latest Codex model in February, the company stated it was “our first model that was instrumental in creating itself.” And Google DeepMind’s Demis Hassabis acknowledged at the same Davos panel that closing the self-improvement loop is something all the major labs are actively working on, even as he warned there are still missing capabilities and real risks.

We don’t know how far this goes. RSI has been a theoretical concept for decades, and the labs may hit bottlenecks, whether in compute, in data, or in the sheer difficulty of AI research. We also don’t know whether LLM-based AIs will eventually hit a ceiling where they cannot get any better, or where the jagged frontier never smooths out. I don’t think we know anything for certain, but I also think we are past the point where recursive self-improvement is science fiction. Instead, it is an explicit item on the roadmap of every major AI company. If the loop does close, the exponential curves we’ve been watching would get steeper, with an uncertain endpoint.

So here is where we are today: the instability of that single week in February was a preview of what it feels like when the increasing ability of AI starts to interact with markets, jobs, and governments all at once. That feeling of uncertainty will likely only spread further. But uncertainty is not the same as helplessness. When a technology is this powerful and this unsettled, the choices that individuals and organizations make right now matter more. We can see the shape of the Thing now, but we can still influence the Thing itself, and what it means for all of us. We clearly don’t have rules or role models for how AI gets used at work, in schools, or in government. That’s a problem, but it also means that every organization figuring out a good way to use AI right now is setting a precedent for everyone else. The window to shape the Thing may not last long, but it is here now.

Subscribe now

Share

image
image
この記事をシェア

関連記事

MarkTechPost★42026年6月10日 02:24

Google、Meet・翻訳・ライブ API で 70 言語以上対応のストリーミング音声対音声モデル「Gemini 3.5 Live Translate」を公開

Google は、70 以上の言語を自動検知し、話者のイントネーションやピッチを保ちながら連続的に翻訳音声を生成する新モデル「Gemini 3.5 Live Translate」を発表した。この技術は Meet、翻訳サービス、ライブ API で利用可能となる。

The Verge AI★42026年6月9日 23:18

Apple の AI 約束がいよいよ、ほぼ、あるいは少しだけ実現した

Apple は開発者会議で AI に関する大胆な約束を表明したが、CEO ティム・クックが述べた新技術の導入よりも、むしろ「Siri AI」を中心とした発表は他社に追いつくためのものだった。

TLDR AI★42026年6月8日 09:00

化学者としての Claude の活用(12 分読)

Anthropic が開発した AI モデル「Claude」は、NMR スペクトルの予測において従来のツールに匹敵し、場合によっては上回る性能を示しました。特に Claude 派生モデルの「Opus 4.7」は水素や炭素シフトを正確に予測し、スペクトルデータから化学構造を推定する逆工学タスクでも有望な結果を出しています。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む