Q&A:現在のエージェント型 AI とあるべき姿とは何か
MIT の専門家インタビューにより、生成 AI とは異なり「行動する」AI エージェントの定義、現状の普及状況、および実装におけるデータ不足という根本的な課題が明確に解説された。
キーポイント
エージェンティック AI の本質と定義
生成 AI が物語や画像を作成するのに対し、エージェンティック AI は物理的・デジタルな「行動」を行う点を強調し、現在の主流はデジタルエージェントであると説明している。
業界における急速な普及状況
MIT スローン経営大学院と BCG の最新報告によると、企業の 35% が既に AI エージェントを導入しており、さらに 44% が近々導入を計画している。
実装の構造:基盤モデルとラッパー
多くの企業は Claude や ChatGPT などの基盤モデルをコアとしつつ、特定のツールや記憶機能を持つ「ラッパー」を装着して独自のエージェント製品を構築している。
開発における最大の課題:訓練データの欠如
マウスの動きやエラー対応など具体的な手順を示すデータが不足しており、エージェントは試行錯誤を通じて環境を学習する必要があるという技術的障壁がある。
影響分析・編集コメントを表示
影響分析
本記事は、AI エージェントが単なる概念から実社会への展開段階に入ったことを示す重要な指標であり、企業戦略における優先事項の変化を如実に反映しています。また、技術的成熟度よりも「行動データ」の不足がボトルネックとなっている点を指摘することで、今後の研究開発や投資の方向性を示唆する内容となっています。
編集コメント
生成 AI から「行動する AI」へのパラダイムシフトが現実のものとなりつつある中、その技術的基盤と実装の壁を解説した非常に示唆に富む記事です。企業の導入動向と技術的課題の両面から捉えることで、今後の市場予測に役立つ洞察が含まれています。
「AI エージェント」と呼ばれる自動化されたソフトウェアシステムの導入は、最近爆発的に増加しました。2025 年 11 月に*MIT スローン経営大学院とボストン・コンサルティンググループ*が発表したレポートによると、調査対象企業の 35% がすでに AI エージェントを導入しており、さらに 44% がまもなくアジェンティック AI の実装を計画していることが明らかになりました。
これらのますます普及するツールの基本原理と潜在的な影響を理解するために、*MIT ニュース*は、AI エージェントが持つ知能や、アジェンティック AI システムを支える基盤となるモデルおよびメカニズムを研究している電気工学・コンピュータサイエンス学部(EECS)准教授であり、コンピュータ科学人工知能研究所(CSAIL)のメンバーであるフィリップ・イソラ氏にインタビューを行いました。
Q: アジェンティック AI とは何か、また ChatGPT や Claude などの生成 AI モデルとはどのように異なるのでしょうか?
A: アジェンティック AI とは、現実世界で行動を行う AI です。その行動には、ロボットの操作のような物理的なアクションや、フライトの予約のようなデジタルなアクションが含まれます。一方、私たちは生成 AI を、私たちに代わって行動するのではなく、物語、詩、芸術、画像などを創作するものとして捉えています。
「エージェント」という言葉は単なるブランド名に過ぎません。通常、これは人々がアプリケーションやウェブサイト、あるいは物理世界と対話するのを支援するための AI を指します。今日私たちが遭遇するほとんどのエージェントはデジタルエージェントであり、製品に関する苦情について話し合うことができるカスタマーサービスエージェントなどが該当します。
エージェントを提供する企業の多くは、裏側で同じ数少ない AI モデルを使用し、それらにアクションを実行したり過去の出来事を記憶したりする能力を与えています。エージェントの核心には、Claude などの基本的な生成 AI システムが置かれます。その後、企業はその基盤モデル(foundation model)の周りに、自社の製品やアプリケーション向けに異なるラッパー(wrapper)を構築します。これらのラッパーは、エージェントが使用できる特定のツールであり、そのツールはアプリケーションに応じて異なります。例えば、計算機へのアクセス権を持たせて数学の問題を解かせたり、より複雑なハードドライブとオペレーティングシステムへのアクセス権を与えて企業の財務データや過去のビジネス交渉を記憶させたりすることがあります。
エージェント型 AI の開発における最大の課題は、トレーニングデータの不足です。オンラインにアクセスして飛行機を予約してくれるシステムを作りたい場合、それは非常にシンプルに見えるかもしれません。しかし、マウスをどこに動かすか、どのボタンをクリックするか、何か問題が起きたらどうするか、あるいは誰かに電話をかけて航空券の価格について交渉する方法かを具体的に示したデータはあまりありません。このようなシステムをトレーニングする一つの方法として、AI エージェントに航空会社のウェブサイトを訪問させ、試行錯誤して何がうまくいき、何が失敗するかを確認させることが挙げられます。これらの環境はモデル化が難しいため、エージェントは往々にして試行錯誤によって学習する必要があります。
Q: エージェント型 AI の有望な応用例にはどのようなものがありますか?
A: 最も成功が見られている分野は、コーディングエージェントの領域だと考えます。これは生成 AI から発展したものです。人々はコードに対して言語モデルをトレーニングし、人間がコーディング問題を解決するために何を行うかを予測できるようにしました。さらに、エージェントはフィードバックループを通じてこれを学習することもできます。つまり、異なるソリューションを試して答えが正しいかを確認するのです。答えを検証できる限り、AI エージェントは良い戦略を見出すまでこの試行錯誤のループを続けることができます。
しかし、意思決定の自動化と、単に人間を支援・情報提供することの間には、常にバランスが必要です。意思決定の結果を予測するシステムのような分析型 AI 手法は、本質的に自律的(アジェンティック)なものではありませんが、人間の意思決定者にとって非常に有益な情報を提供します。医療、セキュリティ、高レベルのビジネス方針など、リスクが大きく安全性が重要なケースでは、AI がこれらのプロセスを完全に自動化できる技術がまだ整っていない場合や、あるいは私たちがそれを望まない場合もあります。
Q: AI エージェントを使用する際に考慮すべきリスクはありますか?
A: 大きなリスク領域の一つは、エージェントに特定の種類の作業を行わせることが非常に容易であるという事実から生じます。コーディングエージェントの場合、「バイブコーディング」して、エージェントにコードを作成させるだけで済むため、自分自身で苦労する必要がなくなります。しかし、あまりにも簡単であるがゆえに、人々がそれが正しいことを十分に検証しようとする努力を怠る大きなリスクがあります。バグが導入され、個人データが漏洩する——これはすでに起こり始めています。
エージェントは完璧ではありません。訓練が不十分であったり、何をすべきか分からなかったりするせいでミスを犯す可能性があります。しかし、たとえ非常に有能なエージェントであっても、人間が適切に使用しなかったり、指示が曖昧すぎたりした場合、AI エージェントは人間のミスによって誤りを犯すことになります。すべての結果を人間が十分に検討する関与が減れば、そうしたミスを犯しやすくなるのではないかと考えられます。
もう一つの側面として、スキル低下のリスクがあります。これがどこまで進むかは不明ですが、宿題やコーディング、数学の問題解決にエージェントを頼りすぎると、自分たちでそれらを行う能力を失う可能性があります。また、その技術がこれらのプロセスを完全に自動化する準備がまだ整っていないため、その能力を失うのが早すぎる恐れもあります。
Q: アジェンティック AI の未来には何が待ち受けているのでしょうか?
A: 現在私たちがアジェンティック AI と呼んでいるものは、デジタルおよび物理システムと対話するためにツールを使用する大規模言語モデルを指します。明白な限界として、内部ではこれらが言語モデルのアーキテクチャを持っており、テキストデータに基づいて訓練されている点が挙げられます。さらに強力な AI エージェントを作るためには、動画、物理力、時系列データ、レーダースキャン、その他のモダリティをモデル化する必要があるかもしれません。連続データ、高次元データ、確率的データなどを処理できる、根本的に異なるアーキテクチャを持つモデルが必要になる可能性もあります。
しかし一方で、極めて優れたコーディングモデルが、センサーやアクチュエータ、Web API と対話するための操り人形として機能する可能性もあるかもしれません。数学、言語、コードを理解する超賢い推論システムを手に入れたら、カメラとキーボードを与えても、空間領域で何をすべきかを自ら見つけ出すことができるでしょう。次の AI の波は、センサーやアクチュエータ、ツールを備えた Claude になるのか、それとも根本から新しい方法で構築されるものになるのか。これが現在、AI 界隈の多くの人々が取り組んでいる大きな問いです。
原文を表示
*The deployment of automated software systems called AI agents has recently exploded. A November 2025 report by *MIT Sloan School of Management and Boston Consulting Group* found that 35 percent of surveyed businesses had already deployed AI agents, while another 44 percent planned to implement agentic AI soon. *
*To understand the fundamentals and potential impacts of these increasingly popular tools*, MIT News* spoke with Phillip Isola, an associate professor in the Department of Electrical Engineering and Computer Science (EECS) and a member of the Computer Science and Artificial Intelligence Laboratory (CSAIL), who studies the intelligence AI agents possess, as well as the underlying models and mechanisms that power agentic AI systems.*
Q: What is agentic AI and how is it different from generative AI models like ChatGPT and Claude?
A: Agentic AI is AI that takes actions in the world. These actions could be a physical action, like robotic manipulation, or a digital action, like booking a flight. On the other hand, we think of generative AI as making up stories, poems, art, and images, rather than taking actions for us.
The word “agent” is just a brand name. It usually means AI that is going to help people interact with an application, a website, or the physical world. Most agents we encounter today are digital agents, like customer service agents you can talk with about product complaints.
Most companies that offer agents use the same few AI models under the hood and give them the ability to take actions and remember what happened. An agent starts with a fundamental generative AI system, like Claude, at the core. Then companies put different wrappers around that foundation model for their product or application. Those wrappers might be specific tools that agent can use, and those tools depend on the application. Maybe the agent has access to a calculator so it can solve math problems, or maybe it has access to a more complicated hard drive and operating system so it can remember a firm’s financial data and past business negotiations.
The biggest challenge in developing agentic AI comes from a lack of training data. If I want to create a system that can go online and book a flight for me, that seems pretty simple. But we don’t have a lot of data that spells out exactly how to do that — where to move the mouse, which buttons to click on, what to do if something goes wrong, or how to call somebody and negotiate about the price of the airline ticket. One way to train a system like this is to have the AI agent visit airline websites, try things out, and see what works and what doesn’t work. These environments are hard to model, so often the agent must learn by trial and error.
Q: What are some promising applications of agentic AI?
A: I think the area where we’ve seen the most success has been with coding agents. This is something that evolved from generative AI. People trained language models on code, and then they can predict what a human would do to solve a coding problem. In addition, an agent can learn to do this by going through a feedback loop where it tries out different solutions and checks to see if it got the answer right. As long as it can check the answer, the AI agent can perform this trial-and-error loop until it figures out a good strategy.
But there is always a balance between automating decision making versus simply assisting and informing humans. Analytical AI methods, like the systems that help predict possible outcomes of decisions, are not agentic in nature, but are very informative to human decision-makers. For cases that are either high-stakes or safety-critical, like medicine, security, high-level business policies, etc., the technology might not be ready for AI to completely automate those processes, or we might not even be comfortable with that.
Q: Are there risks we should be thinking about when using AI agents?
A: One big risk area comes from the fact that it is often very easy to get agents to do certain types of work for you. With coding agents, you can “vibe code” and just ask the agent to make a code for you, so you don’t have to do the hard work yourself. There is a big risk that, because it is so easy, people will not put enough effort into verifying that it is doing the right thing. Bugs will be introduced, private data will get leaked — this is already happening.
Agents aren’t perfect, in the sense that they might make mistakes because they are not well-trained and don’t know what to do. But even if they are very competent, if a human doesn’t use them appropriately or gives them an instruction that is too vague, the AI agent could make a mistake because the human made a mistake. If humans are less involved in thinking through all the consequences, I think we might be more prone to making those mistakes.
An additional aspect is the risk of de-skilling. It is unclear how far this will go, but when we are relying on agents to do our homework, our coding, and our math, we might lose the ability to do that ourselves, and we might lose that ability too soon because the technology is not yet ready to fully automate those processes.
Q: What does the future hold for agentic AI?
A: What we think of now as agentic AI refers to large language models using tools to interact with digital and physical systems. One obvious limitation is that, under the hood, these have the architecture of a language model and are trained on text data. To make even more powerful AI agents, we might need to model videos, physical forces, time series, radar scans, and other modalities. We might need to have models with fundamentally different architectures that can handle continuous data, high-dimensional data, stochastic data, and so on.
But, on the other hand, maybe an extremely good coding model could act as a puppeteer to interface with sensors, actuators, and web APIs? Perhaps, once you have a super-smart reasoning system that understands math, language, and code, you can give it a camera and a keyboard and it will figure out what to do in the spatial domain. Is the next wave of AI just going to be Claude with sensors, actuators, and tools, or is it going to be something built in a new way from the ground up? That’s the big question a lot of people in AI are grappling with right now.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み