GoogleのクラウドAI責任者が語る、モデル能力の3つのフロンティア
AIモデルは、知性、応答速度、拡張性の3つのフロンティアで同時に進化を続けている。
キーポイント
GoogleのAI責任者が提示した「AIモデル能力の3つのフロンティア」:生の知能、応答時間、大規模展開のためのコスト効率性
Google Cloudの垂直統合(データセンターからチップ、モデル、推論層、エージェント層まで)が競争優位性の源泉であるという見解
企業のAI利用は「エージェント的パターン(agentic patterns)」へのアクセスを求めており、Vertexはそのプラットフォームとして機能
AIの実用化においては、予測不可能な規模での展開可能性(コスト面)が知能や速度と同等に重要な課題
影響分析・編集コメントを表示
影響分析
この記事は、AIモデルの進化を単なる「知能」競争から、応答性とコスト効率性を含む多次元の課題として再定義している。Googleの垂直統合戦略が、この3つのフロンティア全てに対応する上で有利であることを示唆しており、クラウドAIプラットフォーム競争の今後の方向性を理解する上で重要な視点を提供する。
編集コメント
AI競争が「ベンチマーク性能」から「実運用での総合的な価値」へとシフトしていることを明確に示すインタビュー。特にコスト効率性を第三のフロンティアとして位置づけた点は、業界の議論を前進させるものだ。
GoogleのクラウドAI責任者が語る、モデル能力の3つのフロンティア
Google CloudのプロダクトVPとして、マイケル・ガーストンハーバーは主に、企業向けAIを導入するための同社の統合プラットフォーム「Vertex」に携わっている。この立場から、企業が実際にどのようにAIモデルを利用しているか、そしてエージェント型AIの可能性を解き放つためにまだ何が必要なのかを高い視点で捉えている。
マイケルと話した中で、特に印象に残った、これまで聞いたことのない考え方がある。彼の表現によれば、AIモデルは同時に3つのフロンティアに挑んでいるという。それは、生の知性、応答時間、そして3つ目は生の能力というよりコストに関わる特性——モデルが予測不能な大規模なスケールで実行できるほど十分に安価に導入できるかどうか——だ。これはモデルの能力についての新しい考え方であり、フロンティアモデルを新たな方向に推進しようとする誰にとっても特に価値のある視点である。
このインタビューは、長さと明瞭さのために編集されている。
まず、これまでのAI分野でのご経験と、Googleでのご担当業務についてお聞かせいただけますか?
AIに関わって約2年になります。アンソロピックに1年半在籍し、Googleにはほぼ半年います。Googleの開発者プラットフォーム「Vertex」を担当しています。私たちの顧客の大半は、自社アプリケーションを構築するエンジニアです。彼らはエージェント型のパターン、エージェント型プラットフォーム、世界で最も賢いモデルの推論機能へのアクセスを求めています。私はそれを提供しますが、アプリケーションそのものを提供するわけではありません。それはShopifyやThomson Reuters、そして様々な顧客がそれぞれの領域で提供すべきものです。
Googleに惹かれた理由は何ですか?
Googleは、インターフェースからインフラ層まで全てを自社で持っているという点で、世界でも独特だと思います。データセンターを建設できます。電力を購入し、発電所を建設できます。自社チップを持ち、自社モデルを持っています。自社で制御する推論層、エージェント層があります。メモリや、コード書き込みのインターリーブのためのAPIがあります。その上に、コンプライアンスとガバナンスを確保するエージェントエンジンがあります。そして、消費者向けにはGemini EnterpriseやGemini Chatといったチャットインターフェースさえ持っていますよね?ですから、私がここに来た理由の一つは、Googleが他に類を見ない垂直統合を実現しており、それが強みになると考えたからです。
Techcrunchイベント TechCrunch Founder Summit で最大300ドルまたは30%オフ
1,000人以上の起業家と投資家が、成長、実行、実世界でのスケーリングに焦点を当てた終日イベント「TechCrunch Founder Summit 2026」に集結。業界を形作ってきた起業家や投資家から学び、同じ成長段階を進む仲間とつながり、すぐに実践できる戦術を持ち帰れます。オファーは3月13日まで。
TechCrunch Founder Summit で最大300ドルまたは30%オフ
1,000人以上の起業家と投資家が、成長、実行、実世界でのスケーリングに焦点を当てた終日イベント「TechCrunch Founder Summit 2026」に集結。業界を形作ってきた起業家や投資家から学び、同じ成長段階を進む仲間とつながり、すぐに実践できる戦術を持ち帰れます。オファーは3月13日まで。
不思議なことに、企業間のあらゆる違いがあるにもかかわらず、3つの大きな研究所(ラボ)はすべて能力が非常に接近しているように感じます。これは単に知性を競うレースなのでしょうか、それとももっと複雑なのでしょうか?
私は3つの境界線があると考えています。Gemini Proのようなモデルは、生の知性のために調整されています。コードを書くことを考えてみてください。ただ可能な限り最高のコードが欲しいのです。45分かかっても構いません。なぜなら、それを保守し、本番環境に投入しなければならないからです。ただ最高のものが欲しいのです。
次に、レイテンシーに関する別の境界線があります。カスタマーサポートを行っていて、ポリシーの適用方法を知る必要がある場合、そのポリシーを適用するには知性が必要です。返品取引は許可されていますか?飛行機の座席をアップグレードできますか?しかし、答えを得るのに45分かかったら、それがどれだけ正しくても意味がありません。ですから、そのようなケースでは、そのレイテンシー予算内で最も知的な製品が欲しいのです。なぜなら、相手が退屈して電話を切ってしまったら、それ以上の知性はもはや重要ではなくなるからです。
そして最後のカテゴリーがあります。RedditやMetaのような企業がインターネット全体をモデレートしたい場合です。彼らは大きな予算を持っていますが、スケールの仕方がわからないものに対して企業リスクを負うことはできません。今日または明日、有害な投稿がどれだけあるかわからないのです。ですから、彼らは予算を、手の届く最高の知性を持つモデルに制限せざるを得ませんが、それは無限の対象に対してスケーラブルな方法でなければなりません。そのためには、コストが非常に、非常に重要になります。
私がずっと疑問に思っていることの一つは、なぜエージェント型システムの普及にこれほど時間がかかっているのか、ということです。モデルは既に存在し、驚くべきデモも見てきましたが、一年前なら予想していたような大きな変化は見られません。何が足を引っ張っているとお考えですか?
この技術は基本的に生まれて2年であり、まだ多くのインフラが欠けています。エージェントが何をしているかを監査するパターンがありません。エージェントへのデータの認可を行うパターンがありません。こうしたパターンは、本番環境に導入するために作業が必要です。そして、本番環境での実用化は、常に技術が可能とすることの遅行指標です。ですから、2年という期間は、その知性が本番環境で何をサポートできるかを確認するには十分な長さではなく、そこが人々が苦労している点です。
ソフトウェア工学の分野では特に急速に進展したと思います。なぜなら、それはソフトウェア開発ライフサイクルにうまく適合するからです。物事を壊しても安全な開発環境があり、開発環境からテスト環境へと昇格させます。Googleでのコード作成プロセスでは、そのコードを監査する2人の人間が必要で、両者がGoogleのブランドを背負って顧客に提供するのに十分な品質であることを確認します。ですから、人間がループの中に入るプロセスが多くあり、それが実装のリスクを非常に低くしています。しかし、他の場所や他の職業においても、そうしたパターンを生み出す必要があります。
ラッセル・ブランドム AI編集者
10月13-15日 カリフォルニア州サンフランシスコ 2月27日までパスを最大680ドル割引。投資家と出会い、次のポートフォリオ企業を発見しよう。250人以上のテクノロジーリーダーからの話を聞き、200以上のセッションに深く潜り込み、次なるものを構築する300以上のスタートアップを探索。この一度きりの割引をお見逃しなく。
ビル・ガーリーが語る、今、キャリアにとって最悪なのは安全策を取ることだ
返したくない9,000ポンドの怪物
サム・アルトマンが思い出させたいこと:人間も大量のエネルギーを使っている
Google VPが警告、2種類のAIスタートアップは生き残れない可能性
xAIにとって朗報:Grokが『Baldur's Gate』に関する質問にかなり上手く答えられるようになった
ラッセル・ブランドム
FBIが警告、ATM「ジャックポッティング」攻撃が増加、ハッカーが数百万ドルの現金を盗む
Meta自身の研究が発見、親の監督は十代の若者の強迫的なソーシャルメディア利用を抑えるのにあまり役立たない
原文を表示
As a product VP at Google Cloud, Michael Gerstenhaber works mostly on Vertex, the company’s unified platform for deploying enterprise AI. It gives him a high-level view of how companies are actually using AI models, and what still needs to be done to unleash the potential of agentic AI.
When I spoke with Michael, I was particularly struck by one idea I hadn’t heard before. As he put it, AI models are pushing against three frontiers at once: raw intelligence, response time, and a third quality that has less to do with raw capability than with cost — whether a model can be deployed cheaply enough to run at massive, unpredictable scale. It’s a new way of thinking about model capabilities, and a particularly valuable one for anyone trying to push frontier models in a new direction.
This interview has been edited for length and clarity.
Why don’t you start by walking us through your experience in AI so far, and what you do at Google?
I’ve been in AI for about two years now. I was at Anthropic for a year and a half, I’ve been at Google almost half a year now. I run Vertex, Google’s developer platform. Most of our customers are engineers building their own applications. They want access to agentic patterns. They want access to an agentic platform. They want access to the inference of the smartest models in the world. I provide them that, but I don’t provide the applications themselves. That’s for Shopify, Thomson Reuters, and our various customers to provide in their own domains.
What drew you to Google?
Google is I think unique in the world in that we have everything from the interface to the infrastructure layer. We can build data centers. We can buy electricity and build power plants. We have our own chips. We have our own model. We have the inference layer that we control. We have the agentic layer we control. We have APIs for memory, for interleaved code writing. We have agent engine on top of that that ensures compliance and governance. And then we even have the chat interface with Gemini enterprise and Gemini chat for consumers, right? So part of the reason I came here is because I saw Google as uniquely vertically integrated, and that being a strength for us.
Techcrunch event Save up to $300 or 30% to TechCrunch Founder Summit
1,000+ founders and investors come together at TechCrunch Founder Summit 2026 for a full day focused on growth, execution, and real-world scaling. Learn from founders and investors who have shaped the industry. Connect with peers navigating similar growth stages. Walk away with tactics you can apply immediately. Offer ends March 13.
Save up to $300 or 30% to TechCrunch Founder Summit
1,000+ founders and investors come together at TechCrunch Founder Summit 2026 for a full day focused on growth, execution, and real-world scaling. Learn from founders and investors who have shaped the industry. Connect with peers navigating similar growth stages. Walk away with tactics you can apply immediately Offer ends March 13.
It’s odd because, even with all the differences between companies, it feels like all three of the big labs are really close in capabilities. Is it just a race for more intelligence, or is it more complicated than that?
I see three boundaries. Models like Gemini Pro are tuned for raw intelligence. Think about writing code. You just want the best code you can get, doesn’t matter if it takes 45 minutes, because I have to maintain it, I have to put it in production. I just want the best.
Then there’s this other boundary with latency. If I’m doing customer support and I need to know how to apply a policy, you need intelligence to apply that policy. Are you allowed to transact a return? Can I upgrade my seat on an airplane? But it doesn’t matter how right you are if it took 45 minutes to get the answer. So for those cases, you want the most intelligent product within that latency budget, because more intelligence no longer matters once that person gets bored and hangs up the phone.
And then there’s this last bucket, where somebody like Reddit or Meta wants to moderate the entire internet. They have large budgets, but they can’t take an enterprise risk on something if they don’t know how it scales. They don’t know how many poisonous posts there will be today or tomorrow. So they have to restrict their budget to a model at the highest intelligence they can afford, but in a scalable way to an infinite number of subjects. And for that, cost becomes very, very important.
One of the things I’ve been puzzling about is why agentic systems are taking so long to catch on. It feels like the models are there and I’ve seen incredible demos, but we’re not seeing the kind of major changes I would have expected a year ago. What do you think is holding it back?
This technology is basically two years old, and there’s still a lot of missing infrastructure. We don’t have patterns for auditing what the agents are doing. We don’t have patterns for authorization of data to an agent. There are these patterns that are going to require work to put into production. And production is always a trailing indicator of what the technology is capable of. So two years isn’t long enough to see what the intelligence supports in production, and that’s where people are struggling.
I think it’s moved uniquely quickly in software engineering because it fits nicely in the software development lifecycle. We have a dev environment in which it’s safe to break things, and then we promote from the dev environment to the test environment. The process of writing code at Google requires two people to audit that code and both affirm that it’s good enough to put Google’s brand behind and give to our customers. So we have a lot of those human-in-the-loop processes that make the implementation exceptionally low-risk. But we need to produce those patterns in other places and for other professions.
Russell Brandom AI Editor
October 13-15 San Francisco, CA Save up to $680 on your pass before February 27. Meet investors. Discover your next portfolio company. Hear from 250+ tech leaders, dive into 200+ sessions, and explore 300+ startups building what’s next. Don’t miss these one-time savings.
Bill Gurley says that right now, the worst thing you can do for your career is play it safe
The 9,000-pound monster I don’t want to give back
Sam Altman would like to remind you that humans use a lot of energy, too
Google VP warns that two types of AI startups may not survive
Great news for xAI: Grok is now pretty good at answering questions about Baldur’s Gate
Russell Brandom
FBI says ATM ‘jackpotting’ attacks are on the rise, and netting hackers millions in stolen cash
Meta’s own research found parental supervision doesn’t really help curb teens’ compulsive social media use
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み