Google Cloud、Nvidia対抗の新型AIチップ2つを発表
Google Cloudは前世代より高速かつ低コストな新TPU2種類を公開し、Nvidia製チップとの競合を強化しつつも、当面は既存のNvidia供給体制も維持するマルチベンダー戦略を採用している。
キーポイント
新TPUの性能・コスト向上
Googleが公開した2つの最新TPUは、従来モデルより処理速度が向上し、運用コストも削減されている。
Nvidiaとの競合戦略
自社開発チップの強化により、AIインフラ市場でNvidia製GPUに直接対抗する姿勢を明確にした。
当面のマルチベンダー体制
自社チップの拡充とは別に、クラウド環境でのNvidia製チップ供給も当面継続し、顧客の移行リスクを低減する。
影響分析・編集コメントを表示
影響分析
本ニュースは、クラウドAIインフラ市場におけるチップ供給の多様化とコスト競争が本格化していることを示唆する。Googleは自社TPUの拡充でNvidiaへの依存度を長期的に低下させる方針だが、移行期間中の顧客維持のため既存供給を維持する現実的な戦略を採用している。これにより、クラウド利用者は性能とコストのバランスに応じたチップ選択が可能になり、AI開発のコスト構造に持続的な圧力がかかる見込みである。
編集コメント
自社チップと競合製品の併存は、クラウド利用者の選択肢拡大に寄与する一方、長期的なアーキテクチャの標準化を遅らせる可能性もある。利用者はワークロード特性に応じたチップ選定と、ベンダーロックイン回避の両方を意識する必要がある。
Google Cloudは水曜日、独自開発の第8世代AIチップ、すなわちテンソル処理ユニット(TPU)を2種類に分割すると発表した。1つはTPU 8tと名付けられ、モデル学習(model training)向けに設計され、もう1つはTPU 8iで、推論(inference)向けに焦点を当てている。
推論とは、ユーザーがプロンプトを入力した後に起こるモデルの継続的な使用を指す。
予想通り、同社は前世代と比較してこれらの新しいTPUの優れた性能仕様を謳っている。AIモデル学習は最大3倍高速化し、1ドルあたりのパフォーマンスが80%向上し、単一クラスタ(cluster)内で100万個以上のTPUを連携させる能力も備える。その結果、以前のバージョンよりもはるかに少ないエネルギーと顧客のコストで、より多くの計算能力(compute)が得られるはずだ。これらをTPUと呼ぶのは、GPUではなく、元々「Tensor」と命名された低消費電力の独自チップであるためである。
ただし、Googleのチップは少なくとも現時点では、Nvidiaの将来に対する全面的な攻撃ではない。MicrosoftやAmazonを含む他の巨大クラウド事業者と同様、Googleはこれらのチップを自社のインフラで提供するNvidiaベースのシステムを補完するために使用している。これはNvidiaを完全に置き換えるものではない。実際、Googleは今年後半までに自社のクラウドでNvidiaの最新チップ「Vera Rubin」を利用可能にすると約束している。
将来的には、Amazon、Microsoft、Googleといった独自のAIチップを開発するハイパースケール企業(hyperscalers)が、企業がクラウドにAIニーズを移行し、これらのチップ向けにアプリをポートするにつれて、Nvidiaへの依存度を低減できる可能性がある。
それでも現状では、Nvidiaに賭けない方が利益があるわけではない。有名なチップ市場アナリストであるPatrick Moorhead氏はX上で冗談めかして投稿したところ、検索大手が最初のTPUを発売した2016年当時、GoogleのTPUはNvidia(およびIntel)にとって悪報になるだろうと予測していた。現在Nvidiaの時価総額(market cap)は約5兆ドルに達しており、その予測が時間の試練に耐えなかったことは明らかだ。
Nvidiaの計画通り進めば、GoogleがAIクラウドプロバイダーとして成長することで、多くのワークロード(workload)がGoogleのチップ上で実行されたとしても、チップメーカーであるNvidiaにとってビジネスは増えるはずだ。
TechCrunchイベント
San Francisco, CA
|
October 13-15, 2026
実際、Googleはまた、Nvidiaと協力して、同社のクラウド内でNvidiaベースのシステムがより効率的に動作できるようにするコンピュータネットワーク技術(computer networking)を開発することに合意したと述べている。特に両社のテックジャイアントは、2023年にすべてのオープンソースデータセンターハードウェア団体の父祖的存在であるOpen Compute Projectの下でGoogleが作成しオープンソース化した、Falconというソフトウェアベースのネットワーク技術を強化する作業を進めている。
当記事内のリンクを通じてご購入いただいた場合、当社は少額のコミッションを受け取る場合があります。これは編集方針の独立性に影響しません。
原文を表示
Google Cloud on Wednesday announced that its eighth generation of custom-built AI chips, or tensor processing units (TPUs), will be split in two. One chip, named the TPU 8t, will be geared for model training and another, the TPU 8i, is aimed at inference.
Inference is the ongoing usage of models, aka what happens after users submit prompts.
As you might expect, the company touts some impressive performance specs for these new TPUs compared to the previous generations: up to 3x faster AI model training, 80% better performance per dollar, and the ability to get 1 million+ TPUs to work together in a single cluster. The upshot should be a lot more compute for a lot less energy — and cost to customers — than previous versions. It calls these chips TPUs, not GPUs, because its custom low-power chips were originally named Tensor.
But Google’s chips are not a full frontal assault on Nvidia’s future, at least not yet. Like the other giant cloud providers, including Microsoft and Amazon, Google is using these chips to supplement the Nvidia-based systems it offers in its infrastructure. It is not flat-out replacing Nvidia. In fact, Google promises its cloud will have Nvidia’s latest chip, Vera Rubin, available later this year.
One day the hyperscalers building their own AI chips (which includes Amazon, Microsoft, and Google) may grow to need Nvidia less, as enterprises move their AI needs to their clouds and port their apps to these chips.
Still, as things stand today, it’s not profitable to bet against Nvidia. As notable chip market analyst Patrick Moorhead jokingly posted on X, he had predicted that Google’s TPU could be bad news for Nvidia (and Intel) back in 2016 when the search giant launched its first one. Nvidia is now a nearly $5 trillion market cap company, meaning that prediction didn’t exactly hold up to the test of time.
If all goes according to Nvidia’s plan, Google’s growth as an AI cloud provider would result in more business for the chip maker not less, even if many a workload runs on Google’s chips.
Techcrunch event
San Francisco, CA
|
October 13-15, 2026
In fact, Google also says it has agreed to work with Nvidia to engineer computer networking that allows Nvidia-based systems to perform even more efficiently in its cloud. In particular, the two tech giants are working to beef up the software-based networking tech called Falcon, which Google created and open sourced in 2023 under the godfather of all open source data center hardware organizations, the Open Compute Project.
When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.
関連記事
Googleがエージェント型アーキテクチャのスケーリング原則を発表
GoogleとMITの研究者が、マルチエージェントシステムのスケーリングに関する予測フレームワークを論文で発表した。このフレームワークは、ツール調整のトレードオフを示し、特定のタスクに最適なエージェント型アーキテクチャの選択に活用できる。
Google、新規コードの75%をAIが生成していると発表
Googleは、社内における新規コードの75%がAIによって生成され、その後開発者がレビューを行うと発表した。
Gemini 3.1 Flash-Liteが入力処理方法の選択肢を提供
クラウドプロバイダーが新モデルGemini 3.1 Flash-Liteを発表し、企業開発者が直面する課題に対応するため、タスクに応じた思考レベルを提供する。