AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月23日 00:34·約6分で読める

Google、Cloud Next '26で第8世代TPU、エージェントプラットフォーム、Workspace AIレイヤーを発表

#Agentic AI#TPU#Enterprise AI#Google Cloud
TL;DR

GoogleはCloud Next '26において、第8世代TPU、刷新されたエージェントプラットフォーム、Workspace用AIレイヤーを「Agentic Enterprise」の枠組みで発表し、エンタープライズ向けAI統合基盤の強化を推進した。

AI深層分析2026年4月23日 02:12
4
重要/ 5段階
深度40%
3
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

第8世代TPUの発表

大規模AIモデルの学習・推論効率を向上させる次世代アクセラレータハードウェアを提供。

2

エージェントプラットフォームの刷新

自律型AIエージェントの開発・デプロイを支援する統合開発環境と管理基盤を整備。

3

Workspace AIレイヤーの新設

OfficeスイートにAI機能を組み込み、業務プロセスの自動化とナレッジ活用を促進。

4

「Agentic Enterprise」戦略の推進

インフラ、エージェント基盤、アプリ層を一体化させ、企業向けAI導入の標準パッケージとして提供。

影響分析・編集コメントを表示

影響分析

Googleはクラウドインフラからアプリケーション層までを一括で提供することで、企業側のAI統合コストを大幅に削減する。特にエージェント機能の標準化は、RPAや業務自動化市場への参入を加速させ、競合クラウド事業者との差別化要因となる。

編集コメント

Googleはハードウェアからアプリ層までを一体化させた「Agentic Enterprise」戦略で、企業向けAI市場の標準規格を自ら定義しようとしている。今後は各レイヤー間の連携品質とセキュリティ基準が競合との勝敗を分ける鍵となるだろう。

GoogleはCloud Next '26カンファレンスにおいて、第8世代TPUの発表、刷新されたエージェントプラットフォーム、そしてWorkspace用の新しいAIレイヤーを公開した。同社は、「Agentic Enterprise(エージェント型エンタープライズ)」という旗印の下、これら一連のソリューションを提案している。

今回Googleは、Tensor Processing Units(TPU:テンソルプロセッシングユニット)を初めて2つのバリエーションに分割した。1つは学習(training)用のTPU 8t、もう1つは推論(inference)用のTPU 8iである。AIおよびインフラストラクチャー担当シニアバイスプレジデント兼チーフテクノロジストのAmin Vahdat氏によれば、この取り組みは、計画し、行動し、ループ内で学習するエージェントからの推論需要の高まりに対応するためのものだという。

Nvidiaと比較すると、Googleは単一チップの純粋なパフォーマンスよりもスケーラビリティ(規模)に賭けている。The Registerの指摘通り、Nvidiaの次期Rubin GPUはTPU 8tよりも多くの計算能力と大幅に高いメモリ帯域幅を1チップあたりで提供している。しかし、最先端モデルの学習において重要なのは、いかに多くのチップを効率的に連携させられるかということだ。

The Registerによれば、ここがGoogleの優位性となる点だ。Nvidiaの最新GPUは、低速なEthernetやInfiniBandリンクが動作し始める前に、単一のNVLinkドメイン内で最大576個のアクセラレータを接続する。一方Googleは、光回路スイッチ(optical circuit switches)を用いて、単一のポッド(pod)内で9,600個のTPUを接続している。新しいVirgo Networkは複数のデータセンターを結び、最大100万個のTPUからなるクラスターを構築できる。管理されたLustreストレージシステムはデータをアクセラレータのメモリに直接転送する。Googleが目標とする「goodput(実効スループット)」率は約97%であり、これはチェックポイントの待機やエラーからの復旧ではなく、チップが実際に学習に費やす時間の割合を意味する。

TPU 8i推論チップは、計算能力の一部を犠牲にしてオンチップSRAMと高速HBM(High Bandwidth Memory:高帯域幅メモリ)の増強を図っている。大容量SRAMにより、キーバリューキャッシュ(key-value cache:過去の応答に関するモデルの記憶)の大部分をチップ上に直接保持でき、コアがデータ待ちでアイドル状態になるのを防ぐ。Collective Acceleration Engineは、Mixture-of-Experts(MoE:専門家の混合)モデルの処理速度向上を目的として設計されている。またGoogleは、チップ間レイテンシを削減するためにBoardflyというネットワークトポロジーも開発した。

両TPUは、今回初めてGoogleのArmベースAxion CPU上で動作する。

エージェントの構築と実行のための単一プラットフォーム

ソフトウェア面では、Googleは既存のAIサービスをVertex AIを基盤とするGemini Enterprise Agent Platformに統合している。構築には、複数のエージェントがフローチャートとしてどのように連携するかをマッピングできるツールと、自然言語を通じてエージェントを作成できるAgent Studioというインターフェースが用意されている。中央レジストリは、組織内でほぼ同一のエージェントが数十個も作成されるのを防ぐことを目的としている。

エージェントの実行面では、Googleはよく知られた弱点に切り込んでいる。長時間稼働するエージェントは、各ステップで人間の入力を待って一時停止するのではなく、マルチステッププロセスを自律的に処理できるようになった。サンドボックス化されたテスト環境(Sandboxed test environments)により、エージェントはホストシステムにリスクを与えずに独自のコードやブラウザ自動化を実行できる。Memory Bankにより、エージェントは長期記憶を獲得し、セッションのたびにゼロから開始する必要がなくなる。

自律型エージェント(autonomous agents)は新たな攻撃面(attack surfaces)を開くため、Googleはそれに対応する制御機能を搭載して提供します。これには各エージェントの暗号化されたID(cryptographic identities)、プロンプトインジェクション(prompt injection)に対するアップストリームフィルタ、不正なデータアクセスや終わらない推論ループ(reasoning loops)といった不審な行動に対する異常検知(anomaly detection)が含まれます。シミュレーションツールにより、チームは実際の顧客と接触する前に合成されたユーザーインタラクションに対してエージェントをテストできます。これらの安全対策が実際にどれほど効果的かは、まだ見えていません。

利用可能なモデルには、Gemini 3.1 Pro、Nano Banana 2、Lyria 3に加え、AnthropicのClaude Opus、Sonnet、Haiku、そして新たに追加されたClaude Opus 4.7が含まれます。

同梱のGemini Enterpriseアプリはエンドユーザーを対象としています。従業員はビルディングブロックから独自のエージェントを組み立てたり、インボックス形式のビューで実行中のタスクを追跡したり、アプリ内で直接ドキュメントを編集することができます。

プラットフォームと並行して、GoogleはWorkspace Intelligenceを展開しています。これはGmail、Docs、Drive、Meet、Chatにわたってコンテンツを接続するレイヤーです。このアイデアは、Geminiおよびその上に構築されたエージェントが、各アプリを個別にクエリするのではなく、メール、会議、チャット、ファイル間の関係性を理解できる点にあります。

Gmailでは、Geminiが着信メッセージを分類し、トピックを要約します。Google Chatでは、ユーザーは会話から直接カレンダーイベントやドキュメントを作成できます。Docsでは、Geminiがメールやファイルからコンテンツの下書きを作成し;Sheetsではダッシュボードを構築し;Slidesではプレゼンテーションを組み立てます。Drive Projectsは、ファイルやメールをトピックベースのワークスペースにグループ化します。移行を検討する企業向けに、GoogleはMicrosoft 365からのより高速なマイグレーションパスを提供しています。

AI News Without the Hype – Curated by Humans

THE DECODERに登録して、広告なしの読書、週刊AIニュースレター、年6回の独占「AI Radar」フロンティアレポート、アーカイブへの完全アクセス、そしてコメントセクションへのアクセスをお楽しみください。

今すぐ登録する

原文を表示

Google used its Cloud Next '26 conference to unveil its eighth-generation TPUs, a revamped agent platform, and a new AI layer for Workspace. The company is pitching the whole package under the banner "Agentic Enterprise."

For the first time, Google is splitting its Tensor Processing Units into two variants: TPU 8t for training and TPU 8i for inference. According to Amin Vahdat, SVP and chief technologist for AI and infrastructure, the move is a response to rising inference demands from agents that plan, act, and learn in loops.

Compared to Nvidia, Google is betting less on raw single-chip performance and more on scale. As The Register notes, Nvidia's upcoming Rubin GPUs offer more compute and significantly more memory bandwidth per chip than the TPU 8t. But when training frontier models, what matters is how many chips you can efficiently link together.

That's where Google has the edge, according to The Register. Nvidia's latest GPUs connect up to 576 accelerators in a single NVLink domain before slower Ethernet or InfiniBand links kick in. Google, by contrast, uses optical circuit switches to link 9,600 TPUs in a single pod. Its new Virgo Network can tie multiple data centers together into clusters of up to one million TPUs. A managed Lustre storage system pushes data straight into accelerator memory. Google is targeting a "goodput" rate of around 97 percent - meaning the share of time chips spend actually training rather than waiting on checkpoints or recovering from errors.

The TPU 8i inference chip trades some compute for more on-chip SRAM and faster HBM. The larger SRAM keeps more of the key-value cache - essentially the model's memory of previous responses - directly on the chip, so cores don't sit idle waiting for data. A Collective Acceleration Engine is designed to speed up mixture-of-experts models. Google also developed a network topology called Boardfly to cut chip-to-chip latency.

Both TPUs now run on Google's Arm-based Axion CPUs for the first time.

A single platform for building and running agents

On the software side, Google is bundling its existing AI services into the Gemini Enterprise Agent Platform, which builds on Vertex AI. For building, there's a tool that lets developers map out how multiple agents work together as a flowchart, plus an interface called Agent Studio for creating agents through natural language. A central registry is meant to prevent organizations from ending up with dozens of nearly identical agents.

For running agents, Google is taking aim at well-known weak spots. Long-running agents can now handle multi-step processes on their own instead of pausing for human input at every step. Sandboxed test environments let agents execute their own code or browser automations without putting host systems at risk. A Memory Bank gives agents long-term memory so they don't start from scratch with every session.

Because autonomous agents open up new attack surfaces, Google is shipping controls to match: cryptographic identities for each agent, upstream filters against prompt injection, and anomaly detection for suspicious behavior like unauthorized data access or reasoning loops that never end. Simulation tools let teams test agents against synthetic user interactions before they ever meet a real customer. How effective these safeguards actually are remains to be seen.

Available models include Gemini 3.1 Pro, Nano Banana 2, and Lyria 3, along with Anthropic's Claude Opus, Sonnet, Haiku, and the newly added Claude Opus 4.7.

The accompanying Gemini Enterprise app targets end users: employees can assemble their own agents from building blocks, track running tasks in an inbox-style view, and edit documents directly in the app.

Alongside the platform, Google is rolling out Workspace Intelligence, a layer that connects content across Gmail, Docs, Drive, Meet, and Chat. The idea is that Gemini and the agents built on top of it can understand the relationships between emails, meetings, chats, and files instead of querying each app in isolation.

In Gmail, Gemini sorts incoming messages and summarizes topics. In Google Chat, users can create calendar events or documents directly from a conversation. In Docs, Gemini drafts content from emails and files; in Sheets, it builds dashboards; in Slides, it puts together presentations. Drive Projects groups files and emails into topic-based workspaces. For companies looking to switch, Google is offering a faster migration path from Microsoft 365.

AI News Without the Hype – Curated by Humans

Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.

Subscribe now

この記事をシェア

関連記事

InfoQ★32026年3月3日 23:00

Googleがエージェント型アーキテクチャのスケーリング原則を発表

GoogleとMITの研究者が、マルチエージェントシステムのスケーリングに関する予測フレームワークを論文で発表した。このフレームワークは、ツール調整のトレードオフを示し、特定のタスクに最適なエージェント型アーキテクチャの選択に活用できる。

The Decoder★42026年4月23日 22:23

Google、新規コードの75%をAIが生成していると発表

Googleは、社内における新規コードの75%がAIによって生成され、その後開発者がレビューを行うと発表した。

AI Business★32026年3月4日 07:02

Gemini 3.1 Flash-Liteが入力処理方法の選択肢を提供

クラウドプロバイダーが新モデルGemini 3.1 Flash-Liteを発表し、企業開発者が直面する課題に対応するため、タスクに応じた思考レベルを提供する。

ニュース一覧に戻る元記事を読む