Google Developers AI の最新記事
公式62件の記事
Why we built ADK 2.0
Google Cloud の力を活用した VS Code での ML 開発:Workbench エクステンションが利用可能に
Google が、VS Code からスケーラブルなクラウドベースの Jupyter 環境へ直接接続できる「Cloud Workbench Notebooks」エクステンションを正式にリリースしました。これにより、開発者はローカル IDE で機械学習ライフサイクルをシームレスに管理できるようになります。
Genkit でエージェント型フルスタックアプリを構築
Google がオープンソースフレームワーク「Genkit」に導入した Agents API は、会話 AI の複雑な処理を単一インターフェースで簡素化するツールです。これにより、メッセージ履歴やツールのループ管理が容易になります。
ADK Go 2.0 で信頼性の高いマルチエージェントアプリケーションを構築。グラフベースのワークフローエンジンや人間が関与する仕組み、動的オーケストレーションを発見
Google が「Agent Development Kit (ADK) for Go」のバージョン 2.0 をリリースし、複雑なマルチエージェントアプリ作成を支援するグラフベースのワークフローエンジンと、人間が関与する機能や動的実行機能を追加した。
コーディングエージェントの品質向上サイクルを推進する
Google は、プロンプト修正が本番環境に広範な回帰を引き起こす懸念に対処するため、データ準備から推論実行、評価までの5段階評価サイクルを自動化する新しい開発者スキルを発表した。
Google のエージェント開発キットと A2A を用いたクロス言語マルチエージェントチームの構築
Google が提供する Agent Development Kit と A2A プロトコルを活用し、異なるプログラミング言語で動作する複数のエージェントを連携させるチーム構築手法を発表した。
Jules を用いた重要指標の測定方法について
Google Developers AI が、AI モデルの評価において重要な指標を測定する方法として「Jules」を紹介した。
エージェント間通信プロトコル「A2A」が構築する協調型エージェントの世界
Google Developers AI は、エージェント間通信(A2A)プロトコルの1周年を記念し、従来のAPIの硬直性を排除して自律型AIエージェントが安全に協力・タスク引継ぎを行う仕組みについて紹介した。
宣言型とカスタムエージェント UI の融合:A2UI と MCP Apps を組み合わせる
Google Developers AI は、MCP アプリと Agent-to-User Interface(A2UI)を統合する 3 つのアーキテクチャパターンを発表した。これにより、開発者はネイティブな宣言型レンダリングとカスタム iframe のトレードオフを解消し、MCP サーバー上でネイティブ感覚の UI を提供できるようになる。
エージェント型リソース発見仕様の発表
Google Developers AI が、AI エージェントがリソースを自動的に発見・利用するための新しい仕様「Agentic Resource Discovery」を発表した。
TPU スタックの力を解き放つ:新開発者ハブの紹介
Google は、モデルビルダーや開発者が Google Cloud TPU の性能を最大化できるよう支援する教育リソース「TPU 開発者ハブ」を正式に立ち上げました。
DiffusionGemma:開発者向けガイド
Google が、Gemma 4 アーキテクチャを基盤に拡散モデルに基づく並列生成を採用した実験的テキスト生成モデル「DiffusionGemma」を開発し、消費者用 GPU でも動作する高速推論と双方向文脈理解を実現したと発表した。
Google Colab CLI の紹介
Google は、開発者や AI エージェントがローカル端末からリモート Colab ランタイムに接続し、高機能 GPU を要求して Python スクリプトをシームレスに実行できる新ツール「Google Colab CLI」を発表した。
Gemma 4 12B:開発者ガイド
Google が、消費者向けデバイスでの高性能なローカル AI 実行を目的とした高密度マルチモーダルモデル「Gemma 4 12B」を発表し、従来の視覚・音声エンコーダーを不要とする新アーキテクチャを採用した開発者向けのガイドを提供した。
Google AI Edge を活用した Gemma 4 12B のローカル導入:ラップトップで実行可能なエージェント型ワークフローの実現
Google DeepMind は、メモリ 16GB の一般的なラップトップでも動作する「Gemma 4 12B」モデルを発表し、macOS 上で Google AI Edge Gallery を介してローカルデータ処理や視覚的洞察生成を可能にするエージェント型 AI ワークフローを提供している。
Google Pay & Wallet Developer MCP サーバーで統合ワークフローを強化
Google は、AI 開発アシスタントや IDE とリアルタイムの API やアカウント情報を安全に接続するためのオープン標準ツール「Google Pay & Wallet Developer MCP サーバー」を発表した。これにより、開発者は開発環境内で公式ドキュメントを検索し、ウォレットパスを検証できるようになる。
コミュニティが Tunix と TPU を活用して Gemma に「思考」能力を習得させた方法
Google が Kaggle で開催したハッカソンにおいて、開発者たちは限られた計算資源と Kaggle TPU を用いて、小規模なベースモデルに多段階の事後学習パイプラインを適用し、推論エンジンとしての能力を獲得させることに成功しました。
Android およびそれ以上での AI エージェント構築を可能にする Kotlin 版 ADK と Android 専用 ADK 0.1.0 の発表
Google は、クラウドとエッジ環境にまたがる複雑なオーケストレーションやセッション共有を管理するオープンソースフレームワーク「Agent Development Kit (ADK)」の Kotlin 版および Android 専用ライブラリのバージョン 0.1.0 を発表した。
ホーム向け Gemini でサービスプロバイダーとハードウェアパートナーを支援
Google は、高度なカメラ知能や自然言語クエリ機能を統合したフルスタックの Gemini AI オファリングを開始し、スマートホームエコシステムを拡大する。これにより、サービスプロバイダーやハードウェアメーカーは、ブランド付きの予防的サービス構築に必要な参考設計と API を利用できるようになる。
Google I/O 2026 デベロッパー基調講演のニュースまとめ
Google は支援型 AI から自律型エージェントへの移行を発表し、Gemini 3.5 シリーズの発売と Antigravity エージェントファースト開発プラットフォームの大幅更新を明らかにした。また、モバイル開発者向けに新 Android CLI ツールや評価リーダーボードも紹介された。
より賢くなったGoogle AI Edge Gallery:MCP統合、通知機能、セッション継続性の追加
GoogleはAndroid向けAIエッジギャラリーアプリにオープンソースのモデルコンテキストプロトコル(MCP)の実験的サポートを追加し、Gemma 4が外部データソースと連携して複雑なタスクを調整可能にした。これにより、より能動的で継続的なユーザー体験が可能になった。
LiteRT-LMによるオンデバイス生成AIの高速化
Google AI Edgeが提供する「LiteRT-LM」は、Gemma 4モデルをモバイルやエッジ環境で実行するための最適化インフラであり、メモリ効率の高い動的読み込みとマルチトークン予測により、最大2.2倍の速度向上を実現し、オンデバイスでの多機能・エージェント機能を解放する。
1 年間の革新:Google Cloud と NVIDIA の開発者コミュニティが会員数 10 万人を達成
Google Cloud と NVIDIA が共同で運営する開発者コミュニティが設立から 1 周年を迎え、会員数が 10 万人に達した。両社は引き続き、LLM の最適化や GPU を活用したデータ分析の学習パスを提供し、開発者の支援を強化している。
Google Tensor SDK Beta と LiteRT の発表
Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。
重要な更新:Gemini CLI を「Antigravity CLI」へ移行
Google は、コミュニティ向けの Gemini CLI を、複雑なマルチエージェントワークフロー向けに設計された新しいエージェントファーストプラットフォームである Antigravity CLI へ移行すると発表した。
Genkit ミドルウェア発表:エージェント型アプリの検知・拡張・強化
Google が TypeScript や Python などに対応するオープンソースフレームワーク「Genkit」を発表し、生成呼び出しを中継してリトライやモデル切替、人間による承認機能などを追加できるミドルウェアシステムを提供した。
オンデバイス AI の加速:Arm と Google AI Edge の最適化
Arm が提供するスケーラブル行列拡張 2(SME2)と Google の AI エッジソフトウェアスタックを統合することで、CPU を強力な行列演算アクセラレータとして活用し、オンデバイスでの生成 AI の高パフォーマンスを実現する手法が示された。
ADK を活用して、コンテキストを失わずに一時停止・再開可能な長期実行型 AI エージェントを構築する方法
Google は、HR 採用など数日〜数週間にわたる企業ワークフローを管理できる生産レベルの AI エージェントを実現するため、永続的な状態機械とセッション保存機能を持つ「Agent Development Kit(ADK)」を発表した。これにより、従来型のステートレスなチャットボットから、コンテキストを維持しながら一時停止や再開が可能なエージェントへの移行が可能となる。
Google TPU上でLLM推論を高速化:拡散型予測デコーディングによる3倍の速度向上を実現
UCSD(カリフォルニア大学サンディエゴ校)の研究チームは、Google TPU上でブロック拡散型予測デコーディング手法「DFlash」を実装し、従来の逐次推論のボトルネックを克服して推論速度を3倍に向上させることに成功した。
Gemini Embedding 2 の一般提供:エージェント型マルチモーダル RAG を実現する統合モデル
Google はテキスト、画像、動画、音声、文書を単一の意味空間にマッピングする統合モデル「Gemini Embedding 2」の一般提供を開始した。この新モデルにより、開発者は1回のリクエストで複数のマルチモーダル入力を処理でき、エージェント型 RAG の性能が大幅に向上する。
LiteRTとNPUを活用した実世界向けオンデバイスAIの構築
LiteRTフレームワークは、モバイル開発者向けにNPUsの性能を最大限活用する統一APIを提供し、CPU/GPUの課題を解決して実用的な端末内AIの実装を可能にする。
Agent PlatformのAgents CLI:1つのCLIで開発から本番環境へ
Google CloudはAIエージェントのローカル開発から本番デプロイを一元化する「Agents CLI」を発表した。このCLIはコーディングアシスタントにGoogle Cloudリソースへのアクセスを提供し、開発コストを削減する。
本番環境対応のAIエージェント:モノリシックシステムのリファクタリングから得た5つの教訓
開発チームはGoogle ADKを用い、販売調査プロトタイプを本番環境対応のAIエージェントに改修した。モノリススクリプトをサブエージェントと構造化出力に置き換え、システム障害を解消した。
A2UI v0.9:ポータブルでフレームワークに依存しない生成UIの新標準
A2UI v0.9は、企業の既存デザインシステムを使用してAIエージェントがリアルタイムでカスタマイズされたUIウィジェットを生成するためのフレームワークに依存しない標準を導入した。Python用Agent SDK、共有ウェブコアライブラリ、React/Flutter/Angularの公式サポートにより開発者体験を簡素化している。
MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張
MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。
Gemini CLIにサブエージェントが導入される
GoogleはGemini CLIにサブエージェントを導入した。これらの専門エージェントは複雑なタスクを隔離されたコンテキストで処理し、Markdownファイルでカスタマイズ可能で、@agent構文で呼び出せる。
より優れたAIエージェントを構築する:エージェント・ベイクオフからの5つの開発者向けヒント
Google Cloud AIエージェント・ベイクオフは、単純なプロンプトエンジニアリングから厳密なエージェント工学への移行を強調し、本番環境対応のAIにはモジュラー型のマルチエージェントアーキテクチャが必要だと指摘している。複雑なタスクを専門サブエージェントに分解するなど5つの開発者向けヒントを提示した。
TorchTPU:GoogleスケールのTPU上でPyTorchをネイティブ実行
GoogleがTorchTPUを発表。同社のTPUインフラ上でPyTorchワークロードを最小限のコード変更でネイティブ実行できる新エンジニアリングスタックを提供する。
Gemma 4で最先端のエージェント機能をエッジデバイスに導入
Google DeepMindは、Gemma 4という最先端のオープンモデル群を発表した。このモデルは、オンデバイスで多段階計画と自律的なエージェントワークフローを可能にする。また、Google AI Edge Galleryと高速化を提供するLiteRT-LMライブラリもリリースした。
スキルを備えたADKエージェント構築の開発者ガイド
GoogleのAgent Development Kit(ADK)SkillToolsetは、AIエージェントが要求に応じてドメイン知識を読み込める「段階的開示」アーキテクチャを導入し、従来の単一プロンプトと比較してトークン使用量を最大90%削減する。
トレーニング効率を向上:OrbaxとMaxTextにおける連続チェックポイント機能が信頼性を最適化
GoogleはOrbaxとMaxTextに連続チェックポイント機能を導入し、従来の固定頻度チェックポイントの問題を解決して、モデルトレーニング中の信頼性とパフォーマンスのバランスを最適化した。
ADK Go 1.0がリリース!
GoogleがGo言語向けのAgent Development Kit(ADK)1.0を発表し、実験的なAIスクリプトから本番環境対応のサービス開発へ移行を促進。OpenTelemetry統合によるトレーシング機能やプラグインシステムを導入。
Java向けエージェント開発キット(ADK)1.0.0の発表:JavaにおけるAIエージェントの未来を構築
GoogleがJava向けエージェント開発キット(ADK)1.0.0をリリースし、Google Maps連携、URL取得機能、エージェント間連携プロトコルを追加した。
エージェントスキルで知識ギャップを埋める
Google DeepMindは、静的モデル知識と急速に進化するソフトウェア実践のギャップを埋めるため、エージェントにライブドキュメントとSDKガイダンスを提供する「Gemini API開発者スキル」を開発した。評価結果では、gemini-3.1-pro-previewモデルの性能が28.2%から96.6%に大幅に向上した。
ジャンプして遊ぶ:GeminiとMediaPipeでの構築
Googleは、Gemini CanvasとMediaPipe Pose Landmarkerを使用して、モーション制御ゲーム開発のワークフローを効率化する方法を発表した。開発者はGoogle AI Studioで低遅延モデルや安定したトラッキングポイントを最適化できる。
LlamaParseとGemini 3.1でスマートな財務アシスタントを構築
Googleが、非構造化文書から高品質データを抽出するワークフローを紹介。LlamaParseとGemini 3.1モデルを組み合わせ、複雑な財務表の解析と要約を実現するイベント駆動型アーキテクチャを提案している。
AIエージェントプロトコル開発者ガイド
Googleが、AIエージェントがデータにアクセスし通信する方法を標準化するMCPやA2Aなど6つのプロトコルを紹介。実例として「キッチンマネージャー」エージェントによる在庫管理・取引処理を示す。
Gemini CLIにプランモードが追加
GoogleがGemini CLIにプランモードを追加した。この機能は、AIが複雑なコードベースを分析し、誤実行のリスクなくアーキテクチャ変更を計画できる読み取り専用環境を提供する。
IntelliJとVS CodeのGemini Code Assist拡張機能で「Finish Changes and Outlines」を導入
GoogleがIntelliJとVS CodeのGemini Code Assistに「Finish Changes and Outlines」を導入し、開発者の負担を軽減し、長い手動プロンプトの必要性を排除した。Finish ChangesはAIペアプログラマーとして、コードの完成、擬似コードの実装、リファクタリングパターンの適用を行う。
開発の超能力を解き放て:コアコーディング体験の洗練
Gemini Code Assistチームが、Agent Mode with Auto ApproveやInline Diff Viewsなどの高速ツールによるコアコーディングワークフローの効率化を目的とした一連のアップデートを発表した。