Gemini 3.5 Flash にコンピュータ操作機能を導入
Google DeepMind は、Gemini 3.5 Flash に組み込まれた「Computer Use」機能を発表し、エージェントがプラットフォーム間を跨いで直接操作を行う能力を強化した。
キーポイント
Computer Use のネイティブ統合
Gemini 3.5 Flash に「Computer Use」機能が組み込まれ、外部ツールなしでエージェントがシステム操作を行えるようになった。
クロスプラットフォーム操作の実現
この機能により、AI エージェントは異なるプラットフォームやアプリケーション間をシームレスに移動し、複雑なタスクを実行可能となる。
高速・軽量モデルでの実装
Google の高速かつ軽量な「Flash」シリーズにおいて高度な操作機能が利用可能になったことは、コスト効率とスピードの両立を意味する。
ネイティブ統合による性能向上
Computer Use機能がGemini 3.5 Flashにネイティブ統合され、スタンドアロンモデルよりも優れたエージェントタスクのパフォーマンスを実現しました。
多様な環境での自律的アクション
ブラウザ、モバイル、デスクトップ環境を横断して視覚化・推論・実行を行うカスタムエージェントの構築が可能になり、長期ホライズンの自動化タスクに対応します。
開発者向けアクセス経路
Gemini API および Gemini Enterprise Agent Platform を通じて、開発者と企業がすぐにComputer Use機能を利用開始できます。
標的型敵対的学習によるリスク軽減
ライブ環境で動作するエージェントのプロンプトインジェクションリスクを軽減するため、Gemini 3.5 Flash ではコンピュータ使用機能に対して標的型の敵対的学習(targeted adversarial training)を採用しています。
影響分析・編集コメントを表示
影響分析
この発表は、LLM を単なる情報処理ツールから、実際のデジタル環境で動作する自律型オペレーターへと進化させる重要な転換点です。特に「Flash」モデルにこの機能が搭載されたことは、大規模な計算リソースを要さずに複雑な自動化タスクを実行できるため、企業における業務効率化や RPA(ロボティック・プロセス・オートメーション)の新たな基準となる可能性があります。
編集コメント
「Flash」モデルに高度な操作機能が搭載された点は、コスト対効果を重視する実務現場にとって極めて大きな朗報です。これにより、大規模な計算リソースを必要とせずに複雑な自動化ワークフローを構築できる道が開かれました。
2026 年 6 月 24 日
5 分間でお読みいただけます
コンピュータ操作機能は、プラットフォーム間で相互作用するエージェントを構築するための Gemini 3.5 Flash に組み込まれたツールとして利用可能になりました。
Mateo Quiros
Google DeepMind プロダクトマネージャー

お使いのブラウザはオーディオ要素をサポートしていません。
記事の音声読み上げ
このコンテンツは Google AI によって生成されています。生成 AI は実験的な技術です。
[[duration]] 分
Computer use は、Gemini 3.5 Flash に組み込まれたツールとしてサポートされ、エージェントによるコンピュータ操作タスクにおいてこれまでの最高性能を実現します。以前はスタンドアロンの Gemini 2.5 computer use モデル としてのみ利用可能でしたが、現在はメインの Gemini Flash モデルにネイティブ統合されました。Gemini はすでに関数呼び出しや、Search や Maps などの組み込みツールを活用する能力において卓越しています。組み込まれた computer use 機能により、開発者は now、3.5 Flash を用いて、ブラウザ、モバイル、デスクトップ環境全体で視覚化・推論・行動を実行できるカスタムエージェントを確実に構築できるようになります。これにより、継続的なソフトウェアテストや専門アプリケーションにわたる知識作業など、長期にわたるおよびエンタープライズ向けの自動化タスクにおいてパフォーマンスが向上します。
開発者および企業は、Gemini API および Gemini Enterprise Agent Platform を通じて、3.5 Flash での computer use の利用を開始できます。
3.5 Flash は computer use を活用して Gemini アプリを分析し、カテゴリ分けされた機能リストを返します。
Making computer use safe in 3.5 Flash
Gemini 3.5 Flash におけるコンピュータ操作の安全性向上
ライブ環境で動作するエージェントに対するプロンプトインジェクション(prompt injection)リスクの一部を緩和するため、Gemini 3.5 Flash のコンピュータ機能には、標的型敵対的学習(adversarial training)を採用しています。また、企業向けに以下の機能を可能にする 2 つのオプションのエンタープライズセーフガードシステムも公開します。
- 機密性が高く、または元に戻せない操作に対しては、明示的なユーザー確認を必須とする。
- 間接的なプロンプトインジェクションが検出された場合、タスクを自動的に停止する。
「多層防御(defense-in-depth)」のアプローチを採用し、これらの機能と安全なサンドボックス化(sandboxing)、人間によるループ検証(human-in-the-loop verification)、厳格なアクセス制御を組み合わせて利用することを開発者に推奨しています。安全性対策に関する詳細は、ベストプラクティス ドキュメントをご覧ください。
すでに、顧客がコンピュータ機能を通じて価値を生み出している事例が見られます。その一部からの声をご紹介します:
今日からコンピュータ機能を使った開発を始めるには:
- 今すぐお試しください:Browserbase がホストするデモ環境で機能をテストしてください。
- 開発を開始しましょう:Gemini API および Gemini Enterprise Agent Platform を通じて、リファレンス実装とドキュメントをご覧ください。
## Get more stories from Google in your inbox.
Done. Just one step more.
Check your inbox to confirm your subscription.
すでに本ニュースレターにご登録いただいています。
メールアドレスでも購読いただけます。
## 関連記事
.
原文を表示
Jun 24, 2026
5 min read
Computer use is now a built-in tool in Gemini 3.5 Flash to build agents
that can interact across platforms.
M
Mateo Quiros
Product Manager, Google DeepMind

Your browser does not support the audio element.
Listen to article
This content is generated by Google AI. Generative AI is experimental
[[duration]] minutes
Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks. Previously only available as a standalone Gemini 2.5 computer use model, computer use is now integrated natively in the main Gemini Flash model. Gemini already excels at function calling and using built-in tools like Search and Maps grounding. With built-in computer use capability, developers can now use 3.5 Flash to reliably build custom agents that can see, reason and take action across browser, mobile and desktop environments. This unlocks improved performance for long-horizon and enterprise automation tasks like continuous software testing and knowledge work across professional applications.
Developers and enterprises can start using computer use in 3.5 Flash via the Gemini API and Gemini Enterprise Agent Platform.
3.5 Flash uses computer use to analyse the Gemini app and return a categorized list of features.
Making computer use safe in 3.5 Flash
To mitigate some of the prompt injection risks for agents operating in live environments, we use targeted adversarial training for computer use in Gemini 3.5 Flash. We’re also releasing two optional enterprise safeguard systems that enable enterprises to:
- Require explicit user confirmation for sensitive or irreversible actions.
- Automatically stop tasks if an indirect prompt injection is identified.
Taking a “defense-in-depth” approach, we encourage developers to combine these features with secure sandboxing, human-in-the-loop verification and strict access controls. Additional information on safety measures can be found in our best practices documentation.
We are already seeing customers drive value with computer use. Here’s what some of them have to say:
To start building with computer use today:
- Try it now: Test the capabilities in a demo environment hosted by Browserbase.
- Start building: Dive into our reference implementation and documentation via Gemini API and Gemini Enterprise Agent Platform.
Get more stories from Google in your inbox.
Done. Just one step more.
Check your inbox to confirm your subscription.
You are already subscribed to our newsletter.
You can also subscribe with a
Related stories
.
関連記事
Gemini 3.5 Flash にコンピュータ操作機能を導入
Google DeepMind は、AI モデル「Gemini 3.5 Flash」に、ユーザーの代わりにブラウザやアプリケーションを直接操作する機能を実装したと発表した。これにより、複雑なタスクの自動化が可能になる。
ジェミニ研究者らがアンソロピックへ移籍(1 分読了)
ブルームバーグによると、Google のジェミニ研究チームに所属するジョナス・アドラー氏とアレクサンダー・プリッツェル氏が、競合他社であるアンソロピックへ移籍した。これはノア・シャゼー氏やジョン・ジャッパー氏らの退社に続く、主要 AI 企業間での人材流出の波の一環である。
HSBC、Google Cloud と AI 銀行提携を拡大
HSBC は Google Cloud と多年度提携を結び、グローバル業務で Gemini モデルなどを用いた AI ツールの開発・導入を開始する。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み