Gemini 3.5 Flash にコンピュータ操作機能を導入
Google DeepMind は、AI モデル「Gemini 3.5 Flash」にブラウザやアプリケーションを直接操作する機能を搭載し、複雑なタスクの自動化を実現可能にしたと発表した。
キーポイント
Computer Use 機能の実装
Gemini 3.5 Flash に、ユーザーの代わりにブラウザやアプリケーションを直接操作する能力が追加された。
複雑なタスクの自動化
この新機能により、従来のチャットベースの対話では困難だった多段階かつ複雑な作業の自動実行が可能になる。
Google DeepMind の発表
本機能は Google DeepMind によって正式に発表され、次世代 AI モデルの実用性を高める重要なステップとなる。
影響分析・編集コメントを表示
影響分析
この発表は、AI が単なる情報処理ツールから、実際のデジタル環境で行動を実行する自律型エージェントへと進化することを示す画期的な転換点です。企業や個人ユーザーにとって、データ入力やシステム操作などの反復業務を AI に委ねる現実的な道筋が開かれ、生産性革命の加速が期待されます。
編集コメント
「Computer Use」という機能名が示す通り、AI が画面を「見る」だけでなく「操作する」時代が本格化しました。これは RPA や従来の自動化ツールの概念を再定義する可能性を秘めています。
2026 年 6 月 24 日
約 4 分でお読みいただけます
コンピュータ操作機能は、プラットフォーム間を横断して相互作用するエージェントを構築するための Gemini 3.5 Flash に組み込まれたツールとして利用可能になりました。
Mateo Quiros
Google DeepMind プロダクトマネージャー

お使いのブラウザは音声再生要素をサポートしていません。
記事の聴読
このコンテンツは Google AI によって生成されています。生成 AI は実験的な技術です
[[duration]] 分
コンピュータ操作機能は、Gemini 3.5 Flash に組み込まれたツールとしてサポートされ、エージェントによるコンピュータ操作タスクにおいてこれまでの最高性能を実現しています。以前はスタンドアロンの Gemini 2.5 コンピュータ使用モデル としてのみ利用可能でしたが、現在はメインの Gemini Flash モデルにネイティブに統合されました。Gemini はすでに関数呼び出しや、検索やマップなどの組み込みツールを活用する能力において卓越しています。組み込まれたコンピュータ操作機能により、開発者は now、ブラウザ、モバイル、デスクトップ環境全体で視覚化し、推論し、行動を起こすカスタムエージェントを信頼性を持って構築できるようになりました。これにより、継続的なソフトウェアテストや専門アプリケーションにわたる知識労働など、長期にわたるおよび企業向けの自動化タスクにおいてパフォーマンスが向上します。
開発者や企業は、Gemini API および Gemini Enterprise Agent Platform を通じて、3.5 Flash でのコンピュータ操作機能の利用を開始できます。
3.5 Flash はコンピュータ操作機能を使用して Gemini アプリを分析し、カテゴリ分けされた機能リストを返します。
3.5 Flash におけるコンピューター使用の安全性確保
ライブ環境で動作するエージェントに対するプロンプトインジェクションリスクの一部を軽減するため、Gemini 3.5 Flash のコンピューター使用機能には、標的型敵対的トレーニング(adversarial training)を採用しています。また、企業向けに以下の機能を可能にする 2 つのオプションのエンタープライズセーフガードシステムも公開します。
- 機密性が高く、または不可逆的なアクションに対しては明示的なユーザー確認を必須とする。
- 間接的なプロンプトインジェクション(indirect prompt injection)が検出された場合、タスクを自動的に停止する。
「多層防御(defense-in-depth)」のアプローチを採用し、これらの機能と安全なサンドボックス化(sandboxing)、人間によるループ検証(human-in-the-loop verification)、厳格なアクセス制御を組み合わせて利用することを開発者に推奨しています。安全性対策に関する詳細情報は、ベストプラクティス ドキュメントをご覧ください。
すでに、コンピューター使用機能によって顧客が価値を生み出している様子が見られます。その一部をご紹介します:
今すぐコンピューター使用機能の構築を開始するには:
- 今すぐお試しください:Browserbase がホストするデモ環境で機能をテストしてください。
- 構築を始める:Gemini API および Gemini Enterprise Agent Platform を通じて、リファレンス実装とドキュメントをご覧ください。
## Google のストーリーをあなたのメールボックスへ
完了しました。あと一歩です。
受信トレイを確認して購読を確定してください。
すでに本ニュースレターにご登録いただいています。
以下の方法でもご登録いただけます。
## 関連記事
.
原文を表示
Jun 24, 2026
4 min read
Computer use is now a built-in tool in Gemini 3.5 Flash to build agents
that can interact across platforms.
M
Mateo Quiros
Product Manager, Google DeepMind

Your browser does not support the audio element.
Listen to article
This content is generated by Google AI. Generative AI is experimental
[[duration]] minutes
Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks. Previously only available as a standalone Gemini 2.5 computer use model, computer use is now integrated natively in the main Gemini Flash model. Gemini already excels at function calling and using built-in tools like Search and Maps grounding. With built-in computer use capability, developers can now use 3.5 Flash to reliably build custom agents that can see, reason and take action across browser, mobile and desktop environments. This unlocks improved performance for long-horizon and enterprise automation tasks like continuous software testing and knowledge work across professional applications.
Developers and enterprises can start using computer use in 3.5 Flash via the Gemini API and Gemini Enterprise Agent Platform.
3.5 Flash uses computer use to analyse the Gemini app and return a categorized list of features.
Making computer use safe in 3.5 Flash
To mitigate some of the prompt injection risks for agents operating in live environments, we use targeted adversarial training for computer use in Gemini 3.5 Flash. We’re also releasing two optional enterprise safeguard systems that enable enterprises to:
- Require explicit user confirmation for sensitive or irreversible actions.
- Automatically stop tasks if an indirect prompt injection is identified.
Taking a “defense-in-depth” approach, we encourage developers to combine these features with secure sandboxing, human-in-the-loop verification and strict access controls. Additional information on safety measures can be found in our best practices documentation.
We are already seeing customers drive value with computer use. Here’s what some of them have to say:
To start building with computer use today:
- Try it now: Test the capabilities in a demo environment hosted by Browserbase.
- Start building: Dive into our reference implementation and documentation via Gemini API and Gemini Enterprise Agent Platform.
Get more stories from Google in your inbox.
Done. Just one step more.
Check your inbox to confirm your subscription.
You are already subscribed to our newsletter.
You can also subscribe with a
Related stories
.
関連記事
AI 研究者が競合他社へ移籍を続ける Google の状況
Google の AI 研究チームから、複数の研究者が競合他社へと移籍し続けていることが報告されています。
Klarna の AI アシスタントが 8500 万人のユーザー向けに大規模カスタマーサポートを再定義した方法
決済大手 Klarna は、8500 万人のアクティブユーザーを対象とした顧客サポートにおいて、AI アシスタントを導入することで業務効率と対応品質を劇的に向上させました。
Google Home スピーカーは音質・デザインともに優れるが、動作に癖あり
The Verge AI は、新しい Google Home スピーカーが音量最大時でも「Hey, Google」の音声認識を即座に実行する優れた性能を持つ一方、2 日間のテストでマイクロホンの反応に不安定さが見られると報告した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み