#computer use のAIニュース

5件の記事

Gemini 3.5 Flash にコンピュータ操作機能を導入

Google が軽量モデル「Gemini 3.5 Flash」にネイティブのコンピュータ操作機能を追加し、連続するスクリーンショットを解析してデスクトップ上のクリックやスクロール、入力操作を直接実行可能にした。

TLDR AI·6月25日·★★★★

Gemini 3.5 Flash にコンピュータ操作機能を導入

Google DeepMind は、AI モデル「Gemini 3.5 Flash」に、ユーザーの代わりにブラウザやアプリケーションを直接操作する機能を実装したと発表した。これにより、複雑なタスクの自動化が可能になる。

Google DeepMind·6月25日·★★★★

MagenticLite、MagenticBrain、Fara1.5:小型モデル向けに最適化されたエージェント体験

Microsoft Research は、ブラウザとローカルファイルシステムを単一ワークフローで連携する「MagenticLite」アプリケーションを発表した。また、オーケストレーション用「MagenticBrain」とコンピューター操作用「Fara1.5」という小型モデルも紹介し、小型モデルによるエージェント機能の強化を図っている。

Microsoft Research·5月22日·★★★★

「正解」が非確定的な場合の自律型エージェント行動の検証

GitHub Copilot Coding Agent(Agent Mode)のような自律型エージェントは、UI やブラウザとの相互作用により正解が複数経路に分かれるため、従来の反復可能性を前提としたテスト手法では不十分である。

GitHub Blog·5月7日·★★★★

59%のユーザーがより安価なモデルを選択:Sonnet 4.6の詳細解説

Anthropic社がClaude Sonnet 4.6をリリースし、Claude Codeテストで70%のユーザーが前世代モデルより好み、59%がフラッグシップモデルOpus 4.5よりも選択した。コーディング、コンピュータ利用、100万トークンコンテキストなど6次元で全面アップグレードされ、価格は据え置き。

宝玉的分享·2月17日·★★★★