2026年 第10週のAI週報

200件の記事を集計 · 2026/3/8 0:43:12生成

AI週報

2026-W10

200件の記事を集計

2026-W10 AI週次レポート

今週のハイライト

  • GPT-5.4正式リリース: OpenAIが新フロンティアモデル「GPT-5.4」と「GPT-5.4 Pro」を発表。コーディング、コンピュータ操作、推論を統合したエージェント機能が強化され、ChatGPT、API、GitHub Copilot、Cursorなど主要プラットフォームで順次展開開始。
  • Anthropic vs 米国防総省の対立激化: 国防総省がAnthropicを「サプライチェーンリスク」と正式認定。これに対しAnthropicのCEOダリオ・アモデイが法的措置を示唆。一方、Claudeの一般消費者向け成長は国防総省契約破談後も急増。
  • AIによる脆弱性発見能力が実証: AnthropicのClaudeがFirefoxで100以上のセキュリティ脆弱性(うち数十件は高深刻度)を発見。OpenAIもコードセキュリティエージェント「Codex Security」の研究プレビューを開始し、セキュリティ分野でのAI活用が現実化。
  • エージェント型コーディングの進化: GitHub Copilotがエージェント型アーキテクチャに移行し、より文脈を考慮したコードレビューを提供。Cursorは「Automations」で常時稼働エージェントを、AnthropicはClaude Codeにスケジュールタスク機能を追加し、自動化が加速。
  • 大規模なAIインフラ動向: ソフトバンクがOpenAI出資に向け400億ドル融資を検討。OpenAIはAWSと1100億ドル規模のマルチクラウド契約を締結。一方、OracleとOpenAIはテキサスデータセンター拡張を電力問題で停止し、NVIDIA次世代チップへの投資へシフト。
  • 動画生成AIの性能向上と限界: ByteDanceが単一GPUでほぼリアルタイム動画生成を可能にするオープンウェイトモデル「Helios」を公開。しかし研究では、Sora 2やVeo 3.1などの最新モデルも推論タスクでは人間に大きく劣ることが指摘された。
  • AIの雇用影響は「時期尚早」: Anthropicのレポートが、AIの理論的破壊ポテンシャルにもかかわらず、現時点での実質的雇用影響は限定的(若年層採用減少は例外)と分析。AI能力と実社会への浸透にギャップがあることを示唆。
  • 注目テーマ

  • エージェントの実用化と自動化: コーディング(GitHub Copilot、Cursor、Claude Code)、セキュリティ(Codex Security)、業務支援(AWS Health Connect、Sakana AI融資エキスパート)など、特定タスクを自律・半自律で実行するエージェントの本格的な製品展開が今週の中心テーマ。スケジューリングやトリガーによる常時稼働機能の追加が顕著。
  • AI安全性とガバナンスの対立: Anthropicの国防総省との契約破談とサプライチェーンリスク指定は、AI企業の軍事利用へのスタンスの違いがビジネスに直結する事例となった。同時に、OpenAIはモデルの推論経路を制御できないこと(CoT制御性の低さ)を安全性の証と主張するなど、安全性の定義と実装を巡る議論が活発化。
  • オープンソース/オープンウェイトモデルの進展: ByteDanceの動画モデル「Helios」、Tencentの適応型フレームワーク「HY-WU」、Qwen 3.5 4Bの一部ベンチマークでのGPT-4o超えなど、オープンなモデルの性能向上と技術革新が報告された。特に小型モデル(Qwen 3.5 4B)の効率性と能力の高まりが注目される。
  • 生成AIの限界と評価手法の見直し: 動画AIの推論限界、LLMの「幻覚」検出手法、静的ベンチマークの陳腐化への批判が相次ぐ。これに対応し、「インタラクティブ・ベンチマーク」やエージェントの能動的評価など、新しい評価パラダイムの研究提案が行われた。
  • AIインフラの巨大化と電力制約: データセンター拡張への巨額投資(ソフトバンク、OpenAI-AWS)と、それに伴う電力供給遅延(OpenAI-Oracle)や人員削減(Oracle)という現実的な制約が表面化。持続可能な成長への課題が浮き彫りに。
  • ソース別まとめ

    Anthropic

  • Claudeのセキュリティ実力証明: Firefoxで100以上の脆弱性を発見(うち14件は高深刻度)。国防総省契約問題後も一般消費者向け成長は継続し、日次100万人以上の新規ユーザーを獲得。
  • ビジネス展開: 月額200ドルの「Claude Code」サブスクリプションを提供(内部コストは最大5,000ドルと試算)。企業向けにサードパーティAIツールを購入できる「マーケットプレイス」を立ち上げ。
  • 国防総省問題: サプライチェーンリスク指定を受け、CEOが法的措置を表明。OpenAIの国防総省契約を「安全対策の見せかけ」と批判。
  • OpenAI

  • GPT-5.4リリース: コーディング、コンピュータ操作、推論を統合した新フロンティアモデルを「Pro」「Thinking」版で発表。100万トークンコンテキストをサポートし、ChatGPT、API、GitHub Copilotなどで展開開始。
  • セキュリティツール: コード脆弱性を自動検出・修正するAIエージェント「Codex Security」の研究プレビューを開始。オープンソース開発者向けにChatGPT ProとCodexへの無料アクセスも提供。
  • インフラ・ビジネス: AWSと1100億ドル規模のマルチクラウド契約を締結。Oracleとのテキサスデータセンター拡張は電力問題で停止し、NVIDIA次世代チップへ投資方針。ChatGPTのショッピング機能はパートナーアプリへ移行。
  • Google

  • モデル発表: コスト効率型の軽量モデル「Gemini 3.1 Flash-Lite」と、創造性を強調した画像生成モデル「Nano Banana 2」を発表。
  • 検索のAI化: Geminiの「Canvas」機能を米国Google検索に統合し、検索結果のインタラクティブな編集・カスタマイズを可能に。
  • その他AIツール・研究

  • コーディングエージェント: GitHub Copilotがエージェント型アーキテクチャに移行。Cursorは「Automations」で常時稼働エージェントを実現。Vercelのv0がカスタムMCPサーバー接続をサポート。
  • オープンソースモデル: ByteDanceが高速動画生成モデル「Helios」、Tencentが適応型フレームワーク「HY-WU」を公開。Qwen 3.5 4Bが一部ベンチマークでGPT-4oを上回る報告。
  • 研究動向: AIの「幻覚」を検出する新手法、エージェントの「自己帰属バイアス」、数学的概念を自律発見するマルチエージェントシステムなど、基礎研究の幅広い進展が報告された。AGI概念への批判と「超人的適応知能」の提案も。
  • 来週の注目ポイント

    1. GPT-5.4の実地評価: 主要開発ツール(GitHub Copilot, Cursor, Windsurf等)への統合が進む中、開発者コミュニティによる実際のコーディング・推論能力の評価とフィードバックが活発化する。

    2. Anthropicの法的対応の行方: 国防総省を相手取った法的措置が具体化するか、またこれが他のAI企業や政府調達に与える影響が注目される。

    3. エージェント自動化のユースケース拡大: Cursor AutomationsやClaude Codeのスケジュールタスクなど、常時稼働型エージェントの初期ユーザー体験と実用的な成果が報告され始める。

    4. AIセキュリティツールの競争激化: OpenAIのCodex Securityと、脆弱性発見で実績を示したClaudeの能力が比較され、セキュリティ専門家による評価が進む。

    5. インフラと電力制約への対応: OpenAIのNVIDIA次世代チークへの投資や、洋上風力タービンを用いた水中データセンター計画など、電力問題への具体的な解決策に関する詳細がさらに明らかになる可能性。