2026-W13 AI週次レポート
今週のハイライト
OpenAIの戦略転換:Soraの段階的終了を発表。 動画生成ツール「Sora」の提供を2026年4月から終了し、リソースをコーディングや企業向け製品に集中させる方針を示した。 Anthropicの新モデル「Claude Mythos」がリーク。 セキュリティミスにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデルの存在が明らかに。同社は推論能力における「段階的変化」を確認。 Google、Gemini 3.1 Flash Liveを中心に音声AIを大幅強化。 より自然で高速な音声会話モデルを発表。同時に、他社チャットボットからの会話履歴移行ツールや、全世界展開のリアルタイム検索「Search Live」を投入。 メタ(Meta)、脳科学AIとオブジェクト追跡で進展。 画像・音声に対する脳の反応を予測するAIモデル「TRIBE v2」と、最大16オブジェクトを同時追跡可能な「SAM 3.1」を発表。 AIエージェント開発・評価ツールが充実。 LangChainがエージェント評価チェックリストやカスタマイズ可能なミドルウェアを公開。OpenAIはResponses APIを拡張し、自律エージェント構築を支援。 AIインフラ拡大に対する現実的な反発が表面化。 データセンター建設への土地所有者の拒否や、連邦議員による建設一時停止法案の提出など、技術発展と社会的受容の緊張が高まる。 GitHub、Copilotユーザーデータのモデル学習利用を発表。 2026年4月24日以降、無料・有料プラン利用者のインタラクションデータを、オプトアウトしない限りAIモデル学習に使用する方針を更新。注目テーマ
戦略的収束と撤退: OpenAIのSora終了や「アダルトモード」開発停止に代表される、大手企業の事業ポートフォリオ整理が目立つ。計算リソースと開発力を収益性の高い中核事業(エンタープライズ、コーディング支援)へ集中させる動き。 音声AIの競争激化: Google (Gemini 3.1 Flash Live)、Cohere (オープンソース音声認識モデル)、Mistral (Voxtral)、OpenAI (音声エージェントAPI) が相次いで新モデル・機能を発表。自然な対話とエッジデバイス展開が焦点。 エージェントの「実用化」と「評価」: AIエージェントの本番環境導入が進み、それに伴い、その挙動を評価・制御するためのフレームワーク(LangChain)、チェックリスト、ミドルウェア、ベンチマーク(Microsoft AsgardBench)の整備が活発化。 規制・倫理・社会的影響への対応: AIによる不平等拡大(Anthropic調査)、偽情報対策の限界(Meta監督委員会)、雇用喪失懸念、データセンターの電力・土地問題など、技術の外部性に対する議論と政策的対応が具体化し始めた。 オープンソース vs. クローズドソースの攻防: CohereやMistral、AI2などが高性能なオープンソース/オープンウェイトのモデル(音声、ウェブエージェント)を発表。クローズドモデル優位の分野への浸透を図る。ソース別まとめ
Anthropic
モデル開発: テストスコアが劇的に高い新モデル「Claude Mythos」の存在がセキュリティミスによりリーク。推論能力で「段階的変化」を記録と確認。 調査・分析: Claudeの利用期間が長いユーザーほど結果が向上するというデータを発表。AIスキルギャップが既存の不平等を拡大する可能性を指摘。 プロダクト更新: Claude APIのアップデート(v2.1.86, v2.1.85)を実施。Claude Codeの設計解説をエンジニアリングブログで公開。 法廷闘争: 連邦判事がトランプ政権による同社AIモデル禁止令を「オーウェル的」として差し止め。OpenAI
戦略転換: AI動画生成ツール「Sora」を2026年4月から段階的に終了。創造的ツールからコーディング/企業向け製品へのリソースシフトを示唆。 プロダクト開発: 音声エージェントAPI(GPT-Realtime-1.5)を発表し、シンガポール診療所での実証実験を開始。CodexにSlack、Figma、Notion等連携のプラグイン機能を追加。 API拡張: 自律エージェント構築の基盤としてResponses APIを拡張。シェルツールサポート、組み込み実行ループなどを追加。 倫理対応: アドバイザー等の懸念を受け、ChatGPTの「アダルトモード(官能モード)」開発を無期限停止。Google / DeepMind
音声AI: 低遅延・高自然さの音声モデル「Gemini 3.1 Flash Live」を発表。他社チャットボットからの会話履歴移行を容易にする「切り替えツール」も提供。 検索・多様性: スマホカメラと音声でリアルタイム検索できる「Search Live」を全世界200か国以上で展開。権利処理済みデータで学習した音楽生成モデル「Lyria 3 Pro」を発表。 研究・安全: AI操作(マニピュレーション)リスクを測定する初の実証済みツールキットを開発。視覚に基づく対話型計画ベンチマーク「AsgardBench」を公開。 提携: AppleがGeminiにアクセスし、蒸留技術で軽量オンデバイスモデルを構築していると報道。ロボティクス企業Agile Robotsとの提携も発表。Meta
研究開発: 画像・音声・音声に対する脳の反応を予測するAIモデル「TRIBE v2」を発表。画像セグメンテーション「SAM 3.1」では最大16オブジェクトの同時追跡を可能に。 インフラ投資: テキサスのAIデータセンター投資を15億ドルから100億ドルに大幅増額。 組織・ガバナンス: 生産性向上のため「AIネイティブポッド」と呼ばれる小規模チーム制の働き方を試験。監督委員会は、コミュニティノートがAI偽情報に効果的に対抗できないと警告。その他AIツール・研究
エージェント開発プラットフォーム: LangChainがエージェント評価チェックリスト、カスタマイズ可能なミドルウェア、チーム知識を共有する「スキル」機能をFleetに追加。 オープンソースモデル: * Cohere: オープンソース音声認識モデルを発表。ベンチマークでWhisperを含む競合を上回ると報告。
* Mistral AI: 9言語対応、3秒の音声から声をクローンできる初のオープンウェイトTTSモデル「Voxtral」をリリース。
* AI2: スクリーンショットのみでウェブ操作する完全オープンなウェブエージェント「MolmoWeb」を発表。
コーディング/開発者ツール: GitHub Copilotがプルリクエストのマージ競合解決機能を追加。Vercelは自然言語からUIを生成するフレームワーク「json-render」をオープンソース化。 クラウド/インフラ: AWS、Amazon Bedrockのガードレール機能や強化学習ファインチューニング対応を強化。Cloudflareはデータ処理場所を細かく制御できる「カスタムリージョン」を発表。来週の注目ポイント
1. OpenAIの次の一手: Sora終了で解放されたリソースが、Codexプラグイン拡充や企業向けResponses APIなど、どの具体策に注がれるか。
2. Anthropic「Claude Mythos」の正式発表タイミング: リークを受けての公式対応と、OpenAI次世代モデルとの性能競争の行方。
3. 音声AIの実利用拡大: Google Gemini 3.1 Flash Liveを皮切りに、各社の音声モデルが実際のカスタマーサービスやエージェントにどの程度統合されていくか。
4. AIインフラ規制議論の具体化: データセンター建設停止法案や電力使用報告義務化の動きが、議会や地方自治体でどのように進展するか。
5. エージェント評価基準の業界標準化: LangChain、Microsoft、Googleなどが提案する多様なエージェント評価ベンチマークやチェックリストが、開発現場でどう採用されていくか。