LWiAI Podcast #228 - GPT 5.2、スケーリングエージェント、奇妙な汎化
OpenAI の新モデル GPT-5.2 とディズニーとの巨額提携、およびエージェントスケーリングの限界に関する研究など、業界を揺るがす複数の重大ニュースが報じられた。
キーポイント
GPT-5.2 の発表とコスト増
OpenAI が最新モデル GPT-5.2 を発表し、マルチモーダル能力やパフォーマンスを強化したが、利用コストの増加と知識カットオフ日の変更が課題として浮上した。
ディズニーとの 10 億ドル提携
OpenAI とディズニーが 10 億ドル規模の投資契約を結び、Marvel やスター・ウォーズなどのキャラクターコンテンツ生成において独占的なライセンス枠組みを構築する。
エージェントシステムのスケーリング課題
DeepMind がマルチエージェントシステムのスケーリングにおけるツール調整やタスク実行の複雑さに関する論文を発表し、単純な規模拡大の限界を示唆した。
米政府による規制と輸出管理強化
米国政府が AI チップの輸出ルールを厳格化すると同時に、州政府による独自規制を禁止する大統領令を発令し、中央集権的な AI ガバナンスへ舵を切った。
Nvidia AI チップの輸出規制強化
中国への輸出前に、米国の当局による通常とは異なるセキュリティ審査が実施される見込みです。
AI 技術密輸ネットワークの摘発
米国当局が中国と関連する主要な AI 技術の密輸ネットワークを停止させました。
RSL 1.0 の導入による著作権料請求権
新しいガイドライン「RSL 1.0」により、出版者は AI 企業に対しコンテンツのスクレイピングに対して支払いを要求できるようになりました。
影響分析・編集コメントを表示
影響分析
このニュースは、AI モデルの進化が単なる性能競争から、経済的持続可能性とコンテンツライセンスという実利の側面へとシフトしていることを示しています。特にディズニーとの提携は、IP(知的財産)を持つ大手企業と AI エンタープライズが緊密に連携する新たなパラダイムを確立し、業界全体のパワーバランスに影響を与えるでしょう。また、DeepMind の研究結果は、今後の AI 開発において「規模の法則」だけでなく「協調性の科学」への投資が不可欠であることを示唆しています。
編集コメント
今週のニュースは、技術的なブレークスルーだけでなく、巨大資本の参入と政府による規制強化という「現実世界」の影響が AI 業界に直結していることを如実に示しています。特にエージェントシステムの複雑さに関する知見は、今後の実装戦略において重要な指針となるでしょう。
先週のAIビッグニュースの要約と議論をお届けする第228回エピソードです!
録音日: 2025年12月12日
ホスト: Andrey Kurenkov と Jeremie Harris
ご質問やフィードバックは contact@lastweekinai.com および/または hello@gladstone.ai までお気軽にメールでお寄せください。
今回のエピソードでは:
OpenAIの最新モデルGPT-5.2は、性能の向上と強化されたマルチモーダル機能を示していますが、コストの増加と知識カットオフ日の変更が伴います。
Disneyは、Disneyキャラクターコンテンツを生成するためOpenAIに10億ドルを投資し、Marvel、Pixar、Star Warsフランチャイズのキャラクターにわたる独自のライセンス契約を締結します。
米国政府は、セキュリティ審査を含む新たなAIチップ輸出規制を導入する一方で、州が独自にAIを規制することを阻止する動きを進めています。
DeepMindは、マルチエージェント・システムのスケーリングにおける課題と発見を概説する論文を発表し、ツール調整とタスク実行の複雑さを強調しています。
タイムスタンプ:
(00:00:00) イントロ / 雑談
(00:01:19) ニュースプレビュー
ツールとアプリ
(00:01:58) GPT-5.2は、OpenAIのエージェント型AI競争における最新の動き | The Verge
(00:08:48) Runwayが初のワールドモデルをリリース、最新のビデオモデルにネイティブ音声機能を追加 | TechCrunch
(00:11:51) Google、AIモードでより多くの情報源へのリンクを提供すると発表 | The Verge
(00:12:24) ChatGPTが無料でAdobeアプリを使用して写真やPDFを編集できるようになりました | The Verge
(00:13:05) Tencentが4060億パラメータのHunyuan 2.0をリリース
アプリケーションとビジネス
(00:16:15) 中国、トランプ氏の輸出承認にもかかわらずNvidiaのH200チップへのアクセスを制限する見込み
(00:21:02) DisneyがOpenAIに10億ドルを投資、Soraでのキャラクター使用を許可
(00:24:48) Unconventional AIが巨額の4億7500万ドルのシードラウンドを確認
(00:29:06) Slack CEOのDenise DresserがOpenAIの最高収益責任者に就任 | TechCrunch
(00:31:18) エンタープライズAIの現状
プロジェクトとオープンソース
(00:33:49) [2512.10791] FACTSリーダーボード: 大規模言語モデルの事実性に関する包括的ベンチマーク
(00:36:27) Claude 4.5 Opusのソウルドキュメント
研究と進歩
(00:43:49) [2512.08296] エージェント・システムのスケーリングの科学に向けて
(00:48:43) VeoワールドシミュレーターにおけるGemini Roboticsポリシーの評価
(00:52:10) 最小限の人間監督によるガイド付き自己進化LLM
(00:56:08) マルチンゲール・スコア: LLM推論におけるベイズ合理性の教師なしメトリック
(01:00:39) [2512.07783] 推論言語モデルにおける事前学習、中間学習、強化学習の相互作用について
(01:04:42) LLMによる強化学習の安定化: 定式化と実践
(01:09:42) GoogleのAI部門DeepMind、英国に『自動化研究ラボ』を発表
政策と安全
(01:10:28) トランプ氏、新大統領令で州によるAI規制を阻止する動き - The New York Times
(01:13:54) [2512.09742] 奇妙な汎化と帰納的バックドア: LLMを破損させる新たな方法
(01:17:57) コンピュート減速下でのAIタイムホライズンの予測
(01:20:46) AIセキュリティ研究所、AI測定と評価に焦点
(01:21:16) NvidiaのAIチップ、中国への輸出前に異例の米国セキュリティ審査を受ける見込み
(01:22:01) 米当局、中国関連の大規模なAI技術密輸ネットワークを摘発
合成メディアとアート
(01:24:01) RSL 1.0が登場、出版社がAI企業にコンテンツスクレイピングの対価支払いを要求可能に | The Verge
原文を表示
Our 228th episode with a summary and discussion of last week’s big AI news!
Recorded on 12/12/2025
Hosted by Andrey Kurenkov and Jeremie Harris
Feel free to email us your questions and feedback at contact@lastweekinai.com and/or hello@gladstone.ai
In this episode:
OpenAI’s latest model GPT-5.2 demonstrates improved performance and enhanced multi-modal capabilities but comes with increased costs and a different knowledge cutoff date.
Disney invests $1 billion in OpenAI to generate Disney character content, creating unique licensing agreements across characters from Marvel, Pixar, and Star Wars franchises.
The U.S. government imposes new AI chip export rules involving security reviews, while simultaneously moving to prevent states from independently regulating AI.
DeepMind releases a paper outlining the challenges and findings in scaling multi-agent systems, highlighting the complexities of tool coordination and task performance.
Timestamps:
(00:00:00) Intro / Banter
(00:01:19) News Preview
Tools & Apps
(00:01:58) GPT-5.2 is OpenAI’s latest move in the agentic AI battle | The Verge
(00:08:48) Runway releases its first world model, adds native audio to latest video model | TechCrunch
(00:11:51) Google says it will link to more sources in AI Mode | The Verge
(00:12:24) ChatGPT can now use Adobe apps to edit your photos and PDFs for free | The Verge
(00:13:05) Tencent releases Hunyuan 2.0 with 406B parameters
Applications & Business
(00:16:15) China set to limit access to Nvidia’s H200 chips despite Trump export approval
(00:21:02) Disney investing $1 billion in OpenAI, will allow characters on Sora
(00:24:48) Unconventional AI confirms its massive $475M seed round
(00:29:06) Slack CEO Denise Dresser to join OpenAI as chief revenue officer | TechCrunch
(00:31:18) The state of enterprise AI
Projects & Open Source
(00:33:49) [2512.10791] The FACTS Leaderboard: A Comprehensive Benchmark for Large Language Model Factuality
(00:36:27) Claude 4.5 Opus’ Soul Document
Research & Advancements
(00:43:49) [2512.08296] Towards a Science of Scaling Agent Systems
(00:48:43) Evaluating Gemini Robotics Policies in a Veo World Simulator
(00:52:10) Guided Self-Evolving LLMs with Minimal Human Supervision
(00:56:08) Martingale Score: An Unsupervised Metric for Bayesian Rationality in LLM Reasoning
(01:00:39) [2512.07783] On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models
(01:04:42) Stabilizing Reinforcement Learning with LLMs: Formulation and Practices
(01:09:42) Google’s AI unit DeepMind announces UK ‘automated research lab’
Policy & Safety
(01:10:28) Trump Moves to Stop States From Regulating AI With a New Executive Order - The New York Times
(01:13:54) [2512.09742] Weird Generalization and Inductive Backdoors: New Ways to Corrupt LLMs
(01:17:57) Forecasting AI Time Horizon Under Compute Slowdowns
(01:20:46) AI Security Institute focuses on AI measurements and evaluations
(01:21:16) Nvidia AI Chips to Undergo Unusual U.S. Security Review Before Export to China
(01:22:01) U.S. Authorities Shut Down Major China-Linked AI Tech Smuggling Network
Synthetic Media & Art
(01:24:01) RSL 1.0 has arrived, allowing publishers to ask AI companies pay to scrape content | The Verge
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み