LWiAIポッドキャスト #234 - Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5
AI技術の最新動向を紹介するポッドキャスト。Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5などの新モデルやアップデートについて議論。
キーポイント
主要AI企業(Anthropic、OpenAI、Google)が大規模言語モデルの新バージョンを発表し、コンテキストウィンドウ拡大やエージェント機能強化など性能向上を競っている
生成AI分野ではByteDanceのSeedance 2.0などテキスト・画像・動画生成モデルが進化し、マルチモーダル生成能力が拡大している
AIスタートアップの資金調達が活発化し、音声生成のElevenLabsが110億ドル、動画生成のRunwayが53億ドル、人型ロボットのApptronikが53億ドルの評価額を獲得
中国企業(Zhipu、DeepSeek、Alibaba)がオープンソースや長文処理モデルで存在感を示し、国際競争が激化している
影響分析・編集コメントを表示
影響分析
この記事は2026年初頭のAI業界の急速な進化を包括的に示しており、大規模言語モデルの性能競争が新段階に入り、生成AIの実用化が加速していることを示唆している。同時に、多額の資金調達が技術開発と市場拡大を後押しし、国際的な競争構造が形成されつつある。
編集コメント
1つのポッドキャストでこれだけ多岐にわたるAIニュースをカバーしている点が印象的で、業界の活発な動きを実感させる。特に中国企業の台頭と生成AIの実用化進展が今後の市場構造を変える可能性がある。
LWiAI Podcast #234 - Opus 4.6, GPT-5.3-Codex, Seedance 2.0, GLM-5
Last Week in AI2026年2月17日23シェアトランスクリプト先週のAIビッグニュースをまとめて議論する、第234回目のエピソードです!
収録日: 2026年1月2日
ホスト: Andrey Kurenkov、Jeremie Harris
ご質問やフィードバックは、contact@lastweekinai.com または hello@gladstone.ai までお気軽にメールでお寄せください。
今回のエピソードでは:
主要なモデルのリリースとして、Anthropicからは100万トークンのコンテキストウィンドウと「エージェントチーム」を備えたOpus 4.6、OpenAIからはGPT-5.3 CodexとCerebras経由の高速版Codex Spark、GoogleからはGemini 3 Deep Thinkが、安全性に関する文書が欠如しているという批判を受けつつもARC-AGI-2やその他のSTEMベンチマークで大きな躍進を記録しました。
生成メディアの進展では、ByteDanceのSeedance 2.0が高いリアリズムと幅広いプロンプト入力によるテキストからビデオへの変換を実現、新しい画像モデルSeedream 5.0とAlibabaのQwen Image 2.0、さらにxAIのテキスト/画像からビデオへのGrok Imagine APIが登場しました。
オープンかつ競争力のあるリリースが拡大し、ZhipuのGLM-5、DeepSeekの100万トークンコンテキストモデル、Cursor Composer 1.5、効率的なローカル/エージェント的コーディングを目指したハイブリッドアテンションを使用するオープンウェイトのQwen3 Coder Nextが公開されました。
ビジネスアップデートでは、ElevenLabsが110億ドルの評価額で5億ドルを調達、Runwayが53億ドルの評価額で3億1500万ドルを調達、ヒューマノイドロボティクス企業Apptronikが53億ドル以上の評価額で9億3500万ドルを調達、Waymoが第6世代ハードウェアの大量生産準備を発表したほか、Anthropicのスーパーボウル広告とxAIからの離脱をめぐる業界のドラマがありました。
(00:00:10) イントロ / 雑談
(00:02:05) リスナーコメントへの返信
(00:03:59) Anthropic、新機能「エージェントチーム」を備えたOpus 4.6をリリース | TechCrunch
(00:08:00) OpenAIの新モデルGPT-5.3-Codexは25%高速化、コーディングの枠を超える進化 - 新機能解説 | ZDNET
(00:22:02) OpenAI、エージェント的コーディング向け新macOSアプリをローンチ | TechCrunch
(00:23:10) Google、科学・エンジニアリング向けGemini 3 Deep Thinkを公開 | The Tech Buzz
(00:27:58) ByteDanceのSeedance 2.0、最高のAIビデオ生成ツールになる可能性 - TechEBlog
(00:31:46) 中国のByteDanceとAlibaba、Googleの人気モデルNano Bananaに対抗するAI画像ツールを発表 | South China Morning Post
(00:33:26) DeepSeekがAIモデルのトークン数を10倍に拡張、Zhipu AIはGLM-5を公開 | South China Morning Post
(00:39:43) Cursor、複雑なタスク向けにアップグレードしたComposer 1.5をローンチ
(00:40:35) xAI、テキストおよび画像からビデオへの変換API「Grok Imagine API」をローンチ
アプリケーションとビジネス
(00:42:19) Nvidia出資のAI音声スタートアップElevenLabs、評価額110億ドルに到達
(00:48:36) AIビデオスタートアップRunway、評価額53億ドルで3億1500万ドルを調達、より高度な世界モデルを視野に | TechCrunch
(00:50:34) ヒューマノイドロボットスタートアップApptronik、評価額50億ドル以上で総額9億3500万ドルの調達を完了 | TechCrunch
(00:53:42) Anthropic、「Claudeは広告なしのまま」と表明、名前を挙げない競合とは一線を画す | The Verge
(00:56:50) さて、xAIの創業チームのちょうど半数が会社を去りました | TechCrunch
(01:00:35) Waymoの次世代ロボタクシー、乗客対応と「大量生産」の準備が整う | The Verge
プロジェクトとオープンソース
(01:01:31) Qwen3-Coder-Next: 小型ハイブリッドモデルによるエージェント的コーディングの推進
(01:05:10) OpenClawのAI「スキル」拡張機能はセキュリティ上の悪夢 | The Verge
研究と進展
(01:07:12) 130億パラメータで推論を学習する
(01:12:33) LLMベースエージェントのための強化学習世界モデル
(01:16:32) Vending-BenchにおけるOpus 4.6 – 単なる便利なアシスタントではない
政策と安全性
(01:19:00) METR GPT-5.2
(01:23:31) AIの混沌: モデルの知性とタスクの複雑さに伴うミスアライメントはどのように拡大するか?
今回のエピソードに関する議論


原文を表示
231×0:00Current time: 0:00 / Total time: -1:29:50-1:29:50Audio playback is not supported on your browser. Please upgrade.LWiAI Podcast #234 - Opus 4.6, GPT-5.3-Codex, Seedance 2.0, GLM-5
Last Week in AIFeb 17, 202623ShareTranscriptOur 234th episode with a summary and discussion of last week’s big AI news!
Recorded on 01/02/2026
Hosted by Andrey Kurenkov and Jeremie Harris
Feel free to email us your questions and feedback at contact@lastweekinai.com and/or hello@gladstone.ai
In this episode:
Major model launches include Anthropic’s Opus 4.6 with a 1M-token context window and “agent teams,” OpenAI’s GPT-5.3 Codex and faster Codex Spark via Cerebras, and Google’s Gemini 3 Deep Think posting big jumps on ARC-AGI-2 and other STEM benchmarks amid criticism about missing safety documentation.
Generative media advances feature ByteDance’s Seedance 2.0 text-to-video with high realism and broad prompting inputs, new image models Seedream 5.0 and Alibaba’s Qwen Image 2.0, plus xAI’s Grok Imagine API for text/image-to-video.
Open and competitive releases expand with Zhipu’s GLM-5, DeepSeek’s 1M-token context model, Cursor Composer 1.5, and open-weight Qwen3 Coder Next using hybrid attention aimed at efficient local/agentic coding.
Business updates include ElevenLabs raising $500M at an $11B valuation, Runway raising $315M at a $5.3B valuation, humanoid robotics firm Apptronik raising $935M at a $5.3B valuation, Waymo announcing readiness for high-volume production of its 6th-gen hardware, plus industry drama around Anthropic’s Super Bowl ad and departures from xAI.
(00:00:10) Intro / Banter
(00:02:05) Response to listener comments
(00:03:59) Anthropic releases Opus 4.6 with new ‘agent teams’ | TechCrunch
(00:08:00) OpenAI’s new GPT-5.3-Codex is 25% faster and goes way beyond coding now - what’s new | ZDNET
(00:22:02) OpenAI launches new macOS app for agentic coding | TechCrunch
(00:23:10) Google Unveils Gemini 3 Deep Think for Science & Engineering | The Tech Buzz
(00:27:58) ByteDance’s Seedance 2.0 Might be the Best AI Video Generator Yet - TechEBlog
(00:31:46) China’s ByteDance, Alibaba unveil AI image tools to rival Google’s popular Nano Banana | South China Morning Post
(00:33:26) DeepSeek boosts AI model with 10-fold token addition as Zhipu AI unveils GLM-5 | South China Morning Post
(00:39:43) Cursor launches Composer 1.5 with upgrades for complex tasks
(00:40:35) xAI launches Grok Imagine API for text and image to video
Applications & Business
(00:42:19) Nvidia-backed AI voice startups ElevenLabs hits $11 billion valuation
(00:48:36) AI video startup Runway raises $315M at $5.3B valuation, eyes more capable world models | TechCrunch
(00:50:34) Humanoid robot startup Apptronik has now raised $935M at a $5B+ valuation | TechCrunch
(00:53:42) Anthropic says ‘Claude will remain ad-free,’ unlike an unnamed rival | The Verge
(00:56:50) Okay, now exactly half of xAI’s founding team has left the company | TechCrunch
(01:00:35) Waymo’s next-gen robotaxi is ready for passengers — and also ‘high-volume production’ | The Verge
Projects & Open Source
(01:01:31) Qwen3-Coder-Next: Pushing Small Hybrid Models on Agentic Coding
(01:05:10) OpenClaw’s AI ‘skill’ extensions are a security nightmare | The Verge
Research & Advancements
(01:07:12) Learning to Reason in 13 Parameters
(01:12:33) Reinforcement World Model Learning for LLM-based Agents
(01:16:32) Opus 4.6 on Vending-Bench – Not Just a Helpful Assistant
Policy & Safety
(01:19:00) METR GPT-5.2
(01:23:31) The Hot Mess of AI: How Does Misalignment Scale with Model Intelligence and Task Complexity?
Discussion about this episode


関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み