LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals
本記事は、OpenAIのGPT-5.4 mini/nano公開、MistralのSmall 4とForgeプラットフォーム発表、MetaとNvidiaによるエージェントOS競争の激化、およびエンタープライズ重視への転換や安全研究の進展など、2026年3月の主要AI動向を網羅する。
キーポイント
OpenAIのGPT-5.4 mini/nano公開とAPI価格戦略
40万トークンコンテキスト窓を搭載し、Codexにおけるトークン効率を向上させたが、API価格は最大4倍に引き上げられた。nanoは高頻度分類・データ抽出向けにAPI専用に提供されている。
MistralのSmall 4シリーズとForgeプラットフォーム発表
MoEアーキテクチャ(総パラメータ119B/アクティブ6B)を採用したSmall 4をオープンソース化し、推論・マルチモーダル・コーディングエージェント機能を統合。企業向けカスタムモデル構築支援ツール「Forge」も公開された。
エージェントOS分野におけるMetaとNvidiaの競争激化
Metaが買収したManusからMacローカルエージェント「My Computer」をリリースし、NvidiaはNeMoとサンドボックスランタイム「Open Shell」を発表。DLSS 5のリアルタイム生成AIフィルタやGroq LPU統合などハードウェア予測も示された。
エンタープライズ戦略の転換と安全・コンプライアンス強化
OpenAIがビジネス・生産性領域へ焦点を移行し、MicrosoftはCopilotとフロンティアモデルの再編を進める。Metaは新モデル公開を延期し、ByteDanceは海外で大規模Nvidiaクラスターを導入。ステガノグラフィやChain-of-Thought忠実性などの安全研究も進んでいる。
Microsoft AI Division Restructuring
Microsoft is reorganizing its AI division as Copilot struggles to keep pace with competitors like Google and OpenAI, signaling a strategic shift in their AI development approach.
AI Safety & Evaluation Frameworks
Recent research focuses on proactive safety measures, including steganography-based LLM monitoring, in-training defenses against emergent misalignment, and open-source tools like Bloom for automated behavioral evaluations.
Advanced Model Architectures & Capabilities
Cutting-edge developments include Mamba-3's improved sequence modeling via state space principles, the introduction of Attention Residuals, and rigorous testing of frontier AI agents in multi-step cyber-attack scenarios.
影響分析・編集コメントを表示
影響分析
本記事は、大規模言語モデルの出力効率化とエージェントOSの実装競争が企業現場での実用化を加速させていることを示している。OpenAIとMistralの戦略転換、およびNvidiaやMetaのインフラ整備は、次世代AI開発の標準を再定義する可能性が高く、企業はカスタムモデル構築と安全ガバナンスへの投資を優先せざるを得なくなる。これにより、AI導入のハードルは下がる一方で、競争優位を維持するための技術的・規制的な準備がより重要になる。
編集コメント
複数の主要企業がエンタープライズ向け実用化とエージェント基盤に注力する中、価格転換とオープンソース戦略の両立が今後の競争分岐点となる。開発者はモデル選定に加え、セキュリティ監査とカスタム学習インフラの整備を早期に検討すべきである。
アンドレイからのメッセージ:このエピソードは先週 RSS で公開されましたが、YouTube への投稿が遅れたため、Substack への掲載も遅れてしまいました。申し訳ありません!
先週の大きな AI ニュースの要約と議論を含む、当チャンネル第 238 回エピソードです!
録音日:2026 年 3 月 18 日
ホスト:アンドレイ・クレンコフ(Andrey Kurenkov)およびジェレミー・ハリス(Jeremie Harris)
ご質問やフィードバックは、andreyvkurenkov@gmail.com および/または hello@gladstone.ai までお気軽にご連絡ください。
今回のエピソードの内容:
- OpenAI が GPT-5.4 mini と nano をリリースしました。両者とも 40 万トークンのコンテキストウィンドウを備えていますが、1 トークンあたりの価格は上昇しています。ただし、Codex におけるトークン効率の向上を主張しており、nano は API のみで提供され、主要な価格引き上げにもかかわらず、高ボリュームの分類やデータ抽出用途に位置づけられています。
- Mistral が Small 4 モデルファミリー(MoE:Mixture of Experts、総パラメータ数 1190 億/アクティブパラメータ数 60 億)をオープンソース化しました。このモデルは推論能力、マルチモーダル機能、コーディングエージェント機能を統合しており、同時に企業がカスタムモデルのトレーニングやポストトレーニングを行うための支援ツール「Forge」を発表しました。
- エージェント用「オペレーティングシステム」をめぐる競争が激化しています。Meta が買収した Manus がローカル Mac 向けエージェントをリリースし、Nvidia は NeMo/「Open Shell」と呼ばれるサンドボックス型エージェントランタイムを発表しました。また Nvidia は DLSS 5 も発表し、Groq LPU の統合を含む主要なハードウェア予測も明らかにしました。
ビジネスおよび安全に関する最新情報には、競合他社との競争の中で OpenAI が生産性・企業向けへの焦点をシフトしていること、Microsoft が Copilot およびフロンティアモデルの取り組みを再編したこと、Meta が次期モデルの発表を延期したこと、中国系企業の ByteDance が海外で大規模な Nvidia クラスターを展開していることが含まれています。また、ステガノグラフィ(隠蔽技術)、思考連鎖の忠実性、ファインチューニング防御策、サイバー攻撃評価、憲章・仕様準拠に関する新たな安全研究も発表されました。
現在のスポンサーの皆様へ感謝いたします:
Box - Box.com/AI へアクセスして詳細をご覧ください
ODSC AI - odsc.ai/east へアクセスし、プロモーションコード LWAI を使用すると、ODSC AI East 2026 のパスがさらに 15% オフになります。
Factor - factormeals.com/lwai50off へアクセスし、コード lwai50off を使用すると、50% オフに加え、1 年間の無料朝食特典が受けられます。
タイムスタンプ:
(00:00:10) イントロダクション / おしゃべり
(00:01:56) ニュースプレビュー
ツールとアプリ
(00:02:39) OpenAI が GPT-5.4 mini と nano をリリース、より高速で能力は向上したが価格は最大 4 倍に
(00:08:04) Mistral の新モデル Small 4 は 128 のエキスパートモジュールを備え、その規模以上の性能を発揮
(00:14:03) Meta の Manus が「My Computer」を発表、Mac を AI エージェントに変身させる - 9to5Mac
(00:17:57) NVIDIA が OpenClaw コミュニティ向けに NemoClaw を発表 | NVIDIA ニュースルーム + Nvidia がオープンエージェント開発プラットフォームで知識労働を強化
(00:24:09) DLSS 5 は、ビデオゲームにおけるリアルタイム生成 AI フィルタのように見える | The Verge
(00:26:36) OpenAI が自身のアドバイザーからの警告にもかかわらず ChatGPT の「アダルトモード」の開始を発表 - CNET
アプリケーションとビジネス
(00:33:46) OpenAI、ビジネスと生産性への焦点に転換するとの報道
(00:41:25) Nvidia GTC 2026:CEO ジェン・スンファン氏、Blackwell および Vera Rubin の受注額が 2027 年までに 1 兆ドルに達すると見込む
(00:45:44) Mistral、企業が独自の AI モデルを構築できるよう支援する「Forge」を発表
(00:54:17) WSJ の報道によると、中国の ByteDance が上位 Nvidia AI チップへのアクセス権を獲得
(00:57:57) パフォーマンスに関する懸念により、Meta は新 AI モデルの展開を延期
(01:02:50) Copilot が Google や OpenAI に後れを取る中、Microsoft が AI 部門の大規模な再編を実施
ポリシーと安全性
(01:07:26) LLM モニタリングへの応用を含む、ステガノグラフィ(隠蔽通信)の意思決定理論的定式化
(01:13:09) リーゾニング・シアター:モデルの信念と思考連鎖(Chain-of-Thought)を分離する
(01:18:29) 言語モデルにおける突発的なアライメント不全に対するトレーニング中の防御策
(01:23:07) フロンティア AI エージェントは多段階サイバー攻撃シナリオでどのように振る舞うか?
(01:25:20) Claude Opus 4.6 の BrowseComp パフォーマンスにおける評価意識(Eval awareness)の存在
(01:29:49) オープンソースツール「Bloom」の紹介:自動化された行動評価のためのツール
(01:32:26) モデルは自らの憲章をどの程度遵守しているか?
(01:37:11) Nvidia の H200 製品ライセンスが、主要な民主党議員の間でセキュリティ懸念を引き起こす
研究と進展
(01:40:050) [2603.15031] アテンション・リジデュアルズ(Attention Residuals)
(01:47:11) Mamba-3:状態空間原理を用いた改善されたシーケンスモデリング
原文を表示
Note from Andrey: this ep came out a week ago on RSS, but I was delayed posting it to youtube and therefore also Substack. My bad!
Our 238th episode with a summary and discussion of last week’s big AI news!
Recorded on 03/18/2026
Hosted by Andrey Kurenkov and Jeremie Harris
Feel free to email us your questions and feedback at andreyvkurenkov@gmail.com and/or hello@gladstone.ai
In this episode:
- OpenAI released GPT-5.4 mini and nano with 400k-token context windows, higher per-token prices but claimed token-efficiency gains in Codex; nano is API-only and pitched for high-volume classification/data extraction despite a major price increase.
- Mistral open-sourced the Small 4 model family (MoE, 119B total/6B active) combining reasoning, multimodal, and coding-agent capabilities, and announced Forge to help businesses train or post-train custom models.
- Agent “operating system” competition intensified with Meta’s acquired Manus launching a local Mac agent, Nvidia announcing NeMo/“Open Shell” sandboxed agent runtime, and Nvidia also unveiling DLSS 5 plus major hardware forecasts including Groq LPU integration.
- Business and safety updates included OpenAI shifting focus toward productivity/enterprise amid competition, Microsoft reorganizing Copilot and frontier-model efforts, Meta delaying its next model, China-linked ByteDance deploying large Nvidia clusters abroad, and new safety work on steganography, chain-of-thought faithfulness, fine-tuning defenses, cyber-attack evals, and constitution/spec compliance.
A thank you to our current sponsors:
Box - visit Box.com/AI to learn more
ODSC AI - go to odsc.ai/east and use promo code LWAI for an additional 15% off your pass to ODSC AI East 2026.
Factor - head to factormeals.com/lwai50off and use code lwai50off to get 50 percent off and free breakfast for a year
Timestamps:
(00:00:10) Intro / Banter
(00:01:56) News Preview
Tools & Apps
(00:02:39) OpenAI ships GPT-5.4 mini and nano, faster and more capable but up to 4x pricier
(00:08:04) Mistral’s new Small 4 model punches above its weight with 128 expert modules
(00:14:03) Meta’s Manus launches ‘My Computer’ to turn your Mac into an AI agent - 9to5Mac
(00:17:57) NVIDIA Announces NemoClaw for the OpenClaw Community | NVIDIA Newsroom + Nvidia boosts knowledge work with Open Agent Development Platform
(00:24:09) DLSS 5 looks like a real-time generative AI filter for video games | The Verge
(00:26:36) OpenAI to Launch ChatGPT ‘Adult Mode’ Despite Warnings From Its Own Advisers - CNET
Applications & Business
(00:33:46) OpenAI Reportedly Pivoting to a Focus on Business and Productivity Only
(00:41:25) Nvidia GTC 2026: CEO Jensen Huang sees $1 trillion in orders for Blackwell and Vera Rubin through ’27
(00:45:44) Mistral launches Forge to help enterprises build their own AI models
(00:54:17) China’s ByteDance gets access to top Nvidia AI chips, WSJ reports
(00:57:57) Meta Delays Rollout of New A.I. Model After Performance Concerns
(01:02:50) Microsoft Shakes Up AI Division As Copilot Falls Behind Google and OpenAI
Policy & Safety
(01:07:26) A Decision-Theoretic Formalisation of Steganography With Applications to LLM Monitoring
(01:13:09) Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought
(01:18:29) In-Training Defenses against Emergent Misalignment in Language Models
(01:23:07) How do frontier AI agents perform in multi-step cyber-attack scenarios?
(01:25:20) Eval awareness in Claude Opus 4.6’s BrowseComp performance
(01:29:49) Introducing Bloom: an open source tool for automated behavioral evaluations
(01:32:26) How well do models follow their constitutions?
(01:37:11) Nvidia’s H200 License Stirs Security Concern Among Top Democrats
Research & Advancements
(01:40:050) [2603.15031] Attention Residuals
(01:47:11) Mamba-3: Improved Sequence Modeling using State Space Principles
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み