AIE Europe 振り返りとエージェントラボの主張：教師なし学習と潜在空間のクロスオーバー特別編（2026年）

本日、私たちは最初の「教師なし学習×潜在空間クロースオーバー」スペシャルから1年後をチェックし、AIの世界で何が変わったか（多くの変化があります）について議論します。このエピソードはAIE Europeの直後に録音されましたが、CursorとxAIの契約締結前です。 「教師なし学習（Unsupervised Learning）」は、AIの最前線で活躍する鋭い思想家たちへのインタビューを通じて、今日何が現実であり、将来何が起こり得るか、そしてそれがビジネスや世界にどのような意味を持つかを掘り下げます。これにより、ビルダー（開発者）、研究者、創業者が最大のブレイクスルーを分解し理解するのを支援します。 この番組のホストおよび編集を担当してくれたJacobとUL制作チームに感謝します！ Jacob Effron LinkedIn: https://www.linkedin.com/in/jacobeffron/ X: https://x.com/jacobeffron YouTubeでの全エピソード 私たちが議論すること: AIエンジニアリングの時代の精神（zeitgeist）の中心からのswyxの見解：OpenClaw、ハルネスエンジニアリング（Harness Engineering）、コンテキストエンジニアリング、評価（evals）、観測可能性（observability）、GPU、マルチモーダル性、そしてなぜカンファレンスのトラック構成が今、AIにおいて最も重要なものを明らかにしているか AIインフラストラクチャが最終的に安定したかどうか：なぜ「スキル」がエージェントのための最小限の妥当なパッケージ形式になり得るのか、なぜインフラ企業は毎年自分自身を再発明せざるを得なかったのか、そしてなぜアプリケーション企業はモデルのボラティリティ（変動性）に対して生き残るのが容易だったのか 垂直統合型 versus 水平展開型のAIスタートアップ論争：なぜアプリケーション企業が企業向けのアウトソーシングされたAIチームとして機能し得るのか、なぜ一部の水平展開型企業が依然として重要なのか、そしてなぜサンドボックスがAI時代における古典的なクラウドインフラストラクチャの最も明確な再発明となり得るのか "エージェントラボ"のプレイブック：最先端モデルから始め、自らのドメインに特化させ、その後、コストとレイテンシの削減を正当化するのに十分なデータ、ワークロード、ユーザー行動が揃った時点で独自のモデルをトレーニングする ドメイン特化型モデルのトレーニングは現実であり、単なるマーケティングではない：CursorやCognitionのような企業がユーザーに自社製モデルを選んでもらう方法、そして検索、ドメイン特化、蒸留（distillation）がより重要になっている理由 オープンモデル、カスタムチップ、代替推論インフラ：swyxがオープンソースに対してより楽観的になっている理由、非NVIDIAハードウェアが突然注目を集めている理由、そして10倍の速度向上がどのように新たな製品体験を可能にするか 人間ではなくエージェントに販売することの意味：エージェントエクスペリエンスが実質的には単なる別の名前の優れた開発者体験である理由、APIやドキュメントがこれまで以上に重要である理由、そして事前トレーニングデータの既存企業がエージェントファーストの世界でどのように優位性を複合的に積み重ねているか メモリとパーソナライズが次の大きな切り札になる理由：現在のモデルは主に言及頻度を報酬とするが、将来swyxは製品選択がパーソナライズされたメモリシステムによってより大きく形作られると予想している AIコーディング戦争の現状：コーディングがなぜAIの中で最大かつ最速に成長しているカテゴリの一つになったか、Anthropic、OpenAI、Cursor、Cognitionがどのようにこの波に乗ったか、そしてこのカテゴリにまだ成長余地があるかもしれない理由 能力の探求と効率性：なぜ業界はまだトークン最大化や実験重視の段階にあり、多くを使うことが少なく使うことよりも報酬されるのか Claude CodeとCodex、そしてコーディング製品の奇妙な定着性：最初の魔法のような製品体験が予想以上に重要であり、これまでのところ実質的な勝者として名前が上がっているのが限られた企業だけであるという大きな謎とは何か コーディング市場の最終的な姿：2大プレイヤー、ニッチ製品の長いテール、そしてMicrosoft、Mistral、xAI、あるいは中国のラボがコーディング分野でより強力に参入した場合の可能性のある破壊 ラボに対してアプリケーション企業がまだ余地を持っている理由：フロンティアラボが金融や医療といった垂直分野への拡大を試みているものの、ワークフローとラストマイルを支配する焦点を絞った企業にはまだ空間が残っている理由 コーディングが他のすべてのAI市場のプレビューとなる理由：パラボリック（放物線状）に成長した最初のカテゴリ、ファウンデーションモデル企業とアプリケーション企業の衝突の最も明確な例、そして将来の垂直AI市場がどのように発展していくかを示すテンプレート なぜ現在のAIバリュエーションが無制限に感じられるのか：1年でビルドされた10億ドルのARR（年間経常収益）製品から兆ドル規模の時価総額まで、swyxとJacobは、AI市場がスケールと耐久性に関する従来のスタートアップの直感をどのように壊したかを解き明かす コンシューマーAIとコーディングAI：ChatGPTのコンシューマーカテゴリは頻度と製品設計において頭打ち状態にある可能性が高い一方で、コーディングは実際の勢いを持つ日常利用カテゴリとして引き続き感じられる理由 コーディングの次の製品フロンティア：消費者向けエージェント、コンピュータ操作、「コンテインメントを破るコーディング・エージェント」、そしてswyxの仮説——2025年はコーディング・エージェントの年で、2026年はそれらが他のすべてのタスクを担い始める年になるかもしれない—— 基盤モデルが本当にスタートアップの分類を壊滅させているのか：なぜswyxは初期の創業者にはそれほど心配していないのか、中規模スタートアップや従来のSaaS（Software as a Service）にはより懸念しているのか、そしてなぜ今では野心的なプロジェクトを構築することがフロンティアラボへの最高の面接になるのか AI対SaaS、そして採用をめぐる内部の文化戦争：高価なソフトウェアを撤去したいAIネイティブな従業員と、迅速に構築されたAI代替品が脆弱なシステムを生み出すと考えている懐疑派との間の緊張関係 従来のSaaSが本当に圧力を受けている理由：swyx自身がイベントおよびスポンサー管理ソフトウェアに6桁の金額を費やした経験、それをAIで安価に再構築する誘惑、そしてチームがカスタムなAIネイティブな代替品を信頼するかどうかというより広範な問い バイオセーフティ、セキュリティ、そしてフロンティアモデルへのアクセス：なぜswyxはAnthropicのMike Kriegerとの夕食会でバイオセーフティを持ち出したのか、なぜKriegerはセキュリティがより大きな問題だと主張したのか、そして制限付きモデルのリリースがAnthropic対OpenAIについて何を明らかにしているのか 巨大モデルの時代：10兆（10T）以上のパラメータを持つシステムが、より大規模なクラスターが登場するまでの一時的な配給フェーズに過ぎない理由、ラボが蒸留のために最も強力なモデルをますます非公開で保持する可能性が高い理由、そしてスケール単体ではもはや完全な答えのように感じられない理由 AIにおける最も遅いスケーリング要因としてのメモリ：コンテキストウィンドウが人々の期待ほどには急速に改善されなかった理由、百万トークンのコンテキストが依然としてほとんどの実際のワークフローを変革していない理由、そしてなぜメモリが次世代システムの主要なボトルネックとなる可能性があるか 過去1年でswyxの見方が変わった点：オープンモデルに対してより楽観的になり、トップティアのエージェントスタートアップが一般的なAI企業とは非常に異なる振る舞いをするという確信を深め、ファインチューニングや専門モデルの適応可能性に対してより前向きになったこと 「ダークファクトリー」とゼロヒューマンレビューのコーディング：ゼロ人間記述コードという次の段階として、モデルがコードを生成するだけでなく、人間のレビューなしに本番環境へデプロイするという新たなフロンティア。これにより、企業はテストと検証のプロセスを根本から見直すことを余儀なくされる 強化学習（RL）とポストトレーニングが人々の想定以上に重要である理由：生成されたモデルが数ヶ月ごとに破棄される場合でも、そのデータ、ワークフロー、ドメイン固有の改善点は持続的に蓄積される 合成ルビクス（Synthetic Rubrics）、Doctor GRPO、マルチターン強化学習：強化学習が多くの人が認識しているよりもはるかにドメイン固有かつマルチステップなプロセスへと進化しており、これによりより深いカスタマイズの道が開かれている コーディングの次のフロンティア：メモリ、パーソナライゼーション、そしてワールドモデル。swyxがなぜワールドモデルがロボティクスやゲームだけでなく、AIにより生きた理解に近いものを与えるために重要だと考えているかについて フェイ・フェイ・リー、空間知能、そして『グッドウィル・ハンティング』の例え：今日のLLM（大規模言語モデル）はすべてを読み込むことで何でも知っているかもしれないが、知識をより深い知能へと変える「生きた経験」にはまだ欠けているという考え方 タイムスタンプ 00:00:00 導入プレビュー：AIコーディング戦争、スタートアップの圧力、市場構造 00:00:28 Latent Space（潜在空間）× 教師なし学習のクロオーバーへようこそ 00:01:17 AIビルダーが現在注力していること：OpenClaw、ハーネス、インフラ 00:04:33 なぜAIインフラはアプリよりも困難であり、スタートアップがまだ勝利できる場所はどこか 00:06:39 企業が独自のモデルを訓練すべきか？ 00:09:28 オープンモデル、カスタムチップ、そして新たな推論レース 00:11:25 人間だけでなくエージェント向けに製品を設計する 00:16:49 2026年のAIコーディング戦争の状況 00:19:27 能力探求、トークン最大化、そしてコーディングが放物線状に成長する理由 00:21:41 コーディング市場の最終形態はどのようなものになるか 00:23:50 ラボ（大規模AI研究機関）に対して、アプリ会社がまだ余地を持っている場所 00:27:02 なぜAIのバリュエーションや市場の変動が前例なく感じられるのか 00:28:56 コンシューマーAIとコーディングAI、そしてスティッキーな製品が依然として重要である理由 00:32:28 次の画期的な製品体験とは何か 00:32:53 2026年のテーゼ：コーディングエージェントが制約を破り、世界を席巻する 00:35:27 ファウンデーションモデルはスタートアップのカテゴリを消滅させているのか？ 00:37:33 AI対SaaS、ヴァイブコーディング、そして社内チームの緊張関係 00:40:01 バイオセーフティ、セキュリティ、そして制限付きモデルリリースの政治学 00:42:19 巨大モデル、計算リソースの制約、そしてスケールの限界 00:44:30 AIにおける真のボトルネックはメモリである 00:44:57 swyxがオープンモデルに関する見方を改めた理由 00:47:44 ダークファクトリーとゼロヒューマンレビューコーディングの未来 00:49:36 後処理（Post-training）や強化学習（RL）が人々が考える以上に重要である理由 00:51:50 メモリ、ワールドモデル（World Models）、そして知能の次のフロンティア 00:53:54 LLM（大規模言語モデル）に対する『グッドウィル・ハンティング』のアナロジー 00:54:21 結びの言葉 トランスクリプト（文字起こし） [00:00:00] swyx：そんな数字がただの気絶するほど驚くべきものじゃないですか？ [00:00:03] Jacob Effron：今日のAIコーディング戦争の状況はどうなっていますか？ [00:00:05] swyx：私たちは一種の能力探求フェーズにあります。私が現在追求している一般的なテーゼは、2025年がコーディングエージェントの年であったように、2026年はコーディングエージェントが制約を破って他のすべてのタスクを行う年になるということです。 [00:00:16] Jacob Effron：基盤モデル（Foundation Models）がこれらのスタートアップカテゴリの多くに参入することを心配していますか？ [00:00:21] swyx：中規模スタートアップのことですね。はい。 [00:00:23] Jacob Effron：この市場の最終状態、つまり市場構造が大幅に変化する時期についてどう思いますか？ [00:00:25] swyx：今日のトピックは教師なし学習（Unsupervised Learning）です。楽しいエピソードがあり、そして私たちの友人であるLatent Spaceとのクロスオーバーエピソードが、もはや恒例の行事となっています。 Swix と私は座って、今日の AI エコシステムで起きていることすべてについて話しました。モデル層でのさまざまな変化についてどう思っているか、インフラの世界で何が起こっているか、コーディング戦争、そしてその他の多くのことについてです。このことを、私が本当に尊敬している方、そしてゲーム界の素晴らしいポッドキャスターであるもう一人の方と行うのは、非常に楽しいものです。 それでは、私たちのエピソードをご覧ください。Swix です。うーん、また別の「教師なし学習 x 潜在空間クロースオーバー」エピソードに参加できて、本当に楽しいです。 [00:01:02] swix：ああ、 [00:01:02] Jacob Effron：どこから始めようかと思うところはたくさんありますが、あなたが時間をどのように過ごしているかについて、私がいつも魅力的だと感じていることのひとつは、あなたは明らかにこのエンジニアリングムーブメントとコミュニティの中心にいて、これらのイベントやカンファレンスを運営し、これらの素晴らしいトークを企画していることです。 そして、何が起こっているかの時代の精神（zeitgeist）に対する優れた感覚を持っていると思います。 [00:01:16] swix：ああ、 [00:01:17] Jacob Effron：では、まず始めに、人々が今最も考えている最大のトピックは何ですか？ [00:01:21] swix：ああ、ロンドンから戻ったばかりで、そこで AI Europe を行いました。今は四半期に1回ほど開催しています。ああ、あなたは [00:01:27] Jacob Effron：本当にペースを [00:01:27] swix：上げている、 hopefully [00:01:28] Jacob Effron：ペースを上げています。 [00:01:29] swix：頑張っています。AI の速度に追いつこうとしていますよね？ [00:01:30] Jacob Effron：ああ、まさにその通り。トップは完全に異なるものになるでしょうね。うーん、 [00:01:33] swyx：ああ、わかるよ。確かに私はトラック（セッション枠）をキュレーションしているから、私の考えが見て取れるはずだ。トラックリストと私が招待するスピーカーを見れば、明らかに「Open Claw」は過去4〜5ヶ月の物語であり、その直下にはBeが位置づけられている。 私は「ハネスエンジニアリング」と「コンテキストエンジニアリング」を、エージェントとRAG（Retrieval-Augmented Generation：検索拡張生成）に関連する2つのトピックと見なしている。そして、評価（evals）、観測可能性（observability）、GPU、LMインフラストラクチャ、そして一般的な話題など、「エヴァーグリーン（永続的な）」なテーマのロングテールが続く。また、マルチモーダル性や「ジェネラティブメディア」と呼べるような生成メディアに関する他のアップデートも提供している。 うーん、でも私が最初に挙げた3つが、人々の関心の最上位にあることは確かだ。うん。 [00:02:13] Jacob Effron：ハネスは特に興味深いと思う。うーん、最近私の目に留まったHarrison Chase（LangChainのCEO）のツイートで、「ようやくAIインフラストラクチャの周りで安定感があるように感じられる」と彼は言っていた。 彼が示唆していたのは、おそらくこうだ。AIインフラの中心に位置する企業として過去2〜3年を振り返ると、それはまるで「ドジョウ抜き」のようなものだった。つまり、構築パターンが進化するにつれて、常に振り回されながら移動していたわけだ。 [00:02:36] swyx：Harrisonにとって確かにそうだ。彼はLangChainを始めて以来、毎年会社を再発明せざるを得なかったわけだ。 そうでしょう？Lang Chain、Ang Graph、そしてLPエージェントといった話で、彼はこの分野で最も器用で熟練した鋭い人物の一人だと思います。はい、その通りです。 [00:02:49] Jacob Effron：今こそが、ついに安定の時期だと言っているのです。 [00:02:51] swyx：その通りです。 [00:02:52] Jacob Effron：はい。あなたはそれを支持しますか？それとも、その見解をどう捉えていますか？ [00:02:56] swyx：「今回は違う」と言うのは非常にコストがかかることですが、単にコードを書いている段階では、実際にコールを試してみるのは問題ないと考えています。そして、そのコールが正しいかどうかは、実は重要ではないかもしれません。 例えばですが、エージェントとの統合における「パッションパッケージング」の多様な方法を経験してきましたが、最終的に「スキル」という概念に落ち着いたように感じます。これは最小限の妥当なフォーマットであり、スクリプトが添付されたマークダウンファイルに過ぎません。これ以上シンプルになることはないでしょう。したがって、ハルネス（harnesses）周辺の安定性には一定の正当性があります。ただし、エージェントエンジニアリングにおける「スキル」のような分野については、リアルタイム要素やサブエージェント、メモリなどの適応の方がより多いように感じます。 うーん、でももしそのテーゼが、「エージェントとはツールをループに組み込み、ファイルシステムを持つLM（大規模言語モデル）であり、スキルや標準的なツールリングを用いた検索が可能である」ということなら、おそらくそれは理にかなっているでしょう。ただ、私は「私たちはすでにそこにいる」というこのテーゼに自分の評判を賭ける意味はないと思います。もしまた状況が変わったら、それに合わせて変化すればいいのですから。 それでいいんです。 [00:04:33] Jacob Effron：そうだね。私はいつも、インフラ企業やアプリケーション企業にとってそれがより困難であることに驚かされてきました。明らかに、アプリケーション側では、Sierra MaxやLaraのBrett Taylorのようなケースを見てきたように、「モデルの先を行くものを作り、モデルが改善されるにつれて3ヶ月ごとにすべてを捨ててしまう」という姿勢があります。 まさにその通りです。しかし、少なくともそこにあるのはエンドカスタマーが存在することですね。彼らはある程度ロイヤルティが高く、少なくともこれらのものを作る機会を与えてくれるでしょう。私がこれまでより困難だと感じてきたのは、インフラレイヤーにおける「3ヶ月ごとに自分自身を再発明する」という性質です。開発者というユーザーは、会計事務所や銀行といった顧客よりも、おそらくより選別された（クリティカルな）オーディエンスであることは間違いありません。 そうだね。つまり、常に自分自身を刷新し続けなければならないという点で、それは確かにより困難な立場だと言える。 [00:05:17] swyx：そうだね。うん、うん。そして、彼らが新しいものへ移行するとき、それは非常に包括的なものだね。つまり、彼らは次-hotな新技術-へと去っていくんだ。おそらく防衛性（defensibility）がないからだろうね。たとえあなたがデータベース会社だとしても、人々はワークロードをデータベースから移行できるからね。 つまり、それはよく知られた事実だ。だから、私が言いたいのは、私たちが話していることは、AIスタートアップにおける垂直（vertical）と水平（horizontal）の議論 basically だということだね。私が考えるもう一つのポイントは、あなたが「橋渡し」役、つまりアウトソーシングされたAIチームである場合、あなたの仕事は最先端のAI手法を適用することだということだね。 [00:05:55] Jacob Effron：そうだね。モデルの能力とあなたの [00:05:57] swyx：顧客をつなぐ層だね。うん、最終顧客へ向けてね。そして、もし彼らがあなたを雇わなければ、自社でエンジニアリングチームを採用する必要があるが、そうはしないから、彼らはあなたを選ぶんだ。つまり、エンジニアリング層で人々がどのようなトレンドや発見をしても、それに対して非常にロバスト（堅牢）で合理的な立場だと思う。 私としては、有用な横断的な企業が構築されているような気がするのですが、それらはすべて、AI時代の古典的なクラウドの再発明のようなもので、主要なものがサンドボックスです。はい。えーと、それは計算リソースの別の形態で、皆さん、それに熱くなりすぎないでください。 でも、 workload が莫大だという意味です。 [00:06:38] Jacob Effron: そうです。 [00:06:38] swyx: はい。 [00:06:39] Jacob Effron: 興味深いことです。この一環として、人々がインフラストラクチャについて質問している中で、企業が独自のAIチームを持つべきかどうか、そして社内で行うべきことは何かという質問が多くあります。 また、人々が独自のモデルをトレーニングすべきかどうか、あるいは保有するデータに基づいて社内での強化学習（Reinforcement Learning, RL）を行うべきかどうかといった質問もあります。私は、この点に関する見解をペースに合わせて3ヶ月ごとに進化させる必要があると感じています。では、現在のあなたの立場はどうですか？ [00:07:00] swyx: 私は、実際にはすべてのモデルが向上したと考えています。もちろん、私はCognitionに関与しており、またCursorでも独自のモデルトレーニングを多く行っています。そして、これは私が「エージェントラボのプレイブック」と呼んでいるものの一部だと考えています。つまり、大手ラボからの最先端モデルで始め、ドメイン固有の専門化を行うのです。 しかし、十分なワークロードとユーザーからの高品質なデータが揃えば、当然ながら独自のモデルをトレーニングし、コストやレイテンシ、そしてその他の多くのメリットを大幅に節約することができます。また、「ファジーな名前」を付けて研究結果を発表することによる、一種のマーケティング上のボーナスも得られます。 [00:07:38] Jacob Effron：私の視点からは、それがエンドユーザーに実際にどの程度の価値を提供しているのか、そしてそのマーケティングボーナスがどれほど影響しているのかを正確に見極めるのは難しいですね。正しい判断です。それはある種の組み合わせのように見えます。 [00:07:45] swyx：私は両方あると思います。 [00:07:46] Jacob Effron：ええ、その通りです。 [00:07:46] swyx：いや、実際には真の価値があります。その理由はいくつかあります。例えば、補助金がなくても、人々はそれを上位4つまたは5つの選択肢の一つとして選んでいます。 これはComposer 2と、あぁ、Suite 1.6のいずれかですが、上位5つのモデルの一つに入っています。公平な市場、いや自由市場においてです。あるいはモデルの切り替え時においても、人々はそれを選択しており、補助金を受けているわけではありません。つまり、これ以上の良い評価はありません。さらにその先として、例えば検索におけるドメイン固有モデル（domain-specific models）のようなケースがあります。両社ともSearch with Bothにおいて、これは非常に理にかなっています。 誰もが、そうだ、常にそうすべきだと口を揃えます。そして正直に言って、そのためのインフラストラクチャは、思考機械（thinking machines）のいじくり回しや、主要なラボ関連の作業などを通じて、ますます容易になっているように思えます。はい、つまりこれは「苦い教訓（bitter lesson）」の逆転現象の一つで、あなたは…

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト