AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Latent Space·2026年4月24日 04:37·約23分で読める

AIE Europe 振り返りとエージェントラボの主張:教師なし学習と潜在空間のクロスオーバー特別編(2026年)

#エージェント#ドメイン特化型モデル#オープンソースLLM#インフラ最適化#パーソナライズドメモリ
TL;DR

AIE Europeでの議論を踏まえ、swyxがエージェントの最小パッケージングとしての「スキル」、ドメイン特化型モデル学習の現実性、オープンソースと独自ハードウェアの台頭、そしてエージェント向け販売とメモリ機能の重要性について、2026年のAI業界の方向性を分析している。

AI深層分析2026年4月27日 01:20
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

エージェント基盤と「スキル」の定義

インフラが安定しつつあり、エージェントの最小単位となるパッケージング形式として「スキル」が注目されており、アプリケーション企業がモデルの揺らぎに対して強く生存できている背景を示唆している。

2

ドメイン特化型モデル学習の実現

CursorやCognitionのような企業は、フロントエンドモデルから始まり、十分なデータとワークロードが蓄積された段階で独自モデルへの移行(ディステillation)を行う「エージェントラボ」プレイブックを実践しており、これは単なるマーケティングではない。

3

インフラの多様化とオープンソース回帰

swyxはオープンソースへの強気転換を示し、NVIDIA以外のハードウェアや独自チップへの関心が高まっていることを指摘し、10倍の速度向上が新たな製品体験を可能にする可能性を論じている。

4

エージェント向け販売とパーソナライズドメモリ

エージェントへの販売は実質的に優れた開発者体験(DX)の提供であり、APIやドキュメントが重要になる。また、今後の競争優位性は頻度ではなく「パーソナライズドメモリシステム」によって形作られると予測している。

5

コーディング市場の構造と未来予測

コーディング分野では少数の主要プレイヤーとニッチ製品の長尾が共存する構造へ移行し、MicrosoftやxAIなどの参入により競合激化が見込まれる。また、この市場は垂直領域AIのテンプレートとして機能し、アプリ企業とラボ企業の衝突パターンを示している。

6

SaaS業界への圧力と内部文化の亀裂

AIによる低コスト再構築の可能性が、高価な既存SaaS製品への依存を揺るがしており、AIネイティブな従業員と保守的な組織の間で採用に関する文化対立が生じている。

7

大規模モデルの限界とセキュリティ優先

10兆パラメータ超の大規模モデルは単なる一時的な割り当て段階であり、ラボはより強力なモデルを蒸留用に私有化する傾向にある。さらに、AnthropicのMike Kriegerはセキュリティをバイオ安全性よりも優先すべき課題として位置づけている。

影響分析・編集コメントを表示

影響分析

この記事は、AI開発の焦点が「モデル性能の向上」から「実装・運用・エコシステムの最適化」へシフトしていることを示しています。特に、エージェントが自律的に動作するためのインフラ整備や、ドメイン固有のデータを活用したモデル最適化は、今後はスタートアップからエンタープライズに至るまで必須の戦略となります。また、ハードウェア多様化とオープンソースの台頭は、既存のクラウド寡占構造に対する重要な対抗軸となる可能性があります。

編集コメント

モデル競争の激化に伴い、勝者は「最も強力なモデル」ではなく、「最も効率的にドメイン固有のタスクを解決できるエコシステム」を持つ企業になるという洞察は、投資家およびエンジニアにとって極めて示唆に富む。

本日、私たちは最初の「教師なし学習×潜在空間クロースオーバー」スペシャルから1年後をチェックし、AIの世界で何が変わったか(多くの変化があります)について議論します。このエピソードはAIE Europeの直後に録音されましたが、CursorとxAIの契約締結前です。

「教師なし学習(Unsupervised Learning)」は、AIの最前線で活躍する鋭い思想家たちへのインタビューを通じて、今日何が現実であり、将来何が起こり得るか、そしてそれがビジネスや世界にどのような意味を持つかを掘り下げます。これにより、ビルダー(開発者)、研究者、創業者が最大のブレイクスルーを分解し理解するのを支援します。

この番組のホストおよび編集を担当してくれたJacobとUL制作チームに感謝します!

Jacob Effron

LinkedIn: https://www.linkedin.com/in/jacobeffron/

X: https://x.com/jacobeffron

YouTubeでの全エピソード

私たちが議論すること:

AIエンジニアリングの時代の精神(zeitgeist)の中心からのswyxの見解:OpenClaw、ハルネスエンジニアリング(Harness Engineering)、コンテキストエンジニアリング、評価(evals)、観測可能性(observability)、GPU、マルチモーダル性、そしてなぜカンファレンスのトラック構成が今、AIにおいて最も重要なものを明らかにしているか

AIインフラストラクチャが最終的に安定したかどうか:なぜ「スキル」がエージェントのための最小限の妥当なパッケージ形式になり得るのか、なぜインフラ企業は毎年自分自身を再発明せざるを得なかったのか、そしてなぜアプリケーション企業はモデルのボラティリティ(変動性)に対して生き残るのが容易だったのか

垂直統合型 versus 水平展開型のAIスタートアップ論争:なぜアプリケーション企業が企業向けのアウトソーシングされたAIチームとして機能し得るのか、なぜ一部の水平展開型企業が依然として重要なのか、そしてなぜサンドボックスがAI時代における古典的なクラウドインフラストラクチャの最も明確な再発明となり得るのか

"エージェントラボ"のプレイブック:最先端モデルから始め、自らのドメインに特化させ、その後、コストとレイテンシの削減を正当化するのに十分なデータ、ワークロード、ユーザー行動が揃った時点で独自のモデルをトレーニングする

ドメイン特化型モデルのトレーニングは現実であり、単なるマーケティングではない:CursorやCognitionのような企業がユーザーに自社製モデルを選んでもらう方法、そして検索、ドメイン特化、蒸留(distillation)がより重要になっている理由

オープンモデル、カスタムチップ、代替推論インフラ:swyxがオープンソースに対してより楽観的になっている理由、非NVIDIAハードウェアが突然注目を集めている理由、そして10倍の速度向上がどのように新たな製品体験を可能にするか

人間ではなくエージェントに販売することの意味:エージェントエクスペリエンスが実質的には単なる別の名前の優れた開発者体験である理由、APIやドキュメントがこれまで以上に重要である理由、そして事前トレーニングデータの既存企業がエージェントファーストの世界でどのように優位性を複合的に積み重ねているか

メモリとパーソナライズが次の大きな切り札になる理由:現在のモデルは主に言及頻度を報酬とするが、将来swyxは製品選択がパーソナライズされたメモリシステムによってより大きく形作られると予想している

AIコーディング戦争の現状:コーディングがなぜAIの中で最大かつ最速に成長しているカテゴリの一つになったか、Anthropic、OpenAI、Cursor、Cognitionがどのようにこの波に乗ったか、そしてこのカテゴリにまだ成長余地があるかもしれない理由

能力の探求と効率性:なぜ業界はまだトークン最大化や実験重視の段階にあり、多くを使うことが少なく使うことよりも報酬されるのか

Claude CodeとCodex、そしてコーディング製品の奇妙な定着性:最初の魔法のような製品体験が予想以上に重要であり、これまでのところ実質的な勝者として名前が上がっているのが限られた企業だけであるという大きな謎とは何か

コーディング市場の最終的な姿:2大プレイヤー、ニッチ製品の長いテール、そしてMicrosoft、Mistral、xAI、あるいは中国のラボがコーディング分野でより強力に参入した場合の可能性のある破壊

ラボに対してアプリケーション企業がまだ余地を持っている理由:フロンティアラボが金融や医療といった垂直分野への拡大を試みているものの、ワークフローとラストマイルを支配する焦点を絞った企業にはまだ空間が残っている理由

コーディングが他のすべてのAI市場のプレビューとなる理由:パラボリック(放物線状)に成長した最初のカテゴリ、ファウンデーションモデル企業とアプリケーション企業の衝突の最も明確な例、そして将来の垂直AI市場がどのように発展していくかを示すテンプレート

なぜ現在のAIバリュエーションが無制限に感じられるのか:1年でビルドされた10億ドルのARR(年間経常収益)製品から兆ドル規模の時価総額まで、swyxとJacobは、AI市場がスケールと耐久性に関する従来のスタートアップの直感をどのように壊したかを解き明かす

コンシューマーAIとコーディングAI:ChatGPTのコンシューマーカテゴリは頻度と製品設計において頭打ち状態にある可能性が高い一方で、コーディングは実際の勢いを持つ日常利用カテゴリとして引き続き感じられる理由

コーディングの次の製品フロンティア:消費者向けエージェント、コンピュータ操作、「コンテインメントを破るコーディング・エージェント」、そしてswyxの仮説——2025年はコーディング・エージェントの年で、2026年はそれらが他のすべてのタスクを担い始める年になるかもしれない——

基盤モデルが本当にスタートアップの分類を壊滅させているのか:なぜswyxは初期の創業者にはそれほど心配していないのか、中規模スタートアップや従来のSaaS(Software as a Service)にはより懸念しているのか、そしてなぜ今では野心的なプロジェクトを構築することがフロンティアラボへの最高の面接になるのか

AI対SaaS、そして採用をめぐる内部の文化戦争:高価なソフトウェアを撤去したいAIネイティブな従業員と、迅速に構築されたAI代替品が脆弱なシステムを生み出すと考えている懐疑派との間の緊張関係

従来のSaaSが本当に圧力を受けている理由:swyx自身がイベントおよびスポンサー管理ソフトウェアに6桁の金額を費やした経験、それをAIで安価に再構築する誘惑、そしてチームがカスタムなAIネイティブな代替品を信頼するかどうかというより広範な問い

バイオセーフティ、セキュリティ、そしてフロンティアモデルへのアクセス:なぜswyxはAnthropicのMike Kriegerとの夕食会でバイオセーフティを持ち出したのか、なぜKriegerはセキュリティがより大きな問題だと主張したのか、そして制限付きモデルのリリースがAnthropic対OpenAIについて何を明らかにしているのか

巨大モデルの時代:10兆(10T)以上のパラメータを持つシステムが、より大規模なクラスターが登場するまでの一時的な配給フェーズに過ぎない理由、ラボが蒸留のために最も強力なモデルをますます非公開で保持する可能性が高い理由、そしてスケール単体ではもはや完全な答えのように感じられない理由

AIにおける最も遅いスケーリング要因としてのメモリ:コンテキストウィンドウが人々の期待ほどには急速に改善されなかった理由、百万トークンのコンテキストが依然としてほとんどの実際のワークフローを変革していない理由、そしてなぜメモリが次世代システムの主要なボトルネックとなる可能性があるか

過去1年でswyxの見方が変わった点:オープンモデルに対してより楽観的になり、トップティアのエージェントスタートアップが一般的なAI企業とは非常に異なる振る舞いをするという確信を深め、ファインチューニングや専門モデルの適応可能性に対してより前向きになったこと

「ダークファクトリー」とゼロヒューマンレビューのコーディング:ゼロ人間記述コードという次の段階として、モデルがコードを生成するだけでなく、人間のレビューなしに本番環境へデプロイするという新たなフロンティア。これにより、企業はテストと検証のプロセスを根本から見直すことを余儀なくされる

強化学習(RL)とポストトレーニングが人々の想定以上に重要である理由:生成されたモデルが数ヶ月ごとに破棄される場合でも、そのデータ、ワークフロー、ドメイン固有の改善点は持続的に蓄積される

合成ルビクス(Synthetic Rubrics)、Doctor GRPO、マルチターン強化学習:強化学習が多くの人が認識しているよりもはるかにドメイン固有かつマルチステップなプロセスへと進化しており、これによりより深いカスタマイズの道が開かれている

コーディングの次のフロンティア:メモリ、パーソナライゼーション、そしてワールドモデル。swyxがなぜワールドモデルがロボティクスやゲームだけでなく、AIにより生きた理解に近いものを与えるために重要だと考えているかについて

フェイ・フェイ・リー、空間知能、そして『グッドウィル・ハンティング』の例え:今日のLLM(大規模言語モデル)はすべてを読み込むことで何でも知っているかもしれないが、知識をより深い知能へと変える「生きた経験」にはまだ欠けているという考え方

タイムスタンプ

00:00:00 導入プレビュー:AIコーディング戦争、スタートアップの圧力、市場構造

00:00:28 Latent Space(潜在空間)× 教師なし学習のクロオーバーへようこそ

00:01:17 AIビルダーが現在注力していること:OpenClaw、ハーネス、インフラ

00:04:33 なぜAIインフラはアプリよりも困難であり、スタートアップがまだ勝利できる場所はどこか

00:06:39 企業が独自のモデルを訓練すべきか?

00:09:28 オープンモデル、カスタムチップ、そして新たな推論レース

00:11:25 人間だけでなくエージェント向けに製品を設計する

00:16:49 2026年のAIコーディング戦争の状況

00:19:27 能力探求、トークン最大化、そしてコーディングが放物線状に成長する理由

00:21:41 コーディング市場の最終形態はどのようなものになるか

00:23:50 ラボ(大規模AI研究機関)に対して、アプリ会社がまだ余地を持っている場所

00:27:02 なぜAIのバリュエーションや市場の変動が前例なく感じられるのか

00:28:56 コンシューマーAIとコーディングAI、そしてスティッキーな製品が依然として重要である理由

00:32:28 次の画期的な製品体験とは何か

00:32:53 2026年のテーゼ:コーディングエージェントが制約を破り、世界を席巻する

00:35:27 ファウンデーションモデルはスタートアップのカテゴリを消滅させているのか?

00:37:33 AI対SaaS、ヴァイブコーディング、そして社内チームの緊張関係

00:40:01 バイオセーフティ、セキュリティ、そして制限付きモデルリリースの政治学

00:42:19 巨大モデル、計算リソースの制約、そしてスケールの限界

00:44:30 AIにおける真のボトルネックはメモリである

00:44:57 swyxがオープンモデルに関する見方を改めた理由

00:47:44 ダークファクトリーとゼロヒューマンレビューコーディングの未来

00:49:36 後処理(Post-training)や強化学習(RL)が人々が考える以上に重要である理由

00:51:50 メモリ、ワールドモデル(World Models)、そして知能の次のフロンティア

00:53:54 LLM(大規模言語モデル)に対する『グッドウィル・ハンティング』のアナロジー

00:54:21 結びの言葉

トランスクリプト(文字起こし)

[00:00:00] swyx:そんな数字がただの気絶するほど驚くべきものじゃないですか?

[00:00:03] Jacob Effron:今日のAIコーディング戦争の状況はどうなっていますか?

[00:00:05] swyx:私たちは一種の能力探求フェーズにあります。私が現在追求している一般的なテーゼは、2025年がコーディングエージェントの年であったように、2026年はコーディングエージェントが制約を破って他のすべてのタスクを行う年になるということです。

[00:00:16] Jacob Effron:基盤モデル(Foundation Models)がこれらのスタートアップカテゴリの多くに参入することを心配していますか?

[00:00:21] swyx:中規模スタートアップのことですね。はい。

[00:00:23] Jacob Effron:この市場の最終状態、つまり市場構造が大幅に変化する時期についてどう思いますか?

[00:00:25] swyx:今日のトピックは教師なし学習(Unsupervised Learning)です。楽しいエピソードがあり、そして私たちの友人であるLatent Spaceとのクロスオーバーエピソードが、もはや恒例の行事となっています。

Swix と私は座って、今日の AI エコシステムで起きていることすべてについて話しました。モデル層でのさまざまな変化についてどう思っているか、インフラの世界で何が起こっているか、コーディング戦争、そしてその他の多くのことについてです。このことを、私が本当に尊敬している方、そしてゲーム界の素晴らしいポッドキャスターであるもう一人の方と行うのは、非常に楽しいものです。

それでは、私たちのエピソードをご覧ください。Swix です。うーん、また別の「教師なし学習 x 潜在空間クロースオーバー」エピソードに参加できて、本当に楽しいです。

[00:01:02] swix:ああ、

[00:01:02] Jacob Effron:どこから始めようかと思うところはたくさんありますが、あなたが時間をどのように過ごしているかについて、私がいつも魅力的だと感じていることのひとつは、あなたは明らかにこのエンジニアリングムーブメントとコミュニティの中心にいて、これらのイベントやカンファレンスを運営し、これらの素晴らしいトークを企画していることです。

そして、何が起こっているかの時代の精神(zeitgeist)に対する優れた感覚を持っていると思います。

[00:01:16] swix:ああ、

[00:01:17] Jacob Effron:では、まず始めに、人々が今最も考えている最大のトピックは何ですか?

[00:01:21] swix:ああ、ロンドンから戻ったばかりで、そこで AI Europe を行いました。今は四半期に1回ほど開催しています。ああ、あなたは

[00:01:27] Jacob Effron:本当にペースを

[00:01:27] swix:上げている、 hopefully

[00:01:28] Jacob Effron:ペースを上げています。

[00:01:29] swix:頑張っています。AI の速度に追いつこうとしていますよね?

[00:01:30] Jacob Effron:ああ、まさにその通り。トップは完全に異なるものになるでしょうね。うーん、

[00:01:33] swyx:ああ、わかるよ。確かに私はトラック(セッション枠)をキュレーションしているから、私の考えが見て取れるはずだ。トラックリストと私が招待するスピーカーを見れば、明らかに「Open Claw」は過去4〜5ヶ月の物語であり、その直下にはBeが位置づけられている。

私は「ハネスエンジニアリング」と「コンテキストエンジニアリング」を、エージェントとRAG(Retrieval-Augmented Generation:検索拡張生成)に関連する2つのトピックと見なしている。そして、評価(evals)、観測可能性(observability)、GPU、LMインフラストラクチャ、そして一般的な話題など、「エヴァーグリーン(永続的な)」なテーマのロングテールが続く。また、マルチモーダル性や「ジェネラティブメディア」と呼べるような生成メディアに関する他のアップデートも提供している。

うーん、でも私が最初に挙げた3つが、人々の関心の最上位にあることは確かだ。うん。

[00:02:13] Jacob Effron:ハネスは特に興味深いと思う。うーん、最近私の目に留まったHarrison Chase(LangChainのCEO)のツイートで、「ようやくAIインフラストラクチャの周りで安定感があるように感じられる」と彼は言っていた。

彼が示唆していたのは、おそらくこうだ。AIインフラの中心に位置する企業として過去2〜3年を振り返ると、それはまるで「ドジョウ抜き」のようなものだった。つまり、構築パターンが進化するにつれて、常に振り回されながら移動していたわけだ。

[00:02:36] swyx:Harrisonにとって確かにそうだ。彼はLangChainを始めて以来、毎年会社を再発明せざるを得なかったわけだ。

そうでしょう?Lang Chain、Ang Graph、そしてLPエージェントといった話で、彼はこの分野で最も器用で熟練した鋭い人物の一人だと思います。はい、その通りです。

[00:02:49] Jacob Effron:今こそが、ついに安定の時期だと言っているのです。

[00:02:51] swyx:その通りです。

[00:02:52] Jacob Effron:はい。あなたはそれを支持しますか?それとも、その見解をどう捉えていますか?

[00:02:56] swyx:「今回は違う」と言うのは非常にコストがかかることですが、単にコードを書いている段階では、実際にコールを試してみるのは問題ないと考えています。そして、そのコールが正しいかどうかは、実は重要ではないかもしれません。

例えばですが、エージェントとの統合における「パッションパッケージング」の多様な方法を経験してきましたが、最終的に「スキル」という概念に落ち着いたように感じます。これは最小限の妥当なフォーマットであり、スクリプトが添付されたマークダウンファイルに過ぎません。これ以上シンプルになることはないでしょう。したがって、ハルネス(harnesses)周辺の安定性には一定の正当性があります。ただし、エージェントエンジニアリングにおける「スキル」のような分野については、リアルタイム要素やサブエージェント、メモリなどの適応の方がより多いように感じます。

うーん、でももしそのテーゼが、「エージェントとはツールをループに組み込み、ファイルシステムを持つLM(大規模言語モデル)であり、スキルや標準的なツールリングを用いた検索が可能である」ということなら、おそらくそれは理にかなっているでしょう。ただ、私は「私たちはすでにそこにいる」というこのテーゼに自分の評判を賭ける意味はないと思います。もしまた状況が変わったら、それに合わせて変化すればいいのですから。

それでいいんです。

[00:04:33] Jacob Effron:そうだね。私はいつも、インフラ企業やアプリケーション企業にとってそれがより困難であることに驚かされてきました。明らかに、アプリケーション側では、Sierra MaxやLaraのBrett Taylorのようなケースを見てきたように、「モデルの先を行くものを作り、モデルが改善されるにつれて3ヶ月ごとにすべてを捨ててしまう」という姿勢があります。

まさにその通りです。しかし、少なくともそこにあるのはエンドカスタマーが存在することですね。彼らはある程度ロイヤルティが高く、少なくともこれらのものを作る機会を与えてくれるでしょう。私がこれまでより困難だと感じてきたのは、インフラレイヤーにおける「3ヶ月ごとに自分自身を再発明する」という性質です。開発者というユーザーは、会計事務所や銀行といった顧客よりも、おそらくより選別された(クリティカルな)オーディエンスであることは間違いありません。

そうだね。つまり、常に自分自身を刷新し続けなければならないという点で、それは確かにより困難な立場だと言える。

[00:05:17] swyx:そうだね。うん、うん。そして、彼らが新しいものへ移行するとき、それは非常に包括的なものだね。つまり、彼らは次-hotな新技術-へと去っていくんだ。おそらく防衛性(defensibility)がないからだろうね。たとえあなたがデータベース会社だとしても、人々はワークロードをデータベースから移行できるからね。

つまり、それはよく知られた事実だ。だから、私が言いたいのは、私たちが話していることは、AIスタートアップにおける垂直(vertical)と水平(horizontal)の議論 basically だということだね。私が考えるもう一つのポイントは、あなたが「橋渡し」役、つまりアウトソーシングされたAIチームである場合、あなたの仕事は最先端のAI手法を適用することだということだね。

[00:05:55] Jacob Effron:そうだね。モデルの能力とあなたの

[00:05:57] swyx:顧客をつなぐ層だね。うん、最終顧客へ向けてね。そして、もし彼らがあなたを雇わなければ、自社でエンジニアリングチームを採用する必要があるが、そうはしないから、彼らはあなたを選ぶんだ。つまり、エンジニアリング層で人々がどのようなトレンドや発見をしても、それに対して非常にロバスト(堅牢)で合理的な立場だと思う。

私としては、有用な横断的な企業が構築されているような気がするのですが、それらはすべて、AI時代の古典的なクラウドの再発明のようなもので、主要なものがサンドボックスです。はい。えーと、それは計算リソースの別の形態で、皆さん、それに熱くなりすぎないでください。

でも、 workload が莫大だという意味です。

[00:06:38] Jacob Effron: そうです。

[00:06:38] swyx: はい。

[00:06:39] Jacob Effron: 興味深いことです。この一環として、人々がインフラストラクチャについて質問している中で、企業が独自のAIチームを持つべきかどうか、そして社内で行うべきことは何かという質問が多くあります。

また、人々が独自のモデルをトレーニングすべきかどうか、あるいは保有するデータに基づいて社内での強化学習(Reinforcement Learning, RL)を行うべきかどうかといった質問もあります。私は、この点に関する見解をペースに合わせて3ヶ月ごとに進化させる必要があると感じています。では、現在のあなたの立場はどうですか?

[00:07:00] swyx: 私は、実際にはすべてのモデルが向上したと考えています。もちろん、私はCognitionに関与しており、またCursorでも独自のモデルトレーニングを多く行っています。そして、これは私が「エージェントラボのプレイブック」と呼んでいるものの一部だと考えています。つまり、大手ラボからの最先端モデルで始め、ドメイン固有の専門化を行うのです。

しかし、十分なワークロードとユーザーからの高品質なデータが揃えば、当然ながら独自のモデルをトレーニングし、コストやレイテンシ、そしてその他の多くのメリットを大幅に節約することができます。また、「ファジーな名前」を付けて研究結果を発表することによる、一種のマーケティング上のボーナスも得られます。

[00:07:38] Jacob Effron:私の視点からは、それがエンドユーザーに実際にどの程度の価値を提供しているのか、そしてそのマーケティングボーナスがどれほど影響しているのかを正確に見極めるのは難しいですね。正しい判断です。それはある種の組み合わせのように見えます。

[00:07:45] swyx:私は両方あると思います。

[00:07:46] Jacob Effron:ええ、その通りです。

[00:07:46] swyx:いや、実際には真の価値があります。その理由はいくつかあります。例えば、補助金がなくても、人々はそれを上位4つまたは5つの選択肢の一つとして選んでいます。

これはComposer 2と、あぁ、Suite 1.6のいずれかですが、上位5つのモデルの一つに入っています。公平な市場、いや自由市場においてです。あるいはモデルの切り替え時においても、人々はそれを選択しており、補助金を受けているわけではありません。つまり、これ以上の良い評価はありません。さらにその先として、例えば検索におけるドメイン固有モデル(domain-specific models)のようなケースがあります。両社ともSearch with Bothにおいて、これは非常に理にかなっています。

誰もが、そうだ、常にそうすべきだと口を揃えます。そして正直に言って、そのためのインフラストラクチャは、思考機械(thinking machines)のいじくり回しや、主要なラボ関連の作業などを通じて、ますます容易になっているように思えます。はい、つまりこれは「苦い教訓(bitter lesson)」の逆転現象の一つで、あなたは…

原文を表示

Today, we check in a year after the first Unsupervised Learning x Latent Space Crossover special to discuss everything that has changed (there is a lot) in the world of AI. This episode was recorded just after AIE Europe, but before the Cursor-xAI deal.

Unsupervised Learning is a podcast that interviews the sharpest minds in AI about what’s real today, what will be real in the future and what it means for businesses and the world - helping builders, researchers and founders deconstruct and understand the biggest breakthroughs.

Thanks to Jacob and the UL production team for hosting and editing this!

Jacob Effron

LinkedIn: https://www.linkedin.com/in/jacobeffron/

X: https://x.com/jacobeffron

Full Episode on Their YouTube

We discuss:

swyx’s view from the center of the AI engineering zeitgeist: OpenClaw, harness engineering, context engineering, evals, observability, GPUs, multimodality, and why conference tracks now reveal what matters most in AI

Whether AI infrastructure has finally stabilized: why “skills” may be the minimal viable packaging format for agents, why infra companies have had to reinvent themselves every year, and why application companies have had an easier time surviving model volatility

The vertical vs. horizontal AI startup debate: why application companies can act as the outsourced AI team for enterprises, why some horizontal companies still matter, and why sandboxes may be the clearest reinvention of classic cloud infrastructure for the AI era

The “agent lab” playbook: starting with frontier models, specializing for your domain, then training your own models once you have enough data, workload, and user behavior to justify the cost and latency savings

Why domain-specific model training is real, not just marketing: how companies like Cursor and Cognition can get users to choose their in-house models, and why search, domain specialization, and distillation are becoming more important

Open models, custom chips, and alternative inference infrastructure: why swyx has turned more bullish on open source, why non-NVIDIA hardware is suddenly getting real attention, and why every 10x speedup can unlock new product experiences

What it means to sell to agents instead of humans: why agent experience may mostly just be good developer experience by another name, why APIs and docs matter more than ever, and how pretraining-data incumbents are compounding advantages in an agent-first world

Why memory and personalization may become the next big wedge: today’s models mostly reward frequency of mentions, but in the future, swyx expects product choice to be shaped much more by personalized memory systems

The state of the AI coding wars: why coding has become one of the largest and fastest-growing categories in AI, how Anthropic, OpenAI, Cursor, and Cognition have all ridden the wave, and why the category may still have more room to run

Capability exploration vs. efficiency: why the industry is still in a token-maxing, experiment-heavy phase where people are rewarded for spending more rather than less

Claude Code vs. Codex and the strange stickiness of coding products: why first magical product experiences may matter more than expected, and why the bigger mystery may be why only a few names have emerged as real winners so far

What the end state of the coding market might look like: two major players, a longer tail of niche products, and possible disruption if Microsoft, Mistral, xAI, or the Chinese labs push harder into coding

Where application companies still have room against the labs: why frontier labs are trying to expand into verticals like finance and healthcare, but still leave space for focused companies that own the workflow and the last mile

Why coding may be a preview of every other AI market: the first category to truly go parabolic, the clearest example of foundation model companies colliding with application companies, and a template for how future vertical AI markets may develop

Why AI valuations now feel unbounded: from billion-dollar ARR products built in a year to trillion-dollar market caps, swyx and Jacob unpack how the AI market has broken traditional startup intuitions about scale and durability

Consumer AI vs. coding AI: why ChatGPT’s consumer category may have plateaued on frequency and product design, while coding continues to feel like a daily-use category with real momentum

The next product frontier beyond coding: consumer agents, computer use, and “coding agents breaking containment,” with swyx’s thesis that 2025 was the year of coding agents and 2026 may be the year they begin to do everything else

Whether foundation models are really killing startup categories: why swyx is less worried for early founders, more worried for mid-size startups and traditional SaaS, and why building something ambitious may now be the best job interview for a frontier lab

AI vs. SaaS and the internal culture war around adoption: the tension between AI-native employees who want to rip out expensive software and skeptics who think quick AI-built replacements create fragile systems

Why traditional SaaS may be under real pressure: swyx’s own experience spending six figures on event and sponsor management software, the temptation to rebuild it cheaply with AI, and the broader question of whether teams will trust custom AI-native replacements

Biosafety, security, and frontier model access: why swyx raised biosafety at a dinner with Anthropic’s Mike Krieger, why Krieger argued security is the bigger issue, and what restricted model releases reveal about Anthropic vs. OpenAI

The era of giant models: why 10T+ parameter systems may only be a temporary rationing phase before bigger clusters arrive, why labs may increasingly keep their most powerful models private for distillation, and why scale alone no longer feels like a complete answer

Memory as the slowest scaling factor in AI: why context windows have improved far more slowly than people hoped, why million-token context still has not changed most real workflows, and why memory may be the key bottleneck for the next generation of systems

What swyx changed his mind on in the past year: becoming more bullish on open models, more convinced that the top tier of agent startups behaves very differently from the median AI company, and more optimistic about fine-tuning and specialized model adaptation

“Dark factories” and zero-human-review coding: the next frontier after zero human-written code, where models not only write the code but ship it without human review, forcing companies to rethink testing and verification from first principles

Why RL and post-training may matter more than people assumed: even if the resulting models get thrown out every few months, the data, workflows, and domain-specific improvements persist

Synthetic rubrics, Doctor GRPO, and multi-turn RL: why reinforcement learning is becoming much more domain-specific and multi-step than many people realize, opening the door to much deeper customization

The next frontier after coding: memory, personalization, and world models, including why swyx thinks world models matter not just for robotics or gaming, but for giving AI something closer to lived understanding

Fei-Fei Li, spatial intelligence, and the Good Will Hunting analogy: the idea that today’s LLMs may know everything by reading it all, but still lack the lived experience that turns knowledge into a deeper kind of intelligence

Timestamps

00:00:00 Intro preview: AI coding wars, startup pressure, and market structure

00:00:28 Welcome to the Latent Space × Unsupervised Learning crossover

00:01:17 What AI builders are focused on now: OpenClaw, harnesses, and infra

00:04:33 Why AI infra is harder than apps, and where startups can still win

00:06:39 Should companies train their own models?

00:09:28 Open models, custom chips, and the new inference race

00:11:25 Designing products for agents, not just humans

00:16:49 The state of the AI coding wars in 2026

00:19:27 Capability exploration, token-maxing, and why coding is going parabolic

00:21:41 What the end state of the coding market could look like

00:23:50 Where app companies still have room against the labs

00:27:02 Why AI valuations and market swings feel unprecedented

00:28:56 Consumer AI vs. coding AI, and why sticky products still matter

00:32:28 What the next breakthrough product experience might be

00:32:53 2026 thesis: coding agents break containment and eat the world

00:35:27 Are foundation models wiping out startup categories?

00:37:33 AI vs. SaaS, vibe coding, and internal team tensions

00:40:01 Biosafety, security, and the politics of restricted model releases

00:42:19 Giant models, compute constraints, and the limits of scale

00:44:30 Memory as the real bottleneck in AI

00:44:57 Why swyx changed his mind on open models

00:47:44 Dark factories and the future of zero-human-review coding

00:49:36 Why post-training and RL may matter more than people think

00:51:50 Memory, world models, and the next frontier of intelligence

00:53:54 The Good Will Hunting analogy for LLMs

00:54:21 Outro

Transcript

[00:00:00] swyx: Isn’t that crazy? That number is just mind boggling.

[00:00:03] Jacob Effron: What is the state of the AI coding wars today?

[00:00:05] swyx: We’re in a phase of sort of like capability exploration. The general thesis that I have been pursuing now is that the same way that 2025 was a year coding agents 2026 is coding agents breaking containments to do everything else.

[00:00:16] Jacob Effron: Do you worry about the foundation models just getting into a bunch of these startup categories?

[00:00:21] swyx: Mid-size startups. Yes.

[00:00:23] Jacob Effron: What do you think the end state of this market is

[00:00:25] swyx: for the market structure to, to significantly change? There would be

[00:00:28] Jacob Effron: today on unsupervised learning. We had a, a fun episode and what’s really become an annual tradition, a crossover episode with our friends at Latent space.

Swix and I sat down and we talked about everything happening in the AI ecosystem today. What we thought of the various changes at the model layer, what’s happening in the infra world, the coding wars, and a bunch of other things. It’s a ton of fun to do this with someone I really respect and another great podcaster in the game.

Without further ado, here’s our episode. Well switch. This is, uh, super fun to be back with another unsupervised learning, uh, latent space crossover episode.

[00:01:02] swyx: Yeah,

[00:01:02] Jacob Effron: I feel like a lot of places we could start, but you know, one thing I always find fascinating, uh, about the way you spend your time is you obviously are like at the epicenter of this engineering movement and community, and you run these events and conferences and put on these.

Awesome talks and, and I think just have a great pulse on the zeitgeist of what’s going on.

[00:01:16] swyx: Yeah.

[00:01:17] Jacob Effron: Maybe to, to start just what are the biggest topics people are thinking about right now?

[00:01:21] swyx: Yeah, so I just came back from London, uh, where we did a IE Europe and we’re doing roughly one per quarter now, which Yeah, you’ve

[00:01:27] Jacob Effron: really up

[00:01:27] swyx: the, hopefully

[00:01:28] Jacob Effron: up the, up the pace.

[00:01:29] swyx: It’s trying. We’re trying to match AI speed, you

know?

[00:01:30] Jacob Effron: Yeah, exactly. The tops would be completely different, I imagine. Uh,

[00:01:33] swyx: yeah. You know, I definitely curate the tracks, like you can see what I think. When you see the track list and the, the speakers that I invite, obviously Open Claw is like the story of the last four or five months, and then be, be just below that.

I would consider harness engineering, context engineering to be two related topics in agents and rag. And then there’s a long tail of Evergreen stuff like evals, observability, GPUs, uh, and uh, LM infra and just general, just in general. We also have other updates on like multimodality and, uh, generative media, let’s call it.

Um, but I definitely, the, the first three that I mentioned are top of mind people. Yeah.

[00:02:13] Jacob Effron: I think harness is particular like, so interesting. Um, you know, there was this tweet from Harrison Chase, the, the lane chain, CEO, that, that caught my eye recently where he said, you know, it finally feels like we have stability, uh, around the infrastructure for, uh, you know, around ai.

And I think what. He basically was implying his like, look over the past two, three years as a company at the epicenter of AI infrastructure, it was a bit like playing whack-a-mole, right? You were constantly moving around with, however, the building patterns were evolving

[00:02:36] swyx: for Harrison for sure. Right? Like he’s basically had to reinvent the company every year since he started Lang Chain.

Right? It was Lang chain, Ang graph and LP agents and like, uh, I think he’s like one of the most nimble, adept sharp people about this. Yeah. Yeah.

[00:02:49] Jacob Effron: Saying now, now is finally the time stability

[00:02:51] swyx: this. Yeah.

[00:02:52] Jacob Effron: Yeah. Um, do you buy that or what have you kind of make of that take?

[00:02:56] swyx: I think that. It, it’s very expensive to say this Time is different sometimes, but when you’re just writing code, like it’s actually okay to just like try to make a call and I think it may not even matter if this call is right or not.

Like I just don’t even care that much because you can be right on a thesis, but if you don’t, you don’t figure out how to monetize the thesis, then who cares if you said something first that said, um, it does feel like, for example. Uh, we went through a lot of different ways of passion packaging integrations up with, uh, with agents.

And it feels like we’ve landed at skills, which is like the minimal viable format. Yeah. Which is just a markdown file, uh, with some scripts attached to it, and I don’t see how it can be more simple than that. And so there is some justification for. The stability around harnesses. I feel like there may be more adaptation with regards to maybe like the real time elements or subagents or memory or any of those like agent disciplines, let’s call it in, in agent engineering.

Uh, but if, if the thesis is that, okay, you just want agents are LMS with tools in the loop with a file system, what they can do. Retrieval with, with skills and all these like standard tooling that now seems to be relatively consensus then probably. That makes sense. Um, I just think like there’s no point trying to stake your reputation on this thesis that we’re there because if it changes again, just change with it.

It’s fine.

[00:04:33] Jacob Effron: Yeah. It’s always, you know, I’ve always been struck by how that is. Much more challenging for infrastructure companies and application companies. Like obviously I think, yeah. You know, on the application side you’ve seen, you know, Brett Taylor from Sierra Max, from Lara. Like, they’re like, look, we build, you know, what’s ahead of the models and we’re willing to throw everything out every three months, you know, as the models get better and better.

Exactly. Yeah. But the thing you at least have there is you have. Uh, you have an end customer, right? That’s like decently sticky. Um, you know, they will mostly stick, you know, they’ll, they’ll give you a shot at least of, of building these things. What I’ve always found more challenging, uh, at, at the kind of like, you know, reinvent yourself every three months of the infrastructure layer, it’s like, you know, developers are definitely a, a pickier audience maybe than an accounting firm or, uh, you know, a bank.

Yeah. And so it’s definitely a, a, a more challenging position to be in to, to have to constantly reinvent yourself.

[00:05:17] swyx: Yeah. Yeah. Yeah. And, and like when they turn, it’s like. Very complete. Like, they’ll leave to like the, the hot new thing, uh, because there’s like no defensibility, I guess. Like e even, even if you are a database, like, uh, people can migrate workloads off databases.

Like it’s, it’s a, it’s a known thing. Uh, so I think like basically what we’re talking about is the vertical versus horizontal, uh, debate in, in AI startups. And uh, the way I think about it also is just that like when you are. Um, Lara, when you are a bridge, like you are the outsource AI team, right? You, you are, your job is to apply whatever state ofthe art AI methods.

[00:05:55] Jacob Effron: Yeah. Like this translation layer between model capabilities and your

[00:05:57] swyx: own customers. Yeah. To, to the end customers and like, well, if they didn’t have you, they would’ve to hire in house and they’re not gonna hire in house so they have you. And like, I think that’s like a reasonable, like very robust to any whatever trends and, and discoveries that people make in, in the engineering layer.

I do think like there is, um. It like sort of useful horizontal companies being built, but they’re all. Very much like, sort of like the reinventions of classic cloud in the AI era and the, the primary one being sandboxes. Yeah. Um, which like, it’s another form of compute guys, like, let’s not get too excited about it.

But I mean, like the, the workloads are enormous.

[00:06:38] Jacob Effron: Right.

[00:06:38] swyx: Yeah.

[00:06:39] Jacob Effron: It’s interesting, and I feel like as, as part of this, you know, the questions that folks are asking around infrastructure, there’s a lot around, you know, the extent to which companies should have their own AI teams and what they should be doing in-house.

And, you know, uh, I think there’s questions around should people be training their own models? Should people be doing, you know, rl, uh, in-house based on the data they have? I feel like, you know, one has to evolve their takes on this every, every three months with paces. But where, where are you at on this today?

[00:07:00] swyx: I think, well, I mean actually all models have gone up. Um, and obviously I’m involved in cognition and also cursors doing, doing, uh, a lot of own model training. And I think that that is some part of the, what I’ve been calling the agent lab playbook, where you start off with the state of the art models from, uh, from the big labs and you, uh, specialize for your domain.

But once you have enough workload and enough high quality data from your users, then you can obviously train your own models and like save a lot on cost and latency and all that, all that good stuff. Um, you also get like a marketing bonus of like calling it some fancy name and putting out some research

[00:07:38] Jacob Effron: from my seat.

I can’t tell how much of it is like actual, you know, value that’s provided to the end user. And how much of it is that marketing bonus? Right. It seems some combination of the

[00:07:45] swyx: I think it’s both.

[00:07:46] Jacob Effron: Yeah.

[00:07:46] swyx: Um, no, no. There, there actually is real value. Um, and you, you know that for a number of reasons. Like one, even when it’s not subsidized, people do choose it as like one of the top four or five.

This is both composer two and, uh, suite 1.6 I one of the top five models. Like in a, in a fair market? In a free market, yeah. In a, in a, in a model switch. Or people do choose it and like, it’s not subsidized. Like, so that’s as good as it gets. Uh, but beyond that, like domain specific models, for example. For search with, with both, which both companies have absolutely makes, makes a ton of sense.

Everyone says like, yeah, we should always, always do this. And honestly like, I think the infrastructure for that is becoming easier with, um, like thinking machines tinker thing as well as primary like, uh, lab stuff. Yeah, I mean like, this is one of those like reversal of the, the bitter lesson where you fi

この記事をシェア

関連記事

Vercel Blog★42026年6月9日 16:00

Anthropic の「Claude Fable 5」が AI Gateway で利用可能に

Anthropic が開発した新モデル「Claude Fable 5」が、Vercel の AI Gateway で利用可能になりました。このモデルは複雑な多段階タスクで人間の手を介さずに実行でき、長期の生産性維持や並列エージェントの制御に優れています。

TechCrunch AI★42026年6月7日 05:32

OpenAI、プロンプト注入攻撃から機密データを保護する「ロックダウンモード」を発表

OpenAI は、プロンプト注入攻撃によって機密データが漏洩するリスクを防ぐため、「Lockdown Mode」という新機能を発表した。この機能は、ユーザーの意図しない悪意ある指示によるデータ侵害を防止する役割を果たす。

Latent Space★42026年6月5日 15:44

[AINews] 今日は何も大きな出来事はありませんでした

Anthropic が RSI の兆候を示し、OpenAI の ChatGPT が月間アクティブユーザー数で 10 億人を突破。SpaceX AI は IPO について説明しているが、最も重要なのは AIE WF のチケット確保とイベント参加である。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む