AIEWF 日次レポート:大規模ループ論争と AI エンジニアリングの現状
AI Engineer World's Fair の議論は、自律型ソフトウェアファクトリーとループの hype と実装ギャップについて激論を交わし、業界が抽象化レベルの引き上げよりも制御と直感構築の重要性を再認識する転換点となった。
キーポイント
ループ推進派と懐疑派の対立構造
Geoffrey Huntley 氏らが「ループは不可避であり、手書きコードに戻る必要はない」と主張する一方、Dex Horthy 氏は「 hype が discipline を凌駕している」と懸念を示し、制御ループの確実性を強調した。
経済的持続可能性への懸念
Greg Pstrucha 氏は、トークンを購入して問題をオーケストレーションするだけでは経済的に持続不可能であり、コスト対効果の問題が解決されていないと指摘した。
ソフトウェアファクトリーの現実的アプローチ
完全自動化されたファクトリーへの移行には危険があり、Horthy 氏は「問題に直接触れなくなる」リスクを警告し、エージェントループで直感を築きながら小規模から始める漸進的なアプローチを提唱した。
ソフトウェアファクトリーとClaude Tagの実践
AnthropicのMike Krieger氏は、同社の内部モデル「Claude Tag」が人間を代替するのではなく、チームメンバーが責任範囲を委任し、非同期かつ能動的にタスクを実行する「マルチプレイヤー型」のソフトウェアファクトリーの初期段階を示していると説明した。
AIエージェントの能力進化と自動化の課題
Amplifyの調査によると、95%のエンジニアがエージェントを使用しており、その89%がデータ作成などの「アクション」を実行可能となっている一方、レビュープロセスのボトルネックや人間による概念理解の限界という新たな課題も浮き彫りになっている。
制御層とコストの課題
AI エージェントの制御層はまだ未成熟で、人間による承認が主要な safeguard となっている一方、コストやトークン使用量が開発の野心的さを制限する要因となっている。
生成コードへの懸念と可能性
AI が実験を安価にし生産性を高めた一方で、回答者の 59% は現在の AI 生成コードが長期的な負債を生むことを懸念している。
影響分析・編集コメントを表示
影響分析
この記事は、AI エンジニアリング業界が「自律型ファクトリー」という夢から現実的な技術的・経済的課題へと意識をシフトしている重要な転換点を示しています。完全な自動化への楽観論に対し、制御可能性とコスト効率を重視する声が高まっていることで、今後の AI ツール開発や導入戦略において、より慎重で人間中心のアプローチが主流になると予測されます。
編集コメント
「ループ」を巡るこの議論は、単なる技術論争ではなく、AI エンジニアリングの成熟度がどこにあるかを問う重要な指標です。完全自動化への過度な期待を戒めつつ、人間と AI の協働における新しい役割(制御者としてのエンジニア)を再定義する契機となるでしょう。

AI Engineer World's Fair の最終日のハイライトの一つは、ループ(loop)に関する議論でした。これは会議全体を通じて続いていた議論をうまく捉えたものでした:自律型ソフトウェア工場は現在実現可能なのか、それとも工学的な分野がその野望に追いついていないのか。
Keycard の Allie Howe がモデレーターを務め、冒頭で「ループの背後にある過剰な期待と、実際に現場で機能しているものの間にギャップはあるのか」と問いかけました。
ループ支持派の主張は、Ralph Loop の創設者である Geoffrey Huntley と Keycard の CEO Ian Livingstone によって提示されました。Huntley は冒頭で、ループはすでに存在していると述べ、「それは避けられず、定着するものだ」と付け加え、「私は手書きでコードを書く時代に戻ることはないでしょう」と語りました。
Livingstone は、最終的には検証可能性(verifiability)が重要であると指摘し、いかにして生成されたコードであれ、あらゆるコードでそれを達成できると述べました。また、ループはソフトウェア開発の核心的な側面であり続けてきたとも指摘しました:
「ループは『何かを試す、何かを学ぶ、何かを適用する』というプロセスの中核にあります。私たちが本当に話しているのは、このプロセスをいかに迅速に加速できるかということです。」
懐疑的な立場には、HumanLayer の Dex Horthy と Subroutine の Greg Pstrucha がいました。Horthy はまず、自分がループに反対しているわけではないと指摘しました。「ここで言いたい基本的な点は、ループが良いか悪いかではありません」と彼は述べ、「実際、Kubernetes はループ、つまり制御ループの上に構築されています。しかし、それらは決定論的なループです」と付け加えました。Horthy の問題意識は、「過剰な期待が規律を追い越している」点にあります。
「コーディングを制御するエージェントに対して、抽象化レベルを一段階上げるだけで済む段階に来たという証拠はまだ見ていません」と Horthy は述べました。「むしろ、抽象化レベルを一段階下げる必要があると思います。」
Pstrucha は主に、アジェンシー・ループの経済的持続可能性について懸念を示し、それが持続可能ではないと指摘しました。彼は「より多くのトークンを購入して問題をオーケストレーション(調整)することはできない」と言いました。
「[私たちは] 今や機関車の運転士のようなものです。私たちの仕事は、機関車を線路から外れないように保つことです。」
- Geoffrey Huntley, ループ推進派
Huntley はその後、ループ・マックス(最適化)に対するこの素晴らしい比喩を提示しました。「[私たちは] 今や機関車の運転士のようなものです。私たちの仕事は、機関車を線路から外れないように保つことです。」
議論はソフトウェア工場へと移りました。これは業界に実際に根付いたメタファーです。Horthy は、ファクトリーのようなエージェント環境で全てが自動化されると、「問題に触れる機会が永遠に失われる」と懸念しています。そのため、彼は小さく始めてエージェント・ループで反復することを勧め、「直観を築き上げ」、最初からエンドツーエンドの自動化を試みないよう提言しました。
ハントリーもまた、ループにおけるいくつかの危険性を認識していました。彼はソフトウェア工場は私たちが将来向かっている先であると述べましたが、市場においてまだ解決されていないことにも注意を促しました。「これはフロンティア的な思考です」と彼は言いました。
1 時間にわたる議論の終了後、ハウは聴衆にどちらの側が「勝利した」かを尋ねる投票を行いました。皮肉なことに、これが人的ミスにつながりました。ステージの照明が強すぎて、ハウも討論参加者全員も、どのくらいの手が挙げられたかを確認できなかったのです。もし明かりを調整するエージェントが担当していればよかったのに。
Anthropic の次なる注目すべき取り組み:Claude Tag
おそらくソフトウェア工場モデルへ移行している企業の一例として Anthropic が挙げられます。Web 2.0 時代の Instagram の共同創設者の一人であり、現在は Anthropic でラボ責任者を務めるマイク・クリガーが、朝のセッションの一つで swyx にインタビューされました。
クリガーは先週同社が世界に発表した内部モデル「Claude Tag」について語りました。彼は Tag を、Claude よりも委任型(delegated)、非同期型(asynchronous)、そして能動的(proactive)であると説明しました。これはおそらく、実践における初期のソフトウェア工場がどのようなものかを示唆しているでしょう——エージェントがチームを代替するのではなく、複数の人間が Claude Tag のようなシステムに責任を委譲する形です。

今日 AIEWF で swyx と対話するマイク・クリガー。
「Tag の使用状況について言えば、実際には多くの作業が委任されています」と彼は語りました。チームがエージェントに指示を与える具体例として、「単にバグを修正するだけでなく、このコードベースの一部に対して責任を持ってください。また、このフィードバックチャネルを監視し、積極的にタスクを引き受けてください」と伝えていると説明しました。
「それが現在の私たちの運用方法を大きく変えました」と彼は続けました。「今では、よりマルチプレイヤーで非同期かつ能動的なアプローチになっています」
しかし、彼はある程度自動化が進むことによる負の側面にも言及しました。彼のチームは現在、「レビューにボトルネックが生じている」状態であり、「人間が私たちが何をしているかを完全に概念化できる能力に限界がある」と指摘しています。
2026 年 AI エンジニア調査
さて、大多数の AI エンジニアにとっての現在の現実に戻りましょう。今朝、Amplify の Barr Yaron が業界を対象とした年次調査結果を発表しました。
Amplify のデータによると、回答者の 95% が現在エージェントを使用しており、これは昨年の約 2 倍に相当します。エージェントを導入しているチームのうち 89% は、そのエージェントがデータの作成も可能だと回答しており、前年の 52% から大幅に増加しています。
「エージェントはもはや単なる読み込み、要約、ドラフト作成の段階ではありません」と Yaron は述べました。「彼らはシステム内で実際に行動を起こすようになっています」

AI エンジニアリング調査を発表する Barr Yaron
しかし、制御手段は依然として比較的原始的です。人間の承認と権限が2大セーフガードであり、その後にタスク分解、検索、メモリ管理、サンドボックス化などの散在する技術が続いています。
「エージェントの制御層については誰も決着をつけていません」とヤロン氏は言いました。
コストも懸念事項です。回答者の40%はAIのコストが定期的にAIの利用をどの程度大胆に行うかを制限しているとし、さらに36%は時々そうだと答えています。トークン使用量は現在、品質に次いで2番目に監視されている生産指標となっています。
この調査はカンファレンスの中心的な矛盾を捉えました。AIは実験をより安価にし、チームがより多くのソフトウェアを生産することを可能にしましたが、Amplify 調査への回答者の59%は、今日のAI生成コードが長期的な負債を生み出していることを恐れています。
クロージング基調講演
カンファレンスの最終セッションでは、適切にもう一度AI技術について楽観的に考え、それを使って構築することに戻りました。そもそもAIエンジニア世界博覧会が存在する理由もそこにあるのですし、それが楽しい場所だからです!
テオ・ブラウン氏は、AIを使って構築した、あるいは現在も構築中のいくつかのソフトウェアプロジェクトを紹介しました。彼の主張は、個人の開発者が現実的に挑戦できる規模が変化したという点にあります。「かつてスタートアップだったものが今はサイドプロジェクトになり、かつて『大きすぎる』と却下していたプロジェクトが手の届く範囲になってきています」と彼は述べました。
Y Combinator の会長兼 CEO である Garry Tan は、その楽観主義に組織的な形を与えました。彼によると、YC が目にする最も急速に成長している創業者たちは、「AI をオートコンプリートとして扱わず、労働力として扱っている」そうです。

AIEWF での Garry Tan。
Tan の締めくくりの提言は、「AI を単に利用する企業ではなく、AI ネイティブな企業を構築せよ」というものでした。
今週の議論は、すべての人にとって AI ネイティブなビジョンが実現可能となるまでには、まだ多くのエンジニアリングが残っていることを示しました。しかし、締めくくりの基調講演は、なぜこの会議に参加したエンジニアたちがそれを目指しているのかを思い出させてくれました:彼らは単にその機関車に乗りたいだけなのです!
原文を表示

One of the highlights of the final day of the AI Engineer World’s Fair was a debate about loops. It nicely captured an argument running through the whole conference: are autonomous software factories viable now, or is the engineering discipline lagging behind the ambition?
Allie Howe from Keycard was the moderator and she opened by asking, “is there or is there not a delta between the hype behind loops and what actually works in practice?”
The pro-loop case was presented by Geoffrey Huntley, creator of the Ralph Loop, and Keycard CEO Ian Livingstone. Huntley opened by saying loops are already here. “It’s inevitable, it’s here to stay,” adding that “I don’t see myself going back to writing code by hand.”
Livingstone said that verifiability is ultimately what it’s about — and you can achieve that with any code, regardless of how it was produced. He also pointed out that loops have always been a core aspect of software development:
“A loop is at the core of ‘I try something, I learn something, I apply something.’ And all we’re really talking about is how quickly we can expedite that process.”
On the skeptical side were Dex Horthy from HumanLayer and Greg Pstrucha from Subroutine. Horthy began by noting that he wasn’t anti-loops. “The basic take here is not whether loops are good or bad,” he said, noting that “Kubernetes is actually built on loops — built on control loops. But they’re deterministic loops.” Horthy’s issue is that “the hype is outrunning the discipline.”
“I haven’t seen proof that we are at a point where we can just step up an abstraction level,” Horthy said, referring to agents controlling the coding. “I actually think we need to step down an abstraction level, if anything.”
Pstrucha was mainly concerned about the economic viability of agentic loops, which he said wasn’t sustainable. You can’t “orchestrate your problems away by buying more tokens,” he said.
“[We’re] kind of like locomotive engineers now. That’s our job: to keep the locomotive on the rails.”
- Geoffrey Huntley, loops advocate
Huntley then offered this wonderful analogy for loopmaxxing: “[We’re] kind of like locomotive engineers now. That’s our job: to keep the locomotive on the rails.”
The discussion turned to software factories, the metaphor that has really taken hold of the industry. Horthy worries that when everything is automated in a factory-like agent environment, “you never touch the problem.” So instead, he advises to start small and iterate with agent loops — to “build up intuition” and not try to automate end to end from the start.
Even Huntley recognized some of the dangers in loops. He said that software factories represent where we are headed in the future, but cautioned that it’s not yet solved in the market. “This is frontier thinking,” he said.
At the end of the hour-long debate, Howe polled the audience to ask which side ‘won’. Ironically, this resulted in a human failure: the stage lights were too bright for Howe or any of the debate participants to see how many hands were raised. If only an agent was in charge of dimming the lights.
Anthropic’s next big thing: Claude Tag
Perhaps one example of a company moving to a software factory model is Anthropic. Mike Krieger, one of the co-founders of Instagram back in Web 2.0 and now Head of Labs at Anthropic, was interviewed by swyx in one of the morning sessions.
Krieger talked about Claude Tag, Anthropic’s internal model which the company announced to the world last week. He described Tag as more delegated, asynchronous and proactive than Claude. It perhaps suggests what an early software factory looks like in practice — not agents replacing a team, but multiple people delegating responsibilities to a system like Claude Tag.

Mike Krieger talking with swyx at AIEWF today.
“Most usage is actually much more delegated,” he said regarding his team’s usage of Tag. He gave an example of how they instruct the agents: “Don’t just fix this bug. Now you are responsible for this part of the codebase, and I want you to monitor this feedback channel and proactively take on tasks.”
“That’s really changed how we operate currently,” he continued. “It’s much more this multiplayer, async, proactive way.”
However, he also indicated there are some negative consequences to becoming more automated. He noted that his team is “bottlenecked on reviews” and on the “human ability to fully conceptualize what we’re doing.”
2026 AI Engineer Survey
Back to the current reality for most AI engineers. This morning, Barr Yaron from Amplify presented her annual survey of the industry.
According to Amplify’s data, 95% of respondents now use agents — roughly double last year’s share. Among teams using agents, 89% said those agents could write data, up from 52% the previous year.
“Agents are no longer reading, summarizing, drafting,” Yaron said. “They’re taking actions inside the systems.”

Barr Yaron presenting her AI engineering survey.
The controls, however, remain comparatively primitive. Human approvals and permissions were the two leading safeguards, followed by a scattered collection of task decomposition, retrieval, memory and sandboxing techniques.
“Nobody has settled the control layer for agents,” Yaron said.
Cost is also a concern. Forty percent of respondents said that AI costs regularly limit how ambitiously they use AI, while another 36% said it sometimes does. Token usage is now the second-most monitored production metric, behind quality.
The survey captured the conference’s central contradiction. AI has made experimentation cheaper and enabled teams to produce more software, but 59% of respondents to the Amplify survey fear that today’s AI-generated code is creating long-term liabilities.
Closing keynotes
The final sessions of the conference appropriately took us back to thinking optimistically about AI technology — about building with it. After all, that’s why the AI Engineer World’s Fair exists, and it’s where the fun is!
Theo Browne showcased several software projects he had built, or was still building, with AI. His point was that the scale of what an individual developer can realistically attempt has shifted. “What used to be a startup is now a side project,” he said, while projects he would once have dismissed as “too big” are moving within reach.
Garry Tan, president and CEO of Y Combinator, followed by giving that optimism an organizational form. The fastest-growing founders YC sees, he said, are “not treating AI as autocomplete, they’re treating it as a workforce.”

Garry Tan at AIEWF.
Tan’s closing prescription was: “Build an AI-native company, not a company that just uses AI.”
The debates during the week showed how much engineering remains before the AI-native vision is viable for all. But the closing keynotes offered a reminder of why the engineers who attended this conference are pursuing it: they just want to ride those locomotives!
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み