苦い教訓対ゴミ箱理論
この記事は、組織が「ゴミ箱モデル」のように非公式で混沌としたプロセスを持つことが多く、これが AI の大規模導入を阻む要因となっていると指摘し、実効的な AI 導入には現場の複雑な実態をマッピングする必要があると説いている。
キーポイント
組織の「ゴミ箱モデル」の実態
多くの組織は戦略と運用が乖離しており、非公式なルールや重複作業、誰も使わないプロセスが存在する混沌とした状態(Garbage Can)にある。
AI 導入の根本的な障壁
従来の自動化は明確なルールを必要とするが、組織にはそれが存在しないため、企業規模での AI 展開が困難である。
現場レベルでの非公式な活用
AI の利用は現在、多くの従業員が個別の課題解決のために非公式に行っているに過ぎず、組織全体としての統合には至っていない。
成功のための具体的なアプローチ
大規模な AI 導入を成功させるには、既存の仮説ではなく、実際の業務プロセスをマッピングし、発見された課題に特化したシステムを構築する必要がある。
人間の知識の限界と計算資源の重要性
AI研究において、人間が長年かけて構築した専門知識や直観をプログラムに埋め込むアプローチは、単純な計算能力の増強と汎用的な機械学習手法に比べて劣る傾向がある。
アルファゼロによる実証
Google の AlphaZero はチェスや将棋、囲碁において事前のゲーム知識を一切持たず、自己対戦を通じて独自に学習することで人類最強の棋士を打ち破り、この法則を実証した。
企業における AI 導入への示唆
企業が AI に人間と同じように組織を理解させることを前提とすると普及は遅れるが、計算資源を増やし AI に自ら問題を解決させる「苦い教訓」の適用次第で状況が変わる可能性がある。
影響分析・編集コメントを表示
影響分析
この記事は、AI 導入の成功を「技術の優劣」ではなく「組織の複雑な実態への理解度」に依存させるという重要な視点を提供します。多くの企業が AI ツールの導入自体を目的化しがちですが、本稿はプロセスの可視化と再設計が先行条件であることを示唆しており、AI 戦略策定における現実的なアプローチの転換を促すものです。
編集コメント
技術的な新機能の紹介ではなく、AI 導入を阻む「人間と組織の構造的問題」に焦点を当てた貴重な洞察です。成功する AI 戦略には、ツール選定よりも先に現場の実態を深く理解するプロセスが必要であることを再認識させられます。
組織論に関する私の好きな学術論文の一つに、ルースアン・フイジングによるものがあり、そこでは自社のプロセスマップを作成するよう割り当てられたチームの物語が語られています。このマップは、原材料から完成品に至るまで、組織が実際に何を行っているかを追跡したものです。このマップを作成する過程で、彼らは仕事の多くがいかに奇妙で計画されていないように見えるか realization しました。誰も使用しない成果物を生み出す全体的なプロセスや、物事を完了させるための奇妙な準公式の経路、そして繰り返される努力の重複を発見したのです。マップ作成に従事していた多くの従業員、かつては会社の有望株だった人々は、幻滅してしまいました。

プロセスマップ
Huising 教授に、その後に何が起こったのか説明させてください。「一部の人は、トップの誰かがこれらの設計と運用上の問題を知っているのではないかと希望を抱いていましたが、彼らはしばしばこの楽観主義を打ち砕かれました。例えば、あるマネージャーが CEO に地図を示しながら歩き回り、彼にこれまで見たことのない視点を提供し、設計の欠如や戦略と運用との断絶を具体的に説明しました。地図の説明を受けた後、CEO は座り込み、机に頭を置き、「これは私が想像していたよりもさらにひどい状態だ」と言いました。CEO は明らかに、自らの組織の運営が自分のコントロールを超えているだけでなく、その把握自体が空想に過ぎないことを示唆したのです。
多くの人にとって、これは驚きではないかもしれません。組織(またはそこで働くこと)を研究することで学ぶことのひとつは、すべての組織が実際には少し混乱しているということです。実は、古典的な組織理論の一つに「ガベージ・カンモデル」というものがあります。このモデルでは、組織を問題、解決策、意思決定者が無秩序に投げ込まれる混沌とした「ゴミ箱」と捉え、意思決定は完全な合理的プロセスを通じてではなく、これらの要素が偶然衝突したときに起こると考えます。もちろん、この見方を極端に受け取ることは容易です。組織には実際に意味を持つ構造や意思決定者、プロセスが存在します。ただ、これらの構造は慎重に設計され詳細に記録されたものというより、人々の中で進化し、交渉によって形成されてきた側面が強いのです。
ガベージ・カン(ゴミ箱)モデルは、暗黙のルールや個別化された知識、複雑で文書化されていないプロセスが重要な役割を果たす世界を象徴しています。この状況こそが、組織における AI 導入を困難にしている要因です。米国労働者の 43% が職場で AI を利用したことがあるという事実がある一方で、彼らは主に非公式な方法で、自分自身の業務課題を解決するためにそれを利用しているに過ぎません。企業全体で AI をスケールさせるのは難しいのです。なぜなら、従来の自動化には明確なルールと定義されたプロセスが必要であり、ガベージ・カン型の組織がまさに欠いているのがこれらの要素だからです。AI と仕事に関するより一般的な課題に対処するには、特定のユースケース向けに AI 搭載システムを慎重に構築し、実際の業務フローをマッピングし、発見された課題を解決するためのツールを開発する必要があります。
これは困難で時間のかかるプロセスであり、企業における AI 導入には時間を要することを示唆しています。少なくとも、AI が私たちと同じように組織を理解する必要があると仮定すれば、そう見えるでしょう。しかし、AI の研究者たちは、こうした前提に関する重要な学びを得ています。
苦い教訓
コンピュータサイエンティストのリチャード・サットン氏は、2019 年の影響力ある論文において「苦い教訓(The Bitter Lesson)」という概念を導入し、AI 研究における一つの傾向を指摘しました。チェスで人間に勝利するといった困難な問題を解決しようとする際、AI 研究者たちは繰り返し、オープニングの手順や局面評価、戦術パターン、終盤データベースの研究などによるエレガントな解法に頼ってきました。プログラマは、センターの支配、早期の駒展開、王の安全確保、通路兵の価値などといった数世紀にわたるチェスの知恵を手作業で設計されたソフトウェアに記述しました。世界最高の人間を破った最初のチェスコンピュータである Deep Blue は、いくつかのチェスの知識を用いていましたが、それに加えて 1 秒間に 2 億局面を検索できるという圧倒的な計算力(brute force)と組み合わせました。2017 年、Google は AlphaZero を発表しました。これはチェスだけでなく将棋や囲碁でも人間に勝利するものでしたが、これらのゲームに関する事前知識は一切持っていませんでした。代わりに、AI モデルは自分自身との対戦を通じて学習し、ゲームをプレイすることでそのルールと戦略を習得しました。チェスのエレガントな知識はすべて無意味であり、純粋な計算力(brute force)に機械学習の汎用的アプローチを加えるだけで、人間を上回ることが可能だったのです。これが「苦い教訓」です。人間の理解を AI に記述化することは、AI に問題解決方法を自ら考えさせること、そして人間よりも優れた結果を出せるまで十分な計算リソースを追加することよりも、往々にして劣る結果をもたらすという教訓です。
なぜこのグラフには2つのバージョンがあるのか?また、なぜわずかに異なるのか?答えは後ほど!
この教訓が苦いのは、人生の経験から築き上げてきた人間の問題理解が、AI を用いて問題を解決する際にそれほど重要ではないことを意味しているからです。何十年にもわたる研究者による人間専門知識を符号化する丁寧な作業は、最終的には単に計算資源を問題に投入するよりも効果的ではありませんでした。私たちはまもなく、「苦い教訓」が労働の世界全体に広く適用されるかどうかを目撃することになるでしょう。
エージェント
個人がチャットボットを利用することから多くの恩恵を得られる一方で、組織内での AI の活用方法に関する興奮の多くは「エージェント」に焦点を当てています。私はこの用語を、目標達成のために自律的な行動を取れる AI システムと定義しています。プロンプトでチャットボットを誘導するのではなく、タスクをエージェントに委任し、それが実行します。しかし、以前の AI システムは組織のあらゆるニーズに対応するには十分ではなく、現実世界にはあまりにも多くの不確実性や混乱が存在します。そのため、1 年前に最初の AI 搭載型教育ゲームを作成した際、限定的なタスクを処理するためにエージェント・システムの各ステップを慎重に設計する必要がありました。AI の自律作業能力が非常に急速に向上しているとはいえ、最も複雑な業務においては依然として人間レベルには遠く、複雑なタスクでは容易に道に迷ってしまいます。

これは 80% の成功閾値におけるものです
エージェントシステムの最先端の例として、Claude を使用し、AI エージェントが実際に実務を遂行できるようにする一連の巧妙なアプローチを採用している Manus を考えてみましょう。Manus チームは、いくつかの興味深いエンジニアリングの要素と非常に精巧なプロンプト設計を含む、エージェント構築のための多くのヒントを共有しています。この投稿を書いている際、私は Manus に「現代のチェスコンピュータから 2025 年までの世界最高のチェスコンピュータと、世界最高位のグランドマスターの ELO を比較する魅力的なグラフが必要だ」と尋ねました。するとシステムは作業を開始しました。まず Manus は必ずToDo リストを作成し、次にデータを収集して複数のファイルを書き出し、私が求めたいくつかの微調整を経て、最終的に上記左側に表示されているグラフ(グラフの周りに枠がない方)を完成させました。

なぜこれらをこの順序で行ったのでしょうか?それは、Manus が手作業で構築され、利用可能な最高の汎用エージェントとなるよう慎重に設計されたからです。そのシステムプロンプトには、数百行にも及ぶ専用テキストが含まれており、そこには ToDo リストの作成方法に関する詳細な指示も含まれています。これは、今日の AI システムとエージェントを連携させるための、苦労して得られた知識を取り入れたものです。
潜在的な問題にお気づきでしょうか?「慎重に作り込まれた」「オーダーメイドの」「苦労して得た知識を組み込んだ」といった表現は、まさに Bitter Lesson が避けるべき作業の典型です。なぜなら、より汎用的な手法によって最終的に無意味なものになってしまうからです。
実は最近の ChatGPT agent のリリースにより、これが可能であるという証拠が現れました(この名前はあまり魅力的ではありませんが、少なくとも明確であり、OpenAI にとって大きな前進です!)。ChatGPT agent は根本的な転換点を示しています。これは作業のプロセスを学習するのではなく、OpenAI は強化学習を用いて、実際の最終成果物に基づいて AI を訓練しました。例えば、人間のように Excel ファイルを作成する方法を教えるのではなく、作成された Excel ファイルの品質を評価し続けることで、AI が開発したあらゆる方法を使って良いファイルを作る方法を学ばせます。
強化学習と慎重な作り込みがどのようにして類似の結果をもたらすかを示すために、私は ChatGPT agent に全く同じチェスのプロンプトを与え、上記右側のグラフを得ました。しかし今回は、やるべきリストも従うスクリプトもなく、エージェントは訓練に基づいて私に最良の出力を提供するために必要な神秘的なコースを自ら描きました。その抜粋が以下にあります:
ただし、外見の違い以外に、2 つのチャートにはいくつかの違いがあることに気づくかもしれません。例えば、Deep Blue のパフォーマンスに対する評価がそれぞれ異なるのは、Deep Blue の ELO が公式に測定されたことがないためです。Manus の評価は基本的な検索に基づいており、私たちは推測的な Reddit の議論を見つけましたが、Deep Research で使用されている強化学習アプローチでトレーニングされた ChatGPT エージェントは、Atlantic 誌の記事などより信頼性の高いソースを複数見つけ出し、その主張を裏付けました。同様に、両方のエージェントに完全に機能する Excel ファイルを作成してグラフを再現するように依頼した際、ChatGPT のバージョンは正常に動作しましたが、Manus のバージョンにはエラーがありました。

ChatGPT エージェントが Manus より優れているかどうかはまだわかりませんが、競合他社よりもはるかに速く成果を上げられる可能性が高いと私は推測しています。Manus を改善するには、より慎重な設計と個別の作業が必要ですが、ChatGPT エージェントを改善するには、単にコンピューターチップを増やし、例題を増やすだけで十分です。「苦い教訓(The Bitter Lesson)」が正しいとすれば、長期的な結果は非常に明確に見えます。しかし、さらに重要なのは、手作業で設計されたエージェントと成果ベースでトレーニングされたエージェントの比較が、組織が AI 導入にどのように取り組むべきかという根本的な問いを投げかけている点です。
ゴミ箱の中のエージェント
これは組織の世界へと私たちを戻します。個人は急速に AI を採用する一方で、企業はまだゴミ箱問題に苦しみ、AI システムを導入する前に数ヶ月をかけて混沌としたプロセスのマッピングを行っています。しかし、それが逆ではないでしょうか?
「苦い教訓」は、企業がどのようにアウトプットを生み出しているかに注目するのをやめ、アウトプットそのものにのみ焦点を当てるようになるかもしれないと示唆しています。良い営業報告書や顧客対話とはどのようなものかを定義し、AI にそれを生成させるように訓練します。AI は組織の混沌の中を独自の道を見つけ出すでしょう;それは人間が進化させた半公式ルートよりも効率的である可能性がありますが、より不透明なものになるかもしれません。「苦い教訓」が支配する世界では、机に顔をうずめている CEO の絶望は誤ったものです。壊れたプロセスすべてを解きほぐすのではなく、成功の定義を示し、AI に混乱の中を進ませるだけで十分です。実は、「苦い教訓」は甘くなるかもしれません:組織に満ち溢れる文書化されていないワークフローや非公式なネットワークは重要ではないのかもしれません。重要なのは、良いアウトプットを見たときにそれが何であるかを知っていることです。
⟦CODE_0⟧
これが真実であれば、ゴミ箱は残ったままですが、競争優位性そのものが再定義される中で、それを整理する必要はなくなります。企業がプロセスの洗練や組織的知識の構築、運用卓越性を通じた競争上の堀を築くために費やした努力は、彼らが思っているほど重要ではない可能性があります。AI エージェントが出力のみから学習できるのであれば、品質を定義し十分な例を提供できるあらゆる組織が、自らのプロセスを理解しているかどうかに関わらず、同様の結果を達成できるかもしれません。
あるいは、ゴミ箱が勝つのかもしれません。つまり、人間の複雑さやそれら messy かつ進化したプロセスは、AI には理解なしにナビゲートするにはあまりにも複雑であるということです。私たちはまもなく、組織が本当にどのような種類の問題なのかを見極めることになります:計算規模に対して屈服するチェスゲームか、それとも根本的にさらに混沌としたものか。どちらの答えに賭けるかはすでに企業が行っており、私たちが実際に何のゲームをプレイしているのかはもうすぐ明らかになるでしょう。
購読する
共有する
原文を表示
One of my favorite academic papers about organizations is by Ruthanne Huising, and it tells the story of teams that were assigned to create process maps of their company, tracing what the organization actually did, from raw materials to finished goods. As they created this map, they realized how much of the work seemed strange and unplanned. They discovered entire processes that produced outputs nobody used, weird semi-official pathways to getting things done, and repeated duplication of efforts. Many of the employees working on the map, once rising stars of the company, became disillusioned.

The Process Map
I’ll let Prof. Huising explain what happened next: “Some held out hope that one or two people at the top knew of these design and operation issues; however, they were often disabused of this optimism. For example, a manager walked the CEO through the map, presenting him with a view he had never seen before and illustrating for him the lack of design and the disconnect between strategy and operations. The CEO, after being walked through the map, sat down, put his head on the table, and said, "This is even more fucked up than I imagined." The CEO revealed that not only was the operation of his organization out of his control but that his grasp on it was imaginary.”
For many people, this may not be a surprise. One thing you learn studying (or working in) organizations is that they are all actually a bit of a mess. In fact, one classic organizational theory is actually called the Garbage Can Model. This views organizations as chaotic "garbage cans" where problems, solutions, and decision-makers are dumped in together, and decisions often happen when these elements collide randomly, rather than through a fully rational process. Of course, it is easy to take this view too far - organizations do have structures, decision-makers, and processes that actually matter. It is just that these structures often evolved and were negotiated among people, rather than being carefully designed and well-recorded.
The Garbage Can represents a world where unwritten rules, bespoke knowledge, and complex and undocumented processes are critical. It is this situation that makes AI adoption in organizations difficult, because even though 43% of American workers have used AI at work, they are mostly doing it in informal ways, solving their own work problems. Scaling AI across the enterprise is hard because traditional automation requires clear rules and defined processes; the very things Garbage Can organizations lack. To address the more general issues of AI and work requires careful building of AI-powered systems for specific use cases, mapping out the real processes and making tools to solve the issues that are discovered.
This is a hard, slow process that suggests enterprise AI adoption will take time. At least, that's how it looks if we assume AI needs to understand our organizations the way we do. But AI researchers have learned something important about these sorts of assumptions.
The Bitter Lesson
Computer scientist Richard Sutton introduced the concept of the Bitter Lesson in an influential 2019 essay where he pointed out a pattern in AI research. Time and again, AI researchers trying to solve a difficult problem, like beating humans in chess, turned to elegant solutions, studying opening moves, positional evaluations, tactical patterns, and endgame databases. Programmers encoded centuries of chess wisdom in hand-crafted software: control the center, develop pieces early, king safety matters, passed pawns are valuable, and so on. Deep Blue, the first chess computer to beat the world’s best human, used some chess knowledge, but combined that with the brute force of being able to search 200 million positions a second. In 2017, Google released AlphaZero, which could beat humans not just in chess but also in shogi and go, and it did it with no prior knowledge of these games at all. Instead, the AI model trained against itself, playing the games until it learned them. All of the elegant knowledge of chess was irrelevant, pure brute force computing combined with generalized approaches to machine learning, was enough to beat them. And that is the Bitter Lesson — encoding human understanding into an AI tends to be worse than just letting the AI figure out how to solve the problem, and adding enough computing power until it can do it better than any human.

Why two versions of this graph? And why are they slightly different? Answers in a bit!
The lesson is bitter because it means that our human understanding of problems built from a lifetime of experience is not that important in solving a problem with AI. Decades of researchers' careful work encoding human expertise was ultimately less effective than just throwing more computation at the problem. We are soon going to see whether the Bitter Lesson applies widely to the world of work.
Agents
While individuals can get a lot of benefits out of using chatbots themselves, a lot of excitement about how to use AI in organizations focuses on agents, a fuzzy term that I define as AI systems capable of taking autonomous action to accomplish a goal. As opposed to guiding a chatbot with prompting, you delegate a task to an agent, and it accomplishes it. However, previous AI systems have not been good enough to handle the full range of organizational needs, there is just too much messiness in the real world. This is why when we created our first AI-powered teaching games a year ago, we had to carefully design each step in the agentic system to handle narrow tasks. And though AI ability to work autonomously is increasing very rapidly, they are still far from human-level on most complicated jobs and are easily led astray on complex tasks.

This is with an 80% success threshold
As an example of the state-of-the art in agentic systems, consider Manus, which uses Claude and a series of clever approaches to make AI agents that can get real work done. The Manus team has shared a lot of tips for building agents, involving some interesting bits of engineering and very elaborate prompt design. When writing this post, I asked Manus: “i need an attractive graph that compares the ELO of the best grandmaster and the ELO of the worlds best chess computer from the first modern chess computer through 2025.” And the system got to work. First, Manus always creates a to-do list, then it gathered data and wrote a number of files and, after some minor adjustments I asked for, finally came up with the graph you can see on the left side above (the one without the box around the graph).

Why did it do these things in this order? Because Manus was built by hand, carefully crafted to be the best general purpose agent available. There are hundreds of lines of bespoke text in its system prompts, including detailed instructions about how to build a to-do list. It incorporates hard-won knowledge on how to make agents work with today’s AI systems.
Do you see the potential problem? “Carefully crafted,” “bespoke,” “incorporates hard-won knowledge” — exactly the kind of work the Bitter Lesson tells us to avoid because it will eventually be made irrelevant by more general-purpose techniques.
It turns out there is now evidence that this may be possible with the recent release of ChatGPT agent (an uninspiring name, but at least it is clear, a big step forward for OpenAI!). ChatGPT agent represents a fundamental shift. It is not trained on the process of doing work; instead, OpenAI used reinforcement learning to train their AI on the actual final outcomes. For example. they may not teach it how to create an Excel file the way a human would, they would simply rate the quality of the Excel files it creates until it learns to make a good one, using whatever methods the AI develops. To illustrate how reinforcement learning and careful crafting lead to similar outcomes, I gave the exact same chess prompt to ChatGPT agent and got the graph on the right above. But this time there was no to-do list, no script to follow, instead the agent charted whatever mysterious course was required to get me the best output it could, according to its training. You can see an excerpt of that below:
But you might notice a few differences between the two charts, besides their appearance. For example, each has different ratings for Deep Blue’s performance because the ELO for Deep Blue was never officially measured. The rating from Manus was based off a basic search, we found a speculative Reddit discussion, while the ChatGPT agent, trained with the reinforcement learning approaches used in Deep Research, turned up more credible sources, including an Atlantic article, to back up its claim. In a similar way, when I asked both agents to re-create the graph by making a fully functional Excel file, ChatGPT’s version worked, while Manus’s had errors.

I don’t know if ChatGPT agent is better than Manus yet, but I suspect that it is far more likely to make gains faster than its competitor. To improve Manus will involve more careful crafting and bespoke work, to improve ChatGPT agents simply requires more computer chips and more examples. If the Bitter Lesson holds, the long-term outcome seems pretty clear. But more critically, the comparison between hand-crafted and outcome-trained agents points to a fundamental question about how organizations should approach AI adoption.
Agents in the Garbage Can
This returns us to the world of organizations. While individuals rapidly adopt AI, companies still struggle with the Garbage Can problem, spending months mapping their chaotic processes before deploying any AI system. But what if that's backwards?
The Bitter Lesson suggests we might soon ignore how companies produce outputs and focus only on the outputs themselves. Define what a good sales report or customer interaction looks like, then train AI to produce it. The AI will find its own paths through the organizational chaos; paths that might be more efficient, if more opaque, than the semi-official routes humans evolved. In a world where the Bitter Lesson holds, the despair of the CEO with his head on the table is misplaced. Instead of untangling every broken process, he just needs to define success and let AI navigate the mess. In fact, Bitter Lesson might actually be sweet: all those undocumented workflows and informal networks that pervade organizations might not matter. What matters is knowing good output when you see it.
If this is true, the Garbage Can remains, but we no longer need to sort through it while competitive advantage itself gets redefined. The effort companies spent refining processes, building institutional knowledge, and creating competitive moats through operational excellence might matter less than they think. If AI agents can train on outputs alone, any organization that can define quality and provide enough examples might achieve similar results, whether they understand their own processes or not.
Or it might be that the Garbage Can wins, that human complexity and those messy, evolved processes are too intricate for AI to navigate without understanding them. We're about to find out which kind of problem organizations really are: chess games that yield to computational scale, or something fundamentally messier. The companies betting on either answer are already making their moves, and we will soon get to learn what game we're actually playing.
Subscribe now
Share
関連記事
Meta の AI 追いつきへの試みを探る
マーク・ザッカーバーグは、28 歳のスタートアップ創業者アレクサンダー・ワンを起用し、1.5 兆ドル規模の Meta が「Muse Spark」という信頼性の高い AI モデルを開発した。
AI エージェントのボトルネックはモデル性能ではなく権限管理である(3 分読了)
エンタープライズ AI エージェントの停滞はモデル性能の問題ではなく、権限付与が原因である。ワークデイ社は既存のシステム記録をガバナンス層として活用する解決策を提示している。
CEO は AI に憑かれているか?Box 創業者アロン・レヴィーは「大半がそう」と指摘
Box の創業者アロン・レヴィー氏は、AI が人間の仕事を代替できると判断する経営層ほど、実際の業務内容を理解していないとし、これを「AI 精神病」と呼んだ。同氏は、ClickUp が AI エージェント導入を理由に従業員の22%を解雇した事例などを挙げている。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み