エンジニア部門における AI 支出削減の傾向について
Uber の経営陣や OpenCode の事例を通じて、AI ツールの導入率向上と実質的なビジネス価値創出の間に明確な相関が見られない現状が浮き彫りになり、多くの企業が AI 予算の見直しを迫られている。
キーポイント
AI 投資対効果の不明確さ
Uber の経営陣は、コードコミットの 25% が AI 由来という数字が素晴らしいとしても、それが「以前却下されていたプロジェクトの実行」や「有用な機能の提供」と直接リンクしていないと指摘している。
予算超過とコスト管理の必要性
Uber の CTO は 2026 年の AI 予算を 3 月中に使い果たす事態となり、トークン消費量と人件費のトレードオフを議論する必要があると表明した。
AI ツール利用コストの可視化
開発者が AI ツールを利用している場合、直接請求が来ないため「無料」だと錯覚しがちだが、実際には組織全体で巨額の費用が発生しており、その対価を支払う必要がある。
業界全体の支出見直しトレンド
OpenCode の創業者は、大企業を中心に AI コストの最適化や安価な推論サービスの需要が急増していることを報告し、全社的な AI 支出の見直しが進行中であると示唆した。
企業におけるAIコスト最適化の急増
大手企業からスタートアップまで、AI利用料金の削減が最優先課題となっており、OpenCode Zenのような安価な推論サービスの需要が爆発的に増加しています。
開発者主体の効率化施策とモデルルーティング
トップティアのエンジニアリングチームは、使用ケースに応じた「スマート」なモデルルーティングや、単純タスクでの安価なモデルへの切り替えを積極的に導入しています。
ボトムアップ型の文化変化と評価制度への影響
経営層からの命令ではなくエンジニア自らがAI効率化の知識共有を行い始めており、将来的にはコスト削減への貢献が昇進や報酬の評価基準に組み込まれる可能性があります。
影響分析・編集コメントを表示
影響分析
この記事は、AI ツールの導入初期段階における「効率化の幻想」から「実質的な経済的検証」への転換点を示唆しており、エンジニアリング組織が単なるツールの導入ではなく、明確なビジネス価値とコスト管理のバランスを迫られている現実を浮き彫りにしています。今後は、AI 予算の配分やツール選定において、ROI(投資対効果)の可視化が経営層の最重要課題となるでしょう。
編集コメント
AI ツールの導入が「魔法の杖」ではないことを示す、実務家による冷静な分析です。エンジニアリングリーダーは、ツールの利用率という表面的な指標ではなく、ビジネス成果への直接的な貢献度を問われる時代へと突入しています。
こんにちは、Pragmatic Engineer ニュースレターの特別無料号をお届けするゲルゲーです。毎号、シニアエンジニアやエンジニアリングリーダーの視点からビッグテックとスタートアップを取り上げています。今回は、2 週間前に発行した『The Pulse』の 4 つのトピックのうち 1 つを扱います。フルサブスクライバーには、この記事を 14 日前にお送りしています。もしこのメールが転送された場合は、こちらから購読できます。
以下の『The Pulse』は興味深いものです。元の記事を送信してからわずか 1 週間後、OpenAI の CEO サム・アルトマンも、一部の企業にとって AI の予算策定が大きな課題であると述べており、この分析結果と一致する見解を示しました。
5 月中旬、Uber の社長であるアンドリュー・マクドナルドは、『Rapid Response podcast』に出演し、ホストのボブ・サフィアンとの対談でライドシェアリング大手について議論しました。その中で、AI から期待された効率化のレバレッジが得られていない点を指摘し、言語学習アプリである Duolingo を例に挙げました。
「先四半期にコードコミットの 25% が AI 駆動だったとか、トークン使用量が従業員の X% から Y% に増えたといった話を企業がしているのを聞くと、これらの数字は素晴らしいと思います。これは社会全体における巨大な変革だ」とマクドナルド氏は語りました。
「しかし、その後シニアエンジニアリングリーダーたちに話を聞いてみると、『カットリスト(保留中のプロジェクト)にあったプロジェクトのうち、生産性向上によって実際に完了ラインに達したものはどれくらいあるのか?』と尋ねたくなります。先四半期にはコードコミットの 25% が Claude Code を通じて行われたのですから。」
AI による生産性向上というリンクは、まだ確立されていません。つまり、暗黙的により多くのものが出荷されている可能性はあるものの、その統計データの一つと、より有用な消費者向け機能との間に明確な線引きを行うのは非常に困難です。
今後数四半期、あるいは数年かけて、それがより明確になるかもしれません。しかし今日においては、基盤となる指標のいくつかが大変な勢いで上昇傾向にあるとしても、依然として難しい状況です。
当社の CTO である Praveen は、インタビューで「2026 年の AI バジェットを 3 月中旬という時期に使い果たしてしまった」と発言したことで話題になりました。今後は、エンジニア組織としてトークン消費量と関連コスト、そして人員数との比較について議論を始め、その上でトレードオフ(取舍)を行っていく必要があります。
ユーザーに対して出荷する有用な機能や機能性の数に直接的な結びつきを示せない場合、AI への支出に関するそのトレードオフを正当化するのはより困難になります。なぜなら AI は無料ではないからです。
単に AI ツールのユーザーとして座っており、興味深いユースケースを思いついているだけで、請求書を支払う立場にない場合、「AI は無料である」という感覚を抱くかもしれません。しかし、誰かがその請求書を支払っているのです」
私の直感では、ほぼすべての企業が、AI コーディングツールから始めとして、AI 支出の劇的な増加について質問を投げかけ始めているか、まもなくそうするようになるでしょう。私は大企業と中小企業の数人の関係者にこれについて話を聞きました:
OpenCode: 支出最適化への顧客需要が急増。昨日、OpenCode の創設者である Dax Raad とのポッドキャストエピソードで、彼は OpenCode のホスト推論サービス(OpenCode Zen)に対する需要がすべての予想を上回ったと語りました。大企業はより安価でありながら依然として能力のある AI モデルを求めているからです。彼は過去 1 ヶ月間で、入ってくる企業の問い合わせのすべてが支出最適化に関するものであることを明らかにしました。つまり、AI 利用料金の増大に対する広範な懸念が存在します。
最先端の AI を活用する企業は、モデルルーティングで決断を下しています。私は2社の最先端テックカンパニーの CTO とエンジニアリング責任者に話を聞きました。彼らもまだ明白な投資対効果(ROI)を達成していません。それでも、最新モデルへのアクセスには「インテリジェンス・プレミアム」を支払うか、出荷されるバグ数を増やすかの二者択一だと感じています。コスト削減のため、両社ともユースケースとプロンプトに基づく「スマート」なモデルルーティングを検討しています。これらの企業は最高水準のエンジニアに市場最高額を支払っているため、同様に最高のツールやモデルへのアクセスを期待されています。
DoorDash: 知識共有セッションの増加と開発者への責任付与。大手フードデリバリーカンパニーである DoorDash は、支出管理の開発者への権限委譲を行っています:全員に高い月間トークン使用制限が設定されています。これを超える場合は理由の説明が必要であり、さらに翌月の効率化計画も共有する必要があります。多くの定期的な社内知識共有セッションは、効率的な AI 利用について行われています。
伝統的な企業:月間利用制限と低性能モデルへのダウングレード。先月、米国の大手退職金積立企業の一人が、全開発者向けの AI 利用ポリシーを更新したと、現職のエンジニアから聞きました。これにより GitHub Copilot のトークン使用量に月間上限が設けられました。上限を超えると、開発者は追加料金がかからないが機能は劣る「0x」モデルを使用しなければなりません。具体的には GPT‑5 mini、GPT‑4.1、および Grok Code Fast 1 です。
スタートアップ:複数の Claude / Codex Max サブスクリプションへの登録。私は、有意義な収益を上げており、高額な API 価格を支払いたくないと考えるいくつかの中小スタートアップ関係者と話しました。そのため、開発者が補助付きの Claude Code Max または Codex Max のサブスクリプションを取得することを慣例化しています。
AI 効率性への新たなボトムアップ型の注目。多くのテック企業では、定期的なチームデモやランチ・アンド・ラーンセッション、エンジニア全員参加の全体会議など、多様な社内知識共有活動を行っています。ここ数ヶ月、トップダウンからの命令ではなく、エンジニア自身から AI 効率性に焦点を当てたセッションが増えていることに気づいています。
エンジニア全体の会議、CTO、さらには CEO もも、増加する AI トークンコストについて懸念を表明し始めました。現在では、より多くのエンジニアが単純なタスクには安価なモデルを使用したり、モデルのルーティングを行ったり、トークンの使用効率を高めたりする実験を行っています。
次回の業績評価や昇進サイクルにおいて、トークンコストの削減に貢献したエンジニアが報奨されるようになるでしょう。それは 2 年前、エンジニアチームがサードパーティベンダーへの請求書節約に対して報奨された時と同じです。
エンジニアにとって、自分の仕事におけるインパクトを示す最良の方法は、それを金銭に換算することです。つまり、生成された収益や削減されたコストです。AI への支出が観測可能性(observability)に対するものと同程度かそれ以上に高い現状において、賢明な最適化によって巨額の節約を実現することは容易であるはずです。皮肉なことに、昇進や給与アップにつながるかもしれないその節約は、実際に支出を急増させた場所から生み出されることになります。
前号の『The Pulse』で完全版をお読みください。あるいは今週の『The Pulse』をチェックしてください:Anthropic の新モデルが競合である Codex の市場シェアを押し上げたのでしょうか?
原文を表示
Hi, this is Gergely with a bonus, free issue of the Pragmatic Engineer Newsletter. In every issue, I cover Big Tech and startups through the lens of senior engineers and engineering leaders. Today, we cover one out of four topics from The Pulse issue from two weeks ago. Full subscribers received the article below fourteen days ago. If you’ve been forwarded this email, you can subscribe here.
The below The Pulse is interesting, as a week after the original was sent it out, OpenAI CEO Sam Altman also said how AI budgeting is a huge issue for some companies – echoing findings from this analysis.
In mid-May, Uber president, Andrew McDonald, was on the Rapid Response podcast for a conversation about the ridesharing giant with host Bob Safian, who raised the lack of hoped-for efficiency leverage from AI, citing the language learning app, Duolingo.
“When you hear companies talking about 25% of code commits over the last quarter were AI-driven, or how their token usage went from X to Y percentage of employees: all these numbers are amazing. I think it’s a massive transformation of society”, McDonald said.
“But, then you go and you talk to your senior engineering leaders, and you’re asking: “how many projects that were “on the cutting room floor” got moved above the line [of being done] because of the productivity gains? Because 25% of our code commits were via Claude Code last quarter.”
That link [of improved productivity thanks to AI] is not there yet. I mean, maybe implicitly there’s more that is getting shipped, but it’s very hard to draw a line between one of those stats and more useful consumer features.
Over the coming quarters and years, maybe that will become clearer. But today it’s hard, even if some of the underlying metrics are trending in a really astronomical direction.
Our CTO, Praveen, went viral because he said in an interview that we had blown through our AI budget for 2026 and it was the middle of March. We’re going to have to start talking about token consumption and the associated cost versus headcount, and making tradesoffs on that as an engineering organization.
If you’re not able to draw a direct line to [how many] useful features and functionality you’re shipping to your users, that tradeoff [on AI spend] becomes harder to justify because AI is not free.
If you’re just a user [of AI tools] sitting there and coming up with interesting use cases, and you don’t pay the bill, it can feel [like AI is free]. But somebody’s paying the bill”.
My hunch is that pretty much every company is starting to, or will do soon, ask questions about the massive growth in AI spend; starting with AI coding tools. I talked with a few folks at larger and smaller companies about it:
OpenCode: customer demand for optimizing spend is spiking. Yesterday, on the podcast episode with OpenCode creator, Dax Raad, he said demand for OpenCode’s hosted inference service (OpenCode Zen) surpassed all expectations because larger companies want cheaper, but still capable, AI models. He revealed that over the past month, every single inbound enterprise request was about optimizing spend. So, there’s some widespread concern about AI bills.
Companies with cutting-edge AI bite the bullet with model routing. I talked with a CTO and a Head of Engineering at two cutting-edge tech companies. They also do not have an obvious return on investment (ROI) as yet. Still, they feel they have no choice but to pay the “intelligence premium” for state-of-the-art models or increase the number of bugs shipped. To reduce costs, both are considering “smart” model routing based on use case and prompt. These places pay top-of-market for the best engineers, so similarly, there are expectations of access to the best tools and models.
DoorDash: More knowledge-sharing sessions and responsibility for devs. The leading food delivery company gives responsibility for spending to devs: everyone has a high monthly token usage limit. To exceed it, you need to justify why, and also share the plan for being more efficient next month. Many regular in-house knowledge-sharing sessions are about efficient AI use.
Traditional company: monthly limits and dumb-model downgrades. One month ago, one of the largest retirement-savings companies in the US updated its AI usage policy for all devs, a current engineer told me, imposing a monthly GitHub Copilot token limit. Once gone, devs must use the less capable “0x” models on Copilot, which are not charged extra: GPT‑5 mini, GPT‑4.1, and Grok Code Fast 1.
Startups: signing up for multiple Claude / Codex Max subscriptions. I talked with several smaller startups that are generating meaningful revenue, and don’t want to pay expensive API prices. So, they’ve made it a practice for devs to get subsidized Claude Code Max or Codex Max subscriptions.
There’s a new bottom-up focus on AI efficiency. Most tech companies do a variety of internal knowledge-sharing things like regular team demos, lunch-and-learn sessions, and engineering all-hands. I’ve been noticing more AI efficiency-focused sessions in the past couple of months, coming from engineers: no top-down mandate!
Engineering all-hands, CTOs, and even CEOs have started to raise concerns about increasing AI token costs, and now more engineers are experimenting with cheaper models for simpler tasks, model routing, more efficient token usage, etc.
I’d expect that during the next performance review and promotion cycles, engineers who helped save on token costs might be rewarded, like two years ago, when engineering teams were rewarded for saving on third-party vendor bills.
For an engineer, the best way to show impact in your work is to translate it to money: revenue generated, or costs saved. With AI spending as high as (or higher than) on observability, it should be straightforward to show massive savings with smart optimizations. There’s a touch of irony in how any savings – for which there might be promotions and pay rises – will come from the places that actually did the rocketing spending.
Read the full issue in the previous The Pulse. Or check out this week's The Pulse: Did Anthropic’s new model just boost rival Codex’s market share?
関連記事
GitHub エージェント型ワークフローにおけるトークン効率の向上
GitHub は、リポジトリのクリーンアップを行うエージェント型ワークフローのコスト削減のため、トークン使用効率を改善する手法を発表した。自動実行される CI ジョブでのコスト蓄積を防ぐ狙いがある。
プレゼンテーション:プラットフォームエンジニアリング:eBay Velocityの台頭と衰退からの教訓
Randy Shoupが、eBayの「Velocity Initiative」について解説し、エンジニアリング生産性を倍増させた技術的プレイブックを共有した。また、ウォーターフォール計画やリスク回避などの組織文化がエンジニアリングの優れた実行を妨げる要因であると指摘した。
The Pulse:Antigravity 2.0 が「IDE」の概念を再定義
Google は本日、主力 AI IDE のフルリデザイン版である Antigravity 2.0 を発表し、開発環境における「IDE」という概念そのものを刷新した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み