92.6%の開発者が月次でAIコーディングアシスタントを利用するも、週間節約時間はわずか4時間
AIコーディングツールの採用率は92.6%に達するが、時間節約効果は週4時間で頭打ち。組織の運用次第で事故率が半減または倍増するという調査結果。
キーポイント
AIコーディングアシスタントの月間利用者は92.6%と高いが、週あたりの時間節約効果は約4時間で頭打ち状態
AI生成コードの本番環境採用率は26.9%に達し、前四半期比で約5ポイント増加
AIは新人開発者のオンボーディング期間を半減させ、その効果は2年間持続する可能性がある
MIT研究によると、95%の企業AIプロジェクトは測定可能な財務的影響を生み出せていない
AIは組織のシステム問題を解決するものではなく、むしろ既存の問題を増幅する可能性がある
影響分析・編集コメントを表示
影響分析
この記事は、AIコーディングツールの普及が必ずしも組織全体の生産性向上に直結しない現実をデータで示している。特に、個人レベルの時間節約効果が限定的である一方、新人育成における効果が顕著である点は、AI導入戦略の見直しを迫る重要な示唆となる。組織変革を伴わないAI導入の限界が明確になり、ツール活用から組織改革への転換点を示す内容である。
編集コメント
AIツールの導入効果が個人レベルで頭打ちになる中、組織全体の変革こそが次のブレークスルーを生むという重要な転換点を示すデータ。新人育成効果の持続性は、人材戦略におけるAI活用の新たな可能性を提示している。
See all postsPublished on 2026-02-2592.6% 开发者每月使用 AI 编码助手,但每周节省时间只有 4 小时
Laura Tacho 是 DX 公司 CTO,Core 4 开发者生产力框架的联合作者,手里握着 12 万开发者、450 多家公司的真实数据。2 月 11 日在旧金山 Pragmatic Summit 上,她做了一场 30 分钟的主题演讲,用最新行业基准数据回答一个问题:AI 到底有没有让组织变好?

【注:Pragmatic Summit 是 The Pragmatic Engineer 创始人 Gergely Orosz 于 2026 年 2 月举办的首届线下峰会,约 500 名工程领导者参加。DX 是一家帮助企业度量和改善工程效率的开发者体验平台公司。】

原始视频链接:https://www.youtube.com/watch?v=LOHgRw43fFk
12.1 万开发者样本显示,92.6% 每月使用 AI 编码助手,但每周节省时间稳定在约 4 小时,连续几个季度没有增长
AI 编写并合并到生产环境的代码占比达 26.9%,较上季度的 22% 显著提升,日活用户突破 30%
AI 是放大器:有些公司客户端事故减少了 50%,有些公司事故翻了一倍。同样的工具,不同的结果
MIT 研究结论:“高采用率、低转化率”。92% 的开发者在用 AI,但组织层面的真正变革很少发生
95% 的企业级 AI 项目无法产生可衡量的财务影响(MIT 研究数据)
入职时间减半可能是 AI 目前影响最深远的效果:第 10 个 PR 的表现能预测未来两年的产出,AI 让达到这个里程碑的时间缩短了一半
Agent 间共识将是 2026 年需要解决的重大问题
Martin Fowler 闭门研讨会的核心判断:AI 不解决组织系统问题,除非你先承认系统问题的存在
【1】12 万开发者的最新数据:92% 在用,但时间节省卡在 4 小时
Laura 带来了一组首次公开的行业基准数据。样本量是 121,502 名开发者,覆盖 464 家公司,数据采集时间从 2025 年 11 月到 2026 年 2 月 1 日。

先看采用率:92.6% 的开发者每月至少使用一次 AI 编码助手。其中 44.1% 每天使用,30.3% 每周使用,18.2% 每月使用,只有 0.8% 从来不用。这里的“AI 编码助手”,大部分开发者将其定义为 Cursor、Codex、Copilot、Claude 这类工具,不一定包括 ChatGPT。

次に時間節約について見てみましょう。95,301 名の開発者を対象としたサンプルにおいて、AI ツールによって週あたり約 4.08 時間の節約が自己報告されています。使用頻度別に細分化すると、毎日使用する層が最も多く(週あたり約 4.8 時間)、週に 1 回使用する層は約 4 時間、月に 1 回使用する層は約 3.6 時間です。この数値は 2025 年第 2 四半期(Q2)とほぼ同水準で、第 4 四半期(Q4)の 3.67 時間も近い値であり、常に 4 時間前後で推移しています。Google が 2025 年に発表した研究では生産性の向上が約 10% と推定されていますが、DX のデータはこの規模をほぼ裏付けています。
しかし、この数値はツールの迭代(バージョンアップ)に伴って顕著に増加していません。モデルが強力になりツールが改善される中、週あたりの節約時間は 4 時間付近で頭打ちになっています。Laura はその理由について言及していませんが、データ自体が一つのシグナルを示しています:コーディングタスクの加速のみを最適化することによる余地は、すでに天井に近づいている可能性があります。

最も変化が著しい指標は、AI によって記述されたコード(AI authored code)の割合です。42,644 名の開発者を対象としたサンプルでは、生産環境で実際に使用されるコードの 26.9% が AI によって作成されており、大幅な修正を施さずにコードレビューを通過し、そのまま本番環境へデプロイされています。前四半期は 22% でしたから、四半期対比で約 5 ポイント増加しています。AI を毎日使用する開発者においては、この割合がすでに 30% を突破しています。
【2】AI が新人のオンボーディング時間を半分にし、その効果は 2 年間にわたって持続する
Laura は常に直感的に感じていました:AI はオンボーディング(入社研修・業務習熟プロセス)における強力なツールとなり、新人がより早くプロジェクトの情報に触れるのを助けるだろうと。彼女はデータを用いてこの直感を検証しました。

2024 年 1 月以降に入社した開発者 35,594 名を対象としたサンプルにおいて、2024 年第 1 四半期(Q1)から 2025 年第 4 四半期(Q4)にかけて、オンボーディングにかかる時間が半分になりました。衡量基準は「10 番目のマージされた PR に到達するまでの日数」です。これは業界で広く認知されているオンボーディングのマイルストーンです。グラフを見ると、2024 年 Q1 では約 100 日かかっていましたが、2025 年 Q4 には 50 日を切るまで短縮されています。この曲線と AI の利用率が上昇する曲線を重ね合わせると、その動きは非常に高い相関を示しています。
【注:PR(Pull Request)とは、開発者がプロジェクトへコード変更を提出するための標準的なプロセスです。10 番目の PR は通常、開発者がすでに複数の有意義なコード貢献を独立して完了したことを意味し、「実際に業務に慣れた」状態を測るための一般的な指標として用いられます。】
Microsoft には関連する研究があります。SPACE フレームワークの共同著者である Brian Houck 氏は、開発者が 10 番目の PR を提出した時点でのパフォーマンスレベルが、その人物の今後 2 年間の生産性パターンを予測できることを発見しました。単に「オンボーディングが早い人はその後もしばらく速い」という話ではなく、10 番目の PR そのものが将来のパフォーマンスを示す予測シグナルとなるのです。
【注:SPACE フレームワークとは、2021 年に Nicole Forsgren 氏らによって提唱された開発者の生産性を測定するフレームワークであり、満足度(Satisfaction)、パフォーマンス(Performance)、活動量(Activity)、コミュニケーションと協働(Communication & Collaboration)、効率性(Efficiency)の 5 つの次元をカバーしています。業界で広く採用されています。】
論理の連鎖は以下の通りです:AI が新人をより速く 10 番目の PR に到達させる → 10 番目の PR は今後 2 年間のパフォーマンスを予測する → オンボーディングの加速効果は最大 2 年間にわたって拡大し続ける可能性がある。この推論が正しいとすれば、オンボーディングの加速こそが AI が組織にもたらす最も大きな単一の効果となるでしょう。
Laura はさらに、これは新入社員の会社だけでなく、プロジェクトを転換するエンジニアや非エンジニアにも当てはまると補足しました。AI はコードベースを理解するための認知のハードルを下げました。過去には新人が大型プロジェクトに参加して既存のコード構造を理解するのに数週間かかることがありましたが、現在は AI に直接質問することができます。
【3】平均値は欺瞞的:ある企業では事故が半分になり、別の企業では倍増した
Laura は業界の平均値を示した後、話題を転換しました。
平均値は典型的な体験を意味するものではなく、あなたに起こることを意味するものではありません。("Average does not mean typical, it does not mean what is going to happen to you.")

彼女は大爆発に例えました。AI が組織に導入されるのは大爆発のようであり、莫大なエネルギーを解放しますが、衝撃波は異なる組織を全く異なる方向へと押しやります。組織のパフォーマンスは多次元的であり、AI は加速器および増幅器として、これらの次元における差異をますます拡大させています。


品質の次元において、格差が最も大きいです。67,084 人の開発者を対象としたサンプルでは、ある企業のクライアントサイドでの事故が増加し倍増した一方で、同じ期間中に別の企業では事故が 50% 減少しました。
もともと機能不全に陥っていた組織は、さらに機能不全に陥っています。しかも、より速いスピードでです。("Organizations that were dysfunctional already, now they're more dysfunctional. They're dysfunctional and dysfunctional faster.")
すでに健全なシステムを持つ企業では、AI がその強みを増幅し、より高速かつ高品質で、変更に対する自信を高めることを可能にしました。一方、もともと問題を抱えていた企業では、AI が問題を拡大させ、事故を増やし、コードを誤った場所に速やかにデプロイしてしまいます。
AI は薬ではなく、増幅器です。良いものはより良くなり、悪いものはより悪くなります。
【4】92% が利用中だが、組織の転換率は極めて低い
Laura は MIT が 2025 年 7 月に発表した研究『The GenAI Divide: State of AI in Business 2025』を引用しました。この研究は 152 の組織を対象に調査を行い、現在の業界が「高い採用率と低い転換率」の状態にあるという結論に至りました。
【注:本調査は MIT の Project NANDA チームによって発表され、52 回の経営陣へのインタビュー、153 件の経営層向けアンケート、および 300 を超える公開 AI プロジェクトの分析に基づいています。】

PPT のグラフによると、80% の組織が汎用大規模言語モデルの調査を行いましたが、パイロット段階に進んだのは 50% に過ぎず、最終的に成功裏に実施されたのはわずか 40% です。組み込み型やタスク特化型の GenAI(生成 AI)に至ってはさらに悲惨で、60% の組織が調査から 20% がパイロット、そして 5% しか成功裏の実装に至らず、漏斗は極めて急峻です。パイロットから生産環境へ、そして利益へと至る各段階において、多くの組織が脱落しています。
この背景には、Laura が見出した一つの法則があります。かつてクラウド移行を放棄した組織や、アジャイル移行を放棄した組織が、今では AI 移行も放棄しているという事実です。移行には組織が自らの問題に直面することが必要であり、そのこと自体が不快感をもたらします。
採用(Adoption)は影響(Impact)を意味しません。("Adoption doesn't mean impact.")
Laura の PPT では MIT の言葉が引用されています:「これらのツールは主に個人の生産性を向上させるものであり、損益計算書(P&L)のパフォーマンスを改善するものではありません。」AI が単に個人がコンピュータの前でコードを書く工程を加速するためにのみ使用される場合、生産性向上の天井は低くなります。組織レベルでの成果を得るためには、コーディングタスクのレベルにとどまらず、組織全体という視点で AI の応用を考える必要があります。
MIT の研究はまた、あるミスマッチも明らかにしました:AI 予算の 50% 以上が販売およびマーケティングツールに投じられていますが、最も高い ROI(投資対効果)をもたらすのは、バックオフィス自動化、例えばアウトソーシングの削減や代理費用の減少などです。専門ベンダーのツールを購入した場合の成功率は約 67% ですが、自社で内部構築する場合の成功率はわずか 3 分の 1 です。
また急速に拡大している「シャドウ AI(Shadow AI)経済」もあります:公式の LLM(大規模言語モデル)サブスクリプションを購入したのは企業の 40% に過ぎませんが、90% 以上の企業で従業員が業務中に個人的な AI ツールを定期的に使用しています。

PPT には直接、3 つのステップが列挙されています:「1. AI で実験する → 2. ??? → 3. 利益!」。この中間にある「???」こそが真に困難な部分であり、それは組織変革管理(Organizational Change Management)と呼ばれます。
【5】Agentic ワークフローが拡張する可能性の限界

Laura は、Agentic ワークフロー(自律型ワークフロー)の台頭を宇宙の膨張に例えました:私たちの宇宙は拡大しており、過熱した議論も増え続けていますが、可能性もまた広がっています。

彼女は、1969 年の人々が月面植民地に対して抱いた幻想と、2026 年の Gas Town を対比させています。

Gas Town は実験的な AI プログラミングツールであり、PPT の挿絵には「Vibe Coding Floor: Throughput Over Precision」(感覚プログラミング车间:精度よりもスループットを優先)と記されています。そこでは一群のカワウソが混乱した工場内で、「Features(機能)」、「Bugs(バグ)」、「Reviews(レビュー)」と書かれた桶を運んでいます。

Laura は Gas Town を「完全に狂気じみている」と表現し、PPT にはいくつかの使用上の警告を列挙しました。「もし同時に少なくとも 5 つの Claude Code を実行できないなら、Gas Town は使うべきではない」「もしお金を気にするなら、Gas Town は使うべきではない」「Gas Town は使うべきではない」です。
【注:Gas Town は Steve Yegge が開発した実験的な AI プログラミング代理ツールであり、複数の AI コーディングエージェントを並列実行してタスクを完了させることで、過激な自律性と極めて高いトークン消費量で知られています。】

これらのツールは構築をより面白くしますが、Laura は冷静です。彼女がネイルサロンで AI を使ってネイルポリッシュの配色アプリを作るのと、多国籍銀行が AI で収益構造を変えるのは全く異なることだと指摘します。彼女は月面着陸に例えました:私たちはまだ月に住んでいませんが、宇宙探査はサングラス、バーコード、クォーツ時計をもたらしました。実験と探索自体に価値があり、Agent(自律型エージェント)もまた、私たちが何ができるか、どのように行うか、誰のために作るかの境界を拡張しているのです。

Agentic(自律型エージェント)の使用に関する具体的なデータは、より小規模なサンプルから得られたものです:先行する 6 社の 2,920 名の開発者です。これらの企業では、50.5% が毎日 agentic ワークフローを使用し、30.2% が週に一度、11.7% が月に一度使用しています。Laura は注意を促します:これらの企業は業界の最前線にあり、すでに agentic ワークフローのためにテレメトリー(telemetry:遠隔計測・監視データ収集技術)を導入しているため、業界全体の平均水準を代表するものではありません。

Codex について、Laura は以下のデータを共有しました:Codex デスクトップ版は 2 月 2 日のリリースから一週間以内にダウンロード数が 100 万を超え、先週ユーザー数は 60% 増加しました。OpenAI 内部では毎週数兆トークンを処理しており、OpenAI の開発者の 95% が Codex を使用しています。先週木曜日(約 2 月 6 日)には GPT 5.3 Codex もリリースされました。Codex を使用する開発者は、他の AI ツールを使用する開発者に比べて、毎週の PR(Pull Request:コード変更の取り込み要求)提出数が約 60% 多くなります。
【注:Codex デスクトップアプリは OpenAI が 2026 年 2 月にリリースした Mac 向けの AI コーディングツールで、複数の AI エージェントを並列実行してタスクを処理できます。GPT-5.3-Codex はその基盤となるモデルです。これらのデータは OpenAI の公式発表に基づくものであり、利害関係が存在します。】
Laura はこの数字に対して慎重な態度を示しました:これは一つのデータポイントに過ぎず唯一のものではありませんが、agentic ワークフローには非常に高い上限があることを示唆しています。
【6】企業実戦:Haven 医療、Cisco、JP Morgan

ローラ氏は、AI 業界ではない企業として、サンフランシスコに拠点を置く頭痛・片頭痛専門のバーチャル遠隔医療スタートアップ「Haven Headache and Migraine Center」を紹介しました。Haven の核心的な課題は非常に素朴なものでした。「Zoom を通じて頭痛の問題を解決できるか?」という点です。その答えはイエスでした。
医療分野において、ローラ氏は重要な区別を強調しました。それは AI によって生成されたコードが「耐久性のあるコード(durable code)」なのか、「使い捨てのコード(disposable code)」なのかという違いです。Haven は医療現場における小規模スタートアップとして、両方のケースに対応しています。
開発面では、Haven は Ralph loops を活用して、新しい患者ポータルのプロトタイプを迅速に構築しました。プレゼンテーション資料には、完全なワークフローの連鎖が示されています:(Linear + Figma) → PRD(製品要件定義)→ JSON → Claude Code。その成果物は使い捨てのゴミのようなコードではなく、高品質なプロトタイプであり、反復速度はより速く、ドキュメントも明確になっています。
臨床面では、Haven は HIPAA(米国医療プライバシー法規)に準拠したモデルを訓練し、数十万件の過去の患者メッセージを処理しています。このモデルはメッセージの分類、ルーティング、およびワークフロー自動化を担当します:薬の継続が必要か、それともフォローアップ予約が必要かを判断するのです。その結果、顧客満足度は業界平均の 3 倍に達し、患者の頭痛の日数と重症度には実質的な低下が見られました。

大企業も動き出しています。Cisco には毎日 18,000 人のエンジニアが Codex を使用しており、主に複雑なコードの移行とコードレビューに活用されています。その結果、コードレビューにかける時間は 50% 削減されました。JP Morgan Chase は MAFA(Multi-Agent Framework for Annotation:多智能体注釈フレームワーク)に関する論文を発表しました。これは、複数の専門化されたエージェントが顧客インタラクションデータ(意図、エンティティ、FAQ 分類など)を独立して注釈付けし、その後、「審判者エージェント」がコンセンサスと信頼度スコアに基づいて結果を集約・再順序付けるという仕組みです。
ローラ氏は予測しました。2026 年に解決すべき重大な技術課題の一つは、エージェント間の合意形成(consensus among agents)になるとのことです。これは分散システムにおける合意問題の流れを汲むものですが、AI エージェントの文脈においては全く新しい挑戦となります:複数のエージェントがそれぞれ異なる「判断」を下した際に、どのようにして合意に至るかという問いです。
【7】マーティン・ファウラーによるクローズドカンファレンス:「AI は組織の問題を解決しない」
2026 年 2 月 1 日から 3 日にかけて、ローラ氏はマーティン・ファウラーと Thoughtworks が主催する「ソフトウェア開発の未来」と題されたクローズドカンファレンスに招待され、ユタ州の鹿谷で開催されました。この場所が選ばれたのには歴史的な意義があります。2001 年 2 月、アジャイル宣言はまさにユタ州のスノー・バードスキーリゾートで誕生したからです。それから 25 年後、同じ州の山々で一群の人々が集まり、AI 時代のソフトウェア開発について議論しました。参加者には、エクストリームプログラミング(XP)の創始者であるケント・ベック氏や、Gas Town の開発者であるスティーブ・イェッゲ氏、ゲルゲー・オロシュ氏などが含まれています。
【注:マーティン・ファウラーは Thoughtworks のチーフサイエンティストであり、『リファクタリング』の著者、そして 2001 年のアジャイル宣言の 17 名の署名者の一人です。ケント・ベック氏はエクストリームプログラミング(XP)の創始者であり、同様にアジャイル宣言の署名者です。】
1 日半の議論は、エージェントをどのように責任を持って、倫理的かつ持続可能に使用するかという一つの話題に集中しました。会場には多くの実験が行われており(Steve Yegge が Gas Town をプレイ中)、雰囲気も活発でした。しかし、最終的な結論は意外にも冷静なものでした。
AI は組織のシステム上の問題を解決するものではありません。あなたが能動的に AI をシステム上の問題に応用した場合にのみ、それは効果を発揮します。その前提として、まずシステム上の問題が存在することを認める必要があります。
Kent Beck はソフトウェア業界における過去 30 年間のあらゆる「銀弾」への約束を目撃し、Steve Yegge は Google と Amazon で大規模なエンジニアリング組織の現実を経験し、Laura は 450 社にまたがる実データを持っています。三人は異なる角度から同じ事柄を見ています。

PPT には、Laura とある参加者の写真が掲載されており、隣には付箋で埋め尽くされたディスカッションボードがあります。議題には生産性の測定やプログラミング言語の未来などが含まれています。Laura は、彼女と Kent Beck、Steve Yegge が会議の合間の廊下で話し合い、以下のような結論を導き出したと話しました。

組織は、人間とシステムレベルの問題によって制約されています。これらの人間とシステムレベルの制約を先に解決することなくして組織のパフォーマンスを改善できるとする技術の約束に対して、私たちは懐疑的な立場を貫きます。私たちは懐疑的であり続け、また人間であり続けます。
(「Organizations are constrained by human and systems-level problems. We remain skeptical of the promise of any technology to improve organizational performance without first addressing human and systems-level constraints. We remain skeptical and we remain human." — Kent Beck, Laura Tacho, and Steve Yegge)

Laura は宇宙を例に議論を収束させました。PPT には、火星で渋滞している様子を描いた漫画が展示されています。火星の表面はゴミや廃棄された衛星、そして長蛇の列を作る車で溢れ、遠くの空には地球が見えています。
システムレベルの問題に対処しなければ、私たちはそれらをすべて宇宙に持ち込んでしまうだけです。(「If we don't address the systems level problems, we will just take them to space with us.")
Martin Fowler に、新しい宣言を書くべきではないかという質問が投げかけられました。Fowler の答えは、「いいえ、まだ早いです」でした。人々はまだアイデアを実験している段階だと彼は述べました。彼自身は宣言そのものにはあまり関心がないとし、多くの宣言は大多数の人々によって賢明にも無視されていると指摘しました。ただし、アジャイル宣言(Agile Manifesto)だけが偶然にも例外だったのだそうです。
【8】AI 競争に勝利した組織が正しく行った四つのこと
ワークショップと膨大なデータ分析に基づき、Laura は彼女が繰り返し目にしてきた成功のパターンを四つまとめました。
第一,有目标,有度量。 “撒网祈祷”(spray and pray)不奏效,就是给所有开发者发 AI 工具许可证,然后祈祷好事发生。Laura 说她有大量证据证明这行不通。赢的组织会把 AI 创新对准一个具体问题,设定可衡量的目标,然后跟踪进展。

为此她和 DX CEO Abi Noda 联合发布了一个 AI 度量框架:
第一层“利用率”:AI 工具的日活/周活、AI 辅助 PR(Pull Request)的比例、AI 生成代码的比例、分配给 Agent(エージェント)的任务数
第二层“影响”:AI 节省的时间、开发者满意度、DX Core 4 指标(PR 吞吐量、交付感知速率、开发者体验指数、コードの保守性、変更への自信度、変更失敗率),以及 Agent 完成的人类等效工时(HEH: Human Equivalent Hours)
第三层“成本”:AI 总支出和人均支出、每个开发者的净时间收益(時間節約から AI に要した時間を差し引いたもの)、Agent 時薪率(HEH / AI 支出)
她同时推荐了两个 AI 就绪度模型。一个是 DORA AI Capabilities Model,包含七项能力维度:清晰传达的 AI 立场、小批量工作、健康的数据生态、以用户为中心、AI 可访问的内部数据、高质量的内部平台、强版本控制实践。另一个是 Thoughtworks の FOREST フレームワーク,包含六个维度:基础架构、运营模型、データ準備度、信頼できる AI、人間と機械の協働体験、戦略的整合。
【注:DORA(DevOps Research and Assessment)は Google Cloud 傘下の研究チームで、年次 DevOps レポートで知られています。】
第二,开发者体验比以往任何时候都更重要。
把你原来要跟领导层谈的“开发者体验”改名叫“智能体体验”,你就能拿到预算了。(“Just call it agent experience and you'll get money for it.”)
好的反馈循环、清晰的服务定义、完善的文档、快速的 CI(継続的インテグレーション),这些开发者体验的基本功,喊了几十年,一直拿不到预算。到了 AI 时代,同样的东西换了个名字,管理层突然愿意投资了。因为好的测试实践、好的文档,恰恰是 agentic 工作流能跑起来的基础。
我们为开发者体验呼吁了几十年,一直在为几毛钱乞讨。不愿意为人类工程师花这个钱,但为机器人工程师花钱就没问题了。这让人有点心寒,但策略上,抓住这个机会。(“We have been screaming about this for decades... It is disheartening that we didn't want to spend the money when it came to human engineers but when it comes to robot engineers we're okay with it.”)

PPT には、134,085 名のエンジニアを対象とした調査結果のグラフが表示されており、各ワークフロー段階が開発者の時間に対して与える影響を年次換算で分布させています。最も上位に位置するのは「会議集中日」と「中断頻度」であり、これらは「AI による時間節約」を大きく上回っています。その後に続くのは、ビルドとテストの待ち時間、開発環境の煩雑さ、レビュー待ち時間、コード理解、情報検索です。
AI がもたらす週4時間の節約では、悪質な会議文化や頻発する中断を補うことはできません。成功している組織は、AI を用いてコーディングを加速させるのではなく、AI の焦点をこれらのシステム課題そのものに向けます。具体的には、AI を活用して会議を減らし、CI(継続的インテグレーション)の待ち時間を最適化し、開発環境における反復作業を削減することです。
第三に、AI は個人の問題ではなく組織の問題として捉えるべきです。
収益、損益計算書、市場投入期間といった組織レベルでの成果を得たいのであれば、AI の活用について組織全体で考える必要があります。AI は価値流全体にわたるワークフローを跨いで機能するものです。

MIT の研究は、組織レベルでの AI 導入における障壁のランキングを示しています。
上位3位はいずれも技術的な問題ではありません。Laura はある現象を指摘しました:経営陣が「AI を導入しよう」と言う一方で
原文を表示
See all postsPublished on 2026-02-2592.6% 开发者每月使用 AI 编码助手,但每周节省时间只有 4 小时
Laura Tacho 是 DX 公司 CTO,Core 4 开发者生产力框架的联合作者,手里握着 12 万开发者、450 多家公司的真实数据。2 月 11 日在旧金山 Pragmatic Summit 上,她做了一场 30 分钟的主题演讲,用最新行业基准数据回答一个问题:AI 到底有没有让组织变好?

【注:Pragmatic Summit 是 The Pragmatic Engineer 创始人 Gergely Orosz 于 2026 年 2 月举办的首届线下峰会,约 500 名工程领导者参加。DX 是一家帮助企业度量和改善工程效率的开发者体验平台公司。】

原始视频链接:https://www.youtube.com/watch?v=LOHgRw43fFk
12.1 万开发者样本显示,92.6% 每月使用 AI 编码助手,但每周节省时间稳定在约 4 小时,连续几个季度没有增长
AI 编写并合并到生产环境的代码占比达 26.9%,较上季度的 22% 显著提升,日活用户突破 30%
AI 是放大器:有些公司客户端事故减少了 50%,有些公司事故翻了一倍。同样的工具,不同的结果
MIT 研究结论:“高采用率、低转化率”。92% 的开发者在用 AI,但组织层面的真正变革很少发生
95% 的企业级 AI 项目无法产生可衡量的财务影响(MIT 研究数据)
入职时间减半可能是 AI 目前影响最深远的效果:第 10 个 PR 的表现能预测未来两年的产出,AI 让达到这个里程碑的时间缩短了一半
Agent 间共识将是 2026 年需要解决的重大问题
Martin Fowler 闭门研讨会的核心判断:AI 不解决组织系统问题,除非你先承认系统问题的存在
【1】12 万开发者的最新数据:92% 在用,但时间节省卡在 4 小时
Laura 带来了一组首次公开的行业基准数据。样本量是 121,502 名开发者,覆盖 464 家公司,数据采集时间从 2025 年 11 月到 2026 年 2 月 1 日。

先看采用率:92.6% 的开发者每月至少使用一次 AI 编码助手。其中 44.1% 每天使用,30.3% 每周使用,18.2% 每月使用,只有 0.8% 从来不用。这里的“AI 编码助手”,大部分开发者将其定义为 Cursor、Codex、Copilot、Claude 这类工具,不一定包括 ChatGPT。

再看时间节省。在 95,301 名开发者的样本中,自报每周因 AI 工具节省约 4.08 小时。按使用频率细分,每天使用的人节省最多(约 4.8 小时/周),每周使用的约 4 小时,每月使用的约 3.6 小时。这个数字和 2025 年 Q2 差不多,和 Q4 的 3.67 小时也接近,一直在 4 小时左右徘徊。Google 在 2025 年发表的一项研究称约 10% 的生产力提升,DX 的数据基本印证了这个量级。
但这个数字没有随着工具迭代而明显增长。模型在变强,工具在变好,每周节省时间就是卡在 4 小时附近。Laura 没有解释原因,但数据本身就是一个信号:仅靠加速编码任务的优化空间,可能已经接近天花板。

变化最快的指标是 AI 编写代码(AI authored code) 的比例。在 42,644 名开发者的样本中,26.9% 的生产代码由 AI 编写,基本未经大幅修改就通过代码审查并进入生产环境。上一季度这个数字是 22%,季度环比增长近 5 个百分点。每天使用 AI 的开发者,这个比例已经突破 30%。
【2】AI 让新人入职时间减半,且效果持续两年
Laura 一直有个直觉:AI 会是入职(onboarding)的利器,能帮新人更早地接触到项目信息。她用数据验证了这个直觉。

在 35,594 名 2024 年 1 月后入职的开发者样本中,从 2024 年 Q1 到 2025 年 Q4,入职时间缩短了一半。衡量标准是达到第 10 个合并 PR 的天数,这是行业普遍认可的入职里程碑。从图表看,2024 年 Q1 大约需要将近 100 天,到 2025 年 Q4 降到了不到 50 天。把这个曲线和 AI 使用率的增长曲线放在一起,走势高度吻合。
【注:PR(Pull Request)是开发者向项目提交代码变更的标准流程。第 10 个 PR 通常意味着开发者已经独立完成了多次有意义的代码贡献,是衡量“真正上手”的常用指标。】
Microsoft 有一项相关研究。SPACE 框架联合作者 Brian Houck 发现,一个开发者在第 10 个 PR 时的表现水平,能预测这个人在未来两年内的产出模式。不是“入职快的人之后也快”这么简单,而是第 10 个 PR 本身就是一个预测信号。
【注:SPACE 框架是 2021 年由 Nicole Forsgren 等人提出的开发者生产力度量框架,覆盖满意度、绩效、活动量、沟通协作和效率五个维度,被业界广泛采用。】
逻辑链条是这样的:AI 帮新人更快达到第 10 个 PR → 第 10 个 PR 预测未来两年表现 → 入职加速的效果可能在两年内持续放大。如果这个推论成立,入职加速可能是 AI 对组织影响最大的单一效果。
Laura 补充说,这不仅适用于公司新员工,也适用于转项目的工程师甚至非工程师。AI 降低了理解代码库的认知门槛,过去新人加入一个大型项目,光理解现有代码结构可能就要花几周,现在可以直接问 AI。
【3】均值是骗人的:有公司事故减半,有公司事故翻倍
Laura 展示完行业均值后,话锋一转:
均值不等于典型体验,不等于会发生在你身上的事。 (“Average does not mean typical, it does not mean what is going to happen to you.”)

她用大爆炸做了个比喻。AI 进入组织就像一场大爆炸,释放了巨大的能量,但冲击波把不同的组织推向了完全不同的方向。组织绩效是多维的,AI 作为加速器和放大器,正在把这些维度上的差异拉得越来越大。


质量维度上,差距最大。在 67,084 名开发者的样本中,有些公司的客户端事故增加了一倍,而同一时间段内,另一些公司的事故减少了 50%。
本来就运转不良的组织,现在更加运转不良了。而且是以更快的速度运转不良。 (“Organizations that were dysfunctional already, now they're more dysfunctional. They're dysfunctional and dysfunctional faster.”)
那些已有健康系统的公司,AI 放大了它们的优势,让它们更快、质量更高、变更信心更强。而那些本就有问题的公司,AI 放大了问题,制造了更多事故,更快地把代码推到了不该推的地方。
AI 不是药,是放大器。好的更好,差的更差。
【4】92% 在用,但组织转化率很低
Laura 引用了 MIT 在 2025 年 7 月发布的研究《The GenAI Divide: State of AI in Business 2025》。这项研究调查了 152 家组织,结论是:当前行业处于“高采用率、低转化率”的状态。
【注:该研究由 MIT 的 Project NANDA 团队发布,基于 52 次高管访谈、153 份高管调查和 300 多个公开 AI 项目的分析。】

PPT 上的图表显示:80% 的组织调研过通用大语言模型,但只有 50% 进入了试点阶段,最终成功实施的只剩 40%。嵌入式或任务专用的 GenAI 更惨,从 60% 调研到 20% 试点再到 5% 成功实施,漏斗极其陡峭。从试点到生产再到利润,每一步都有大量掉队者。
这背后有一个 Laura 观察到的规律:那些曾经放弃云转型的组织、放弃敏捷转型的组织,现在也在放弃 AI 转型。转型需要组织直面自身的问题,而这件事本身就令人不适。
采用不等于影响。 (“Adoption doesn't mean impact.”)
Laura 的 PPT 里引用了 MIT 的一句话:“这些工具主要提升了个人生产力,而非损益表(P&L)表现。” 当 AI 仅被用来加速一个人在电脑前敲代码的环节,生产力提升的天花板很低。如果想要组织级的成果,就必须在组织层面思考 AI 的应用,而不是停留在编码任务层面。
MIT 研究还揭示了一个错配:超过 50% 的 AI 预算被投向了销售和营销工具,但最高 ROI 其实来自后台自动化,比如削减外包和减少代理费用。购买专业供应商工具的成功率约 67%,自己内部构建的成功率只有三分之一。
还有一个正在快速扩大的“影子 AI 经济”:只有 40% 的公司购买了官方 LLM 订阅,但超过 90% 的公司里,员工在工作中定期使用个人 AI 工具。

PPT 上直接列了三步:“1. 用 AI 做实验 → 2. ??? → 3. 利润!”。中间那个“???”才是真正困难的部分,它叫组织变革管理。
【5】Agentic 工作流在扩展可能性的边界

Laura 用宇宙膨胀来比喻 agentic 工作流的兴起:我们的宇宙正在变大,炒作在变多,但可能性也在变大。

她把 1969 年人们对月球殖民地的幻想和 2026 年的 Gas Town 放在一起做对比。

Gas Town 是一个实验性的 AI 编程工具,PPT 的插图标着“Vibe Coding Floor: Throughput Over Precision”(凭感觉编程车间:吞吐量优先于精度),一群水獭在混乱的工厂里搬运标着“Features”、“Bugs”、“Reviews”的桶。

Laura 形容 Gas Town“完全疯狂”,PPT 列了几条使用警告:“如果你不能同时运行至少 5 个 Claude Code,别用 Gas Town”、“如果你在乎钱,别用 Gas Town”、“别用 Gas Town”。
【注:Gas Town 是 Steve Yegge 开发的实验性 AI 编程代理工具,同时并行运行多个 AI 编码代理完成任务,以激进的自主性和极高的 token 消耗著称。】

这些工具让构建变得更有趣,但 Laura 很清醒:自己在美甲沙龙用 AI 做一个指甲油配色 App,和一家跨国银行靠 AI 改变营收,是完全不同的事。她类比登月:我们没有住在月球上,但太空探索带来了太阳镜、条形码、石英手表。实验和探索本身有价值,Agent 同样在扩展我们能做什么、怎么做、为谁做的边界。

Agentic 使用的具体数据来自一个较小的样本:6 家先行公司的 2,920 名开发者。在这些公司中,50.5% 每天使用 agentic 工作流,30.2% 每周使用,11.7% 每月使用。Laura 提醒,这些公司走在行业前沿,已经为 agentic 工作流部署了遥测(telemetry),不能代表行业平均水平。

关于 Codex,Laura 分享了一组数据:Codex 桌面版在 2 月 2 日发布后一周内超过 100 万下载,上周用户增长了 60%。OpenAI 内部每周处理数万亿 token,95% 的 OpenAI 开发者在用 Codex。上周四(约 2 月 6 日)还发布了 GPT 5.3 Codex。使用 Codex 的开发者比使用其他 AI 工具的开发者每周多提交约 60% 的 PR。
【注:Codex 桌面应用是 OpenAI 于 2026 年 2 月推出的 Mac 端 AI 编码工具,可以同时运行多个 AI Agent 并行处理任务。GPT-5.3-Codex 是其底层模型。这些数据来自 OpenAI 官方公布,存在利益相关性。】
Laura 对这个数字的态度很审慎:这是一个数据点,不是唯一的数据点,但它说明 agentic 工作流有很高的上限。
【6】企业实战:Haven 医疗、Cisco、JP Morgan

Laura 介绍了一家非 AI 行业的公司:Haven Headache and Migraine Center,一家位于旧金山的虚拟远程医疗创业公司,专注头痛和偏头痛。Haven 的核心问题很朴素:能不能通过 Zoom 解决头痛问题?事实证明可以。
在医疗领域,Laura 强调了一个关键区分:用 AI 生成的代码是“耐用代码”(durable code) 还是“一次性代码”(disposable code)。Haven 作为一个医疗场景的小型创业公司,两种都在做。
在开发层面,Haven 用 Ralph loops 快速搭建全新患者门户的原型。PPT 展示了完整的工作流链路:(Linear + Figma) → PRD → JSON → Claude Code。产出不是一次性垃圾代码,而是高质量的原型,迭代速度更快,文档更清晰。
在临床层面,Haven 训练了一个 HIPAA(美国医疗隐私法规)合规的模型,处理数十万条历史患者消息。模型对消息进行分类、路由和工作流自动化:是需要续药还是需要预约随诊。结果是客户满意度达到行业平均的 3 倍,患者的头痛天数和严重程度都有了实质性下降。

大型企业也在动。Cisco 有 18,000 名工程师每天都在使用 Codex,主要用于复杂的代码迁移和代码审查,代码审查时间减少了 50%。JP Morgan Chase 发表了一篇关于 MAFA(Multi-Agent Framework for Annotation,多智能体标注框架)的论文:多个专业化智能体独立标注客户交互数据(意图、实体、FAQ 分类),然后由一个“评判智能体”通过共识和置信度评分来聚合和重新排序结果。
Laura 预测,智能体之间的共识(consensus among agents) 将是 2026 年需要解决的重大技术问题。这和分布式系统中的共识问题一脉相承,但在 AI Agent 的语境下是全新的挑战:当多个 Agent 各自有不同的“判断”时,如何达成共识?
【7】Martin Fowler 闭门研讨会:“AI 不解决组织问题”
2026 年 2 月 1-3 日,Laura 被邀请参加了 Martin Fowler 和 Thoughtworks 组织的“软件开发的未来”闭门研讨会,地点在犹他州鹿谷。选这个地点有历史意义:2001 年 2 月,敏捷宣言就是在犹他州的雪鸟滑雪度假村诞生的。25 年后,一群人回到同一个州的山区,讨论 AI 时代的软件开发。参与者包括 Kent Beck(极限编程创始人)、Steve Yegge(Gas Town 的开发者)、Gergely Orosz 等人。
【注:Martin Fowler 是 Thoughtworks 首席科学家,《重构》作者,也是 2001 年敏捷宣言的 17 位签署者之一。Kent Beck 是极限编程(XP)的创始人,同为敏捷宣言签署者。】
一天半的讨论集中在一个话题:如何负责任、合乎伦理、可持续地使用 Agent。现场有大量实验(Steve Yegge 在玩 Gas Town),气氛活跃。但最终的结论出乎意料地冷静:
AI 不解决组织的系统问题。 只有当你主动把 AI 应用到系统问题上时,它才能发挥作用。而前提是,你首先要承认系统问题的存在。
Kent Beck 见证了软件行业过去 30 年的每一次“银弹”承诺,Steve Yegge 在 Google 和 Amazon 经历过大规模工程组织的现实,Laura 手里有跨 450 家公司的实际数据。三个人从不同角度看到了同一件事。

PPT 上放了一张 Laura 和一位参会者的合影,旁边是贴满便签纸的讨论板,议题涵盖生产力度量、编程语言的未来等。Laura 说,她和 Kent Beck、Steve Yegge 在会议间隙的走廊里聊了一阵,总结出了这样一段话:

组织受制于人和系统层面的问题。我们对任何声称可以在不先解决这些人和系统层面约束的情况下改善组织绩效的技术,保持怀疑。我们保持怀疑,我们也保持为人。
(“Organizations are constrained by human and systems-level problems. We remain skeptical of the promise of any technology to improve organizational performance without first addressing human and systems-level constraints. We remain skeptical and we remain human.” — Kent Beck, Laura Tacho, and Steve Yegge)

Laura 用太空类比收束。PPT 展示了一幅火星上堵车的漫画,火星表面到处是垃圾、废弃卫星和排着长队的汽车,地球在远处的天空中。
如果我们不解决系统层面的问题,我们只会把它们一起带到太空去。 (“If we don't address the systems level problems, we will just take them to space with us.”)
有人问 Martin Fowler:是不是该写一个新的宣言了?Fowler 的回答是:不,太早了。人们还在实验想法。他说他对宣言本身没什么兴趣,大多数宣言被大多数人明智地忽略了,只不过敏捷宣言碰巧是个例外。
【8】赢得 AI 竞赛的组织做对了四件事
在研讨会和大量数据分析的基础上,Laura 总结了四个她反复看到的成功模式。
第一,有目标,有度量。 “撒网祈祷”(spray and pray)不奏效,就是给所有开发者发 AI 工具许可证,然后祈祷好事发生。Laura 说她有大量证据证明这行不通。赢的组织会把 AI 创新对准一个具体问题,设定可衡量的目标,然后跟踪进展。

为此她和 DX CEO Abi Noda 联合发布了一个 AI 度量框架:
第一层“利用率”:AI 工具的日活/周活、AI 辅助 PR 的比例、AI 生成代码的比例、分配给 Agent 的任务数
第二层“影响”:AI 节省的时间、开发者满意度、DX Core 4 指标(PR 吞吐量、交付感知速率、开发者体验指数、代码可维护性、变更信心、变更失败率),以及 Agent 完成的人类等效工时(HEH)
第三层“成本”:AI 总支出和人均支出、每个开发者的净时间收益(时间节省减去 AI 花费的时间)、Agent 时薪率(HEH / AI 支出)
她同时推荐了两个 AI 就绪度模型。一个是 DORA AI Capabilities Model,包含七项能力维度:清晰传达的 AI 立场、小批量工作、健康的数据生态、以用户为中心、AI 可访问的内部数据、高质量的内部平台、强版本控制实践。另一个是 Thoughtworks 的 FOREST 框架,包含六个维度:基础架构、运营模型、数据就绪度、可信 AI、人机协作体验、战略对齐。
【注:DORA(DevOps Research and Assessment)是 Google Cloud 旗下的研究团队,以其年度 DevOps 报告闻名。】
第二,开发者体验比以往任何时候都更重要。
把你原来要跟领导层谈的“开发者体验”改名叫“智能体体验”,你就能拿到预算了。 (“Just call it agent experience and you'll get money for it.”)
好的反馈循环、清晰的服务定义、完善的文档、快速的 CI(持续集成),这些开发者体验的基本功,喊了几十年,一直拿不到预算。到了 AI 时代,同样的东西换了个名字,管理层突然愿意投资了。因为好的测试实践、好的文档,恰恰是 agentic 工作流能跑起来的基础。
我们为开发者体验呼吁了几十年,一直在为几毛钱乞讨。不愿意为人类工程师花这个钱,但为机器人工程师花钱就没问题了。这让人有点心寒,但策略上,抓住这个机会。 (“We have been screaming about this for decades... It is disheartening that we didn't want to spend the money when it came to human engineers but when it comes to robot engineers we're okay with it.”)

PPT 展示了一张来自 134,085 名工程师的调查图表,按年化时间分布排列各工作流阶段对开发者时间的影响。排在最前面的是“会议密集日”和“中断频率”,远超“AI 时间节省”。构建和测试等待时间、开发环境繁琐度、审查等待时间、代码理解、信息搜索排在后面。
AI 节省的每周 4 小时,无法弥补糟糕的会议文化和频繁的中断。 成功的组织不是用 AI 加速编码,而是把 AI 指向这些系统性问题本身,比如用 AI 减少会议、优化 CI 等待时间、降低开发环境的重复劳动。
第三,把 AI 当作组织问题而非个人问题。
如果你想要营收、损益表、上市时间这样的组织级成果,就必须在组织层面思考 AI 的应用。AI 需要跨越整个价值流的工作流。

MIT 研究展示了组织层面 AI 采用的障碍排名:
前三项都不是技术问题。Laura 点名了一个现象:高管团队说“上 AI”,但
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み