Anthropic経済指数:AI利用を理解するための新たな構成要素
Anthropic は新指標「経済プリミティブ」を用いた第 4 回レポートで、AI が複雑なタスクほど生産性を劇的に向上させる一方、ホワイトカラー層への恩恵が顕著であることを実証した。
キーポイント
新規指標「経済プリミティブ」の導入
タスクの複雑さ、スキルレベル、目的、AI の自律性、成功率という 5 つの基礎測定値を導入し、AI の経済影響をより詳細に分析する枠組みを提供した。
複雑なタスクほど生産性が向上
高校卒レベルのタスクでは 9 倍、大卒レベルのタスクでは 12 倍のスピードアップが観測され、AI の恩恵は高度なスキルを要する業務に集中している。
ホワイトカラー層への偏り
生産性向上が相対的に高いスキルを持つホワイトカラー職で顕著であり、これが現在の AI 利用傾向と一致していることが示された。
スキル低下(ネット・デスキリング)の可能性
タスクレベルの成功率の変化を分析し、AI の普及が将来的に多くの職種のスキル要求を低下させる「ネット・デスキリング」効果をもたらす可能性を示唆している。
タスク成功率と複雑性の関係
大学卒業者向けタスクの成功率は66%、高卒未満向けは70%だが、Claude のスピードアップ効果はタスクの複雑度に対してより鋭く増加する。
AI の時間的持続可能性(タイムホライズン)
API 利用では2時間のタスクで50%の成功率だが、Claude.ai では19時間に及ぶ場合もあり、ユーザーがタスクを細分化するフィードバックループや選択バイアスが影響している。
国別の使用目的の違い
GDP が高い国では業務や個人利用が主流である一方、経済発展段階の低い国では教育課題への利用が多く、所得水準に応じて用途が多様化する採用曲線を示している。
影響分析・編集コメントを表示
影響分析
このレポートは、AI が単に作業を速めるだけでなく、高度な認知能力を要する業務において特に大きな変革をもたらすことを定量的に示しており、企業の AI 導入戦略や人材育成方針の再考を迫る重要な示唆を含んでいます。また、「ネット・デスキリング」という概念への言及は、AI が人間のスキルセットそのものを根本から書き換える可能性を示唆し、長期的な労働市場の変容に対する警戒感を高める内容です。
編集コメント
AI の経済効果に関する定量的分析の質が向上しており、特に「複雑さ」と「生産性」の相関関係は業界全体で注目すべき知見です。ただし、サンプル期間やモデルバージョン(Sonnet 4.5)に依存する点も考慮し、継続的なモニタリングが必要です。
Anthropic Economic Index: AI の利用を理解するための新たな基礎要素
人工知能は本当に人々の業務を速くしているのでしょうか?AI はどのようなタスクを最もよく支援するのでしょうか?また、人々の職業の性質にどのように変化をもたらす可能性があるのでしょうか?
Anthropic では、こうした質問に正確に答えるために、継続的に現実世界における AI の利用状況を測定しています。プライバシーを保護した分析手法により、Claude.ai 上の会話(主に消費者による利用)や、当社のファーストパーティ API(主に企業による利用)に関する詳細な知見を得ることができます。1 これまでの報告書では、職業別および賃金レベル別の AI タスクの評価、ソフトウェア開発へのより深い注目、国別および米国州別の AI 利用状況の調査を行ってきました。
現在、当社の経済インデックスに新たな詳細レベルを追加しています。第4回報告書において、私たちは「経済プリミティブ」と呼ぶ一連の5つの単純かつ基礎的な測定指標を導入します。これらは、Claude の時間経過に伴う経済的影響を追跡するためのものです。最初のセットには、タスクの複雑さ、スキルレベル、目的(業務、教育、または個人的利用)、AI の自律性、および成功が含まれます。2 これらのプリミティブは、本報告書のサンプル内のすべての会話について、Claude に共通の質問セットに回答させることで導き出されます。
これらのプリミティブは、AI の潜在的な経済的影響の先行指標を提供し、すでに AI がどのように仕事を変化させているかというはるかに複雑な質問に答えることを可能にします。私たちの最新のレポートでは、2025 年 11 月の会話(主に Claude Sonnet 4.5 を使用)をサンプリングし、私たちがそれまでには答えられなかったであろう幅広い質問を探求するためにこれらのプリミティブを使用しています。具体的には、より複雑なタスクにおける Claude のタスクレベルの成功率がどう変化するか、そしてこれまでの Claude の利用が多くの仕事においてネット・デスキリング(技能低下)効果をもたらす可能性があるかどうかといった問いです。
第 4 回経済インデックスレポートはここでお読みいただけます。以下にその結果を要約します。
経済プリミティブから得られた知見
私たちは、経済プリミティブを用いて、個々のタスク、職業、そして観察される変化の可能な集計的影響に関する問いに取り組んできました。(完全な方法論、特にプリミティブの精度を検証した詳細については、完全版レポートの第 2 章に記載されています。)
AI はどのタスクを、どれほど高速化するか?
Claude は、より複雑なタスクにおいて最も大きな速度向上をもたらすことがわかりました。これは、Claude が会話の入力を理解するために必要な教育年数として推定する値によって測定されます。Claude.ai においては、高校卒業(12 年間)の教育を要するプロンプトを含むタスクでは 9 倍に、大学卒業者(16 年間)を要するタスクでは 12 倍に速度が向上しました。(API では、この速度向上はさらに大きくなりました。)これらの結果は、AI の生産性向上効果が現在、比較的高い人的資本を必要とするタスクで生じていることを示唆しており、これはホワイトカラーの専門職の方が職場で AI を利用する可能性が高いという証拠と一致しています。
この同じ傾向は、タスクの成功率で調整した場合にも当てはまります(ただし、その程度は弱くなります)。Claude は大学卒業者を要するタスクを 66% の確率で成功させますが、高校卒業未満の教育を要するタスクでは 70% です。これは全体的な効果を減らしますが、完全に消し去るものではありません。Claude のタスク速度向上への影響は、複雑度と成功率低下の相関関係よりも、複雑度に対してより急峻にスケールします。
Claude はどの程度の時間範囲でタスクをサポートできるのでしょうか?
METR による AI のタスク時間範囲の測定では、より長いタスクほど AI モデルが完了させるのが難しいことが示されています。しかし、モデルが向上するにつれて、AI モデルが作業を継続できる時間の長さは着実に増加しており、この指標は現在、AI の進歩を示す重要な指標となっています。
私たちは、経済的な基本要素を用いて METR の分析を補完することができます。以下のグラフでは、Claude.ai 上および API 上で、人間が同じタスクを実行するのにかかる時間に対する Claude のタスクレベルでの成功率を示しています:
METR のベンチマークによると、Claude Sonnet 4.5(私たちが分析に用いたモデル)は、2 時間のタスクにおいて 50% の成功率を達成します。一方、私たちの API データでは、Claude はほぼ倍の時間(約 3.5 時間)かかるタスクで 50% の成功率を示し、Claude.ai ではその所要時間はさらに大幅に長く、約 19 時間に達します。しかし、これは一見すると矛盾しているように見えるかもしれませんが、私たちの方法論は METR のそれとはいくつかの重要な点で異なります。私たちのサンプルでは、ユーザーは複雑なタスクをより小さなステップに分解でき、Claude が軌道修正を行うことを可能にするフィードバックループが形成されます。また、固定されたタスクセットではなく、私たちのサンプルには選択バイアスの一種が含まれています:ユーザーは、Claude で成功する可能性が高いと確信しているタスクを持ち込みます。
私たちの分析は、一貫したタスクセットを用いた研究で見られるものとは異なる、Claude の実効的な時間範囲がどのように見えるかを示しています。この指標については、今後の報告書で追跡していきます。
Claude の業務の性質は国によってどのように異なりますか?
私たちは、Claude が経済発展の異なる段階にある国々において非常に異なる種類のタスクを完了していることを発見しました。1 人あたり GDP の高い国では、Claude は仕事や個人的な利用のために頻繁に使用される一方、スペクトルの反対側に位置する国々では、教育課程での利用がより一般的です。これは、低所得国の AI 利用の大部分が教育と限られた数の業務タスクに占められ、国々が豊かになるにつれて AI 利用が個人的な目的へと多様化するという、単純な「採用曲線」の物語に合致しています。
これらの結果は、AI の教育利用を1人あたり所得の低さと関連付け、レジャーでの AI 利用を高所得と関連付ける Microsoft の最近の研究と一致しています。この点を踏まえて設計された、ルワンダ政府および技術トレーニングプロバイダーである ALX との私たちの最近のパートナーシップでは、参加者はまず AI リテラシーの開発から始めます。また、一部の卒業生に Claude Pro への年間アクセス権を付与するプログラムをパイロット実施しており、教育利用からより広範なアプリケーションへの移行を支援しています。
2025 年 1 月のデータに基づく最初の報告書では、サンプル内の職種の 36% で Claude がタスクの少なくとも 4 分の 1 に使用されていることが判明しました。複数の報告書のデータを統合すると、この割合は 49% に上昇しています。しかし、Claude の成功率(労働者がそのタスクを行う頻度と所要時間に応じて重み付け)を考慮に入れると、AI 利用の影響を最も受ける職種に関する異なる図景が浮かび上がります。
以下のグラフでは、x 軸に前述の職業のタスク被覆率を、y 軸には新たに調整した指標をプロットしています。両者には確かに相関がありますが、私たちは現在、データ入力キーヤーや放射線科医などの一部の職業は、タスク被覆率だけでは示唆されるよりも AI の影響を強く受けている一方、教師やソフトウェア開発者などの他の職業は比較的影響が少ないことを発見しました。
ただし、修正された評価にも限界があります。私たちが評価しているのは Claude.ai 上で実行されるタスクのみであり、これらの会話が現実世界の変化にどのように対応するかは必ずしも明確ではありません。これは今後さらに掘り下げていく予定の分野です。
私たちがさらに問いかけたのは、AI がカバーするタスクが、特定の職業における高スキル成分か低スキル成分のどちらを代表しているかという点です。各タスクに必要なスキルレベルを推定した指標を用いると、Claude は相対的に高等教育レベルを必要とするタスク(具体的には平均 14.4 年の教育を要するタスク)をカバーする可能性が高いことが分かりました。これは米国の準学士号に相当し、経済全体の平均である 13.2 年と比較して高い値です(以下参照)。これは、Claude がホワイトカラー労働者によってより頻繁に使用されているという以前の発見と一致しています。
実験の一環として、Claude がカバーするタスクを除去した場合に人々の仕事のタスク構成がどのようにシフトするかを推定しました。第一次的な効果としては、これは平均して仕事をスキルダウンさせることになります。なぜなら、より高度な教育を要するタスクが排除されるためです。技術ライター、旅行代理店、教師などの職業は影響を受けるでしょう(詳細については報告書でさらに議論します)、ただしごく稀に不動産管理者のように逆方向の影響を受けるケースもあります。
私たちは必ずしもこのスキルダウンが発生すると予測しているわけではありません。AI が現在サポートするタスクを完全に自動化したとしても、労働市場が動的に調整され、本分析では考慮されていない形で変化しうる可能性があります。(もちろん、モデルが改善されるにつれて、AI がカバーするタスクの構成も変化するでしょう。)しかしながら、私たちはこれが今後間もなく職業に及ぼす最も即時的な影響に関する有用なシグナルを提供すると考えています。
集計された影響
以前の研究において、私たちは AI の広範な採用が、今後 10 年間にわたり米国の労働生産性成長率を年間 1.8 ポイント引き上げると推定しました。これはトレンドレートのおよそ倍に相当します。私たちの新しいプリミティブ(基本要素)を用いることで、この分析を見直すことが可能になりました。
タスクの速度向上のみを基にした推定値に基づくと、以前の発見である 1.8 ポイントの増加(API データを追加した場合でも)を再現できました。しかし、タスクの信頼性を考慮し、つまりタスクレベルでの時間節約の見積もりをそのタスクが成功する確率で調整すると、Claude.ai で完了したタスクでは推定値は約 3 分の 1 減少し(年間 1.2 ポイント)、通常より困難なタスクが多い API で完了したタスクではやや多く減少します(年間 1.0 ポイント)。
年間の労働生産性成長率が 1 ポイントでも増加すれば、なお注目すべきことです。これは米国の生産性成長率を 1990 年代後半から 2000 年代初頭の水準に戻すことになります。また、以前の研究で言及した通り、このトップラインの推定値は、AI モデルがさらに強力になる可能性や、職場での AI 利用がより洗練される可能性を考慮していません。これらが実現すれば、数値はさらに大幅に引き上げられる可能性があります。実際、当社の調査以降、Claude Opus 4.5 のリリースにより Claude は著しく強化されています。
以前の指標に関する更新情報
基本となる指標に加え、過去の報告書で追跡してきた指標について新たなデータ収集ラウンドを行いました。これにより、2025 年 1 月から 11 月までの AI 利用におけるトレンドを特定することが可能になりました。ここでは主に、Claude の利用が不均一に分布していることを示した以前の分析結果から、わずかな進化が見られる程度です。
まず、Claude の利用は特定のタスクに依然として高度に集中していることが分かりました。Claude.ai には 3,000 の固有の業務タスクが含まれていますが、上位 10 件がセット全体の 24% を占めており、これは 2025 年 1 月の 21% から着実に増加しています。より具体的には、コンピュータおよび数学関連のタスクが Claude の利用を依然として支配しており、Claude.ai 上の会話の約 3 分の 1、API トラフィックのほぼ半分を占めています。
次に、新しい報告書によると、Augmentation(補完)(52%)が Automation(自動化)(45%)を上回り、Claude.ai における Claude との最も一般的な対話パターンとなりました。これは 8 月のサンプルで観察された結果(Automation が 49% で 47% を上回っていた)に対する逆転ですが、より長い時間枠でこの質問を評価すると、依然としてタスクにおける Automation の割合が緩やかに上昇していることが確認できます。昨年 1 月には Augmentation が 55% で Automation の 41% を上回っており、3 月にも Augmentation が 55% で Automation の 42% を上回っていました。
最後に、最新の分析では、AI 利用の地理的集中(前回議論した通り)が依然として明白であることが示されました。米国、インド、日本、英国、韓国は Claude.ai の全体的な利用において引き続き首位を占めており、1 人あたり GDP で採用状況が十分に説明されています。ただし、米国においてはより大きな変化を観察しています:Claude の利用は米国の各州間で明らかに均等に分布するようになりました。実際、この傾向が続けば、モデルの予測では Claude の利用は 2〜5 年以内に全国で均等化されるとのことです。このモデルの詳細については報告書で議論します。
最新の経済インデックス報告書からの最も即時的な結論は、AI が世界労働力に与える影響がいまだに非常に不均等であるということです。AI の利用は特定の国や職業に集中しており、タスクの被覆に関する証拠が示すように、ある職業への影響は他の職業とは全く異なるものとなっています。
より一般的には、この報告書は将来の調査と比較するための新たな基準値を提供しました。Claude が改善されるにつれて、より困難なタスクを任されることが期待され、おそらくより大きな成功を収めるでしょう。また、タスクが Claude.ai から API へ(つまり、主に消費者から主に企業へと)移行する可能性も考えられます。これは、タスクの信頼性が高まるにつれて起こり得る現象です。もしこれが実現すれば、AI が生産性に与える影響において企業の採用が重要であるという点に照らせば、これにより経済的影響の到来を示す別の指標となり得ます。私たちのプリミティブを通じて、こうした変化が人々の仕事の性質や、この急速な技術移行期間において最も影響を受ける可能性のある人々(およびその場所)といった現実世界の成果にどのように影響し始めているかを測定できるようになります。
その間、研究者、ジャーナリスト、そして一般市民は、当社のデータを用いて各自の研究や思考を補強し、必要となるかもしれない潜在的な政策対応に対する実証的な基盤を提供することができます。上記で議論した各領域の詳細については、完全な報告書をご覧ください。
前回の報告書と同様に、当社のすべての分析はプライバシーを保護する分析に基づいています。本報告書全体を通じて、Claude.ai の無料版、Pro 版、Max 版からの会話 100 万件(これらを主に消費者の利用を表すため「消費者データ」とも呼ぶ)と、自社 API トラフィックの転記文書 100 万件(これらを主に企業の利用を表すため「エンタープライズデータ」とも呼ぶ)を無作為に抽出して分析しています。
より具体的には、「タスクの複雑さ」は、タスクがその複雑さにおいて異なることを捉える指標です。これには完了までの所要時間や難易度が含まれます。O*NET における「デバッグ(debugging)」というタスクは、Claude が関数内の小さなエラーを修正するものから、コードベース全体を包括的にリファクタリングするものまで指し得ますが、労働需要への影響は非常に異なります。複雑さは、AI を使用せずにタスクを完了するために必要な推定人間の所要時間、AI を使用してタスクを完了するのにかかった時間、およびユーザーが単一の会話内で複数のタスクを処理しているかどうかを通じて測定されます。
「人間と AI のスキル」は、自動化がスキルレベルとどのように相互作用するかを示すものです。もし AI が専門知識をあまり必要としないタスクに対して不均衡に代替し、高スキルな業務を補完するものである場合、それは技能偏向型技術変化(skill-biased technical change)の別の形態となり、高度なスキルを持つ労働者の需要を増加させる一方で、低スキルの労働者を置き換える可能性があります。私たちは、ユーザーが Claude を使用せずにタスクを完了できたかどうか、およびユーザーのプロンプトと Claude の応答の両方を理解するために必要な教育年数を測定します。
ユースケースは、専門的利用、教育的利用、そして個人的利用を区別します。労働市場への影響は職場での利用から最も直接的に生じますが、教育的利用は将来の労働力がどのような AI 補完スキルを構築しているかを示すシグナルとなり得ます。
AI の自律性は、ユーザーが意思決定を Claude に委譲する度合いを測定します。最新のレポートでは、タスクを完全に委譲する「指示的」な利用が増加していることが記録されました。能動的な共同作業から完全な委任に至るまでの自律性レベルを追跡することは、自動化のペースを予測するのに役立ちます。
タスク成功度は、Claude がタスクを成功裏に完了したと評価するかどうかを測定します。タスク成功度は、タスクが効果的に自動化可能か(そもそもタスクは自動化できるのか?)、そして効率的に自動化可能か(タスクを自動化するには何回の試行が必要か?)を評価するために役立ちます。つまり、タスク成功度は、労働タスクの自動化における実現可能性とコストの両方にとって重要です。
実際、歴史的な証拠の一部は、ジョブタスクを自動化する技術が特許データに現れると、露出された職業において雇用と賃金がその後低下することを示唆しています。
関連コンテンツ
Claude Opus 3 に対するモデル廃止コミットメントに関する更新
ペルソナ選択モデル
Anthropic Education Report: The AI Fluency Index(AI 習熟度指数)
私たちは、今日の人々が AI とどのように協力しているかを測定するための基準となる「AI 習熟度指数」を構築するために、数千の Claude.ai 会話にわたる 11 の観測可能な行動を追跡しました。

原文を表示
Anthropic Economic Index: New building blocks for understanding AI use
Is artificial intelligence really making people faster at work? What sort of tasks does AI support best? And how might it change the nature of people’s occupations?
At Anthropic, we’re measuring real-world AI use on an ongoing basis to answer questions exactly like these. Our privacy-preserving analysis method allows us to learn more about conversations on Claude.ai (capturing uses by consumers) and our first-party API (mostly capturing uses by businesses).1 In past reports, we’ve assessed AI tasks by occupation and wage level, looked more closely at software development, and studied AI use by country and by US state.
We’re now adding a new level of detail to our Economic Index. In our fourth report, we’re introducing what we’ve called economic primitives: a set of five simple, foundational measurements to track the economic impacts of Claude over time. Our initial set includes task complexity, skill level, purpose (work, education, or personal use), AI autonomy, and success.2 We derive these primitives from asking Claude to answer a common set of questions about every conversation in our sample for this report.
These primitives provide a leading indicator of AI’s potential economic impacts—and allow us to answer far more complex questions about how AI is already changing jobs. Our latest report, which samples conversations from November 2025 (predominantly using Claude Sonnet 4.5), uses our primitives to explore a wide range of questions that we wouldn’t otherwise be able to answer—including how Claude’s task-level success rates change for more complex tasks, and whether the use of Claude to date might portend a net-deskilling effect on many jobs.
You can read the fourth Economic Index report here. Below, we summarize its results.
What we’ve learned from our economic primitives
We applied our economic primitives to questions about individual tasks, occupations, and then the possible aggregate impacts of the changes we observe. (Our full methodology—including details on how we tested the accuracy of our primitives—is described in chapter two of the full report.)
Which tasks does AI speed up, and by how much?
We found that more complex tasks were sped up the most by Claude. We measure this by what Claude estimates as the number of years of schooling required to understand the conversation’s inputs: in Claude.ai, tasks with prompts requiring a high school education (12 years) were sped up by a factor of 9, while those requiring a college degree (16 years) were sped up by a factor of 12. (On the API, the speedup was greater still.) These results imply that AI’s productivity gains are currently accruing in tasks that require relatively high human capital, which is consistent with the evidence that white collar professionals are more likely to use AI at work.
This same trend holds—albeit in weaker form—when we adjust for tasks’ success rates. Claude successfully completes tasks that require a college degree 66% of the time, compared to 70% for those tasks that require less than a high school education. This reduces, but doesn’t eliminate, the overall effect: Claude’s impact on task speedup scales more sharply with complexity than complexity correlates with a decrease in success rate.
What are the time horizons over which Claude can support tasks?
METR’s measure of AI’s task horizons shows that longer tasks are harder for AI models to complete. But the length of time over which AI models can work is steadily increasing as models get better: this measure has now become a key indicator of AI progress.
We’re able to complement METR’s analysis using our economic primitives. In the graph below, we show Claude’s task-level success rates relative to the amount of time a human would take to do the same task, both on Claude.ai and on our API:
METR’s benchmark suggests that Claude Sonnet 4.5 (the model in our own analysis) achieves 50% success rates on tasks of 2 hours. By contrast, our own API data finds that Claude is 50% successful at tasks that take nearly twice as long (around 3.5 hours), and on Claude.ai, the duration is vastly longer still—around 19 hours. But this might not be as discordant as it seems: our methodology is different to METR’s in some important ways. In our sample, users can break down complex tasks into smaller steps, creating a feedback loop that allows Claude to correct course. And rather than a fixed set of tasks, our sample contains a form of selection bias: users bring tasks to Claude that they’re more confident will work.
Our analysis shows how Claude’s effective time horizons might look different to those found in a study with a consistent set of tasks. We’ll track this indicator in further reports.
How does the nature of Claude’s work vary across countries?
We find that Claude completes very different kinds of tasks in countries at different stages of economic development. In countries with higher GDP per capita, Claude is used much more frequently for work or for personal use—whereas countries at the other end of the spectrum are more likely to use it for educational coursework. This fits a straightforward “adoption curve” story, in which lower-income countries show a large share of AI use on education and on a smaller number of work tasks, while AI use diversifies towards personal purposes as countries become richer.
These results align with recent work by Microsoft that associates AI use in education with lower per-capita income, and AI use for leisure with higher incomes. Our recent partnership with the Rwandan government and ALX, a technology training provider, is designed with this in mind: participants begin by developing AI literacy, and we’re piloting a program for granting some graduates year-long access to Claude Pro, supporting the transition from educational use to a broader range of applications.
In our first report, with data from January 2025, we found that 36% of jobs in our sample saw Claude being used for at least a quarter of their tasks. Pooling data across reports, this has risen to 49%. But once we account for Claude’s success rate (which we weight according to how often workers do that task and how long the task takes), we get a different picture of which jobs are most affected by the use of AI.
On the graph below, we plot that earlier measure of occupations’ task coverage along the x axis, and our new, adjusted measure on the y axis. Although the two are certainly correlated, we now find that some occupations (like data entry keyers and radiologists) are much more heavily affected by AI than task coverage alone would suggest, while others (like teachers and software developers) are relatively less affected.
That said, even our revised assessment is still limited: we only assess tasks that are performed on Claude.ai, and it’s not always clear how these conversations might map onto changes in the real world. This is an area we plan to dig into further in future.
A further question we asked is whether the tasks that AI covers represent the higher- or the lower-skilled components of a given occupation. Using an estimate that we create of the skill level required for each task, we find that Claude is relatively more likely to cover the tasks that require higher education levels—specifically, tasks that require an average of 14.4 years of education (equivalent to a US associate’s degree), relative to the economy’s average of 13.2 (shown below). This aligns with our earlier finding that Claude is used more frequently by white-collar workers.
As an experiment, we estimated how removing these Claude-covered tasks would shift the task composition of people’s jobs. As a first-order effect, this would deskill jobs on average, since it would remove those higher-education tasks. Professions like technical writers, travel agents, and teachers would be affected (as we discuss further in the report), though a rarer few (like real estate managers) would see effects going the other way.
We’re not necessarily predicting that this deskilling will occur: it’s possible that even if AI fully automated the tasks it currently supports, the labor market would dynamically adjust in ways that this analysis doesn’t account for. (Of course, as models improve, the composition of tasks that AI covers will change, too.) That said, we think this offers a useful signal as to the most immediate effects that AI might have on occupations in the near future.3
Aggregate impact
In our earlier research, we estimated that the widespread adoption of AI could increase US labor productivity growth by 1.8 percentage points per year over the next ten years—around double the trend rate. Our new primitives allow us to revisit this analysis.
Based on our estimates of task speedups alone, we replicated our earlier finding of a 1.8 percentage point increase (even when we added in our API data). But when we account for task reliability—that is, when we adjust our estimate of task-level time savings by the probability that the task is successful, our estimate falls by about one-third for tasks completed on Claude.ai (to 1.2 percentage points per year), and by slightly more (to 1.0 percentage points) for the typically more challenging tasks completed on our API.
Even a 1 percentage point increase in annual labor productivity growth would still be notable: it would return US productivity growth to the rates of the late 1990s and early 2000s. And, as we mentioned in our earlier research, this top-line estimate does not account for the possibilities that AI models become much more powerful, or that the use of AI at work becomes much more sophisticated—which could push the number much higher. Indeed, since our survey, Claude has become substantially more powerful, with the release of Claude Opus 4.5.
Updates on our previous measures
In addition to our primitives, we collected a new round of data on the measures we’ve been tracking in our previous reports. This allows us to pick out trends in AI use over the course of 2025, from January to November. Here, we mostly find only small evolutions from the results of previous analyses, which pointed to an uneven distribution of Claude use.
First, we find that the use of Claude has remained highly concentrated among certain tasks: even though our sample includes 3,000 unique work tasks on Claude.ai, the top ten account for 24% of the set, which has steadily increased from 21% in January 2025. More specifically, computer and mathematical tasks continue to dominate Claude use: they’re about a third of all conversations on Claude.ai, and nearly half of our API traffic.
Second, our new report finds that augmentation (52% of conversations) has overtaken automation (45%) as the most popular pattern of interaction with Claude on Claude.ai. This is a reversal of what we saw in our August sample (when automation led by 49% to 47%), but, when we assess this question over a longer time-frame, we still see a slow rise in automation’s share of tasks: augmentation led by 55% to 41% in January of last year, and by 55% to 42% in March.
Third, our latest analysis shows that the geographic concentration of AI use (as we discussed last time) remains evident. The US, India, Japan, the UK, and South Korea still lead in overall Claude.ai use, and adoption remains well-explained by GDP per capita. That said, in the US, we’ve observed greater changes: Claude use has become noticeably more evenly distributed across US states. In fact, if this trend was sustained, our model predicts that Claude use would be equalized across the country within two to five years. We discuss this model in more detail in the report.
The most immediate conclusion from our latest Economic Index report is that the impact of AI on the global workforce remains a highly uneven one: AI use remains concentrated in specific countries and occupations, and it affects some occupations in a very different way to others, as the evidence on task coverage suggests.
More generally, this report has given us a new baseline against which to compare our future surveys. As Claude improves, we expect it’ll be asked to take on harder tasks, and that it’ll likely find greater success. We also expect that tasks might move from Claude.ai to the API (that is, from predominantly consumers to predominantly businesses) as they become more reliable—and if this happens, it’ll give us another possible indication of coming economic impacts, given the importance of business adoption for AI’s effect on productivity. Through our primitives, we’ll be able to measure how changes like these are beginning to impact real-world outcomes, including the nature of people’s work, and which people (and where) are likely to be most affected during this period of rapid technological transition.
In the meantime, researchers, journalists, and the public can use our data to inform their own research and thinking, and to provide an empirical foundation for the potential policy responses we might need. For much more detail on each of the areas we’ve discussed above, see our full report.
As with previous reports, all our analysis is based on privacy-preserving analysis. Throughout the report we analyze a random sample of 1M conversations from Claude.ai Free, Pro and Max conversations (we also refer to this as “consumer data” since it mostly represents consumer use) and 1M transcripts from our first-party (1P) API traffic (we also refer to this as “enterprise data” since it mostly represents enterprise use).
More specifically, Task complexity captures that tasks can vary in their complexity, including how long they take to complete and how difficult they are. A "debugging" task in O*NET could refer to Claude fixing a small error in a function or comprehensively refactoring a codebase—with very different implications for labor demand. We measure complexity through estimated human time to complete tasks without AI, time spent completing tasks with AI, and whether users handle multiple tasks within a single conversation.
Human and AI skills address how automation interacts with skill levels. If AI disproportionately substitutes for tasks requiring less expertise while complementing higher-skilled work, it could be another form of skill-biased technical change—increasing demand for highly skilled workers while displacing lower skilled workers. We measure whether users could have completed tasks without Claude, and the years of education needed to understand both user prompts and Claude's responses.
Use case distinguishes professional, educational, and personal use. Labor market effects most directly follow from workplace use, while educational use may signal where the future workforce is building AI-complementary skills.
AI autonomy measures the degree to which users delegate decision-making to Claude. Our latest report documented rising "directive" use where users delegate tasks entirely. Tracking autonomy levels—from active collaboration to full delegation—helps forecast the pace of automation.
Task success measures Claude’s assessment of whether Claude completes tasks successfully. Task success helps assess whether tasks can be automated effectively (can a task be automated at all?) and efficiently (how many attempts would it take to automate a task?). That is, task success matters for both the feasibility and the cost of automating labor tasks.
Indeed, some historical evidence suggests that when technologies automating job tasks appear in patent data, employment and wages subsequently fall for exposed occupations.
Related content
An update on our model deprecation commitments for Claude Opus 3
The persona selection model
Anthropic Education Report: The AI Fluency Index
We tracked 11 observable behaviors across thousands of Claude.ai conversations to build the AI Fluency Index — a baseline for measuring how people collaborate with AI today.

関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み