AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月18日 21:45·約8分で読める

AIを回答マシンとして10分使用するだけで問題解決能力が低下、新研究が発見

#AI依存#認知能力#人間-AI協働#教育テクノロジー#行動研究
TL;DR

米英の研究者による新しい研究は、AIを回答マシンとしてわずか10~15分使用するだけで、その後のAIなしの課題における問題解決能力と粘り強さが測定可能に低下することを発見した。

AI深層分析2026年4月18日 22:41
3
注目/ 5段階
深度40%
3
関連度30%
4
実用性20%
3
革新性10%
2

キーポイント

1

短時間使用による即時影響

AIアシスタントを回答マシンとして10~15分使用するだけで、その後のAIを使用しないタスクにおける問題解決能力と粘り強さが測定可能に弱まることが判明した。

2

研究の学術的背景

この研究は米国と英国の研究者によって実施され、AIの利用が人間の認知能力に与える短期的な影響を実証的に調査した。

3

問題解決スキルの低下

研究結果は、AIへの依存が人間自身の推論能力や課題への持続的な取り組み姿勢を急速に蝕む可能性を示唆している。

影響分析・編集コメントを表示

影響分析

この研究は、AIツールの日常的な利用が人間の基礎的な認知能力に予想外に早く影響を与える可能性を明らかにし、教育・職場環境におけるAIの適切な利用法についての議論を促す。特に、問題解決スキルの育成を重視する場面では、AIへの過度な依存のリスクを考慮する必要がある。

編集コメント

AIの生産性向上効果ばかりが注目される中、人間の能力への潜在的悪影響を実証した点で貴重な研究。利用者と開発者双方が認識すべきバランスの課題を提起している。

新研究によると、AIを「回答機」として10分間使用するだけで、問題解決スキル(problem-solving skills)が測定可能なレベルで低下することが判明

米英の研究者による新研究によると、AIアシスタントと10〜15分間接するだけで、その後の無補助タスクにおける問題解決能力(problem-solving ability)と持続力(persistence)が測定可能なレベルで低下することが示された。

複数の米英大学チームによるこの研究は、AI支援が即時のパフォーマンスを向上させる一方で代償を伴うことを示している。すなわち、AIの支援が取り除かれた後、ユーザーは最初から一人で同じタスクに取り組んだ人々よりも低いパフォーマンスを示す。また、あきらめる頻度も高くなる。

研究者らは、これらの効果に関する以前の証拠は主にアンケート調査や小規模なサンプルから得られていたと指摘する。これは、制御実験から導き出された初の大規模な因果関係を示す証拠である。

分数の問題が示す「補助具効果」(crutch effect)

第1の実験では、参加者は単純な1ステップの計算から複雑な3ステップのタスクまで、15問の分数問題(fraction problems)に取り組んだ。一方のグループはサイドバーにGPT-5を利用でき、各問題とその解答が事前に読み込まれていた。

つまり、参加者はほぼ努力せずに正解を得られた。単に「Answer?」と入力するだけで十分だった。対照群(control group)はツールを一切使用せずに作業を行った。12問終了後、AIが警告なしで削除され、全員が3問の同一テスト問題を一人で解いた。

AIが利用可能だった間、AIグループ(オレンジ色)はほぼすべての分数問題を正確に解いた。しかし最終3問のテスト問題でAIが削除されると、解答率(solve rate)は対照群(緑色)を下回り、スキップ率(skip rate)が急上昇した。| 画像: Liu et al.

そのテスト問題において、以前のAIユーザーは対照群よりも有意に少ない正解数だった。また、問題をスキップする頻度もほぼ2倍になった。誤答に対するペナルティがなく、報酬もパフォーマンスに連動していなかったため、研究者らはスキップ行動を持続力(persistence)と動機付けの直接的な指標として扱った。

第2の実験がパターンを確認

追試実験は方法論的な欠陥を修正した。第1回の実験では、AIグループの基礎能力が低い参加者がAIを通じて正解を提出できたため、対照群と同じ基準で除外されなかった。

今回は、単純な分数問題による事前テスト(pre-test)が追加され、対照群もAIグループのインターフェースに合わせるため、事前テストの解答が記載されたサイドバーを与えられた。

実験2はより厳密な方法論で同様の効果を再現した。AIグループは学習フェーズでは再び首位を走ったが、無補助テスト(unassisted test)では後れを取った。平均的なスキップ率はほぼ同等だった。| 画像: Liu et al.

結果は支持された。AIグループは無補助テストにおいて再び対照群を下回った。高いスキップ率も同じ方向を指していたが、全体として統計学的有意差には達しなかった。研究者らは、実際にAIをどのように使用したかの違いを可能性のある理由として挙げている。

「直接回答」ユーザーが最大の代償を支払う

AIユーザーの約61%が、主にアシスタントに直接解答を求めていると回答した。別の4分の1はヒントや解説のために使用し、残りは全く使用しなかった。事前テストでは、これらのグループは解答率とスキップ率の両方で同等のパフォーマンスを示した。基礎能力(baseline ability)と動機付けも比較可能だった。

使用スタイル別に分類:すべてのグループは当初同等の水準からスタートした(a)。無補助テストでは、「直接回答」ユーザーが最も悪く、最も頻繁にスキップした一方、AIを完全に無視した人々が最高解答率を示した(b)。「直接回答」グループのみが、自身の事前テスト結果よりも低いパフォーマンスとなった(c)。| 画像: Liu et al.

AIが削除された後、結果は急変した。直接解答に依存していた人々が最も悪く、AIを完全に無視した参加者は最高解答率を示し、対照群よりも高かった。直接回答ユーザーは自身の事前テストスコアに対して低下した一方、他のグループは横ばいまたは向上した。このデータは、負の影響が「思考を外部委託する」ユーザーに集中していることを示唆している。

読解力(reading comprehension)でも同様のパターンが確認

この効果が数学に限定されるかどうかを確認するため、研究者らは米SAT(Scholastic Assessment Test)の読解問題を用いて同じ実験デザインを実施した。ここでは、学習フェーズとテストフェーズの文脈切り替えを反映させるため、対照群に一般的な試験のコツが記載されたサイドバーを与えた。チームは、文章をそれほどの速さで読めないため、5秒以内に出された回答もスキップとしてカウントした。

実験3は、このデザインをSATの読解問題に適用した。パターンが繰り返される:AIが削除された後、AIグループの解答率は対照群を大きく下回り、スキップ頻度も高くなる。| 画像: Liu et al.

結果は数学実験と一致した。AIグループは無補助テストで正解数が少なく、有意に多くのスキップを示した。研究者らは、持続力(persistence)の低下は、批判的思考(critical thinking)に密接に関連するタスクであっても、AI支援型問題解決の広範な副作用であると指摘している。

2つのメカニズム、1つの構造的課題

本研究は、持続力の喪失について2つの説明を提示している。第一に、AIはタスクの難易度の基準点をリセットする。支援なしで作業すると、あらゆる利便性に慣れるのと同じく、より困難に感じられる。このメカニズムは自己強化型である:あらゆるショートカットは、次回自分で作業を行う perceived cost(知覚されるコスト)を高める。

第二に、ユーザーは知識を構築し、自身の能力に対する現実的な感覚を養う「生産的な苦闘(productive struggle)」の機会を逃す。

研究者らは、この知見を技能の漸進的喪失に関する広範な議論と結びつけている。即時の有用性で最適化されたAIシステムは、ユーザーの長期的な能力を損なう可能性がある。分数や読解力は委譲しやすいものに見えるかもしれないが、それらは代数や批判的思考(critical thinking)といった高度なスキルの前提条件であると指摘する。

学術的リソースが限られた学生ほど特にリスクが高い。わずか10分の使用で測定可能な効果が生じるのであれば、研究者は警告する、その影響は数ヶ月や数年をかけて複合的に蓄積し、回復が困難になる可能性がある。

研究者らは、Socratic AIや使用制限のようなユーザー側の修正は単なる「応急処置(band-aids)」に過ぎないと主張する。必要なのは、これらのシステムの構築方法を見直すことであり、短期的なユーザー満足度から離れ、自律性を育み、時には支援を控える設計へと向けるべきである。

AIの認知コストに関する証拠が蓄積

以前の研究も同様の方向を指しているが、手法は弱かった。Swiss Business Schoolによる研究は、AI使用と批判的思考(critical thinking)の間に強い負の相関があることを発見し、17〜25歳の参加者にその傾向が最も顕著だった。高等教育は保護因子として作用した:学歴が高い人々はAI生成情報をより頻繁に疑問視し、より深い分析を行った。

Microsoft ResearchとCarnegie Mellonの共同研究は、「自動化の皮肉(irony of automation)」を記述している。定型業務を処理することで、AIツールはユーザーが「認知筋力(cognitive muscles)」を鍛える機会を奪う。定型または低リスクのタスクでは、ユーザーは単にAIにデフォルトで依存する。

主にジュニアのソフトウェア開発者52名を対象としたAnthropicの研究も同様に、AI支援が新しいプログラミングスキルの習得を損なう可能性を示した。参加者は見慣れないTrioライブラリを使用して2つのタスクを解決するよう求められた。一方のグループはGPT-4oベースのアシスタントにアクセス可能であり、対照群はドキュメントとウェブ検索のみで作業を行った。

追試の知識テストにおいて、AIグループは17%低いスコアだった。再び重要なのはツールの使用方法である:解説を求めた人々は、業務を丸投げした人々よりもよく学んだ。

使用経験も重要である。別のAnthropic研究では、熟練したClaudeユーザーは同一タスクにおいて新規ユーザーよりも約4ポイント高い成功率を記録した。彼らは単にコマンドを発行するのではなく、モデルと反復的に作業を行った。

他の研究では、AIが個人およびチームのパフォーマンスを向上させることが示されている。しかし、多くの企業は依然として、それらの孤立した生産性向上を実際の効率改善や収益成長に変えることに多くの理由から苦戦している。

原文を表示

Just 10 to 15 minutes with an AI assistant is enough to measurably weaken problem-solving ability and persistence on later tasks done without AI, according to a new study from researchers in the US and UK.

The research, conducted by teams at several American and British universities, shows that while AI assistance boosts immediate performance, it comes with a catch: once the AI is taken away, users perform worse than people who tackled the same tasks on their own from the start. They also give up more often.

Previous evidence of these effects has mostly come from surveys or small samples, the researchers note. This is the first large-scale causal evidence drawn from controlled experiments.

Fraction problems expose the crutch effect

In the first experiment, participants worked through 15 fraction problems ranging from simple one-step calculations to more complex three-step tasks. One group had GPT-5 available in a sidebar, preloaded with each problem and its solution.

That meant participants could get correct answers with almost no effort. Just typing "Answer?" was enough. The control group worked with no tools at all. After 12 problems, the AI was removed without warning, and everyone solved three identical test problems on their own.

 While the AI was available, the AI group (orange) nailed nearly every fraction problem. Once it was pulled for the final three test problems, their solve rate dipped below the control group (green) and their skip rate shot up. | Image: Liu et al.

On those test problems, the former AI users got significantly fewer correct answers than the control group. They also skipped problems almost twice as often. Since there was no penalty for wrong answers and pay wasn't tied to performance, the researchers treated skipping as a direct measure of persistence and motivation.

A second experiment confirms the pattern

A follow-up experiment addressed a methodological flaw: in the first run, weaker participants in the AI group could submit correct answers through the AI, meaning they weren't filtered out by the same criteria as the control group.

This time, a pre-test with simple fraction problems was added, and the control group got a sidebar with pre-test solutions to match the AI group's interface.

Experiment 2 replicated the effect with tighter methodology. The AI group again led during the learning phase but fell behind in the unassisted test. Skip rates were roughly even on average. | Image: Liu et al.

The results held up: the AI group again underperformed the control group on the unassisted test. A higher skip rate pointed the same way, though it didn't reach statistical significance overall. The researchers point to differences in how people actually used the AI as a possible reason.

Direct-answer users pay the biggest price

About 61 percent of AI users said they mainly asked the assistant for direct answers. Another quarter used it for hints or explanations, and the rest didn't use it at all. On the pre-test, these groups performed the same on both solve and skip rates. Baseline ability and motivation were comparable.

Broken down by usage style: all groups started out comparable (a). On the unassisted test, the "direct-answer" users did worst and skipped most often, while people who ignored the AI entirely posted the highest solve rates (b). Only the direct-answer group also performed worse than their own pre-test (c). | Image: Liu et al.

After the AI was pulled, the results shifted sharply. People who had relied on direct answers did the worst, while participants who ignored the AI altogether posted the highest solve rates, even higher than the control group. The direct-answer users also declined relative to their own pre-test scores, while the other groups held steady or improved. The data suggests the negative effects are concentrated in users who outsource the thinking.

The same pattern shows up in reading comprehension

To see whether the effect was limited to math, the researchers ran the same design with reading comprehension passages from the US SAT. Here the control group got a sidebar with general test tips to mirror the context switch between learning and test phases. The team also counted answers given in under five seconds as skips, since the passage can't be read that fast.

Experiment 3 applied the design to SAT reading passages. The pattern repeats: after the AI is removed, the AI group's solve rate falls well below the control group, and they skip more often. | Image: Liu et al.

The results matched the math experiments. The AI group got fewer questions right on the unassisted test and skipped significantly more. Reduced persistence, the researchers say, is a broad side effect of AI-assisted problem solving, even on tasks tied closely to critical thinking.

Two mechanisms, one structural problem

The study points to two explanations for the loss of persistence. First, AI resets the reference point for how hard a task should feel. Working without help then feels tougher, the same way you get used to any convenience. The mechanism is self-reinforcing: every shortcut raises the perceived cost of doing the work yourself next time.

Second, users miss out on the productive struggle that builds both knowledge and a realistic sense of their own abilities.

The researchers tie their findings to the broader debate about gradual skill loss. AI systems optimized for instant helpfulness could undermine their users' long-term abilities. Fractions and reading comprehension might look like easy things to delegate, they note, but they're prerequisites for higher skills like algebra and critical thinking.

Students with fewer academic resources are especially at risk. If just 10 minutes of use produces measurable effects, the researchers warn, the consequences could compound over months and years and become hard to reverse.

User-side fixes like Socratic AI or usage limits are just "band-aids," they argue. What's needed is a rethink of how these systems are built, away from short-term user satisfaction and toward designs that foster autonomy and sometimes withhold help.

A growing body of evidence on AI's cognitive costs

Earlier research has pointed in the same direction, though with weaker methods. A study by the Swiss Business School found a strong negative correlation between AI use and critical thinking, most pronounced among participants aged 17 to 25. Higher education acted as a protective factor: people with more schooling questioned AI-generated information more often and engaged in deeper analysis.

A joint study by Microsoft Research and Carnegie Mellon described an "irony of automation": by handling routine work, AI tools deny users the chance to flex their "cognitive muscles." For routine or low-stakes tasks, users simply default to the AI.

An Anthropic study with 52 mostly junior software developers similarly showed that AI assistance can hurt the learning of new programming skills. Participants were asked to solve two tasks using the unfamiliar Trio library. One group had access to a GPT-4o-based assistant; the control group worked only with documentation and web search.

On a follow-up knowledge test, the AI group scored 17 percent lower. Again, how people used the tool mattered: those who asked for explanations learned better than those who offloaded the work.

Usage experience matters too. In another Anthropic study, experienced Claude users hit success rates about four percentage points higher than newcomers on identical tasks. They worked iteratively with the model rather than just issuing commands.

Other research shows AI can boost individual and team performance. But many companies still struggle to turn those isolated productivity gains into real efficiency improvements or revenue growth, for plenty of reasons.

この記事をシェア

関連記事

Microsoft Research★42026年4月10日 01:11

新しい働き方の未来:AIが急速な変化を推進し、不均等な利益をもたらす

マイクロソフトの研究によると、AIは職場で急速な変化を推進しており、単に作業を速くするだけでなく、人々の協働方法を変えている。AIを協働パートナーとして扱う組織が最大の利益を得ている。

Microsoft Research★42026年4月10日 01:10

アイデア:望ましい仕事の未来へAIを導く

マイクロソフトの研究者が、2020年から「新たな仕事の未来」研究イニシアチブを通じて、人々の働き方に関する研究を実施・分析し、AI技術が人間に与えるポジティブな影響について議論している。

阶跃星辰★42026年4月3日 11:01

階躍にはもう「純粋な人間」従業員がいない

階躍社は、AIを単なるツールではなくコアワークフローに組み込み、従業員全員がAIシステムを統括する体制を構築した。同社には既に数千のAIエージェントが従業員として存在する。

ニュース一覧に戻る元記事を読む