ArXiv、AI 生成の質の低い論文を投稿した研究者を1年間禁止へ
学術プレプリントサーバー「arXiv」は、生成 AI の不適切な使用や検証不足が明らかな論文の著者に対し、1 年間の投稿停止および再提出時の査読付き出版物での受理を義務付ける厳格な規制を導入した。
キーポイント
AI スロップに対する厳罰化ルール
LLM 生成による誤った参照、メタコメントの混入、検証不足が明らかな論文を投稿した場合、著者は 1 年間の arXiv 利用停止処分となる。
具体的な違反事例と判定基準
「200 語の要約を提供しますか?」といった LLM のメタコメントや、架空の参考文献が含まれることが「証拠不疑」とみなされ、自動的なペナルティ発動の対象となる。
再提出時の厳格な条件
1 年間の禁止期間終了後、arXiv に再度投稿するには、まず信頼性の高い査読付き学術誌での受理が必須条件とされる。
背景にある論文の質の低下
2025 年以降、生成 AI の濫用により CS 分野を中心に「AI スロップ」が溢れ、架空引用や不正な投稿が急増していることが規制強化の背景にある。
AI 生成による捏造引用の急増
コロンビア大学の調査によると、2026 年初頭の論文約 277 本に 1 本の割合で AI によって捏造された参考文献が含まれており、これは 2023 年と比較して著しく増加している。
非営利団体化による資金調達強化
ArXiv は今年 7 月にコーネル工科大学から独立した非営利法人となり、多様なドナーからの資金を集めることで「AI スロップ」との戦いに備える方針である。
影響分析・編集コメントを表示
影響分析
この規制は、生成 AI の台頭により学術出版の信頼性が脅かされる中、主要なプレプリントサーバーが自主的なガバナンスを強化した象徴的な出来事である。著者に対して「AI を使っても最終責任は人間にある」という厳格な姿勢を示すことで、研究コミュニティ全体の倫理基準と品質維持への意識を高める効果が期待される一方で、研究者の負担増や表現の自由とのバランスが今後の課題となるだろう。
編集コメント
arXiv のような中立的なプラットフォームが、AI 生成コンテンツの濫用に対して明確なペナルティを科す方針へ転換した点は、業界全体における AI リテラシーと責任ある利用への重大な転換点と言えます。
image 学術研究のプレプリントを公開アクセスで提供するアーカイブ「ArXiv」は、明らかに生成 AI によって作成された論文を投稿した著者に対して、1 年間の利用禁止措置を講じる方針です。
木曜日の夜遅く、ArXiv のコンピュータサイエンスセクション委員長であるトーマス・ディーターリッチ氏は X(旧 Twitter)で次のように投稿しました。「生成 AI ツールが不適切な言語、盗用されたコンテンツ、偏ったコンテンツ、誤り、間違い、不正確な参考文献、あるいは誤解を招く内容を生成し、その出力が学術論文に含まれている場合、それは著者自身の責任です。私たちは最近、これに対する処罰規定を明確化しました。提出された論文に、著者が大規模言語モデル(LLM)の生成結果を確認していなかったことを示す疑いの余地のない証拠が含まれている場合、それは論文内のあらゆる内容を信頼できないことを意味します」。
彼が指摘する「疑いの余地のない証拠」の例としては、「幻覚的な参考文献」、あるいは LLM からのメタコメント(「200 語の要約です。変更はありますか?」「この表のデータは説明用であり、実験から得た実際の数値を埋めてください」など)が挙げられます。
ディーターリッチ氏はさらに、「処罰内容は、ArXiv からの 1 年間の利用禁止に加え、その後の ArXiv への提出については、まず信頼できる査読付きの学術誌などで受理される必要がある」と述べています。
Dietterich は金曜日の朝にメールで、これはワンストライクルールであると伝えました。つまり、AI による質の低い論文を含む投稿を一度でも検出された著者は追放されるが、決定には異議申し立てが可能であるということです。「確実な証拠がある場合のみこのルールを適用することを強調したい」と彼は言いました。「また、内部プロセスではまずモデレーターが問題を文書化し、その後セクション議長が確認してから罰則を科す必要があることも付け加えておきます。」
2025 年 11 月、arXiv は「AI による質の低い論文」で溢れかえっているとして、コンピュータサイエンス分野のレビュー記事やポジションペーパーの受け入れを停止すると発表しました。「生成 AI や大規模言語モデル(LLM)は、特に新しい研究成果を導入しない論文を含め、論文作成を迅速かつ容易にしたことで、この洪水に拍車をかけています。arXiv の全カテゴリで投稿数が大幅に増加していますが、その中でも arXiv の CS カテゴリにおいて特に顕著です」と、当時の変更に関するプレスリリースでは記述されています。
そして 1 月には、不正な投稿の増加に伴い、初めて投稿する者は確立された著者からの推薦状が必要になると発表しました。
AI によって生成された捏造された引用は、研究において大きな問題となっています。コロンビア大学の研究者による最近の研究では、3 年間にわたる 250 万篇の生物医学論文が調査され、2026 年の最初の 7 週間に発表された論文のうち 1/277 に捏造された参考文献が含まれていることが判明しました。一方、2023 年は 1/2,828、2025 年は 1/458 でした。AI によって生成された引用や論文はすでにピアレビュー(査読)プロセスに負担をかけており、メタコメントや幻覚的なデータがそのまま残ったまま、より多くの論文が審査パイプラインを通過するようになっています。
ArXiv はコーネル・テックによって管理されていますが、今年 7 月には独立した非営利法人となります。コーネル・テックの学長兼副学務担当理事であるグレッグ・モリセットは Science.org の取材に対し、この変更により arXiv がより幅広いドナーから資金を調達できるようになり、「AI スロップ(低品質な AI 生成コンテンツ)」の出現に対処するために必要な資金調達が容易になると述べました。
原文を表示
imageArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work.
Late Thursday evening, Thomas Dietterich, chair of the computer science section of ArXiv, wrote on X: “If generative AI tools generate inappropriate language, plagiarized content, biased content, errors, mistakes, incorrect references, or misleading content, and that output is included in scientific works, it is the responsibility of the author(s). We have recently clarified our penalties for this. If a submission contains incontrovertible evidence that the authors did not check the results of LLM generation, this means we can't trust anything in the paper.”
Examples of incontrovertible evidence, he wrote, include “hallucinated references, meta-comments from the LLM (‘here is a 200 word summary; would you like me to make any changes?’; ‘the data in this table is illustrative, fill it in with the real numbers from your experiments’.”
“The penalty is a 1-year ban from arXiv followed by the requirement that subsequent arXiv submissions must first be accepted at a reputable peer-reviewed venue,” Dietterich wrote.
Dietterich told me in an email on Friday morning that this is a one-strike rule—meaning authors caught just once including AI slop in submissions will be banned—but that decisions will be open to appeal. “I want to emphasize that we only apply this to cases of incontrovertible evidence,” he said. “I should also add that our internal process requires first a moderator to document the problem and then for the Section Chair to confirm before imposing the penalty.”
In November 2025, arXiv announced it would no longer accept computer science review articles and position papers because it was being “flooded” with AI slop. “Generative AI/large language models have added to this flood by making papers—especially papers not introducing new research results—fast and easy to write. While categories across arXiv have all seen a major increase in submissions, it’s particularly pronounced in arXiv’s CS category,” arXiv wrote in a press release about the change at the time.
And in January, it announced first-time submitters would need an endorsement from an established author due to a rise in fraudulent submissions.
AI-generated, fabricated citations are a huge problem in research. A recent study by Columbia University researchers examined 2.5 million biomedical papers across three years, and found that one in 277 papers published in the first seven weeks of 2026 contained fabricated references; In 2023, it was one in 2,828, and in 2025, one in 458. AI-generated citations and papers are already straining the peer-review process, and more and more papers are making it through the pipeline with those meta-comments and hallucinated data intact.
ArXiv is managed by Cornell Tech, but this July, it will become an independent nonprofit corporation. Greg Morrisett, dean and vice provost of Cornell Tech, told Science.org that this change will help arXiv raise more money from a wider range of donors, which Morrisett said is needed to deal with the emergence of “AI slop.”
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み