ArXiv、AI 生成の質の低い論文を投稿する研究者を禁止へ
学術プレプリントプラットフォームである ArXiv が、LLM による生成結果の検証不足やハルシネーションを含む論文の投稿を禁止する新たな方針を打ち出した。
キーポイント
AI スロップ(低品質な AI 生成物)の排除方針
ArXiv は、LLM 生成の結果を検査していないことが明白な論文の投稿を禁止する新たなルールを導入し、プラットフォーム上の質を維持しようとしている。
具体的な違反事例の定義
ハルシネーション(捏造)された参考文献や、LLM が生成したまま残されたメタコメントなどが、著者が結果を検証していない「決定的な証拠」として認定される。
研究者へのペナルティ
違反が確認された場合、関連する研究者は投稿権限を剥奪され、プラットフォームの利用から追放される措置が取られる。
影響分析・編集コメントを表示
影響分析
この方針は、生成 AI の急速な普及に伴う学術論文の質的低下という課題に対し、主要プラットフォームが自主規制を通じて対応する先駆けとなった。今後は研究者側において、AI ツールの利用と結果の厳密な検証が義務化され、学術倫理の基準が再定義される可能性がある。
編集コメント
生成 AI の台頭により、学術界における「人間による検証」の重要性が再認識される重要な転換点です。プラットフォーム側の厳しい姿勢は、研究者にとって新たなコンプライアンス要件となるでしょう。
ジェイ・ピーターズ
はテクノロジー、ゲームなどを担当するシニア記者です。2019 年に The Verge に加入するまで、Techmeme で約 2 年間勤務しました。
学術研究のプレプリント(査読前の論文)を共有するための人気プラットフォームである ArXiv は、生成 AI による質の低い論文(AI slop)の量を減らすための新たな措置を講じようとしています。
「大規模言語モデル(LLM: Large Language Model)の生成結果を検証しなかったことを示す疑いの余地のない証拠」がある場合、例えば幻覚的な参考文献や LLM によって残された「メタコメント」などがある場合は、著者は ArXiv から 1 年間追放されます。これは ArXiv のコンピュータサイエンスセクションの議長であるトーマス・ディートリッヒ氏によるとのことです。今後の ArXiv への提出論文は、「信頼できる査読付きの場」で受理されている必要があります。
彼が X(旧 Twitter)で述べた内容は以下の通りです:
**@arxiv の著者各位へ:当館の行動規範では、著者の名前に署名することは、その内容がどのように生成されたかに関わらず、各著者がすべての内容に対して完全な責任を負うことを意味します。
生成 AI ツールが不適切な言語、盗用されたコンテンツ、偏ったコンテンツ、誤り、間違い、不正確な参考文献、または誤解を招くコンテンツを生成し、その出力が学術作品に含まれている場合、それは著者(たち)の責任です。
私たちは最近、この違反に対する処罰を明確化しました。提出物に「LLM の生成結果を検証しなかったことを示す疑いの余地のない証拠」が含まれている場合、それは論文内のあらゆるものを信頼できないことを意味します。**
処罰は、arXiv からの 1 年間の利用停止に続き、その後の arXiv への投稿が信頼できる査読付きの場での受理を必須とするものです。
疑いの余地のない証拠の例としては、幻覚的な参考文献や、LLM(大規模言語モデル)からのメタコメント(「200 語の要約です。変更はありますか?」「この表のデータは説明用のもので、実験結果の実数で埋めてください」など)が挙げられます。
著者は利用停止決定に対して異議申し立てを行うことができます。Dietterich は 404Media にこう述べています。また、同氏はこのポリシーが「疑いの余地のない証拠がある場合のみに適用される」と指摘し、「内部プロセスではまずモデレーターが問題を文書化し、その後セクション議長が確認してから処罰を科す必要がある」とも付け加えています。
昨年、arXiv は AI による質の低いコンテンツ(AI slop)を削減するため、コンピュータサイエンス分野のレビュー論文およびポジションペーパーについては、査読を経て会議またはジャーナルで受理されたもののみを掲載する方針を更新しました。「大規模言語モデルの登場により、この種のコンテンツは比較的容易に需要に応じて生成できるようになりましたが、私たちが受け取るレビュー論文の大半は注釈付き文献リストに過ぎず、未解決の研究課題に関する本格的な議論が含まれていません」と、当時 arXiv は述べています。
このストーリーのトピックや著者をフォローして、パーソナライズされたホームページフィードで類似のコンテンツをもっと見たり、メール更新を受け取ったりしてください。
- ジェイ・ピーターズ
-
-
-
原文を表示
Jay Peters
is a senior reporter covering technology, gaming, and more. He joined The Verge in 2019 after nearly two years at Techmeme.
ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop.
If a paper has “incontrovertible evidence that the authors did not check the results of LLM generation,” such as hallucinated references or “meta-comments” left by an LLM, authors will be banned from ArXiv for a year, according to Thomas Dietterich, ArXiv’s section chair of its computer science section. Future ArXiv submissions will also have to be accepted at “a reputable peer-reviewed venue.”
Here’s what he said on X:
Attention @arxiv authors: Our Code of Conduct states that by signing your name as an author of a paper, each author takes full responsibility for all its contents, irrespective of how the contents were generated.If generative AI tools generate inappropriate language, plagiarized content, biased content, errors, mistakes, incorrect references, or misleading content, and that output is included in scientific works, it is the responsibility of the author(s).We have recently clarified our penalties for this. If a submission contains incontrovertible evidence that the authors did not check the results of LLM generation, this means we can’t trust anything in the paper.The penalty is a 1-year ban from arXiv followed by the requirement that subsequent arXiv submissions must first be accepted at a reputable peer-reviewed venue.Examples of incontrovertible evidence: hallucinated references, meta-comments from the LLM (“here is a 200 word summary; would you like me to make any changes?”; “the data in this table is illustrative, fill it in with the real numbers from your experiments”)
Authors can appeal ban decisions, Dietterich told 404Media. He also noted that this policy will only apply “to cases of incontrovertible evidence” and that “our internal process requires first a moderator to document the problem and then for the Section Chair to confirm before imposing the penalty.”
Last year, ArXiv also updated its policies to reduce AI slop by only allowing computer science review articles and position papers to be published if they have been peer reviewed and have been accepted at a conference or a journal. “The advent of large language models have made this type of content relatively easy to churn out on demand, and the majority of the review articles we receive are little more than annotated bibliographies, with no substantial discussion of open research issues,” ArXiv said at the time.
Follow topics and authors from this story to see more like this in your personalized homepage feed and to receive email updates.
- Jay Peters
-
-
-
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み