ファンフィクションコミュニティが AI と自身との間で対立
AO3(Archive of Our Own)コミュニティで、Claude 生成テキストを検出する拡張機能を用いた対立が勃発し、技術的な限界と誤検知のリスクが浮き彫りとなった。
キーポイント
AI 検出ツールの登場と仕組み
匿名アカウント「@heatedrivalryai」が、Claude から直接コピーペーストされたテキストに埋め込まれる特定のコード(font-claude-response-body)を検知して背景を赤く表示する AO3 用スキンを提供した。
技術的な限界と誤検知のリスク
この手法は「直接コピーペースト」された場合のみ有効であり、テキストを編集したり他の経路で入手した場合に検出されなくなるなど、信頼性に欠ける。また、AI 使用の有無に関わらず特定の操作をしたユーザーが誤って疑われるリスクがある。
コミュニティ内での対立と懸念
クリエイティブな分野における AI への嫌悪感が高まる中、この検出ツールの導入は「AI 作者」を排除する動きを加速させたが、同時にコミュニティ内部の分断や、無実の作家への不当なレッテル貼りという新たな問題を引き起こしている。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI の普及に伴い、クリエイティブコミュニティ内で「人間による創作」と「AI 生成」の境界線を描こうとする試みが、技術的な不完全さゆえに逆効果や分断を招く可能性を示唆しています。特に AO3 のような大規模なプラットフォームにおいて、簡易的な検出ツールが導入されることで生じる倫理的・社会的影響は、今後の AI ガバナンスやコミュニティ運営の重要な教訓となります。
編集コメント
技術的な痕跡に依存した簡易検出は、AI の進化や利用方法の多様化に対して脆弱であり、コミュニティの分断を招くリスクが高いことが示されています。
過去1週間で、生成AIを使用する作者を根絶することを目的とした新たなファン作品運動が始まりました。しかし、導入されている検出方法は疑問の余地があり、あらゆるファンフィクション作家が巻き込まれる可能性があります。
Claude、ChatGPT、およびその他のAIツールの使用に対する広範な嫌悪感は、ファンフィクションの世界を含むクリエイティブコミュニティにおいて長らく*存在するもの*でした。読者や作家たちは、AI生成とされる作品を見分けるためのヒントを共有しており、それにはダッシュ文字から紫の文章という広範な概念に至るまで多岐にわたります。しかし、6月29日、匿名のXアカウント@heatedrivalryaiが、より信頼性の高い解決策を約束しました。同アカウントは、Anthropic社のClaudeボットが残したコード痕跡を特定する supposedly 機能を持つ、人気のあるファンフィクションリポジトリ「Archive of Our Own (AO3)」向けのスキン(拡張機能のようなもの)を投稿しました。
「Claudeで生成された回答がClaudeから直接AO3に貼り付けられると、テキストはClaudeによって注入されたコード'font-claude-response-body'で囲まれます」と@heatedrivalryaiアカウントは述べています。「その存在は、Claudeの使用を明確に示します」。ユーザーがこのコードを含むページ(ファンフィクション作品など)を訪れると、スキンが背景全体を赤色に変更します。
AO3(Archive of Our Own)には、ユーザーが機能を確認できるためのいくつかのテスト投稿が公開されています。私がこれらの例に対してスキンをテストした際、画面は即座に赤く表示されました。また、Claude によって生成された短編小説を投稿して独自の実験を行ったところ、チャットボットから直接エディタに貼り付けた場合は赤い画面が表示されましたが、Claude から直接来ないテキスト(同じ生成された物語であっても)を貼り付けた場合はその画面が消えました。
この Claude 検出機能に関する投稿には、アーティファクトが検出されたファンフィクションの例も添えられていましたが、匿名の作成者はこれはシステムが正常に動作していることを示すためのものであり、「不信感を生む環境を作ったり、特定のユーザーを非難するためではない」と述べています。しかし、ファンフィクションコミュニティはすぐに動員され、ツールによってフラグ付けされた作品の著者を公的に名指しして恥じさせる動きを見せています。また、その作成者自身も AI を肯定的なものと捉えていません。「ファンドムは、他者とつながり、協働するユニークな空間です。それは人間性という要素と、それを駆動し、そこから栄養を得る創造的な火花によって成り立っています」と同氏は語りました。「もし私たちが無自覚に AI によってこれらの空間が汚染されることを許してしまうなら、そこにはいったい何が残るのでしょうか?」
アンソロピックは、ファンが作成した Claude デテクターが説明通りに機能するかどうかを検証するという私の依頼に対して回答しませんでした。しかし、ここで示された方法論は妥当に見え、私たちの独自のテストもそれを裏付けています。もしボットが何らかの形で使用されていないのであれば、物語に Claude のコードが存在する理由は見当たりません。ただし、偽陰性(false negatives)と過度な一般化のリスクは明確にあります。
このコードラッピングは、テキストを Claude から直接 AO3 のエディタにコピーした場合のみ保持されるため、Google ドキュメントや Microsoft Word で編集された後に AO3 に移動されたものは検出できません。生計を立てるために執筆している者として、CMS へ直接書き込むことのリスクについて証言できます。フラグ付けされた作家の何人かはすでに作品を更新してアーティファクトを削除しており、今後の作品はこのツールを容易に回避できるでしょう。
逆に、このタグは特定の作品で Claude がどの程度使用されたかを示すものではありません。その一瞬で視界を奪われるような赤い画面は、物語全体が完全に AI によって生成されたことを意味する一方で、作者が数文の手書きの文章をスペルチェックや翻訳のために Claude に貼り付け、その後 AO3 に戻しただけの可能性もあります。
これは一部のファンダムメンバーにとっては問題ではありません。彼らは生成 AI のいかなる使用も、より広い創造コミュニティに対する許されない裏切りと見なしています。多くの人が、この技術の環境への影響や、オープンウェブをスクレイピングしてトレーニングされていることへの懸念を挙げており、そこには AO3 などのプラットフォームにアップロードされたファン作品も含まれている可能性があります。
この特定のツールの適用範囲は限定的です。AO3 はファン作品を公開する唯一のプラットフォームではなく、Claude も多数ある AI モデルの一つに過ぎません。少なくとも 1 人の人物が、「Claude」「Deepseek」、および「ChatGPT」の使用を検出できる独自のコードを作成したと主張していますが、その解決策を一般に公開しておらず、またその仕組みについても説明していません。私は Google と OpenAI に、同様の手段で検出可能なテキスト生成における痕跡が自社のモデルに残っていないか尋ねましたが、回答はありませんでした。
実際、普遍的かつ信頼性の高いシステムが存在するとしたら驚くべきことです。私はここ数年、AI 検知を取り巻く問題について報告を続けており、私の知る限り、現在、人間が手入力したテキストと生成されたテキストを区別するための信頼できる技術的解決策は*存在しません*。C2PA コンテンツ認証(Content Credentials)や Google の SynthID といったシステムは、画像、動画、さらには音声における生成 AI の特定に向けて一定の進展を見せていますが、これらはコピー&ペーストされたテキストには継承されない不可視の透かしやメタデータに依存しています。
AI 企業には少なくとも社内でこの問題を解決するインセンティブがすべて存在します
これは将来変わる可能性があり、AI 企業には少なくとも内部でこの問題を解決する十分な動機があります。初期のモデルはインターネットから無差別に収集されたテキストで訓練されており、人間の文章がその合成 counterpart に押され出されるにつれ、「モデル崩壊」と呼ばれるシナリオに陥るリスクがあり、これにより出力の精度が低下する可能性があります。
しかし今はまだ、ファンダムコミュニティは主に「雰囲気」に頼っています。ほとんどのファンフィクションは AO3 のスキン(スタイル)のようなツールで判断されるのではなく、「兆候」によって評価されます。そこには特定の文構造(有名な「それは X ではなく Y だ」という表現など)から、過剰な装飾的な比喩の使用まで何でも含まれます。(少なくともこれまでにファンダム内でベンチが人間になるという事例はありません。)しかし私たちは、AI がそのような書き方をするのは、実際に人間が書いたものを訓練データとして使用しているからであり、私たちを模倣しようとしていることを忘れてはいけません。私の AO3 のブックマークを共有するほど大胆ではありませんが、ChatGPT 以前のインターネット時代にも、この疑わしい嗅ぎテストに合格しないような、あまりにも大げさなファンフィクションを読んだことは間違いありません。
このコンテンツは、あなたのクッキー設定のために表示されていません。このコンテンツを読み込むには、以下の「許可」ボタンをクリックして、「ソーシャルメディアおよび埋め込みコンテンツ」のクッキーを有効にしてください。これらのクッキーは、埋め込みコンテンツの出所となる第三者ソースによって設定・管理されます。
AO3 上で AI による作品と人間による作品を見分けるための最良の解決策は、すでに利用可能です:同サイトの堅牢なタグ付けシステムです。「Generative AI を使用して作成」というタグが存在し、多くの著者が Claude などのツールの使用を開示するためにこれを付与しています。ただし、これには誠実な透明性が求められますが、反発がある現状では誠実さを持つインセンティブはほとんどありません。また、ファンフィクションは規制された業界ではなく、趣味であるべきだという点も忘れてはいけません。
AI が本物の人間による創造性から注目を奪うのを防ぐこうした取り組みの中で、認められるべきとされる執筆の質に適合しない著者たちが、進行中の魔女狩りの無実の犠牲者となる可能性があります。少なくとも一人の作家は、信頼していた別の人物が Claude を使用して ファンフィクションを編集した ために、すでにこの騒動に巻き込まれています。したがって、次に読むファンフィクションが少し機械的に感じられたとしても、それが実際にロボットが生み出したものではない可能性を念頭に置いてください。
この物語のトピックや著者をフォローして、パーソナライズされたホームページフィードで類似のコンテンツをもっと見たり、メール更新を受け取ったりしてください。
- ジェス・ウェザーベッド
-
-
-
-
-
-
-
原文を表示
Over the past week, a new fanworks movement has kicked off, with the aim to root out authors using generative AI. But the detection methods being implemented are questionable, and any fanfic writer could be caught in the crossfire.
Broad distaste around the use of Claude, ChatGPT, and other AI tools has long been *a thing* in creative communities, including the world of fanfiction. Readers and writers have passed around tips for spotting supposedly AI-generated works, citing anything from em dashes to the broad concept of purple prose. But on June 29th, an anonymous X account called @heatedrivalryai promised a seemingly more reliable solution. It posted a skin — similar to an extension — for the popular fanfic repository Archive of Our Own (AO3) that would purportedly identify coding artifacts left behind by Anthropic’s Claude bot.
“When a Claude-generated response is pasted directly into AO3 from Claude, the text is wrapped by a Claude-injected code ‘font-claude-response-body,’” said the @heatedrivalryai account. “Its presence indicates the use of Claude definitively.” When a user visits a page (like a work of fanfic) with this code, the skin turns the entire background red.
Several test posts have been published to AO3 that allow users to check if it works. The screen immediately turned red when I tested the skin against these examples myself, and I published a Claude-generated short story to run my own experiment just in case. The red screen appeared when I directly pasted from the chatbot into the editor and vanished if I pasted text (including the exact same generated story) that didn’t come straight from Claude.
The Claude detector post was accompanied by examples of fanfic where the artifacts were spotted, which the anonymous creator said was meant to demonstrate the system works, not “create an environment of mistrust or accuse particular users.” But fanfic communities have quickly mobilized to publicly name and shame writers whose published works were flagged by the tool, and its creator certainly doesn’t consider AI a positive thing. “Fandom is a uniquely connective, collaborative space. It thrives on the human element and the creative spark which drives it and feeds off it,” they said. “If we unknowingly allow AI to corrupt these spaces, what will be left of them?”
Anthropic did not respond to my request to verify if the fan-made Claude detector works as described. The methodology here does look sound, however, and our own testing backs it up. There’s no apparent reason for the Claude code to be present in a story if the bot wasn’t used somehow. But there’s a clear risk of both false negatives and overgeneralizations.
The code wrapping is only preserved if text is copied directly from Claude into AO3’s editor, so it won’t catch anything edited in Google Docs or Microsoft Word and then moved to AO3 — and as someone who writes for a living, I can testify to how risky writing straight into a CMS is. Some writers who have been flagged have already updated their works to remove the artifacts, and future works can easily evade the tool.
Conversely, the tag doesn’t reveal how heavily Claude was used in a given work. That flashbanged scarlet screen could mean the entire story was fully AI-generated, or that an author pasted a few human-written sentences into Claude for spell-checking or translation, then moved them back into AO3.
That hasn’t mattered to some fandom members, who view *any* use of generative AI as an inexcusable betrayal to the wider creative community. Many people cite concerns over the environmental impact of the technology and how it’s trained by scraping the open web, which likely includes fanworks uploaded to platforms like AO3.
This particular tool’s applicability is limited — AO3 isn’t the only platform for publishing fanworks, and Claude is just one of many AI models. At least one person claims they’ve written separate code that can detect “Claude, Deepseek, and some ChatGPT” usage, but they haven’t released that solution to the public or explained how it works. I asked Google and OpenAI if their models leave any traceable artifacts in text generation that could be detected by similar means, but they haven’t responded.
In fact, it’d be highly surprising if a universally reliable system existed. I’ve been reporting on the issues surrounding AI detection for a few years now, and to my knowledge, there *isn’t* currently a reliable technological solution for distinguishing generated text from that typed out by human hands. Systems like C2PA Content Credentials and Google’s SynthID are making some progress toward identifying generative AI in images, videos, and even audio, but these rely on invisible watermarks and metadata that don’t carry over for copy-pasted text.
AI companies have every incentive to at least solve the problem internally
That could change in the future, and AI companies have every incentive to at least solve the problem internally. Early models were trained on text indiscriminately scraped from the internet, and as human writing is crowded out by its synthetic counterpart, they could risk a “model collapse” scenario that would degrade the accuracy of outputs.
For now, though, fandom communities are still mostly relying on vibes. Most fanfics aren’t judged by a tool like the AO3 skin, but by “tells” that could include anything from specific sentence structures — like the notorious “it’s not X, it’s Y” — to overuse of flowery metaphors. (At least nobody in fandom, so far, has benches becoming men.) But we have to remember that AI often Writes Like That because it was trained on stuff that real people have written. It’s trying to replicate us. I’m not bold enough to share my own AO3 bookmarks, but I’ve definitely read some overly grandiloquent fanfics in the pre-ChatGPT internet days that wouldn’t pass this dubious sniff test.
This content isn't visible due to your cookie preferences. To load this content, click the Allow button below to opt in to "Social Media & Embedded Content" cookies. These cookies are set and controlled by the third party sources from which the embedded content originates.
The best solution for distinguishing AI works on AO3 is already available: the site’s robust tagging system. A “Created Using Generative AI” tag exists, and many authors do include it to disclose the use of tools like Claude. That requires honest transparency, though, and there’s little incentive for honesty given the backlash. It’s also worth remembering that fanfiction is supposed to be a hobby, not a regulated industry.
With these efforts to prevent AI from taking eyeballs away from genuine human-driven creativity, authors who don’t conform to what’s deemed to be an acceptable quality of writing may become innocent victims of the ongoing witch hunt. At least one writer has already been caught up in this because another person they trusted to edit their fic did so using Claude. So if the next fanfic you read feels a little robotic, just bear in mind that it might not *actually* be the product of a robot.
Follow topics and authors from this story to see more like this in your personalized homepage feed and to receive email updates.
- Jess Weatherbed
-
-
-
-
-
-
-
-
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み