裁判所、Meta の成人向けサイトデータ収集訴訟を却下せず Meta に訴えられ得ると判断
カリフォルニア北部連邦地裁の裁判官が、メタ社による成人向けコンテンツの無断スクレイピングを「偶然の個別行為」ではなく「組織的なデータ収集」と認定し、ストライク3・ホールディングスの訴訟を却下しない判断を下した。
キーポイント
裁判官によるメタ社の主張の否定
メタ社がスクレイピングを「一部の従業員の個人的行為」と主張したが、裁判官は同一日・同一IP範囲での大量ダウンロードパターンから、これは組織的なデータ収集計画であると認定した。
AI学習データとしての無断利用の証拠
メタ社のIPアドレスが「Teen」などのキーワードを含む成人向け動画やアニメを体系的に取得しており、これが生成AIモデルのトレーニング用データ収集の一環であった可能性が高いと判断された。
著作権侵害訴訟の継続許可
ストライク3・ホールディングスが保有するBlacked.comなどのコンテンツが、メタ社の内部メールで示唆される通り81テラバイト規模のデータセットに含まれていたことが確認され、訴訟は続行される。
AI学習の使用の有無は問われない
メタがストライク3の動画をAIモデルの訓練に使用したかどうかは問題ではなく、torrenting(共有)行為自体が著作権侵害と判断された。
違法なダウンロードと配布行為
被告はファイルを不正にダウンロードしただけでなく、「シード」して他のユーザーへ海賊版を配布したことが認められた。
影響分析・編集コメントを表示
影響分析
この判決は、生成AI業界が直面する最大のリスクの一つである「データ収集の法的境界線」を明確にする重要な転換点です。特に、企業が組織的なスクレイピング行為を「個人の過失」や「偶発的行動」として免責しようとする試みが裁判所によって否定されたことは、今後のAIモデル開発におけるコンプライアンスと著作権対応に大きな影響を与えるでしょう。
編集コメント
AI開発におけるデータソースの合法性が問われる中、企業側の「偶発的収集」主張が裁判で退けられたことは、業界全体にコンプライアンス強化を迫る重要な信号です。
image連邦裁判所の判事が、Blacked、Vixen、Tushy などの人気サイトを所有するストライク3ホールディングス(Strike 3 Holdings)が提起した訴訟の却下をメタ社が求めた件について、これを退ける判決を下しました。この訴訟は、同社が成人向け動画のスクレイピング(データ収集)を行ったことに対するものです。
この決定は、AI モデルの学習データを構築するためにインターネットから膨大な量の著作権素材を無断で収集するメタ社の理不尽な正当化を示すものであり、現在の生成 AI ブーム以前からモデル学習用データとしてスクレイピングの対象となってきた成人向けコンテンツクリエイターにとって注目に値します。
ストライク3ホールディングスは、別の訴訟で内部のメタ社メールが明らかになり、同社が書籍、映画、テレビ番組、そして成人向け動画を含む著作権素材のtorrenting(ファイル共有)のための大規模なオープン検索エンジンである「Anna's Archive」をスクレイピングして81テラバイト以上のデータをダウンロードしたことが示されたことをきっかけに、ほぼ1年前に訴訟を起こしました。ストライク3ホールディングスの調査によると、2018年から2025年の間にメタ社に所属する47のIPアドレスが使用され、同社の動画2,396本を合計6,008回ダウンロードしたことが判明しました。木曜日、カリフォルニア州北部地区連邦地方裁判所の李栄美(Eumi K. Lee)判事が、メタ社による訴訟却下の試みを退け、訴訟の続行を許可しました。
Meta は、Strike 3 Holdings が Meta が実際に自社の AI モデルの学習に Strike 3 Holdings の動画を使用する意図を持っていたことを示せなかったと主張し、また、動画のダウンロードは会社自体が行ったものであり、悪質な従業員が勤務時間中に会社の IP アドレスからポルノをダウンロードした行為とは異なるものであると主張しました。
裁判官の判決によると、Strike 3 Holdings の調査では、Meta の IP アドレス間で調整された動きが確認され、「無作為な従業員の行動」ではなく「データを収集するための協調的な取り組み」であったことが証明されました。具体的には、Strike 3 Holdings は、Meta の IP アドレスが同じ日にポルノからアニメ、シットコムに至るまで、ファイル名が類似したファイルを torrent(ピアツーピア共有)していたことを示しました。これは、会社が特定のキーワードに基づいてファイルをダウンロードしていた可能性を示唆しています。
「例えば、IP レンジ A と F は 2022 年 12 月 15 日に以下のファイルを torrent しました:『Teen Sex Sessions 2 (2012)』、『Teen Titans Go to the Movies (2018)』、『Teens Love Tats XXX』、『TeensLoveAnal.16.09.30.Amara』、『Teenfidelity Pics』、『TeensLoveAnal.16.06.10.Casey』、『Teenage Mutant Ninja Turtles (1987-1996)』、『Teen Mom Girls Night In S02E08』、『TeenyTaboo.22.12.07.Kiana』、そして『TeenageDelinquents.Maryjane』です」と判決は述べています。「同じ日に、企業用 IP アドレスを使用して『TeenCurves.22.12.09.Willow』が torrent されました。これらのファイル間のつながりは明白です:すべてのファイル名に『teen(ティーン)』という単語が含まれています。」
裁判官は、Meta がこれらのファイルを同時にダウンロードしたことが、独立して行動する複数の個別の Meta 従業員による行為であると示唆することは、「信憑性に欠ける」と述べました。
裁判官はまた、Meta が実際に Strike 3 Holdings の動画を AI モデルの学習に使用したかどうかは問題ではなく、Meta が Torrenting(torrent)によって同社の著作権を侵害した点で違法であるとも説明しました。Meta はファイルを不正にダウンロードしただけでなく、「シード」も行ったため、海賊版を他のユーザーへ配布していたことになります。
「要するに、原告 [Strike 3 Holdings] は、被告 [Meta] が映画の Torrenting(torrent)に基づき、直接責任、代替責任、および共同著作権侵害のいずれにも問われる可能性があると合理的に主張している」と判決は述べています。「したがって、被告の却下請求は棄却されます。
原文を表示
imageA federal judge has rejected Meta’s attempt to dismiss a lawsuit from Strike 3 Holdings, the company that owns popular sites like Blacked, Vixen, and Tushy, for scraping its porn videos.
The decision shows Meta’s nonsensical justification for scraping massive amounts of copyrighted material from the internet in order to train its AI models, and is notable for adult content creators, who have been scraped for model training data long before the current generative AI boom.
Strike 3 Holding first filed its lawsuit almost a year ago after internal Meta emails revealed in a different lawsuit showed that the company downloaded over 81 terabytes of data by scraping Anna’s Archive, a massive open search search engine for torrenting copyrighted material including books, movies, TV shows, and porn. A Strike 3 Holding investigation found that 47 IP addresses belonging to Meta were used to torrent 2,396 of its videos a total of 6,008 times between 2018 and 2025. On Thursday, Judge of the United States District Court for the Northern District of California Judge Eumi K. Lee rejected Meta’s attempt to dismiss the lawsuit, allowing it to move forward.
Meta argued that Strike 3 Holdings failed to show that Meta actually intended to use Strike 3 Holdings’ videos to train its AI models and that Meta, the company, was actually responsible for downloading the videos, as opposed to rogue employees downloading porn on company time from company IP addresses.
According to the judge’s ruling, Strike 3 Holdings’ investigation showed coordination across Meta’s IP addresses that proved “a coordinated effort to gather data,” as opposed to the action of random employees. Specifically, Strike 3 Holdings showed that Meta’s IP addresses torrented files with similar file names on the same day, ranging from porn to cartoons and sitcoms, suggesting the company was downloading files based on key terms.
“For example, IP Ranges A and F torrented the following files on December 15, 2022: ‘Teen Sex Sessions 2 (2012),’ ‘Teen Titans Go to the Movies (2018),’ ‘Teens Love Tats XXX,’ ‘TeensLoveAnal.16.09.30.Amara,’ ‘Teenfidelity Pics,’ ‘TeensLoveAnal.16.06.10.Casey,’ ‘Teenage Mutant Ninja Turtles (1987-1996),’ ‘Teen Mom Girls Night In S02E08,’ ‘TeenyTaboo.22.12.07.Kiana,’ and ‘TeenageDelinquents.Maryjane,’” the decision says. “On the same day, a Corporate IP Address was used to torrent ‘TeenCurves.22.12.09.Willow.’ The connection between these files is plain: The word ‘teen’ appears in every file name.”
The judge said that Meta suggesting that its IP addresses downloading all these files at the same time was the work of different individual Meta employees acting independently “strains credulity.”
The judge also explained that whether Meta actually used Strike 3 Holdings’ videos to train its AI models is irrelevant because Meta violated Strike 3 Holdings’s copyright when it torrented its videos. It illegally downloaded the files and also “seeded” them, meaning they distributed the pirated to other users.
“In sum, Plaintiffs [Strike 3 Holdings] have plausibly alleged that Defendant [Meta] is liable for direct, vicarious, and contributory copyright infringement based on the torrenting of their films,” the decision said. “Defendant’s motion to dismiss is therefore DENIED.”
関連記事
ロボット学習データの収集は汚く地味な作業だ。一部の AI ラボはすでに XDOF にその業務を委託している
AI ラボの一部が、ロボット訓練に必要なデータ収集という汚く地味な作業を専門企業 XDOF に委託し、対価を支払っている事例が報告された。
「ディスカバリー・デイ」の幻想:人々がエイリアン映像を AI とは思わないと信じる誤解
映画『ディスカバリー・デイ』は、生放送でエイリアンのぼやけた映像が人類を団結させるとする flawed な前提に基づいており、その核心となる幻想は人々がそれを信じないという点にある。
この AI スタートアップは、脚本がヒット映画になるかを予測できると主張している
AI スタートアップの Quilty は、脚本を読むだけで映画の成功を正確に予測できるツールを提供すると発表した。しかし、実際に製品を試した人々の多くは、その予測精度に対して懐疑的な見方を示している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み