AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
404 Media·2026年6月3日 09:16·約5分で読める

Google、Play ストア開発者のコードを AI 訓練用に購入へ

#LLM#データ収集#コード生成#学習データ枯渇
TL;DR

Google が Play ストアの開発者に対し、AI コーディングツールの学習用としてコードベースへのアクセス権を非公開で購入するパイロットプログラムを開始した。

AI深層分析2026年6月3日 11:54
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

非公開のコード購入パイロット開始

Google が Play ストアのアプリ開発者にメールを送り、生産用コードやアーカイブされたプロジェクトへのアクセス権を「秘密保持契約」の下で購入するオファーを行っている。

2

AI 学習データ不足の裏返し

Web からスクレイピングできる公開データの枯渇や、競合他社(Anthropic, Microsoft)との技術格差を埋めるため、非公開の高品質なコードデータを有料で取得する戦略に転換している。

3

開発者へのインセンティブ設計

Google は知的財産権の開発者側への帰属と非独占ライセンスを明記し、「追加収益源」としての価値を強調しているが、AI 利用についてはメール本文では言及せず、リンク先で説明している。

4

非独占的な収益化プログラム

開発者はアプリの生産コードやアーカイブされたプロジェクトを共有することで追加収入を得られ、知的財産権は完全に保持されます。

5

AI 学習用実世界データの活用

Google は複雑なロジックの理解やコーディング評価ベンチマーク作成のために、実際の開発現場でテストされた高品質なコードベースを必要としています。

影響分析・編集コメントを表示

影響分析

このニュースは、生成AI業界における学習データの枯渇という構造的な課題が顕在化し、大手テック企業が公開データ依存からクローズドで高品質なデータを有料購入する新たなビジネスモデルへ移行しつつあることを示しています。また、開発者エコシステムとAI企業間の関係性が「利用」から「取引・パートナーシップ」へと変化し、コードの所有権やライセンスに関する新しい倫理的・法的議論を喚起する可能性があります。

編集コメント

公開データの限界が現実味を帯びる中、Google が開発者コミュニティから直接データを買い求める姿勢は、今後のAI学習データ市場の価格形成や権利関係に大きな影響を与える重要な転換点です。

imageimageGoogle は、Play ストアで Android アプリをリリースした開発者が作成したコードへのアクセス権を購入する提案を、静かに行ってきたことが 404 Media の取材で明らかになりました。これは同社が AI コーディングツールの訓練を行うためです。

Google は、数百万回のダウンロードがある Android アプリの開発者宛てに送られたメールにおいて、「機密コンテンツオファーパイロットに参加する」よう提案し、開発者が「アプリから追加の収益を創出できる」と述べています。Google のメールには、同社が開発者のコードベースへのアクセス権を購入したい理由は、「Google の開発者向けツールや製品の改善に役立てるためである」と記載されています。404 Media は、このプログラムが「機密」プログラムとして説明されていることについて情報を共有したことで会社からの報復を恐れたため、開発者の身元を匿名化しました。

「アプリを支えるコードやアーカイブされたプロジェクトの共有に対して報酬を受け取ってください」とメールには書かれています。メールでは、開発者がコードに対する知的財産権を保持し続けると明記されており、ライセンスは非独占的であるとされています。「現在のアプリを支えるアクティブなプロダクションコードベースであっても、もはや使用されていないプロトタイプやサイドプロジェクトのアーカイブであっても、そのコードには未開拓の価値がある可能性があります。これはツールと製品の変革を支援し、開発者エコシステムをサポートし、新たな収益源を開くための貴重な機会です。」

そのメールには人工知能に関する言及はありませんが、メール内のリンクは「AI 製品の改善に向けたパートナーシップ」についてのページへ誘導しています。

そのページでは、同社および他の AI 企業がインターネットからスクレイピングして入手した公開データに加え、「さまざまなメディア形式における非公開コンテンツの提供に対して対価を支払うこと」を模索していると説明されています。

「私たちは異なる種類のコンテンツの価値についてより多くを学び、今後どのように相互に有益な協力を継続できるかを探っています」と同ページは述べています。このページでは、AI ツールのトレーニングを、「個人を支援し、企業を支援し、そして社会全体を支援する」というミッション駆動型の機会として位置づけており、「AI は、世界が自然災害に対処・管理したり、医師が病気を早期に検出したりすることを助けるために、1 世代に一度の機会を提供している」としています。

コード生成 AI の開発において Google は競合他社に遅れをとっています。Anthropic は Claude Code の成功に乗じて OpenAI を上回る評価額を達成し、Microsoft の Copilot も広く採用されています。Google が開発者からコードを購入しようとしている事実は、同社がウェブからスクレイピングできるコンテンツのみを用いて十分な品質のコーディング AI を作成できていないことを示唆しており、さらに企業がトレーニングに使用可能なコンテンツが尽きつつあるという事実を浮き彫りにしています。Google は AI トレーニング用のサイトアクセス権を得るために Reddit に 6000 万ドルを支払ったことで有名ですが、その結果は賛否両論でした。

完全なメール文面は以下に転記します:

「Google パートナーシップチームに代わり、選抜された Google Play アプリ開発者の方々に、機密性の高いコンテンツ提供パイロットプログラムへの参加をご招待いたします。

アプリから追加の収益を創出するユニークな機会を提供したいと考えています。アプリの構築とユーザーベースの拡大には多大なる努力を払ってこられたことと思います。現在稼働中のアプリケーションを支える本番環境のコードベースであっても、もはや使用されていないプロトタイプやサイドプロジェクトのアーカイブであっても、そのコードには未開拓の価値がある可能性があります。これは、ツールや製品の変革を支援し、開発者エコシステムをサポートし、新たな収益機会を開くための特別な機会です。

この機会の概要:私たちは、Google の開発者向けツールおよび製品の改善に役立つ高品質な実世界ベースコードを探しています。本プログラムが提供する主な内容は以下の通りです。

• 追加の収益機会:アプリを支えるコードやアーカイブされたプロジェクトを共有することで報酬を受け取ることができます。

• 先行採用者としての役割:パイロットパートナーとして、今後は開発コミュニティと Google がどのように連携していくかを形作る立場となります。

• インパクトの創出:複雑なロジックの理解からコーディング評価(evals)やベンチマークの開発に至るまで、多様なユースケースにおいて実世界のコードが製品およびサービスの開発に有用であることを確認しています。本番環境でテスト済みのコードが直接的に貢献できます。

• コントロールの維持:本プログラムは非独占的です。知的財産権(IP)は 100% 保持され、アプリも完全にあなたの所有物であり、データを他の場所で収益化する権利も引き続き保有されます。」

Google のパートナーシップへの取り組みについては、当社のブログ記事で詳しくご紹介します。

原文を表示

imageimageGoogle has quietly been offering to buy access to code written by developers who have released Android apps on the Play Store in order to help the company train its AI coding tools, 404 Media has learned.

Google has emailed some app developers with an offer to “join a confidential content offer pilot,” that will allow developers to “generate additional revenue from your apps,” according to an email sent to the developer of an Android app that has millions of downloads. Google’s email says that the company wants to buy access to developers’ codebases “to help improve Google’s developer tools and products.” 404 Media granted the developer anonymity because they feared retaliation from the company for sharing info about what was described as a “confidential” program.

“Get paid for sharing the code powering your apps, as well as your archived projects,” the email says. The email says that the developer would retain the intellectual property rights to their code, and that the license would be non-exclusive. “Whether it's the active production codebase powering your current app, or archives of prototypes and side projects no longer in use, that code could have untapped value. This is a unique occasion to help transform tools and products, support the developer ecosystem, and unlock new revenue.”

The email does not mention artificial intelligence, but a link in the email goes to a page about “partnerships to improve our AI products.”

That page explains that, beyond the publicly-available data it and other AI companies have scraped from the internet, the company is seeking to “pay for the delivery of non-public content in a range of media formats.”

“We're learning more about the value of different types of content and how we can continue to create mutually beneficial collaborations in the future,” it says. The page frames the training of AI tools as a mission-driven opportunity for “helping individuals, helping businesses, [and] helping society at large: AI presents a once-in-a-generation opportunity to help the world combat and manage natural disasters, help doctors detect diseases earlier.”

Google has fallen behind its competitors in creating AI that generates code. Anthropic has rode the success of Claude Code to a valuation higher than OpenAI, and Microsoft’s Copilot has also been widely adopted. The fact that Google is trying to buy code from developers suggests that the company hasn’t been able to create a good enough coding AI using content that it can scrape from the web, and highlights the fact that companies are likely running out of content to train on. Google famously paid Reddit $60 million for access to its site for AI training, the results of which have been a bit of a mixed bag.

The full email is reproduced below:

“We are reaching out on behalf of the Google Partnerships team with an invitation for a select group of Google Play app developers to join a confidential content offer pilot.

We'd like to offer a unique opportunity to generate additional revenue from your apps. You've put a lot of hard work into building your app and growing its user base. Whether it's the active production codebase powering your current app, or archives of prototypes and side projects no longer in use, that code could have untapped value. This is a unique occasion to help transform tools and products, support the developer ecosystem, and unlock new revenue.

The Opportunity: We are looking for high-quality, real-world codebases to help improve Google's developer tools and products. Here is what this program offers you:

• Additional revenue opportunities: Get paid for sharing the code powering your apps, as well as your archived projects.

• Be an early adopter: As a pilot partner, you will shape how Google partners with the developer community moving forward.

• Drive impact: We've found real- world code to be useful to our product and service development across a wide variety of use cases, from understanding complex logic to developing coding evals and benchmarks. Your production tested code can directly help.

• Retain control: This is non-exclusive. You keep 100% of your IP, your app remains entirely yours, and you retain the right to monetize your data anywhere else.

You can learn more about Google's approach to partnerships in our blog post.”

この記事をシェア

関連記事

Ars Technica AI★42026年6月5日 05:44

ロシアのプロパガンダに抵抗する能力において最も優れた大規模言語モデルとは

エストニア言語研究所は、外国の敵対国が推進する危険なプロパガンダを拡散する懸念に対応するため、大規模言語モデルがロシア連邦の戦略的トピックに対して立場を取らない能力を評価する「プロパガンダ抵抗」ベンチマークを発表した。

AWS Machine Learning Blog★42026年6月5日 01:59

NVIDIA Nemotron 3 Ultra が Amazon SageMaker JumpStart で利用可能に

AWS は、推論速度を5倍向上させ、コストを最大30%削減する「NVIDIA Nemotron 3 Ultra」モデルを、Amazon SageMaker JumpStart でワンクリックデプロイ可能にしたと発表した。

404 Media★42026年6月4日 23:33

存在しない判例を引用した弁護士を裁判官が厳しく批判する様子を見よ

生成 AI を使用した弁護士が、架空の判例や引用を含む誤った書類を提出し、裁判所から時間浪費と職業への恥辱として非難されている事例が増えている。

ニュース一覧に戻る元記事を読む