Firefox 開発元、Google のブラウザへの Prompt API 組み込みを批判
Mozilla は、Google が Chrome に Prompt API を組み込む決定に対し、ウェブのオープン性を損なう恐れがあるとして強く反対を表明している。
キーポイント
ウェブのオープン性への懸念
Mozilla は Google の AI プラミング(Prompt API)がブラウザに直接組み込まれることにより、ウェブの標準化とオープン性が損なわれる可能性を強く危惧している。
技術導入の既成事実
Mozilla の反発は遅れていたが、すでに Chrome や Microsoft Edge において Prompt API のテストが行われており、実装が進んでいる状況にある。
ブラウザベンダー間の対立
主要ブラウザプロバイダーである Google と Mozilla の間で、AI 機能の統合方針を巡る明確な思想的・戦略的対立が表面化した。
影響分析・編集コメントを表示
影響分析
このニュースは、生成 AI の普及がブラウザレベルで標準化される過程で生じる「プラットフォームの囲い込み」リスクを浮き彫りにしています。Google の主導する技術標準がウェブ全体の多様性を脅かすという Mozilla の懸念は、今後の Web 標準化プロセスにおけるガバナンスや競争原理の行方に大きな影響を与える可能性があります。
編集コメント
ブラウザという最も重要なウェブ入口において、AI 機能がどう実装されるかは、今後のインターネットのあり方を左右する重要な分岐点です。
Mozilla は、AI の配管機能を Chrome ブラウザに組み込むという Google の決定に対して反対を再確認したが、Prompt API と呼ばれるこの技術がすでに Chrome や Microsoft Edge でテストされていることを考えると、やや遅れての声明となった。
Mozilla のウェブ開発者関係責任者である Jake Archibald は、ローカルの機械学習モデルからプロンプトとレスポンスを送受信するための標準的な手段を提供する本 API に関する GitHub の議論 で、組織の懸念を明確に述べた。
「私たちは引き続きこの API に反対しており、ウェブプラットフォームの相互運用性、更新可能性、そして中立性に深刻な悪影響を及ぼすものだと考えている」と Archibald は語った。
Google が説明する Prompt API は、「Web ページがブラウザに提供された言語モデルに対して直接プロンプトを送信できる能力を与える」としている。これは、Chrome を通じてローカル推論のためにダウンロード可能なほど小型の Google の Gemini Nano モデルに対し、自然言語による指示を送る手段を提供するものである。
そのサイズは決して小さくない——Google は 22 GB の空き容量を推奨しているが、デスクトップ利用向けの Nano (v3Nano) モデルは約 4.27 GB である。
Web 開発者はすでに AI モデルと対話するためのさまざまな手段を持っている。ホストされたモデルとの通信にはクラウドサービス API を使用できるし、JavaScript ランタイムフレームワーク、WASM(WebAssembly)、または WebGPU などの技術を通じてローカルモデルにアクセスすることも可能だ。
OpenAI や Perplexity のようなさまざまなベンダーは、リモートホスト型の AI モデルへのアクセスを埋め込んだブラウザを提供しています。Mozilla 自身も Firefox で AI ベースのスマートウィンドウ をテストしており、AI モデルのスケーフォールディング(基盤構築)のためのツール も開発中です。
Prompt API は、ブラウザのセキュリティメカニズムを活用してローカル推論をより容易に行えるようにし、応答時間の短縮、オフラインでの利用を可能にし、AI サービスの統合におけるコスト効率の高い方法(例えば、ユーザーが有料の AI API キーを持っていない場合に無料の AI フォールバックを提供するなど)を提供することを目的としています。
Archibald が表明した Mozilla の懸念は、Prompt API がウェブに何を意味するか、さらには Google の導入に対する正当性に関わるものです。
まず、彼は Google 独自の Nano モデルがデフォルトとなり、開発者が AI モデルの非確定的な応答をより予測可能にするために、それに対して標準化を進めることを懸念しています。彼は、この傾向は共通のユーザー体験のために Apple や Mozilla が Nano のライセンスを取得する圧力につながると主張します。
おそらくさらに重要なのは、Archibald が指摘するように、Prompt API を使用するには Google の 生成 AI 禁止利用ポリシー に同意する必要があり、そこには違法とは必ずしも言えない活動(「不気味な」コンテンツの生成など)が禁止されているという点です。
「これは Web プラットフォーム上の API にとって悪い方向であり、使用に関する [ブラウザ] 固有のルールを持つより多くの API に対して懸念される先例を設定する」と彼は述べた。
最後に、アーチボルドは、Google が一部のソーシャルメディア投稿を抽出して選別し、それを開発者の支持の大規模な広がりと呼ぶことで、この API に対する需要を誤って表現したと主張している。
「blink-dev への実装意向では、Web 開発者を『強く肯定的』としており、根拠として説明資料へのリンクを提示している」と彼は記述した。「そこで提供された証拠は、その主張に合致していないように思われる」
- Hashicorp の共同創設者ミッチェル・ハシモト氏は、GitHub を「もはや真剣な作業の場ではない」と発言
- Google がクリティカルな Gemini CLI バグに対して行った修正が、あなたの CI/CD パイプラインを破損させる可能性あり
- AWS は、深刻なサーバーメモリ不足が顧客をクラウドへ駆り立てていると発表
- Linux の暗号化コードの欠陥が、ルート権限取得への高速経路を提供
電子メールにおいて、アーチボルドは *The Register* に対し、この質問は Prompt API が Web に有益かどうかであると述べ、Mozilla はそれが有益ではないと考えていると伝えた。
「核心的な問題は相互運用性である」と彼は言った。「プロンプトはモデルに強く結合されており、開発者は必然的に、自身が構築する対象となるあらゆるモデルの癖やポリシーに合わせて調整せざるを得なくなる」
「それが、モデル固有のコードパスを生み出す結果となり、再びブラウザ互換性の問題に直面することになります。利用規約の問題もその一部です:Web API の使用が特定のベンダーのコンテンツポリシー(特に法律を超えたもの)を受け入れることを意味する場合、あなたはもはやオープンプラットフォームのために構築しているわけではありません。」
Google による開発者の熱意の誇張について、アーチボルド氏は、AI 機能に関心を持つ開発者が確かに存在する一方で、Google はその証拠を提供しなかったと述べました。
「信号は二極化しており、『強く肯定的』ではありません」と彼は説明しました。「どちらにせよ、開発者の需要だけでは基準を満たしません。問題は、この API がプラットフォームを特定のベンダーのモデルに縛り付けることなく、実装全体で機能するかどうかです。」
Google はコメント依頼に対して即座には回答しませんでした。
しかし木曜日、プロンプト API の出荷を担当した Google Chrome エンジニアのリック・バイアーズが、GitHub 上の議論に参加し 発言 しました。これはアーチボルド氏が表明した懸念を認めるためのものです。
「Chromium でこれを出荷するための Blink API オーナー承認者の一人として、私は Mozilla の標準化ポジションで示された懸念を共有することを認めざるを得ません」と彼は書き込みました。「私が異なるのは、何かが起こるかもしれないという恐怖からイノベーションの停滞を恐れて誤った側を選ぶのではなく、実験を促進し、失敗から学び、競争を促す道を選択する点です。」
バイヤーズ氏は、議論を進展させるためにウェブコミュニティに対し、被害の実態を収集するよう協力を呼びかけました。暗号化メディア拡張機能(EME)など他の論争的なウェブ技術をめぐる議論に言及し、その結果は予測されたほど悲惨なものではないと示唆しています。
しかし、データに焦点を当てても、現時点では Google の主張にはあまり寄与していません。2 月に作成され、Prompt API を使用した Chrome(Gemini Nano)と Edge(Phi-4 mini-instruct)のパフォーマンスを比較したレポートによると、これらのモデルは非常に良い結果を提供していません。
「生成タスク(文章作成、タグ生成など)において、Edge の回答の 24.29% と Chrome の回答の 15.17% がタスクを完了できませんでした」とレポートは述べています。これは、5 段階評価で 2 点以下を失敗と定義する評価基準に基づいたものです。「分類タスクにおいては、Edge の回答の 29.58% と Chrome の回答の 23.93% が入力を正しくラベル付けまたは分類できませんでした」。
根拠のある正確さ(groundedness)と精度については、Edge は 17% のケースで失敗し(「幻覚」を起こし)、Chrome は 6% のケースで失敗しました。
それがウェブにとって良いことでしょうか?Chrome に聞いてみることもできますが、信頼できる答えが得られるとは限りません。®
原文を表示
Mozilla has reiterated its opposition to Google's decision to build AI plumbing into its Chrome browser, though rather belatedly now that the technology, known as the Prompt API, is already being tested in Chrome and Microsoft Edge.
Jake Archibald, Mozilla web developer relations lead, articulated the org’s concerns in a GitHub discussion of the API, which provides a standard way to send and receive prompts and responses from a local machine learning model.
"We continue to oppose this API, and feel it has severe negative consequences to the interoperability, updatability, and neutrality of the web platform," said Archibald.
The Prompt API, as Google describes it, "gives web pages the ability to directly prompt a browser-provided language model." It provides a way to send natural language instructions to Google's Gemini Nano model, which is small enough to be downloaded for local inference through Chrome.
It's not that small – Google recommends having 22 GB of space available, though the Nano (v3Nano) model for desktop use is ~4.27 GB.
Web developers already have a variety of ways to interact with AI models. They can use cloud service APIs to communicate with hosted models. Or they can access local models through technologies like JavaScript runtime frameworks, WASM, or WebGPU.
Various vendors like OpenAI and Perplexity have shipped browsers that embed access to remotely hosted AI models. Mozilla itself is testing an AI-based Smart Window in Firefox and it's developing tools for AI model scaffolding.
The Prompt API aims to make it easier to run local inference in a way that takes advantage of browser security mechanisms, to produce faster response times, to allow offline usage, and to provide more cost effective ways to integrate AI services (e.g. providing a free AI fallback if users lack a paid AI API key).
Mozilla's concern, as articulated by Archibald, has to do with what the Prompt API means for the web, not to mention Google's justification for deployment.
First, he worries that Google's own Nano model will become the default and that developers will standardize on it in an effort to make the non-deterministic responses of an AI model more predictable. That tendency, he argues, will create pressure for Apple and Mozilla to license Nano, for the sake of a common user experience.
Perhaps more significantly, Archibald notes that using the Prompt API requires agreeing to Google's Generative AI Prohibited Uses Policy, which prohibits activities that are not necessarily illegal, like generating "disturbing" content.
"This seems like a bad direction for an API on the web platform, and sets a worrying precedent for more APIs that have [browser]-specific rules around usage," he said.
Finally, Archibald argues that Google misrepresented demand for the API by cherry-picking a few social media posts and calling that a groundswell of developer support.
"The intent to ship on blink-dev states web developers as 'Strongly positive,' and links to the explainer for evidence," he wrote. "The evidence provided there does not seem to fit the claim."
- Hashicorp co-founder Mitchell Hashimoto says GitHub 'no longer a place for serious work'
- Google's fix for critical Gemini CLI bug might break your CI/CD pipelines
- AWS says acute server memory shortage is driving customers to the cloud
- Linux cryptographic code flaw offers fast route to root
In an email, Archibald told *The Register* that the question is whether the Prompt API is good for the web, and Mozilla doesn't believe that it is.
"The core problem is interoperability," he said. "Prompts are tightly coupled to models; developers will inevitably tune to the quirks and policies of whatever model they're building against.
"That's how you end up with model-specific code paths, which is the browser-compatibility problem all over again. The T&C issue is part of that: if using a web API means accepting a specific vendor's content policy (especially one that goes beyond law) you're not really building for an open platform anymore."
With regard to Google's exaggeration of developer enthusiasm, Archibald said there are definitely devs interested in AI capabilities but Google failed to provide evidence of that.
"The signal is polarised, not 'strongly positive,'" he explained. "Either way, developer demand alone doesn't meet the bar. The question is whether the API can work across implementations without tying the platform to one vendor's model."
Google did not immediately respond to a request for comment.
However, on Thursday, Rick Byers, the Google Chrome engineer responsible for shipping the Prompt API, chimed in to the GitHub discussion to acknowledge the concerns articulated by Archibald.
"As one of the blink API owner approvers for shipping this in Chromium, I admit that I share the concerns here in Mozilla's standards position," he wrote. "Where I differ is in preferring paths that promote experimentation, learning from mistakes, and competition to those which err on the side of stalling innovation out of fear of what *might* happen."
Byers asked the web community to help collect evidence of harm to advance the discussion. Pointing to the debate over other controversial web technologies like Encrypted Media Extensions (EME), he suggested the outcome has not been as dire as predicted.
But focusing on data, so far, hasn't done much for Google's cause. According to a report created in February that compares the performance of Chrome (Gemini Nano) and Edge (Phi-4 mini-instruct) using the Prompt API, these models just don't provide very good results.
"For generative tasks (composition, tag generation, etc), 24.29 percent of Edge's and 15.17 percent of Chrome's responses failed to complete the task," the report says, in reference to a rubric that defines failure as a score of 2 or less on a scale of 5. "For classification tasks, 29.58 percent of Edge's and 23.93 percent of Chrome's responses did not label or categorize the input correctly."
In terms of groundedness and accuracy, Edge failed ("hallucinated") 17 percent of the time while Chrome failed 6 percent of the time.
Is that good for the web? You could ask Chrome but you might not get a reliable answer. ®
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み