DiffusionGemma：Google の高速テキスト生成モデルが再登場

**[DiffusionGemma](https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/)** 昨年 5 月、Google は実験的な Gemini Diffusion モデルを短時間だけ公開しました。当時私はそのプレビューを試して [記録を残しています](https://simonwillison.net/2025/May/21/gemini-diffusion/) が、その時の処理速度は 1 秒あたり 857 トークンでした。非常に魅力的なモデルでしたが、Google はその後これに関する追加発表を行いませんでした。 しかし、この研究が最善の形で復活しました。新しいオープンウェイト（Apache 2 ライセンス）の Gemma モデルとして登場したのです。それが [google/diffusiongemma-26B-A4B-it](https://huggingface.co/google/diffusiongemma-26B-A4B-it) です。 現在、NVIDIA はこのモデルを自社の NIM クラウド API で [無料でホストしています](https://build.nvidia.com/google/diffusiongemma-26b-a4b-it)。私はこの API を使用して、このペリカン（アジサシ）の画像を生成しました。その結果は [こちら](https://tools.simonwillison.net/markdown-svg-renderer#url=https%3A%2F%2Fgist.github.com%2Fsimonw%2Fe5e234a6dc6eef61e209ce1629620042) ですが、生成には 4.4 秒かかりました（`time uv run generate.py` の計測による）。これは 2,409 トークンを返したことになります。つまり、少なくとも 1 秒あたり 500 トークンの速度です。 ![image](https://static.simonwillison.net/static/2026/diffusiongemma-pelican.png) Via [Hacker News](https://news.ycombinator.com/item?id=48478471) Tags: [google](https://simonwillison.net/tags/google), [ai](https://simonwillison.net/tags/ai), [generative-ai](https://simonwillison.net/tags/generative-ai), [llms](https://simonwillison.net/tags/llms), [nvidia](https://simonwillison.net/tags/nvidia), [pelican-riding-a-bicycle](https://simonwillison.net/tags/pelican-riding-a-bicycle), [gemma](https://simonwillison.net/tags/gemma), [llm-release](https://simonwillison.net/tags/llm-release), [llm-performance](https://simonwillison.net/tags/llm-performance)

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト