Google Developers AI·2026年6月10日 09:00·約1分で読める

DiffusionGemma：開発者向けガイド

#Diffusion Model #Non-Autoregressive Generation #LLM Architecture #Inference Optimization #Google DeepMind

TL;DR

Google は、従来の自己回帰型生成に代わる拡散モデル「DiffusionGemma」を発表し、並列生成と双方向文脈理解により推論速度の向上と複雑なタスク処理能力を実現した。

AI深層分析2026年6月11日 04:03

重要/ 5段階

深度40%

キーポイント

非自己回帰型のアーキテクチャ転換

DiffusionGemma はトークンごとの逐次生成ではなく、拡散に基づく並列生成を採用し、推論速度を劇的に向上させています。

双方向文脈と自己修正機能

従来のモデルが苦手とする双方向の文脈認識とリアルタイムな自己修正機能を備え、Sudoku などの複雑な制約条件付きタスクに強い性能を発揮します。

汎用性とデプロイ容易性

256 トークンのブロックを反復的なノイズ除去で生成・ refinement する仕組みを持ち、vLLM などの既存推論フレームワークと統合可能で、消費者向け GPU でも動作します。

影響分析・編集コメントを表示

影響分析

この発表は、テキスト生成モデルの主流である自己回帰方式に対する強力な代替案を示すものであり、推論コストと速度の課題解決に新たな道筋を開きます。特に双方向文脈処理能力の強化は、複雑な推論タスクやリアルタイム応用における AI の実用性を大きく高める可能性があります。

編集コメント

従来の LLM のボトルネックである逐次生成の限界を打破する画期的なアプローチであり、今後の推論効率化のトレンドを決定づける重要な一歩と言えます。

DiffusionGemma は、Gemma 4 アーキテクチャを基盤とした実験的なテキスト生成モデルであり、トークンごとの自己回帰的生成ではなく拡散に基づく並列生成を採用しています。これにより、推論速度の大幅な向上、双方向コンテキストの認識能力、リアルタイムでの自己修正機能を実現しつつ、一般消費者向けの GPU 上でも展開可能です。そのアーキテクチャは、反復的なノイズ除去を通じて 256 トークンのブロックを並列で生成・洗練させることで、従来の言語モデルよりも数独（Sudoku）のような複雑な制約ベースのタスクをより効果的に処理でき、ファインチューニングからの大きな性能向上も示しています。このモデルは vLLM やその他の人気のある推論フレームワークと統合されており、開発者に対して高性能、効率的な長文コンテキストのスケーリング能力、そして直感的なカスタマイズと展開を兼ね備えた新しい非自己回帰的アプローチへのアクセスを提供します。

原文を表示

DiffusionGemma is an experimental text-generation model built on the Gemma 4 architecture that uses diffusion-based parallel generation instead of token-by-token autoregression, enabling much faster inference, bidirectional context awareness, and real-time self-correction while remaining deployable on consumer GPUs. Its architecture generates and refines 256-token blocks in parallel through iterative denoising, allowing it to handle complex constraint-based tasks such as Sudoku more effectively than traditional language models and demonstrating strong gains from fine-tuning. The model integrates with vLLM and other popular inference frameworks, giving developers access to a new non-autoregressive approach that combines high performance, efficient long-context scaling, and straightforward customization and deployment.

この記事をシェア

Ars Technica AI★42026年6月11日 04:29

Google DeepMind、ローカルAIを4倍高速化する拡散モデル「DiffusionGemma」を公開

Google DeepMindは、従来の逐次生成ではなくテキストブロックを並列生成する新モデル「DiffusionGemma」を発表し、Nvidia DGXやゲーミングGPUなどのローカル環境で処理速度を4倍に向上させたと発表した。

Google DeepMind★42026年6月11日 01:24

DiffusionGemma：テキスト生成が4倍高速化

Google DeepMind は、新しい手法「DiffusionGemma」を発表し、テキスト生成の速度を従来の4倍に向上させることに成功しました。

Simon Willison Blog★42026年6月11日 05:00

DiffusionGemma：Google の高速テキスト生成モデルが再登場

Google は昨年実験的に公開した Gemini Diffusion モデルの研究を再開し、DiffusionGemma として再発表しました。このモデルは以前 1 秒間に 857 トークンの生成速度を記録しており、テキスト生成の高速化に寄与する技術です。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み