#テキスト拡散モデル のAIニュース
3件の記事
DiffusionGemma:テキスト生成が4倍高速化(5分読了)
Google の DiffusionGemma は、26B モデルの MoE 構造を採用し、テキストブロックを並列生成することで GPU 上で最大4倍の速度向上を実現しました。このモデルは低遅延と双方向アテンションを特徴とし、量子化により高価なコンシューマー向け GPU でも動作可能ですが、標準モデルと比較して品質が若干低下します。
TLDR AI·6月11日·★★★★
Google AI、テキスト拡散を用いた26B MoEオープンモデル「DiffusionGemma」を公開
Google DeepMindチームは、標準的な自己回帰型ではなくテキスト拡散方式を採用した実験的オープンモデル「DiffusionGemma」をApache 2.0ライセンスで公開し、開発者や研究者向けに高速な生成ワークフローを提供する。
MarkTechPost·6月11日·★★★★
標準的な大規模言語モデルを超えて
線形アテンション・ハイブリッド、テキスト拡散、コード世界モデル、小型再帰型トランスフォーマーなど、次世代AI技術の新たなアプローチを紹介。
Sebastian Raschka·11月4日·★★★★