ArXiv cs.AI·2026年3月6日 14:00·約1分

拡散言語モデルのデコード加速のための段階的改良規制

#Diffusion Language Model #Text Generation #Decoding Optimization #Reinforcement Learning #arXiv

TL;DR

Diffusion Language Modelsにおけるトークンごとの収束状態を予測軌道に基づいて評価し、温度制御による分布整形でデコーディング速度を大幅に向上させる「Progressive Refinement Regulation (PRR)」フレームワークが提案された。

AI深層分析2026年4月26日 02:29

重要/ 5段階

深度40%

キーポイント

既存手法の限界

従来の拡散言語モデルは全トークンに対して均一な精製ルールを適用するため、収束速度の異なるトークン間で冗長な計算が発生し、非効率であった。

PRRフレームワークの提案

トークンごとの将来の精製軌道（future refinement trajectory）に基づき、実証的な収束進捗を評価する動的な制御枠組み「Progressive Refinement Regulation」を導入した。

軽量コントローラーと学習手法

完全なデコーディングロールアウトから得られた信号を用いて、温度ベースの分布整形により精製を制御する軽量なトークンごとのコントローラーを、自己進化型学習スキームで習得する。

生成品質を維持した高速化

実験により、PRRは拡散言語モデルのデコーディング速度を大幅に加速させながら、生成品質を維持することに成功した。

影響分析・編集コメントを表示

影響分析

この研究は、拡散モデルを用いたテキスト生成のボトルネックである「冗長な反復処理」を解決する重要な一歩となります。特に、トークン単位で計算リソースを配分する動的制御は、大規模言語モデルのリアルタイム応用や低遅延サービスの実現に寄与する可能性があります。

編集コメント

拡散モデルのテキスト生成における「均一な処理」から「適応的な処理」への転換を示す興味深いアプローチであり、推論速度改善の新たなパラダイムを提供している。

arXiv:2603.04514v1 アナウンスタイプ: 新規

要約: 拡散言語モデルは、すべてのトークンに均一な改良ルールを適用した反復的ノイズ除去によりテキストを生成する。しかし実際には、トークンは異なる速度で安定化するため、冗長な改良が多分に生じ、ノイズ除去プロセスに対する改良制御の必要性が高まる。既存手法では、固定されたデコーディングプロセスにおいて、瞬間的・ステップレベルの信号から改良の必要性を評価するのが一般的である。これに対し、あるトークンが収束したかどうかは、その予測が将来の改良軌道に沿ってどのように変化するかによって定義される。さらに、改良ルールを変更すると将来の改良軌道が再形成され、それが今度は改良ルールの定式化方法を決定するため、改良制御は本質的に動的な性質を持つ。本研究では、完全なデコーディングのロールアウトから、経験的収束進捗をトークンレベルで定義する、漸進的かつ軌道に基づく改良制御フレームワーク「漸進的改良制御（Progressive Refinement Regulation, PRR）」を提案する。この信号に基づき、PRRは軽量なトークン単位のコントローラーを学習し、漸進的自己進化トレーニングスキームの下で温度ベースの分布形成により改良を制御する。実験により、PRRが生成品質を維持しつつ、拡散言語モデルのデコーディングを大幅に高速化することが示された。

原文を表示

arXiv:2603.04514v1 Announce Type: new

Abstract: Diffusion language models generate text through iterative denoising under a uniform refinement rule applied to all tokens. However, tokens stabilize at different rates in practice, leading to substantial redundant refinement and motivating refinement control over the denoising process. Existing approaches typically assess refinement necessity from instantaneous, step-level signals under a fixed decoding process. In contrast, whether a token has converged is defined by how its prediction changes along its future refinement trajectory. Moreover, changing the refinement rule reshapes future refinement trajectories, which in turn determine how refinement rules should be formulated, making refinement control inherently dynamic. We propose \emph{Progressive Refinement Regulation} (PRR), a progressive, trajectory-grounded refinement control framework that derives a token-level notion of empirical convergence progress from full decoding rollouts. Based on this signal, PRR learns a lightweight token-wise controller to regulate refinement via temperature-based distribution shaping under a progressive self-evolving training scheme. Experiments show that PRR substantially accelerates diffusion language model decoding while preserving generation quality.

この記事をシェア

MarkTechPost重要度42026年7月4日 15:32

NVIDIA AI が自己改善型ロボットフレームワーク「ASPIRE」を発表、LIBERO-Pro の長期タスクでゼロショット成功率 31% を達成

AWS Machine Learning Blog重要度42026年7月3日 02:50

Amazon SageMaker AIにおける多ターン強化学習のベストプラクティス

Apple Machine Learning重要度42026年7月2日 09:00

強化学習微調整済み視覚言語モデルの頑健性と思考連鎖の一貫性に関する研究

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む