Stable Diffusion、AMD Radeon GPUおよびRyzen AI APU向けに最適化
Stability AI と AMD の提携により、Stable Diffusion モデルの ONNX ベース版が AMD Radeon GPU および Ryzen AI APU で最大 3.8 倍高速化され、実用環境への導入が容易になった。
キーポイント
AMD ハードウェア向け最適化モデルの提供開始
Stable Diffusion 3.5 Large、Turbo、XL 1.0、XL Turbo の 4 モデルが ONNX ランタイム対応版として「_amdgpu」サフィックス付きで Hugging Face に公開された。
推論速度の劇的な向上
AMD 最適化により、SD3.5 ベースモデルと比較して最大 2.6 倍、SDXL ベースモデルと比較して最大 3.8 倍の推論速度向上が達成された。
既存ワークフローへのシームレス統合
ONNX Runtime をサポートする環境であれば、品質を損なうことなく既存の生産パイプラインにすぐに組み込むことが可能で、Amuse 3.0 での試作も推奨されている。
影響分析・編集コメントを表示
影響分析
この発表は、AMD ハードウェアユーザーが生成 AI の高品質な画像生成をより高速かつ低コストで利用可能にする重要な転換点です。特に ONNX 形式への対応により、企業や開発者が既存のインフラを大幅に変更せずに性能向上を実現できるため、産業現場での生成 AI の実装スピードとスケーラビリティが加速すると予想されます。
編集コメント
プレスリリース特有の強調表現が含まれるものの、具体的な数値(2.6 倍・3.8 倍)と技術的実装経路(ONNX Runtime)が明記されており、開発者にとっての実用性は極めて高い。AMD ユーザー層へのインパクトは決定的と言える。
主要ポイント
AMD と協力し、Stable Diffusion モデルファミリーの選択された ONNX 最適化版を提供しました。これらは AMD Radeon™ GPU および Ryzen™ AI APU でより高速かつ効率的に動作するように設計されています。
Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo、Stable Diffusion XL 1.0、および Stable Diffusion XL Turbo の AMD 最適化版は、Hugging Face で利用可能となり、「_amdgpu」が接尾辞として追加されています。エンドユーザーは Amuse 3.0 を使用して、AMD 最適化モデルを試すことができます。
これらの速度向上に関する技術詳細については、AMD のブログ記事をご覧ください。

AMD と協力し、Stable Diffusion モデルファミリーの選択された ONNX 最適化版を提供しました。これらは AMD Radeon™ GPU および Ryzen™ AI APU でより高速かつ効率的に動作するように設計されています。この共同エンジニアリング取り組みは、モデル出力の品質やオープンライセンスを損なうことなく、推論パフォーマンスを最大化することに焦点を当てています。
その結果、ONNX Runtime がサポートするあらゆる環境に統合可能な加速済みモデルセットが生まれました。これにより、既存のワークフローにすぐにでも取り込んで活用することが可能になります。最も高度な画像生成モデルである Stable Diffusion 3.5 (SD3.5) の派生版や、Stable Diffusion XL Turbo (SDXL Turbo) をデプロイする場合でも、これらのモデルは AMD ハードウェア上でより高速なクリエイティブアプリケーションを駆動する準備ができています。
生成型ビジュアルメディアの採用が加速する中、主要ハードウェア向けにモデルを最適化することは不可欠です。この協力により、開発者や企業は Stable Diffusion を自社の生産パイプラインに統合できるようになり、ワークフローをより高速かつ効率的にし、スケーリングに対応可能な状態にすることができます。
利用可能なモデル
AMD は SD3.5 と SDXL 全体で 4 つのモデルを最適化し、パフォーマンス向上を実現しました。
SD3.5 バージョン:
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Large Turbo
AMD が最適化した SD3.5 モデルは、ベースとなる PyTorch (PyTorch) モデルと比較して、推論速度を最大 2.6 倍向上させます。
SDXL バージョン:
Stable Diffusion XL 1.0
Stable Diffusion XL Turbo
AMD の最適化により、SDXL 1.0 と SDXL Turbo は、ベースとなる PyTorch モデルと比較して推論速度を最大 3.8 倍向上させます。

分析は、AMD 最適化済みモデルの推論速度をベースラインとなる PyTorch モデルと比較したものです。テストには Amuse 3.0 RC と AMD Adrenalin 24.30.31.05 KB ドライバー(バージョン 25.4.1 プレビュー版)を使用しました。
AMD 最適化済み Stable Diffusion モデルは現在、Hugging Face で「_amdgpu」の接尾辞付きで利用可能です。エンドユーザーはまた、Amuse 3.0 を使用して AMD 最適化モデルを試すこともできます。これらの速度向上に関する技術的な詳細については、AMD のブログ記事をご覧ください。
当社の進捗状況について最新情報をお知りになりたい場合は、X、LinkedIn、Instagram でフォローするか、Discord コミュニティにご参加ください。
原文を表示
Key Takeaways
We’ve collaborated with AMD to deliver select ONNX-optimized versions of the Stable Diffusion family of models, engineered to run faster and more efficiently on AMD Radeon™ GPUs and Ryzen™ AI APUs.
AMD-optimized versions of Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo, Stable Diffusion XL 1.0, and Stable Diffusion XL Turbo are now available on Hugging Face and suffixed with “_amdgpu”. End users can try out the AMD optimized models using Amuse 3.0.
You can learn more about the technical details of these speed upgrades on AMD’s blog post.
image
We’ve collaborated with AMD to deliver select ONNX-optimized versions of the Stable Diffusion model family, engineered to run faster and more efficiently on AMD Radeon™ GPUs and Ryzen™ AI APUs. This joint engineering effort focused on maximizing inference performance without compromising model output quality or our open licensing.
The result is a set of accelerated models that integrate into any ONNX Runtime-supported environment, making it easy to drop them into your existing workflows right out of the box. Whether you’re deploying Stable Diffusion 3.5 (SD3.5) variants, our most advanced image model, or Stable Diffusion XL Turbo (SDXL Turbo), these models are ready to power faster creative applications on AMD hardware.
As generative visual media adoption accelerates, it’s essential our models are optimized for leading hardware. This collaboration ensures builders and businesses can integrate Stable Diffusion into their production pipelines, making workflows faster, more efficient, and ready to scale.
Available models
AMD has optimized four models across SD3.5 and SDXL for improved performance.
SD3.5 Version:
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Large Turbo
AMD-optimized SD3.5 models deliver up to 2.6x faster inference when compared to the base PyTorch models.
SDXL Version:
Stable Diffusion XL 1.0
Stable Diffusion XL Turbo
With AMD optimization, SDXL 1.0 and SDXL Turbo achieve up to 3.8x faster inference, when compared to the base PyTorch models.
image
Analysis compares AMD-optimized model inference speed to the base PyTorch models. Testing was conducted using Amuse 3.0 RC and AMD Adrenalin 24.30.31.05 KB driver - 25.4.1 preview.
Get started
The AMD-optimized Stable Diffusion models are available now on Hugging Face and suffixed with “_amdgpu”. End users can also try out the AMD optimized models using Amuse 3.0.You can learn more about the technical details of these speed upgrades on AMD’s blog post.
To stay updated on our progress, follow us on X,LinkedIn, Instagram, and join our Discord Community.
関連記事
Stable DiffusionがAMD Radeon™ GPUとRyzen™ AI APU向けに最適化
Stability AIがAMDと協力し、Stable Diffusionの主要モデルをAMD Radeon™ GPUとRyzen™ AI APU向けにONNX最適化し、Hugging Faceで公開した。
Stability AIとNVIDIA、Stable Diffusion 3.5 NIMで高速パフォーマンスと簡易な企業導入を実現
Stability AIはNVIDIA NIMマイクロサービスをStable Diffusion 3.5向けにリリースし、企業が高度なモデルをより高速かつ簡単に導入できるようにした。
Stability AIとNVIDIA、Stable Diffusion 3.5 NIMで高速化・企業向け展開を簡素化
Stability AIはNVIDIAと連携し、Stable Diffusion 3.5を高速化・簡易デプロイ可能なNIMマイクロサービスとして提供開始した。このモデルはbuild.nvidia.comから利用可能で、Hugging Faceから重みも取得できる。Stability AIコミュニティライセンスの下、商用・非商用利用が可能だが、年収益100万ドル超の企業は個別契約が必要である。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み