Stable DiffusionがAMD Radeon™ GPUとRyzen™ AI APU向けに最適化
Stability AI は AMD と連携し、Radeon GPU および Ryzen AI APU で動作する ONNX 最適化版 Stable Diffusion モデルを公開し、推論速度を最大 3.8 倍向上させた。
キーポイント
AMD ハードウェア向け最適化モデルの提供
Stable Diffusion 3.5 Large、同 Turbo、XL 1.0、XL Turbo の 4 モデルが ONNX 形式で AMD GPU および Ryzen AI APU に最適化され、Hugging Face で公開された。
劇的な推論速度の向上
SD3.5 ベースモデルと比較して最大 2.6 倍、SDXL ベースモデルと比較して最大 3.8 倍の推論速度向上を実現し、品質やオープンライセンスを損なわない。
既存ワークフローへの容易な統合
ONNX Runtime をサポートする環境であれば、Amuse 3.0 などのツールを通じてすぐに導入可能で、生産パイプラインへの組み込みが容易である。
AMD最適化モデルの入手方法
AMD最適化版Stable DiffusionモデルはHugging Faceで「_amdgpu」接尾辞付きで公開されており、Amuse 3.0 RCを通じて利用可能です。
ベンチマークテスト環境
AMD最適化モデルとベースのPyTorchモデルの推論速度比較は、Amuse 3.0 RCおよびAMD Adrenalin 24.30.31.05 KBドライバー(プレビュー版)を使用して実施されました。
影響分析・編集コメントを表示
影響分析
この発表は、AMD ハードウェアユーザーが高性能な生成 AI を低コストかつ高速で利用できるようになることを意味し、特に Ryzen AI APU を搭載した PC やローカル環境での画像生成ワークフローの普及を加速させる。また、ONNX 標準への対応により、ベンダーロックインを避けつつハードウェア固有の性能を引き出す手法がさらに一般化されることで、業界全体の推論効率基準が引き上げられる可能性がある。
編集コメント
プレスリリース特有の「最大〇倍」という数値は魅力的だが、実際のハードウェア構成や負荷条件によるばらつきに注意が必要である。しかし、ONNX 標準化による相互運用性の向上は、ローカル AI 開発者にとって実質的な恩恵が大きい重要な進展と言える。
主なポイント
AMDと協業し、AMD Radeon™ GPUおよびRyzen™ AI APU上でより高速かつ効率的に動作するよう設計された、Stable Diffusionモデルファミリーの一部をONNX最適化したバージョンを提供します。
Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo、Stable Diffusion XL 1.0、Stable Diffusion XL TurboのAMD最適化バージョンが、Hugging Faceで「_amdgpu」の接尾辞を付けて利用可能になりました。エンドユーザーはAmuse 3.0を使用して、これらのAMD最適化モデルをお試しいただけます。
これらの速度向上に関する技術的詳細は、AMDのブログ記事でご確認ください。
AMDと協業し、AMD Radeon™ GPUおよびRyzen™ AI APU上でより高速かつ効率的に動作するよう設計された、Stable Diffusionモデルファミリーの一部をONNX最適化したバージョンを提供します。この共同開発では、モデルの出力品質やオープンライセンスを損なうことなく、推論パフォーマンスを最大化することに重点を置きました。
その結果、あらゆるONNX Runtime対応環境に統合可能な一連の高速化モデルが誕生し、既存のワークフローにそのまま簡単に組み込めるようになりました。最先端の画像モデルであるStable Diffusion 3.5 (SD3.5) の各種バリアントであれ、Stable Diffusion XL Turbo (SDXL Turbo) であれ、これらのモデルはAMDハードウェア上で高速なクリエイティブアプリケーションを実現する準備が整っています。
生成視覚メディアの普及が加速する中、主要なハードウェア向けにモデルを最適化することは極めて重要です。この協業により、開発者や企業はStable Diffusionを自社のプロダクションパイプラインに統合し、ワークフローをより高速、効率的かつスケール可能なものにすることができます。
利用可能なモデル
AMDは、SD3.5とSDXLにわたる4つのモデルを最適化し、パフォーマンスを向上させました。
SD3.5 バージョン:
- Stable Diffusion 3.5 Large
- Stable Diffusion 3.5 Large Turbo
AMD最適化SD3.5モデルは、ベースのPyTorchモデルと比較して、最大2.6倍高速な推論を実現します。
SDXL バージョン:
- Stable Diffusion XL 1.0
- Stable Diffusion XL Turbo
AMD最適化により、SDXL 1.0およびSDXL Turboは、ベースのPyTorchモデルと比較して、最大3.8倍高速な推論を達成します。
※本分析は、AMD最適化モデルの推論速度をベースのPyTorchモデルと比較したものです。テストはAmuse 3.0 RCおよびAMD Adrenalin 24.30.31.05 KBドライバー (25.4.1 プレビュー) を使用して実施されました。
始めましょう
AMD最適化Stable Diffusionモデルは、現在Hugging Faceで「_amdgpu」の接尾辞を付けて利用可能です。エンドユーザーはAmuse 3.0を使用してこれらのモデルをお試しいただけます。速度向上に関する技術的詳細は、AMDのブログ記事でご覧ください。
最新情報については、X、LinkedIn、Instagramでフォローし、Discordコミュニティにご参加ください。
原文を表示
Key Takeaways
We’ve collaborated with AMD to deliver select ONNX-optimized versions of the Stable Diffusion family of models, engineered to run faster and more efficiently on AMD Radeon™ GPUs and Ryzen™ AI APUs.
AMD-optimized versions of Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo, Stable Diffusion XL 1.0, and Stable Diffusion XL Turbo are now available on Hugging Face and suffixed with “_amdgpu”. End users can try out the AMD optimized models using Amuse 3.0.
You can learn more about the technical details of these speed upgrades on AMD’s blog post.
image
We’ve collaborated with AMD to deliver select ONNX-optimized versions of the Stable Diffusion model family, engineered to run faster and more efficiently on AMD Radeon™ GPUs and Ryzen™ AI APUs. This joint engineering effort focused on maximizing inference performance without compromising model output quality or our open licensing.
The result is a set of accelerated models that integrate into any ONNX Runtime-supported environment, making it easy to drop them into your existing workflows right out of the box. Whether you’re deploying Stable Diffusion 3.5 (SD3.5) variants, our most advanced image model, or Stable Diffusion XL Turbo (SDXL Turbo), these models are ready to power faster creative applications on AMD hardware.
As generative visual media adoption accelerates, it’s essential our models are optimized for leading hardware. This collaboration ensures builders and businesses can integrate Stable Diffusion into their production pipelines, making workflows faster, more efficient, and ready to scale.
Available models
AMD has optimized four models across SD3.5 and SDXL for improved performance.
SD3.5 Version:
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Large Turbo
AMD-optimized SD3.5 models deliver up to 2.6x faster inference when compared to the base PyTorch models.
SDXL Version:
Stable Diffusion XL 1.0
Stable Diffusion XL Turbo
With AMD optimization, SDXL 1.0 and SDXL Turbo achieve up to 3.8x faster inference, when compared to the base PyTorch models.
image
Analysis compares AMD-optimized model inference speed to the base PyTorch models. Testing was conducted using Amuse 3.0 RC and AMD Adrenalin 24.30.31.05 KB driver - 25.4.1 preview.
Get started
The AMD-optimized Stable Diffusion models are available now on Hugging Face and suffixed with “_amdgpu”. End users can also try out the AMD optimized models using Amuse 3.0.You can learn more about the technical details of these speed upgrades on AMD’s blog post.
To stay updated on our progress, follow us on X,LinkedIn, Instagram, and join our Discord Community.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み