Qwen-Image-Flash (26 minute read)｜Qwen-Image-Flash の紹介（26 分読） | AIニュース最前線

著者：[Tianhe Wu](https://arxiv.org/search/cs?searchtype=author&query=Wu,+T), [Kun Yan](https://arxiv.org/search/cs?searchtype=author&query=Yan,+K), [Zikai Zhou](https://arxiv.org/search/cs?searchtype=author&query=Zhou,+Z), [Lihan Jiang](https://arxiv.org/search/cs?searchtype=author&query=Jiang,+L), [Jiahao Li](https://arxiv.org/search/cs?searchtype=author&query=Li,+J), [Jie Zhang](https://arxiv.org/search/cs?searchtype=author&query=Zhang,+J), [Kaiyuan Gao](https://arxiv.org/search/cs?searchtype=author&query=Gao,+K), [Ningyuan Tang](https://arxiv.org/search/cs?searchtype=author&query=Tang,+N), [Shengming Yin](https://arxiv.org/search/cs?searchtype=author&query=Yin,+S), [Xiaoyue Chen](https://arxiv.org/search/cs?searchtype=author&query=Chen,+X), [Xiao Xu](https://arxiv.org/search/cs?searchtype=author&query=Xu,+X), [Yilei Chen](https://arxiv.org/search/cs?searchtype=author&query=Chen,+Y), [Yuxiang Chen](https://arxiv.org/search/cs?searchtype=author&query=Chen,+Y), [Yan Shu](https://arxiv.org/search/cs?searchtype=author&query=Shu,+Y), [Yixian Xu](https://arxiv.org/search/cs?searchtype=author&query=Xu,+Y), [Yanran Zhang](https://arxiv.org/search/cs?searchtype=author&query=Zhang,+Y), [Zihao Liu](https://arxiv.org/search/cs?searchtype=author&query=Liu,+Z), [Zhendong Wang](https://arxiv.org/search/cs?searchtype=author&query=Wang,+Z), [Zekai Zhang](https://arxiv.org/search/cs?searchtype=author&query=Zhang,+Z), [Deqing Li](https://arxiv.org/search/cs?searchtype=author&query=Li,+D), [Liang Peng](https://arxiv.org/search/cs?searchtype=author&query=Peng,+L), [Yi Wang](https://arxiv.org/search/cs?searchtype=author&query=Wang,+Y), [Jingren Zhou](https://arxiv.org/search/cs?searchtype=author&query=Zhou,+J), [Chenfei Wu](https://arxiv.org/search/cs?searchtype=author&query=Wu,+C) [PDF を表示](https://arxiv.org/pdf/2606.03746) [HTML (実験的)](https://arxiv.org/html/2606.03746v2) ** 抄録：少ステップ蒸留は、高度な視覚生成モデルの高速化に向けた効果的な戦略となっていますが、先行研究は主に蒸留目的関数に焦点を当ててきました。本研究では、学生モデルのパフォーマンスを決定づけるトレーニングレシピに注目し、少ステップ蒸留を補完的な視点から再検討します。Qwen-Image-2.0 を代表例として用い、統合テキスト画像生成および指示に基づく画像編集の蒸留において、データ構成、教師からのガイダンス、タスク混合という 3 つの要因を体系的に調査しました。その実証分析により、いくつかの直感的でない振る舞いが明らかになり、これが Qwen-Image-Flash の開発動機となりました。全体的に、本研究の結果は、効果的な少ステップ蒸留には、慎重に設計された目的関数だけでなく、より広範なトレーニングパイプラインの原理に基づいた組織化も必要であることを示唆しています。 主題: コンピュータビジョンとパターン認識 (cs.CV); 人工知能 (cs.AI); グラフィックス (cs.GR); マシンラーニング (cs.LG) 引用形式: [arXiv:2606.03746](https://arxiv.org/abs/2606.03746) [cs.CV] (または このバージョンについては [arXiv:2606.03746v2](https://arxiv.org/abs/2606.03746v2) [cs.CV]) [https://doi.org/10.48550/arXiv.2606.03746](https://doi.org/10.48550/arXiv.2606.03746) DataCite 経由で発行された arXiv DOI ## 提出履歴 投稿者：Tianhe Wu [[メールを見る](https://arxiv.org/show-email/47a91665/2606.03746)] [[v1]](https://arxiv.org/abs/2606.03746v1)** 2026 年 6 月 2 日（火）UTC 15:00:22 (12,865 KB)** [v2]** 2026 年 6 月 3 日（水）UTC 05:16:34 (12,864 KB)

Qwen-Image-Flash の紹介（26 分読）

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト

背景や根拠まで確認しますか？

関連記事

ニュースの次に確認する

調べる

選ぶ

サイト