AI 動画 · AI ENGINEER

FLUX と Open Research、視覚 AI の未来を語る Black Forest Labs の Stephen Batifol氏

AI Engineer2026/5/922:31

3 行要旨

Black Forest Labs は Stable Diffusion や Flux モデルの開発チームであり、Microsoft や Adobe との提携を通じて業界をリードしています。同社は最新の「Flux 2」で画像・編集の品質を劇的に向上させると同時に、「Selfflow」という独自学習手法により、外部エンコーダーに依存しないスケーラブルなマルチモーダル生成モデルの実現を目指しています。さらに、0.5 秒未満のリアルタイム編集機能や、ロボット制御のための「ワールドモデル」への投資を通じて、視覚 AI の未来を物理世界と結びつける戦略を明らかにしました。

編集者ノート

生成 AI の技術的限界（外部エンコーダー依存）とそれを打破する独自研究「Selfflow」の詳細は、開発者にとって極めて示唆に富む内容です。特にリアルタイム性と物理 AI への応用は、今後の業界動向を予測する上で必須の知見です。

重要度

5

最重要/ 5段階

深度40%

5

関連度30%

5

実用性20%

4

革新性10%

5

言及企業(4)

主要ポイント

01
Flux シリーズの進化史
Flux One でテキスト画像生成に成功し、Context で編集機能を統合、Flux 2 では多参照対応と高品質なリアルタイム性を達成。
02
Selfflow 学習手法の革新
外部エンコーダー（DINO など）を排除し、教師・生徒モデルによる自己教師あり学習でマルチモーダル表現と生成を統合する新アプローチ。
03
リアルタイム生成の実現
Client モデルにより画像生成・編集を 0.5 秒未満で完了させ、インタラクティブなデザインやゲームレンダリングへの応用が可能に。
04
物理 AI とワールドモデル
視覚 AI をロボット制御や製造自動化へ展開するため、幾何学的関係や物理法則を理解する「ワールドモデル」の研究を推進中。

業界への影響

Black Forest Labs の「Selfflow」技術は、現在の AI モデルが抱える外部依存のボトルネックを解消し、マルチモーダル学習の効率と汎用性を劇的に向上させる可能性があります。また、0.5 秒未満のリアルタイム生成能力は、クリエイティブワークフローやゲーム開発におけるインタラクションの質を変革し、物理世界でのロボット制御への実装を加速させるでしょう。

文字起こし(en)

13 行は翻訳保留中です。原文(英語)を表示しています — 次回のパイプラインで補完されます。

重要な引用

目次

注目ポイント