Black Forest Labs は Stable Diffusion や Flux モデルの開発チームであり、Microsoft や Adobe との提携を通じて業界をリードしています。同社は最新の「Flux 2」で画像・編集の品質を劇的に向上させると同時に、「Selfflow」という独自学習手法により、外部エンコーダーに依存しないスケーラブルなマルチモーダル生成モデルの実現を目指しています。さらに、0.5 秒未満のリアルタイム編集機能や、ロボット制御のための「ワールドモデル」への投資を通じて、視覚 AI の未来を物理世界と結びつける戦略を明らかにしました。
生成 AI の技術的限界(外部エンコーダー依存)とそれを打破する独自研究「Selfflow」の詳細は、開発者にとって極めて示唆に富む内容です。特にリアルタイム性と物理 AI への応用は、今後の業界動向を予測する上で必須の知見です。
- 01
Flux シリーズの進化史
Flux One でテキスト画像生成に成功し、Context で編集機能を統合、Flux 2 では多参照対応と高品質なリアルタイム性を達成。
- 02
Selfflow 学習手法の革新
外部エンコーダー(DINO など)を排除し、教師・生徒モデルによる自己教師あり学習でマルチモーダル表現と生成を統合する新アプローチ。
- 03
リアルタイム生成の実現
Client モデルにより画像生成・編集を 0.5 秒未満で完了させ、インタラクティブなデザインやゲームレンダリングへの応用が可能に。
- 04
物理 AI とワールドモデル
視覚 AI をロボット制御や製造自動化へ展開するため、幾何学的関係や物理法則を理解する「ワールドモデル」の研究を推進中。
Black Forest Labs の「Selfflow」技術は、現在の AI モデルが抱える外部依存のボトルネックを解消し、マルチモーダル学習の効率と汎用性を劇的に向上させる可能性があります。また、0.5 秒未満のリアルタイム生成能力は、クリエイティブワークフローやゲーム開発におけるインタラクションの質を変革し、物理世界でのロボット制御への実装を加速させるでしょう。