#image generation のAIニュース

11件の記事

Krea 2 技術レポート（59 分読了）

Krea は、創造的な探求を目的とした拡張性と表現力に優れた画像生成モデル「Krea 2」を発表した。同社は多段階のトレーニングプロセスと高度なアーキテクチャを採用し、プロンプト拡張機能やスタイル参照システムを通じて、ユーザーがテキストや画像入力から多様な視覚出力を生成できるように制御性を高めた。

Latent Space は、Reve 2 と Ideogram 4 の同時発表により、画像構成が AGI ハード課題から脱却したと指摘。両社が強力なラベル付けとコードによるレイアウト制御を強化し、特に Ideogram 4.0 がオープンモデルで最高性能となったことを紹介している。

Ideogram が、既存モデルの微調整ではなくゼロから訓練したオープンウェイトテキスト画像生成モデル「Ideogram 4」を公開しました。同社は、構造化 JSON プロンプトインターフェースや多言語テキストレンダリング機能、2K 解像度対応などの新機能を搭載しています。

TLDR AI は、ノートパソコンやスマートフォンなどのローカルハードウェアで高品質な拡散推論を実行できるコンパクトな画像生成モデルファミリー「Bonsai Image 4B」を正式にリリースした。このモデルは 1 ビットおよび三元表現のバリアントを含み、エッジデバイスでの効率的な動作を実現する。

Hugging Face が公開した「Lance」は、画像・動画の理解・生成・編集に対応する 30 億パラメータの軽量モデルであり、128 台の A100 GPU を用いてゼロから訓練された。

IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー（3B、8B、30B）を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。

AnthropicのClaude Opus 4.7がリリースされた。コーディング能力は高いが、性格や指示への従順さについて評価が分かれ、バグも報告されている。

Stability AIとNVIDIAは、TensorRTで最適化したStable Diffusion 3.5モデルを公開した。これにより、NVIDIA RTX GPU上で最大2.3倍の高速生成とVRAM使用量の40%削減を実現し、幅広いGPUでの商用・非商用利用が可能となった。

Stability AIがNVIDIAと協力し、Stable Diffusion 3.5モデルをTensorRTで最適化した。これにより、NVIDIA RTX GPUでの画像生成速度が最大2.3倍向上し、VRAM使用量が40%削減された。

Stability AIはAMDと協力し、Stable Diffusion 3.5やXLなどのモデルをAMD製GPUおよびAPU向けに最適化したONNX版を提供した。これにより、処理速度と効率性が向上し、ユーザーはAmuse 3.0を通じてこれらのモデルを試すことができる。

Stability AIがAMDと協力し、Stable Diffusionの主要モデルをAMD Radeon™ GPUとRyzen™ AI APU向けにONNX最適化し、Hugging Faceで公開した。