#image generation のAIニュース
11件の記事
Krea 2 技術レポート(59 分読了)
Krea は、創造的な探求を目的とした拡張性と表現力に優れた画像生成モデル「Krea 2」を発表した。同社は多段階のトレーニングプロセスと高度なアーキテクチャを採用し、プロンプト拡張機能やスタイル参照システムを通じて、ユーザーがテキストや画像入力から多様な視覚出力を生成できるように制御性を高めた。
[AI ニュース] Reve 2 と Ideogram 4:画像生成におけるレイアウト制御の進展
Latent Space は、Reve 2 と Ideogram 4 の同時発表により、画像構成が AGI ハード課題から脱却したと指摘。両社が強力なラベル付けとコードによるレイアウト制御を強化し、特に Ideogram 4.0 がオープンモデルで最高性能となったことを紹介している。
Ideogram 4(GitHub リポジトリ)
Ideogram が、既存モデルの微調整ではなくゼロから訓練したオープンウェイトテキスト画像生成モデル「Ideogram 4」を公開しました。同社は、構造化 JSON プロンプトインターフェースや多言語テキストレンダリング機能、2K 解像度対応などの新機能を搭載しています。
ローカルデバイス向け画像生成モデル「Bonsai Image 4B」の紹介:1 ビットおよび三元表現版を公開
TLDR AI は、ノートパソコンやスマートフォンなどのローカルハードウェアで高品質な拡散推論を実行できるコンパクトな画像生成モデルファミリー「Bonsai Image 4B」を正式にリリースした。このモデルは 1 ビットおよび三元表現のバリアントを含み、エッジデバイスでの効率的な動作を実現する。
Hugging Face リポジトリの Lance(軽量ネイティブ統合マルチモーダルモデル)
Hugging Face が公開した「Lance」は、画像・動画の理解・生成・編集に対応する 30 億パラメータの軽量モデルであり、128 台の A100 GPU を用いてゼロから訓練された。
Granite 4.1 3B SVG ペリカンギャラリー
IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。
AI #165:私たちの姿に似て
AnthropicのClaude Opus 4.7がリリースされた。コーディング能力は高いが、性格や指示への従順さについて評価が分かれ、バグも報告されている。
TensorRT最適化版Stable Diffusion 3.5、NVIDIA RTX GPUで2倍高速・VRAM40%削減
Stability AIとNVIDIAは、TensorRTで最適化したStable Diffusion 3.5モデルを公開した。これにより、NVIDIA RTX GPU上で最大2.3倍の高速生成とVRAM使用量の40%削減を実現し、幅広いGPUでの商用・非商用利用が可能となった。
Stable Diffusion 3.5モデル、TensorRT最適化によりNVIDIA RTX GPUで性能2倍向上・メモリ使用量40%削減を実現
Stability AIがNVIDIAと協力し、Stable Diffusion 3.5モデルをTensorRTで最適化した。これにより、NVIDIA RTX GPUでの画像生成速度が最大2.3倍向上し、VRAM使用量が40%削減された。
Stable Diffusion、AMD Radeon GPUおよびRyzen AI APU向けに最適化
Stability AIはAMDと協力し、Stable Diffusion 3.5やXLなどのモデルをAMD製GPUおよびAPU向けに最適化したONNX版を提供した。これにより、処理速度と効率性が向上し、ユーザーはAmuse 3.0を通じてこれらのモデルを試すことができる。
Stable DiffusionがAMD Radeon™ GPUとRyzen™ AI APU向けに最適化
Stability AIがAMDと協力し、Stable Diffusionの主要モデルをAMD Radeon™ GPUとRyzen™ AI APU向けにONNX最適化し、Hugging Faceで公開した。