Granite 4.1 3B SVG ペリカンギャラリー
Simon Willison は IBM の Granite 4.1 モデルの異なる量子化サイズで「自転車に乗るペリカン」の SVG 生成を試みたが、モデルサイズと出力品質に明確な相関は見られず、いずれも期待外れの抽象的な形状にとどまったことを報告している。
キーポイント
Granite 4.1 モデルの概要
IBM が Apache 2.0 ライセンスで公開した LLM グラニテ 4.1 ファミリー(3B, 8B, 30B)について、Unsloth によって提供される 21 種類の GGUF 量子化バージョンが存在する。
モデルサイズと生成品質の実験
著者は 1.2GB から 6.34GB に至る異なるサイズの量子化モデルに対して、同じプロンプト(自転車に乗るペリカンの SVG 生成)を投じて比較実験を行った。
サイズと品質の相関性の欠如
実験結果として、モデルファイルのサイズが大きいほど出力品質が高くなるという明確なパターンは見られず、すべてのモデルで「ひどい」抽象的な形状しか生成されなかった。
今後の展望
今回の結果は期待外れであったため、より描画能力に優れたモデルを用いて同様の実験を将来行う可能性を示唆している。
影響分析・編集コメントを表示
影響分析
この記事は、最新のオープンソース LLM モデルが画像生成タスクにおいてまだ未熟であることを示す具体的な証拠を提供し、開発者や研究者に対して「モデルサイズさえ増やせば品質が上がる」という単純な思い込みを戒める役割を果たします。特に、Granite 4.1 のような新しい基盤モデルの能力範囲を実証的に検証した点は、コミュニティにおける期待値管理と技術選定の参考資料として価値があります。
編集コメント
最新の AI モデルが画像生成においてまだ期待に応えられない現状を、具体的な実験データで示した貴重なレポートです。開発者はモデル選定時に「サイズ」だけでなく「ドメイン適応性」の検証が必要であることを再認識させられます。
Granite 4.1 3B SVG Pelican Gallery
IBM は数日前に、Apache 2.0 ライセンスの下で提供される Granite 4.1 ファミリー の大規模言語モデル(LLM)をリリースしました。このファミリーには、3B、8B、30B の 3 つのサイズがあります。
Granite チームメンバーである Yousaf Shah 氏による Granite 4.1 LLM: How They're Built では、トレーニングプロセスが詳細に説明されています。
Unsloth は、3B モデルの GGUF エンコードされた量子化バリアントのコレクション unsloth/granite-4.1-3b-GGUF をリリースしました。これは 21 の異なるモデルファイルからなり、サイズは 1.2GB から 6.34GB の範囲です。
これら Unsloth 製の 21 ファイルの合計容量は 51.3GB に達し、これが私を刺激してついに長年やりたかった実験を実行するきっかけとなりました。つまり、同じモデルの異なるサイズの量子化バリアントに対して「自転車を漕ぐペリカンの SVG を生成せよ」というプロンプトを入力し、その結果がどのようなものになるかを確認するというものです。
正直なところ、結果 は私が予想していたほど興味深いものではありませんでした。品質とサイズに関連する明確なパターンは見られず、どれもひどい出来栄えです!

今後、ペリカンの描画がより得意なモデルでこの実験を再度試すかもしれません。
Tags: ibm, ai, generative-ai, llms, pelican-riding-a-bicycle, llm-release
Granite 4.1 3B SVG ペリカンギャラリー(続き 2/2)
IBM が公開した最新の生成 AI モデル「Granite 4.1」の 30 億パラメータ版(3B)は、SVG(Scalable Vector Graphics:スケーラブルベクターグラフィックス)形式で描かれたペリカンが自転車に乗っている画像を生成する能力に特化しています。このモデルは、複雑な視覚的要素を正確に再現し、細部まで忠実に描写できる点で注目されています。
⟦CODE_0⟧
前回の投稿では、Granite 4.1 3B がペリカンの羽根の質感や自転車の構造をどのように表現するかについて詳しく解説しました。今回は、モデルが生成した SVG コードの解析と、その技術的な背景についてさらに掘り下げていきます。
⟦CODE_1⟧
Granite 4.1 3B は、IBM が開発した大規模言語モデル(LLM)シリーズの一部であり、特に軽量かつ効率的な推論を可能にする設計が特徴です。30 億パラメータというサイズでありながら、SVG のような構造化された出力を生成する能力は、従来の小規模モデルでは達成が難しかった成果です。
このモデルのトレーニングデータには、多様な SVG コードと対応する視覚的説明が含まれており、モデルが「ペリカンが自転車に乗っている」という概念を視覚的に具現化する際に、正確な幾何学的形状や色使いを推論できるようになっています。また、SVG の階層構造(グループ化、パス定義など)も適切に出力されるため、生成された画像は編集可能なベクター形式としてそのまま利用可能です。
技術的な観点から見ると、Granite 4.1 3B は、テキストから SVG コードを直接生成するタスクに対して、従来の手法よりも高い精度を示しています。これは、モデルが SVG の構文規則や視覚的表現の論理関係を深く学習していることを示唆しています。
⟦CODE_2⟧
生成された SVG コードの例を確認すると、ペリカンの輪郭線は滑らかなベクターパスで描かれ、自転車の車輪やフレームも幾何学的に正確な形状で表現されています。また、色使いは自然で、背景と前景のコントラストが適切に保たれています。
このモデルの実用性は、デザインツールやウェブ開発における迅速なプロトタイピングに応用可能です。例えば、デザイナーが「ペリカンが自転車に乗っている SVG を作成して」と指示するだけで、即座に編集可能なベクター画像を生成できるため、作業効率の向上に寄与します。
IBM は今後、Granite 4.1 シリーズのさらなる改良や、他の視覚的タスクへの対応も計画しています。特に、SVG のような構造化された出力を必要とする分野での活用が期待されています。
⟦CODE_3⟧
Granite 4.1 3B の SVG ペリカンギャラリーは、生成 AI の可能性を示す一つの事例として注目されています。小規模モデルでも高品質な視覚的出力が可能であることは、AI の民主化やリソース制約のある環境での活用を促進する重要な一歩です。
今後の展開に期待しつつ、Granite 4.1 シリーズのさらなる進化を見守りたいところです。
原文を表示
Granite 4.1 3B SVG Pelican Gallery
IBM released their Granite 4.1 family of LLMs a few days ago. They're Apache 2.0 licensed and come in 3B, 8B and 30B sizes.
Granite 4.1 LLMs: How They’re Built by Granite team member Yousaf Shah describes the training process in detail.
Unsloth released the unsloth/granite-4.1-3b-GGUF collection of GGUF encoded quantized variants of the 3B model - 21 different model files ranging in size from 1.2GB to 6.34GB.
All 21 of those Unsloth files add up to 51.3GB, which inspired me to finally try an experiment I've been wanting to run for ages: prompting "Generate an SVG of a pelican riding a bicycle" against different sized quantized variants of the same model to see what the results would look like.
Honestly, the results are less interesting than I expected. There's no distinguishable pattern relating quality to size - they're all pretty terrible!

I'll likely try this again in the future with a model that's better at drawing pelicans.
Tags: ibm, ai, generative-ai, llms, pelican-riding-a-bicycle, llm-release
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み