AAIニュース
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業
AAIニュース

世界中のAI最新情報を日本語で。毎時自動収集・翻訳・要約。

コンテンツ

最新ニュースAI日報週報

分析

トレンド企業動画

サイト

についてRSSお問い合わせ
© 2026 ainew.jp — All rights reserved.特定商取引法に基づく表記
ニュース一覧元記事を開く
Simon Willison Blog·2026年5月5日 08:49·約4分

Granite 4.1 3B SVG ペリカンギャラリー

#LLM#Generative AI#Open Source Models#IBM Granite#Image Generation
TL;DR

Simon Willison は IBM の Granite 4.1 モデルの異なる量子化サイズで「自転車に乗るペリカン」の SVG 生成を試みたが、モデルサイズと出力品質に明確な相関は見られず、いずれも期待外れの抽象的な形状にとどまったことを報告している。

AI深層分析2026年5月5日 09:03
2
参考/ 5段階
深度40%
3
関連度30%
4
実用性20%
1
革新性10%
2

キーポイント

1

Granite 4.1 モデルの概要

IBM が Apache 2.0 ライセンスで公開した LLM グラニテ 4.1 ファミリー(3B, 8B, 30B)について、Unsloth によって提供される 21 種類の GGUF 量子化バージョンが存在する。

2

モデルサイズと生成品質の実験

著者は 1.2GB から 6.34GB に至る異なるサイズの量子化モデルに対して、同じプロンプト(自転車に乗るペリカンの SVG 生成)を投じて比較実験を行った。

3

サイズと品質の相関性の欠如

実験結果として、モデルファイルのサイズが大きいほど出力品質が高くなるという明確なパターンは見られず、すべてのモデルで「ひどい」抽象的な形状しか生成されなかった。

4

今後の展望

今回の結果は期待外れであったため、より描画能力に優れたモデルを用いて同様の実験を将来行う可能性を示唆している。

影響分析・編集コメントを表示

影響分析

この記事は、最新のオープンソース LLM モデルが画像生成タスクにおいてまだ未熟であることを示す具体的な証拠を提供し、開発者や研究者に対して「モデルサイズさえ増やせば品質が上がる」という単純な思い込みを戒める役割を果たします。特に、Granite 4.1 のような新しい基盤モデルの能力範囲を実証的に検証した点は、コミュニティにおける期待値管理と技術選定の参考資料として価値があります。

編集コメント

最新の AI モデルが画像生成においてまだ期待に応えられない現状を、具体的な実験データで示した貴重なレポートです。開発者はモデル選定時に「サイズ」だけでなく「ドメイン適応性」の検証が必要であることを再認識させられます。

Granite 4.1 3B SVG Pelican Gallery

IBM は数日前に、Apache 2.0 ライセンスの下で提供される Granite 4.1 ファミリー の大規模言語モデル(LLM)をリリースしました。このファミリーには、3B、8B、30B の 3 つのサイズがあります。

Granite チームメンバーである Yousaf Shah 氏による Granite 4.1 LLM: How They're Built では、トレーニングプロセスが詳細に説明されています。

Unsloth は、3B モデルの GGUF エンコードされた量子化バリアントのコレクション unsloth/granite-4.1-3b-GGUF をリリースしました。これは 21 の異なるモデルファイルからなり、サイズは 1.2GB から 6.34GB の範囲です。

これら Unsloth 製の 21 ファイルの合計容量は 51.3GB に達し、これが私を刺激してついに長年やりたかった実験を実行するきっかけとなりました。つまり、同じモデルの異なるサイズの量子化バリアントに対して「自転車を漕ぐペリカンの SVG を生成せよ」というプロンプトを入力し、その結果がどのようなものになるかを確認するというものです。

正直なところ、結果 は私が予想していたほど興味深いものではありませんでした。品質とサイズに関連する明確なパターンは見られず、どれもひどい出来栄えです!

image
image

今後、ペリカンの描画がより得意なモデルでこの実験を再度試すかもしれません。

Tags: ibm, ai, generative-ai, llms, pelican-riding-a-bicycle, llm-release

Granite 4.1 3B SVG ペリカンギャラリー(続き 2/2)

IBM が公開した最新の生成 AI モデル「Granite 4.1」の 30 億パラメータ版(3B)は、SVG(Scalable Vector Graphics:スケーラブルベクターグラフィックス)形式で描かれたペリカンが自転車に乗っている画像を生成する能力に特化しています。このモデルは、複雑な視覚的要素を正確に再現し、細部まで忠実に描写できる点で注目されています。

⟦CODE_0⟧

前回の投稿では、Granite 4.1 3B がペリカンの羽根の質感や自転車の構造をどのように表現するかについて詳しく解説しました。今回は、モデルが生成した SVG コードの解析と、その技術的な背景についてさらに掘り下げていきます。

⟦CODE_1⟧

Granite 4.1 3B は、IBM が開発した大規模言語モデル(LLM)シリーズの一部であり、特に軽量かつ効率的な推論を可能にする設計が特徴です。30 億パラメータというサイズでありながら、SVG のような構造化された出力を生成する能力は、従来の小規模モデルでは達成が難しかった成果です。

このモデルのトレーニングデータには、多様な SVG コードと対応する視覚的説明が含まれており、モデルが「ペリカンが自転車に乗っている」という概念を視覚的に具現化する際に、正確な幾何学的形状や色使いを推論できるようになっています。また、SVG の階層構造(グループ化、パス定義など)も適切に出力されるため、生成された画像は編集可能なベクター形式としてそのまま利用可能です。

技術的な観点から見ると、Granite 4.1 3B は、テキストから SVG コードを直接生成するタスクに対して、従来の手法よりも高い精度を示しています。これは、モデルが SVG の構文規則や視覚的表現の論理関係を深く学習していることを示唆しています。

⟦CODE_2⟧

生成された SVG コードの例を確認すると、ペリカンの輪郭線は滑らかなベクターパスで描かれ、自転車の車輪やフレームも幾何学的に正確な形状で表現されています。また、色使いは自然で、背景と前景のコントラストが適切に保たれています。

このモデルの実用性は、デザインツールやウェブ開発における迅速なプロトタイピングに応用可能です。例えば、デザイナーが「ペリカンが自転車に乗っている SVG を作成して」と指示するだけで、即座に編集可能なベクター画像を生成できるため、作業効率の向上に寄与します。

IBM は今後、Granite 4.1 シリーズのさらなる改良や、他の視覚的タスクへの対応も計画しています。特に、SVG のような構造化された出力を必要とする分野での活用が期待されています。

⟦CODE_3⟧

Granite 4.1 3B の SVG ペリカンギャラリーは、生成 AI の可能性を示す一つの事例として注目されています。小規模モデルでも高品質な視覚的出力が可能であることは、AI の民主化やリソース制約のある環境での活用を促進する重要な一歩です。

今後の展開に期待しつつ、Granite 4.1 シリーズのさらなる進化を見守りたいところです。

原文を表示

Granite 4.1 3B SVG Pelican Gallery

IBM released their Granite 4.1 family of LLMs a few days ago. They're Apache 2.0 licensed and come in 3B, 8B and 30B sizes.

Granite 4.1 LLMs: How They’re Built by Granite team member Yousaf Shah describes the training process in detail.

Unsloth released the unsloth/granite-4.1-3b-GGUF collection of GGUF encoded quantized variants of the 3B model - 21 different model files ranging in size from 1.2GB to 6.34GB.

All 21 of those Unsloth files add up to 51.3GB, which inspired me to finally try an experiment I've been wanting to run for ages: prompting "Generate an SVG of a pelican riding a bicycle" against different sized quantized variants of the same model to see what the results would look like.

Honestly, the results are less interesting than I expected. There's no distinguishable pattern relating quality to size - they're all pretty terrible!

Six different SVG images from models ranging in size from 1.67GB to 1.2GB. They are almost all an abstract collection of shapes - weirdly the smallest model had the best version of a bicycle, while the largest one had something that looked a tiny bit like a pelican.
Six different SVG images from models ranging in size from 1.67GB to 1.2GB. They are almost all an abstract collection of shapes - weirdly the smallest model had the best version of a bicycle, while the largest one had something that looked a tiny bit like a pelican.

I'll likely try this again in the future with a model that's better at drawing pelicans.

Tags: ibm, ai, generative-ai, llms, pelican-riding-a-bicycle, llm-release

この記事をシェア

関連記事

NVIDIA Developer Blog重要度42026年6月26日 01:38

NVIDIA ACE を活用した KRAFTON の共演可能キャラクター「PUBG Ally」の構築方法

KDnuggets2026年6月26日 01:00

Gemini を活用して Google スプレッドシートを作成する方法

Microsoft Research重要度42026年6月26日 01:00

AI を駆使した説明と実験による脳理解の探求

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む