Granite 4.0 1B Speech:コンパクトで多言語対応、エッジ向けに構築
IBMはリソース制約のあるエッジデバイス向けに、マルチ言語対応のコンパクトな音声認識モデル「Granite 4.0 1B Speech」を公開し、OpenASRリーダーボードで首位を獲得した。
キーポイント
パラメータ削減と高性能化の両立
前作の半分以下のパラメータ数ながら英語の文字起こし精度が向上し、speculative decodingによる推論速度の高速化を実現している。
マルチ言語対応と実務機能の追加
英仏独西葡日の6言語に対応し、コミュニティ要望に応じた日本語ASRとキーワードリストバイアス(固有名詞・略語の認識精度向上)が新たに実装された。
エンタープライズ向けの実装基盤とライセンス
Apache 2.0ライセンスで公開され、transformersやvLLMにネイティブ対応。本番環境ではGranite Guardianとの併用を推奨し、セキュリティリスクの検出もサポートする。
影響分析・編集コメントを表示
影響分析
本リリースは、音声認識モデルの小型化と高精度化のバランスを改善し、エッジコンピューティング環境での実装ハードルを下げた。オープンソースコミュニティとエンタープライズ現場の両方に貢献し、マルチ言語対応や推論最適化が標準化する流れを加速させる。
編集コメント
軽量モデルの高精度化はエッジAI普及の鍵となる。今後は推論コスト削減とプライバシー保護の観点から、オンデバイス音声処理の実装がさらに加速すると予想される。
Back to Articles Granite 4.0 1B Speech: コンパクト、多言語対応、エッジ向けに構築
Upvote 1
この度、IBMのGranite Speechファミリーに最新モデル「Granite 4.0 1B Speech」が加わりましたので、ご紹介いたします。リソースに制約のあるデバイス上でのエンタープライズアプリケーション向けに設計されたこのモデルは、多言語自動音声認識(ASR)および双方向音声翻訳(AST)のためのコンパクトな音声言語モデルです。前身モデル「granite-speech-3.3-2b」の半分のパラメータ数でありながら、英語の文字起こし精度の向上、推測的デコードによる高速な推論、そして拡張された言語サポート(英語、フランス語、ドイツ語、スペイン語、ポルトガル語、日本語)を実現しています。今回のリリースでは、コミュニティから要望の多かった2つの新機能、すなわち日本語ASRのサポートと、固有名詞や頭字語の認識向上のためのキーワードリストバイアスを追加しました。また、Granite 4.0 1B Speechは、OpenASRリーダーボードで1位を獲得しており、オープンな音声認識システムの中でも優れた性能を発揮することが示されています。
小型モデルにもかかわらず、Granite 4.0 1B Speechは標準的な英語ASRベンチマークで非常に高い競争力を示しています。性能は単語誤り率(WER)——誤って文字起こしされた単語の割合——で測定され、値が低いほど精度が高いことを意味します。チャート1が示す通り、このモデルは、多くの同等モデルよりもはるかに少ないパラメータ数でありながら、複数のデータセットにおいて優れた(低い)WERを達成しています。
チャート1: granite-4.0-1B-speechは、小型モデルでありながら、多くのベンチマークで競争力のある低いWER、すなわち高いASR精度を実現しています。
すべてのGraniteモデルと同様、Granite 4.0 1B SpeechはApache 2.0ライセンスの下で公開され、transformersおよびvLLMでネイティブにサポートされています。当モデルを、英語、多言語、翻訳タスクにわたる一連の標準ASR/ASTベンチマークで評価した結果、パラメータ数がはるかに多いモデルと同等、あるいはそれ以上の性能を発揮することが確認されました。詳細な評価結果、アーキテクチャ、学習データ、使用例はモデルカードをご覧ください。本番環境へのデプロイメントで追加のリスク検出が必要な場合は、Granite Guardianとの併用をお勧めします。
ぜひお試しいただき、ご意見をお聞かせください。



原文を表示
Back to Articles Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge
Upvote 1
We’re excited to share Granite 4.0 1B Speech, the latest addition to IBM's Granite Speech collection. Designed for enterprise applications on resource-constrained devices, Granite 4.0 1B Speech is a compact speech-language model built for multilingual automatic speech recognition (ASR) and bidirectional speech translation (AST). With only half the parameters of its predecessor, granite-speech-3.3-2b, the model delivers higher English transcription accuracy, faster inference through speculative decoding, and expanded language support, now covering English, French, German, Spanish, Portuguese, and Japanese. Two new additions in this release are Japanese ASR support and keyword list biasing for improved recognition of names and acronyms, both of which are frequently requested capabilities from the community. Granite 4.0 1B Speech also recently ranked #1 on the OpenASR leaderboard, highlighting its strong performance among open speech recognition systems.
Despite its small size, Granite 4.0 1B Speech achieves highly competitive results on standard English ASR benchmarks. Performance is measured using Word Error Rate (WER)—the percentage of words transcribed incorrectly—where lower scores indicate better accuracy. As shown in Chart 1, Granite 4.0 1B Speech delivers strong WER across multiple datasets while using far fewer parameters than many comparable models.
Chart 1: granite-4.0-1B-speech delivers competitively low WER, thus strong ASR accuracy, across many benchmarks while being a small model.
Like all Granite models, Granite 4.0 1B Speech is released under an Apache 2.0 license with native support in transformers and vLLM. We evaluated the model across a range of standard ASR and AST benchmarks — spanning English, multilingual, and translation tasks — and found it performs as well as or better than models well above its parameter count. Full evaluation results, architecture details, training data, and usage examples can be found on the model card. We recommend pairing it with Granite Guardian for production deployments requiring additional risk detection.
Give it a try today and let us know what you think!



関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み