1件の記事
IBM は、15 トリオントークンで学習した Granite 4.1 系列のオープンソース大規模言語モデルを公開しました。このシリーズは 3B、8B、30B パラメータの Dense アーキテクチャを採用し、特に 8B モデルは多段階強化学習により前世代の 32B モデルに匹敵する性能を実現しています。