1件の記事
Googleの研究チームは、モバイル環境向けに効率を最大化する新アーキテクチャを開発し、既存の「凍結」状態にあるGemini Nano v3モデルにマルチトークン予測機能を組み込むことで、ポケットに入る大規模言語モデルのパフォーマンス向上を実現した。