2件の記事
大規模言語モデルの推論精度向上を目的とした、推論時に適用可能な各種スケーリング手法の分類と、最近の関連研究の概要について解説しています。
DeepSeek AIは、一般報酬モデルの推論段階でのスケーラビリティを向上させる新技術「SPCT」に関する論文を発表した。同時に、次世代モデルR2の登場を示唆し、AI界隈で注目を集めている。