2件の記事
Preferred Networks は、推論モデル中心の既存評価基準を見直し、事前学習済み大規模言語モデル PLaMo の能力を適切に測定する新たなベンチマーク構築を進めている。
オープンソースの大規模言語モデルGPT-OSS-120Bに論理クイズや数学問題を解かせ、その推論プロセスをログから詳細に分析した研究内容。