2件の記事
アイドル時間を活用して学習速度を2倍に向上させつつ精度を維持する手法が開発された。
研究者らが、大規模言語モデル(LLM)の推論能力を向上させるため、推論時の計算スケーリング、強化学習、教師ありファインチューニング、蒸留などの新戦略を多数発表した。