#supervised fine-tuning のAIニュース
2件の記事
NVIDIA Open-SWE-Traces を用いた教師あり微調整データの構築:軌道解析、パッチ分析、トークン予算、ツール使用指標
MarkTechPost は、Hugging Face からストリーミングされる NVIDIA の Open-SWE-Traces データセットを Google Colab で活用し、エージェント型ソフトウェアエンジニアリングの軌道を微調整用に準備する手法を解説している。
MarkTechPost·6月27日·★★★★
多様な推論経路が LLM により良い意思決定を教える
Amazon Science は、大規模言語モデル(LLM)に対し、複数の多様な推論経路を生成・比較する並列推論手法が、モデルの推論能力の限界理解と意思決定の向上に有効であることを示した。
Amazon Science·5月27日·★★★★