#supervised fine-tuning のAIニュース

2件の記事

NVIDIA Open-SWE-Traces を用いた教師あり微調整データの構築：軌道解析、パッチ分析、トークン予算、ツール使用指標

MarkTechPost は、Hugging Face からストリーミングされる NVIDIA の Open-SWE-Traces データセットを Google Colab で活用し、エージェント型ソフトウェアエンジニアリングの軌道を微調整用に準備する手法を解説している。

Amazon Science は、大規模言語モデル（LLM）に対し、複数の多様な推論経路を生成・比較する並列推論手法が、モデルの推論能力の限界理解と意思決定の向上に有効であることを示した。