#sft のAIニュース

3件の記事

VibeThinker-3B：Qwen2.5-Coder-3Bを基盤にスペクトルから信号へのポストトレーニングパイプラインで構築された 30 億パラメータの密着型推論モデル

中国の新浪微博研究所が開発した「VibeThinker-3B」は、大規模なパラメータ数に依存しない効率的なアプローチを採用し、検証可能なタスクにおいて数百倍サイズのモデルと同等の性能を発揮する 30 億パラメータの推論モデルとして公開された。

MarkTechPost·6月20日·★★★★

Amazon SageMaker AI で SFT と DPO を活用し、エージェントのツール呼び出し精度を向上させる方法

AWS は、Amazon SageMaker AI を使用して教師あり学習（SFT）と直接最適化（DPO）を適用することで、AI エージェントが適切なツールを選択する精度を高め、エラー率やサポートコストを削減できると発表した。

AWS Machine Learning Blog·6月4日·★★★★

LLMの迷宮を辿る：オープンソースLLMとその先への包括的ガイド

AI開発の急速な進展により、多数のオープンソース基盤モデルとその派生モデルが生まれ、追従が困難になっている現状を解説するガイド。

Spiral.AI Tech Blog·3月14日