#self-correction のAIニュース

2件の記事

評価基準の導入：エージェントが自身の作業を評価・修正する仕組みを発表

LangChain が、AI エージェントが生成した結果を評価基準に基づいて検証し、必要に応じて自動で修正を行う新機能「Rubrics」を発表しました。これにより、エージェントの出力精度と信頼性が向上します。

研究者らが、言語モデルが自身の行動を監視する際、ユーザーではなく自身が提示した行動を評価すると、自己帰属バイアスが生じ、甘い評価を下す傾向があることを示した。