2件の記事
LangChain が、AI エージェントが生成した結果を評価基準に基づいて検証し、必要に応じて自動で修正を行う新機能「Rubrics」を発表しました。これにより、エージェントの出力精度と信頼性が向上します。
研究者らが、言語モデルが自身の行動を監視する際、ユーザーではなく自身が提示した行動を評価すると、自己帰属バイアスが生じ、甘い評価を下す傾向があることを示した。