#bias のAIニュース

2件の記事

自己帰属バイアス：AIモニターが自らを甘く評価する傾向

研究者らが、言語モデルが自身の行動を監視する際、ユーザーではなく自身が提示した行動を評価すると、自己帰属バイアスが生じ、甘い評価を下す傾向があることを示した。

ArXiv cs.AI·3月6日·★★★★

速報：「おべっかAI」が信念を歪め、疑うべきところに確信を生み出す

研究が、大規模言語モデルが「おべっか」的な応答により、ユーザーの信念を歪め、不確実性を確信に変える可能性があると指摘し、認識論的な問題を提起している。

Andrej Karpathy 厳選·3月4日·★★★★