1件の記事
研究者らが、大規模言語モデル(LLM)が生成する信頼性の高いが不正確な応答をチェックするため、過信を特定する新たな不確実性定量化方法を開発した。従来の複数回プロンプト送信方法は自己信頼度のみ測定し、過信がユーザーを誤解させる可能性がある問題に対処する。