#報酬モデルのAIニュース

2件の記事

報酬モデルは過度に敏感になり得る（22 分読）

メタ社は、報酬モデルが同等の回答に対して過剰反応し、強化学習が報酬ハッキングに向かう可能性を研究した。論文では、識別能力と特異性の両方を測定し、モンテカルロドロップアウトを用いて報酬を安全な離散信号にクラスタリングする手法を提案している。

TLDR AI·6月29日·★★★★

P-GenRM：パーソナライズされた生成報酬モデルが多様な個人嗜好に対応

通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM（Personalized Generative Reward Model）を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。

通义大模型·3月17日·★★★★