1件の記事
通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM(Personalized Generative Reward Model)を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。