1件の記事
Microsoft Research は、最近の論文「LLM が委任時に文書を破損する」について、AI システムの信頼性に関する議論を踏まえ、同研究が主張する点と主張しない点を明確にしている。この研究は、長期にわたる委任・共同作業タスクに対する堅牢な評価手法の開発を目指している。