#モデル信頼性のAIニュース

3件の記事

Anthropicが「良しだが最高ではない」Claude Opus 4.7をリリース

AnthropicがClaude Opus 4.7をリリースし、モデルのドリフトや幻覚といった企業導入の主要な課題に対応することを目指している。

AI Business·4月17日

詰め込みを減らして記憶を増やす：訓練データの剪定が事実の記憶を改善

ICLR 2026のワークショップで採択された研究が、情報理論の観点から事実記憶を定式化し、訓練データ分布が事実精度に与える影響を分析した。大規模言語モデル（LLM）は事実知識の記憶に苦戦し、幻覚や知識集約型タスクでの低性能を招くが、訓練データの剪定が記憶を改善できることを示した。

Apple Machine Learning·4月13日·★★★★

言語モデルが幻覚を起こす時、自身の数学に「こぼれたエネルギー」を残す

ローマ・サピエンツァ大学の研究者が、大規模言語モデルが幻覚を起こす際に計算内に残す測定可能な痕跡を検出するトレーニング不要の手法を開発した。この手法は従来のアプローチよりも汎化性能が高い。

The Decoder·3月7日