#explainable ai (xai) のAIニュース

4件の記事

AI を駆使した説明と実験による脳理解の探求

マイクロソフト研究所は、大規模言語モデルを用いて人間の脳の言語反応を高精度に予測する手法を開発したが、その性能の根拠となるパラメータ群は解読不能である。同所は大学と連携し、生成因果テスト（GCT）という新たなアプローチでこの黒箱問題を解決しようとしている。

Anthropic は、AI モデルの内部活性化を人間が理解できるテキストに変換する「自然言語オートエンコーダー」を発表した。この技術は AI の安全性や隠れた動機を検出し、モデルの整合性監査を強化する一方、幻覚やコスト高などの課題も残っている。

MITの研究者が、医療診断などの高リスク分野でAIの意思決定を人間が理解できる概念で説明する「概念ボトルネックモデリング」を開発した。

トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。