#explainable ai (xai) のAIニュース

4件の記事

AI を駆使した説明と実験による脳理解の探求

マイクロソフト研究所は、大規模言語モデルを用いて人間の脳の言語反応を高精度に予測する手法を開発したが、その性能の根拠となるパラメータ群は解読不能である。同所は大学と連携し、生成因果テスト(GCT)という新たなアプローチでこの黒箱問題を解決しようとしている。

Microsoft Research·6月26日·★★★★

自然言語オートエンコーダー(9 分読了)

Anthropic は、AI モデルの内部活性化を人間が理解できるテキストに変換する「自然言語オートエンコーダー」を発表した。この技術は AI の安全性や隠れた動機を検出し、モデルの整合性監査を強化する一方、幻覚やコスト高などの課題も残っている。

TLDR AI·5月8日·★★★★

AIモデルの予測説明能力の向上

MITの研究者が、医療診断などの高リスク分野でAIの意思決定を人間が理解できる概念で説明する「概念ボトルネックモデリング」を開発した。

MIT ML News·3月9日·★★★★

トランスフォーマー言語モデルを説明するためのインターフェース

トランスフォーマー言語モデルを入力の顕著性とニューロン活性化で分析するインターフェースを紹介。入力の重要度とニューロン活性化の可視化を通じてモデルの内部動作を理解する手法を提案。

Jay Alammar·12月17日·★★★★