LLM の重み内部における政治的検閲の実態(109 分読)
Qwen3.5-9B の政治的検閲が、事前学習された事実知識とは独立した小さな回路によって制御されていることが解明され、この回路を特定して無効化できる可能性が示唆されています。
Qwen3.5-9B の政治的検閲が、事前学習された事実知識とは独立した小さな回路によって制御されていることが解明され、この回路を特定して無効化できる可能性が示唆されています。
重要度スコアの内訳、キーポイント、影響分析、編集コメントをプレミアムで公開中。
この記事の日本語全文は、プレミアムプランで公開しています。
原文をDeepSeekが自然な日本語に翻訳し、長文は段落単位で読みやすく整形。さらに本記事の深層分析(キーポイント・影響分析・編集コメント)もまとめて読めます。
まずは無料で、日報・週報・記事一覧をご利用ください。
続きを日本語で読む
無料登録で1日5記事まで読めます。プレミアムなら無制限。
関連記事
Datasette Agent のバージョン 0.1a4 がリリース
Simon Willison が、Datasette 1.0a30 で追加された JavaScript プラグインフックを活用し、エージェント機能の改善を含む新バージョン「datasette-agent 0.1a4」を公開した。
アルミン・ロナーカーへの引用:AI が生成した不正確な報告の弊害について
Simon Willison は、Almin Ronacher の指摘を引用し、AI が問題報告を再構成して誤った結論を自信満々に提示する現状が、根本原因の特定を不可能にしている問題を指摘しています。
Mad House — ユズバーン・クリーピー・コンピューターゲーム
Simon Willison は、UK の出版社ユズバーンが1980年代のコンピュータ関連書籍を無料PDFとして公開したことを紹介し、自身が子供の頃にコモドール64で遊んだ思い出を語っている。