Claude Code の「拡張思考」出力のテキストは真正ではない(3 分読了)
Claude Code の「拡張思考」機能において、ユーザーが期待する推論プロセスの完全なログは暗号化されており、実際には要約のみが提供されるという重大な事実が明らかになった。
キーポイント
推論ログの非公開と暗号化
Claude Code はセッションを記録するが、モデルの思考プロセス(thinking blocks)は署名付きで暗号化されており、ユーザー端末には復号鍵を持たないため実質的にアクセス不能である。
API による要約情報の提供
通常のエンドポイントでは、実際の推論プロセスではなく、その要約(SUMMARY)が返却される仕組みとなっており、完全な思考ログの取得にはエンタープライズ契約が必要である。
監査証跡としての限界
ユーザーはローカルファイルから推論ロジックを生成できず、入力・出力・アクションのスクレイピングも可能だが、それらはモデルの行動を駆動した「実際の思考」ではないため、完全な監査証跡としては機能しない。
ドキュメント表現の不透明さ
Anthropic のドキュメントは間接的な表現が多く、「拡張思考」が完全なプロセスの要約であることを明確に理解していないと、誤った期待を抱くリスクがある。
オープンソースモデルの性能向上の必要性
記事では、オープンソースモデルにおけるパフォーマンス改善のスピードをさらに高める必要があると指摘されています。
影響分析・編集コメントを表示
影響分析
この情報は、AI エージェント開発者や企業にとって極めて重要です。特にコンプライアンス監査やデバッグにおいて、モデルの内部推論プロセスを完全に追跡・検証できるという前提でシステムを設計していた場合、重大なリスク要因となります。開発者は「要約」が「完全な思考」ではないことを理解し、エンタープライズ契約の有無や代替手段を検討する必要があります。
編集コメント
AI の透明性と説明責任が求められる中で、内部推論プロセスの非公開は開発者にとって大きな課題です。この記事は、ツール選定や監査体制の見直しを迫る重要な警鐘となっています。
Claude Code は各セッションをディスクに記録します。そのログには「思考ブロック」が含まれており、これはモデルが作業を行う際の自身の推論プロセスです。
私は今週末にその推論を検証しましたが、署名(600 文字分)は存在するものの、実際のテキストは見つかりませんでした。
そこでドキュメントを読み直しました:https://platform.claude.com/docs/en/build-with-claude/extended-thinking
知っておくべきいくつかの詳細があります:
- Claude はその推論を署名の中に暗号化して格納しています。
- 鍵は Anthropic が保持しており、お客様のマシンには配信されません。
- API は推論そのものではなく、推論の「要約」を返します。
- 完全な思考出力を取得するには、エンタープライズ契約が必要です。
Matt Green 氏がこれについて調査し、署名ブロックに関するより詳細な観察結果を持っています。
誰かに監査証跡(audit trail)を提供すると約束する前に、これは知っておくべき事実です。また注意してください:Ctrl+O から得られる「拡張思考」出力は、Fable/Opus の思考の要約です。https://platform.claude.com/docs/en/build-with-claude/extended-thinking#summarized-thinking これはセッション内でモデルの行動を駆動した実際の思考そのものではなく、思考ロジックの要約に過ぎません。これは BMP 形式の画像を JPEG として保存し、その JPEG を編集して再び BMP として保存するようなものです。変換過程でデータ損失が発生します。
[訂正:当初は順序が逆になっており、HN の読者から指摘を受けました。お詫び申し上げます!]
Anthropic が自社のアプリケーションの挙動を提示している方法には、私はあまり感銘を受けませんでした。セッション中に使用したエージェントが用いたロジックの記録が必要な場合:
- ローカルファイルを使ってそのロジックを生成することはできません。システム上の推論ログはあなたにはアクセスできません。
- 走っている Claude Code の入力、出力、およびアクションを、いくらか荒っぽいスクレイピング手法でログに記録することは可能ですが、それでもなお、エージェントの挙動を駆り立てた実際の推論プロセスではありません。
ドキュメント内の記述も非常に間接的です。コーヒーを飲んでいないと、「Extended Thinking は Claude の完全な思考プロセスの要約を返す」という部分を見逃してしまうかもしれません。
imageスクリーンショット
オープンソースモデルにおけるパフォーマンス向上は、もっと迅速に進める必要があります。
原文を表示
Claude Code records each session to disk. Those logs include “thinking blocks” — the model’s own reasoning as it works.
I went to inspect that reasoning this weekend and found a signature (600 characters long) and no text.
So I read the docs: https://platform.claude.com/docs/en/build-with-claude/extended-thinking
Some details worth being aware of:
- Claude encrypts its reasoning into that signature.
- Anthropic holds the key. Your machine doesn’t receive it.
- The API hands back a SUMMARY of reasoning, NOT the reasoning itself.
- Getting the full thinking output requires an enterprise agreement.
Matt Green looked into this and has some more detailed observations on the signature blocks.
This is worth knowing before you promise anyone an audit trail. Also- BEWARE: The “extended-thinking” output from ctrl+o is a summary of Fable/Opus’ thinking. It isn’t the actual thinking that drove the model’s actions in a session- but a summary of the thinking logic. This is like saving a bmp as a .jpeg and then editing the .jpeg and saving it back as a .bmp. The conversion produces data loss. [edit: I originally had the order inverted, which triggered some HN readers. Apologies!]
I’m underwhelmed by how Anthropic is presenting the behavior of their application. If you ever need a record of the logic a used by YOUR AGENT during a session:
- you can’t produce the logic using the local files. The reasoning logs on your system are not accessible to you.
- You can log the inputs, the outputs, and the actions of a running Claude code with some scrappy scraping- but even then- it’s not the actual reasoning that drove the agent’s behavior.
And the language in the docs is awfully indirect. If you haven’t had your coffee, you might miss that “extended thinking returns a summary of Claude’s full thinking process”

Performance improvements in Open Source models need to come faster.
関連記事
Claude Sonnet 5(1 分で読める)
Anthropic が新モデル「Claude Sonnet 5」を発表しました。このモデルは、前世代よりも推論能力や複雑なタスクの処理性能が向上しています。
Claude Code がアーティファクト機能をサポート
Anthropic は Claude Code に「アーティファクト」機能を追加し、PR の解説やシステム説明などの作業セッションをライブで共有可能な視覚ページに変換しました。この機能は自動更新やバージョン履歴をサポートし、チームと企業向けベータ版として提供されています。
Claude Code がアーティファクト機能をサポート
Anthropic は開発者向けツール「Claude Code」に、コード生成結果を直接表示・編集できる「アーティファクト」機能を追加した。これにより、開発ワークフローの効率化が図られる。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み