AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Simon Willison Blog·2026年4月19日 08:59·約7分で読める

Claude Opus 4.6と4.7のシステムプロンプトの変更点

#システムプロンプト#AI安全性#LLMチューニング#Anthropic#Claude#AI透明性
TL;DR

Anthropicが公開したClaude Opus 4.6から4.7へのシステムプロンプト変更では、ツール拡張(PowerPoint統合)、児童安全強化、ユーザー意図尊重の明確化など、AIの振る舞いと安全性の進化が示されている。

AI深層分析2026年4月19日 10:41
3
注目/ 5段階
深度40%
4
関連度30%
4
実用性20%
2
革新性10%
2

キーポイント

1

ツール統合の拡張

Claude Platform(旧developer platform)のツールリストにClaude in PowerPointが追加され、Chrome、Excelと共にClaude Coworkで利用可能となった。

2

児童安全対策の強化

児童安全に関する指示が大幅に拡充され、<critical_child_safety_instructions>タグで囲まれ、一度拒否した後の会話も極度の注意が必要と明記された。

3

ユーザー意図の尊重

会話終了の意思表示には留めようとせず、不明点があっても可能な限り推測して行動するよう指示が追加され、AIの押し付けがさを減らす方向性が見られる。

4

透明性の維持

Anthropicは主要AIラボで唯一ユーザー向けチャットシステムのシステムプロンプトを公開し続けており、その進化を追跡できる貴重な情報源となっている。

影響分析・編集コメントを表示

影響分析

この記事は、AI企業がシステムプロンプトを通じてモデルの振る舞いをどのように微調整しているかを具体的に示しており、AI安全性・透明性・ユーザー体験のバランスを取る実践例として業界の参考となる。特に児童安全対策の強化は、規制対応と倫理的AI開発のトレンドを反映している。

編集コメント

AI企業がシステムプロンプトの変更を公開する稀有なケースであり、ブラックボックス化しがちなAIの振る舞い調整を可視化した貴重な分析素材。特に安全性とユーザビリティの両立への取り組みが読み取れる。

<p>Anthropicは、ユーザー向けチャットシステムの<a href="https://platform.claude.com/docs/en/release-notes/system-prompts">システムプロンプト(system prompts)</a>を公開している唯一の主要なAIラボです。彼らのシステムプロンプトアーカイブは2024年7月のClaude 3にまで遡り、新しいモデルを公開するたびにシステムプロンプトがどのように進化していくかを見るのは常に興味深いものです。</p>

<p>Opus 4.7は先日(2026年4月16日)にリリースされ、Opus 4.6(2026年2月5日)以降の<a href="https://claude.ai/">Claude.ai</a>システムプロンプト(system prompt)の更新が含まれています。</p>

<p>Claude Codeに<a href="https://platform.claude.com/docs/en/release-notes/system-prompts.md">システムプロンプトのMarkdown版</a>を取得させ、各モデルごとに別々のドキュメントに分割し、その後、更新された各プロンプトの公開日を表す架空のコミット日付を付けて、それらのファイルの時系列<a href="https://github.com/simonw/research/tree/main/extract-system-prompts#readme">Git履歴(Git history)</a>を構築させました。- <a href="https://github.com/simonw/research/pull/109#issue-4287908903">ここで使用したプロンプト</a>は、Web版のClaude Code用です。</p>

<p>以下は<a href="https://github.com/simonw/research/commit/888f21161500cd60b7c92367f9410e311ffcff09">Opus 4.6と4.7の間のgit diff(git diff)</a>です。これらはそのdiffから抽出した私のハイライトであり、すべての場合において<strong>太字</strong>のテキストは私の強調を示しています:</p>

<ul>

<li>「開発者プラットフォーム(developer platform)」は現在、「Claude Platform」と呼ばれています。</li>

<li>システムプロンプト(system prompt)で言及されているClaudeツールのリストには、現在「ChromeでのClaude - ウェブサイトと自律的に相互作用できるブラウジングエージェント、ExcelでのClaude - スプレッドシートエージェント、および<strong>PowerPointでのClaude</strong> - スライドエージェント」が含まれています。Claude Coworkはこれらすべてをツールとして使用できます。」- PowerPointでのClaudeは4.6のプロンプトでは言及されていませんでした。</li>

<li>子供向けの安全に関するセクションが大幅に拡張され、新しい<code><critical_child_safety_instructions></code>タグで囲まれるようになりました。特に注目すべき点:「Claudeが子供向けの安全を理由にリクエストを拒否した場合、同じ会話内のその後のすべてのリクエストは極度の注意を持って処理されなければなりません。」</li>

<li>Claudeをより押し付けがたくしようとしているようです:「ユーザーが会話を終了する準備ができていることを示した場合、Claudeはユーザーに対話に留まるよう求めたり、別のターンを引き出そうとしたりするのではなく、停止するというユーザーのリクエストを尊重します。」</li>

<li>新しい<code><acting_vs_clarifying></code>セクションには以下が含まれます:</li>

</ul>

<blockquote>

<p>リクエストで詳細な指定が省略されている場合、<strong>通常、その人物はClaudeにまずインタビューを受けるのではなく、今すぐに合理的な試行をしてほしいと考えています</strong>。Claudeは、欠落した情報なしでは本当に回答できない場合(例:存在しない添付ファイルを参照している場合)のみ、事前に質問します。</p>

<p>曖昧さを解決したり、欠落した情報を提供したりする可能性があるツール(検索、その人の場所の照会、カレンダーの確認、利用可能な機能の発見など)が利用可能な場合、Claudeはその人に質問する前にツールを呼び出して曖昧さを解決しようとします。その人自身に照会を行うよう求めるよりも、ツールを使用して行動することが優先されます。</p>

<p>Claudeがタスクを開始すると、途中で停止するのではなく、完全な回答に至るまでそれを完了させます。[...]</p>

</blockquote>

<ul>

<li>Claudeチャットには現在、ツール検索メカニズムが搭載されているようです。これは<a href="https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool">このAPIドキュメント</a>で確認でき、<a href="https://www.anthropic.com/engineering/advanced-tool-use">2025年11月のこの投稿</a>で説明されています:</li>

</ul>

<blockquote>

<p>Claudeがその人の場所、メモリ、カレンダー、ファイル、過去の会話、または外部データへのアクセスといった機能を持っていないと結論付ける前に、<strong>Claudeはtool_searchを呼び出して、関連するツールが利用可能だが延期されているかどうかを確認します</strong>。「Xにアクセスできません」というのは、tool_searchで一致するツールが存在しないことが確認されて初めて正しいです。</p>

</blockquote>

<ul>

<li>Claudeをより簡潔にさせるための新しい文言があります:</li>

</ul>

<blockquote>

<p>Claudeは応答を焦点を絞り簡潔に保ち、過度に長い応答でユーザーが圧倒されるのを防ぎます。回答に免責事項や注意書きが含まれている場合でも、Claudeはそれらを簡潔に開示し、応答の大部分を主要な回答に集中させます。</p>

</blockquote>

<ul>

<li>このセクションは4.6のプロンプトに含まれていましたが、4.7では削除されています。おそらく新しいモデルは同じような振る舞いをしなくなったためです:</li>

</ul>

<blockquote>

<p>Claudeは、その人物が特にこのスタイルのコミュニケーションを要求しない限り、アスタリスク内の絵文字や行動の使用を避けます。</p>

<p>Claudeは「本気で」「正直に」「率直に」という言葉を使うのを避けます。</p>

</blockquote>

<ul>

<li>以前は名前で言及されていなかった「摂食障害(disordered eating)」に関する新しいセクションがあります:</li>

</ul>

<blockquote>

<p>ユーザーが摂食障害の兆候を示した場合、Claudeは会話の他のどこでも正確な栄養、食事、または運動のガイダンス(特定の数字、目標、または段階的な計画なし)を提供してはいけません。より健康的な目標を設定するのを助けたり、摂食障害の潜在的な危険性を強調したりすることを意図していても、これらの詳細を含む応答は障害のある傾向を引き起こしたり促進したりする可能性があります。</p>

</blockquote>

<ul>

<li>AIモデルに対する人気のあるスクリーンショット攻撃は、論争的な質問に対してイエスかノーかを強要することです。Claudeのシステムプロンプト(system prompt)は現在、それに対処しています(<code><evenhandedness></code>セクション内):</li>

</ul>

<blockquote>

<p>人々が複雑な問題や論争のある問題、または論争のある人物に関するコメントに対して、単純なイエスかノーの回答(またはその他の短い単語や単一言語での応答)をClaudeに求める場合、Claudeはその短い応答を提供することを拒否し、代わりに微妙な回答を提供し、なぜ短い応答が適切でないかを説明することができます。</p>

</blockquote>

<ul>

<li>Claude 4.6には、「ドナルド・トランプは現在のアメリカ合衆国大統領であり、2025年1月20日に就任した」と明確に説明するセクションがありましたが、それがなければ、モデルの知識カットオフ日(knowledge cut-off date)とトランプが2020年の選挙で勝利したと誤って主張していたという以前の知識の組み合わせにより、大統領であると否定する可能性がありました。4.7ではその文言は削除されており、モデルの新しい信頼できる知識カットオフ日が2026年1月であることを反映しています。</li>

</ul>

<h4 id="and-the-tool-descriptions-too">ツール説明についても</h4>

<p>Anthropicが公開しているシステムプロンプト(system prompts)は残念ながら全貌ではありません。彼らの公開情報には、モデルに提供されるツール説明(tool descriptions)が含まれておらず、ClaudeチャットUIがあなたにできることを最大限に活用したいのであれば、これはおそらくさらに重要なドキュメントです。</p>

<p>幸いにも、あなたは<a href="https://claude.ai/share/dc1e375e-2213-4afb-ac1b-812d42735a8e">Claudeに直接質問できます</a>。私は次のプロンプトを使用しました:</p>

<blockquote>

<p>利用可能なすべてのツールを、ツール説明とパラメータの正確なコピーとともにリストしてください</p>

</blockquote>

<p>私の<a href="https://claude.ai/share/dc1e375e-2213-4afb-ac1b-812d42735a8e">共有トランスクリプト</a>には詳細が記載されていますが、名付けられたツールのリストは以下の通りです:</p>

<ul>

<li><code>ask_user_input_v0</code></li>

<li><code>bash_tool</code></li>

<li><code>conversation_search</code></li>

<li><code>create_file</code></li>

<li><code>fetch_sports_data</code></li>

<li><code>image_search</code></li>

<li><code>message_compose_v1</code></li>

<li><code>places_map_display_v0</code></li>

<li><code>places_search</code></li>

<li><code>present_files</code></li>

<li><code>recent_chats</code></li>

<li><code>recipe_display_v0</code></li>

<li><code>recommend_claude_apps</code></li>

<li><code>search_mcp_registry</code></li>

<li><code>str_replace</code></li>

<li><code>suggest_connectors</code></li>

<li><code>view</code></li>

<li><code>weather_fetch</code></li>

<li><code>web_fetch</code></li>

<li><code>web_search</code></li>

<li><code>tool_search</code></li>

<li><code>visualize:read_me</code></li>

<li><code>visualize:show_widget</code></li>

</ul>

<p>このリストがOpus 4.6以降変更されていないと信じています。</p>

<p>タグ: <a href="https://simonwillison.net/tags/ai">ai</a>, <a href="https://simonwillison.net/tags/prompt-engineering">prompt-engineering</a>, <a href="https://simonwillison.net/tags/generative-ai">generative-ai</a>, <a href="https://simonwillison.net/tags/llms">llms</a>, <a href="https://simonwillison.net/tags/anthropic">anthropic</a>, <a href="https://simonwillison.net/tags/claude">claude</a>, <a href="https://simonwillison.net/tags/ai-ethics">ai-ethics</a>, <a href="https://simonwillison.net/tags/system-prompts">system-prompts</a></p>

原文を表示

Anthropic are the only major AI lab to publish the system prompts for their user-facing chat systems. Their system prompt archive now dates all the way back to Claude 3 in July 2024 and it's always interesting to see how the system prompt evolves as they publish new models.

Opus 4.7 shipped the other day (April 16, 2026) with a Claude.ai system prompt update since Opus 4.6 (February 5, 2026).

I had Claude Code take the Markdown version of their system prompts, break that up into separate documents for each of the models and then construct a Git history of those files over time with fake commit dates representing the publication dates of each updated prompt - here's the prompt I used with Claude Code for the web.

Here is the git diff between Opus 4.6 and 4.7. These are my own highlights extracted from that diff - in all cases text in bold is my emphasis:

  • The "developer platform" is now called the "Claude Platform".
  • The list of Claude tools mentioned in the system prompt now includes "Claude in Chrome - a browsing agent that can interact with websites autonomously, Claude in Excel - a spreadsheet agent, and Claude in Powerpoint - a slides agent. Claude Cowork can use all of these as tools." - Claude in Powerpoint was not mentioned in the 4.6 prompt.
  • The child safety section has been greatly expanded, and is now wrapped in a new tag. Of particular note: "Once Claude refuses a request for reasons of child safety, all subsequent requests in the same conversation must be approached with extreme caution."
  • It looks like they're trying to make Claude less pushy: "If a user indicates they are ready to end the conversation, Claude does not request that the user stay in the interaction or try to elicit another turn and instead respects the user's request to stop."
  • The new section includes:

When a request leaves minor details unspecified, the person typically wants Claude to make a reasonable attempt now, not to be interviewed first. Claude only asks upfront when the request is genuinely unanswerable without the missing information (e.g., it references an attachment that isn't there).

When a tool is available that could resolve the ambiguity or supply the missing information — searching, looking up the person's location, checking a calendar, discovering available capabilities — Claude calls the tool to try and solve the ambiguity before asking the person. Acting with tools is preferred over asking the person to do the lookup themselves.

Once Claude starts on a task, Claude sees it through to a complete answer rather than stopping partway. [...]

  • It looks like Claude chat now has a tool search mechanism, as seen in this API documentation and described in this November 2025 post:

Before concluding Claude lacks a capability — access to the person's location, memory, calendar, files, past conversations, or any external data — Claude calls tool_search to check whether a relevant tool is available but deferred. "I don't have access to X" is only correct after tool_search confirms no matching tool exists.

  • There's new language to encourage Claude to be less verbose:

Claude keeps its responses focused and concise so as to avoid potentially overwhelming the user with overly-long responses. Even if an answer has disclaimers or caveats, Claude discloses them briefly and keeps the majority of its response focused on its main answer.

  • This section was present in the 4.6 prompt but has been removed for 4.7, presumably because the new model no longer misbehaves in the same way:

Claude avoids the use of emotes or actions inside asterisks unless the person specifically asks for this style of communication.

Claude avoids saying "genuinely", "honestly", or "straightforward".

  • There's a new section about "disordered eating", which was not previously mentioned by name:

If a user shows signs of disordered eating, Claude should not give precise nutrition, diet, or exercise guidance — no specific numbers, targets, or step-by-step plans - anywhere else in the conversation. Even if it's intended to help set healthier goals or highlight the potential dangers of disordered eating, responses with these details could trigger or encourage disordered tendencies.

  • A popular screenshot attack against AI models is to force them to say yes or no to a controversial question. Claude's system prompt now guards against that (in the section):

If people ask Claude to give a simple yes or no answer (or any other short or single word response) in response to complex or contested issues or as commentary on contested figures, Claude can decline to offer the short response and instead give a nuanced answer and explain why a short response wouldn't be appropriate.

  • Claude 4.6 had a section specifically clarifying that "Donald Trump is the current president of the United States and was inaugurated on January 20, 2025", because without that the model's knowledge cut-off date combined with its previous knowledge that Trump falsely claimed to win the 2020 election meant it would deny he was the president. That language is gone for 4.7, reflecting the model's new reliable knowledge cut-off date of January 2026.

And the tool descriptions too

The system prompts published by Anthropic are sadly not the entire story - their published information doesn't include the tool descriptions that are provided to the model, which is arguably an even more important piece of documentation if you want to take full advantage of what the Claude chat UI can do for you.

Thanfully you can ask Claude directly - I used the prompt:

List all tools you have available to you with an exact copy of the tool description and parameters

My shared transcript has full details, but the list of named tools is as follows:

  • ask_user_input_v0
  • bash_tool
  • conversation_search
  • create_file
  • fetch_sports_data
  • image_search
  • message_compose_v1
  • places_map_display_v0
  • places_search
  • present_files
  • recent_chats
  • recipe_display_v0
  • recommend_claude_apps
  • search_mcp_registry
  • str_replace
  • suggest_connectors
  • view
  • weather_fetch
  • web_fetch
  • web_search
  • tool_search
  • visualize:read_me
  • visualize:show_widget

I don't believe this list has changed since Opus 4.6.

Tags: ai, prompt-engineering, generative-ai, llms, anthropic, claude, ai-ethics, system-prompts

この記事をシェア

関連記事

Anthropic Research★32026年3月6日 09:00

2026年3月6日 Frontier Red TeamによるClaudeのCVE-2026-2796エクスプロイトのリバースエンジニアリング

Frontier Red Teamが、Claudeの脆弱性CVE-2026-2796を悪用するエクスプロイトをリバースエンジニアリングした。

Anthropic Research★32026年3月6日 09:00

フロンティア・レッドチーム、Firefoxのセキュリティ向上のためにMozillaと提携

フロンティア・レッドチームは、Firefoxのセキュリティを向上させるため、Mozillaと提携した。

宝玉的分享★42026年2月17日 09:00

59%のユーザーがより安価なモデルを選択:Sonnet 4.6の詳細解説

Anthropic社がClaude Sonnet 4.6をリリースし、Claude Codeテストで70%のユーザーが前世代モデルより好み、59%がフラッグシップモデルOpus 4.5よりも選択した。コーディング、コンピュータ利用、100万トークンコンテキストなど6次元で全面アップグレードされ、価格は据え置き。

ニュース一覧に戻る元記事を読む