Anthropic、Claude に金融取引を任せる「財務エージェント」を発表
Anthropic は Claude AI の金融業務支援能力を強化するため、スキル・コネクタ・サブエージェントで構成される「Finance Agents」テンプレートセットを公開した。
キーポイント
Finance Agents のアーキテクチャ定義
各テンプレートは、タスク固有の知識を持つ「スキル」、データへのアクセス権限を持つ「コネクタ」、特定サブタスクを処理する「サブエージェント」の 3 つで構成される参照アーキテクチャとして設計されている。
Claude Code とエージェントの仕組み
Claude Code は制御フローを駆使してツールやデータを選択する「エージェント」として機能し、サブエージェントは特定のシステムプロンプトとツールを持つ API 呼び出しとして実装される。
KYC/AML スクリーナーの具体例
Know-Your-Customer Screener などのテンプレートでは、Claude がオンボーディング記録を解析し、リスク評価や書類チェックを行う具体的なルール(kyc-rules)を実行可能である。
複雑な用語の整理
記事は「エージェント」と「サブエージェント」の区別を明確にし、これらが本質的には目標達成に向けた反復ループの中でリソース(ツール・データ)を利用するモデルである点を解説している。
KYC スクリーナーの具体的な出力形式
KYC/AML ルール適用時に、リスク評価や文書確認結果を構造化された JSON 形式で出力するスキルが提供されている。
多様な金融エージェントのリストアップ
ピッチビルダーから月次クローザーまで、10 種類以上の金融業務用エージェントテンプレートが利用可能となっている。
人間の監督(Human-in-the-loop)の必要性
ベンチマークでの失敗率が高いことを踏まえ、クライアントへの提出や実行前に人間によるレビューと承認を必須としている。
影響分析・編集コメントを表示
影響分析
この発表は、LLM が単なるチャットボットから、特定のドメイン知識とツール連携を備えた自律的な業務実行エージェントへと進化していることを示す重要なマイルストーンです。特に金融業界のような厳格なコンプライアンスが求められる領域において、再現性のある自動化ソリューションを提供する基盤となり、実務への導入スピードを加速させる可能性があります。
編集コメント
金融分野における AI エージェントの実用化に向けた具体的なアーキテクチャの公開は、開発者が即座に検証・導入できる点で非常に価値が高い。ただし、実際の業務適用には「コネクタ」部分のセキュリティとガバナンスが引き続き課題となるだろう。
もしあなたが、Claude が生成する回答には誤りが含まれる可能性があるという Anthropic の免責事項を読み、「これが金融業務にスパイスを効かせるために必要だ」と思ったことがあるなら、あなたは幸運です。
Anthropic は、その Claude AI サービスが金融タスクをよりよく支援できるように設計された一連の金融エージェントテンプレートをリリースしました。
「各エージェントテンプレートは、3 つの要素をパッケージ化した参照アーキテクチャです:スキル(タスクのための指示とドメイン知識)、コネクタ(タスクが実行されるデータへの管理されたアクセス)、サブエージェント(主要なエージェントによって呼び出される追加の Claude モデルで、比較対象の選択や手法チェックなどの特定のサブタスクを担当します)」と同社は説明しています。
用語は少し曖昧に感じられるかもしれませんが、究極的にはすべてがツールやデータといったリソースを用いて反復ループの中で目標を追求するモデルに過ぎません。
Claude Code 自体は、Anthropic が定義した制御フロー(control flow)を使用して基盤となるモデルをサポートするエージェント型ハーンです。Claude モデルが制御フローを目標に向かって駆動し、どのツールを使用するかやどのデータにアクセスするかを決定している場合、それはエージェントとなります。
そしてサブエージェントが存在しますが、これらは実際には、特殊なシステムプロンプト、指定されたツール、およびオーケストレーションシステムによって提供されるコンテキストを用いて Claude に対して行われる API 呼び出しに過ぎません。これはプログラム内の関数がアプリケーションの特定の側面を処理するのと少し似ています。
Anthropic の金融エージェントは、ワークフローを記述するマークダウンファイルである「スキル」、外部サービスとの統合である「コネクタ」、そして焦点を絞ったシステムプロンプト、特定のツール、文脈データから構成される「サブエージェント」で成り立っています。
- 子供たちは、偽のヒゲを描くことで年齢確認を突破できると主張している
- イギリスの数学者が AI エージェントにクレジットカードを任せた結果、パスワード漏洩や CAPTCHA の混乱などが発生した
- 攻撃者は最新の「CopyFail」と呼ばれる Linux の脆弱性を悪用して利益を得ている
- Bun が Rust への移植ガイドを投稿したが、書き換えはまだ半ば未完成の状態である
例えば、Anthropic の Know-Your-Customer Screener エージェントテンプレート(kyc-screener)には、「kyc-rules」という名前のスキルが含まれており、これは Claude が解析されたオンボーディングレコードに対して企業の KYC/AML(マネーロンダリング防止)規則をどのように適用すべきかを明確に示しています。これらのルールは AI モデルに対し、リスク評価の付与、書類の確認、規則の結果の引用、そして以下のような形式で結果を生成することを指示します:
{
"risk_rating": "low | medium | high",
"disposition": "clear | request-docs | escalate-EDD | decline-recommend",
"missing_documents": ["..."],
"escalation_reasons": ["rule 4.2: confirmed PEP", "..."],
"rule_outcomes": [{"rule_id": "...", "outcome": "...", "evidence": "..."}]
}
この JSON データは、おそらくこれを受け取る企業システムにとって有用なものとなるでしょう。
Anthropic のエージェントリストには、ピッチビルダー、会議準備担当、決算レビュー担当、モデルビルダー、市場調査員、バリュエーションレビュー担当、一般元帳照合担当、月末クローザー、ステートメント監査人、そして前述の KYC スクリーナーが含まれています。
これらは、Claude Cowork や Claude Code においてプラグインとして、あるいは Claude Managed Agents 向けの「cookbook」(コピー可能なコードスニペット)として活用できます。
あなたは、数値のような科学的な分野においては財務が非常に厳しく容赦がないと考えているかもしれません。もしかすると、Anthropic の Opus 4.7 モデルが Vals AI の Finance Agent ベンチマーク で「業界をリードする」64.37 パーセントというスコアを獲得したことに感銘を受けないかもしれません。これは、人間であれば即座に失格となるような失敗率です。
しかしご安心ください。Anthropic は、ユーザーがクライアントへの提出や提出書類の処理、あるいはアクションの実行前に、「Claude の作業をレビューし、反復して改善し、承認する」という形で「常にループ内に留まる」ことを期待しているからです。
会計には責任が伴います。®
原文を表示
If you've ever read Anthropic's disclaimer that responses generated by Claude may contain mistakes and thought, "That's what I need to spice up financial operations," you're in luck.
Anthropic has released a set of financial agent templates designed to allow its Claude AI service to better assist with financial tasks.
"Each agent template is a reference architecture that packages three things: skills (instructions and domain knowledge for the task), connectors (governed access to the data the task runs on), and subagents (additional Claude models that are called upon by the main agent, for specific sub-tasks such as comparables selection or methodology checks)," the company explains.
The terminology can be a bit murky because, at the end of the day, it's all just a model pursuing a goal in an iterative loop with resources like tools and data.
Claude Code itself is an agentic harness that supports an underlying model using Anthropic's defined control flow. When the Claude model is driving the control flow toward a goal – deciding what tools to use and what data to access – that's an agent.
Then there are subagents, and these are really just API calls to Claude using specialized system prompts, specified tools, and context provided by an orchestration system. They're a bit like functions in a program that handle a particular aspect of an application.
So Anthropic's finance agents consist of: skills, which are markdown files that describe workflows; connectors, which are integrations with external services; and subagents, made up of a focused system prompt, specific tools, and contextual data.
- Kids say they can beat age checks by drawing on a fake mustache
- Brit mathematician lets AI agent loose with credit card – cue password leaks, CAPTCHA chaos and more
- Attackers are cashing in on fresh 'CopyFail' Linux flaw
- Bun posts Rust porting guide, says rewrite is still half-baked
For example, Anthropic's Know-Your-Customer Screener agent template (kyc-screener) includes a skill called kyc-rules that spells out how Claude should apply a firm's KYC/AML (anti-money laundering) rules to a parsed onboarding record. The rules tell the AI model to assign a risk rating, check documents, cite rule outcomes, and produce a result formatted thus:
{
"risk_rating": "low | medium | high",
"disposition": "clear | request-docs | escalate-EDD | decline-recommend",
"missing_documents": ["..."],
"escalation_reasons": ["rule 4.2: confirmed PEP", "..."],
"rule_outcomes": [{"rule_id": "...", "outcome": "...", "evidence": "..."}]
}
This JSON data would presumably be useful to whatever corporate system receives it.
Anthropic's list of agents includes: Pitch builder; Meeting preparer; Earnings reviewer; Model builder; Market researcher; Valuation reviewer; General ledger reconciler; Month-end closer; Statement auditor; and, as previously noted, KYC screener.
These can be applied to Claude Cowork and Claude Code as plugins or as a "cookbook" – copyable code snippets – for Claude Managed Agents.
You may be thinking that finance tends to be fairly unforgiving when it comes to sciency stuff like numbers. Perhaps you're unimpressed that Anthropic's Opus 4.7 model scored an "industry leading" 64.37 percent on Vals AI's Finance Agent benchmark – a failure rate that would get a human tossed.
Worry not, because Anthropic expects that users will "stay firmly in the loop – reviewing, iterating on, and approving Claude's work before it goes to a client, gets filed, or is acted on."
With accounting comes accountability. ®
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み