Claude Opus 4.6による金融の進化
Claude Opus 4.6が金融業界に革新をもたらし、効率化と新たな可能性を開拓する取り組みについて紹介されています。
キーポイント
Claude Opus 4.6は金融分析・推論において大幅な性能向上(前モデル比23ポイント以上)を達成
金融業務に特化した新機能(Claude in PowerPointベータ版)と既存製品(Cowork、Excel統合)の強化を同時発表
複数の外部ベンチマーク(Finance Agent、TaxEval等)で最先端性能を実証し、実務応用を強く意識した開発方針を示した
影響分析・編集コメントを表示
影響分析
金融業界という厳密性と実用性が求められる分野へのAI本格導入を加速させる発表。特定業界に特化したモデル性能の最適化と、Excel/PowerPointなど実務ツールへの深い統合という二つの方向性を示しており、生成AIの「実務浸透フェーズ」への移行を象徴する。
編集コメント
「AIの実用化」を金融という厳しい分野で具体化したケース。ベンチマーク数値と実製品のアップデートをセットで発表する戦略的PRと言える。
Claude Opus 4.6:金融分析の進化を支えるAIの新たなステップ
Anthropicは、最新のAIモデル「Claude Opus 4.6」を発表し、金融分野における意思決定と分析業務の高度化を支援することを明らかにした。このモデルは、複雑な財務推論、マルチタスキング、そして長い多段階タスクにおける集中力の維持において、市場の他のモデルを大きく上回る性能を有している。
金融専門家はAIを主に三つの領域で活用する。複数のデータソースを横断した効果的な調査、財務分析の支援、そしてチームや顧客が実行可能な成果物の作成である。Claude Opus 4.6はこれら全ての領域で最高水準の能力を発揮する。
まず調査においては、大規模で非構造化のデータソースから特定情報を抽出する能力を測るベンチマーク「BrowseComp」と「DeepSearchQA」で性能を向上させた。これにより、ユーザーは複雑な文書群をClaudeに渡すだけで、単なる要約ではなく、具体的で焦点の絞られた回答を得られるようになる。
次に分析では、公開企業のSEC提出書類の調査を評価する外部ベンチマーク「Finance Agent」で60.7%(Opus 4.5から5.47%改善)を達成し、最先端の性能を示した。また、税務評価ベンチマーク「TaxEval」でも76.0%で最高水準を記録している。
さらに成果物の作成については、投資銀行、プライベート・エクイティ、パブリック投資、企業財務など幅広い分野のアナリストが日常的に行う、スプレッドシート、スライドデッキ、文書の生成・レビューを含む約50のユースケースで構成される「Real-World Finance」内部評価を実施。その結果、わずか数ヶ月前の最先端モデル「Claude Sonnet 4.5」と比較して、23パーセントポイント以上の大幅な改善を確認した。
この性能向上を実際の業務環境に組み込むため、既存製品の更新と新製品の導入も同時に行われる。共同作業ツール「Cowork」は、財務モデルやプレゼンテーションなどの成果物の初回作成時点での完成度を高める。「Claude in Excel」は、財務モデルが複雑化してもClaude Opus 4.6の焦点と正確性を維持し、長時間タスクの処理能力を向上させる。そして新たに「Claude in PowerPoint」がベータ版の研究プレビューとしてリリースされ、プレゼンテーション資料のネイティブな構築と反復改良が可能となる。
これらの総合的なアップデートにより、Claudeは金融サービス業界および企業財務部門における、より強力な「パートナー」としての地位を確立する。Claude Opus 4.6は、正確な情報と明確な分析に基づく意思決定を支援し、洗練された成果物を生成することで、金融チームの生産性とアウトプットの質を一段階引き上げることを目指している。
原文を表示
Contact salesContact salesContact sales
Contact salesContact salesContact sales
Contact salesContact salesContact sales
Contact salesContact salesContact sales
Advancing finance with Claude Opus 4.6
With Claude Opus 4.6, finance teams get better reasoning on complex analyses, cleaner first-pass deliverables, and new tools built for where analysts actually spend their time.
ShareCopy linkhttps://claude.com/blog/opus-4-6-finance
Claude Opus 4.6 marks a step forward in AI for finance. It can be used to help professionals make decisions based on accurate information and clear analysis, and it produces deliverables with real polish. The model is substantially better than others in the market at financial reasoning, multitasking, and maintaining focus over longer multi-step tasks.
Alongside Claude Opus 4.6, we’re updating some of our existing products—and introducing a new one—to put these capabilities where analysts spend the majority of their time. Cowork now delivers more polished outputs, such as financial models and presentations, on the first pass. Claude in Excel is now better at handling long-running tasks, with Claude Opus 4.6 staying focused and accurate as financial models become more complex. And we’re releasing Claude in PowerPoint as a research preview in beta for natively building and iterating on decks and presentations.
Our internal Real-World Finance evaluation measures Claude’s performance on ~50 investment and financial analysis use cases spanning spreadsheets, slide decks, and word document generation and review. These are tasks commonly performed by analysts across investment banking, private equity, public investing, and corporate finance. Claude Opus 4.6 improves by over 23 percentage points on Claude Sonnet 4.5, our state-of-the-art model just a few months ago.
Together, these updates make Claude a much stronger partner for those across financial services and corporate finance.
Financial professionals use AI to research effectively across multiple data sources, support financial analyses, and create deliverables that their teams and customers can act on. Claude Opus 4.6 is best in class across all three dimensions.
On research, Claude Opus 4.6 improves on both BrowseComp and DeepSearchQA, two benchmarks that test a model’s ability to extract specific information from large, unstructured data sources. In practice, this means that users can hand Claude a dense set of documents and receive a specific, focused answer, rather than a simple summary.
On analysis, Claude Opus 4.6 is state-of-the-art at 60.7% (achieving a 5.47% improvement from Opus 4.5) on Finance Agent, an external benchmark from Vals AI that evaluates models on research of SEC filings of public companies. Opus 4.6 is also state-of-the-art on the TaxEval by Vals AI at 76.0%.
On creation, we use GDPval-AA to measure Claude’s performance on complex knowledge work, in addition to our Real-World Finance evaluation. With Claude Opus 4.6, structured outputs like spreadsheets and presentations come out right more often on the first pass. The side-by-side outputs below show how output quality has improved from Claude Opus 4.5 to Opus 4.6. These are examples of Claude’s first-pass performance on a commercial due diligence task (evaluating a potential acquisition)—the kind of work that would typically take a senior analyst two to three weeks to complete.
“With Claude Opus 4.6, creating financial PowerPoints that used to take hours now takes minutes. We're seeing tangible improvements in attention to detail, spatial layout, and content structuring.” - Aabhas Sharma, CTO, Hebbia
“The performance jump with Claude Opus 4.6 feels almost unbelievable. Real-world tasks that were challenging for Opus [4.5] suddenly became easy. This feels like a watershed moment for spreadsheet agents on Shortcut.” - Nico Christie, Co-Founder & CTO, Shortcut AI
Better multitasking and first drafts
The finance capabilities of Claude Opus 4.6 are easy to access with Cowork, a new way to use Claude in our desktop app.
In Cowork, you give Claude access to a desktop folder of your choosing. Claude is able to read, edit, and create new files directly in that folder. For finance teams, this means you can kick off several analyses at once, while steering Claude’s thought process as it creates each deliverable to meet your standard.
Cowork can also be customized with plugins—bundles of skills (which specify how to complete a task) and connectors to data on other platforms. With our corporate finance plugin, for example, Claude immediately knows how to complete common workflows like journal entries, variance analyses, and reconciliation. You can also build your own plugins to match how you like to work.
Cowork is available as a desktop-only research preview in beta on all paid Claude plans1.
Go deeper without leaving your spreadsheet
Claude in Excel brings Claude Opus 4.6 directly to your spreadsheets. We’ve now made it better at planning and cl
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み