Inscribe が Amazon Bedrock を活用して数秒で文書詐欺を検出する方法
Inscribe は Amazon Bedrock を活用したエージェント型 AI システムを開発し、金融機関における文書詐欺検出を従来の 20 倍となる 90 秒以内で実現し、精度と説明可能性も維持している。
キーポイント
詐欺の急増と従来手法の限界
AI 生成による偽造が前年比 5 倍に増加する中、従来の手動審査(30 分/件)やルールベースシステムでは、高度なディープフェイクや組織的な詐欺に対応しきれない状況にある。
Amazon Bedrock を活用したエージェント型 AI の実装
Inscribe は Amazon Bedrock 上の基盤モデルを活用し、専門家の思考プロセスを模倣する「アジェンティック AI」システムを構築。これにより文書間の推論や整合性チェックを自動化している。
20 倍の処理速度向上と規制対応
新システムは検出時間を 90 秒未満に短縮し、20 倍の効率化を実現しつつ、金融規制が求める精度と判断根拠の説明可能性を確保している。
Amazon Bedrock の技術的基盤
AI21 Labs、Anthropic、Cohere、Meta など複数の主要 AI 企業の高性能モデルを単一 API で利用可能にし、セキュリティと責任ある AI の要件を満たすプラットフォームとして機能している。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI が単なるテキスト生成ツールから、複雑な推論と意思決定を行う「エージェント」として実社会の課題解決に直結する段階に入ったことを示す重要な事例です。特に金融という厳格な規制下にある業界において、AI の導入がスピードと信頼性の両立を可能にした点は、他の業種への波及効果が極めて大きいと言えます。
編集コメント
従来のルールベースシステムや人手によるチェックの限界を打破し、AI エージェントが専門家の推論プロセスを模倣することで実用化された事例として注目すべきです。特に「説明可能性」を維持したまま速度を劇的に向上させた点は、規制産業における AI 導入の標準モデルとなり得るでしょう。
*この投稿は、Inscribe の CTO 兼共同創業者である Conor Burke と共著です*
不正行為は今や文書の 16 件に 1 件の割合で発生しており、AI によって生成された偽造文書は 2025 年 4 月から 12 月にかけて 5 倍に増加しました(Inscribe の 2026 年版ドキュメント不正行為レポート)。毎日数千件の申請を処理する金融機関にとって、この規模の欺瞞は不可能な課題を生み出しています。従来の手動審査では申請ごとに 30 分を要し、増加する処理量に対応できません。さらに深刻なのは、現代の不正行為ツールが可能にする進化する戦術を検出するのが手作業のプロセスでは困難だということです。スピードだけでは不十分です。解決策は、人間の審査員やレガシーなルールベースシステムが検出するために設計されていなかった、洗練された偽造文書、ディープフェイク、そして組織的な不正行為グループも捉えなければなりません。
Inscribe は、2017 年以来、主要な 銀行、貸付業者、およびフィンテック企業向けに、AI を活用した文書不正検出システムの構築を行ってきました。本記事では、Inscribe がどのようにして Amazon Bedrock を用いて、熟練した不正調査員のように文書間での推論を行う エージェント型 AI システムを開発したかをご紹介します。この新しいエージェント型 AI システムにより、Inscribe は改ざん、捏造、および AI 生成による金融文書を 90 秒未満で検出できるようになりました。これは従来の手動レビューと比較して 20 倍の改善でありながら、金融サービス規制が要求する精度と説明可能性を維持しています。
Amazon Bedrock は、AI21 Labs、Anthropic、Cohere、Meta、Stability AI、および Amazon など、主要な AI 企業から高性能なファウンデーションモデル(FMs)を選択できるフルマネージドサービスです。単一の API を通じてこれらのモデルを利用可能にし、セキュリティ、プライバシー、責任ある AI の観点から生成 AI アプリケーションを構築するために必要な広範な機能を提供しています。
課題
中規模銀行における典型的なローン申請を想定してください。顧客は銀行取引明細書、給与明細書、納税書類、身分証明書などを提出します。不正行為分析担当者は、各文書の真正性を検証し、文書間での情報を照合し、ますます巧妙化するディープフェイクや AI 生成の偽造を含む改ざんの兆候をチェックし、申請者の雇用主と住所を調査する必要があります。顧客を競合他社に奪われないよう、迅速な処理を維持しながらこれらすべてを実行しなければなりません。
この手作業プロセスは、3 つの複合的な課題を生み出します:
- スケーラビリティ:アプリケーションの増加に伴い、機関は比例してより多くの分析担当者を雇用する必要があり、検出精度を向上させることなくコストが増大します。
- 適応性:静的な不正検出ルールでは、ディープフェイクや AI 生成の偽造文書、組織的な身元盗難リングといった巧妙な手口を見逃してしまいます。
- 一貫性:異なる分析担当者が類似した事案に対して異なる結論に達し、コンプライアンスリスクと公平性の懸念を生み出します。
金融上のリスクは甚大です。1 つの事例の見落としが、直接的な損失で数百万ドル、金融犯罪対策の不備による規制当局からの対応、そして回復がさらに困難な評判への打撃を意味する可能性があります。時間のかかる手動レビューにより顧客承認に数日の遅れが生じ、高い離脱率につながります。一方、不正行為者は過労している分析担当者が毎日数百件の申請を処理する際に微妙な操作の兆候を見逃す可能性を知っており、AI によるディープフェイクや捏造文書から合成身元詐欺へと手口を変化させ続けています。
ソリューション:エージェント型 AI がなぜ手動レビューで見落とされるものを捉えるのか
Inscribe は、リスク管理チームや引受チームと共に機能する AI ソリューション を構築しました。これは日常的な文書分析を自動化しつつ、複雑なケースを人間によるレビューのためにフラグ付けし、深いドメイン専門知識と 多層検出手法 を組み合わせることで、手動レビューチームや他のプロバイダーが見逃すものを明らかにします。
エージェント型 AI システムを、最初から最後まで作業を行う専門家アナリストと想像してください。このシステムは目標を受け取り、それをステップに分解し、複数のツールを活用して完了まで導きます。基本的な AI ツールが単一の質問に答えるのに対し、エージェント型システムは専門的なモデルを調整し、必要に応じて外部 API を呼び出し、すべての情報を統合して最終的な判断を下します。文書詐欺検出においては、Inscribe のシステムは疑わしいフィールドを単にフラグ付けするだけでなく、文書を提出し、適切なモデルへルーティングし、並列で forensic チェック(forensic checks)を実行し、ウェブを検索して雇用主の詳細を確認し、文書セット全体でデータをクロス参照し、人間の介入なしに監査対応可能な詐欺レポートを生成します。このプロセスは数秒で完了します。
ファウンデーションモデル は、文脈の理解、文書間での推論、自然言語による説明の生成において卓越しており、これらは詐欺分析に不可欠な機能です。Inscribe のアーキテクチャを形作る重要な洞察は、単一のモデルがすべてのタスクに等しく適しているわけではないという点です。各ステップに適切なモデルを調整し、一つのモデルで全てを処理するのではなく、これによりより良い結果をより低いコストで達成できます。
Amazon Bedrock が支える多モデル不正検出
Amazon Bedrock からの広範なモデル選択により、Inscribe は各タスクに最適な FM(ファウンデーションモデル)を選択でき、個別のインフラを管理する必要がなくなります。これにより、モデル選択は統合プロジェクトではなく設定項目として扱われるようになります。
サーバーレススケーリングは、深夜の静かな時間帯から業務時間のピークまで、文書処理量の大幅な変動を自動的に処理します。Inscribe が専用サービングインフラをプロビジョニングする必要はありません。
エンタープライズセキュリティとコンプライアンスは、金融サービスが求める厳格なデータ保護基準を満たしています。転送中および保存中のデータを暗号化し、AWS Identity and Access Management (IAM) により細粒度のアクセス制御を提供します。
モデルバージョン管理とガバナンスにより、Inscribe は本番環境へ展開する前にステージング環境で新しいモデルリリースをテストできます。これは、不正検出精度の一貫性を維持するために極めて重要です。
スピードとコスト効率のためにタスクにモデルをマッチさせる
Inscribe は Amazon Bedrock 上で複数のモデルを評価し、パフォーマンス、レイテンシ、コストを測定して、各不正検出タスクに適したモデルを選定しました。
Anthropic Claude Haiku 4.5: レビュー速度を落とさずにコストを 40% 削減
通常のタスクに Claude Sonnet を使用する代わりに、推論コストを約 40% 削減できます。スピードは犠牲になりません。Inscribe は、ドキュメントの解析、フィールド抽出、初期分類、事前スクリーニングチェックなど、数秒で完了する高ボリュームオペレーションに Claude Haiku 4.5 (Anthropic Claude Haiku 4.5) を採用しています。Haiku 4.5 へのアップグレードにより、これらの日常的なタスクにおいてコスト削減を実現しつつ、精度も向上しました。
Meta Llama 3.1 70B と Meta Llama 4: トランザクション分析を高速かつ低コストに維持
トランザクションの補完やエンティティ抽出には、Inscribe は Meta Llama モデル (Meta Llama) を使用しています。Inscribe のエンジニアリングマネージャーである Ivo は、この決定について以下のように説明します。
**
*「パフォーマンスの観点では大きな差は見られませんでした。Llama の品質は、私たちが求める水準と同等でした。そのため、Llama を選択することで、品質を犠牲にすることなくコスト削減を実現できました。価格も最終的な決定において確かに重要な役割を果たしました。」*
この実用的なアプローチ、つまりパフォーマンスがより高価な代替案と同等である場合に Llama を採用することは、高ボリュームの推論タスクにおいて大幅なコスト削減をもたらします。
Anthropic Claude Sonnet 4 および 4.5:文書間詐欺パターンの検出
Claude Sonnet は調整層として機能し、最も洗練されたタスクを処理します。具体的には、文書間詐欺分析、多段階推論ワークフロー、雇用主確認のためのウェブ検索統合、監査対応可能な詐欺レポートの自然言語生成などです。Sonnet の拡張コンテキストウィンドウにより、文書セット全体にわたる意識を維持し、個別に文書を分析した場合に見逃される可能性のあるパターンを特定できます。
AWS 上でスケーラブルな詐欺検出を実現する Inscribe
Inscribe の詐欺検出システムは、速度、信頼性、コンプライアンスを大規模に提供するために設計された AWS インフラストラクチャ上に構築されています。そのエージェントアーキテクチャにより、システムは専門モデルの調整を行い、次に何を分析すべきかを決定し、必要に応じて外部 API を呼び出し、人間による介入なしでこれらすべてを統合して最終的な判断を下します。

AWS 上の Inscribe の詐欺検出アーキテクチャ
ドキュメントの取り込みと保存
ローン申請書類が Inscribe の Web インターフェースまたは API を経由してアップロードされると、そのドキュメントは業界をリードするスケーラブルなオブジェクトストレージサービスである Amazon Simple Storage Service(Amazon S3)に格納されます。Amazon CloudFront と Application Load Balancer を介して提供される Web アプリケーションは処理ジョブを作成し、それを Amazon Simple Queue Service(Amazon SQS)にキューイングします。ドキュメントは直ちに処理のためにキューに入れられ、手動での引き継ぎは不要です。
非同期処理
Amazon Elastic Compute Cloud(Amazon EC2)上で実行されている Celery ワーカープロセス(分散タスクキュー)が、キューからジョブを引き出します。このキューベースのアーキテクチャにより、トラフィックの急増も遅延なく処理できます。営業時間中はワーカーが自動的にスケールアップし、夜間にはコストを最小化するためにキャパシティがスケールダウンします。10 件の申請を処理する場合でも 1 万件を処理する場合でも、システムは常に一貫したパフォーマンスを提供します。
テキスト抽出
Amazon Textract は、PDF および画像からのベースラインの光学式文字認識(OCR)およびテキスト抽出機能を提供します。Inscribe では、複雑な金融ドキュメントからより正確な抽出を実現するため、解析ワークロードを Amazon Bedrock 上の FMs に直接シフトさせる傾向が強まっています。
マルチモデル不正検出パイプライン
Inscribe がテキストを抽出した後、文書は Amazon Bedrock 上で複数の FM(Foundation Models)を協調したシーケンスで通過します。Claude Haiku は高速な初期解析と分類を担当し、Meta Llama モデルは取引データを処理してエンティティを抽出します。Claude Sonnet は文書間分析を行い、雇用主の検証や住所確認のためのウェブ検索を調整し、最終的な不正評価を生成します。各モデルが最も得意とするタスクを担うことで、レビュー時間を数秒に抑えます。
Amazon SageMaker AI 上の独自不正検出モデル
基盤モデル分析と並行して、Inscribe は Amazon SageMaker AI にホストされた独自の機械学習(ML)モデルを実行しています。これらのモデルは完全に社内開発され、Inscribe が毎年処理する数百万件の申請データで訓練されており、汎用大規模言語モデル(基盤モデルのサブセット)が見逃す兆候を検出します。具体的には、デジタル改ざん画像を特定するためのピクセルレベルの法医学的解析、既知の不正テンプレートライブラリと文書を照合するネットワークパターン検出、および改ざんされた署名やレイアウトを検出する視覚的異常検出です。
SageMaker AI は、これらの専門モデルを大規模に展開するための管理型インフラストラクチャを提供し、モデルのデプロイ、自動スケーリング、パフォーマンス監視のための組み込み機能を備えています。Inscribe のエンジニアリングチームは、インフラストラクチャの管理ではなく、詐欺検出アルゴリズムの洗練に注力できます。これは、金融犯罪の手口が静的なルールシステムが適応できる速度よりも急速に進化しているため、特に重要です。
結果の保存、キャッシュ、および観測性
Inscribe は、中間的な推論トレースと最終的な詐欺レポートの両方を Amazon Relational Database Service (Amazon RDS) に保存し、コンプライアンスチームのための信頼できる監査証跡を提供すると同時に、継続的なモデル改善を支援しています。Amazon ElastiCache for Valkey は、ウェブフックトークンなどの一時的なデータをキャッシュし、レート制限(単位時間あたりのリクエスト数の制限)を適用し、Celery タスクのメタデータを管理します。Amazon MemoryDB はベクトルデータベース層をサポートしており、ここでトランザクションの埋め込み表現が保存され、K 近傍法(KNN: K-nearest neighbor)検索と呼ばれる技術を使用して照会されます。これはデータセット内で最も類似したレコードを見つける手法であり、支援モデルのパワーソースとなります。
Amazon CloudWatch は、推論レイテンシ、エラーレート、トークン使用量、リクエストあたりのコストなど、モデルのパフォーマンス指標を追跡します。この観測性は、モデルのドリフト(性能の低下)や予測精度の変化を検出するために不可欠であり、これらは再トレーニングやモデル更新の必要性を示すシグナルとなります。
結果:Inscribe で実現できること
Amazon Bedrock を活用したエージェント型不正検知への移行により、Inscribe の顧客ベース全体で測定可能な成果が得られました。以下の顧客事例は、Inscribe の不正検知ソリューションを利用する組織が達成した成果を示しています。
Customer**
Fraud Losses Prevented
Review Time Reduction
Key Outcome
BHG Financial
数百万ドルの損失防止
90% 以上の削減
貴社と共に成長する体系的なワークフロー
Logix Federal Credit Union
8 ヶ月で 300 万ドル以上
最大 99% の削減
AI による偽造検知
BCU
560 万ドルの損失防止
10 件から 10,000 件の申請まで処理可能
不正グループの検出
BHG Financial:手作業から体系的なプロセスへ
BHG Financial は、主要な金融サービス企業ですが、一貫性に欠け、増加する申請量に対応しきれない手動による文書レビュープロセスに課題を抱えていました。Inscribe の導入後、BHG Financial は手動レビュー時間を 90% 以上削減し、潜在的な不正損失を数百万ドル防止しました。不正検知は、主観的でアナリスト依存だったプロセスから、チームがすべての意思決定で信頼できる透明性の高いワークフローへと移行し、人的リソースの比例増加なしに申請量の増加にも対応できるようになりました。
「Inscribe は私たちの転換点となりました。不正検出を、手作業で主観的なプロセスから、毎回信頼できるスケーラブルで透明性の高いシステムへと変革しました。」— マイケル・クーマー氏、BHG Financial 不正管理ディレクター
Logix Federal Credit Union: 8 ヶ月間で不正防止による節約額 300 万ドル
Logix Federal Credit Union は年間数百件のローン不正事例を処理しています。調査チームは、手作業での書類検査では見逃しがちなもの、特に AI 生成の偽造文書や合成文書を検出できるツールの必要性を感じていました。Inscribe の導入から 8 ヶ月以内に、Logix は潜在的なローン不正による損失として 300 万ドル以上を防ぎました。また、以前はすべてのケースを遅らせていた雇用主記録と見本書類の時間のかかる手動照合も不要となりました。
「昨年の 4 月末に Inscribe の使用を開始しました。わずか 8 ヶ月で、潜在的なローン不正防止による節約額が 300 万ドルを超え、無数の ID 盗難被害を防ぐことができました。」— マット・オーヴァリン氏、Logix Federal Credit Union 不正リスク管理担当
BCU:損失が膨らむ前に不正グループを阻止する
BCU は、大手信用組合として、手動審査では検出できていなかった複数の申請書を提出する連携型不正グループというより複雑な課題に直面していました。Inscribe は BCU の口座保護チームに対し、これらの不正スキームを早期に浮き彫りにするための跨アプリケーションパターン検出機能を提供しました。その結果、560 万ドルの不正損失が防止され、チームは人員を比例的に増やすことなく、増加する審査ボリュームに対応できるようになりました。
*「過去数年間で防止した金額最大の事例の多くは、Inscribe の検知によるものです。防止された損失は数百万ドルに及び、これが不正を阻止する速度と自信に計測可能な違いをもたらしました。」* — Nickie Christianson 氏、BCU 口座保護チーム シニアマネージャー
結論と今後のステップ
Inscribe の成果は、エージェント型 AI が文書不正検出ワークフローに応用された際に何が実現可能かを示しています。単なる審査の高速化だけでなく、推論し、適応し、トレーニング当初には存在していなかった不正手口を検知するシステムです。Amazon Bedrock 上の基盤モデルが継続的に進化していく中で、エージェント型アプローチにより Inscribe はコアインフラを再構築することなく新機能を導入でき、金融機関を不正犯の手先から常に一歩先へ導きます。
Amazon Bedrock 上のマルチモデルアーキテクチャは、同様の課題に直面する他の企業にとってもテンプレートとして機能します。Amazon Bedrock の統一 API(API)とサーバーレススケーリング(serverless scaling)によってサポートされる戦略的なモデル選択により、複雑な AI ワークフロー全体で品質、速度、コストのバランスを保つことが可能になります。
開始するには、以下のリソースをご覧ください:
To
原文を表示
*This post is co-written with Conor Burke, CTO and Co-Founder at Inscribe*
Fraud now appears in 1 of every 16 documents, and AI-generated forgeries grew 5x from April to December 2025 (Inscribe’s 2026 State of Document Fraud Report). For financial institutions processing thousands of applications daily, this scale of deception creates an impossible challenge. Traditional manual review takes 30 minutes per application and cannot keep pace with rising volumes. More critically, manual processes struggle to detect the evolving tactics that modern fraud tools make possible. Speed alone is not enough. The solution must also catch sophisticated forgeries, deepfakes, and coordinated fraud rings that human reviewers and legacy rule-based systems were never designed to identify.
Inscribe has been building AI-powered document fraud detection since 2017 for leading banks, lenders, and fintechs. In this post, you will learn how Inscribe developed an agentic AI system using Amazon Bedrock that reasons across documents the way an expert fraud analyst would. With this new agentic AI system, Inscribe now detects tampered, fabricated, and AI-generated financial documents in under 90 seconds. This is a 20x improvement over traditional manual review, while maintaining the accuracy and explainability required by financial services regulations.
Amazon Bedrock is a fully managed service that offers a choice of high-performing foundation models (FMs) from leading AI companies, such as AI21 Labs, Anthropic, Cohere, Meta, Stability AI, and Amazon through a single API. It also provides a broad set of capabilities you need to build generative AI applications with security, privacy, and responsible AI.
The challenge
Consider a typical loan application at a mid-sized bank. A customer submits bank statements, pay stubs, tax documents, and identification. A fraud analyst must verify each document’s authenticity, cross-reference information across documents, check for signs of manipulation including increasingly sophisticated deepfakes and AI-generated forgeries, and research the applicant’s employer and address. They must do all of this while maintaining a fast turnaround to avoid losing the customer to competitors.
This manual process creates three compounding challenges:
- Scale: As application volume grows, institutions must hire proportionally more analysts, driving up costs without improving detection accuracy.
- Adaptability: Static fraud detection rules miss sophisticated schemes like deepfakes, AI-generated fake documents, and coordinated identity theft rings.
- Consistency: Different analysts reach different conclusions on similar cases, creating compliance risks and fairness concerns.
The financial stakes are significant. A single missed case can mean millions in direct losses, regulatory exposure for financial crime failures, and reputational consequences that are even harder to recover from. Time-intensive manual reviews delay customer approvals for days, leading to high abandonment rates. Meanwhile, fraudsters continuously change tactics, shifting from AI deepfakes and fabricated documents to synthetic identity fraud, knowing that overworked analysts might miss subtle manipulation signals when processing hundreds of applications daily.
Solution: Why agentic AI catches what manual review misses
Inscribe built an AI solution that works alongside risk and underwriting teams. It automates routine document analysis while flagging complex cases for human review, combining deep domain expertise with layered detection techniques to uncover what manual review teams and other providers miss.
Think of an agentic AI system as an expert analyst who works from start to finish. It takes a goal, breaks it into steps, uses multiple tools, and works through to completion. Where a basic AI tool might answer a single question, an agentic system coordinates specialized models, calls external APIs when needed, and synthesizes everything into a final decision. For document fraud detection, that means Inscribe’s system does not only flag a suspicious field. It submits a document, routes it through the right models, runs parallel forensic checks, searches the web to verify employer details, cross-references data across the full document set, and generates an audit-ready fraud report without requiring human intervention, completing the process in seconds.
Foundation models excel at understanding context, reasoning across documents, and generating natural language explanations, capabilities that are essential for fraud analysis. The key insight that shapes Inscribe’s architecture: no single model is equally suited to every task. Coordinating the right model for each step, rather than applying one model to everything, delivers better results at lower cost.
How Amazon Bedrock powers multi-model fraud detection
Broad model selection from Amazon Bedrock means Inscribe can choose the right FM for each task without managing separate infrastructure, turning model selection into a configuration choice rather than an integration project.
Serverless scaling handles the significant swings in document processing volume, from quiet overnight hours to business-hour spikes, without requiring Inscribe to provision dedicated serving infrastructure.
Enterprise security and compliance meet the rigorous data protection standards financial services require: encryption covers data in transit and at rest, and AWS Identity and Access Management (IAM) provides fine-grained access control.
Model versioning and governance allow Inscribe to test new model releases in staging environments before promoting to production, which is critical for maintaining consistent fraud detection accuracy.
Matching models to tasks for speed and cost efficiency
Inscribe evaluated multiple models on Amazon Bedrock, measuring performance, latency, and cost to determine the right model for each fraud detection task.
Anthropic Claude Haiku 4.5: Reduce costs by 40% without slowing review
You can reduce inference costs by approximately 40% compared to using Claude Sonnet for routine tasks, without sacrificing speed. Inscribe uses Claude Haiku 4.5 for high-volume operations that complete in seconds: document parsing, field extraction, initial classification, and pre-screening checks. The upgrade to Haiku 4.5 delivered improved accuracy while achieving those cost reductions on routine tasks.
Meta Llama 3.1 70B and Meta Llama 4: Keep transaction analysis fast and cost-efficient
For transaction enrichment and entity extraction, Inscribe uses Meta Llama models. Ivo, Engineering Manager at Inscribe, explains the decision:
“We didn’t see much of a difference in terms of performance. The quality of Llama for those tasks was on par with what we wanted, so choosing Llama allowed us to reduce costs without sacrificing quality. Price definitely had a role to play in the final decision.”
This pragmatic approach, using Llama when performance matches that of more expensive alternatives, delivers significant cost savings on high-volume inference tasks.
Anthropic Claude Sonnet 4 and 4.5: Catch cross-document fraud patterns
Claude Sonnet serves as the coordination layer, handling the most sophisticated tasks: cross-document fraud analysis, multi-step reasoning workflows, web search integration for employer verification, and natural language generation of audit-ready fraud reports. Sonnet’s extended context window allows it to maintain awareness across entire document sets, identifying patterns that would be invisible when documents are analyzed in isolation.
How Inscribe scales fraud detection on AWS
Inscribe’s fraud detection system is built on AWS infrastructure designed to deliver speed, reliability, and compliance at scale. Its agentic architecture means the system coordinates specialized models, decides what to analyze next, calls external APIs when needed, and synthesizes everything into a final decision, without human intervention.

Inscribe’s fraud detection architecture on AWS
Document ingestion and storage
When loan application documents are uploaded via Inscribe’s web interface or API, the documents land in Amazon Simple Storage Service (Amazon S3), an industry-leading scalable object storage service. The web application, served through Amazon CloudFront and an Application Load Balancer, creates a processing job and queues it in Amazon Simple Queue Service (Amazon SQS). Documents are immediately queued for processing, with no manual handoff required.
Asynchronous processing
Celery worker processes (a distributed task queue) running on Amazon Elastic Compute Cloud (Amazon EC2) pull jobs from the queue. This queue-based architecture handles traffic spikes without delays. During business hours, more workers scale up automatically, and overnight, capacity scales down to minimize costs. The system provides consistent performance whether you are processing ten applications or ten thousand.
Text extraction
Amazon Textract provides baseline optical character recognition (OCR) and text extraction from PDFs and images. Inscribe has increasingly shifted parsing workloads directly to FMs on Amazon Bedrock, delivering more accurate extraction from complex financial documents.
Multi-model fraud detection pipeline
After Inscribe extracts text, the document flows through multiple FMs on Amazon Bedrock in a coordinated sequence. Claude Haiku performs fast initial parsing and classification. Meta Llama models process transaction data and extract entities. Claude Sonnet conducts cross-document analysis, coordinates web searches for employer verification and address validation, and generates the final fraud assessment. Each model handles what it does best, keeping your review time to seconds.
Proprietary fraud detection models on Amazon SageMaker AI
In parallel with foundation model analysis, Inscribe runs proprietary machine learning (ML) models hosted on Amazon SageMaker AI. These models, built entirely in-house and trained on the millions of applications Inscribe processes each year, detect signals that general-purpose large language models (a subset of foundation models) miss: pixel-level forensic analysis to identify digitally altered images, network pattern detection that matches documents against a library of known fraud templates, and visual anomaly detection for manipulated signatures or layouts.
SageMaker AI provides the managed infrastructure for deploying these specialized models at scale, with built-in capabilities for model deployment, automatic scaling, and performance monitoring. Inscribe’s engineering team can focus on refining fraud detection algorithms rather than managing infrastructure, which matters especially as financial crime tactics evolve faster than static rule systems can adapt.
Results storage, caching, and observability
Inscribe stores both intermediate reasoning traces and final fraud reports in Amazon Relational Database Service (Amazon RDS), providing a reliable audit trail for compliance teams while supporting ongoing model improvements. Amazon ElastiCache for Valkey caches short-lived data such as webhook tokens, enforces rate limiting, and manages Celery task metadata. Amazon MemoryDB supports the vector database layer, where transaction embeddings are stored and queried using K-nearest neighbor (KNN) search, a technique that finds the most similar records in a dataset, to power supporting models.
Amazon CloudWatch tracks model performance metrics including inference latency, error rates, token usage, and cost per request. This observability is critical for detecting model drift, changes in prediction accuracy that signal the need for retraining or model updates.
Results: What you can achieve with Inscribe
The shift to agentic fraud detection powered by Amazon Bedrock has delivered measurable results across Inscribe’s customer base. The following customer examples demonstrate outcomes achieved by organizations using Inscribe’s fraud detection solution.
Customer
Fraud Losses Prevented
Review Time Reduction
Key Outcome
BHG Financial
Millions prevented
90%+ reduction
Systematic workflow that grows with you
Logix Federal Credit Union
$3M+ in 8 months
Up to 99% reduction
AI forgery detection
BCU
$5.6M prevented
Handles volume from 10 to 10,000 applications
Fraud ring detection
BHG Financial: From manual to systematic
BHG Financial, a leading financial services company, struggled with a manual document review process that was inconsistent and could not keep pace with growing application volume. After deploying Inscribe, BHG Financial achieved more than a 90% reduction in manual review time and prevented millions in potential fraud losses. Fraud detection shifted from a subjective, analyst-dependent process into a transparent workflow that teams could rely on for every decision, one that grows with application volume without proportional headcount increases.
“Inscribe was the inflection point for us. It transformed fraud detection from a manual, subjective process into a scalable, transparent system we can trust every time.” — Michael Coomer, Director of Fraud Management, BHG Financial
Logix Federal Credit Union: $3 million in fraud savings in eight months
Logix Federal Credit Union processes several hundred loan fraud cases annually. Their investigators needed tools that could surface what manual document inspection could not catch, particularly AI-generated forgeries and synthetic documents. Within eight months of deploying Inscribe, Logix prevented more than $3 million in potential loan fraud losses. The team also avoided the time-consuming manual cross-referencing of employer records and specimen documents that had previously slowed every case.
“We started using Inscribe in late April last year. And in just eight months, we saw potential loan fraud savings of over $3 million and countless ID theft saves.” — Matt Overin, Fraud Risk Management, Logix Federal Credit Union
BCU: Stopping fraud rings before losses mount
BCU, a leading credit union, faced a more complex challenge: coordinated fraud rings submitting multiple applications that manual review was not catching. Inscribe gave BCU’s account protection team the cross-application pattern detection needed to surface these schemes early. The outcome was $5.6 million in fraud losses prevented, with the team able to handle growing review volume without adding headcount proportionally.
“Some of our largest dollar preventions in the past few years have come directly from Inscribe detections. We’re talking millions in losses prevented, and that’s made a measurable difference in how fast and how confidently we can stop fraud.” — Nickie Christianson, Senior Manager, Account Protection Team, BCU
Conclusion and next steps
Inscribe’s results show what becomes possible when agentic AI applies to document fraud detection workflows. Not only faster review, but a system that reasons, adapts, and catches fraud tactics that did not exist when it was first trained. As foundation models on Amazon Bedrock continue to evolve, the agentic approach means Inscribe can adopt new capabilities without rebuilding core infrastructure, keeping your institution ahead of fraudsters.
The multi-model architecture on Amazon Bedrock also provides a template for other enterprises facing similar challenges. Strategic model selection, supported by Amazon Bedrock’s unified API and serverless scaling, helps you balance quality, speed, and cost across complex AI workflows.
To get started, explore the following resources:
To
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み