Mastercard、新しい基盤モデルで不正取引を監視
Mastercardは個人情報除去の膨大な取引データを用いて構造化データを分析する「大規模表モデル(LTM)」を開発し、不正検知システムの精度向上に実装している。
キーポイント
LTMの基本概念と学習データの特徴
テキストや画像ではなく、取引イベントや merchant location などの構造化データを学習対象とし、個人情報は除去された状態で行動パターンを解析する。
プライバシー保護と匿名化の取り組み
個人情報識別子を除外することで他の金融AIが抱えるプライバシーリスクを低減し、大規模な行動データ量で匿名化による情報損失を補完する。
LLMとの技術的差異と内部活用
次単語予測型のLLMとは異なり、多次元データテーブル内のフィールド間関係を分析する純粋な機械学習に近い技術であり、顧客対話型モデルより運用リスクが低い。
不正検知分野での実装と初期成果
既存のルールベース不正検知システムを補完する内部用「インサイトエンジン」としてCybersecurity領域に先行実装され、高価値低頻度取引などの特定ケースで従来手法より性能向上を確認している。
ハイブリッド展開によるリスク管理
規制環境を考慮し、既存手法と新モデルを組み合わせたハイブリッドシステムを採用。単一モデルの限界を認識し、段階的な導入を進める。
構造化データ活用と運用コスト削減
ロイヤルティプログラムやポートフォリオ管理など構造化データに特化し、タスク固有の複数モデルに代わる単一基盤モデルで訓練・検証コストを削減する。
将来の拡張とコンプライアンス重視
データ規模の拡大やAPI/SDK提供を計画すると同時に、プライバシー、説明可能性、監査性を重視し、規制当局の審査に備える方針を示している。
影響分析・編集コメントを表示
影響分析
MastercardのLTM導入は、金融業界におけるAI活用の方向性を「テキスト生成中心」から「構造化データ分析・内部意思決定支援」へシフトさせる示唆となる。プライバシー規制が厳格化する中、匿名化された大規模取引データを活用するこのアプローチは、セキュリティ強化とコンプライアンス遵守の両立を実現する実用的なモデルとして他金融機関や業界標準に波及する可能性がある。
編集コメント
金融機関がLLMブームから一歩踏み出し、構造化データ特化の基盤モデルへ注力する戦略は現実的かつ効果的だ。プライバシー規制が強化される中で、匿名化と大規模データ活用を両立させる本アプローチは、業界全体のセキュリティ標準を再定義する可能性を秘めている。
タイトル: Mastercard、新しいファウンデーションモデルで不正を監視
Mastercardは、デジタル決済におけるセキュリティと真正性の問題に対処するため、テキストや画像ではなく取引データで学習させた大規模表形式モデル(LLMではなくLTM)を開発しました。
同社は、数十億件のカード取引でファウンデーションモデルを学習させており、将来的には数千億件に拡大する予定です。データセットには、支払いイベントおよび加盟店の場所、承認フロー、不正インシデント、チャージバック、ロイヤルティ活動などの関連データが含まれています。Mastercardは、学習開始前に個人識別情報が削除され、モデルは個人のアイデンティティではなく行動パターンを解析すると述べています。
個人データを除外することで、この技術は金融サービス分野の他の形態のAIが抱える可能性のあるプライバシーリスクを軽減します。ユーザーごとの情報が欠落しているにもかかわらず、データの規模と豊富さにより、モデルは商業的に価値のあるパターンを推測できると、同社は最近のブログ記事で述べています。匿名化によってリスク評価の分野で有用とされる可能性のあるシグナルが除去されるものの、Mastercardは、十分に大量の行動データを使用することで、詳細なデータの損失を補えると主張しています。
LTM(大規模表形式モデル)とは何か?
LTMのアーキテクチャは、非構造化入力で学習され、シーケンス内の次のトークン(一般的には不正確に単語と表現される)を予測することで機能する大規模言語モデルとは異なります。MastercardのLTMは、多次元データテーブル内のフィールド間の関係性を調べ、この技術の定義を人工知能というより純粋な機械学習に近づけています。
大規模表形式モデルは、生の入力から、どの関係性が予測可能であるかを正確に学習するため、事前定義されたルールでは捕捉できない異常なパターンを特定できます。
同社はLTMを、既存の製品で使用でき、既存のワークフローを強化する「インサイトエンジン」と表現しています。顧客と対話するモデル(多くの場合LLM)の運用リスクは、内部意思決定の一部をなすモデルのリスクとは異なります。
LTMの技術インフラはNvidiaとDatabricksによって提供され、前者がコンピューティングプラットフォームを、Databricksがデータエンジニアリングとモデル開発を担当しています。
LTMはどこで運用されるのか?
Mastercardのサイバーセキュリティ分野が、この技術が最初に積極的に展開される領域です。多くの機関と同様に、Mastercardは取引データを検査する複数の不正検知システムを運用しています。これらは導入時に人的入力を必要とし、継続的な調整により、どのような行動が疑わしいとみなされるかを定義します。例えば、取引頻度の急激な増加や、短時間に世界中の異なる場所で購入を行うユーザーなどが含まれる可能性があります。
特定のケースにおいて、従来の手法と比べて性能が向上したという初期結果が得られていると同社は述べています。高額で低頻度の購入を例に挙げ、従来のモデルでは異常としてフラグが立てられる可能性があるが、新しいモデルは正当なイベントを従来モデルよりも正確に区別できるようです。
同社は、確立された手順と新しいモデルを組み合わせたハイブリッドシステムを展開する計画であり、これは同社が置かれる規制レベルを反映した慎重な姿勢です。単一のモデルがすべてのシナリオでうまく機能する可能性は低いことを認めており、LTMはこの分野のツール群の中にその位置を占めることになります。
このモデルは、ロイヤルティプログラムの活動をスキャンし、ポートフォリオ管理や内部分析に使用できるとされており、これらは大量の構造化データが存在する領域です。現在の運用では、企業は各タスクに特化した多くのモデルを展開することが多いですが、これにはトレーニングコストや検証、監視の労力が倍増する可能性があります。異なるタスク向けに微調整可能な単一のファウンデーションモデルは、プロセスを簡素化しコストを抑制することができます。
リスクと将来の計画
もちろん、多機能LTMアプローチにはリスクがあります。広く展開されたモデルに障害が発生すれば、システム全体に影響が及ぶ可能性があり、これは少なくとも現時点では、Mastercardが既存の検知システムと併用してこの技術を適用する戦略をある程度説明するものです。
Mastercardは、モデルで使用されるデータの規模と全体的な精緻さを高めることを望んでいます。また、APIアクセスとSDKを提供し、内部チームが新しいアプリケーションを構築できるようにする計画です。
ブログ記事は、LTMが負うデータ責任を強調し、プライバシーと透明性、モデルの説明可能性、監査可能性に言及しています。信用判断や不正の結果に影響を与えるシステムについては、LTMの運用に関わるデータ慣行に加えて、規制当局による監視が行われることが予想されます。
テキストや画像とは対照的に、高度に構造化されたデータがLTMの核心にあります。大規模表形式モデルは、コアバンキングと決済インフラにおける新世代AIシステムの始まりとなる可能性があります。これまでの証拠はベンダーレポートに限られているため、性能に関する主張は必ずしも決定的と見なすべきではありません。
敵対的条件下での堅牢性、学習後の長期的なコスト、規制当局の受け入れは、表形式モデルが失敗または成功する可能性を分ける問題です。これらの要因が採用の速度と範囲を決定しますが、これがMastercardが現在注力している分野なのです。
(画像ソース: "Oversight" by United States Marine Corps Official Page is licensed under CC BY-NC 2.0.)
AIとビッグデータについて業界リーダーからもっと学びたいですか?アムステルダム、カリフォルニア、ロンドンで開催されるAI & Big Data Expoをチェックしてください。この包括的なイベントはTechExの一部であり、他の主要なテクノロジーイベントと併設されています。詳細情報はこちらをクリックしてください。
AI NewsはTechForge Mediaによって運営されています。今後のエンタープライズテクノロジーイベントとウェビナーをこちらで探索してください。
この記事「Mastercard keeps tabs on fraud with new foundation model」はAI Newsに最初に掲載されました。
原文を表示
Mastercard has developed a large tabular model (an LTM as opposed to an LLM) that’s trained on transaction data rather than text or images to help it address security and authenticity issues in digital payments.
The company has trained a foundation model on billions of card transactions, with the intention of expanding to hundreds of billions in time. The datasets include payment events and associated data such as merchant location, authorisation flows, fraud incidents, chargebacks, and loyalty activity. Mastercard says personal identifiers are removed before the training began, and that the model parses behavioural patterns rather than concern itself with individual identities.
By excluding personal data, the technology reduces privacy risks that may affect other forms of AI in financial services sector. The scale and richness of the data allow the model to infer patterns that are commercially valuable – the company said in a recent blog post – despite the lack of per-user information. Although anonymisation removes signals that could be argued as being useful in the area of risk assessment, Mastercard asserts that using sufficiently large volumes of behavioural data compensates for any loss of rich data.
What is an LTM (large tabular model)?
LTM architecture differs from that of large language models, which are trained on unstructured inputs and work by predicting the next token (typically but inaccurately described as a word) in a sequence. Mastercard’s LTM examines relationships between fields in multi-dimensional data tables, making a definition of the technology closer to that of pure machine learning rather than artificial intelligence.
The large tabular model learns from raw inputs exactly which relationships are predictable, so it can identify anomalous patterns not captured by predefined rules.
The company describes the LTM as an ‘insights engine’ that can be used in existing products, augmenting existing workflows. The operational risk of a model that interacts with customers (often an LLM) differs from that of one that’s part of internal decision-making.
Technical infrastructure for the LTM comes from Nvidia and Databricks, with the former providing the computing platform and Databricks handling data engineering and model development.
Where will we see an LTM in operation?
Cybersecurity at Mastercard is the first area to see active deployment of the tech. Like many institutions, Mastercard operates several fraud detection systems examining transaction data. These require human input at their outset – and ongoing attenuation – to define what constitutes as suspicious behaviour. These might include sudden increases in transaction frequency, or users making purchases in different parts of the world in a small space of time.
Early results indicate improved performance on conventional techniques in specific cases, the company says. It cites the example of high-value, low-frequency purchases which can be flagged as anomalies using traditional models, but the new model appears to be able to distinguish legitimate events more accurately than its counterparts.
The company plans to deploy hybrid systems that combine established procedures with the new model, a degree of caution that reflects the regulatory levels it operates under. It acknowledges that no single model is likely to perform well in all scenarios, so the LTM will take its place among the tools in this sphere.
It’s claimed the model can scan activity on loyalty programmes, be used in portfolio management, and for internal analytics, areas where there are large volumes of structured data. In current operations, companies often deploy many models adapted to each task, but this can involve multiples of training costs and validation and monitoring efforts. A single foundation model that can be fine-tuned for different tasks may simplify processes and keep costs down.
Risk and future plans
There’s a risk to the multi-function LTM approach, of course: A failure in a widely-deployed model could have system-wide consequences, which goes some way to explain Mastercard’s strategy of applying its technology alongside existing detection systems – at least, for the present.
Mastercard hopes to increase the scale of the data used on the model and its overall sophistication. It’s also planning on API access and SDKs to let internal teams build new applications.
The blog post emphasises the data responsibilities the LTM holds, mentioning privacy and transparency, model explainability, and auditability. Regulatory scrutiny of any system that influences credit decisions or fraud outcomes is to be expected in addition to any data practices involved in the LTM’s operation.
Highly structured data, as opposed to text or images, lies at the core of the LTM. Large tabular models may be the start of a new generation of AI systems in core banking and payments infrastructure. Evidence to date remains limited to vendor reports, so any performance claims should not necessarily be regarded as conclusive.
Robustness under adversarial conditions, long-term post-training costs, and regulatory acceptance are all issues on which tabular models may founder or thrive. These factors will determine the pace and extent of adoption, but it’s the area of the table where Mastercard is placing some of its bets at present.
(Image source: “Oversight” by United States Marine Corps Official Page is licensed under CC BY-NC 2.0.)

Want to learn more about AI and big data from industry leaders? Check out AI & Big Data Expo taking place in Amsterdam, California, and London. The comprehensive event is part of TechEx and co-located with other leading technology events. Click here for more information.
AI News is powered by TechForge Media. Explore other upcoming enterprise technology events and webinars here.
The post Mastercard keeps tabs on fraud with new foundation model appeared first on AI News.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み