NFL次世代統計の10年間の革新
NFLのNext Gen Statsは、RFIDとAWS上の75の機械学習モデルを用いて選手の動きをリアルタイムで分析し、100年以上続いたボックススコア中心のフットボールをデータ駆動型スポーツへと変革した。
キーポイント
データ収集の技術的基盤
選手のショルダーパッドとボールに埋め込まれたRFIDチップ、およびスタジアムに設置された20台以上の超広帯域受信機により、選手の位置データ(毎秒10回)とボールのデータ(毎秒25回)が数インチの精度で収集されている。
AWSによるリアルタイムデータ処理
AWS上で動作する75の機械学習モデルが、試合中に生成される数百万の追跡データポイントを1秒未満で処理し、即時分析を可能にしている。
リーグ全体へのデータアクセスとインフラ化
2018年に全チームがリーグ全体のトラッキングデータにアクセスできるようになり、NGSは追跡実験からNFLの重要なインフラへと進化し、生放送はその最も目に見える表現となった。
意思決定への広範な影響
NGSは現在、クラブの選手評価やゲームプランの設計から、NFLの審判業務、選手の安全性、ルール変更の研究に至るまで、リーグ全体の意思決定を支えるデータ基盤となっている。
AWSとの連携による複雑な統計モデルの開発
NFL Next Gen Statsは、AWSのSageMakerプラットフォームを活用して、パスの完了確率など複雑なゲーム指標を機械学習モデルで定量化し、より深い分析を可能にした。
Amazon Quick Sightによるリアルタイムデータ可視化とファンエンゲージメント
NFLはAmazon Quick Sightを使用して、ファンやアナリスト向けにリアルタイムのインタラクティブな可視化を提供し、Combine IQやDraft IQなどの体験を通じて洞察へのアクセスを拡大した。
Big Data Bowlによる外部研究者へのデータ開放と分析の深化
2018年に開始されたBig Data Bowlは、プレーヤートラッキングデータを外部研究者に開放し、ディフェンダーのスペース閉鎖効果などの新たな研究課題に取り組む機会を創出した。
影響分析・編集コメントを表示
影響分析
この取り組みは、スポーツ分析におけるIoTとAIの大規模実装の成功例を示しており、データ駆動型意思決定が競技の戦術、運営、安全性、さらにはファン体験までを根本的に変容させる可能性を実証している。スポーツ以外の分野におけるリアルタイムセンシングと分析の応用にも大きな示唆を与える。
編集コメント
AIとIoTの融合が、伝統的な領域(プロスポーツ)のビジネスと競技の核心を変革した具体例。技術の実用化とスケーリングの成功ストーリーとして注目に値する。
NFL次世代統計の10年にわたる革新
NFLの試合ごとに、RFID装備の22人の選手から数百万のトラッキングデータポイントが生成されます。AWS上で動作する75の機械学習モデルが、そのデータを1秒以内に処理し、フットボールをあらゆる動きが測定、モデル化、即時分析されるスポーツへと変えています。
共有 共有 リンクをコピー
NFLにおける毎回のスナップ(プレー開始)は、膨大な物理データの奔流を引き起こします。22人の選手が瞬時に加速、衝突し、方向を変え、ボールは制御された混沌の中を軌跡を描きます。
しかし、このスポーツの歴史の大半において、その複雑さの多くは測定されませんでした。「フットボールは、100年以上にわたり、ボックススコア(試合記録)のゲームでした。獲得ヤード、タッチダウン、タックルの数などです…」と、NFL次世代統計のリサーチ&アナリティクスシニアマネージャー、マイク・バンドは言います。
それらの数字が捉えられるのは、フィールド上で実際に起きたことのほんの一部に過ぎませんでした。コーチは試合の録画を熟視し、経験に基づいた推測をしました。ファンはスタンドやソファから議論を交わしました。審判は部分的で、しばしば視界が遮られた状態に基づいて、時折ジャッジメントコール(裁量判断)を行いました。「ボックススコアの統計を見ても、あるプレーでどの22人の選手がフィールドにいたかさえ分かりませんでした」と、NFLフットボールデータ&アナリティクスシニアディレクター、マイク・ロペスは言います。
2015年、NFLはボックススコアを超えるものとして次世代統計(NGS)の立ち上げを決定しました。すべてのショルダーパッド一式とボール内部にRFIDチップが埋め込まれ、各スタジアムの周囲には20台以上の超広帯域レシーバーが設置されました。このシステムは、22人全選手の座標(1秒間に10回)とボールの座標(1秒間に25回)のストリーミングを開始しました。リーグ史上初めて、すべてのプレーのあらゆる瞬間において、数インチの精度で包括的な選手位置データを捕捉できるようになったのです。
最初は、各クラブは自チームのトラッキングデータにしかアクセスできませんでした。それが変化したのは2018年、チームがリーグ全体のデータにアクセスできるようになり、コーチ、スカウト、アナリストが共通の分析基盤に立った時です。また同年、リーグはAWSとのパートナーシップを正式化・深化させ、NGSがトラッキング実験からNFLの重要なインフラへと徐々に変貌を遂げる始まりとなりました。ライブ放送は、その最も目に見える表現に過ぎません。
今日、NGSはリーグ全体の意思決定の基盤となっています。クラブが選手を評価し、ゲームプランを設計する方法から、NFLがオフィシエイティング(審判業務)、選手の安全性、ルール変更を研究する方法まで。すべてのチーム、そしてリーグ自体の多くが、今や同じ、絶えず拡大するデータ基盤から作業を行っています。
しかし、始まりは単純なものだったとバンドは言います。「初期の指標は、得やすい成果(ロー・ハンギング・フルーツ)でした。選手間の距離、スピード、スローまでの時間など、当時持っていたデータから容易に導き出せるものでした。より複雑なゲーム指標のモデル化にははるかに多くの労力が必要で、そこにAWSが関わってきたのです。」
このパートナーシップが生み出した最初の複雑な統計は、2018年の「パス成功確率」でした。これは「パスの難易度を数値化できるか?」という単純な問いに答えるために構築されました。
その答えは、一部、AmazonのSageMakerプラットフォーム上でホストされたXGBoost機械学習(ML)モデルによってもたらされました。このモデルは、クォーターバックへのプレッシャーからスローの深さ、レシーバーの離脱距離、サイドラインへの近接性まで、スローの結果を形作る要因を組み合わせました。モデルは、可能性と難易度の両方を捉えた単一のパーセンテージを返しました。「それが私たちの機械学習への入り口となりました」とバンドは言います。
SageMakerを超えて、NFLの分析作業は幅広いAWSツール群へと拡大しました。その中にはAmazon Quickも含まれ、リーグはこれを使用してファン、アナリスト、放送パートナーにリアルタイムのインタラクティブな可視化と回答を提供しています。ロペスは、リーグのフットボールデータアナリティクスグループのメンバーについて「私たちは自らを『AWSショップ』と呼んでいます」と述べています。2018年までに、リーグ全体でのアクセスが整い、AWSのMLパイプラインが稼働するようになると、NGSはこのスポーツ全体におけるより深い問いを照らし始めました。
NFLの試合ごとに数百万の生トラッキングデータポイントが生成されますが、生のデータフィードは単なる基盤に過ぎません。真のデータの成長は、座標を利用可能なフットボールの洞察に変換するモデルからもたらされます。例えば、「プレッシャー確率」は、パスラッシュの各瞬間においてディフェンダーがクォーターバックに影響を与える可能性を推定し、十数以上の二次的な指標を生成します。
バンドの推定では、NGSは現在、1プレーあたり500から1000の統計を生成しています。システムの応答性を維持するためには、AWSのインフラストラクチャに依存して、データフィードを取り込み、モデルを実行し、チームや放送局に数秒以内に結果を返し、より深い分析のために広範なデータの宝庫を保存する必要があります。
Amazon Quick Sightダッシュボードの概要。NFLはAmazon QuickのエージェントAIとBI機能を利用して、ファン、アナリスト、放送パートナーにリアルタイムのインタラクティブな可視化と回答を提供しています。Amazon Quickの機能を活用し、NFLはCombine IQ、Draft IQ、Draft IQ Assistantといった体験を通じて、100万人以上のファンに選手のパフォーマンスやドラフト予測に関する洞察への前例のないアクセスを提供しました。
そのより深い分析のルーツは、2018年に始まった初の「ビッグデータボウル」にまで遡ります。ロペスが主導したこの取り組みは、選手トラッキングデータを外部の研究者に開放するリーグ初の大規模な試みとなり、どのディフェンダーが最も効果的に間合いを詰めるか、あるいはスロー後の選手の動きをどのように予測するかといった課題に取り組むよう彼らを招待しました。
数ヶ月にわたるハッカソンとして構成されるこの年次コンペティションは、参加者に過去のトラッキングデータでMLモデルを訓練し、未見のプレーへの一般化能力をテストするよう挑戦します。その重点は、次に何が起こるかを予測できるモデルへと、ますます置かれています。
初期の成功例は、2020年に開発された「期待値超過ラッシュヤード(RYOE)」でした。この指標は、実際に獲得したヤード数と、平均的なリーグの選手が同じ状況(ブロッカーとディフェンダーの位置、スピード、方向を考慮して)で獲得すると予測されるヤード数である「期待ラッシュヤード」との差を測定します。これは、特定のランがどれほど強力だったかを文脈化し、集計することで、ランニングバックが1試合または1シーズンを通じてどれだけうまくプレーしたかを理解するのに役立ちます。
RYOEはビッグデータボウルから全国放送へと素早く移行しました。ロペスは、2021年のNFCチャンピオンシップゲーム(バッカニアーズ対パッカーズ)で初めてそれが表示されるのを見た瞬間を回想します。「レナード・フォーネットが良いランを見せた直後に、彼の期待値超過ラッシュヤードを示すグラフィックがポップアップしました。それは優勝ソリューションを得てから10ヶ月も経っていない時でした。」彼は付け加えます。「私はテレビ画面の写真を撮り、同僚たちも私に彼らの写真を送ってきました。誇らしい瞬間でした。」
そのパイプラインにより、ビッグデータボウルはアイデアとデータサイエンス人材の両方の実証の場へと変わりました。最初の10年で、ビッグデータボウルはリーグの分析エコシステムの中心的な一部となりました。当時ニューオーリンズ・セインツのコーチだったショーン・ペイトンが2015年にサイドラインでのリアルタイムデータの台頭について冗談めかして言ったように、「MIT卒のコーチがもっと増えるってことだと思うよ。」
過去10年間で、NGSはオフェンス、ディフェンス、スペシャルチーム、ゲーム戦略にまたがる75以上のMLモデルのポートフォリオへと成長しました。その中でも、「タックル確率」と「ディフェンシブアラート」は、生のトラッキングデータがいかにしてチーム、放送局、ファンにとってより明確な洞察に変換されるかを、おそらく最もよく示しています。
タックル確率は、接触の瞬間にディフェンダーがタックルを完了する可能性を、スピード、角度、距離、レバレッジ(有利な体勢)、追跡を考慮して推定します。このデータにより、NGSは真のタックル機会を特定し、ミスタックルを定量化し、ディフェンダーがセーブした、または許したヤード数を計算することができます。
ディフェンシブアラートは、スナップ前のディフェンシブの配置と動きを評価します。
原文を表示
A decade of NFL Next Gen Stats innovation
Every NFL game generates millions of tracking data points from 22 RFID-equipped players. Seventy-five machine learning models running on AWS process that data in under a second, transforming football into a sport where every movement is measured, modeled, and instantly analyzed.
Share Share Copy link
Every snap in the NFL triggers a deluge of physical data. Twenty-two players accelerate, collide, and change direction in fractions of a second, while the ball traces a path through the controlled chaos.
Yet for most of the sport’s history, much of that complexity went unmeasured. “Football, for 100-plus years, has been a box score game: you've got yards, you've got touchdowns, you've got tackles … ,” says Mike Band, senior manager of research and analytics with NFL’s Next Gen Stats.
Those numbers could capture only a sliver of what actually unfolded on the field. Coaches pored over game recordings and made educated guesses. Fans argued from the stands and the sofa. Officials occasionally made judgment calls based on partial, often obstructed views. “Looking at box score stats, you didn’t even know which 22 players were on the field for a given play,” says Mike Lopez, senior director of NFL Football Data and Analytics.
In 2015, the NFL decided to expand beyond box scores by launching Next Gen Stats (NGS). RFID chips were placed in every set of shoulder pads and inside the football, and more than 20 ultrawideband receivers were mounted around each stadium. The system began streaming the coordinates of all 22 players (10 times a second) and the ball (25 times per second). For the first time, the league was capturing comprehensive player location data, accurate to a few inches, for every moment of every play.
RFID chips were placed in every set of shoulder pads and inside the football, and more than 20 ultrawideband receivers were mounted around each stadium. At first, each club could access only its own tracking data. That shifted in 2018, when teams gained league-wide access, putting coaches, scouts, and analysts on common analytic footing. Also that year, the league formalized and deepened its partnership with AWS, marking the start of the gradual transformation of NGS from a tracking experiment into critical NFL infrastructure, with live broadcasts only its most visible expression.
Today, NGS underpins decision making across the league, from how clubs evaluate players and design game plans to how the NFL studies officiating, player safety, and rule changes. Every team, and much of the league itself, now works from the same continuously expanding data backbone.
But it started simply, says Band. “Our early metrics were low-hanging fruit — player separation, speed, and time to throw — easily derivable from the data we had. Modeling more-complex game metrics takes much more effort, and that’s where AWS came in.”
The first complex stat the partnership delivered, in 2018, was completion probability. It was built to answer a simple question: can the difficulty of a pass be quantified?
The answer came, in part, courtesy of an XGBoost machine learning (ML) model hosted on Amazon’s SageMaker platform. It blended the factors that shape a throw’s outcome, from quarterback pressure to throw depth, receiver separation, and sideline proximity. The model returned a single percentage that captured both likelihood and difficulty. “That became our entry point into machine learning,” Band says.
Beyond SageMaker, the NFL’s analytics work has expanded into a broad suite of AWS tools, including Amazon Quick, which the League uses to deliver real-time, interactive visualizations and answers to fans, analysts, and broadcast partners. Lopez says the members of the league’s football data analytics group “call ourselves an AWS shop.” By 2018, with league-wide access in place and AWS’s ML pipelines running, NGS began to illuminate deeper questions across the sport.
Every NFL game generates millions of raw-tracking data points, yet the raw feed is only the substrate. The real data growth comes from the models that convert coordinates into usable football insight. Pressure probability, for example, estimates how likely a defender is to affect the quarterback at each moment of a pass rush and produces more than a dozen secondary metrics.
Band estimates that NGS now produces between 500 and 1,000 stats — per play. Keeping the system responsive depends on AWS infrastructure to ingest the feed, run the models, return results within seconds for teams and broadcasters, and store the wider data trove for deeper analysis.
Overview of Amazon Quick Sight dashboard. The NFL uses the Amazon Quick’s agentic AI and BI capabilities to deliver real-time, interactive visualizations and answers to fans, analysts, and broadcast partners. Using the capabilities of Amazon Quick, the NFL provided unprecedented access to insights on player performance and draft predictions to over a million fans with their Combine IQ, Draft IQ, and Draft IQ Assistant experiences.
The roots of that deeper analysis extend back to 2018, with the inaugural Big Data Bowl. Led by Lopez, it became the league’s first large-scale effort to open player-tracking data to external researchers, inviting them to tackle questions such as which defenders close space most effectively or how to predict post-throw player movement.
Structured as a months-long hackathon, the annual competition challenges participants to train ML models on historical tracking data and test their ability to generalize to unseen plays. The emphasis is increasingly on prediction — models that can anticipate what would happen next.
An early success was the 2020 development of rush yards over expectation (RYOE). The metric measures the difference between actual yards gained and expected rushing yards, or what a league-average player would be predicted to gain on the same carry, considering the location, speed, and direction of blockers and defenders. It helps contextualize how strong a given run was and, when aggregated, how well a back performed over a game or season.
NFL Big Data Bowl Explained | AWS Events RYOE moved from the Big Data Bowl to national broadcasts quickly. Lopez recalls the moment he first saw it appear, during the 2021 NFC Championship Game between the Buccaneers and Packers: “Leonard Fournette had a good run, and immediately a graphic popped up with his rush yards over expectation. That was less than 10 months after we got the winning solution.” He adds: “I took a photo of my TV screen, and colleagues were sending me theirs. It was a proud moment.”
That pipeline has turned the Big Data Bowl into a proving ground for both ideas and data science talent. In its first decade, the Big Data Bowl has become a central part of the league’s analytics ecosystem. As then New Orleans Saints coach Sean Payton quipped in 2015 about the rise of real-time data on the sidelines, “ I think it means there are going to be more MIT grads coaching.”
Over the past decade, NGS has grown into a portfolio of more than 75 ML models, spanning offense, defense, special teams, and game strategy. Among those, tackle probability and defensive alerts perhaps best illustrate how raw tracking data can be converted into clearer insights for teams, broadcasters, and fans.
Tackle probability estimates the likelihood of a defender completing a tackle at the moment of contact, factoring in speed, angle, distance, leverage, and pursuit. That data allows NGS to identify true tackle opportunities, quantify missed tackles, and calculate the yards a defender saves or concedes.
Defensive alerts assess defensive alignment and movement before the snap to predict which players are likely to rush. The model uses acceleration patterns and presnap shifts, combines them with situational context such as down, distance, and game state, and then applies generative AI to predict likely rushers, who are highlighted with red circles for viewers.
“Defensive alerts had a big impact, from a broadcast perspective,” says Dashiell Flynn, AWS’s principal sports consultant. He highlights how the model exposes deliberate misdirection: “Sometimes the prediction is wrong because the defense itself is using misdirection, trying to trick the offense into thinking a blitz is coming.” Those moments give game commentators a natural way to discuss disguised defensive pressure and the intent behind it.
Together, these metrics show how NGS models can turn fast, ambiguous moments into clear visual and tactical explanations.
Overview of how Next Gen Stats uses data to make accurate predictions.
Player safety and rule changes
The same tracking foundation that fuels performance analysis also gives the league clearer visibility into player safety. By capturing every player’s speed, spacing, and movement, it gives the league a concrete understanding of the dynamics behind plays long considered risky.
The new dynamic kickoff, introduced for the 2024 season, is a clear example. Kickoffs were producing too many dangerous, high-speed collisions. NGS helped quantify and ultimately change that.
“The season before, we were showing Next Gen Stats animations of the space and relative speeds of the players, and that analysis became a critical part of the rules change,” says Lopez.
The NFL Competition Committee tested alternative formations and identified a design that reduced high-speed contact without removing the competitive element. Two seasons of data show the dynamic kickoff is working: the 2025 return rate jumped to 75% (from 32% in 2024), and even with 1,157 more plays, lower-extremity injuries dropped 35% while concussion rates remain below the old kickoff format. The change is delivering both more action and fewer injuries.
The infrastructure for the next major advance — optical tracking — is already embedded in every NFL venue. Rather than recording only a player’s two-dimensional location, the system uses 4K cameras to capture the full three-dimensional position of key joints such as shoulders, elbows, knees, hips, and hands.
The result is pose estimation, a digital skeletal model for every player on every play. This season marks the first year the league has had what Band calls “full installation, full capture” across every game, although the data remains internal while it is validated, structured, and stored for future use.
For the NGS team, pose estimation arrives at the right moment. A decade of two-dimensional tracking has deepened understanding of the game, Band says, “but this new skeletal data is going to unlock the next level. It’s an inflection point.”
The scale of the data capture is worth pausing over. Standard location tracking collects a single x,y coordinate for each player 10 times per second. Optical tracking captures high-resolution video from 16 angles to derive x,y,z coordinates for 29 body parts per player, 60 times a second. “The explosion in the volume of data can be daunting,” says Flynn. “But once folks wrap their heads around it, the ideas start flowing very quickly.”
The pipeline behind optical tracking runs in three stages: local capture, on-site processing, and cloud analysis. High-bandwidth video from 4K cameras cannot be sent to the cloud fast enough, so each stadium hosts AWS servers that process the data within about 700 milliseconds. The processed, simplified data is then sent to the cloud, where ML models run in under 100 milliseconds and return analysis to the production team. This keeps the full capture-to-analysis pipeline under a second. And because broadcasts such as Thursday Night Football operate with a roughly two-second delay, Next Gen Stats derived
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み