CA DATA NIGHT #9 〜スポーツの現場を支えるAI・データ活用の最前線〜 開催レポート
サイバーエージェントが主催した CA DATA NIGHT #9 では、競輪 AI の勝率補正手法やスポーツ映像のデータ基盤構築など、実社会における AI・データ活用の具体的な課題と解決策が報告された。
キーポイント
競輪 AI 予想モデルの難しさと解決策
同じレースが二度と行われないことやオッズの歪み(Favorite-longshot bias)という課題に対し、支持率を勝率へ補正するモデルと、3 連単予測を段階的な条件付き確率に分解する手法が紹介された。
スポーツ映像を支えるサーバレス基盤
WINTICKET が構築した「DAM」と呼ばれるデータ管理基盤について、サーバレスアーキテクチャを活用して CV/ML モデル開発の土台を効率的に整備する事例が発表された。
J リーグ現場でのデータ活用
記事の冒頭で J リーグクラブ現場でのデータ活用についても言及されており、異なる立場(事業者・インフラ・現場)における多角的な AI 導入事例が紹介された。
競輪 AI 予想の難解性と解決策
同じレースが二度と行われないことやオッズの歪み(Favorite-longshot bias)という観測不可能な勝率を扱う課題に対し、段階的な条件付き確率への分解でモデル性能を改善した。
映像データ管理基盤「DAM」の構築
散在する映像資産と属人化した管理課題を解決するため、AWS のメディアレイクガイドラインをベースにしたフルサーバーレス型の一元管理基盤を構築した。
データ活用現場の多様性
本イベントでは、競輪予想という予測タスクから映像管理基盤、J リーグクラブでの運用まで、異なる立場と対象における AI・データ活用の最前線が紹介された。
データサイロ化と意思決定の壁への対応
部署ごとの分断やサッカー特有の複雑さによる課題に対し、現場が求める情報を一気通貫で届けるデータプラットフォームを構築して解決を図っている。
影響分析・編集コメントを表示
影響分析
このイベントレポートは、AI が単なる技術デモではなく、競輪やスポーツリーグといった実社会の複雑な課題解決にどう組み込まれているかを具体的に示しています。特に「観測不可能な値の推定」や「市場バイアスの補正」といったデータサイエンスの本質的な難問に対するエンジニアリング的アプローチは、業界全体の実装レベルを高める参考事例となります。
編集コメント
実社会の複雑なルールやバイアスを持つ領域で、どのようにデータサイエンスを適用しモデルを改善したかという実践的な知見が得られる貴重なレポートです。特に競輪予測における確率分解のアプローチは、類似する組み合わせ問題への応用も期待できます。
こんにちは。サイバーエージェントの佐藤です。
先日開催された CA DATA NIGHT #9 の様子についてご紹介いたします。
イベント概要
image会場で配布した CA DATA NIGHT のノベルティ
connpass: https://cyberagent.connpass.com/event/389754/
CA DATA NIGHT とは、サイバーエージェントが主催するデータサイエンスに特化した技術者向けの勉強会です。機械学習や統計学、コンピュータビジョン、情報推薦など、さまざまな専門分野のエンジニアやデータサイエンティストが、日々の技術や取り組みを紹介しています。
2026 年 5 月 21 日に当社オフィスで開催した 9 回目の今回は、「スポーツの現場を支える AI・データ活用の最前線」をテーマに掲げました。WINTICKET の競輪 AI 予想、スポーツ映像を支えるデータ基盤、そして J リーグのクラブ現場でのデータ活用と、扱う対象や立場が異なる 3 名にご登壇いただきました。
以下、各発表の様子をお伝えします。
発表内容
競輪 AI 予想モデル:観測できない勝率にどう近づくか
サイバーエージェント/Data Science Center 所属の ML エンジニア 杉山 雄大より、WINTICKET の競輪 AI 予想モデルについて発表されました。AI が買い目の候補を提案し、ユーザーの投票を支援する機能を題材に、競輪予測ならではの難しさと、その乗り越え方が語られました。
image杉山の発表の様子
競輪予測が難しい理由は 2 つあります。1 つは、同じレースが二度と行われないため、選手の「真の勝率」を直接観測できないこと。もう 1 つは、市場のオッズが勝率そのものではなく支持率にすぎず、人気馬ならぬ人気選手ほど過小評価される Favorite-longshot bias(お気に入り・長距離馬バイアス)による歪みを含むことです。オッズをそのまま勝率とみなすと、この歪みごと取り込んでしまいます。
最終オッズとレース情報を入力とした機械学習モデルで、支持率を勝率に近い確率へ補正するアプローチを採りました。さらに難所となるのが、ラインの駆け引きが効いてくる 3 連単の予測です。9 車から 3 着までの並びをまとめて言い当てようとすると組み合わせが膨れ上がるため、これを単勝・2 車単・3 連単へと段階的な条件付き確率に分解しました。問題を解ける単位までほどいてから積み上げる設計に切り替えたことで、モデルの性能改善につながったとのことです。
なお本発表のスライドは、予想モデルの詳細を含むため外部公開はしておりません。
サーバレスで作る動画データ管理基盤
サイバーエージェント/WINTICKET でバックエンドと基盤を担当する茨木 啓瑚より、データ基盤「DAM」について発表されました。スポーツ映像から CV/ML モデルを生み出すための土台となる基盤です。
image茨木の発表の様子
出発点は、足元の困りごとでした。競輪 WINLIVE などで日々たまる映像が、ローカル PC・Google Drive・個人の EC2 へと散らばり、「どの動画がどこにあるか」が担当者の記憶頼みになっていたのです。DAM はこの状況に対して、元動画・メタデータ・実行履歴・副産物を一箇所へ集約します。S3 に置くだけで Collection へ自動的に整理される仕組みにより、所在の属人化を解きほぐしていきます。
アーキテクチャは入口・取込・Pipeline(処理パイプライン)・保管・検索の5ブロックで構成され、全体をフルサーバーレスでまとめています。土台には AWS 公式 OSS の「Guidance for Media Lake on AWS」を採用し、コアには手を入れず拡張ポイントだけを自社実装する方針をとりました。これにより upstream(上流工程)の更新へ追従しながら、自社の事情に合わせて伸ばせる構成になっています。GUI でのパイプライン組み立て、CVAT を使ったアノテーション連携、セマンティック検索まで備え、これまで個人の工夫に閉じていたモデル開発の土台を、基盤へ移していく姿が示されました。
FC町田ゼルビアでのデータ活用
FC町田ゼルビアのデータアナリスト 木下 慶悟より、J1 サッカークラブの戦術領域におけるデータ活用について発表されました。
image木下の発表の様子
クラブの現場には、データが部署ごとに分断されるサイロ化と、サッカー特有の複雑さゆえにデータだけでは意思決定を下しづらいという二つの壁がありました。木下が所属するデータ&テクノロジーグループは、現場が求める情報を過不足なく一気通貫で届けるデータプラットフォームを構築し、この壁に向き合っています。
戦術領域では、昨シーズンの分析をもとに現場と方向性をすり合わせるところから始めました。「戦術と紐づくか」「結果と相関するか」「直感的にわかりやすいか」という3つの観点でチーム独自の戦術評価指標を策定し、それらを他のスタッツ(統計データ)と統合したダッシュボードの開発を進めています。
こうした長期的な取り組みと並行して、試合単位でもデータの因果関係を解析しています。現実的に改善できる介入点を特定して現場に提案することで、検証のためのデータが仮説を生み出すデータへと変わり、チームの目線を揃え、より良い意思決定を後押ししつつあるとのことです。
発表のまとめで強調されたのは、何よりも信頼関係の構築でした。単なる技術者ではなくチームの一員になることが、データを現場に活かすための土台になります。その土台の上で、今後は AI を活用した対戦相手分析の支援や、リアルタイムでのデータ取得・分析に向けた実証実験を進めていく予定です。
おわりに
発表のあとに開いた懇親会も盛り上がり、登壇者と参加者が分野を越えて語り合う時間になりました。ご参加いただいた皆さま、登壇者の皆さま、ありがとうございました。
今後も事例紹介のイベントを開催していく予定です。ご興味をお持ちの方は、ぜひ connpass の CyberAgent グループ をチェックしてみてください。
原文を表示
こんにちは。サイバーエージェントの佐藤です。
先日開催された CA DATA NIGHT #9 の様子についてご紹介いたします。
イベント概要

connpass: https://cyberagent.connpass.com/event/389754/
CA DATA NIGHT とは、サイバーエージェントが主催するデータサイエンスに特化した技術者向けの勉強会です。機械学習や統計学、コンピュータビジョン、情報推薦など、さまざまな専門分野のエンジニアやデータサイエンティストが、日々の技術や取り組みを紹介しています。
2026年5月21日に当社オフィスで開催した9回目の今回は、「スポーツの現場を支えるAI・データ活用の最前線」をテーマに掲げました。WINTICKET の競輪 AI 予想、スポーツ映像を支えるデータ基盤、そして J リーグのクラブ現場でのデータ活用と、扱う対象や立場が異なる3名にご登壇いただきました。
以下、各発表の様子をお伝えします。
発表内容
競輪 AI 予想モデル:観測できない勝率にどう近づくか
サイバーエージェント/Data Science Center 所属の ML エンジニア 杉山 雄大より、WINTICKET の競輪 AI 予想モデルについて発表されました。AI が買い目の候補を提案し、ユーザーの投票を支援する機能を題材に、競輪予測ならではの難しさと、その乗り越え方が語られました。

競輪予測が難しい理由は2つあります。1つは、同じレースが二度と行われないため、選手の「真の勝率」を直接観測できないこと。もう1つは、市場のオッズが勝率そのものではなく支持率にすぎず、人気馬ならぬ人気選手ほど過小評価される Favorite-longshot bias による歪みを含むことです。オッズをそのまま勝率とみなすと、この歪みごと取り込んでしまいます。
最終オッズとレース情報を入力とした機械学習モデルで、支持率を勝率に近い確率へ補正するアプローチを採りました。さらに難所となるのが、ラインの駆け引きが効いてくる3連単の予測です。9車から3着までの並びをまとめて言い当てようとすると組み合わせが膨れ上がるため、これを単勝・2車単・3連単へと段階的な条件付き確率に分解しました。問題を解ける単位までほどいてから積み上げる設計に切り替えたことで、モデルの性能改善につながったとのことです。
なお本発表のスライドは、予想モデルの詳細を含むため外部公開はしておりません。
サーバレスで作る動画データ管理基盤
サイバーエージェント/WINTICKET でバックエンドと基盤を担当する茨木 啓瑚より、データ基盤「DAM」について発表されました。スポーツ映像から CV/ML モデルを生み出すための土台となる基盤です。

出発点は、足元の困りごとでした。競輪 WINLIVE などで日々たまる映像が、ローカル PC・Google Drive・個人の EC2 へと散らばり、「どの動画がどこにあるか」が担当者の記憶頼みになっていたのです。DAM はこの状況に対して、元動画・メタデータ・実行履歴・副産物を一箇所へ集約します。S3 に置くだけで Collection へ自動的に整理される仕組みにより、所在の属人化を解きほぐしていきます。
アーキテクチャは入口・取込・Pipeline・保管・検索の5ブロックで構成され、全体をフルサーバーレスでまとめています。土台には AWS 公式 OSS の「Guidance for Media Lake on AWS」を採用し、コアには手を入れず拡張ポイントだけを自社実装する方針をとりました。これにより upstream の更新へ追従しながら、自社の事情に合わせて伸ばせる構成になっています。GUI でのパイプライン組み立て、CVAT を使ったアノテーション連携、セマンティック検索まで備え、これまで個人の工夫に閉じていたモデル開発の土台を、基盤へ移していく姿が示されました。
FC町田ゼルビアでのデータ活用
FC町田ゼルビアのデータアナリスト 木下 慶悟より、J1 サッカークラブの戦術領域におけるデータ活用について発表されました。

クラブの現場には、データが部署ごとに分断されるサイロ化と、サッカー特有の複雑さゆえにデータだけでは意思決定を下しづらいという二つの壁がありました。木下が所属するデータ&テクノロジーグループは、現場が求める情報を過不足なく一気通貫で届けるデータプラットフォームを構築し、この壁に向き合っています。
戦術領域では、昨シーズンの分析をもとに現場と方向性をすり合わせるところから始めました。「戦術と紐づくか」「結果と相関するか」「直感的にわかりやすいか」という3つの観点でチーム独自の戦術評価指標を策定し、それらを他のスタッツと統合したダッシュボードの開発を進めています。
こうした長期的な取り組みと並行して、試合単位でもデータの因果関係を解析しています。現実的に改善できる介入点を特定して現場に提案することで、検証のためのデータが仮説を生み出すデータへと変わり、チームの目線を揃え、より良い意思決定を後押ししつつあるとのことです。
発表のまとめで強調されたのは、何よりも信頼関係の構築でした。単なる技術者ではなくチームの一員になることが、データを現場に活かすための土台になります。その土台の上で、今後は AI を活用した対戦相手分析の支援や、リアルタイムでのデータ取得・分析に向けた実証実験を進めていく予定です。
おわりに
発表のあとに開いた懇親会も盛り上がり、登壇者と参加者が分野を越えて語り合う時間になりました。ご参加いただいた皆さま、登壇者の皆さま、ありがとうございました。
今後も事例紹介のイベントを開催していく予定です。ご興味をお持ちの方は、ぜひ connpass の CyberAgent グループ をチェックしてみてください。
関連記事
人の選好予測には「3 の力」が有効である
アメリカの心理学者 L.L.サーストーンは、1927 年の論文で複数の選択肢から一つを選ぶ際、人は数値化できないものの最も価値が高いものを選んでいると提案した。この研究は心理測定学の基礎を築き、現代の選好予測モデルにも影響を与えている。
Google、AI学習用にレンズ写真や検索録音などを保存する方針へ変更
Google はユーザーに送ったメールで、Search Services History という新設定の下、Lens で使用した画像や音声ファイル、動画などを保存し、AI 学習に活用すると発表した。
Apple、AI による写真編集の幻想に没入
Apple は WWDC 2026 で、現実を正確に捉える必要性を否定し、画像操作を容易にする多数の新 AI 写真編集ツールを発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み