なぜ12年前の予測論文は時代の試練に耐え続けているのか
アマゾン研究者が2014年に発表したラテンアメリカの社会不安予測論文が、2025年KDDで「時代を超えた価値賞」を受賞した。
キーポイント
2014年に発表された社会不安予測システム『EMBERS』が、2025年KDD会議でテスト・オブ・タイム賞を受賞したこと
EMBERSはニューラルネットワーク主流以前の手法(ベイズ分類、ロジスティック回帰など)を組み合わせ、オープンソース情報からラテンアメリカ10カ国の社会不安を予測するシステムであること
システムは複数のアルゴリズムをベイズ推論で統合し、確率付きの予測を数週間から数ヶ月先まで行うこと
2013年のブラジルでの抗議活動の発生と沈静化を正確に予測するなど、実証的な成果を上げていること
影響分析・編集コメントを表示
影響分析
この記事は、AI研究の持続的価値と実社会への応用可能性を示す重要な事例である。ニューラルネットワーク以前の手法でも、適切な設計と評価により長期的に有用なシステムが構築できることを証明しており、現在のAI研究における手法選択や評価基準の見直しに影響を与える可能性がある。また、社会問題へのAI応用における倫理的・実用的な課題についても再考を促す内容となっている。
編集コメント
AI研究の『耐久性』を考える上で貴重なケーススタディ。最新技術だけでなく、適切に設計された従来手法の組み合わせが、10年以上にわたり実用的価値を維持できることを示している。
なぜ12年前の予測論文は時を超えて輝き続けるのか
なぜ12年前の予測論文は時を超えて輝き続けるのか
アマゾン・スカラーであるアラヴィンド・スリニヴァサンは、2014年にラテンアメリカの市民的不安を予測する論文を共同執筆し、KDD 2025でテスト・オブ・タイム賞を受賞しました。
シェア シェア リンクをコピー
2025年に開催された計算機学会ACMの知識発見・データマイニング特別グループ(KDD)会議において、アマゾン・スカラーでありメリーランド大学教授のアラヴィンド・スリニヴァサンは、8機関の30名の共著者の一人として、2014年の論文「『ニュースを凌駕する』EMBERS:オープンソース指標を用いた市民的不安の予測」で、同会議の応用データサイエンス部門テスト・オブ・タイム賞を受賞しました。
アマゾン・スカラーであるアラヴィンド・スリニヴァサンは、メリーランド大学カレッジパーク校の卓越教授および計算機科学教授です。彼の研究関心は、アルゴリズム、連続および組み合わせ最適化、機械学習の交差点にあります。
ニューラルネットワークが主流となる前の当時、EMBERS(「代理指標を用いた早期モデルベース事象認識」の略)は、ベイズ分類やロジスティック回帰などの技術を用いて、ソーシャルメディアの投稿、ニュース記事、ブログ投稿、経済指標、衛星画像など公開可能な情報を処理し、ラテンアメリカ10か国における市民的不安の発生確率を予測する5つの機械学習モデルの集合体でした。論文が発表された時点で、EMBERSは2年間運用されており、2013年半ばにブラジルで発生した大規模な抗議活動の急増と沈静化を正確に予測していました。
アマゾン・サイエンスは、EMBERS論文とそれが今も注目され続ける理由について、スリニヴァサンに話を聞きました。
Q. この論文の焦点は何でしたか?
この論文はラテンアメリカに焦点を当て、主に金融イベント、選挙結果、健康関連イベント、社会的動乱の4種類の事象を対象としています。新聞データ、インターネットデータ、衛星画像(例えば病院の駐車場が混雑していれば健康関連イベントを示唆する)など、あらゆるオープンソース・インテリジェンスを利用できる場合、今後数週間から数か月の間に発生する事象について、確率付きで知的な予測を行うことはできるか? それらの予測をどのように知的に評価し、私たちが発した警告と実際に発生した事象を照合するか? そして最後に、補完的な強みを持つ複数のアルゴリズムを実行しているため、ベイズ推論を用いてそれらを知的に融合し、警告を発するにはどうすればよいか? これらが焦点でした。
Q. 時を経ても色あせない論文の側面は何ですか?
私たちは12、13年前の機械学習技術を用いましたが、それは大きく凌駕されているので、その点の貢献は少ないと思います。しかし、何らかの機械学習モデルがある場合、それを検証できる必要があります。例えば教師あり学習問題であれば、ラベリングプロセスの質を評価する必要があります。しかし、未来について警告を与えるアルゴリズムを、どのように評価すればよいのでしょうか?
私たちは、例えば「この地域の今度の選挙では、これらの政党が最も得票率を伸ばすだろう」といった警告を出すことになっていました。部分的に正しかったとしましょう:それにどのようなスコアを与えるべきでしょうか? おそらく、そのうちの一党は得票率を大幅に伸ばしたが、もう一党はそうではなかった、といった場合です。
時を経ても有効だと思う一つの洞察は、個々の警告を見るのではなく、警告の時系列全体と実際の事象の時系列全体を見て、これらを可能な限り首尾一貫した方法で対応付けようとすることです。これは二部マッチングと呼ばれ、警告とアラートの間で最大重みマッチングを見つけることで、この事象はあの警告に最も帰属させることができる、あるいはその逆、という首尾一貫した見解を得ます。時間的な考慮を尊重するためには、理想的にはマッチングが交差しないようにしたいと考えます。
警告(w1–w7)と事象(e1–e7)を対応付ける3つのアプローチ:重み付きマッチング;最大重み二部マッチング;非交差最大重み二部マッチング。図は「『ニュースを凌駕する』EMBERS:オープンソース指標を用いた市民的不安の予測」から改変。
二つ目の貢献で、有用であったと思うのは、単一の警報ではなく複数の警報を発することです。なぜなら、私たちは異なるスキルを持つ補完的なアルゴリズムを持っているからです。しかし、警報が雑然としていては困ります。何らかの方法でそれらを融合する必要があり、私たちの融合方法論は、各アルゴリズムの異なる強さについての事前の信念、使用コストなどについて、いくつかの単純なベイズ的考えを用いています。そしてもちろん、ベイズのルールに従ってそれらを更新し続けます。
Q. ベイズ推論に関する内容は、今日の機械学習モデルにもまだ当てはまりますか?
モデル訓練の設定では少ないですが、強化学習や制御理論、あるいはそのような設定ではより多く当てはまるでしょう。強化学習が教師あり学習と異なる点の一つは、エージェントが行動を起こすのを助けることです。今日では、現代的なエージェント型AIのようなものかもしれませんが、一つの考え方としてはロボットのようなものです。それは世界を観察し、探索と利用のトレードオフを行うことで、様々なステップを踏む確率の系列を学習させることができます。
しかし、それは時代遅れになるかもしれません:ロボットが新しい部屋や新しいシナリオに入ると、当然、その信念を更新する必要がありますが、多くのシステムではベイズ推論を用いてそれを行います。ご存知のように、現在では、ロボットに様々な科学実験を行わせ、物理的コンテキストにおいてどの実験が最も実り多いかを判断させることで、物理的AIや科学的発見を実現しようとするスタートアップ企業があります。このような設定、つまり知的な推測を行いながら、時間の経過とともにそれらの推測を更新する必要がある場合、この種のベイズ推論は依然として非常に有用です。
機械学習
確率的予測
テスト・オブ・タイム賞
原文を表示
Why a 12-year-old forecasting paper has stood the test of time
Amazon Scholar Aravind Srinivasan coauthored a 2014 paper about forecasting civil unrest in Latin America, which won a test-of-time award at KDD 2025.
Share Share Copy link
At the 2025 meeting of the Association for Computing Machinery's Special Interest Group on Knowledge Discovery and Data Mining (KDD), Amazon Scholar and University of Maryland professor Aravind Srinivasan was one of 30 coauthors from eight institutions to win the conference’s applied-data-science test-of-time award for a 2014 paper titled “‘Beating the news’ with EMBERS: Forecasting civil unrest using open-source indicators”.
Amazon Scholar Aravind Srinivasan is a distinguished university professor and professor of computer science at the University of Maryland, College Park. His research interests lie at the intersection of algorithms, continuous and combinatorial optimization, and machine learning.
In those days before the predominance of neural networks, EMBERS (for “early model-based event recognition using surrogates”) was a collection of five machine learning models that used techniques like Bayesian classification and logistic regression to process publicly available information such as social-media posts, news reports, blog posts, economic indicators, and satellite imagery and predict the likelihood of civil unrest in 10 Latin American nations. When the paper was published, EMBERS had been in operation for two years and had correctly predicted the surge and subsidence of public protests in Brazil in mid-2013.
Amazon Science caught up with Srinivasan to discuss the EMBERS paper and the reasons it continues to draw attention.
Q. What was the focus of the paper?
The paper focuses on Latin America and on four types of events — broadly, financial events, election outcomes, health events, and social unrest. If you have access to newspaper data, Internet data, satellite imaging — because if hospital parking lots are crowded, it suggests something about health events — and so on, given all this open-source intelligence, can we make intelligent forecasts, along with probabilities, about events happening over the next several weeks or months? How do we evaluate them intelligently, match up the warnings that we issued with the events that actually happened? And finally, since we run multiple algorithms with complementary strengths, how do we fuse them intelligently using Bayesian reasoning in order to issue our alerts?
Q. What are the aspects of the paper that have stood the test of time?
We used the machine learning of 12, 13 years ago, which has been greatly surpassed, so I think that has been less of a contribution. But if you have some machine learning model, you need to be able to validate it — if it's a supervised-learning problem, say, to figure out how good the labeling process is. But how do you evaluate an algorithm that gives warnings about the future?
We were supposed to give warnings that, for example, these political parties would increase their vote share the most in the coming election in this district. Suppose we're partly correct: what kind of score should we give it? Maybe one of those parties heavily advanced its vote share, but the other did not.
One insight that I think has stood the test of time is to not look at individual warnings but to look at a whole temporal sequence of warnings and another temporal sequence of actual events and try to match these up in as coherent a manner as possible. This is called a bipartite matching, and you find a maximum-weight matching between warnings and alerts so that you get a coherent idea that this event can be most attributed to that warning and vice versa. In order to respect temporal considerations, you would ideally like the matching to be non-crossing.
Three approaches to matching warnings (w1–w7) and events (e1–e7): weighted matching; maximum-weight bipartite matching; and non-crossing maximum-weight bipartite matching. Figure adapted from “‘Beating the news’ with EMBERS: Forecasting civil unrest using open-source indicators”.
A second contribution that I think has been useful is issuing not just one alarm but multiple alarms, because we have complementary algorithms with different skills. But you don't want a cacophony of alarms. You want to somehow fuse them, and our fusion methodology uses some simple Bayesian ideas about our prior belief about the different strengths of our algorithms, the costs of using them, and so on. And of course, you keep updating them according to Bayes’s rule.
Q. Would the stuff about Bayesian inference still apply to today’s machine learning models?
Less in model training settings but more in reinforcement learning or control theory or settings like that. One of the ways in which reinforcement learning differs from supervised learning is that it helps an agent take actions. Today, it could be a modern agentic-AI kind of thing, but one way to think about it is it's a robot. It inspects the world, and by trading off exploration and exploitation, you can teach it a sequence of probabilities with which to take various steps.
But that may become outdated: maybe the robot enters a new room or a new scenario, and then it naturally needs to update its beliefs, which in many systems it'll do using Bayesian reasoning. You know, there are now startups that want to do physical AI and scientific discovery by letting robots do various science experiments and figure out which experiments may be the most fruitful in a physical context. In settings like this, where you need to make intelligent guesses but update those guesses over time, this kind of Bayesian reasoning can still be very helpful.
Machine learning
Probabilistic forecasting
Test of Time Award
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み