Googleは過去のニュース報道とAIを活用して鉄砲水を予測
GoogleはGemini大規模言語モデルで500万件のニュースを解析し洪水データを時系列化することで、気象インフラが不足する地域でも瞬発的洪水を予測するAIモデルを実用化した。
キーポイント
ニュース記事からのデータ抽出
Geminiを用いて500万件のニュースから260万件の洪水報告を抽出し、「Groundsource」という地理タグ付き時系列データセットを作成した。
AI予測モデルの構築
LSTMニューラルネットワークに気象予報データとGroundsourceを学習させ、特定地域での瞬発的洪水発生確率を算出するモデルを開発した。
実社会への適用と限界
150カ国の都市部リスクをFlood Hubで可視化し防災機関とデータ共有。解像度は20平方kmと比較的低く、リアルタイムレーダーデータを欠くため精度は限定的。
低インフラ地域への焦点
高価な気象観測設備や詳細な記録を持たない地域向けに設計されており、防災対応の迅速化に貢献している。
影響分析・編集コメントを表示
影響分析
気象予測分野において、LLMを活用した非構造化データ(ニュース記事)の構造化・学習への応用は、観測インフラが不足する地域における防災AIの実装可能性を大きく広げる。精度や解像度の課題は残るものの、既存の気象観測網との補完関係により、グローバルな防災インフラの格差是正に貢献する可能性を秘めている。
編集コメント
気象予測という堅固な科学分野にLLMをデータ前処理・特徴量抽出の手段として組み込んだ点は秀逸だ。解像度やリアルタイム性の課題は残るが、観測インフラの地理的格差を埋める実用的な枠組みとして、今後の防災AI分野における標準的なデータパイプラインの一つになり得る。
タイトル: Google、過去のニュース記事とAIを活用して鉄砲水を予測
鉄砲水は世界で最も致命的な気象現象の一つであり、毎年5,000人以上が犠牲となっています。また、最も予測が困難な現象の一つでもあります。しかしGoogleは、ニュース記事を「読む」という意外な方法でこの問題を解決したと考えています。
人類は多くの気象データを収集してきましたが、鉄砲水は発生期間が短く局所的であるため、気温や河川流量のように長期的に包括的に測定することはできません。このデータのギャップにより、気象予報能力が高まっている深層学習モデルでも、鉄砲水を予測することができないのです。
この問題を解決するため、Googleの研究者たちは大規模言語モデル「Gemini」を使用して世界中の500万件のニュース記事を分析し、260万件の異なる洪水に関する報道を抽出。それらの報道を「Groundsource」と名付けた地理タグ付き時系列データに変換しました。Google ResearchのプロダクトマネージャーであるGila Loikeによると、同社が言語モデルをこの種の作業に使用するのは初めてのことです。この研究とデータセットは木曜日の朝に公開されました。
現実世界のベースラインとしてGroundsourceを用いて、研究者たちは長短期記憶(LSTM)ニューラルネットワークを基に構築したモデルを訓練。全球の気象予報データを取り込み、特定地域での鉄砲水発生確率を生成するようにしました。
Googleの鉄砲水予測モデルは現在、同社の「Flood Hub」プラットフォーム上で150か国の都市部におけるリスクを提示しており、そのデータを世界中の緊急対応機関と共有しています。Googleと共にこの予測モデルを試験運用した南部アフリカ開発共同体の緊急対応担当官、António José Belezaは、このモデルが自身の組織による洪水へのより迅速な対応を支援したと述べました。
このモデルにはまだ限界があります。一つには、解像度がかなり低く、20平方キロメートルの地域単位でリスクを識別することです。また、米国国立気象局の洪水警報システムほど正確ではなく、その理由の一部は、Googleのモデルがリアルタイムの降水追跡を可能にする現地のレーダーデータを取り込んでいないためです。
しかし、このプロジェクトの意義の一部は、地方政府が高価な気象観測インフラに投資する余裕がない、あるいは気象データの包括的な記録を持っていない地域でも機能するように設計された点にあります。
Techcrunchイベント Disrupt 2026: テックエコシステムが一堂に会する
あなたの次の資金調達ラウンド。あなたの次の採用。あなたの次のブレイクスルー機会。TechCrunch Disrupt 2026で見つけましょう。10,000人以上の起業家、投資家、テックリーダーが集結し、250以上の実践的セッション、強力な人脈構築、市場を定義するイノベーションが3日間にわたって繰り広げられます。今すぐ登録して最大400ドル節約しましょう。
TechCrunch Founder Summitへの参加費を最大300ドル(30%)節約
1,000人以上の起業家と投資家がTechCrunch Founder Summit 2026に集結し、成長、実行、現実世界でのスケーリングに焦点を当てた丸一日を過ごします。業界を形作ってきた起業家や投資家から学びましょう。同じ成長段階を進む仲間とつながりましょう。すぐに適用できる戦術を持ち帰りましょう。このオファーは3月13日までです。
「何百万件もの報道を集約しているため、Groundsourceデータセットは実際に地図のバランスを再調整するのに役立っています」と、Googleの「レジリエンス」チームのプログラムマネージャーであるJuliet Rothenbergは今週記者団に語りました。「これにより、情報がそれほど多くない他の地域への外挿が可能になります。」
Rothenbergは、書かれた定性的な情報源から定量的データセットを開発するために大規模言語モデル(LLM)を使用するアプローチは、熱波や土砂崩れなど、他の一時的だが予測が重要な現象に関するデータセット構築の取り組みにも応用できる可能性があるとチームは期待していると述べました。
水力発電会社などの顧客向けに河川流量を予測するために同様の深層学習モデルを使用している企業、Upstream TechのCEOであるMarshall Moutenotは、Googleの貢献は、深層学習ベースの気象予測モデルのためのデータを集める取り組みが拡大している一環であると述べました。Moutenotは、研究者やスタートアップ向けに機械学習対応の気象データを収集・管理するグループ「dynamical.org」の共同創設者でもあります。
「データ不足は地球物理学における最も困難な課題の一つです」とMoutenotは述べました。「同時に、地球に関するデータは多すぎる一方で、真実(実際の現象)に対して評価したいときには十分ではありません。これはそのデータを得るための非常に創造的なアプローチでした。」
原文を表示
Flash floods are among the deadliest weather events in the world, killing more than 5,000 people each year. They’re also among the most difficult to predict. But Google thinks it has cracked that problem in an unlikely way — by reading the news.
While humans have assembled a lot of weather data, flash floods are too short-lived and localized to be measured comprehensively, the way the temperature or even river flows are monitored over time. That data gap means that deep learning models, which are increasingly capable of forecasting the weather, aren’t able to predict flash floods.
To solve that problem, Google researchers used Gemini — Google’s large language model — to sort through 5 million news articles from around the world, isolating reports of 2.6 million different floods, and turning those reports into a geo-tagged time series dubbed “Groundsource.” It’s the first time that the company has used language models for this kind of work, according to Gila Loike, a Google Research product manager. The research and data set was shared publicly Thursday morning.
With Groundsource as a real-world baseline, the researchers trained a model built on a Long Short-Term Memory (LSTM) neural network to ingest weather global forecasts and generate the probability of flash floods in a given area.
Google’s flash flood forecasting model is now highlighting risks for urban areas in 150 countries on the company’s Flood Hub platform, and sharing its data with emergency response agencies around the world. António José Beleza, an emergency response official at the Southern African Development Community who trialed the forecasting model with Google, said it helped his organization respond to floods more quickly.
There are still limitations to the model. For one, it is fairly low resolution, identifying risk across 20-square-kilometer areas. And it is not as precise as the US National Weather Service’s flood alert system, in part because Google’s model doesn’t incorporate local radar data, which enables real-time tracking of precipitation.
Part of the point, though, is that the project was designed to work in places where local governments can’t afford to invest in expensive weather-sensing infrastructure or don’t have extensive records of meteorological data.
Techcrunch event Disrupt 2026: The tech ecosystem, all in one room
Your next round. Your next hire. Your next breakout opportunity. Find it at TechCrunch Disrupt 2026, where 10,000+ founders, investors, and tech leaders gather for three days of 250+ tactical sessions, powerful introductions, and market-defining innovation. Register now to save up to $400.
Save up to $300 or 30% to TechCrunch Founder Summit
1,000+ founders and investors come together at TechCrunch Founder Summit 2026 for a full day focused on growth, execution, and real-world scaling. Learn from founders and investors who have shaped the industry. Connect with peers navigating similar growth stages. Walk away with tactics you can apply immediately Offer ends March 13.
“Because we’re aggregating millions of reports, the Groundsource data set actually helps rebalance the map,” Juliet Rothenberg, a program manager on Google’s Resilience team, told reporters this week. “It enables us to extrapolate to other regions where there isn’t as much information.”
Rothenberg said the team hopes that using LLMs to develop quantitative data sets from written, qualitative sources could be applied to efforts to building data sets about other ephemeral-but-important-to-forecast phenomena, like heat waves and mud slides.
Marshall Moutenot, the CEO of Upstream Tech, a company that uses similar deep learning models to forecast river flows for customers like hydropower companies, said Google’s contribution is part of a growing effort to assemble data for deep learning-based weather forecasting models. Moutenot co-founded dynamical.org, a group curating a collection of machine learning-ready weather data for researchers and startups.
“Data scarcity is one of the most difficult challenges in geophysics,” Moutenot said. “Simultaneously, there’s too much Earth data, and then when you want to evaluate against truth, there’s not enough. This was a really creative approach to get that data.”
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み