コンピュータビジョンによる魚類モニタリングの市民科学の強化
MITなどの研究チームは、渡り魚の個体数減少問題に対し、水中ビデオとコンピュータビジョンを用いた自動カウントシステムを開発し、従来の市民科学ボランティアによる目視カウントを補完する手法を提案した。
キーポイント
従来手法の課題
渡り魚の個体数監視は、時間・環境条件・労働集約性に制約されるボランティアによる目視カウントが主流で、夜間や短時間の大量移動を捕捉できず、データの連続性と精度に限界があった。
新手法の提案
研究チームは、水中カメラで撮影したビデオに、物体検出・追跡・種分類などのコンピュータビジョンと深層学習を適用するエンドツーエンドの自動化パイプラインを構築し、魚の自動カウントを実現した。
実用性と拡張性
このシステムは、スケーラブルでコスト効率が高く、効率的な自動監視ソリューションとして、保全活動や漁業管理の意思決定を支援する信頼性の高いデータを提供することを目指している。
学術的成果
研究成果は、査読付き学術誌『Remote Sensing in Ecology and Conservation』に2025年2月に掲載され、オープンアクセス論文として公開されている。
影響分析・編集コメントを表示
影響分析
この研究は、AI技術が環境保全や生物多様性モニタリングといった社会的課題の解決に直接貢献する実例を示しており、持続可能な開発目標(SDGs)への技術的アプローチとして注目される。従来の人手に依存する市民科学プロジェクトに、自動化とデータ品質向上をもたらす可能性を開く。
編集コメント
AIの社会実装として、環境保全という具体的な公益分野での応用例を詳細に報告している点が評価できる。技術の新規性よりも、既存技術の実問題への適応と実用化プロセスに焦点が当てられている。
毎年春になると、リバーヘリングの個体群はマサチューセッツ州の沿岸水域から移動を開始し、河川を遡上して淡水の産卵地へ向かう年次の旅を始める。リバーヘリングは過去数十年間にわたり個体数の急激な減少に直面しており、その移動はこの地域全体で、主に伝統的な目視計数とボランティアベースのプログラムを通じて広範にモニタリングされている。
魚類の移動をモニタリングし、個体群動態を理解することは、保全活動の指針とし、漁業管理を支援するために不可欠である。今月から始まる年次的なヘリングの遡上に伴い、研究者と資源管理者は再び、移動する魚の個体数を可能な限り正確に計数・推定するという課題に取り組んでいる。
ウッドウェル気候研究センター、MITシーグラント、MITコンピュータ科学・人工知能研究所(CSAIL)、MITリンカーン研究所、およびインテュイットの研究者チームは、市民科学活動を補完するため、水中ビデオとコンピュータビジョンを用いた新しいモニタリング手法を検討した。ウッドウェル気候研究センターのZhongqi ChenとLinda Deegan、MITシーグラントのRobert VincentとKevin Bennett、MIT CSAILのSara BeeryとTimm Haucke、インテュイットのAustin Powell、MITリンカーン研究所のLydia Zuehsowからなる研究者らは、この研究を説明する論文を今年2月に学術誌『Remote Sensing in Ecology and Conservation』に発表した。
オープンアクセスの論文「From snapshots to continuous estimates: Augmenting citizen science with computer vision for fish monitoring」(スナップショットから連続的推定へ:コンピュータビジョンによる魚類モニタリングの市民科学への統合)は、物体検出と追跡から種分類に至る最近のコンピュータビジョンとディープラーニングの進歩が、効率とデータ品質を向上させた魚類の自動計数に向けた現実的な解決策を提供する可能性を概説している。
従来のモニタリング手法は、時間、環境条件、労力の面で制約がある。ボランティアによる目視計数は短い日中サンプリング時間に限られ、夜間の移動や、数分間に数百匹の魚が通過するような短い移動のピークを見逃している。受動音響モニタリングやイメージングソナーなどの技術は特定条件下での連続的な魚類モニタリングを発展させてきたが、最も有望で低コストな選択肢である水中ビデオの手動レビューは依然として労力と時間を要する。自動化されたビデオ処理ソリューションへの需要が高まる中、本研究は信頼性の高い自動魚類モニタリングのための、拡張性があり、費用対効果が高く、効率的なディープラーニングベースのシステムを提示している。
チームは、現場の水中カメラからビデオラベリングとモデルトレーニングまでのエンドツーエンドパイプラインを構築し、コンピュータビジョンによる自動魚類計数を実現した。ビデオはマサチューセッツ州の3つの河川、ファルマスのクーナメセット川、イプスウィッチのイプスウィッチ川、マシュピーのサントゥイット川から収集された。
トレーニングデータセットを準備するため、チームは照明、水の透明度、魚種と密度、時刻、季節に変化のあるビデオクリップを選択し、コンピュータビジョンモデルが多様な現実のシナリオで確実に機能することを保証した。彼らはオープンソースのウェブプラットフォームを用い、魚の移動を追跡するためバウンディングボックスでビデオをフレームごとに手動でラベル付けした。合計で1,435のビデオクリップにラベルを付け、59,850フレームに注釈を付けた。
研究者らは、コンピュータビジョンによる計数結果を、人間によるビデオレビュー、川辺での目視計数、および受動型統合トランスポンダ(PIT)タギングのデータと比較・検証した。その結果、多様な複数地点・複数年のデータでトレーニングされたモデルが最も優れた性能を発揮し、従来確立された推定値と一致する、季節全体にわたる高解像度の計数を生成すると結論付けた。さらに一歩進んで、このシステムは環境要因に関連する移動行動、タイミング、移動パターンに関する洞察を提供した。2024年のクーナメセット川の遡上で撮影されたビデオを用いたシステムは、42,510匹のリバーヘリングを計数し、上流への移動は夜明けにピークに達する一方、下流への移動は主に夜間に行われ、魚が捕食者を避けるために暗く静かな時間帯を利用していることを明らかにした。
この実地応用を通じて、研究者らは漁業管理におけるコンピュータビジョンの発展を目指し、幅広い水棲生物種の保全活動にこの技術を統合するための枠組みとベストプラクティスを提供したいと考えている。「MITシーグラントはこのテーマに関する研究を以前から資金支援しており、Zhongqi Chenと同僚によるこの優れた研究は漁業モニタリング能力を向上させ、漁業管理者と保全団体のための魚類個体群評価を改善するでしょう」とVincentは述べる。「また、学生、一般市民、市民科学グループに対して、沿岸の生態学的・文化的に重要なリバーヘリングの個体群を支援するための教育と訓練を提供するでしょう。」
それでも、漁業管理機関が自動計数システムを完全に導入するまで、長期的なデータセットの一貫性を維持するためには、従来のモニタリングの継続が不可欠である。たとえ導入後も、コンピュータビジョンと市民科学は補完的とみなされるべきだろう。ボランティアはカメラのメンテナンスや、ビデオ注釈からモデル検証に至るコンピュータビジョンのワークフローに直接貢献するために必要となる。研究者らは、市民による観察とコンピュータビジョンが生成するデータを統合することが、環境モニタリングに対するより包括的で全体的なアプローチの構築に寄与すると考えている。
この研究はMITシーグラントによって資金提供され、追加的な支援は北東気候適応科学センター、MITアブドゥル・ラティフ・ジャミール水・食料システムシードグラント、AI・生物多様性変動グローバルセンター(米国国立科学財団とカナダ自然科学・工学研究評議会の支援による)、およびMIT学部研究機会プログラムによって提供された。
原文を表示
Each spring, river herring populations migrate from Massachusetts coastal waters to begin their annual journey up rivers and streams to freshwater spawning habitat. River herring have faced severe population declines over the past several decades, and their migration is extensively monitored across the region, primarily through traditional visual counting and volunteer-based programs.
Monitoring fish movement and understanding population dynamics are essential for informing conservation efforts and supporting fisheries management. With the annual herring run getting underway this month, researchers and resource managers once again take on the challenge of counting and estimating the migrating fish population as accurately as possible.
A team of researchers from the Woodwell Climate Research Center, MIT Sea Grant, the MIT Computer Science and Artificial Intelligence Lab (CSAIL), MIT Lincoln Laboratory, and Intuit explored a new monitoring method using underwater video and computer vision to supplement citizen science efforts. The researchers — Zhongqi Chen and Linda Deegan from the Woodwell Climate Research Center, Robert Vincent and Kevin Bennett from MIT Sea Grant, Sara Beery and Timm Haucke from MIT CSAIL, Austin Powell from Intuit, and Lydia Zuehsow from MIT Lincoln Laboratory — published a paper describing this work in the journal* Remote Sensing in Ecology and Conservation* this February.
The open-access paper, “From snapshots to continuous estimates: Augmenting citizen science with computer vision for fish monitoring,” outlines how recent advancements in computer vision and deep learning, from object detection and tracking to species classification, offer promising real-world solutions for automating fish counting with improved efficiency and data quality.
Traditional monitoring methods are constrained by time, environmental conditions, and labor intensity. Volunteer visual counts are limited to brief daytime sampling windows, missing nighttime movement and short migration pulses, when hundreds of fish pass by within the span of a few minutes. While technologies like passive acoustic monitoring and imaging sonar have advanced continuous fish monitoring under certain conditions, the most promising and low-cost option — manual review of underwater video — is still labor-intensive and time-consuming. With the growing demand for automated video processing solutions, this study presents a scalable, cost-effective, and efficient deep learning-based system for reliable automated fish monitoring.
The team built an end-to-end pipeline — from in-field underwater cameras to video labeling and model training — to achieve automated, computer vision-powered fish counting. Videos were collected from three rivers in Massachusetts: the Coonamessett River in Falmouth, the Ipswich River (Ipswich), and the Santuit River in Mashpee.
To prepare the training dataset, the team selected video clips with variations in lighting, water clarity, fish species and density, time of day, and season to ensure that the computer vision model would work reliably across diverse real-world scenarios. They used an open-source web platform to manually label the videos frame-by-frame with bounding boxes to track fish movement. In total, they labeled 1,435 video clips and annotated 59,850 frames.
The researchers compared and validated the computer vision counts with human video reviews, stream-side visual counts, and data from passive integrated transponder (PIT) tagging. They concluded that models trained on diverse multi-site and multi-year data performed best and produced season-long, high-resolution counts consistent with traditionally established estimates. Going one step further, the system provided insights into migration behavior, timing, and movement patterns linked to environmental factors. Using video from the 2024 Coonamesset River migration, the system counted 42,510 river herring and revealed that upstream migration peaked at dawn, while downstream migration was largely nocturnal, with fish utilizing darker, quieter periods to avoid predators.
With this real-world application, the researchers aim to advance computer vision in fisheries management and provide a framework and best practices for integrating the technology into conservation efforts for a wide range of aquatic species. “MIT Sea Grant has been funding work on this topic for some time now, and this excellent work by Zhongqi Chen and colleagues will advance fisheries monitoring capabilities and improve fish population assessments for fisheries managers and conservation groups,” Vincent says. “It will also provide education and training for students, the public, and citizen science groups in support of the ecologically and culturally important river herring populations along our coasts.”
Still, continued traditional monitoring is essential for maintaining consistency in long-term datasets until fisheries management agencies fully implement automated counting systems. Even then, computer vision and citizen science should be seen as complementary. Volunteers will be necessary for camera maintenance and for contributing directly to the computer vision workflow, from video annotation to model verification. The researchers envision that integrating citizen observations and computer vision-generated data will help create a more comprehensive and holistic approach to environmental monitoring.
This work was funded by MIT Sea Grant, with additional support provided by the Northeast Climate Adaptation Science Center, an MIT Abdul Latif Jameel Water and Food Systems seed grant, the AI and Biodiversity Change Global Center (supported by the National Science Foundation and the Natural Sciences and Engineering Research Council of Canada), and the MIT Undergraduate Research Opportunities Program.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み