AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Allen AI (AI2)·2026年4月23日 17:00·約11分で読める

OlmoEarth埋め込みの紹介:下流分析用のカスタム埋め込みエクスポート

#Earth Observation#Embeddings#Allen AI#Foundation Models#Computer Vision
TL;DR

Allen AIは、OlmoEarth Studioにおいて地球観測ファウンデーションモデルからのカスタム埋め込みエクスポート機能を公開し、類似性検索や変化検出などのダウンストリーム分析を可能にした。

AI深層分析2026年4月27日 00:30
3
注目/ 5段階
深度40%
4
関連度30%
3
実用性20%
4
革新性10%
3

キーポイント

1

カスタム埋め込みエクスポート機能の提供

OlmoEarth Studioを通じて、ユーザーはOlmoEarthファウンデーションモデルからカスタム地球観測埋め込みをエクスポートできるようになった。

2

多様なダウンストリームタスクへの適用

エクスポートされた埋め込みは、類似性検索、few-shotマッピング、変化検出、および教師なし探索などの多様な分析タスクに利用可能である。

3

分析プロセスの柔軟性向上

モデル内部での処理だけでなく、外部ツールや独自アルゴリズムとの連携を容易にし、分析の自由度と応用範囲を拡大する。

影響分析・編集コメントを表示

影響分析

この発表は、地球観測分野におけるAIモデルの「ブラックボックス化」を緩和し、分析結果の透明性と再利用性を高める重要なステップである。特に、大規模データの処理コストを抑えつつ、特定のユースケースに最適化した分析パイプラインを構築できるため、気候変動モニタリングや都市計画などの実務現場でのAI導入障壁を下げる貢献が期待される。

編集コメント

モデルの出力である埋め込みベクトルをエクスポート可能にするのは、AIエコシステムにおける「レゴブロック化」の動きであり、開発者が独自の分析ロジックを組み立てやすくなる点で意義深い。

2026年4月23日

Patrick Johnson、Favyen Bastani、Gabriel Tseng、Chris Wilhelm、Joseph Redmon、Hunter Pitelka、Patrick Beukema、Mike Jacobi、Hadrien Sablon - Ai2

技術報告書 ドキュメント OlmoEarthについて詳しくはこちら

地球観測モデルの構築を支援する当社のプラットフォームOlmoEarth Studioでは、オープンソースの基盤モデルOlmoEarthによって生成された地球観測データのコンパクトな数値表現である埋め込みベクトル(embedding vectors)の計算とエクスポートが可能になりました。ソースコードとモデルの重みは、研究論文とともに一般公開されており、コミュニティはこれらの埋め込みがどのように生成されるかを正確に確認することができます。

埋め込みベクトルは、OlmoEarthの活用に対する高速かつ費用対効果の高い入り口です。これらは、類似性検索からセグメンテーション、教師なし探索に至るまで、幅広い下流タスクをサポートします。表面特性が類似する場所は同じようなベクトルになり、異なる場所のものは遠く離れた位置に配置されます。OlmoEarthの埋め込みベクトルは、当社のベンチマークおよび独立した評価において優れたパフォーマンスを示しています。エクスポートされたCloud-Optimized GeoTIFFs (COGs) は軽量で共有が容易です。Studio UIまたはAPIを通じて、関心のある領域、時間範囲、エンコーダーのバリエーション、解像度、画像ソースを選択するだけで、自由に活用できるCOGを取得できます。もしアプリケーションでより高いパフォーマンスが必要であれば、Studioは教師ありファインチューニング (SFT)もサポートしています。

カスタム計算された埋め込みベクトルは、OlmoEarth Studioのユーザーに対して現在利用可能です。アクセス権限を取得したい場合はお問い合わせください。公開されているOlmoEarthモデルを使用してご自身で埋め込みベクトルを計算するための手順はこちらでご覧いただけます。

Studioでの埋め込みベクトルの計算

Studioにおける埋め込みベクトルの計算は、他の予測タスクと同じワークフローに従います。まずモデルを構成して実行し、その後結果をダウンロードします。出力を調整するいくつかのパラメータがあります:

  • 関心領域:任意のポリゴンを描画またはアップロード;Studio が画像取得とタイル処理を行います。
  • 時間範囲:1〜12ヶ月分。
  • エンコーダーのバリエーション:Nano(128次元、140万パラメータ)、Tiny(192次元、620万パラメータ)、または Base(768次元、8900万パラメータ)。
  • 空間解像度:1ピクセルあたり10メートル、20メートル、40メートル、または80メートル。
  • 画像ソース:Sentinel-2 L2A、Sentinel-1 RTC、または両方。

Studio は、埋め込み次元ごとに1バンドを持つ COG(Cloud Optimized GeoTIFF)を提供します。ベクトルは符号付き8ビット整数(int8)として保存されます。値の範囲は -127 から +127 までで、-128 はノデータ(nodata)用に予約されています。浮動小数点ベクトルを取得するには、olmoearth_pretrain の dequantize_embeddings を参照してください。

すべての計算が事前計算されたグローバルアーカイブからデータを取得するのではなくオンデマンドで行われるため、あなたの埋め込みはあなたが関心を持つ条件を正確に反映します。年間スナップショットだけでなく、季節的な動態を捉えるために月次埋め込みを生成することも可能です。

OlmoEarth 埋め込みでできること

以下の例はすべて、40メートル解像度の OlmoEarth-v1-Tiny(192次元)埋め込みと Sentinel-2 L2A 合成画像を使用しています(ほとんどの例では年間、変化検出では月次)。Tiny は軽量なエンコーダーですが、依然として高いパフォーマンスを発揮します。独自のアプリケーションでは、計算量とストレージのコストを引き換えにより大きなバリエーションに切り替えることができます。

類似度検索:「これに似たもの」を見つける

クエリピクセルを選択し、その埋め込み(embedding)を抽出して、他のすべてのピクセルとのコサイン類似度を計算します。その結果は、クエリピクルと景観が最も似ている場所と最も異なる場所を示すヒートマップになります。

このクエリはカリフォルニア州のメルセド市街地の近くに位置しています。都市部や道路廊下が明確に浮き上がり、農地は暗いままです。このモデルは、ラベルなしで建築用地と農地を区別します。

クエリを小さな農業用ウィンドウに切り替えると、そのウィンドウ内の埋め込みベクトルの平均をクエリベクトルとして定義し、最も類似度が高く、および低く類似度が低い場所のSentinel-2画像を取得して、モデルが何を似ているものとして、また異なるものとして扱っているかを確認します。

最も類似度が高いパッチ(0.89以上)はすべて、灌漑された畑を持つ農地です。最も類似度が低いもの(ほぼゼロ)は、周囲に裸地がある空港、乾燥した地形を持つ貯水池、そして乾燥した牧草地です。トレーニングデータもラベルもなく、埋め込み空間における内積のみが行われます。

フューショットセグメンテーション:景観のラベリング

類似度検索は「どこがこれに似ているか」を教えてくれますが、時には領域全体に離散ラベルが必要な場合があります。表現力がすでに豊かであるため、単純な線形分類器を用いて、非常に少ないラベル付きピクルから壁から壁までの土地被覆マップを生成できます。

これを実証するため、ベトナムのカマウ(Ca Mau)、沿岸のマングローブ地域において、わずか60ピクセル(各クラス20ピクセル)にラベル付けを行いました。ラベルソースとしてESA WorldCover 2021を使用し、マングローブ、水域、その他の3つのクラスについて、各クラスからランダムに20ピクセルをサンプリングし、特徴量ごとの標準化を行ったロジスティック回帰(logistic regression)を学習させ、地域内の全ピクセルを予測しました。

60個のラベル付きピクセルから、分類器は重み付けF1スコア(weighted F1)0.84の整合性の高いマップを生成しました。マングローブ林、潮汐水路、開水域が地域全体にわたって明確に区別されています。この分類器は急速に収束します:ラベル数を30から300に増やしても精度はほとんど変化しません。これは、埋め込み(embeddings)が大部分の重労働を担っているためです。

分析の中核は、以下の数行のPythonコードです:

import rasterio

import numpy as np

from sklearn.pipeline import make_pipeline

from sklearn.preprocessing import StandardScaler

from sklearn.linear_model import LogisticRegression

Studioからエクスポートされた192バンドの埋め込みCOGを読み込む

with rasterio.open("embeddings.tif") as ds:

emb = ds.read().astype(np.float32) # (192, H, W)

C, H, W = emb.shape

X = emb.reshape(C, -1).T # (H*W, 192)

ラベル付きピクセルで学習し、全域を予測する

clf = make_pipeline(StandardScaler(), LogisticRegression(max_iter=2000))

clf.fit(X[train_idx], labels[train_idx])

prediction = clf.predict(X).reshape(H, W)

これは*線形プローブ*であり、ファウンデーションモデルの標準的な評価手法です。192次元のロジスティック回帰という単純なモデルが、極めて少ないラベルから土地被覆の境界を復元できるということは、Tinyエンコーダーが事前学習段階でこれらの生態学的な差異を整理・表現できていることを意味します。より大きなバリエーション(Base、768次元)は、さらに豊かな表現をエンコードします。

もし地面真値のポリゴン、現地調査のポイント、あるいは既存の大まかな地図をお持ちであれば、同様の分類器を学習させて、関心のある領域に対して全域のマップを作成することができます。

変化検出:何が変わったかを見極める

Studioは任意の時間解像度(月次から年次まで)で埋め込みを生成できるため、2つの時期を直接比較して地表状態が変化した箇所を特定できます。以下では、2023年9月と2024年9月の同一地域について月次Sentinel-2埋め込みを計算し、ピクセルごとのコサイン距離を測定しました。カリフォルニア州バット郡のパーク火災(2024年7月〜9月)による焼失跡地が、すぐに明確に浮き上がります。

ラベルも学習も不要です。埋め込みCOG(Cloud Optimized GeoTIFF)を2つ用意し、数行のPythonコードを実行するだけです。

教師なし探索:モデルが何を見ているか

クエリ地点や参照ラベルがない場合もあります。 embeddings に存在する構造を理解したいだけです。主成分分析(Principal Component Analysis, PCA)は、これを明確に行う方法です:3次元に削減し、R/G/B にマッピングして、偽カラー画像として表示します。類似した embeddings は自動的に類似した色になります。

オランダのフェルボラントは、規則的な農地パッチのグリッドを持つ干拓地の風景です。PCA による偽カラー画像は、高い忠実度でこれらの境界を再現しています。異なる作物の種類、水域、都市地域はそれぞれ明確な色調を与えられます。この embedding は、パッチや作物が何であるかを教えられることなく、景観の構造を内部化しています。

この種の教師なしビューは、関心のある領域全体でモデルがどのような構造を拾い上げたかを確認する迅速な方法です。

エクスポートから洞察へ

類似度検索、フューショットセグメンテーション、変化検出、PCA 探索は、標準的なラスターデータに対する単純な操作であり、数秒で実行されます。その力は embeddings にあります:地球観測データを圧縮し、多数のセンサーと数百万のトレーニング例から各場所に関する豊富な情報を捉えるベクトルに変換した学習された表現です。

カスタム埋め込みエクスポートが利用可能になりました。プロジェクトを作成し、埋め込みモデルを設定して埋め込みの計算を行ってください。エクスポートされた GeoTIFF は、QGIS、GDAL、rasterio、または独自のスクリプトなど、あらゆる地理空間ツールと互換性があります。本記事の例を再現するエンドツーエンドのコードについては、similarity search、few-shot segmentation、change detection、PCA visualization の動作コードを含む embeddings tutorial を参照してください。ローカル環境のセットアップなしで実際に試したい場合は、Colab notebook をお試しください。

さらに先へ:ファインチューニング

この投稿の例はすべて、タスク固有の学習を行わない凍結埋め込み(frozen embeddings)を使用しています。埋め込みは、OlmoEarthを活用するための優れた入り口です。これにより、高速かつ費用対効果の高い結果の生成が可能になり、リソースが限られた環境でも良好に動作し、共有も容易です。より高いパフォーマンスが必要なアプリケーションの場合、OlmoEarth StudioはSFT(Supervised Fine-Tuning:教師ありファインチューニング)にも対応しており、独自のラベルに基づいてタスク固有のモデルヘッドを学習させることができます。これは通常、凍結された特徴量に対する線形プローブよりも優れたパフォーマンスを発揮します。

制限事項

私たちは常に事前学習のアプローチを改善していますが、上記で説明した手法のいくつかを使用して、ユースケースにおける埋め込みの品質を確認することが重要です。パフォーマンスは入力画像データの品質にも依存します。継続的な雲の被覆、大気アーティファクト、または合成期間中の観測データの欠如は、生成されるベクトルに影響を与える可能性があります。

*欧州宇宙機関(ESA)のSentinel-2 L2A画像データはMicrosoft Planetary Computer経由で取得しました。マングローブの参照データにはESA WorldCover 2021 v200を使用しました。グローバルなクラスタリング可視化には、OlmoEarth-v1-Base(768次元)を使用し、季節ごとのSentinel-2合成画像をパッチサイズ8で、1.1M件の事前学習サンプル全体に対してインスタンスレベルの埋め込みを適用しています。*

最新のAi2ニュースに関する月次アップデートを受け取るには、購読してください。

原文を表示

April 23, 2026

Patrick Johnson, Favyen Bastani, Gabriel Tseng, Chris Wilhelm, Joseph Redmon, Hunter Pitelka, Patrick Beukema, Mike Jacobi, and Hadrien Sablon - Ai2

Tech ReportDocumentationLearn more about OlmoEarth

OlmoEarth Studio, our platform for building Earth observation models, now lets you compute and export embedding vectors—compact numerical representations of Earth-observation data produced by our open source OlmoEarth foundation models. The source code and model weights are publicly available alongside the research paper, so the community can inspect exactly how these embeddings are generated.

Embeddings are a fast, cost-effective entry point for leveraging OlmoEarth: they support a wide range of downstream tasks, from similarity search to segmentation to unsupervised exploration. Locations with similar surface characteristics end up with similar vectors; locations that differ land far apart. OlmoEarth embeddings have shown strong performance in our own benchmarking and in independent evaluations. The exported Cloud-Optimized GeoTIFFs (COGs) are lightweight and easy to share. Choose your area of interest, time range, encoder variant, resolution, and imagery sources via the Studio UI or API, and get back a COG you can use however you like. If your application requires higher performance, Studio also supports supervised fine-tuning (SFT).

Custom-computed embeddings are now available for users of OlmoEarth Studio. Reach out if you're interested in gaining access. Instructions for using the publicly available OlmoEarth models to compute your own embeddings are available here.

Computing embeddings in Studio

Computing embeddings follows the same workflow as any other prediction in Studio. First configure a model and run it, and then download the results. Several parameters tailor the output:

  • Area of interest: Draw or upload any polygon; Studio handles imagery acquisition and tiling.
  • Time span: 1-12 monthly periods.
  • Encoder variant: Nano (128-dim, 1.4M params), Tiny (192-dim, 6.2M params), or Base (768-dim, 89M params).
  • Spatial resolution: 10 meter, 20 meter, 40 meter, or 80 meter per pixel.
  • Imagery sources: Sentinel-2 L2A, Sentinel-1 RTC, or both.

Studio delivers a COG with one band per embedding dimension. Vectors are stored as signed 8-bit integers (int8). Values range from -127 to +127, with -128 reserved for nodata. To recover floating-point vectors, see dequantize_embeddings in olmoearth_pretrain.

Because everything is computed on demand rather than pulled from a pre-computed global archive, your embeddings reflect exactly the conditions you care about. You can generate monthly embeddings to capture seasonal dynamics, not just annual snapshots.

What you can do with OlmoEarth embeddings

The examples below all use OlmoEarth-v1-Tiny (192-dim) embeddings at 40-meter resolution with Sentinel-2 L2A composites (annual for most examples; monthly for change detection). Tiny is a lightweight encoder but still highly performant; for your own applications, you can swap it for a larger variant at the cost of higher compute and storage.

Similarity search: Finding "more like this"

Pick a query pixel, extract its embedding, and compute cosine similarity against every other pixel. The result is a heatmap showing where the landscape looks most and least like your query pixel.

This query sits near the Merced urban center in California. Urban fabric and road corridors light up coherently while agricultural parcels stay dark. The model distinguishes built-up surfaces from cropland without any labels.

Switching the query to a small agricultural window, we define the query vector as the mean of the embedding vectors over that window, then pull Sentinel-2 imagery at the highest- and lowest-similarity locations to see what the model treats as similar and dissimilar.

The most similar patches (0.89 and above) are all agricultural parcels with irrigated fields. The least similar (around zero) are an airport with surrounding bare ground, a reservoir with dry terrain, and arid rangeland. No training data, no labels, just a dot product in embedding space.

Few-shot segmentation: Labeling the landscape

Similarity search tells you "where is it like this?" but sometimes you need discrete labels across a region. Because the representations are already rich, a simple linear classifier can produce a wall-to-wall land-cover map from very few labeled pixels.

To test this, we labeled just *60 pixels* (20 per class) over Ca Mau, Vietnam, a coastal mangrove region. Using ESA WorldCover 2021 as the label source for three classes (mangrove, water, other), we randomly sampled 20 pixels per class, trained a logistic regression with per-feature standardization, and predicted every pixel in the region.

From 60 labeled pixels, the classifier produces a coherent map with *weighted F1 = 0.84*. Mangrove stands, tidal channels, and open water are delineated across the entire region. The classifier saturates quickly: increasing from 30 to 300 labels barely changes accuracy, because the embeddings are doing most of the heavy lifting.

The core of the analysis is a few lines of Python:

code
import rasterio
import numpy as np
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression

# Load the 192-band embedding COG exported from Studio
with rasterio.open("embeddings.tif") as ds:
    emb = ds.read().astype(np.float32)  # (192, H, W)

C, H, W = emb.shape
X = emb.reshape(C, -1).T  # (H*W, 192)

# Train on labeled pixels, predict everywhere
clf = make_pipeline(StandardScaler(), LogisticRegression(max_iter=2000))
clf.fit(X[train_idx], labels[train_idx])
prediction = clf.predict(X).reshape(H, W)

This is a *linear probe*, a standard evaluation for foundation models. The fact that a logistic regression over 192 dimensions recovers land-cover boundaries from so few labels means the Tiny encoder has organized these ecological distinctions during pretraining. Larger variants (Base, 768-dim) encode even richer representations.

If you have ground-truth polygons, field survey points, or a coarse existing map, you can train a similar classifier and produce a wall-to-wall map for your own region of interest.

Change detection: Spotting what shifted

Because Studio can generate embeddings at any temporal resolution (monthly through annual), you can compare two time periods directly to identify where surface conditions have changed. Below, we computed monthly Sentinel-2 embeddings for the same region in September 2023 and September 2024 and measured per-pixel cosine distance. The Park Fire (July-September 2024) burn scar in Butte County, California lights up immediately.

No labels or training required—just two embedding COGs and a few lines of Python.

Unsupervised exploration: Seeing what the model sees

Sometimes you have no query location or reference labels. You just want to understand what structure exists in the embeddings. Principal Component Analysis (PCA) is a clean way to do this: reduce to three dimensions, map to R/G/B, and display as a false-color image. Similar embeddings get similar colors automatically.

Flevoland, in the Netherlands, is a reclaimed polder landscape with a regular grid of agricultural parcels. The PCA false-color image reproduces those boundaries with high fidelity. Different crop types, water bodies, and urban areas each get distinct hues. The embedding has internalized landscape structure without ever being told what a parcel or crop is.

This kind of unsupervised view is a quick way to see what structure the model has picked up across your area of interest.

From export to insight

Similarity search, few-shot segmentation, change detection, and PCA exploration are simple operations on standard raster data that run in seconds. The power comes from the embeddings: learned representations that compress earth observation data into vectors capturing rich information about each location from many sensors and millions of training examples.

Custom embedding exports are available now. Create a project, configure an embeddings model, and compute your embeddings. The exported GeoTIFF works with any geospatial tool: QGIS, GDAL, rasterio, or your own scripts. For end-to-end code reproducing the examples in this post, see the embeddings tutorial, which includes working code for similarity search, few-shot segmentation, change detection, and PCA visualization. To get hands-on without any local setup, try the Colab notebook.

Going further: fine-tuning

The examples in this post all use frozen embeddings with no task-specific training. Embeddings are a great entry point for leveraging OlmoEarth: they enable fast, cost-effective generation of results, work well in resource-constrained environments, and are easy to share. For applications that require higher performance, OlmoEarth Studio also supports SFT, training a task-specific model head on your own labels, which typically outperforms linear probes on frozen features.

Limitations

While we are always working to improve our pretraining approaches, it's important to check the quality of the embeddings for your use case using some of the techniques described above. Performance also depends on the quality of the input imagery—persistent cloud cover, atmospheric artifacts, or missing observations in the composite period can affect the resulting vectors.

*Sentinel-2 L2A imagery from the European Space Agency, accessed via Microsoft Planetary Computer. ESA WorldCover 2021 v200 for mangrove reference. The global clustering visualization uses OlmoEarth-v1-Base (768-dim) with seasonal Sentinel-2 composites at patch size 8, instance-level embeddings over 1.1M pretraining samples.*

Subscribe to receive monthly updates about the latest Ai2 news.

この記事をシェア

関連記事

Allen AI (AI2)★42026年5月19日 17:00

OlmoEarth v1.1:より効率的なリモートセンシングモデルファミリーの登場

Allen AI は、計算コストを最大 3 分の 1 に削減しつつ同等のパフォーマンスを維持する「OlmoEarth v1.1」を発表し、大規模衛星マッピングを高速化・低コスト化した。

Allen AI (AI2)★42026年5月13日 17:00

AI 気候モデルの相互比較プロジェクト「AIMIP」を発表

新オープンベンチマーク「AIMIP」が、AI 気候モデルが一部の歴史的指標で従来型モデルに匹敵または上回ることを示したが、長期的な温暖化傾向や未知のシナリオへの一般化には依然として課題がある。

TLDR AI★42026年5月11日 09:00

エキスパートモデルにおける突発的モジュール性の発見

アレンAIが、事前学習データから直接モジュール化されたエキスパート組織を学習する「EMO」を発表した。このモデルは、全性能を維持しつつタスク実行に必要となるエキスパート数を全体の12.5%に削減できる。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む