MicrosoftのBingチームが「Harrier」埋め込みモデルをオープンソース化
MicrosoftのBingチームは、多言語MTEB v2ベンチマークでトップ性能を達成し、100以上の言語をサポートする埋め込みモデル「Harrier」をオープンソース化した。
キーポイント
オープンソース化
MicrosoftのBingチームが埋め込みモデル「Harrier」をオープンソースとして公開した。
ベンチマーク性能
Harrierは多言語MTEB v2ベンチマークでトップ性能を達成している。
多言語サポート
100以上の言語をサポートする多言語埋め込みモデルである。
開発主体
Microsoftの検索エンジン「Bing」の開発チームによって開発された。
影響分析・編集コメントを表示
影響分析
この発表は、多言語AIモデルの民主化を加速させる重要な一歩となる。オープンソース化により、研究者や開発者が高性能な埋め込み技術を容易に利用できるようになり、グローバルなAIアプリケーション開発の障壁が低下する。
編集コメント
多言語AIの実用化に向けた重要なマイルストーン。オープンソース化により、中小企業や研究機関でも最先端の埋め込み技術を活用できる環境が整った。

MicrosoftのBingチームは、多言語MTEB v2ベンチマークで最高スコアを獲得し、100言語以上をサポートする埋め込みモデル「Harrier」をオープンソース化しました。
本記事「Microsoft's Bing team open-sources "Harrier" embedding model」は、The Decoderに最初に掲載されました。
原文を表示
Microsoft's Bing team (yes, really) has released "Harrier," an open-source embedding model. Harrier supports more than 100 languages, offers a 32,000-token context window, and was trained on over two billion examples plus synthetic data from GPT-5. According to the team, Harrier takes the top spot on the multilingual MTEB v2 benchmark and outperforms proprietary models from OpenAI and Amazon.
Rank (Borda)
Model
Zero-shot
Active Params (B)
Total Params (B)
Embedding Dim
Max Tokens
1
harrier-oss-v1-27b
78%
25.6
27.0
5376
131072
2
KaLM-Embedding-Gemma3-12B-2511
73%
10.8
11.8
3840
32768
3
llama-embed-nemotron-8b
99%
7.0
7.5
4096
32768
4
Qwen3-Embedding-8B
99%
6.9
7.6
4096
32768
5
gemini-embedding-001
99%
3072
2048
6
Qwen3-Embedding-4B
99%
3.6
4.0
2560
32768
7
Octen-Embedding-8B
99%
6.9
7.6
4096
32768
8
F2LLM-v2-14B
88%
13.2
14.0
5120
40960
9
F2LLM-v2-8B
88%
6.9
7.6
4096
40960
10
harrier-oss-v1-0.6b
78%
0.440
0.596
1024
32768
Alongside the full 27-billion-parameter model, the team released two smaller variants—0.6B and 270M—designed to run on less powerful hardware. All three models are available on Hugging Face under the MIT license. Going forward, the team plans to integrate the technology into Bing and into new grounding services for AI agents.
Embedding models handle the searching, retrieving, and organizing of information AI systems need for accurate answers. According to Microsoft, they're becoming increasingly critical as AI agents independently take on more complex, multi-step tasks.
AI News Without the Hype – Curated by Humans
Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.
Subscribe now
関連記事
マイクロソフトがAzure Copilot Migration Agentを発表、クラウド移行計画を加速
マイクロソフトは、Azureポータルに組み込まれたAIアシスタント「Azure Copilot Migration Agent」を発表した。このエージェントは、移行計画の自動化、エージェントレスなVMwareの検出、ランディングゾーンの作成を行う。ただし、移行の実行はできず、レプリケーションと切り替えは手動タスクのままである。
マイクロソフト、Copilot Coworkを拡大展開し、AIモデル同士の相互チェック機能を導入
マイクロソフトがCopilot Coworkを拡大展開し、AIアシスタントがワークフロー全体を自律的に処理できるようにした。また、複数のAIモデルが互いの作業をチェックする新機能も導入した。
マイクロソフト、Copilot Researcherに新たなAI機能を導入
マイクロソフトはCopilot Researcherに新たなAI機能を追加し、企業ワークフローの正確性と信頼性を向上させた。