AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月8日 01:38·約1分で読める

MicrosoftのBingチームが「Harrier」埋め込みモデルをオープンソース化

#埋め込みモデル#オープンソース#マルチリンガル#ベンチマーク#Microsoft#検索技術
TL;DR

MicrosoftのBingチームは、多言語MTEB v2ベンチマークでトップ性能を達成し、100以上の言語をサポートする埋め込みモデル「Harrier」をオープンソース化した。

AI深層分析2026年4月8日 02:41
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

オープンソース化

MicrosoftのBingチームが埋め込みモデル「Harrier」をオープンソースとして公開した。

2

ベンチマーク性能

Harrierは多言語MTEB v2ベンチマークでトップ性能を達成している。

3

多言語サポート

100以上の言語をサポートする多言語埋め込みモデルである。

4

開発主体

Microsoftの検索エンジン「Bing」の開発チームによって開発された。

影響分析・編集コメントを表示

影響分析

この発表は、多言語AIモデルの民主化を加速させる重要な一歩となる。オープンソース化により、研究者や開発者が高性能な埋め込み技術を容易に利用できるようになり、グローバルなAIアプリケーション開発の障壁が低下する。

編集コメント

多言語AIの実用化に向けた重要なマイルストーン。オープンソース化により、中小企業や研究機関でも最先端の埋め込み技術を活用できる環境が整った。

image
image

MicrosoftのBingチームは、多言語MTEB v2ベンチマークで最高スコアを獲得し、100言語以上をサポートする埋め込みモデル「Harrier」をオープンソース化しました。

本記事「Microsoft's Bing team open-sources "Harrier" embedding model」は、The Decoderに最初に掲載されました。

原文を表示

Microsoft's Bing team (yes, really) has released "Harrier," an open-source embedding model. Harrier supports more than 100 languages, offers a 32,000-token context window, and was trained on over two billion examples plus synthetic data from GPT-5. According to the team, Harrier takes the top spot on the multilingual MTEB v2 benchmark and outperforms proprietary models from OpenAI and Amazon.

Rank (Borda)

Model

Zero-shot

Active Params (B)

Total Params (B)

Embedding Dim

Max Tokens

1

harrier-oss-v1-27b

78%

25.6

27.0

5376

131072

2

KaLM-Embedding-Gemma3-12B-2511

73%

10.8

11.8

3840

32768

3

llama-embed-nemotron-8b

99%

7.0

7.5

4096

32768

4

Qwen3-Embedding-8B

99%

6.9

7.6

4096

32768

5

gemini-embedding-001

99%

3072

2048

6

Qwen3-Embedding-4B

99%

3.6

4.0

2560

32768

7

Octen-Embedding-8B

99%

6.9

7.6

4096

32768

8

F2LLM-v2-14B

88%

13.2

14.0

5120

40960

9

F2LLM-v2-8B

88%

6.9

7.6

4096

40960

10

harrier-oss-v1-0.6b

78%

0.440

0.596

1024

32768

Alongside the full 27-billion-parameter model, the team released two smaller variants—0.6B and 270M—designed to run on less powerful hardware. All three models are available on Hugging Face under the MIT license. Going forward, the team plans to integrate the technology into Bing and into new grounding services for AI agents.

Embedding models handle the searching, retrieving, and organizing of information AI systems need for accurate answers. According to Microsoft, they're becoming increasingly critical as AI agents independently take on more complex, multi-step tasks.

AI News Without the Hype – Curated by Humans

Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.

Subscribe now

この記事をシェア

関連記事

InfoQ★32026年3月29日 19:00

マイクロソフトがAzure Copilot Migration Agentを発表、クラウド移行計画を加速

マイクロソフトは、Azureポータルに組み込まれたAIアシスタント「Azure Copilot Migration Agent」を発表した。このエージェントは、移行計画の自動化、エージェントレスなVMwareの検出、ランディングゾーンの作成を行う。ただし、移行の実行はできず、レプリケーションと切り替えは手動タスクのままである。

The Decoder★42026年3月31日 01:07

マイクロソフト、Copilot Coworkを拡大展開し、AIモデル同士の相互チェック機能を導入

マイクロソフトがCopilot Coworkを拡大展開し、AIアシスタントがワークフロー全体を自律的に処理できるようにした。また、複数のAIモデルが互いの作業をチェックする新機能も導入した。

AI Business★32026年3月31日 04:33

マイクロソフト、Copilot Researcherに新たなAI機能を導入

マイクロソフトはCopilot Researcherに新たなAI機能を追加し、企業ワークフローの正確性と信頼性を向上させた。

ニュース一覧に戻る元記事を読む