AAIニュース
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業
AAIニュース

世界中のAI最新情報を日本語で。毎時自動収集・翻訳・要約。

コンテンツ

最新ニュースAI日報週報

分析

トレンド企業動画

サイト

についてRSSお問い合わせ
© 2026 ainew.jp — All rights reserved.特定商取引法に基づく表記
ニュース一覧元記事を開く
Allen AI (AI2)·2026年5月7日 17:00·約13分

設計思想としてオープン:Ai2 が NSF OMAI の完全な AI インフラを稼働

#Open Source AI#Research Infrastructure#OMAI#Scientific Discovery
TL;DR

Allen Institute for AI (AI2) は、NSF の OMAI インフラを活用し、再利用可能なモデルやデータを提供する完全オープンな AI 研究エコシステムを稼働させた。

AI深層分析2026年5月8日 00:05
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

OMAI インフラの稼働開始

National Science Foundation (NSF) の OMAI プロジェクトによる計算資源が正式にオンライン化され、大規模な AI 研究を支援する基盤となった。

2

オープンな研究エコシステムの構築

AI2 は国家投資を活用し、モデル、データ、手法、ツールをすべてオープンにして再利用可能にし、科学発見の加速を目指す。

3

再現性と透明性の向上

インフラと成果物を完全に公開することで、研究の再現性を高め、AI 分野における透明性のある開発環境を実現する。

影響分析・編集コメントを表示

影響分析

このニュースは、AI 研究における「ブラックボックス化」への対抗策として、国家レベルのインフラをオープンソース文化と融合させる重要な転換点を示しています。大規模計算資源へのアクセス障壁が下がることで、資金力のない研究者や小規模チームでも最先端の実験が可能になり、AI 分野全体のイノベーション速度が加速すると期待されます。

編集コメント

国家予算を基盤とした大規模計算資源が、いかにしてオープンな研究文化に還元されるかを示す象徴的な事例です。今後の AI 研究の民主化と加速に大きく寄与する動きと言えます。

2026 年 5 月 7 日

Ai2

オープンソースは科学の発見を推進します。実験の再現性、手法の検証、共有された成果物への積み上げといった能力は、研究が進展する仕組みにおいて常に中核的な役割を果たしてきました。そして AI の分野では、オープンなインフラストラクチャこそがこのエンジンを稼働させる鍵です。モデルの重み(weights)、トレーニングデータ、および手法へのアクセスがない場合、研究者たちはブラックボックスを調査するしかなくなります。今日、NSF(米国国立科学財団)、NVIDIA、Ai2 はこの状況を変えようとしています。

昨年、Ai2 は米国国立科学財団(NSF)と NVIDIA から、科学のためのオープン多モーダル AI インフラストラクチャ(Open Multimodal AI Infrastructure for Science: NSF OMAI)を構築するために 1 億 5,200 万ドルの助成金を受けました。今日、この投資が運用開始となります。

NVIDIA Blackwell Ultra を搭載したシステムの導入により、Ai2 は新たな計算リソースをオンライン化し、その利用方法における新しいモデルをもたらします。単一の独自システムを駆動するのではなく、このインフラストラクチャは完全なオープンエコシステムをサポートします。各トレーニング実行は他者によって再利用され、拡張され、さらに発展させることが可能になります。Ai2 の研究は、モデル、ツール、およびその背後にあるプロセスを完全にオープン化し、アクセス範囲を広げ、GPU 使用時間ごとのインパクトを最大化することで、インフラストラクチャからのリターンを最大限に引き出すように設計されています。

*「先進的な AI システムへのアクセスが少数の企業に集中する傾向が強まる中、このハードウェアインフラを稼働させることは、私たちにとって極めて重要な一歩です。NSF OMAI は、オープンなインフラに対する国家的投資であり、それが広範な研究者エコシステムに恩恵をもたらす実際的で利用可能な計算リソースへと変換されました。私たちの目標は、真にオープンな技術エコシステムを加速し、その波及効果を最大化することです。具体的には、AI 研究を強化し、米国がこの分野で引き続きリーダーシップを発揮できるよう支援する、完全なオープン性の AI システム、リソース、およびツールを開発していきます。」 — Noah A. Smith, NSF OMAI 主研究者、Ai2 シニア研究ディレクター***

インフラからインパクトへ

クローズドシステムでは、膨大な計算資源が組織外に流出することのない実験や反復、中間結果の生成に費やされることが多く、その結果として得られるのは商業目的で利用される単一の最終製品である AI モデルだけというケースが少なくありません。もし同じ計算資源をオープンな成果物の生成に充てるのであれば、トレーニング終了後も長期間にわたり価値を生み出し続けることになります。データ、チェックポイント、手法、さらには最終モデルそのものさえも、多くの下流アプリケーションで取り込まれて適応されることが可能となり、他の研究室はコストのかかる実験を繰り返すことなく、徹底的に文書化された教訓から学ぶことができます。

Ai2 の最近の内部研究 によると、場合によってはトレーニング作業の 82% が最終モデルではなく探索的な作業に費やされていると推定されています。この作業が共有されることで、各 GPU 時間は単一のリリースだけでなく、分野全体が参照できる蓄積された成果にも貢献します。その結果、大規模でクローズドな展開に必要な環境負荷(フットプリント)を必要とすることなく、同じリソースが時間とともにより多くのアイデア、アプリケーション、そして進展を支える乗数効果が生まれます。

この新しいクラスターはこうした哲学を反映しています。NVIDIA B300 システムを基盤に構築され、単なる規模の大きさではなく、その容量がいかに効果的に使用・共有されるかを重視しています。Cirrascale Cloud Services とのパートナーシップによって展開・管理されており、言語、マルチモーダル、科学分野における大規模トレーニングと継続的な実験の両方をサポートします。

この意味において、AI インフラへの投資対効果は成果だけで測れるものではなく、いかに多くのイノベーションを可能にするかという点で評価されるべきです。オープン性と再利用に焦点を当てることで、NSF OMAI は大規模でクローズドな展開に必要な環境負荷(フットプリント)を必要とすることなく、極めて大きなインパクトをもたらすように設計されています。

*「NSF OMAI は、高度な AI インフラストラクチャがより広範な研究コミュニティを支えることを確実にするという当機関のコミットメントを反映しています。オープンで共有されたリソースへの投資を通じて、私たちは多分野にわたる科学者や研究者が AI システムを構築し、テストし、再現し、検証し、さらに発展させることを可能にしています。この取り組みは発見を加速させ、再現性と透明性を通じた科学的厳密性を強化し、米国がこの分野におけるリーダーシップを維持・強化するものです。」 — Wendy Nilsen, NSF コンピュータ情報科学工学局 副局長***

*「科学の進展には、AI 研究をスケールさせ、その恩恵がグローバルなコミュニティ全体に広く行き渡ることを確保するためのアクセス可能なインフラストラクチャが必要です。NVIDIA Blackwell Ultra 上で NSF Open Multimodal AI Infrastructure プロジェクトクラスターの構築を実行することで、Ai2 は計算時間の影響を最大化する、極めて効率的でオープンなエコシステムを創出しています。」 — Jack Wells, NVIDIA 高等教育・研究コンピューティング担当ディレクター***

先を見据えて:オープンソース AI の未来を推進する

クラスタが稼働するとともに、Ai2 は言語およびマルチモーダル分野にわたる取り組みを統合し、複数のデータタイプとタスクをネイティブで処理できる統一アーキテクチャへの注力が高まっています。また、Ai2 は計画を立て、ツールを使用し、複雑な環境において自律的に行動するエージェントとして機能するモデルへの投資も継続しています。これらの取り組みの一部はすでに明らかになっており、Open Coding Agents ファミリーや MolmoWeb、ならびにトレーニング戦略や環境が信頼性の高いエージェント行動をどのように形成するかに関する継続的な研究などが含まれます。

これと並行して、Ai2 はトレーニングおよび評価のためのインフラストラクチャの改善にも投資しており、モデルの構築とベンチマークに使用されるシステムが研究のスケーラビリティに対応できるよう確保しています。

この取り組みの一環として、Olmo チームの研究員らは 科学コミュニティへのアウトリーチ を実施しており、Ai2 が次世代に提供するモデルがそのコミュニティにとって真に有用なものとなるよう努めています。これは、Ai2 が長年追求してきた基盤的かつ汎用的なモデルに関する取り組みの上に、新たな層を追加するものです。これらのプロジェクト全体を通じての方向性は、孤立したシステムへと向かうのではなく、一般的な AI 研究と科学発見の両方を支えることができるオープンで再利用可能なビルディングブロックへと向かっています。

*「Olmo チームの創設メンバーの一人として、科学のための完全オープン AI を推進し続けるこの重要な局面で Ai2 に戻ってきたことを嬉しく思います。今日私が目にするものは、Olmo プロジェクト開始当時の感覚と驚くほど対称的です——まだ織り合わされていない多様な研究の糸が待っている状態です。私たちは、新しいモデルアーキテクチャ、ネイティブなマルチモーダルモデル、大規模事前学習、強化学習(RL)といった分野で計画している研究の表面をようやく触り始めたばかりです。」 — Iz Beltagy, Olmo チーム リサーチリード、Ai2***

NSF OMAI を通じて支援された研究はすでに成果を生み出しています:

  • Molmo 2 は、Ai2 のマルチモーダルモデルファミリーに動画理解、ポインティング、オブジェクト追跡機能を追加し、8B パラメータのモデルが元の 72B モデルを主要なベンチマークで上回るとともに、高度な動画グラウンディング、複数画像グラウンディング、超高密度動画キャプション生成、自由形式の動画質問応答といったタスクをカバーする9つの新しいデータセットも公開されました。これらはすべて寛容なライセンスの下でリリースされています。
  • MolmoPoint は、テキスト座標出力に代わり、モデルの視覚特徴に直接紐づくトークンベースのグラウンディング機構を採用した新たなポインティングアーキテクチャを導入し、空間推論タスクにおいて最先端の精度を達成しました。
  • 言語モデリングの側面では、Olmo Hybrid がトランスフォーマーのアテンションと線形 RNN レイヤーを組み合わせた新アーキテクチャを実現し、先行モデルと同等の性能を維持しながらも、必要なトレーニングデータを大幅に削減。場合によっては約2倍の効率向上を果たしています。
  • エージェント型 AI においては、自己反省を伴うメタ強化学習の研究が進展しており、検索エージェントが過去の試行から学習する方法を改善。外部報酬モデルに依存せず、クロスエピソードでの反省を通じて探索能力を向上させています。

これら一連のプロジェクトは、NSF OMAI が Ai2 の言語モデリングプログラム全体で加速している研究の広範さを示すものであり、単なるモデルの生成にとどまらず、他のチームが検証・適応・発展可能なオープンな成果物(アーティファクト)を生み出しています。

Olmo 3 モデルフロー

事前学習

中間学習

長文コンテキスト

Olmo 3 Base

インストラクション SFT

インストラクション DPO

インストラクション RL

Olmo 3 Instruct

思考 SFT

思考 DPO

思考 RL

Olmo 3 ThinkRL Zero

Olmo 3 RL Zero

Olmo 3 モデルフロー

事前学習

中間学習

長文コンテキスト

Olmo 3 Base

インストラクション SFT

インストラクション DPO

インストラクション RL

Olmo 3 Instruct

思考 SFT

思考 DPO

思考 RL

Olmo 3 ThinkRL Zero

Olmo 3 RL Zero

モデルフローを探索する

各ステージをクリックすると、詳細情報やアーティファクトのダウンロードが可能です。

*上記のモデルフローは、事前学習および中間学習から長文コンテキストトレーニングを経て、インストラクション、思考、RL Zero の各バリアントに対するポストトレーニングブランチに至るまでの Olmo 3 ファミリーを追跡する方法を示しています。各ステージをクリックして詳細を確認し、アーティファクトをダウンロードしてください。

科学コミュニティへの恩恵は理論上の話ではありません。Olmo がリリースされて以来、この国中の研究者が言語モデルの科学を研究可能にするための基盤的な要素として不可欠な役割を果たしてきました。

*「Olmo は完全にオープンソースであるという点において、[私の研究] を独自に可能にしました。Olmo は、コミュニティが推論、バイアス、公平性、信頼性に関する根本的な問いを検証できる、オープンで信頼性の高いプラットフォームを提供します。商業的に最適化されたシステムが支配する現状において、Olmo は単なる応用ではなく、より深い理解を可能にする点で際立っています。」—— Yuan He 氏(オックスフォード大学元研究員)、「Supposedly Equivalent Facts That Aren't? Entity Frequency in Pre-training Induces Asymmetry in LLMs」の第一著者***

NSF OMAI は、最先端 AI の開発は必ずしもクローズドである必要はないという考えに対する国家的投資として始まりました。新しい計算リソースが稼働し始め、研究活動も Ai2 以外で既に活用されるようになり、本プロジェクトは次のフェーズへと移行しています。この段階では、オープンなインフラ上で生み出された成果が、設計上クローズドな取り組みでは不可能な形で複合的に積み上がっていくことになります。

NSF OMAI について

2025 年、Ai2 は米国国立科学財団(NSF)のミッドスケール研究インフラストラクチャプログラムを通じて共同契約を獲得し、Nvidia から 7,700 万ドルの投資を受け、「科学を加速するためのオープン多モーダル AI インフラストラクチャ NSF OMAI(NSF Mid-Scale RI-2: Open Multimodal AI Infrastructure to Accelerate Science)」を設立しました。NSF OMAI は、AI コミュニティが検査・再現・革新を行う能力を強化し、学問分野全体における科学発見の変革を目指しています。Ai2 は、ハワイ大学ヒロ校、ニューハンプシャー大学、ニューメキシコ大学、ワシントン大学の共同主研究者(Co-PI)と共に NSF OMAI を主導しています。詳細は www.allenai.org/omai の NSF OMAI プロジェクトウェブサイトをご覧ください。

この資料は、米国国立科学財団の共同契約番号 2413244 に基づく支援を受けた研究活動に基づいています。

原文を表示

May 7, 2026

Ai2

Open source drives scientific discovery. The ability to reproduce experiments, inspect methods, and build on shared work has always been central to how research advances — and in AI, open infrastructure is what keeps that engine running. Without access to model weights, training data, and methods, researchers are left studying a black box. Today, NSF, NVIDIA, and Ai2 are changing that.

Last year, Ai2 was awarded $152 million from the U.S. National Science Foundation (NSF) and NVIDIA to build the Open Multimodal AI Infrastructure for Science (NSF OMAI). Today, that investment is becoming operational.

With the deployment of NVIDIA Blackwell Ultra-powered systems, Ai2 is bringing new compute online, and with it, a different model for how that compute is used. Instead of powering a single proprietary system, this infrastructure will support a fully open ecosystem where each training run can be reused, extended, and built on by others. Ai2’s research is designed to maximize the infrastructure return by making its models, tools, and the processes behind them fully open, expanding access, and increasing the impact of every GPU hour.

"At a time when access to advanced AI systems is increasingly concentrated among a small number of companies, bringing this hardware infrastructure online represents a critical step for us. NSF OMAI represents a national investment in open infrastructure that has turned into real, usable compute that benefits a broader ecosystem of researchers. Our goal is to accelerate a truly open technology ecosystem with broad impact, developing fully-open AI systems, resources, and tools that strengthen AI research and support continued U.S. leadership in the field." — Noah A. Smith, Principal Investigator, NSF OMAI, and Senior Research Director, Ai2

From infrastructure to impact

In closed systems, substantial compute is spent on experiments, iteration, and intermediate results that never leave the organization—often yielding only a single final product, an AI model that’s used for commercial purposes. If that same compute is instead spent on generating an open artifact, it continues to generate value long after training ends. The data, checkpoints, methods, and even the final model itself can get picked up and adapted across many downstream applications, and other labs can avoid repeating costly experiments to learn lessons that have been thoroughly documented.

Recent internal research from Ai2 estimates that, in some cases, 82% of a training effort goes toward exploratory work rather than the final model. When this work is shared, each GPU hour contributes not just to one release but to a growing body of work the entire field can draw on. The result is a multiplier effect: the same resources support more ideas, applications, and progress over time—without the footprint required by large, closed deployments.

The new cluster reflects this philosophy. Built on NVIDIA B300 systems, the cluster prioritizes how effectively its capacity is used and shared, rather than relying on raw scale. Deployed and managed in partnership with Cirrascale Cloud Services, it supports both large-scale training and ongoing experimentation across language, multimodal, and scientific domains.

In that sense, return on investment in AI infrastructure can’t be measured solely in outputs, but rather in how much innovation it enables. By focusing on openness and reuse, NSF OMAI is designed to deliver outsized impact without the footprint required by large, closed deployments.

"NSF OMAI reflects our commitment to ensuring that advanced AI infrastructure supports the broader research community. By investing in open, shared resources, we are enabling scientists and researchers across disciplines to build, test, reproduce, validate, and advance AI systems. This work accelerates discovery, strengthens scientific rigor through replicability and transparency, and reinforces U.S. leadership in the field." — Wendy Nilsen, Deputy Directorate Head, NSF Computer and Information Science and Engineering Directorate

"Scientific advancement requires accessible infrastructure to scale AI research and ensure its benefits are widely distributed across a global community. By executing the building of the NSF Open Multimodal AI Infrastructure project cluster on NVIDIA Blackwell Ultra, Ai2 is creating a highly efficient, open ecosystem that maximizes the impact of every compute hour." — Jack Wells, Director of Higher Education and Research Computing, NVIDIA

Looking ahead: powering the future of open source AI

As the cluster comes online, Ai2's work across language and multimodal disciplines is converging, reflecting a greater focus on unified architectures that handle multiple data types and tasks natively. And Ai2 is continuing to invest in models that act as agents – ones that can plan, use tools, and act autonomously in complex environments. Some of this work has already come to light, like its Open Coding Agents family, MolmoWeb, and ongoing research into how training strategies and environments shape reliable agentic behavior.

Alongside this, Ai2 is investing in improving its infrastructure for training and evaluation—ensuring the systems used to build and benchmark models can scale with the research.

As part of this work, Olmo team researchers are conducting outreach to science communities to make sure the next generations of models from Ai2 are genuinely useful for that community, adding a new layer on top of the foundational and general-purpose model work Ai2 has long pursued. Across these projects, the direction is not toward isolated systems, but toward open, reusable building blocks that can support both general AI research and scientific discovery.

"As a member of the original Olmo team, I’m excited to be back at Ai2 at this pivotal moment as we continue to advance fully open AI for science. There's a striking symmetry between what I see today with how things felt at the start of the Olmo project—disparate threads of research waiting to be woven together. We’re just scratching the surface of the research we plan to do in areas like novel model architectures, natively multimodal models, scaled pretraining, and RL." — Iz Beltagy, Research Lead, Olmo Team, Ai2

Research supported through NSF OMAI is already producing results:

  • Molmo 2 introduced video understanding, pointing, and object tracking to Ai2's multimodal model family, with an 8B-parameter model surpassing the original 72B Molmo on key benchmarks alongside nine new datasetsnine new datasets covering tasks such as advanced video grounding, multi-image grounding, ultra-dense video captioning, and free-form video question-answering, all released under a permissive license.
  • MolmoPoint followed with a new pointing architecture that replaces text-coordinate outputs with a token-based grounding mechanism tied directly to the model's visual features, achieving state-of-the-art accuracy on spatial reasoning tasks.
  • On the language modeling side, Olmo Hybrid combined transformer attention with linear RNN layers in a new architecture that matches prior models while using significantly less training data—roughly two times greater efficiency in some cases.
  • In agentic AI, work on meta-reinforcement learning with self-reflection is advancing how search agents learn from prior attempts, using cross-episode reflection to improve exploration without relying on external reward models.

Together, these projects illustrate the breadth of research that NSF OMAI is helping accelerate across Ai2's language modeling programs—producing not just models, but open artifacts that other teams can inspect, adapt, and build on.

Olmo 3 Model FlowPretrainingMidtrainingLong contextOlmo 3 BaseInstruct SFTInstruct DPOInstruct RLOlmo 3 InstructThinking SFTThinking DPOThinking RLOlmo 3 ThinkRL ZeroOlmo 3 RL ZeroOlmo 3 Model FlowPretrainingMidtrainingLong contextOlmo 3 BaseInstruct SFTInstruct DPOInstruct RLOlmo 3 InstructThinking SFTThinking DPOThinking RLOlmo 3 ThinkRL ZeroOlmo 3 RL ZeroExplore the Model Flow

Click on any stage to learn more about it and download artifacts.

*The model flow above shows how you can trace our Olmo 3 family from pretraining and midtraining through long-context training and post-training branches for Instruct, Think, and RL Zero variants. Click each stage to learn more and download the artifacts.*

The benefit to the scientific community is not theoretical. In the years since Olmo's release, it’s become a foundational part of what makes studying the science of language models possible for researchers across the country.

"Olmo uniquely enabled [my research] work because it is fully open source… Olmo offers an open and credible platform where the community can investigate fundamental questions about reasoning, bias, fairness, and trustworthiness. In a landscape dominated by commercially optimized systems, Olmo stands out by empowering deeper understanding rather than just application." — Yuan He, Former Research Associate, University of Oxford, and first author of “Supposedly Equivalent Facts That Aren't? Entity Frequency in Pre-training Induces Asymmetry in LLMs”

NSF OMAI began as a national investment in the idea that frontier AI development doesn't have to be closed. With new compute now operational and research already in use beyond Ai2, the project is entering its next phase—one where the work produced on open infrastructure can compound in ways that private efforts, by design, cannot.

About NSF OMAI

In 2025, Ai2 was awarded a cooperative agreement through the U.S. National Science Foundation’s Mid-Scale Research Infrastructure program combined with a $77M investment from Nvidia to form the NSF Mid-Scale RI-2: Open Multimodal AI Infrastructure to Accelerate Science (NSF OMAI). NSF OMAI aims to empower the AI community to inspect, reproduce, and innovate, while transforming scientific discovery across disciplines. Ai2 leads NSF OMAI alongside co-PIs from the University of Hawai’i Hilo, the University of New Hampshire, the University of New Mexico, and the University of Washington. Learn more from the NSF OMAI project website at www.allenai.org/omai.

This material is based upon work supported by the U.S. National Science Foundation under Cooperative Agreement No. 2413244.

この記事をシェア

関連記事

Allen AI (AI2)重要度42026年6月25日 17:00

ハイブリッドモデルはどのトークンをより正確に予測するか?

Allen AI (AI2)2026年6月18日 17:00

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Allen AI (AI2)重要度42026年6月18日 17:00

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む