AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
TLDR AI·2026年6月2日 09:00·約7分で読める

NVIDIA、物理AI向けオープンフロンティアモデル「Cosmos 3」を発表

#物理 AI#オムニモデル#Mixture-of-Transformers#合成データ生成#NVIDIA Cosmos#世界モデル
TL;DR

NVIDIA は物理 AI のための基盤モデル「Cosmos 3」と、主要企業が集結する「Cosmos Coalition」を発表し、マルチモーダル推論と世界シミュレーションのオープン化を推進した。

AI深層分析2026年6月3日 18:17
5
最重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
4
革新性10%
5

キーポイント

1

Cosmos 3 の技術的特徴

Mixture-of-Transformers アーキテクチャを採用し、テキスト、画像、動画、音声、アクションを統合的に理解・生成する世界初の完全オープンなオムニモデルとして登場した。

2

物理 AI 開発の効率化

高い物理精度を持つ合成データ生成により、ロボットや自律走行車のトレーニングおよび評価サイクルを数ヶ月から数日へと劇的に短縮する可能性を示唆している。

3

Cosmos Coalition の設立

Agile Robots、Black Forest Labs、Runway などの主要 AI ラボやロボティクス企業が参画し、次世代の世界モデル開発を推進するためのグローバル連携体制が構築された。

4

新しいアーキテクチャと汎用性

推論トランスフォーマーと生成エクスパートを組み合わせた混合型アーキテクチャにより、限られたデータで現実世界の物体相互作用や空間時間関係を理解・予測できる。

5

3 つの主要な活用形態

多様なモダリティを理解するビジョンランゲージモデル、物理環境をシミュレートする世界モデル、およびロボットタスク訓練のための世界行動モデルとして機能する。

6

Cosmos 3 のモデルラインナップ拡充

物理精度と生成品質が最優先のロボット・自動運転向け「Super」、数秒以内の高品質な推論向け「Nano」、そして近日公開予定のエッジ向けリアルタイム推論モデル「Edge」の 3 つのバリアントが用意されています。

7

Cosmos Coalition の設立とオープン協力

Agile Robots や Runway などの主要企業が参加するグローバルな連携体制により、モデルや研究手法の共有、DGX Cloud を活用した大規模トレーニングを推進し、物理 AI のイノベーションを加速させます。

影響分析・編集コメントを表示

影響分析

この発表は、物理 AI がシミュレーションデータの不足やトレーニングの非効率性というボトルネックから脱却する転換点となり得ます。特に完全オープンなモデルと大規模なエコシステムの構築により、中小企業を含めた開発参入障壁が下がり、ロボット工学や自律走行分野でのイノベーション加速が予想されます。

編集コメント

NVIDIA が物理 AI のための完全オープンモデルを投入し、エコシステムを構築した点は業界の構造変化を示唆しています。特にトレーニング期間の劇的な短縮は、実用化への道筋を大きく後押しする画期的な動きです。

ニュースサマリー:

  • NVIDIA Cosmos 3 は、物理 AI の推論、世界シミュレーション、行動生成のための画期的な混合トランスフォーマーアーキテクチャを基盤とした、新世代のリーダーボード首位を占めるオープンな物理 AI ファウンデーションモデルです。
  • Cosmos 3 は、テキスト、画像、動画、環境音、そして行動にわたるネイティブなビジョン推論とマルチモーダル生成機能を備えた、世界で初めて完全オープン化されたオムニモデルであり、最先端の合成データ生成および物理 AI ポリシーモデル開発を可能にします。
  • NVIDIA は次世代のオープンワールドモデルの発展を目指し、Agile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AI といった主要な AI ラボおよびロボット工学のリーダー企業と共に「NVIDIA Cosmos コーリション」を設立しました。

NVIDIA GTC Taipei— NVIDIA は本日、ビジョン推論、世界生成、行動予測を単一のシステムで統合した画期的な混合トランスフォーマーアーキテクチャ(mixture-of-transformers)を基盤とした、物理 AI 向けのオープンワールドファウンデーションモデル「NVIDIA Cosmos™ 3」を発表しました。

Cosmos 3 は、テキスト、画像、動画、環境音、行動をネイティブに理解・生成でき、最先端の物理精度を実現する世界で初めて完全オープン化されたオムニモデル(omnimodel)です。これにより、物理 AI のトレーニングおよび評価サイクルが数ヶ月から数日へと劇的に短縮されます。

NVIDIA はまた、次世代のワールドモデルを推進するために協力する world model 構築者および AI 開発者(Agile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AI など)とのグローバルな協力体制である「NVIDIA Cosmos Coalition」も発表しました。

「マルチモーダル推論言語、ビジョン、およびワールドモデルにおける画期的な進展により、物理的 AI のビッグバンはもうすぐそこです」と NVIDIA の創設者兼 CEO であるジェンソン・ファン氏は述べています。「オープンでフロンティアのオムニモデルである Cosmos 3 ファミリーは、開発者が物理世界において知覚し、推論し、計画し、行動するロボットや自律走行車(AVs)、ビジョン AI を構築するための能力的な世代間飛躍を提供します。」

物理的 AI のための新アーキテクチャ

Cosmos 3 は、物理的 AI が抱える根本的な課題に取り組んでいます。すなわち、限られたトレーニングデータと断片的なシミュレーションスタックの中で、ロボットや自律走行車(AVs)、ビジョンエージェントが現実世界で一般化できるようにすることです。

このモデルの「トランスフォーマーの混合」アーキテクチャは、推論用トランスフォーマーと専門生成用トランスフォーマーを組み合わせることで、Cosmos 3 が動画や行動軌道を生成する前に、オブジェクト間の相互作用、運動、および時空間的関係を理解することを可能にします。

テキスト、画像、動画、音声、および行動軌跡にわたる数十億のサンプルを含む、最大級の多モーダル物理 AI データセットの一つでトレーニングされたこのモデルは、開発者に対して、より少ないデータと低いトレーニングコストで物理 AI システムを構築するための強力な事前学習済み基盤を提供します。

Cosmos 3 は以下のように利用できます:

  • モーダリティ間で理解と推論を行うビジョン言語モデルとして。
  • 物理環境をシミュレートし、トレーニングおよび評価のために未来の世界状態を予測する世界モデルまたは動画基盤モデルとして。
  • 特定のタスクを実行するためにロボットを訓練するための世界行動モデルのバックボーンとして。

Cosmos 3 モデルは、物理 AI ベンチマークにおいて最先端の結果を提供します。オープンモデルの中では、世界生成精度において Artificial Analysis、Physics-IQ、PAI-Bench、および R-Bench で 1 位を獲得し、行動ポリシーにおいては RoboLab および RoboArena、ビジョン理解においては VANTAGE-Bench および TAR リーダーボードで首位を維持しています。

Cosmos 3 ラインナップは、物理 AI 開発の異なる段階に合わせて開発者に選択肢を提供します:

  • Cosmos 3 Super は、最も高い物理学精度と生成品質を必要とするポストトレーニング用ロボットおよび自動運転車 (AV) モデル向けです。
  • Cosmos 3 Nano は、数秒分の時間内で高品質な動画処理と行動推論を行うために設計されています。
  • Cosmos 3 Edge は近日公開予定で、エッジにおけるリアルタイム推論に対応します。

Cosmos コーリションがオープンワールドモデル開発を加速****

Cosmos コーリションは、業界全体にわたるオープンワールドモデルの進展を目指し、世界モデル構築者、AI 開発者、物理 AI のリーダーによるグローバルな協力体制です。メンバーは Cosmos 3 テクノロジー、トレーニングツール、および大規模トレーニング用の NVIDIA DGX™ Cloud インフラストラクチャを利用しながら、モデル、研究、評価手法を貢献することができます。

創設メンバーには、Agile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AI が含まれています。オープンな環境で構築し、共有エコシステム全体に貢献することで、コーリションはより迅速なイノベーション、広範な相互運用性、および物理 AI におけるより急速な進展を可能にすることを目指しています。

開発者が Cosmos を活用

Cosmos プラットフォームは、NVIDIA の物理 AI スタックを支え、業界全体でのトレーニングおよび評価ワークフローの加速を実現しています。このプラットフォームには、ロボット工学、物理学、人間の動作、自動運転、倉庫安全、空間推論のための新しいデータセットが追加され、ニューラルシーン再構築、欠陥画像生成、動画拡張のための新たな 物理 AI エージェントスキル も提供されています。

物理 AI 開発者は、業界全体で Cosmos プラットフォーム上で構築を進めています。ロボット工学分野では Agile Robots、Doosan Robotics、LG エレクトロニクス、サムスン電子、Skild AI が、自動運転車(AV)分野では Li Auto が、ビジョン AI エージェント 分野では Centific、Fogsphere、Linker Vision、Milestone Systems、Yuan が、それぞれ産業用 AI やスマートスペースアプリケーションを推進しています。

利用可能性**

Cosmos 3 Super と Cosmos 3 Nano は現在利用可能であり、リアルタイム推論用の Cosmos 3 Edge もまもなく登場します。開発者は build.nvidia.com で Cosmos 3 を試したり、Hugging Face からオープンモデルをダウンロードしたり、Hugging Face Diffusers や GitHub のリソースを活用してモデルのカスタマイズや合成データの生成を行ったりできます。また、これらのモデルは NVIDIA NIM™ マイクロサービスとしてデプロイすることも可能です。

モデルビルダーおよびソフトウェアプロバイダーは、GitHub 上の物理 AI エージェントスキルを活用し、推論サービスやクラウドインフラストラクチャパートナーを通じて Cosmos のアクセス、カスタマイズ、デプロイを加速させることができます。主要な推論および合成データ生成ワークロードに対応するパートナーには、Baseten、CoreWeave、Microsoft Azure、Nebius、Deep Infra、そして Classmethod が含まれます。

*黄氏による基調講演を視聴し、*NVIDIA GTC Taipei* でさらに詳しく学び、これらの*物理 AI セッション* を探索してください。*

原文を表示

News Summary:

  • NVIDIA Cosmos 3 is a new leaderboard-topping open physical AI foundation model, built on a breakthrough mixture-of-transformers architecture for physical AI reasoning, world simulation and action generation.
  • Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning and multimodal generation across text, image, video, ambient sound and action for state-of-the-art synthetic data generation and physical AI policy model development.
  • NVIDIA launches the NVIDIA Cosmos Coalition with leading AI labs and robotics leaders — including Agile Robots, Black Forest Labs, Generalist, LTX, Runway and Skild AI — to advance the next generation of open world models.

NVIDIA GTC Taipei—NVIDIA today launched NVIDIA Cosmos™ 3, an open world foundation model for physical AI built on a breakthrough mixture-of-transformers architecture that combines vision reasoning, world generation and action prediction in a single system.

Cosmos 3 is the world’s first fully open omnimodel that can natively understand and generate text, images, video, ambient sound and actions with leading physics accuracy, reducing physical AI training and evaluation cycles from months to days.

NVIDIA also launched the NVIDIA Cosmos Coalition, a global collaboration between world model builders and AI developers — including Agile Robots, Black Forest Labs, Generalist, LTX, Runway and Skild AI — working together to advance next-generation world models.

“The big bang of physical AI is just around the corner thanks to breakthroughs in multimodal reasoning language, vision and world models,” said Jensen Huang, founder and CEO of NVIDIA. “The Cosmos 3 family of open, frontier omnimodels gives developers a generational leap in ability to build robots, autonomous vehicles and vision AI that perceive, reason, plan and act in the physical world.”

A New Architecture for Physical AI**

Cosmos 3 tackles a fundamental challenge in physical AI: enabling robots, autonomous vehicles (AVs) or vision agents to generalize in the real world with limited training data and fragmented simulation stacks.

The model’s mixture-of-transformers architecture pairs a reasoning transformer with an expert generation transformer, enabling Cosmos 3 to understand object interactions, motion and spatial-temporal relationships before generating video and action trajectories.

Trained on one of the largest multimodal physical AI datasets — including billions of samples across text, image, video, sound and action trajectories — the model gives developers a powerful pretrained foundation for building physical AI systems with less data and lower training costs.

Developers can use Cosmos 3 as:

  • A vision language model that understands and reasons across modalities.
  • A world model or video foundation model that simulates physical environments and predicts future world states for training and evaluation.
  • The backbone for world action models that help train robots to perform specific tasks.

Cosmos 3 models deliver leading results on physical AI benchmarks. Among open models, it ranks first across Artificial Analysis, Physics-IQ, PAI-Bench and R-Bench for world generation accuracy, RoboLab and RoboArena for action policy, and the VANTAGE-Bench and TAR leaderboards for vision understanding.

The Cosmos 3 lineup gives developers options for different stages of physical AI development:

  • Cosmos 3 Super for post-training robotics and AV models that need the highest physics accuracy and generation quality.
  • Cosmos 3 Nano for high-quality video and action reasoning in fractions of a second.
  • Cosmos 3 Edge, coming soon, for real-time inference at the edge.

Cosmos Coalition Accelerates Open World Model Development****

The Cosmos Coalition is a global collaboration between world model builders, AI developers and physical AI leaders to advance open world models across industries, enabling members to contribute models, research and evaluation techniques while using Cosmos 3 technologies, training tools and NVIDIA DGX™ Cloud infrastructure for large-scale training.

Founding coalition members include Agile Robots, Black Forest Labs, Generalist, LTX, Runway and Skild AI. By building in the open and contributing across a shared ecosystem, the coalition aims to enable faster innovation, broader interoperability and more rapid advances in physical AI.

Developers Build on Cosmos****

The Cosmos platform powers NVIDIA’s physical AI stack to accelerate training and evaluation workflows across industries. The platform now includes new datasets for robotics, physics, human motion, autonomous driving, warehouse safety and spatial reasoning, as well as new physical AI agent skills for neural scene reconstruction, defect-image generation and video augmentation.

Physical AI developers are building on the Cosmos platform across industries — Agile Robots, Doosan Robotics, LG Electronics, Samsung Electronics and Skild AI for robotics, Li Auto for AVs, and Centific, Fogsphere, Linker Vision, Milestone Systems and Yuan for vision AI agents to power industrial AI and smart spaces applications.

Availability**

Cosmos 3 Super and Cosmos 3 Nano are available now, with Cosmos 3 Edge coming soon for real-time inference. Developers can try Cosmos 3 on build.nvidia.com, download open models from Hugging Face, customize models and generate synthetic data with Hugging Face Diffusers and resources on GitHub, and deploy the models as NVIDIA NIM™ microservices.

Model builders and software providers can accelerate access, customization and deployment of Cosmos for key reasoning and synthetic data generation workloads using physical AI agent skills on GitHub through inference services and cloud infrastructure partners including Baseten, CoreWeave, Microsoft Azure, Nebius, Deep Infra and Classmethod.

*Watch the *keynote* from Huang, learn more at *NVIDIA GTC Taipei* and explore these *physical AI sessions*.*

この記事をシェア

関連記事

Smol AI News★42026年6月1日 14:44

今日は何も大きな出来事はありませんでした

Smol AI News は、5月30日から6月1日にかけての期間に、主要なニュースや技術進展がない静かな日であったと報告しています。

TLDR AI2026年6月5日 09:00

EVA-Bench Data 2.0:3 ドメイン、121 ツール、213 シナリオ(9 分読了)

TLDR AI が公開した EVA-Bench データセットの第 2 版は、3 つのドメインにわたる 121 のツールと 213 のシナリオを含む評価データを提供し、AI ツール利用能力の評価基準を強化します。

TLDR AI★42026年6月5日 09:00

iPhone のメッセージアプリにサードパーティ製 AI エージェントが導入される

Apple が iPhone のメッセージアプリでサードパーティ製 AI サービス「Poke」の利用を承認し、ユーザーは iMessage 内で直接チャットして各種タスクを実行できるようになった。ただし、需要の高さにより応答速度に遅延が生じる事例も報告されている。

ニュース一覧に戻る元記事を読む