#world models のAIニュース
12件の記事
想像に預けられ、行動のために微調整:ワールド・アクションモデルの台頭
NVIDIA は、事前学習されたビジョン言語モデルを基盤とし、ロボット制御に適応させた「ワールド・アクションモデル(WAM)」という新しい技術の登場を発表した。これは、視覚と言語を理解する能力を行動計画に転用するアプローチである。
[AINews] NVIDIA Cosmos 3、Nemotron 3 Ultra、RTX Spark の発表
NVIDIA は今日、言語・画像・動画・音声・動作を統合する「Cosmos 3」を発表した。同モデルは推論と生成を組み合わせたアーキテクチャを採用し、Nano や Super など複数のサイズで提供される。
NVIDIA Cosmos 3 の登場:物理 AI の推論と行動のための初のオープンオムニモデル
NVIDIA が、物理世界の推論と行動を担うための最初のオープンソース型オムニモデル「Cosmos 3」を発表した。この新モデルは、AI が現実世界を理解し、動作する能力を強化する基盤技術として期待されている。
データは不足していない。不足しているのは想像力だ(8 分読了)
Asuka Zheng は、トレーニングデータの枯渇への不安が市場の実態を捉えていないと指摘し、自身の SRE 代替プロジェクトで世界モデルの訓練が失敗した事例を紹介する。同氏は、最初の異常から完全な解決に至るまでの長期エンドツーエンドの事象軌跡データが存在しないことがボトルネックだったと述べている。
マルチエージェント・ワールドモデル(3 分で読める)
TLDR AI が、複数のエージェントが協調して環境をシミュレーションする「マルチエージェント・ワールドモデル」に関する解説記事を公開しました。
イーロン・マスク率いるスペースX AI、合併後から人材流出が相次ぐ
イーロン・マスクが率いるスペースX AIは、コーディングや世界モデル、Grok音声などの分野でトップ人材を失っており、メタ社やシンキングマシーンズラボなどの競合他社が元従業員を引き抜いている。極端な労働文化と現金化への欲求が流出の要因となっている。
実世界のための AI:ヤン・ルコン氏との対談(12 分読了)
ヤン・ルコン氏は、現在の大規模言語モデルが人間レベルの知能には至らないとし、物理法則や因果関係を学習する「ワールドモデル」に基づく次世代 AI の必要性を説いた。
世界モデルはすべてを変える可能性がある(20 分読了)
ヤン・ルコン氏ら AI パイオニアが、現在の大規模言語モデルの能力を超えた複雑な物理的相互作用を捉えるための「世界モデル」開発に数十億ドルを投資している。この取り組みは、AI が単なるパターン認識から現実世界の理解と対話へと進化するための基盤となるが、効果的な機能には多様で高品質な実世界データの確保という課題が残っている。
AI エンジニア世界博覧会、第 2 回スピーカー募集を開始
AI エンジニアリング(AIE)が主催する「AI Engineer World's Fair」が、夏季開催に向けて第 2 回のスピーカー募集を開始しました。同イベントは、自己研究やメモリ機能、世界モデルなどの新分野に焦点を当てています。
AI動画は序章に過ぎないか?RunwayのCEOが「世界モデル」を次世代と指摘
ニューヨークの企業RunwayのCEOは、生成AI動画が単なる novelty から創造的ツールへ急速に進化したと述べ、同社がGoogleやOpenAIと競合する中、次世代技術として「世界モデル」への移行が必要だと主張している。
研究者が米政策当局に「ChatGPTの過ち」をワールドモデルで繰り返すよう警告
研究者は、AIがテキストから物理世界へ移行する中、米政策当局者がその規模を把握できていないと警告し、中国がロボット分野で先行していると指摘する。
長期ホライズンにおけるワールドモデルのための勾配ベース計画手法
「GRASP」を開発した研究チームは、勾配ベースの計画手法により学習済みワールドモデルを用い、長期ホライズンでの意思決定と敵対的ロバスト性を向上させた。