#世界モデル のAIニュース
8件の記事
世界モデル開発企業オデッセイがアマゾンなど大手の支援を受け、14.5億ドルの評価額を獲得
世界モデルを開発するスタートアップ「オデッセイ」は、アマゾンや他の主要投資家からの出資により、企業価値が14.5億ドルに達したと発表した。
TechCrunch AI·6月18日·★★★★
NVIDIA、物理AI向けオープンフロンティアモデル「Cosmos 3」を発表
NVIDIA は、テキスト・画像・動画・音声・動作を扱う完全なオープン型多機能モデル「Cosmos 3」を発表した。この新モデルは推論と生成の両機能を備え、開発者が少ないデータ量で物理AIシステムを構築できる基盤を提供する。
TLDR AI·6月2日·★★★★★
Google の Gemini Omni が画像・音声・テキストから動画を生成、その先も続く
Google は新モデル「Gemini Omni」を発表し、画像や音声、テキストを入力として動画を作成する機能を搭載した。これは同社のマルチモーダル能力のさらなる拡張であり、今後の技術展開の第一歩となる。
TechCrunch AI·5月20日·★★★★
研究者が世界モデルの定義を明確化、テキスト動画生成AIは除外
国際研究チームがOpenWorldLibで世界モデル研究の統一を図り、Soraなどのテキスト動画生成モデルを定義から除外した。
The Decoder·4月12日
Naverの「ソウル・ワールド・モデル」、実在するストリートビュー・データを用いてAIによる都市全体の幻覚生成を防止
韓国のインターネット大手Naverが、自社の100万枚以上のストリートビュー画像から都市の実在する幾何学データに基づいたビデオ・ワールド・モデルを構築した。このモデルは、追加の調整なしに他の都市にも一般化できる。
The Decoder·3月29日·★★★★
NVIDIA Cosmos World Foundation Modelsによる合成データのスケーリングと物理AI推論
NVIDIAは、人型ロボットや自動運転車などの次世代AI駆動ロボット向けに、高忠実度で物理法則を考慮した合成データを生成する「Cosmos World Foundation Models」を発表した。
NVIDIA Developer Blog·3月14日·★★★★
混元世界モデルのさらなる進化:世界モデル向け初のオープンソース強化学習後訓練フレームワーク「WorldCompass」を公開
テンセント混元3Dチームは、世界モデル向け初のオープンソース強化学習後訓練フレームワーク「WorldCompass」を公開した。このフレームワークは、世界モデルの対話精度と体験を向上させることを目的としている。
腾讯混元·3月10日·★★★★
AGIはマルチモーダルではない
言語モデルを思考のモデルと見なすことで、知能の基盤となる暗黙の身体的知覚を見失うと指摘。最近の生成AIの成功がAGIの到来を予感させるが、言語中心のアプローチには限界がある。
The Gradient·6月4日·★★★★