#世界モデルのAIニュース

8件の記事

世界モデル開発企業オデッセイがアマゾンなど大手の支援を受け、14.5億ドルの評価額を獲得

世界モデルを開発するスタートアップ「オデッセイ」は、アマゾンや他の主要投資家からの出資により、企業価値が14.5億ドルに達したと発表した。

NVIDIA は、テキスト・画像・動画・音声・動作を扱う完全なオープン型多機能モデル「Cosmos 3」を発表した。この新モデルは推論と生成の両機能を備え、開発者が少ないデータ量で物理AIシステムを構築できる基盤を提供する。

Google は新モデル「Gemini Omni」を発表し、画像や音声、テキストを入力として動画を作成する機能を搭載した。これは同社のマルチモーダル能力のさらなる拡張であり、今後の技術展開の第一歩となる。

国際研究チームがOpenWorldLibで世界モデル研究の統一を図り、Soraなどのテキスト動画生成モデルを定義から除外した。

韓国のインターネット大手Naverが、自社の100万枚以上のストリートビュー画像から都市の実在する幾何学データに基づいたビデオ・ワールド・モデルを構築した。このモデルは、追加の調整なしに他の都市にも一般化できる。

NVIDIAは、人型ロボットや自動運転車などの次世代AI駆動ロボット向けに、高忠実度で物理法則を考慮した合成データを生成する「Cosmos World Foundation Models」を発表した。

テンセント混元3Dチームは、世界モデル向け初のオープンソース強化学習後訓練フレームワーク「WorldCompass」を公開した。このフレームワークは、世界モデルの対話精度と体験を向上させることを目的としている。

言語モデルを思考のモデルと見なすことで、知能の基盤となる暗黙の身体的知覚を見失うと指摘。最近の生成AIの成功がAGIの到来を予感させるが、言語中心のアプローチには限界がある。