メインコンテンツへスキップ

#世界モデル のAIニュース

8件の記事

世界モデル開発企業オデッセイがアマゾンなど大手の支援を受け、14.5億ドルの評価額を獲得

世界モデルを開発するスタートアップ「オデッセイ」は、アマゾンや他の主要投資家からの出資により、企業価値が14.5億ドルに達したと発表した。

TechCrunch AI·6月18日·★★★★

NVIDIA、物理AI向けオープンフロンティアモデル「Cosmos 3」を発表

NVIDIA は、テキスト・画像・動画・音声・動作を扱う完全なオープン型多機能モデル「Cosmos 3」を発表した。この新モデルは推論と生成の両機能を備え、開発者が少ないデータ量で物理AIシステムを構築できる基盤を提供する。

TLDR AI·6月2日·★★★★★

Google の Gemini Omni が画像・音声・テキストから動画を生成、その先も続く

Google は新モデル「Gemini Omni」を発表し、画像や音声、テキストを入力として動画を作成する機能を搭載した。これは同社のマルチモーダル能力のさらなる拡張であり、今後の技術展開の第一歩となる。

TechCrunch AI·5月20日·★★★★

研究者が世界モデルの定義を明確化、テキスト動画生成AIは除外

国際研究チームがOpenWorldLibで世界モデル研究の統一を図り、Soraなどのテキスト動画生成モデルを定義から除外した。

The Decoder·4月12日

Naverの「ソウル・ワールド・モデル」、実在するストリートビュー・データを用いてAIによる都市全体の幻覚生成を防止

韓国のインターネット大手Naverが、自社の100万枚以上のストリートビュー画像から都市の実在する幾何学データに基づいたビデオ・ワールド・モデルを構築した。このモデルは、追加の調整なしに他の都市にも一般化できる。

The Decoder·3月29日·★★★★

NVIDIA Cosmos World Foundation Modelsによる合成データのスケーリングと物理AI推論

NVIDIAは、人型ロボットや自動運転車などの次世代AI駆動ロボット向けに、高忠実度で物理法則を考慮した合成データを生成する「Cosmos World Foundation Models」を発表した。

NVIDIA Developer Blog·3月14日·★★★★

混元世界モデルのさらなる進化:世界モデル向け初のオープンソース強化学習後訓練フレームワーク「WorldCompass」を公開

テンセント混元3Dチームは、世界モデル向け初のオープンソース強化学習後訓練フレームワーク「WorldCompass」を公開した。このフレームワークは、世界モデルの対話精度と体験を向上させることを目的としている。

腾讯混元·3月10日·★★★★

AGIはマルチモーダルではない

言語モデルを思考のモデルと見なすことで、知能の基盤となる暗黙の身体的知覚を見失うと指摘。最近の生成AIの成功がAGIの到来を予感させるが、言語中心のアプローチには限界がある。

The Gradient·6月4日·★★★★