AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
TechCrunch AI·2026年6月10日 22:07·約8分で読める

Decart の新世界モデルは、いくつかの注意点はあるものの、数時間にわたる写実的な運転をシミュレーション可能

#World Model#自動運転#シミュレーション#Computer Vision#Decart
TL;DR

Decart は数時間にわたる写実的な運転シミュレーションを可能にする世界モデルを発表したが、現時点では計算コストや物理的整合性などの技術的課題が残っている。

AI深層分析2026年6月10日 23:02
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

長時間シミュレーションの実現

従来の手法よりもはるかに長い時間(数時間)にわたって、高解像度かつ写実的な運転状況を連続して生成・シミュレートできる技術を開発した。

2

物理的整合性と計算コストの課題

長時間のシミュレーションにおいて、物体の物理法則に従った挙動や一貫性を維持することには依然として難題があり、膨大な計算リソースを要する。

3

自動運転開発への応用可能性

この技術は、安全な環境で数百万マイルにわたるテストデータを生成し、自動運転システムの学習と検証プロセスを加速させる可能性がある。

影響分析・編集コメントを表示

影響分析

この発表は、自動運転分野におけるシミュレーション技術の新たな基準を示すものであり、実世界での危険なテストを減らすための重要なツールとなり得ます。しかし、現時点では完全な実用化には至っておらず、計算リソースの最適化や物理モデルの精度向上が今後の課題となります。

編集コメント

長時間の写実的シミュレーションは自動運転開発の聖杯の一つですが、この技術が「現実の物理法則」をどこまで忠実に再現できるかが今後の鍵となります。

AI スタートアップの Decart は水曜日、リアルタイムでフォトリアリスティックな運転環境を生成できる最新インタラクティブ世界モデル「Oasis 3」を発表しました。これは TechCrunch が独占的に入手した情報です。同モデルは現在 API を通じて利用可能です。

スタートアップは当初、大規模に稀な運転シナリオをシミュレーションする必要がある自動運転車企業を対象としており、ロボット工学やその他の物理 AI アプリケーションへの展開も計画しています。しかし、最大の賭けは開発者向けです。初日から API アクセスを提供することで、Decart は OpenAI が言語モデルで成し遂げたように、世界モデルを中心に開発者エコシステムを構築しようとしています。

「これは実際にその上でプログラミングできる最初の有用な世界モデルになるでしょう」と Decart の共同創設者兼 CEO の Dean Leitersdorf は TechCrunch に語りました。「この上に新たな開発者コミュニティが形成されると思います」

同スタートアップにはすでに 10 万人を超える開発者のコミュニティがあり、その多くは e コマースやライブストリーミング分野を中心に、リアルタイム動画モデル「Lucy」の上に製品を構築しています。Oasis 3 はこの基盤モデルに基づいており、同社の物理 AI への進出を象徴するものです。アクセス料金は 1 秒あたり 0.02 ドルで、エンタープライズ向け価格は利用ケースによって異なりますと Decart は述べています。

Decart は、ますます混雑する世界モデルの分野で活動しています。昨年、Google は研究プレビューとして Genie 3 をリリースし、Fei-Fei Li の World Labs は商用用途向けに「Marble」を立ち上げ、Luma や Runway といった動画生成スタートアップも、物理法則を意識した動画モデルを世界モデルへと転換させています。

imageimage Decart の Oasis 3 は、リアルタイムで対話可能なフォトリアリスティックな運転シナリオを生成します。画像クレジット: Decart

Oasis 3 のリリースは、2 年前に 3 億ドルの資金調達を果たした Decart から数週間後です。Leitersdorf 氏によると、このラウンドは EC(電子商取引)、ライブストリーミング、物理 AI における「構築したモデルへの需要が劇的に増加した」ことに伴うものであり、Decart のバリュエーションを約 40 億ドルに押し上げました。これにより、トヨタ、Adobe、eBay といった一連の戦略的投資家が参画しました。Leitersdorf 氏によれば、これらの企業はすべて潜在的な顧客です。既存の投資家である Nvidia もこのラウンドに参加しています。

Oasis 3 の強みは、そのモデルのフォトリアルな描写力と無限生成能力にあります。これは Decart による効率化の技によるもので、同社の主力製品である DOS(Decart Optimization Stack)ソフトウェアが支えています。このソフトウェアにより、モデルを Nvidia、Amazon、Google のハードウェア上で効率的に実行可能とし、競合他社よりもはるかに低コストで運用できるようにしています。

「これは当社のリアルタイムスタック全体の上に構築されており、ハードウェアレベルまで徹底的に最適化されています」と Leitersdorf は語っています。「このように垂直統合されているからこそ、業界の他の誰よりも桁違いに安価にこれらのモデルを実行できるのです」。

Leitersdorf によると、同社のスタートアップのモデルは非常に効率的なため、設立以来「劇的に少ない」金額で済ませていると述べています。具体的には 1 億ドルを大幅に下回るコストで運用されています。

Oasis 3 は、トレーニングおよびテスト用の物理的に正確なマルチカメラ環境(前方 1 つ、側方 2 つ)を生成します。また、限定的なデモや研究プレビューを提供するのではなく、開発者に対して無限のシナリオ生成を可能にしています。これは、可能な限り多くのエッジケースを試したい自動運転車開発者にとって完璧な機能です。

私が試した他のモデル、例えば Google の Genie 3 や World Labs の Marble と比較すると、Oasis 3 は単一のテキストプロンプトから得られる最もフォトリアルな環境を提供します。さらに、数時間にわたってそれらと対話できるという事実は、Decart の競合他社が欠いている可能性のある効率性のレベルを示唆しています。

しかし、長く世界を生成できるようにすることで、モデルも著しく劣化してしまいます。

0 秒 / 1 分 27 秒 音量 90%

キーボードショートカットの一覧を表示するにはシフトキーと疑問符キーを押してください

00:00

01:27

01:27

私のテストでは、システムはプロンプトに一致する強力な初期シーンを一貫して設定できることが分かりましたが、世界内を移動するにつれてテーマの整合性は急速に崩れました。朝のニューヨーク市街地を生成するように指示すると、美しく実現されました。しかし、運転を進めるにつれ、環境はニューヨークというより、あらゆる都市や西洋風の都市の標準版のように見えてきました。

振り返って最初の交差点に戻ろうと試みると、そこにはもうなく、全く新しい環境に置き換わっていました。さらに、操作があまり反応せず、車の進行方向を制御できなくなることがよくありました(これも私がテストした他の世界モデルで共通する欠点です)。この体験は、一貫性のあるシミュレーションというよりは、すぐに意味不明になる夢のような断片的な意識の流れのように感じられました。

私が他の世界モデルでも目にした別の問題として、車が他の車をすり抜けて走行してしまうことがあります。これは、環境内で物理法則が適切にシミュレートされていないことを意味します。ライターズドルフ氏はこれを「現在解決に取り組んでいる主要な研究課題」と呼び、「事故に関するデータは良好な運転に関するデータと比較して劇的に少ない」ことに起因すると説明しています。

この物理的整合性が難しい理由の一部は、この世界モデルの動作原理そのものに根ざしています。Oasis 3 は自己回帰型であり、1 フレームずつ生成し、次に何が生じるかを決定するために、自分が以前に生成した内容を参照します。これは多くの世界モデルにおける重要なアーキテクチャ的特徴ですが、同時に計算集約的な処理でもあります。

整合性を維持するため、Leitersdorf 氏は Decart チームがモデルのメモリ長を改善する取り組みを行っていると言います。

「私たちが生成する各フレームはおよそ 8,000 トークンです」と彼は言いました。「これを秒間数十フレームで生成すると、1 秒間に数十万トークンになります。コンテキストウィンドウは非常に速く埋まってしまいます。私たちは数百万トークンを保存するためのより長いコンテキストの実現方法や、メモリをより少ないトークンに圧縮する方法について研究しています。」

Leitersdorf 氏は、この整合性の問題はモデルの次期バージョンで部分的に解決される可能性があると考えています。そのバージョンでは、ユーザーは画像ではなく環境の動画に基づいて世界を生成し始めることができるようになります。彼は、世界モデルという分野はまだ初期段階にあることを認めています。

それでも、創業者は現在の技術の限界よりも、開発者がこの技術を手にしたときに何が起こるかに焦点を当てています。

「これは LLM の黎明期を思い出させます」と彼は語り、OpenAI がモデル用の API を発明した当時のことを指差しました。そこでは、新しいユースケースを見つけて構築することで分野を前進させた開発者コミュニティの出現がありました。

「3 ヶ月後に再びお話しする際には、『オアシスを使って 100 人の開発者がそれぞれ 100 の異なるアプリケーションを構築し、私たち全員を驚かせた』と語っているでしょう」と彼は言いました。

*当社の記事内のリンクを通じてご購入いただいた場合、私たちは少額のコミッションを獲得する可能性があります。これは当社の編集の独立性には影響しません。

原文を表示

AI startup Decart on Wednesday unveiled Oasis 3, its latest interactive world model that can generate photorealistic driving environments in real time, TechCrunch has exclusively learned. The model is currently available via API.

The startup is initially targeting autonomous vehicle companies that need to simulate rare driving scenarios at scale, and plans to expand into robotics and other physical AI applications. But the bigger bet is on developers: By offering API access from day one, Decart is trying to build a developer ecosystem around world models much like how OpenAI did with language models.

“It’s going to be the first usable world model that people can actually program on top of,” Dean Leitersdorf, co-founder and CEO of Decart, told TechCrunch. “I think there’s going to be an entire developer community that emerges on top of this.”

The startup already has a community of more than 100,000 developers, many of whom are building products on top of its real-time video model Lucy, largely in e-commerce and live streaming. Oasis 3 is based on that foundation model, and it represents the company’s push into physical AI. Access is priced at $0.02 per second, and enterprise pricing depends on use cases, Decart said.

Decart is playing in an increasingly packed world model arena. Last year, Google released Genie 3 in research preview, Fei-Fei Li’s World Labs launched Marble for commercial use cases, and video generation startups like Luma and Runway are also translating their physics-aware video models into world models.

Decart’s Oasis 3 generates photorealistic driving scenarios that you can interact with in real time.Image Credits:Decart
Decart’s Oasis 3 generates photorealistic driving scenarios that you can interact with in real time.Image Credits:Decart

Oasis 3’s release comes a few weeks after two-year-old Decart raised $300 million, which Leitersdorf says followed “huge demand increases for the models we built” in e-commerce, live streaming and physical AI. The round boosted Decart’s valuation to nearly $4 billion, and brought a series of strategic investors such as Toyota, Adobe and eBay. All of these companies are potential customers, says Leitersdorf. Nvidia, an existing investor, also participated in the round.

Oasis 3’s edge lies in the photo-realism of its models and infinite generation capability. That’s due to some efficiency wizardry on Decart’s part, powered by the company’s other main product: the DOS (Decart Optimization Stack) software that allows models to run efficiently on Nvidia, Amazon and Google hardware, making its models far less expensive to run than competitors.

“This is built on top of our entire real-time stack, which we optimize all the way down to the hardware,” Leitersdorf said. “By being so vertically integrated, we’re able to be more than an order of magnitude cheaper than anyone else in the industry in order to run these models.”

The startup’s models are so efficient, per Leitersdorf, that it has burned through “drastically less” than $100 million in its lifetime.

Oasis 3 generates physically accurate, multi-camera environments — one front-facing and two-side facing — for training and testing systems. And instead of offering limited demos and research previews, Decart allows developers to generate scenarios infinitely, which is perfect for autonomous vehicle developers looking to try as many edge cases as possible.

Compared to other models I’ve tried, like Google’s Genie 3 or World Labs’s Marble, Oasis 3 delivers the most photorealistic environments from a single text prompt I’ve seen. And the fact that you can interact with them for hours suggests a level of efficiency that Decart’s rivals might lack.

But by letting you generate a world for so long, the model also degrades significantly.

0 seconds of 1 minute, 27 secondsVolume 90%

Press shift question mark to access a list of keyboard shortcuts

00:00

01:27

01:27

In my testing, I found the system could consistently set up a strong initial scene that matches the prompt, but the thematic integrity degraded rapidly as I moved through the world. I prompted it to generate a New York City street in the morning, it did so, beautifully. But as I drove along, the environment looked less like New York and more like a standard version of any urban, Western city.

When I tried to turn around and make my way back to the initial intersection, it was gone, replaced by an entirely new environment. On top of that, the controls aren’t very responsive, and I often lost control over where the car was moving (again, a drawback shared by other world models I’ve tested). The experience felt less like a coherent simulation and more of a dream-like, disjointed stream of consciousness that quickly grows nonsensical.

Another issue, which I’ve also seen in other world models, is that the car will just drive through other cars, meaning the model doesn’t simulate physics properly in the environment. Leitersdorf calls this a “major research problem that we’re cracking now,” attributing it to the fact that “there’s drastically more data on good driving compared to accidents.”

Part of what makes this physics consistency difficult is fundamental to how this world model works. Oasis 3 is auto-regressive, meaning it generates one frame at a time, and looks back at what it previously generated to decide what comes next. This is a key architectural feature of many world models, and it is a compute-intensive one, too.

In order to maintain consistency, Leitersdorf says the Decart team is working to improve the length of the model’s memory.

“Every frame we generate is roughly 8,000 tokens,” he said. “Generating this at tens of frames per second — that’s hundreds of thousands of tokens per second. The context window fills up very quickly. We’re researching how to do longer context to store millions more tokens, and how to compress the memory into fewer tokens.”

Leitersdorf thinks the consistency issue might be partially solved in the model’s next version, which will allow users to start generating worlds based on a video of an environment rather than an image. He acknowledged that world models as a field are still early.

Still, the founder is less focused on the current limitations of his tech than what will happen when developers get their hands on it.

“It takes me back to the early days of LLMs, when OpenAI invented the API for models,” he said, pointing to the emergence of a developer community that advanced the field by finding and building new use cases.

“When we talk again in three months, we’ll be like, ‘Here’s 100 developers that all built 100 different applications with Oasis that surprised all of us,’” he said.

*When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.*

この記事をシェア

関連記事

TLDR AI★42026年6月17日 09:00

Qwen の具現化された世界モデル(28 分読了)

アリババ傘下の通義千問チームが、物理世界をシミュレートする新しい「具現化された世界モデル」を発表し、AI が現実環境を理解・予測する能力の向上を示した。

MarkTechPost★42026年6月17日 01:51

Qwen ロボットスイートの紹介:VLA 操作、動画世界モデル、ナビゲーションの 3 つの身体型 AI モデル

Qwen チームは、Qwen3.5-4B を基盤とする操作モデル「Qwen-RobotManip」、60 レイヤーの MMDiT を備えた動画世界モデル「Qwen-RobotWorld」、および Qwen3-VL に基づくナビゲーションモデル「Qwen-RobotNav」からなる 3 つの身体型 AI モデルをリリースした。

Ars Technica AI★42026年6月2日 02:41

15時間から1分へ:AI/MLがGMの開発を加速させる方法

元テスラおよびオーロラの最高製品責任者であるスターリング・アンダーソン氏が、ゼネラルモーターズの最高製品責任者に就任し、同社が開発設計の第3期へと移行する中で、AIと機械学習が開発プロセスを劇的に短縮している状況を報告した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む