Qwen ロボットスイートの紹介：VLA 操作、動画世界モデル、ナビゲーションの 3 つの身体型 AI モデル

#Vision-Language-Action #Embodied AI #World Model #Qwen #Robotics

整理・翻訳:ainew.jp 編集システムAIによる自動処理作り方と限界

本文の状態

要点を先行公開

本文を取得できないため、要約と元記事への導線を掲載しています。

同じ出来事の情報源

この情報源を基点に整理

MarkTechPost

30秒でわかる

Qwen チームは、Qwen3.5-4B を基盤とする操作モデル「Qwen-RobotManip」、60 レイヤーの MMDiT を備えた動画世界モデル「Qwen-RobotWorld」、および Qwen3-VL に基づくナビゲーションモデル「Qwen-RobotNav」からなる 3 つの身体型 AI モデルをリリースした。