#robotics のAIニュース
31件の記事
LLM がロボットに曖昧な指示の理解と重要詳細への集中を支援
大規模言語モデル(LLM)が、ロボットに対して人間のような「見せて教える」手法を通じて曖昧な指示を理解させ、重要な詳細に焦点を当てる能力を向上させる技術を開発した。
MIT の新チップが複雑な環境を移動する小型ロボットの支援へ
MIT の研究者が開発した新チップは、LED1 個分の電力でリアルタイムに詳細な 3D マップを作成し、バッテリー制限のある小型自律型ロボットや UAV が複雑な環境でも障害物を回避して安全に移動できるようにする。
AI コーディングエージェントがロボットに GPU 取り付けやジップタイ切断を教示
Ars Technica は、計算リソースとトークン予算を与えられた AI コーディングエージェントが、自律的にロボットアームの訓練プログラムを策定し、GPU の挿入やジップタイの切断といった物理作業を習得した事例を紹介している。
自己駆動型ラボ:Joseph Krause氏、Radical AIについて語る
Latent Space の Science ポッドキャストで、Joseph Krause 氏が Radical AI を紹介し、材料科学における AI の加速課題や複雑な変数の重要性を解説した。
Hugging Face Hub からロボットハードウェアへ:Strands Agents と LeRobot の連携
Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。
AI が鍵の置き場所を特定できるか?
MIT の研究者が、ロボットが複雑な大規模環境の詳細な心理モデルを迅速に形成・想起できる長期記憶フレームワークを開発した。これにより、人間と並んで働くロボットの空間時間的記憶能力が向上する可能性がある。
Qwen の具現化された世界モデル(28 分読了)
アリババ傘下の通義千問チームが、物理世界をシミュレートする新しい「具現化された世界モデル」を発表し、AI が現実環境を理解・予測する能力の向上を示した。
Qwen ロボットスイートの紹介:VLA 操作、動画世界モデル、ナビゲーションの 3 つの身体型 AI モデル
Qwen チームは、Qwen3.5-4B を基盤とする操作モデル「Qwen-RobotManip」、60 レイヤーの MMDiT を備えた動画世界モデル「Qwen-RobotWorld」、および Qwen3-VL に基づくナビゲーションモデル「Qwen-RobotNav」からなる 3 つの身体型 AI モデルをリリースした。
想像に預けられ、行動のために微調整:ワールド・アクションモデルの台頭
NVIDIA は、事前学習されたビジョン言語モデルを基盤とし、ロボット制御に適応させた「ワールド・アクションモデル(WAM)」という新しい技術の登場を発表した。これは、視覚と言語を理解する能力を行動計画に転用するアプローチである。
ジェフ・ベゾスの新スタートアップ「プロメテウス」の事業内容
ジェフ・ベゾスが共同 CEO を務める新スタートアップ「プロメテウス」は、大規模言語モデルなどの深層学習技術をロボットや製造業に応用する「物理 AI」に注力しており、新たな資金調達によりその詳細が明らかになった。
ジェフ・ベゾスの AI スタートアップが「人工一般エンジニア」の構築を目指す
Amazon の創業者であるジェフ・ベゾスが、物理製品の設計を支援する AI 駆動型エンジニアリングツールの開発を目指す新スタートアップ「プロメテウス」を立ち上げたと報じられている。
ジェフ・ベゾスの Prometheus が物理世界向け「人工一般エンジニア」構築に 120 億ドルを調達
ジェフ・ベゾスが設立した Prometheus は、物理世界で動作する人工一般エンジニアの構築を目指し、120 億ドルの資金調達を実現しました。
Amazon SageMaker AI で NVIDIA Isaac Lab を活用し、ロボット強化学習のスケールアップを実現
AWS は、物理的AIの実用化に向け、Amazon SageMaker AI上でNVIDIA Isaac Labを活用することで、複雑なロボットの強化学習を高速化するソリューションを発表した。
欧州におけるロボティクスの未来を推進する
Google DeepMind は、欧州のロボティクス分野の発展を支える取り組みを発表した。
実世界における自律型 AI の基盤
Amazon Science は、2026 年に AI が単なる知識を持つモデルから、物理世界で計画・ツール使用・多段階タスク実行を行う自律型エージェントへと転換する決定的な変化が訪れると発表しました。
インターネット上で話題となっている人型ロボットへの懐疑論者のガイド
テック企業が披露する人型ロボットのアクロバットや家事の実演は、実世界での信頼性のある反復作業にはまだ大きな隔たりがあることを示している。
NVIDIA Cosmos 3 の登場:物理 AI の推論と行動のための初のオープンオムニモデル
NVIDIA が、物理世界の推論と行動を担うための最初のオープンソース型オムニモデル「Cosmos 3」を発表した。この新モデルは、AI が現実世界を理解し、動作する能力を強化する基盤技術として期待されている。
NVIDIA Cosmos 3 で物理 AI の推論・世界モデル・行動モデルを開発する
NVIDIA は、ロボットや自律走行車などが現実世界を理解して動作するために必要な物理 AI の推論、世界モデル、行動モデルを構築できる「Cosmos 3」を発表した。
テック企業があなたの家事を撮影することに必死になっている理由
AI学習スタートアップのShiftは、ニューヨークやロンドンで無料で清掃サービスを提供する代わりに、利用者の自宅での様子を撮影してデータ収集を行う計画を発表した。
ロボット学習用データ収集のため全記録を条件に無料清掃を提供するスタートアップ
ドイツのスタートアップ「MicroAGI」は、ニューヨーク市住民に対し、清掃員がカメラを着用して作業をすべて録画し、そのデータをAI搭載ロボットの訓練に使用することを条件に、無料で自宅清掃サービスを提供すると発表した。
マルチエージェント・ワールドモデル(3 分で読める)
TLDR AI が、複数のエージェントが協調して環境をシミュレーションする「マルチエージェント・ワールドモデル」に関する解説記事を公開しました。
実世界のための AI:ヤン・ルコン氏との対談(12 分読了)
ヤン・ルコン氏は、現在の大規模言語モデルが人間レベルの知能には至らないとし、物理法則や因果関係を学習する「ワールドモデル」に基づく次世代 AI の必要性を説いた。
実世界で動作するロボットのためのオープン基盤「MolmoAct 2」の発表
AI研究所が、実世界のロボットタスクにおける高速かつ強力な 3D 行動推論を実現する完全オープン型のロボティクス基盤モデル「MolmoAct 2」と、二足歩行操作のための大規模データセットを公開した。
AI エンジニア世界博覧会、第 2 回スピーカー募集を開始
AI エンジニアリング(AIE)が主催する「AI Engineer World's Fair」が、夏季開催に向けて第 2 回のスピーカー募集を開始しました。同イベントは、自己研究やメモリ機能、世界モデルなどの新分野に焦点を当てています。
人手不足解消のため、東京空港で人型ロボットが手荷物仕分けテストを開始
日本航空は、訪日客の増加による人手不足を解消するため、2026年5月に羽田空港で人型ロボットを用いた手荷物仕分けの実証実験を開始する。将来的には機内清掃や地上支援機器の操作など幅広い業務への展開も検討されている。
NVIDIA Cosmos World Foundation Modelsによる合成データのスケーリングと物理AI推論
NVIDIAは、人型ロボットや自動運転車などの次世代AI駆動ロボット向けに、高忠実度で物理法則を考慮した合成データ生成と推論を可能にする「Cosmos World Foundation Models」を発表した。
MolmoBot:シミュレーションのみで学習するロボット操作モデル
MolmoBotは、シミュレーション環境のみで学習されたオープンソースのロボット操作モデルスイートです。実世界データの収集や微調整を行わずとも、ゼロショットで実機への転移を実現します。
Mentor PiメカナムホイールをROS 2で動作させる〜macOS上でのシミュレーション環境構築とフロンティアベース探索による検証
ABEJAのインターン生が、メカナムホイール搭載ロボット「Mentor Pi」をROS 2で制御し、macOS上でシミュレーション環境を構築して自律探索を実証した。
モラベックのパラドックスの事実確認
著者はYouTubeチャンネルでAI開発を分析し、最近の動画で「人間には難しいタスクはAIに簡単」とされるモラベックのパラドックスを検証した。その結果、このパラドックスは多くの研究者が繰り返すものの、実証試験が行われていないことが判明した。
π0シリーズで使用されるaction expertをコードレベルで理解する
ABEJAのデータサイエンティストが、π0シリーズのaction expertの仕組みを、openpiの実装コードを基に解説するブログ記事。
初心者向けガイド:VLAでtoioを操作する
ABEJAの飯嶌が、高価なロボットアームではなくtoioを使い、低コストでVLA(Vision-Language-Action)の検証環境を構築する方法を紹介。Physical AIの実証実験のハードルを下げる取り組み。