AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月18日 03:59·約1分で読める

Google DeepmindのGemini Robotics-ER 1.6がロボットの計画・知覚能力を向上

#ロボティクスAI#マルチモーダル知覚#計画生成#産業用ロボット#Google DeepMind#実世界AI
TL;DR

Google DeepMindのGemini Robotics-ER 1.6は、計測器の読み取り能力を新たに獲得し、ロボットの計画と知覚をより精密にする脳を提供する。

AI深層分析2026年4月18日 04:40
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

計画と行動の精度向上

Gemini Robotics-ER 1.6は、ロボットがより正確に計画し行動できるように支援する。

2

新たな計測器読み取り能力

ロボットが計測器(メーターやゲージなど)を読み取る能力を新たに獲得した。

3

知覚機能の強化

ロボットの知覚(perception)能力がより鋭敏(sharper)になった。

4

Google DeepMindによる開発

この技術はGoogleのAI研究部門であるDeepMindによって開発された。

影響分析・編集コメントを表示

影響分析

この技術は、ロボットがより複雑な実世界タスク(工場での品質検査、インフラ点検、医療現場での計測など)を自律的に実行する能力を大幅に向上させる可能性がある。特に計測器読み取り機能の追加は、従来の視覚認識を超えた実用的な応用範囲の拡大を示しており、産業用ロボットの次世代進化に寄与する重要な一歩と言える。

編集コメント

計測器読み取りという具体的な機能強化に焦点を当てた実用的なアップデートであり、研究段階から実応用への橋渡しとして注目される。ただし、詳細な技術仕様や実証データが記事に含まれていない点は残念。

Google Deepmindは、ロボットにおける具現化推論(embodied reasoning)のためのアップグレード版モデル「Gemini Robotics-ER 1.6」をリリースした。これは高レベルの思考層として機能し、ロボットが周囲を理解しタスクを自律的に計画するのを支援する。必要に応じてGoogle Searchやビジョン・ランゲージ・アクションモデル(vision-language-action models)などのツールを活用する。Deepmindによると、新バージョンは物体の指し示し、カウント、タスク実行の成功認識において、Gemini Robotics-ER 1.5およびGemini 3.0 Flashの両方を上回る性能を示している。

Boston Dynamicsとの共同開発による、圧力計や視察鏡などの計器の読み取り機能も大幅に強化された。このモデルはエージェント型画像処理(agentic image processing)とコード実行を組み合わせる:表示の小さな詳細を捉えるためにズームインし、指し示し機能とコードを用いて比率や距離のスケールを計算した上で、世界知識を適用して数値を読み取る。Boston DynamicsのSpot robotは、この機能をシステム点検に使用していると報告されている。

本モデルはGemini APIおよびGoogle AI Studioを通じて利用可能であり、開発者向けにはColabのサンプルも提供されている。

AI News Without the Hype – Curated by Humans

THE DECODERに登録して、広告なしの読書体験、週刊AIニュースレター、年6回の限定「AI Radar」フロンティアレポート、アーカイブ全文へのアクセス、およびコメント欄への参加を楽しんでください。

Subscribe now

原文を表示

Google Deepmind has released Gemini Robotics-ER 1.6, an upgraded model for embodied reasoning in robots. It acts as a high-level thinking layer that helps robots understand their surroundings and plan tasks on their own, tapping tools like Google Search or vision-language-action models when needed. Deepmind says the new version beats both Gemini Robotics-ER 1.5 and Gemini 3.0 Flash at pointing to objects, counting, and recognizing successful task execution.

Reading instruments like pressure gauges and sight glasses, a capability developed with Boston Dynamics, has also seen a major boost. The model pairs agentic image processing with code execution: it zooms in to catch small display details, uses pointing functions and code to calculate proportions and scale distances, then applies world knowledge to interpret the reading. Boston Dynamics' Spot robot reportedly uses the feature for system inspections.

The model is available through the Gemini API and Google AI Studio, with a Colab example for developers.

AI News Without the Hype – Curated by Humans

Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.

Subscribe now

この記事をシェア

関連記事

HEROZ Tech Blog★32026年4月14日 15:25

S2S APIを比較して分かった実務的な選び方

本記事は、主要なS2S(Speak-to-Speak)APIモデル(GPT・Gemini・Nova)を体験品質・知能性能・レイテンシ・実装面で比較し、実務的な選び方を整理している。

The Batch★32025年9月3日 09:00

ジェミニの環境影響、中国の新興AIハブ、チャットボットによる採用面接、エージェントのセキュリティ

The Batch AI News and Insightsが、AIを理解する開発者の需要が未充足であると報告した。

Google DeepMind★42026年4月14日 00:52

Gemini Robotics-ER 1.6:強化された身体化推論による実世界ロボットタスクの実現

GoogleのGemini Robotics ER 1.6は、空間推論と多視点理解を強化し、自律ロボットの実世界タスク遂行能力を向上させる技術を発表した。

ニュース一覧に戻る元記事を読む