プロジェクトフェッチ
フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。
キーポイント
Claudeによるロボット制御実験で、AI非利用チームに比べタスク完了時間が約半分に短縮された
AIアクセスがチームの士気と協働動態に影響を与え、AI利用チームはAIとのパートナーシップで作業を進めた
フロンティアAIモデルが未知のハードウェアと相互作用することで、物理世界への影響力が急速に進展する可能性を示した
影響分析・編集コメントを表示
影響分析
この実験は、大規模言語モデルが単なるデジタルツールを超えて、物理世界のロボット制御という実践的課題に直接貢献できることを実証した。AIと人間の協働によるロボティクス開発の加速化と、デジタル・物理世界の統合に向けた重要な一歩を示している。
編集コメント
AIがコード生成だけでなく物理世界のロボットを直接制御できる可能性を示した点が画期的。実験中のロボット暴走エピソードは、AI統合時の安全対策の重要性も浮き彫りにしている。
プロジェクト・フェッチ:AIクロードはロボット犬を訓練できるか?
先進的なAIモデルであるクロードが、コンピューターの枠を超えて物理世界にどのように影響を与えうるかを探るため、アンソロピック社は実験「プロジェクト・フェッチ」を実施した。その核心は、ロボット工学の専門家ではない8名の社内研究者を、AIクロードの利用が可能なチームと不可能なチームの2つに無作為に分け、四足歩行ロボット(ロボット犬)にビーチボールを回収させるプログラムを作成するという複雑な課題に取り組ませることだった。
実験の結果、AIを活用したチームは、AIなしのチームに比べて、平均して約2倍の速さで課題を達成し、より多くのタスクを完了させた。特に、ボールを完全自律的に回収するという最終目標に向けた実質的な進展を見せたのは、クロードを利用したチームのみであった。このことから、現在のAIでもロボット制御という物理的課題に対して、大幅な能力向上(AIアップリフト)をもたらしうることが示された。
さらに顕著だったのは、チームの士気と作業動態への影響である。AIを利用できなかったチームは、より多くの否定的な感情や混乱を表明し、その代わりにメンバー同士で活発に質問をし合う様子が見られた。一方、クロードを利用したチームのメンバーは、互いにではなく、AIをパートナーとして協働する形で作業を進める傾向が強かった。
実験は、AIの関与がもたらす思わぬハプニングも浮き彫りにした。クロードチームが、プログラムの算術的ミスによりロボットを暴走させ、もう一方のチームの作業テーブルに突進させるという出来事が発生したのである。これは、AIが生成したコードを人間が十分に検証・監視することの重要性を痛感させるエピソードとなった。
本実験は、AIエージェントの行動範囲がコード作成などのデジタル領域に留まらず、未知のハードウェアと相互作用することで物理世界に直接影響を与える可能性が、モデルの進化に伴い急速に高まりうることを示唆している。以前の実験「プロジェクト・ヴェンド」では、AIの物理世界への関与が人間の労働を介して行われたのに対し、今回はより直接的な制御を試みた。AIが現実世界と「橋渡し」する能力は確かに存在し、その可能性とともに、安全性や人間の役割に関する新たな課題も明らかになりつつある。
原文を表示
red.anthropic.com Project Fetch: Can Claude train a robot dog?
How could frontier AI models like Claude reach beyond computers and affect the physical world? One path is through robots. We ran an experiment to see how much Claude helped Anthropic staff perform complex tasks with a robot dog.
We randomly divided eight Anthropic researchers (none of whom were robotics experts) into two teams—one with Claude access, one without—and asked them to program quadruped robots to fetch beach balls.
Team Claude accomplished more tasks and completed them faster on average—indeed, Team Claude succeeded in about half the time it took Team Claude-less. Only Team Claude made substantial progress toward the final goal: programming the robot to fully autonomously retrieve the ball.
Access to AI also affected team morale and dynamics. Team Claude-less expressed more negative emotion and confusion, but also asked one another more questions. Team Claude’s members largely worked in partnership with the AI.
This experiment demonstrated substantial AI uplift in robotics—bridging digital and physical worlds. As models improve, their ability to affect the physical world by interacting with previously-unknown hardware could advance rapidly.
Gathered around a table in a warehouse, looking at computer screens with code that refused to work, with no access to their trusted AI assistant Claude, our volunteer researchers did not expect to be attacked by a four-legged robot.
Yet as the mechanical whirring and rubberized footfalls grew louder, the humans startled. They had been trying, without success, to establish a connection between their computers and a robotic quadruped—a “robodog.” Meanwhile, the competing team on the other side of the room had long since done so and were now controlling their robot with a program largely written by Claude. But in an all-too-human error of arithmetic, Team Claude had instructed their robodog to move forward at a speed of one meter per second for five seconds—failing to realize that less than five meters away was the table with the other team.
The robot did as it was instructed, careening toward the hapless coders. The event’s organizer managed to grab hold of the robot and power it off before any damage was done to robots, tables, or human limbs. The morale of the inadvertently targeted team, however, did not escape unscathed.
At this point, you might be asking…
A common question about the impact of AI is how good it will be at interacting with the physical world. Even as we enter the era of AI agents—which take actions instead of just providing information—these actions are largely digital, such as writing code and manipulating software. We’ve previously explored how AI can bridge the digital-physical divide in a limited way with Project Vend, where we had Claude run a small shop in Anthropic’s office.
In that experiment, AI’s interaction with the real world was mediated by human labor. In this robodog experiment, we took a natural next step and used robots instead of people to tackle a different challenge.
One way of understanding and tracking the capabilities of AI models is to run an “uplift” study. These experiments randomly divide participants into two groups—one with access to AI and one without—and measure the difference in task performance between them (we’ve used this methodology extensively in our work on AI and biological risk). The difference between the groups is the “uplift”—the advantage (if any) provided by AI. Measuring uplift tells us about the present ability of AI to augment human performance. It’s also suggestive of the future domains in which AI will be able to successfully perform tasks on its own.
To run our experiment, we recruited eight Anthropic researchers and engineers, none of whom had extensive prior experience with robots.[1] We randomly selected four to be on “Team Claude” and four to be on “Team Claude-less.” Then, we asked each team to operate a quadruped robodog in three increasingly difficult phases. In all phases, the core task they were being evaluated against was simple: get the robodog to fetch a beach ball.
We do not expect robotic fetch to prove so economically valuable that it shows up as a task on a future version of our Anthropic Economic Index. So why are we doing this?
First, it builds on our previous research. One of the evaluations we use to assess the ability of Claude to contribute to AI R&D is a test of its ability to train a machine learning model that could be used to control a quadruped robot. We’ve previously evaluated the resulting algorithm using simulations, which have shown that Claude is not yet at the point where it can handle this task truly autonomously.[2] This meant that this task was well suited to a trial that combined AI with human help. We could also be confident our experiment would be useful to repeat in the future: there is still a lot of room for models to improve on robotics.
Another reason is practical. It’s
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み