AI が自らを構築し始めたとき、何が起きるのか?
Richard Socher が率いるスタートアップ「Recursive Superintelligence」が、6.5億ドルの資金調達とともに、人間を介さずに自ら弱点を特定し改善する再帰的自律型AIの実現に向けた画期的なアプローチを発表した。
キーポイント
再帰的自己改善の定義と目標
単なる改良ではなく、アイデア立案から実装、検証までの全プロセスを自動化し、AIが自らの限界を認識して自己改変する「真の再帰的スーパーインテリジェンス」の実現を目指す。
オープンエンドネス技術の活用
Google DeepMind出身の共同創設者らが、生物進化のような適応プロセス(環境への適応と逆適応)を模倣する「オープンエンドネス」技術を核に据え、無限の可能性を持つAI開発を実現しようとしている。
業界のパラダイムシフト
製品化よりも研究そのものにリソースを集中させる「ネオラボ」の概念を超え、AIが自律的に研究を行う新しいフェーズへの移行を示唆する重要な発表となった。
AI による共進化型レッドチーム
複数の AI が互いに攻撃と防御を繰り返す「レインボートーミング」により、人間よりも効率的に脆弱性を発見し、AI の安全性を高めています。
知能の限界は遠く、改善は継続する
現在の AI にはまだ知能の上限(アストロノミカルな限界)から程遠い余地があり、プログラミングや数学などの能力向上は永遠に続く可能性があります。
新ラボは製品化と社会貢献を重視
既存大手とは異なるアプローチとして「オープンエンドネス」を掲げつつ、単なる研究機関ではなく、人々に愛される実用的な製品の開発に注力しています。
製品化のタイムライン短縮
チームの進捗により当初想定していたよりも早く、数年ではなく数クォーターで製品が提供される見込みです。
影響分析・編集コメントを表示
影響分析
この記事は、AI開発のパラダイムが「人間による設計・改善」から「AI自身による完全自律的進化」へと移行する可能性を示す画期的な出来事である。6億5000万ドルという巨額の資金と、Richard Socherらトップ研究者の参画により、再帰的自己改善の実現に向けた競争が激化し、AGI(汎用人工知能)到達への道筋に新たな変数が加わった。
編集コメント
「AIがAIを作る」というSF的な概念が、具体的な資金と技術ロードマップを伴って現実味を帯びてきた。これは単なる研究発表ではなく、AGI到達のタイムラインを劇的に短縮させる可能性のある転換点となるだろう。
リチャード・ソチャーは、長年にわたり AI の主要人物の一人であり、初期のチャットボットスタートアップ You.com を設立したことで最もよく知られています。その前には ImageNet に関する彼の業績が挙げられます。さて、彼は現在、研究に焦点を当てた AI スタートアップの新世代に加わり、サンフランシスコを拠点とする Recursive Superintelligence というスタートアップに参加しました。この企業は水曜日にステルスモードから脱却し、6億5000万ドルの資金調達を発表しました。
ソチャーには、ピーター・ノヴィグや Cresta の共同創設者であるティム・シーら、著名な AI 研究者たちが新事業に参加しています。彼らは再帰的に自己改善を行う AI モデルの構築に取り組んでおり、これは人間が関与することなく、自ら弱点を特定し、それを修正するために自身を再設計できるモデルです。これは現代の AI 研究において長年追求されてきた聖杯とされています。
私はローンチ後に Zoom で彼にインタビューを行い、Recursive の独自技術的アプローチや、なぜこの新プロジェクトを「ネオラボ(研究よりも製品構築を優先する新世代の AI スタートアップに対する非公式な呼称)」とは考えていないのかについて掘り下げました。
本インタビューは、長さの調整と明瞭化のために編集されています。
最近では再帰性(recursion)についてよく耳にしますが、さまざまなラボで非常に一般的な目標のように感じられます。あなたにとって独自のアプローチは何だとお考えですか?
私たちのユニークなアプローチは、誰もまだ達成していない再帰的自己改善へと至るためにオープンエンドネスを利用することです。これは多くの人にとって掴みどころのない目標です。多くの人は、単に自動研究を行うだけでそれが起こるとすでに考えています。つまり、AI を使って何か他のものをより良くするように依頼できるということです。それは機械学習システムでも、あなたが書く手紙でも、あるいは何であれ構いませんが、しかしそれは再帰的自己改善ではありません。それは単なる改善です。
私たちの主な焦点は、スケーラブルに真の再帰的自己改善型スーパーインテリジェンスを構築することであり、これは研究アイデアの立案、実装、検証のプロセス全体が自動化されることを意味します。
まず [AI 研究アイデアを自動化し]、最終的にはあらゆる種類の研究アイデア、さらには物理的領域におけるものさえも自動化します。しかし、特に強力なのは AI が自分自身に取り組む場合であり、その際、自身の欠点に対する新たな自己認識の感覚を発展させることです。
あなたは「オープンエンドネス」という用語を使いましたが、それは特定の技術的な意味を持っていますか?
もちろんです。実際、共同創設者の一人である Tim Rocktäschel は、Google DeepMind でオープンエンドネスと自己改善チームを率い、特に世界モデル Genie 3 に取り組んでいました。これはオープンエンドネスの素晴らしい例です。あらゆる概念、あらゆる世界、あらゆるエージェントを指定するだけで、AI がそれを作成し、対話的に動作します。
生物進化において、動物は環境に適応し、その後他の生物がその適応に対して逆適応します。これは数十億年にもわたって進化し続けるプロセスであり、面白いことが次々と起こり続けますよね?これが私たちが[頭]に目を持つようになった理由です。
もう一つの例として、Tim による別の論文から「レインボー・ティーミング(rainbow teaming)」があります。レッド・ティーミング(red teaming)という言葉を聞いたことがありますか?
サイバーセキュリティにおいて、これは--
つまり、大規模言語モデル(LLM: Large Language Model)の文脈でもレッド・ティーミングを行う必要があります。基本的には、LLM に爆弾の作り方を教えるように仕向けようとし、それが実行されないことを確認します。
現在、人間が長時間座って、AI が言うべきではない面白い例を思いつくことができます。しかし、もしこの最初の AI を別の AI でテストし、その第二の AI の任務が第一の AI に[可能な限り]あらゆる悪いことを言わせるように仕向けることだとしたらどうでしょうか?そして、それらは数百万回の反復で互いに攻防を繰り広げます。
実際には、2 つの AI が共進化(co-evolution)するようにすることも可能です。一方が他方を攻撃し続け、単一の角度だけでなく多くの異なる角度から攻め立てるのです。これが「レインボー」という比喩の由来です。そして第一の AI を免疫させることで、私たちはより安全になっていきます。これは Tim Rocktaeschel 氏のアイデアであり、現在は主要な研究ラボすべてで採用されています。
いつ完了したと判断すればよいのでしょうか?おそらく、それは決して完了することはないでしょう。
これらのことのいくつかは決して達成されないでしょう。あなたは常により知的になることができます。プログラミングや数学などにおいて、常に向上することができます。知性にはある程度の限界がありますが、私は現在それらを形式化しようとしています。しかし、その限界は天文学的な規模です。私たちはその限界から非常に遠く離れています。
ネオラボ(新世代の研究所)として、主要な研究所が取り組んでいない何かを行うべきだと感じます。つまり、主要な研究所が現在のやり方では RSI [再帰的自己改善] に到達しないと考えているという含意があるのでしょうか?それは公平な指摘でしょうか?
彼らが何をしているかについてはコメントできませんが、私たちは異なるアプローチでこれに近づいていると思います。私たちはオープンエンドネス(開放性)の概念を真に受け入れ、チームはこのビジョンに完全に集中しています。このチームは過去 10 年間、この分野の研究を行い、論文を発表してきました。また、この分野を大きく前進させ、実際に製品をリリースしてきた実績があります。例えば、Tim Shi は Cresta をユニコーン企業へと成長させました。Josh Tobin は OpenAI の初期メンバーの一人であり、後に Codex チームや深層研究チームを率いました。
私は実際、時折この「ネオラボ」というカテゴリに少し違和感を覚えます。私たちは単なる研究所ではないと感じています。私たちは本当に持続可能な企業となり、人々が愛用し、人類に対してポジティブな影響を与える素晴らしい製品を持つことを目指しています。
では、最初の製品のリリースはいつ予定されていますか?
私はそれを何度も考えました。チームは非常に多くの進歩を遂げ、当初想定していたスケジュールよりも前倒しできるかもしれません。しかしはい、製品は登場しますし、数年待つ必要はなく、数四半期待てばよいことになります。
再帰的自己改善に関するアイデアの一つに、このようなシステムが完成すれば、計算リソースこそが唯一重要な資源となるというのがあります。システムをどれだけ高速で実行するかによって、その改善速度が決まり、外部の人間の活動が実質的な違いをもたらすことはありません。つまり競争は、「どれだけの処理能力をこの目的に投入できるか」という点に集約されます。私たちが向かっている世界がまさにそのようなものだとお考えですか?
計算リソースを過小評価してはいけません。将来、非常に重要な問いとなるのは、「人類はどの問題を解決するために、どれだけ計算リソースを投じるべきか」です。例えば、このがんやあのウイルスがあります。どちらを先に解決したいですか?それにどれだけの計算リソースを与えますか?最終的には資源配分の問題となります。これは世界で最も大きな課題の一つになるでしょう。
*当記事内のリンクを通じてご購入いただいた場合、私たちは少額のコミッションを受け取る可能性があります。ただし、これは当社の編集の独立性には影響しません。*
原文を表示
Richard Socher has been a major figure in AI for some time, best known for founding the early chatbot startup You.com and, before that, his work on Imagenet. Now, he’s joining the current generation of research-focused AI startups with Recursive Superintelligence, a San Francisco-based startup that came out of stealth on Wednesday with $650 million in funding.
Socher is joined in the new venture by a cohort of prominent AI researchers, including Peter Norvig and Cresta co-founder Tim Shi. Together, they’re working to create a recursively self-improving AI model, one that can autonomously identify its own weaknesses and redesign itself to fix them, without human involvement — a long-held holy grail of contemporary AI research.
I spoke with him on Zoom after the launch, digging into Recursive’s unique technical approach and why he doesn’t think of this new project as a neolab, the informal term for a new generation of AI startups that prioritize research over building products.
This interview has been edited for length and clarity.
We hear a lot about recursion these days! It feels like a very common goal across different labs. What do you see as your unique approach?
Our unique approach is to use open-endedness to get to recursive self-improvement, which no one has yet achieved. It’s an elusive goal for a lot of people. A lot of people already assume it happens when you just do auto-research. You know, you can take AI and ask it to make some other thing better, which could be a machine learning system, or just a letter that you write, or, you know, whatever it might be, right? But that’s not recursive self-improvement. That’s just improvement.
Our main focus, is to build truly recursive, self-improving superintelligence at scale, which means that the entire process of ideation, implementation and validation of research ideas would be automatic.
First [it would automate] AI research ideas, eventually any kind of research ideas, even eventually in the physical domains. But it's particularly powerful when it's AI working on itself, and it's developing a new kind of sense of self awareness of its own shortcomings.
You used the term open-ended — does that have a specific technical meaning?
It does. In fact, Tim Rocktäschel, one of our cofounders, led the open-endedness and self-improvement teams at Google DeepMind and particularly worked on the world model Genie 3, which is a great example of open-endedness. You can tell it any concept, any world, any agent, and it just creates it, and it's interactive.
In biological evolution, animals adapt to the environment, and then others counter-adapt to those adaptations. It's just a process that can evolve for billions of years, and interesting stuff keeps happening, right? That's how we developed eyes in our [heads].
Another example is rainbow teaming, from another paper from Tim. Have you heard of red teaming?
In cybersecurity, it means--
So, red teaming also has to be done in an LLM context. Basically you try to get the LLM to tell you how to build a bomb, and you want to make sure that it doesn’t do it.
Now, humans can sit there for a long time and come up with interesting examples of what the AI shouldn't say. But what if you tested this first AI with a second AI, and that second AI now has the task of making the first AI [try to] say all the possible bad things. And then they can go back and forth for millions of iterations.
You can actually allow two AIs to co-evolve. One keeps attacking the other, and then comes up with not just one angle but many different angles, and hence the rainbow analogy. And then you can inoculate the first AI, and you become safer and safer. This was an idea from Tim Rocktaeschel, and it’s now used in all the major labs.
How do you know when it’s done? I suppose it’s never done.
Some of these things will never be done. You can always get more intelligent. You can always get better at programming and math and so on. There are some bounds on intelligence; I’m actually trying to formalize those right now, but they’re astronomical. We’re very far away from those limits.
As a neolab, it feels like you’re supposed to be doing something that the major labs aren’t doing. So part of the implication here is that you don’t think the major labs are going to reach RSI [recursive self-improvement] by doing what they’re doing. Is that fair to say?
I can’t really comment on what they’re doing, but I do think we’re approaching it differently. We really embrace the concept of open-endedness, and our team is entirely focused on that vision. And the team has been researching this and doing papers in this space for the last decade. And the team has a track record of really pushing the field forward significantly and shipping real products. You know, Tim Shi built Cresta into a unicorn. Josh Tobin was one of the first people at OpenAI and eventually led their Codex teams and the deep research teams.
I actually sometimes struggle a little bit with this neolab category. I feel like we're not just a lab. I want us to be become a really viable company, to really have amazing products that people love to use, that have positive impact on humanity.
So when do you plan to ship your first product?
I’ve thought about that a lot. The team has made so much progress, we may actually pull up the timelines from what we had initially assumed. But yes, there will be products, and you’ll have to wait quarters, not years.
One of the ideas around recursive self-improvement is that, once we have this sort of system, compute becomes the only important resource. The faster you run the system, the faster it will improve, and there’s no outside human activity that will really make a difference. So the race just becomes, how much processing power can we throw at this? Do you think that’s the world we’re headed toward?
Compute is not to be underestimated. I think in the future, a really important question will be: how much compute does humanity want to spend to solve which problems? Here’s this cancer and here’s that virus — which one do you want to solve first? How much compute do you want to give it? It becomes a matter of resource allocation eventually. It’s going to be one of the biggest questions in the world.
*When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.*
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み