Databricks の元 AI 責任者、AI の電力使用量を 1,000 倍削減できると主張
Databricks の元 AI 責任者が、AI モデルの電力消費コストを最大で 1,000 倍削減する可能性のある新アプローチを提唱している。
キーポイント
電力効率の劇的向上目標
元 AI 責任者は、現在の AI インフラが抱える膨大な電力消費問題を解決し、コストを最大で 1,000 倍削減できる技術的可能性を示唆している。
計算効率の根本的再設計
従来のハードウェア依存や単純なスケーリングではなく、アルゴリズムやアーキテクチャの根本的な見直しを通じて、不要な計算を排除するアプローチが提案されている。
持続可能な AI 開発への転換
AI の普及に伴う環境負荷と運用コストの増大という課題に対し、技術革新による解決策を提示し、業界全体の持続可能性を高める方向性を示している。
影響分析・編集コメントを表示
影響分析
このニュースは、AI 業界が直面する最大のボトルネックの一つであるエネルギーコストと環境負荷に対する解決策の萌芽を示しています。もし提唱される技術が実現すれば、大規模モデルの開発・運用コストが劇的に低下し、より多くの企業や研究機関が AI を活用できる土壌が整う可能性があります。ただし、1,000 倍という数値は極めて野心的であり、実用化までの道のりと具体的な技術的詳細についてはさらなる検証が必要です。
編集コメント
AI の普及を阻む最大の障壁である「電力コスト」への挑戦は、業界の持続可能性にとって極めて重要です。1,000 倍削減という野心的な目標が実現可能な技術的根拠を含んでいるか、今後の詳細発表に注目すべきでしょう。
AI の次の画期的な発見に向けた動きは、非常に野心的なプロジェクトに資金を提供してきましたが、ある企業はこの機会を捉え、計算アーキテクチャを一から再構築しようとしています。
Databricks で元 AI 部門長を務めていた Naveen Rao が率いる Unconventional AI は、推論処理の電力効率を劇的に向上させることを約束しています。その秘密兵器は、振動子ベースの新しい計算アーキテクチャです。
木曜日、同社は初のモデル AI である「Un-0」を発表しました。これは画像生成システムツールであり、同社の技術が従来の AI システムをどのように再現できるかを初めて示すものです。併せて発表された新論文では、研究チームが新しいアーキテクチャのソフトウェアシミュレーションを用いて、最先端の拡散モデル(diffusion models)と同等の性能を発揮する完全な機能を持つ画像生成モデルを構築した方法を詳述しています。
「これは、新しい種類のコンピュータにおける『Hello World』です」と Rao は TechCrunch に語りました。「今後 1 年間で、この分野に関する非常に興味深いニュースが次々と発表されるようになるでしょう。」
新しい Un-0 モデルの出力は、Stable Diffusion や OpenAI の GPT Image 1 などの画像生成モデルの出力と似ています。印象深いのは、その性能に到達するプロセスです。このモデルは、従来のコンピューティングや伝統的な大規模言語モデル(LLM)を駆動するチップとは全く異なる、振子ベースのアーキテクチャに基づいて構築されています。振子ベースのコンピューティングの利点は複雑ですが、Rao 氏は最終的に電力使用量を最大で 1,000 倍削減できると信じています。
そこへ至るためのインフラストラクチャーの多くはまだ建設中です。現在の Un-0 のバージョンは、Unconventional の振子チップのソフトウェアシミュレーション上で動作しますが、同社はまもなく実際のチップのための設計図を公開する計画です。そこから先は、Unconventional AI が他のプロバイダーと同様に計算能力を提供するように、推論スタック全体を一から構築する計画です。
「私たちは自社のチップで構成される新しい種類のシステムを構築します」と Rao 氏は述べています。「そこで AI モデルを実行し、プロンプトが入力され推論結果が出力されるネットワークケーブルも用意しますが、電力消費は従来の 1/1000 で実現されます。」
これは驚くほど野心的な目標であり、特に従業員数がまだ 50 人未満の企業にとってはなおさらです。しかし、AI の構築規模と、増大する推論(inference)需要に応じるために予想されるコストを考慮すれば、この問題の規模に対応できる数少ない取り組みの一つとなる可能性があります。ラオ氏の見解では、今後数年間の AI にとって電力の利用可能供給量は重要な制約要因の一つとなり、Unconventional はそれを解決できる数少ないプロジェクトの一つです。
「AI のスケーリングが難しいのはエネルギーの問題 때문입니다。これが今後数年間の根本的な限界となります。それを越えることはできません。結局のところ、これはエネルギーに制限された問題になるのです」と彼は言います。
*当記事内のリンクを通じてご購入いただいた場合、私たちは少額のコミッションを受け取る可能性があります。これは私たちの編集の独立性には影響しません。
ラッセル・ブランドムは 2012 年以来テクノロジー業界を取材しており、プラットフォーム政策と新興技術に焦点を当てています。彼は以前 The Verge や Rest of World で勤務し、Wired、The Awl、MIT の Technology Review にも寄稿しています。
彼への連絡先は russell.brandom@techcrunch.com または Signal(412-401-5489)です。
原文を表示
The drive to discover the next big thing in AI has funded some pretty ambitious projects — but one company is taking it as a chance to rebuild computing architecture from the ground up.
Led by Naveen Rao, formerly the head of AI at Databricks, Unconventional AI promises to make inference processing vastly more power efficient. The secret weapon: a new kind of oscillator-based computer architecture.
On Thursday, the company released its first model AI — called Un-0 — an image-generation system tool that shows for the first time how the company’s technology can replicate conventional AI systems. In an accompanying new paper, the company’s research team details how they built a fully functional image-generation model using a software simulation of the new architecture — one that performs just as well as state-of-the-art diffusion models.
“This is the ‘hello world’ of a new kind of computer,” Rao told TechCrunch. “Over the next year, you’re going to start seeing some pretty interesting news around this.”
The output from the new Un-0 model is similar to that of image-generation models like Stable Diffusion or OpenAI’s GPT Image 1. The impressive part is how it arrives at that performance. The model is built on an oscillator-based architecture that is completely different from the chips that power conventional computing and traditional LLMs. The advantages of the oscillator-based computing are complex, but Rao believes it will ultimately reduce power use by as much as 1,000 times.
Much of the infrastructure to get there is still being built. The current version of Un-0 runs on a software simulation of Unconventional’s oscillator chips, but the company plans to release schematics for an actual chip soon. From there, the plan is to build an entire inference stack from the ground up, with Unconventional AI eventually supplying compute capacity just like any other provider.
“We will build a new kind of system composed of our chips,” says Rao. “We will run AI models there, and we will have a network cable where prompts come in and inferences go out, but it’ll be done at 1/1000 of power.”
It’s a stunningly ambitious goal, particularly for a company that still counts less than 50 employees. But given the scale of the AI buildout and the anticipated cost of meeting the growing demand for inference, it may be one of the few efforts to meet the scale of the problem. As Rao sees it, the available supply of power will be one of the hard limits for AI in the years to come — and Unconventional is one of the few projects able to address it.
“AI scaling is hard because of energy. It’s going to be the fundamental limit in the next few years. You just can’t go past it. It’s going to be an energy-limited problem, at the end of the day,” he says.
*When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.*
Russell Brandom has been covering the tech industry since 2012, with a focus on platform policy and emerging technologies. He previously worked at The Verge and Rest of World, and has written for Wired, The Awl and MIT’s Technology Review.
He can be reached at russell.brandom@techcrunch.com or on Signal at 412-401-5489.
関連記事
フルスタック推論・学習最適化による AI ファクトリのエネルギー効率最大化
NVIDIA は、AI ファクトリ全体のエネルギー効率を向上させるため、推論と学習の両面で最適化手法を提案している。
NVIDIA TensorRT を用いた複数 GPU での AI 推論のスケーリングとマルチデバイス推論サポートの紹介
NVIDIA は、TensorRT の新機能であるマルチデバイス推論サポートを活用し、複数の GPU にわたって AI 推論を効率的にスケーリングする手法を発表した。これにより大規模モデルの実行性能が向上する。
IBM、世界初のサブ1ナノメートルチップ技術を主張
IBMは、AIデータセンター向けに世界初のサブ1ナノメートルチップ技術を開発し、人差し指の爪ほどのサイズに約1000億個のトランジスタを実装した。これにより、前世代比でトランジスタ密度がほぼ倍増し、計算性能とエネルギー効率が大幅に向上した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み