AI 計算資源の探索が、次の Cerebras を生み出すか
新参のインファレンス・ネオクラウド「General Compute」が、GPU に代わる SambaNova 製チップを採用し、既存データセンターでの導入を可能にする戦略で 1500 万ドルの資金調達に成功した。
キーポイント
インファレンス特化型ハードウェアへのシフト
AI モデルの推論(インファレンス)フェーズには、トレーニング用 GPU よりも SambaNova のような専用チップが適しており、Nvidia や Cerebras の動向がこの潮流を裏付けている。
General Compute の資金調達と戦略
CEO Finn Puklowski 率いる General Compute は、SambaNova 製 SN50 チップを最先端で導入するネオクラウドとして 1500 万ドルのシードラウンドを FUSE VC などから獲得した。
インフラ制約の解消と性能向上
新チップは空冷対応かつ低消費電力で既存施設での導入が可能であり、GPU(250 トークン/秒)に対し 600〜700 トークン/秒という高い推論速度を実現する。
Colocation戦略と顧客の多様化
General Compute はデータセンター事業者だけでなく、ビットコイン採掘コストが価格を超えたクリプト採掘者とも提携し、自社ハードウェアを他施設に設置するコロケーション契約を推進している。
SambaNovaとの相互依存関係
投資家のJoe Hasselmannは、General ComputeとSambaNovaの提携がCoreWeaveとNvidiaの関係やGroqの事例に似ていると指摘し、両社が互いに相手の成長に賭け合う関係にあると分析している。
推論速度による価値変革
AIエージェント間での通信が増える中で、コーディングや音声対応の処理時間を数十分から数分に短縮し、推論の速度とコストが今後の競争優位性を決定する鍵となる。
影響分析・編集コメントを表示
影響分析
この記事は、AI インフラ業界が「GPU 一辺倒」から「用途特化型チップ(推論最適化)」へパラダイムシフトしていることを示唆しており、SambaNova のようなニッチなプレイヤーが主要な競争者として台頭する兆候を伝えている。また、インフラ制約の解消により AI サービスの展開スピードが加速し、既存データセンター資産の有効活用が進むことで、業界全体の資本効率とスケーラビリティに大きな影響を与える可能性がある。
編集コメント
推論特化型チップの実用化と、それを活用した新ビジネスモデルの登場は、AI インフラ市場の成熟度を示す重要な転換点です。特に既存インフラでの導入が可能な点は、大規模な設備投資を必要とする現在の課題に対する現実的な解決策として注目されます。
AI モデルを実行するためのコンピューターに対する需要は激化し続けていますが、業界に関わる誰もが克服しなければならない2 つの大きな障壁があります。それは適切なチップを入手すること、そしてそれらを収益を生み出し始めるデータセンターに設置することです。
General Compute は、新しい推論用ネオクラウド(モデルがトレーニングされるのではなく、実行されてユーザーに応答するフェーズに特化した AI 処理能力のレンタル企業)であり、AI エコシステムがどこへ向かっているのかを照らし出す答えを持っています。これらの回答により、同社は FUSE VC が主導し、Carya Venture Partners と Village Global Ventures が参加した、1,500 万ドルのシードラウンドを、出資後評価額6,000 万ドルで調達することに成功しました。
まず、適切なチップとは何でしょうか?GPU に対する需要は天井知らずですが、モデルがトレーニングされた後に AI モデルを実行する際に最適なチップではないという考え方が常識となりつつあります。モデルが積極的に応答を生成している AI のフェーズでは、トレーニング時とは異なる計算要件があり、それ専用の新しいクラスのチップが開発されています。12 月のNvidia の 200 億ドルの Groq 買収と、先週のCerebras の 570 億ドルの IPOがその方向性を示しています。
両社のキャパシティが逼迫する中、General Compute の共同創業者であり CEO の Finn Puklowski 氏と CTO の Jason Goodison 氏は別の選択肢を探しました。彼らが注目しているのは、推論(inference)に特化し、インテルの支援を受けたチップメーカーである SambaNova が製造する専用チップです。この企業は現在、シリコンバレーでの議論からやや外れていました。
しかし、SambaNova が今年新型チップをリリースすれば、状況が変わる可能性があります。そのアーキテクチャはより柔軟で、推論計算中にコンテキスト(文脈)を保存するためにより多くのメモリを使用します。また SambaNova は、この新チップが GPU だけでなく、Groq や Cerebras などが製造する他の専用チップをも上回ると主張しています。Puklowski 氏によると、新型チップは 1 秒あたり 600〜700 トークンを生成する一方、GPU では約 250 トークン程度です。
General Compute は同社の SN50 チップを 3 億ドル分発注しており、これを展開する最初のネオクラウド(neocloud)になると述べています。
これらのチップは、General Compute が抱えるもう一つの大きな問題である「どこに設置するか」の解決にも役立ちます。これらは水冷ではなく空冷であり、消費電力も少ないため、新たなインフラ投資を行わずとも既存のデータセンター施設に設置可能です。
Puklowski 氏は、コロケーション(colocation)契約の獲得を進めています。これは General Compute が他社の施設に自社のハードウェアを設置する形態で、データセンタープロバイダーだけでなく、ビットコイン採掘コストが価格を上回るケースが多いためインフラを転用しようとする暗号通貨マイナーとも提携しています。
General Compute は先週、クラウドサービスの提供を開始し、すでに強力なオープンソース大規模言語モデルである MiniMax 2.7 の実行において世界最速であると主張しています。
Joe Hasselmann は、2021 年に Groq に投資して推論ブームの初期段階から参入したベンチャーキャピタリストです。今年、彼は AI セクターに特化した新ファンド「Evercrest Capital Partners」を設立し、General Compute を最初の投資先の一つとしました。Hasselmann は、SambaNova と General Compute の提携が、CoreWeave と Nvidia の関係や、Groq のチップ製造事業とその過去のクラウドサービス提供の組み合わせに似ていると見ています。
「彼らは、成長が見込まれる環境で自社のチップを使用する顧客を健全な割合で抱える必要があります」と Hasselmann は述べています。「General Compute が SambaNova に賭けている一方で、SambaNova も General Compute に賭けているのです。」
問われているのは、AI の未来においてどの種類のコンピュータアーキテクチャが最大の価値を獲得するかです。推論クラウドは、単一のプロバイダーが支配するのではなく、複数のモデルとエージェントが存在し、推論の速度とコストが主要な競争変数となる世界への暗黙的な賭けです。先週 OpenRouter が調達した 1 億 1300 万ドルのシリーズ B ラウンド を考えてみてください。これは、顧客がトークン使用量を最適化するために複数のモデルへのアクセスを提供できる同社の能力を反映したものです。
計算においては、価格や能力の観点から速度が重要です。プークロフスキーは、コーディングエージェント向けの数時間かかるワークロードを 5 分〜10 分のタスクに変え、効果的な対話にはより高速な推論を必要とするカスタマーサービス用のオーディオエージェントをより経済的に運用したいと考えています。
「ChatGPT を使用して 1 秒あたり 50 トークンを出力しても、それはまだ人間が読む速度よりはるかに速いですが、現在はエージェント間でのやり取りに移行しており、エージェントが代わりに読み込んだりデータベースに問い合わせたりしているため、より高速化する必要があります」とプークロフスキーは TechCrunch に語りました。
*当記事内のリンクを通じてご購入いただいた場合、私たちは少額のコミッションを獲得する可能性があります。これは当社の編集の独立性には影響しません。
Tim Fernholz は、テクノロジー、金融、公共政策について執筆するジャーナリストです。民間宇宙産業の台頭を密接に取材しており、『Rocket Billionaires: Elon Musk, Jeff Bezos and the New Space Race』の著者でもあります。以前はグローバルビジネスニュースサイトである Quartz で 10 年以上シニア記者を務め、ワシントン D.C.で政治担当記者としてキャリアを開始しました。
Tim への連絡や outreach の確認は、tim.fernholz@techcrunch.com へメールを送るか、Signal で暗号化メッセージを tim_fernholz.21 宛てに送信してください。
原文を表示
The raging demand for computers to run AI models has only accelerated, but there are two major obstacles that anyone in the business needs to overcome: getting the right chips, and getting them into data centers where they can start generating revenue.
General Compute, a new inference neocloud — a company that rents out AI processing power, specializing in the phase when models are running and responding to users rather than being trained — has answers to those questions that illuminate where the AI ecosystem is headed. Those answers helped it raise a $15 million seed round at a $60 million post-money valuation, led by FUSE VC with participation from Carya Venture Partners and Village Global Ventures.
First, what is the right chip? The demand for GPUs has gone through the roof, but it’s becoming conventional wisdom that they aren’t the best-suited chips for running AI models once they have been trained. The phase of AI where a model is actively generating responses has different computational requirements than training, and a new class of chips is being designed specifically for it. Nvidia’s $20 billion Groq transaction in December and Cerebras’ $57 billion IPO last week point the way.
With capacity strained at both those companies, the co-founders of General Compute, CEO Finn Puklowski and CTO Jason Goodison, found another option. They’re turning to specialized chips built by SambaNova, an Intel-backed chipmaker focused on inference that has fallen a bit out of the Silicon Valley conversation.
That may change when SambaNova releases its new chips this year. The architecture is more flexible and uses more memory to store context during inference calculations, and SambaNova claims that it outperforms not just GPUs but also other specialized chips built by the likes of Groq or Cerebras. Puklowski says the new chips will generate 600 to 700 tokens per second, versus about 250 tokens per second for GPUs.
General Compute has $300 million of the company’s SN50 chips on order and says it will be the first neocloud deploying them.
These chips also help solve the second big problem — where to put them — for General Compute: They are air-cooled, not water-cooled, and consume less power, so they can be installed in existing data center facilities without new infrastructure investments.
Puklowski is pursuing colocation deals — arrangements where General Compute installs its hardware in someone else’s facility — not just with data center providers, but also with crypto miners looking to repurpose their infrastructure as the cost of producing a bitcoin has often exceeded its price.
General Compute launched its cloud offering last week, claiming it is already the fastest at running MiniMax 2.7, a powerful opensource LLM.
Joe Hasselmann is a venture investor who got in on the ground floor of the inference boom when he invested in Groq in 2021. This year, he launched a new fund, Evercrest Capital Partners, focused on the AI space, and made General Compute one of his first investments. Hasselmann sees in SambaNova’s partnership with General Compute parallels to CoreWeave’s relationship with Nvidia — and to the pairing of Groq’s chip-making with its former cloud offering.
“They do need a healthy mix of customers that are going to put their chips in environments that are going to have high growth to them,” Hasselmann said. “As much as General Compute is making a bet on SambaNova, SambaNova is making a bet on General Compute.”
The question is what kind of computer architecture will capture the most value in the AI future. Inference clouds are implicit bets on a world of multiple models and agents, one where no single provider dominates and speed and cost of inference become the key competitive variables. Consider the $113 million Series Braised for OpenRouter this week, reflecting the company’s ability to offer customers access to multiple models in order to optimize their token spend.
Speed matters in that calculation, for price, and for capability. Puklowski wants to turn hour-long workloads for coding agents into five- or 10-minute tasks, and make audio agents for customer service, which require faster inference to converse effectively, more economical.
“If you use ChatGPT and it gives you 50 tokens per second, that’s still a heck of a lot faster than we can read,” Puklowski told TechCrunch, “Now that things have moved to agent-to-agent, where agents are out there reading on our behalf or pinging databases, they need to go faster.”
*When you purchase through links in our articles, we may earn a small commission. This doesn’t affect our editorial independence.*
Tim Fernholz is a journalist who writes about technology, finance and public policy. He has closely covered the rise of the private space industry and is the author of * Rocket Billionaires: Elon Musk, Jeff Bezos and the New Space Race.* Formerly, he was a senior reporter at Quartz, the global business news site, for more than a decade, and began his career as a political reporter in Washington, D.C.
You can contact or verify outreach from Tim by emailing tim.fernholz@techcrunch.com or via an encrypted message to tim_fernholz.21 on Signal.
関連記事
インテル:次期 AI チップは NVIDIA や AMD より安価・低温動作へ
インテルのデータセンター部門責任者ケヴォルク・ケチキアン氏は、同社が年内に発売予定の新型 AI 用 GPU「Crescent Island」について、競合他社の製品より安価なメモリと冷却技術を採用し、コスト削減と省電力化を実現すると発表した。
バイトダンス、プロセッサの長期待機に我慢できず自社開発へ
バイトダンスは半導体調達に数ヶ月を要する現状に不満を抱き、自社のプロセッサ開発を開始すると発表した。
SambaNovaのAI市場における戦略的動き
SambaNovaはインテルと提携し、市場が複雑な多段階推論へ移行する中で、コスト効率の高いAI推論システムを提供することを目指している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み