AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
TechCrunch AI·2026年4月15日 22:00·約5分で読める

このスタートアップはトークンマキシングが次のコンピューティング巨人を生むと賭けている

#推論最適化#オープンソースLLM#AIインフラ#Compute Liquidity#自律型エージェント
TL;DR

ParasailはAI推論用の柔軟なクラウドコンピューティング基盤を提供し、オープンモデルの活用とリソース最適化により推論コストを大幅に削減する事業展開を進めている。

AI深層分析2026年4月15日 23:44
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
3

キーポイント

1

Compute Liquidityによる推論コスト最適化

Parasailはハードウェア所有に依存せず、世界中のデータセンターと流動性市場から計算リソースを柔軟に調達・配分し、推論コストと遅延を最小化するモデルを構築している。

2

オープンソースモデルとエージェントの台頭

フロントティア企業(OpenAI等)のAPI利用コストと摩擦を回避するため、開発者はオープンソースモデルと自律型エージェントを活用するハイブリッドアーキテクチャへ移行している。

3

資金調達と市場規模の拡大

Groq元CEOのMike Henryが率いるParasailは$32MのシリーズAを調達し、日量5000億トークンの処理規模でAI推論インフラ市場での競争力を強化している。

影響分析・編集コメントを表示

影響分析

本記事は、AI推論インフラの「コモディティ化」と「リソース流動性市場」の台頭を示しており、今後フロントティア企業への依存を脱したハイブリッド推論アーキテクチャが主流になる可能性を示唆している。開発者や企業は、計算リソースの柔軟な調達とオープンモデルの活用を戦略に組み込む必要がある。

編集コメント

計算リソースの「流動性市場」化は、AIインフラ業界における次の重要な分岐点であり、ハードウェア所有競争からリソース配分アルゴリズムとコスト最適化へのシフトを意味する。開発者はオープンモデルの活用と柔軟なインフラ選定を早期に検討すべきだ。

「トークンをくれ。ただトークンをくれ。速く欲しい。安く欲しい。今すぐ欲しい。」

これは生成AIモデル上でソフトウェアを構築する開発者たちの合言葉、あるいは少なくともParasailのCEOマイク・ヘンリーが日々耳にする要望だ。Parasailは推論のためにAIモデルを実行する企業にクラウドコンピューティングサービスを提供しており、ヘンリーはTechCrunchに、1日に5,000億トークンを生成していると語った。トークンマキシングの規模として、いかがだろうか。

ヘンリーはLLM特化型チップメーカーのGroqで幹部を務め、同社のクラウドサービスを立ち上げた人物だ。彼は当時、AIモデル上でソフトウェアを構築する開発者が、自身のニーズに特化したクラウド処理を求めるようになると早期に見抜いていた。ステルス状態を脱して1年が経った現在、Parasailはそのビジョンを大規模に実現するため、3,200万ドルのシリーズA資金を調達した。

ヘンリーは物理チップ設計のバックグラウンドを持つが、Parasailは自社チップの所有に固執していない。GPUの一部は自社所有だが、同社は主に世界15カ国に分散する40のデータセンターから処理時間を借用し、流動性市場からさらに調達している。これらを背景で巧みに調整し、推論リクエストのコスト削減を実現する。

ワークロードを巧妙に割り振り、需要のピークを回避することで、同社は自社シリコンを所有する企業に対抗することを目指す。それらの企業は、既存の顧客との契約やワークロードによって制約を受ける可能性がある。

同社の成長可能性は、フロンティアラボの外でオープンソースモデルとエージェントが普及し続けるかにかかっている。Parasailの幹部や投資家によれば、この動きは、AnthropicやOpenAIといった企業のサービスを利用する際のコストと煩わしさの増大によって加速されているという。

代わりに台頭しつつあるのはハイブリッドアーキテクチャだと、科学文献向け研究アシスタントを開発するスタートアップElicitのCEO、アンドレアス・シュトゥールミュラーは言う。同社はシリーズAで2,200万ドルを調達している。彼の顧客である大手製薬企業は、LLMベースのツールを用いて数万本に及ぶ科学論文のデータを検討・分析している。

TechCrunchイベント Disruptで次の投資家やポートフォリオスタートアップに出会おう

次の資金調達。次の人材採用。次のブレイクスルー機会。TechCrunch Disrupt 2026で見つけよう。創業者、投資家、テクノロジーリーダー1万人以上が集結し、3日間にわたって250以上の実践的セッション、強力なネットワーキング、市場を定義するイノベーションが展開される。今すぐ登録して最大410ドル節約しよう。

Disruptで次の投資家やポートフォリオスタートアップに出会おう

次の資金調達。次の人材採用。次のブレイクスルー機会。TechCrunch Disrupt 2026で見つけよう。創業者、投資家、テクノロジーリーダー1万人以上が集結し、3日間にわたって250以上の実践的セッション、強力なネットワーキング、市場を定義するイノベーションが展開される。今すぐ登録して最大410ドル節約しよう。

「何十万ものリクエストをAPIエンドポイントに送るのはかなり厳しいため、我々はよりオープンモデルへ移行しました」とシュトゥールミュラーはTechCrunchに語った。特に、自社サービスを改善するためにエージェントを利用し、タスクを分割してより長期的な視野で戦略的に作業するようになった現在では、その傾向は強いという。オープンモデルが初期選別を担当してコストを抑え、その後、性能の高いフロンティアモデルが最終回答を提供する。

エージェントがソフトウェア開発において一般的になるにつれ、モデルクエリが急増している。このことが、安価な推論のインフラを提供するParasailのような企業への投資を後押ししている。今回のラウンドを共同主導したTouring Capitalのパートナー、サミール・クマールはTechCrunchに対し、将来的にはソフトウェア構築コストの少なくとも20%が推論に費やされるとの見通しを示した。

その市場のうち、どれだけをParasailが獲得できるだろうか。競合の多いクラウドコンピュート市場において、ヘンリーは自社の強みをこう説明する。推論に特化し(学習は扱わない)、長期契約を結ばないスタートアップ顧客も受け入れる姿勢が、エンタープライズビジネスに注力する大規模クラウド事業者や、Fireworks AIやBasetenといったクラウド推論分野の資金力のある競合他社との差別化要因だという。

もちろん、すべての顧客が予測困難なAI分野のシードおよびシリーズBスタートアップであることは、別種のリスクを伴う。

今回の資金調達のもう一人の共同主導者であるKindred Venturesのパートナー、スティーブ・ジャングは、モデルをデプロイする経済性が、Parasailが提供するようなコンピュートブローカレッジを必要とすると述べる。これは、コンテンツ生成やロボティクス向けにモデルが広く使われる前の段階での話だ。

「誰もがAIバブルだと思っていた。しかしAIバブルはない」と彼はTechCrunchに語った。「推論の需要は供給を遥かに上回っている。」

原文を表示

“Give me tokens. Just give me tokens. I want them fast. I want them cheap. I want them now.”

That’s the mantra for developers building software on generative AI models, or at least what Parasail CEO Mike Henry hears. Parasail provides a cloud computing service to companies running AI models for inference, and Henry told TechCrunch it generates 500 billion tokens a day. How’s that for tokenmaxxing?

Henry was an executive at Groq, the LLM-focused chipmaker, where he built the company’s cloud offering, an early recognition that developers building software on AI models would want cloud processing specialized to their needs. Now, after coming out of stealth a year ago, Parasail has raised a $32 million Series A to do that at scale.

Henry has a background in physical chip design, but Parasail isn’t committed to owning its own chips. While some of its GPUs are its own, the company mainly rents processing time at 40 data centers in 15 countries around the globe, and buys more from liquidity markets, orchestrating that all behind the scenes to drive down the cost of inference requests.

By allocating workloads cleverly and avoiding demand peaks, the company aims to compete with firms that own their own silicon and might be constrained by existing customer commitments and workloads.

The company’s potential relies on the continued proliferation of open-source models and agents outside of frontier labs. Parasail’s executives and investors say this is driven by the growing cost and friction of using offerings from companies like Anthropic and OpenAI.

Instead, a hybrid architecture is emerging, according to Andreas Stuhlmüller, the CEO of Elicit, a startup that has raised a $22 million Series A to develop a research assistant for scientific literature. His customers at top pharmaceutical companies use the LLM-based tool to review and analyze data from tens of thousands of scientific papers.

Techcrunch event Meet your next investor or portfolio startup at Disrupt

Your next round. Your next hire. Your next breakout opportunity. Find it at TechCrunch Disrupt 2026, where 10,000+ founders, investors, and tech leaders gather for three days of 250+ tactical sessions, powerful introductions, and market-defining innovation. Register now to save up to $410.

Meet your next investor or portfolio startup at Disrupt

Your next round. Your next hire. Your next breakout opportunity. Find it at TechCrunch Disrupt 2026, where 10,000+ founders, investors, and tech leaders gather for three days of 250+ tactical sessions, powerful introductions, and market-defining innovation. Register now to save up to $410.

“We’ve moved more towards open models because it’s pretty rough sending 100,000s of requests to an API endpoint,” Stuhlmüller told TechCrunch, especially now that the company is relying on agents to improve its offering, splitting up tasks and working more strategically over longer time horizons. Open models handle the initial screening to drive down the cost of the work, before a more capable frontier model provides a final answer.

The proliferation of model queries, as agents become an increasingly common part of software development, is driving the investment in companies like Parasail that provide the infrastructure for cheap inference. Samir Kumar, a partner at Touring Capital who co-led this round, told TechCrunch he expects inference to be at least 20% of the cost of building software in the future.

How much of that market could be Parasail’s? In the crowded cloud compute space, Henry argues that his firm’s focus on inference (no training allowed) and willingness to take on startup customers without long-term commitments sets his offering apart from larger cloud-computing companies focused on enterprise business, and even better-funded competitors in the cloud inference space, like Fireworks AI and Baseten.

Of course, there’s a different kind of risk when all of your customers are seed and Series B startups in the unpredictable AI sector.

Steve Jang, a partner at Kindred Ventures, the other co-leader in this fundraising, says the economics of deploying models will demand the kind of compute brokerage Parasail provides. And that’s before widespread use of models for content generation and robotics.

“Everyone thought there was an AI bubble. There’s no AI bubble,” he told TechCrunch. “Inference demand is far outstripping supply.”

この記事をシェア

関連記事

Smol AI News★42026年6月4日 14:44

今日は何も大きな出来事はありませんでした

Smol AI News は、6月3日から4日にかけての期間に、12件のサブレッドや544件のツイートを調査しましたが、AI業界で特筆すべき動きは確認されませんでした。

TLDR AI★42026年6月2日 09:00

米国、中国企業向け Nvidia 最高級チップの海外販売ループホールを閉鎖へ

米商務省は、本社が中国にある企業の海外子会社による NVIDIA 製先端チップ購入にも輸出ライセンス要件を適用する指針を発出し、既存の回避策を封じる方針を示した。

Latent Space★42026年5月28日 16:26

[AI ニュース] コグニションが 260 億ドルのシリーズ D で 10 億ドルを調達

コグニション社が 260 億ドルの評価額で 10 億ドルの資金調達を実施し、年間収益は年内に 10 億ドル超を見込む。これにより同社は AI エージェント分野で最大級の独立系ラボとなった。

ニュース一覧に戻る元記事を読む