Sakana Fugu Ultra が AI Gateway で利用可能に
Vercel の AI Gateway に、複数のフロントier モデルを協調させて回答を生成する Sakana AI の「Fugu Ultra」が利用可能となり、業界標準の推論性能を実現する新たな選択肢が提供された。
キーポイント
モデルアーキテクチャの革新
単一のモデルではなく、公開されている最先端モデル群をプールし、問題に応じて 1-3 エージェントにルーティングして結果を統合する協調型アプローチを採用している。
推論性能の実証
推論能力と科学ベンチマークにおいて、Claude Mythos Preview や Fable 5 に匹敵するレベルの性能を有することが示されている。
AI Gateway の機能強化
Vercel AI Gateway は、統一 API、使用量・コスト追跡、リトライ・フェイルオーバー設定、ゼロデータ保持サポートなどを提供し、プロバイダ価格そのままの課金体系を採用している。
開発者への導入方法
AI SDK でモデル名を「sakana/fugu-ultra」と指定するだけで利用可能であり、モデルプレイグラウンドでの試行もサポートされている。
影響分析・編集コメントを表示
影響分析
この発表は、単一モデルの限界を超え、複数の最先端モデルを状況に応じて最適に組み合わせる「モデル・アグリゲーション」の実用化が加速したことを示しています。開発者にとっては、特定のベンダーに依存せず、高品質な推論能力を柔軟かつコスト効率よく利用する新たなインフラ選択肢が得られるため、AI アプリケーションの性能向上と運用コスト最適化に直結する重要な進展です。
編集コメント
単一モデルの性能競争から、複数モデルを賢く使い分ける「オーケストレーション」の時代へ移行する兆候が明確に現れています。特にコスト透明性を保ちながら最先端の推論能力を提供する点は、実務での採用ハードルを下げる重要な要素と言えるでしょう。
Sakana AI の Sakana Fugu Ultra が、AI Gateway で利用可能になりました。
Fugu Ultra は単一のモデルとして動作するのではなく、公開アクセス可能な最先端モデルのプールを基盤に構築されています。このシステムは複数のモデルを調整し、問題に応じて 1〜3 エージェントに処理をルーティングし、その結果を統合して一つの回答として出力します。
推論および科学的ベンチマークに基づき、Fugu Ultra は Claude Mythos Preview や Fable 5 と同等の能力を有しています。
Fugu Ultra を利用するには、AI SDK でモデルを sakana/fugu-ultra に設定してください:
AI Gateway は、モデル呼び出し、使用状況とコストの追跡、リトライ・フェイルオーバー・パフォーマンス最適化の設定などを行うための統一 API を提供し、プロバイダー単体よりも高い稼働率を実現します。また、組み込みのカスタムレポート機能、ゼロデータ保持(Zero Data Retention)サポート、API キーごとの予算管理などの機能を備えています。
AI Gateway はプロバイダーの価格をそのまま反映し、マージンを加算しません。推論コストについても、Bring Your Own Key (BYOK) リクエストを含め、プラットフォーム料金を徴収しません。
モデルプレイグラウンドで Sakana Fugu Ultra をお試しください。
続きを読む
原文を表示
Sakana Fugu Ultra from Sakana AI is now available on AI Gateway.
Fugu Ultra is built on a pool of publicly accessible frontier models, rather than running as a single model. It coordinates several models, routing work to 1-3 agents depending on the problem and combining their results into a single answer.
Based on reasoning and scientific benchmarks, Fugu Ultra has capabilities similar to those of Claude Mythos Preview and Fable 5.
To use Fugu Ultra, set model to sakana/fugu-ultra in AI SDK:
AI Gateway provides a unified API for calling models, tracking usage and cost, and configuring retries, failover, and performance optimizations for higher-than-provider uptime. It includes built-in custom reporting, Zero Data Retention support, budgets for API keys, and more.
AI Gateway reflects provider pricing with no markup and does not charge a platform fee on inference, including on Bring Your Own Key (BYOK) requests.
Try Sakana Fugu Ultra in the model playground.
Read more
関連記事
Sakana AI、フロントティア LLM を柔軟にルーティングするオーケストレーションモデル「Sakana Fugu」を発表
Sakana AI は、単一のエンドポイントからリクエストを受け付け、タスクの複雑さに応じて直接処理するか複数の専門モデルを協調させるマルチエージェントシステム「Sakana Fugu」を発表した。これは OpenAI 互換 API を提供し、背後で複数の最先端 LLM を動的にルーティングする仕組みである。
リアルタイム音声対話 AI の知識強化を目指す Tandem アーキテクチャ「KAME」が ICASSP2026 に採択
研究者らが、思考を深めつつ遅延なく応答する新アーキテクチャ「KAME」を発表し、ICASSP2026 で採用された。これにより、従来の浅い推論に留まっていた高速音声 AI の知能が向上する可能性がある。
VibeThinker-3B:Qwen2.5-Coder-3Bを基盤にスペクトルから信号へのポストトレーニングパイプラインで構築された 30 億パラメータの密着型推論モデル
中国の新浪微博研究所が開発した「VibeThinker-3B」は、大規模なパラメータ数に依存しない効率的なアプローチを採用し、検証可能なタスクにおいて数百倍サイズのモデルと同等の性能を発揮する 30 億パラメータの推論モデルとして公開された。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み