読み込み中…

Vercel Blog·2026年6月4日 16:00·約1分

Nemotron 3 Ultra が AI Gateway で利用可能に

#LLM #Reasoning #Agent Workflow #Nvidia #Vercel

TL;DR

Nvidia の新推論モデル「Nemotron 3 Ultra」が Vercel AI Gateway で利用可能となり、エージェントワークフローの効率化とコスト削減が可能になった。

AI深層分析2026年6月5日 17:36

重要/ 5段階

深度40%

キーポイント

エージェント特化型モデルの登場

100 万トークンのコンテキストウィンドウを備え、計画立案やツール使用などの多段階エージェントワークフローに最適化されたオープンな MoE モデル。

高性能とコスト効率の実現

スループットは最大 350 トークン/秒で、エージェントタスクにおけるコストを最大 30% 削減できることが謳われている。

Vercel AI Gateway の統合と機能

AI SDK を介して簡単に利用可能となり、統一 API、使用量追跡、自動フェイルオーバー、ゼロデータ保持などの機能を提供。

重要な引用

Nemotron 3 Ultra is an open Mixture-of-Experts reasoning model built for orchestrating long-running agent workflows

Throughput reaches up to 350 tokens per second, with up to 30% lower cost on agentic tasks.

AI Gateway reflects provider pricing with no markup and does not charge a platform fee on inference

影響分析・編集コメントを表示

影響分析

このニュースは、大規模なエージェントワークフローを必要とする開発者にとって、高性能かつ低コストで推論を実行する新たな選択肢を提供します。特に Vercel AI Gateway のようなインフラ層がプロバイダー価格をそのまま反映し手数料を課さない点は、運用コストの透明性を高め、大規模な AI アプリケーションの実装を加速させる要因となります。

編集コメント

エージェントアプリケーションの開発において、推論コストと性能のバランスを最適化できる重要なインフラ更新です。特に「手数料なし」の価格設定は、大規模展開時の予算管理に大きなメリットをもたらします。

Nvidia の Nemotron 3 Ultra が、Vercel AI Gateway で利用可能になりました。

Nemotron 3 Ultra は、長期実行型のエージェントワークフローをオーケストレーションするために構築されたオープンな Mixture-of-Experts（専門家混合）推論モデルで、100 万トークンのコンテキストウィンドウを備えています。このモデルは、計画策定、ツール使用、サブエージェントへの委任、エラー回復といった多段階のエージェントワークフローを対象としています。スループットは最大で秒間 350 トークンに達し、エージェントタスクにおけるコストは最大 30% 削減されます。

Nemotron 3 Ultra を利用するには、AI SDK でモデルを nvidia/nemotron-3-ultra-550b-a55b に設定してください。

AI Gateway は、モデル呼び出しの統一 API、使用状況とコストの追跡、リトライ・フェイルオーバー・パフォーマンス最適化の設定（プロバイダーの稼働率を上回る高可用性を実現）を提供します。組み込みのカスタムレポート機能、ゼロデータ保持（Zero Data Retention）サポート、レイテンシとコストに基づく動的なプロバイダーソートなど、多くの機能を備えています。AI Gateway はプロバイダー価格をそのまま反映し、マージンを加算せず、推論（Inference）や Bring Your Own Key (BYOK) リクエストにおいてもプラットフォーム料金を徴収しません。

AI Gateway に関する詳細情報、AI Gateway のモデルリーダーボードの閲覧、またはモデルプレイグラウンドでの試行については、こちらをご覧ください。

さらに詳しく読む

原文を表示

Nemotron 3 Ultra from Nvidia is now available on Vercel AI Gateway.

Nemotron 3 Ultra is an open Mixture-of-Experts reasoning model built for orchestrating long-running agent workflows, with a 1M token context window. The model targets multi-turn agent workflows: planning, tool use, sub-agent delegation, and error recovery. Throughput reaches up to 350 tokens per second, with up to 30% lower cost on agentic tasks.

To use Nemotron 3 Ultra, set model to nvidia/nemotron-3-ultra-550b-a55b in the AI SDK.

AI Gateway provides a unified API for calling models, tracking usage and cost, and configuring retries, failover, and performance optimizations for higher-than-provider uptime. It includes built-in custom reporting, Zero Data Retention support, dynamic provider sorting by latency and cost, and more. AI Gateway reflects provider pricing with no markup and does not charge a platform fee on inference, including on Bring Your Own Key (BYOK) requests.

Learn more about AI Gateway, view the AI Gateway model leaderboard or try it in our model playground.

この記事をシェア

AWS Machine Learning Blog重要度42026年7月21日 02:01

AWS と NVIDIA が業務用エージェントワークフローを公開

MarkTechPost2026年7月20日 10:56

コミュニティが MiniCPM5-1B を微調整し、657MB の思考モデルを公開

TLDR AI2026年7月20日 09:00

Fable5とGPT-5.6のNP困難問題比較

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む

Vercel Blog·2026年6月4日 16:00·約1分

Nemotron 3 Ultra が AI Gateway で利用可能に

#LLM #Reasoning #Agent Workflow #Nvidia #Vercel

TL;DR

Nvidia の新推論モデル「Nemotron 3 Ultra」が Vercel AI Gateway で利用可能となり、エージェントワークフローの効率化とコスト削減が可能になった。

AI深層分析2026年6月5日 17:36

重要/ 5段階

深度40%

キーポイント

エージェント特化型モデルの登場

高性能とコスト効率の実現

スループットは最大 350 トークン/秒で、エージェントタスクにおけるコストを最大 30% 削減できることが謳われている。

Vercel AI Gateway の統合と機能

AI SDK を介して簡単に利用可能となり、統一 API、使用量追跡、自動フェイルオーバー、ゼロデータ保持などの機能を提供。

重要な引用

Nemotron 3 Ultra is an open Mixture-of-Experts reasoning model built for orchestrating long-running agent workflows

Throughput reaches up to 350 tokens per second, with up to 30% lower cost on agentic tasks.

AI Gateway reflects provider pricing with no markup and does not charge a platform fee on inference

影響分析・編集コメントを表示

影響分析

編集コメント

Nvidia の Nemotron 3 Ultra が、Vercel AI Gateway で利用可能になりました。

Nemotron 3 Ultra を利用するには、AI SDK でモデルを nvidia/nemotron-3-ultra-550b-a55b に設定してください。

AI Gateway に関する詳細情報、AI Gateway のモデルリーダーボードの閲覧、またはモデルプレイグラウンドでの試行については、こちらをご覧ください。

さらに詳しく読む

原文を表示

Nemotron 3 Ultra from Nvidia is now available on Vercel AI Gateway.

To use Nemotron 3 Ultra, set model to nvidia/nemotron-3-ultra-550b-a55b in the AI SDK.

Learn more about AI Gateway, view the AI Gateway model leaderboard or try it in our model playground.

この記事をシェア

AWS Machine Learning Blog重要度42026年7月21日 02:01

AWS と NVIDIA が業務用エージェントワークフローを公開

MarkTechPost2026年7月20日 10:56

コミュニティが MiniCPM5-1B を微調整し、657MB の思考モデルを公開

TLDR AI2026年7月20日 09:00

Fable5とGPT-5.6のNP困難問題比較

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む

Nemotron 3 Ultra が AI Gateway で利用可能に

キーポイント

重要な引用

影響分析

編集コメント

関連記事

Nemotron 3 Ultra が AI Gateway で利用可能に

キーポイント

重要な引用

影響分析

編集コメント

関連記事