Vercel AI GatewayでDeepSeek V4の利用が可能に
VercelがAI GatewayにDeepSeek V4(Pro/Flash)を追加し、エージェント開発や高スループスワークロード向けに統一APIと高度なルーティング機能を提供する。
キーポイント
V4 ProとFlashの2バリエーション提供
1Mトークンのコンテキストウィンドウを標準搭載し、用途に応じて推論性能とコスト/速度のバランスを選べる構成とした。
エージェント開発と高負荷ワークロードへの最適化
V4 Proは複雑なコーディング・数学推論・長文書生成に特化し、V4 Flashは低パラメータサイズで高速応答と低コストを実現した。
AI SDKとのシームレスな統合
SDKのmodelパラメータに`deepseek/deepseek-v4-pro`または`flash`を指定するだけで、既存コードベースへのモデル差し替えが可能。
AI Gatewayの運用基盤機能
統一API、使用量・コスト追跡、自動リトライ・フェイルオーバー、カスタムレポート機能を備え、プロバイダ依存のダウンタイムを低減する。
影響分析・編集コメントを表示
影響分析
Vercel AI GatewayへのDeepSeek V4統合は、開発者が最先端の推論モデルをインフラ層でシームレスに運用できる環境を整えた。これにより、エージェント開発や大規模API呼び出しにおけるコスト最適化とシステム信頼性が向上し、マルチモデル戦略の実装ハードルが下がる。
編集コメント
プラットフォーム統合型のニュースだが、エージェント開発とコスト最適化の両軸を明確に提示したモデル選定基準は実務者に有用である。
DeepSeek V4がVercel AI Gatewayで利用可能になりました。
2つのモデルバリエーションがあります:DeepSeek V4 ProとDeepSeek V4 Flashです。両モデルとも、1Mトークンのコンテキストウィンドウ(context window)がデフォルトで設定されています。
DeepSeek V4 Proは、エージェント型コーディング(agentic coding)、形式的な数学的推論、そして長期にわたるワークフロー(long-horizon workflows)に焦点を当てています。複数のスタックにわたる機能開発、バグ修正、リファクタリングを処理し、MCPワークフローやエージェントフレームワークなどのハッチ(harnesses)で動作するツール利用をサポートします。また、明確で構造化された長文ドキュメントの作成も可能です。
DeepSeek V4 Flashは推論性能がV4 Proに近く、より単純なエージェントタスクでも安定して動作します。パラメータサイズが小さいため応答速度が速く、APIコストも低くなります。高スループットなワークロードやレイテンシ(latency)が敏感なユースケースに最適です。
DeepSeek V4を使用するには、AI SDKでモデルを deepseek/deepseek-v4-pro または deepseek/deepseek-v4-flash に設定してください。
AI Gatewayは、モデル呼び出し、使用量とコストの追跡、およびプロバイダー単体の稼働率を上回る高可用性を実現するためのリトライ(retries)、フェイルオーバー(failover)、パフォーマンス最適化の設定を行うための統一APIを提供します。また、組み込みのカスタムレポート機能、観測性(observability)、Bring Your Own Key(BYOK)サポート、自動リトライ機能付きのインテリジェントなプロバイダールーティングが含まれています。
AI Gatewayの詳細については、AI Gatewayモデルリーダーボードをご覧ください。または、モデルプレイグラウンドで実際にお試しください。
続きを読む
原文を表示
DeepSeek V4 is now available on Vercel AI Gateway.
There are 2 model variants: DeepSeek V4 Pro and DeepSeek V4 Flash. A 1M token context window is the default across both models.
DeepSeek V4 Pro focuses on agentic coding, formal mathematical reasoning, and long-horizon workflows. It handles feature development, bug fixing, and refactoring across stacks, with tool use that works across harnesses like MCP workflows and agent frameworks. It also writes clear, well-structured long-form documents.
DeepSeek V4 Flash performs close to V4 Pro on reasoning and holds up on simpler agent tasks, with a smaller parameter size for faster responses and lower API cost. It's a good fit for high-volume workloads and latency-sensitive use cases.
To use DeepSeek V4, set model to deepseek/deepseek-v4-pro or deepseek/deepseek-v4-flash in the AI SDK.
AI Gateway provides a unified API for calling models, tracking usage and cost, and configuring retries, failover, and performance optimizations for higher-than-provider uptime. It includes built-in custom reporting, observability, Bring Your Own Key support, and intelligent provider routing with automatic retries.
Learn more about AI Gateway, view the AI Gateway model leaderboard or try it in our model playground.
Read more
関連記事
駿馬が春を迎え、共に新たな境地へ駆ける | DeepSeek 丙午新年・春節 AI 挨拶
DeepSeekが春節の挨拶を発表し、AI技術の進展と新年の希望を詩的な表現で示した。
DeepSeek V4 Flash のための軽量ネイティブ推論エンジン「ds4.c」が GitHub に公開
開発チームは、DeepSeek V4 Flash 専用として意図的に小型化されたローカル推論エンジン「ds4.c」を公開した。このプロジェクトはエンドツーエンドで完成したモデル体験を目指し、現在は Metal 環境のみ対応のアルファ版だが、将来的に CUDA サポートも検討されている。
NVIDIA BlackwellとGPUアクセラレーションエンドポイントを用いたDeepSeek V4の構築
DeepSeekは第4世代フラッグシップモデル「V4-Pro/Flash」を公開し、NVIDIA BlackwellとGPUアクセラレーションエンドポイントを活用した構築環境を提供した。