AI ゲートウェイにルーティングルールが利用可能に
Vercel は AI Gateway にファイアウォール型のルーティングルール機能を追加し、コード変更なしでモデルの切り替えやアクセス制限を即時実行可能にした。
キーポイント
コードレスなモデル制御の実現
アプリケーションコードの変更を必要とせず、Gateway レベルでのルール適用により、モデル障害時や廃止時の即座の迂回・切り替えが可能になる。
2 種類のルール機能(Rewrite/Deny)
「Rewrite」はリクエスト先を別のモデルに透明に置換してトラフィックを維持し、「Deny」は未承認モデルへのアクセスをブロックする。
既存設定との統合と管理
ルーティングルールは BYOK、フォールバック、ゼロデータ保持などの既存設定と併用可能で、Vercel CLI を介して一元管理される。
影響分析・編集コメントを表示
影響分析
この機能は、LLM の可用性やコスト最適化が重要な課題となっている開発現場において、インフラ側の柔軟性を劇的に向上させる。コードベースの変更リスクを排除し、リアルタイムでのモデル切り替えとセキュリティ制御を実現することで、AI アプリケーションの運用安定性と敏捷性が大幅に高まる。
編集コメント
モデルのライフサイクル管理や障害対応において、開発者の負担を大幅に軽減する実用的な機能追加です。特にマルチモデル構成やコスト最適化が必要なプロジェクトで即座に価値を発揮するでしょう。
Vercel AI Gateway でルーティングルールが利用可能になりました。
ルーティングルールは、ファイアウォールスタイルのルールであり、チームが使用できるモデルを制御するもので、アプリケーションコード内ではなくゲートウェイレベルで適用されます。
モデルがダウンしたり廃止されたりした場合、通常はそれを回避するためにコード変更をリリースする必要があります。しかし、ルーティングルールを使用すれば、ルールを 1 つ設定するだけで、すべてのリクエストが即座に再ルーティングされます。ルールには 2 種類あります:
タイプ | 機能 | 使用目的
---|---|---
書き換え (Rewrite) | あるモデルへのリクエストを別のモデルで処理する | モデルが利用できない場合にトラフィックを継続させる、廃止されたモデルからの移行を行う、1 つのモデルに標準化する、高価なモデルを安価なモデルへルーティングする
拒否 (Deny) | 特定モデルへのリクエストをブロックする | チームが未承認のモデルを使用しないようにする
ルールは、チームの AI Gateway 認証情報を使用して行われるすべてのリクエストに適用されます。これらの管理は Vercel CLI を用いて行います。
書き換え (Rewrite)
ソースモデルと宛先モデルを指定して書き込みルールを作成します。ゲートウェイが宛先モデルを透明性を持って差し替えるため、アプリケーション側では引き続きソースモデルへのリクエストが行われます:
拒否 (Deny)
モデルをブロックするための拒否ルールを作成します。該当するリクエストには 403 エラーが返されます:
ルーティングルールは、どのモデルがリクエストに応答するかという点のみを変更するものであり、宛先モデルに対して設定済みの他のすべての機能も引き続き適用されます。これには以下が含まれます:
リクエストレベル: BYOK (Bring Your Own Key)、モデルのフォールバック、ソート、唯一のフィルター、プロバイダーオプション。
チームレベル: データ保持ゼロ (Zero Data Retention) およびプロバイダー許可リスト。
ルーティングルールはベータ版です。詳細については、ルーティングルールのドキュメントをご覧ください。
さらに読む
原文を表示
Vercel AI Gateway now supports routing rules.
Routing rules are firewall-style rules that control which models your team can use, applied at the gateway level instead of in your application code.
When a model goes down or gets retired, you usually have to ship a code change to move off it. With routing rules, you push one rule and every request reroutes instantly. There are two types:
Type
What it does
Use it to
Rewrite
Serves a request for one model using another
Keep traffic flowing when a model is unavailable, migrate off a retired model, standardize on one model, or route an expensive model to a cheaper one
Deny
Blocks requests for a model
Keep your team off models you haven’t approved
Rules apply to every request made with your team's AI Gateway credentials. You manage them with the Vercel CLI.
Rewrite
Create a rewrite with a source and a destination model. The Gateway swaps in the destination transparently, so your application keeps requesting the source model:
Deny
Create a deny rule to block a model. Requests for it return a 403:
Rules only change which model serves a request. Everything else you’ve configured still applies to the destination model, including:
Request-level: BYOK, model fallbacks, sorting, the only filter, and provider options.
Team-level: Zero Data Retention and the provider allowlist.
Routing rules are in beta. For more information, read the routing rules docs.
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み