AI Gateway に GLM-5.2 が利用可能に
Vercel は、100 万トークンのコンテキストウィンドウと長期的タスクへの対応能力を強化した GLM 5.2 を AI Gateway で利用可能にし、エンジニアリング標準の遵守やコスト管理機能も提供している。
キーポイント
GLM 5.2 の主要機能強化
プロジェクトレベルの工事情報を単一タスク内で保持し、長時間実行されるタスクの信頼性とエンジニアリング標準への準拠性を向上させた。
コンテキストウィンドウの拡大
前バージョン(GLM 5.1)の 20 万トークンから 100 万トークンへ大幅に拡張され、大規模な文脈処理が可能になった。
AI Gateway の統合と機能
モデル呼び出しの統一 API、使用量・コスト追跡、自動フェイルオーバー、ゼロデータ保持サポート、API キーごとの予算管理などを提供する。
価格設定と BYOK 対応
プロバイダ価格にマーカーを加えず、推論時にプラットフォーム料金を徴収しない方針を維持し、Bring Your Own Key (BYOK) リクエストにも対応している。
影響分析・編集コメントを表示
影響分析
この発表は、長文コンテキストと複雑なタスク処理を必要とする開発者にとって、GLM 5.2 の実用的な導入経路を大幅に拡大するものです。特に AI Gateway が提供するコスト管理やセキュリティ機能との統合により、大規模プロジェクトでのモデル運用リスクを低減し、採用のハードルを下げる効果が期待されます。
編集コメント
100 万トークンという圧倒的なコンテキスト容量は、複雑なコードベースの解析や長文ドキュメントの処理において実用的な価値を即座に生み出すでしょう。また、Vercel が提供する透明性のある価格設定とセキュリティ機能との組み合わせは、エンタープライズ利用における重要な判断材料となります。
GLM 5.2 が AI Gateway で利用可能になりました。
長期にわたるタスク向けに設計された GLM 5.2 は、単一のタスク内でプロジェクトレベルのエンジニアリングコンテキストを保持し、長時間実行されるタスクをより確実に処理し、エンジニアリング基準を一貫して遵守します。
このモデルのコンテキストウィンドウは、GLM 5.1 の 200K トークンから 1M トークンに拡張されました。
GLM 5.2 を使用するには、AI SDK でモデルを zai/glm-5.2 に設定してください:
AI Gateway は、モデルの呼び出し、利用状況とコストの追跡、リトライ・フェイルオーバー・パフォーマンス最適化の設定などを行い、プロバイダーよりも高い稼働率を実現するための統一 API を提供します。組み込みのカスタムレポート機能、ゼロデータ保持(Zero Data Retention)サポート、API キーごとの予算管理などが含まれています。AI Gateway はプロバイダーの価格をそのまま反映し、マージンを加算せず、推論時にもプラットフォーム料金を徴収しません。Bring Your Own Key (BYOK) リクエストの場合も同様です。
AI Gateway に関する詳細情報や、AI Gateway のモデルリーダーボードをご覧いただくか、モデルプレイグラウンドでお試しください。
続きを読む
原文を表示
GLM 5.2 is now available on AI Gateway.
Built for long-horizon tasks, GLM 5.2 carries project-level engineering context across a single task, runs long-running tasks more reliably, and follows engineering standards more consistently.
The context window for this model has been upgraded to 1M tokens, up from 200K in GLM 5.1.
To use GLM 5.2, set model to zai/glm-5.2 in the AI SDK:
AI Gateway provides a unified API for calling models, tracking usage and cost, and configuring retries, failover, and performance optimizations for higher-than-provider uptime. It includes built-in custom reporting, Zero Data Retention support, budgets for API keys, and more. AI Gateway reflects provider pricing with no markup and does not charge a platform fee on inference, including on Bring Your Own Key (BYOK) requests.
Learn more about AI Gateway, view the AI Gateway model leaderboard or try it in our model playground.
Read more
関連記事
[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定
Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。
Salesforce CodeGen チュートリアル:ユニットテストと安全性チェック付きの Python 関数の生成・検証・再ランク付け
Salesforce は Hugging Face からモデルを読み込み、自然言語から Python 関数を生成するエンドツーエンドワークフローを公開した。この手法には構文チェックや静的解析、ユニットテストによる検証が含まれる。
CloudWatch の SageMaker メトリクスとインサイトダッシュボードを用いた生成 AI 推論の監視・デバッグ
AWS は、大規模な生成 AI 推論エンドポイントの P99 レイテンシ急上昇などのトラブルを GPU メモリ圧力や KV キャッシュ飽和などから特定できるよう、CloudWatch に SageMaker の詳細メトリクスとインサイトダッシュボードを追加した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み