#serverless のAIニュース

13件の記事

AI Gateway で GLM 5.2 Fast が Wafer を経由して利用可能に

Vercel は、Zai の提供する GLM 5.2 Fast モデルを AI Gateway 上で Wafer を介して提供開始した。ベンチマークによると、サーバーレス環境でのスループットは他社より 2 倍高く、小・大コンテキストともに高速な生成を実現している。

Vercel Blog·6月24日

設定不要で Node サーバーをデプロイ可能に

Vercel が、プロジェクトルートまたは src/server.ts に server.ts ファイルを検出すると、Express や Koa などと同様に設定不要で Node.js アプリケーションとしてデプロイする機能を追加した。

Vercel Blog·6月23日

Vercel Functions で WebSocket がパブリックベータに

Vercel は、同社の Functions サービスで WebSocket 接続をサポートする機能をパブリックベータとして公開した。これにより、クライアントとサーバー間での双方向通信が可能になり、リアルタイムの AI ストリーミングやチャット機能の実装が容易になる。

Vercel Blog·6月22日

Amazon SageMaker AI の非同期推論にリクエストペイロードの直接送信がサポートされるように

AWS は Amazon SageMaker AI の非同期推論機能において、API を呼び出す際にリクエスト本体に直接データを格納して送信できる機能を追加した。これにより、各実行前にデータを S3 にアップロードする必要がなくなり、ネットワーク往復の削減や運用負荷の軽減が可能になった。

AWS Machine Learning Blog·6月18日·★★★★

Cloud Functions 世代移行に伴う 1000 万件のメッセージ滞留:Pub/Sub、Cloud Run、Spanner のチューニング

Mercari Engineering の会計チームは、Cloud Functions の世代移行により Cloud Pub/Sub に 1000 万件のメッセージが滞留した事象を報告し、Cloud Run と Spanner を含むシステム全体のチューニングで解決に至った経緯を解説している。

Mercari Engineering·6月16日

Vercel の Workflow SDK が TanStack Start アプリケーションをサポート

Vercel は、Workflow SDK に TanStack Start アプリケーションのサポートを追加しました。これにより、開発者は Vite と Nitro を基盤とする環境で、標準的な TypeScript を使用して永続的で再開可能なワークフローを記述できるようになります。

Vercel Blog·6月16日

Vercel Functions、Pro および Enterprise チーム向けに最大 30 分までの実行が可能に

Vercel は、Node.js と Python ランタイムを使用する Vercel Functions の実行制限を、Pro および Enterprise チーム向けに従来の約 800 秒から最大 30 分に延長した。これにより、長時間の LLM 推論やストリーミング応答などの処理が可能になる。

Vercel Blog·6月15日·★★★★

Workflow SDK が Nitro v3 でネイティブ実行可能に

Vercel は Workflow SDK の Nitro v3 統合をベータ版として公開し、ワークフローステップをアプリと同じランタイムで実行可能にした。これによりサーバーサイド API を直接利用でき、開発サーバーでワークフロー UI をデバッグできるようになった。

Vercel Blog·6月13日

Vercel、Pro および新 Enterprise ユーザー向けに関数呼び出し課金を単価制へ移行

Vercel は Pro および新規 Enterprise カスタマーに対し、パッケージベースの課金から単位ごとの課金(1 回あたり 0.0000006 ドル)へ移行すると発表した。現在の請求サイクル終了までは従来料金を維持し、次期から使用量に連動した課金体系となる。

Vercel Blog·5月29日

Amazon Bedrock を活用した AI 搭載採用アシスタントの構築方法

AWS は、採用担当者の事務作業時間を削減するため、Amazon Bedrock を使用して AI 搭載の採用アシスタントを構築する手法を公開しました。

AWS Machine Learning Blog·5月22日·★★★★

Browser Run が Cloudflare コンテナ上で稼働し、高速化とスケーラビリティが向上

開発チームは Browser Run を Cloudflare のコンテナ基盤に再構築しました。これにより、1 分間に最大 60 ブラウザを起動可能になり、並行実行数は 120 に達し、以前より 4 倍の性能向上を実現しています。また、クイックアクションの応答時間が 50% 以上短縮され、信頼性も高まりました。

Cloudflare Blog·5月13日·★★★★

VercelのCDNが新たなデプロイメントなしでルーティングルールの更新をサポート

Vercelがプロジェクト内でレスポンスヘッダーの設定や外部APIへのリライトなどのルーティングルールを、新たなデプロイメントを必要とせずに作成・更新できる機能を発表した。

Vercel Blog·3月5日

Railwayが1億ドルを調達、AIネイティブなクラウド基盤でAWSに挑戦

Railwayは1億ドルの資金調達を発表。AIアプリケーションの需要増加に対応し、AWSに対抗するAIネイティブなクラウドインフラを構築する。

VentureBeat AI·1月22日·★★★★