メインコンテンツへスキップ

#モデルデプロイメント のAIニュース

7件の記事

Claude Opus 4.7がVercel AI Gatewayで利用可能に

AnthropicがClaude Opus 4.7をVercel AI Gatewayで公開した。同モデルは長時間実行可能な非同期エージェント向けに最適化され、複雑な多段階タスクを確実に処理できる。知識労働者向けタスクや画像処理ライブラリを用いたプログラム的ツール呼び出しで性能向上を示す。

Vercel Blog·4月16日·★★★★

SageMaker JumpStartにおけるユースケースベースのデプロイ

Amazon SageMaker JumpStartは、AIワークロードの開始を支援する多様な問題タイプ向けの事前学習済みモデルを提供し、主要なユースケース向けソリューションをSageMaker AI Managed Inferenceエンドポイントにデプロイ可能にする。

AWS Machine Learning Blog·4月15日

リアルタイム強化学習によるComposerの改善

Meta社がComposerにオンライン強化学習を適用し、本番環境でモデルチェックポイントを提供し、実際のユーザーインタラクションを報酬信号として使用して、1日に複数回改善されたチェックポイントをリリースした。

Cursor Blog·3月26日

MLモデルを本番環境に安全にデプロイするための4つの制御戦略(A/B、カナリア、インターリーブ、シャドウテスト)

著者は、機械学習モデルを本番環境に安全にデプロイするために、A/Bテスト、カナリアリリース、インターリーブテスト、シャドウテストの4つの制御戦略を提案している。

MarkTechPost·3月22日·★★★★

カスタムLLMのデプロイを加速: OumiでファインチューニングしAmazon Bedrockにデプロイ

OumiのDavid StewartとMatthew Personsが、オープンソース大規模言語モデルの実験から本番環境への移行における課題を解決する方法を紹介。LlamaモデルをOumiでファインチューニングし、Amazon Bedrockにデプロイする手順を示す。

AWS Machine Learning Blog·3月11日

NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化

NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。

NVIDIA Developer Blog·2月10日·★★★★

Nanochatのオーケストレーション:モデルのデプロイ

RunPodが、訓練済みのAIモデルを高速で信頼性の高いエンドポイントとしてデプロイする方法を解説する。Dagsterによるオーケストレーションと自動更新を組み合わせたガイドを提供する。

Dagster Blog·12月16日