#sagemaker のAIニュース
8件の記事
CloudWatch の SageMaker メトリクスとインサイトダッシュボードを用いた生成 AI 推論の監視・デバッグ
AWS は、大規模な生成 AI 推論エンドポイントの P99 レイテンシ急上昇などのトラブルを GPU メモリ圧力や KV キャッシュ飽和などから特定できるよう、CloudWatch に SageMaker の詳細メトリクスとインサイトダッシュボードを追加した。
埋め込み型 Amazon SageMaker AI MLflow アプリをカスタムポータルに構築する方法
AWS は、大規模な機械学習チーム向けに、SSO を統合した内部ポータルへ Amazon SageMaker AI の MLflow アプリを安全かつスケーラブルに埋め込む手法を発表しました。
Amazon SageMaker AI エンドポイントが OpenAI 互換 API サポートを発表
Amazon は、SageMaker AI のリアルタイム推論エンドポイントに OpenAI 互換 API サポートを追加した。これにより、OpenAI SDK や LangChain を利用するユーザーは、エンドポイント URL の変更のみで SageMaker AI 上のモデルを呼び出せるようになった。
NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に
NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。
Nova Forge SDKシリーズ第2部:データ混合機能を使用したNovaモデルのファインチューニング実践ガイド
Amazonは、Amazon Nova Forge SDKを使用してAmazon Novaモデルをファインチューニングする手順を、データ準備からデータ混合を用いたトレーニング、評価まで実践的に解説するガイドを公開した。
SageMaker JumpStartにおけるユースケースベースのデプロイ
Amazon SageMaker JumpStartは、AIワークロードの開始を支援する多様な問題タイプ向けの事前学習済みモデルを提供し、主要なユースケース向けソリューションをSageMaker AI Managed Inferenceエンドポイントにデプロイ可能にする。
SageMaker AI LSTMネットワークとESA STIXデータを用いた太陽フレア検出システムの構築
欧州宇宙機関のSTIXデータとSageMakerのLSTMネットワークを活用し、複数エネルギー帯のX線放射を分析する機械学習ベースの異常検出システムで、太陽フレアの監視と特性把握を実現する。
Nova Forge SDKを使用したNovaカスタマイズ実験の開始
Nova Forge SDKは、大規模言語モデル(LLM)のカスタマイズを容易にし、技術的専門知識やインフラ設定を必要とせずにチームが言語モデルの可能性を活用できるようにする。