#amazon sagemaker のAIニュース
18件の記事
NVIDIA Blackwell を用いた Amazon SageMaker AI でのモデル学習の最適化
AWS は、NVIDIA の最新 GPU「Blackwell」を活用することで、Amazon SageMaker AI 上で大規模 AI モデルの学習におけるメモリ制約やシーケンス長の制限といった課題を克服し、実用的な運用範囲を広げる方法を発表した。
Amazon SageMaker AI 上で SeedVR2 をデプロイして超解像を実現する方法
AWS は、既存の低解像度動画ライブラリを高精細ディスプレイ向けにアップスケールする課題に対し、SeedVR2 モデルを Amazon SageMaker AI でデプロイする手法を発表した。これにより計算資源の制約や品質の不安定さを克服し、詳細なディテールの復元が可能となる。
Amazon SageMaker AI にコンテナキャッシュ機能を導入し、モデルのスケーリングを高速化
AWS は生成 AI モデルのスケールアウト時にエンドツーエンドのレイテンシを最大 2 倍短縮する「コンテナイメージキャッシング」機能を Amazon SageMaker AI 推論に追加した。
Amazon SageMaker AI で P-EAGLE を用いた推測的デコーディングの並列化
AWS は、大規模言語モデルの推論スループットを最大化し遅延を最小化する戦略として、軽量ドラフトモデルとターゲット LLM を組み合わせた「P-EAGLE」による推測的デコーディングの並列化技術を Amazon SageMaker AI で実装したと発表した。
Amazon SageMaker AI と FHE を用いたエンドツーエンド暗号化 ML 推論の紹介
AWS は、医療記録や機密情報などの敏感なデータをクラウド上で処理する際、データが推論プロセス全体で暗号化されたまま保たれるよう、Amazon SageMaker AI と完全準同型暗号(FHE)を組み合わせた手法を発表した。
NVIDIA Nemotron 3 Ultra が Amazon SageMaker JumpStart で利用可能に
AWS は、推論速度を5倍向上させ、コストを最大30%削減する「NVIDIA Nemotron 3 Ultra」モデルを、Amazon SageMaker JumpStart でワンクリックデプロイ可能にしたと発表した。
Amazon SageMaker AI で SFT と DPO を活用し、エージェントのツール呼び出し精度を向上させる方法
AWS は、Amazon SageMaker AI を使用して教師あり学習(SFT)と直接最適化(DPO)を適用することで、AI エージェントが適切なツールを選択する精度を高め、エラー率やサポートコストを削減できると発表した。
Amazon SageMaker AI LLM推論における包括的な観測可能性:GPU利用率からLLM品質まで
AWSは、大規模言語モデル(LLM)をAmazon SageMaker AI Inferenceでスケール展開する際、従来のソフトウェアとは異なる不確実な出力に対応するため、GPU利用率やLLMの品質変化を追跡する包括的な観測可能性の重要性について解説した。
REST API プロキシを用いたAmazon SageMaker MLflowへの外部アクセスの簡素化
AWSは、既存のHTTPSベースのインフラ要件に対応するため、REST APIプロキシを使用してAmazon SageMaker MLflowへの外部アクセスを容易にする機能を発表した。
Amazon SageMaker AI と vLLM を用いたリアルタイム音声アプリケーションの構築
AWS は、2025 年 11 月から Amazon SageMaker AI と vLLM を活用し、従来の方式では不可能だった低遅延のリアルタイム音声処理を実現する新機能を公開した。これにより、通話分析や字幕生成などのアプリケーションが単一接続で同時に音声ストリームを送受信できるようになる。
Amazon SageMaker AI における EU AI 法対応のガイドライン
Amazon は、EU AI 法の遵守義務を判断するために必要な計算資源(FLOPs)の追跡方法を、SageMaker AI を用いた大規模言語モデルのファインチューニングにおいて説明している。
ML ワークロード向け EC2 キャパシティブロックと SageMaker 学習プランによる短期 GPU 容量の確保
AWS は、GPU 需要が供給を上回る現状に対応するため、機械学習トレーニングや推論に使用できる短期間の GPU 容量を予約する「EC2 キャパシティブロック for ML」と「SageMaker 学習プラン」を発表した。
Amazon SageMaker AI で MLflow v3.10 がサポートされ、生成 AI 開発が効率化
Amazon は Amazon SageMaker AI の MLflow Apps にバージョン 3.10 を導入し、生成 AI 開発のワークフローを簡素化し、実験追跡機能を強化したと発表した。
容量対応型推論:SageMaker AI エンドポイントの自動インスタンスフォールバック
AWS は、生成 AI ワークロードの拡大に伴う GPU リソース不足によるエンドポイント障害を防ぐため、Amazon SageMaker AI 上で需要に応じた自動的なインスタンス切り替え機能を導入した。これにより、リソースが枯渇してもサービス継続を可能にする。
フォルクスワーゲングループが生成AIでマーケティングを再構想
フォルクスワーゲングループが、生成AIを活用してマーケティング業務を革新する取り組みを発表した。同社は2025年1-9月期に660万台の車両を販売する世界有数の自動車メーカーであり、AI技術の導入によりマーケティング効率の向上を目指している。
Bark.comとAWSがスケーラブルな動画生成ソリューションを構築する方法
Bark.comとAWSは、AIを活用した動画コンテンツ生成の品質を維持しつつ生産時間を短縮するスケーラブルなソリューションを共同開発した。
Amazon SageMaker AIとAmazon BedrockでvLLMを使用して数十のファインチューニングモデルを効率的に提供
vLLMでMixture of ExpertsモデルのマルチLoRA推論を実装し、カーネルレベルの最適化を行い、効率的なモデル提供方法を解説。GPT-OSS 20Bを例に使用。
SonraiがAmazon SageMaker AIを活用して精密医療試験を加速する方法
生命科学AI企業Sonraiは、AWSと提携し、Amazon SageMaker AIを用いたMLOpsフレームワークを構築。規制環境で必要な追跡可能性と再現性を維持しながら、精密医療試験の効率化を実現。