#ai推論 のAIニュース
6件の記事
Amazon Bedrockの詳細なコスト帰属機能の導入
AWSがAmazon Bedrockの推論コストをIAMプリンシパルごとに自動的に帰属する機能を発表した。これにより、コストの内訳把握、コスト最適化、財務計画が容易になる。
AWS Machine Learning Blog·4月18日
NVIDIAの極限共同設計が新たなMLPerf推論記録を達成
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを実現し、MLPerf推論ベンチマークで新記録を樹立した。
NVIDIA Developer Blog·4月2日·★★★★
スタートアップGimlet Labs、驚くほど洗練された方法でAI推論のボトルネックを解決
Gimlet Labsは、AIがNVIDIA、AMD、Intel、ARM、Cerebras、d-Matrixのチップを同時に実行できる技術で8000万ドルのシリーズA資金を調達した。
TechCrunch AI·3月24日·★★★★
NVIDIA Vera CPU、AIファクトリー向けに高性能・高帯域幅・高効率を実現
NVIDIAがVera CPUを発表し、AIインフラの各層に新たな要件が生じる中、推論モデルのトークン需要増加に対応する高性能・高帯域幅・高効率をAIファクトリー向けに提供する。
NVIDIA Developer Blog·3月17日·★★★★
NVIDIA CUDA TileにおけるFlash Attentionのピークパフォーマンス調整
NVIDIAが、現代AIの重要なワークロードであるFlash Attentionの実装方法と、CUDA Tileを使用した最適化テクニックを解説している。
NVIDIA Developer Blog·3月5日
SambaNovaのAI市場における戦略的動き
SambaNovaはインテルと提携し、市場が複雑な多段階推論へ移行する中で、コスト効率の高いAI推論システムを提供することを目指している。
AI Business·2月27日