#ハードウェアアクセラレーション のAIニュース

9件の記事

SpecMD:予測的専門家プリフェッチングに関する包括的研究

研究者らは、Mixture-of-Experts モデルの性能向上に不可欠な専門家のキャッシュ機構について、既存のハードウェア中心の方策との相互作用を解明するため、標準化された研究手法「SpecMD」を開発した。

Apple Machine Learning·5月6日·★★★★

AIの電力消費を推定する高速な手法

研究者らが、データセンターの電力消費を迅速に推定する新手法を開発した。AI普及に伴うエネルギー需要増に対応し、データセンターの省エネ効率向上と持続可能性の実現を目指す。

MIT ML News·4月27日·★★★★

TPUが高度なAIワークロードをどのように支えるか

Googleは、TPUがますます要求の高いAIワークロードを処理する仕組みを解説する新動画を発表した。

Google AI Blog·4月23日

NVIDIA NVbandwidth:GPU相互接続とメモリ性能を測定する必須ツール

NVIDIAが、CUDAアプリケーション開発時に重要なデータ転送性能を測定するツール「NVbandwidth」を公開した。このツールはGPU間の相互接続とメモリ性能を評価するために設計されている。

NVIDIA Developer Blog·4月15日

次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介

NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。

NVIDIA Developer Blog·3月17日·★★★★

NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター

NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。

NVIDIA Developer Blog·3月17日·★★★★

NVIDIA Blackwellが金融分野におけるLLM推論でSTAC-AI記録を樹立

NVIDIAのBlackwellプラットフォームが、金融取引向け大規模言語モデルの推論性能でSTAC-AIベンチマーク記録を達成した。同技術は大量の非構造化データを分析し、金融取引の意思決定を支援する。

NVIDIA Developer Blog·3月6日·★★★★

NVIDIA CUDA TileにおけるFlash Attentionのピークパフォーマンス調整

NVIDIAが、現代AIの重要なワークロードであるFlash Attentionの実装方法と、CUDA Tileを使用した最適化テクニックを解説している。

NVIDIA Developer Blog·3月5日

LiteRT:オンデバイスAIのためのユニバーサルフレームワーク

TFLiteを進化させたLiteRTは、GPU性能1.4倍向上や新NPU対応など、オンデバイスAIの標準フレームワークとして機能します。

Google Developers AI·1月28日·★★★★