#高性能コンピューティング のAIニュース
4件の記事
プレゼンテーション:レイテンシー:ゼロへの競争…我々は到達したのか?
Amir Langer氏が、ポニーエクスプレスから現代ハードウェアまでのレイテンシー低減の進化を解説し、ビジネスロジックとI/Oの分離やAeronなどの技術でマイクロ秒単位の高速化を実現する手法を説明した。
InfoQ·4月10日
NVIDIA Vera CPU、AIファクトリー向けに高性能・高帯域幅・高効率を実現
NVIDIAがVera CPUを発表し、AIインフラの各層に新たな要件が生じる中、推論モデルのトークン需要増加に対応する高性能・高帯域幅・高効率をAIファクトリー向けに提供する。
NVIDIA Developer Blog·3月17日·★★★★
cuTile.jlがNVIDIA CUDAタイルベースプログラミングをJuliaに導入
NVIDIAがJulia向けにcuTile.jlを発表し、CUDAタイルベースプログラミングを実現。これによりテンソルコアへの自動アクセスが可能になり、JuliaでのGPUプログラミングが強化される。
NVIDIA Developer Blog·3月4日·★★★★
OpenAI Triton向けCUDA Tile IRバックエンドによるGPUプログラミングの進展
NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。
NVIDIA Developer Blog·1月31日·★★★★