#高性能コンピューティングのAIニュース

4件の記事

プレゼンテーション：レイテンシー：ゼロへの競争…我々は到達したのか？

Amir Langer氏が、ポニーエクスプレスから現代ハードウェアまでのレイテンシー低減の進化を解説し、ビジネスロジックとI/Oの分離やAeronなどの技術でマイクロ秒単位の高速化を実現する手法を説明した。

NVIDIAがVera CPUを発表し、AIインフラの各層に新たな要件が生じる中、推論モデルのトークン需要増加に対応する高性能・高帯域幅・高効率をAIファクトリー向けに提供する。

NVIDIAがJulia向けにcuTile.jlを発表し、CUDAタイルベースプログラミングを実現。これによりテンソルコアへの自動アクセスが可能になり、JuliaでのGPUプログラミングが強化される。

NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。