2件の記事
GoogleがTorchTPUを発表。同社のTPUインフラ上でPyTorchワークロードを最小限のコード変更でネイティブ実行できる新エンジニアリングスタックを提供する。
NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。