#ハードウェアアーキテクチャのAIニュース

5件の記事

大規模言語モデルの拡張方法（14 分読了）

本書は、TPU や GPU の動作原理や相互通信、実機での LLM 実行方法、および大規模スケールで効率的に動作させるための並列化手法を解説し、トレーニングコストやメモリ要件などの課題への回答を示す。

TLDR AI·5月6日·★★★★

LLM の重みがどの程度の情報を運んでいるか：無駄なビットを探して

研究者らは、大規模言語モデル（LLM）の推論において計算ユニットがデータバス速度不足で待機するボトルネックを解消するため、メモリを計算に変換する手法や量子化技術の限界について調査している。

TLDR AI·5月6日·★★★★

NVIDIA CEOジェンスン・フアン：AIがソフトウェアを破壊するという考えは「ばかげている」

NVIDIA CEOジェンスン・フアンは、AIエージェントがソフトウェアを置き換えるのではなく活用すると説明し、同社はラックアーキテクチャ全体を再設計した。

The Decoder·3月24日

言い換えれば、バットマンがスーパーマンになり、ロビンがバットマンになった

Appleは、Mシリーズチップの効率コア（「劣った」コア）が単体でも高速であることを強調しており、従来の認識を覆そうとしている。

Andrej Karpathy 厳選·3月4日

OpenAIのCodex-Spark、Cerebrasハードウェアで超高速コーディングを実現

OpenAIはハードウェア戦略を転換し、従来のNVIDIA GPUではなくCerebrasのウェハースケールチップ上で動作する初の本番AIモデル「GPT-5.3-Codex-Spark」を発表した。同社によると、この新モデルはスループット向上と低遅延を実現し、リアルタイムで対話的なコーディング体験を可能にする。

InfoQ·3月3日·★★★★