1件の記事
Cerebras は IPO で急成長を示し、トークン速度に最適化された「回答用推論」と、メモリ階層に最適化された「エージェント用推論」の分裂を予兆している。同社の WSE-3 は H100 の約 6,000 倍の帯域幅を持つが、KV キャッシュやモデル重みがオンチップ容量を超えると使用できない。