#deep learning architecture のAIニュース
2件の記事
LWiAIポッドキャスト第227回 - ジェレミーが帰ってきた!DeepSeek 3.2、TPU、ネスト学習
アンドレイ・クレンコフとジェレミー・ハリスが、DeepSeek 3.2とFlux 2のリリース、Amazonの新AIチップとGoogleのTPUによるAIハードウェアの変化について議論した。
Last Week in AI·12月9日·★★★★★
トランスフォーマーファミリー版2.0
著者は3年前の投稿を大幅に改訂し、近年のアーキテクチャ改善案を追加した「トランスフォーマーファミリー版2.0」を公開した。これは旧版の上位互換で約2倍の長さとなり、セクション階層を再構築して最新論文を反映している。
Lilian Weng·1月27日·★★★★