#gqa のAIニュース
2件の記事
パッキングシーケンス、GQA、ALiBi、SwiGLU、因果アテンションを用いたメモリ効率的なTransformerの構築方法(xFormers活用)
MarkTechPost は、GPU上で高速かつメモリ効率の高いTransformerモデルを構築するための実践的ツールキット「xFormers」の使用法を紹介しています。記事では、標準的な実装との比較を通じて、因果マスクやパッキングシーケンス、グループ化クエリアテンション(GQA)、カスタムALiBi位置バイアスなどの技術を組み合わせ、訓練可能なGPTスタイルのモデルを実装する方法を解説します。
MarkTechPost·6月17日·★★★★
大規模言語モデル(LLM)アーキテクチャの比較
Sebastian Raschka氏は、DeepSeek V3とGLM-5を含む現代のLLMアーキテクチャを比較し、各モデルの設計特徴と技術的進化を解説している。
Sebastian Raschka·7月19日·★★★★