#長文処理のAIニュース

2件の記事

ミニマックスが109BパラメータMoEモデル向けに開発したスパースアテンション手法「MSA」を発表

中国のAI企業ミニマックスは、長文コンテキストにおける計算コストを削減する新手法「MiniMax Sparse Attention（MSA）」を開発し、109BパラメータのMoEモデルで実証した。同社はさらに推論用カーネルをオープンソース化し、生産環境向けモデル「MiniMax-M3」もリリースした。

MarkTechPost·6月17日·★★★★

キーバリューキャッシュからの効率的なエビクション学習

大規模言語モデルの推論効率化に向け、従来のヒューリスティック手法に依存しない、キーバリューキャッシュの効率的なエビクション手法の研究。

Apple Machine Learning·2月23日·★★★★

#長文処理 のAIニュース

ミニマックスが109BパラメータMoEモデル向けに開発したスパースアテンション手法「MSA」を発表

キーバリューキャッシュからの効率的なエビクション学習

#長文処理のAIニュース