#deepseek-v4 のAIニュース
4件の記事
DeepSeek、DeepSeek-V4 の生成速度を 60〜85% 向上させる推測的デコーディングフレームワーク「DSpark」を公開
中国の AI 企業 DeepSeek は、既存モデルの重みを利用した推測的デコーディングフレームワーク「DSpark」と、その学習・評価コード「DeepSpec」をオープンソース化し、大規模モデルの推論速度を大幅に向上させた。
MarkTechPost·6月28日·★★★★
FlashMemory DeepSeek-V4 リトリーバー(GitHub リポジトリ)
FlashMemory は、DeepSeek-V4 の KV キャッシュのうち将来のトークンが参照する可能性が高い断片を予測し、GPU 上に最も関連性の高い断片のみを保持します。これにより、デバイスのメモリ使用量を約 10〜15% に抑えつつ、下流タスクのパフォーマンスを維持または向上させることが報告されています。
TLDR AI·6月10日·★★★★
DeepSeek V4 ProおよびFlashモデル、Huawei Ascendチップで動作可能に
DeepSeekが大型遅延を経てDSV4をリリース。これは2024年12月のDSV3以来の主要バージョンであり、現在オープンモデルリーダーであるKimi K2.6やXiaomi Mimo 2.5と肩を並べる水準に達した。
Latent Space·4月25日·★★★★
DeepSeek-V4:エージェントが実際に活用できる100万トークンコンテキスト
DeepSeekは、自律型エージェントが実際に活用できる100万トークンのコンテキスト長を実現した新モデル「DeepSeek-V4」を公開した。
Hugging Face Blog·4月24日·★★★★