#deepseek-v4 のAIニュース

4件の記事

DeepSeek、DeepSeek-V4 の生成速度を 60〜85% 向上させる推測的デコーディングフレームワーク「DSpark」を公開

中国の AI 企業 DeepSeek は、既存モデルの重みを利用した推測的デコーディングフレームワーク「DSpark」と、その学習・評価コード「DeepSpec」をオープンソース化し、大規模モデルの推論速度を大幅に向上させた。

FlashMemory DeepSeek-V4 リトリーバー（GitHub リポジトリ）

FlashMemory は、DeepSeek-V4 の KV キャッシュのうち将来のトークンが参照する可能性が高い断片を予測し、GPU 上に最も関連性の高い断片のみを保持します。これにより、デバイスのメモリ使用量を約 10〜15% に抑えつつ、下流タスクのパフォーマンスを維持または向上させることが報告されています。

TLDR AI·6月10日·★★★★

DeepSeek V4 ProおよびFlashモデル、Huawei Ascendチップで動作可能に

DeepSeekが大型遅延を経てDSV4をリリース。これは2024年12月のDSV3以来の主要バージョンであり、現在オープンモデルリーダーであるKimi K2.6やXiaomi Mimo 2.5と肩を並べる水準に達した。

Latent Space·4月25日·★★★★

DeepSeek-V4：エージェントが実際に活用できる100万トークンコンテキスト

DeepSeekは、自律型エージェントが実際に活用できる100万トークンのコンテキスト長を実現した新モデル「DeepSeek-V4」を公開した。

Hugging Face Blog·4月24日·★★★★