#deepseek-r1 のAIニュース
3件の記事
今さらながらDeepSeek-R1の論文を読んでみた
中国DeepSeek社が公開した軽量で高品質なLLMについて、蒸留手法を用いた軽量化の技術的観点から考察。高価なGPUが不要で動かせる点が特徴。
ABEJA Tech Blog·12月24日·★★★★
Qwen3:より深く思考し、より高速に動作する
Qwenチームは最新大規模言語モデル「Qwen3」を公開した。主力モデルと小型MoEモデルは、コーディングや数学で他トップモデルと互角の結果を示し、先行版を上回る性能を達成した。
Qwen Blog·4月29日·★★★★
DeepSeek APIの閑散時間帯割引、R1の価格が1/4に
深度求索は、北京時間の深夜0時30分から8時30分の閑散時間帯に、DeepSeek-V3のAPI価格を50%に、DeepSeek-R1を25%に引き下げる割引キャンペーンを開始した。
DeepSeek Blog·2月26日