#キャッシュ最適化 のAIニュース
3件の記事
Claude Codeのトークン節約ガイド:100万コンテキストの使用に注意、新セッションの開始方法を適切に選択
AnthropicがClaude Codeのコスト構造を解説し、プロンプトキャッシュメカニズムを理解することで、新セッションを常に開始するよりも既存の会話を継続する方が費用対効果が高いことを示した。
宝玉的分享·4月6日·★★★★
AI時代におけるキャッシュの再考理由
Cloudflareが、自社ネットワークの32%のトラフィックがAIアシスタントを含む自動化トラフィックであることを報告し、AIエージェントの攻撃的なリクエスト行動に対応するためキャッシュシステムの再設計を進めている。
Cloudflare Blog·4月2日·★★★★
Kimi API:90%のキャッシュヒット率で価格を25%に削減
月之暗面(Moonshot AI)は、Kimi K2.5多モーダルモデルのAPI価格が、90%のキャッシュヒット率により標準価格の25%相当まで実質的に低下することを明らかにした。これは、同社が清華大学と共同開発した推論アーキテクチャ「Mooncake」による技術的成果である。
月之暗面 Kimi·2月27日·★★★★