世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現
世界のウェブサイトの約20%のトラフィックを扱うインフラ企業Cloudflareが、AIエージェントの大規模展開におけるコスト課題を解決するため、Kimi K2.5モデルをコア生産業務に採用し、77%のコスト削減を実現した。
キーポイント
CloudflareによるKimi K2.5の採用
グローバルなCDN・セキュリティ企業Cloudflareが、性能・安定性・拡張性の厳格な基準を満たすモデルとしてKimi K2.5を選定し、コア生産業務に導入した。
77%の大幅なコスト削減効果
Kimi K2.5の導入により、従来の閉鎖型モデルと比較して77%のコスト削減を達成し、例として単一のセキュリティスキャンAgentで年間240万ドルの費用を大幅に圧縮した。
AIエージェント時代のコスト課題への対応
指数関数的に増加する推論需要と持続的な高額なトークンコストが事業拡大のボトルネックとなる中、Cloudflareは閉鎖型モデルへの依存を止め、コスト効率の高い代替ソリューションを模索した。
Kimi K2.5の技術的特長と実用性
256kのコンテキストウィンドウ、視覚入力、安定した論理的推論能力、複雑なマルチターンツール呼び出しのサポート、構造化出力の信頼性のある処理により、エンジニアの日常ツールとして広く活用されている。
影響分析・編集コメントを表示
影響分析
この事例は、大規模な実運用環境においてオープンソース系AIモデルが閉鎖型モデルに匹敵する性能を持ちながら大幅なコスト優位性を発揮できることを実証し、企業のAI導入戦略に大きな影響を与える可能性がある。特に、AIエージェントの本格的な普及が進む中で、持続可能なコスト構造の構築が業界全体の課題となることが示唆されている。
編集コメント
Cloudflareというグローバルなインフラ企業による実践的な導入事例は、AIモデルの選定基準が単なる性能比較から総合的なコストパフォーマンス評価へと移行していることを示しており、業界の転換点となる可能性がある。
Kimi API 2026-03-31 20:20 天津
以下文章来源于:Kimi开放平台
Kimi开放平台
Kimi APIでアプリケーションを作成: platform.kimi.com 、月の裏側を一緒に探求するのを楽しみにしています
image
Cloudflare × Kimi K2.5
image
インターネットを利用したことがあるなら、おそらくすでにCloudflareのサービスを利用したことがあるでしょう。ニューヨーク証券取引所に上場し、時価総額約800億ドルのこのグローバルなサイバーセキュリティとCDN企業は、世界のインターネットトラフィックの約20%を支えています。
その影響力は、重要な瞬間に特に明らかになります。2025年11月18日、Cloudflareの潜在的なバグにより、ChatGPTやClaudeなどの主要AIサービスが5時間にわたって一斉に停止しました。このようなインフラレベルの地位は、Cloudflareが基盤技術を選ぶ基準が極めて高いことを意味します——性能、安定性、拡張性のすべてが欠かせません。
最近、Cloudflareは公式技術ブログで、AI大規模言語モデル(LLM)アプリケーションの新たな進展を公表しました。世界中の様々なモデルを総合的に評価した結果、Cloudflareは中核的な本番業務においてKimi K2.5を選択し、77%のコスト削減を実現しました。
エージェント時代のコスト課題
Cloudflareの目標は、モデルの能力とコストの最適なバランス点を真に見つけることです。新規事業の急速な成長と、社内AIエージェントの大規模導入に伴い、推論コストは事業拡大の主要なボトルネックとなっています。
CloudflareのCEO、マシュー・プリンセスは、SXSW 2026カンファレンスで、将来のインターネットトラフィックは数億のAIエージェントによって駆動され、推論需要は指数関数的に増加すると述べました。この潮流に対し、大企業であっても、クローズドモデルが持続的にもたらす高額なトークンコストを負担し続けることは困難です。そのためCloudflareは、実際の業務ではもはやクローズドモデルに依存していません。
Kimi K2.5による77%のコスト削減
Cloudflareの評価において、Kimi K2.5は256Kのコンテキストウィンドウ、ビジュアル入力、安定した論理推論能力によって頭角を現しました。複雑なマルチターンツール呼び出しをサポートするだけでなく、構造化出力を確実に処理し、様々なプログラミングやエージェントタスクで優れた性能を発揮します。
Cloudflareは公式ブログで次のように記しています:
過去数週間、私たちはKimi K2.5を社内開発ツールのエンジンとしてテストしました。OpenCode環境では、Cloudflareのエンジニアが日常的にKimiを使って様々なエージェントコーディングタスクをこなしています。また、このモデルを自動コードレビューパイプラインにも統合しました。当社の公開コードレビューエージェント「Bonk」では、CloudflareのGitHubリポジトリでその実際の働きを直接確認できます。導入後、このモデルは大規模なクローズドモデルの迅速かつ効率的な代替手段であることが証明され、品質の低下は一切ありませんでした。
blog.cloudflare.com
当初、Kimi K2.5の導入は単なる実験でしたが、その性能とコスト効率を評価した後、すぐに欠かせない存在となりました。具体的な例を挙げると、Cloudflareのコードリポジトリのセキュリティ問題をスキャンする担当エージェントがあり、毎日70億を超えるトークンを処理しています。Kimiを使ったこのエージェントは、単一のリポジトリで一度に15個の確認済みセキュリティ欠陥を発見したことがあります。大まかな試算では、このエージェントがクローズドモデルで実行された場合、この単一ユースケース、単一コードリポジトリだけで、年間240万ドルの費用がかかります。Kimi K2.5に切り替えた後、コストは元のごく一部となり、直接的に費用を77%削減しました。
blog.cloudflare.com
現在、Kimi K2.5はCloudflareエンジニアの日常的なツール(デイリードライバー)となり、社内開発ツールや自動コードレビューなどのタスクに広く活用されています。
この節約は予算構造を最適化しただけでなく、チームがAIをより多くの高頻度シナリオに適用する余地を生み出しました。
Cloudflareが述べるように、AIアプリケーションがますます普及するにつれ、企業のエンジニアリングチームの働き方は根本的に変わりつつあり、推論量は急増しています。企業は、最先端レベルの推論能力を持ち、コストがクローズドモデルの数分の一であるKimi K2.5のようなモデルに移行し、働き方の変革と新規事業の急速な成長を支えていくでしょう。
クイックアクセス
Kimi API オープンプラットフォーム: platform.kimi.com
K2.5 モデル クイックスタート: platform.kimi.com/docs/guide/kimi-k2-5-quickstart
- 彼らは皆Kimiモデルを使っています -
最近の更新
【チュートリアル】Kimi K2.5用マルチモーダルツールの作成、画像や動画を直接返す(文字記述ではなく)
Kimi:90%キャッシュヒット率、実質入力価格2.5割
K2.5、アリババ、テンセント、バイトダンスのAIプログラミングツールに導入
Kimi K2.5 リリース:オールラウンドエージェントモデル、視覚理解、コード、思考が一体に
90%のテンセントエンジニアが使うCodeBuddyプログラミングアシスタント、Kimi K2 Thinkingモデルを内蔵
7万人の金融投資研究員が使うAlphaEngine、エージェントモデルをKimi K2 Thinkingにアップグレード
3.5万スターと千万ダウンロードのCherry Studio、Kimi K2で開発イテレーションをどう加速させたか
世界で評価額最高のAI検索アプリPerplexity、Kimi K2 Thinkingモデルを導入
10人チームで年間経常収益(ARR)100万ドル、エージェントアプリ「Flowith」がKimi K2モデルに接続
45日でARRが3600万ドルに達したAIエージェント企業「Genspark」、Kimi K2モデルに接続
どれもKimi K2なのに、性能が違う?複数サービスプロバイダーのツール呼び出し性能を検証、テストセットを公開
評価額93億ドル、エージェントユーザー350万人超、クラウド開発ホスティングプラットフォーム「Vercel」、Kimi K2 Turbo APIに接続
リリースから4ヶ月、月間アクティブユーザー50万人、AIコーディングのダークホース「YouWare」、Kimi K2 APIに接続
Kimi K2 モデル更新、より強力なコード能力、より高速なAPIを提供
Kimi Playground: Kimi K2のツール呼び出し能力をワンストップで体験
Kimi K2 リリース及びオープンソース化、コードとエージェンシー的タスクに優れる
原文を読む
WeChatで開く
原文を表示
Kimi API 2026-03-31 20:20 天津
以下文章来源于:Kimi开放平台
Kimi开放平台
用 Kimi API 创造你的应用:platform.kimi.com ,期待与你一起探索月之暗面
image
Cloudflare × Kimi K2.5
image
只要你上过网,大概率已经用过 Cloudflare 的服务。这家在纽交所上市、市值近 800 亿美元的全球网络安全与 CDN 加速公司,承载了全球约 20% 的互联网流量。
它的影响力在关键时刻尤为明显:2025 年 11 月 18 日 Cloudflare 的一个潜伏 Bug,导致 ChatGPT 和 Claude 等主流 AI 服务集体中断 5 小时。这种基础设施级别的地位,意味着 Cloudflare 对底层技术的选择标准极高——性能、稳定性和扩展性缺一不可。
近日,Cloudflare 在其官方技术博客中披露了 AI 大模型应用的新进展。经过对全球各类模型的综合评估,Cloudflare 最终在其核心生产业务中选择了 Kimi K2.5,并实现了 77% 的成本降幅。
Agent 时代的成本挑战
Cloudflare 的目标是真正找到模型能力与成本的最佳平衡点。随着新业务的快速增长,以及内部 AI Agent 的大规模上线,推理成本已成为制约业务扩展的主要瓶颈。
Cloudflare 首席执行官 Matthew Prince 在西南偏南 SXSW 2026 大会分享中提到,未来的互联网流量将由数以亿计的 AI 智能体驱动,推理需求将呈指数级增长。面对这一趋势,即便是大型企业也难以承受闭源模型持续的、高昂的 Token 开销,因此 Cloudflare 已在实际业务中不再继续依赖闭源模型。
Kimi K2.5 降低 77% 成本
在 Cloudflare 的评估中,Kimi K2.5 凭借 256k 的上下文窗口、视觉输入和稳定的逻辑推理能力脱颖而出。它不仅支持复杂的多轮工具调用,还能可靠地处理结构化输出在各类编程和 Agent 任务中表现出色。
Cloudflare 在官方博客中写到:
过去几周,我们把 Kimi K2.5 作为内部开发工具的引擎进行了测试。在 OpenCode 环境中,Cloudflare 的工程师日常就用 Kimi 来完成各种 Agent 编码任务。我们还将该模型接入了自动代码审查流水线;在我们的公共代码审查 Agent Bonk 中,你可以直接在 Cloudflare 的 GitHub 仓库里看到它的实际表现。上线后,这款模型已被证明是大体量闭源模型的快速、高效替代方案,同时毫无质量折损。
blog.cloudflare.com
起初,接入 Kimi K2.5 只是一次试验,但在评估其性能与成本效益后,它迅速变得不可或缺。举个具体例子:我们有一个负责扫描 Cloudflare 代码库安全问题的 Agent,它每天处理的 token 超过 70 亿。使用 Kimi,它曾在单一仓库里一次性发现 15 个已确认的安全缺陷。粗略估算,如果这个 Agent 跑在闭源模型上,仅在这一单一用例、单一代码库上,我们每年就得花 240 万美元。换到 Kimi K2.5 后,成本只是原来的零头:直接把费用砍掉了 77%。
blog.cloudflare.com
目前,Kimi K2.5 已成为 Cloudflare 工程师的日常工具(Daily Driver),广泛应用于内部开发工具和自动化代码审查等任务。
这笔节省不仅优化了预算结构,更让团队有能力将 AI 应用到更多高频场景。
正如 Cloudflare 所言,随着 AI 应用日益普及,企业工程团队运作方式正在发生根本转变,推理量正在飙升。企业将会转向 Kimi K2.5 这样具备前沿级推理能力、成本仅为闭源模型几分之一的模型,以支持工作方式的转变和新业务的快速增长。
快速访问
Kimi API 开放平台:platform.kimi.com
K2.5 模型快速开始:platform.kimi.com/docs/guide/kimi-k2-5-quickstart
- 他们都在用 Kimi 模型 -
最近更新
【教程】为 Kimi K2.5 创建 Multimodal Tool,直接返回图片或视频,而非文字描述
Kimi:90%缓存命中率,实际输入价格2.5折
K2.5 已入驻阿里、腾讯、字节 AI 编程工具
Kimi K2.5 上线:全能 Agent 模型,视觉理解、代码和思考All in One
90%腾讯工程师在用的CodeBuddy编程助手,现已内置Kimi K2 Thinking模型
7万金融投研人在用的AlphaEngine,Agent模型升级Kimi K2 Thinking
3.5万Star和千万下载的Cherry Studio,如何用Kimi K2加速开发迭代?
全球估值最高AI搜索应用Perplexity上线 Kimi K2 Thinking模型
十人团队百万美元ARR,Agent应用「Flowith」已接入Kimi K2模型
45天ARR达3600万美元,AI Agent公司「Genspark」接入 Kimi K2 模型
都是Kimi K2,表现却不同?我们测了多家服务商ToolCall性能,并开源了测试集
估值93亿美元,Agent用户超350万,云端开发托管平台「Vercel」已接入Kimi K2 Turbo API
上线 4 个月,月活 50 万,AI Coding 黑马「YouWare」接入 Kimi K2 API
Kimi K2 模型更新,带来更强的代码能力、更快的 API
Kimi Playground: 一站式体验 Kimi K2 的工具调用能力
Kimi K2 发布并开源,擅长代码与 Agentic 任务
阅读原文
跳转微信打开
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み