月之暗面 Kimi·2026年4月21日 00:34·約17分で読める

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

#大規模言語モデル #コード生成 #自律型Agent #Moonshot AI #オープンソース

TL;DR

Moonshot AIがコード生成と自律型Agentクラスタ能力を大幅強化した大規模言語モデル「Kimi K2.6」をリリースし、オープンソース化するとともに主要ベンチマークで競合他社モデルに追従・優位を示した。

AI深層分析2026年4月21日 22:41

重要/ 5段階

深度40%

キーポイント

コード生成・長文タスクの突破

13時間連続コーディング、4000行超の修正・生成を実現し、複数言語・領域で高い汎化性能を維持。

Agentクラスタアーキテクチャの大幅強化

300個のサブエージェントが4000ステップを並列実行可能となり、最大5日間の自律運用をサポート。

主要ベンチマークでの競合追従・上回り

SWE-Bench ProやHumanity's Last ExamなどでGPT-5.4やClaude Opus 4.6と同等以上の成績を記録。

実証ケースの公開

軽量モデルの推論最適化や金融エンジンのリファクタリングなど、実際の開発現場で活用可能な実例を公開。

主要企業による早期テスト

Baseten、Vercel、Ollamaなど12社の主要企業がK2.6を早期にテストし、実証データを共有。

コード生成とAgentクラスタリングの強化

タイトルより、本モデルはコード処理能力とマルチAgent協調動作の性能を全面的に向上させている。

代码驱动设计与多模态生成能力

K2.6 Agent 模式可生成高设计感网站并支持基础后端功能，新增 Kimi Design Bench 评测基准，在多模态转代码任务上显著领先竞品。

影響分析・編集コメントを表示

影響分析

Moonshot AIのKimi K2.6公開は、オープンソースモデルとクローズドモデルの性能差をさらに縮めるだけでなく、長文コード生成と自律型Agentクラスタの実用化において新たな基準を提示した。開発者は大規模なソフトウェア保守・最適化作業をAIに委ねる新たなワークフローを構築でき、業界全体のAgent基盤技術の進化を加速させる可能性が高い。

編集コメント

プレスリリース特有の誇大表現に注意が必要だが、Agentクラスタの並列処理数や13時間連続コーディングといった具体的な実証データは、次世代開発支援ツールの方向性を示す重要な指標となる。

原作 Kimi Agent 2026-04-20 23:34 天津

image

マイナーバージョン、メジャーアップグレード

image

Talk is cheap. Show me the code.

Linus Torvalds

今日は、業界最高水準（state-of-the-art）のコード生成、長時間タスク実行、エージェントクラスター能力を備えた Kimi K2.6 モデルの公開およびオープンソース化を発表いたします。

Kimi K2.6 は現在、kimi.com、最新バージョンの Kimi アプリ、Kimi API、および Kimi Code プログラミングアシスタントにて提供開始されており、すべてのユーザーがご利用いただけます。

（完全なベンチマークテスト結果は技術ブログをご覧ください）

Kimi K2.6 は、汎用エージェント、コード生成、視覚理解などの総合能力を全面的に向上させました。特に、博士課程レベルの難易度を誇る完全版「人類最後の試験」（Humanity's Last Exam）、モデルの実務的なソフトウェアエンジニアリング能力を評価する SWE-Bench Pro、エージェントの深層検索能力を測定する DeepSearchQA などのベンチマークテストにおいて業界最高水準の成績を収め、GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro などのクローズドソースモデルと同等かそれ以上の性能を実現しています。

Kimi K2.6 はこれまでで最も強力なコードモデルであり、長時間のコーディング能力も大幅に向上しました。テストでは連続 13 時間の無停止コーディングが可能で、4000 行以上のコードを生成または修正し、複雑なシステムの開発と最適化を完了できます。コード生成能力と視覚理解能力の深い融合により、K2.6 はコード駆動型デザイン能力を新たな高みへ引き上げ、高いデザイン創造性を備えたプロフェッショナルレベルの Web アプリケーションを納品できるようになりました。

Kimi K2.6 はエージェントの自律実行能力（Autonomous execution capability）を大幅に強化し、エージェントの能力範囲をさらに広げることを可能にしました：

K2.6 モデルを基盤とする「エージェントクラスター（Agent Cluster）」アーキテクチャが大幅にアップグレードされ、現在 300 のサブエージェントが並列で 4000 の協調ステップを完了できるようになりました。より大規模な並列化を実現すると同時に、タスクの完了率と納品品質は K2.5 と比較して大幅に向上しています。

OpenClaw や Hermes Agent などのアクティブエージェントフレームワークに対応し、K2.6 は極めて強力な自動化タスク処理能力を発揮し、最大 5 日間の継続的な自律運用をサポートします。

長時間コーディング能力の突破

K2.6 は長時間のコードタスクにおけるパフォーマンスで突破を達成し、異なるプログラミング言語（Rust、Go、Python など）やタスクシナリオ（フロントエンド、運用保守、パフォーマンス最適化など）に対してより堅牢な汎化能力を備えています。

多種の複雑なエンドツーエンドタスク（End-to-end task）を網羅する Kimi 内部の厳格なコード評価ベンチマーク「Kimi Code Bench」において、K2.6 の成績は K2.5 より約 20% 向上しました。

実際のテスト結果によると、Kimi K2.6 モデルは複雑なソフトウェアエンジニアリングタスクにおいて強力な長時間推論能力を発揮しました：

シナリオ1：K2.6 は Mac ローカル環境で Qwen3.5-0.8B モデルのダウンロードとデプロイに成功し、マイナーな Zig 言語を用いてモデル推論の実装と最適化を行うことで、新モデルの汎化能力を実証しました。4,000 回以上のツール呼び出しと 12 時間を超える無停止運用を経て、K2.6 モデルは計 14 回のイテレーションを繰り返し、スループット（Throughput）を約 15 tokens/s から約 193 tokens/s に向上させ、最終的に LM Studio より 20% 高速な推論速度を実現しました。

シナリオ2：Kimi K2.6 は、8 年の歴史を誇るオープンソースの金融マッチングエンジン「exchange-core」に対する深度リファクタリングを自律的に完了しました。13 時間にわたる連続作業の中で、モデルは 12 種類の最適化戦略をイテレーションし、1,000 回以上のツール呼び出しを通じて 4,000 行以上のコードを精密に修正しました。エキスパートレベルのシステムアーキテクトとして、Kimi K2.6 は CPU およびメモリ割り当てのフレイムグラフ（Flame graph）を詳細に分析して隠れたボトルネックを特定し、コアスレッドのトポロジー構造（Topology structure）（4ME+2RE から 2ME+1RE へ）を大胆に調整しました。同エンジンの性能がすでに限界に近い状況においても、Kimi K2.6 は中央値スループットを 185% 向上（0.43 から 1.24 MT/s に増加）、ピークスループットも大幅に 133% 向上（1.23 から 2.86 MT/s に急増）させました。

Baseten、Blackbox AI、CodeBuddy、Factory（Droid）、飞书妙搭、Fireworks AI、Nous Research（Hermes Agent）、Kilo Code、Ollama、OpenCode、Qoder 和 Vercel といった企業顧客が K2.6 モデルを先行テストしました。以下に、彼らからの実際のフィードバックを抜粋してご紹介します：アルファベット順（1-6）

←

アルファベット順（7-12）

←

コード駆動型デザインの基準

私たちは、美しさそのものが生産力であると信じています。K2.6のエージェント（Agent）モードは、今やデザイン性と視覚インパクトに優れたウェブサイトを作成できるようになりました。

画像および動画生成ツールを熟練して呼び出すことで、K2.6エージェントは視覚スタイルが高度に統一された素材を生成し、視覚的な焦点が際立つヒーローセクション（Hero Section）を構築し、さらに多様なインタラクティブ要素や豊富なスクロールトリガーなどのアニメーション効果を実現します。

K2.6エージェントはフロントエンドページの作成に留まらず、基本的なバックエンドデータベースモジュールもサポートします。例えば、生成されたWebページにフォームによる情報収集機能を埋め込むことも可能です。

より強力なマルチモーダルプログラミング能力を備えたK2.6は、画像や動画の素材をコードへより正確に変換できます：

私たちは専用のフロントエンド開発デザイン評価ベンチマーク（Kimi Design Bench）を作成しました。これは、ビジュアル入力タスク、ランディングページ構築、フルスタックアプリケーション開発、そして汎用Web開発の4つの次元をカバーしています。Google AI Studio内のGemini 3モデルと比較して、kimi.comフレームワークに基づくK2.6エージェントは非常に明確な優位性を示しています。

エージェント（Agent）クラスターの全面的なアップグレード

単体のエージェント性能の制限を突破して初めて、エージェント能力の大規模な拡張が可能になります。「エージェントクラスター」はK2.5モデルから導入した新能力であり、複雑なタスクを動的に分解し、自律的に専門的なエージェントを生成して並列処理を行います。

K2.5を基盤とし、K2.6のエージェントクラスターの協調能力が全面的にアップグレードされました。エージェントクラスターは現在、異なる技能特性を持つエージェントを補完的に連携させることができ、検索、ディープリサーチ（深度研究）、ドキュメント分析、長文作成などの能力を組み合わせることで、K2.5と比較してタスク完了品質が大幅に向上しました。エージェントクラスターは単一の実行で、ドキュメントからWebページへ、さらにPPTや表計算ソフトへのマルチ成果物エンドツーエンド納品を完全に自律的に実行できます。

さらに、エージェントクラスターのアーキテクチャもアップグレードされ、最大300のサブエージェントが並列で4000の協調ステップを完了できるようになり、より大規模な並列化を実現し、マルチエージェントシステム協働の能力上限をさらに引き上げました。

使用例を2つご紹介します：

ケース1：エージェントクラスターは世界中の100社の半導体銘柄を対象に5つのクオンツ戦略を設計・実行しました。マッキンシースタイルのPPTロジックを再利用可能なスキルとして蓄積し、最終的に詳細なモデリング表と一連の報告プレゼンテーションドキュメントを納品しました。

ケース2：エージェントクラスターは、膨大な視覚データを含む高品質な天体物理学論文を再利用可能な学術スキルに変換しました。論文の推論プロセスと可視化手法を抽出することで、40ページ・約7000字の研究論文、2万超のデータを含む構造化データセット、そして14枚の天文学級チャートを生成しました。

自律型エージェント：OpenClawやHermesなどのフレームワークと完璧に連携

K2.6はエージェントの自律実行能力を大幅に強化し、特にOpenClawやHermesのようなエージェント型自動化タスクで顕著な成果を上げています。これらのシナリオでは、AIがアプリケーションを跨いで24時間365日（24/7）の連続運用を実現する必要があります。

従来の対話型インタラクションとは異なり、このようなワークフローでは、AIがバックグラウンド常駐型のエージェントとしてタスク計画を自律的に管理し、コードを実行し、クロスプラットフォーム操作を調整する必要があります。

当社のRL（強化学習）インフラストラクチャチームは、K2.6ベースのエージェントを用いて5日間の連続自律運用を実現しました。このエージェントは監視、障害対応、システム運用を担当し、持続的なコンテキスト維持能力、マルチスレッドタスク処理能力、そしてアラート受信から完全解決までのフルプロセス実行能力を示しました。以下はK2.6の作業ログです（機密情報は匿名化处理済み）：

実際の使用においてK2.6の信頼性は着実に向上しました：API呼び出しがより正確になり、長時間の実行が安定し、複雑な研究タスク実行時のセキュリティ意識も強化されました。

Kimi 内部の Claw Bench（Claw Bench）テスト結果によると、K2.6 は K2.5 に比べて総合性能が 10% 向上しました。このベンチマークテストは、プログラミングタスク、メッセージングエコシステムの統合、情報検索と分析、スケジュールタスク管理、そしてメモリ呼び出し能力の 5 つの次元をカバーしています。すべての評価指標において、K2.6 はタスク完了率とツール呼び出しの精度で K2.5 を上回っており、人間の介入が不要で長時間の自律実行を必要とするワークフローにおいてその優位性が特に顕著です。

Office 業務能力の継続的な強化

K2.6 モデルの強化されたコードおよびビジュアル理解能力を活かし、Kimi エージェントモードではスキル（Skill）の作成と呼び出しがサポートされるようになりました。

システムには公式推奨スキルが 100 以上プリインストールされています。これには Kimi 内部の専門チームが作成した投資調査スキルパックが含まれており、機関レベルの投資調査ワークフローをパッケージ化することで、ユーザーはワンクリックでプロ仕様のレイアウトを施した「A株・港股・米株企業 1 ページまとめ」または詳細な投資リサーチレポートを生成できます。これにより、企業への迅速な理解が可能になり、重要な財務基礎データ、業界の全体像、市場が最も注目する株価の中核駆動要因を全方位かつ高速で把握できます。

今後は推奨スキルライブラリを継続的に更新し、より多くの知識労働者が「プラグアンドプレイ」を実現できるよう支援します。資料収集から思考整理、成果出力までの全プロセスにおける効率向上をサポートします。

現在、Kimi エージェントモードでスラッシュ「 / 」を入力するだけで、スキルの作成と呼び出しを開始できます。すべてのユーザーはゼロから Kimi との対話を通じてスキルを作成することが可能です。

しかし、本当に実用的なスキルを作成するには、依然として豊富な知識の蓄積と専門的な能力が必要であり、ハードルは高いものです。ユーザーが丹念に作成したドキュメントを簡単に再利用可能なスキル（Skill）に変えられるよう支援するため、Kimi エージェントは「Office ドキュメントからスキルへ」機能をサポートしています。高品質な Office ドキュメントをアップロードすると、Kimi は原文書の構造とスタイルの遺伝子を理解しようとし、あなた専用に再利用可能なドキュメント作成スキルを生成します。

もう一つ、重要な発表

人類はチームワークと組織的な分業によってインターネットを創造し、大規模言語モデルを開発し、月面への到達を実現しました。AI エージェントが現実世界の複雑な課題を人類に代わって処理するのを支援するためには、チームワークと組織的分業の方向へ進化することは必然です。

「エージェントクラスター（Agent Cluster）」は、AI による自動化分業の方向性での私たちの探求です。本日より、もう一つの方向性の探索を開始します。人類と各種の 24 時間稼働型エージェントを同じグループに配置し、彼らがどのように分業協力して、個人や単一エージェントでは達成できないタスクを完了するかを探ります。

これが、すでに小規模なベータテストを開始している「Claw グループ」です。

「Claw グループ」の目標は、開放的で異種混合なエコシステムを受け入れることです。複数のエージェントと人類が真の共同作業者として連携して動作します。ユーザーは、あらゆるデバイス、あらゆるベンダー、あらゆるモデルで稼働する全天候型エージェント（初回サポートは OpenClaw、以降は Hermes Agent などのフレームワーク対応を追加予定）を接続できます。各エージェントは独自の専門ツールキット、スキル、永続化されたメモリコンテキストを携行します。ローカルのノートパソコン、モバイルデバイス、クラウドインスタンスのいずれにデプロイされていても、これらの多様なエージェントは同じ共同作業グループに参加できます。

「Claw グループ」において K2.6 はコーディネーター（Coordinator）として機能します。エージェントのスキルプロファイルと利用可能なツールに基づいてタスクを動的にマッチングさせ、能力の最適配置を実現します。特定のエージェントで障害や停止が発生すると、コーディネーターが中断を検知し、タスクの自動再割り当てまたはサブタスクの生成を行います。さらに、エージェントの納品物の全ライフサイクル（起動から検証、完了まで）を積極的に管理します。

Kimi Claw のユーザーは順次「Claw グループ」のベータテスト招待を受け取ることになります。ご期待ください。

Kimi K2.6 の利用開始

Kimi K2.6 は現在、すべての無料ユーザー、有料サブスクリプションユーザー、Kimi Code ユーザー、および企業向け API ユーザーに向けて公開されています。kimi.com、最新バージョンの Kimi App、Kimi Code、そして Kimi API 公開プラットフォーム（platform.kimi.com）へアクセスしてご利用ください。

企業や開発者は、Kimi API でモデルを「kimi-k2.6」に指定するだけで利用を開始できます。K2.6 モデル API のリリースを記念し、Kimi 公開プラットフォームでは同時に最大 30% の期間限定チャージボーナスキャンペーンを同時開催しています。

同時に、Kimi K2.6公式APIが腾讯云TokenHubなどのプラットフォームで初回提供を開始しました。腾讯云ユーザーの皆様のご利用と体験を歓迎いたします。さらに、Kimi K2.6のベンチマーク評価結果を再現するには、Kimi公式APIを直接呼び出すことを推奨します。サードパーティのAPIサービスを利用する場合は、Kimiモデルベンダー検証サービス（Kimi Vendor Verifier, KVV）を通じて、より高精度なサービスプロバイダーを選択してください。詳しくはこちら：https://kimi.com/blog/kimi-vendor-verifier

クイックスタート

↓ K2.6との会話、Office文書の処理、Webアプリケーションの作成

Kimiとの会話：kimi.com または最新バージョンのKimi Appをダウンロード -

Kimi Agentの体験：kimi.com/agent

Agent Swarmの体験：kimi.com/agent-swarm

↓ K2.6を活用したプログラミング支援

Kimi Codeの月額コーディングプランのご利用：kimi.com/code

↓ Kimi APIを使用したアプリケーション作成 K2.6クイックスタート：https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart

期間限定チャージボーナスキャンペーンのご確認：https://platform.kimi.com/docs/pricing/promotion

↓ モデルのローカルデプロイメント（Local Deployment）

Hugging Face:https://huggingface.co/moonshotai

ModelScope：https://www.modelscope.ai/organization/moonshotai

最近の更新

Kimiと共に人工汎用知能（AGI）へ取り組み、成長サイクルを乗り越える

世界で5分の1のウェブサイトを運用するCloudflareがKimi K2.5を選択し、コストを77%削減

Kimi 杨植麟「2026 中关村论坛」基調講演全文（動画付き）

Kimi API：90％のキャッシュヒット率（Cache Hit Rate）で価格を25％に引き下げ

KimiでOpenClawのご利用が可能になりました

テクニカルレポート：Kimi K2.5はテキストとビジュアル能力をどのように相互強化しているか？

PPTだけでなく、Kimi K2.5 AgentがExcel、Word、PDFの作成もサポート

KimiがK2.5モデルを公開・オープンソース化、新たなビジュアル理解、コード生成、Agentクラスタリング能力を提供

WeChatで開くにはこちらへジャンプ

原文を表示

原创 Kimi Agent 2026-04-20 23:34 天津

image

小版本，大升级

image

Talk is cheap. Show me the code.

Linus Torvalds

今天，我们发布并开源 Kimi K2.6 模型，带来行业领先（state-of-the-art）的代码、长程任务执行和 Agent 集群能力。

Kimi K2.6 现已上线 kimi.com、最新版 Kimi 应用、Kimi API和 Kimi Code 编程助手，所有用户都可以开始使用。

（完整基准测试成绩见技术博客）

Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升，其中在博士级难度的完整版人类最后的考试（Humanity's Last Exam）、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩，持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro等闭源模型。

Kimi K2.6 是我们迄今最强的代码模型，其长程编码能力也得到显著提升，在测试中可以不间断编码 13 小时，编写或修改超过 4000 行代码，完成复杂系统的开发和优化。通过将代码与视觉能力的深度融合，K2.6 将代码驱动的设计能力提升到了新高度，可以交付极具设计创意的专业级 Web 应用。

Kimi K2.6 大幅增强了 Agent 自主化执行能力，帮助我们进一步扩展 Agent 的能力范围：

由 K2.6 模型驱动的「Agent 集群」架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤，实现更大规模的并行化，同时任务完成度和交付质量相比于 K2.5 有显著提升；

针对 OpenClaw、Hermes Agent 等主动式 Agent 框架，K2.6 展现出极强的自动化任务处理能力，支持长达 5 天的持续自主运行。

长程编码能力突破

K2.6 在长程代码任务中的表现取得了突破，面对不同编程语言（如 Rust、Go、Python）和任务场景（如前端、运维、性能优化）均具备更可靠的泛化能力。

在涵盖了多种复杂端到端任务的、Kimi 内部严格代码评测基准 Kimi Code Bench 中，K2.6 的成绩比 K2.5 提升了约 20%。

根据我们的实测，Kimi K2.6 模型在复杂软件工程任务中，展现了强大的长程推理能力：

场景一：K2.6 成功在 Mac 本地下载并部署了 Qwen3.5-0.8B 模型，通过使用小众 Zig 语言实现并优化模型推理，证明了新模型的泛化能力。经过 4,000 多次工具调用，超过 12 小时的不间断运行，K2.6 模型共迭代了 14 轮，将吞吐量从约 15 tokens/s 提升至约 193 tokens/s，最终实现比 LM Studio 快 20% 的推理速度。

场景二：Kimi K2.6 自主完成了对拥有 8 年历史的开源金融撮合引擎 exchange-core 的深度重构。历经 13 小时的连续作业，模型迭代了 12 套优化策略，通过 1,000 余次工具调用，对 4,000 多行代码进行了精准修改。化身专家级系统架构师，Kimi K2.6 深入分析 CPU 及内存分配火焰图以定位隐蔽瓶颈，并大胆调整核心线程拓扑结构（由 4ME+2RE 优化为 2ME+1RE）。即便在该引擎性能已接近极限的情况下，Kimi K2.6 仍实现了 185% 的中位吞吐量跃升（由 0.43 增至 1.24 MT/s），峰值吞吐量更是大幅提升 133%（由 1.23 飙升至 2.86 MT/s）。

Baseten、Blackbox AI、CodeBuddy、Factory（Droid）、飞书妙搭、Fireworks AI、Nous Research（Hermes Agent）、Kilo Code、Ollama、OpenCode、Qoder 和 Vercel 等企业客户提前测试了 K2.6 模型，这里摘录部分来自他们的真实反馈：首字母顺序（1-6）

←

首字母顺序（7-12）

←

代码驱动设计的标杆

我们相信，美本身就是一种生产力。K2.6 Agent 模式现在可以制作极具设计感和视觉冲击力的网站。

凭借对图像和视频生成工具的熟练调用，K2.6 Agent 能够生成视觉风格高度统一的素材，构建视觉焦点突出的首屏区（Hero Section），并且实现各种交互元素和丰富的滚动触发等动效。

K2.6 Agent 不局限于写前端页面，也支持基础的后端数据库模块，例如在生成网页中嵌入表单信息收集的功能。

凭借更强的多模态编程能力，K2.6 能够更精准地将图像和视频素材转化为代码：

我们创建了一套专门的前端开发设计评测基准（ Kimi Design Bench），涵盖视觉输入任务、落地页构建、全栈应用开发以及通用 Web 开发这四个维度。对比 Google AI Studio 中的 Gemini 3 模型，基于 kimi.com 框架的 K2.6 Agent 展现出了非常明显的领先优势。

Agent 集群全面升级

突破单体 Agent 性能的限制，才能实现 Agent 能力的规模化扩张。「Agent 集群」是我们从 K2.5 模型开始引入的新能力——动态拆解复杂任务，自主生成专项 Agent 并行处理。

在 K2.5 的基础上，K2.6 的 Agent 集群的协同能力全面升级。Agent 集群现在可以调度不同技能特长的 Agent 互补协作，将搜索、深度研究、文档分析和长文创作等能力进行组合，任务完成质量相比于 K2.5 有显著提升。Agent 集群在单次运行中，就能独立完成从文档到网页、再到 PPT 和表格的多产物端到端交付。

此外，Agent 集群的架构也升级了，现在最多支持 300 个子 Agent 并行完成 4000 个协作步骤，实现更大规模的并行化，进一步推高多 Agent 系统协作的能力上限。

我们看两个使用案例：

案例一：Agent 集群针对全球 100 个半导体标的设计并执行了 5 套量化策略。它将麦肯锡风格的 PPT 逻辑沉淀为可复用的技能，最终交付了详尽的建模表格和一整套汇报演示文档。

案例二：Agent 集群把一篇包含海量视觉数据的高质量天体物理论文转化为可复用的学术技能。通过提取论文的推理流程和可视化方法，系统产出了 40 页、长达 7000 字的研究论文，以及包含 2 万多条数据的结构化数据集和 14 张天文级图表。

自主 Agent：与 OpenClaw/Hermes 等框架完美协同

K2.6 显著增强了 Agent 的自主化执行能力，特别是在 OpenClaw、Hermes Agent 式自动化任务中表现突出——这些场景要求 AI 能够跨应用实现 24/7 不间断运行。

与传统的对话交互不同，这类工作流需要 AI 以后台常驻 Agent 的形式主动管理任务计划、执行代码、协调跨平台操作。

我们的 RL 基础设施团队使用基于 K2.6 的 Agent 实现了连续 5 天自主运行。该 Agent 负责监控、故障响应和系统运维，展现了持久的上下文维持能力、多线程任务处理能力，以及从接收告警到彻底解决的全流程执行能力。以下是 K2.6 的工作日志（敏感信息已做匿名化处理）：

K2.6 在实际使用中的可靠性有了切实提升：API 调用更加精准，长时间运行更加稳定，在执行复杂研究任务时的安全意识也得到了加强。

Kimi 内部的 Claw Bench 测试结果显示，K2.6 相比 K2.5 综合性能提升了 10%。这项基准测试涵盖五大维度：编程任务、即时通讯生态集成、信息检索与分析、定时任务管理，以及记忆调用能力。在所有评测指标上，K2.6 的任务完成率和工具调用准确率均领先 K2.5，在无需人工干预、需要长时间自主运行的工作流中优势尤为显著。

Office 办公能力持续精进

借助 K2.6 模型更强的代码和视觉理解能力，现在 Kimi Agent 模式支持创建和调用技能（Skill）。

系统已内置了上百个官方推荐技能。其中包括 Kimi 内部专家团队创建的投研技能包，通过封装机构级投资研究工作流，让用户一键生成专业排版的A股港股美股公司一页纸或者深度的投资研报，快速对一家公司上手，全方位速览公司关键基本面、行业全景和市场最关注的股价核心驱动因素。

后续我们将持续更新推荐技能库，帮助更多知识工作者实现「即插即用」，完成从找资料、理思路到出成果的全流程效率提升。

现在开始，在 Kimi Agent 模式下输入斜杠「 / 」，就可以开始创建和调用技能了。每个用户都可以从零开始，通过与 Kimi 对话创建技能。

但创建出真正实用的技能，仍然需要很多知识储备和专业能力，有很高的门槛。为了帮助大家把自己精心创建的文档轻松变成可复用的技能（Skill），Kimi Agent 已支持「Office 文档转技能」：上传高质量 Office 文档，Kimi 就会尝试理解原文档的结构与风格基因，为你生成专属的可复用文档创建技能。

One More Thing

人类通过团队协作和组织分工，创造了互联网、做出了大模型、登上了月球，AI Agent 想要帮助人类处理现实世界的复杂难题，也必然会向团队协作和组织分工的方向进化。

「Agent 集群」是我们在 AI 自动化分工方向的探索。今天将开始探索另一个方向：把人类和各种全天候 Agent 放在一个群组中，他们如何分工协作，完成一个人或一个 Agent 无法完成的任务？

这就是我们已开启小范围内测的「Claw 群组」。

「Claw群组」的目标是拥抱开放、异构的生态：多个 Agent 与人类作为真正的协作者共同运行。用户可以接入来自任何设备、任何供应商、运行任何模型的全天候 Agent（首批支持 OpenClaw，后续会加入对 Hermes Agent 等框架的支持），每个 Agent 可携带各自的专业工具包、技能和持久化记忆上下文。无论是部署在本地笔记本电脑、移动设备还是云端实例，这些各异的 Agent 都能进入同一个协同办公群组。

在「Claw群组」中，K2.6 担任协调者。它根据 Agent 的技能画像和可用工具动态匹配任务，实现能力的最优配置。当某个 Agent 遇到故障或停滞时，协调者会检测到中断，自动重新分配任务或生成子任务，并对 Agent 交付物的全生命周期（从启动、验证到完成）进行主动管理。

Kimi Claw 用户会陆续收到「Claw群组」的内测邀请，敬请期待。

开始使用 Kimi K2.6

Kimi K2.6 现已面向所有免费用户、付费订阅用户、Kimi Code 和企业 API 用户开放，欢迎访问 kimi.com、最新版 Kimi App、Kimi Code 和 Kimi API 开放平台（platform.kimi.com）开始使用。

企业和开发者只需在 Kimi API 中指定模型为kimi-k2.6，即可开始使用。为庆祝 K2.6 模型 API 上线，Kimi 开放平台同步开启了最高 30% 的限时充赠活动。

同时，Kimi K2.6 官方 API 已经首发登陆腾讯云 TokenHub 等平台，欢迎腾讯云的用户使用和体验 Kimi K2.6 模型。此外，我们推荐直接调用 Kimi 官方 API 复现 Kimi K2.6 基准评测成绩。如需使用第三方 API 服务，可通过 Kimi 模型供应商验证服务（Kimi Vendor Verifier, KVV) ，挑选精度更高的服务商。了解更多：https://kimi.com/blog/kimi-vendor-verifier

快速开始

↓ 对话 K2.6、处理Office文档或创建 Web 应用

与 Kimi 对话：kimi.com 或下载最新版 Kimi App -

体验 Kimi Agent：kimi.com/agent

体验 Agent Swarm：kimi.com/agent-swarm

↓ 用 K2.6 辅助编程

使用 Kimi Code 包月编码套餐：kimi.com/code

↓使用 Kimi API 创建应用K2.6 快速开始：https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart

查看限时充赠活动：https://platform.kimi.com/docs/pricing/promotion

↓ 本地部署模型

Hugging Face:https://huggingface.co/moonshotai

ModelScope：https://www.modelscope.ai/organization/moonshotai

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

#大規模言語モデル #コード生成 #自律型Agent #Moonshot AI #オープンソース

TL;DR

AI深層分析2026年4月21日 22:41

重要/ 5段階

深度40%

キーポイント

コード生成・長文タスクの突破

13時間連続コーディング、4000行超の修正・生成を実現し、複数言語・領域で高い汎化性能を維持。

Agentクラスタアーキテクチャの大幅強化

300個のサブエージェントが4000ステップを並列実行可能となり、最大5日間の自律運用をサポート。

主要ベンチマークでの競合追従・上回り

SWE-Bench ProやHumanity's Last ExamなどでGPT-5.4やClaude Opus 4.6と同等以上の成績を記録。

実証ケースの公開

軽量モデルの推論最適化や金融エンジンのリファクタリングなど、実際の開発現場で活用可能な実例を公開。

主要企業による早期テスト

Baseten、Vercel、Ollamaなど12社の主要企業がK2.6を早期にテストし、実証データを共有。

コード生成とAgentクラスタリングの強化

タイトルより、本モデルはコード処理能力とマルチAgent協調動作の性能を全面的に向上させている。

代码驱动设计与多模态生成能力

K2.6 Agent 模式可生成高设计感网站并支持基础后端功能，新增 Kimi Design Bench 评测基准，在多模态转代码任务上显著领先竞品。

影響分析・編集コメントを表示

影響分析

編集コメント

原作 Kimi Agent 2026-04-20 23:34 天津

image

マイナーバージョン、メジャーアップグレード

image

Talk is cheap. Show me the code.

Linus Torvalds

（完全なベンチマークテスト結果は技術ブログをご覧ください）

Kimi K2.6 はエージェントの自律実行能力（Autonomous execution capability）を大幅に強化し、エージェントの能力範囲をさらに広げることを可能にしました：

長時間コーディング能力の突破

実際のテスト結果によると、Kimi K2.6 モデルは複雑なソフトウェアエンジニアリングタスクにおいて強力な長時間推論能力を発揮しました：

←

アルファベット順（7-12）

←

コード駆動型デザインの基準

より強力なマルチモーダルプログラミング能力を備えたK2.6は、画像や動画の素材をコードへより正確に変換できます：

エージェント（Agent）クラスターの全面的なアップグレード

使用例を2つご紹介します：

自律型エージェント：OpenClawやHermesなどのフレームワークと完璧に連携

Office 業務能力の継続的な強化

もう一つ、重要な発表

これが、すでに小規模なベータテストを開始している「Claw グループ」です。

Kimi Claw のユーザーは順次「Claw グループ」のベータテスト招待を受け取ることになります。ご期待ください。

Kimi K2.6 の利用開始

クイックスタート

↓ K2.6との会話、Office文書の処理、Webアプリケーションの作成

Kimiとの会話：kimi.com または最新バージョンのKimi Appをダウンロード -

Kimi Agentの体験：kimi.com/agent

Agent Swarmの体験：kimi.com/agent-swarm

↓ K2.6を活用したプログラミング支援

Kimi Codeの月額コーディングプランのご利用：kimi.com/code

↓ Kimi APIを使用したアプリケーション作成 K2.6クイックスタート：https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart

期間限定チャージボーナスキャンペーンのご確認：https://platform.kimi.com/docs/pricing/promotion

↓ モデルのローカルデプロイメント（Local Deployment）

Hugging Face:https://huggingface.co/moonshotai

ModelScope：https://www.modelscope.ai/organization/moonshotai

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

キーポイント

影響分析

編集コメント

関連記事

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

キーポイント

影響分析

編集コメント

関連記事