AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Decoder·2026年4月21日 02:13·約3分で読める

オープンウェイト「Kimi K2.6」がエージェント群でGPT-5.4とClaude Opus 4.6に挑戦

#LLM#オープンソースモデル#エージェントスワーム#Moonshot AI#コーディングAI
TL;DR

Moonshot AIがコーディングベンチマークでGPT-5.4やClaude Opus 4.6に匹敵するオープンウェイトモデル「Kimi K2.6」をリリースし、最大300のエージェント並列実行をサポートする。

AI深層分析2026年4月21日 03:31
4
重要/ 5段階
深度40%
3
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

オープンウェイト化による運用自由度の向上

Moonshot AIがKimi K2.6をオープンウェイト形式で公開し、企業や開発者が独自環境でのデプロイや微調整を可能にした。

2

トップティアモデルとの性能競合

コーディング特化ベンチマークにおいて、GPT-5.4やClaude Opus 4.6と同等以上の性能達成を謳っており、市場競争が激化している。

3

エージェントスワーム技術の実装

最大300個の自律型エージェントを並列実行可能であり、複雑なタスクの分解と協調処理能力が強化された。

影響分析・編集コメントを表示

影響分析

Kimi K2.6のオープンウェイト化は、大規模言語モデル市場におけるクローズドとオープンの境界を曖にし、開発者のカスタマイズ可能性を大幅に高める。特にエージェントスワーム技術の統合は、複雑なタスクを自律的に処理する次世代AIシステムの標準化を加速させる可能性が高い。

編集コメント

オープンウェイト化とエージェント並列処理の組み合わせは、次世代AI開発のトレンドを先取りしている。ただし、ベンチマーク結果の実環境での再現性とセキュリティ対策が今後の課題となるだろう。

Moonshot AIはKimi K2.6をオープンウェイトモデル(open-weight model)としてリリースした。コーディングベンチマーク(coding benchmarks)においてGPT-5.4やClaude Opus 4.6と互角の性能を発揮するように設計されており、最大300のエージェントを並列実行可能だ。

Moonshot AIによると、K2.6は複数のベンチマークで最高スコアを記録し、GPT-5.4、Claude Opus 4.6、Gemini 3.1 Proと同等の水準に達している。具体的な数値としては、HLE with Toolsで54.0、SWE-Bench Proで58.6、BrowseCompで83.2をマークしている。このモデルはRust、Go、Pythonなどの言語において、4,000回以上のツール呼び出し(tool calls)をチェーンで実行し、12時間以上連続稼働することも可能だ。

コーディングやエージェントベンチマーク(agent benchmarks)ではOpenAI、Anthropic、Googleのトップモデルと肩を並べるKimi K2.6だが、純粋な推論やビジョン(画像認識)の分野ではやや劣る。| 画像提供: Kimi

並列動作する300のエージェント

目玉機能はAgent Swarm(エージェントスウォーム)で、最大300のサブエージェント(sub-agents)を同時に実行でき、各エージェントは4,000ステップの処理を行う。システムはタスクを自動的にサブタスクに分割し、専門的なエージェントへ引き渡す。Moonshot AIによると、これらのエージェントはウェブ調査(web research)、ドキュメント分析(document analysis)、文章作成などのスキルを組み合わせ、単一のランで文書、ウェブサイト、スライド資料(slide decks)、スプレッドシートなどの完成品を生成することを意図している。以下に例を示す:

「claw groups」と呼ばれるプレビュー機能により、複数のエージェントと人間がチームとして連携して作業できる。K2.6は調整役を務め、各エージェントの得意分野に基づいてタスクを割り当て、エラーが発生したり処理が停滞したりした際には介入して対応する。

また、K2.6はテキストプロンプト(text prompts)から直接、アニメーションやデータベース接続を備えた完全なウェブサイトも構築可能だ。視覚的な一貫性を保つため、画像生成や動画生成のツールも組み込む。Moonshot AIは、このモデルがフロントエンド作業(front-end work)にとどまらず、ユーザー登録、データベース操作、セッション管理(session management)などの基本的なフルスタックタスク(full-stack tasks)も処理できると説明している。

K2.6は、ほぼ無制限の自由な利用を認める修正MITライセンス(modified MIT license)の下で提供されるが、条件が一つある。月間アクティブユーザー(monthly active users)数が1億人以上、または月間収益が2,000万ドルを超える商用製品でこのモデルを展開する場合は、ユーザーインターフェース上で「Kimi K2.6」を明記したクレジット表示が義務付けられる。

このモデルは、kimi.com上でチャットモードおよびエージェントモードで利用可能であり、Kimi Codeを通じてコーディングツールとしても提供され、API経由でのアクセスやHugging Faceでのオープンソースダウンロード(open source download)にも対応している。

過大評価を排したAIニュース – 人間が厳選

THE DECODERへの購読で、広告なしの閲覧、週刊AIニュースレター、年6回の限定「AI Radar」フロンティアレポート、アーカイブ全件へのアクセス、コメント欄への参加が可能になる。

今すぐ購読する

原文を表示

Moonshot AI has released Kimi K2.6 as an open-weight model. It's built to match GPT-5.4 and Claude Opus 4.6 on coding benchmarks, and it can run up to 300 agents in parallel.

Moonshot AI says K2.6 puts up top scores across several benchmarks, landing on par with GPT-5.4, Claude Opus 4.6, and Gemini 3.1 Pro. The numbers include 54.0 on HLE with Tools, 58.6 on SWE-Bench Pro, and 83.2 on BrowseComp. The model can chain together more than 4,000 tool calls and run continuously for over twelve hours in languages like Rust, Go, and Python.

Kimi K2.6 keeps pace with the top models from OpenAI, Anthropic, and Google on coding and agent benchmarks, though it falls behind on pure reasoning and vision. | Image: Kimi

300 agents working in parallel

The headline feature is Agent Swarm, which can run up to 300 sub-agents at once, each taking 4,000 steps. The system automatically splits tasks into subtasks and hands them off to specialized agents. Moonshot AI says these agents combine skills like web research, document analysis, and writing, and a single run is meant to produce finished outputs, including documents, websites, slide decks, and spreadsheets. Here's an example:

A preview feature called "claw groups" lets multiple agents and humans work together as a team. K2.6 runs the coordination, handing out tasks based on each agent's strengths and stepping in whenever an agent fails or gets stuck.

K2.6 can also spin up complete websites with animations and database connections straight from text prompts, pulling in image and video generation tools to keep the visuals consistent. Moonshot AI says the model goes beyond front-end work and handles basic full-stack tasks too, including user sign-ups, database operations, and session management.

K2.6 ships under a modified MIT license that allows largely free use, with one catch: anyone deploying the model in commercial products with more than 100 million monthly active users or over $20 million in monthly revenue has to visibly credit "Kimi K2.6" in the user interface.

The model is available on kimi.com in chat and agent mode, as a coding tool through Kimi Code, via API, and as an open source download on Hugging Face.

AI News Without the Hype – Curated by Humans

Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section.

Subscribe now

この記事をシェア

関連記事

Smol AI News★42026年6月4日 14:44

今日は何も大きな出来事はありませんでした

Smol AI News は、6月3日から4日にかけての期間に、12件のサブレッドや544件のツイートを調査しましたが、AI業界で特筆すべき動きは確認されませんでした。

Sebastian Raschka★42026年6月6日 20:16

LLM 研究論文:2026 年 1 月から 5 月のリスト

Sebastian Raschka が、2026 年上半期(1 月〜5 月)に注目すべき大規模言語モデル関連の研究論文を選定し、一覧として公開した。

Latent Space★42026年6月6日 13:34

[AINews] 今日特に大きな出来事はありませんでした

Latent Space が運営するニュースレター「AINews」が、6月4日から5日にかけてのAI業界動向を12件のRedditスレッドや544件のTwitter投稿から選別して紹介しました。記事ではRL環境ガイドの推奨や、DeepSeek v4 Pro向けの最適化に関するリモートポッドの更新について言及しています。

ニュース一覧に戻る元記事を読む