Kimi 楊植麟「2026 中関村フォーラム」講演全文(動画付き)
月之暗面創業者の楊植麟氏は2026年中关村フォーラムで、大規模言語モデル開発における「エネルギーから知能への変換」を効率化する3つの軸(トークン効率、長文コンテキスト、マルチエージェントクラスタ)を提唱し、Kimi K2.5モデルでの実証結果を発表した。
キーポイント
トークン効率の最適化
高品質データは有限であるため、ネットワークアーキテクチャと最適化手法の改善により、限られたデータからより多くの知能を抽出する効率向上に注力。
長文コンテキストの実現
「Kimi Linear」アーキテクチャと専用訓練データを採用し、モデルのコンテキスト窓を拡張することで複雑なタスク処理能力を大幅に向上。
エージェントクラスタの導入
Kimi K2.5モデルで複数のエージェントを並列協調させる新手法により、単一エージェント方式では指数関数的に増加する実行時間を抑制し、高難度作業の実現可能性を劇的に向上。
Agent集群的规模化能力
通过同时调查数百个数据源、撰写长篇论文及复杂任务编排,实现输入、输出与执行的规模化,显著提升模型处理高复杂度任务的能力。
注意力残差(Attention Residuals)架构
受ResNet启发,将注意力机制从时间轴旋转至深度轴,结合所有历史层输出进行计算;采用块状结构设计,仅增加2%成本即可大幅提升模型效果。
开源模型成为行业新基准
以Kimi K2.5为代表的开源模型已被芯片厂商用于硬件评测及学术研究,通过开放架构与创新降低AI使用门槛,共建开源生态。
学習データと手法の進化(2023〜2025年)
インターネット上の「天然」データから、人間が選別した高品質タスクに基づく大規模強化学習へ移行し、プログラミング・数学分野の能力向上に寄与している。
影響分析・編集コメントを表示
影響分析
本講演は、単なるモデルベンチマーク競争から「アーキテクチャ革新とマルチエージェント協調によるスケーリング効率化」へのパラダイムシフトを示している。Kimi K2.5のAgentクラスタ手法が実証する「複雑度に対する実行時間の非線形抑制」は、今後AIエージェントの産業実装におけるコストと時間制約を大幅に緩和し、自律型複雑タスク処理の標準規格を再定義する可能性がある。
編集コメント
単一モデルの性能向上から「エージェント協調によるスケーリング効率化」へ焦点が移行しつつある今、Kimi K2.5の内部テスト結果は産業実装におけるコスト対効果の転換点となる可能性を秘めている。
月之暗面 Kimi 2026-03-31 20:20 天津
すべての基礎技術は再考に値する
皆さん、こんにちは。今日は、オープンソースモデルの開発と、より優れた大規模言語モデル(LLM)の継続的な訓練における最新の進展と考察をお話しできる機会をいただき、大変嬉しく思います。
実は、大規模モデルを開発する本質は、エネルギーを知能に変換することです。その変換プロセスにおいて最も重要なことは、スケーラビリティ(規模の拡大)です。つまり、可能な限り多くのエネルギーを、計算資源とモデルを通じて、より多く、より高度な知能へと変換していくことです。
本質的に、スケーリング法則(Scaling Law)は過去数年間におけるすべてのモデルや AI 発展の非常に重要な基盤となっています。
もちろん、スケーラビリティとは、単にエネルギーを暴力的に増やすこと、あるいは計算資源を暴力的に増やすことを意味するわけではありません。それは、いかに効率的に規模を拡大するかという課題に関わるものです。
私たちは、効率性を高めるために以下の 3 つの側面から考えます。
まずはトークン効率の向上です。
これは、同じデータからどれだけの知能を学習できるかを表しています。なぜなら、この世の有効で高品質なデータは実は定数であり、あるいは非常に限られた値だからです。より優れたネットワークアーキテクチャや、より良いオプティマイザがあれば、有限のデータからより多くの知能を学習することができます。
二つ目はコンテキスト長の拡張です。
より長いコンテキスト処理能力を持つことは、モデルがより複雑なタスクを処理できるようになることを意味します。そのために、私たちは新しいネットワークアーキテクチャ「Kimi Linear」と専用の訓練データを設計し、長文コンテキストにおけるモデルの性能向上を図りました。
三つ目はエージェントクラスタです。
最新のモデル「Kimi K2.5」において、私たちは新たなスケーリング手法を提案しました。それは複数のエージェントを導入し、多数のエージェントが連携して作業を行うことで、エージェントクラスタを形成するというものです。この方法によって、AI が処理できるタスクの複雑さを向上させます。
これは「Kimi K2.5」のエージェントクラスタに関する内部テスト結果です。横軸はタスクの複雑度、縦軸は実行時間を示しています。もしこのように単一エージェントで作業を行う場合、タスクの複雑度が徐々に高まるにつれて、完了時間は指数関数的に増加することがわかります。例えば、コードリポジトリをゼロから作成したり、非常に複雑な機能を実装したりするといった極めて複雑なタスクを行う必要がある場合、数日甚至は数週間を要することになります。
しかし、並列処理が可能であれば、例えば 100 個のエージェントを同時に起動してこのタスクに取り組ませ、その過程で互いに協力し、調整を行い、次に何をすべきかを計画するといったことができれば、まるで人間の組織のように機能します。そうすれば、タスクの複雑度が増加しても、実行時間に大きな変化はありません。これは、単位時間あたりにより複雑なタスクを完了できることを意味し、従来は全く不可能だったと見なされていたタスクさえも実現可能にします。
例えば、ある企業が極めて困難なことに挑戦し、複雑な使命を達成しようとする場合、0 から 100 億ドル、あるいは 1,000 億ドル規模の企業を構築するといったことを想定してください。もしそれを一人だけで行おうとすれば、完成までに 100 年かかるかもしれません。そうなれば市場での競争力は失われますが、もし 100 人または 200 人の非常に賢い人材が集まり、協働できれば、短期間での達成も可能になります。
エージェント・クラスタの能力を活用することで、規模化された入力を実現できます。例えば、同時に数百もの異なるデータソースを調査し、信頼性の高いデータ源の中から答えを探し出すことが可能です。また、規模化された出力も実現でき、これらのデータソースを読み込んで数百ページにわたる論文を作成することもできます。さらに、規模化された実行や規模化されたオーケストレーションを行うことで、モデルが処理できるタスクの複雑さを向上させることができます。
同時に、私たちはより優れた基盤となるネットワークアーキテクチャの開発にも注力しています。これが私たちが最近オープンソース化した最新のモデルアーキテクチャであり、「アテンション・リザイダル(Attention Residuals)」と呼ばれています。この技術の主なインスピレーションは、10 年前に登場した「ResNet」や「残差ネットワーク接続」と呼ばれる技術から得られています。
10 年前は、誰も深層ニューラルネットワークを訓練する方法を持っていませんでした。しかし、ヘ・カイミン(何凱明)ら研究者が残差ネットワークを導入したことで、モデルが数十層、数百層のネットワークを訓練できるようになり、層数を自由に増やすことが可能になりました。
この残差構造は、LSTM ネットワークの変種とみなすこともできます。ただし、LSTM は時間の次元に適用されるのに対し、残差ネットワークはネットワークの深さに焦点を当てています。これにより、各層が直前の層の出力を受け取り、関数処理を行うことで現在の層の出力を得ることができます。
私たちはこの考え方を自然に一般化し、アテンション・メカニズムという計算パターンを 90 度回転させました。もともと時間軸上でのみ適用されていたものを、今度は深さの次元にも適用できるようにしたのです。アテンションを深さに適用することには多くの利点があります。例えば、直前の層の出力に基づいて計算するだけでなく、過去のすべての層の出力を組み合わせて計算できるようになるため、ネットワークアーキテクチャのパフォーマンスを最適化する際に非常に大きなメリットがあります。
これがアテンション・リザイダルの全体アーキテクチャ図です。左側が標準的な残差構造で、右側が私たちが提案しオープンソース化した残差構造です。また、ブロック状の残差構造も設計しており、非常に効率的に実装できるようにしました。わずか 2% の追加コストだけで、パフォーマンスを大幅に向上させることが可能です。
先ほど申し上げた通り、大規模言語モデルの第一原理はスケーリング法則(Scaling Law)ですが、私たちは単に力任せでスケールするだけでなく、スケールしながらも効率を向上させることを目指しています。そのため、より強力なモデルアーキテクチャの開発に注力してきました。例えば、Adam オプティマイザやアテンションアーキテクチャ、残差接続などは、すでに 10 年以上の歴史を持つ技術です。コンピュータサイエンスの分野において、10 年という期間は非常に長い時間です。過去 10 年間、これらの技術を挑戦する者はおらず、誰もがこれを標準として受け入れていました。
しかし現在、計算資源の向上と研究手法の変化により、従来の学術中心でアイデア(idea)のみから出発する研究から、エンジニアリングとの連携を重視し、非常に堅牢なスケーリング検証実験を設計して確固たる結論を得るスタイルへと変化しています。その結果、以前は標準と考えられていた多くのものが、今では挑戦可能となっています。
私たちは、オープンソースモデルが新たな標準へと成長しつつあることを確認しています。これらは直近終了した英伟达(NVIDIA)の GTC 2026 大会における黄仁勲氏の基調講演から抜粋したスライドです。Kimi K2.5 を代表とするオープンソースモデルは、世界中のすべてのチップメーカーがハードウェア性能をテストするベンチマークとして採用されています。新しいチップを発表する際、その性能向上幅を評価するために Kimi や他のオープンソースモデルが用いられます。
現在、世界中の多くの研究機関も、Kimi K2.5 やその他のオープンソースモデルを用いて研究を進めています。私たちはオープンソース化を通じて、あらゆる企業、研究者、そしてエンドユーザーが、極めて低いハードルで知能(AI)にアクセスできるようにすることを目指しています。これは非常に重要な意義を持つことです。
同時に、私たちが行った多くの重要な革新、私が先ほど言及した新しいアーキテクチャもすべて公開されており、誰でも利用可能です。最終的には、皆でオープンソースエコシステムを形成し、AI 分野の発展を共に推進していくことを目指しています。
最後に、モデル訓練の観点からお話ししますと、大規模言語モデル(LLM)分野は依然として急速に発展しており、現在の研究開発手法は 2〜3 年前とは大きく異なっています。
2023 年と 2024 年は、主に「天然」データが使用されていました。これはインターネット全体から収集されたデータに、価値観や嗜好に合致しているかなどを人手でラベル付けした少量のデータを加えたものです。
2025 年には、大規模な強化学習(Reinforcement Learning)システムの構築により、より高い重視が置かれています。ただし、これは人間が高品質なタスクを選別し、その上で強化学習を適用してより良い成果を得るというアプローチです。プログラミングや数学分野における能力向上は、主にこの技術路線によるものです。
2026 年以降、そして今後数年間にわたって、AI の研究開発手法には大きな変化が生じます:AI が主導する研究がより多く行われるようになります。各研究者には膨大な数の AI トークンが付与され、これらの AI トークンは新しいタスクの合成や、新たな環境の構築を支援し、その環境下で最も適切かつ最適な報酬関数(Reward Function)を定義することも担います。さらには、新しいネットワークアーキテクチャがどのようなものになるかを探索することさえも可能になります。
したがって、AI の研究開発全体も徐々に加速していくでしょう。私たちはオープンソースコミュニティ全体と協力し、より良いエコシステムを構築することで、技術を不断に前進させ、知能の上限を探求する速度を加速させることを目指しています。
ご清聴ありがとうございました。
通し動画の再放送:
最新アップデート
QR コードを読み取れば、あなたの Kimi ロブスターが「WeChat(微信)」に接続されます
10 万人が実際に試して好評:OpenClaw 一鍵インストーラーが新登場
Kimi Code Plan が正式にアップグレード:引き続き 3 倍のクォータを享受可能
Kimi API:90% のキャッシュヒット率で価格を 25% に引き下げました
Kimi で OpenClaw を利用できるようになりました
技術レポート:Kimi K2.5 はどのようにしてテキストと視覚能力を相互に強化しているのか?
PPT だけでなく、Kimi K2.5 Agent が Excel、Word、PDF の作成も支援します
Kimi が K2.5 モデルを発表しオープンソース化。新たな視覚理解、コード生成、およびエージェント(Agent)クラスタ能力をもたらす
WeChat で開くにはこちらへ
原文を表示
月之暗面 Kimi 2026-03-31 20:20 天津
image
每一项基础技术都值得重新思考
image
大家好,今天很高兴有机会分享我们在做开源模型和不断训练更好的大模型过程中的最新进展和思考。
其实做大模型本质上是把能源转化成智能。转化的过程中,最重要的事情是规模化。也就是说,把尽可能多的能源,经过算力和模型,变成更多的、更高程度的智能。
本质上,规模化定律(Scaling Law)是过去若干年,所有的模型和 AI 发展的一个很重要的基础。
当然,规模化并不是代表我们只是去暴力地增加能源,或者去暴力的增加算力,而是涉及到我们如何有效地规模化。
我们会从三个维度去思考如何提高效率:
首先是提升 Token 效率。
它代表的是从同样的数据中能够学到多少智能。因为这个世界上的有效高质量数据,其实是一个常量,或者说是一个非常有限的值。如果你有更好的网络架构,或者有更好的优化器,那么你就可以从有限的数据里学到更多的智能。
第二是扩展上下文长度。
更长的上下文能力,意味着模型可以学会处理更复杂的任务。为此,我们设计了新的网络架构 Kimi Linear 和专门的训练数据,来提升模型在长上下文时的表现。
第三是 Agent 集群。
我们在最新模型 Kimi K2.5 中提出了一种新的规模化的方法,就是通过引入多个 Agent,让很多个 Agent 可以一起去工作,形成 Agent 集群。通过这种方式提升 AI 能完成的任务复杂度。
这是我们 K2.5 Agent 集群的一个内部测试结果。横坐标是任务复杂度,纵坐标是执行时间,如果我们用这种单一 Agent 的方式工作,可以看到随着任务复杂度逐渐提升,完成时间是指数增加的。如果你需要做一个非常复杂的任务,比如从头去写一个代码仓库,去实现一个很复杂的功能,需要几天甚至几周的时间。
但如果我们能够并行,比如说开启 100个 Agent 同时去做这个任务,然后在过程中它们会互相协作,互相协调和规划接下来应该做的事情,就跟人类的组织一样,那么随着任务复杂度的增加,执行时间其实没有太大的变化。这意味着你可以在单位时间内去完成更加复杂的任务,使得原来一些完全不可能实现的任务变得有可能。
就像一家公司,如果你想做一个非常艰难的事情,完成一个很复杂的使命,比如说从 0 到 1 建造一家 100 亿或者 1,000 亿美元的公司,那么你只靠一个人,可能要 100 年才能做出来,那你在市场上是没有竞争力的,但这个时候如果你有100 或者 200 个非常聪明的人,能一起协作,那就有可能在短时间内完成。
通过 Agent 集群能力,我们可以实现规模化的输入,比如说你可以同时去调查几百个不同的数据来源,在各种权威的数据源里面寻找答案;你也可以做规模化的输出,比如说你可以通过阅读这些数据来源,去撰写一个几百页的论文;以及去规模化的执行或规模化的编排,去提升模型能处理的任务复杂度。
同时,我们非常注重研发更好的底层网络架构。这是我们最新开源的模型架构,叫做注意力残差(Attention Residuals)。这项技术主要的灵感来自于 10 年前的技术 Resnet, 或者叫残差网络连接。
在十年之前,其实没有任何人有办法去训练深度的神经网络。直到何凯明等研究者引入残差网络,可以让模型去训练几十、几百层的网络,可以任意的增加层数。
这种残差结构,其实可以认为是 LSTM 网络的一个变种,只是说 LSTM 是应用在时间的维度上,残差网络更多体现在网络深度上,使得每一层可以用上一层的输出,然后做一个函数的处理,得到当前这一层的输出。
我们把类似的思路做一个自然的泛化,把注意力机制这种计算模式做 90 度的旋转,从原来只是应用在时间轴上,现在我们可以把它应用在深度上。把注意力应用到深度上有很多好处,比如不仅仅只是基于前一层的输出来进行计算,而是可以去结合之前的所有层的输出进行计算,这样在优化网络架构性能的时候就有非常多好处。
这是我们整个注意力残差的架构图。左边是标准的残差结构,右边是我们提出来并开源的残差结构。然后,我们也设计了基于块状的残差结构,使它能够非常高效地实现。基本上在只有 2% 额外成本的情况下,就大幅度提升了效果。
就像我刚才说的,大模型的第一性原理是规模化定律(Scaling Law),但我们不仅仅只是去暴力的做规模化,而是希望我们在规模化的同时也能够去提升效率,所以我们一直致力于研发更强的模型架构。比如像 Adam 优化器或者像 Attention 架构、残差连接这些都是有了 10 余年历史的技术。在计算机领域,十年其实是非常长的时间。过去十年的时间里面,没有任何人能够去挑战这些技术,大家都把它当成一个标准。
但随着现在算力的提升和大家研发方式的变化,从原来的偏学术,单纯从想法(idea)出发的研究,到变成现在更加重视与工程的结合,然后可以设计非常扎实的规模化验证实验,从而得到非常扎实的结论。因此,很多以前认为是标准的东西,现在都可以被挑战。
我们看到,开源模型正在逐渐成为新的标准。这是几张从刚刚结束的英伟达 GTC 2026 大会上,黄仁勋的主题演讲中里面摘取的幻灯片。可以看到,以 Kimi K2.5 为代表的开源模型,已成为全世界所有芯片厂商测试硬件性能的基准:如果发布新的芯片,就会通过 Kimi 或者其他开源模型来评测芯片性能提升幅度。
现在,全世界很多研究机构也在用 Kimi K2.5 或其他的开源模型去进行研究。我们通过开源,让每一个企业、每一个研究者、每一个终端用户,都能以非常低门槛获取智能,是一个非常重要的事情。
同时我们做的很多重要的创新,包括我刚提到的新的架构也是开放的,可以被任何人所获取。最终,大家能够去形成一个开源生态系统,一起推动 AI 领域的发展。
最后想跟大家分享,从模型训练的角度看,大模型领域仍在快速发展,现在的研发方式跟两三年之前会有很大不同:
2023 年和 2024 年,大家主要使用「天然」数据。也就是从整个互联网获取的数据,加上一些少量的人工标注,比如去标注某一条数据是不是符合价值观或者偏好。
2025年,大家更加重视搭建大规模的强化学习系统。但要靠人筛选高质量任务,然后在这些任务上做强化学习得到更好的效果。可以看到,在编程或者数学领域上得到的能力提升,主要就来自于这种技术路线。
从 2026 年开始,包括接下来的若干年时间内,整个 AI 研发的方式会发生重大变化:更多由 AI 去主导研究。每个研究员会配备非常多的 AI Token, 然后这些 AI 的 Token 可以帮你去合成新的任务,帮你合成新的环境,帮你定义在这个环境下面最好、最合适的奖励函数是什么。甚至可以去帮你探索新的网络架构可能长什么样。
因此,整个 AI 的研发也会逐渐加速。我们希望也能够跟整个开源社区一起,打造更好的生态系统,不断把技术往前推进,加速探索智能的上限。
感谢大家。
全程视频回放:
最近更新
扫一扫,你的 Kimi 龙虾就连上了「微信」
10万人亲测好用:OpenClaw一键安装器上新
Kimi Code Plan正式升级:持续享受3倍额度
Kimi API:用90%缓存命中率,把价格打到25%
你可以来 Kimi 使用 OpenClaw 了
技术报告:Kimi K2.5 如何实现文本和视觉能力互相增强?
不只PPT,Kimi K2.5 Agent可以帮你做Excel、Word和PDF了
Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力
跳转微信打开
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み