GLM-5-Turbo:ロブスター強化の基盤モデル
智譜はOpenClaw(龙虾)エージェントシナリオに特化した基盤モデル「GLM-5-Turbo」を公開し、ツール呼び出しや長連鎖タスクの安定性を強化した。
キーポイント
エージェント特化の基盤最適化
汎用LLMが抱える長連鎖タスクでの失速やツール呼び出し不安定さを解消するため、訓練段階からエージェントワークフローと実行目標に特化して最適化した。
業界共通ベンチマークの公開と実証
OpenClawの実用例を基にした「ZClawBench」を完全公開し、国内モデル首位を達成。主要テック企業による盲測でも高評価を得ている。
エンタープライズ向け商用パッケージ展開
トークン消費を考慮した「龙虾套餐」の提供、企業向けセキュリティ管理システムの導入、およびハードウェア端末(机械革命)との連携により実務導入を推進している。
影響分析・編集コメントを表示
影響分析
本リリースは、チャット中心のLLMから自律型エージェントへの移行期における「実行信頼性」の課題に直接応答している。主要テック企業による実証と独自ベンチマークの公開により、業界標準の評価軸が確立されつつあり、実務導入におけるリスク低減に寄与する。ただし、プレスリリース特有の表現には注意しつつ、実際の複雑なエージェントワークフローでの再現性を追跡する必要がある。
編集コメント
エージェント実装における「長連鎖タスクの安定性」という実務課題をモデル最適化で解決しようとする試みは業界の方向性と一致する。ベンチマーク公開と商用パッケージのセット提供により、実証から導入までのサイクルが加速する可能性が高い。
2026 年 3 月 16 日 10 時 31 分 北京
私たちは GLM-5-Turbo を発表します。これは OpenClaw(龙虾)のシナリオに深く最適化された基盤モデルです。
OpenClaw の利用経験がある方なら、皆が共通して感じる点があります。「モデルは会話を楽しむことはできるが、必ずしも実務をこなせるわけではない」ということです。問題の根源はフレームワークにあるのではなく、むしろ基盤となるモデルそのものにあります。汎用大規模言語モデルが現実の複雑な Agent(エージェント)シナリオに投入されると、長距離タスクにおいて容易に失速してしまいます。
Harness(ハーン:環境構築やリソース管理の仕組み)をいくら増やしても、モデル自体が強くなるには及びません。GLM-5-Turbo は訓練段階から「龙虾(OpenClaw)」タスクの中核的ニーズに合わせて特別に最適化されており、ツール呼び出し、指示の遵守、タイマーおよび継続的なタスク、長距離実行といった中核能力を強化しています。自社開発のベンチマークテストである ZClawBench では国産モデルの中で第 1 位を獲得し、複数の大手インターネット企業による「龙虾」シナリオでの内部テストでも高い評価を得ています。
私たちは「Claw(龙虾)プラン」と、エンタープライズ向けシナリオに特化した Claw セキュリティ管理システムを発表します。
龙虾ネイティブモデル
龙虾タスクは単なる一問一答ではなく、通常は多輪の理解、タスクの分解、ツール呼び出し、状態の継承、時間トリガー、そして継続実行を伴う長距離ワークフローを伴います。汎用モデルが会話能力において優れたパフォーマンスを発揮したとしても、現実の龙虾シナリオに投入されると、指示遵守の逸脱、ツールの不安定な呼び出し、長期間タスクの途中での失速などの問題が発生しやすくなります。
これらの難題を根本から解決するには、基盤モデル層における深い最適化が不可欠です。これが GLM-5-Turbo の出発点です。
訓練データの構築から最適目標の設計に至るまで、私たちは現実的な Agent ワークフローを構築し、モデルに龙虾タスクにおける実行可能性を持たせました。特に以下の核心能力を重点的に強化しています:
Tool Calling(ツール呼び出し)—— 呼び出しが途切れないようにする。外部ツールおよび各種 Skills(スキル)の呼び出し能力を強化します。
Instruction Following(指示の遵守)—— 複雑な指示の分解能力を向上。複雑で多層的、長距離にわたる指示の理解と分解をより正確に行い、目標の特定、ステップの計画、マルチエージェント協調をサポートします。
タイマーおよび継続的なタスク —— 時間次元をより深く理解し、長期間タスクを中断させない。時間トリガーや長時間実行などのシナリオに重点的に最適化され、時間次元における要件をより良く理解できます。
高スループット長距離—— 実行がより安定する。データのスループット量が多く、チェーンが長いタスクに対して実行効率と安定性をさらに向上させ、長期的なビジネスプロセスに適しています。
龙虾シナリオベンチマーク ZClawBench
OpenClaw(龙虾)の普及に伴い、モデルが龙虾シナリオにおける能力をどのように評価するかが業界全体の焦点となっています。OpenClaw の膨大な実用例分析に基づき、私たちは龙虾シナリオ向けのエンドツーエンド Agent 評価基準である ZClawBench を発表します。
現在のOpenClawのタスクタイプは、インストール設定、コード開発、情報収集、データ分析、コンテンツ制作など多様なタスクを網羅しており、ユーザー層も初期のデベロッパーから、効率化を求めるビジネスパーソン、金融関係者、運用エンジニア、コンテンツクリエイター、研究分析担当者へと拡大しています。同時に、Skillsの使用割合は短期間で26%から45%へ急成長し、エージェント能力がモジュール化とスキル特化型の生態系へと進化していることを示しています。
このベンチマークに基づく評価結果では、GLM-5-TurboのOpenClawシナリオにおけるパフォーマンスはGLM-5と比較して顕著に向上しており、複数の主要な主流モデルに対して多数の重要タスクで全体として先行しています。
ZClawBenchの質問データベースとテスト軌跡は全面的に公開されており、業界全体での検証と改善を歓迎します。
ユーザーの実体験こそが試金石です。GLM-5-TurboはPony-Alpha-2というコードネームでAutoClaw(澳龍)に接続され、ユーザーによるブラインドテストでは、回答者の90%がGLM-5-Turboの性能を他の国産モデルよりも優れていると評価しました。
ベータテスト段階において、龙虾生態系内の大手インターネット企業はGLM-5-Turboに対して高い評価を与えました:
「正確なツール呼び出しと長期的タスクにおける安定した信頼性が、デスクトップ型エージェント上での跨アプリケーションデータ転送やシステムAPI操作を完璧に駆動しています。オフィスシナリオにおける『幻覚(ハルシネーション)』の課題克服において優れたパフォーマンスを発揮しました!」——アリババQoderWorkモデル評価チーム
「命令への従順性は他を圧倒し、長期的タスクにおいても精度が高く途切れることがなく、マルチエージェント構築の成功率を大幅に向上させました。」——Coze(扣子)評価チーム
「定期タスクと長連鎖タスクが堅牢で、同種モデルと比較して明確なトップティアの優位性を示しており、非常に信頼できます。」——メイトゥ某チーム
「高スループット実行は極めて高速でありながら失速せず、応答安定性は同種モデルをリードし、真にエージェントの実行課題を解決しました。」——クワショウ万擎評価チーム
プログラミングシナリオにおいて、GLM-5-TurboはGLMモデルのAgentic Engineering(エージェント工学)における実績を引き継いでいます:
「プログラミング能力は確実にトップティアに位置し、Coding Agentの実測では同種モデルを上回り、長連鎖コードタスクの処理が非常に堅牢です。」——字节跳动TRAEチーム
GLM-5-Turboはソフトインフォメーションパワー(SoftStone)傘下の機械革命ボックスにも導入され、世界で初めてGLMモデルを搭載した機械革命「龙虾ボックス」が登場し、ネイティブAI Agent端末体験を構築します。
龙虾セットであなたのAI同僚を満腹に
龙虾は働き者であるため、当然トークンも大量に消費します。
典型的な龙虾タスク、例えば部署間を跨ぐ会議議事録の整理とタスク割り当てを完了するケースでは、数十回のツール呼び出しと文脈の接続が必要となり、トークンの消費量は通常の対話をはるかに上回ります。龙虾を利用する企業や個人にとって、トークンは最大のコストボトルネックとなっています。
企業や個人が「トークンの自由」を実現できるよう、智譜は本日、GLM-5-Turboを基盤とした「龙虾(ロブスター)プラン」の提供を開始しました。このプランには個人版とチーム版が含まれており、一人会社、創業チーム、中堅・大企業を問わず、自社の業務規模に応じて柔軟にプランを契約できます。
各アカウントあたり最大5個まで購入可能です。企業は「龙虾(ロブスター)プラン」のチーム版を利用し、実際の従業員数に合わせて柔軟に契約することで、コストを抑えつつトークンの十分な確保とAI従業員の安定稼働を実現できます。
さらに、「龙虾(ロブスター)プラン」を基盤に、エンタープライズ向けシーンに特化したOpenClawセキュリティ管理システム「Claw for Enterprise Security」を新たに構築しました。このシステムは、情報収集、データ分析、コード開発、あるいは跨システム操作など、異なる種類のClawに対する統一されたスケジューリングと権限編成をサポートします。企業は自社の業務フローに応じてClawの機能を柔軟に組み合わせることができ、集中管理コンソールを通じて、各エージェントタスクの実行パス、ツール呼び出しチェーン、リソース消費状況をリアルタイムで可視化できます。これにより、複雑なマルチエージェント協調がもはやブラックボックスであることはなくなります。
セキュリティ保証の観点では、本システムは多層防御メカニズムを提供します:ロールベースの権限管理により、各Clawは承認された範囲内でのみツールを呼び出しデータをアクセスできます。すべての操作は完全な監査ログとして生成され、企業のコンプライアンス要件を満たします。機密業務データは全工程で暗号化処理が施され、データローカライゼーションの厳格な遵守と、企業が管理可能な境界外への流出防止が徹底されます。また、重要な業務ノードでは人的承認メカニズムを維持し、自動化プロセスによる制御不能な業務リスクを防ぎます。
目前に迫る変革とは、OpenClawに代表されるエージェントが組織内部へ浸透し、あらゆる企業が7×24時間オンラインでいつでも呼び出せるAI従業員を持つようになることです。同時に、これらは私たち一人ひとりの専属AIアシスタントとなり、人々を定型化・反復的な雑務から真に解放します。
私たちは今、大規模モデルが単なる効率化ツールから、企業労働力へと至る重要な飛躍を目撃しています。
アクセスと利用方法
GLM-5-Turboはすでにサービスを開始しており、開発者や企業ユーザーは智譜オープンプラットフォームのBigModel.cnを通じて直接APIを呼び出すか、「龙虾(ロブスター)プラン」を利用して接続できます。
「GLM Coding Plan Max」はすでにGLM-5-Turboをサポートしています。Proプランは今月中にできるだけ早くサポートを開始し、Liteプランは4月にアクセス対応が開始されます。Coding PlanはOpenClawのアクセス体験にも利用可能です。ただし、長期的な安定稼働、バックグラウンドでの継続実行、あるいは高負荷のエージェントシナリオを想定する場合は、「龙虾(ロブスター)プラン」の利用を優先することをお勧めします。
Claude Opusに匹敵する上位モデルであるGLM-5およびGLM-5-Turboは、「ピーク時3倍、非ピーク時2倍」という係数で利用枠を消費します。期間限定の福利として、GLM-5-Turboは4月末まで非ピーク時に限り1倍でのみ利用枠が差し引かれます。
AutoClaw(オーストラリアロブスター)のデフォルトモデルはGLM-5-Turboに設定されており、プログラマーではないすべてのユーザーがGLM-5-Turboの「龙虾(ロブスター)」機能を体験し、一定量の無料利用枠を享受できます。3月22日までの期間限定福利として、「加油包(チャージパック)」は最高で3.4割引となります(チャージパックは購入から7日間有効)。
公式 API への接続
智譜オープンプラットフォーム:BigModel.cn
Z.ai:api.z.ai
GLM コーディングプラン
Coding Plan Max は GLM-5-Turbo に統合されました。
Pro バージョンは今月中にできるだけ早くサポートを開始します。
オンライン体験
AutoClaw オーストラリアン・ロブスタークライアント:https://autoglm.zhipuai.cn/autoclaw
Z.ai:z.ai
智譜清言 APP/ウェブ版
原文を読む
WeChat で開くためにジャンプ
原文を表示
2026-03-16 10:31 北京
image
image
我们推出GLM-5-Turbo——一个面向OpenClaw龙虾场景深度优化的基座模型。
体验过OpenClaw的用户都有一个共同感受:模型能聊好天,但未必能干好活。问题的根源不在框架,而在底层模型本身。通用大模型在进入真实复杂的Agent场景后,容易在长链路任务中失速。
Harness再多,不如模型自身变强。GLM-5-Turbo从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力。在自研基准测试ZClawBench中取得国产模型第一的成绩;多家互联网大厂在龙虾场景内测中给予高度评价。
我们推出Claw龙虾套餐,及面向企业级场景的Claw安全管理体系。
龙虾原生模型
龙虾任务不是简单的一问一答,通常涉及多轮理解、任务拆解、工具调用、状态衔接、时间触发和持续执行的长链路工作流。通用模型即使在对话能力上表现优秀,一旦进入真实龙虾场景,仍然容易出现指令遵循偏差、工具调用不稳定、长任务中途失速等问题。
要从根本上解决这些难题,必须在基座模型层进行深度优化——这正是GLM-5-Turbo的出发点。
从训练数据构造到优化目标设计,我们构造真实Agent工作流使模型在龙虾任务中具备可执行性。重点增强以下核心能力:
Tool Calling——调用不掉链子。强化对外部工具与各类Skills的调用能力。
Instruction Following——复杂指令拆解更强。对复杂多层、长链路指令理解和拆解更准确,支持识别目标、规划步骤、多智能体协同。
定时与持续性任务——更懂时间维度,长任务不中断。针对定时触发、长时间运行等场景进行重点优化,能够更好理解时间维度上的要求。
高吞吐长链路——执行更稳。针对数据吞吐量大、链条长的任务进一步提升执行效率与稳定性,适合长程业务流程。
龙虾场景基准ZClawBench
随着龙虾OpenClaw的普及,如何评测模型在龙虾场景的能力成为全行业焦点。基于对OpenClaw大量真实用例的分析,我们发布龙虾场景端到端Agent评测基准ZClawBench。
当前OpenClaw的任务类型覆盖安装配置、代码开发、信息搜集、数据分析、内容创作等多元化任务,用户群体也从早期的开发者扩展到效率办公人群、金融从业者、运维工程师、内容创作者与研究分析人员等。同时,Skills的使用比例在短时间内从26%快速增长至45%,表明Agent能力正向模块化与技能化的生态方向演进。
基于该基准的评测结果显示,GLM-5-Turbo在OpenClaw场景中的表现相比GLM-5提升显著,在多项关键任务上整体领先于多家主流模型。
ZClawBench的题库与测试轨迹已全面公开,欢迎业界共同验证与完善。
用户真实体验是试金石。GLM-5-Turbo以Pony-Alpha-2为代号接入AutoClaw澳龙,在用户盲测中,90%的受访者认为GLM-5-Turbo的表现优于其他国产模型。
内测阶段,龙虾生态的互联网大厂对GLM-5-Turbo给予高度评价:
“精准的工具调用配合长程任务的稳定可靠,完美驱动了桌面级Agent上的跨应用数据流转与系统API操控。在攻克办公场景的‘幻觉’痛点上表现优秀!”——阿里QoderWork模型测评团队
“指令遵循力压群雄,面对长任务更精准不掉链子,极大提升了多智能体构建的成功率。”——扣子Coze测评团队
“定时与长链路任务稳健,对比同类模型展现出明显第一梯队的优势,非常靠谱。”——美团某团队
“高吞吐执行极快且不失速,响应稳定性领跑同类模型,真正解决了Agent的执行难题。”——快手万擎测评团队
在编程场景,GLM-5-Turbo延续GLM模型Agentic Engineering的表现:
“编程能力稳居第一梯队,在Coding Agent实测中优于同类模型,处理长链路代码任务非常稳健。”——字节TRAE团队
GLM-5-Turbo已接入软通动力旗下机械革命盒子中,面向全球首发接入GLM模型的机械革命“龙虾盒子”,打造原生AI Agent终端体验。
龙虾套餐喂饱你的AI同事
龙虾太能干活,自然也吃tokens。
一个典型的龙虾任务,比如完成一次跨部门的会议纪要整理与任务分发,可能涉及数十轮工具调用与上下文衔接,tokens消耗远超普通对话。对于使用龙虾的企业和个人来说,tokens成为最大的成本瓶颈。
为了让企业和个人实现龙虾“tokens自由”,智谱即日起推出基于GLM-5-Turbo的龙虾套餐,包含个人版和Team版。无论你是一人公司、创业团队,或者是大中型企业,都能根据自身业务规模灵活订阅套餐。
每个账号最多购买5个。企业可通过龙虾套餐Team版,按照实际员工数灵活订阅,以可控成本实现tokens的充分保障以及AI员工的稳定在线。
此外,我们在龙虾套餐的基础上,专门构建了一套面向企业级场景的OpenClaw安全管理体系“Claw for Enterprise Security”。支持对不同类型Claw的统一调度与权限编排——无论是信息搜集、数据分析、代码开发还是跨系统操作,企业可以根据业务流程灵活组合Claw能力,并通过集中化的管控台对每一个Agent任务的执行路径、工具调用链路和资源消耗进行实时可视化监控,让复杂的多Agent协同不再是黑盒。
在安全保障层面,该系统提供多层防护机制:基于角色的权限管理确保每个Claw只能在授权范围内调用工具和访问数据;所有操作均生成完整的审计日志,满足企业合规要求;敏感业务数据全程加密处理,严格遵守数据本地化要求,不离开企业可控边界;关键业务节点保留人工审批机制,防止自动化流程产生不可控的业务风险。
正在到来的变革是,以OpenClaw为代表的Agent正在进入组织内部,让每一家企业都拥有7×24小时在线、随叫随到的AI员工;同时,它们也成为我们每个人的专属AI助理,把人从流程化、重复性的琐事中真正解放出来。
我们正在见证大模型从提效工具,走向企业劳动力的一场关键跃迁。
接入与使用
GLM-5-Turbo现已上线,开发者和企业用户可以通过智谱开放平台BigModel.cn直接调用API,或者通过龙虾套餐接入。
GLM Coding Plan Max现已支持GLM-5-Turbo,Pro套餐将在本月尽快支持,Lite套餐将在4月支持接入。Coding Plan也可用于OpenClaw接入体验;如需长期稳定运行、后台持续执行或更高负载的Agent场景,建议优先使用龙虾套餐。
GLM-5、GLM-5-Turbo作为对标Claude Opus的高阶模型,将按照“高峰期3倍,非高峰期2倍”系数消耗额度。作为限时福利,GLM-5-Turbo将在非高峰期仅作1倍抵扣持续到4月底。
AutoClaw澳龙默认模型为GLM-5-Turbo,让所有非程序员群体可以体验GLM-5-Turbo龙虾能力,享受一定免费额度。即日起至3月22日为澳龙限时福利,加油包最高享3.4折优惠(加油包自购买起7日内有效)。
官方 API 接入
智谱开放平台:BigModel.cn
Z.ai:api.z.ai
GLM Coding Plan
Coding Plan Max已纳入GLM-5-Turbo
Pro版将在本月尽快支持
在线体验
AutoClaw澳龙客户端:https://autoglm.zhipuai.cn/autoclaw
Z.ai:z.ai
智谱清言APP/网页版
阅读原文
跳转微信打开
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み