AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
MarkTechPost·2026年6月15日 15:10·約11分で読める

Z.ai が使用可能な 100 万トークンコンテキストと 2 つの思考レベルを備えた GLM-5.2 を発表、ベンチマークなしでリリース

#LLM#Long Context#Coding Agent#Z.ai#GLM-5.2
TL;DR

Z.ai は GLM-5.2 を発表し、100 万トークンのコンテキストウィンドウと思考努力レベルの追加により、大規模リポジトリを扱うコーディングエージェントの実用性を大幅に向上させた。

AI深層分析2026年6月15日 16:02
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

1M トークンコンテキストウィンドウの実装

GLM-5.2 は最大 100 万トークンの入力と 13 万トークンの出力をサポートし、中規模のコードリポジトリ全体をメモリに保持して要約なしで処理可能にした。

2

思考努力レベルの導入

複雑な多段階コーディングタスクに対応するため、「High」と「Max」の 2 つの思考努力レベルが追加され、特に Max モードが推奨されている。

3

アーキテクチャとモデル進化

7440 億パラメータの MoE ベースに 400 億パラメータ活性化を維持しつつ、GLM-5.1 の後期トレーニングを基盤とした新バージョンとしてリリースされた。

4

ベンチマークなしでの発表

今回のリリースでは公式なベンチマークスコアが提供されず、実用性やコンテキストの拡張に焦点が当てられている点が特徴である。

5

実用性の高い1Mトークンコンテキスト

GLM-5.2は、単なるベンチマーク数値ではなく、実際の長文処理や複雑なタスクに即した「使用可能な」100万トークンのコンテキストウィンドウを提供します。

6

思考の深さを制御する2段階モード

ユーザーはタスクの複雑さに応じて、迅速な回答を優先する標準モードと、高度な推論を行うための「思考努力レベル」を選択できるようになりました。

7

ベンチマーク数値の公開回避

同社は今回のリリースにおいて、従来のベンチマークスコアの発表を行わず、実際のユースケースにおけるパフォーマンスと使いやすさを重視したアプローチをとっています。

影響分析・編集コメントを表示

影響分析

この発表は、LLM が単なるチャットボットから、大規模なコードベースを直接理解・操作できる本格的な開発エージェントへと進化することを明確に示しています。100 万トークンという巨大なコンテキストウィンドウの実現により、RAG(検索拡張生成)の限界を超えたリアルタイムでのリポジトリ全体解析が可能となり、ソフトウェア開発プロセスそのものに大きな変革をもたらす可能性があります。

編集コメント

ベンチマークスコアを明示しないという異例の発表形式は、Z.ai が「数値上の性能」よりも「実務でのコンテキスト処理能力」に自信を持っていることを示唆しています。開発現場におけるコードエージェントの実用性を高める重要な一歩と言えます。

GLM-5.2 は Z.ai が最新リリースした大規模言語モデルであり、GLM-5 シリーズにおける第 3 回目の主要バージョンです。これは GLM-5(2 月 11 日)、GLM-5-Turbo(3 月 15 日)、そして GLM-5.1(4 月 7 日)に続くものです。これにより、約 4 ヶ月の間に 4 つのフラッグシップクラスのコーディングリリースが行われたことになります。

実用可能な 100 万トークンコンテキストウィンドウ

GLM-5.2 の目玉仕様は、1,000,000 トークンのコンテキストウィンドウです。Z.ai はこのバリアントを独自設定で glm-5.2[1m] と呼んでいます。各レスポンスでは最大 131,072 トークンの出力トークンを返すことができます。これは GLM-5.1 の 200,000 トークンウィンドウと比較して約 5 倍の拡大です。

1M トークンのウィンドウは、コーディングエージェントの実践的な動作を大きく変えます。エージェントは、作業メモリ内に中規模のコードリポジトリ全体を保持できるようになります。これにはソースファイル、テスト、設定ファイル、会話履歴が含まれます。これにより、小さなウィンドウが強制する頻繁な要約処理を回避できます。

今回のリリースでは、思考努力レベルとして「High(高)」と「Max(最大)」の 2 つが追加されました。Z.ai は複雑で多段階のコーディング作業に対して Max エフォートを推奨しています。Claude Code では /effort コマンドがこの設定を制御します。xhigh、max、ultracode の各オプションはすべて GLM-5.2 の Max エフォートにマッピングされます。

アーキテクチャと変更点

Z.ai はリリース資料において GLM-5.2 のアーキテクチャについては明言していません。しかしコミュニティの注釈に基づくと、GLM-5 ベースは 7,440 億パラメータを持つ Mixture-of-Experts(専門家混合モデル)です。トークンごとに 400 億パラメータが活性化されます。GLM-5.1 はこのバックボーンを維持しつつ、再ターゲットされたポストトレーニングを行いました。

MTP エクスプレイナープレイグラウンド

#mtp-glm52-demo, #mtp-glm52-demo * { box-sizing:border-box!important; }

#mtp-glm52-demo hr, #mtp-glm52-demo p:empty, #mtp-glm52-demo del, #mtp-glm52-demo s { display:none!important; }

#mtp-glm52-demo {

background:#111!important; color:#e8e8e8!important;

border:1px solid #2a2a2a!important; border-radius:14px!important;

font-family:-apple-system,BlinkMacSystemFont,"Segoe UI",Roboto,Helvetica,Arial,sans-serif!important;

max-width:900px!important; margin:24px auto!important; padding:24px!important;

line-height:1.5!important;

}

#mtp-glm52-demo .g52-head { border-bottom:1px solid #2a2a2a!important; padding-bottom:14px!important; margin-bottom:18px!important; }

#mtp-glm52-demo .g52-kicker { color:#76B900!important; font-size:12px!important; letter-spacing:.12em!important; text-transform:uppercase!important; font-weight:700!important; margin:0 0 6px!important; }

#mtp-glm52-demo .g52-title { font-size:21px!important; font-weight:700!important; color:#fff!important; margin:0!important; }

#mtp-glm52-demo .g52-sub { color:#9a9a9a!important; font-size:13px!important; margin:6px 0 0!important; }

#mtp-glm52-demo .g52-label { font-size:11px!important; letter-spacing:.08em!important; text-transform:uppercase!important; color:#888!important; font-weight:700!important; margin:0 0 8px!important; }

#mtp-glm52-demo .g52-row { margin-bottom:18px!important; }

#mtp-glm52-demo .g52-btns { display:flex!important; flex-wrap:wrap!important; gap:8px!important; }

#mtp-glm52-demo .g52-btn {

background:#1a1a1a!important; color:#cfcfcf!important; border:1px solid #333!important;

border-radius:8px!important; padding:9px 14px!important; font-size:13px!important; font-weight:600!important;

cursor:pointer!important; transition:all .15s ease!important;

}

#mtp-glm52-demo .g52-btn:hover { border-color:#76B900!important; color:#fff!important; }

#mtp-glm52-demo .g52-btn.is-on { background:#76B900!important; color:#0a0a0a!important; border-color:#76B900!important; }

#mtp-glm52-demo .g52-bars { margin:4px 0 0!important; }

#mtp-glm52-demo .g52-bar-wrap { margin-bottom:12px!important; }

#mtp-glm52-demo .g52-bar-top { display:flex!important; justify-content:space-between!important; font-size:12px!important; color:#bbb!important; margin-bottom:5px!important; }

#mtp-glm52-demo .g52-bar-top b { color:#fff!important; }

#mtp-glm52-demo .g52-track { background:#1d1d1d!important; border-radius:6px!important; height:16px!important; overflow:hidden!important; border:1px solid #2a2a2a!important; }

#mtp-glm52-demo .g52-fill { height:100%!important; border-radius:6px 0 0 6px!important; transition:width .6s cubic-bezier(.2,.7,.3,1)!important; }

#mtp-glm52-demo .g52-fill.old { background:#3d4d1a!important; }

#mtp-glm52-demo .g52-fill.new { background:#76B900!important; }

#mtp-glm52-demo .g52-code-wrap { position:relative!important; }

#mtp-glm52-demo pre {

background:#0c0c0c!important; color:#dcdcdc!important; border:1px solid #2a2a2a!important;

border-radius:10px!important; padding:16px!important; margin:0!important;

font-family:"SFMono-Regular",Consolas,"Liberation Mono",Menlo,monospace!important;

font-size:12.5px!important; line-height:1.6!important; overflow-x:auto!important; white-space:pre!important;

}

#mtp-glm52-demo pre code { color:#dcdcdc!important; background:none!important; padding:0!important; }

#mtp-glm52-demo .g52-k { color:#76B900!important; }

#mtp-glm52-demo .g52-s { color:#c5a3ff!important; }

#mtp-glm52-demo .g52-copy {

position:absolute!important; top:10px!important; right:10px!important;

background:#1a1a1a!important; color:#76B900!important; border:1px solid #76B900!important;

border-radius:6px!important; padding:5px 11px!important; font-size:11px!important; font-weight:700!important; cursor:pointer!important;

}

#mtp-glm52-demo .g52-copy:hover { background:#76B900!important; color:#0a0a0a!important; }

#mtp-glm52-demo .g52-note { font-size:12.5px!important; color:#9a9a9a!important; margin:12px 0 0!important; padding:11px 13px!important; background:#161616!important; border-left:3px solid #76B900!important; border-radius:0 8px 8px 0!important; }

#mtp-glm52-demo .g52-note b { color:#cfcfcf!important; }

#mtp-glm52-demo .g52-fits { display:flex!important; flex-wrap:wrap!important; gap:10px!important; margin-top:4px!important; }

#mtp-glm52-demo .g52-chip { background:#161616!important; border:1px solid #2a2a2a!important; border-radius:8px!important; padding:10px 12px!important; flex:1!important; min-width:120px!important; }

#mtp-glm52-demo .g52-chip .n { color:#76B900!important; font-size:18px!important; font-weight:700!important; display:block!important; }

#mtp-glm52-demo .g52-chip .t { color:#9a9a9a!important; font-size:11px!important; }

#mtp-glm52-demo .g52-foot { border-top:1px solid #2a2a2a!important; margin-top:20px!important; padding-top:12px!important; font-size:11.5px!important; color:#777!important; display:flex!important; justify-content:space-between!important; flex-wrap:wrap!important; gap:6px!important; }

#mtp-glm52-demo .g52-foot b { color:#76B900!important; }

@media (max-width:640px){

#mtp-glm52-demo { padding:16px!important; }

#mtp-glm52-demo .g52-title { font-size:18px!important; }

#mtp-glm52-demo .g52-btn { padding:8px 11px!important; font-size:12px!important; }

#mtp-glm52-demo pre { font-size:11.5px!important; padding:13px!important; }

#mtp-glm52-demo .g52-chip { min-width:calc(50% - 5px)!important; }

}

インタラクティブデモ

GLM-5.2 セットアップジェネレーター & コンテキスト可視化ツール

エージェントとエフォートモードを選択してください。正確な設定をコピーし、100 万トークンが何をもたらすかを確認できます。

  1. コーディングエージェント

Claude Code

Claude Code (環境変数)

OpenClaw

Cline

  1. コンテキストウィンドウ

1M トークン (glm-5.2[1m])

標準 (glm-5.2)

  1. 思考エフォート

最大(複雑なコーディング用)

高

あなたの設定

コピー

コンテキストウィンドウ:GLM-5.1 vs GLM-5.2

GLM-5.1〜200,000 トークン

GLM-5.2 1,000,000 トークン

GLM-5.2 の概要

コンテキストウィンドウ内に 1,000,000 入力トークンを処理可能

1 回のレスポンスあたり最大 131,072 出力トークン

GLM-5.1 のウィンドウの 5 倍の規模

初日から 8 つのエージェントツールをサポート

設定情報元:Z.ai 開発者ドキュメント・2026 年 6 月

© Marktechpost

(function(){

var root = document.getElementById('mtp-glm52-demo');

if(!root) return;

var state = { tool:'claude', ctx:'1m', eff:'max' };

function model(){ return state.ctx==='1m' ? 'glm-5.2[1m]' : 'glm-5.2'; }

function effortLine(){

return state.eff==='max'

? 'セッションで /effort を実行し、より深い推論のために max を選択してください。'

: 'セッションで /effort を実行し、高速なターン処理のために high を選択してください。';

}

})

function configs(){

var m = model();

var compact = state.ctx==='1m' ? '1000000' : '200000';

if(state.tool==='claude'){

return {

text:'{\n "env": {\n "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "'+compact+'",\n "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",\n "ANTHROPIC_DEFAULT_SONNET_MODEL": "'+m+'",\n "ANTHROPIC_DEFAULT_OPUS_MODEL": "'+m+'"\n }\n}',

tip:'Edit ~/.claude/settings.json. '+effortLine()+' Then run /status to confirm '+m+' is active.'

};

}

if(state.tool==='env'){

return {

text:'export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"\nexport ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"\nexport ANTHROPIC_DEFAULT_OPUS_MODEL="'+m+'"\nexport ANTHROPIC_DEFAULT_SONNET_MODEL="'+m+'"\nexport ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"\nclaude',

tip:'Paste into your shell, then launch claude. The Anthropic-compatible endpoint needs only a base-URL and key swap. '+effortLine()

};

}

if(state.tool==='openclaw'){

return {

text:'{\n "id": "'+m+'",\n "name": "GLM-5.2",\n "reasoning": true,\n "input": ["text"],\n "contextWindow": '+(state.ctx==='1m'?'1000000':'200000')+',\n "maxTokens": 131072\n}',

tip:'Add this object to models.providers.zai.models in ~/.openclaw/openclaw.json. Point agents.defaults.model.primary at zai/'+m+', then run: openclaw gateway restart.'

};

}

return {

text:'Provider: OpenAI Compatible\nBase URL: https://api.z.ai/api/coding/paas/v4\nAPI Key: your-zai-api-key\nModel: '+m+'\nContext size: '+(state.ctx==='1m'?'1000000':'200000')+'\nSupport Images: off',

tip:'In Cline, choose the OpenAI Compatible provider and enter these values. Adjust temperature to your task. '+effortLine()

};

}

必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:

{"translation": "翻訳全文"}

function esc(s){ return s.replace(/&/g,'&').replace(//g,'>'); }

function highlight(s){

s = esc(s);

s = s.replace(/("[^"]*?"|"[^&]*?")/g, function(m){ return ''+m+''; });

s = s.replace(/\b(export|claude|Provider|Base URL|API Key|Model|Context size|Support Images)\b/g, '$1');

return s;

}

function render(){

var c = configs();

root.querySelector('#g52-out code').innerHTML = highlight(c.text);

root.querySelector('#g52-tip').innerHTML = 'How to apply: '+c.tip;

root.querySelector('#g52-out').setAttribute('data-raw', c.text);

}

function wire(groupId, key){

var g = root.querySelector('#'+groupId);

g.addEventListener('click', function(e){

var b = e.target.closest('.g52-btn'); if(!b) return;

state[key] = b.getAttribute('data-v');

g.querySelectorAll('.g52-btn').forEach(function(x){ x.classList.remove('is-on'); });

b.classList.add('is-on');

render();

});

}

wire('g52-tool','tool'); wire('g52-ctx','ctx'); wire('g52-eff','eff');

root.querySelector('#g52-copy').addEventListener('click', function(){

var raw = root.querySelector('#g52-out').getAttribute('data-raw');

var btn = this;

function done(){ btn.textContent='Copied'; setTimeout(function(){ btn.textContent='Copy'; },1400); }

if(navigator.clipboard && navigator.clipboard.writeText){

navigator.clipboard.writeText(raw).then(done, done);

} else {

var ta=document.createElement('textarea'); ta.value=raw; document.body.appendChild(ta);

ta.select(); try{document.execCommand('copy');}catch(e){} document.body.removeChild(ta); done();

}

});

render();

})();

ベンチマークに関する質問

ここには重要な注意が必要です。Z.ai は GLM-5.2 のローンチ時に、ベンチマークスコアを一切公開していませんでした。SWE-bench、Terminal-Bench、または Code Arena の数値もまだ存在しません。今回の発表は、利用可能性、コンテキストの拡張、そしてオープンソースのロードマップに焦点が当てられていました。

仕様比較:GLM-5.2 vs GLM-5.1

属性 | GLM-5.2 | GLM-5.1

---|---|---

リリース日 | 2026 年 6 月 13 日 | 2026 年 4 月 7 日

コンテキストウィンドウ | 1,000,000 トークン (glm-5.2[1m]) | 約 200,000 トークン

最大出力トークン数 | 131,072 | 非公表

推論モード | High(高)、Max(最大)の 2 レベル | シングルモードのみ

アーキテクチャ | ローンチ時は未発表 (GLM-5 リネージ) | 744B MoE、アクティブ 40B

ライセンス | MIT(重みは来週公開予定) | MIT(オープンウェイト公開済み)

ローンチ時のベンチマーク | 未公開 | SWE-bench Pro 58.4

ローンチ時のアクセス | GLM Coding Plan(全ティア対象) | Coding Plan、API、およびウェイト

使用例付きユースケース

リポジトリ全体の書き換え:中規模のリポジトリを単一のコンテキストウィンドウに読み込みます。エージェントは再取得を行うことなく、ファイル間の依存関係を追跡します。例として、40 個の Python データパイプラインファイルを単一セッションで書き換えることが可能です。

長期ホライズンのエージェント実行:GLM-5.2 は、計画・実行・テスト・修正のループを継続的に実行することを目的としています。GLM-5.1 は、1 つのセッションで約 1,700 ステップのエージェント動作を維持し、最大 8 時間にわたる自律的なループを実行しました。GLM-5.2 もその軌道を引き継ぎますが、同モデル自体の数値は現在未確定です。

Claude Code の差し替え代替品:ベース URL とモデル識別子のみを変更すれば、既存のエージェントハネスとワークフローをそのまま維持できます。これは、最先端 API へのアクセスが阻害された際に特に重要です。

大規模ドキュメントの分析:200K トークンを超える長い仕様書、ログ、または転写テキストを入力します。1M のウィンドウは、小規模モデルでは切り捨てられてしまう資料を保持できます。

GLM-5.2 のセットアップ方法

Claude Code の場合、~/.claude/settings.json を編集してください。Sonnet および Opus スロットを 1M バリアントに指し示します。自動コンパクションウィンドウを引き上げて、エージェントが完全なコンテキストを使用できるようにします。

json
{
  "env": {
    "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
  }
}

あるいは、環境変数を通じてエンドポイントを設定することもできます。Anthropic 互換のエンドポイントは、ベース URL の差し替えを受け入れます。

export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"

export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"

export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"

export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"

export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"

claude

次に、セッション内で /effort を実行して max を選択してください。/status を実行して GLM-5.2 がアクティブであることを確認します。Cline の場合は、OpenAI 互換プロバイダーを選択し、ベース URL を https://api.z.ai/api/coding/paas/v4 に設定します。カスタムモデルとして glm-5.2 を入力し、コンテキストを 1,000,000 に設定してください。

GLM-5.2 は、発売初日から 8 つのエージェント型コーディングツールと互換性があります。リストには Claude Code、Cline、OpenCode、OpenClaw が含まれています。

主要なポイント

Z.ai は 2026 年 6 月 13 日に GLM-5.2 をリリースし、GLM コーディングプランのすべてのティア(Lite、Pro、Max、Team)で即時利用可能となりました。

最大 131,072 トークンの出力トークンを備えた 1M トークンコンテキストウィンドウ (glm-5.2[1m])。

発売時にベンチマークは公開されませんでした。

ベース URL とモデルの切り替えのみで、Anthropic 互換エンドポイント経由で Claude Code、Cline、OpenClaw に組み込まれます。

知性はオープンであり、アクセス可能であり、構築のために用意されているべきです。世界中の開発者をエンパワーします。

GLM-5.2 は now、Lite、Pro、Max、Team プランを含むすべての GLM コーディングプランユーザーに利用可能です。https://t.co/aOKcqZD5EJ

新フラッグシップモデルとして、GLM-5.2 は…

— Z.ai (@Zai_org) 2026 年 6 月 13 日

技術詳細はこちらをご覧ください。また、Twitter でフォローしていただくこともお気軽にどうぞ。15 万人以上の ML 関連ユーザーが集まる SubReddit に参加することや、ニュースレターを購読することも忘れないでください。待ってください!Telegram をご利用ですか?今なら Telegram でも私たちに参加いただけます。

GitHub リポジトリの宣伝、Hugging Face ページの紹介、製品リリース、ウェビナーなどについて、弊社とパートナーシップを結んでプロモーションをご希望の方は、こちらからご連絡ください。

本記事「Z.ai が GLM-5.2 を発表:実用可能な 100 万トークンのコンテキスト、2 つの思考努力レベル、そしてリリース時にはベンチマークなし」は、MarkTechPost で最初に公開されました。

原文を表示

GLM-5.2 is the latest large language model from Z.ai, becoming the third major release in the GLM-5 line. It follows GLM-5 (February 11), GLM-5-Turbo (March 15), and GLM-5.1 (April 7). That makes four flagship-tier coding releases in roughly four months.

Usable 1M-Token Context Window

GLM-5.2’s standout spec is a 1,000,000-token context window. Z.ai labels the variant glm-5.2[1m] in its own configuration. Each response can return up to 131,072 output tokens. That is roughly a 5x jump from GLM-5.1’s 200,000-token window.

A 1M-token window changes how a coding agent works in practice. The agent can hold an entire mid-sized repository in working memory. That includes source files, tests, configuration, and conversation history. It avoids the constant summarization that smaller windows force.

The release also adds two thinking-effort levels: High and Max. Z.ai recommends Max effort for complex, multi-step coding work. In Claude Code, the /effort command controls this setting. The xhigh, max, and ultracode options all map to GLM-5.2’s Max effort.

Architecture and What Changed

Z.ai did not specify GLM-5.2’s architecture in its launch materials. But based on community notes, the GLM-5 base is a 744-billion-parameter Mixture-of-Experts model. It activates 40 billion parameters per token. GLM-5.1 kept that same backbone with retargeted post-training.

MTP Explainer Playground

#mtp-glm52-demo, #mtp-glm52-demo * { box-sizing:border-box!important; }

#mtp-glm52-demo hr, #mtp-glm52-demo p:empty, #mtp-glm52-demo del, #mtp-glm52-demo s { display:none!important; }

#mtp-glm52-demo {

background:#111!important; color:#e8e8e8!important;

border:1px solid #2a2a2a!important; border-radius:14px!important;

font-family:-apple-system,BlinkMacSystemFont,"Segoe UI",Roboto,Helvetica,Arial,sans-serif!important;

max-width:900px!important; margin:24px auto!important; padding:24px!important;

line-height:1.5!important;

}

#mtp-glm52-demo .g52-head { border-bottom:1px solid #2a2a2a!important; padding-bottom:14px!important; margin-bottom:18px!important; }

#mtp-glm52-demo .g52-kicker { color:#76B900!important; font-size:12px!important; letter-spacing:.12em!important; text-transform:uppercase!important; font-weight:700!important; margin:0 0 6px!important; }

#mtp-glm52-demo .g52-title { font-size:21px!important; font-weight:700!important; color:#fff!important; margin:0!important; }

#mtp-glm52-demo .g52-sub { color:#9a9a9a!important; font-size:13px!important; margin:6px 0 0!important; }

#mtp-glm52-demo .g52-label { font-size:11px!important; letter-spacing:.08em!important; text-transform:uppercase!important; color:#888!important; font-weight:700!important; margin:0 0 8px!important; }

#mtp-glm52-demo .g52-row { margin-bottom:18px!important; }

#mtp-glm52-demo .g52-btns { display:flex!important; flex-wrap:wrap!important; gap:8px!important; }

#mtp-glm52-demo .g52-btn {

background:#1a1a1a!important; color:#cfcfcf!important; border:1px solid #333!important;

border-radius:8px!important; padding:9px 14px!important; font-size:13px!important; font-weight:600!important;

cursor:pointer!important; transition:all .15s ease!important;

}

#mtp-glm52-demo .g52-btn:hover { border-color:#76B900!important; color:#fff!important; }

#mtp-glm52-demo .g52-btn.is-on { background:#76B900!important; color:#0a0a0a!important; border-color:#76B900!important; }

#mtp-glm52-demo .g52-bars { margin:4px 0 0!important; }

#mtp-glm52-demo .g52-bar-wrap { margin-bottom:12px!important; }

#mtp-glm52-demo .g52-bar-top { display:flex!important; justify-content:space-between!important; font-size:12px!important; color:#bbb!important; margin-bottom:5px!important; }

#mtp-glm52-demo .g52-bar-top b { color:#fff!important; }

#mtp-glm52-demo .g52-track { background:#1d1d1d!important; border-radius:6px!important; height:16px!important; overflow:hidden!important; border:1px solid #2a2a2a!important; }

#mtp-glm52-demo .g52-fill { height:100%!important; border-radius:6px 0 0 6px!important; transition:width .6s cubic-bezier(.2,.7,.3,1)!important; }

#mtp-glm52-demo .g52-fill.old { background:#3d4d1a!important; }

#mtp-glm52-demo .g52-fill.new { background:#76B900!important; }

#mtp-glm52-demo .g52-code-wrap { position:relative!important; }

#mtp-glm52-demo pre {

background:#0c0c0c!important; color:#dcdcdc!important; border:1px solid #2a2a2a!important;

border-radius:10px!important; padding:16px!important; margin:0!important;

font-family:"SFMono-Regular",Consolas,"Liberation Mono",Menlo,monospace!important;

font-size:12.5px!important; line-height:1.6!important; overflow-x:auto!important; white-space:pre!important;

}

#mtp-glm52-demo pre code { color:#dcdcdc!important; background:none!important; padding:0!important; }

#mtp-glm52-demo .g52-k { color:#76B900!important; }

#mtp-glm52-demo .g52-s { color:#c5a3ff!important; }

#mtp-glm52-demo .g52-copy {

position:absolute!important; top:10px!important; right:10px!important;

background:#1a1a1a!important; color:#76B900!important; border:1px solid #76B900!important;

border-radius:6px!important; padding:5px 11px!important; font-size:11px!important; font-weight:700!important; cursor:pointer!important;

}

#mtp-glm52-demo .g52-copy:hover { background:#76B900!important; color:#0a0a0a!important; }

#mtp-glm52-demo .g52-note { font-size:12.5px!important; color:#9a9a9a!important; margin:12px 0 0!important; padding:11px 13px!important; background:#161616!important; border-left:3px solid #76B900!important; border-radius:0 8px 8px 0!important; }

#mtp-glm52-demo .g52-note b { color:#cfcfcf!important; }

#mtp-glm52-demo .g52-fits { display:flex!important; flex-wrap:wrap!important; gap:10px!important; margin-top:4px!important; }

#mtp-glm52-demo .g52-chip { background:#161616!important; border:1px solid #2a2a2a!important; border-radius:8px!important; padding:10px 12px!important; flex:1!important; min-width:120px!important; }

#mtp-glm52-demo .g52-chip .n { color:#76B900!important; font-size:18px!important; font-weight:700!important; display:block!important; }

#mtp-glm52-demo .g52-chip .t { color:#9a9a9a!important; font-size:11px!important; }

#mtp-glm52-demo .g52-foot { border-top:1px solid #2a2a2a!important; margin-top:20px!important; padding-top:12px!important; font-size:11.5px!important; color:#777!important; display:flex!important; justify-content:space-between!important; flex-wrap:wrap!important; gap:6px!important; }

#mtp-glm52-demo .g52-foot b { color:#76B900!important; }

@media (max-width:640px){

#mtp-glm52-demo { padding:16px!important; }

#mtp-glm52-demo .g52-title { font-size:18px!important; }

#mtp-glm52-demo .g52-btn { padding:8px 11px!important; font-size:12px!important; }

#mtp-glm52-demo pre { font-size:11.5px!important; padding:13px!important; }

#mtp-glm52-demo .g52-chip { min-width:calc(50% - 5px)!important; }

}

Interactive Demo

GLM-5.2 Setup Generator & Context Visualizer

Pick your agent and effort mode. Copy the exact config. See what 1M tokens buys you.

  1. Coding agent

Claude Code

Claude Code (env vars)

OpenClaw

Cline

  1. Context window

1M tokens (glm-5.2[1m])

Standard (glm-5.2)

  1. Thinking effort

Max (complex coding)

High

Your config

Copy

Context window: GLM-5.1 vs GLM-5.2

GLM-5.1~200,000 tokens

GLM-5.21,000,000 tokens

GLM-5.2 at a glance

1,000,000input tokens in one context window

131,072max output tokens per response

5xlarger than GLM-5.1’s window

8agentic tools supported day one

Config sourced from Z.ai developer docs · June 2026

© Marktechpost

(function(){

var root = document.getElementById('mtp-glm52-demo');

if(!root) return;

var state = { tool:'claude', ctx:'1m', eff:'max' };

function model(){ return state.ctx==='1m' ? 'glm-5.2[1m]' : 'glm-5.2'; }

function effortLine(){

return state.eff==='max'

? 'Run /effort in your session and select max for deeper reasoning.'

: 'Run /effort in your session and select high for faster turns.';

}

function configs(){

var m = model();

var compact = state.ctx==='1m' ? '1000000' : '200000';

if(state.tool==='claude'){

return {

text:'{\n "env": {\n "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "'+compact+'",\n "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",\n "ANTHROPIC_DEFAULT_SONNET_MODEL": "'+m+'",\n "ANTHROPIC_DEFAULT_OPUS_MODEL": "'+m+'"\n }\n}',

tip:'Edit ~/.claude/settings.json. '+effortLine()+' Then run /status to confirm '+m+' is active.'

};

}

if(state.tool==='env'){

return {

text:'export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"\nexport ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"\nexport ANTHROPIC_DEFAULT_OPUS_MODEL="'+m+'"\nexport ANTHROPIC_DEFAULT_SONNET_MODEL="'+m+'"\nexport ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"\nclaude',

tip:'Paste into your shell, then launch claude. The Anthropic-compatible endpoint needs only a base-URL and key swap. '+effortLine()

};

}

if(state.tool==='openclaw'){

return {

text:'{\n "id": "'+m+'",\n "name": "GLM-5.2",\n "reasoning": true,\n "input": ["text"],\n "contextWindow": '+(state.ctx==='1m'?'1000000':'200000')+',\n "maxTokens": 131072\n}',

tip:'Add this object to models.providers.zai.models in ~/.openclaw/openclaw.json. Point agents.defaults.model.primary at zai/'+m+', then run: openclaw gateway restart.'

};

}

return {

text:'Provider: OpenAI Compatible\nBase URL: https://api.z.ai/api/coding/paas/v4\nAPI Key: your-zai-api-key\nModel: '+m+'\nContext size: '+(state.ctx==='1m'?'1000000':'200000')+'\nSupport Images: off',

tip:'In Cline, choose the OpenAI Compatible provider and enter these values. Adjust temperature to your task. '+effortLine()

};

}

function esc(s){ return s.replace(/&/g,'&').replace(//g,'>'); }

function highlight(s){

s = esc(s);

s = s.replace(/("[^&]*?"|"[^"]*?")/g, function(m){ return ''+m+''; });

s = s.replace(/\b(export|claude|Provider|Base URL|API Key|Model|Context size|Support Images)\b/g, '$1');

return s;

}

function render(){

var c = configs();

root.querySelector('#g52-out code').innerHTML = highlight(c.text);

root.querySelector('#g52-tip').innerHTML = 'How to apply: '+c.tip;

root.querySelector('#g52-out').setAttribute('data-raw', c.text);

}

function wire(groupId, key){

var g = root.querySelector('#'+groupId);

g.addEventListener('click', function(e){

var b = e.target.closest('.g52-btn'); if(!b) return;

state[key] = b.getAttribute('data-v');

g.querySelectorAll('.g52-btn').forEach(function(x){ x.classList.remove('is-on'); });

b.classList.add('is-on');

render();

});

}

wire('g52-tool','tool'); wire('g52-ctx','ctx'); wire('g52-eff','eff');

root.querySelector('#g52-copy').addEventListener('click', function(){

var raw = root.querySelector('#g52-out').getAttribute('data-raw');

var btn = this;

function done(){ btn.textContent='Copied'; setTimeout(function(){ btn.textContent='Copy'; },1400); }

if(navigator.clipboard && navigator.clipboard.writeText){

navigator.clipboard.writeText(raw).then(done, done);

} else {

var ta=document.createElement('textarea'); ta.value=raw; document.body.appendChild(ta);

ta.select(); try{document.execCommand('copy');}catch(e){} document.body.removeChild(ta); done();

}

});

render();

})();

The Benchmark Question

Here is the important caveat. Z.ai published no benchmark scores for GLM-5.2 at launch. There is no SWE-bench, Terminal-Bench, or Code Arena number yet. The announcement focused on availability, context, and the open-source roadmap.

Specification Comparison: GLM-5.2 vs GLM-5.1

AttributeGLM-5.2GLM-5.1

ReleasedJune 13, 2026April 7, 2026

Context window1,000,000 tokens (glm-5.2[1m])~200,000 tokens

Max output tokens131,072Not disclosed

Reasoning modesHigh, MaxSingle mode

ArchitectureNot specified at launch (GLM-5 lineage)744B MoE, 40B active

LicenseMIT (weights pending next week)MIT (open weights released)

Launch benchmarksNone published58.4 SWE-bench Pro

Access at launchGLM Coding Plan (all tiers)Coding Plan, API, and weights

Use Cases With Examples

Whole-repository refactors: Load a mid-sized repo into one context window. The agent tracks cross-file dependencies without re-fetching. Example: refactor a 40-file Python data pipeline in a single session.

Long-horizon agent runs: GLM-5.2 targets sustained plan, execute, test, fix loops. GLM-5.1 sustained roughly 1,700 agent steps in one session. It ran autonomous loops for up to eight hours. GLM-5.2 inherits that trajectory, though its own numbers are pending.

Drop-in Claude Code replacement: Swap the base URL and model identifier only. Keep your existing agent harness and workflow. This matters when frontier API access is disrupted.

Large-document analysis: Feed long specs, logs, or transcripts past 200K tokens. The 1M window holds material that smaller models truncate.

How to Set Up GLM-5.2

For Claude Code, edit ~/.claude/settings.json. Point the Sonnet and Opus slots at the 1M variant. Raise the auto-compact window so the agent uses the full context.

Copy CodeCopiedUse a different Browser

{

"env": {

"CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",

"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",

"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",

"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"

}

}

Alternatively, set the endpoint through environment variables. The Anthropic-compatible endpoint accepts a base-URL swap.

Copy CodeCopiedUse a different Browser

export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"

export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"

export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"

export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"

export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"

claude

Then run /effort in a session and select max. Run /status to confirm GLM-5.2 is active. For Cline, choose the OpenAI Compatible provider. Set the base URL to https://api.z.ai/api/coding/paas/v4. Enter the custom model glm-5.2 and set context to 1,000,000.

GLM-5.2 is compatible with eight agentic coding tools from day one. The list includes Claude Code, Cline, OpenCode, and OpenClaw.

Key Takeaways

Z.ai shipped GLM-5.2 on June 13, 2026, live immediately across all GLM Coding Plan tiers (Lite, Pro, Max, Team).

1M-token context window (glm-5.2[1m]) with up to 131,072 output tokens.

No benchmarks were published at launch

It drops into Claude Code, Cline, and OpenClaw via an Anthropic-compatible endpoint with just a base-URL and model swap.

Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere.

GLM-5.2 is now available to all GLM Coding Plan users, including Lite, Pro, Max, and Team plans.https://t.co/aOKcqZD5EJ

As our new flagship model, GLM-5.2 delivers…

— Z.ai (@Zai_org) June 13, 2026

Check out the Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.

Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us

The post Z.ai Launches GLM-5.2 With a Usable 1M-Token Context, Two Thinking-Effort Levels, and No Benchmarks at Launch appeared first on MarkTechPost.

この記事をシェア

関連記事

AI News★52026年6月15日 17:00

AIの緊急停止スイッチ:Anthropicの輸出規制が引き起こしたグローバルなAI主権争奪戦

米国政府は2026年6月13日、同社の強力なAIモデルを全世界からオフラインにする指令を出し、欧州やカナダでAIの支配権を巡る懸念が高まっている。

Simon Willison Blog★42026年6月15日 08:54

AI がソフトウェアエンジニアを代替しない理由と、その将来性について

アーヴィンド・ナラヤナン氏とサイヤシュ・カッポル氏は、AI による雇用喪失の議論に対し、ソフトウェア工学という分野に焦点を当てて、AI が特定の能力閾値を超えても大規模な代替は起こらないとする証拠があることを論じています。

MarkTechPost★42026年6月15日 05:45

FineWeb を用いたストリーミング、フィルタリング、重複排除、トークン化、大規模ウェブコーパス分析のコーディングハンズオン

MarkTechPost は、大規模なデータセットをダウンロードせずに FineWeb データセットのサンプルをストリーミングし、スキーマやメタデータを調査するチュートリアルを提供しています。また、品質フィルタリングパイプラインの再現、MinHash による重複検出、GPT-2 トークナイザーを用いたトークン数検証、および有用な分析結果の生成方法を解説しています。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む