OpenClaw 2026.5.26 リリースノート
OpenClaw が 2026 年 5 月 26 日に更新され、ゲートウェイと返信の高速化、およびトランスクリプトを中核とした会議要約機能などが強化された。
2026.5.26
ハイライト
- ゲートウェイと返信の高速化:起動時にプラグイン、チャネル、セッション、使用コスト、警告、スケジュールサービス、ファイルシステムのスキャンを繰り返さないように回避。目に見える返信では、ユーザー向けの送信と、より遅いフォローアップ作業を分離し、負荷下でのゲートウェイランタイム/セッションキャッシュの入れ替えを減らします。
- 転記(トランスクリプト)が中核:トランスクリプトに裏打ちされた会議要約、ソースプロバイダーチャンク、クリーニング済みユーザーターン、メディアの出自、Codex ミラー、WebChat 返信、CLI/TUI リプレイは、すべてより信頼性の高い転記パスを利用します。
- より多くのチャネルが生産環境対応:Telegram は入力中/進行状況のコンテキストとフォーラムトピックを維持し、iMessage は添付ファイルのルート、リモートメディアのステージング、重複するローカル Messages ソースを処理。WhatsApp はグループ/メディア動作を復元し、Discord は音声再生とモデル選択を改善。Signal/iMessage/WhatsApp ではリアクション承認が利用可能になります。
- 音声と Talk の向上:リアルタイム Talk ランンは Web UI や Discord 通話から検査・操作・キャンセル・フォローアップが可能に。ウェイクワードの処理はより寛容になりつつ、環境音によるエージェントの誤作動を防ぎます。
- より安全なコンテンツ境界:ブラウザスナップショット読み取りは SSRF ポリシーを尊重し、システムイベントテキストでネストされたプロンプトマーカーを偽装できず、取得ファイルテキストは外部コンテンツとしてラップされます。ClickClack 受信送信者ホワイトリストはエージェントディスパッチ前に実行され、期限切れのデバイストークンは拒否され、シリアライズされたツール呼び出しテキストは返信からスクラブ(除去)されます。
- プロバイダー、Codex、およびローカルモデルの安定性が向上:認証プロファイルの名称指定、OpenAI サンプリングパラメータ、Codex アプリサーバーの再開/タイムアウト/利用制限回復機能、動的ツールスキーマガード、xAI 利用制限の表示、Ollama の top-p 正規化、およびローカル承認解決により、プロバイダー固有の行き止まりが減少しました。
- より信頼性の高いインストール/更新/リリースパス:Alpine インストール、信頼されたランタイムフォールバックルート、安定した更新チャンネル、Docker/パッケージのタイムアウト、Windows 定期タスク、Windows/macOS の証明レーン、Testbox/Crabbox の委任、プラグイン公開チェック、および macOS ランナーのブートストラップが強化されました。
- 観測性の向上:アクティビティタブ、ゲートウェイシークレット準備トレース、ツール/モデルストリームの進捗状況、明示的な高速モードステータス、systemd Gateway の衛生管理、OpenTelemetry LLM スパン、リリースパフォーマンスの証拠、およびより豊富なテレメトリ信号により、障害の調査が容易になりました。
変更点
- 通訳:トランスクリプトに裏打ちされた会議要約のためのコア通訳キャプチャとソースプロバイダーサポートを追加しました。これには、名称変更された通訳ドキュメント、CLI サフェース、ソースプロバイダーチャンク、および整理されたユーザーターン永続化が含まれます。
- 認証:Hermes、OpenCode、Codex の認証プロファイルに対する名前付きモデルログインプロファイルとサポートされる資格情報移行を追加しました。明示的なオプトアウトと非対話型コントロールも用意されています。(#85667)@fuller-stack-dev 氏に感謝します。
- 診断機能:ゲートウェイシークレットの準備プロセスを追跡し、スキル/ツールの使用状況を分類し、モデルストリームの進行状況を表示。OpenTelemetry LLM コンテキストスパンを追加し、ブロックされたツール、フェイルオーバー、期限切れセッション、ライブネス状態、過大なペイロード、Webhook 入力に関するアラート可能なテレメトリを公開する。(#83019, #80370, #86191)
- チャネル:Signal のリアクション承認、iMessage のサムネイル承認リアクション、WhatsApp のサムネイル承認リアクションサポートを追加し、モバイルでの承認フローがテキストベースの /approve コマンドなしで動作できるようにする。(#85894, #85952, #85477)
- エージェント/API:OpenAI のサンプリングパラメータをゲートウェイ経由で転送し、アクティブなエージェント実行の推定コンテキスト予算ステータスを公開する。(#84094)
- TUI/ステータス:エージェントがビジー状態にある間に送信されたプロンプトをキューに追加し、明示的な高速モード状態を表示。status 出力で systemd ゲートウェイの衛生管理情報をより豊富にする。(#86722, #87115, #86976)
- 実行承認:現在のプロンプトに対して利用できない永続的承認アクションを非表示にし、承認ランタイムトークンをローカルのみとする。これにより、期限切れのプロンプトが誤解を招くコントロールを提供できなくする。(#86270, #86359)
- プラグイン SDK:リアクション承認ヘルパーを追加し、診断イベントのルートエクスポートを関数名およびエイリアスバウンドモジュールグラフ全体で検出可能に維持する。(#86735, #87084)
- Android/iOS:Android の pair-new-gateway アクションを追加し、モバイル Talk モードの表示面を改善。iOS のリアルタイム Talk モードおよび Android のオフライン音声/ゲートウェイ回復機能を含む。(#86798, #86355)@ngutman 氏に感謝。
- パフォーマンス:キャッシュプラグインのメタデータスナップショット、パッケージの実パス、ゲートウェイメタデータの安定化、モデルコストインデックス、チャネル解決、使用量コストインデックス、セッション/認証ホットパスの事実を保存し、共通の Gateway および返信パスでの再発見処理を減らす。(#84649, #85843, #86517, #86678)
- ボイス:リアルタイム音声 SDK を通じて共有されるリアルタイム TURN コンテキスト追跡を公開し、Discord 話者属性の特定およびウェイクワードコンテキストの回復に再利用する。
- ボイス:Google Meet コマンドおよびノードオーディオブリッジにおいて、共有されるリアルタイム出力アクティビティ追跡を再利用し、ローカルでのバージイン検出のための直近出力チェックを含むものとする。
- ボイス:リアルタイム音声 SDK を通じて共有されるリアルタイム出力アクティビティ追跡を公開し、Discord の再生アクティビティおよびバージイン判断に再利用する。
- ボイス:リアルタイム音声 SDK を通じて共有されるリアルタイム相談質問マッチング、発話可能結果の抽出、エイリアス対応強制相談調整を公開し、Gateway Talk、Voice Call、Discord 音声パスで再利用する。
- ボイス:リアルタイム音声 SDK を通じてアクティベーション名マッチングおよび相談トランスクリプトスクリーニングを共有し、Discord、ブラウザボイス、会議サーフェスが一つの実装を再利用できるようにする。
- Cron: scheduled automations(スケジュールされた自動化)とその孤立したエージェントターンが明示的な設定なしで並列に進捗できるよう、cron.maxConcurrentRuns のデフォルト値を 8 に設定する。
- QA-Lab: qa coverage --match を追加し、ライブまたはリモートレーンを実行する前に既存のメタデータから一致するシナリオを検出できる集中的な証明選択を可能にする。
- Discord/model picker: プロバイダーリストまたはプロバイダーのモデルリストが25項目を超える場合、アルファベットバケット選択(例:A–G (12) · H–N (18) · O–Z (5))を表示し、provider/*ワイルドカードを含む設定が「次/前」ページを切り替える代わりに、正しいページにワンクリックで到達できるようにします。すべての項目の最初の文字が同じ場合は数値チャンクにフォールバックします。
- Control UI: 生データテレメトリを保存しない、サニタイズ済みライブツール活動要約用の一時的なActivityタブを追加しました。Fixes #12831。@BunsDev 氏に感謝します。
- Build: scripts/build-all.mjs のフルビルドおよびciArtifactsプロファイルにui:buildを含めることで、tsdownがdistをクリーンアップした後にpnpm buildが常にdist/control-uiを再構築するようにし、2番目のコマンドの必要性とソース/ランタイムインストールおよびCIアーティファクトアップロードにおけるアセット不足による失敗モードを排除しました。(#85206)
- iOS: 直接リアルタイム音声セッション、コンパクトなツールバーステータス、レスポンシブな音声波形フィードバックによりTalkモードを改善しました。(#86355)@ngutman 氏に感謝します。
- Media: メタデータ、リサイズ、EXIF方向補正、PNGアルファ保持最適化のためにSharp画像バックエンドをRastermillに置き換え、OpenClawが画像処理のためにSharpやWhatsAppのJimpフォールバックをインストールする必要がなくなりました。(#86437)
- Codex: バンドルされたCodex CLIを0.134.0に更新し、予算トリガーによるアプリサーバーターンでネイティブ圧縮を無効にしたまま維持し、OpenClawが回復境界を管理できるようにしました。(#86772)
Fixes
- メモリ/セキュリティ:明示的な memory_store ツールを介して提出されたプロンプトのようなテキストは、埋め込みまたは保存前に拒否する。既存の自動キャプチャ型プロンプト注入フィルタと整合させること。(#87142)
- ゲートウェイ/セキュリティ:gateway.auth.rateLimit が未設定の場合、リモートの非ブラウザおよび HTTP ゲートウェイ認証失敗時にデフォルトの認証レートリミッターを有効化する。ただし、ループバック例外は維持する。(#87148)
セキュリティ/コンテンツ境界:ChromeMCP または直接 CDP 読み取り前に、Browser スナップショットタブの URL を SSRF ポリシーに対して検証する。キューイングされたシステムイベントテキストをサニタイズし、信頼できないプラグインまたはチャンネルラベルがネスト型プロンプトマーカーを偽装できないようにする。取得したファイルテキストおよびメタデータを外部コンテンツとしてラップする。エージェントディスパッチ前に ClickClack の allowFrom 送信者ホワイトリストを適用する。トークンローテーション中に無効化されたデバイストークンを持つクライアントからの RPC を拒否する。段階的なサンドボックスメディア参照を要求し、返信からシリアライズされたツール呼び出しテキストをスクラビングする。(#78526, #87094, <a class="issue-link js-issue-link" data-error-text="Failed to load title" data-id="4528022916" data-permission-text="Title is private" data-url="https://github.com/opencla
原文を表示
2026.5.26
Highlights
- Faster Gateway and replies: startup avoids repeated plugin, channel, session, usage-cost, warning, scheduled-service, and filesystem scans; visible replies separate user-facing sends from slower follow-up work; Gateway runtime/session caches churn less under load.
- Transcripts are core: transcript-backed meeting summaries, source-provider chunks, cleaned user turns, media provenance, Codex mirrors, WebChat replies, and CLI/TUI replay now use one more reliable transcript path.
- More channels are production-ready: Telegram keeps typing/progress context and forum topics, iMessage handles attachment roots, remote media staging, and duplicate local Messages sources, WhatsApp restores group/media behavior, Discord improves voice playback and model picking, and Signal/iMessage/WhatsApp get reaction approvals.
- Better voice and Talk: realtime Talk runs can be inspected, steered, cancelled, or followed up from Web UI and Discord voice; wake-name handling is more tolerant without letting ambient speech trigger agents.
- Safer content boundaries: Browser snapshot reads honor SSRF policy, system-event text cannot spoof nested prompt markers, fetched file text is wrapped as external content, ClickClack inbound sender allowlists run before agent dispatch, stale device tokens are rejected, and serialized tool-call text is scrubbed from replies.
- Providers, Codex, and local models are steadier: named auth profiles, OpenAI sampling params, Codex app-server resume/timeout/usage-limit recovery, dynamic tool-schema guards, xAI usage-limit surfacing, Ollama top-p normalization, and local approval resolution reduce provider-specific dead ends.
- More reliable install/update/release paths: Alpine installs, trusted runtime fallback roots, stable update channels, Docker/package timeouts, Windows Scheduled Tasks, Windows/macOS proof lanes, Testbox/Crabbox delegation, plugin publish checks, and macOS runner bootstraps all got hardened.
- Better observability: Activity tab, gateway secret-prep traces, tool/model stream progress, explicit fast-mode status, systemd Gateway hygiene, OpenTelemetry LLM spans, release performance evidence, and richer telemetry signals make failures easier to inspect.
Changes
- Transcripts: add core transcript capture and source-provider support for transcript-backed meeting summaries, including the renamed Transcripts docs, CLI surface, source-provider chunks, and cleaned user-turn persistence.
- Auth: add named model login profiles and supported credential migration for Hermes, OpenCode, and Codex auth profiles, with explicit opt-out and non-interactive controls. (#85667) Thanks @fuller-stack-dev.
- Diagnostics: trace gateway secret preparation, classify skill/tool usage, surface model stream progress, add OpenTelemetry LLM content spans, and expose alertable telemetry for blocked tools, failover, stale sessions, liveness, oversized payloads, and webhook ingress. (#83019, #80370, #86191)
- Channels: add Signal reaction approvals, iMessage thumb approval reactions, and WhatsApp thumb approval reaction support so mobile approval flows work without textual /approve commands. (#85894, #85952, #85477)
- Agents/API: forward OpenAI sampling params through the Gateway and expose estimated context-budget status for active agent runs. (#84094)
- TUI/status: queue prompts submitted while an agent is busy and show explicit fast-mode state plus richer systemd Gateway hygiene in status output. (#86722, #87115, #86976)
- Exec approvals: hide durable approval actions that are unavailable for the current prompt and keep approval runtime tokens local-only so stale prompts cannot offer misleading controls. (#86270, #86359)
- Plugin SDK: add reaction approval helpers and keep diagnostic event root exports discoverable across function-name and alias-bound module graphs. (#86735, #87084)
- Android/iOS: add the Android pair-new-gateway action and improve mobile Talk mode surfaces, including iOS realtime Talk mode and Android offline voice/gateway recovery. (#86798, #86355) Thanks @ngutman.
- Performance: cache plugin metadata snapshots, package realpaths, stable gateway metadata, model cost indexes, channel resolution, usage-cost indexes, and session/auth hot-path facts so common Gateway and reply paths do less rediscovery. (#84649, #85843, #86517, #86678)
- Voice: expose shared realtime turn-context tracking through the realtime voice SDK and reuse it for Discord speaker attribution and wake-name context recovery.
- Voice: reuse shared realtime output activity tracking in Google Meet command and node audio bridges, including recent-output checks for local barge-in detection.
- Voice: expose shared realtime output activity tracking through the realtime voice SDK and reuse it for Discord playback activity and barge-in decisions.
- Voice: expose shared realtime consult question matching, speakable-result extraction, and alias-aware forced-consult coordination through the realtime voice SDK, then reuse it in Gateway Talk, Voice Call, and Discord voice paths.
- Voice: share activation-name matching and consult-transcript screening through the realtime voice SDK so Discord, browser voice, and meeting surfaces can reuse one implementation.
- Cron: default cron.maxConcurrentRuns to 8 so scheduled automations and their isolated agent turns can make progress in parallel without explicit configuration.
- QA-Lab: add qa coverage --match so focused proof selection can discover matching scenarios from existing metadata before running live or remote lanes.
- Discord/model picker: surface an alpha-bucket select (e.g. A–G (12) · H–N (18) · O–Z (5)) when the provider list or a provider's model list exceeds 25 items, so configs with provider/* wildcards stay one click from the right page instead of paginating through prev/next; falls back to numeric chunks when every item shares the same first letter.
- Control UI: add an ephemeral Activity tab for sanitized live tool activity summaries without persisting raw telemetry. Fixes #12831. Thanks @BunsDev.
- Build: include ui:build in the full and ciArtifacts profiles of scripts/build-all.mjs so pnpm build always rebuilds dist/control-ui after tsdown cleans dist, removing the second-command requirement and the missing-asset failure mode for source/runtime installs and CI artifact uploads. (#85206)
- iOS: improve Talk mode with direct realtime voice sessions, compact toolbar status, and responsive voice waveform feedback. (#86355) Thanks @ngutman.
- Media: replace the Sharp image backend with Rastermill for metadata, resizing, EXIF orientation, and PNG alpha-preserving optimization so OpenClaw no longer installs Sharp or the WhatsApp Jimp fallback for image processing. (#86437)
- Codex: update the bundled Codex CLI to 0.134.0 and keep native compaction disabled for budget-triggered app-server turns so OpenClaw owns the recovery boundary. (#86772)
Fixes
- Memory/security: reject prompt-like text submitted through the explicit memory_store tool before embedding or storage, matching the existing auto-capture prompt-injection filter. (#87142)
- Gateway/security: enable the default auth rate limiter for remote non-browser and HTTP gateway auth failures when gateway.auth.rateLimit is unset, while preserving the loopback exemption. (#87148)
Security/content boundaries: validate Browser snapshot tab URLs against SSRF policy before ChromeMCP or direct CDP reads, sanitize queued system-event text so untrusted plugin/channel labels cannot spoof nested prompt markers, wrap fetched file text and metadata as external content, apply ClickClack allowFrom sender allowlists before agent dispatch, reject RPCs from invalidated device-token clients during rotation, require staged sandbox media refs, and scrub serialized tool-call text from replies. (#78526, #87094, <a class="issue-link js-issue-link" data-error-text="Failed to load title" data-id="4528022916" data-permission-text="Title is private" data-url="https://github.com/opencla
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み