OpenClaw Changelog·2026年5月5日 10:43·約13分で読める
OpenClaw バージョン 2026.5.4-beta.2 の公開
TL;DR
Google Meet と Twilio を連携させた音声通話機能の改善が発表されました。リアルタイム Gemini 音声ブリッジを活用し、音声ストリーミングの制御やバッファ管理を最適化することで、OpenClaw の音声エージェントの応答性を大幅に向上させました。
2026.5.4
ハイライト
- Google Meet/音声通話:リアルタイム Gemini ボイスブリッジを介して Twilio ダイヤルイン接続の音声を、ペーストされたオーディオストリーミング、バックプレッシャー対応バッファリング、バージインキュークリア、およびリアルタイム音声中のTwiMLフォールバックなしで再生可能にし、Meet 参加者により素早い OpenClaw ボイスエージェントを提供します。(#77064) @scoootscooob 氏に感謝。
変更点
- プラグイン/マイグレーション:plugins.entries または plugins.allow がインストールされていない公式外部プラグインを参照している場合、カタログバックドのインストールヒントを出力します。これにより、アップグレードされた設定ファイルが有効なプラグイン設定の削除を指示するのではなく、openclaw plugins install コマンドをオペレーターに案内します。(#77483) @hclsys 氏に感謝。
- OpenAI/Codex メディア:ランタイムおよびマニフェストメタデータで Codex オーディオトランスクリプションを宣伝し、アクティブな Codex チャットモデルをオーディオトランスクリプションの OpenAI デフォルトへルーティングします。これにより、チャットモデル ID がオーディオトランスクリプションに送信されるのを防ぎます。@vincentkoc 氏に感謝。
- 依存関係:Pi 0.73.0、ACPX アダプター、OpenAI、Anthropic、Slack、TypeScript ネイティブプレビューを含むランタイムおよびプロバイダーパッケージを更新します。ただし、Windows ARM Node 24 npm リゾルバーの失敗により、Bedrock ランタイムインストーラーのオーバーライドはピン留めされたまま維持されます。
- エージェント/パフォーマンス:解決済みのワークスペースを BTW(Behind The Wheel)、コンパクション、埋め込み実行モデル生成、および PDF モデルセットアップに渡すことで、明示的な agent-dir モデルリフレッシュが現在のワークスペーススコープのプラグインメタデータスナップショットを再利用できるようにし、コールドなプラグインメタデータスキャンへのフォールバックを防ぎます。(#77519, #77532)
- プラグイン/パフォーマンス:スコープなしモデルカタログおよびマニフェスト契約リーダーが、現在のワークスペース互換性のあるプラグインメタデータスナップショットを再利用できるようにし、ホットなコントロールプレーンパスでの繰り返しコールドプラグインメタデータスキャンを回避しつつ、環境/設定/ワークスペースの互換性チェックを維持します。(#77519, #77532)
- 設定/プラグイン自動有効化:構成されたチャネルを自動的にホワイトリストに登録する際、組み込みチャンネルエイリアスよりも、請求元のプラグインマニフェスト ID を優先し、WeCom/Yuanbao スタイルのエイリアスがインストール済みプラグイン ID に解決されるようにします。@Beandon13 氏に感謝。
- シークレット/適用:プロバイダー対象シークレットをスクラビングする際、auth-profile の keyRef および tokenRef フィールドを保持し、プレーンテキスト値を保持することなく、正規の SecretRef メタデータがシークレット適用後も生存するようにします。@Beandon13 氏に感謝。
- プラグイン/アクティブメモリ:リコールサブエージェントのチャネルを解決する際、: を含むセッションストアチャネルエントリをスキップし、QQ c2c エージェント ID(例:c2c:10D4F7C2…)や他のスコープ付き会話 ID がバンドルプラグインの dirName 検証に到達してリコール実行がクラッシュするのを防ぎます。このガードはすでに明示的な channelId パラメータに対して適用されています (#76704);これをストア由来チャネルにも拡張します。(#77396) @hclsys 氏に感謝。
- シークレット/外部チャネル契約:シークレット契約 API サイドカーの解決時に
/dist/も参照するように変更しました。これにより、コンパイル成果物がdist/配下に存在する npm 公開型の外部化チャネルプラグイン(例:2026.5.2 以降の @openclaw/discord)が、ランタイムスナップショットにチャネル SecretRef 契約を含めるようになります。この変更がない場合、env ベースの channels.discord.token の SecretRefs は、2026.5.3 でゲートウェイ起動時に解決に失敗し、#76449 が汎用外部契約ローダーを実装したにもかかわらずチャネルが設定されないという状態が発生していました。@mogglemoss 氏に感謝します。
- Models/auth:
openclaw models auth listコマンドに--provider [プロバイダ名]および--jsonオプションを追加しました。これにより、ユーザーはシークレットを露出したり、古い「引数が多すぎる」エラーパスに遭遇したりすることなく、保存されたエージェントごとの認証プロファイルを検査できるようになりました。@vincentkoc 氏に感謝します。
- Control UI/header:ダッシュボードのパンくずリストに現在のセッションキーを追加せずにアクティブなエージェント名を表示するように変更しました。これにより、チャット以外のビューでも上部バーが混雑することなく方向性を維持できます。
- Control UI/cron:「新しいジョブ」サイドバーを折りたたみ可能にし、フォームはワンクリックでアクセスできるようにしつつ、ジョブリストのスペースを確保できるようにしました。@BunsDev 氏に感謝します。
- Gateway/startup:モデルカタログテストヘルパー、ランセッション検索コード、QR ペアリングヘルパー、TypeBox メモリツールスキーマ構築コードを、ホットスタートアップインポートパスから除外しました。これにより、デフォルトのゲートウェイベンチマークにおけるプラグイン読み込みとメモリ負荷が軽減されます。
- コントロール UI/パフォーマンス:サポートされている場合、デバッグイベントログにブラウザの長時間アニメーションフレームまたは長時間タスクのエントリを記録し、ダッシュボードのレンダリングが遅くなる原因を UI から特定しやすくします。
- Slack/ストリーミング:構造化された進行状況ラインデータに基づく Block Kit 進行状況ドラフトに対して、streaming.progress.render: "rich" を追加します。
- Slack/ストリーミング:Block Kit の制限により長い進行状況ドラフトが切り捨てられる場合でも、最新の豊富な進行状況ラインを保持します。@vincentkoc 氏に感謝します。
- チャンネル/ストリーミング:デフォルトで進行状況ドラフトのツールライン数を制限し、編集された進行状況ボックスが長い折り返し行によるジャンプする再配置を避けるようにします。
- エージェント/詳細モード:デフォルトでは /verbose および進行状況ドラフトに対してコンパクトな説明モードのツールサマリーを使用し、raw コマンド/詳細出力のデバッグには agents.defaults.toolProgressDetail: "raw" を設定し、各エージェントごとのオーバーライドを適用します。
- コントロール UI/チャット:チャットセッションピッカーにエージェントファーストのフィルターを追加し、スマートフォン・タブレット・デスクトップのあらゆる画面幅でチャットコントロールやコンポーザーが応答性を保つようにし、デスクトップのチャットコントロールは 1 行に収まるようにし、初期チャット読み込み中の重複アバター更新を回避し、転記文書をスクロールダウンする際にその行を非表示にします。@BunsDev 氏に感謝します。
- コントロール UI/チャット:連続する重複テキストメッセージを 1 つのバブルに統合してカウントを表示し、何もしないハートビートの確認応答がコンパクトに保たれるようにしつつ、近くの文脈を隠さないようにします。
- エージェント/サブエージェント:直接完了フォールバックでリクエスト元エージェントのアナウンスターンをバイパスしなければならない場合でも、グループ化された子結果すべてを保持します。@vincentkoc 氏に感謝します。
- TTS/telephony: telephony 合成プロバイダーにおいて、Honor プロバイダーの音声/モデルのオーバーライドを適用し、Google Meet エージェントの音声ログが実際に音声を生成したバックエンドと一致するようにします。@vincentkoc 氏に感謝。
- Voice Call/realtime: 調整された Twilio オーディオキューをバインドし、プロバイダー側のオーディオが WebSocket バックプレッシャーガードの背後で蓄積する前に、過負荷状態のリアルタイムストリームをクローズします。@vincentkoc 氏に感謝。
- Docs: IRC はオペレーター管理のフォワードプロキシルーティングの外側で生の TCP/TLS ソケットを使用するため、IRC エグレス(出口通信)は明示的に承認された後にのみ有効化されるべきであることを明確化しました。@jesse-merhi 氏に感謝。
- Gateway/performance: 非読み込み状態のサイドカーを準備完了シグナルの後まで遅延させ、ホットパスのチャネルプラグインバーレルインポートを回避し、Gateway 起動時に信頼されたバンドルプラグインメタデータを高速パスで処理します。
- Gateway/performance: ネイティブロード可能なプラグイン起動パスで jiti をインポートしないようにし、コンパイル済みバンドルプラグインの表面がソース変換ローダーのコストを負担しないようにします。ただし、フォールバック読み込みが実際に必要な場合を除きます。
- Gateway/diagnostics: pnpm gateway:watch において、起動フェーズのスパン、アクティブな作業ラベル、古くなったターミナルブリッジマーカー、およびデフォルトの同期 I/O トレースを追加し、ログと安定性診断から Gateway の遅延をより容易に特定できるようにします。
- Plugins/loader: ネイティブ高速パスにおいて、実際のコンパイル済みプラグインモジュール評価エラーを保持し、投げられた .js モジュールすべてをソース変換フォールバックミスとして扱わないようにしました。@vincentkoc 氏に感謝。
- QA/Mantis: pnpm openclaw qa mantis slack-desktop-smoke を追加し、Crabbox VNC デスクトップ内で Slack のライブ QA を実行し、Slack Web を開き、Slack QA 成果物 alongside でデスクトップのスクリーンショットをキャプチャできるようにしました。
- QA/Mantis: ランタイム環境を desktop-browser Crabbox および artifact-copy サブコマンドを通じて渡すように変更し、埋め込まれた Mantis コール側が親プロセスを変更せずに Crabbox 認証情報を提供できるようにしました。@vincentkoc さんありがとうございます。
- QA/Mantis: リモート Slack QA が失敗した場合でも、コピーされた Slack デスクトップのスクリーンショットパスを返すように変更し、CLI が依然として失敗時のスクリーンショット成果物を出力するようにしました。@vincentkoc さんありがとうございます。
- QA/Mantis: desktop smoke warmup から Blacksmith Testbox の tbx_... リース ID を受け付けるように変更し、provider オーバーライドが inspect/run 前に失敗しないようにしました。@vincentkoc さんありがとうございます。
- QA/Codex ハーネス: ターゲット型のライブ Docker/Testbox 診断、認証事前チェック、キャッシュマウントの修正、および app-server プロトコルのチェックアウト検出を追加し、メンテナによるハーネスの失敗をより再現しやすくしました。@vincentkoc さんありがとうございます。
- Plugins/update: 公式の外部化されたバンドル npm マイグレーションと ClawHub から npm へのフォールバックを信頼されたソースリンクインストールとして扱うように変更し、プレリリース専用の公式プラグインパッケージがバンドルビルドから移行する際に、不安全なプレリリース解決策として拒否されないようにしました。@vincentkoc さんありがとうございます。
- Plugins/update: ClawHub パッケージが利用可能になった後、早期の npm フォールバックを経た後に、ClawHub 優先の外部化されたプラグインインストールを再び ClawHub に戻すように変更しました。@vincentkoc さんありがとうございます。
- プラグインの更新:既に外部化された固定 npm および ClawHub プラグインインストールに対して、古くなったバンドルロードパスをクリーンアップします。これにより、リリースチャンネルの同期時に、削除されたバンドルパスがインストール済み外部パッケージより前に残ることを防ぎます。@vincentkoc 氏に感謝。
- Telegram:エージェントメッセージツールにおいて、プラグイン所有の数値フォーラムトピックターゲットを受け入れ、ローカルパッケージ更新中に返信ディスパッチプロバイダーチャンクを、実際の安定したランタイムエイリアス behind に保ちます。#77137 を修正しました。@richardmqq 氏に感謝。
- Google Meet:realtime.introMessage: "" を維持し、リアルタイム Chrome 接続がデフォルトの音声イントロを復元するのではなく、サイレント状態のまま継続できるようにします。@vincentkoc 氏に感謝。
- プラグイン/SDK:ワークフロープラグインがもう一度モデルパスを要求できるように、有界な before_agent_finalize リトライ指示を追加しました。@100yenadmin 氏に感謝。
- Discord/status:一時的なソケットリセットが健全に動作しているチャンネルのように見えないように、劣化した Discord トランスポートおよびゲートウェイイベントループの飢餓信号を openclaw チャンネルステータス、openclaw status --deep、およびフェッチタイムアウトログに追加しました。(#76327) @joshavant 氏に感謝。
Providers/OpenR
原文を表示
2026.5.4
Highlights
- Google Meet/Voice Call: make Twilio dial-in joins speak through the realtime Gemini voice bridge with paced audio streaming, backpressure-aware buffering, barge-in queue clearing, and no TwiML fallback during realtime speech, giving Meet participants a much snappier OpenClaw voice agent. (#77064) Thanks @scoootscooob.
Changes
- Plugins/migration: emit catalog-backed install hints when plugins.entries or plugins.allow references an official external plugin that is not installed, so upgraded configs point operators to openclaw plugins install instead of telling them to remove valid plugin config. (#77483) Thanks @hclsys.
- OpenAI/Codex media: advertise Codex audio transcription in runtime and manifest metadata and route active Codex chat models to the OpenAI transcription default instead of sending chat model ids to audio transcription. Thanks @vincentkoc.
- Dependencies: refresh runtime and provider packages including Pi 0.73.0, ACPX adapters, OpenAI, Anthropic, Slack, and TypeScript native preview, while keeping the Bedrock runtime installer override pinned below the Windows ARM Node 24 npm resolver failure.
- Agents/performance: pass the resolved workspace through BTW, compaction, embedded-run model generation, and PDF model setup so explicit agent-dir model refreshes can reuse the current workspace-scoped plugin metadata snapshot instead of falling back to cold plugin metadata scans. (#77519, #77532)
- Plugins/performance: let unscoped model catalog and manifest-contract readers reuse the current workspace-compatible plugin metadata snapshot, avoiding repeated cold plugin metadata scans on hot control-plane paths while preserving env/config/workspace compatibility checks. (#77519, #77532)
- Config/plugin auto-enable: prefer the claiming plugin manifest id over a built-in channel alias when auto-allowlisting a configured channel, so WeCom/Yuanbao-style aliases resolve to the installed plugin id. Thanks @Beandon13.
- Secrets/apply: preserve auth-profile keyRef and tokenRef fields when scrubbing provider-target secrets, so the canonical SecretRef metadata survives secrets apply without keeping plaintext values. Thanks @Beandon13.
- Plugins/active-memory: skip session-store channel entries that contain : when resolving the recall subagent's channel, so QQ c2c agent IDs (e.g. c2c:10D4F7C2…) and other scoped conversation IDs do not reach bundled-plugin dirName validation and crash the recall run. The same guard already applied to explicit channelId params (#76704); this extends it to store-derived channels. (#77396) Thanks @hclsys.
- Secrets/external channel contracts: also look in /dist/ when resolving the secret-contract-api sidecar, so npm-published externalized channel plugins (e.g. @openclaw/discord since 2026.5.2) whose compiled artifacts live under dist/ actually contribute their channel SecretRef contracts to the runtime snapshot. Without this, env-backed channels.discord.token SecretRefs silently failed to resolve at gateway start on 2026.5.3, leaving the channel not configured even though #76449 had landed the generic external-contract loader. Thanks @mogglemoss.
- Models/auth: add openclaw models auth list [--provider ] [--json] so users can inspect saved per-agent auth profiles without dumping secrets or hitting the old “too many arguments” path. Thanks @vincentkoc.
- Control UI/header: show the active agent name in dashboard breadcrumbs without adding the current session key, keeping non-chat views oriented without crowding the topbar.
- Control UI/cron: make the New Job sidebar collapsible so the jobs list can reclaim space while keeping the form one click away. Thanks @BunsDev.
- Gateway/startup: keep model-catalog test helpers, run-session lookup code, QR pairing helpers, and TypeBox memory-tool schema construction out of hot startup import paths, reducing default gateway benchmark plugin-load and memory pressure.
- Control UI/performance: record browser long animation frame or long task entries in the debug event log when supported, making slow dashboard renders easier to attribute from the UI.
- Slack/streaming: add streaming.progress.render: "rich" for Block Kit progress drafts backed by structured progress line data.
- Slack/streaming: keep the newest rich progress lines when Block Kit limits trim long progress drafts. Thanks @vincentkoc.
- Channels/streaming: cap progress-draft tool lines by default so edited progress boxes avoid jumpy reflow from long wrapped lines.
- Agents/verbose: use compact explain-mode tool summaries for /verbose and progress drafts by default, with agents.defaults.toolProgressDetail: "raw" and per-agent overrides for debugging raw command/detail output.
- Control UI/chat: add an agent-first filter to the chat session picker, keep chat controls/composer responsive across phone/tablet/desktop widths, keep desktop chat controls on one row, avoid duplicate avatar refreshes during initial chat load, and hide that row while scrolling down the transcript. Thanks @BunsDev.
- Control UI/chat: collapse consecutive duplicate text messages into one bubble with a count so no-op heartbeat acknowledgements stay compact without hiding nearby context.
- Agents/subagents: preserve every grouped child result when direct completion fallback has to bypass the requester-agent announce turn. Thanks @vincentkoc.
- TTS/telephony: honor provider voice/model overrides in telephony synthesis providers so Google Meet agent speech logs match the backend that actually produced the audio. Thanks @vincentkoc.
- Voice Call/realtime: bound the paced Twilio audio queue and close overloaded realtime streams before provider audio can pile up behind the websocket backpressure guard. Thanks @vincentkoc.
- Docs: clarify that IRC uses raw TCP/TLS sockets outside operator-managed forward proxy routing, so direct IRC egress should be explicitly approved before enabling IRC. Thanks @jesse-merhi.
- Gateway/performance: defer non-readiness sidecars until after the ready signal, avoid hot-path channel plugin barrel imports, and fast-path trusted bundled plugin metadata during Gateway startup.
- Gateway/performance: avoid importing jiti on native-loadable plugin startup paths, so compiled bundled plugin surfaces do not pay source-transform loader cost unless fallback loading is actually needed.
- Gateway/diagnostics: add startup phase spans, active work labels, stale terminal bridge markers, and default sync-I/O tracing in pnpm gateway:watch so slow Gateway turns are easier to attribute from logs and stability diagnostics.
- Plugins/loader: preserve real compiled plugin module evaluation errors on the native fast path instead of treating every thrown .js module as a source-transform fallback miss. Thanks @vincentkoc.
- QA/Mantis: add pnpm openclaw qa mantis slack-desktop-smoke to run Slack live QA inside a Crabbox VNC desktop, open Slack Web, and capture desktop screenshots beside the Slack QA artifacts.
- QA/Mantis: pass the runtime env through desktop-browser Crabbox and artifact-copy child commands, so embedded Mantis callers can provide Crabbox credentials without mutating the parent process. Thanks @vincentkoc.
- QA/Mantis: return the copied Slack desktop screenshot path even when remote Slack QA fails, so the CLI still prints the failure screenshot artifact. Thanks @vincentkoc.
- QA/Mantis: accept Blacksmith Testbox tbx_... lease ids from desktop smoke warmup, so provider overrides do not fail before inspect/run. Thanks @vincentkoc.
- QA/Codex harness: add targeted live Docker/Testbox diagnostics, auth preflight checks, cache mount fixes, and app-server protocol checkout discovery so maintainer harness failures are easier to reproduce. Thanks @vincentkoc.
- Plugins/update: treat official externalized bundled npm migrations and ClawHub-to-npm fallbacks as trusted source-linked installs, so prerelease-only official plugin packages can migrate from bundled builds without being rejected as unsafe prerelease resolutions. Thanks @vincentkoc.
- Plugins/update: move ClawHub-preferred externalized plugin installs back to ClawHub after an earlier npm fallback once the ClawHub package becomes available. Thanks @vincentkoc.
- Plugins/update: clean stale bundled load paths for already-externalized pinned npm and ClawHub plugin installs, so release-channel sync does not leave removed bundled paths ahead of the installed external package. Thanks @vincentkoc.
- Telegram: accept plugin-owned numeric forum-topic targets in the agent message tool and keep reply-dispatch provider chunks behind a real stable runtime alias during in-place package updates. Fixes #77137. Thanks @richardmqq.
- Google Meet: preserve realtime.introMessage: "" so realtime Chrome joins can stay silent instead of restoring the default spoken intro. Thanks @vincentkoc.
- Plugins/SDK: add bounded before_agent_finalize retry instructions so workflow plugins can request one more model pass. Thanks @100yenadmin.
- Discord/status: add degraded Discord transport and gateway event-loop starvation signals to openclaw channels status, openclaw status --deep, and fetch-timeout logs so intermittent socket resets do not look like a healthy running channel. (#76327) Thanks @joshavant.
Providers/OpenR
この記事をシェア
関連記事
OpenClaw Changelog2026年5月4日 18:35
OpenClaw v2026.5.3-1 のコア npm ホットフィックスリリース
OpenClaw がバージョン 2026.5.3-1 のコア npm パッケージをベータ版として公開し、環境変数アクセスや通常 API 送信がバンドル内の遠隔部分にのみ存在する場合でも、公式プラグインパッケージのインストールスキャンが誤ってブロックされないようセキュリティ機能を修正した。
OpenClaw Changelog2026年5月4日 16:21
OpenClaw のファイル転送プラグインとセキュリティ強化機能の更新(2026 年 5 月 3 日)
OpenClaw は、バイナリファイル操作を可能にするファイル転送プラグインを更新し、デフォルトでパス制限やシンボリックリンクの追跡拒否などのセキュリティ強化機能を導入した。
OpenClaw Changelog2026年5月4日 11:20
OpenClaw バージョン 2026.5.3-beta.3 のリリース
OpenClaw がバージョン 2026.5.3-beta.3 を公開し、バイナリファイル操作用のプラグインとツールを追加した。これにより、ペアリングされたノード間でファイルの取得や書き込みが可能になったが、デフォルトではパス制限やシンボリックリンクの追跡が拒否されるなどセキュリティ強化が図られている。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み