要点
OpenClawプロジェクトがOpenAIプロバイダーに画像生成・参照画像編集機能をCodex OAuth経由で追加し、OPENAI_API_KEY不要でgpt-image-2を利用可能にした。
2026.4.23
変更点
- Providers/OpenAI: Codex OAuth を通じて画像生成および参照画像編集を追加し、OPENAI_API_KEY なしで openai/gpt-image-2 が動作するようになりました。Fixes #70703。
- Providers/OpenRouter: image_generate を通じて画像生成および参照画像編集を追加し、OPENROUTER_API_KEY で OpenRouter の画像モデルが動作するようになりました。Fixes #55066 (via #67668)。@notamicrodose さん、ありがとうございます。
- 画像生成: エージェントがプロバイダーがサポートする品質や出力形式のヒントをリクエストできるようにし、image_generate ツールを通じて OpenAI 固有の背景、モデレーション、圧縮、ユーザーヒントを渡すようにしました。(#70503) @ottodeng さん、ありがとうございます。
- エージェント/サブエージェント: ネイティブな sessions_spawn 実行に対してオプションのフォークされたコンテキストを追加し、エージェントが必要に応じて子リクエスト者のトランスクリプトを継承できるようにしつつ、デフォルトではクリーンで分離されたセッションを維持します。これにはプロンプトのガイダンス、コンテキストエンジンフックメタデータ、ドキュメント、QA カバレッジが含まれます。
- エージェント/ツール: 画像、動画、音楽、TTS 生成ツールに対してオプションの呼び出しごとの timeoutMs サポートを追加し、エージェントが特定の生成処理にのみプロバイダーの要求タイムアウトを延長できるようにしました。
- Memory/local embeddings: 4096 のデフォルト値を持つ memorySearch.local.contextSize を追加し、メモリホストをパッチすることなく、制約のあるホスト向けにローカル埋め込みコンテキストを調整できるようにしました。(#70544) @aalekh-sarvam さん、ありがとうございます。
- 依存関係/Pi:バンドルされたPiパッケージを0.70.0に更新し、OpenAIおよびOpenAI Codexに対してPiのアップストリームgpt-5.5カタログメタデータを使用し、ローカルのgpt-5.5-proの前方互換性処理のみを保持します。
- Codexハネス:埋め込みハネスの選択決定に対する構造化デバッグログを追加し、/statusをシンプルに保ちつつ、ゲートウェイのログが自動選択およびPiフォールバックの理由を説明できるようにします。(#70760) @100yenadminさんありがとう。
修正
- Codexハネス:ネイティブのrequest_user_inputプロンプトを元のチャットに戻し、キューイングされたフォローアップ回答を保持し、新しいapp-serverコマンド承認の修正決定を尊重します。
- Codexハネス/コンテキストエンジン:ログ出力前にコンテキストエンジンのアセンブリ失敗をマスク(赤文字化)し、フォールバック警告が生のエラーオブジェクトをシリアライズしないようにします。(#70809) @jalehmanさんありがとう。
- WhatsApp/オンボーディング:初回実行セットアップの読み込みをBaileysランタイム依存関係パスから除外し、パッケージ化されたQuickStartインストールでランタイム依存関係がステージされる前にWhatsAppセットアップを表示できるようにします。#70932を修正。
- ブロックストリーミング:部分的なブロック配信中止後、既に送信されたテキストチャンクが最終返信を完全にカバーしている場合、最終的に組み立てられたテキストを抑制し、関連しない短いメッセージをドロップせずに重複返信を防ぎます。#70921を修正。
- Codexハネス/Windows:ネイティブapp-serverを開始する前に、npmインストールされたcodex.cmdシャムをPATHEXTを通じて解決し、手動の.exeシャムなしでcodex/*モデルが動作するようにします。#70913を修正。
- Slack/groups: MPIM グループの DM をグループチャットコンテキストとして分類し、Slack の非 DM 領域での冗長なツール/計画の進捗表示を抑制することで、内部の「作業中…」というトレースがルーム内に漏れ出すのを防ぎます。Fixes #70912。
- Agents/replay: OpenAI/Codex のトランスクリプト再生において、欠落したツール結果を合成するのを停止しつつ、Anthropic、Gemini、Bedrock のトランスポート所有セッションにおける合成修復は維持します。(#61556) @VictorJeon 氏および @vincentkoc 氏に感謝。
- Telegram/media replies: 最終返信パスにおいて、リモート Markdown 画像構文をアウトバウンドメディアペイロードに解析し、モデルやツールが MEDIA: トークンではなく
... を出力した際に Telegram グループチャットがプレーンテキストの画像 URL にフォールバックするのを防ぎます。(#66191) @apezam 氏および @vincentkoc 氏に感謝。
- Agents/WebChat: 埋め込みランナーから、課金、認証、レート制限エラーなどの再試行不可能なプロバイダー障害を表面化し、surface_error をログに記録して webchat にレンダリングされたエラーを残さない代わりに表示します。Fixes #70124。(#70848) @truffle-dev 氏に感謝。
- WhatsApp: ダイレクト送信と自動返信の両方で、アウトバウンドメディアの正規化を統一します。@mcaxtr 氏に感謝。
- Memory/CLI: memory-core マニフェスト内に組み込みのローカル埋め込みプロバイダーを宣言することで、スタンドアロンの openclaw memory status、index、search がゲートウェイランタイムと同様にローカル埋め込みを解決できるようにします。Fixes #70836。(#70873) @mattznojassist 氏に感謝。
- Gateway/WebChat: テキストのみのプライマリモデルに対して画像添付ファイルを保持するため、破棄するのではなくメディア参照としてオフロードし、設定された画像ツールが元のファイルを検査できるようにしました。Fixes #68513, #44276, #51656, #70212。
- Plugins/Google Meet: 委譲されたTwilio通話を退出時に切断し、起動失敗時にChromeのリアルタイムオーディオブリッジをクリーンアップし、フラットなプロバイダー安全なツールスキーマを使用します。
- Media understanding: 有効なチャットモデルがテキストのみの場合、MiniMax VLなどのプロバイダー画像デフォルトを含め、agents.defaults.imageModel、tools.media.image.models、ネイティブビジョンのスキップ前に明示的な画像モデル設定を尊重します。Fixes #47614, #63722, #69171。
- Codex/media understanding: openai-codex/*をOpenAI Codex OAuthルートに保持しつつ、bounded Codex app-server image turnsを通じてcodex/*画像モデルをサポートし、生成されたプロトコル契約に対してapp-serverのレスポンスを検証します。Fixes #70201。
- Providers/OpenAI Codex: Codexカタログの発見でopenai-codex/gpt-5.5 OAuthモデル行が省略された場合、これを合成し、アカウントが認証されている状態でcronおよびsubagentの実行がUnknown modelで失敗しないようにします。
- Models/Codex: チャットまたはCLIコマンドからモデルを追加する際にCodexプロバイダーメタデータを保持し、手動で追加されたCodexモデルが正しい認証およびルーティング動作を維持するようにします。(#70820) Thanks @Takhoffman。
- Providers/OpenAI: openai-codex プロファイルがアクティブな場合、まず OPENAI_API_KEY をプローブするのではなく、設定された Codex OAuth 経由で openai/gpt-image-2 をルーティングします。
- Providers/OpenAI: 画像生成の認証ルーティングと Codex OAuth のレスポンス解析を強化し、フォールバックが公開された OpenAI API ルートおよび制限付きの SSE (Server-Sent Events) 結果にのみ適用されるようにしました。@Takhoffman さん、ありがとうございます。
- OpenAI/画像生成: 参照画像の編集を JSON データ URL の代わりに保護されたマルチパートアップロードとして送信し、複雑な複数参照 gpt-image-2 編集を復元しました。#70642 を修正します。@dashhuang さん、ありがとうございます。
- Providers/OpenRouter: 画像理解プロンプトを画像パートの前にユーザーテキストとして送信し、OpenRouter マルチモーダルモデルの空でないビジョンレスポンスを復元しました。#70410 を修正します。