Codex 公式チームによる共有:Codex を最大限に活用する方法
Codex の公式チームが、同ツールを最大限に活用するための具体的な方法やベストプラクティスについて共有している。
Codex 公式チームからの共有:Codex を最大限に活用する方法
著者:jason (@jxnlco)**
原文:Getting the most out of Codex
多くの開発者がコード編集 AI エージェント (AI Agent) に初めて触れる際、通常は「コードを書く」という一つのタスクしか任せないものです。例えば、コードベースのチェック、差分比較 (diff) の生成、テストの実行、そしてマージリクエスト (pull request) の提出などです。
確かに、コード作成こそが Codex の中核的な強みです。しかし、よく考えてみると、私たちがコンピュータ上で行う仕事の大部分は、本質的にコードと密接に関連しています:ターミナルコマンドの実行、ウェブページの閲覧、アプリケーションプログラミングインターフェース (API) の呼び出し、ドキュメントのエクスポート、各種イベントへの対応、あるいは自動化プロセスのトリガーなどです。Codex がこれらの領域へと拡張され始めると、それはもはや狭義の「コーディングアシスタント」という枠を超え、あらゆるコンピュータ作業をこなす「万能な労働者」へと進化を遂げたように感じられます。
Codex の新機能 は、この変革を現実のものにします。現在の会話スレッド (thread) は、文脈の記憶保持、各種ツールの呼び出し、生成されたファイル (artifacts) の表示が可能であり、異なるプロンプト間でもシームレスにつながります。これにより、毎回会話を終えるたびに「最初からやり直す」必要がなくなります。
Codex の潜在能力を最大限に引き出すには、以下の戦略を組み合わせて活用する必要があります:
- 長期的な記憶を保持できる「永続的な会話スレッド (durable threads)」
- ユーザーが全体を掌握している際に、柔軟に音声入力、タスクの介入 (steering)、およびタスクキューイング (queuing) を活用する
- ブラウザ、コンピュータ操作 (computer-use)、モデルコンテキストプロトコルサーバー (MCP servers, AI がローカルデータやツールに安全に接続するための汎用標準)、および各種コネクタを活用し、Codex の手をコードベースの外へ広げる
- ユーザーが離席している間に、会話スレッドの自動化 (thread automations) と目標指向型機能 (Goals) を活用して作業を継続させる
- サイドパネル (side panel) を使いこなして、生成されたコード、ドキュメント、スライド、その他のファイルを随時レビューする
永続的な会話スレッド (Durable threads)
永続的な会話スレット:Codex の対話フローで長時間実行可能であり、複数回の利用を通じて作業の文脈を常に保持し続けるものです。
これらの永続的な対話を「ピン留め (Pinned threads)」することで、いつでも呼び出せるようにするのが効果的です。これは、繰り返し進める必要があるワークフローにおいて特に強力なツールとなります。例えば:
- 日常の雑務を処理する専属の「チーフ・オブ・スタッフ」用スレッド
- 製品リリースを担当する専用スレッド
- ドキュメントレビューを担当するスレッド
- 外部データを監視する専用スレッド
これらは、会話が終われば消えてしまう一時的なチャットボックスではありません。永続的な作業スペースなのです。時が経っても Codex はこれらの対話に戻ることができ、以前行った決定や個人の好み、現在の進行状況などを記憶しています。この機能がなければ、毎回ゼロから背景情報を再入力する必要が生じます。
ピン留めのショートカット機能により、この操作は極めて実用的なものとなります。Command-1 から Command-9 を押すだけで、保存された専用スレッドに瞬時に戻り、作業を継続できます。
音声入力 (Voice input)
音声入力が優れている理由は、考えを文字として推敲して入力する前に、脳内の最も原始的で粗いアイデアを捉えてくれる点にあります。
Codex には標準で音声入力機能が搭載されています。これは、「口では説明できるが、タイピングは面倒だ」と感じる曖昧なアイデアに対して特に有効です。例えば:
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
「Ben という人が Slack でこの件について言っていたのを覚えています。
詳細は忘れました。
あなたが見つけてきてください。」
自分で検索し、文脈を収集して報告してくれる AI エージェントにとって、これらの数行の言葉だけで十分です。
頭の中に漠然としたアイデアはあるが、まだ完全に形になっていない段階で、それに向かって 2〜3 分間「独り言」のように話しかけ、思考をすべて吐き出すだけでも、驚くほど効果的です。
音声入力の変換も同じ理屈です。手直しされていない会議議事録や、口述された計画草案は、簡潔な要約よりも価値があることが多いのです。なぜなら、那些粗い記録には、あなたの迷う声のトーン、強調したいポイント、そしてまだ語り尽くされていないひらめきが保存されているからです。
任務の介入とキューイング (Steering and queuing)
音声入力を入力し、実行中のタスクに対する直接制御を組み合わせることで、その真価が発揮されます。
タスクが実行されている最中に、もしも
任務の介入 (Steering):現在のタスクが完了する前に中断し、Codex に新しい方向性を指示すること。
AI が逸脱してしまったことに気づき、壁にぶつかる前に修正したい場合、この機能が役立ちます。例えば、ウェブサイトのレビューを依頼している際、サイドバーで指差しながら直接口頭で作業を中断させることができます:
- 「これをもう少し小さくして」
- 「これらの 2 つの要素間の間隔がおかしい気がする」
- 「この文章に誤りがある」
任務キューイング (Queuing):Codex が現在のステップを完了した後に、次の作業を割り当てること。
任務キューイングは少し異なります。進行中のタスクを中断するのではなく、新しいタスクを順番待ちの列に追加します。以下のように指示できます:
「この仕事を終えたら、プレビューリンクを Slack に送信して審査者に確認してもらって。」
簡単に言えば、「介入」は Codex が現在行っていることを変更することであり、「キューイング」は次に実行すべきことをスケジュールすることです。これらの機能により、タスク実行中も常に「人間と機械が一体となった」コントロール感を維持できます。
ツールと到達範囲 (Tools and reach)
対話フローに連続的な記憶機能が備わった後、次の課題は「どこまで届くか」という点です。Codex の触角は段階的に外側へ広がっていきます:
- $browser:サイドバーで動作するアプリ内ブラウザ。Codex はここでウェブページをレビューし、直接マークアップできます。
- @chrome:ブラウザのログイン状態を取得し、Chrome に依存したワークフローを処理します。
- @computer:デスクトップのグラフィカルユーザーインターフェース (GUI) を通じてのみ完了できるタスクに特化しています。
$browser はサイドバーでのウェブページレビューに適しており、@chrome はアカウントのログイン状態が必要なブラウザ内作業に適し、@computer はパソコンのデスクトップ上でマウス操作を繰り返す必要があるタスクを処理するために使われます。
MCP サーバーと各種コネクタは、この能力をさらにあなたの全ワークフローに拡張します。Slack 統合や、さまざまな MCP ツールコネクタ、そして MCP ガイド が重要視されるのは、多くの重要なタスクがコード化する以前に、単なるチャットメッセージや受信トレイのメール、あるいはスケジュール上の問題として始まるからです。
スキル (Skills) 機能により、反復的なワークフローを再利用可能になります。一度そのワークフローの有効性が証明されれば、それを スキルとして固定 できます。これにより、Codex は次回からそのプロセスを最初から学習し直すことなく、直接実行できるようになります。
随时随地工作 (Work from anywhere)
随时随地与 Codex 协同工作 的理念,彻底打破了我们“必须坐在电脑前才能干活”的传统限制。一个任务可以在你装满文件、权限和本地环境的 Mac 电脑上启动,然后当你离开工位用手机查看时,它依然在默默推进。
这在很多碎片时间里非常有用。你可以让 Codex 在电脑上跑一个耗时很长的任务,然后自己离开工位去喝杯咖啡。如果在外面时它有问题问你,你可以直接用手机回复、批准它的下一步行动,或者在回座位前就给它指派新的方向。你的本地环境安安静静地待在那里干活,而你的人却可以自由移动。
自动化 (Automations)
自动化功能 能让 Codex 按照你设定的时间表自动干活。如果是需要每天从零开始的任务,比如生成日报或者例行检查代码库,那就用“定时自动化 (scheduled automation)”。但如果需要在一个带有历史记忆的对话中继续推进工作,那就用“对话流自动化 (thread automation)”。
对话流自动化:就像一种定时唤醒的“心跳”机制,它会按照设定的时间表,定期回到同一个 Codex 对话流中继续工作。
把对话流置顶固然好用,但它毕竟还得等你主动回去找它。而“对话流自动化”则可以每隔几分钟或几小时自己去查岗,一直跑到满足某个条件为止,甚至还能根据情况自己调整查岗的频率。
比如,你的“幕僚长”对话流可以每 30 分钟跑一次:
每 30 分钟,去查一下我的 Slack 和 Gmail 里有没有需要处理但还没回的消息。
帮我排个优先级。
如果有人向我提问,尽可能深入地去查资料,然后帮我起草一份回复,但不要直接发送。
当你回到电脑前时,那些最耗时耗力的“收集背景资料”的工作往往已经做完了。作为人类,你只需要做最后拍板发出去的决定。
对话流自动化也非常适合用来处理“反馈循环”。它可以默默盯着你在代码合并请求、Google 文档或是 Slack 里的评论,趁你不在的时候自动推进后续的修改工作。
想象一个制作动画的场景:审核人在 Slack 里发了一个视频。对话流自动化可以定时检查讨论进度,一旦有修改意见进来,它就自动渲染一版新的,然后在原贴里艾特审核人并回复新视频。如果某个软件的集成接口没法自动完成最终的上传,它甚至能调动“电脑桌面自动化”通过图形界面把最后一步走完。
这个完整的闭环跨越了接收反馈的 Slack、负责渲染的代码库,以及负责最终上传的桌面自动化工具。
目标设定 (Goals)
当一个任务有一个清晰的终点线,并且 AI 智能体可以不断朝着那个终点努力时,目标 (Goals) 的威力就彻底爆发了。
目标:运行时间更长的 Codex 任务,有一个明确的终点线,AI 会在一段时间内持续向它冲刺。
一个糟糕的目标**是这样定的:
**
把这个 Markdown 文件里的计划实现一下。
一个优秀的目标**必须有一个可以被衡量的成功标准。
比如,一位工程师想把一个内部工具从 Python 语言迁移到 Rust 语言,他可以建好新目录,设定好目标,并画一条明确的终点线:
直到所有单元测试全部通过,这个新版本的开发才算完成。
目標設定とは、実質的に「継続的な実行」と「検証器 (verifier)」を結びつけることです。人間であるあなたが、望む結果、停止の条件、そして Codex がゴールに近づいているかどうかを判断するシグナルを定義します。
優れた検証器には以下のようなものがあります:
- 完全なテストケースのセット
- ベンチマーク性能テスト
- 安定して再現可能なバグ
- 検証マトリックス
- 常に実行されるべきエンドツーエンドのワークフロー
野心を持つことは確かに重要ですが、検証メカニズムを伴わない野心は、単なる願望に過ぎません。
側面パネル (The side panel)
側面パネル機能 を使うと、生成された成果物をチャットウィンドウと並べて常に表示できます。ファイルをエクスポートして、異なるソフトウェア間で苦しみながら切り替える必要はもうありません。その場で直接レビューが可能です。生成される成果物はコードである場合もあれば、スライド、PDF ファイル、ウェブページ、表計算、あるいはその他あらゆる生成物である場合もあります。
この機能は特に以下の 4 つの作業に優れています:
- 生成されたファイル (artifacts) の確認
- 修正が必要な箇所のマーキング
- ウェブインターフェースの操作
- コードやファイルの変更点のレビュー
側面パネルを使えば、ユーザーは Markdown ドキュメント、表計算、データテーブル、一般的なドキュメント、スライドをその場で直接表示できます。既存のワークフローを中断することなく、直接チェックし、マーキングを行い、ファイルを修正できます。

スライドや PDF は、チャットウィンドウの隣にすっきりと表示され、いつでも検閲や修正が可能です。

アプリ内ブラウザ により、Codex はレンダリングされたウェブページを直接確認し、操作し、さらにその上でユーザーが行ったマーキングに直接応答することが可能になります。ウェブページやファイルに対するコメントはすべてこのワークフローの閉じたループ内に留まり、以前のように個別の引き継ぎタスクに分割して扱う必要はありません。
ウェブページは出力結果であると同時に、操作可能なコントロールパネルにもなります。Codex はページを作成し、側面パネルでそれを開き、自らチェックし、バグを修正し、その場で同じものを継続的に反復・最適化できます。

以下のようなシナリオでは、側面パネルとの組み合わせが特に効果的です:
- 軽量な静的表示用に単一の index.html ファイルを使用する
- Storybook を実行してユーザーインターフェース (UI) コンポーネントをレビューする
- Remotion Studio を使用してコード生成によるアニメーションを作成する
- ブラウザで再生されるスライドプレゼンテーション
- データ分析フロー用のデータアプリ (data apps)
単なる index.html ファイル一つで、サーバー構築なしでも楽しめるインタラクティブな小アプリに変身します。さらに、会話フローの自動化により、これらの静的ファイルは時間とともに静かに更新されていくため、戻ってきた時には常に最新の進捗が待っています。
共有メモリ (Shared memory)
長時間実行される対話フローが単一のチャットの枠を超えて記憶を共有できるようになると、その役割は飛躍的に向上します。
共有メモリ (Shared memory):単一の会話外に保存された永続的なコンテキストであり、これにより将来の作業は明確で追跡可能な情報に基づいて継続して進められます。
より確実な方法としては、これらの永続的な対話フローを「Obsidian 知識ベース (vault)」に「アンカー(固定)」することです。つまり、純粋なテキストファイルを格納するフォルダを作成するだけです。これはシンプルで直感的であり、いつでも確認・修正・移動が可能で、長期間の保存も可能です。チームはこのフォルダを、Git、Dropbox、Google Drive、あるいは他の同期ツールなど、好きなクラウドストレージに配置することができます。
あなたの知識ベースは以下のような構造になるかもしれません:
vault/
├── TODO.md
├── people/
├── projects/
├── agent/
└── notes/
最外層のディレクトリには、AGENTS.md ファイルを配置できます。ここでは Codex に対してルールを設定します:人員、プロジェクト、意思決定、およびタスクに関する新しい情報を把握した際、この知識ベースをどのように更新すべきかを定義するのです。
特定の知識ベース構造を硬直してそのままコピーする必要はありません。あなたが行うべきは、AI エージェントに「教える」ことです。永続的なコンテキスト(文脈)はどこに置くのか、どのコンテキストを保持すべきなのか、そしていつファイルを変更しないようにすべきなのかを明確にするのです。
実用的な AGENTS.md ガイドには、以下のように記述できます:
- ~/vault をあなたの長期の作業記憶領域として扱うこと。
- 笔记(ノート)は整理整頓し、断片的な記録が散らからないようにすること。
- タスク、人員、プロジェクト、日々のサマリー、ドラフトを正確に分類して保存すること。
- 決定事項、行き詰まり、責任者、日付、有用なリンクなどを適切に保存すること。
- 実質的な新進展がない限り、知識ベース内のファイルを安易に変更しないこと。
コードリポジトリはコードを格納する場所です。一方、この知識ベースは、継続的に更新されるコンテキスト(文脈)を格納するためのものです:誰が関与しているか、何が変更されたか、どこでつまずいているか、次に誰が引き継ぐのか、そして 2 回のチャットセッションの間に途切れると完全に消失してしまうような詳細情報などです。
重要なコンテキストは、単に一度きりのチャットの文字記録の中に閉じ込めておくべきではありません。それらを記述し、次の対話フローがすぐに引き継げる場所に配置してください。
Codex 自体も、「設定 > パーソナライズ > メモリ」において公式の メモリ機能 を提供しています。これらはシステム標準のローカルメモ帳のようなもので、あなたの個人的な好みや頻繁に使用するワークフロー、そしてよくある失敗パターンを記憶するために使われます。ただし、この機能はあなたが明確に記述したコンテキスト(文脈)を補助するものであり、それを代替するものではありません。Chronicle メモリコンポーネント も同様の考え方に基づいており、Codex があなたの最近の画面で起こった出来事から記憶を抽出・構築するのを支援します。
コードから外側へ (From code outward)
Codex はもともとコード作成を本業としていますが、現在ではコードに付随する多くの周辺業務も、この同一システム内で完結できるようになりました:MCP サーバー、ウェブインターフェース、デスクトップ制御、対話フローの自動化、あるいはサイドバーで直接レビューできるファイルなどです。
これは、私たちが Codex を制御する方法を根本的に変えました。「タスク介入」によって動作を途中から中断でき、「タスクキューイング(待機列)」によって次のステップを適切に手配できます。「対話フローの自動化」により、あなたが不在でもシステムが稼働し続けます。また「目標設定」によって明確なゴールラインを描き、Codex がどこに向かって突き進むべきかを理解させます。
現在の Codex は、完全なワークフローを担うことができます:指示の聴取からタスクの実行、そして最終的なファイルレビューまで。これらの業務がすでにコードリポジトリの範囲を超えていても、Codex は依然として余裕を持ってこなすことができるのです。
原文を表示
来自 Codex 官方团队的分享:如何把 Codex 用到极致
作者:jason (@jxnlco)**
原文:Getting the most out of Codex
大多数开发者刚接触代码编辑类的 AI 智能体 (AI Agent) 时,通常只让它们干一件事:写代码。比如让它检查一下代码库,生成个差异对比 (diff),跑跑测试,然后再提个合并请求 (pull request)。
写代码确实依然是 Codex 的核心强项。但仔细想想,我们在电脑上做的大部分工作,本质上其实都和代码息息相关:执行终端命令、浏览网页、调用应用程序接口、导出文档、响应各种事件,或者是触发自动化流程。当 Codex 开始延伸到这些领域时,它给人的感觉就不再只是一个狭义上的“编程助手”了,而是进化成了一个能帮你搞定各种电脑工作的“全能打工人”。
Codex 的新特性 让这种转变变得触手可及。现在的对话流 (thread) 可以记住你们的上下文、调用各种工具、展示生成的文件 (artifacts),还能在不同的提示词之间无缝衔接,再也不用每次聊完都“重新认识”一遍了。
想要彻底榨干 Codex 的潜能,你需要把下面这些绝招组合起来用:
- 能够长期保存记忆的“持久对话流 (durable threads)”
- 在你掌控全局时,灵活使用语音输入、任务干预 (steering) 和任务排队 (queuing)
- 借助浏览器、电脑操控 (computer-use)、模型上下文协议服务器 (MCP servers, 一种让 AI 安全连接本地数据和工具的通用标准) 以及各类连接器,让 Codex 的手伸向代码库之外的地方
- 当你离开电脑时,利用对话流自动化 (thread automations) 和目标驱动 (Goals) 让它继续搬砖
- 熟练使用侧边栏 (side panel),随时审查它生成的代码、文档、幻灯片和其他文件
持久对话流 (Durable threads)
持久对话流:可以长时间运行的 Codex 对话流,能在你多次使用的过程中,始终为你保留工作上下文。
把对话流“置顶 (Pinned threads)”是让这些持久对话随叫随到的好办法。这对于那些需要反复推进的工作流来说简直是神器,比如:
- 一个专属的“幕僚长”对话流(帮你处理日常杂务)
- 一个专门负责产品发布的对话流
- 一个负责审查文档的对话流
- 一个专门盯着外部数据的监控对话流
它们不是那种聊完即焚的闲聊框,而是持久的工作空间。随着时间的推移,Codex 可以随时回到这些对话中,它会记得你之前做过的决定、你的个人偏好以及当前的进度。如果没有这个功能,你每次都得从零开始把这些背景信息重新喂给它。
置顶快捷键让这个操作变得极为实用。只要按下 Command-1 到 Command-9,你就能瞬间穿越回这些保存好的专属对话流里继续工作。
语音输入 (Voice input)
语音输入之所以好用,是因为它能在你把想法字斟句酌地敲成文字之前,先把你脑子里最原始、最粗糙的念头捕捉下来。
Codex 内置了语音输入功能。这对于那些“嘴上说得清,打字嫌麻烦”的模糊想法特别管用。比如:
“我记得有个叫 Ben 的人在 Slack 上提过这事儿。
细节我忘了。
你去帮我找找看。”
对于一个会自己搜索、收集上下文并向你汇报的 AI 智能体来说,这几句话就足够它干活了。
当你脑子里有一个大概的想法,但还没完全成型时,花两三分钟对着它“碎碎念”,把思绪一股脑倒出来,效果也出奇的好。
录音转写也是同样的道理。一份未经修饰的会议记录,或者一段口述的计划草案,往往比一份简短的总结更有价值。因为那些粗糙的记录里,保留了你犹豫的语气、强调的重点,以及那些还没讲完的灵光一现。
任务干预与排队 (Steering and queuing)
当你把语音输入和对运行中任务的直接控制结合起来时,它的威力才真正显现出来。
当一个任务正在执行时,如果你想
任务干预 (Steering):在当前任务还没完成时,中途打断 Codex 并给它指引新的方向。
当你发现 AI 跑偏了,需要在它撞南墙之前纠正它时,这个功能就派上用场了。比如,在让它审查网站时,你可以一边在侧边栏上指指点点,一边直接开口打断它的工作:
- “把这个调小一点”
- “这两个元素之间的间距看着不太对劲”
- “这句文案写错了”
任务排队 (Queuing):在 Codex 完成当前步骤后,给它安排接下来的活儿。
任务排队就不太一样了。它不会打断正在进行的任务,而是把新任务排在队伍后面。你可以这么跟它说:
“等这活儿干完之后,把预览链接发到 Slack 给审核人看看。”
简单来说,“干预”是改变 Codex 眼下正在做的事,而“排队”是安排它接下来要做的事。这两个功能都能让你在任务执行的过程中,始终保持一种“人机合一”的掌控感。
工具与触达范围 (Tools and reach)
当一个对话流有了连续的记忆后,下一个问题就是:它能触碰到什么?Codex 的触角可以向外一层层延伸:
- $browser 在侧边栏中运行的应用内浏览器,Codex 可以在这里审查网页并在上面做标记。
- @chrome 可以获取你浏览器的登录状态,用来处理那些基于 Chrome 的工作流。
- @computer 专治那些只能通过桌面图形界面 (GUI) 来完成的任务。
$browser 适合在侧边栏做网页审查;@chrome 适合那些需要你账号登录状态的浏览器内工作;而 @computer 则用来搞定那些只能在电脑桌面上点来点去的任务。
MCP 服务器和各类连接器把这种能力进一步延伸到了你的整个工作流中。Slack 集成、以及各种 MCP 工具连接器 和 MCP 指南 之所以重要,是因为很多关键任务在变成代码之前,最初往往只是一条聊天消息、一封收件箱里的邮件,或者一个日程安排问题。
技能 (Skills) 让那些重复的工作流可以被反复利用。一旦某个工作流被证明好用,你可以将它固化为技能,这样 Codex 下次就能直接跑通,而不需要从头开始重新学习这个流程。
随时随地工作 (Work from anywhere)
随时随地与 Codex 协同工作 的理念,彻底打破了我们“必须坐在电脑前才能干活”的传统限制。一个任务可以在你装满文件、权限和本地环境的 Mac 电脑上启动,然后当你离开工位用手机查看时,它依然在默默推进。
这在很多碎片时间里非常有用。你可以让 Codex 在电脑上跑一个耗时很长的任务,然后自己离开工位去喝杯咖啡。如果在外面时它有问题问你,你可以直接用手机回复、批准它的下一步行动,或者在回座位前就给它指派新的方向。你的本地环境安安静静地待在那里干活,而你的人却可以自由移动。
自动化 (Automations)
自动化功能 能让 Codex 按照你设定的时间表自动干活。如果是需要每天从零开始的任务,比如生成日报或者例行检查代码库,那就用“定时自动化 (scheduled automation)”。但如果需要在一个带有历史记忆的对话中继续推进工作,那就用“对话流自动化 (thread automation)”。
对话流自动化:就像一种定时唤醒的“心跳”机制,它会按照设定的时间表,定期回到同一个 Codex 对话流中继续工作。
把对话流置顶固然好用,但它毕竟还得等你主动回去找它。而“对话流自动化”则可以每隔几分钟或几小时自己去查岗,一直跑到满足某个条件为止,甚至还能根据情况自己调整查岗的频率。
比如,你的“幕僚长”对话流可以每 30 分钟跑一次:
每 30 分钟,去查一下我的 Slack 和 Gmail 里有没有需要处理但还没回的消息。
帮我排个优先级。
如果有人向我提问,尽可能深入地去查资料,然后帮我起草一份回复,但不要直接发送。
当你回到电脑前时,那些最耗时耗力的“收集背景资料”的工作往往已经做完了。作为人类,你只需要做最后拍板发出去的决定。
对话流自动化也非常适合用来处理“反馈循环”。它可以默默盯着你在代码合并请求、Google 文档或是 Slack 里的评论,趁你不在的时候自动推进后续的修改工作。
想象一个制作动画的场景:审核人在 Slack 里发了一个视频。对话流自动化可以定时检查讨论进度,一旦有修改意见进来,它就自动渲染一版新的,然后在原贴里艾特审核人并回复新视频。如果某个软件的集成接口没法自动完成最终的上传,它甚至能调动“电脑桌面自动化”通过图形界面把最后一步走完。
这个完整的闭环跨越了接收反馈的 Slack、负责渲染的代码库,以及负责最终上传的桌面自动化工具。
目标设定 (Goals)
当一个任务有一个清晰的终点线,并且 AI 智能体可以不断朝着那个终点努力时,目标 (Goals) 的威力就彻底爆发了。
目标:运行时间更长的 Codex 任务,有一个明确的终点线,AI 会在一段时间内持续向它冲刺。
一个糟糕的目标**是这样定的:
把这个 Markdown 文件里的计划实现一下。
一个优秀的目标必须有一个可以被衡量的成功标准。
比如,一位工程师想把一个内部工具从 Python 语言迁移到 Rust 语言,他可以建好新目录,设定好目标,并画一条明确的终点线:
直到所有单元测试全部通过,这个新版本的开发才算完成。
目标设定,其实就是把“持续执行”和“验证器 (verifier)”结合在了一起。你作为人类来定义想要的结果、何时停止的条件,以及用来判断 Codex 有没有离终点更近的信号。
好用的验证器包括:
- 一套完整的测试用例
- 一项基准性能测试
- 一个能稳定复现的 Bug
- 一个验证矩阵
- 一个必须始终跑通的端到端工作流
有野心固然重要,但没有验证机制的野心,就只是在许愿而已。
侧边栏 (The side panel)
侧边栏功能 让你生成的工作成果始终和你们的聊天窗口并排在一起。你再也不用把文件导出来,然后痛苦地在不同软件之间切来切去了,直接在原位就能审查。生成的成果可能是代码,但也可能是幻灯片、PDF 文件、网页、表格,或者任何其他生成的东西。
它特别擅长处理四种工作:
- 检查生成文件 (artifacts)
- 标注需要修改的地方
- 操作网页界面
- 审查代码或文件的变更
侧边栏允许用户直接原地查看 Markdown 文档、电子表格、数据表、普通文档和幻灯片。你可以不打断现有的工作流,直接检查、做标记、修改文件。

你的幻灯片或 PDF 就乖乖敞开在对话框旁边,随时等你检阅和修改。

应用内浏览器 让 Codex 能够直接检查渲染好的网页,控制它,甚至直接响应你在网页上做的标注。对网页或文件的评论全部留在这个工作闭环里,再也不用像以前那样把它拆分成一个个单独的交接任务了。
网页既变成了它的输出结果,也变成了你可以操控的控制面板。Codex 可以建好一个页面,在侧边栏打开它,自己检查它,修 Bug,然后原地不断迭代优化同一个东西。

下面这些场景配合侧边栏尤其好用:
- 用单个 index.html 来做轻量级的静态展示
- 跑 Storybook 来审查用户界面 (UI) 组件
- 用 Remotion Studio 搞代码生成的动画
- 在浏览器里放映的幻灯片演示
- 用于数据分析流的数据应用 (data apps)
一个简简单单的 index.html 文件就能变成一个好玩的交互式小应用,连服务器都不用搭。而且,对话流自动化还能随着时间推移悄悄更新这些静态文件,这样等你回来时,总能看到最新的进展等着你。
共享记忆 (Shared memory)
当那些长时间运行的对话流能够打破单次聊天的界限,把记忆共享出去时,它们的作用将发生质的飞跃。
共享记忆 (Shared memory):存储在单一对话之外的持久上下文,它可以让未来的工作能够基于一些明确的、可追溯的信息继续推进。
一个相对稳妥的做法是,把这些持久的对话流“锚定”在一个 Obsidian 知识库 (vault) 里。说白了,就是建一个存放纯文本文件的文件夹。它简单直白,方便你随时查看、修改、移动,而且能保存很久。团队可以把这个文件夹放在任何你们喜欢的云盘里,比如 Git、Dropbox、Google Drive 或是其他的同步工具中。
你的知识库可能长这样:
vault/
├── TODO.md
├── people/
├── projects/
├── agent/
└── notes/
在最外层目录下,你可以放一个 AGENTS.md 文件。在这里,你可以给 Codex 定规矩:当它了解到关于人员、项目、决策以及待办事项的新情况时,应该如何更新这个知识库。
别死板地照抄某一种知识库结构。你需要做的是“教”你的 AI 智能体:那些持久的上下文该放在哪,哪些上下文需要保留,以及什么时候不要瞎折腾去改文件。
一份实用的 AGENTS.md 指南里可以这么写:
- 把 ~/vault 当作你长期的工作记忆区。
- 尽量把笔记整理得有条理,别搞得到处都是碎片记录。
- 准确地把待办事项、人员、项目、每日总结和草稿分类放好。
- 把做过的决定、遇到的卡点、负责人、日期和有用的链接好好保存下来。
- 如果没有什么实质性的新进展,不要随意修改知识库里的文件。
代码库是用来存代码的。而这个知识库,是用来存不断滚动的上下文的:牵涉到哪些人、改了什么、卡在哪里、接下来谁跟进,以及那些如果在两次聊天中间断掉就会彻底消失的细节。
重要的上下文绝不应该仅仅锁死在某一次聊天的文字记录里。把它们写下来,放在下一个对话流能够立刻接手的地方。
Codex 自己也在 设置 > 个性化 > 记忆 中提供官方的 记忆功能。它们就像是系统自带的本地记事本,用来记住你的个人偏好、常用的工作流以及一些经常踩的坑。不过,这个功能是用来辅助你清晰写下来的上下文的,而不是取代它。Chronicle 记忆组件 也是同样的思路,它能帮 Codex 从你最近屏幕上发生的事情中提取并构建记忆。
从代码向外延伸 (From code outward)
Codex 虽然还是以写代码为本行起家,但现在,围绕代码的诸多周边工作,都能在这个同一套系统里搞定了:无论是 MCP 服务器、网页界面、电脑桌面控制、对话流自动化,还是那些可以在侧边栏直接审查的文件。
这彻底改变了我们控制它的方式。“任务干预”可以在中途打断它的动作;“任务排队”可以帮它安排好下一步;“对话流自动化”能让你人不在场时系统依然运转;而“目标设定”则给它画了一条清晰的终点线,让 Codex 知道要一直往哪里冲。
如今的 Codex 已经可以扛起一个完整的工作流:从听取指令、执行任务,一直到最终文件的审查。哪怕这些工作早已经超出了代码库的范畴,它也依然游刃有余。
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み