Agents SDKの次の進化
OpenAIは、開発者がファイルやツールを横断する安全で長時間実行可能なエージェントを構築するのを支援するため、ネイティブサンドボックス実行とモデルネイティブハーネスを備えたAgents SDKをアップデートした。
キーポイント
ネイティブサンドボックス実行の導入
エージェントの実行環境を隔離し、セキュリティを強化するサンドボックス機能がネイティブで実装された。
モデルネイティブハーネスの提供
AIモデルとツールやファイルシステムとの連携を効率化する新しいフレームワークが導入された。
長時間実行エージェントの構築支援
開発者が持続的に動作する複雑なエージェントをより容易に構築できるよう設計されている。
ファイルとツールの横断的統合
複数のファイルや外部ツールにアクセスしながら動作するエージェントの開発を可能にする。
影響分析・編集コメントを表示
影響分析
このアップデートは、AIエージェント開発の実用化を加速させる重要な進展であり、特にエンタープライズ向けの信頼性の高い自律システム構築の障壁を下げる。開発者コミュニティにおけるエージェントベースのアプリケーション開発がさらに活発化することが期待される。
編集コメント
OpenAIの開発者エコシステム強化に向けた具体的な一歩で、実用的なAIエージェント構築のハードルが下がりそう。
私たちは、開発者が簡単に始められ、OpenAIモデルのために正しく構築された標準化されたインフラストラクチャを提供する、Agents SDK(新しいウィンドウで開く)の新しい機能を紹介しています。これには、エージェントがコンピュータ上のファイルやツールを横断して作業できるモデルネイティブのハーンネスと、その作業を安全に実行するためのネイティブなサンドボックス実行が含まれます。例えば、開発者はエージェントに制御された作業領域、明確な指示、そして証拠を検証するために必要なツールを与えることができます。
有用なエージェントを構築するには、最高のモデルだけでなく、ファイルの検査、コマンドの実行、コードの記述、そして多くのステップにわたって作業を継続する方法をサポートするシステムが必要です。現在存在するシステムは、チームがプロトタイプから本番環境へ移行するにつれてトレードオフを伴います。モデル非依存のフレームワークは柔軟ですが、最先端モデルの機能を完全に活用しません。モデルプロバイダーのSDKはモデルに近い場合もありますが、ハーンネスへの可視性が不十分なことが多いです。また、管理されたエージェントAPIはデプロイメントを簡素化できますが、エージェントの実行場所や機密データへのアクセス方法を制限します。
私たちと一緒に新しいSDKをテストした一部の顧客からのコメントをご紹介します:
今回のリリースにより、ドキュメント、ファイル、システムと連携するエージェントにとってAgents SDKのハーンネスはより強力になりました。現在、構成可能なメモリ、サンドボックス対応のオーケストレーション、Codexライクなファイルシステムツール、そして最先端エージェントシステムで一般的になりつつあるプリミティブとの標準化された統合を備えています。
ハーンネスは、実行をモデルが最も高いパフォーマンスを発揮する方法と一致させることで、開発者が最先端モデルの能力をより引き出すのを支援します。これにより、エージェントはモデルの自然な動作パターンに近づき、特に長時間実行されるタスクや多様なツールとシステムにわたって調整された作業において、複雑なタスクに対する信頼性とパフォーマンスが向上します。
さらに、私たちは各製品は独自であり、きめ細かく定義された枠組みに収まらないことを理解しています。Agents SDKはこの多様性をサポートするように設計されています。開発者は、ツール使用、メモリ、サンドボックス環境を含む独自のスタックへの適応が容易な、ターンキーでありながら柔軟なハーンネスを取得します。更新されたAgents SDKはサンドボックス実行をネイティブにサポートしており、エージェントはタスクに必要なファイル、ツール、依存関係を持つ制御されたコンピュータ環境で実行できます。
有用なエージェントの多くは、ファイルの読み書き、依存関係のインストール、コードの実行、ツールの安全な使用ができる作業領域を必要とします。ネイティブサンドボックスサポートは、開発者がそれらを自分で組み立てることを強いるのではなく、実行レイヤーを最初から提供します。
開発者は独自のサンドボックスを持ってくるか、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercelの組み込みサポートを使用できます。
これらの環境をプロバイダー間でポータブルにするため、SDKはエージェントの作業領域を記述するためのManifest抽象化も導入しています。開発者はローカルファイルをマウントし、出力ディレクトリを定義し、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2などのストレージプロバイダーからデータを持ってくることができます。
これにより、開発者はローカルプロトタイプから本番デプロイメントに至るまで、エージェントの環境を形成する一貫した方法を得ます。また、モデルには予測可能な作業領域が提供されます:入力をどこで見つけるか、出力をどこに書くか、そして長時間実行されるタスク全体で作業をどのように整理するかです。
エージェントシステムは、プロンプトインジェクションや情報漏洩の試行を想定して設計されるべきです。ハーンネスとコンピューティングを分離することで、モデル生成コードが実行される環境から資格情報を隔離できます。
また、これは耐久性のある実行を可能にします。エージェントの状態が外部化されている場合、サンドボックスコンテナの喪失は実行の喪失を意味しません。ビルトインのスナップショットとリハイドレーションにより、Agents SDKは元の環境が失敗または期限切れになった場合、新しいコンテナでエージェントの状態を復元し、最後のチェックポイントから継続できます。最後に、これによりエージェントのスケーラビリティが向上します。エージェントの実行は1つのサンドボックスまたは複数のサンドボックスを使用でき、必要な場合にのみサンドボックスを呼び出し、サブエージェントを隔離された環境にルーティングし、コンテナ間で作業を並列化して高速実行を実現できます。
これらの新しいAgents SDKの機能は、トークンとツール使用に基づいた標準API価格で、すべての顧客にAPI経由で一般提供されています。
Agents SDKの開発を続ける中で、カスタムインフラストラクチャを最小限に抑えながら、より強力なエージェントを本番環境に導入しやすくすることを目的として、開発者が構築できる範囲を広げ続けていきます。同時に、エージェントを独自の環境に適合させるために必要な柔軟性と制御権を維持します。
新しいハーンネスとサンドボックスの機能はまずPythonでリリースされ、TypeScriptのサポートは今後のリリースで予定されています。また、コードモードやサブエージェントなどの追加のエージェント機能も、PythonとTypeScriptの両方に提供できるよう取り組んでいます。
さらに、私たちは時間とともにより広範なエージェントエコシステムを統合することを目的としており、より多くのサンドボックスプロバイダーのサポート、より多くの統合、そして開発者がすでに使用しているツールやシステムにSDKを接続するためのより多くの方法を提供していきます。
原文を表示
We’re introducing new capabilities to the Agents SDK(opens in a new window) that give developers standardized infrastructure that is easy to get started with and is built correctly for OpenAI models: a model-native harness that lets agents work across files and tools on a computer, plus native sandbox execution for running that work safely.For example, developers can give an agent a controlled workspace, explicit instructions, and the tools it needs to inspect evidence:Developers need more than the best models to build useful agents—they need systems that support how agents inspect files, run commands, write code, and keep working across many steps. The systems that exist today come with tradeoffs as teams move from prototypes to production. Model-agnostic frameworks are flexible but do not fully utilize frontier models capabilities ; model-provider SDKs can be closer to the model but often lack enough visibility into the harness; and managed agent APIs can simplify deployment but constrain where agents run and how they access sensitive data.Here’s what some of the customers who tested the new SDK with us had to say:With today’s release, the Agents SDK harness becomes more capable for agents that work with documents, files, and systems. It now has configurable memory, sandbox-aware orchestration, Codex-like filesystem tools, and standardized integrations with primitives that are becoming common in frontier agent systems.The harness also helps developers unlock more of a frontier model’s capability by aligning execution with the way those models perform best. That keeps agents closer to the model’s natural operating pattern, improving reliability and performance on complex tasks—particularly when work is long-running or coordinated across a diverse set of tools and systems.In addition, we realize each product is unique and rarely fits neatly into a mold. We designed Agents SDK to support this diversity. Developers get a harness that’s turnkey yet flexible—making it easy to adapt it to their own stack—including tool use, memory, and sandbox environment. The updated Agents SDK supports sandbox execution natively, so agents can run in controlled computer environments with the files, tools, and dependencies they need for a task.Many useful agents need a workspace where they can read and write files, install dependencies, run code, and use tools safely. Native sandbox support gives developers that execution layer out of the box, instead of forcing them to piece it together themselves.Developers can bring their own sandbox or use built-in support for Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, and Vercel.To make those environments portable across providers, the SDK also introduces a Manifest abstraction for describing the agent’s workspace. Developers can mount local files, define output directories, and bring in data from storage providers including AWS S3, Google Cloud Storage, Azure Blob Storage, and Cloudflare R2.This gives developers a consistent way to shape the agent’s environment from local prototype to production deployment. It also gives the model a predictable workspace: where to find inputs, where to write outputs, and how to keep work organized across a long-running task.Agent systems should be designed assuming prompt-injection and exfiltration attempts. Separating harness and compute helps keep credentials out of environments where model-generated code executes.It also enables durable execution. When the agent’s state is externalized, losing a sandbox container does not mean losing the run. With built-in snapshotting and rehydration, the Agents SDK can restore the agent’s state in a fresh container and continue from the last checkpoint if the original environment fails or expires. Finally, it makes agents more scalable. Agent runs can use one sandbox or many, invoke sandboxes only when needed, route subagents to isolated environments, and parallelize work across containers for faster execution.These new Agents SDK capabilities are generally available to all customers via the API and use standard API pricing, based on tokens and tool use.As we continue to develop the Agents SDK, we’ll keep expanding what developers can build with it, making it easier to bring more capable agents into production with less custom infrastructure, while preserving the flexibility and control developers need to fit agents into their own environments.The new harness and sandbox capabilities are launching first in Python, with TypeScript support planned for a future release. We’re also working to bring additional agent capabilities, including code mode and subagents, to both Python and TypeScript.In addition, we want to help bring the broader agent ecosystem together over time, with support for more sandbox providers, more integrations, and more ways for developers to plug the SDK into the tools and systems they already use.
関連記事
教育におけるChatGPTの有用性を主張した研究が撤回される
Springer Nature は、OpenAI の ChatGPT が学習成果にプラスの影響を与えると主張した研究について、分析上の不整合と結論への信頼性欠如を理由に撤回を発表しました。この論文は出版後約1年で数百件の引用を集め、SNS でも話題となりましたが、著者による注目すべき主張には問題があったことが判明しました。
Nature が ChatGPT の教育効果に関する論文を撤回
学術誌 Nature は、AI が学生の学習成績や思考力にプラスの影響を与えると主張したメタ分析論文を撤回しました。この論文は 5 月に発表され、ChatGPT の教育的利点を示す根拠として引用されていましたが、調査の結果問題が発覚し取り下げられました。
OpenAI、Codex にアニメーションペットと設定ファイル自動インポート機能を追加
OpenAI は開発ツール「Codex」を更新し、画面にオーバーレイ表示されるアニメーションペット機能や、他コードエージェントからの設定ファイル自動インポート、音声入力精度向上のための辞書機能を追加した。これによりデスクトップアプリとしての利便性と魅力が強化された。