オープンソースメンテナを支援する「Daybreak」イニシアチブの開始
OpenAI は、オープンソースプロジェクトの維持者を支援する新イニシアチブ「Patch the Planet」を開始し、持続可能な開発エコシステムの構築を推進している。
キーポイント
新イニシアチブの発足
OpenAI が「Daybreak initiative」として位置づけた「Patch the Planet」プログラムを発表し、オープンソースメンテナへの支援を開始した。
メンテナ支援の目的
多くの重要なオープンソースプロジェクトを支えるメンテナの負担を軽減し、技術生態系の持続可能性を確保することを主目的としている。
業界への波及効果
大手 AI 企業がインフラ基盤となるオープンソース開発者を直接支援する動きは、業界全体のガバナンスと開発環境の改善に寄与する。
影響分析・編集コメントを表示
影響分析
このニュースは、AI 業界におけるオープンソース依存度の高さと、それを支える人的リソースの不足という構造的課題への対応を示しています。大手企業が資金やリソースを投入してメンテナを支える動きは、開発環境の安定化とイノベーションの加速に寄与する一方で、企業によるコミュニティへの影響力拡大という新たな側面も生み出します。
編集コメント
オープンソースの維持者が直面する燃え尽き症候群やリソース不足への対応は、業界全体が長年懸念していた課題です。大手企業が具体的な支援策を打ち出したことは、技術エコシステムの健全化に向けた重要な一歩と言えます。
私たちは、世界が依存する重要なオープンソースソフトウェアを維持者たちが強化できるよう支援するための「Patch the Planet」を発表します。これは、Trail of Bits と共同で構築した Daybreak の取り組みです。当社の最もサイバー対応能力に優れたモデルを活用した AI 支援型セキュリティ調査と、専門家の人的レビューを組み合わせることで、脆弱性の特定だけでなく、パッチの作成も支援します。
AI は脆弱性の発見を加速させていますが、発見だけではユーザーを守れません。多くの維持者たちは、限られた時間とリソースの中で、より多くの報告書をより迅速に処理するよう求められています。「Patch the Planet」は、その負担を増やすのではなく軽減するために設計されています。セキュリティエンジニアが報告内容を維持者に届ける前にレビューし、プロジェクトと協力してパッチやテストを開発し、最初の修正が適用された後もチームが継続的にセキュリティを改善できるよう、再利用可能なワークフローを構築します。
さらに、HackerOne と Calif とも連携し、脆弱性のトリアージ、調整済み開示、および追加の重点的な脆弱性発見活動を通じて、取り組みをさらに推進していきます。
Patch the Planet の仕組み
Patch the Planet の各エンゲージメントは、メンテナとの相談から始まります。各協力において、セキュリティエンジニアはメンテナと連携し、各プロジェクトのニーズや優先事項、追加のセキュリティ努力が最も有益となる領域(脆弱性の検証、パッチ開発、CI/CD の改善、あるいは長期的なセキュリティエンジニアリングなど)を理解します。合意形成後、研究者は潜在的な脆弱性を調査し、意味のある問題を検証し、パッチの開発または改良を行い、テストを支援し、プロジェクトの確立されたチャネルを通じて開示を調整します。
初期参加者には、cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go プロジェクト、freenginx、Python、および python.org が含まれます。これらのプロジェクトは、広く使用されているネットワーク、暗号化、ソフトウェアサプライチェーン、言語インフラストラクチャを支えており、より強固なセキュリティは広範な下流製品やサービスに恩恵をもたらします。追加のプロジェクトは今後のラウンドに参加する予定です。
セキュリティ研究者は、最先端モデルおよび Codex Security(新しいウィンドウで開く) を活用して、分析、パッチ開発、テスト、ドキュメント作成を支援します。参加プロジェクトには ChatGPT Pro へのアクセス権、条件付きでの Codex Security へのアクセス権、およびコアオープンソース開発、メンテナの自動化、リリースワークフローのための API クレジットが付与されます。Trail of Bits は、このサポートを活用してプロジェクトが実行できる、重複排除、トリアージ、パッチ適用のための AI 支援ワークフローを開発しています。
開発者からの初期フィールドノートと発見事項
Trail of Bits は、Codex および GPT‑5.5‑Cyber と 19 のオープンソースプロジェクトにおいてフルタイムで連携するセキュリティエンジニアを専任しており、すでに数百件のセキュリティ課題を特定し、数十の修正パッチをマージ済みです。さらに多くの課題については、調整された開示プロセスが進行中です。
初期のスプリントでは、再利用可能なセキュリティインフラストラクチャも生み出されました。これには、ファジング(fuzzing)ハーンチス、歴史的 CVE 分析パイプライン、差分テストシステム、脅威モデル、拡張されたテストスイート、重複排除・偽陽性フィルタリング・深刻度修正・パッチ生成のためのワークフローが含まれます。プロジェクト固有の詳細については、テスト、対策、調整された開示の進展に応じて後日共有されます。いくつかの初期事例から、チームが構築し発見した内容の一部をご紹介します。
1 日未満で構築されたファジングラボ。 Trail of Bits のエンジニアは、GPT‑5.5‑Cyber と組み合わせて Codex の /goal コマンドを反復実行することで、数十のエントリーポイント、バリエーションビルド、プラットフォーム、新規テストシードをカバーする完全なファジングラボを構築しました。エンジニアが目標を設定しプロンプトを洗練させることで、システムはカバレッジフィードバックを活用して新たな表面領域へ展開を続け、ターゲットの境界ケースを特定し、弱体または無効な候補をフィルタリングします。
Trail of Bits のエンジニアたちは、限られたガイダンスのもとで GPT‑5.5‑Cyber が、カバレッジをどこに拡大するか、どのビルドやエントリーポイントをプローブすべきか、またどの候補が追求する価値がないほど脆弱であるかを判断する上で有用な選択を行ったことを発見しました。このセットアップの完了には 1 日未満しかかかりませんでした。Trail of Bits の推計では、同様のラボを手動で構築するには通常少なくとも数週間を要するとされています。
既知の脆弱性のバリアントを検出するための再利用可能なパイプライン。 チームは、歴史的な CVE を取り込み、関連する脆弱性パターンを抽出し、対象となるコードベース内で関連する欠陥を検索し、候補となる発見結果を専門的な判定エージェントに送るエンドツーエンドシステムを構築しました。このパイプラインは結果の重複排除を行い、偽陽性の可能性が高いものをフィルタリングし、最も強力な証拠をセキュリティエンジニアへ転送して手動確認を行います。
これにより、何年にもわたる公的な脆弱性履歴が、プロジェクト全体に適用可能な反復可能な検索戦略へと変換されます。Trail of Bits は、この種のバリアント分析においてモデルが特に効果的であることを発見し、レビュー対象のコードベース全体で多くの追加問題が発見されました。
数週間や数ヶ月ではなく数日で実行する差分テスト。 同じプロトコルの異なる実装は、通常同じ入力条件下では同じように動作すべきです。それらが分岐する場合、いずれかにバグが含まれている可能性があります。この考え方を大規模に適用するのは通常困難であり、各実装を共通のテストハッチ(test harness)に接続するカスタムシムおよびグルーコードをエンジニアが記述しなければならないためです。
Codex はそのコードを生成し反復処理することで、複数の実装同士を相互にファジング(不特定入力によるテスト)し、それらの振る舞いの違いを検証することを可能にしました。このワークフローは多くの弱体または無効な結果をフィルタリングし、専門家のレビュー対象となる比較的高いシグナルを持つ候補セットを生成しました。チームはこの成果を数日以内に達成し、従来であれば数週間から数ヶ月を要する作業を圧縮しました。Trail of Bits は、プロジェクト固有の詳細を公開する前に、これらのテストの拡大と精緻化を継続しています。
ソフトウェアが仕様で約束する振る舞いに対してテストを行うこと。 チームは Codex を用いて、プロジェクト仕様や RFC に基づいた脅威モデル、攻撃分類体系、不変条件テスト、プロパティベーステストを開発しました。これらの手法により、意図された動作と実際の動作の間に顕著な差異が明らかになると同時に、より広範なテストカバレッジ、強化されたドキュメント、CI/CD およびソフトウェアサプライチェーンツールへの改善をもたらすことができました。
セキュリティエンジニアは、すべての発見事項がメンテナに到達する前にレビューを行いました。 Trail of Bits のエンジニアは、セキュリティ問題がメンテナに提出される前に手動ですべてをレビューし、このステップの付加価値は過小評価できません。最先端 AI モデルは脆弱性の特定と修正において非常に能力が高い一方で、すでにメンテナが直面している圧倒的なバックログに拍車をかける大量の偽陽性も生成します。「Patch the Planet」はこの課題に対し、専任の Trail of Bits 研究者が証拠を再現し、プロジェクト固有のドキュメントや脅威モデルに基づいて発見事項を検証し、重複を除去し、重大度を再評価して修正が必要な確認済み脆弱性の優先順位をつけることで解決しています。また、メンテナの好みに従ってパッチを開発・提出します。メンテナは、どのパッチを展開するか、および開示をどのように処理するかについて引き続きコントロール権を保持します。
OpenAI Daybreak がすでに発見しているオープンソースの課題
「Patch the Planet」は、最先端モデルが広く使用されているソフトウェアにおける深刻な脆弱性の特定、検証、修正を防御側が支援できることを示す、より広範な Daybreak 研究の成果に基づいています。
ここではいくつかの初期のハイライトを紹介していますが、開示が進行中の exploit の仕組みやプロジェクト固有の詳細については非公開としています。修正が適用され、調整された開示が完了次第、個別の発見事項、研究方法、検証ワークフロー、他の防御側が応用できる教訓を詳しく解説する技術レポートを公開する予定です。
私たちの調査結果はソフトウェアスタックのすべての層にわたっており、まだ開示プロセス中のものも多数あります。
オペレーティングシステム
- Linux カーネル:GPT‑5.5‑Cyber は 3,000 万行を超えるコードの中からセキュリティ関連のコンポーネントを特定し、潜在的なセキュリティ課題にフラグを立てた上で動的に検証を行いました。その結果、カーネルポインタ情報漏洩に関する証明概念(PoC)8 件とローカル特権昇格エクスプロイト 24 件が生成されました。数百件の課題が同定されましたが、これは自動生成された PoC を持つものに限られたサブセットです。
- OpenBSD:当社のモデルは、OpenBSD のカーネル実装における System V セマフォの 23 年前にさかのぼる use-after-free(新しいウィンドウで開く)脆弱性を特定しました。OpenAI の研究者が同課題を再現し、特権を持たないローカルユーザーが root への特権昇格を可能にする可能性があることを確認しました。
- FreeBSD:カリフォルニアのセキュリティ研究者は Codex を使用して、FreeBSD におけるいくつかの LPE(新しいウィンドウで開く)脆弱性を特定・検証し、証明概念エクスプロイトを作成しました。より広範な FreeBSD キャンペーンにおいて、OpenAI の研究者は 34 件の脆弱性を確認し、7 件のローカル特権昇格 PoC を作成しました。
ネットワーク
- dnsmasq: Codex Security は、2.92rel2 で後に修正された 6 つの dnsmasq CVE のうち 4 つに対応する脆弱なパターンを独立して特定しました。これらは CVE-2026-4890(新しいウィンドウで開く)、CVE-2026-4891(新しいウィンドウで開く)、CVE-2026-4892(新しいウィンドウで開く)、および CVE-2026-5172(新しいウィンドウで開く)です。
- HTTP/2 Bomb: Calif は Codex を使用して、NGINX、Apache、IIS、Pingora など主要な HTTP/2 実装に影響を与えるサービス不能攻撃手法「HTTP/2 Bomb」(新しいウィンドウで開く)を特定しました。Calif の分析によると、880,000 サイトを超えるインターネット公開ウェブサイトが、HTTP/2 を有効にした影響を受けるサーバーソフトウェアを実行していました。
Browsers
- Chrome: OpenAI の研究者らは、Chrome の V8 JavaScript エンジン(V8 JavaScript engine)において 5 つの悪用可能な脆弱性を発見し報告しました。そのうち 3 つは導入から数日以内に特定され修正されました。
- Safari: WebKit への集中的な取り組みを約 1 週間行った結果、10 を超える悪用可能な Safari の脆弱性が発見・報告されました。
- Firefox: OpenAI Preparedness は、GPT‑5.5 を使用して WebAssembly 脆弱性(CVE-2026-8390(新しいウィンドウで開く))を特定しました。これは Pwn2Own Berlin の開催前日である 2 日前に Mozilla によって修正されたものであり、その結果、登録された Firefox エントリーの 5 つが撤退しました。競技会において Firefox を悪用する攻撃は成功しませんでした。
オープンソースソフトウェアは共有インフラです。それを保護することは、共有された作業であるべきです。AI は脆弱性の発見のペースを変化させており、現在の課題は、その恩恵を最も必要としているメンテナとユーザーに確実に届けることです。
Patch the Planet は、メンテナのために完全な防御ループを提供するように設計されています:発見、検証、深刻度レビュー、開示、パッチ開発、テスト、およびデプロイです。最先端のモデルは、このループの一部を高速化できますが、目的は共有インフラを担当する人々に、より優れたツールとより大きなキャパシティを与えつつ、変更がどのように適用されるかについての彼らの自律性を維持することにあります。
今回の最初のスプリントでは、メンテナ、セキュリティエンジニア、AI 支援ワークフロー間の持続的な協力がもたらす成果を示しています:即座の修正、強化されたプロジェクトインフラ、そして時間とともにオープンソースソフトウェアを改善し続けることができる再利用可能なセキュリティ作業です。
これは始まりに過ぎません。より多くの修正が適用され、調整された開示が完了するにつれて、特定の発見結果、それらを検出・検証するために使用された手法、そして誰もが依存するソフトウェアを保護するために守り手が適応できるワークフローについて、より詳細な技術レポートを公開する予定です。メンテナである場合は、Patch the Planet への参加を こちら から申請できます。
原文を表示
We are introducing Patch the Planet, a Daybreak initiative built with Trail of Bits to help maintainers strengthen the critical open-source software the world relies on. We’re pairing AI-assisted security research using our most cyber-capable models with expert human review to not only identify vulnerabilities, but help patch them.
AI is accelerating vulnerability discovery, but discovery alone does not protect users. Many maintainers are already being asked to sort through more reports, more quickly, with the same limited time and resources. Patch the Planet is built to reduce that burden, not add to it: security engineers review findings before they reach maintainers, work with projects to develop patches and tests, and build reusable workflows that help teams continue improving security after the first fixes land.
Additionally, we will be partnering with HackerOne and Calif who are helping us take our efforts further with vulnerability triage, coordinated disclosure, and additional focused vulnerability discovery efforts.
How Patch the Planet works
Each engagement under Patch the Planet begins in consultation with the maintainer. For each collaboration, security engineers work with maintainers to understand each project’s needs, preferences, and where additional security effort would be most useful: vulnerability validation, patch development, CI/CD improvements, or longer-term security engineering. Once aligned, researchers investigate potential vulnerabilities, validate meaningful issues, develop or refine patches, support testing, and coordinate disclosure through the project's established channels.
Initial participants include cURL, NATS Server, pyca/cryptography, Sigstore, aiohttp, the Go project, freenginx, Python, and python.org. These projects support widely used networking, cryptography, software supply chain, and language infrastructure, where stronger security can benefit a broad range of downstream products and services. Additional projects will join in future rounds.
Security researchers are equipped with our frontier models as well as Codex Security(opens in a new window) to support the analysis, patch development, testing, and documentation. Participating projects receive access to ChatGPT Pro; conditional access to Codex Security; and API credits for core open-source development, maintainer automation, and release workflows. Trail of Bits has developed AI-assisted workflows for deduplication, triage, and patching that projects can run with this support.
Early field notes and findings from developers
Trail of Bits has dedicated security engineers to work full-time with Codex and GPT‑5.5‑Cyber across 19 open-source projects, and has already identified hundreds of security issues and merged dozens of patches, with many more still undergoing coordinated disclosure.
The initial sprint also produced reusable security infrastructure: fuzzing harnesses, historical-CVE analysis pipelines, differential-testing systems, threat models, expanded test suites, and workflows for deduplication, false-positive filtering, severity correction, and patch generation. Some project-specific details will be shared later as testing, remediation, and coordinated disclosure progress. A few early examples show what the team was able to build and find:
A fuzzing lab in less than a day. Trail of Bits engineers used repeated Codex /goal runs with GPT‑5.5‑Cyber to build an entire fuzzing lab covering dozens of entry points, variant builds, platforms, and novel test seeds. Engineers set the objectives and refined the prompts; the system then used coverage feedback to keep expanding into new surfaces, target edge cases, and filter weak or invalid candidates.
Trail of Bits engineers found that, with limited guidance, GPT‑5.5‑Cyber made useful choices about where to expand coverage, which builds and entry points to probe, and which candidates were too weak to pursue. The completed setup took less than a day. Trail of Bits estimates that building the same lab manually would ordinarily take at least several weeks.
A reusable pipeline for finding variants of known vulnerabilities. The team built an end-to-end system that ingests historical CVEs, extracts relevant vulnerability patterns, searches target codebases for related flaws, and sends candidate findings through specialized judging agents. The pipeline deduplicates results, filters likely false positives, and routes the strongest evidence to security engineers for manual confirmation.
This turns years of public vulnerability history into a repeatable search strategy that can be applied across projects. Trail of Bits found the models especially effective at this kind of variant analysis, which uncovered many additional issues across the codebases under review.
Differential testing in days instead of weeks or months. Different implementations of the same protocol should usually behave the same way under the same inputs. When they diverge, one may contain a bug. Applying this idea at scale is normally difficult because engineers must write custom shim and glue code connecting each implementation to a common test harness.
Codex generated and iterated on that code, allowing multiple implementations to be fuzzed against one another and their behavioral differences investigated. The workflow filtered many weak or invalid results and produced a comparatively high-signal set of candidates for expert review. The team reached those results within days, compressing work that has historically taken weeks or months. Trail of Bits is continuing to expand and refine these tests before publishing project-specific details.
Testing software against the behavior its specifications promise. The teams used Codex to develop threat models, attack taxonomies, invariant tests, and property-based tests grounded in project specifications and RFCs. These methods exposed notable differences between intended and actual behavior while leaving projects with broader test coverage, stronger documentation, and improvements to CI/CD and software-supply-chain tooling.
Security engineers reviewed every finding before it reached a maintainer. Trail of Bits engineers manually reviewed every security issue before it was submitted to a maintainer, and the added value of this step cannot be understated. While frontier AI models are highly capable of finding vulnerabilities and patching them, they also produce a high volume of false positives that can contribute to the already overwhelming backlog maintainers are facing. Patch the Planet solves for this by having dedicated Trail of Bits researchers reproduce the evidence, check findings against project-specific documentation and threat models, remove duplicates, reassess severity, and prioritize confirmed vulnerabilities for remediation. They also develop and submit patches in accordance with maintainers preferences. Maintainers remain in control of what patches are deployed and how disclosure is handled.
What OpenAI Daybreak is already finding
Patch the Planet builds on a broader body of Daybreak work showing how frontier models can help defenders find, validate, and remediate serious vulnerabilities in widely used software.
We are sharing a few early highlights here, while withholding exploit mechanics and project-specific details where disclosure is still underway. As fixes land and coordinated disclosures conclude, we plan to publish deeper technical reports that walk through individual findings, research methods, validation workflows, and lessons other defenders can apply.
Our findings span every layer of the software stack, with many more still in the disclosure process.
Operating systems
- Linux Kernel: GPT‑5.5‑Cyber identified security-relevant components across more than 30 million lines of code, flagged potential security issues, and then validated them dynamically, generating 8 kernel pointer information leak proof-of-concepts (PoCs) and 24 local privilege escalation exploits. We note that hundreds of issues were identified, this is the subset for which PoCs were automatically generated.
- OpenBSD: Our models identified a 23-year-old use-after-free(opens in a new window) in OpenBSD’s kernel implementation of System V semaphores. OpenAI researchers reproduced the issue and confirmed that it could allow an unprivileged local user to escalate privileges to root.
- FreeBSD: Security researchers at Calif used Codex to find and validate using proof-of-concept exploits for several(opens in a new window) LPEs(opens in a new window) in FreeBSD(opens in a new window). Across a broader FreeBSD campaign, OpenAI researchers confirmed 34 vulnerabilities and produced 7 local privilege escalation PoCs.
Network
- dnsmasq: Codex Security independently identified vulnerable patterns corresponding to four of the six dnsmasq CVEs later fixed in 2.92rel2: CVE-2026-4890(opens in a new window), CVE-2026-4891(opens in a new window), CVE-2026-4892(opens in a new window), and CVE-2026-5172(opens in a new window).
- HTTP/2 Bomb: Calif used Codex to identify "HTTP/2 Bomb(opens in a new window)," a denial-of-service technique affecting major HTTP/2 implementations including NGINX, Apache, IIS and Pingora. Calif’s analysis suggested that more than 880,000 Internet-facing websites were running affected server software with HTTP/2 enabled.
Browsers
- Chrome: OpenAI researchers found and reported five exploitable vulnerabilities in Chrome’s V8 JavaScript engine, including three that were identified and remediated within days of being introduced.
- Safari: In roughly a week of focused WebKit work, over 10 exploitable Safari vulnerabilities were found and reported.
- Firefox: OpenAI Preparedness identified a WebAssembly vulnerability (CVE-2026-8390(opens in a new window)) with GPT‑5.5 during safety evaluations(opens in a new window) that Mozilla patched two days before Pwn2Own Berlin, prompting five of six registered Firefox entries to withdraw. No Firefox exploit was successfully demonstrated at the competition.
Open-source software is shared infrastructure. Securing it should be shared work. AI is changing the pace of vulnerability discovery, and the work now is to make sure the benefits reach the maintainers and users who need them most.
Patch the Planet is designed to put that full defensive loop in service of maintainers: discovery, validation, severity review, disclosure, patch development, testing, and deployment. Frontier models can make parts of that loop faster, but the aim is to give the people responsible for shared infrastructure better tools and more capacity, while preserving their agency over how changes land.
This first sprint shows what sustained collaboration among maintainers, security engineers, and AI-assisted workflows can produce: immediate fixes, stronger project infrastructure, and reusable security work that can continue improving open-source software over time.
This is just the beginning. As more fixes land and coordinated disclosures complete, we plan to publish deeper technical reports on selected findings, the methods used to discover and validate them, and the workflows defenders can adapt to help protect the software everyone depends on. If you are a maintainer, you can apply to join Patch the Planet here(opens in a new window).
関連記事
OpenAI、オープンソースのバグ発見と修正を支援する新イニシアチブを開始
OpenAI は、オープンソースソフトウェアに存在するバグを発見し、修正するための新たな取り組みを発表した。このイニシアチブは、開発コミュニティの安全性向上を目指すものである。
OpenAI、新セキュリティツールを公開し「GPT-5.5-Cyber」を更新(2 分読)
OpenAI は、更新された Codex セキュリティプラグイン、限定リリースの GPT-5.5-Cyber、および AI エラのための防御型サイバースタック「Daybreak」パートナープログラムとオープンソースイニシアチブ「Patch the Planet」を発表した。
OpenAI、Broadcom 製初の独自チップを発表
OpenAI が Broadcom と共同開発した自社初の専用チップを公開し、AI 計算能力の向上を目指す。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み