GPT-5.5システムカード
OpenAIは複雑な実世界作業に対応する新モデル「GPT-5.5」のシステムカードを公開し、自律的なツール使用・自己検証機能と厳格な安全評価プロセスを明かした。
キーポイント
高度な自律型タスク処理能力
コード作成、オンライン調査、情報分析など複雑な実世界作業に対応し、以前のモデルより早期にタスクを理解し、少ない指示で自律的に完了する。
厳格な安全評価と対策
事前展開時の安全性評価スイートと準備フレームワークを通じ、サイバーセキュリティや生物学分野のレッドチームングを実施し、誤用を減らしつつ有益な利用を維持するsafeguardsを搭載。
GPT-5.5 Proの並列テスト時計算
並列テスト時計算(parallel test time compute)を活用する「GPT-5.5 Pro」を同一基盤モデルとして扱い、一部ケースで別途評価を実施する方針を示した。
影響分析・編集コメントを表示
影響分析
本システムカードは、OpenAIが単なる性能向上だけでなく「自律的な作業完了」と「厳格な安全プロトコル」の両立を重視していることを示す。特に並列テスト時計算(TTC)の採用は、推論時の計算資源を動的に割り当てる次世代アーキテクチャの標準化を示唆し、業界全体のモデル開発・評価基準に大きな影響を与える可能性がある。
編集コメント
技術仕様よりも安全プロトコルと運用フローに重点を置いた公開文書である。実装詳細は省略されているが、TTCの採用と厳格なレッドチームングは、次世代モデル開発における「安全-by-design」の標準化を象徴する。
GPT-5.5システムカード|OpenAIGPT‑5.5は、コードの作成、オンライン調査、情報の分析、ドキュメントやスプレッドシートの作成、タスク完了のための複数ツール間の操作などを含む、複雑な実世界の作業のために設計された新しいモデルです。以前のモデルと比較して、GPT‑5.5はタスクをより早く理解し、必要な指示が少なく、ツールをより効果的に使用し、作業を確認して完了するまで処理を続けます。
本モデルは、事前展開時の一連の安全評価および準備状況フレームワーク(Preparedness Framework)にかけられ、高度なサイバーセキュリティおよび生物学の能力に関する標的型レッドチーム演習(targeted red-teaming)が含まれています。また、リリース前にほぼ200社の早期アクセスパートナーから実際のユースケースに関するフィードバックを収集しました。私たちは、GPT‑5.5をこれまでで最も強力な一連の安全対策(safeguards)とともにリリースします。これは、高度な能力の正当かつ有益な利用を維持しつつ、悪用を減らすことを目的として設計されています。
一般的に、GPT‑5.5の安全結果は、並列テスト時計算(parallel test time compute)を活用する設定を使用している同一の基盤モデルであるGPT‑5.5 Proにとっての強力な指標(proxies)として扱います。以下に注記があるように、この設定が関連するリスクや適切な安全対策の姿勢に実質的な影響を及ぼす可能性があるため、特定のケースではGPT‑5.5 Proを別途評価しています。注記がない限り、システムカードに記載の結果は、オフライン環境で実施した評価を示しています。
原文を表示
GPT-5.5 System Card | OpenAIGPT‑5.5 is a new model designed for complex, real-world work, including writing code, researching online, analyzing information, creating documents and spreadsheets, and moving across tools to get things done. Relative to earlier models, GPT‑5.5 understands the task earlier, asks for less guidance, uses tools more effectively, checks it work and keeps going until it’s done.
We subjected the model to our full suite of predeployment safety evaluations and our Preparedness Framework, including targeted red-teaming for advanced cybersecurity and biology capabilities, and collected feedback on real use cases from nearly 200 early-access partners before release. We are releasing GPT‑5.5 with our strongest set of safeguards to date, designed to reduce misuse while preserving legitimate, beneficial uses of advanced capabilities.
We generally treat GPT‑5.5’s safety results as strong proxies for GPT‑5.5 Pro, which is the same underlying model using a setting that makes use of parallel test time compute. As noted below, we separately evaluate GPT‑5.5 Pro in certain cases because we judge that the setting could materially impact the relevant risks or appropriate safeguards posture. Except where noted, the results in system cards describe evaluations we ran in an offline setting.
関連記事
GPT-5.5はベンチマークで最高スコアを記録するも頻繁に幻覚が発生し、API利用料は20%値上げ
OpenAIのGPT-5.5はベンチマークで首位を記録するも、頻繁に幻覚(誤回答)が発生し、API利用料は前モデル比20%以上値上げされている。
OpenAIの新「Trusted Access」プログラムにより、Microsoftはサイバー防御向けに最も強力なモデルを利用可能に
OpenAIは新プログラム「Trusted Access」を通じて、Microsoftに自社最上位のAIモデルをサイバー防御用に提供し、AI脅威への対策を強化する。
NVIDIA Nemotron 3 Ultra が Amazon SageMaker JumpStart で利用可能に
AWS は、推論速度を5倍向上させ、コストを最大30%削減する「NVIDIA Nemotron 3 Ultra」モデルを、Amazon SageMaker JumpStart でワンクリックデプロイ可能にしたと発表した。