NVIDIA のエンジニアと研究者が Codex を活用して開発する様子
NVIDIA は GPT-5.5 を基盤とする独自コード生成モデル「Codex」をエンジニアリングおよび研究ワークフローの標準ツールとして採用し、自律的な開発と実験実行において劇的な効率向上を実現している。
キーポイント
GPT-5.5 ベースの高度な自律性
NVIDIA の Codex は GPT-5.5 を基盤とし、従来のモデルよりもはるかに長いセッションと高い自律性を発揮し、プロンプトに含まれていないバグや課題を自ら発見・提案する能力を持つ。
生産システム開発の劇的加速
MVP から本番環境への移行や、プライバシー制約下での社内ツールの迅速な構築(数時間)が可能となり、開発のハードルが大幅に低下している。
完全自律的な研究ワークフロー
研究課題の特定からスクリプト作成、リモートマシンでの実験実行までを自動化し、AI 研究者にとって創造的なパートナーとして機能して研究ループを加速させている。
デスクトップアプリによる自動テスト
Codex デスクトップアプリはコンピュータ操作能力を活用し、開発中のアプリケーションの音声・動画機能を自らテストする完全自律的な動作を実現した。
影響分析・編集コメントを表示
影響分析
このニュースは、大規模言語モデル(LLM)が単なる開発支援ツールから、自律的に問題を解決し複雑なシステムを構築・運用できる「AI エージェント」へと成熟したことを示す決定的な事例です。特に NVIDIA のようなハードウェアベンダーが自社の最新インフラ上でこの技術を本番環境で成功させている点は、AI 開発のパラダイムシフトと実用化の加速を象徴しています。
編集コメント
GPT-5.5 の能力向上により、AI エージェントが人間の手を介さずに複雑な開発タスクや研究プロセスを完結させる段階に達したことを示す重要な事例です。NVIDIA による実証は、次世代 AI ツールの産業応用における新たな基準を示唆しています。
NVIDIA では、エンジニアたちが複雑な工学作業やエンドツーエンドの機械学習実験の実行において、Codex をデフォルトツールとして活用しています。GPT‑5.5 を基盤に構築され、NVIDIA の GB200 および GB300 インフラ上で本番環境で稼働している Codex は、より長く自律的なセッションを処理可能であり、単なる実行を超えて、元のプロンプトには含まれていなかった問題やアイデアを浮き彫りにします。
「Codex は複雑な工学タスクにおける私たちの定番ツールです。GPT-5.5 を用いることで、他のモデルでは発見できなかったプログラム内のバグや欠落箇所を明らかにしてくれます」
—Dennis Hannusch 氏、シニアソフトウェアエンジニア
本番システムの構築とリリース
NVIDIA のコーディングエージェントチームは、社内のエンジニアたちが現実の開発ワークフローにおいて AI ツールを効果的に導入・活用できるよう支援しています。GPT‑5.5 を搭載した Codex は、複雑な工学タスクにおける彼らの定番ツールとなっています。
「私個人としては、GPT-5.5 を搭載した Codex がはるかに自律性が高く、細かな手取り足取りのサポートが不要だと実感しています」と、エージェントチームに所属するシニアソフトウェアエンジニアの Dennis Hannusch 氏は説明します。「複数回のコンパクション(圧縮)を伴う長時間のセッションでも、トップレベルの精度を維持し、文脈を適切に保ちながら作業を進められることが確認できました。また、適切なツールやスキルを戦術的に選択する点においても非常に優れています」
Hannusch 氏はすでに、Codex を活用して内部プラットフォームを MVP(最小実行可能製品)から本番運用可能なシステムへと進化させ、その過程でスケーラビリティと信頼性の向上を実現しました。これは以前のモデルでは困難であった課題です。
チームはまた、Riverside に似た内部ポッドキャスト録画アプリも構築しました。これは Codex を使用してわずか数時間で立ち上げられたものです。「プライバシーの制約を考慮すると、ソフトウェアを調達するには数週間かかったでしょう」と Hannusch は説明します。
Codex デスクトップアプリをコンピュータ操作と併用することで、システムは構築中にビデオおよびオーディオ録画機能もテストできました。「何もする必要はありませんでした。完全に自律的に構築され、テストされました」と彼は言います。「Codex は、何を構築する価値があるかという基準を根本から変えました」。
「実験の実行面だけで 10 倍の速度向上がありました。なぜなら、エンドツーエンドの機械学習研究ワークフロー全体を処理できるからです」
—Shaunak Joshi, AI リサーチャー
フルな研究ワークフローの実行
NVIDIA の研究チームにとって、Codex は主に研究ループを自動化しました。研究領域の特定から、機械学習実験のスクリプト作成、そしてリモートマシン上での実験実行までです。
「GPT‑5.5 は創造的なパートナーとして大きな可能性を開きました。特に知識労働においては」と、NVIDIA の AI リサーチャーである Shaunak Joshi は述べています。
チームは Codex を研究エージェントとして使用し、強化学習などの分野における関連論文の大規模なコーパスをモデルに指向させます。「GPT-5.5 は競合他社と比較して非常に創造的であるように思われます」とジョシ氏は述べています。「このモデルは、証拠のスニペットを全体のチェーン全体で追跡するのを助け、アイデアの知識グラフ(knowledge graph)を提案してくれました。これにより、概念がどのように結びついているかを視覚化するのに本当に役立ちました。」
仮説を特定した後、Codex は機械学習インフラストラクチャのためのスクリプトを作成し、モデルのトレーニングを行います。Codex アプリは SSH をサポートしているため、ジョシ氏はリモートホストでのログインやセットアップについて心配する必要がなくなったと発見しました。彼は自分のラップトップから簡単に大規模な機械学習ワークロードを実行できるようになりました。
「パフォーマンスがあまり高くない古いコードベースをお持ちの場合、Codex は機械翻訳において非常に優れています。そのため、多くの人が Python リポジトリを GPT-5.5 に送信し、それを Rust へ書き換えて、20 倍も効率的にしています。」
—Shaunak Joshi, AI researcher
次のステップ
Codex は、NVIDIA のエンジニアリングチームと研究チーム全体で作業を加速しており、概念から実行、テストに至るまでのアイデアを単一のワークフローで実現しています。
「私たちが取り組んでいるのは、その可能性の表面にすぎません」とハヌシュ氏は述べています。「実際にシステムを構築し、それがどこまで到達できるかを見ることを楽しみにしています。」
原文を表示
At NVIDIA, engineers are using Codex as their default tool for complex engineering work, and to run end-to-end machine learning experiments. Codex, built on GPT‑5.5 and running in production on NVIDIA GB200 and GB300 infrastructure, can handle much longer, more autonomous sessions — going beyond execution to surface issues and ideas that weren't part of the original prompt.
“Codex is our go-to tool for complex engineering tasks, and with GPT-5.5, it surfaces bugs and gaps in my program that other models weren’t able to find.”
—Dennis Hannusch, Senior Software Engineer
Building and shipping production systems
NVIDIA’s coding agents team helps engineers across the company adopt and use AI tools effectively in real-world development workflows. Codex with GPT‑5.5 has become their go-to tool for complex engineering tasks.
“I’ve personally found Codex with GPT‑5.5 to be way more autonomous, with much less handholding,” explains Dennis Hannusch, a senior software engineer on the agents team. “I’m able to go for long sessions with multiple compactions and find that it still performs with top accuracy and manages to keep the work in context. And it’s great at tactically selecting the right tools as well as the right skills.”
Hannusch has already used Codex to evolve an internal platform from an MVP into a production-ready system, improving scalability and reliability along the way, something that had proven difficult with earlier models.
The team has also built an internal podcast recording app, similar to Riverside, spun up in just hours using Codex. “Given our privacy constraints, it would have taken us weeks to procure software,” Hannusch explains.
Using the Codex desktop app with computer interaction, the system was also able to test the video and audio recording functionality as it was built. “I didn’t have to do anything—it was built and tested completely autonomously,” he says. “Codex has completely changed the threshold for what’s worth building.”
“It’s been a 10x speed improvement just in terms of running experiments, because it’s able to handle the whole end-to-end machine learning research workflow.”
—Shaunak Joshi, AI researcher
Running full research workflows
For NVIDIA’s research teams, Codex has largely automated the research loop: from identifying research areas, to writing scripts for machine learning experiments, to running the experiments on remote machines.
“GPT‑5.5 has been a massive unlock as a creative partner, especially when it comes to knowledge work,” says Shaunak Joshi, an AI researcher at NVIDIA.
The team uses Codex as a research agent, pointing the model at a large corpus of relevant papers in areas like reinforcement learning. “GPT‑5.5 seems to be much more creative compared to competitors,” Joshi says. “It helped me trace snippets of evidence throughout the entire chain, and suggested a knowledge graph of the ideas that really helped me visualize how concepts tied together.”
After identifying hypotheses, Codex writes the scripts on machine learning infrastructure to train models. The Codex app supports SSH, so Joshi has found that he no longer has to worry about log-in and setup on remote hosts; he can easily run large machine learning workloads from his laptop.
“If you have an old codebase that isn’t that performant, Codex is really good at machine translation. So a lot of folks are taking their Python repository, sending it to GPT-5.5, and it’s rewriting it into Rust and making it like 20X more efficient.”
—Shaunak Joshi, AI researcher
What’s next
Codex is accelerating work at NVIDIA across engineering and research teams, taking ideas from concept to execution and testing in a single workflow.
“We’re just scratching the surface of what it can do,” Hannusch says. “I’m really excited to keep building real systems and see how far it can go.”
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み