NVIDIA の BioNeMo エージェント・ツールキットが、創薬における AI エージェント向けに生体分子モデルを呼び出し可能なスキルへ変換
NVIDIA は、科学者向け AI エージェントが生物学的モデルを信頼して活用できるよう、BioNeMo Agent Toolkit を公開し、タスク完了率を 57.1% から 100% に向上させる実証結果を発表した。
キーポイント
AI エージェントの生物学的課題への対応
汎用コーディングエージェントは科学発見の不確実性に対応できず、NVIDIA は専門ツールを「スキル」としてパッケージ化することでこのギャップを埋める。
BioNeMo Agent Toolkit の機能と構成
タンパク質折りたたみ、ドッキング、生成化学などの機能を NIM エンドポイントやオープンモデルとして提供し、エージェントが自律的に呼び出せるように設計された。
パフォーマンスの劇的向上
スキルを活用することでタスク完了率が 57.1% から 100% に上昇し、1,000 トークンあたりの合格アサート数も平均 2 倍に増加した。
標準化されたスキル定義とワークフロー
各モデルは SKILL.md ファイルで目的や引数を文書化し、複数のモデルを連鎖させるメタスキル(例:RFdiffusion→ProteinMPNN)もサポートする。
AI エージェントのタスク完了率と効率性の劇的向上
BioNeMo スキルを活用することで、エージェントのタスク完了率が 57.1% から 100% に向上し、トークンあたりの成功ステップ数も倍増しました。
柔軟なデプロイメントと標準化されたスキル設計
ホスト型またはローカル型の NIM エンドポイントを選択可能で、モデルごとに統一された入力・出力形式を持つスキルとして実装されています。
最小限の要件とデプロイオプション
Claude や Codex などのエージェントランタイムと NVIDIA API キーがあればすぐに始められ、GPU ノードはローカル NIM デプロイのためにのみ必須です。
影響分析・編集コメントを表示
影響分析
この発表は、AI エージェントが単なるコード生成から、物理世界や複雑な科学プロセスを扱える自律的な研究パートナーへと進化するための重要なマイルストーンです。NVIDIA が提供する標準化されたスキルセットにより、製薬業界における創薬プロセスの自動化と加速が現実味を帯びており、次世代の AI 科学者(AI Scientists)の実装基盤として大きな影響を与えるでしょう。
編集コメント
汎用 AI エージェントが科学分野で実戦投入される際の最大の障壁であった「信頼性の低いツール呼び出し」を、NVIDIA が具体的な製品化と数値データで解決した点は非常に示唆に富んでいます。特にタスク完了率が 100% に達したという結果は、産業応用に向けた大きな一歩と言えます。
AI 科学者は、科学計算のための新しいインターフェースとなりつつあります。これらのエージェントは論文を読み込み、コードを記述し、仮説を生成し、API を呼び出し、ファイルを調査します。しかし、科学はソフトウェア工学とは異なります。仮説が正しいからといってテストスイートが緑色に点灯することはありません。発見プロセスは反復的であり、不確実性を伴い、物理世界に根ざしたものです。
このギャップこそが NVIDIA が狙っている対象です。NVIDIA は BioNeMo Agent Toolkit に関する実践的なウォークスルーを公開しました。その主張は明快です。生物学を対象とした汎用的なコーディングエージェントでは、新しい医薬品を生み出すことはできません。生体分子研究において、エージェントの性能上限は、信頼性・正確性・効率性を兼ね備えて使用できるツールによって決定されます。
TL;DR
BioNeMo Agent Toolkit は、NVIDIA の生体分子モデルを文書化された呼び出し可能なエージェントスキルとしてパッケージ化したものです。
スキルにはタンパク質折りたたみ、ドッキング、生成化学、ゲノミクス、およびタンパク質設計が含まれます。
NVIDIA によると、スキルを活用することでタスク完了率が 57.1% から 100% に向上しました。
エージェントは 1,000 トークンあたりのパスするアサーション数が平均で 2 倍になりました。
クイックアクセスにはホストされた NIM エンドポイントが、反復的な作業にはローカル NIM が適しています。
インタラクティブ・エクスプレイナー
(function(){
window.addEventListener("message", function(e){
if(e && e.data && e.data.bionemoHeight){
var f = document.getElementById("bionemo-demo");
if(f){ f.style.height = e.data.bionemoHeight + "px"; }
}
});
})();
BioNeMo Agent Toolkit とは何か
BioNeMo Agent Toolkit は、AI エージェント向けの「スキル」を収めたオープンソースリポジトリです。各スキルは、NVIDIA の生体分子モデルをエージェントが呼び出せるツールに変換します。このツールキットには、タンパク質フォールディング、分子ドッキング、生成化学、ゲノム解析、タンパク質設計、バイオマーカー発見の機能がパッケージ化されています。
NVIDIA はこのプラットフォームを 2 つの部分で構成しています。第 1 に加速されたツール層があります。NVIDIA NIM(NVIDIA Inference Microservices)および BioNeMo のオープンモデルが、呼び出し可能なサービスとしてコア機能を提供します。これらの機能は、構造モデル向けには cuEquivariance などのライブラリ、ゲノム解析向けには Parabricks によって加速されています。第 2 に、エージェント対応のインターフェースがあります。BioNeMo Skills は各機能をパッケージ化し、エージェントが利用可能にします。
スキルは、モデルの目的、必要な入力、オプションのパラメータ、期待される成果物、および失敗モードを文書化したものです。Model Context Protocol(MCP)サーバーラッパーは、まだ NIM としてパッケージ化されていないオープンモデルを公開します。これにより、エージェントが自律的に生体分子モデルを発見し、選択し、呼び出し、解釈することが可能になります。
リポジトリ内のスキルは、nim-skills、open-models-skills、library-skills の 3 つに分類されています。workflows フォルダには、多段階のメタスキルが格納されます。一例として、generative_protein_binder_design があり、これは RFdiffusion → ProteinMPNN → OpenFold3 を連鎖させるものです。
BioNeMo スキルの仕組み
すべてのスキルは、SKILL.md ファイルを含むディレクトリです。ここには YAML フロントマターに加え、指示、オプションの参照情報、およびオプションのスクリプトが格納されます。エージェントはこのファイルをドキュメントとして読み取り、それに基づいて行動します。
プロンプトパターンはモデル間で同じです。NVIDIA の投稿では OpenFold3 が使用されています。この形状は、生物学向けの他の NIM にも適用されます。これには Boltz-2、DiffDock、GenMol、ProteinMPNN、MSA Search、RFdiffusion、Evo 2 が含まれます。スキル名、入力、エンドポイントを指定するだけです。
ホスト型 NIM エンドポイント
NVIDIA API エンドポイント https://build.nvidia.com/openfold3 を使用して、OpenFold3 BioNeMo スキルで MKTVRQERLKSIVR の折りたたみを行います。
ローカル NIM デプロイメント
ローカル NIM エンドポイント http://localhost:8000 を使用して、OpenFold3 BioNeMo スキルで MKTVRQERLKSIVR の折りたたみを行います。
インストールでは、オープンソースのスキル CLI を通じてスキルを取得します:
対話式でスキルを閲覧して選択する
npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit
または特定のエージェント用に 1 つのスキルをインストールする
npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit --skill boltz2-nim --agent claude-code
deployment はデフォルトではなく選択事項です。インフラストラクチャを管理せずに高速アクセスが必要な場合は、ホスト型 NIM エンドポイントを使用してください。低いウォームアップレイテンシ、データの局所性、または反復的な試行が必要になった場合、選択したモデルをローカルに移動します。
ベンチマーク
NVIDIA は、スキルが実際にエージェントのループを改善するかどうかを測定しました。報告されたすべての指標は、GPT-5.5 fast を実行している Codex CLI から得られたものです。チームは、各スキルあり・なしでの同一のエージェントを比較しました。
最初の指標はタスク完了率です。スキルがない場合、エージェントは必要なタスクの平均 57.1% を完了しました。NIM スキルへのアクセスがある場合、完了率は 100% に達しました。
効率性は2番目の指標でした。NVIDIA は、タスクを構成する個々のステップであるアサーションの通過数をカウントしました。スキルを使用すると、エージェントは1,000 トークンあたり2倍の通過アサーションを生み出しました。この向上は、テストされたすべての 10 の NIM スキルにおいて維持されました。
使用例と具体例
タンパク質構造予測: エージェントは Boltz-2 または OpenFold3 を用いてペプチド配列を折りたたみます。その結果、後続の検査用の CIF ファイルが返されます。
複数配列アライメント: エージェントは MSA Search スキルを通じて MMseqs2 で MSA(Multiple Sequence Alignment)を生成します。生成されるアーティファクトは A3M ファイルです。
創薬化学(ジェネレーティブ・ケミストリー): エージェントは GenMol を用いて候補分子を生成します。出力は SDF または SMILES 形式で、フィルタリングのために提供されます。
タンパク質結合体設計: generative_protein_binder_design ワークフローでは3つのモデルが連鎖します。RFdiffusion がバックボーンを構築し、ProteinMPNN が配列を設計し、OpenFold3 が折りたたみを検証します。
各ループは同じ形状に従います:エージェントはモデルを選択し、入力を準備し、実行し、出力を検査し、注意点を付して結果を説明します。
比較:スキルありのエージェントとなしのエージェント
次元 | 一般エージェント(スキルなし) | エージェント + BioNeMo スキル
---|---|---
タスク完了 | 平均 57.1% | 平均 100%
トークン効率 | ベースライン | 1,000 トークンあたり2倍の通過アサーション
モデル選択 | ツール、フォーマット、入力を推測 | 目的、入力、アーティファクトを読み取る
デプロイメント | ソースからの手動セットアップ | ホストまたはローカルの NIM(NVIDIA Inference Microservices)、文書化済み
障害ハンドリング | 不明な障害モード | スキルごとの文書化された障害モード
ワークフロー | 単一の孤立した呼び出し | マルチステップのメタスキル(結合体設計など)
Getting Started
準備は最小限です。Claude や Codex などのエージェントランタイムが必要です。ホストされた BioNeMo NIM エンドポイントを利用するには NVIDIA API キーが必要です。GPU ノードは、ローカルでの NIM デプロイを行う場合にのみオプションとなります。
まず、エージェントをリポジトリに指向させます。実行する前に利用可能な機能を列挙させてください。その後、1 つのモデルを操作するための単一のスキル(技能)を与えてください。
NVIDIA は2つの注意点を示しています。build.nvidia.com のエンドポイントは小規模な開発とテスト専用であり、本番環境での推論には適していません。また NVIDIA は検証を強調しており、信頼する前に低信頼度の構造を確認し、生成された分子をフィルタリングする必要があります。
リポジトリと技術詳細をご覧ください。Twitter でフォローすることも歓迎します。また、150,000 人以上の ML サブレッドに参加し、ニュースレターを購読することを忘れないでください。待ってください!Telegram をご利用ですか?今なら Telegram でもご参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご検討ですか?ぜひご連絡ください。
本記事「NVIDIA BioNeMo Agent Toolkit Turns Biomolecular Models Into Callable Skills for AI Agents in Drug Discovery」は、MarkTechPost で最初に公開されました。
原文を表示
AI scientists are becoming a new interface for scientific computing. These agents read papers, write code, generate hypotheses, call APIs, and inspect files. But science is not software engineering. No test suite turns green when a hypothesis is correct. Discovery stays iterative, uncertain, and grounded in the physical world.
That gap is what NVIDIA is targeting. NVIDIA published a hands-on walkthrough for its BioNeMo Agent Toolkit. The argument is direct. A general coding agent pointed at biology will not produce new medicines. In biomolecular research, an agent’s ceiling is set by the tools it can use reliably, correctly, and efficiently.
TL;DR
BioNeMo Agent Toolkit packages NVIDIA biomolecular models as documented, callable agent skills.
Skills span protein folding, docking, generative chemistry, genomics, and protein design.
NVIDIA reports task completion rising from 57.1% to 100% with skills.
Agents averaged 2x more passing assertions per 1,000 tokens.
Hosted NIM endpoints suit quick access; local NIM suits repeated iteration.
Interactive Explainer
(function(){
window.addEventListener("message", function(e){
if(e && e.data && e.data.bionemoHeight){
var f = document.getElementById("bionemo-demo");
if(f){ f.style.height = e.data.bionemoHeight + "px"; }
}
});
})();
What is BioNeMo Agent Toolkit
The BioNeMo Agent Toolkit is an open-source repository of ‘skills’ for AI agents. Each skill turns an NVIDIA biomolecular model into a tool an agent can call. The toolkit packages protein folding, molecular docking, generative chemistry, genomics analysis, protein design, and biomarker discovery.
NVIDIA frames the platform in two parts. The first is an accelerated tool layer. NVIDIA NIM (NVIDIA Inference Microservices) and BioNeMo open models deliver core capabilities as callable services. These are accelerated by libraries such as cuEquivariance for structure models and Parabricks for genomics. The second part is agent-ready interfaces. BioNeMo Skills package each capability so an agent can use it.
A skill documents the model’s purpose, required inputs, optional parameters, expected artifacts, and failure modes. Model Context Protocol (MCP) server wrappers expose open models not yet packaged as NIM. Together, this lets an agent discover, select, invoke, and interpret biomolecular models on its own.
The repository groups skills into nim-skills, open-models-skills, and library-skills. A workflows folder holds multi-step meta-skills. One example is generative_protein_binder_design, which chains RFdiffusion → ProteinMPNN → OpenFold3.
How a BioNeMo Skill Works
Every skill is a directory with a SKILL.md file. It holds YAML frontmatter plus instructions, optional references, and optional scripts. An agent reads it like documentation, then acts on it.
The prompt pattern stays the same across models. The NVIDIA’s post uses OpenFold3. The same shape applies to other NIMs for biology. These include Boltz-2, DiffDock, GenMol, ProteinMPNN, MSA Search, RFdiffusion, and Evo 2. You name the skill, the input, and the endpoint.
Copy CodeCopiedUse a different Browser
Hosted NIM endpoint
Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR
with the NVIDIA API endpoint at https://build.nvidia.com/openfold3
Local NIM deployment
Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR
with the local NIM endpoint at http://localhost:8000
Installation pulls skills through the open-source skills CLI:
Copy CodeCopiedUse a different Browser
Browse and pick a skill interactively
npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit
Or install one skill for a specific agent
npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit --skill boltz2-nim --agent claude-code
Deployment is a choice, not a default. Use hosted NIM endpoints for fast access without managing infrastructure. Move selected models local when you need lower warm latency, data locality, or repeated iteration.
Benchmark
NVIDIA measured whether skills actually improve an agent’s loop. All reported metrics came from Codex CLI running GPT-5.5 fast. The team compared the same agent with and without each skill.
Task completion was the first metric. Without skills, the agent completed 57.1% of required tasks on average. With access to NIM skills, completion reached 100%.
Efficiency was the second metric. NVIDIA counted passing assertions, the individual steps that compose a task. With skills, an agent produced 2x more passing assertions per 1,000 tokens. That gain held across all ten NIM skills tested.
Use Cases With Examples
Protein structure prediction: An agent folds a peptide sequence with Boltz-2 or OpenFold3. It returns a CIF file for downstream inspection.
Multiple sequence alignment: An agent generates an MSA with MMseqs2 through the MSA Search skill. The artifact is an A3M file.
Generative chemistry: An agent generates candidate molecules with GenMol. Outputs arrive as SDF or SMILES for filtering.
Protein binder design: The generative_protein_binder_design workflow chains three models. RFdiffusion builds a backbone, ProteinMPNN designs the sequence, and OpenFold3 validates the fold.
Each loop follows the same shape: The agent selects a model, prepares inputs, runs it, inspects outputs, and explains results with caveats.
How It Compares: Agent With vs Without Skills
DimensionGeneral agent (no skills)Agent + BioNeMo Skills
Task completion57.1% average100% average
Token efficiencyBaseline2x passing assertions per 1k tokens
Model selectionGuesses tool, format, and inputsReads purpose, inputs, and artifacts
DeploymentManual setup from sourceHosted or local NIM, documented
Failure handlingUnknown failure modesDocumented failure modes per skill
WorkflowsIsolated single callsMulti-step meta-skills (binder design)
Getting Started
The prerequisites are minimal. You need an agent runtime such as Claude or Codex. You need an NVIDIA API key for hosted BioNeMo NIM endpoints. A GPU node is optional, for local NIM deployment.
Point the agent at the repository first. Let it enumerate the available capabilities before it acts. Then hand it a single skill to operate one model.
NVIDIA flags two cautions. The build.nvidia.com endpoints are for small-scale development and testing only. They are not production-grade inference. NVIDIA also stresses validation: check low-confidence structures and filter generated molecules before trusting them.
Check out the Repo and Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post NVIDIA BioNeMo Agent Toolkit Turns Biomolecular Models Into Callable Skills for AI Agents in Drug Discovery appeared first on MarkTechPost.
関連記事
Meta AI、非侵襲型脳からテキストへ変換する「Brain2Qwerty v2」を公開し、タイピング中の文章を61%の単語精度で復元
OpenClaw、iOS および Android 向けコンパニオンノードアプリをリリースし、スマートフォンを自己ホスト型 AI エージェントゲートウェイに接続
セキュリティ分析とリスク調査における対話型グラフインテリジェンスパイプラインのための PyGraphistry 実装ワークフロー
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み