NVIDIA Claraを使用して医療・創薬分野のAIモデルを実装した体験
ABEJA の技術者が、ドメイン知識がなくても医療画像診断と創薬分野の AI モデルを NVIDIA Clara を用いて迅速に実装・検証できる実践レポートを公開した。
キーポイント
NVIDIA Clara プラットフォームの多角的紹介
医療画像診断(MONAI)、創薬(BioNeMo)、医療機器(Holoscan)、ゲノム解析(Parabricks)など、NVIDIA Clara が提供する主要機能とそれぞれの役割を体系的に解説している。
ドメイン知識不要な実装アプローチ
マテリアルや創薬の専門知識がなくても、事前構築されたフレームワーク(MONAI, BioNeMo)を活用することで、比較的容易にモデルを動かせる環境であることを示している。
具体的な技術実装事例
医療画像分野では VISTA-3D モデルを用いた内臓セグメンテーションのファインチューニングと推論、創薬分野では ESM-2 タンパク質言語モデルの学習・推論をそれぞれ実行した手順を報告している。
GPU による計算高速化の原理
ゲノム解析におけるアライメント処理や DNN の行列演算など、AI モデルが GPU で劇的に高速化される技術的根拠(並列処理能力)についても言及している。
NVIDIA FLARE と連合学習の活用
データ共有が困難な医療機関間でも、プライバシーを保護しながら分散学習を行うために NVIDIA FLARE を MONAI Toolkit と連携して使用できる。
T4 GPU でのモデル動作確認
公式要件は高価な A100/H100 だが、画像セグメンテーションモデル(VISTA-3D)であれば GCP の T4 単体でも環境構築と実行が可能である。
NGC コンテナによる環境構築
NVIDIA NGC から MONAI Toolkit の Docker イメージを pull し、JupyterLab または Bash モードでコンテナを起動して AI モデルを実行する手順が示されている。
影響分析・編集コメントを表示
影響分析
本記事は、医療・創薬という専門性の高い領域において、AI ツールの普及と実装の民主化を促進する重要な示唆を与えるものである。特にドメイン知識が不足している開発者や研究者に対し、NVIDIA のエコシステムを活用して即座にプロトタイプを作成できる道筋を示すことで、業界全体の AI 活用スピードを加速させる可能性がある。
編集コメント
医療・創薬分野の AI 実装における「参入障壁」を下げ、具体的な技術スタックの選定基準を提供する有益な実践記事です。
こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。
こちらはABEJAアドベントカレンダー2025の25日目の記事です。
近年のディープラーニングの発展に伴い、マテリアル・創薬・医療分野においても AI の活用が進みつつあるかと思いますが、その市場規模はかなり大きく、どのようなモデルや技術が使用されているのか?とか将来性はどうなのか?とか個人的に興味がありました。
とはいえ自分は、マテリアル・創薬・医療系のドメイン知識に関して素人なので、できるだけさくっと動かせるモデルやフレームワークで試してみたかったのですが、LLM とかと違ってこの分野では簡単に動かせるフレームワークやプラットフォームがそんなに整備されていない印象でした。そんな中で NVIDIA が提供している「NVIDIA Clara」と呼ばれる医療系の AI プラットフォームが、比較的簡単に動かせそうだったので、軽く動かしてみました
NVIDIA Clara の公式ドキュメントは、以下のリンク先にあります。
NVIDIA Clara の概要
NVIDIA Clara for Medical Imaging(AI 医療用画像診断) NVIDIA Clara for Medical Imaging の概要
MONAI Toolkit を起動する
内臓セグメンテーション用モデル(VISTA-3D)のファインチューニングを行う
ファインチューニングした内臓セグメンテーション用モデル(VISTA-3D)で推論し、CT画像における特定の内臓領域をアノテーションする
NVIDIA Clara for Biopharma(AI 創薬) NVIDIA Clara for Biopharma / BioNeMo の概要
BioNeMo Framework を起動する
BioNeMo Framework を使用してタンパク質言語モデル(ESM-2)の学習を行う
BioNeMo Framework を使用してタンパク質言語モデル(ESM-2)の推論を行う
NVIDIA Clara の概要
NVIDIA Clara は、NVIDIA が提供している医療系の AI プラットフォームで、 現時点で以下の分野のための機能群を提供しているようです。
NVIDIA Clara for Biopharma(AI 創薬)
AI 創薬のためのプラットフォームである BioNeMo フレームワークを提供。BioNeMo フレームワークには、AI創薬のための事前学習済みモデル群も含まれます
NVIDIA Clara for Medical Devices / NVIDIA Holoscan
医療機器データ(内視鏡動画、超音波などの医療センサーデータなど)のストリーミングに対してAIモデル推論によるリアルタイム解析を行うためのハイブリッド環境用(エッジ AI デバイス・オンプレ環境・クラウド環境)プラットフォームで、NVIDIA Holoscan として提供されています。
docs.nvidia.com
NVIDIA Clara for Medical Imaging(AI 医療用画像診断)/ NVIDIA MONAI Toolkit
NVIDIA Clara for Medical Imaging は、医療用画像(レントゲン画像、CT画像など)x AI(AIモデルによる画像セグメンテーションや画像生成など)にターゲットを絞った NVIDIA Clara の機能で、NVIDIA MONAI Toolkit として提供されています。
docs.nvidia.com
NVIDIA Clara for Genomics(AI ゲノム解析)/ NVIDIA Parabricks
次世代シーケンシング(NGS)による膨大なゲノムデータの解析を、GPU を使って劇的に高速化するためのプラットフォーム
ゲノム解析における二次解析と呼ばれる工程では、細かく断片化された数億個のデータ(リード)をパズルのように正しい位置に並べ直す作業(アライメント)が発生するそうですが、これは行列とベクトル演算といった並列処理になるので、GPU で劇的な高速化ができるようです。 (余談ですが、GPUは、元々3Dゲームにおける行列とベクトル演算の高速化で使用されていましたが、AIモデルでも同じくDNN 内で行列とベクトル演算してるだけなので GPU で高速化できるんじゃんてなったのと同じ流れですね)
今回の記事では、最も簡単に動かせそうだった「NVIDIA Clara for Medical Imaging」と、個人的にAI 創薬の雰囲気だけでも知っておきたかったので 「NVIDIA Clara for Biopharma」も動かしてみます
NVIDIA Clara for Medical Imaging(AI 医療用画像診断)
NVIDIA Clara for Medical Imaging の概要

NVIDIA Clara for Medical Imaging は、医療用画像(レントゲン画像、CT画像など)x AI にターゲットを絞った NVIDIA Clara の機能で、以下の主要コンポーネントで構成されるようです
NVIDIA MONAI [Medical Open Network for AI] Toolkit
医療用画像(レントゲン画像、CT画像など)の AI プロダクト開発・モデル学習・デプロイのためのフレームワークです
catalog.ngc.nvidia.com
サポートしているモデル例 VISTA-3D
CT画像における内臓領域のセグメンテーション用モデル

MAISI [Medical AI for Synthetic Imaging]
3D CT 画像の生成モデルで、拡散モデルをベースとしている。用途しては、学習用データセットのデータ拡張での利用(合成データ)など

NVIDIA FLARE との連携
developer.nvidia.com
NVIDIA FLARE は、連合学習 [Federated Learning] のためのフレームワークです。 連合学習というのは分散学習の1種なのですが、複数の組織に属する開発者が学習用データセットなどを共有せずに協力してAIモデルを分散学習する方法のことです。 プライバシー保護などのセキュリティ上の理由から、異なる組織に学習用データセットなどのデータ共有ができないケースに有用になります。 NVIDIA FLARE 自体は、NVIDIA Clara の医療用とは別のフレームワークになるのですが、MONAI Toolkit と連携することで、医療機関におけるデータ保護などのセキュリティ上の問題をクリアしつつモデルの学習を行うことができます。
blueprint でのデモサイトが公開されているので、以下のサイトから試してみるとイメージしやすいかと思います
VISTA-3D(CT画像における内臓領域のセグメンテーション用モデル)のデモ
build.nvidia.com
MAISI(CT画像の生成モデル)のデモ
build.nvidia.com
MONAI Toolkit を起動する
それでは実際に、NVIDIA Clara for Medical Imaging での AI モデルを動かしていきます。まずは、MONAI Toolkit を起動することから始めていきます。
MONAI Toolkit は、NVIDIA が NGC 上に公開している MONAI Toolkit 用 docker image のコンテナで動かす形になります。
GPU インスタンスを構築する
今回は少し動かしてみるだけだったので GCP の VMインスタンス(T4:1台)で環境構築しました。
本格的な学習を行う場合は、クラウドで動かすとインフラコストが膨大になるので、オンプレ環境で動かすことを推奨します。
公式のシステム要件は、以下に記載されています。
記載されているスペックは A100, H100 とかの高価な GPU ですが、今回動かしてみるモデル(VISTA-3D)は、生成 AI モデルのような大規模モデルではなくただの画像セグメンテーションモデルなので、T4 でも動かせました。
docs.nvidia.com
NVIDIA の NGC にログインして SetUp 画面から API キーを作成する
NVIDIA NGC Container Register にログインする
docker login nvcr.io
ユーザー名: $oauthtoken
パスワード: 上記作成した API トークン
MONAI Toolkit の Docker image を pull する
以下のコマンドで NVIDIA NGC Container Register から MONAI Toolkit の Docker image を pull してください
docker pull nvcr.io/nvidia/clara/monai-toolkit:3.0
MONAI Toolkit の Docker コンテナを起動する
JupyterLab で起動する場合
今回は、JupyterLab 上のコードを使用するので、以下のコマンドで JupyterLab のコンテナを起動してださい
docker run --gpus all -it --rm \ --ipc=host --net=host \ nvcr.io/nvidia/clara/monai-toolkit:3.0
-e JUPYTER_PORT=8900
[Option] bash で起動する場合
なお自作したスクリプト等を MONAI Toolkit 環境で動かしたい場合は、コンテナを bash 起動した上でスクリプトを実行してください
docker run --gpus all -it --rm \ --ipc=host --net=host \ nvcr.io/nvidia/clara/monai-toolkit:3.0 /bin/bash
ブラウザ上で JupyterLab を開く
上記コマンド実行後に以下のようなログが出力されるので、ログ中の http://localhost:8888/lab?token=dummy
Welcome to MONAI Toolkit MONAI toolkit components: MONAI Core, Version: 1.4.0 MONAI Label, Version: 0.8.4 NVFlare, Version: 2.5.0 Jupyter Port is set to: 8888 checking port 8888 availability [I 2025-12-22 06:19:05.734 ServerApp] jupyter_lsp | extension was successfully linked. [I 2025-12-22 06:19:05.739 ServerApp] jupyter_server_terminals | extension was successfully linked. ... [I 2025-12-22 06:19:07.563 ServerApp] Jupyter Server 2.14.2 is running at: [I 2025-12-22 06:19:07.563 ServerApp] http://localhost:8888/lab?token=dummy [I 2025-12-22 06:19:07.563 ServerApp] http://127.0.0.1:8888/lab?token=dummy [I 2025-12-22 06:19:07.563 ServerApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation). [C 2025-12-22 06:19:07.568 ServerApp] To access the server, open this file in a browser: file:///root/.local/share/jupyter/runtime/jpserver-29-open.html Or copy and paste one of these URLs: http://localhost:8888/lab?token=dummy http://127.0.0.1:8888/lab?token=dummy
JupyterLab 上で welcome.md

ブラウザ接続に成功すると、上のような JupyterLab でのページが表示されるので、このチュートリアルに従って各種 AI モデルを動かしていきます
内臓セグメンテーション用モデル(VISTA-3D)のファインチューニングを行う
CT画像セグメンテーション用モデル(VISTA-3D)のチュートリアルコード http://localhost:8888/lab/tree/tutorials/monai/vista_3d/vista3d_spleen_finetune.ipynb
JupyterLab で動かしているので、UI 上から Run ボタン ▶️ をポチポチするだけで良いです。



VISTA-3D:CT画像セグメンテーション用モデルで、120以上の主要臓器クラスをセグメンテーション可能なモデルです

以下で公開されているデータセットで、腹部断面のCT画像と正解ラベル(黄色の領域:脾臓として正しくラベル付けされた領域)を含むデータセットになります。
このデータセットで VISTA-3D をファインチューニングします。
medicaldecathlon.com
msd-for-monai.s3-us-west-2.amazonaws.com
画像解像度:239 x 239
枚数: 150枚 かなり少ないが、ファインチューニングなので問題なし(本当はもっと多いほうが良い)
エポック数:5 epoch かなり少ない気がしますが、チュートリアルのまま 5 epoch とします
使用 GPU メモリ: 8 ~ 9GB 程度なので、T4でも動かせました

今回はチュートリアルと同じ設定で学習しましたが、epoch 5 ではまだ十分に loss が収束してないので、もっと Epoch 数増やしたほうが良さそうです
ファインチューニングした内臓セグメンテーション用モデル(VISTA-3D)で推論し、CT画像における特定の内臓領域をアノテーションする
同じくCT画像セグメンテーション用モデル(VISTA-3D)のチュートリアルコード http://localhost:8888/lab/tree/tutorials/monai/vista_3d/vista3d_spleen_finetune.ipynb

推論結果例は、以下の通りです。
腹部断面のCT画像(テスト用データを使用)から脾臓部分をうまくアノテーション(セグメンテーション)できていることがわかるかと思います

NVIDIA Clara for Biopharma(AI 創薬)
NVIDIA Clara for Biopharma / BioNeMo の概要
NVIDIA Clara for Biopharma は、NVIDIA Clara における AI 創薬のための機能です。BioNeMo と呼ばれるフレームワークと AI 創薬のための事前学習済みモデル群で構成されます
以下で blueprint でのデモが公開されているので、こちらを試してみるとイメージが掴みやすいと思います。
build.nvidia.com
拡散モデルベースのモデルで、ノイズ入力から徐々にタンパク質構造を生成
です。
こちらはABEJAアドベントカレンダー2025の25日目の記事です。
近年のディープラーニングの発展に伴い、マテリアル・創薬・医療分野においても AI の活用が進みつつあるかと思いますが、その市場規模はかなり大きく、どのようなモデルや技術が使用されているのか?とか将来性はどうなのか?とか個人的に興味がありました。
とはいえ自分は、マテリアル・創薬・医療系のドメイン知識に関して素人なので、できるだけさくっと動かせるモデルやフレームワークで試してみたかったのですが、LLM とかと違ってこの分野では簡単に動かせるフレームワークやプラットフォームがそんなに整備されていない印象でした。そんな中で NVIDIA が提供している「NVIDIA Clara」と呼ばれる医療系の AI プラットフォームが、比較的簡単に動かせそうだったので、軽く動かしてみました
NVIDIA Clara の公式ドキュメントは、以下のリンク先にあります。
NVIDIA Clara の概要
NVIDIA Clara for Medical Imaging(AI 医療用画像診断) NVIDIA Clara for Medical Imaging の概要
MONAI Toolkit を起動する
内臓セグメンテーション用モデル(VISTA-3D)のファインチューニングを行う
ファインチューニングした内臓セグメンテーション用モデル(VISTA-3D)で推論し、CT画像における特定の内臓領域をアノテーションする
NVIDIA Clara for Biopharma(AI 創薬) NVIDIA Clara for Biopharma / BioNeMo の概要
BioNeMo Framework を起動する
BioNeMo Framework を使用してタンパク質言語モデル(ESM-2)の学習を行う
BioNeMo Framework を使用してタンパク質言語モデル(ESM-2)の推論を行う
NVIDIA Clara の概要
NVIDIA Clara は、NVIDIA が提供している医療系の AI プラットフォームで、 現時点で以下の分野のための機能群を提供しているようです。
NVIDIA Clara for Biopharma(AI 創薬)
AI 創薬のためのプラットフォームである BioNeMo フレームワークを提供。BioNeMo フレームワークには、AI創薬のための事前学習済みモデル群も含まれます
NVIDIA Clara for Medical Devices / NVIDIA Holoscan
医療機器データ(内視鏡動画、超音波などの医療センサーデータなど)のストリーミングに対してAIモデル推論によるリアルタイム解析を行うためのハイブリッド環境用(エッジ AI デバイス・オンプレ環境・クラウド環境)プラットフォームで、NVIDIA Holoscan として提供されています。
docs.nvidia.com
NVIDIA Clara for Medical Imaging(AI 医療用画像診断)/ NVIDIA MONAI Toolkit
NVIDIA Clara for Medical Imaging は、医療用画像(レントゲン画像、CT画像など)x AI(AIモデルによる画像セグメンテーションや画像生成など)にターゲットを絞った NVIDIA Clara の機能で、NVIDIA MONAI Toolkit として提供されています。
docs.nvidia.com
NVIDIA Clara for Genomics(AI ゲノム解析)/ NVIDIA Parabricks
次世代シーケンシング(NGS)による膨大なゲノムデータの解析を、GPU を使って劇的に高速化するためのプラットフォーム
ゲノム解析における二次解析と呼ばれる工程では、細かく断片化された数億個のデータ(リード)をパズルのように正しい位置に並べ直す作業(アライメント)が発生するそうですが、これは行列とベクトル演算といった並列処理になるので、GPU で劇的な高速化ができるようです。 (余談ですが、GPUは、元々3Dゲームにおける行列とベクトル演算の高速化で使用されていましたが、AIモデルでも同じくDNN 内で行列とベクトル演算してるだけなので GPU で高速化できるんじゃんてなったのと同じ流れですね)
今回の記事では、最も簡単に動かせそうだった「NVIDIA Clara for Medical Imaging」と、個人的にAI 創薬の雰囲気だけでも知っておきたかったので 「NVIDIA Clara for Biopharma」も動かしてみます
NVIDIA Clara for Medical Imaging(AI 医療用画像診断)
NVIDIA Clara for Medical Imaging の概要

NVIDIA Clara for Medical Imaging は、医療用画像(レントゲン画像、CT画像など)x AI にターゲットを絞った NVIDIA Clara の機能で、以下の主要コンポーネントで構成されるようです
NVIDIA MONAI [Medical Open Network for AI] Toolkit
医療用画像(レントゲン画像、CT画像など)の AI プロダクト開発・モデル学習・デプロイのためのフレームワークです
catalog.ngc.nvidia.com
サポートしているモデル例 VISTA-3D
CT画像における内臓領域のセグメンテーション用モデル

MAISI [Medical AI for Synthetic Imaging]
3D CT 画像の生成モデルで、拡散モデルをベースとしている。用途しては、学習用データセットのデータ拡張での利用(合成データ)など

NVIDIA FLARE との連携
developer.nvidia.com
NVIDIA FLARE は、連合学習 [Federated Learning] のためのフレームワークです。 連合学習というのは分散学習の1種なのですが、複数の組織に属する開発者が学習用データセットなどを共有せずに協力してAIモデルを分散学習する方法のことです。 プライバシー保護などのセキュリティ上の理由から、異なる組織に学習用データセットなどのデータ共有ができないケースに有用になります。 NVIDIA FLARE 自体は、NVIDIA Clara の医療用とは別のフレームワークになるのですが、MONAI Toolkit と連携することで、医療機関におけるデータ保護などのセキュリティ上の問題をクリアしつつモデルの学習を行うことができます。
blueprint でのデモサイトが公開されているので、以下のサイトから試してみるとイメージしやすいかと思います
VISTA-3D(CT画像における内臓領域のセグメンテーション用モデル)のデモ
build.nvidia.com
MAISI(CT画像の生成モデル)のデモ
build.nvidia.com
MONAI Toolkit を起動する
それでは実際に、NVIDIA Clara for Medical Imaging での AI モデルを動かしていきます。まずは、MONAI Toolkit を起動することから始めていきます。
MONAI Toolkit は、NVIDIA が NGC 上に公開している MONAI Toolkit 用 docker image のコンテナで動かす形になります。
GPU インスタンスを構築する
今回は少し動かしてみるだけだったので GCP の VMインスタンス(T4:1台)で環境構築しました。
本格的な学習を行う場合は、クラウドで動かすとインフラコストが膨大になるので、オンプレ環境で動かすことを推奨します。
公式のシステム要件は、以下に記載されています。
記載されているスペックは A100, H100 とかの高価な GPU ですが、今回動かしてみるモデル(VISTA-3D)は、生成 AI モデルのような大規模モデルではなくただの画像セグメンテーションモデルなので、T4 でも動かせました。
docs.nvidia.com
NVIDIA の NGC にログインして SetUp 画面から API キーを作成する
NVIDIA NGC Container Register にログインする
docker login nvcr.io
ユーザー名: $oauthtoken
パスワード: 上記作成した API トークン
MONAI Toolkit の Docker image を pull する
以下のコマンドで NVIDIA NGC Container Register から MONAI Toolkit の Docker image を pull してください
docker pull nvcr.io/nvidia/clara/monai-toolkit:3.0
MONAI Toolkit の Docker コンテナを起動する
JupyterLab で起動する場合
今回は、JupyterLab 上のコードを使用するので、以下のコマンドで JupyterLab のコンテナを起動してださい
docker run --gpus all -it --rm \ --ipc=host --net=host \ nvcr.io/nvidia/clara/monai-toolkit:3.0
-e JUPYTER_PORT=8900
[Option] bash で起動する場合
なお自作したスクリプト等を MONAI Toolkit 環境で動かしたい場合は、コンテナを bash 起動した上でスクリプトを実行してください
docker run --gpus all -it --rm \ --ipc=host --net=host \ nvcr.io/nvidia/clara/monai-toolkit:3.0 /bin/bash
ブラウザ上で JupyterLab を開く
上記コマンド実行後に以下のようなログが出力されるので、ログ中の http://localhost:8888/lab?token=dummy
Welcome to MONAI Toolkit MONAI toolkit components: MONAI Core, Version: 1.4.0 MONAI Label, Version: 0.8.4 NVFlare, Version: 2.5.0 Jupyter Port is set to: 8888 checking port 8888 availability [I 2025-12-22 06:19:05.734 ServerApp] jupyter_lsp | extension was successfully linked. [I 2025-12-22 06:19:05.739 ServerApp] jupyter_server_terminals | extension was successfully linked. ... [I 2025-12-22 06:19:07.563 ServerApp] Jupyter Server 2.14.2 is running at: [I 2025-12-22 06:19:07.563 ServerApp] http://localhost:8888/lab?token=dummy [I 2025-12-22 06:19:07.563 ServerApp] http://127.0.0.1:8888/lab?token=dummy [I 2025-12-22 06:19:07.563 ServerApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation). [C 2025-12-22 06:19:07.568 ServerApp] To access the server, open this file in a browser: file:///root/.local/share/jupyter/runtime/jpserver-29-open.html Or copy and paste one of these URLs: http://localhost:8888/lab?token=dummy http://127.0.0.1:8888/lab?token=dummy
JupyterLab 上で welcome.md

ブラウザ接続に成功すると、上のような JupyterLab でのページが表示されるので、このチュートリアルに従って各種 AI モデルを動かしていきます
内臓セグメンテーション用モデル(VISTA-3D)のファインチューニングを行う
CT画像セグメンテーション用モデル(VISTA-3D)のチュートリアルコード http://localhost:8888/lab/tree/tutorials/monai/vista_3d/vista3d_spleen_finetune.ipynb
JupyterLab で動かしているので、UI 上から Run ボタン ▶️ をポチポチするだけで良いです。



VISTA-3D:CT画像セグメンテーション用モデルで、120以上の主要臓器クラスをセグメンテーション可能なモデルです

以下で公開されているデータセットで、腹部断面のCT画像と正解ラベル(黄色の領域:脾臓として正しくラベル付けされた領域)を含むデータセットになります。
このデータセットで VISTA-3D をファインチューニングします。
medicaldecathlon.com
msd-for-monai.s3-us-west-2.amazonaws.com
画像解像度:239 x 239
枚数: 150枚 かなり少ないが、ファインチューニングなので問題なし(本当はもっと多いほうが良い)
エポック数:5 epoch かなり少ない気がしますが、チュートリアルのまま 5 epoch とします
使用 GPU メモリ: 8 ~ 9GB 程度なので、T4でも動かせました

今回はチュートリアルと同じ設定で学習しましたが、epoch 5 ではまだ十分に loss が収束してないので、もっと Epoch 数増やしたほうが良さそうです
ファインチューニングした内臓セグメンテーション用モデル(VISTA-3D)で推論し、CT画像における特定の内臓領域をアノテーションする
同じくCT画像セグメンテーション用モデル(VISTA-3D)のチュートリアルコード http://localhost:8888/lab/tree/tutorials/monai/vista_3d/vista3d_spleen_finetune.ipynb

推論結果例は、以下の通りです。
腹部断面のCT画像(テスト用データを使用)から脾臓部分をうまくアノテーション(セグメンテーション)できていることがわかるかと思います

NVIDIA Clara for Biopharma(AI 創薬)
NVIDIA Clara for Biopharma / BioNeMo の概要
NVIDIA Clara for Biopharma は、NVIDIA Clara における AI 創薬のための機能です。BioNeMo と呼ばれるフレームワークと AI 創薬のための事前学習済みモデル群で構成されます
以下で blueprint でのデモが公開されているので、こちらを試してみるとイメージが掴みやすいと思います。
build.nvidia.com
拡散モデルベースのモデルで、ノイズ入力から徐々にタンパク質構造を生成

標的となるタンパク質の構造データ
生成するタンパク質の長さや、標的タンパク質のどの範囲を固定するかを指定するパラメータ
出力 タンパク質の3D構造の原型を PDB [Protein Data Bank] 形式で出力 この段階ではアミノ酸の種類は決まっておらず、グリシン(GLY)だけで構成されるいった原型だけのモデルが出力
グラフ畳み込み(GNN)ベースのモデルで、タンパク質の3D構造からアミノ酸配列に逆変換するモデル

RFdiffusion で予想したタンパク質の3D構造
出力 入力されたタンパク質の3D構造に折りたたまる可能性が高いアミノ酸配列
AlphaFold2 (OpenFold)
Transformer ベースのモデルで、タンパク質の3次元構造を非常に高い精度で予測するAIモデル

ProteinMPNN で予想したアミノ酸配列
既存の構造データ(例:ACE2)を参照用として使用
出力 最終的なタンパク質の3D構造を PDB [Protein Data Bank] 形式で出力
{ "result": { "alphafold2": { "all_predicted_pdbs": [ "ATOM 1 N SER A 19 96.155 70.201 45.493 1.00100.66 N \nATOM 2 CA SER A 19 94.696 70.434 45.702 1.00101.02 C \nATOM 3 C SER A 19 93.987 69.087 45.880 1.00100.43 C \nATOM 4 O SER A 19 94.494 68.054 45.439 1.00 99.56 O \nATOM 5 CB SER A 19 94.116 71.194 44.499 1.00102.01 C \nATOM 6 OG SER A 19 92.778 71.609 44.730 1.00102.75 O \nATOM 7 N THR A 20 92.825 69.102 46.535 1.00100.27 N \nATOM 8 CA THR A 20 92.051 67.879 46.776 1.00 99.38 C \nATOM 9 C THR A 20 91.073 67.584 45.641 1.00 98.31 C \nATOM 10 O THR A 20 90.444 68.499 45.100 1.00 98.40 O \nATOM 11 CB THR A 20 91.236 67.973 48.092 1.00 98.99 C \nATOM 12 OG1 THR A 20 92.126 68.161 49.199 1.00100.97 O \nATOM 13 CG2 THR A 20 90.435 66.697 48.320 1.00 98.68 C \nATOM 14 N ILE A 21 90.946 66.305 45.289 1.00 97.23 N \nATOM 15 CA ILE A 21 90.028 65.874 44.232 1.00 96.91 C \nATOM 16 C ILE A 21 88.577 66.107 44.659 1.00 95.29 C \nATOM 17 O ILE A 21 87.687 65.320 44.350 1.00 95.10 O \nATOM 18 CB ILE A 21 90.209 64.370 43.890 1.00 97.49 C \nATOM 19 CG1 ILE A 21 89.957 63.500 45.130 1.00 98.25 ... }, "proteinmpnn": { "mfasta": ">input, score=3.0430, global_score=2.2795, fixed_chains=['B'], designed_chains=['A'], CA_model_name=v_48_002, git_hash=unknown, seed=667\nGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG\n>T=0.1, sample=1, score=1.3999, global_score=1.9260, seq_recovery=0.0469\nGPEEEEKKREIEALVAEMAKQFEEVKPLIELLEELKKKIGEGEKEAEKELKKKIEEEEKRKEEA\n", "scores": [ 1.3998868465423584 ], "probabilities": [ [ [ 2.9388796951579366e-10, 6.684248006694004e-19, 3.878053780881352e-11, 1.8682724638174886e-12, 2.496218801052632e-15, 0.9949813485145569, 8.619456505049819e-16, 2.2613524466467754e-15, 2.8787888739501e-10, 1.5028966569505253e-12, 0.004999660421162844, 5.45019411546388e-12, 1.129599669011383e-12, 4.379279345433822e-15, 8.465267549440103e-12, 0.000018977581930812448, 2.3997567821787413e-10, 3.865102394363202e-15, 1.6532286080523171e-18, 6.183128094975089e-17, 0 ], [ 0.00005282574420562014, 7.163673617923613e-18, ... ] ], "rfdiffusion": { "output_pdb": "ATOM 1 N GLY A 1 -41.231 -9.202 10.946 1.00 0.00\nATOM 2 CA GLY A 1 -40.410 -8.027 11.210 1.00 0.00\nATOM 3 C GLY A 1 -39.456 -8.271 12.373 1.00 0.00\nATOM 4 O GLY A 1 -38.329 -7.777 12.377 1.00 0.00\nATOM 5 N GLY A 2 -39.762 -9.223 13.182 1.00 0.00\nATOM 6 CA GLY A 2 -38.935 -9.554 14.336 1.00 0.00\nATOM 7 C GLY A 2 -37.653 -10.259 13.912 1.00 0.00\nATOM 8 O GLY A 2 -36.582 -10.007 14.465 1.00 0.00\nATOM 9 N GLY A 3 -37.722 -11.118 12.941 1.00 0.00\nATOM 10 CA GLY A 3 -36.533 -11.809 12.458 1.00 0.00\nATOM 11 C GLY A 3 -35.546 -10.833 11.830 1.00 0.00\nATOM 12 O GLY A 3 -34.337 -10.939 12.036 1.00 0.00\nATOM 13 N GLY A 4 -36.039 -9.888 11.050 1.00 0.00\nATOM 14 CA GLY A 4 }, ... }
上記 json データを 3D レンダリングした結果

上記のモデル群を以下の手順でパイプライン的に推論することで、タンパク質の3D構造を出力することができます
RFdiffusion::こういう機能に最適なタンパク質3D構造の原型をゼロ(ノイズ)から生成
ProteinMPNN:上記生成されたタンパク質構造を安定させるためのアミノ酸配列を予想
AlphaFold2:ProteinMPNN が予想したアミノ酸配列が、本当に意図したタンパク質構造に折りたたまれるかを検証
BioNeMo Framework を起動する
それでは実際に、NVIDIA Clara for Biopharma での AI モデルを動かしていきます。まずは、BioNeMo Framework を起動することから始めていきます。
BioNeMo Framework は、NVIDIA が NGC 上に公開している BioNeMo Framework 用 docker image のコンテナで動かす形になります。
GPU インスタンスを構築する
GC
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み