GigaTIME:マルチモーダルAIが生成する仮想患者集団を用いた腫瘍微小環境モデルの大規模化
Microsoft Research は、H&E 病理スライドから仮想 mIF 画像を生成する AI モデル「GigaTIME」を開発し、大規模な腫瘍微小環境の解析と精密免疫療法の予測を可能にした。
キーポイント
H&E から仮想 mIF への変換技術
高コストでスケーラビリティに課題がある多重免疫蛍光(mIF)データの代わりに、日常的なヘマトキシリン・エオシン染色(H&E)スライドを AI で変換し、21 のタンパク質チャネルを含む仮想 mIF 画像を生成する技術を実現した。
大規模仮想コホートの構築
51 の病院と 1,000 クリニックのデータを用いて約 30 万枚の仮想 mIF 画像を生成し、24 の癌種および 306 のサブタイプにわたる統計的に有意な臨床属性との関連性を発見した。
公衆利用と研究加速
開発された GigaTIME モデルは Microsoft Foundry Labs および Hugging Face で公開され、精密腫瘍学における大規模空間プロテオミクス研究の新たな枠組みを提供している。
GigaTIME の主な機能
GigaTIME は、H&E スライドから空間分解能のある単細胞状態を予測し、腫瘍微小環境(TME)モデリングのための仮想人口(mIF イメージ)を生成する。
マルチモーダル AI の学習規模
プロビデンスの 4,000 万細胞分のペアデータ(H&E スライドと mIF イメージ)を用いて訓練され、既存手法よりも高精度なクロスモーダル変換を実現した。
臨床的意義
組織全体での平均バイオマーカー状態だけでなく、細胞レベルの空間情報を解析可能にし、精密腫瘍学における大規模な発見を加速する。
大規模な統計的関連性の発見
GigaTIME を用いて生成された仮想集団により、腫瘍免疫細胞状態と臨床バイオマーカーの間で1,234の統計的に有意な関連性が特定され、既知の知見や新たな相関関係(例:KMT2D や KRAS との関連)が解明されました。
影響分析・編集コメントを表示
影響分析
この技術は、高価で限定的な空間プロテオミクスデータの壁を取り払い、過去の膨大な病理データから新たな生物学的知見を引き出すことを可能にします。これにより、個別化医療の精度が飛躍的に向上し、治療反応性の低い患者に対する戦略的介入(コールドからホットへの転換)を迅速に行えるようになります。
編集コメント
医療 AI の分野において、高価な実験データを不要にすることで大規模研究を可能にする「データ拡張」の真骨頂を示す成果です。特に、既存の病理スライドを活用できる点は、即座に臨床応用への道を開く画期的なアプローチと言えます。
タイトル: GigaTIME: マルチモーダルAIによって生成された仮想集団を用いた腫瘍微小環境モデリングのスケーリング
デジタルトランスフォーメーションと生成AI革命の収束は、精密医療の進歩を加速させる前例のない機会を生み出しています。精密免疫療法は、この変革の代表的な成功例です。多重蛍光免疫染色(mIF)のような新興技術は、個々の細胞の内部状態とその空間的位置を評価することができ、腫瘍が免疫系とどのように相互作用するかを解読する上で極めて重要です。その結果得られる知見は、しばしば腫瘍微小環境の「文法」と呼ばれ、腫瘍が免疫療法に反応するかどうかを予測するのに役立ちます。反応する可能性が低い場合、これらの知見は、腫瘍を「冷たい」状態から「熱い」状態へと再プログラムし、治療への感受性を高める戦略を立てるための情報を提供することもできます。
これは非常に刺激的ですが、現在の技術のコストの高さと拡張性の限界によって進歩が妨げられています。例えば、組織サンプルに対して数十のタンパク質チャネルに関するmIFデータを取得するには数千ドルの費用がかかり、最も先進的な研究室でさえ、利用可能な組織サンプルのごく一部にしかスケールさせることができません。
12月9日にCell誌に掲載された論文「Multimodal AI generates virtual population for tumor microenvironment modeling (新しいタブで開く)」において、私たちは、日常的に利用可能なヘマトキシリン・エオシン(H&E)染色病理スライドを仮想mIF画像に変換するマルチモーダルAIモデルであるGigaTIME (新しいタブで開く)を発表しました。プロビデンスおよびワシントン大学との共同研究で開発されたGigaTIMEは、21のタンパク質チャネルにわたってH&E画像とmIF画像が対となった、プロビデンスのデータセット(4,000万細胞)で訓練されました。私たちはGigaTIMEを、プロビデンス・システム内の51の病院と1,000以上の診療所から集められた14,256人のがん患者に適用しました。この取り組みにより、24種類のがんと306種類のがんサブタイプにまたがる約30万枚の仮想mIF画像からなる仮想集団が生成されました。この仮想集団から、mIFタンパク質活性化と、バイオマーカー、病期、患者生存率などの重要な臨床属性とを結びつける1,234の統計的に有意な関連性が明らかになりました。10,200人のCancer Genome Atlas(TCGA)患者を用いた独立した外部検証により、我々の発見はさらに裏付けられました。
私たちの知る限り、これは空間プロテオミクスに基づく腫瘍免疫微小環境(TIME)に関する初の集団規模の研究です。このような研究は、従来はmIFデータの不足により実現不可能でした。容易に入手可能なH&E病理スライドを高解像度の仮想mIFデータに変換することで、GigaTIMEは集団規模のTIME分析と発見を通じて精密免疫腫瘍学を探求するための新しい研究フレームワークを提供します。私たちは、GigaTIMEモデルをMicrosoft Foundry Labs (新しいタブで開く) およびHugging Face (新しいタブで開く) で公開し、精密腫瘍学における臨床研究の加速に貢献したいと考えています。
「GigaTIMEは、これまで手の届かなかった知見を解き放つことに関わるものです」と、プロビデンス・ゲノミクスの最高医療責任者(CMO)であり、プロビデンス癌研究所の癌ゲノミクス・精密腫瘍学医療ディレクターであるCarlo Bifulco医学博士は説明します。「何千人もの患者の腫瘍微小環境を分析することで、GigaTIMEは精密腫瘍学の未来を形作り、患者の転帰を改善する発見を加速させる可能性を秘めています。」
スポットライト: イベントシリーズ
Microsoft Research Forum
汎用AI時代の研究についての継続的な意見交換にご参加ください。最初の4エピソードをオンデマンドでご覧いただけます。
GigaTIMEは、腫瘍微小環境モデリングのための仮想集団を生成する
デジタル病理学は、染色された腫瘍組織の顕微鏡スライドを高解像度のデジタル画像に変換し、核や細胞質などの細胞形態の詳細を明らかにします。このようなスライドは画像あたりわずか5〜10ドルで、がん治療において日常的に利用可能になっています。H&Eに基づく細胞形態には細胞の状態に関する情報が含まれていることはよく知られています。昨年、私たちはギガピクセルH&Eスライドにトランスフォーマーアーキテクチャをスケーリングするための最初のデジタル病理学基盤モデルであるGigaPathをリリースしました。その後、マウントサイナイ病院とメモリアル・スローン・ケタリングがんセンターの研究者らは、世界的な前向き試験において、それが精密腫瘍学のトリアージのための主要なバイオマーカーをH&Eスライドから確実に予測できることを示しました。しかし、このような先行研究は一般的に、組織全体にわたる平均的なバイオマーカー状態に限定されていました。したがって、GigaTIMEは、腫瘍微小環境モデリングに不可欠な空間分解された単一細胞状態を予測することを学習することで、大きな前進を表しています。これにより、大規模なTIME分析のための仮想mIF画像の仮想集団を生成することが可能になります(図1)。
GigaTIMEは、病理スライドを空間プロテオミクス画像に変換するマルチモーダルAIモデルを学習し、細胞形態と細胞状態を橋渡しする
GigaTIMEは、プロビデンスから提供された対になったH&EスライドとmIF画像を持つ4,000万細胞を用いて訓練することで、デジタル病理学から空間多重プロテオミクスへのクロスモーダルAI翻訳モデルを学習しました。私たちの知る限り、これは仮想mIF生成のスケーリングのためにマルチモーダルAIを探求する初の大規模研究です。高品質の対データにより、従来の最先端手法と比較してはるかに正確なクロスモーダル翻訳が可能になりました(図2)。
仮想集団は、細胞状態と主要バイオマーカー間の関連性を集団規模で発見することを可能にする
GigaTIMEをプロビデンスの実世界データに適用することで、仮想mIFと主要な臨床属性を持つ14,256人の患者からなる仮想集団を生成しました。多重仮説検定を補正した後、腫瘍免疫細胞状態(CD138、CD20、CD4)と臨床バイオマーカー(腫瘍変異負荷、KRAS、KMT2D)との間に、がん種全体からがんサブタイプまで、1,234の統計的に有意な関連性を特定しました(図3)。これらの発見の多くは既存の文献によって支持されています。例えば、MSI-highおよびTMB-highは、CD138などのTIME関連チャネルの活性化増加と関連していました。さらに、仮想集団は、免疫活性化と腫瘍抑制遺伝子KMT2Dや癌遺伝子KRASなどの主要な腫瘍バイオマーカーとの間の、がん種全体にわたる関連性など、これまで知られていなかった関連性も明らかにしました。
仮想集団は、患者層別化のための腫瘍免疫シグネチャを集団規模で発見することを可能にする
仮想集団はまた、がん種全体からがんサブタイプまで、病期および生存プロファイルにわたって効果的な患者層別化のためのGigaTIMEシグネチャを明らかにしました(図4)。先行研究では、CD3やCD8などの個々の免疫タンパク質に基づく患者層別化が探求されてきました。私たちは、GigaTIMEによってシミュレートされたCD3およびCD8が同様に有効であることを発見しました。さらに、21のタンパク質チャネルすべてにわたる結合されたGigaTIMEシグネチャは、個々のチャネルと比較してさらに優れた患者層別化を達成しました。
仮想集団は、興味深い空間的および組み合わせ的相互作用を明らかにする
仮想集団は、GigaTIME仮想タンパク質チャネル全体にわたる興味深い非線形相互作用を明らかにし、シャープネスやエントロピーなどの空間的特徴、およびAPCやKMT2Dなどの主要な臨床バイオマーカーとの関連性を明らかにしました(図6)。このような組み合わせ研究は、mIFデータの不足により、これまで手の届かないものでした。
TCGAによる独立した外部検証
私たちは、The Cancer Genome Atlas(TCGA)データセットの10,200人の患者にGigaTIMEを適用し、GigaTIMEによってシミュレートされた仮想mIFとTCGAで利用可能な臨床バイオマーカーとの間の関連性を研究することで、独立した外部検証を実施しました。プロビデンスとTCGAからの仮想集団間に有意な一致が観察され、がんサブタイプ全体での仮想タンパク質活性化についてスピアマン相関0.88を示しました。また、2つの集団は、GigaTIMEシミュレートされたタンパク質活性化と臨床バイオマーカーとの間の関連性において、有意な重複を明らかにしました(フィッシャーの正確確率検定 p < 2 × 10−9)。一方、プロビデンスの仮想集団はTCGAよりも33%多い有意な関連性をもたらし、臨床発見のための大規模で多様な実世界データの価値を浮き彫りにしました。
GigaTIME
原文を表示
The convergence of digital transformation and the GenAI revolution creates an unprecedented opportunity for accelerating progress in precision health. Precision immunotherapy is a poster child for this transformation. Emerging technologies such as multiplex immunofluorescence (mIF) can assess internal states of individual cells along with their spatial locations, which is critical for deciphering how tumors interact with the immune system. The resulting insights, often referred to as the “grammar” of the tumor microenvironment, can help predict whether a tumor will respond to immunotherapy. If it is unlikely to respond, these insights can also inform strategies to reprogram the tumor from “cold” to “hot,” increasing its susceptibility to treatment.
This is exciting, but progress is hindered by the high cost and limited scalability of current technology. For example, obtaining mIF data of a couple dozen protein channels for a tissue sample can cost thousands of dollars, and even the most advanced labs can barely scale it to a tiny fraction of their available tissue samples.
In our paper published in Cell on December 9, “Multimodal AI generates virtual population for tumor microenvironment modeling (opens in new tab),” we present GigaTIME (opens in new tab), a multimodal AI model for translating routinely available hematoxylin and eosin (H&E) pathology slides to virtual mIF images. Developed in collaboration with Providence and the University of Washington, GigaTIME was trained on a Providence dataset of 40 million cells with paired H&E and mIF images across 21 protein channels. We applied GigaTIME to 14,256 cancer patients from 51 hospitals and over a thousand clinics within the Providence system. This effort generated a virtual population of around 300,000 mIF images spanning 24 cancer types and 306 cancer subtypes. This virtual population uncovered 1,234 statistically significant associations linking mIF protein activations with key clinical attributes such as biomarkers, staging, and patient survival. Independent external validation on 10,200 Cancer Genome Atlas (TCGA) patients further corroborated our findings.
To our knowledge, this is the first population-scale study of tumor immune microenvironment (TIME) based on spatial proteomics. Such studies were previously infeasible due to the scarcity of mIF data. By translating readily available H&E pathology slides into high-resolution virtual mIF data, GigaTIME provides a novel research framework for exploring precision immuno-oncology through population-scale TIME analysis and discovery. We have made our GigaTIME model publicly available at Microsoft Foundry Labs (opens in new tab) and on Hugging Face (opens in new tab) to help accelerate clinical research in precision oncology.
“GigaTIME is about unlocking insights that were previously out of reach,” explained Carlo Bifulco, MD, chief medical officer of Providence Genomics and medical director of cancer genomics and precision oncology at the Providence Cancer Institute. “By analyzing the tumor microenvironment of thousands of patients, GigaTIME has the potential to accelerate discoveries that will shape the future of precision oncology and improve patient outcomes.”
Spotlight: Event Series
Microsoft Research Forum
Join us for a continuous exchange of ideas about research in the era of general AI. Watch the first four episodes on demand.
GigaTIME generates a virtual population for tumor microenvironment modeling
Digital pathology transforms a microscopy slide of stained tumor tissue into a high-resolution digital image, revealing details of cell morphology such as nucleus and cytoplasm. Such a slide only costs $5 to $10 per image and has become routinely available in cancer care. It is well known that H&E-based cell morphology contains information about the cellular states. Last year, we released GigaPath, the first digital pathology foundation model for scaling transformer architectures to gigapixel H&E slides. Afterward, researchers at Mount Sinai Hospital and Memorial Sloan Kettering Cancer Center showed in a global prospective trial that it can reliably predict a key biomarker from H&E slides for precision oncology triaging. However, such prior works are generally limited to average biomarker status across the entire tissue. GigaTIME thus represents a major step forward by learning to predict spatially resolved, single-cell states essential for tumor microenvironment modeling. In turn, this enables us to generate a virtual population of mIF images for large-scale TIME analysis (Figure 1).
GigaTIME learns a multimodal AI model to translate pathology slides into spatial proteomics images, bridging cell morphology and cell states
GigaTIME learned a cross-modal AI translator from digital pathology to spatial multiplex proteomics by training on 40 million cells with paired H&E slides and mIF images from Providence. To our knowledge, this is the first large-scale study exploring multimodal AI for scaling virtual mIF generation. The high-quality paired data enabled much more accurate cross-modal translation compared to prior state-of-the-art methods (Figure 2).
Virtual population enables population-scale discovery of associations between cell states and key biomarkers
By applying GigaTIME to Providence real-world data, we generated a virtual population of 14,256 patients with virtual mIF and key clinical attributes. After correcting for multiple hypothesis testing, we have identified 1,234 statistically significant associations between tumor immune cell states (CD138, CD20, CD4) and clinical biomarkers (tumor mutation burden, KRAS, KMT2D), from pan-cancer to cancer subtypes (Figure 3). Many of these findings are supported by existing literature. For example, MSI high and TMB high associated with increased activations of TIME-related channels such as CD138. Additionally, the virtual population also uncovered previously unknown associations, such as pan-cancer associations between immune activations and key tumor biomarkers, such as the tumor suppressor KMT2D and the oncogene KRAS).
Virtual population enables population-scale discovery of tumor immune signatures for patient stratification
The virtual population also uncovered GigaTIME signatures for effective patient stratification across staging and survival profiles (Figure 4), from pan-cancer to cancer subtypes. Prior studies have explored patient stratification based on individual immune proteins such as CD3 and CD8. We found that GigaTIME-simulated CD3 and CD8 are similarly effective. Moreover, the combined GigaTIME signature across all 21 protein channels attained even better patient stratification compared to individual channels.
Virtual population uncovers interesting spatial and combinatorial interactions
The virtual population uncovered interesting non-linear interactions across the GigaTIME virtual protein channels, revealing associations with spatial features such as sharpness and entropy, as well as with key clinical biomarkers like APC and KMT2D (Figure 6). Such combinatorial studies were previously out of reach given the scarcity of mIF data.
Independent external validation on TCGA
We conducted an independent external validation by applying GigaTIME to 10,200 patients in The Cancer Genome Atlas (TCGA) dataset and studied associations between GigaTIME-simulated virtual mIF and clinical biomarkers available in TCGA. We observed significant concordance across the virtual populations from Providence and TCGA, with a Spearman correlation of 0.88 for virtual protein activations across cancer subtypes. The two populations also uncovered a significant overlap of associations between GigaTIME-simulated protein activations and clinical biomarkers (Fisher’s exact test p < 2 × 10−9). On the other hand, the Providence virtual population yielded 33% more significant associations than TCGA, highlighting the value of large and diverse real-world data for clinical discovery.
GigaTIME is a promising step toward the moonshot of “virtual patient”
By learning to translate across modalities, GigaTIME is a promising step toward “learning the language of patients” for the ultimate goal of developing a “virtual patient”, a high-fidelity digital twin that could one day accurately forecast disease progression and counterfactual treatment response. By converting routinely available cell morphology data into otherwise scarce high-resolution cell states signals, GigaTIME demonstrated the potential in harnessing multimodal AI to scale real-world evidence (RWE) generation.
Going forward, growth opportunities abound. GigaTIME can be extended to handle more spatial modalities and cell-state channels. It can be integrated into advanced multimodal frameworks such as LLaVA-Med to facilitate conversational image analysis by “talking to the data.” To facilitate research in tumor microenvironment modeling, we have made GigaTIME open-source (opens in new tab) on Foundry Labs (opens in new tab) and Hugging Face (opens in new tab).
GigaTIME is a joint work with Providence and the University of Washington’s Paul G. Allen School of Computer Science & Engineering. It reflects Microsoft’s larger commitment to advancing multimodal generative AI for precision health (opens in new tab), with other exciting progress such as GigaPath, BiomedCLIP, LLaVA-Rad (opens in new tab), BiomedJourney, BiomedParse, TrialScope, Curiosity.
Paper co-authors: Jeya Maria Jose Valanarasu, Hanwen Xu, Naoto Usuyama, Chanwoo Kim, Cliff Wong, Peniel Argaw, Racheli Ben Shimol, Angela Crabtree, Kevin Matlock, Alexandra Q. Bartlett, Jaspreet Bagga, Yu Gu, Sheng Zhang, Tristan Naumann, Bernard A. Fox, Bill Wright, Ari Robicsek, Brian Piening, Carlo Bifulco, Sheng Wang, Hoifung Poon
Related publications
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day
BiomedJourney: Counterfactual Biomedical Image Generation by Instruction-Learning from Multimodal Patient Journeys
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs
BiomedParse: a biomedical foundation model for image parsing of everything everywhere all at once
LLaVA-Rad MIMIC-CXR Annotations
Multimodal AI generates virtual population for tumor microenvironment modeling
Meet the authors
General Manager, Real-World Evidence
Jeya Maria Jose Valanarasu
Senior Researcher
Principal Researcher
Assistant Professor
Paul G. Allen School of Computer Science & Engineering, University of Washington
Artificial intelligence
Medical, health and genomics
Microsoft Health Futures
GigaPath: Foundation Model for Digital Pathology


![Figure 1. GigaTIME enables population-scale tumor immune microenvironment (TIME) analysis. A, GigaTIME inputs a hematoxylin and eosin (H&E) whole-slide image and outputs multiplex immunofluorescence (mIF) across 21 protein channels. By applying GigaTIME to 14,256 patients, we generated a virtual population with mIF information, leading to population-scale discovery on clinical biomarkers and patient stratification, with independent validation on TCGA. B, Circular plot visualizing a TIME spectrum encompassing the GigaTIME-translated virtual mIF activation scores across different protein channels at the population scale, where each channel is represented as an individual circular bar chart segment. The inner circle encodes OncoTree, which classifies 14,256 patients into 306 subtypes across 24 cancer types. The outer circle groups these activations by cancer types, allowing visual compariso
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み