癌治験の95%失敗率をTransformersで解決 — NoetikのRon Alfa & Daniel Bear
NoetikのRon AlfaとDaniel Bearは、GSKとの5000万ドルのライセンス契約を背景に、TARIO-2トランスフォーマーを用いて空間トランスクリプトミクスデータをH&E染色から予測し、がん臨床試験の成功率向上を目指すプラットフォームビジネスを展開している。
キーポイント
GSKとの大型ライセンス契約
NoetikはGSKと5000万ドルの契約を結び、長期的なモデルライセンス(TARIO-2など)を含む包括的なパートナーシップを締結した。
空間トランスクリプトミクスの予測技術
TARIO-2は、患者が既に受けているH&E染色アッセイデータから、約19,000遺伝子の空間マップを予測する autoregressive transformer モデルであり、高価な空間トランスクリプトミクス検査の代替として機能する。
ソフトウェアライセンスモデルの転換
多くのバイオテック企業が自社創薬に注力する中、Noetikはプラットフォームのソフトウェアライセンスを提供するモデルを採り、製薬企業のツールへの関心が高まっていることを示している。
臨床試験の成功率向上への貢献
がん治療の95%が臨床試験で失敗する理由を「患者と腫瘍、治療法のマッチング」の問題とし、AIによる精密な解析で成功率を劇的に向上させる可能性を示唆している。
Noetikのモデルがもたらす可能性
既存で安全だが効果不確実な薬剤のテストや、臨床試験通過率の高い薬剤の発見を支援し、新薬開発プロセスを加速させる。
ラボから臨床への転送における課題と解決
ドラッグ開発の最大のボトルネックである「ラボから臨床への転送」を、バイオマーカーを用いたより良いコホート選択によって改善できる可能性がある。
AI技術の高度なデータ処理能力
Noetikは空間トランスクリプトミクス、空間プロテオミクス、H&Eイメージング、全エクソームシーケンシングの4つのモダリティを扱い、1000以上のチャンネルを持つ空間トランスクリプトミクスデータセットを特徴とする。
影響分析・編集コメントを表示
影響分析
このニュースは、バイオテック分野におけるAIの役割が「新薬発見」から既存治療法の最適化と臨床試験の効率化へとシフトしていることを示しています。特に、高価な検査を安価で入手可能なデータから推測する技術は、医療の公平性とアクセシビリティを向上させる可能性があります。また、製薬大手がソフトウェアライセンスに多額投資することは、AI医薬品開発ツールの市場成熟度を示す重要な指標です。
編集コメント
製薬企業がAIツールのライセンスに巨額を投じることは、AI医薬品開発エコシステムの成熟を示す明確な信号です。特に「創薬」だけでなく「既存治療の最適化」という応用領域での成功事例は、投資家や業界関係者にとって重要な示唆となります。
今日は、ゲストからのこの「クリックベイト」的な記事について解説します!

その通りですが、あなたが考えるような意味ではありません!
TL;DR(要約):がん治療の95%が臨床試験に失敗していますが、これは「マッチング」の問題かもしれません。患者がどの腫瘍を持ち、それがどの治療に反応するかをよりよく理解できれば、成功率は劇的に向上し、すでに存在する治療法によって何百万もの命を救うことができます。
本日公開される完全なエピソードをご覧ください:
なぜ大手製薬会社がAIモデルをライセンスしているのか
トルストイは有名に、「健康な細胞はみな似通っているが、がん細胞はそれぞれ独自の不幸を抱えている」と書きました。あるいはそれに似たようなことです。がんほど誤解されている病気はないかもしれません。それは単一の疾患ではなく、疾患のファミリーです。それぞれが独自の基礎生物学を持つ、数百、あるいは数千もの固有の疾患があります。この視点に立てば、「がんを治す」と言うのは、レゴブロックの問題を解決すると宣言するようなものです。
私たちはAIががんを治すだろうとよく耳にしますが、残念ながらそれほど簡単ではありません。今日のゲストであるNoetikのRon Alfa氏とDaniel Bear氏は、治療開発プロセスにおける中核的なボトルネックをAIを使って打破できると考えています。
GSKは、世界最大級の腫瘍空間トランスクリプトミクス(tumor spatial transcriptomics)データセットの一つで学習した自己回帰型トランスフォーマー「TARIO-2」など、Noetikのモデルに関する(非開示の)長期ライセンス契約を含む技術で、5000万ドルの取引を最近締結しました。ホールプレックス空間トランスクリプトミクス(Whole-plex spatial transcriptomics)は、腫瘍を読み取る最も豊富な方法であり、標準的な治療を受けるがん患者の約0%がこれを受けていますが、TARIO-2は現在、すべての患者がすでに持っているH&E染色(H&E assay)から約19,000遺伝子の空間マップを予測することができます。
バイオテック分野における主要なAIの取り組みは、主に創薬(discovery)に焦点を当てており、通常は社内での開発努力につながります(つまり、ツール会社はしばしば製薬会社になります)。この取引が際立っているのは、それがソフトウェアライセンス契約であり、特定の薬剤ではなくプラットフォームへのコミットメントを表している点です。
創薬開発のための他のソフトウェアツール(例えば、BoltzのエピソードやIsomorphicを参照)への関心が高まる中、製薬企業のバイオテックツールに対する需要がついに成長し始めているように見えてきました。なぜ突然の関心が寄せられているのでしょうか?
がんは難しい
生物学は難しいが、がんはさらに難しい。しかしその notwithstanding、私たちは驚くべき進歩を遂げてきました。20年前であれば死の宣告であった多くのがんが、今では日常的に生存可能となっています。かつて私たちの主要な戦略は化学療法、つまり毒を投与して腫瘍が患者より先に死ぬことを願うことでした。現在では、実際に腫瘍を殺し、他の部分を無傷のままにする治療法が数多く存在します。KeytrudaやOpdivoのような免疫チェックポイント阻害剤は、数十種類の腫瘍の防御機構を標的とします。CAR-T療法では、B細胞悪性腫瘍を非常に正確に標的とするよう修正されたT細胞が血液に加えられます。Trastuzumabのような抗体薬物複合体(Antibody Drug Conjugates)は、薬剤と抗体を組み合わせることで、非常に特定の(がん)細胞を標的とすることができます。私たちは本当に素晴らしい時代に生きているのです。
その一方で、まだ道のりは遠いです。奇跡的な治療法があるがんの種類ごとに、依然として死の宣告となるがんがはるかに多く存在します。世界では年間200億〜300億ドルをがん治療の研究に費やし、毎年数百の臨床試験が行われています。しかし、進歩は緩やかで、臨床試験の失敗率は95%に達しています。

実験室での成果は臨床現場に直結しない
私たちは何かを見落としているのだろうか?その答えがNoetikとRon Alfaにある。Ronの核心的な主張は、これらの「失敗した」治療法の多くが実際には機能しているという点だ。しかし、私たちは適切な腫瘍を持つ適切な患者を評価できていないのである。もし私たちが、がんの生物学的な多様性を本当に理解し、どの患者がどの治療に反応するかを把握する方法を持っていたなら、はるかに高い成功率を示すことが可能だったかもしれない。数百万人の生命(そして数十億ドルの資金)が、この課題にかかっていると言っても過言ではない。

出典
難しい部分:データ収集に対する盲目的な信頼
RonとNoetikは、データを収集するためにほぼ2年間を費やすという確固たる信念を持っていた。膨大、そしてさらに膨大な量のデータだ。Noetikは数千の実際のヒト腫瘍を取得し、数百億枚もの画像からなる大規模なマルチモーダルデータセット1を収集している。これにより、局所環境における細胞構成の詳細なマッピングを作成することが可能になる2。これらは本物のヒト腫瘍であり、フランケンシュタイン的なマウスモデルや不死化細胞株ではない。
このデータはその後、大規模な自己教師ありモデルに投入され、「仮想細胞」が作成されます。このモデルはがん生物学について深い理解を持っており、Noetik は腫瘍の種類を区別できることを慎重に示す作業を行ってきました。もしかすると、以前は異なるものとして識別されていなかった腫瘍まで!さらに最近では、モデルとデータをスケールアップする方法を見出し、スケーリング法則に上限がないことを確認しました!
Noetik のモデルは、患者が実験的な治療にどのように反応するかをシミュレートできます。彼らはパートナーと協力して、安全性が確認されているが効果がないことが示された有望な薬剤のテストを行っています。これらのモデルが期待通りに機能すれば、Noetik は新しい薬を開発することなく、患者に新たながん治療法をもたらすことができます!また、これらのモデルは、臨床試験を通過する可能性が高い薬剤への発見プロセスを導くことになります。これが GSK にとっていかに魅力的か想像に難くないでしょう。
見ていきましょう…
Ron と Dan は、彼らのモデルが有用な方法でコホート選択を真に支援するという説得力のある議論を行っていますし、これは価値があると思われます。そして、私たちは以下が明白であると信じています。
ラボから臨床への移行は、創薬開発における最大のボトルネックです。
バイオマーカーを用いたより良いコホート選択は、ラボから臨床への移行を改善する可能性があります。
Noetik はここですでにいくつかの成功を収めています。彼らがそれを確実な優位性に変換できるかどうか、私たちは見守ります。
少し技術的な話から離れて、がんの治癒はAIの非常に明確に肯定的な応用例です。しかし、それを解決するのは非常に困難な問題でもあります。私たちの推測では、多くの人々ががんに影響を受けているか、近い将来そうなるでしょう。そして、Noetikのような企業が素晴らしい仕事をしていることを知ることで、社会が直面する最も困難でエキサイティングな問題に取り組む世代のAIエンジニアたちにインスピレーションを与えられることを願っています。
全動画ポッドキャスト:
- 彼らの空間トランスクリプトミクスデータセットは、1000以上の「チャンネル」を特徴としており、これはかなり快挙です!
- 聴衆の中の専門家の皆様へ、Noetikがデータを収集する4つのモダリティは以下の通りです:空間トランスクリプトミクス、空間プロテオミクス、H&Eイメージング、そして全エクソームシーケンシング。
原文を表示
Today, we explain this piece of “clickbait” from our guest!

true, but not how you think!
TL;DR: 95% of cancer treatments fail to pass clinical trials, but it may be a matching problem — if we better understood what patients have which tumors which will respond to which treatments, success rates improve dramatically and millions of lives can be saved — with the treatments we ALREADY have.
See our full episode dropping today:
Why Big Pharma is licensing AI Models
Tolstoy famously wrote, ‘All healthy cells are alike; each cancer cell is unhappy in its own way.’ Or something like that. Cancer might be the most misunderstood disease out there. It’s not one disease, it’s a family of diseases. Hundreds, maybe thousands, of unique diseases each with its own underlying biology. With this lens, saying you’ll “cure cancer” is like saying you’ll solve legos.
We keep hearing AI will cure cancer, but sadly it may not be so easy. Today’s guests — Ron Alfa and Daniel Bear from Noetik — thinks they can use AI to break through a core bottleneck in the treatment development process.
GSK recently signed a $50M deal for their technology that also includes an (undisclosed) long-term licensing deals for Noetik’s models like the recently announced TARIO-2, an autoregressive transformer trained on one of the largest sets of tumor spatial transcriptomics datasets in the world. Whole-plex spatial transcriptomics is the richest way to read a tumor, and approximately ~0% of cancer patients going through standard care ever get one — and TARIO-2 can now predict an ~19,000-gene spatial map from the H&E assay every patient already has.
Most big AI plays in BioTech have focused on discovery, and usually result in an in-house development effort (meaning tools companies usually become drug companies). This deal stands out in that it is a software licensing deal, and represents a commitment to a platform rather than a drug.
With attention on other software tools for drug development (see the Boltz episode and Isomorphic for example), it is starting to look like the appetite of Pharma for biotech tools has finally started to grow. Why the sudden interest?
Cancer is hard
Biology is hard, cancer is harder. But despite this, we’ve made incredible progress. So many cancers that would have been death sentences twenty years ago are routinely survivable. It used to be our main strategy was just chemotherapy — poison you and hope the tumor dies before you do. Now, there are many treatments that actually kill a tumor and leave the rest of you intact! Immune checkpoint inhibitors like Keytruda and Opdivo target the defenses of dozens of tumor types. CAR-T therapy adds modified T-cells to your blood that can target B-cell malignancies very accurately. Antibody Drug Conjugates such as Trastuzumab combine a drug with an antibody, allowing it to target very specific (cancer) cells. We truly live in marvelous times.
With that said, we still have a long way to go. For every type of cancer with a miracle treatment, we have many more that are still death sentences. The world spends $20-30 billion a year trying to cure cancers, with hundreds of clinical trials yearly.Yet, progress is slow with a 95% failure rate in clinical trials.

The lab doesn’t translate to the clinic
Are we leaving something on the table? Enter Noetik and Ron Alfa. Ron’s core thesis is that many of these “failed” treatments actually work! But we’re not looking at the right patients with the right tumors. If only we had a way to really understand the unique types of cancer biologies and which patients will respond to which treatments, we might be able to show a much higher success rate. Millions of lives (and billions of dollars) may ride on this.

source
The Hard part: Blind Faith in Data Collection
Ron and Noetik had the conviction to spend almost two years just collecting data. Lots, and lots, and lots, of data. Noetik has acquired thousands of actual human tumors, and collects a large multimodal dataset1 of hundreds of millions of images that allows them to create a detailed map of the cell makeup in the local environment.2 These are real human tumors, not frankenstein mouse models or immortal cell lines.
This data is then fed into a massive self-supervised model, creating a “virtual cell”. This model has a deep understanding of cancer biology — Noetik has worked carefully to show it can distinguish different types of tumors. Maybe even tumors we didn’t identify as distinct previously! More recently they figured out how to scale up their model and data, and see no limit in their scaling laws!
Noetik’s models can simulate how a patient will respond to experimental treatments. They are working with partners to test promising drugs that were demonstrated to be safe, but not effective. If these models work as hoped, Noetik will bring new cancer treatments to patients without developing a new drug! Their models will also guide the discovery process towards drugs that are more likely to make it through clinical trials. You can imagine why this is so attractive to GSK.
We’ll see…
Ron and Dan make pretty persuasive arguments that their models will truly assist in cohort selection in useful ways and this seems valuable. And we think it’s pretty clear that
Translation from lab to clinic is the biggest bottleneck for drug development.
Better cohort selection using biomarkers is likely to improve translation from lab to clinic.
Noetik has already had some success here. We’ll see if they’re able to translate that into a reliable advantage.
Stepping back a bit from the technology, curing cancer is a pretty unambiguously positive application of AI. It is also a very hard problem to solve. Our guess is that most people have been impacted by cancer or will be at some point soon. And we hope that learning about the amazing work that companies like Noetik are doing will inspire a generation of AI engineers to work on the hardest and most exciting problems that society faces.
Full Video Pod:
1Their spatial transcriptomics dataset features over 1000 “channels”, that’s quite a feat!
2For those experts in the audience, the four modalities Noetik collects data on are: spatial transcriptomics, spatial proteomics, H&E imaging, and whole exome sequencing.
関連記事
LLM が実際にどのように動作するか(26 分読了)
TLDR AI は、大規模言語モデルの内部仕組みと動作原理を解説する記事を発表しました。
10 年以上続く深層学習の訓練方法に終止符:サカナ・ラボがメモリ壁を突破する新手法を発表
サカナ・ラボは、ネットワーク全体をメモリ上に保持する必要がない新しい訓練法を開発した。同社は順次処理を拡散モデルのノイズ除去のように扱い、深層モデルの訓練に必要なメモリ量を大幅に削減することに成功した。
精度を犠牲にせず LLM を高速化する手法
研究者らは国際会議 ICLR で、リアルタイム AI アプリケーションにおいて計算効率を損なわずに大規模言語モデルの速度を向上させる新フレームワークを発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み