AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Microsoft Research·2026年6月24日 23:00·約12分で読める

Talos:自動化された反復的ゲノム再解析による希少疾患診断の拡張

#ゲノム解析#オープンソース#医療 AI#Microsoft Research#自動化
TL;DR

Microsoft Research を含む国際共同チームが開発したオープンソースツール「Talos」は、希少疾患患者のゲノムデータを自動的に再解析し、診断精度を大幅に向上させる実証結果を発表しました。

AI深層分析2026年6月24日 23:04
5
最重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
5
革新性10%
5

キーポイント

1

自動化による高効率な再解析の実現

Talos は科学知識の進化に伴い蓄積されたゲノムデータを自動的に再評価し、偽陽性を抑えつつ(1.3 カンディデート/患者)、90% の診断を回復する精度を達成しました。

2

大規模コホートでの実証と診断率向上

未診断の約 5,000 人の患者を対象としたプロスペクティブコホートにおいて、241 の新たな診断(追加 5.1%)をもたらしました。

3

持続可能な運用モデルの確立

月次での反復サイクルにより、専門家によるレビューが必要な新変異は患者 200 人あたりわずか 1 つに抑えられ、大規模なシステム再解析の実用性を証明しました。

4

診断までの期間短縮

新たなエビデンスが公開されてから診断に至るまでの平均期間は約 32 日と非常に短く、迅速な臨床応答が可能であることを示しています。

5

保守的な設計と効率化

Talos は人間のレビュー時間がボトルネックとなるため、高信頼度の候補を少数に絞り込む保守的な戦略を採用し、再実行時には証拠が変更された変異のみを提示する。

6

実世界での高い再現率

1,089 人の患者を対象としたベンチマークでは、Talos は対象範囲内の診断の 90% を回復しつつ、家族あたり中央値でわずか 1.3 件の候補変異のみを返した。

7

動的な知識ベースへの対応

PanelApp Australia と ClinVar という継続的に更新される公的リソースを活用し、最新の遺伝子疾患関係や変異の病原性情報に基づいて候補をフィルタリングする。

影響分析・編集コメントを表示

影響分析

このニュースは、希少疾患診断における「データ蓄積の壁」を打破する画期的な解決策を示しており、AI を活用した自動化技術が医療現場の持続可能性に直接寄与できることを実証しています。特に、専門家のレビュー負荷を劇的に軽減しつつ診断率を向上させるモデルは、世界中の遺伝子検査機関における標準的な再解析プロセスの転換点となる可能性があります。

編集コメント

ゲノムデータの「再利用価値」を最大化し、医療リソースの制約を克服する実用的な AI ツールの登場は、希少疾患治療のパラダイムシフトを示唆しています。

image
image

一言で言うと

Talos は、希少疾患におけるゲノムデータの自動的・反復的な再解析を行うオープンソースツールです。科学知識の進展に伴い、保存されたシーケンシングデータを効率的に再検討し、新たに実用的なエビデンスが示された変異をフラグ付けします。

Talos は偽陽性率を低く抑えるように調整されています:ほぼ 1,100 人の患者からなる検証セット全体で、対象範囲内の診断の 90% を回復しつつ、専門家によるレビューが必要な候補変異は患者あたり平均 1.3 件に留まりました。これは、大規模な再解析を持続可能にするために不可欠です。

診断されていないほぼ 5,000 人の患者を対象とした前向きコホートにおいて展開された Talos は、241 の新たな診断(追加の検出率 5.1%)をもたらしました。支持エビデンスが公開されてから結果として得られた診断に至るまでの平均期間はわずか 32 日でした。

月次で反復されるサイクルにおいて、分析担当者がレビューする必要のある新しい変異は患者 200 人あたり 1 件のみであり、頻繁かつ体系的な再解析を持続可能に実行できることが実証されました。

なぜゲノム再解析が重要なのか

ゲノム検査は希少疾患の診断を変革しましたが、この進展があっても、最初の検査後でも患者の半数以上が未だ診断されていません。これは、私たちがゲノムに関する知識をまだ完全に把握していないからです。研究者たちは毎日、特定遺伝子の機能やそれらが疾患とどのように関連しているかについて新たな知見を得ています。

しかし、診断調査の多くとは異なり、ゲノムデータには独特な性質があります。それは、データを保存し、無期限に再検討できる点です。ゲノムに対する理解が絶えず向上しているため、後で分析を単純に再実行するだけで、当初は不可能だった診断が可能になることがあります。これは、毎年数百件の新しい遺伝子 - 疾患関連性や数千件の新しい変異分類が報告されるからです。

未診断患者のゲノムの再解析が解決策となります。約9,500人の未診断患者を対象としたメタ分析では、約2年間の再解析により診断率が約10%向上することが示されました。しかし、現在の再解析は圧倒的に手作業に依存しており、意欲的な臨床医や限られた検査スタッフ、一貫性のない報酬制度に頼っています。その結果、保存されたゲノムの绝大多数が再検討されることなく放置され、データは蓄積し続ける一方です。自動化が長年解決策として提案されてきましたが、自動化システムの開発者は、感度(sensitivity)、特異度(specificity)、人間がレビューすべき候補変異の数、そして分析を再実行する頻度という、困難なトレードオフの間を慎重に進む必要があります。

Talos(新しいタブで開く)は、人口ゲノミクスセンター、オーストラリア・ジェノミクス、ブロード研究所、マイクロソフトにまたがる協力体制によって開発され、これらのトレードオフを解決し、国際的な規模において体系的な再解析が実現可能かつ価値あるものであることを実証するために構築されました。私たちは最近、Talos の機能と複数の希少疾患コホートにおけるその性能を評価した学術論文(新しいタブで開く)を発表しました。

Talos の仕組み

Talos は、実行するたびに患者の既存の変異呼出値を最新のコミュニティ知見に対して再解釈します。これは、遺伝子 - 疾患関係と遺伝様式に関する情報を提供する PanelApp Australia(新しいタブで開く)と、変異レベルの病原性に関する情報を提供する ClinVar(新しいタブで開く)という、2 つの継続的に更新されるパブリックリソースを活用しています。その後、臨床報告のための ACMG/AMP 基準を満たす可能性が最も高い変異を浮き彫りにするように設計された変異優先順位付けアルゴリズムを適用します。

imageimage図 1 – Talos の概要。Talos は複数の段階で動作し、まず遺伝子変異とそれを持つ患者に関する不変の情報を収集し、次に臨床的に関連する可能性が高い変異をフィルタリングして優先順位をつけるために最新知見を適用し、最後にこれらの変異を支援証拠とともに臨床医に提示します。

このパイプラインは、新たに発見された情報を活用して変異をタグ付けおよびフィルタリングし、その後、家族構造(例えば遺伝様式や de novo 状態)を用いて候補セットを精緻化します。また、利用可能な場合は患者の表現型も参照されます。Talos は、エクソームまたはゲノムデータから得られる一塩基多型、小規模な挿入・欠失、コピー数変異、および大規模な構造変異を解釈するために使用できます。

Talos を特徴づける2つの設計上の選択があります。第一に、それは意図的に保守的であり、長い順位付けリストではなく、高信頼度の変異の小さなセットを返すように最適化されています。これは、現実世界のゲノム再解析においてボトルネックとなるのはアルゴリズムの再現性ではなく、人間のレビュー時間であるためです。第二に、繰り返し実行する際、Talos は前回のサイクル以降で支持証拠が変化した変異のみを返します。これにより、臨床医は真に新しい所見に専念して注力することが可能になります。

専門家の手動分析に対して検証済み

Talos のベンチマークは、すでに慎重な手動分析を経た2つの独立したコホートにおいて実施されました。1 つは、重篤な乳幼児および小児を対象としたオーストラリアの急性ケアゲノム(ACG)コホートであり、もう 1 つは、以前に有益でない検査結果を得ていた家族を対象とした米国発の希少ゲノムプロジェクト(RGP)コホートです。これには合計で 1,089 の症例が含まれていました。

ACG トリオにおいて、Talos は対象範囲内の診断の 90% を回復し、1 家族あたり中央値でわずか 1.3 の候補バリアントを返しました。見逃された診断は主にその保守的な戦略の結果であり、具体的には ClinVar のサポートがない劣性変異や、人間のアナリストがトランス構成または機能研究を用いて分類した変異などです。

重要なのは、Talos が非常に異なる RGP コホートにおいても同じ運用ポイントを保ったことです。RGP コホートとは、以前に非情報的な臨床検査を受けた家族のグループであり、症例患者(プロバンド)は最大 82 歳まで含まれていました。RGP トリオにおいて、Talos は 1 トリオあたり中央値で 1.3 の候補バリアントを返すことで、対象範囲内の診断の 87%(54 件中 47 件)を回復し、コホート間での一般化可能性を示しました。

次に、広く使用されている優先順位付けツールである Exomiser と直接比較するベンチマークを行いました。Talos は小規模変異に関する全体的な感度で Exomiser に匹敵しましたが、運用ポイントは大きく異なりました。Exomiser は広範なリストをランク付けして返すのに対し、Talos は短く非常に特異性の高いリストを返します。ペア比較において、Exomiser のランク付けされた変異すべてを検討した場合、両ツールの性能は統計的に区別できませんでしたが、現実的な予算(上位 5 つ:p = 0.017 または上位 1 つ)に限定して検討を行った場合、Talos が顕著に優位でした。これは、両ツールが異なる変異を捉えるため補完的であり、診断ワークフローでは理想的には併用すべきであることを示しています。

Spotlight: AI-POWERED EXPERIENCE

image
image

Microsoft research copilot experience

AI によって駆動される体験を通じて、Microsoft の研究についてさらに詳しく知る

今すぐ始める

新しいタブで開く

国際規模で展開された実験

最も興奮した実験は、オーストラリアのゲノム研究と単一の診断研究所から抽出された、4,735 人のテスト済みだが未診断のコホートでした。ほとんどの患者は、神経発達、心臓、腎臓、および/または神経学的な兆候を有する一人っ子でした。

Talos は 238 人において 241 の新たな診断を生み出し、これは 5.1% の追加的な検出率であり、すべての可能性のある原因変異はその後、認定された研究所によって病原性またはおそらく病原性と確認されました。

これらの診断の源泉は、なぜ再解析がそれほど強力なパラダイムであるかを示しています:

32% は元のテスト以降に発見された新たな遺伝子 - 疾患関係からのものであり、

22% は新たな変異レベルのエビデンス(再分類)からのものであり、

45% はフィルタリングと分析の改善からのものでした。これには、当初は検討されなかった CNV や構造的変異などの変異タイプ、あまりに狭く設定されていた表現型フィルター、およびその他の源泉が含まれます。

診断率は臨床領域全体で一貫しており(神経発達、心臓、腎臓の各適応症で約 5–6%)、その理由はそれぞれ異なりました:神経発達の診断では新規遺伝子関連性と CNV が支配的でしたが、心臓の診断の多くは変異の再分類によって導かれました。ゲノムデータはエクソーム(6.1% vs 4.8%)を上回っており、これは非コード領域の診断、例えば RNU4-2 や MRPL39 の深部イントロン変異などにも到達したためです。繰り返されるテーマとして、従来の知識ベースにおける遅れが挙げられます:再解析時点では、新規遺伝子 - 疾患関連診断の 59% がまだ OMIM でキュレーションされておらず、PanelApp Australia のように急速に更新されるリソースを活用する価値を浮き彫りにしています。

単発イベントから継続的なプログラムへ

その後、Talos を29ヶ月にわたる反復サイクルで実行しました。診断の大部分(92%)はコホートにおける最初のパスで得られましたが、反復設計は二つの側面でその価値を実証しました。第一に、継続的な再解析のスケーラビリティを示しました:後のサイクルでは新規に臨床的意義を持つ証拠のみが返されるため、プログラム全体を通じて平均して200症例あたりわずか1つのバリアントが検出されました。第二に、科学的発見から診断に至るまでのスピードをどのように実現できるかを示しました:公的データベースに新たな知見が現れてから患者が診断を受けるまでにかかった時間は平均でわずか32日であり、最速のケースでは単なる1日で完了しました。図2は、新しい科学的知見から数週間以内に家族に回答をもたらすことができる継続的な再解析の仕組みを示す3症例のタイムラインを提供しています。この全体のパイプラインは、連続して実行するのに十分なほど安価です:ゲノム1,000個のアノテーションには約11ドルのコストがかかり、月次の再解析パスではコホートあたり数セントで済みました。

imageimage図 2 – 3 人の症例患者における診断までの道のり。各患者は遺伝子配列解析後、診断に至るまで数年を要しました。患者 1 の場合、診断を可能にした科学的発見は検査から 1 ヶ月後に起こりましたが、Talos を用いて遺伝子データを初めて再解析するまでは診断されませんでした。一方、患者 2 と 3 は、関連する科学的知見が得られてから 1 ヶ月以内に診断されました。これは、両者がすでに再解析パイプラインに含まれていたためです。

展望

Talos は、希少疾患の遺伝子データ再解析を「稀で労働集約的なイベント」から、「科学の進展に追いつきうる継続的かつ自動化されたプログラム」へと捉え直します。特異性の最適化により、専門家のレビュー時間の現実的なボトルネックを尊重し、PanelApp Australia や ClinVar といったオープンに共有され頻繁に更新されるリソースを活用することで、世界中のコミュニティが蓄積した知識を個々の患者への診断に変換します。多くの場合、このプロセスは数週間で完了します。

私たちはここに基盤となる能力を確立したと考えており、コミュニティがこれをどのように発展させていくかを楽しみにしています。特に、遺伝的変異の影響を理解・予測するためのより高度な AI モデルが利用可能になるにつれ、未解決の希少疾患症例の再解析においてそれらを活用していくことを楽しみにしています。

Talos はオープンソースであり、Azure などのクラウド環境でのデプロイも容易です。当社の研究成果は、診断を求めてなお待ち続ける多くの患者に対して、頻繁かつスケーラブルな再解析を提供しようとする医療システムにとって、実用的な青写真となります。

GitHub

Nature Publication

新しいタブで開きますこの投稿「Talos: 自動化された反復的なゲノム再解析による希少疾患診断のスケーリング」は、Microsoft Research の記事として最初に掲載されました。

原文を表示
image
image

At a glance

Talos is an open-source tool for automated, iterative reanalysis of genomic data in rare disease. It efficiently re-examines stored sequencing data as scientific knowledge evolves and flags variants with newly actionable evidence.

Talos is tuned for a low false-positive rate: across a validation set of nearly 1,100 patients, it recovered 90% of in-scope diagnoses while flagging only 1.3 candidate variants per patient for expert review. This is essential to making reanalysis sustainable at scale.

Deployed across a prospective cohort of almost 5,000 undiagnosed patients, Talos delivered 241 new diagnoses (5.1% additional yield). An average of only 32 days passed between supporting evidence becoming public and the resultant diagnosis.

On monthly iterative cycles, analysts only needed to review one new variant per 200 patients, demonstrating that frequent, systematic reanalysis can be run sustainably.

Why genome reanalysis matters

Genomic testing has transformed the diagnosis of rare disease, but even with this advancement, more than half of patients remain undiagnosed after their first test. This is because our knowledge of the genome is still incomplete. Researchers are learning more every day about the function of specific genes and how they relate to disease.

However, unlike most diagnostic investigations, genomic data has a unique property: it can be stored and reexamined indefinitely. Because our understanding of the genome improves constantly, simply rerunning the analysis later can yield a diagnosis that was impossible to make the first time. This is because there are hundreds of new gene–disease associations and thousands of new variant classifications reported every year.

Reanalysis of the genomes of undiagnosed patients is the solution; a meta-analysis of nearly 9,500 undiagnosed patients found that reanalysis lifted diagnostic yield by about 10% over roughly two years. However, the problem is that reanalysis today is overwhelmingly manual. It depends on motivated clinicians, scarce laboratory staff, and inconsistent reimbursement, so the vast majority of stored genomes are never revisited and the data keep accumulating. Automation has long been proposed as the answer, but the developers of automated machinery must navigate hard trade-offs between sensitivity, specificity, how many candidate variants a human must review, and how often the analysis is rerun.

Talos (opens in new tab), developed through a collaboration spanning the Centre for Population Genomics, Australian Genomics, the Broad Institute, and Microsoft, was built to resolve those trade-offs and to demonstrate, at international scale, that systematic reanalysis is both feasible and valuable. We have recently published a journal article (opens in new tab) detailing how Talos functions and evaluating its performance on multiple rare disease cohorts.

How Talos works

Talos re-interprets a patient’s existing variant calls against the latest community knowledge each time it runs. It draws on two continuously updated public resources: PanelApp Australia (opens in new tab) for gene–disease relationships and modes of inheritance, and ClinVar (opens in new tab) for variant-level pathogenicity. It then applies a variant-prioritization algorithm designed to surface variants most likely to meet ACMG/AMP criteria for clinical reporting.

imageimageFigure 1 – Talos overview. Talos operates in multiple stages, first collecting unchanging information about genetic variants and the patients who possess them, then applying up to date knowledge to filter and prioritize variants that are likely to be clinically relevant, then finally surfacing those variants to clinicians alongside supporting evidence.

The pipeline uses newly discovered information to tag and filter variants, then refines the candidate set using family structure (for example, mode of inheritance and de novo status) and, when available, the patient’s phenotype. Talos can be used to interpret single-nucleotide variants, small insertions/deletions, copy number variants, and large structural variants from exome or genome data.

Two design choices distinguish Talos. First, it is deliberately conservative, optimized to return a small set of high confidence variants rather than a long ranked list, because in real-world genomic reanalysis the limiting factor is human review time, not algorithmic recall. Second, on repeat runs, Talos returns only variants whose supporting evidence has changed since the previous cycle, allowing clinicians to focus exclusively on findings that aregenuinely new.

Validated against expert manual analysis

We benchmarked Talos on two independent cohorts that had already undergone careful manual analysis: the Australian Acute Care Genomics (ACG) cohort of critically ill infants and children, and the U.S.-based Rare Genomes Project (RGP) cohort of families with prior uninformative testing. This included 1,089 probands in total.

On ACG trios, Talos recovered 90% of in-scope diagnoses while returning a median of just 1.3 candidate variants per family. The diagnoses it missed were largely a direct consequence of its conservative strategy, for example, recessive variants lacking ClinVar support that human analysts had classified using trans configuration or functional studies.

Crucially, Talos held the same operating point on the very different RGP cohort, agroup of families who had previously had uninformative clinical testing, with probands ranging up to 82 years of age. On RGP trios, it recovered 87% of in-scope diagnoses (47 of 54) at a median of 1.3 candidate variants per trio, showing generalizability across cohorts.

We then benchmarked head-to-head against Exomiser, a widely used prioritization tool. Talos matched its overall sensitivity for small variants, but at a very different operating point: Exomiser ranks and returns a broad list, while Talos returns a short, highly specific one. In a paired comparison, the two tools were statistically indistinguishable when all of Exomiser’s ranked variants were reviewed, but Talos came out significantly ahead once review was limited to a realistic budget—the top five (p = 0.017) or top one (p different variants, so they are complementary and should ideally be used together in diagnostic workflows.

Spotlight: AI-POWERED EXPERIENCE

imageimage

Microsoft research copilot experience

Discover more about research at Microsoft through our AI-powered experience

Start now

Opens in a new tab

Deployed on an international scale

The experiment we were most excited about was a tested-but-undiagnosed cohort of 4,735 individuals, drawn from Australian Genomics research studies and a single diagnostic laboratory. Most patients were singletons with neurodevelopmental, cardiac, renal, and/or neurological indications.

Talos produced 241 new diagnoses in 238 individuals—a 5.1% additional yield, with every single likely-causative variant subsequently confirmed as pathogenic or likely pathogenic by accredited labs.

The sources of those diagnoses illustrate why reanalysis is such a powerful paradigm:

32% came from new gene–disease relationships discovered since the original test,

22% came from new variant-level evidence (reclassifications), and

45% came from improved filtering and analysis—including variant types such as CNVs and structural variants not examined originally, phenotype filters that had been set too narrowly, and other sources.

Yield was consistent across clinical areas (roughly 5–6% for neurodevelopmental, cardiac, and renal indications) but the reasons differed: new gene associations and CNVs dominated neurodevelopmental diagnoses, while variant reclassification drove most cardiac ones. Genome data outperformed exome (6.1% vs 4.8%), partly by reaching non-coding diagnoses such as RNU4-2 and a deep-intronic MRPL39 variant. A recurring theme was the lag in conventional knowledge bases: 59% of the new gene–disease diagnoses were not yet curated in OMIM at the time of reanalysis, underscoring the value of drawing on a rapidly updated resource like PanelApp Australia.

From a one-off event to a continuous program

We then ran Talos for 29 monthly iterative cycles. Most diagnoses (92%) came on a cohort’s first pass, but the iterative design proved its value on two fronts. First, it demonstrated the scalability of ongoing reanalysis: because later cycles return only newly actionable evidence, they surfaced an average of just one variant per 200 cases over the program. Second, it showed how quickly we can move from scientific discovery to diagnosis: on average just 32 days passed between new knowledge appearing in a public database and a patient receiving a diagnosis, with the fastest case turning around in a single day. Figure 2 provides timelines for three example patients showing how continual reanalysis can bring answers to families within weeks of new scientific findings. The whole pipeline is cheap enough to run continuously: annotating 1,000 genomes cost about $11, and a monthly reanalysis pass ran for a few cents per cohort.

imageimageFigure 2 – Diagnostic odyssey for three example patients. Each patient spent years after genetic sequencing waiting for a diagnosis. For Patient 1, the scientific discovery enabling their diagnosis happened one month after their testing, but no diagnosis was made until the first time their genetic data was reanalyzed using Talos. For patients 2 and 3, diagnoses were made within a month of the relevant scientific findings because the patients were already in the reanalysis pipeline.

Looking ahead

Talos reframes genomic reanalysis from a rare, labor-intensive event into a continuous, automated program that can keep pace with the science. By optimizing for specificity, it respects the real bottleneck of expert reviewer time, and by drawing on openly shared, frequently updated resources like PanelApp Australia and ClinVar, it turns the global community’s accumulating knowledge into diagnoses for individual patients, often within weeks.

We believe we’ve established a foundational capability, and we’re excited to see how the community builds on it. In particular, as more advanced AI models for understanding and predicting the consequences of genetic variation become available, we’re looking forward to leveraging them in the reanalysis of unsolved rare disease cases.

Talos is open source and straightforward to deploy in cloud environments like Azure. Our results offer a practical blueprint for health systems aiming to deliver frequent, scalable reanalysis to the many patients still searching for diagnoses.

GitHub

Nature Publication

Opens in a new tabThe post Talos: Scaling rare disease diagnosis with automated, iterative genomic reanalysis appeared first on Microsoft Research.

この記事をシェア

関連記事

KDnuggets★32026年6月24日 19:00

2026 年にローカルで実行可能なトップ 7 つのコーディングモデル

KDnuggets が選定した、2026 年版のローカル環境で動作する主要な 7 つのコード生成 AI モデルを紹介している。

MarkTechPost★42026年6月24日 18:21

Nous Research、Hermes エージェントのスキルシステムに「/learn」機能を追加、手書きなしでワークフローをスラッシュコマンドとして記録可能に

Nous Research はオープンソースの自己改善型エージェント「Hermes Agent」のスキルシステムを拡張し、「/learn」という新コマンドを追加した。これにより、ユーザーはドキュメントやコードなどの資料を指定するだけで、エージェントが自動的に再利用可能なスキル定義ファイル(SKILL.md)を作成できるようになった。

TLDR AI★42026年6月24日 09:00

CUGA を用いた本格的なエージェントアプリ構築:軽量ハーンス上の24の動作例

IBM が公開したオープンソースの「CUGA」は、計画・実行・状態管理の複雑さを処理し、開発者がツール選択とプロンプト設計に集中できるようにするエージェント用ハーンスです。このシステムは効率的な状態維持とエラー修正機能を持ち、AppWorld などのベンチマークで他社を上回る性能を示しています。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む