Anthropic、再現可能なゲノム・プロテオーム・ケミインフォマティクスパイプライン向けマルチエージェント AI ワークベンチ「Claude Science Beta」をリリース
Anthropic は科学者向けに、再現性を保証するマルチエージェント AI ワークベンク「Claude Science」ベータ版をリリースし、ゲノミクスやタンパク質解析などの複雑な研究パイプラインを自律的に実行・検証できる環境を提供した。
キーポイント
科学特化型マルチエージェントアーキテクチャ
一般協調エージェントがリクエストを受け付け、ゲノミクスや構造生物学に特化した専門エージェントを動的に起動・連携させる仕組みを採用している。
完全な再現性と監査可能性の確保
生成された図表や論文のコード、環境設定、メッセージ履歴をすべて記録し、後日検証可能な形で成果物を出力する機能を標準搭載している。
自律的な品質保証と自己修正機能
パイプライン実行中にレビューエージェントが出力を検証し、誤った引用や数値、不一致のある図表を自動で検出・修正する仕組みを持つ。
データプライバシーとスケーラブルなインフラ
アプリはラボの既存インフラ(HPC、Modal など)上で動作し、機密性の高いデータが外部に流出することなく、必要に応じて数百 GPU までスケール可能です。
専門ドメイン知識と NVIDIA BioNeMo の統合
UniProt や PDB などの 60 以上のデータベースを横断するエージェントが構築され、NVIDIA の BioNeMo を介して Evo 2 や OpenFold3 などの GPU 加速モデルを直接呼び出して利用できます。
実証された研究効率の向上
Manifold Bio や UCSF などの事例では、標的ノミネーションやゲノム疫学解析が従来比で大幅に短縮され、長文文献レビューも数ヶ月から数日で完了するようになっています。
MCP とスキルによる拡張性
Model Context Protocol (MCP) を介して実験室ツールを接続し、既存のワークフローを「スキル」として保存・再利用することで、検証済みのツールとデータを保持したまま Claude がオーケストレーションを行います。
影響分析・編集コメントを表示
影響分析
このリリースは、AI が単なる情報検索ツールから、複雑な科学実験を自律的に実行・検証できる「研究パートナー」へと進化したことを示す重要な転換点です。特に再現性危機が深刻化する現代の科学研究において、すべてのプロセスを追跡可能にする機能は、学術界における AI 導入の信頼性を劇的に高める可能性があります。
編集コメント
既存の LLM を科学ワークフローに特化して再構築し、単なるチャットボットを超えた「自律的な研究アシスタント」としての実用性を示した画期的な取り組みです。特に監査可能性と自己修正機能を標準搭載している点は、実社会での採用に向けた重要な一歩と言えます。
今週、Anthropic は Claude Science をリリースしました。これは科学者向けのアプリで、ベータ版として提供されています。このアプリは Anthropic の既存の Claude モデル上で動作し、新しいモデルを使用するものではありません。ターゲットユーザーは、データベース、ノートブック、クラスター端末を同時に扱う研究者です。多段階の研究プロセスを実行し、各結果がどのように作成されたかを記録します。ベータ版は Pro、Max、Team、Enterprise プランで利用可能です。
Claude Science は、昨秋の Anthropic のライフサイエンス分野での取り組みに基づいています。その以前の取り組みでは、MCP(Model Context Protocol)とスキルを通じて Claude を科学エコシステムに接続しました。
Claude Science とは何か?
Claude Science は研究のための AI ワークベンチです。研究者が最も頻繁に使用するツールやパッケージを統合しています。文献の分析、多段階の研究の実行、詳細な成果物の生成を行います。図表や論文 manuscript を出版準備ができるまで微調整することも可能です。
自然言語で、1 つの一般化された調整エージェントと対話します。このエージェントは、60 以上の厳選されたスキルとコネクタにアクセスできます。これらは、ゲノミクス(genomics)、シングルセル解析(single-cell)、プロテオミクス(proteomics)、構造生物学(structural biology)、ケモインフォマティクス(cheminformatics)のために事前に設定されています。
macOS または Linux 上でローカルで実行することもできます。また、SSH を介してリモートマシンや HPC(High Performance Computing)のログインノード上でも作業可能です。すべての出力には、その作成プロセスを追跡可能な履歴が付随します。
マルチエージェントアーキテクチャの仕組み
一般化された調整エージェントが、あなたの自然言語によるリクエストを受け取ります。このエージェントは、作業を処理するために他のエージェントを起動することもできます。また、ユーザー自身が作成した専門家のエージェントとも連携します。NVIDIA はこれらを、ドメイン特化型の事前設定済みエージェントとして説明しています。各エージェントは、それぞれの分野で確立されたワークフローを知っています。
パイプラインの実行中に、別のレビュー用エージェントが稼働します。このエージェントは出力を段階的に検査し、追跡できない誤った引用や数値を指摘します。また、背後にあるコードと一致しない図も指摘します。そして、その場で自己修正を行います。
再現性と出所の保証
科学研究は本質的に視覚的なものです。そのため、Claude Science は、コードと共に図や論文を生成します。3D タンパク質構造、ゲノムブラウザのトラック、化学構造などをネイティブでレンダリングできます。
図を生成する際、使用された正確なコードと環境を記録します。また、自然言語による説明と完全なメッセージ履歴も記録されます。これにより、数ヶ月後でも作業の検証や再現が容易になります。
図は自然言語で編集可能です。例えば、「軸を対数目盛に変更してほしい」と指示すると、エージェントは自身のコードを直接編集します。また、セッションをフォークして、元のものを失うことなく2 つのアプローチを比較することもできます。
オンデマンドでスケーリングする計算リソース
大規模な解析には、ノートパソコンだけでは不十分な場合があります。タンパク質の折りたたみはその一例です。Claude Science は新しいリソースにアクセスする前に計画を策定し、承認を求め、決定のレビューや取り消しを可能にします。その後、ジョブを記述してユーザー自身のインフラストラクチャへ提出します。
つまり、SSH を介した HPC クラスター(High Performance Computing cluster)や Modal アカウントを利用できます。解析は必要に応じて 1 つの GPU から数百個までスケーリング可能です。エージェントがメモリ内にコンテキストを保持するため、大規模なデータセットは一度だけ読み込まれれば十分です。
このアプリはラボ独自のインフラストラクチャ上で動作します。そのため、大規模または機密性の高いデータセットを現在のシステムから移動させる必要はありません。各ステップに必要なコンテキストのみが Claude へ送信されます。
ドメインのカバレッジと NVIDIA BioNeMo
科学知識は数百の専門ソースに散在しています。生物学ではこれには UniProt、PDB、Ensembl、Reactome が含まれます。また、ClinVar、ChEMBL、GEO、学術誌、プレプリントサーバーもその対象です。専門のエージェントがこれらのソース間で照会と統合を代行します。
Claude Science はさらに、NVIDIA の BioNeMo Agent Toolkit(エージェント・ツールキット)からスキルを利用します。このツールキットは、GPU 加速機能を呼び出し可能なスキルとしてパッケージ化しています。これにより、Evo 2、Boltz-2、OpenFold3 にネイティブに接続されます。Evo 2 はゲノミクスの基盤モデルです。Boltz-2 は生体分子相互作用の予測を処理します。OpenFold3 はタンパク質構造の予測を処理します。
ユースケースと事例
ベータユーザーは、単一細胞 RNA シーケンシング解析や CRISPR スクリーン設計を実行しました。また、タンパク質構造の予測やケミインフォマティクスも実行しています。
標的ノミネーション:Manifold Bio は組織指向性医薬品の設計を行っています。同社は Claude Science を用いて、最新の研究実験における標的をノミネートしました。各組織および各標的について、アプリは表面発現、輸送経路、安全性を評価し、その後 Manifold 独自の独自基準に対して候補をランク付けしました。Manifold は、このプロセスが一般的なコーディングアシスタントとは異なり、エンドツーエンドで実行されたと述べています。
長文文献レビュー:アレン研究所の Jérôme Lecoq は、計算によるレビューテンプレートを開発しました。これには長文レビュー用の約 20 のカスタムスキルが含まれています。サブエージェントが数千件の論文を読み込み、証拠状態データベースに格納します。その後、パイプラインはアクター・クリティック型エージェントペアを用いて各セクションを記述します。かつてこのようなレビューには彼のチームで最大 2 年を要しましたが、現在は約 10 のレビュー(その多くが 100 ページ以上)を有しています。
ゲノム疫学:UCSF の Stephen Francis は、膠芽腫の分子疫学研究を行っています。Claude Science により、germline workup(生殖細胞系列解析)の実行時間が従来のおよそ 1/10 に短縮されました。彼のグループは結果を独立して検証しました。
比較表
次元 | Claude Science | 一般 AI アシスタント | Claude Code
---|---|---|---
主な用途 | 科学研究ワークフロー | Q&A およびドラフト作成 | ソフトウェア開発
リアルパイプライン実行 | はい、エンドツーエンド | いいえ | はい(コード中心)
科学データベースアクセス | 60 以上のデータベースおよびスキル | いいえ | いいえ
計算リソース管理 | ローカル、HPC (SSH)、Modal | いいえ | ローカルターミナル
再現性・追跡可能性 | 各アーティファクトごとの完全記録 | いいえ | Git ヒストリー
引用および数値検証 | レビューアエージェント | いいえ | いいえ
ネイティブ科学レンダラー | タンパク質、トラック、分子 | いいえ | いいえ
基盤モデル
既存の Claude モデル
既存の Claude モデル
既存の Claude モデル
Claude Science の拡張
Claude Science はアプリであり、個別の推論 API を持ちません。コネクタとスキルを通じて拡張され、これらはセッションを超えて保持されます。
ラボツールは Model Context Protocol (MCP) コネクタを介して接続します。これは標準的な MCP クライアント設定フォーマットです:
コードをコピーしました
別のブラウザを使用する
{
"mcpServers": {
"lab-eln": {
"command": "npx",
"args": ["-y", "@lab/eln-mcp-server"],
"env": { "ELN_API_KEY": "REPLACE_ME" }
}
}
}
既存のパイプラインは再利用可能なスキルとして保存できます。スキルとは、SKILL.md ファイルを含むフォルダです:
コードをコピーしました
別のブラウザを使用する
name: rnaseq-qc
description: FASTQ ディレクトリに対してラボの標準 RNA-seq 品質管理パイプラインを実行します。
RNA-seq QC
pipelines/qc.shを実行します。- サンプルごとのメトリクスを要約します。
- 品質管理閾値を下回るサンプルにフラグを立てます。
今後のセッションでは、これらのコネクタとスキルが自動的に継承されます。つまり、検証済みのツールとデータを保持したまま、Claude がそれらを調整・実行します。
主なポイント
Claude Science は macOS および Linux 向けのベータ版アプリであり、Anthropic の既存の Claude モデル上で動作します。
調整役のエージェントが作業を委任し、別のレビュー役エージェントが引用、数値、図表を確認します。
すべての図には、対応する正確なコード、環境、説明、および完全なメッセージ履歴が付属しています。
計算処理はローカル、SSH を介した HPC、または Modal 上で実行され、1 つの GPU から数百個までスケーリング可能です。
ライフサイエンス向けに、60 以上のデータベースと NVIDIA BioNeMo スキル(Evo 2, Boltz-2, OpenFold3)が標準搭載されています。
技術詳細はこちらでご覧ください。また、Twitter でフォローしていただくことや、15 万人以上の ML サブレッドに参加し、ニュースレターを購読することもぜひご検討ください。待ってください!Telegram をご利用ですか?今なら Telegram でも私たちに参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご希望ですか?ご連絡ください。
本記事「Anthropic が Claude Science Beta を発表:再現可能なゲノミクス、プロテオミクス、ケミインフォマティクスパイプラインのためのマルチエージェント AI ワークベンチ」は、MarkTechPost で最初に公開されました。
原文を表示
This week, Anthropic released Claude Science. It is an app for scientists, available in beta. It runs on Anthropic’s existing Claude models, not a new model. The app targets researchers who juggle databases, notebooks, and cluster terminals. It runs multi-step research and records how each result was made. The beta is available for Pro, Max, Team, and Enterprise plans.
Claude Science builds on Anthropic’s life sciences work from last fall. That earlier work connected Claude to the scientific ecosystem through MCPs and skills.
What is Claude Science?
Claude Science is an AI workbench for research. It integrates the tools and packages researchers use most. It analyzes literature, executes multi-step research, and produces detailed artifacts. You can refine figures and manuscripts until they are publication-ready.
You talk to one generalist coordinating agent in plain language. That agent has access to over 60 curated skills and connectors. These come pre-configured for genomics, single-cell, proteomics, structural biology, and cheminformatics.
You can run it locally on macOS or Linux. You can also work on a remote machine over SSH or an HPC login node. Every output carries an auditable history of how it was made.
How The Multi-Agent Architecture Works
A generalist coordinating agent receives your plain-language request. It can spin up other agents to handle the work. It can also engage specialist agents that users create themselves. NVIDIA describes these as preconfigured, domain-specialized agents. Each knows the established workflows for its field.
A separate reviewer agent runs as the pipeline executes. It inspects the outputs step by step. It flags incorrect citations and numbers it cannot trace. It also flags figures that do not match their underlying code. Then it self-corrects as it goes.
Reproducibility And Provenance
Scientific research is inherently visual. So Claude Science generates figures and manuscripts alongside the code that created them. It natively renders 3D protein structures, genome browser tracks, chemical structures, and more.
When it generates a figure, it records the exact code and environment. It also records a plain-language description and the full message history. This makes the work easier to validate and reproduce months later.
You can edit figures in plain language. For example, you can ask it to change an axis to log scale. The agent then edits its own code. You can also fork a session to compare two approaches without losing the original.
Compute that Scales on Demand
Large analyses often need more than a laptop. Folding a protein is one example. Claude Science drafts a plan before reaching new resources. It asks for approval and lets you review or revoke any decision. It then writes and submits the job to your own infrastructure.
That means your HPC cluster over SSH or your Modal account. The analysis scales from a single GPU to hundreds as needed. Because agents hold context in memory, a large dataset loads only once.
The app runs on your lab’s own infrastructure. So large or sensitive datasets never have to leave their current systems. Only the context needed for each step is sent to Claude.
Domain Coverage and NVIDIA BioNeMo
Scientific knowledge is scattered across hundreds of specialized sources. In biology, this includes UniProt, PDB, Ensembl, and Reactome. It also includes ClinVar, ChEMBL, GEO, journals, and preprint servers. Specialist agents query and synthesize across these sources for you.
Claude Science also uses skills from NVIDIA’s BioNeMo Agent Toolkit. The toolkit packages GPU-accelerated capabilities as callable skills. This connects natively to Evo 2, Boltz-2, and OpenFold3. Evo 2 is a genomics foundation model. Boltz-2 handles biomolecular interaction prediction. OpenFold3 handles protein structure prediction.
Use Cases With Examples
Beta users have run single-cell RNA sequencing analysis and CRISPR screen design. They have also run protein structure prediction and cheminformatics.
Target nomination: Manifold Bio designs tissue-targeting medicines. It used Claude Science to nominate targets for its latest experiments. For each tissue and target, the app assessed surface expression, trafficking, and safety. It then ranked candidates against Manifold’s own proprietary criteria. Manifold said the app did this end to end, unlike a general coding assistant.
Long-form literature review: Jérôme Lecoq at the Allen Institute built a computational review template. It comprised about 20 custom skills for long-form reviews. Sub-agents read thousands of papers into an evidence state database. The pipeline then wrote each section using actor-critic agent pairs. Such reviews once took his team as long as two years. He now has about 10 reviews, many over 100 pages.
Genomic epidemiology: Stephen Francis at UCSF studies the molecular epidemiology of glioma. Claude Science ran germline workups in roughly one-tenth the prior time. His group independently validated the results.
Comparison Table
DimensionClaude ScienceGeneral AI assistantClaude Code
Primary useScientific research workflowsQ&A and draftingSoftware development
Runs real pipelinesYes, end to endNoYes, code-focused
Scientific database access60+ databases and skillsNoNo
Compute managementLocal, HPC (SSH), ModalNoLocal terminal
Reproducibility / provenanceFull record per artifactNoGit history
Citation and number checkingReviewer agentNoNo
Native scientific renderersProteins, tracks, moleculesNoNo
Underlying modelExisting Claude modelsExisting Claude modelsExisting Claude models
Extending Claude Science
Claude Science is an app, so it has no separate inference API. You extend it through connectors and skills, which persist across sessions.
You connect a lab tool through a Model Context Protocol (MCP) connector. This is the standard MCP client config format:
Copy CodeCopiedUse a different Browser
{
"mcpServers": {
"lab-eln": {
"command": "npx",
"args": ["-y", "@lab/eln-mcp-server"],
"env": { "ELN_API_KEY": "REPLACE_ME" }
}
}
}
You save an existing pipeline as a reusable skill. A skill is a folder containing a SKILL.md file:
Copy CodeCopiedUse a different Browser
name: rnaseq-qc
description: Run the lab's standard RNA-seq quality-control pipeline on a FASTQ directory.
RNA-seq QC
- Run
pipelines/qc.sh <fastq_dir>. - Summarize the per-sample metrics.
- Flag any sample below the QC threshold.
Future sessions inherit these connectors and skills automatically. So you keep your validated tools and data, while Claude orchestrates them.
Key Takeaways
Claude Science is a beta app for macOS and Linux; it runs on Anthropic’s existing Claude models.
A coordinating agent delegates work, while a separate reviewer agent checks citations, numbers, and figures.
Every figure ships with its exact code, environment, description, and full message history.
Compute runs locally, on HPC over SSH, or on Modal, scaling from one GPU to hundreds.
It ships with 60+ databases and NVIDIA BioNeMo skills (Evo 2, Boltz-2, OpenFold3) for life sciences.
Check out the Technical details here. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post Anthropic Launches Claude Science Beta: A Multi-Agent AI Workbench for Reproducible Genomics, Proteomics, and Cheminformatics Pipelines appeared first on MarkTechPost.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み