科学者向け AI ワークベンチ「Claude Science」がベータ版として登場
Anthropic は科学者のための統合 AI ワークベンチ「Claude Science」をベータ版として公開し、研究プロセスの自動化と結果の再現性を向上させる新たなツールを提供した。
キーポイント
統合研究環境の提供
PubMed, Jupyter, R, クラスター端末など散在する科学ツールの断片を単一の環境に統合し、文献分析から論文作成までの全工程をサポートする。
監査可能な成果物の生成
すべての出力物に作成履歴(監査証跡)が付与され、計算や引用の検証が可能で、研究結果の再現性と信頼性を担保する。
専門エージェントの連携
ゲノム解析や構造生物学など 60 以上の事前設定されたスキルを持つ一般協調型エージェントと、ユーザー作成の専門家エージェントが連携して作業を遂行する。
柔軟なデプロイメント
macOS/Linux のローカル環境だけでなく、SSH や HPC ログインノードを経由したリモートアクセスにも対応し、既存のインフラに統合可能である。
影響分析・編集コメントを表示
影響分析
この発表は、AI が単なる情報検索ツールから、実際の科学実験やデータ分析を完結させる「作業台(ワークベンチ)」へと進化したことを示す画期的な一歩です。特に「監査可能な履歴」の機能は、学術界で最も懸念される再現性危機への対応策となり、AI 活用による研究加速の実現可能性を大幅に高めます。
編集コメント
科学分野における AI ツールの「使いやすさ」から「信頼性・再現性」へのシフトを象徴するニュースであり、実務家にとって待望の進化と言えます。
AI は、科学発見のペースや医療介入の開発を劇的に加速する可能性を秘めています。昨秋に生命科学分野での取り組みを開始して以来、モデル機能の向上に取り組むとともに、MCP やスキルを通じて科学エコシステムとのつながりを強化し、パートナーシップを発足させるなど、この潜在能力を実現するための努力を続けてきました。
本日、これらの取り組みにおける最も重要な拡大として、科学者向けの AI ワークベンチ「Claude Science」Claude Science をご紹介します。Claude Science は、研究者が最も頻繁に使用するツールやパッケージを統合し、監査可能な成果物を生成し、計算リソースへの柔軟なアクセスを提供するアプリケーションです。
Claude Science のご紹介
科学調査は往々にして退屈なものです。研究者は、それぞれ固有のスキーマを持つ数十ものデータベース間を作業する必要があり、独自データパイプラインやビューアを必要とするファイル形式に対処し、PubMed、Jupyter、R、クラスター端末など多様なツール間で移行しなければなりません。
⟦CODE_0⟧
Claude Science は、これらの断片的なツールを単一の研究環境に統合し、科学者が作業の全段階を遂行できるようにします。文献分析や多段階の研究実行を支援し、詳細な成果物を生成し、出版準備ができるまで図表や原稿を反復的に改良できます。すべての出力には作成履歴が監査可能に残されるため、結果を検証・再現することが可能です。Jupyter Notebook のように、Claude Science は既存の作業環境 wherever で利用できます。macOS または Linux 上のローカルマシン、SSH を介したリモートマシン、あるいは HPC ログインノード上などです。
ユーザーは、ゲノム解析、シングルセル解析、プロテオミクス、構造生物学、ケモインフォマティクスなどに事前設定された 60 以上の厳選されたスキルとコネクタにアクセスできる一般向けの調整エージェントと対話します。これらのエージェントは他のエージェントを起動し、ユーザーが作成した専門家のエージェントとも連携できます。また、レビューアエージェントが引用や計算をチェックし、誤りを指摘・修正します。
Claude Science は本日、Claude Pro、Max、Team、Enterprise ユーザー向けにベータ版としてリリースされ、ユーザーからのフィードバックを収集しながらプラットフォームの改良を続けていきます。
仕組みについて
imageClaude Science は、タンパク質、構造、分子をネイティブに表示し、すべての結果が再現可能で、そのコードに追跡可能です。
豊かな科学アーティファクト、完全に再現可能。 科学研究は本質的に視覚的なものなので、Claude Science はコードと共に図や論文を生成します。3D タンパク質構造、ゲノムブラウザのトラック、化学構造など、豊富な科学アーティファクトをネイティブにレンダリングします。エージェントに対してあらゆる詳細についてチャットし、図や論文にインラインで注釈をつけることで、出版準備が整うように修正すべき点をエージェントに認識させることができます。
図を生成する際、Claude Science はその図を作成した正確なコードと環境、作成方法を平易な言葉で説明した記述、そして完全なメッセージ履歴を含めます。これにより入力内容を理解でき、数ヶ月後であっても作業の検証や再現が容易になります。グリッドラインの削除や軸の対数目盛への変更など、平易な言葉で図への編集を Claude Science に依頼すると、エージェントは自身のコードを直接編集します。
imageClaude Science は、ローカルマシンやクラスター、またはオンデマンドの GPU 上で環境を構築し、計算リソースを管理します。
計算リソースを管理し、需要に応じてスケーリングします。タンパク質の折りたたみや、大規模データセット全体にゲノム解析パイプラインを実行するなど、大規模な分析では、研究者は計算ジョブの設定に意識を向け、クラスタへの送信を待ち、成功または失敗を確認し、結果を取り戻すことに時間を割く必要があります。Claude Science はこのプロセスを代行します。計画を作成し、新しいリソースにアクセスする前に確認を求め、ラボがすでに使用している計算リソース(SSH を介した独自の HPC クラスタ、またはオンデマンド計算用の Modal アカウント)に対してジョブを書き込んで提出する前に、あらゆる決定のレビューや取り消しを可能にします。必要に応じて分析を 1 つの GPU から数百個までスケーリングできます。
エージェントはメモリ内にコンテキストを保持した実行中のセッション内で動作するため、大規模なデータセットでも一度だけ読み込めば十分です。これはラボ独自のインフラストラクチャ(ラップトップ、Linux ボックス、HPC ログインノード)上で動作するため、大規模または機密性の高いデータセットは、すでに存在するシステムから移動する必要がなく、分析の各ステップに必要なコンテキストのみが Claude に送信されます。パイプラインの実行中、レビューアエージェントが出力を検査し、誤った引用、追跡不可能な数値、およびその背後にあるコードと一致しない図をフラグ付けしながら、進行中に自己修正を行います。元のスレッドを失うことなく、いつでもセッションをフォークして 2 つのアプローチを比較できます。
imageClaude Science は、ゲノム解析、シングルセル解析、プロテオミクス、ケモインフォマティクス用に事前設定されており、60 以上の科学データベースによって支えられています。
初日からドメイン対応可能。科学的知識は数百の専門ソースに散在しています。例えば生物学では、関連データが UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO といったリソース(それぞれ独自のスキーマとクエリ言語を持つ)や、学術誌・プレプリントサーバー、ドメイン固有のオープンモデルにまたがって存在します。Claude Science に自然言語で質問すると、専門エージェントがこれらのすべてのソースを照会し統合するため、個別にナビゲートする必要はありません。Claude Science は NVIDIA の BioNeMo Agent Toolkit に含まれるスキルを活用し、BioNeMo 内のライフサイエンスモデルやライブラリ(Evo 2、Boltz-2、OpenFold3 など)にネイティブに接続します。
科学者たちはすでに信頼できるモデル、データセット、パイプラインを持っています。Claude Science はこれらにも接続でき、パイプラインを再利用可能なスキルとして保存したり、コネクタを使用してラボが好むツールにアクセスしたりできます。将来的なセッションではこれらの設定が自動的に継承されます。このカスタマイズ性により、1 つの会話の中で Claude、独自のデータ、そしてすでに信頼している検証済みのツールにアクセスすることが可能になります。Claude Science はパートナーの専門知識とプラットフォームを活用しつつ、より多くの科学者が Claude を通じて自分のツールを利用できるようになります。
科学者たちが Claude Science で何をしているか
過去数ヶ月間、研究者たちはベータ版の Claude Science を用いて、単細胞 RNA シーケンシング解析、CRISPR スクリーン設計、タンパク質構造予測、ケミインフォマティクスなど、さまざまなタスクに取り組んできました。
Manifold Bio は、特定の臓器や細胞タイプに作用する組織標的型医薬品を設計しており、薬が必要とされる場所で効果を発揮し、体の他の部分を傷つけないようにします。また、何百もの標的に対応する数百万の候補結合分子が、生体内でどのように分布するかを同時にテストしています。Manifold は Claude Science を用いて、最新の研究実験における標的を選定しました。各組織および標的について、Claude Science は表面発現、輸送経路、安全性を評価し、Manifold が独自の独自データから学習した基準に基づいて候補をランク付けします。Manifold によると、Claude Science が一般的なコーディングアシスタントと異なる点は、過去のプログラムで構築された文脈を踏まえつつ、適切なデータを収集して適切な判断を下すという一連の処理を完遂できる点にあります。
アレン研究所の神経科学者であるジェローム・レコックは、Claude Science を用いて、長文レビュー作成に特化した約 20 のカスタムスキルを備えたマルチエージェント「計算レビューテンプレート」を構築しました。サブエージェントは数千件の論文を読み込み、中心的な主張と主要な定量的発見を抽出し、証拠状態データベース(evidence state database)に格納します。その後、パイプラインが物語の構成を構築し、レビューをセクションごとに記述しながら、各セクションを専門的なサブエージェントに委譲します。各セクション内では、専用のエージェントが証拠データベースから直接、研究間の定量的比較図を生成します。Claude Science によって可能になったワークフローの重要な要素として、アクター・クリティックペア(actor-critic pairs)の使用があります。これは、1 つのエージェントがコンテンツを作成し、別のレビューアーエージェントがその正確性と引用の忠実度を評価するという仕組みです。
Claude Science の導入以前は、レコック氏のチームがこの種のレビューを書くのに最長 2 年を要していました。現在では、約 10 件のレビュー(合計 100 ページ以上)を完成させており、これらはレビューアーエージェントによって引用が検証されています。同チームは今後、ドメインの専門家と協力して、AI ベースのクリティックエージェントをさらに洗練させる作業を進めています。
UCSF脳腫瘍センターの准教授かつ疫学者であるスティーブン・フランシスは、Claude Science を活用して、脳のグリア細胞に発生する原発性腫瘍の一つである膠芽腫(glioma)の分子疫学に関する研究を支援してきました。彼の研究室では、数千もの微小な効果を持つ生殖系列変異がどのように組み合わさって個人の感受性を形成するかという遺伝的基盤を探求しています。この研究は Claude Science の登場以前から行われていましたが、フランシス氏によると、同アプリは分析を劇的に加速させ、従来よりも約 10 分の 1 の時間で複数のアプローチにわたる包括的な生殖系列解析を可能にしたそうです。彼のグループはClaude Science の結果を独立して検証し、迅速かつ堅牢な分析を生み出せることを確認しました。
Claude Science の利用開始
Claude Science アプリは現在、Pro、Max、Team、Enterprise プラン向けに macOS および Linux でベータ版として提供されています。科学者が実際の課題に取り組み、改善点を提案できるように、早期に公開しています。
Team および Enterprise ユーザーの方は、管理者が Claude Science を有効化する必要があります。現在、学術機関や非営利研究組織のアクティブな科学研究ラボ向けに割引席を提供する Team プランも用意されています。詳しくはこちらをご覧ください。
また、最大 50 の「AI for Science」プロジェクトを支援し、それぞれに最大 30,000 ドルのクレジットを提供します。Modal もまた、選定されたプロジェクトに対して最大 2,000 ドル分の計算リソース を提供する予定です。私たちは、分野横断的に科学の境界を探求するプロジェクトを求めており、初期段階では生物学および生物医学研究に焦点を当てています。応募は 2026 年 7 月 15 日まで受け付けており、選考結果の通知は 7 月 31 日までに送られます。プロジェクトの実施期間は 2026 年 9 月 1 日から 12 月 1 日までです—こちらから応募してください。
製品発表の最新情報、フィードバックの提供、および Claude Science コミュニティでの他者からの学びについては、AI for Science Discourse コミュニティ にご参加ください。
Claude Science の利用開始は claude.com/science から行えます。
関連コンテンツ
Claude Sonnet 5 の紹介
Sonnet 5 は、大規模なコーディング、エージェント、および専門業務において最先端のパフォーマンスを発揮します。
Fable 5 の再展開
Fable 5 は 7 月 1 日にグローバルに再展開されます。また、Amazon、Microsoft、Google、およびその他の Glasswing パートナーと共に、脱獄(jailbreak)の深刻度を評価するための業界全体向けのフレームワークを提案しています。
Claude Tag の紹介
Claude Tag は、チームが Claude と共に作業するための新しい方法です。
原文を表示
AI has the potential to dramatically accelerate the pace of scientific discovery and the development of healthcare interventions. Since launching our efforts in the life sciences last fall, we’ve worked to improve our model capabilities, make connections to the scientific ecosystem via MCPs and skills, and launch partnerships in an effort to realize this potential.
Today, we’re introducing our most significant expansion of these efforts: Claude Science, an AI workbench for scientists. Claude Science is an app that integrates the tools and packages that researchers most commonly use, produces auditable artifacts, and provides flexible access to computing resources.
Introducing Claude Science
Scientific research is often tedious. Researchers must work across dozens of databases, each with their own schema, contend with file formats that require bespoke data pipelines and viewers, and transition between a roster of tools: PubMed, Jupyter, R, a cluster terminal, and more.
Claude Science brings these fragmented tools into a single research environment where scientists can conduct all stages of their work. It helps you analyze literature and execute multi-step research, produces detailed artifacts, and lets you iteratively refine figures and manuscripts until they’re ready for publication. Every output carries an auditable history of how it was made, so you can validate and reproduce the results. Like a Jupyter Notebook, you can access Claude Science wherever you already work—locally on macOS or Linux, or on a remote machine over SSH or with an HPC login node.
Users interact with a generalist coordinating agent with access to over 60 curated skills and connectors pre-configured for genomics, single-cell, proteomics, structural biology, cheminformatics, and more. These agents can spin up others and engage with specialist agents created by users. And a reviewer agent checks citations and calculations, flagging and correcting errors.
We are releasing Claude Science today in beta for Claude Pro, Max, Team, and Enterprise users, and will continue to refine the platform as we collect feedback from users.
How it works

Rich scientific artifacts, fully reproducible. Scientific research is inherently visual, so Claude Science generates figures and manuscripts alongside the code that created them. It natively renders rich scientific artifacts, including 3D protein structures, genome browser tracks, chemical structures, and more. You can chat with the agent about any detail, annotating figures and manuscripts in-line so the agent knows what to address to make them publication-ready.
When it generates a figure, Claude Science includes the exact code and environment that produced it, a plain-language description of how it was created, and the full message history. This allows you to understand the inputs, making the work easier to validate and reproduce even months later. You can ask Claude Science to make edits to figures in plain language—removing gridlines, for example, or changing an axis to log scale—and the agent will edit its own code.

Manages your compute and scales on demand. Large analyses—folding a protein, for example, or running a genomics pipeline over a massive dataset—often require researchers to shift their focus to setting up a computing job, waiting while it’s sent to a cluster, checking whether it succeeded or failed, and pulling the results back. Claude Science handles this process for you. It drafts a plan, asks before reaching new resources, and lets you review or revoke any decision before writing and submitting the job to the computing resources your lab already uses (your own HPC cluster over SSH, or your Modal account for compute on demand), scaling the analysis from a single GPU to hundreds as needed.
Because its agents work inside a running session that holds context in memory, even massive datasets only need to be loaded once. It runs on your lab’s own infrastructure—your laptop, Linux box, or HPC login node—so large or sensitive datasets never have to leave the systems they’re already on, and only the context needed for each step of the analysis is sent to Claude. As the pipeline runs, a reviewer agent inspects the outputs, flagging incorrect citations, untraceable numbers, and figures that don’t match their underlying code, and self-correcting as it goes. You can fork the session at any point to compare two approaches without losing the original thread.

Domain-ready on day one. Scientific knowledge is scattered across hundreds of specialized sources. In biology, for example, relevant data might sit across resources such as UniProt, PDB, Ensembl, Reactome, ClinVar, ChEMBL, GEO—each with its own schema and query language—as well as in journals and preprint servers, and domain-specific open models. When you ask Claude Science a question in plain language, specialist agents query and synthesize across all of these sources so you don’t have to navigate them individually. Claude Science uses the skills in NVIDIA’s BioNeMo Agent Toolkit to connect natively to the life sciences models and libraries in BioNeMo, including Evo 2, Boltz-2, and OpenFold3.
Scientists already have models, datasets, and pipelines they trust. Claude Science can connect to these as well, saving any pipeline as a reusable skill or accessing your lab’s preferred tool using a connector, with future sessions inheriting them automatically. This customizability allows you to access Claude, your proprietary data, and the validated tools you already rely on in one conversation. Claude Science benefits from our partners’ specialized expertise and platforms, while more scientists reach their tools through Claude.
What scientists are doing with Claude Science
Over the past few months, researchers have worked with Claude Science in beta for tasks like single-cell RNA sequencing analysis, CRISPR screen design, protein structure prediction, cheminformatics, and more.
Manifold Bio designs tissue-targeting medicines—which home to a specific organ or cell type, so the drug acts where it’s needed and spares the rest of the body—and tests how millions of candidate binders corresponding to hundreds of targets distribute through a living body at once. Manifold used Claude Science to nominate the targets for its latest experiments. For each tissue and target, Claude Science assessed surface expression, trafficking, and safety, ranking candidates against the criteria Manifold has learned from its own internal proprietary data. What set Claude Science apart from a general coding assistant, Manifold said, was that it could do this end-to-end, gathering the right data and applying the right judgment with the context of past programs built in.
Jérôme Lecoq, a neuroscientist at the Allen Institute, used Claude Science to build a multi-agent “computational review template” comprising about 20 custom skills geared towards writing long-form reviews. The sub-agents read through thousands of papers, pulling the central claim and the key quantitative finding, and storing them in an evidence state database. Then the pipeline constructs a narrative arc, writing the review section by section and delegating each to its own specialized sub-agent. Within each section, dedicated agents generate quantitative cross-study figures directly from the evidence database. A key component of the workflow, enabled by Claude Science, is the use of actor-critic pairs: one agent creates content while a separate reviewer agent evaluates it for accuracy and citation fidelity.
Before Claude Science, it could take Lecoq’s team as many as two years to write such a review. He now has about 10 reviews, many more than 100 pages, with citations that were checked over by reviewer agents. The team is now working with domain experts to further refine the AI-based critic agents.
And Stephen Francis, an associate professor and epidemiologist at the UCSF Brain Tumor Center, has used Claude Science to support studies on the molecular epidemiology of glioma, a type of primary tumor that begins in the glial cells of the brain. His lab investigates the genetic basis for how thousands of small-effect germline variants combine to shape individual susceptibility. Although this work predated Claude Science, Francis said the app has dramatically accelerated the analysis, enabling comprehensive germline workups across multiple approaches in roughly one-tenth the time it previously took. His group independently validated Claude Science’s results, confirming that it can produce both rapid and robust analyses.
Getting started with Claude Science
The Claude Science app is available in beta on macOS and Linux for Pro, Max, Team, and Enterprise plans. We’re sharing it early so scientists can start to use it on real problems and tell us how to refine it.
Team and Enterprise users will need their admin to enable Claude Science. We now have a Team plan offering discounted seats for active scientific labs at academic institutions and nonprofit research organizations; learn more here.
We’ll also be supporting up to 50 Claude Science AI for Science projects, providing up to $30,000 in credits. Modal will also be providing up to $2,000 in compute for select projects. We are looking for projects that span domains and explore the boundaries of science, with an early focus on biology and biomedical research. Applications are open through July 15, 2026, with award notifications sent out by July 31. Projects will run from September 1 to December 1, 2026—apply here.
To stay up-to-date on product announcements, provide feedback, and learn from others in the Claude Science community, join the AI for Science Discourse community.
Get started with Claude Science at claude.com/science.
Related content
Introducing Claude Sonnet 5
Sonnet 5 delivers frontier performance across coding, agents, and professional work at scale.
Redeploying Fable 5
Fable 5 returns globally July 1. We're also proposing an industry-wide framework for scoring jailbreak severity, together with Amazon, Microsoft, Google, and other Glasswing partners.
Introducing Claude Tag
Claude Tag is a new way for teams to work with Claude.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み