OpenEvidenceが医師から実際に信頼される医療AIを構築した方法
OpenEvidenceは、Next.jsとVercelを活用したハイブリッドアーキテクチャにより、医療AIプラットフォームとして臨床医の信頼を獲得し、日々数百万件の臨床相談を支えつつ、スタートアップの俊敏性と病院レベルの信頼性を両立させた。
キーポイント
医療AIにおける信頼性とスケーラビリティの実現
OpenEvidenceは、臨床意思決定支援プラットフォームとして、失敗が許されない医療現場で信頼性を確保しつつ、急激なトラフィック増加にも自動的にスケールするインフラを構築した。
ハイブリッドアーキテクチャによる効率的な開発体制
PythonとGCPによるバックエンドと、Next.js/Vercelによるフロントエンドを組み合わせ、少数のフロントエンドエンジニアでも大規模な医療プラットフォームを運用可能にした。
スタートアップの俊敏性と医療グレードの信頼性の両立
5分での本番デプロイや自動プレビュー環境など、迅速な開発サイクルを維持しながら、医療現場が求める安定性と明確性を提供している。
実用的な医療AIプラットフォームの大規模採用
米国臨床医の間で最も広く使用される臨床意思決定支援プラットフォームとなり、2026年1月時点で2000万件以上の臨床相談をサポートしている。
影響分析・編集コメントを表示
影響分析
この記事は、医療AIの実用化における最大の課題である「信頼性の確保」を、クラウドネイティブなアーキテクチャで解決した成功事例を示している。特に、スタートアップの開発速度を維持しながら医療現場が求める安定性を実現した点は、規制の厳しい医療分野でのAI導入を加速させるモデルケースとなる可能性が高い。
編集コメント
医療AIの実用化において技術的信頼性がいかに重要かを具体的な数値と事例で示した良質なケーススタディ。特に、急成長するスタートアップが医療グレードの安定性をどう確保したか、その技術的選択が参考になる。
アンディ・ユンがSlackをスクロールしていると、あるメッセージが目に入った:OpenEvidenceがTikTokでバイラルになっているという。
「注目を集めつつある」ではなく、実際にバイラルで、1週間足らずで約200万回視聴に達していた。
通常なら、チームを総動員し、緊急対応体制を整え、本当はかけたくない電話をかけ始めるような状況だ。
フロントエンドリードエンジニアのアンディは、そのようなことは何もしなかった。
代わりに、彼は数字が上昇するのを見守った。ログを確認すると——すべて正常。応答時間:依然として高速。エラー率:依然としてほぼゼロ。その後、彼は以前の作業に戻った。修正すべきことは何もなかったからだ。
「Vercelはその使用量に完全にスケールしてくれました」と彼は言う。「容量不足でダウンしたことも、追加で何かをプロビジョニングしなければならなかったこともありません。それがそこにあると信頼できること、私たちがそれをほとんど意識しなくてよいほどに信頼できることは、素晴らしいことです。」
これは、彼らがほとんどの医療技術企業がまだ解決できていない問題を解決した証拠だった。すなわち、病院レベルの信頼性基準を満たしながら、スタートアップのスピードで動く方法である。
失敗が許されないとき
OpenEvidenceのような企業にとって、その賭け金は異なる。もし彼らの製品が失敗すれば、誰かが誤った医療判断を下す結果につながりかねない。
OpenEvidenceは、米国の臨床医の間で最も広く使用されている臨床意思決定支援プラットフォームであり、2026年1月には2000万件以上の臨床相談をサポートしている。昨年は、1億人以上のアメリカ人がOpenEvidenceを使用する医師の治療を受けた。
汎用モデルは間違っても許されるが、臨床ツールはそうではない。医師はスピードを求めるが、同時に安定性、明確さ、信頼性も求める。
このプレッシャーは、OpenEvidenceにおけるあらゆる技術的決定の前提となっている。それは毎回、確実に機能しなければならない。
フロントエンドエンジニアとPython開発者チーム
アンディが約3年前にOpenEvidenceに参加したとき、彼はほとんどのフロントエンドエンジニアを不安にさせる事実を発見した。彼が基本的に唯一のフロントエンドエンジニアだったのだ。
「私は、実際のフロントエンドのバックグラウンドを持つ、チームでほぼ唯一のエンジニアでした」と彼は言う。「チームの大半はPythonと機械学習を扱っています。」
彼らには、常に監視が必要なインフラを維持する余裕はなかった。必要なのは、ただ機能するものだった。コードをデプロイすれば、それが本番環境に反映される。トラフィックが増加すれば、スケールする。
そこでOpenEvidenceはハイブリッドアーキテクチャを採用した。バックエンドはPythonで構築され、Google Cloud Platform上で実行される。データの取り込み、モデルのオーケストレーション、およびコアビジネスロジックを処理し、一方フロントエンドはNext.jsで構築され、Vercelにデプロイされている。
「私たちのエンジニアリングチームの構成を考えると、Vercelはフロントエンドのスケールに本当にうまく対応してくれています」とアンディは指摘する。
各コミットは自動的にデプロイされる。本番環境へのデプロイには5分かかる。すべてのブランチに対してプレビューURLが生成される。米国の医師のほぼ半数に相当する医師のために、毎日数百万件の医療相談をサポートする小さなチームにとって、これは不可欠なものだった。
スピードのあるプロトタイピング
OpenEvidenceが今日の姿になる前、それはまず何十もの別のプロトタイプだった。各コンセプト実証(proof of concept)は、カスタムドメインを持つ独自のプロジェクトとしてVercelにデプロイされた。
Vercelはこれを簡単にした。新しいプロジェクトを立ち上げ、カスタムドメインを接続し、コードをプッシュすれば、本番環境のように見えるものが手に入る。ステークホルダーはクリックしてワークフローをテストすることができた。
この数分でプロジェクトを立ち上げる能力は、チームがプロダクト・マーケット・フィットを見つけるのに役立った。また、早期の企業パートナーシップを獲得するのを容易にした。
新機能を構築する際、プレビューデプロイメントはライブデモ用の共有可能なリンクを提供する。変更は安全にロールアウトできる。なぜなら、必要に応じて即座に元に戻すことができるからだ。
90%の驚き
OpenEvidenceが1000倍の成長にスケールする中、インフラストラクチャリードエンジニアのマイカ・スミスはコンピュートコストを注意深く監視していた。VercelがFluid computeを導入したとき、サーバーレスワークロードの実行方法が変わった。オンデマンド実行とサーバー並みの効率性、低遅延、負荷下での高いパフォーマンスを組み合わせたものだ。
チームは結果を確かめるためFluid computeを有効にし、サーバーレス支出は90%減少した。信頼性はそのまま。速度は向上。コールドスタートは減少。
「同じパフォーマンスを維持しながらサーバーレス支出を90%削減し、1000倍の成長にスケールアップした今でも、Vercelは総インフラ支出の5%未満です。」——マイカ・スミス、VPエンジニアリング
インフラはほとんど意識されなくなった。これは、製品体験に費やす時間が増え、ツールのデバッグやサーバーのプロビジョニングに費やす時間が減ったことを意味する。
針の穴を通す
「多くの医師や医療専門家は、本当に時代遅れのソフトウェアに慣れています」とアンディは言う。
彼の言う通りだ。病院のソフトウェアはしばしば90年代に設計されたように見えるが、それらのツールは信頼性が高い。OpenEvidenceは針の穴を通さなければならない。信頼性の基準を維持しつつ、現代的なソリューションを構築するのだ。
彼らのバイラルな瞬間は、プラットフォームが病院レベルの信頼性を維持しながら、突然の流入にも対応できることを証明した。
見事に成功した。
ローンチ以来、OpenEvidenceは米国の医師の40%以上にサービスを提供するまでに成長した。フロントエンドチームは依然として小規模だ。インフラは相変わらず、ただ機能する。
OpenEvidenceについて:OpenEvidenceは米国で最も急速に成長している臨床意思決定支援プラットフォームであり、米国の臨床医の間で最も広く使用されている医療検索エンジンです。OpenEvidenceは、数十万人の検証済み医療専門家から信頼され、査読付き医学文献に基づき、出典が明示された、診療現場での重大な臨床判断を行うために使用されています。医師が命を救い、患者ケアを改善するのを助けるという使命を持って設立されたOpenEvidenceは、米国の医師の平均40%以上によって毎日使用され、全国10,000以上の病院や医療センターに広がっています。詳細はopenevidence.comをご覧ください。
原文を表示
Andy Yoon was scrolling through Slack when he saw the message: OpenEvidence had gone viral on TikTok.
Not "gaining traction.” Actually viral, reaching around two million views in less than a week.
This is usually when you rally the troops, spin up emergency capacity, and start making phone calls you really didn't want to make.
Andy, Lead Frontend Engineer, did none of those things.
Instead, he watched the numbers climb. He checked the logs—everything green. Response times: still fast. Error rates: still near zero. Then he went back to whatever he was doing before, because there was nothing to fix.
"Vercel has just completely scaled with that usage," he says. "We've never had it fall over due to capacity or had to provision anything extra. Just being able to trust that it's there, to the point where we don't really even think about it, is amazing."
It was proof that they'd solved a problem most healthcare tech companies haven't figured out yet: how to move at startup speed while meeting hospital-grade reliability standards.
When failure isn't an option
The stakes are different for companies like OpenEvidence. If their product fails, it could result in someone making a bad medical decision.
OpenEvidence is the most widely used clinical decision support platform among U.S. clinicians, supporting over 20 million clinical consultations in January 2026. Over 100 million Americans were treated by a doctor using OpenEvidence last year.
A general-purpose model can afford to be wrong, but a clinical tool cannot. Physicians expect speed, but they also expect stability, clarity, and trust.
This pressure sits on top of every technical decision at OpenEvidence: it has to work, every time.
A frontend engineer and a team of Python developers
When Andy joined OpenEvidence about three years ago, he discovered something that would make most frontend engineers nervous: he was basically the only one.
"I was pretty much the only engineer on our team coming from an actual frontend background," he says. "Most of our team works in Python and machine learning."
They couldn't afford infrastructure that needed constant babysitting. They needed something that would just work. Deploy code, it goes live. Traffic increases, it scales.
So OpenEvidence uses a hybrid architecture. The backend is built in Python and runs on Google Cloud Platform. It handles data ingestion, model orchestration, and core business logic, while the frontend is built with Next.js and deployed on Vercel.
"Given the makeup of our engineering team, Vercel has really scaled with our frontend so well," Andy notes.
Each commit deploys automatically. Production deploys take five minutes. Preview URLs appear for every branch. For a small team supporting millions of medical consultations daily for almost half of all physicians in the US, it’s been indispensable.
Prototyping at speed
Before OpenEvidence became what it is today, it was dozens of other things first. Each proof of concept was deployed on Vercel as its own project with a custom domain.
Vercel made it simple. Spin up a new project, connect a custom domain, push code, and you have what looks like a production environment. Stakeholders could click around and test workflows.
This ability to spin up projects in minutes helped the team find product-market fit. It also made it easier to win early enterprise partnerships.
When building out new features, preview deployments give them shareable links for live demos. Changes can be rolled out safely, because they can be reverted instantly if needed.
The 90% surprise
As OpenEvidence scaled to 1000x growth, the lead infrastructure engineer, Micah Smith, kept a close eye on compute costs. When Vercel introduced Fluid compute, it changed how serverless workloads run—combining on-demand execution with server-like efficiency, lower latency, and better performance under load.
The team enabled Fluid compute to see what would happen, and their serverless spend dropped by 90%. Same reliability. Faster speed. Fewer cold starts.
"We reduced our serverless spend by 90% while maintaining the same performance, and even as we've scaled up to 1000x growth, Vercel is less than 5% of our overall infra spend." —Micah Smith, VP Engineering
The infrastructure is almost invisible, meaning more time spent on product experience and less time debugging tools or provisioning servers.
Threading the needle
"A lot of doctors and medical professionals are used to really outdated software," Andy says.
He's not wrong. Hospital software often looks like it was designed in the '90s, but those tools are reliable. OpenEvidence has to thread the needle, building a modern solution that upholds the reliability bar.
Their viral moment proved the platform could handle a sudden influx while maintaining hospital-grade reliability.
It did.
Since launching, OpenEvidence has grown to serve over 40% of physicians in the United States. The frontend team is still small. The infrastructure still just works.
About OpenEvidence: OpenEvidence is the fastest-growing clinical decision support platform in the United States, and the most widely used medical search engine among U.S. clinicians. OpenEvidence is trusted by hundreds of thousands of verified healthcare professionals to make high-stakes clinical decisions at the point of care that are sourced, cited, and grounded in peer-reviewed medical literature. Founded with the mission to help doctors save lives and improve patient care, OpenEvidence is actively used daily, on average, by over 40% of physicians in the United States, spanning more than 10,000 hospitals and medical centers nationwide. Learn more at openevidence.com.
Read more
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み