AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
MIT ML News·2026年4月17日 13:00·約8分で読める

AI駆動のタンパク質設計ツールを世界中の生物学者に提供

#タンパク質設計#生成AI#ノーコードAI#バイオインフォマティクス#創薬AI#基盤モデル
TL;DR

OpenProtein.AIは、機械学習の専門知識を持たない科学者向けにノーコードプラットフォームを提供し、タンパク質設計・構造予測・機能予測のための強力な基盤モデルへのアクセスを可能にすることで、AI駆動の生物学研究を民主化している。

AI深層分析2026年4月17日 14:41
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

AI駆動タンパク質設計ツールの民主化

OpenProtein.AIはノーコードプラットフォームを提供し、機械学習の専門知識を持たない科学者でも最先端のAIモデルを利用できるようにしている。

2

創薬・治療開発の効率化

AIモデルはタンパク質工学を効率化し、治療薬や産業用途の開発サイクルを短縮するとともに、特定の特性を持つ新しいタンパク質の設計能力を高める。

3

生物学システムの言語化への挑戦

同社はタンパク質配列から直接機能を予測するアプローチを追求し、生物学システムを記述する「言語」の創出を目指している。

4

学術界への無料提供

製薬・バイオテクノロジー企業だけでなく、学術界の研究者にもプラットフォームを無料で提供している。

影響分析・編集コメントを表示

影響分析

この記事は、AIと生物学の融合が専門家の手から一般の科学者に広がる転換点を示している。ノーコードプラットフォームによるアクセスの民主化は、創薬やバイオテクノロジー分野のイノベーションを加速させ、生物学研究のパラダイムシフトを引き起こす可能性がある。

編集コメント

AIの民主化が生物学研究にまで及んだ画期的な事例。専門知識の壁を下げることで、より多くの科学者がAIを活用した発見に参加できる環境が整いつつある。

人工知能(AI)は、創薬プロセスを加速し、疾患の理解を深める可能性を既に示しています。しかし、AIを新たな治療法へと変えるためには、最新かつ最も強力なモデルを科学者の手に届ける必要があります。

問題は、ほとんどの科学者が機械学習の専門家ではないことです。現在、OpenProtein.AI社は、ノーコードプラットフォームを通じて、強力な基盤モデルと、タンパク質の設計、構造・機能の予測、モデルの学習のための一連のツールへのアクセスを提供し、科学者がAIの最先端に留まるのを支援しています。

Tristan Bepler PhD ’20と元MIT准教授のTim Lu PhD ’07によって設立された同社は、タンパク質工学のための社内開発基盤モデルを含むツールを、あらゆる規模の製薬・バイオテクノロジー企業の研究者に既に提供しています。OpenProtein.AIはまた、学術界の科学者に対しても無料でそのプラットフォームを提供しています。

「現在は非常にエキサイティングな時期です。なぜなら、これらのモデルはタンパク質工学をより効率的にするだけでなく(これにより治療薬や産業用途の開発サイクルが短縮されます)、特定の特性を持つ新しいタンパク質を設計する能力も高めることができるからです」とBeplerは述べています。「私たちはまた、これらのアプローチを非タンパク質モダリティに適用することも考えています。大局的には、生物学的システムを記述するための言語を作り出しているのです。」

AIによる生物学の進歩

Beplerは2014年、計算・システム生物学博士課程プログラムの一員としてMITに来ました。MITのSimons応用数学教授であるBonnie Bergerの下で学び、そこで彼は、生物学の構成要素を成す分子について、私たちの理解がいかに乏しいかを認識しました。

「生物分子やタンパク質を十分に特徴づけていなかったため、例えば全ゲノム回路の挙動や、タンパク質相互作用ネットワークの振る舞いについて、優れた予測モデルを作成することができませんでした」とBeplerは回想します。「それは私に、より詳細なレベルでタンパク質を理解することに興味を持たせました。」

Beplerは、進化データを分析することでタンパク質を構成するアミノ酸鎖を予測する方法を探り始めました。これは、Googleがタンパク質構造の強力な予測モデルであるAlphaFoldをリリースする前のことでした。この研究は、タンパク質の理解と設計のための最初の生成AIモデルの一つ、チームがタンパク質言語モデルと呼ぶものにつながりました。

「私は、タンパク質の古典的な枠組みと、その配列、構造、機能の間の関係に本当に興奮しました。私たちはそれらの関連を十分に理解していません」とBeplerは言います。「では、これらの基盤モデルを使って『構造』要素を飛ばし、配列から直接機能へと移行するにはどうすればよいでしょうか?」

2020年に博士号を取得した後、BeplerはMIT生物工学科のLuの研究室にポスドクとして入りました。

「これは、AIと生物学を統合するという考えが広まり始めた頃でした」とLuは回想します。「Tristanは、生物学的設計のためのより良い計算モデルの構築を手伝ってくれました。また、利用可能な最先端のツールと、それらを使いたいがコードの書き方を知らない生物学者との間に隔たりがあることも認識しました。OpenProteinは、これらのツールへのアクセスを広げるという考えから生まれました。」

Beplerは博士課程の一環として、AIの最前線で働いていました。彼は、この技術が科学者の研究を加速するのに役立つことを知っていました。

「私たちは、機械学習インザループのタンパク質工学を行うための汎用プラットフォームを構築するという考えから始めました」とBeplerは言います。「機械学習の概念はある種難解ですから、ユーザーフレンドリーなものを作りたいと思いました。それらは実装、GPU、ファインチューニング、配列ライブラリの設計を必要とします。特に当時は、生物学者が学ぶには多くのことがありました。」

対照的に、OpenProteinのプラットフォームは、生物学者がデータをアップロードし、機械学習を用いたタンパク質工学作業を行うための直感的なウェブインターフェースを備えています。同社の主力タンパク質言語モデルであるPoETを含む、さまざまなオープンソースモデルを特徴としています。

Protein Evolutionary Transformerの略であるPoETは、関連するタンパク質のセットを生成するためにタンパク質グループで訓練されました。Beplerと彼の共同研究者は、それがタンパク質に対する進化的制約について一般化し、再訓練なしでタンパク質配列に関する新しい情報を取り込むことができることを示し、他の研究者が実験データを追加してモデルを改善できるようにしました。

「研究者は独自のデータを使ってモデルを訓練し、タンパク質配列を最適化し、その後、私たちの他のツールを使ってそれらのタンパク質を分析することができます」とBeplerは言います。「人々はタンパク質配列のライブラリをin silico(コンピュータ上で)生成し、それらを予測モデルに通して検証と構造予測を行っています。基本的にはノーコードのフロントエンドですが、コードでアクセスしたい人のためのAPIも用意しています。」

これらのモデルは、研究者がより速くタンパク質を設計し、その後、どのタンパク質がさらなる実験室テストに値するほど有望かを判断するのに役立ちます。研究者はまた、関心のあるタンパク質を入力すると、モデルは類似の特性を持つ新しいタンパク質を生成することができます。

設立以来、OpenProteinのチームは、研究室の規模やリソースに関わらず、研究者のためにプラットフォームにツールを追加し続けています。

「私たちは、このプラットフォームをオープンエンドのツールボックスにするために本当に努力してきました」とBeplerは言います。「特定のワークフローはありますが、特定の一つのタンパク質機能やタンパク質クラスに特化して縛られているわけではありません。これらのモデルの素晴らしい点の一つは、タンパク質を広く理解するのが非常に得意だということです。可能なタンパク質の全体空間について学習するのです。」

次世代治療法の実現

大手製薬会社のBoehringer Ingelheimは、2025年初頭にOpenProteinのプラットフォームの使用を開始しました。最近、両社は拡大した協業を発表し、OpenProteinのプラットフォームとモデルが、がんや自己免疫疾患、炎症性疾患などの治療のためのタンパク質を設計するBoehringer Ingelheimの業務に組み込まれることになりました。

昨年、OpenProteinはまた、そのタンパク質言語モデルの新バージョンであるPoET-2をリリースしました。これは、計算リソースと実験データのごく一部を使用しながら、はるかに大きなモデルを上回る性能を発揮します。

「私たちは、タンパク質をどのように記述するかという問題を本当に解決したいと思っています」とBeplerは言います。「私たちがタンパク質を生成する際に使用する、意味のある、ドメイン固有のタンパク質制約の言語とは何でしょうか? どのようにしてより多くの進化的制約を取り入れることができるでしょうか? モデルがその反応を行う配列を生成できるように、タンパク質が行う酵素反応をどのように記述できるでしょうか?」

今後、創業者たちは、タンパク質機能の変化し、相互接続された性質を考慮に入れたモデルを作成したいと考えています。

「私が興奮している分野は、タンパク質結合事象を超えて、これらのモデルを使って動的特性を予測・設計することです。つまり、タンパク質が2つ、3つ、または4つの生物学的メカニズムに同時に関与する必要がある場合、または結合後にその機能を変化させる場合です」と、現在同社のアドバイザーを務めるLuは述べています。

AIの進歩が急速に進む中、OpenProteinは、科学者が新しい治療法をより速く開発するための最良のツールを提供するという使命を続けています。

「タンパク質ロジックや動的治療法のようなものを組み込んだアプローチにより、作業がより複雑になるにつれて、既存の実験ツールセットは限定的になります」とLuは言います。「AIと生物学の周りにオープンなエコシステムを作り出すことは本当に重要です。AIリソースがあまりにも集中してしまい、平均的な研究者がそれらを使えなくなるリスクがあります。科学的な分野が進歩するためには、オープンアクセスが非常に重要です。」

原文を表示

Artificial intelligence is already proving it can accelerate drug development and improve our understanding of disease. But to turn AI into novel treatments we need to get the latest, most powerful models into the hands of scientists.

The problem is that most scientists aren’t machine-learning experts. Now the company OpenProtein.AI is helping scientists stay on the cutting edge of AI with a no-code platform that gives them access to powerful foundation models and a suite of tools for designing proteins, predicting protein structure and function, and training models.

The company, founded by Tristan Bepler PhD ’20 and former MIT associate professor Tim Lu PhD ’07, is already equipping researchers in pharmaceutical and biotech companies of all sizes with its tools, including internally developed foundation models for protein engineering. OpenProtein.AI also offers its platform to scientists in academia for free.

“It’s a really exciting time right now because these models can not only make protein engineering more efficient — which shortens development cycles for therapeutics and industrial uses — they can also enhance our ability to design new proteins with specific traits,” Bepler says. “We’re also thinking about applying these approaches to non-protein modalities. The big picture is we’re creating a language for describing biological systems.”

Advancing biology with AI

Bepler came to MIT in 2014 as part of the Computational and Systems Biology PhD Program, studying under Bonnie Berger, MIT’s Simons Professor of Applied Mathematics. It was there that he realized how little we understand about the molecules that make up the building blocks of biology.

“We hadn’t characterized biomolecules and proteins well enough to create good predictive models of what, say, a whole genome circuit will do, or how a protein interaction network will behave,” Bepler recalls. “It got me interested in understanding proteins at a more fine-grained level.”

Bepler began exploring ways to predict the chains of amino acids that make up proteins by analyzing evolutionary data. This was before Google released AlphaFold, a powerful prediction model for protein structure. The work led to one of the first generative AI models for understanding and designing proteins — what the team calls a protein language model.

“I was really excited about the classical framework of proteins and the relationships between their sequence, structure, and function. We don’t understand those links well,” Bepler says. “So how could we use these foundation models to skip the ‘structure’ component and go straight from sequence to function?”

After earning his PhD in 2020, Bepler entered Lu’s lab in MIT’s Department of Biological Engineering as a postdoc.

“This was around the time when the idea of integrating AI with biology was starting to pick up,” Lu recalls. “Tristan helped us build better computational models for biologic design. We also realized there’s a disconnect between the most cutting-edge tools available and the biologists, who would love to use these things but don’t know how to code. OpenProtein came from the idea of broadening access to these tools.”

Bepler had worked at the forefront of AI as part of his PhD. He knew the technology could help scientists accelerate their work.

“We started with the idea to build a general-purpose platform for doing machine learning-in-the-loop protein engineering,” Bepler says. “We wanted to build something that was user friendly because machine-learning ideas are kind of esoteric. They require implementation, GPUs, fine-tuning, designing libraries of sequences. Especially at that time, it was a lot for biologists to learn.”

OpenProtein’s platform, in contrast, features an intuitive web interface for biologists to upload data and conduct protein engineering work with machine learning. It features a range of open-source models, including PoET, OpenProtein’s flagship protein language model.

PoET, short for Protein Evolutionary Transformer, was trained on protein groups to generate sets of related proteins. Bepler and his collaborators showed it could generalize about evolutionary constraints on proteins and incorporate new information on protein sequences without retraining, allowing other researchers to add experimental data to improve the model.

“Researchers can use their own data to train models and optimize protein sequences, and then they can use our other tools to analyze those proteins,” Bepler says. “People are generating libraries of protein sequences in silico [on computers] and then running them through predictive models to get validation and structural predictors. It’s basically a no-code front-end, but we also have APIs for people who want to access it with code.”

The models help researchers design proteins faster, then decide which ones are promising enough for further lab testing. Researchers can also input proteins of interest, and the models can generate new ones with similar properties.

Since its founding, OpenProtein’s team has continued to add tools to its platform for researchers regardless of their lab size or resources.

“We’ve tried really hard to make the platform an open-ended toolbox,” Bepler says. “It has specific workflows, but it’s not tied specifically to one protein function or class of proteins. One of the great things about these models is they are very good at understanding proteins broadly. They learn about the whole space of possible proteins.”

Enabling the next generation of therapies

The large pharmaceutical company Boehringer Ingelheim began using OpenProtein’s platform in early 2025. Recently, the companies announced an expanded collaboration that will see OpenProtein’s platform and models embedded into Boehringer Ingelheim’s work as it engineers proteins to treat diseases like cancer and autoimmune or inflammatory conditions.

Last year, OpenProtein also released a new version of its protein language model, PoET-2, that outperforms much larger models while using a small fraction of the computing resources and experimental data.

“We really want to solve the question of how we describe proteins,” Bepler says. “What’s the meaningful, domain-specific language of protein constraints we use as we generate them? How can we bring in more evolutionary constraints? How can we describe an enzymatic reaction a protein carries out such that a model can generate sequences to do that reaction?”

Moving forward, the founders are hoping to make models that factor in the changing, interconnected nature of protein function.

“The area I am excited about is going beyond protein binding events to use these models to predict and design dynamic features, where the protein has to engage two, three, or four biological mechanisms at the same time, or change its function after binding,” says Lu, who currently serves in an advisory role for the company.

As progress in AI races forward, OpenProtein continues to see its mission as giving scientists the best tools to develop new treatments faster.

“As work gets more complex, with approaches incorporating things like protein logic and dynamic therapies, the existing experimental toolsets become limiting,” Lu says. “It’s really important to create open ecosystems around AI and biology. There’s a risk that AI resources could get so concentrated that the average researcher can’t use them. Open access is super important for the scientific field to make progress.”

この記事をシェア

関連記事

404 Media★42026年6月4日 23:33

存在しない判例を引用した弁護士を裁判官が厳しく批判する様子を見よ

生成 AI を使用した弁護士が、架空の判例や引用を含む誤った書類を提出し、裁判所から時間浪費と職業への恥辱として非難されている事例が増えている。

Ars Technica AI★42026年5月28日 02:36

YouTube、AI 生成動画の自動ラベル付けを開始

Google が運営する YouTube は、2024 年の試行に続き、アップローダーへの依存を減らし、AI 生成動画をより目立つ形で自動的にラベル付けする方針を発表した。

One Useful Thing★32026年5月27日 04:56

人間らしさを選ぶこと

One Useful Thing は、ソーシャルメディアの投稿やコメント、学術論文、ニューヨーク・タイムズの意見記事が AI によって生成され始めている現状を指摘し、人間らしさを維持する選択の重要性を論じています。

ニュース一覧に戻る元記事を読む