「スプレッドシート向けChatGPT」が困難な工学課題の解決を加速
MIT研究者は、テーブルデータ用のファウンデーションモデルを活用し、ベイズ最適化を革新する手法を開発し、電力系統や材料開発などの高次元な工学問題の解決を最大100倍高速化した。
キーポイント
高次元問題への対応
従来のベイズ最適化が苦手とする数百変数を含む複雑な工学問題に対し、テーブルデータ特化のファウンデーションモデルを用いて重要変数を自動特定し、最適解探索を効率化した。
再学習不要な再利用性
解決プロセス中にモデルを継続的に再訓練する必要がなく、一度学習したファウンデーションモデルを異なる問題領域に適用可能であり、計算リソースの節約と効率化を実現した。
実証環境での高速化
電力系統の最適化など現実的な工学ベンチマークにおいて、既存の広く使われている手法と比較して、最良の解を10〜100倍速く発見できることを実証した。
応用分野の拡大
計算コストが高い材料開発や創薬などの分野において、より複雑な問題ほど大きな速度向上が見込まれるため、実用性が期待される。
影響分析・編集コメントを表示
影響分析
この研究は、従来のベイズ最適化が抱えていた「高次元問題への対応難」と「再学習コストの高さ」というボトルネックを、ファウンデーションモデルの汎用性によって解決した点で重要です。これにより、シミュレーションや実験に莫大なコストがかかる工学・科学分野におけるイノベーションのスピードが飛躍的に向上する可能性があります。特に、問題が複雑になるほど恩恵が大きいため、次世代の材料開発や創薬プロセスにおける標準的な最適化手法となる可能性があります。
編集コメント
工学シミュレーションのコスト削減という実務的な課題に対し、ファウンデーションモデルの「再利用可能性」という特性を最適化アルゴリズムに応用した点は非常に示唆的です。今後は、他のドメインでのベンチマーク検証が待たれます。
多くの工学的課題は、同じ頭の痛い問題に行き着きます――調整すべき要素が多すぎる一方で、テストできる機会は限られているのです。電力網の調整であれ、より安全な車両の設計であれ、評価には毎回コストがかかり、影響を与え得る変数は数百にも上る可能性があります。
自動車の安全設計を考えてみてください。エンジニアは数千もの部品を統合しなければならず、多くの設計上の選択が衝突時の車両性能に影響します。最適な組み合わせを探す際、従来型の最適化ツールは行き詰まるかもしれません。
MITの研究者らは、ベイズ最適化として知られる古典的手法を、数百の変数を持つ問題の解決にどう活用できるかを見直す新たなアプローチを開発しました。電力システム最適化のような現実的な工学的ベンチマークによるテストでは、このアプローチは広く用いられている手法よりも10倍から100倍速く最適解を見つけました。
彼らの手法は、表形式データで訓練されたファウンデーションモデルを活用し、性能向上に最も重要な変数を自動的に特定します。このプロセスを繰り返すことで、より良い解決策へと絞り込んでいきます。ファウンデーションモデルとは、膨大で汎用的なデータセットで訓練された巨大な人工知能システムです。これにより、様々な応用に適応できます。
研究者らの表形式ファウンデーションモデルは、解決策を求める過程で継続的に再訓練する必要がなく、最適化プロセスの効率を高めます。この手法は、より複雑な問題に対してより大きな高速化をもたらすため、材料開発や創薬など要求の厳しい応用分野で特に有用となる可能性があります。
「現代のAIと機械学習モデルは、エンジニアや科学者が複雑なシステムを構築する方法を根本から変え得ます。我々は、高次元問題を解決できるだけでなく、再利用可能なアルゴリズムを考案しました。これにより、多くの問題に、一からすべてを始める必要なく適用できます」と、計算科学・工学の大学院生で、本手法に関する論文の筆頭著者であるローゼン・ユウは述べています。
共著者は、元MITポスドク研究員のシリル・ピカールと、機械工学准教授でMIT計算科学・工学センターのコアメンバーであるファエズ・アーメドです。この研究は国際学習表現会議で発表されます。
実証済み手法の改良
科学者が多面的な問題の解決を目指すが、自動車の衝突試験のように各設計の良し悪しを評価する方法が高コストである場合、彼らはしばしばベイズ最適化という実証済みの手法を用います。この反復的手法は、次に何を探索すべきかの推定に役立つ代理モデルを構築し、予測の不確実性を考慮しながら、複雑なシステムの最適な構成を見つけ出します。
しかし、代理モデルは各反復後に再訓練する必要があり、潜在的な解の空間が非常に大きい場合、計算的に手に負えなくなる可能性があります。さらに、科学者は異なるシナリオに取り組むたびに、新たなモデルを一から構築しなければなりません。
これらの両方の欠点に対処するため、MITの研究者らは、表形式ファウンデーションモデルとして知られる生成AIシステムを、ベイズ最適化アルゴリズム内の代理モデルとして利用しました。
「表形式ファウンデーションモデルは、スプレッドシート版のChatGPTのようなものです。これらのモデルの入力と出力は表形式データであり、工学の領域では言語よりもはるかに一般的に見られ、使用されます」とユウは述べています。
ChatGPT、Claude、Geminiのような大規模言語モデルと同様に、このモデルは膨大な量の表形式データで事前トレーニングされています。これにより、様々な予測問題に取り組む準備ができています。さらに、モデルは一切の再訓練を必要とせず、そのままデプロイできます。
システムを最適化のためにより正確かつ効率的にするため、研究者らは、解決策に最大の影響を与える設計空間の特徴をモデルが特定できるようにする工夫を採用しました。
「車には300の設計要件があるかもしれませんが、いくつかの安全パラメータを向上させようとする場合、それらすべてが最適設計の主な要因となるわけではありません。我々のアルゴリズムは、最も重要な特徴を賢く選択し、そこに焦点を当てることができます」とユウは述べています。
これは、表形式ファウンデーションモデルを用いて、どの変数(または変数の組み合わせ)が結果に最も影響を与えるかを推定することで実現します。
その後、すべてを均等に探索する時間を無駄にせず、それらの高影響変数に検索を集中させます。例えば、フロントのクランプルゾーン(衝撃吸収領域)のサイズが大幅に増加し、車の安全評価が向上した場合、その特徴が改善に寄与した可能性が高いといえます。
より大きな問題、より良い解決策
最大の課題の一つは、このタスクに最適な表形式ファウンデーションモデルを見つけることでした、とユウは述べています。次に、最も重要な設計特徴を特定できるよう、それをベイズ最適化アルゴリズムと接続しなければなりませんでした。
「最も重要な次元を見つけることは、数学と計算機科学ではよく知られた問題ですが、表形式ファウンデーションモデルの特性を活用する方法を考案することは真の挑戦でした」とユウは述べています。
アルゴリズムの枠組みが整ったため、研究者らは自らの手法を5つの最先端最適化アルゴリズムと比較してテストしました。
電力網設計や自動車衝突試験のような現実的な状況を含む60のベンチマーク問題において、彼らの手法は他のアルゴリズムよりも一貫して10倍から100倍速く最適解を見つけました。
「最適化問題の次元が増えれば増えるほど、我々のアルゴリズムは真価を発揮します」とユウは付け加えました。
しかし、彼らの手法は、ロボット経路計画など全ての問題で比較対象を上回ったわけではありません。これはおそらく、そのシナリオがモデルのトレーニングデータで十分に定義されていなかったことを示している、とユウは述べています。
将来的に、研究者らは表形式ファウンデーションモデルの性能を向上させる方法を研究したいと考えています。また、海軍艦艇の設計のように、数千、さらには数百万次元の問題に彼らの技術を適用したいと考えています。
「より高いレベルでは、この研究はより広範な変化を示しています。ファウンデーションモデルを、知覚や言語のためだけでなく、科学技術ツール内のアルゴリズムエンジンとして使用し、ベイズ最適化のような古典的手法を、以前は非現実的だった領域にスケールさせることが可能になるのです」とアーメドは述べています。
「この研究で提示された、事前トレーニングされたファウンデーションモデルと高次元ベイズ最適化を組み合わせるアプローチは、シミュレーションベース設計の重いデータ要件を軽減するための創造的で有望な方法です。全体として、この研究は、高度な設計最適化をよりアクセスしやすく、実世界の設定で適用しやすくするための実用的で強力な一歩です」と、この研究に関与していないノースウェスタン大学のウィルソン・クック工学設計教授で機械工学科長のウェイ・チェンは述べています。
原文を表示
Many engineering challenges come down to the same headache — too many knobs to turn and too few chances to test them. Whether tuning a power grid or designing a safer vehicle, each evaluation can be costly, and there may be hundreds of variables that could matter.
Consider car safety design. Engineers must integrate thousands of parts, and many design choices can affect how a vehicle performs in a collision. Classic optimization tools could start to struggle when searching for the best combination.
MIT researchers developed a new approach that rethinks how a classic method, known as Bayesian optimization, can be used to solve problems with hundreds of variables. In tests on realistic engineering-style benchmarks, like power-system optimization, the approach found top solutions 10 to 100 times faster than widely used methods.
Their technique leverages a foundation model trained on tabular data that automatically identifies the variables that matter most for improving performance, repeating the process to hone in on better and better solutions. Foundation models are huge artificial intelligence systems trained on vast, general datasets. This allows them to adapt to different applications.
The researchers’ tabular foundation model does not need to be constantly retrained as it works toward a solution, increasing the efficiency of the optimization process. The technique also delivers greater speedups for more complicated problems, so it could be especially useful in demanding applications like materials development or drug discovery.
“Modern AI and machine-learning models can fundamentally change the way engineers and scientists create complex systems. We came up with one algorithm that can not only solve high-dimensional problems, but is also reusable so it can be applied to many problems without the need to start everything from scratch,” says Rosen Yu, a graduate student in computational science and engineering and lead author of a paper on this technique.
Yu is joined on the paper by Cyril Picard, a former MIT postdoc and research scientist, and Faez Ahmed, associate professor of mechanical engineering and a core member of the MIT Center for Computational Science and Engineering. The research will be presented at the International Conference on Learning Representations.
Improving a proven method
When scientists seek to solve a multifaceted problem but have expensive methods to evaluate success, like crash testing a car to know how good each design is, they often use a tried-and-true method called Bayesian optimization. This iterative method finds the best configuration for a complicated system by building a surrogate model that helps estimate what to explore next while considering the uncertainty of its predictions.
But the surrogate model must be retrained after each iteration, which can quickly become computationally intractable when the space of potential solutions is very large. In addition, scientists need to build a new model from scratch any time they want to tackle a different scenario.
To address both shortcomings, the MIT researchers utilized a generative AI system known as a tabular foundation model as the surrogate model inside a Bayesian optimization algorithm.
“A tabular foundation model is like a ChatGPT for spreadsheets. The input and output of these models are tabular data, which in the engineering domain is much more common to see and use than language,” Yu says.
Just like large language models such as ChatGPT, Claude, and Gemini, the model has been pre-trained on an enormous amount of tabular data. This makes it well-equipped to tackle a range of prediction problems. In addition, the model can be deployed as-is, without the need for any retraining.
To make their system more accurate and efficient for optimization, the researchers employed a trick that enables the model to identify features of the design space that will have the biggest impact on the solution.
“A car might have 300 design criteria, but not all of them are the main driver of the best design if you are trying to increase some safety parameters. Our algorithm can smartly select the most critical features to focus on,” Yu says.
It does this by using a tabular foundation model to estimate which variables (or combinations of variables) most influence the outcome.
It then focuses the search on those high-impact variables instead of wasting time exploring everything equally. For instance, if the size of the front crumple zone significantly increased and the car’s safety rating improved, that feature likely played a role in the enhancement.
Bigger problems, better solutions
One of their biggest challenges was finding the best tabular foundation model for this task, Yu says. Then they had to connect it with a Bayesian optimization algorithm in such a way that it could identify the most prominent design features.
“Finding the most prominent dimension is a well-known problem in math and computer science, but coming up with a way that leveraged the properties of a tabular foundation model was a real challenge,” Yu says.
With the algorithmic framework in place, the researchers tested their method by comparing it to five state-of-the-art optimization algorithms.
On 60 benchmark problems, including realistic situations like power grid design and car crash testing, their method consistently found the best solution between 10 and 100 times faster than the other algorithms.
“When an optimization problem gets more and more dimensions, our algorithm really shines,” Yu added.
But their method did not outperform the baselines on all problems, such as robotic path planning. This likely indicates that scenario was not well-defined in the model’s training data, Yu says.
In the future, the researchers want to study methods that could boost the performance of tabular foundation models. They also want to apply their technique to problems with thousands or even millions of dimensions, like the design of a naval ship.
“At a higher level, this work points to a broader shift: using foundation models not just for perception or language, but as algorithmic engines inside scientific and engineering tools, allowing classical methods like Bayesian optimization to scale to regimes that were previously impractical,” says Ahmed.
“The approach presented in this work, using a pretrained foundation model together with high‑dimensional Bayesian optimization, is a creative and promising way to reduce the heavy data requirements of simulation‑based design. Overall, this work is a practical and powerful step toward making advanced design optimization more accessible and easier to apply in real-world settings,” says Wei Chen, the Wilson-Cook Professor in Engineering Design and chair of the Department of Mechanical Engineering at Northwestern University, who was not involved in this research.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み