一般デバイス上でプライバシーを保護したAI学習を可能にする新手法
MIT の研究者らが開発した新手法により、プライバシーを保護する連合学習の効率が約 81% 向上し、リソース制約のあるエッジデバイスでの高精度 AI モデルの実用化が可能になる。
キーポイント
効率性の劇的向上
MIT が開発した新手法により、プライバシー保護型 AI 学習の処理速度が約 81% 加速され、遅延が大幅に削減される。
異種ネットワークへの対応
メモリ容量や計算能力、通信環境が異なる多様なデバイス(スマートウォッチ、センサー等)を混在するネットワークでも安定して動作する設計となっている。
データローカライズの維持
連合学習の原則に基づき、生データは各端末に留められたままモデル更新のみが送受信されるため、ユーザーデータのセキュリティとプライバシーが担保される。
高リスク分野への応用
医療や金融など厳格なセキュリティ基準が求められる分野において、クラウド依存ではなく端末上で動作する AI の実現を可能にする。
影響分析・編集コメントを表示
影響分析
この技術は、大規模なクラウドサーバーや GPU に依存せずとも、プライバシーを守りながら高精度な AI を日常の小型デバイスで動作させる道を開く画期的な進展です。これにより、医療や金融といった厳格な規制下にある分野でのエッジ AI の実装が加速し、データ主権とリアルタイム処理能力を両立する未来像が具体化されます。
編集コメント
エッジ AI の実用化における最大の障壁であった「リソース制約」と「通信遅延」を同時に解決する成果は、業界の転換点となる可能性が高い。特にプライバシー重視の分野でのローカル処理実現は、GDPR や各国のデータ規制下でも価値が極めて高い技術である。
MIT の研究者が開発した新しい手法により、プライバシーを保護する人工知能(AI)の学習方法を約 81 パーセント加速することが可能になりました。この進展は、センサーやスマートウォッチなどのリソース制約のあるエッジデバイスにおいて、ユーザーデータを安全に保ちながらより正確な AI モデルを展開することを可能にする可能性があります。
MIT の研究者たちは、連合学習(federated learning)と呼ばれる手法の効率を向上させました。これは、接続されたデバイスのネットワークが協力して共有 AI モデルを学習する技術です。
連合学習では、モデルは中央サーバーから無線デバイスへブロードキャストされます。各デバイスはローカルデータを使用してモデルを学習し、その後モデルの更新情報をサーバーへ転送します。データは各デバイス上に残されるため、セキュリティが保たれます。
しかし、ネットワーク内のすべてのデバイスが、モデルをサーバーとやり取りして保存・学習・転送するのに十分な容量や計算能力、接続性を備えているわけではありません。これにより遅延が生じ、学習パフォーマンスが悪化します。
MIT の研究者たちは、これらのメモリ制約と通信のボトルネックを克服する手法を開発しました。この方法は、多様な制限を持つ無線デバイスの異種ネットワーク(heterogenous network)に対応するように設計されています。
この新しいアプローチは、医療や金融など、厳格なセキュリティおよびプライバシー基準が求められる高リスクなアプリケーションにおいて AI モデルを使用することをより現実的なものにする可能性があります。
「この研究は、現在このような強力なモデルを実行することが不可能な小型デバイスに AI を持ち込むことを目的としています。私たちはこれらのデバイスを日常生活の中で常に携行しています。AI は巨大なサーバーや GPU 上だけでなく、これらのデバイスでも実行可能である必要があります。この研究はその実現に向けた重要な一歩です」と、電気工学・コンピュータサイエンス(EECS)の大学院生であり、本手法に関する論文 paper on this technique の筆頭著者であるアイリーン・テニソン氏は述べています。
共著者には、リンカーン研究所で機械学習エンジニアを務めるアンナ・マーフィー氏('25 年卒)、スイスのローザンヌ連邦工科大学(EPFL)から訪日学生であり、Flower Labs で機械学習エンジニアを務めるシャルル・ボーヴィユ氏、そして MIT のコンピュータサイエンスおよび人工知能研究所(CSAIL)で主任研究科学者を務める上級著者のララーナ・カガル氏が含まれています。本研究は IEEE 国際ニューラルネットワーク合同会議にて発表されます。
レイテンシの削減
多くのフェデレーテッドラーニング(連合学習)のアプローチでは、ネットワーク上のすべてのデバイスが完全な AI モデルをトレーニングするための十分なメモリを持ち、更新情報をサーバーへ迅速に送信するための安定した接続性を有していると仮定しています。
しかし、スマートウォッチ、ワイヤレスセンサー、携帯電話など、多様なデバイスを組み合わせたネットワークにおいては、これらの仮定は不十分です。これらのエッジデバイス(edge devices)は限られたメモリと計算能力しか持たず、しばしば断続的なネットワーク接続に直面します。
中央サーバーは通常、すべてのデバイスからのモデル更新を受信するまで待機し、それらを平均化してトレーニングラウンドを完了します。このプロセスはトレーニングが完了するまで繰り返されます。
「この遅延時間はトレーニング手順を遅くしたり、場合によっては失敗させたりする可能性があります」とテニソン氏は述べています。
これらの制限を克服するため、MIT の研究者たちは、各モバイルデバイスに必要なメモリおよび通信オーバーヘッドを削減する新しいフレームワーク「FTTE(Federated Tiny Training Engine)」を開発しました。
彼らのフレームワークには3 つの主要な革新が含まれています。
第一に、FTTE はモデル全体をすべてのデバイスにブロードキャストするのではなく、モデルパラメータのより小さなサブセットを送信し、各デバイスのメモリ要件を削減します。パラメータとは、トレーニング中にモデルが調整する内部変数のことです。
FTTE は、特定のメモリ予算内に収まりながらモデルの精度を最大化するパラメータを特定するために、特別な探索手順を使用します。この制限は、最もメモリ制約の厳しいデバイスに基づいて設定されます。
第二に、サーバーは非同期アプローチを使用してモデルを更新します。すべてのデバイスからの応答を待つのではなく、サーバーは受信した更新を蓄積し、固定容量に達するまで待ち、その後トレーニングラウンドを進めます。
第三に、サーバーは各デバイスからの更新を受信したタイミングに基づいて重み付けを行います。これにより、古い更新がトレーニングプロセスに与える影響は小さくなります。これらの古くなったデータはモデルの進捗を妨げ、トレーニングプロセスを遅らせ、精度を低下させる可能性があります。
「この半同期アプローチを採用したのは、最も性能の低いデバイスもトレーニングプロセスに参加させ、モデルにデータを提供できるようにするためです。しかし、ネットワーク内の高性能なデバイスが長時間アイドル状態になってリソースを浪費させることは避けたいのです」とテニソン氏は述べています。
加速の実現
研究者たちは、数百台の異種デバイスと多様なモデル、データセットを用いたシミュレーションでフレームワークを検証しました。その結果、FTTE は標準的な連合学習アプローチと比較して、トレーニング手順を平均 81% 高速化することができました。
同手法は、オンデバイス上のメモリオーバーヘッドを 80% 削減し、通信ペイロードを 69% 削減しながらも、他の技術と同等の精度を達成しました。
「バッテリー寿命を節約するため、モデルを可能な限り速くトレーニングしたいと考えています。そのため、精度にはトレードオフが生じます。しかし、精度がわずかに低下することは、特に私たちの手法が非常に高速であるため、一部のアプリケーションでは許容できる範囲です」と同氏は説明しています。
FTTE はまた、効果的なスケーラビリティを示し、より大規模なデバイスグループにおいて高いパフォーマンス向上をもたらしました。
これらのシミュレーションに加え、研究者たちは計算能力が異なる実機による小規模ネットワークでも FTTE を検証しました。
「すべての人が最新の Apple iPhone を持っているわけではありません。例えば多くの発展途上国では、ユーザーは性能の低い携帯電話を所有している可能性があります。私たちの技術を用いれば、連合学習の恩恵をこうした環境にももたらすことができます」と彼女は述べています。
将来、研究者たちは、モデルの平均的な性能に焦点を当てるのではなく、各デバイス上の AI モデルのパフォーマンスをよりパーソナライズされたものへと向上させるために、自らの手法がどのように活用できるかを研究したいと考えています。また、実際のハードウェアを用いて大規模な実験も実施する予定です。
本研究は一部、武田博士後援会(Takeda PhD Fellowship)の助成により支援されました。
原文を表示
A new method developed by MIT researchers can accelerate a privacy-preserving artificial intelligence training method by about 81 percent. This advance could enable a wider array of resource-constrained edge devices, like sensors and smartwatches, to deploy more accurate AI models while keeping user data secure.
The MIT researchers boosted the efficiency of a technique known as federated learning, which involves a network of connected devices that work together to train a shared AI model.
In federated learning, the model is broadcast from a central server to wireless devices. Each device trains the model using its local data and then transfers model updates back to the server. Data are kept secure because they remain on each device.
But not all devices in the network have enough capacity, computational capability, and connectivity to store, train, and transfer the model back and forth with the server in a timely manner. This causes delays that worsen training performance.
The MIT researchers developed a technique to overcome these memory constraints and communication bottlenecks. Their method is designed to handle a heterogenous network of wireless devices with varied limitations.
This new approach could make it more feasible for AI models to be used in high-stakes applications with strict security and privacy standards, like health care and finance.
“This work is about bringing AI to small devices where it is not currently possible to run these kinds of powerful models. We carry these devices around with us in our daily lives. We need AI to be able to run on these devices, not just on giant servers and GPUs, and this work is an important step toward enabling that,” says Irene Tenison, an electrical engineering and computer science (EECS) graduate student and lead author of a paper on this technique.
Her co-authors include Anna Murphy ’25, a machine-learning engineer at Lincoln Laboratory; Charles Beauville, a visiting student from Ecole Polytechnique Fédérale de Lausanne (EPFL) in Switzerland and a machine-learning engineer at Flower Labs; and senior author Lalana Kagal, a principal research scientist in the Computer Science and Artificial Intelligence Laboratory (CSAIL) at MIT. The research will be presented at the IEEE International Joint Conference on Neural Networks.
Reducing lag time
Many federated learning approaches assume all devices in the network have enough memory to train the full AI model, and stable connectivity to transmit updates back to the server quickly.
But these assumptions fall short with a network of heterogenous devices, like smartwatches, wireless sensors, and mobile phones. These edge devices have limited memory and computational power, and often face intermittent network connectivity.
The central server usually waits to receive model updates from all devices, then averages them to complete the training round. This process repeats until training is complete.
“This lag time can slow down the training procedure or even cause it to fail,” Tenison says.
To overcome these limitations, the MIT researchers developed a new framework called FTTE (Federated Tiny Training Engine) that reduces the memory and communication overhead needed by each mobile device.
Their framework involves three main innovations.
First, rather than broadcasting the entire model to all devices, FTTE sends a smaller subset of model parameters instead, reducing the memory requirement for each device. Parameters are internal variables the model adjusts during training.
FTTE uses a special search procedure to identify parameters that will maximize the model’s accuracy while staying within a certain memory budget. That limit is set based on the most memory-constrained device.
Second, the server updates the model using an asynchronous approach. Rather than waiting for responses from all devices, the server accumulates incoming updates until it reaches a fixed capacity, then proceeds with the training round.
Third, the server weights updates from each device based on when it received them. In this way, older updates don’t contribute as much to the training process. These outdated data can hold the model back, slowing the training process and reducing accuracy.
“We use this semi-asynchronous approach because want to involve the least powerful devices in the training process so they can contribute their data to the model, but we don’t want the more powerful devices in the network to stay idle for a long time and waste resources,” Tenison says.
Achieving acceleration
The researchers tested their framework in simulations with hundreds of heterogeneous devices and a variety of models and datasets. On average, FTTE enabled the training procedure to reach completing 81 percent faster than standard federated learning approaches.
Their method reduced the on-device memory overhead by 80 percent and the communication payload by 69 percent, while attaining near the accuracy of other techniques.
“Because we want the model to train as fast as possible to save the battery life of these resource-constrained devices, we do have a tradeoff in accuracy. But a small drop in accuracy could be acceptable in some applications, especially since our method performs so much faster,” she says.
FTTE also demonstrated effective scalability and delivered higher performance gains for larger groups of devices.
In addition to these simulations, the researchers tested FTTE on a small network of real devices with varying computational capabilities.
“Not everyone has the latest Apple iPhone. In many developing countries, for instance, users might have less powerful mobile phones. With our technique, we can bring the benefits of federated learning to these settings,” she says.
In the future, the researchers want to study how their method could be used to increase the personalized performance of AI models on each device, rather than focusing on the average performance of the model. They also want to conduct larger experiments on real hardware.
This work was funded, in part, by a Takeda PhD Fellowship.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み