AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
MIT ML News·2026年6月12日 04:10·約8分で読める

人の選好予測には「3 の力」が有効である

#行動経済学#予測モデル#人間中心 AI#機械学習
TL;DR

MIT の研究者らが、90 年以上の歴史を持つランダム効用モデル(RUM)に新たな洞察を加え、人間の選好予測精度を向上させる「3 の力」の法則を発見した。

AI深層分析2026年6月12日 06:02
4
重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
4
革新性10%
3

キーポイント

1

ランダム効用モデル(RUM)の再評価

1927 年に L.L. Thurstone が提唱し、政府や産業で広く使われている RUM は、古くからあるにもかかわらず、まだ改善の余地があることが示された。

2

"3 の力"の発見

MIT 研究者らが ICMLR で発表した論文により、選択肢の数や構成が人間の選好に与える影響において「3」という数が持つ特異な効果(パワー・オブ・スリー)が明らかになった。

3

実社会への応用可能性

交通渋滞の回避、緊急時の資金配分など、複雑なシナリオにおける人間の行動予測精度を高めるための新たな数学的枠組みとして期待される。

影響分析・編集コメントを表示

影響分析

この記事は、長年使われてきた行動経済学・心理学の基礎モデルが、最新の機械学習の視点から再解釈され、より高精度な予測が可能になったことを示しています。特に「3 の力」という具体的な法則的发现は、AI を用いた意思決定支援システムや推薦アルゴリズムの設計において、人間の心理的バイアスをより正確に反映させるための重要な指針となります。

編集コメント

90 年以上も使われてきた古典的な理論が、現代の AI 研究によって新たな発見をもたらす例として興味深いです。人間の複雑な選好を数値化する試みは、AI が人間と共存する上で不可欠な要素です。

1927 年の論文「比較判断の法則」において、アメリカの心理学者 L. L. サーストンは、人々が複数の選択肢の中から一つのオプションを選ぶ際、その選択に特定の数値を割り当てることはできないものの、自分にとって最も価値が高いものを選んでいると提案しました。

サーストンは、「心理測定学(psychometrics)」のパイオニアです。この分野は、目に見えない精神過程であっても、それを測定し定量化できるという前提に基づいています。彼の 1927 年の論文は、現在「ランダム効用モデル」と呼ばれるものの基礎を築きました。これは人間の選好を記述するための数学的枠組みを提供するものであり、この情報は逆に、さまざまな仮説的な状況に関する予測を行う際に信頼できる情報源となります。

ランダム効用モデル (RUMs) は、図書館から持ち帰った小説の山の中からどの本を最初に読むかを決めるような、特定の選択から得られる「効用」、つまり利益を評価することからこの名が付けられています。「これらのモデルは本質的にランダムです」と、MIT電気工学・コンピュータ科学部 (EECS) の准教授であり、情報意思決定システム研究所 (LIDS) の主任研究員であるガブリエラ・ファリーナ氏は説明します。「なぜなら人々は異なるからです。誰もが独自の好みを持っており、その好みさえも時によって変動する可能性があります。例えば、朝はコーヒーを紅茶より好むが夕食後は紅茶を好むという人が、たまにその順序を完全に逆転させることだってあります。

もちろん、RUMs はホット(またはアイス)飲料の選択よりもはるかに重大な状況において、政府や業界で頻繁に使用されています。これらのモデルは日常的に、いわゆる反実仮想(「もしも」)シナリオにおける人々の行動予測を支援します。例えば、主要な幹線道路が工事のために閉鎖された場合、人々はどのようにして職場や学校へ行くでしょうか?どのような経路や交通手段を選択するでしょうか?あるいは、ある都市が突如として 2000 万ドルの富を得た場合、その資金をどのように配分すれば共通の利益を最大化できるでしょうか?

RUM(ランダム・ユーザーモデル)は約100年にわたり存在し、時間とともに洗練されてきたため、この段階では改善の余地もほとんどないだろうと想像する人もいるかもしれません。しかし、実際にはそうではありません。

4 月、ブラジルのリオデジャネイロで開催された「国際学習表現会議(International Conference on Learning Representations)」で発表された論文 paper は、これらのモデルから従来考えられていた以上に多くの知見を得られることを示す基本的な事実を明らかにしました。この論文の著者は、シンガポールの南洋理工大学に現在所属する元 MIT 研究員である Yeshwanth Cherapanamjeri、MIT オペレーションズ・リサーチ・センター(ORC)の中核教員でもある Farina、MIT コンピュータサイエンスおよび人工知能研究所(CSAIL)のメンバーであり、MIT のコンピュータサイエンス教授(Avanessians 教授職)である Constantinos Daskalakis、そして LIDS および EECS に所属する MIT のコンピュータサイエンス博士課程学生 Sobhan Mohammadpour です。

研究グループの発見は、部分的に、RUM(ランダム・ユーティリティ・モデル)の実践における一般的な推定方法の欠陥に起因しています。この問題はサーストンの時代から続くものです。これらのモデルを推定するために用いられるデータは、主にいわゆるペア比較から得られています。つまり、Netflix の映画や Amazon.com 上の競合製品、Google に投稿されたニュース記事など、アイテム A と B のどちらかを選ぶ場合、あなたはどちらを選びますか?このアプローチがこれほどまでに普及している理由の一つを、ダスカルakis は「単一のアイテムから得られる便益に 4.37 という正確な数値スコアを割り当てるのは非常に難しい。一方、2 つのものを比較し、どちらが好きかを決定する方が、認知的にはるかに容易である」と説明しています。しかし、彼はさらに付け加えます。「このように人々の嗜好を評価する方法、つまり一度に 2 つのものしか見ない方法では、多数の選択肢間の相関関係を見つけることは不可能です。」

RUMs(ランダム・ユーティリティ・モデル)を適用する標準的な方法は、A と B から得られる効用が独立していると仮定していますが、実際にはそれらが関連している可能性があり、その事実は非常に重要です。例えば、公職選挙の候補者が有権者候補から銃規制に賛成していることが分かった場合、同じ人が政府による保育制度にも賛成する可能性は十分にあります。同様に、インディペンデント映画のファンは外国映画にも好意を抱くかもしれませんが、ハリウッドのアクション大作にはそれほど熱心ではないでしょう。「デジタルプラットフォームがこのような相関関係の存在を無視すれば、嗜好を非常に正確に推定することはできません」とダスカラキスは指摘します。「もし Netflix があなたが興味のない映画を頻繁に表示し続けたら、あなたは利用を停止してサブスクリプションを解約するかもしれません。」

MIT のチームは、2 項目間の比較だけでは相関に関する情報を得ることは不可能であることを証明しました。しかし、多数の人々が 3 つの選択肢を好みの順に評価すれば、相関関係を見出すことができます。また、「3 選抜」および「2 選抜」の選択を組み合わせても同じ情報が得られます。実際には、モハマドプール氏は次のように説明しています。「多くの参加者に 3 つの項目を順位付けしてもらいます。その後、私たちが開発した手法を用いて、それらの個別の結果を統合し、全体像を提供できる大規模なモデルを作成することができます。」

ファリーナ氏によると、彼らの研究努力は RUMs の計算側面に焦点を当てており、選好情報を抽出できるアルゴリズムの考案や、そのために必要なデータ量、あるいは同等に言えば実行すべき実験数の特定に取り組んでいます。同氏は、この目的のために効率的なアルゴリズムが確かに可能であるという朗報があると言います。必要な実験数は、検討対象となっているカタログやデータベース内のアイテム数に対して指数関数的に増加するものではありません。

「この論文は決定的な突破口を提供しています」と、モントリオール大学のコンピュータサイエンティストであるエマ・フレジニャー氏はコメントします。「従来のデータ収集がなぜ失敗するのかを数学的に証明し、単にユーザーにベスト・オブ・スリー [3 つの中から最も良いもの] の選択を求めるだけで、これらの強力なモデルを正確に訓練する能力が開かれることを示しています。この発見は、より正確な最適化を推進するために優れたデータを収集するための非常に実用的なロードマップを提供します。

「ユーティリティモデルの構築は非常に活発な領域であり続けるでしょう」とダスカーラキスは主張する。「1990 年代後半以来、RUMs(ランダム・ユーティリティ・モデル)がインターネット経済にとって不可欠であったように、それらは今後 AI モデルのアライメントにおいても、そしてこれからも不可欠であり続けるのです。」さらに重要なのは、「RUMs は大規模言語モデル [LLMs] の商業的実現可能性と有用性において中心的な役割を果たしている」という点です。トレーニング期間中、人々は通常、これらの LLMs のさまざまな候補出力をランク付けするよう求められ、それを通じてモデルは、トーン、スタイル、コンテンツの観点から、どのようなテキストが好まれるのかについてより良い理解を得ることができます。

「私たちは常に『多くの異なるドメインにおいて膨大な選択肢に囲まれている』状況にあるため」とダスカーラキスは言う、「人々にあらゆる可能なシナリオにおけるすべての個人的な嗜好を伝えるよう求めることは不可能です。そこで代わりにできるのは、異なる結果に対する人々の考え方を予測するモデルを構築することです。そして、おそらく良い予測ができるようになるまで、反復的なプロセスを通じてモデルを継続的に改善し更新し続ける必要があります。」

原文を表示

In his 1927 paper, “A law of comparative judgment,” the American psychologist L. L. Thurstone proposed that when people select one option among multiple alternatives, they are picking the one that has the highest value to them, even though they cannot assign a particular number to that choice.

Thurstone was a pioneer of “psychometrics” — a field built upon the premise that mental processes, which we cannot see, can nevertheless be measured and quantified. His 1927 paper laid the groundwork for what are now called random utility models, which provide a mathematical framework for describing human preferences — information that can be relied upon, in turn, to make predictions about various hypothetical situations.

Random utility models (RUMs) are so named because they assess the “utility,” or benefit, that can be obtained from a given choice — such as deciding which book to read first among the stack of novels you brought back from the library. “These models are inherently random,” explains Gabriele Farina, an assistant professor in MIT’s Department of Electrical Engineering and Computer Science (EECS) and principal investigator at the Laboratory for Information and Decision Systems (LIDS), “because people are different. Everyone has their own preferences, and even those preferences can vary from time to time.” For example, someone who normally picks coffee over tea in the morning, and prefers tea after dinner, may, upon occasion, mix up that order entirely.

RUMs, to be sure, are frequently used within government and industry in situations of far greater consequence than the selection of a hot (or iced) beverage. The models routinely facilitate predictions regarding what people will elect to do in so-called counterfactual (“what-if”) scenarios such as: How will they get to work or school if a major thoroughfare is shut down for construction? What routes and modes of transport will they take? Or, if a city suddenly receives a windfall of $20 million, how should those funds be disbursed to maximize the common good?

Given that RUMs have been with us for almost 100 years, growing in sophistication over time, one might imagine that, at this stage, there would be little room for improvement. That, however, is not the case.

A paper presented in April at the International Conference on Learning Representations in Rio de Janeiro, Brazil, uncovered basic facts that show there is much more to be gleaned from these models than had traditionally been supposed. The paper was authored by Yeshwanth Cherapanamjeri, a former MIT postdoc now based at Nanyang Technological University in Singapore; Farina, also core faculty in MIT’s Operations Research Center (ORC); Constantinos Daskalakis, the Avanessians Professor of Computer Science at MIT and a member of MIT's Computer Science and Artificial Intelligence Laboratory; and Sobhan Mohammadpour, an MIT PhD student in computer science based at LIDS and EECS.

The group’s findings stem, in part, from a deficiency in the way RUMs are commonly estimated in practice, which has persisted since the days of Thurstone. The data upon which the models are estimated have been largely drawn from so-called pairwise-comparisons: In a choice between items A and B — whether it pertains to movies on Netflix, competing products on Amazon.com, news stories posted on Google, and so forth — which one would you pick? One reason this approach has been so pervasive, explains Daskalakis, is that “assigning a precise numerical score, such as 4.37, to the benefit you get from a single item is very hard. Whereas comparing two things, and deciding which one you like better, is cognitively much easier to do.” But therein lies the rub, he adds. “With this way of assessing people’s preferences, looking at just two things at a time, it is impossible to find correlations between the numerous choices.”

The standard way of applying RUMs assumes that the utilities derived from A and B are independent, but they may, in fact, be linked, and that would be important to know. If someone campaigning for elective office finds out that a potential voter favors gun control, for instance, there is a reasonable chance that same person also favors government-sponsored child care. Similarly, a fan of independent movies might also be partial to foreign films, but less enthusiastic about Hollywood action blockbusters. “If a digital platform has a blind eye to the existence of such correlations, it will not be able to estimate preferences very accurately,” Daskalakis notes. “And if Netflix regularly shows you an assortment of movies you don’t care about, you might sign off and cancel your subscription.”

The MIT team proved that it is impossible to get information about correlations from two-way comparisons alone. Correlations can be discerned, however, when large numbers of people rate three alternatives in their order of preference. The same information can also be obtained from a combination of best-of-three and best-of-two choices. In practice, Mohammadpour explains, “you would get a bunch of people to rank three items. You could then utilize the method we developed for merging those individual results into one big model that can provide us with the big picture.”

Their research effort, according to Farina, is focused on the computational side of RUMs, devising algorithms that can extract preference information and figuring out how much data is needed to do so or, equivalently, how many experiments need to be run. The good news, he says, is that efficient algorithms are, indeed, possible for this purpose. The requisite number of experiments does not grow exponentially with the number of items in the catalog or database that’s under review.

“This paper provides a crucial breakthrough,” comments Emma Frejinger, a computer scientist at the University of Montreal. “It mathematically proves why traditional data collection fails and demonstrates that simply asking users for their best-of-three [choices] unlocks the ability to accurately train these powerful models. This finding provides a highly practical roadmap for collecting better data to drive more accurate optimizations.”

“Building utility models is going to remain a very active area,” Daskalakis insists. “Just as RUMs have been critical to the internet economy since the late 1990s, they are, and will remain to be, critical to the alignment of AI models going forward.” More importantly, he adds, “RUMs play a central role in the commercial viability and usefulness of large language models [LLMs].” During the training period, people are typically asked to rank the various candidate outputs of these LLMs, from which the models can gain a better sense as to the kind of text — in terms of tone, style, and content — that is preferred.

Given that we’re constantly “besieged with a vast sea of options in so many different domains,” Daskalakis says, “you cannot possibly ask people to communicate all their personal preferences for all possible scenarios. So what you can do instead is build a model that predicts what people think about the different possible outcomes. And you have to keep improving and updating your model in an iterative process until, hopefully, you can make good predictions.”

この記事をシェア

関連記事

404 Media2026年5月12日 00:09

世界がカジノ化した理由:誰でもあらゆる事象に賭けられる時代へ

記事は、クレジットカードとパソコンがあれば野球の結果から欧州の戦争に至るまで、世界のあらゆる出来事の結果を予測して金銭を得ることが合法化された背景について論じています。

MIT ML News★42026年3月13日 06:30

AIは心不全患者の1年以内の悪化を予測できるか?

研究チームが、AIを用いて心不全患者の1年以内の状態悪化を予測する可能性について調査している。

MIT ML News★42026年6月5日 13:00

スタートアップが小売業者の製品をリアルタイムで追跡する支援を開始

MIT ML News が紹介したスタートアップは、在庫管理に時間を要する課題に対し、製品の位置情報をリアルタイムで把握できる技術を提供し、従業員が在庫を追跡する負担を軽減する。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む