人の選好予測には「3 の力」が有効である

1927 年の論文「比較判断の法則」において、アメリカの心理学者 L. L. サーストンは、人々が複数の選択肢の中から一つのオプションを選ぶ際、その選択に特定の数値を割り当てることはできないものの、自分にとって最も価値が高いものを選んでいると提案しました。 サーストンは、「心理測定学（psychometrics）」のパイオニアです。この分野は、目に見えない精神過程であっても、それを測定し定量化できるという前提に基づいています。彼の 1927 年の論文は、現在「ランダム効用モデル」と呼ばれるものの基礎を築きました。これは人間の選好を記述するための数学的枠組みを提供するものであり、この情報は逆に、さまざまな仮説的な状況に関する予測を行う際に信頼できる情報源となります。 [ランダム効用モデル](https://en.wikipedia.org/wiki/Random_utility_model) (RUMs) は、図書館から持ち帰った小説の山の中からどの本を最初に読むかを決めるような、特定の選択から得られる「効用」、つまり利益を評価することからこの名が付けられています。「これらのモデルは本質的にランダムです」と、MIT電気工学・コンピュータ科学部 (EECS) の准教授であり、情報意思決定システム研究所 (LIDS) の主任研究員であるガブリエラ・ファリーナ氏は説明します。「なぜなら人々は異なるからです。誰もが独自の好みを持っており、その好みさえも時によって変動する可能性があります。例えば、朝はコーヒーを紅茶より好むが夕食後は紅茶を好むという人が、たまにその順序を完全に逆転させることだってあります。 もちろん、RUMs はホット（またはアイス）飲料の選択よりもはるかに重大な状況において、政府や業界で頻繁に使用されています。これらのモデルは日常的に、いわゆる反実仮想（「もしも」）シナリオにおける人々の行動予測を支援します。例えば、主要な幹線道路が工事のために閉鎖された場合、人々はどのようにして職場や学校へ行くでしょうか？どのような経路や交通手段を選択するでしょうか？あるいは、ある都市が突如として 2000 万ドルの富を得た場合、その資金をどのように配分すれば共通の利益を最大化できるでしょうか？ RUM（ランダム・ユーザーモデル）は約100年にわたり存在し、時間とともに洗練されてきたため、この段階では改善の余地もほとんどないだろうと想像する人もいるかもしれません。しかし、実際にはそうではありません。 4 月、ブラジルのリオデジャネイロで開催された「国際学習表現会議（International Conference on Learning Representations）」で発表された論文 [paper](https://openreview.net/pdf?id=TbEyl6krsY) は、これらのモデルから従来考えられていた以上に多くの知見を得られることを示す基本的な事実を明らかにしました。この論文の著者は、シンガポールの南洋理工大学に現在所属する元 MIT 研究員である Yeshwanth Cherapanamjeri、MIT オペレーションズ・リサーチ・センター（ORC）の中核教員でもある Farina、MIT コンピュータサイエンスおよび人工知能研究所（CSAIL）のメンバーであり、MIT のコンピュータサイエンス教授（Avanessians 教授職）である Constantinos Daskalakis、そして LIDS および EECS に所属する MIT のコンピュータサイエンス博士課程学生 Sobhan Mohammadpour です。 研究グループの発見は、部分的に、RUM（ランダム・ユーティリティ・モデル）の実践における一般的な推定方法の欠陥に起因しています。この問題はサーストンの時代から続くものです。これらのモデルを推定するために用いられるデータは、主にいわゆるペア比較から得られています。つまり、Netflix の映画や Amazon.com 上の競合製品、Google に投稿されたニュース記事など、アイテム A と B のどちらかを選ぶ場合、あなたはどちらを選びますか？このアプローチがこれほどまでに普及している理由の一つを、ダスカルakis は「単一のアイテムから得られる便益に 4.37 という正確な数値スコアを割り当てるのは非常に難しい。一方、2 つのものを比較し、どちらが好きかを決定する方が、認知的にはるかに容易である」と説明しています。しかし、彼はさらに付け加えます。「このように人々の嗜好を評価する方法、つまり一度に 2 つのものしか見ない方法では、多数の選択肢間の相関関係を見つけることは不可能です。」 RUMs（ランダム・ユーティリティ・モデル）を適用する標準的な方法は、A と B から得られる効用が独立していると仮定していますが、実際にはそれらが関連している可能性があり、その事実は非常に重要です。例えば、公職選挙の候補者が有権者候補から銃規制に賛成していることが分かった場合、同じ人が政府による保育制度にも賛成する可能性は十分にあります。同様に、インディペンデント映画のファンは外国映画にも好意を抱くかもしれませんが、ハリウッドのアクション大作にはそれほど熱心ではないでしょう。「デジタルプラットフォームがこのような相関関係の存在を無視すれば、嗜好を非常に正確に推定することはできません」とダスカラキスは指摘します。「もし Netflix があなたが興味のない映画を頻繁に表示し続けたら、あなたは利用を停止してサブスクリプションを解約するかもしれません。」 MIT のチームは、2 項目間の比較だけでは相関に関する情報を得ることは不可能であることを証明しました。しかし、多数の人々が 3 つの選択肢を好みの順に評価すれば、相関関係を見出すことができます。また、「3 選抜」および「2 選抜」の選択を組み合わせても同じ情報が得られます。実際には、モハマドプール氏は次のように説明しています。「多くの参加者に 3 つの項目を順位付けしてもらいます。その後、私たちが開発した手法を用いて、それらの個別の結果を統合し、全体像を提供できる大規模なモデルを作成することができます。」 ファリーナ氏によると、彼らの研究努力は RUMs の計算側面に焦点を当てており、選好情報を抽出できるアルゴリズムの考案や、そのために必要なデータ量、あるいは同等に言えば実行すべき実験数の特定に取り組んでいます。同氏は、この目的のために効率的なアルゴリズムが確かに可能であるという朗報があると言います。必要な実験数は、検討対象となっているカタログやデータベース内のアイテム数に対して指数関数的に増加するものではありません。 「この論文は決定的な突破口を提供しています」と、モントリオール大学のコンピュータサイエンティストであるエマ・フレジニャー氏はコメントします。「従来のデータ収集がなぜ失敗するのかを数学的に証明し、単にユーザーにベスト・オブ・スリー [3 つの中から最も良いもの] の選択を求めるだけで、これらの強力なモデルを正確に訓練する能力が開かれることを示しています。この発見は、より正確な最適化を推進するために優れたデータを収集するための非常に実用的なロードマップを提供します。 「ユーティリティモデルの構築は非常に活発な領域であり続けるでしょう」とダスカーラキスは主張する。「1990 年代後半以来、RUMs（ランダム・ユーティリティ・モデル）がインターネット経済にとって不可欠であったように、それらは今後 AI モデルのアライメントにおいても、そしてこれからも不可欠であり続けるのです。」さらに重要なのは、「RUMs は大規模言語モデル [LLMs] の商業的実現可能性と有用性において中心的な役割を果たしている」という点です。トレーニング期間中、人々は通常、これらの LLMs のさまざまな候補出力をランク付けするよう求められ、それを通じてモデルは、トーン、スタイル、コンテンツの観点から、どのようなテキストが好まれるのかについてより良い理解を得ることができます。 「私たちは常に『多くの異なるドメインにおいて膨大な選択肢に囲まれている』状況にあるため」とダスカーラキスは言う、「人々にあらゆる可能なシナリオにおけるすべての個人的な嗜好を伝えるよう求めることは不可能です。そこで代わりにできるのは、異なる結果に対する人々の考え方を予測するモデルを構築することです。そして、おそらく良い予測ができるようになるまで、反復的なプロセスを通じてモデルを継続的に改善し更新し続ける必要があります。」

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト