エンゲージメントを超えて:人間の価値観に合わせたFacebookアルゴリズムの最適化
ソーシャルメディアはエンゲージメント最適化により有害コンテンツを拡散する問題があり、Facebookはデータ駆動で人間の価値観に沿ったMLシステム構築を目指す。
キーポイント
ソーシャルメディアのアルゴリズムがエンゲージメント最適化から人間的価値最適化への転換を提唱
エンゲージメント指標(コメント・いいね・シェア)が有害コンテンツを増幅する逆説を指摘
検索エンジンの品質評価モデルをソーシャルメディア推薦システムに応用するアナロジーを提示
プラットフォームが「笑顔を増やす」「有意義な議論を促進する」など明確な価値目標を設定する必要性を主張
影響分析・編集コメントを表示
影響分析
この記事はAI推薦システムの根本的な設計思想の転換を提唱しており、ソーシャルメディアプラットフォームの社会的責任とアルゴリズム倫理に関する重要な議論を喚起する。実装されればユーザー体験の質的向上とプラットフォームの長期的持続可能性に寄与する可能性がある。
編集コメント
エンゲージメント至上主義からの脱却を訴える実務家の視点は説得力があり、AIシステム設計における価値観の埋め込みという核心課題を浮き彫りにしている。
タイトル:エンゲージメントを超えて:人間的価値のためにFacebookのアルゴリズムを最適化する
現在のソーシャルメディアプラットフォームは、ユーザーの「エンゲージメント」(コメント、いいね、シェアなど)を最大化するようアルゴリズムを最適化しているが、これには重大な問題がある。例えば、Facebookは2018年に「意味のある社会的相互作用(MSI)」、つまり友人や家族間のエンゲージメントを増加させることを目標に掲げた。しかし、エンゲージメントが必ずしもポジティブな指標とは限らない。最も反応を集めるコンテンツは、しばしば有害で毒性の強いものであり、ユーザーを怒らせて怒りのコメントを誘発するような投稿が、かえってアルゴリズムによって優先表示されてしまう。データサイエンティストの分析でも、MSIへの影響が大きい実験ほど、低品質なコンテンツを最も増加させることが確認されている。これはFacebookに限らず、YouTubeやTwitterなど他のプラットフォームでも普遍的な課題である。
では、解決策は何か。それは、単純なエンゲージメント指標から、より人間的な価値に基づいた目標へと転換することである。検索エンジンの例を考えればわかりやすい。ユーザーがクリックしたリンクが必ずしもそのユーザーにとって有益とは限らないように、ソーシャルメディアでの「コメント」も、怒りや嫌悪から生まれる場合がある。したがって、プラットフォームは、ユーザーが最も多くクリックするコンテンツを盲目的に表示するのではなく、明確な「原則に基づいた製品目標」を設定してアルゴリズムを最適化すべきである。
具体的には、例えば、Facebookのニュースフィードが、ユーザーと友人・家族の絆を深めるようなコンテンツ(例えば、懐かしい家族の料理の投稿など)を最高位に表示する世界を想像できる。あるいは、Twitterで重要な社会的話題について、単なるミームや誹謗中傷ではなく、多様な立場からの洞察に富んだ議論が表示されるようにする。YouTubeならば、ユーザーの滞在時間を短くするかもしれないが、ユーザーを笑顔にすること自体を目標に掲げることも考えられる。
要するに、現在のエンゲージメント偏重のアルゴリズムは、しばしばユーザーの人間関係を損ない、社会の分断や低品質なコンテンツの拡散を助長している。技術的な改善だけではなく、プラットフォームが「何を最適化すべきか」という根本的な目標そのものを、短期的な利用時間や反応数ではなく、人々のウェルビーイングや社会的つながり、健全な議論といった人間的な価値に沿って再定義することが急務である。これにより、ソーシャルメディアは単なる注意喚起装置から、人々の生活を真に豊かにする空間へと進化できる可能性がある。
原文を表示
BlogLeaderboardsWorkforceProductsResearchCareersContactLoginMenuCloseBack to BlogMoving Beyond Engagement: Optimizing Facebook's Algorithms for Human Values
Imagine you’re building a new social media platform. You don’t want to show posts in purely chronological order, but you also want to avoid the engagement traps that social media platforms suffer from — the fact that the posts most likely to catch your eye today often make you feel worse tomorrow.
So how should you design your metrics and recommendation system?
Picture a world, for example, where…
You log onto Facebook, and the first post you see is your mother making a favorite dish from your childhood. You reach out to get the recipe, and share a video of yourself recreating it with her the next day. What if posts like these — that brought you closer to your friends and family — were the pinnacle of News Feed?
You log onto Twitter, and you click on the latest trend about a US Supreme Court decision. Instead of the usual memes and insults, you find fascinating discussion: a firsthand take from Biden, debate from politicians on the other side, and insightful commentary from affected people on the street.
In this world, each social media feed has a principled product objective that it’s optimizing for rather than blindly showing you the type of content you happen to click on the most. What, for example, if YouTube cared about making you smile, even if you spent less time on the site overall?
First, what are the problems with engagement-based metrics and why do we need to optimize for something else? Let's consider Facebook.
In 2018, Facebook switched its objective to increasing Meaningful Social Interactions — essentially, engagement (comments, likes, shares, and so on) from friends and family. If Facebook thought a post would create a lot of engagement between you and your uncle, it would rank it at the top of your feed.
The problem: engagement isn’t necessarily a positive sign! The most engaging content is often the most toxic. If your uncle shares a clickbait video that you hate, you’re compelled to leave an angry comment, which compels him to insult you back in turn. And since those (angry) comments increase MSI, the News Feed algorithm learns to show you even more.
For example, here are the current top comments on Joe Biden’s Facebook page.
These examples aren’t outliers: data scientists would regularly find that experiments with the largest MSI impact also boosted low-quality content the most. Rather than strengthening quality connections with your friends and family, News Feed often hurt them instead.
And this wasn’t just a Facebook problem — I worked at YouTube and Twitter too, and these issues were prevalent across the board.
If engagement-based metrics are the problem, what’s the solution?
There’s a deep analogy with search engines. Just as commenting on a post doesn’t mean you enjoy it — maybe it made you so angry you want to viciously insult the poster — clicks on search pages aren’t necessarily a sign of good results either.
For example, when you search for when was barack obama born?, ideally the answer is displayed at the top of the search result page itself. Clicking is a sign of failure, and there’s no guarantee that the page you click on contains the answer anyways.
A search engine that optimizes for clicks and engagement would be a poor search engine indeed. And that’s why many search engines like Google and Bing use human evaluation instead. In short, they ask trained human raters to rate the relevance of <search query, search result> pairs; instead of optimizing for clicks, this “human evaluation”-based relevance score is one of their core metrics instead.
For instance, here’s an example of this approach that compares Google and Bing:
In other words, Google knows that clicks aren’t a good signal, so it asks human raters to score exactly what it cares about: search relevance.
In the same way, MSI and engagement may seem like a good proxy for human values — for healthy, meaningful interactions from friends and family we truly care about — but they’re not. So could Facebook ask human raters to score the exact principle it cares about too?
Let's show how this works. Suppose your social media company has one core principle in its mission:
Helping users feel closer to their friends and family.
For example, if Angela’s favorite roommate from college lands her dream job, Angela wants to know. When she can’t make her sister’s wedding due to travel restrictions, she hopes her sister takes a wealth of pictures and videos so she can follow along.
You can encode this product principle into a metric as follows:
You ask her how much closer it makes her feel to her friends and family, on a 1-5 point scale.
Importantly, this metric directly matches the principles we laid out!
So imagine every time Facebook has to decide between launching Algorithm A vs. Algorithm B, it shows 1,000 human raters the top 5 posts
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み