ウェルビーイングに基づいたAIの前向きなビジョンが必要
The Gradient の記事は、AI が社会に与える影響を議論する際、単なる楽観や悲観ではなく「ウェルビーイング」や「人間の繁栄」という具体的な指標に基づいた実用的なビジョンの必要性を提唱している。
キーポイント
有益な AI の定義の難しさと解決策
「有益な AI」という概念は抽象的になりがちだが、個人や社会のウェルビーイング(幸福度)に根ざすことで具体化できると主張している。
人間の繁栄の具体的な要素
哲学や経済学で合意されている「支援的な人間関係」「意味のある仕事」「成長の実感」など、幸福を構成する具体的な因子を AI 開発の指針とする。
時間軸と社会インフラの視点
一時的な感情だけでなく、教育や政府などの社会インフラを通じて、長期的・数十年単位のウェルビーイングをどう確保・向上させるかを考慮する必要がある。
ウェルビーイングと機械学習の統合可能性
現在の社会や個人のウェルビーイング指標は低下しているが、ウェルビーイングの科学と機械学習を結合する根本的な障壁はない。
AI による社会変革への積極的ビジョンの必要性
AI はソーシャルメディア以上の衝撃を与えるため、単なる危機回避ではなく、人々が繁栄できる具体的な未来像を想像し構築する必要がある。
基盤モデルのウェルビーイング対応への転換
急速に進化するAIが社会と深く結びつく中で、モデルがウェルビーイングを理解・支援できるよう、評価基準や学習データの改善が不可欠である。
抽象的な価値観から実測可能な指標へ
民主主義や経済成長などの抽象的な概念はそれ自体が目的ではなく、人間の経験の向上に寄与する手段として捉える必要がある。
影響分析・編集コメントを表示
影響分析
この記事は、AI 開発の倫理的枠組みが単なる「リスク管理」や「安全性」から、「人間の幸福の最大化」という前向きな目標へシフトすべきであるという重要なパラダイム転換を提案しています。技術者や政策決定者に対し、抽象的な議論に終始せず、具体的なウェルビーイング指標を開発プロセスに組み込むよう促すことで、AI 社会の実現可能性を高める示唆を与えています。
編集コメント
技術的な進歩だけでなく、人間の幸福という本質的な価値を AI の目標に据えるべきだという視点を提供する、非常に示唆に富む論考です。
タイトル:ウェルビーイングに根ざしたAIに対する前向きなビジョンが必要だ
今から10年前の自分を想像してみてほしい。そして、そのまま現在に飛び、百科事典的な知識を持ち、画像を生成し、コードを書き、哲学について議論するAIと自然に会話している衝撃に直接飛び込むのだ。この技術はほぼ確実に社会を変容させるだろうし、これまでのAIが私たちに与えた影響は良し悪し混ざったものではなかったか?したがって、近頃多くの議論が、時代を定義する一つの問い——「どうすればAIが人類に利益をもたらすことを確実にできるか?」——を巡って循環しているのは驚くべきことではない。これらの議論は、AIに対する過剰な楽観論や悲観論に陥りがちだが、私たちの真摯な目的は実用的な中間の道を歩むことにある。もちろん、完全に成功するとは思わないが。
「有益なAI」という言葉を軽く振りかざすのは流行っているし、私たちの多くはその開発に貢献したいと考えているが、有益なAIが実際に具体的に何を意味するのかを明確に定義するのは容易ではない。このエッセイは、個人のウェルビーイングと社会の健全さに根ざすことで、有益なAIの正体を解き明かそうとする私たちの試みである。そうすることで、AI研究と製品が私たちの繁栄に貢献する機会を促進し、同時に、私たちの結論に至った動機となる、AIがもたらす影響についての考え方を共有したい。
全体像
職業上、私たちの背景は、ウェルビーイング経済学、ポジティブ心理学、哲学など人間の繁栄が最も議論される分野よりも、AIに近い。そうした分野とAIの技術的世界との間に生産的な関連性を見出そうとする旅路で、私たちはしばしば混乱した(そもそも人間の繁栄やウェルビーイングとは何なのか?)。そしてその混乱から、しばしば行き詰まった(おそらく為すべきことは何もないのか?——問題があまりにも多様で広範すぎる)。社会に貢献する技術を創り出そうとする他の人々も私たちと同じ経験を共有しているかもしれない。ここでの希望は、混乱の中に部分的ではあれ道筋を照らし、多くの興味深く有用な仕事ができる場所へと導くことだ。まず主要な結論のいくつかから始め、その後により詳細に掘り下げていく。
私たちが到達した一つの結論は、人間のウェルビーイングを決定的に定義できなくても構わない、ということだ。それは哲学者、経済学者、心理療法士、心理学者、宗教思想家によって長年議論されてきたが、コンセンサスはない。同時に、私たちの人生を良くする多くの具体的な要素については合意がある。例えば、支え合う親密な関係、意味があり没頭できる仕事、成長と達成感、ポジティブな感情体験などだ。また、瞬間的なウェルビーイングを超えて、何年、何十年にもわたってウェルビーイングを確保し向上させる方法——教育、政府、市場、学術界といった重要な制度、すなわち社会的インフラと呼べるものを通じて——を考慮しなければならないことも明確に理解されている。
このウェルビーイングというレンズの利点の一つは、ほとんど逆説的な事実に私たちを目覚めさせることだ。私たち人類が行うほとんどすべての行動の深層にある目的はウェルビーイングであるにもかかわらず、悲劇的にそれを見失っている。個人のウェルビーイング(自殺率、孤独、意味のある仕事)と社会のウェルビーイング(制度への信頼、共有された現実感覚、政治的対立)の両方の一般的な尺度において、私たちはうまくやっていない。そして私たちの印象では、AIはその衰退に加担している。しかし、このウェルビーイング視点の中心的な利点は、ウェルビーイングの科学と機械学習を統合し、集合的な利益に役立てることを妨げる根本的な障害は何もない、という洞察である。
これは私たちの二つ目の結論につながる。私たちには、ウェルビーイングに根ざした、有能なAIを持つ社会についての、もっともらしい前向きなビジョンが必要だ。過去の他の変革的技術と同様に、AIは私たちの社会的インフラに衝撃を与える——私たちが望むと望まざるとにかかわらず、私たちの日常生活の性質を劇的に変えるだろう。例えば、Facebookがローンチされたのはわずか20年前だが、ソーシャルメディアの衝撃波はすでに社会の多くを覆し——ニュースメディアと私たちの情報共有基盤を破壊し、「いいね」に私たちを依存させ、意味ある人間関係をその殻に置き換えてしまった。私たちは、有能なAIの影響はソーシャルメディアのそれを上回ると信じている。その結果、私たちが繁栄できるAIが浸透した世界——おそらくAIが私たちの制度を活性化し、私たちが最も意味を見いだすものを追求する力を与え、人間関係を育むのを助けるような世界——を探求し、構想し、そこに向かって進もうと努力することが極めて重要だ。これは単純な任務ではない。想像力、現実への足場、技術的な実現可能性を必要とする——過去の技術批判によって照らし出された地雷原を、どうにかして踊り抜かなければならない。しかし、これから来るものを積極的に形作りたいのであれば、今こそ夢を見て構築する時である。
これは私たちの最後の結論へとつながる。基盤モデルとその将来の展開の軌跡は決定的に重要だ。この分野の真っ只中にいる私たちでさえ、モデルがどれほど急速に進歩したか、そしてあと数年与えられればどれほど有能になる可能性があるかを、内面化するのは難しい。今日の基準ではほとんど機能しないGPT-2がリリースされたのは、つい2019年のことだったことを思い出してほしい。将来のモデルが今日のものよりもはるかに有能で、世界のより多くの部分に、より大きな自律性をもって関与できるようになれば、それらが私たちの生活や社会に絡み合う度合いは天井知らずに高まると予想できる。したがって、少なくとも、新しいアルゴリズムや、モデルのウェルビーイングに基づく評価、ウェルビーイングのトレーニングデータなどを通じて、これらのモデルが私たちのウェルビーイングとそれを支える方法を理解できるようにしたい。もちろん、実際に人間の利益を実現することも望んでいる——このブログ投稿の最後のセクションでは、その目的に向けた強力なレバレッジ・ポイント(効果的な介入点)と考えられるものを強調する。
この投稿の残りの部分では、より詳細に、(1) 私たちのウェルビーイングに資するAIとは何を意味するか、(2) ウェルビーイングに根ざしたAIに対する前向きなビジョンの必要性、(3) そのような前向きなビジョンに役立つAIの開発と展開を助ける具体的なレバレッジ・ポイントについて説明する。このエッセイは、個々の部分がほぼ独立するように設計しているので、具体的な研究方向性に最も興味がある場合は、そちらまで飛んで読んでいただいて構わない。
有益なAIは人間のウェルビーイングに帰着する
人間の利益のためのAIに関する議論は、しばしば高尚だが、特に実行可能なものではない。「AIは人類に奉仕するようにすべきだ」という、反論の余地はないが内容のないフレーズのように。しかし、AIや政策においてそのような考えを有意義に実装するには、それをコードや法律に翻訳できるだけの十分な精度と明確さが必要だ。そこで私たちは、人間の利益の基盤について科学が何を発見したかを調査することにした。それは、AIを通じてそれを測定し支援できるようになるための一歩としてである。
多くの場合、有益な影響について考えるとき、私たちは民主主義、教育、公平性、経済といった抽象的な柱に焦点を当てる。これらはどれも重要だが、本質的に価値があるものはない。私たちがそれらを気にかけるのは、短期的にも長期的にも、それらが私たちの集合的な生活経験にどのように影響するかによる。社会のGDPを増加させることを気にかけるのは、それが私たちの生活と未来の実際の改善と一致する範囲においてだが、それ自体が目的として扱われると、重要なこと——人間(そして潜在的にすべての種)の経験の改善——から切り離されてしまう。
人間の繁栄の根源を最も直接的に研究する分野を探す中で、私たちはウェルビーイングに関する科学的文献を見つけた。文献は広大で、多くの分野にまたがり、それぞれが独自の抽象概念と理論を持っている——そして、予想通りかもしれないが、ウェルビーイングが実際に何であるかについて真の合意はない。繁栄の哲学、ウェルビーイング経済学、あるいは人間のウェルビーイングに関する心理学的理論に深く入り込むと、多くの興味深く、説得力があるが、一見相容れない考えに出会う。
例えば、哲学における快楽主義の理論は、喜びと苦しみの不在がウェルビーイングの核心だと主張する。一方、欲望充足理論は、感情的にどのように感じるかに関わらず、ウェルビーイングは私たちの欲望の充足に関するものだと主張する。主観的ウェルビーイング(広く言えば、私たちが自分の人生をどのように経験し、感じるか)を測定する文献は豊富にあり、繁栄を特徴づける変数についても多くの異なる枠組みがある。例え
原文を表示
Imagine yourself a decade ago, jumping directly into the present shock of conversing naturally with an encyclopedic AI that crafts images, writes code, and debates philosophy. Won’t this technology almost certainly transform society — and hasn’t AI’s impact on us so far been a mixed-bag? Thus it’s no surprise that so many conversations these days circle around an era-defining question: How do we ensure AI benefits humanity? These conversations often devolve into strident optimism or pessimism about AI, and our earnest aim is to walk a pragmatic middle path, though no doubt we will not perfectly succeed.
While it’s fashionable to handwave towards “beneficial AI,” and many of us want to contribute towards its development — it’s not easy to pin down what beneficial AI concretely means in practice. This essay represents our attempt to demystify beneficial AI, through grounding it in the wellbeing of individuals and the health of society. In doing so, we hope to promote opportunities for AI research and products to benefit our flourishing, and along the way to share ways of thinking about AI’s coming impact that motivate our conclusions.
The Big Picture
By trade, we’re closer in background to AI than to the fields where human flourishing is most-discussed, such as wellbeing economics, positive psychology, or philosophy, and in our journey to find productive connections between such fields and the technical world of AI, we found ourselves often confused (what even is human flourishing, or wellbeing, anyways?) and from that confusion, often stuck (maybe there is nothing to be done? — the problem is too multifarious and diffuse). We imagine that others aiming to create prosocial technology might share our experience, and the hope here is to shine a partial path through the confusion to a place where there’s much interesting and useful work to be done. We start with some of our main conclusions, and then dive into more detail in what follows.
One conclusion we came to is that it’s okay that we can’t conclusively define human wellbeing. It’s been debated by philosophers, economists, psychotherapists, psychologists, and religious thinkers, for many years, and there’s no consensus. At the same time, there’s agreement around many concrete factors that make our lives go well, like: supportive intimate relationships, meaningful and engaging work, a sense of growth and achievement, and positive emotional experiences. And there’s clear understanding, too, that beyond momentary wellbeing, we must consider how to secure and improve wellbeing across years and decades — through what we could call societal infrastructure: important institutions such as education, government, the market, and academia.
One benefit of this wellbeing lens is to wake us to an almost-paradoxical fact: While the deep purpose behind nearly everything our species does is wellbeing, we’ve tragically lost sight of it. Both by common measures of individual wellbeing (suicide rate, loneliness, meaningful work) and societal wellbeing (trust in our institutions, shared sense of reality, political divisiveness), we’re not doing well, and our impression is that AI is complicit in that decline. The central benefit of this wellbeing view, however, is the insight that no fundamental obstacle prevents us from synthesizing the science of wellbeing with machine learning to our collective benefit.
This leads to our second conclusion: We need plausible positive visions of a society with capable AI, grounded in wellbeing. Like other previous transformative technologies, AI will shock our societal infrastructure — dramatically altering the character of our daily lives, whether we want it to or not. For example, Facebook launched only twenty years ago, and yet social media’s shockwaves have already upended much in society — subverting news media and our informational commons, addicting us to likes, and displacing meaningful human connection with its shell. We believe capable AI’s impact will exceed that of social media. As a result, it’s vital that we strive to explore, envision, and move towards the AI-infused worlds we’d flourish within — ones perhaps in which it revitalizes our institutions, empowers us to pursue what we find most meaningful, and helps us cultivate our relationships. This is no simple task, requiring imagination, groundedness, and technical plausibility — to somehow dance through the minefields illuminated by previous critiques of technology. Yet now is the time to dream and build if we want to actively shape what is to come.
This segues into our final conclusion: Foundation models and the arc of their future deployment is critical. Even for those of us in the thick of the field, it’s hard to internalize how quickly models have improved, and how capable they might become given several more years. Recall that GPT-2 — barely functional by today’s standards — was released only in 2019. If future models are much more capable than today’s, and competently engage with more of the world with greater autonomy, we can expect their entanglement with our lives and society to rachet skywards. So, at minimum, we’d like to enable these models to understand our wellbeing and how to support it, potentially through new algorithms, wellbeing-based evaluations of models and wellbeing training data. Of course, we also want to realize human benefit in practice — the last section of this blog post highlights what we believe are strong leverage points towards that end.
The rest of this post describes in more detail (1) what we mean by AI that benefits our wellbeing, (2) the need for positive visions for AI grounded in wellbeing, and (3) concrete leverage points to aid in the development and deployment of AI in service of such positive visions. We’ve designed this essay such that the individual parts are mostly independent, so if you are interested most in concrete research directions, feel free to skip there.
Beneficial AI grounds out in human wellbeing
Discussion about AI for human benefit is often high-minded, but not particularly actionable, as in unarguable but content-free phrases like “We should make sure AI is in service of humanity.” But to meaningfully implement such ideas in AI or policy requires enough precision and clarity to translate them into code or law. So we set out to survey what science has discovered about the ground of human benefit, as a step towards being able to measure and support it through AI.
Often, when we think about beneficial impact, we focus on abstract pillars like democracy, education, fairness, or the economy. However important, none of these are valuable intrinsically. We care about them because of how they affect our collective lived experience, over the short and long-term. We care about increasing society’s GDP to the extent it aligns with actual improvement of our lives and future, but when treated as an end in itself, it becomes disconnected from what matters: improving human (and potentially all species’) experience.
In looking for fields that most directly study the root of human flourishing, we found the scientific literature on wellbeing. The literature is vast, spanning many disciplines, each with their own abstractions and theories — and, as you might expect, there’s no true consensus on what wellbeing actually is. In diving into the philosophy of flourishing, wellbeing economics, or psychological theories of human wellbeing, one encounters many interesting, compelling, but seemingly incompatible ideas.
For example, theories of hedonism in philosophy claim that pleasure and the absence of suffering is the core of wellbeing; while desire satisfaction theories instead claim that wellbeing is about the fulfillment of our desires, no matter how we feel emotionally. There’s a wealth of literature on measuring subjective wellbeing (broadly, how we experience and feel about our life), and many different frameworks of what variables characterize flourishing. For example, Martin Seligman’s PERMA framework claims that wellbeing consists of positive emotions, engagement, relationships, meaning, and achievement. There are theories that say that the core of wellbeing is satisfying psychological needs, like the need for autonomy, competence, and relatedness. Other theories claim that wellbeing comes from living by our values. In economics, frameworks rhyme with those in philosophy and psychology, but diverge enough to complicate an exact bridge. For example, the wellbeing economics movement largely focuses on subjective wellbeing and explores many different proxies of it, like income, quality of relationships, job stability, etc.
After the excitement from surveying so many interesting ideas began to fade, perhaps unsurprisingly, we remained fundamentally confused about what “the right theory” was. But, we recognized that in fact this has always been the human situation when it comes to wellbeing, and just as a lack of an incontrovertible theory of flourishing has not prevented humanity from flourishing in the past, it need not stand as a fundamental obstacle for beneficial AI. In other words, our attempts to guide AI to support human flourishing must take this lack of certainty seriously, just as all sophisticated societal efforts to support flourishing must do.
In the end, we came to a simple workable understanding, not far from the view of wellbeing economics: Human benefit ultimately must ground out in the lived experience of humans. We want to live happy, meaningful, healthy, full lives — and it’s not so difficult to imagine ways AI might assist in that aim. For example, the development of low-cost but proficient AI coaches, intelligent journals that help us to self-reflect, or apps that help us to find friends, romantic partners, or to connect with loved ones. We can ground these efforts in imperfect but workable measures of wellbeing from the literature (e.g. PERMA), taking as first-class concerns that the map (wellbeing measurement) is not the territory (actual wellbeing), and that humanity itself continues to explore and refine its vision of wellbeing.
More broadly our wellbeing relies on a healthy society, and we care not only about our own lives, but also want beautiful lives for our neighbors, community, country, and world, and for our children, and their children as well. The infrastructure of society (institutions like government, art, science, military, education, news, and markets) is what supports this broader, longer-term vision of wellbeing.
Each of these institutions have important roles to play in society, and we can also imagine ways that AI could support or improve them; for example, generative AI may catalyze education through personal tutors that help us develop a richer worldview, may help us to better hold our politicians to account through sifting through what they are actually up to, or accelerate meaningful science through helping researchers make novel connections. Thus in short, beneficial AI would meaningfully support our quest for lives worth living, in both the immediate and long-term sense.
So, from the lofty confusion of conflicting grand theories, we arrive at something sounding more like common sense. Let’s not take this for granted, however — it cuts through the cruft of abstractions to firmly recenter what is ultimately important: the psychological experience of humans. This view points us towards the ingredients of wellbeing that are both well-supported scientifically and could be made measurable and actionable through AI (e.g. there exist instruments to measure many of these ingredients). Further, wellbeing across the short and long-term provides the common currency that bridges divergent approaches to beneficial AI, whether mitigating societal harms like discrimination in the AI ethics community, to attempting to reinvigorate democracy through AI-driven deliberation, to creating a world where humans live more meaningful lives, to creating low-c
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み