ペルソナ・アトラス:著名な思考者の思考マップを可視化
Hugging Face のハッカソン成果である「Persona Atlas」は、小規模モデルを用いて著名人の思考スタイルを定量化・可視化する新しいアプローチを示した。
キーポイント
行動的プロファイルの構築
公開された情報を基にエージェントが調査し、特定の人物の思考スタイルを定量的なデータポイントとして変換する仕組み。
小規模モデルによる実装
大規模言語モデルの計算リソースに依存せず、小さなモデルでも「人格」や「思考の癖」を再現できることを実証している。
思考スタイルの比較分析
複数の思想家や著名人を並べて配置し、懐疑性、ユーモア、抽象度などの違いを空間的に可視化して比較可能にする機能。
思考プロセスの可視化
既存のベンチマークが知識量を測るのに対し、Persona Atlas は特定の人物が未知の問題にどのようにアプローチするかという「思考の動き」を可視化する。
3 つのステップによる実行
ウェブ検索とスタイル仮説の構築(リサーチ)、人格が現れる10 の未解決質問への回答、そして回答を埋め込みベクトル化して比較するプロセスで構成される。
相対的な性格分析
ヒートマップは絶対値ではなく、選択された人物群の中で特定の人格が他者よりもどの特性(例:懐疑心、創造性)に傾いているかを相対的に示す。
影響分析・編集コメントを表示
影響分析
このプロジェクトは、LLM が単に知識を答えるだけでなく、特定の人物の『思考の癖』や『スタイル』を模倣・分析する用途への応用可能性を広げた。特に小規模モデルでの実装成功は、コスト効率の高いパーソナライズド AI やシミュレーションツールの開発における重要な指針となる。
編集コメント
大規模モデルの性能競争が激化する中、小規模モデルでいかに『人間らしさ』や『個性』を抽出するかに注目が集まる今、このアプローチは非常に示唆に富んでいます。
- 始まりとなった問い
- 仕組みについて
- 思考の比較
- 裏側の技術
- 実際に試す
TL;DR. Persona Atlas は、有名人を測定可能な*行動的*な肖像へと変換します。名前一覧を入力すると、小規模モデルのエージェントがオープンウェブ上でその人物について調査し、根拠のあるドシエを作成した上で、固定された一連の自由記述式「思考」質問に対して、その人物の声で回答します。各回答は埋め込みベクトル化されるため、ペルソナは単なる文章の壁ではなく、空間上の一点として表現されます。複数の思想家を並べて比較すれば、誰が懐疑論に頼り、誰がユーモアを重視し、誰が冷徹な抽象思考を好むかが視覚的にわかります。このプロジェクトの根底にある仮説は、「人格は主にスタイルであり、計算能力ではない」というものです。そのため、話し手となるモデルが小規模であってもその特性は維持されます。これは*build-small*ハッカソンの趣旨そのものと言えるでしょう。
短いツアーをご覧ください:ペルソナを調査し、いくつかを比較し、性格のヒートマップを読み解きます。
*プレイヤーの読み込みに問題がある場合、YouTube で視聴してください。*
始まりとなった問い
ソクラテス、チャーチル、そしてシリコンバレーの創業者を同じ部屋に招き、答えのでない同じ質問を彼らに投げかけ、それぞれがどのように異なるアプローチで回答に至るかを観察できたらどうでしょうか?多くのベンチマークはモデルが「何を知っているか」を測定します。一方、Persona Atlas はより掴みどころのないものを追及しています。それは特定の思考プロセスがどのように動くかであり、単に主張するのではなく、それを可視化しようとするものです。
仕組みについて
ランには3つのステップがあります。
まず、リサーチです。ツール呼び出しエージェントが実際のウェブ検索を実行し、肖像画を取得し、公開プロフィールを構築します。これには、実際に訪問したソースにそれぞれリンクされた「 grounded facts(根拠のある事実)」のリストと、この人物がこれまで見たことのない問題にどのように取り組むかという最良の推測である「スタイル仮説」が含まれます。
次に、ペルソナがベンチマークに回答します。これは、アイデンティティ、倫理、真実、自由意志、意味、そして機械的意識に関する10 の意図的にオープンエンドなプロンプトです。正解はあえて存在しません。これらは、モデルの生来の能力ではなく、その人の性格が滲み出る質問なのです。
最後に、すべての回答が埋め込みベクトル(embedding)に変換されます。これにより各ペルソナを比較可能な点として扱えるようになり、2 つのペルソナを並べて、その回答間の距離を測定できます。
思考の比較
保存されたペルソナのいずれかを選択すると、比較ビューが2 つの機能を実行します。1 つ目は、埋め込み空間内での回答の乖離度を測定し、グループ全体の多様性を示す単一の数値を提供することです。2 つ目は、各ペルソナを10 の特性アンカー(綿密さ、明瞭さ、創造性、懐疑心、自信、優しさ、ユーモア、好奇心、実用主義、抽象化)に対して評価し、特性の偏りを示すヒートマップとして描画することです。
このグリッドは二重中心化されており、これは言葉以上に重要な意味を持ちます。あるセルが「温かい」と表示されても、それがその形質に対して絶対的に高い値を示すわけではありません。それは、あなたがたまたまテーブルに置いた他の人格と比較して、その人格がその形質により傾斜していることを意味します。非常に異なる人々を何人か並べて配置すると、行は引き離されます。ある人はユーモアと自信で温かく、別の人は抽象化と懐疑主義で温かくなります。
内部構造
すべての処理は、Hugging Face Inference Providers を通じた小規模なホストモデル上で実行されています:エージェントを駆動するコンパクトな生成モデル、幾何学計算を行う軽量な埋め込みモデル、そして根拠付けのためのライブウェブ検索と画像検索です。フロントエンドは Gradio で構成され、3 つのタブがあります。「研究の実行」「保存された人格の比較」「完全なエージェント追跡の検査」です。これにより、実際の情報源に依存していることを自分で確認でき、静かに作り話をしないようにすることができます。一組の人格が事前構築済みで提供されるため、ページ読み込み時にトークンを必要とせず、すぐに比較を開始できます。
試してみる
「保存された人格の比較」タブを開いて開始するか、新しい人物を研究してアトラスに追加してください:
huggingface.co/spaces/build-small-hackathon/persona-atlas
原文を表示
- The question that started it
- How it works
- Comparing minds
- Under the hood
- Try it
TL;DR. Persona Atlas turns a public figure into a *behavioral* portrait you can actually measure. You type a name, a small-model agent researches that person on the open web, writes up a grounded dossier, and then answers a fixed set of open-ended "thinking" questions *in their voice*. Every answer gets embedded, so a persona stops being a wall of prose and becomes a point in space. Line several thinkers up next to each other and you can see who reaches for skepticism, who for humor, who for cold abstraction. The bet underneath it: personality is mostly style, not horsepower, so it survives even when the models doing the talking are small. Which, this being the *build-small* hackathon, is sort of the whole point.
Watch the short tour: research a persona, compare a few, read the trait heatmap.
*Trouble loading the player? Watch it on YouTube.*
The question that started it
What if you could put Socrates, Churchill, and a Silicon Valley founder in the same room, hand them the same unanswerable question, and watch how differently each one reaches for an answer? Most benchmarks measure what a model knows. Persona Atlas is after something harder to pin down, which is how a given mind moves, and it tries to make that visible instead of just claiming it.
How it works
A run has three steps.
First, research. A tool-calling agent runs real web searches, pulls a portrait, and puts together a public profile, a list of grounded facts (each one linked back to a source it actually visited), and a "style hypothesis" that's its best guess at how this person attacks a problem they've never seen before.
Second, the persona answers the benchmark: ten deliberately open-ended prompts about identity, ethics, truth, free will, meaning, and machine consciousness. There are no right answers, on purpose. These are the questions where a personality leaks through instead of the model's raw capability.
Third, every answer becomes an embedding. That turns each persona into points you can compare: put two side by side and measure the distance between their answers.
Comparing minds
Pick any of the saved personas and the comparison view does two things. It measures how far apart their answers sit in embedding space, giving you one number for how much the whole group diverges, and it scores each persona against ten trait anchors (meticulousness, clarity, creativity, skepticism, confidence, kindness, humor, curiosity, pragmatism, abstraction), drawn as a trait-leaning heatmap.
The grid is double-centered, which matters more than it sounds. A warm cell never means "high on this trait" in some absolute sense. It means this persona leans toward that trait more than the others you happened to put on the table. Drop a handful of very different people side by side and the rows pull apart. One runs warm on humor and confidence, another on abstraction and skepticism.
Under the hood
Everything runs on small, hosted models through Hugging Face Inference Providers: a compact generator driving the agent, a lightweight embedding model doing the geometry, plus live web and image search for grounding. The front end is Gradio, with three tabs: research a run, compare saved personas, and inspect the full agent trace, so you can check for yourself that it leans on real sources rather than quietly making things up. A set of personas ships prebuilt, so the comparison works the moment the page loads, no token required.
Try it
Open the Compare saved personas tab to start, or research someone new and add them to the atlas:
huggingface.co/spaces/build-small-hackathon/persona-atlas
関連記事
MosaicLeaks:研究エージェントは秘密を守れるか?
Hugging Face は、AI エージェントが機密情報を漏洩するリスクを検証する「MosaicLeaks」という評価フレームワークを発表した。
[AINews] 今日特に大きな出来事はありませんでした
Latent Space は、GLM 5.2 が依然として注目されていると指摘しつつ、AIE WF 2026 の通常チケットが月曜日に完売すると発表しました。同サイト購読者向けに限定割引を提供し、参加者には Warp や Datadog などからのスポンサークレジットも付与されます。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み