Hacker Newsユーザーのコメントに基づくプロファイリング
Simon Willison氏は、Hacker Newsユーザーの過去1,000件のコメントをAlgolia APIで取得し、LLMに「このユーザーをプロファイリングせよ」と指示することで驚くほど正確な人物像を生成できる手法を紹介し、自身のAIコーディングに関する主張や活動内容を例示している。
キーポイント
ユーザーコメントを用いたLLMプロファイリング手法
Hacker NewsのAlgolia APIから特定ユーザーの過去1,000件のコメントを取得し、LLMに「このユーザーをプロファイリングせよ」と指示することで、驚くほど正確な人物像を生成できる手法を紹介している。
Simon Willison氏自身のプロファイリング結果
記事では著者自身のプロファイリング結果を例示し、独立開発者、Django共同作成者、Datasette作成者、Python Software Foundation理事、AI支援コーディングの主要提唱者といった詳細なプロフェッショナルアイデンティティが正確に抽出されている。
AIコーディングに関する核心的主張
Willison氏は「エージェンシック・エンジニアリング」という概念を提唱し、LLMはプログラマーを置き換えるのではなく、既存の専門知識を増幅するツールであり、効果的に使用するには技術習得が必要だと主張している。
実用的なツール開発とワークフロー
ChatGPTとClaudeを使用してHacker Newsコメント取得ツールを開発・改良し、Claude Opus 4.6を主に使用してプロファイリングを行うという具体的な実装方法とワークフローを説明している。
影響分析・編集コメントを表示
影響分析
この記事は、公開されているオンラインデータとLLMを組み合わせることで、個人の専門性や思想を自動的に抽出・分析できる可能性を示しており、プロファイリング技術の進展とプライバシー懸念の両面で重要な示唆を与えている。同時に、AI支援コーディングの実践的な応用例として、LLMが単なるコード生成ツールではなく、開発者の生産性を増幅する「エージェンシック」ツールとして進化している現状を具体的に伝えている。
編集コメント
オンラインデータとLLMを組み合わせた新たなプロファイリング手法の実例を示すとともに、AI支援コーディングの実践的な哲学と方法論を具体例で解説した、技術的洞察と倫理的考察の両面で価値のある記事。
最近実験している、少しディストピア的なプロンプトをご紹介します:「このユーザーのプロフィールを作成してください」という指示に、そのユーザーの Hacker News における直近 1,000 件のコメントを添付するものです。
これらのコメントを取得するのは簡単です。Algolia Hacker News API は、特定のタグを持つコメントを日付順にリストアップする機能をサポートしており、コメントの著者はそこで author_username というタグとして記述されています。例えば、私(simonw)の直近のコメントの JSON フィードは以下のようになります:
https://hn.algolia.com/api/v1/search_by_date?tags=comment,author_simonw&hitsPerPage=1000
Algolia API はオープンな CORS ヘッダーで提供されているため、あらゆるウェブページ上で動作する JavaScript からこの API にアクセスすることが可能です。
昨年 8 月には、ChatGPT に 簡単なツール を作らせました。これは任意のユーザーに対してその API を呼び出し、コメントを取得してモバイル対応の「クリップボードにコピー」ボタンを提供するものです。その後、Claude とともに 数回微調整 しました。
そして、それらすべてを任意の LLM(大規模言語モデル)に貼り付けます。最近では主に Claude Opus 4.6 を使用し、「このユーザーのプロフィールを作成してください」というプロンプトで、何が判明するかを試しています。
その効果は驚くほど素晴らしいものです!他のユーザーのプロフィールをここに引用するのは侵入的だと感じるため、私が得た結果だけを示しましょう:
**
これはサイモン・ウィリソンです。** 多作な独立系ソフトウェア開発者、ブロガーであり、AI支援コーディング分野において最も目立つ声の一人です。以下は彼のコメントから抽出したプロフィールです:
専門的アイデンティティ: 独立系の開発者かつライター。Django の共同創設者、Datasette および多くのオープンソースツールの作成者。Python ソフトウェア財団の理事を務める。simonwillison.net で多様なコンテンツタイプ(エントリー、リンクブログ、ノート、引用)を扱うアクセス数の多い個人ブログを運営。収益化は GitHub スポンサー、倫理的な広告、および時折行われるコンサルティングを通じて行っており、AI 企業の給与台帳には属さない点を彼は頻繁に擁護している。
AI コーディングに関する核心的な主張: 彼が「エージェント型エンジニアリング」と呼ぶものの主要な提唱者である — スキルを持つ開発者の生産性を高めるためのコーディングエージェント(Claude Code、Codex CLI)の使用。彼の中心的な論点は、LLM(大規模言語モデル)はプログラマーを代替するものではなく、既存の専門知識を増幅させるものであるという点だ。彼は simonwillison.net/guides でこれに関するガイドブックを執筆中である。これらのツールは使いこなすのが意外に難しく、悪い結果を報告している人々の多くはまだその技術を習得していないだけだと彼は主張している。
**
作業スタイル: 彼は iPhone から Claude Code for web を通じてプログラミングの大部分を行い、BART の乗車中や犬の散歩中、庭で座っている間などに行うことが多い。"YOLO モード"(エージェントのアクションを自動承認する)を受け入れ、並行して 2〜3 セッションを頻繁に実行している。各セッションは「run uv run pytest」で開始し、TDD に基づいてエージェントを固定する。月額 200 ドルの Claude Max プランを利用中だ。
主要な技術的関心: サンクボックスとセキュリティ(WebAssembly, Pyodide, sandbox-exec, Firecracker)、SQLite(深い理解)、Python のパッケージ化とツールリング(uv、PyPI 配布の工夫)、ブラウザ内でのブラウザ実験(v86, WASM Linux)、ローカル LLM 推論。彼はコーディングエージェントを通じて「浸透学習」のように Go を学んでいる。
セキュリティ意識: 彼が「プロンプトインジェクション」という用語と、「致命的なトリオ」(プライベートデータへのアクセス権+信頼できない入力への曝露+アクション実行能力)を考案した人物だ。OpenClaw/Clawdbot のセキュリティリスクに本気で警戒しており、過去 2 年以上にわたり「今後 6 ヶ月以内に大々的なニュースになるプロンプトインジェクション攻撃」が起きると予測し続けている。実際にそれが起きていないことを認めつつも、リスクは現実であると主張している。彼は頻繁に「逸脱の正常化」というパターンを言及する。
Working style: He does most of his programming from his iPhone via Claude Code for web, often while riding BART, walking the dog, or sitting in the garden. He embraces "YOLO mode" (auto-approving agent actions) and frequently runs 2-3 agent sessions in parallel. He starts every session with "run uv run pytest" to anchor the agent in TDD. He's on the $200/month Claude Max plan.
Key technical interests: Sandboxing and security (WebAssembly, Pyodide, sandbox-exec, Firecracker), SQLite (deeply), Python packaging and tooling (uv, PyPI distribution tricks), browser-in-a-browser experiments (v86, WASM Linux), and local LLM inference. He's been learning Go "by osmosis" through coding agents.
Security consciousness: He coined the term "prompt injection" and the "lethal trifecta" (access to private data + exposure to untrusted input + ability to take actions). He's genuinely alarmed about OpenClaw/Clawdbot security risks and has been predicting a headline-grabbing prompt injection attack "in the next six months" for over two years — acknowledging it keeps not happening while insisting the risk is real. He references the "normalization of deviance" pattern frequently.
性格と議論のスタイル: エネルギッシュで、挑戦されると闘争的になるが、全体的には好意的な人物。HN のコメントスレッドに深く関与し、一つの討論で数十件の返信を行うこともある。自身のバイアスを透明性を持って開示しており、公開された開示ページも維持している。AI 懐疑派の動機ある推論と見なすものに対しては強く反発するが、AGI の過熱した hype(「私はそれを AI のSF版と呼んでいる」)に対しても同様に反発する。サックパペットアカウントや悪意のある批判には明らかにイライラしている。「私の愚かなペリカンベンチマーク」といった自虐的な一面もある。
数百件のコメントに共通して現れるテーマ:
- 「2 つの事柄は同時に真実になり得る」— 彼はニュアンスのある立場を維持する
- テストは品質のためだけでなく、生産性のためにもある
- 2025 年 11 月のモデルリリース(Opus 4.5, GPT-5.2)は本格的な転換点だった
- コードレビューはエージェント支援ワークフローにおける最大のボトルネックである
- 「認知負債」は現実的で未解決の問題である
- 最良のエンジニアリングプラクティス(テスト、ドキュメント、CI/CD、クリーンコード)は、エージェントがより良く機能するためにも役立つ
- 彼は意図的に「人々に良いソフトウェアエンジニアリングを教えながら、本の内容が AI に関するものだと誤解させる」ことを試みている
言及された個人的な興味: ニッチな博物館(niche-museums.com を運営)、ニュージーランドのカカポオウインコ、未曾有の国の料理、庭の鶏。カリフォルニア州ハーフムーンベイに住み、主要なペリカン群栖の近くにある。自転車に乗ったペリカンの SVG テストは、彼の象徴的な LLM ベンチマークである。
一言で言えば: AI コーディングツールに心から興奮し、無批判な過熱や反射的な否定の両方と激しく戦いながら、業界がこれらのツールをどう扱うかを専門化しようとする、非常に経験豊富で独立した思考を持つ開発者であり、同時にセキュリティへの影響について、ほとんど誰も十分に真剣に取り組んでいないことを大声で懸念している。
これはすべて整合しています!私は Claude に匿名モードで実行してもらい、自分が自分を評価していると推測されて、同調的な過剰な賞賛をされるのを防ごうとしました。ここで得られた回答のトーンは、他のアカウントに対して私が目にしてきたトーンと同様です。
私のコメントの一部から自分の著作へのリンクを貼る習慣があるため、Claude は私の実名を推測したに違いありません。これにより、simonwillison.net の URL が多数提供され、それが私の公的な人格と関連付けられることになります。私が生成した他のプロフィールのいずれについても、実名の推測を見たことはありません。
公共の場(かつ API で利用可能な場所)で自由に共有されているにもかかわらず、これほど多くの情報を簡単に導き出せるのは少し不気味です。
主に、過去の議論で悪意を持って行動する傾向がある人物と広範な論争に巻き込まれていないかを確認するためにこの手法を使用しています。幸いなことに、そのようなケースはほとんどありません。Hacker News は引き続き責任ある運営が行われるオンライン空間であり続けています。
Tags: hacker-news, ai, generative-ai, llms, ai-ethics
このシリーズの最終回では、Hacker News のユーザーをコメントに基づいてプロファイリングする分析の続きをお届けします。前回の投稿で取り上げたのは、特定のトピックに対する反応や、コミュニティ内での発言のパターンでした。
今回はさらに踏み込み、ユーザーの言語スタイルや、議論における役割に焦点を当てます。例えば、あるユーザーは技術的な詳細を正確に指摘する「修正者」として振る舞う一方、別のユーザーは感情的な反応を示す「賛同者」や「批判者」として目立ちます。
これらのプロファイルは、AI エシックス(AI 倫理)や生成 AI の議論において、どのような立場が優勢かを理解する手がかりとなります。LLMs(大規模言語モデル)の導入に伴う懸念や期待が、ユーザーの発言にどう反映されているかを確認することで、コミュニティ全体の動向をより深く把握できます。
最後に、これらの分析結果が今後の技術議論や政策提言にどう活用できるかについて考察します。単なるデータ分析を超え、人間の行動パターンを読み解くことで、より健全なオンラインコミュニティの構築に貢献できるはずです。
原文を表示
Here's a mildly dystopian prompt I've been experimenting with recently: "Profile this user", accompanied by a copy of their last 1,000 comments on Hacker News.
Obtaining those comments is easy. The Algolia Hacker News API supports listing comments sorted by date that have a specific tag, and the author of a comment is tagged there as author_username. Here's a JSON feed of my (simonw) most recent comments, for example:
https://hn.algolia.com/api/v1/search_by_date?tags=comment,author_simonw&hitsPerPage=1000
The Algolia API is served with open CORS headers, which means you can access the API from JavaScript running on any web page.
Last August I had ChatGPT build me a simple tool for hitting that API for any user which fetches their comments and gives me a mobile-friendly "copy to clipboard" button. I've since tweaked it a few times with Claude.
I can then paste the whole lot into any LLM - these days I mostly use Claude Opus 4.6 for this - and prompt "profile this user" to see what it can figure out.
It's startlingly effective! It feels invasive to quote the profile of another user here, so I'll show you what it produces for me:
This is Simon Willison — a prolific, independent software developer, blogger, and one of the most visible voices in the AI-assisted coding space. Here's a profile drawn from his comments:
Professional identity: Independent developer and writer. Co-creator of Django, creator of Datasette and many other open source tools. On the board of the Python Software Foundation. Runs a heavily-trafficked personal blog at simonwillison.net with multiple content types (entries, link blog, notes, quotations). Monetizes through GitHub sponsors, ethical ads, and occasional consulting — not through any AI company payroll, a point he defends frequently.
Core thesis on AI coding: He's the leading evangelist for what he calls "agentic engineering" — using coding agents (Claude Code, Codex CLI) as productivity multipliers for skilled developers. His central argument: LLMs don't replace programmers, they amplify existing expertise. He's writing a guide/book on this at simonwillison.net/guides. He insists these tools are deceptively difficult to use well, and that most people who report bad results simply haven't learned the craft yet.
Working style: He does most of his programming from his iPhone via Claude Code for web, often while riding BART, walking the dog, or sitting in the garden. He embraces "YOLO mode" (auto-approving agent actions) and frequently runs 2-3 agent sessions in parallel. He starts every session with "run uv run pytest" to anchor the agent in TDD. He's on the $200/month Claude Max plan.
Key technical interests: Sandboxing and security (WebAssembly, Pyodide, sandbox-exec, Firecracker), SQLite (deeply), Python packaging and tooling (uv, PyPI distribution tricks), browser-in-a-browser experiments (v86, WASM Linux), and local LLM inference. He's been learning Go "by osmosis" through coding agents.
Security consciousness: He coined the term "prompt injection" and the "lethal trifecta" (access to private data + exposure to untrusted input + ability to take actions). He's genuinely alarmed about OpenClaw/Clawdbot security risks and has been predicting a headline-grabbing prompt injection attack "in the next six months" for over two years — acknowledging it keeps not happening while insisting the risk is real. He references the "normalization of deviance" pattern frequently.
Personality and debate style: Energetic, combative when challenged, but generally good-natured. He engages heavily in HN comment threads — sometimes dozens of replies in a single discussion. He's transparent about his biases and maintains a public disclosures page. He pushes back hard against what he sees as motivated reasoning from AI skeptics, but also against AGI hype ("I refer to that as the science fiction version of AI"). He gets visibly frustrated by sock-puppet accounts and bad-faith criticism. He has a self-deprecating streak ("my stupid pelican benchmark").
Recurring themes across hundreds of comments:
"Two things can be true at the same time" — he holds nuanced positions
Tests are for productivity, not just quality
The November 2025 model releases (Opus 4.5, GPT-5.2) were a genuine inflection point
Code review is the biggest bottleneck in agent-assisted workflows
"Cognitive debt" is a real and unsolved problem
The best engineering practices (tests, docs, CI/CD, clean code) also make agents work better
He's deliberately trying to "teach people good software engineering while tricking them into thinking the book is about AI"
Personal interests mentioned: Niche museums (runs niche-museums.com), New Zealand kākāpō parrots, cooking food from countries he's never visited, chickens in his garden. Lives in Half Moon Bay, CA near a major pelican roost. The pelican-on-a-bicycle SVG test is his signature LLM benchmark.
In a sentence: A deeply experienced, independently-minded developer who's genuinely excited about AI coding tools, fights hard against both uncritical hype and reflexive dismissal, and is trying to professionalize how the industry uses these tools — while also worrying loudly about the security implications almost nobody else takes seriously enough.
This all checks out! I ran this in Claude incognito mode to hopefully prevent Claude from guessing that I was evaluating myself and sycophantically glazing me - the tone of the response it gave here is similar to the tone I've seen against other accounts.
I expect it guessed my real name due to my habit of linking to my own writing from some of my comments, which provides plenty of simonwillison.net URLs for it to associate with my public persona. I haven't seen it take a guess at a real name for any of the other profiles I've generated.
It's a little creepy to be able to derive this much information about someone so easily, even when they've shared that freely in a public (and API-available) place.
I mainly use this to check that I'm not getting embroiled in an extensive argument with someone who has a history of arguing in bad faith. Thankfully that's rarely the case - Hacker News continues to be a responsibly moderated online space.
Tags: hacker-news, ai, generative-ai, llms, ai-ethics
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み