AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
宝玉的分享·2026年4月23日 09:00·約31分で読める

Cat Wu氏が数百人のPM候補者を面接したところ、ほぼ誰も正解しなかった問いとは「AIプロダクトマネージャーの役割とは何か?」

#AIプロダクトマネージャー#LLM統合#モデル評価指標#データ駆動型開発
TL;DR

Cat Wu氏は数百人のPM候補者への面接を通じて、従来のプロダクトマネージャーの発想から脱却し、AIモデルの特性とデータフローを統合した具体的な業務範囲を定義する重要性を指摘した。

AI深層分析2026年4月24日 15:39
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
3

キーポイント

1

従来のPMスキルセットの限界

従来の機能設計やUI/UX中心のアプローチでは、不確実性の高いAIモデルの特性に対応できず、候補者の大半が誤答している。

2

AI PMの核心業務:データと評価体系の構築

モデル選定やプロンプト設計だけでなく、品質評価指標の設定とデータパイプラインの管理が業務の中心となる。

3

技術とビジネスの橋渡し役としての再定義

AIの可能性と制約を正確に理解し、技術チームとビジネスサイドの間で期待値管理と実装ロードマップを調整する役割が必須となる。

影響分析・編集コメントを表示

影響分析

本記事は、急速に進むAI普及に伴い、プロダクトマネージャーの役割定義が根本から書き換えられていることを示唆している。企業は採用基準の見直しと既存PMへの再教育に注力する必要があり、AIモデルの特性を適切に統合できる人材が競争優位性の源泉となる。

編集コメント

AIモデルの非確実性をどう製品化に落とし込むかは、今やPMの必須スキルである。採用・育成プロセスの見直しを急ぐべき局面だ。

Cat WuはAnthropicのClaude CodeおよびCoworkのプロダクトリードであり、Boris Chernyとパートナーを組んでチームを率い、プロダクト機能の納期を半年から1日へと圧縮した。Lenny's Podcastの最新回で、CatはAnthropic内部のスピード文化、PM(Product Manager)役割の劇的な変化、ソースコード漏洩への対応、そしてオープンソースコミュニティを沸かせたOpenClawのブロック決定について語った。

imageimage**

オリジナル動画:https://www.youtube.com/watch?v=PplmzlgE0kg

ポイントまとめ

image
image
  • 多くのPM候補者は依然として6〜12ヶ月のロードマップ思考で求人を探しているが、Anthropicのリズムは機能リリースを週単位、あるいは1日単位で行うこと
  • Claude Codeチームのほぼ全PMがエンジニアリング背景を持つか直接コードを書く経験があり、デザイナーも元々はフロントエンドエンジニアだった
  • Anthropicはresearch preview(Research Preview)メカニズムを用いてリリースのコミットメントを軽減し、エンジニアがアイデアからリリースまでエンドツーエンドで完結できるようにしている
  • CatはCoworkを意図的に限界まで押し上げるのに30%の時間を費やし、モデルと対話させてエラーの原因を解明している
  • Claude Codeのソースコード漏洩は二段階の手動レビューを経ても見逃され、Catはこれをプロセスの失敗と位置づけた
  • OpenClawの利用をサブスクリプションクォータでブロックする決定について、Catはキャパシティ管理の観点から説明したが、「まず機能を複製してからブロックする」という論争を回避した
  • Anthropicの成功の核心:統一されたミッションにより、チームが自らのKR(Key Results)を犠牲にしてでも会社全体の目標に貢献する意志を持つこと

1. Boris Chernyとのパートナーシップ:80%のシンクロ、20%は各自の担当

image
image

Lennyは冒頭で、CatとBorisがどのように分担しているかを尋ねた。BorisはClaude Codeの生みの親であり技術責任者で、ポッドキャスト界ではすでにスター級の人物だ。Lennyは彼の回がポッドキャスト史上最高の人気エピソードだったと語っている。

Catは自分とBorisの関係が「80% mind-meld(マインド meld / 思考の融合)」と表現できると話す。Borisが得意なのは方向性の把握で、3ヶ月後や6ヶ月後にプロダクトがどうなっているべきか、最もAGI pilled(AGI Pilled)バージョンは何かを語る。Catの役割はこのビジョンを実行パスに翻訳すること**だ:現在からそのビジョンに至るまで、一歩ずつどう進むか?同時に彼女はクロスファンクショナルな調整に多くの時間を費やし、マーケティング、セールス、財務、キャパシティなどのチームが計画に同意し、機能準備完了後に障害が発覚しないようにしている。

残りの20%は、各自が特に重視する事項だ。Catは自分がより関心のあることを主導し、Borisも同様で、より関心の高い方が推進する。この曖昧な分担は外見上あまり正統派ではないが、Catにとってはこの曖昧さこそがスピードを生むのだという。

**

編集者注:** Boris ChernyはAnthropicのClaude Code技術責任者であり、O'Reillyより刊行された『Programming TypeScript』の著者でもある。2024年9月にAnthropicに入社後、Claude Codeの最初のターミナルプロトタイプを構築した。AGI pilledはインターネットスラングのred pilled(映画『マトリックス』由来)に由来し、AGIの到来に対して極めて楽観的かつ熱狂的な態度を指す。AI業界内部では、この言葉には前向きな意味(より強力なモデル向けにプロダクトを設計する勇気)と警告の意味(現在のモデルの実力から乖離している可能性)の両方が含まれる。

2. 数百人のPM面接後の発見:大半は旧世界に生きている

image
image

Lennyは興味深い現象に言及した。AnthropicのPMになりたい人が多すぎて、もうすぐ30億ドルのARR(Annual Recurring Revenue)相当の「紹介料」をもらってしまうほどだ。Catは数百人を面接したが、大半がAI PMの役割に対する理解の方向性が間違っていると感じている。

どこに問題があるのか?Catは、AI登場以前は技術変化が遅く、6〜12ヶ月の計画を立てることができたと考えている。コードを書くコストが高いため、PMの中核業務は各チームのロードマップを調整し、機能がお互いにロック解除されることを確保することだった。この戦術は旧世界では正解だった。

しかし現在、モデルの能力が急速に向上し、AIはエンジニアリング効率を大幅に加速させている。多くのプロダクト機能の納期が6ヶ月から1ヶ月、場合によっては1週間、あるいは1日へと短縮された。このリズムにおいて、PMは複数の四半期にわたるロードマップのクロスチーム調整に精力を費やすべきではなく、どうやってものを出すか最速の方法を見つけるかを考えるべきだ。エンジニアがアイデアを持ち、週末までにユーザーの手に届くようにするにはどうすればよいか?

**

最高のAIプロダクトPMは、「このアイデア」から「実際にユーザーの手に届く」までの時間を短縮する方法を解き明かし、プロダクトがどのタスクでout-of-the-box(Out-of-the-box)状態であるべきかを定義できる人だ。

(“The PMs who do the best on AI native products are the ones who can figure out: How can I shorten the time from having this idea to actually getting the product in the hands of users.”)

3. どうやって1日に1つの機能をリリースするか

image
image

Lennyは具体的にどうやってこれほど速くできるのかと追及した。Catは3つのことを語った。

1つ目は明確な目標の設定だ。**大语言模型(Large Language Model)の能力があまりにも汎用的であるため、ユーザーは誰か、解決する問題は何か、コアシナリオは何かがすべて曖昧になる。優れたPMはこれらを明確に定めることができる:私たちのコアユーザーは企業内のプロフェッショナルな開発者であり、この機能は権限プロンプトが多すぎることに起因する疲労感を解決するものであり、目標は企業開発者が安全にゼロ権限プロンプトを実現できるようにすることだ。この目標が明確になれば、関連性の低い方案の大部分が排除される。

第二に「research preview(研究プレビュー)」の仕組みです。 Claude Code のほぼすべての機能は、まず研究プレビューとして公開されます。ユーザーには明確に伝えます:これは初期版であり、単なるアイデア段階です。フィードバックを収集中であり、この機能は永久にサポートされない可能性があります。これにより公開のハードルが下がり、1〜2週間で製品をリリースできます。

第三に、クロス機能の迅速な対応パイプラインを構築することです。 Cat のチームには「evergreen launch room(エヴァーグリーン・ランチラーム)」という仕組みがあります。エンジニアが機能の準備ができ、社内テストも完了したと判断すると、このチャンネルに投稿します。ドキュメント担当の Sarah、プロダクトマーケティング担当の Alex、デベロッパーリレーションズのスタッフが即座に参画し、翌日には外部向けのプロモーションが完了します。このフローが円滑に回れば、どのエンジニアも機能公開する際に摩擦なく進められます。

Cat は明確にこう述べています:「この公開パイプラインを構築することは、PM がやるべきことです。」

\n編集者注: Anthropic の公開ペースはどれほど速いのでしょうか?ある人物がカレンダーを作成し、Anthropic が 2026 年の最初の数ヶ月ではほぼ毎日、重要な機能や製品の公開を行っていたことを発見しました。

4. PRD (Product Requirements Document) は死んでいないが、生き方が異なる

image
image

Lenny は PRD をまだ書くかどうかを尋ねました。Cat によると、彼らはその代わりとして 2 つのことを行っています。

第一に、毎週厳格な「metrics readout(メトリクス・リードアウト)」を実施することです。チーム全員でデータを確認し、誰もがビジネスの各側面、主要な目標、トレンド、そしてそれを駆動する要因を深く理解していることを保証します。

第二に「team principles(チーム原則)」を維持することです。これには、コアユーザーは誰か、なぜ彼らなのか、どのようなトレードオフを受け入れるかが含まれます。この原則の目的は、チームの誰もが PM やその他のステークホルダーに判断を仰がずとも、自ら意思決定できるようにすることです。

PRD が完全に消えたわけではありません。特に曖昧な機能については、Cat 还是一頁のドキュメントを作成し、目標、理想シナリオ、現在の失敗パターンを列挙します。インフラへの多大な投資が必要な長期プロジェクトにも PRD は残っています。ただし、大部分の機能には必要ありません。

5. Mythos が彼らを速くしたわけではない

image
image

Lenny は、Anthropic がまだ正式公開していない Mythos モデルが外部から注目を集めていることに注目し、社内でこのモデルを使用して開発を加速させているかどうかを尋ねました。

Cat の回答は非常に直接的でした。「彼らはすでに数四半期にわたって高速化しており、Mythos が核心的な原因ではありません。」 Mythos は強力であり、確かに社内ではモデルを使用しており、それが開発をある程度上積かせたのは事実ですが、速度向上の主要部分を説明するには不十分です。より大きな要因はプロセスとチームの期待値の設定です:誰もが、アイデアを1週間以内に現実に変える権限と責任を持っていると感じています。

\n編集者注: Mythos(内部コードネーム:Capybara)は Anthropic の最新フラッグシップモデルで、2026 年 4 月 7 日に研究プレビューとして限定公開され、主に Project Glasswing(プロジェクト・グラスウィング)のサイバーセキュリティプロジェクトに使用されています。当初は 3 月 26 日に CMS の設定ミスにより早期に露見し、Fortune などのメディアが入手した草案では、Opus よりも規模が大きく強力なモデルとして紹介されていました。Anthropic によれば、このモデルはコード生成、推論、サイバーセキュリティの能力において過去の全モデルを大幅に上回り、数千のゼロデイ脆弱性を発見しています。

6. ソースコード漏洩:プロセスの失敗として定性

image
image

2026 年 3 月末、Claude Code の完全なソースコードが npm パッケージを通じて漏洩しました。Lenny は Cat に何があったのかを尋ねました。

Cat によると、彼らは直ちに調査を開始しました。原因は人的ミスであり、あるスタッフが Claude を使用してパッケージ公開フローの更新に関する PR(プルリクエスト)を作成していました。この PR は 2 段階の手動レビュー通过了しましたが、それでも見逃されました。彼らはすでにフローを強化し、再発しないようにしています。

Lenny は鋭い追及を行いました:「この人物は現在も Anthropic に在籍していますか?」Cat の回答は明確でした。「在籍しています。これはプロセスの失敗であり、最も重要なのは教訓を学び、防護を強化することです。」

\n編集者注: 漏洩の根本原因は、Claude Code が Bun runtime を使用してビルドされていたことにあります。Bun はデフォルトで source map ファイルを生成しますが、.npmignore に *.map のエントリが不足していたため、59.8 MB の source map ファイルが公開の npm レジストリに公開され、約 2,000 のファイル、512,000 行の TypeScript ソースコード、44 の非公開機能フラグ、そして KAIROS という名前の自律型バックグラウンドエージェント(漏洩したコードから発見された未公開機能で、ユーザーがアイドル状態のときでも「メモリ整理」を行うため、Claude をバックグラウンドで継続実行可能にするもの)が暴露されました。これは 13 か月間での 2 回目のコード漏洩であり、Mythos モデルの情報が CMS の設定ミスにより漏洩してからわずか 5 日後のことでした。「セキュリティファースト」をブランドポジショニングとする企業にとって、1 週間のうちに 2 回の漏洩が発生したことは、外部から運用セキュリティへの疑問を投げかけました。

7. OpenClaw のブロック:キャパシティ管理か、エコシステムの壁か?

image
image

Lenny はもう一つの論争的な話題に言及しました。Anthropic がサブスクリプションユーザーによるサードパーティ製ツール(特に OpenClaw)を通じた Claude の使用を禁止していることです。オープンソースコミュニティからの反応は非常に大きかったです。

Cat の説明は以下の通りです。Claude への需要が非常に大きいため、インフラの拡張に努めると同時に、harness のトークン効率を最適化しています。サブスクリプションプランはサードパーティ製ツールの使用パターンを想定して設計されたものではありません、こうした製品がシステムに不均衡な負荷をかけています。彼らは最も円滑な移行策を模索するために多くの時間を費やし、最終的に各ユーザーにサブスクリプションに付随する一定のクレジットを付与することを選びましたが、中核的な判断は自社製品と API の優先確保にあります。

**\n私たちは確かに困難な決断を下す必要があり、自社製品と API を優先確保する必要がありました。\n

(“We did have to make the hard decision that we needed to prioritize our first-party products and our API.”)**

編集者注:** Cat の回答はこの論争の一面しかカバーしていません。完全なタイムラインは以下の通りです:OpenClaw(旧名 Clawdbot、2026 年 1 月に Anthropic が商標の混同を懸念して改名)は、オーストリアの開発者 Peter Steinberger によって作成されたオープンソースの AI Agent(エージェント)フレームワークで、2026 年初頭に急激に人気を集め、GitHub でのスター数は累計 24.7 万を数え、オープンソース史上最も成長が速いプロジェクトの一つです。2 月 14 日、Steinberger は OpenAI への加入を発表し、OpenClaw はオープンソース財団に移管されました。2 月 20 日、Anthropic は利用規約を更新し、サードパーティ製ツールへの OAuth token(アクセストークン)の使用を明確に禁止しました。3 月末、Anthropic 自身の Cowork が Claude Dispatch(Claude ディスパッチ)などの機能をリリースし、OpenClaw で最も人気のある機能と大きく重複しました。4 月 4 日に正式なブロックが適用され、ユーザーへの通知はわずか 24 時間未満でした。Steinberger は Anthropic を「人気機能を自社のクローズドな harness(ハルネス)に先に取り込み、その後オープンソースを締め出す」と批判しました。Boris Cherny は X 上でチームが「オープンソースの大きなファンである」と表明し、本人も OpenClaw にプロンプトキャッシュ効率を改善する PR(プルリクエスト)を提出したことがあります。これらの行動と実際のポリシーの間の温度差は、ユーザーに感じ取られています。月額 $200 の Max サブスクリプションユーザーが OpenClaw を通じて終日自律型 Agent(エージェント)を稼働させると、$1,000〜$5,000 に相当する API コストを消費する可能性があり、経済的な観点から Anthropic の決定には合理性があります。しかし、この決定のタイミングと Cowork 機能拡張の偶然が一致している点は、依然としてコミュニティ論争の核心です。

8. PM(プロダクトマネージャー)チームの全体像

image
image

Cat によると、Anthropic には約 30〜40 名の PM(プロダクトマネージャー) がおり、いくつかのチームに分散しています:

  • 研究 PM チーム:モデルに対する顧客からのフィードバックを収集し、モデルのリリースを推進する担当
  • Claude 開発者プラットフォームチーム:API や Managed Agents(マネージドエージェント)などのサービスを維持管理
  • Claude Code チーム:コア製品の開発を担当
  • 企業向けチーム:セキュリティ制御、コスト管理、RBAC(ロールベースのアクセスコントロール)など、大企業が安心して使用できる機能を担当
  • 成長チーム:製品スイート全体の成長を担当

9. 役割の融合:エンジニア、PM(プロダクトマネージャー)、デザイナーの境界線が消失しつつある

image
image

Lenny はすべての PM が不安を抱えている一つの質問を投げかけました:「将来、PM(プロダクトマネージャー)は必要なのか?」

Cat の見解はすべての役割が融合していることです。PM がコードを書き、エンジニアが製品に関する意思決定を行い、デザイナーは PM の業務をこなすだけでなくコードも提出しています。彼女は二つの道があると言います:一つは製品センス(プロダクトテイスト)のあるエンジニアを大量に採用すること、もう一つはエンジニアの数を維持したまま PM を追加して誘導することです。Anthropic が選んだのは前者——製品センスのあるエンジニアを大量に採用することです。

チーム内の多くのエンジニアは、「Twitter でユーザーのフィードバックを見る」から「週末に機能をリリースする」までの全プロセスを完全に一人で完結でき、PM の関与はほとんど不要だと彼女は語ります。これが最も効率的なモデルです。

**

コードが安価になるにつれて、真に価値が高まるのは「何を書くか」を決定することです。

(“As code becomes much cheaper to write, the thing that becomes more valuable is deciding what to write.”)**

Cat 自身もエンジニア出身です。以前は Scale AI でプロダクトエンジニアを務め、Dagster Labs ではエンジニアリングマネージャーとして活動し、その後 Index Ventures でベンチャーキャピタリストとして働きました。チーム内のほぼすべての PM はかつてエンジニアだったか、Claude Code 上で直接コードを書いています。デザイナーも全員がフロントエンドエンジニアの経験を持っています。

では、なぜエンジニアリングのバックグラウンドが現在特に有用なのでしょうか?Cat は次のように説明します。エンジニアリングのバックグラウンドがあれば、タスクの難易度を判断できます。もし簡単なら議論せず、1 時間で仕上げてしまいましょう。もし難しければ、事前にコストがわかるので、優先順位をより正確に付けられます。

しかし彼女は、どのようなバックグラウンドであれ、最も核心的な能力は product taste(プロダクトテイスト/製品センス)**であると依然として考えています。

**

Product taste(プロダクトテイスト)は依然として非常に希少なスキルであり、この能力を強力に証明できる人物であれば、私たちはほぼ全員を採用します。

(“Product taste is still a very rare skill to have, and we'll pretty much hire anyone who we feel has demonstrated this strongly.”)**

10. 「ちょうどよい程度の AGI(人工汎用知能)信仰」

image
image

PM に必要な新スキルについて問われると、Cat は会場全体で最も洞察に富んだ回答を示しました。

最も難しいスキルは、製品が1ヶ月後にどのような姿になるかを定義することです。ここには大きな不確実性があります:その期間内にモデルの能力がどう変化するのか?ユーザーの行動はどのように変化するか?

**

ちょうどよい程度の AGI(人工汎用知能)信仰を持つことは非常に難しいです。

(“It is very hard to be the right amount of AGI pilled.”)**

Cat によると、誰もがその究極の未来を想像できます:モデルが極めて賢く何でもこなせ、入力ボックスに何を望むか伝えるだけで、自らあらゆるツールにアクセスしてタスクを完了します。**これが AGI(人工汎用知能)の製品形態です。

しかし問題は、その究極版のために製品を作ることほど容易なことはないということです。難しいのは、現在のモデルの能力境界がどこにあるかを明確にし、その境界内で最大限の価値を引き出すことです。 AGI pilled(AGI 信仰)が強すぎると目の前のユーザーのペインポイントを見失い、保守的すぎると次のモデルアップグレード時に手違いを起こします。

最高の PM は一つのシグナルを見抜きます:ユーザーが既存製品の限界をどのように突破するか。彼らはこれらのシグナルから方向性を判断し着実に進めつつ、モデルの能力が予想を上回ったり下回ったりした場合でも柔軟にルートを変更します。

Cat 自身のアプローチは、時間の 30%を故意に Cowork を限界まで押しやることに費やし、モデルと対話して、なぜ特定のタスクでエラーが発生するのかを解明することに充てています。

11. モデルがまだ理解していないこと

image
image

Lenny は質問します:「モデルが超賢くなる前に、人間の脳はどの領域でまだ有用なのか?」

Cat 的回答指向常識とEQ。任何一次产品发布都有一千个细碎环节,模型还不能很好地判断谁是关键的利益相关方、他们之间的关系、他们的偏好、应该用什么沟通场合让他们保持在状态里。这种隐性的人际判断仍然是人的领地。她相信模型会越来越擅长这些,但目前缺口还在。

12. P0(最高優先度事故)到 P0000:混乱中怎么保持理智

image
image

Lenny 问如何在这种节奏下保持理智。Cat 笑着说他们的团队都是享受混乱的人。面对每一个挑战都带着笑容,因为如果你对任何事情太紧张,就会燃尽。

她给了一个很有画面感的描述:周日晚上出了一个 P0(最高優先度事故),周一又来一个 P0,周一下午来了个 P0000,“你会想,天啊,我居然还为周日那个 P0 担心过。”

她的应对方式很实际:承认你能做的事有限,睡好觉才能第二天做好决策,暴力排优先级,允许产品不够完美。有些发布确实不够打磨,但只要不影响核心场景,就接受它,等反馈,下个版本修。

13. 速度的代价:功能重叠,用户困惑

image
image

Lenny 问为了速度牺牲了什么。Cat 说最大的代价是产品一致性。

传统做法是仔细规划产品套件里每个产品的关系、每个产品的场景、它们怎么整合。现在 Anthropic 有时候会同时推出功能重叠的东西,因为内部有两种方案都不错,他们想让外部用户来告诉他们哪个更好。

代价是新用户可能不知道完成某件事的最佳路径是什么。她承认需要做更多教育工作来帮用户理解核心功能和最佳实践。

14. Anthropic 为什么能赢:使命和聚焦

image
image

Cat 说了两个因素。

第一是统一使命。 Anthropic 招的是最在意“把安全 AGI(人工知能の一般化)带给全人类”的人,这个使命在产品决策中被频繁引用。因为使命高于任何单个产品线,跨组织决策可以非常快,执行可以高度统一。

Cat 特别强调了使命的具体含义:它意味着团队愿意做出牺牲自身目标和 KR(成果指標)的决策,来服务 Anthropic 整体的目标和 KR,而且人们很乐意做这种取舍。

**

使命意味着团队愿意做出伤害自己目标和 KR 的牺牲,来服务 Anthropic 的整体目标和 KR。

(“Mission means that teams are willing to make sacrifices that hurt their own goals and their own KRs in service of Anthropic's goals and Anthropic's KRs.”)

15. Claude Code、Desktop、Cowork:什么时候用哪个

image
image

这部分 Cat 给了一个清晰的分类。

  • CLI(コマンドラインインターフェース):最强大的,功能通常最先在这里上线。适合随手启动一个编程任务,需要最新最全功能的时候用。
  • Desktop 版:适合做前端开发。Cat 经常打开预览窗格,一边和 Claude 聊天一边实时看自己在构建的 Web 应用。
  • Web 和移动端:适合不在电脑前的时候。走在路上有个想法,掏出手机就能启动任务。
  • Cowork:处理非代码输出——回完 Slack 消息、做一个客户会议的 slide deck、写一份功能目标文档。

Cat 特别提到,要让 Cowork 发挥最大作用,第一步是连接所有相关数据源**:Google Calendar、Slack、Gmail、Google Drive。只有 Cowork 能访问到足够的上下文,它才能给出高质量的输出。

16. 自定义应用:每个人的个人 SaaS(Software as a Service)

image
image

Cat 讲了一个例子。Claude Code 销售团队里有个人,发现自己反复做同样类型的演示文稿。他用 Claude Code 做了一个 web 应用,内置了效果好的 deck 模板,可以从 Salesforce 和 Gong 拉取客户数据,自动生成针对特定客户的定制 deck,比如会标注这个客户是用 Bedrock 还是 Claude Code for Enterprise,对应不同的功能集。

17. Token(トークン)花费在涨,但仍低于薪资

image
image

Lenny 提到一个热门话题:token 花费超过员工薪资。Cat 确认了趋势但没给具体数字。她说每次模型升级或产品大幅改进后,人们会把更多任务交给 AI,花更多时间在 Claude Code 和 Cowork 里,单个工程师或知识工作者的 token 成本确实在增长。但目前仍然远低于工程师薪资,只是占比在持续上升。

18. Claude 的性格是护城河

image
image

CatはClaudeの核心的な差別化要因の一つが性格(personality)であると語った。ユーザーからは「リラックスして楽しく、かつ非常に有能に感じられる」という意見が頻繁に寄せられている。

特に彼女は以下の2つの性格的特徴を挙げた。

  • 低エゴ(Low ego):Claudeが間違っていると指摘すると、「ああ、教えてくれてありがとう、直してみるね」と言い訳せずに修正する。
  • 前向きでポジティブ:手がかりのないように見えるタスクに直面した際、Claudeは「大丈夫です。こんな感じで始められると思いますよ。まずは私が手を動かしましょうか?」と声をかける。

Catはこれを同僚との関係に例えている。これまで一緒に仕事をした人々を振り返れば、必ず「この人のエネルギーは素晴らしい」と感じる人がいるはずだ。Claudeが目指すのは、まさにそのような同僚である。

19. 製品ビジョン:単一タスクからエージェント・マトリックスへ

image
image

Catは長期ロードマップを「ビルディングブロック(building blocks)」で説明している。中核となる構成要素は単一タスクの成功率だ。明確なプロンプト(prompt)を与えたとき、それが常に許容範囲内の出力を生成できるかどうか。

モデルが強化されるにつれて単一タスクの成功率が上昇し、ユーザーは自然とマルチタスク並列処理を始めるようになる。2025年末にはマルチコーディング(multi-coding)が大きなトレンドとなり、現在ではさらに一般的になっている。

Catの推論はこうだ。1つのタスクが成功すれば、次は6つのタスクを同時に実行する。さらに先では、おそらく50のClaude、あるいは100以上のClaudeを同時に稼働させることになる。このロードマップは単独運用からエージェント・マトリックス(Agent matrix)へと移行していく。

20. スピードループ:クライミング、Waymo、そして一万の巨石がある引退後の生活

image
image

Catは以下の2冊の本を推薦している。

  • 『How Asia Works』:持続可能な成功を収める経済体を生み出すための政策と政府の在り方について論じている。
  • 『The Technology Trap』:過去の技術革命(産業革命、コンピュータ革命)が労働者に与えた影響について述べている。

両書とも、彼女が現在経験しているAI変革と直接的に関連している。

最も好きなプロダクトはWaymoで、毎日通勤で2回利用している。お気に入りの映画・ドキュメンタリーはF1ドキュメンタリー『Drive to Survive』とクライミングドキュメンタリー『Free Solo』だ。Catは、人が純粋なエンジニアリングの目標に極限まで集中している様子を見るのが好きだと語っており、この嗜好がAnthropicで働いている理由の一端を説明している。

もし将来仕事をしなくても?と問われると、フランスのフォンテーヌブローに引っ越すかもしれないと答えた。そこには一万もの巨石があり、毎日クライミングを楽しめるという。また、現在の週0.5冊から1〜2冊へ読書量を増やしたいとも語った。

Q&A サマリー

image
image
  • AnthropicのPM(Product Manager)チームはどのくらい規模が大きいか? 約30〜40人で、リサーチ(research)、デベロッパープラットフォーム(developer platform)、Claude Code、エンタープライズ(enterprise)、グロース(growth)の5つのチームに分かれている。
  • PMは依然としてPRD(Product Requirements Document)を書く必要があるか? ほとんどの機能では不要だ。毎週のメトリクス・リードアウト(metrics readout)とチームの原則が通常のPRDに代わっている。特に曖昧な場合や大規模なインフラ投資が必要なプロジェクトには、依然として1ページ分のPRDが残っている。
  • AnthropicはMythosモデルを使って内部開発を加速させたか? 役には立っているが、中核的な理由ではない。速度は主にプロセスとチーム文化から生まれている。
  • Claude Codeのソースコード漏洩事件後、関係者は解雇されたか? いいえ。Catはこれを「プロセスの失敗」と位置づけ、防護策を強化済みだと説明した。
  • Claude CodeとCoworkの使い分けは? コード出力が必要な場合はClaude Codeを、ドキュメントやプレゼン資料(deck)、メール処理などの非コード出力が必要な場合はCoworkを使う。

エディターズノート:注目すべき3つの矛盾

image
image

今回のインタビューは全体的に非常に友好的な対話であり、Lennyは敏感な話題を深く追及せず、Catも対応を適切にコントロールしていた。しかし、いくつかの興味深い矛盾が注目される。

第一に、スピード文化と安全へのコミットメントの間のギャップである。 Catは「1日に1つの機能をリリースする」「リリースのコミットメントを減らす」「エンジニアに自主的なリリースを任せる」といったスピード文化について多くの篇幅を割いているが、Anthropicは同時に「安全」を社名のように掲げるAIラボでもある。1週間の間に2回の情報漏洩(Mythos CMSの誤設定とClaude Codeのソースコードsource map)が発生したが、Catの説明はどちらも「人的ミスであり、防護策を強化した」というものだった。この2つの失敗の性質は単一のPR(Pull Request)の範囲をすでに超えている。スピード文化自体がこうしたリスクを悪化させていないかについて、彼女は全く反省を示していない。

第二に、オープンエコシステムとウォールドガーデン(围墙花园)の間の取舍である。 CatのOpenClawに関する説明は経済的な論理において妥当だ。月額200ドルのサブスクリプションユーザーがエージェント・フレームワーク(Agent framework)を通じて数千ドル相当の計算リソースを消費する可能性があるためである。しかし、タイムライン上の偶然は無視しにくい。Anthropicは自社製品Coworkに類似機能をリリースした後、初めてサードパーティ製ツールのサブスクリプションチャネルを封じた。OpenClaw創設者Peter Steinbergerの「まず人気機能をクローズドなharness(枠組み)にコピーし、その後オープンソースを締め出す」という批判に対し、Catはインタビューで正面から応答しなかった。Boris Chernyが「私たちはオープンソースの大きなファンだ」と言いながらOpenClawのパフォーマンス改善PRを提出したという行動と、実際のポリシーとの温度差は、おそらくポリシー自体よりも考察に値するだろう。

第三の矛盾は、CatによるPM(Product Manager)の役割に関する記述の中に潜んでいる。 彼女は「役割の融合」でPMの未来を説明しているが、自身が提示する最も効率的な模式は、エンジニアがユーザーフィードバックからリリースまでの全プロセスをエンドツーエンドで完了し、「PMの関与はほぼ不要」とするものだ。これが本当なら、PMの価値とは一体どこにあるのか?Catの答えはproduct taste(プロダクトテイスト)だが、この概念は会話全体を通じて抽象的なレベルに留まり、具体的な定義や評価基準は一切提示されていない。一つの選別基準が明確に記述できない場合、それは検証不可能なハードルになりやすい。さらに、彼女によるAGI pilled(AGI志向の/AGIに特化した)に関する記述には、より深いパラドックスが内包されている。もしモデルが十分に強力であればテキストボックス1つで十分なら、彼女が行っているプロダクト作業は本質的に過渡的なものとなる。自分の仕事に賞味期限があることを認めるプロダクト責任者の、この率直さは稀である。

次に注目すべき信号は、Anthropicが約束した安全防護策が実際に機能するかどうか、OpenClaw封鎖後のデベロッパーエコシステムの動向、そしてこの「永久beta」のresearch preview(研究プレビュー)モードがどれほど持続可能か、そしてユーザーの忍耐限度に上限があるかどうかである。

原始動画:https://www.youtube.com/watch?v=PplmzlgE0kg

原文を表示

Cat Wu 是 Anthropic Claude Code 和 Cowork 的产品负责人,和 Boris Cherny 搭档,带着团队把产品功能的交付周期从半年压到了一天。在 Lenny's Podcast 最新一期中,Cat 聊了 Anthropic 内部的速度文化、PM 角色的剧变、源代码泄露的善后,以及那个让开源社区炸锅的 OpenClaw 封堵决定。

**

原始视频:https://www.youtube.com/watch?v=PplmzlgE0kg

要点速览

AI PM 从路线图到发布加速器的手绘信息图
AI PM 从路线图到发布加速器的手绘信息图
  • 大多数 PM 候选人仍然在用 6-12 个月路线图的思维找工作,Anthropic 的节奏是一周甚至一天发布一个功能
  • Claude Code 团队几乎所有 PM 都有工程背景或直接写代码,设计师也曾是前端工程师
  • Anthropic 用 research preview 机制降低发布承诺,让工程师可以端到端完成从想法到发布的全流程
  • Cat 花 30% 的时间故意把 Cowork 推到极限,和模型对话搞清楚它为什么犯错
  • Claude Code 源代码泄露经过两层人工审查仍然漏过,Cat 定性为流程失败
  • 封堵 OpenClaw 使用订阅配额的决定,Cat 从容量管理角度解释,但回避了“先复制功能再封堵”的争议
  • Anthropic 成功的核心:统一使命让团队愿意牺牲自己的 KR 去服务公司整体目标

1. 与 Boris Cherny 搭档:80% 心灵感应,20% 各干各的

Cat 和 Boris 的 80% 心灵感应协作图
Cat 和 Boris 的 80% 心灵感应协作图

Lenny 开场就问 Cat 和 Boris 是怎么分工的。Boris 是 Claude Code 的创造者和技术负责人,在播客界已经是明星级人物,Lenny 说他的那期节目是播客史上最受欢迎的一集。

Cat 说自己和 Boris 的关系用 “80% mind-meld” 来形容。Boris 擅长的是方向感,他会说三个月后、六个月后产品应该长什么样,那个最 AGI pilled 的版本是什么。Cat 的角色则是把这个愿景翻译成执行路径**:从现在到那个愿景之间,每一步怎么走?同时她花更多时间在跨职能协调上,确保市场、销售、财务、容量等团队都认同计划,不会在功能准备好之后才发现有障碍。

剩下的 20%,是各自特别在意的事情。Cat 会主导自己更关心的事,Boris 也一样,谁更在意谁就推。这种模糊分工在外面看起来不太正统,但 Cat 觉得正是因为模糊,才能快。

编者注: Boris Cherny 是 Anthropic Claude Code 技术负责人,也是 O'Reilly 出版的《Programming TypeScript》一书的作者。他在 2024 年 9 月加入 Anthropic 后构建了 Claude Code 的第一个终端原型。AGI pilled 源自互联网俚语 red pilled(出自电影《黑客帝国》),指对 AGI 即将到来持极其乐观甚至狂热的态度。在 AI 行业内部,这个词既有正面含义(敢于为更强的模型设计产品),也有警告意味(可能脱离当下模型的实际能力)。

2. 面试几百个 PM 后的发现:大多数人还活在旧世界

旧世界 PM 与 AI 原生 PM 的对比图
旧世界 PM 与 AI 原生 PM 的对比图

Lenny 提到一个有趣的现象:想去 Anthropic 当 PM 的人多到他快收到三十亿美元 ARR 的“介绍费”了。Cat 面试了几百人,她觉得大多数人对 AI PM 角色的理解方向不对。

问题出在哪?Cat 认为 AI 出现之前,技术变化很慢,你可以做 6-12 个月的规划。代码写起来很贵,所以 PM 的核心工作是协调各团队的路线图,确保大家的功能互相解锁。这套打法在旧世界是对的。

但现在,模型能力在快速提升,AI 大幅加速了工程效率,很多产品功能的交付时间从 6 个月变成了 1 个月,有时候 1 周,甚至 1 天。在这个节奏下,PM 不应该把精力花在多季度路线图的跨团队对齐上,而应该想:怎么找到最快的方式把东西推出去?怎么让工程师有个想法、周末就能送到用户手里?

最好的 AI 产品 PM,能缩短从“有这个想法”到“产品到了用户手里”的时间,并且能定义出产品必须在哪些任务上开箱即用。

(“The PMs who do the best on AI native products are the ones who can figure out: How can I shorten the time from having this idea to actually getting the product in the hands of users.”)

3. 怎么做到一天出一个功能

一天发布一个功能的流水线信息图
一天发布一个功能的流水线信息图

Lenny 追问具体怎么做到这么快。Cat 讲了三件事。

第一件是设定清晰目标。 因为大语言模型能力太通用,用户是谁、解决什么问题、核心场景是什么,全都模糊。好的 PM 能把这些定死:我们的核心用户是企业里的专业开发者,这个功能要解决权限提示太多导致的疲劳感,目标是让企业开发者安全地做到零权限提示。这个目标一旦清楚,就排除掉了大量不相关的方案。

第二件是 research preview 机制。 Claude Code 几乎所有功能都先以研究预览的形式发布。明确告诉用户:这是早期产品、只是一个想法、我们在收集反馈、这个功能可能不会永远支持。这降低了发布门槛,一两周就能把东西推出去。

第三件是搭建跨职能的快速反应流水线。 Cat 的团队有一个叫 “evergreen launch room” 的机制。工程师觉得功能准备好了、内部也试用过了,就把它发到这个频道里。负责文档的 Sarah、负责产品市场营销的 Alex、开发者关系的同事会直接跳进来,第二天就能完成对外宣传。这套流程跑顺了之后,任何工程师想发布功能都没有摩擦。

Cat 说得很明确:搭建这套发布流水线,就是 PM 该干的事。

编者注: Anthropic 的发布节奏有多快?有人做过一个日历,发现 Anthropic 在 2026 年前几个月几乎每天都有一个重要功能或产品发布。

4. PRD 没死,但活法不同了

PRD 新活法的信息图
PRD 新活法的信息图

Lenny 问 PRD 还写不写。Cat 说他们做了两件替代的事。

第一是每周做严格的 metrics readout,整个团队一起看数据,确保每个人都深度理解业务的各个面、关键目标、趋势和驱动因素。

第二是维护一份 team principles,包括谁是核心用户、为什么是他们、愿意做什么取舍。这份原则的目的是让团队每个人都能自己做决策,不需要等 PM 或其他利益相关方来拍板。

PRD 并没有完全消失。对于特别模糊的功能,Cat 还是会写一页纸,列出目标、理想场景、当前失败模式。需要大量基础设施投入的长期项目也仍然有 PRD。但大部分功能不需要。

5. 不是 Mythos 让他们变快的

Mythos 与组织速度来源的对比图
Mythos 与组织速度来源的对比图

Lenny 注意到 Anthropic 还没正式发布的 Mythos 模型引发了外界的关注,问他们内部是不是在用这个模型来加速开发。

Cat 的回答很直接:他们已经快了好几个季度了,Mythos 不是核心原因。 Mythos 很强大,他们确实在内部使用模型,这多少加速了开发,但不足以解释速度提升的主要部分。更大的原因是流程和团队的期望设定:每个人都觉得自己有权力也有责任把想法在一周内变成现实。

编者注: Mythos(内部代号 Capybara)是 Anthropic 的最新前沿模型,2026 年 4 月 7 日以研究预览形式限量发布,主要用于 Project Glasswing 网络安全项目。最初在 3 月 26 日因 CMS 配置错误提前曝光,Fortune 等媒体拿到的草稿描述它是一款比 Opus 更大、更强的模型。Anthropic 称该模型在代码、推理和网络安全方面能力大幅超越此前所有模型,已发现数千个零日漏洞。

6. 源代码泄露:定性为流程失败

Claude Code 源码泄露流程失败图
Claude Code 源码泄露流程失败图

2026 年 3 月底,Claude Code 的完整源代码通过 npm 包泄露。Lenny 问 Cat 发生了什么。

Cat 说他们第一时间就去查了。原因是人为错误,有人在用 Claude 写一个关于包发布流程更新的 PR,这个 PR 经过了两层人工审查,但还是漏了。他们已经加固了流程,确保不会再发生。

Lenny 追问了一个尖锐的问题:这个人还在 Anthropic 吗?Cat 的回答很干脆:还在。这是流程失败,最重要的是学习教训、加强防护。

编者注: 泄露的根本原因是 Claude Code 使用 Bun 运行时构建,Bun 默认生成 source map 文件,而 .npmignore 中缺少 *.map 条目,导致一个 59.8 MB 的 source map 文件被发布到公共 npm 注册表,暴露了约 2,000 个文件、512,000 行 TypeScript 源代码、44 个未公开的功能标志,以及一个名为 KAIROS 的自主后台 Agent(从泄露的代码中发现的未发布功能,能让 Claude 在后台持续运行,甚至在用户空闲时做“记忆整理”)。这已经是 13 个月内的第二次代码泄露,而且发生在 Mythos 模型信息因 CMS 错配泄露后仅 5 天。对于一家以“安全优先”为品牌定位的公司来说,一周内两次泄露引发了外界对其运营安全的质疑。

7. 封堵 OpenClaw:容量管理还是生态围墙?

OpenClaw 容量管理与生态围墙张力图
OpenClaw 容量管理与生态围墙张力图

Lenny 问到了另一个争议话题:Anthropic 禁止订阅用户通过第三方工具(特别是 OpenClaw)使用 Claude。开源社区反应很大。

Cat 的解释是:Claude 的需求量很大,他们一直在努力扩展基础设施,同时也在优化 harness 的 token 效率。订阅计划不是为第三方产品的使用模式设计的,这类产品给系统带来了不成比例的压力。他们花了很多时间想最平滑的过渡方案,最终决定给每个用户随订阅附赠一些额度,但核心决策是优先保障自有产品和 API。

我们确实需要做出一个艰难的决定,优先保障我们的第一方产品和 API。

(“We did have to make the hard decision that we needed to prioritize our first-party products and our API.”)

编者注: Cat 的回答只覆盖了这个争议的一个面。完整的时间线是这样的:OpenClaw(原名 Clawdbot,2026 年 1 月因 Anthropic 担心商标混淆改名)是奥地利开发者 Peter Steinberger 创建的开源 AI Agent 框架,在 2026 年初迅速走红,GitHub 累计 24.7 万颗星,是开源史上增长最快的项目之一。2 月 14 日,Steinberger 宣布加入 OpenAI,OpenClaw 移交开源基金会。2 月 20 日,Anthropic 更新条款明确禁止订阅 OAuth token 用于第三方工具。3 月底 Anthropic 自己的 Cowork 上线了 Claude Dispatch 等功能,和 OpenClaw 最受欢迎的能力高度重合。4 月 4 日正式封堵生效,给用户的通知不到 24 小时。Steinberger 批评 Anthropic“先复制热门功能到自己的封闭 harness 里,再把开源锁在门外”。Boris Cherny 则在 X 上表示团队“是开源的大粉丝”,他本人还给 OpenClaw 提交过改善提示缓存效率的 PR。这些举动和实际政策之间的温度差,用户感受得到。一个 $200/月的 Max 订阅用户如果通过 OpenClaw 跑全天自主 Agent,可能消耗相当于 $1,000-$5,000 的 API 成本,从经济角度看 Anthropic 的决定有合理性。但这个决定的时间节点和 Cowork 功能扩展的巧合,仍然是社区争议的核心。

8. PM 团队的全貌

Anthropic PM 团队分布地图
Anthropic PM 团队分布地图

Cat 说 Anthropic 大约有 30-40 名 PM,分布在几个团队:

  • 研究 PM 团队:负责收集客户对模型的反馈并推动模型发布
  • Claude 开发者平台团队:维护 API 和 Managed Agents 等服务
  • Claude Code 团队:做核心产品
  • 企业团队:负责安全控制、成本管控、RBAC(基于角色的访问控制)等让大企业安心使用的功能
  • 增长团队:负责整个产品套件的增长

9. 角色融合:工程师、PM、设计师的界限在消失

工程师 PM 设计师角色融合维恩图
工程师 PM 设计师角色融合维恩图

Lenny 问了那个所有 PM 都在焦虑的问题:PM 未来还需要吗?

Cat 的观察是所有角色都在融合。PM 在写代码,工程师在做产品决策,设计师在做 PM 的活也在提交代码。她说有两条路可以走:要么大量招有产品品味的工程师,要么维持工程师数量不变、多招 PM 来引导。Anthropic 选的是前者——大量招有产品品味的工程师。

她说团队里很多工程师完全能独立完成从“在 Twitter 上看到用户反馈”到“周末发布功能”的全流程,几乎不需要 PM 参与。这是最高效的模式。

当代码变得越来越便宜,真正变得更有价值的是决定写什么。

(“As code becomes much cheaper to write, the thing that becomes more valuable is deciding what to write.”)

Cat 自己就是工程师出身。她之前在 Scale AI 做产品工程师,在 Dagster Labs 做工程经理,然后去了 Index Ventures 做风投。团队里几乎所有 PM 要么曾经是工程师,要么在 Claude Code 上直接写代码。设计师也都做过前端工程师。

那工程背景为什么在当下特别有用?Cat 解释说,如果你有工程背景,你能判断一件事应该有多难。如果很简单,别讨论了,花一小时做掉;如果很难,你提前知道成本,就能更准确地排优先级。

不过她还是认为,不管什么背景,最核心的能力是 product taste(产品品味)。

Product taste 仍然是一种非常稀缺的技能,任何能强有力地展示这种能力的人,我们基本都会录用。

(“Product taste is still a very rare skill to have, and we'll pretty much hire anyone who we feel has demonstrated this strongly.”)

10. “恰好正确程度的 AGI 信仰”

恰好正确的 AGI 信仰仪表图
恰好正确的 AGI 信仰仪表图

谈到 PM 需要什么新技能,Cat 给出了全场最有洞察力的回答。

最难的技能是定义产品一个月后应该长什么样。这里面的模糊性很大:模型的能力在那个时间范围内会变成什么样?用户行为又会如何改变?

做到恰好正确程度的 AGI 信仰非常难。

(“It is very hard to be the right amount of AGI pilled.”)

Cat 说,每个人都能看到那个终极未来:模型极其聪明,什么都能做,你只需要一个输入框告诉它你想要什么,它自己就能接入任何工具完成任务。这就是 AGI 的产品形态。

但问题是,为那个终极版本做产品太容易了。难的是搞清楚当前模型的能力边界在哪,怎么在这个边界内榨出最大价值。 太 AGI pilled 会让你忽略眼前用户的痛点,太保守又会在下一次模型升级时措手不及。

最好的 PM 能看到一种信号:用户如何突破现有产品的极限。他们能从这些信号里判断方向,稳步推进,同时在模型能力超出或低于预期时灵活调整路线。

Cat 自己的做法是把 30% 的时间花在故意把 Cowork 推到极限,和模型对话,搞清楚它为什么在某些任务上犯错。

11. 模型暂时还不懂的东西

模型暂时不懂的人际隐性地图
模型暂时不懂的人际隐性地图

Lenny 问:在模型变得超级聪明之前,人脑在哪些地方还有用?

Cat 的回答指向常识和情商。任何一次产品发布都有一千个细碎环节,模型还不能很好地判断谁是关键的利益相关方、他们之间的关系、他们的偏好、应该用什么沟通场合让他们保持在状态里。这种隐性的人际判断仍然是人的领地。她相信模型会越来越擅长这些,但目前缺口还在。

12. P0 到 P0000:混乱中怎么保持理智

P0 到 P0000 的优先级混乱图
P0 到 P0000 的优先级混乱图

Lenny 问如何在这种节奏下保持理智。Cat 笑着说他们的团队都是享受混乱的人。面对每一个挑战都带着笑容,因为如果你对任何事情太紧张,就会燃尽。

她给了一个很有画面感的描述:周日晚上出了一个 P0(最高优先级事故),周一又来一个 P0,周一下午来了个 P0000,“你会想,天啊,我居然还为周日那个 P0 担心过。”

她的应对方式很实际:承认你能做的事有限,睡好觉才能第二天做好决策,暴力排优先级,允许产品不够完美。有些发布确实不够打磨,但只要不影响核心场景,就接受它,等反馈,下个版本修。

13. 速度的代价:功能重叠,用户困惑

速度带来的功能重叠与用户困惑图
速度带来的功能重叠与用户困惑图

Lenny 问为了速度牺牲了什么。Cat 说最大的代价是产品一致性。

传统做法是仔细规划产品套件里每个产品的关系、每个产品的场景、它们怎么整合。现在 Anthropic 有时候会同时推出功能重叠的东西,因为内部有两种方案都不错,他们想让外部用户来告诉他们哪个更好。

代价是新用户可能不知道完成某件事的最佳路径是什么。她承认需要做更多教育工作来帮用户理解核心功能和最佳实践。

14. Anthropic 为什么能赢:使命和聚焦

使命和聚焦如何加速组织决策的信息图
使命和聚焦如何加速组织决策的信息图

Cat 说了两个因素。

第一是统一使命。 Anthropic 招的是最在意“把安全 AGI 带给全人类”的人,这个使命在产品决策中被频繁引用。因为使命高于任何单个产品线,跨组织决策可以非常快,执行可以高度统一。

Cat 特别强调了使命的具体含义:它意味着团队愿意做出牺牲自身目标和 KR 的决策,来服务 Anthropic 整体的目标和 KR,而且人们很乐意做这种取舍。

使命意味着团队愿意做出伤害自己目标和 KR 的牺牲,来服务 Anthropic 的整体目标和 KR。

(“Mission means that teams are willing to make sacrifices that hurt their own goals and their own KRs in service of Anthropic's goals and Anthropic's KRs.”)

15. Claude Code、Desktop、Cowork:什么时候用哪个

Claude Code Desktop Web Mobile Cowork 产品入口地图
Claude Code Desktop Web Mobile Cowork 产品入口地图

这部分 Cat 给了一个清晰的分类。

  • CLI(命令行版):最强大的,功能通常最先在这里上线。适合随手启动一个编程任务,需要最新最全功能的时候用。
  • Desktop 版:适合做前端开发。Cat 经常打开预览窗格,一边和 Claude 聊天一边实时看自己在构建的 Web 应用。
  • Web 和移动端:适合不在电脑前的时候。走在路上有个想法,掏出手机就能启动任务。
  • Cowork:处理非代码输出——回完 Slack 消息、做一个客户会议的 slide deck、写一份功能目标文档。

Cat 特别提到,要让 Cowork 发挥最大作用,第一步是连接所有相关数据源:Google Calendar、Slack、Gmail、Google Drive。只有 Cowork 能访问到足够的上下文,它才能给出高质量的输出。

16. 自定义应用:每个人的个人 SaaS

每个人的个人 SaaS 自动化流程图
每个人的个人 SaaS 自动化流程图

Cat 讲了一个例子。Claude Code 销售团队里有个人,发现自己反复做同样类型的演示文稿。他用 Claude Code 做了一个 web 应用,内置了效果好的 deck 模板,可以从 Salesforce 和 Gong 拉取客户数据,自动生成针对特定客户的定制 deck,比如会标注这个客户是用 Bedrock 还是 Claude Code for Enterprise,对应不同的功能集。

17. Token 花费在涨,但仍低于薪资

Token 成本上涨但仍低于薪资的图表
Token 成本上涨但仍低于薪资的图表

Lenny 提到一个热门话题:token 花费超过员工薪资。Cat 确认了趋势但没给具体数字。她说每次模型升级或产品大幅改进后,人们会把更多任务交给 AI,花更多时间在 Claude Code 和 Cowork 里,单个工程师或知识工作者的 token 成本确实在增长。但目前仍然远低于工程师薪资,只是占比在持续上升。

18. Claude 的性格是护城河

Claude 性格护城河特质卡
Claude 性格护城河特质卡

Cat 说 Claude 的一个核心差异化是性格。用户经常提到 Claude 让人觉得“轻松有趣但又极其能干”。

她特别提到两个性格特点:

  • 低 ego:你告诉 Claude 它做错了,它会说“哎呀,谢谢你告诉我,我来修”,而不是辩解。
  • 积极正面:当你面对一个看起来无从下手的任务,Claude 会说“没关系,我觉得我们可以这样开始,要我先帮你动手吗?”

Cat 把这比作同事关系。回想你合作过的所有人,总有一些人让你觉得他们的能量特别好。Claude 的目标就是做那种同事。

19. 产品愿景:从单任务到 Agent 矩阵

从单任务到 Agent 矩阵的路线图
从单任务到 Agent 矩阵的路线图

Cat 用 “building blocks” 来描述长期路线。核心构建单元是单个任务的成功率:你给一个清晰的 prompt,它能不能持续产出可接受的输出?

随着模型变强,单任务成功率上升,用户自然开始做多任务并行。2025 年底 multi-coding 成了大趋势,现在更加普遍。

Cat 的推演是:一个任务成功了,然后六个任务同时做。再往后,也许同时跑 50 个 Claude,或者上百个。这条路线从单兵作战走向 Agent 矩阵。

20. 闪电轮:攀岩、Waymo、和一万块巨石的退休生活

Cat Wu 兴趣偏好信号图
Cat Wu 兴趣偏好信号图

Cat 推荐了两本书:

  • 《How Asia Works》:讲的是什么样的政策和政府能造就持久成功的经济体。
  • 《The Technology Trap》:讲的是过去几次技术革命(工业革命、计算机革命)对工人的影响。

两本都和她正在经历的 AI 变革直接相关。

最喜欢的产品是 Waymo,每天坐两次通勤。最喜欢的影视是 F1 纪录片《Drive to Survive》和攀岩纪录片《Free Solo》。Cat 说她喜欢看人极度专注于一个纯粹的工程目标,这个偏好多少解释了她为什么会在 Anthropic。

如果有一天不用工作了?她说可能会搬到法国枫丹白露,那里有一万块巨石,每天攀岩。还想把阅读量从现在的每周 0.5 本提到一两本。

Q&A 速览

Q&A 速览便签信息图
Q&A 速览便签信息图
  • Anthropic 的 PM 团队有多大? 大约 30-40 人,分研究、开发者平台、Claude Code、企业和增长五个团队。
  • PM 还需要写 PRD 吗? 大部分功能不需要。每周 metrics readout 和 team principles 替代了常规 PRD。特别模糊或需要大量基础设施投入的项目仍然有一页纸的 PRD。
  • Anthropic 用 Mythos 模型加速内部开发了吗? 有帮助但不是核心原因。速度更多来自流程和团队文化。
  • Claude Code 源代码泄露后相关人员被开除了吗? 没有。Cat 定性为流程失败,已加固防护措施。
  • 什么时候用 Claude Code 什么时候用 Cowork? 需要代码输出用 Claude Code,需要非代码输出(文档、deck、邮件处理)用 Cowork。

编辑手记:三个值得关注的矛盾

编辑手记的三个矛盾张力图
编辑手记的三个矛盾张力图

这期访谈整体是一次相当友好的对话,Lenny 没有在敏感话题上深追,Cat 也把控得很好。但几个有意思的矛盾值得关注。

第一个是速度文化和安全承诺之间的缝隙。 Cat 用了大量篇幅讲“一天出一个功能”“降低发布承诺”“让工程师自主发布”的速度文化,但 Anthropic 同时是那家把“安全”写在公司名片上的 AI 实验室。一周内两次信息外泄(Mythos CMS 错配 + Claude Code 源码 source map),Cat 的解释都是“人为失误,已加防护”。这两次失误的性质已经超出了单个 PR 的范围。对速度文化本身是否加剧了这类风险,她没有任何反思。

第二个是开放生态和围墙花园之间的取舍。 Cat 对 OpenClaw 的解释在经济逻辑上成立,一个 $200/月的订阅用户通过 Agent 框架可能消耗价值数千美元的算力。但时间线上的巧合很难忽略:Anthropic 在自己的 Cowork 产品推出了类似功能之后,才封堵了第三方工具的订阅通道。OpenClaw 创始人 Peter Steinberger 的批评“先复制热门功能到封闭的 harness 里,再把开源锁在门外”,Cat 在访谈中没有正面回应。Boris Cherny 一边说“我们是开源的大粉丝”一边给 OpenClaw 提交过改善性能的 PR,这些举动和实际政策之间的温度差,也许比政策本身更值得玩味。

第三个矛盾藏在 Cat 关于 PM 角色的论述里。 她用“角色融合”来描述 PM 的未来,但她自己给出的最高效模式是工程师端到端完成从用户反馈到发布的全流程,“几乎不需要 PM 参与”。如果这是真的,那 PM 的价值到底在哪?Cat 的答案是 product taste,但这个概念在整场对话中始终停留在抽象层面,没有给出任何可操作的定义或评估标准。当一个筛选标准无法被明确描述时,它很容易变成一个不可证伪的门槛。而她关于 AGI pilled 的论述暗含一个更深的悖论:如果模型足够强,一个文本框就够了,那她所做的产品工作本质上是过渡性的。一个产品负责人承认自己的工作有保质期,这种坦率不常见。

接下来值得观察的信号:Anthropic 承诺的安全防护措施是否真正起效,OpenClaw 封堵后开发者生态的走向,以及这套“永久 beta”的 research preview 模式能持续多久,用户的忍耐度有没有上限。

原始视频:https://www.youtube.com/watch?v=PplmzlgE0kg

この記事をシェア

関連記事

The Register AI/ML★42026年4月29日 02:18

IBM の AI コーディング支援ツール「Bob」が一般提供開始

IBM は、昨年から社内8万人でテストを実施したAIコーディングパートナー「Bob」のグローバル一般提供を発表し、生産性向上を実現したと主張している。

Vercel Blog★42026年4月24日 16:00

Vercel AI GatewayでGPT-5.5を提供開始

VercelはAIゲートウェイでGPT-5.5とGPT-5.5 Proを提供開始した。両モデルはコーディングや調査などの長時間エージェント作業向けに最適化され、トークン効率が向上している。

GitHub Changelog★42026年4月23日 01:38

VS Codeでの言語モデルキー持ち込み機能(BYOK)が利用可能に

VS CodeのCopilotビジネスユーザーは、言語モデルキー持ち込み(BYOK)機能を導入した。チームは自前のAPIキーで外部・ローカルモデルをチャットから利用可能になった。

ニュース一覧に戻る元記事を読む