Claude Cowork のリードエンジニアが AI をどう活用しているか(8 分読了)
Claude Cowork のリードエンジニアが、LLM を単なるチャットボットではなく、コード生成やリファクタリングを自動化する「自律的な同僚」として活用し、開発効率を劇的に向上させる具体的なワークフローとベストプラクティスを共有している。
キーポイント
AI を「同僚」としての役割定義
エンジニアは AI を単なる検索ツールではなく、コードレビューやリファクタリングを提案する自律的なパートナーとして位置づけ、対話を通じて共同作業を行うアプローチを採用している。
具体的な実装ワークフロー
複雑なタスクに対しては、まず AI に計画を立てさせ、段階的にコードを実行・検証する「プランニング→実行→フィードバック」のループを回すことで精度を高めている。
プロンプトエンジニアリングの重要性
曖昧な指示ではなく、コンテキスト(既存コードの文脈)や制約条件を明確に付与した高度なプロンプト設計が、AI の出力品質と信頼性を決定づける鍵となっている。
人間による最終確認の必要性
生成されたコードの安全性とアーキテクチャの整合性については、最終的に人間のエンジニアが厳格にレビューし、責任を持つ姿勢を強調している。
影響分析・編集コメントを表示
影響分析
この記事は、LLM を開発現場でどのように実装するかという「使い方の知見」を具体例と共に示しており、エンジニアリングチームの生産性向上に即座に応用可能な実践的ガイドラインを提供しています。特に、AI を単なるツールとしてではなく、対話型のパートナーとして捉えるマインドセットの転換が、技術導入の成否を分ける重要な要素であることを浮き彫りにしています。
編集コメント
AI ツールの導入において、技術的な機能よりも「人間と AI の協働関係(マインドセット)」をどう設計するかが重要であるという示唆に富む記事です。実務レベルでの具体的なプロンプト戦略やワークフローの知見は、開発チームの即戦力となり得ます。
Magic Patterns—製品のようなプロトタイプを提供
- Guru—真実の AI レイヤー
Anthropic の Claude Cowork および Claude Code Desktop のエンジニアリングリードである Felix Rieseberg が、Claire とともに、彼が実際に自身の生活や仕事で Claude をどのように活用しているかを紹介します。このエピソードでは、2D の間取り図から 3D のフロアプランナーを構築したり、メールを個人の在庫データベースとして利用したり、接続されたアプリからライブダッシュボードを作成したり、$20 のハードウェアで「Claude バディ」を組み上げたりする様子を詳しく解説します。また、AI からより多くの価値を引き出すための彼の哲学についても共有します:抽象化レイヤーを一つ上へ行き、Claude にバックグラウンドで作業させ、コンピュータが人生の些細な面倒な問題を解決できないと決めつけないことです。
- AI の普及における最大の障壁は、人々が AI にあらゆる問題を解決させることができることに気づいていないことです。フェリックスはこの状況を常に見ており、ツールは非常に強力ですが、ユーザーがそれらに手を伸ばすための筋肉記憶(マッスルメモリー)をまだ構築できていません。彼のアドバイス:何かクリエイティブではない面倒なことをしているときは、立ち止まって「これを Claude 代わりにやらせることはできないか」と自問してください。そのギャップは技術的なものではなく、心理的なものです。
- あなたのメールは、未開拓の個人データのための金鉱です。フェリックスは引っ越しの際に自分のメールを使って家具の在庫リストを作成しました:すべての購入領収書、すべての確認メール、すべての寸法を。Claude はそれらすべてを解析し、実際の家具を使った 3D フロアプランナーを構築してくれました。この同じ原則は、衣類、医療記録、旅行履歴、あるいは長年にわたって領収書や確認メールを送受信してきたあらゆる分野に適用されます。あなたはすでに構造化されたデータベースを持っています—Claude にそれを指し示すだけでよいのです。
- 抽象化のレイヤーを一つ上に行き、さらにその先へ進んでください。フェリックスは最初は家具の寸法を手動でフロアプランナーに入力していましたが、そこで立ち止まり、Claude に自分が持っている家具が何かを特定させるように頼みました。そしてさらに一歩進み、メールの中から家具を見つけるよう Claude に指示しました。これが鍵となるパターンです:面倒な作業をしている自分に気づくたびに、「これを Claude 代わりにやらせることはできないか」と自問してください。次に、「何をすべきかを自分で指示しなくても、Claude がそれをどう判断できるか」を自問してください。
- ライブアーティファクトは、個人用ダッシュボードを常に最新の状態に保つための Claude の答えです。静的なアーティファクトとは異なり、ライブアーティファクトは接続されたサービス(Spotify、Gmail、カレンダー、Notion、あなたが許可したその他のもの)からのリアルタイムデータで自動的に更新されます。フェリックスが構築したのは、2000 年代初頭のソフトウェアのような外観を持ち、一日中絶えず更新される個人用ダッシュボードです。決定的な機能は、ピッチデッキ、デイリーブリーフィング、あるいは個人的なレポートをもう手動で更新する必要がないことです。
- 本当に何を求めているか分からない場合は Opus を選択してください。フェリックスのモデル選定におけるヒューリスティック:問題が明確に範囲が定められていて具体的であれば Sonnet を使用します。Claude にあなたが言ったことではなく、実際にあなたが望んでいるものを解釈させる必要がある場合は Opus を使いましょう。「単位付きでフロアプランを作成して」という要求(Sonnet の領域)と、「私の人生をどう整理すればよいか教えてほしい」という要求(Opus の領域)の違いです。ほとんどのタスクでは Sonnet で十分ですが、問題の分解にさらに一層の深さが必要な場合は、Opus を使う価値があります。
- 子どもたちは AI を恐れないため、最高の AI ユーザーです。フェリックスは、親たちから送られてくる動画を見ています—Claude で子供たちが作成した、手描きのキャラクターを持つカスタムビデオゲームやインタラクティブなストーリー、数年前であればソフトウェアエンジニアを必要としたツールなどです。大人たちは 20 年間、「コンピュータができないこと」を学ぶという「心の牢獄」の中にいてきました。その学習を解きほぐすことが鍵となります。
- Claude がミスを犯したときは、モデルではなくワークフローをデバッグしてください。フェリックスは Claude を罵倒しません(チームが人々がそうするときに知っておくのは有用だと彼は指摘していますが)。代わりにこう尋ねます:「私が期待したのはこれです。どこで何が違ったのか、手順を追って説明してもらえますか?今後これを防ぐにはどうすればよいですか?」通常、解決策は「Claude はこれができない」ではなく、「プロンプトを変更する必要がある」「データソースを整理する必要がある」「事前実行(ドライラン)を設定する必要がある」というものです。Claude を壊れたツールとして扱うのではなく、より良い指示を必要とする協力者として扱ってください。
Magic Patterns—プロダクトのような見た目のプロトタイプを提供
- ThoughtSpot—AI 駆動の分析機能をプロダクトに組み込む
クレアは、Google I/O 2026 で発表された最大のローンチを解説します。Gemini 3.5 Flash や Antigravity 2.0、そして Google AI Studio、Omni、Flow、Stitch、Pomelliなどです。このエピソードでは、彼女はこれらのツールを実際にテストし、実際に機能するものについて共有するとともに、Google がどこで追いつき、どこで先行しているのか、またなぜ「ローンチから利用可能になるまでのギャップ」がビルダーにとって依然として大きな問題となっているのかを説明します。
- Gemini 3.5 Flash は、Google のベンチマークにおいて主要なフロンティアコーディングモデルと競合しながら、実行速度は4倍速い。Google はこれを、高い推論能力と迅速な実行の両方が必要なタスクに最適化されたエージェント型コーディングモデルとして位置付けている。もしベンチマークが実環境でも有効であれば、この速度優位性がコーディングエージェントの市場を Google のツールへとシフトさせる可能性がある。
- Antigravity 2.0 は、Google の IDE を Claude Code や Codex と機能面で同等にするものだが、後追いとなっている。今回のアップデートでは、プロジェクト(フォルダ制約ワークスペース)、Cron によるスケジュールタスク、特定のタスク用のサブエージェントが追加された。UI は Codex とほぼ同一で、提供される機能も Anthropic や OpenAI が数ヶ月前にリリースしたものと一致している。優位性は速度にある:Gemini 3.5 Flash の性能が実証されれば、開発者は迅速な納品が必要な範囲を限定したタスクに対して Antigravity を選択するかもしれない。
- /grill-me スラッシュコマンドは、Claude Code の丁寧な確認ツールに対する Antigravity の攻撃的なアプローチだ。優しく質問をするのではなく、/grill-me は要件を尋問し、あなたが構築しようとしているものの核心に迫ると約束する。これが実際によりハードコアなものなのか、単なる巧妙なブランディングに過ぎないのかは今後の次第だが、これは Google が個性で差別化を図ろうとする試みを示している。
- Google AI Studio は現在、Workspace アプリと直接統合されているはずだ(あるいはそうされるべきところ)。その約束とは、セットアップ不要で Sheets を読み込み、Gmail の下書きを作成し、Drive を整理し、カレンダーを確認できるノーコードアプリを構築できるというものである。Claire はテスト中にこれを動作させることができなかった。これが実現すれば、Google がデータレイヤーを既に支配している内部の企業向け生産性ユースケースやパーソナルアシスタントワークフローを独占することになる。
- Omni は Google の Sora に対する回答であり、より長く、本番環境品質の動画生成に焦点を当てている。このモデルは 10 秒間の動画を作成する(Sora の 6〜7 秒に対して)、編集Acrossでキャラクターの一貫性を維持し、会話形式での編集も可能にする。Claire は子供の描画をアニメーション化してテストしたが、その出力は印象的だった。真の威力が発揮されるのは、同じキャラクターやシーンを複数回反復して改良する本番ワークフローにおいてだろう。
- Flow は Omni を基盤とした本番環境向けの動画編集ツールだ。これを使えば、キャラクターを定義し、アバターを作成し、映画のような品質を保ちながら会話形式で動画を編集できる。このツールは、スケールした一貫性のある高品質な動画が必要なクリエイターやマーケターを対象としている。Claire は自分自身のアバター作成を試みたが、その機能は失敗した——これは I/O 発表全体を通じて繰り返されるテーマだった。
- Stitch と Pomelli は Google のデザインおよびマーケティングツールだ。Stitch はブラウザ内で動作する Figma のようなもので、ストリーミングによるデザイン生成、インライン AI 編集、コード同期を特徴とする。Pomelli は URL からブランドブック、キャンペーンアセット、ウェブサイトを生成する。両者とも有望だが、「Google slop(グーグルのゴミ)」と呼ばれる、AI 生成デザインの汎用的な美意識に悩まされている。
- Gemini のマルチモーダル能力は依然として最大の差別化要因だ。ファイルや動画に関わる作業、あるいはドキュメントから動画へ、画像からテキストへと異なるモダリティ間での変換を伴う作業においては、Gemini モデルが卓越している。Claire はこれを用いてポッドキャスト動画からのブログ記事生成や描画のアニメーション化を行っている。3.5 シリーズもこの強さを継承しており、これらのユースケースでは Gemini のマルチモーダル性能が最高水準である。
- 最大の課題は:機能の半分がまだ実際に動作していないことだ。Claire はテスト中に破損した機能、欠落している統合、「近日公開」の免責事項を随所で見つけた。AI Studio での Workspace 統合?アクセスできなかった。Flow でのアバター作成?動作しなかった。準備が整っていない機能を発表すると、人々は忍耐を失い、ロードマップへの信頼を失う。
- もしこれらのエピソードを楽しんでいただけたら、返信して、さらに詳しく知りたいことを教えてください:AI ワークフロー、採用、成長、製品戦略——何でも構いません。
来週お会いしましょう、
レニー
*P.S. 新しいエピソードを配信された瞬間に受け取りたいですか?お気に入りのポッドキャストアプリで「フォロー」してください。*
原文を表示
Brought to you by:Magic Patterns—Prototypes that look like your productGuru—The AI layer of truth
Felix Rieseberg, the engineering lead for Claude Cowork and Claude Code Desktop at Anthropic, joins Claire to show how he actually uses Claude in his own life and work. In this episode, Felix walks through building a 3D floor planner from a 2D house plan, using email as a personal inventory database, creating live dashboards from connected apps, and hacking together a $20 hardware “Claude buddy.” He also shares his philosophy for getting more out of AI: go one abstraction layer up, let Claude work in the background, and stop assuming computers can’t solve some of the annoying little problems in your life.
- The biggest barrier to AI adoption is people not realizing they can ask AI to solve almost any problem. Felix sees this constantly—the tools are incredibly powerful, but users haven’t built the muscle memory to reach for them. His advice: whenever you’re doing something annoying that doesn’t feel creative, pause and ask yourself if Claude could do it instead. The gap isn’t technical; it’s psychological.
- Your email is an untapped gold mine of personal data. Felix used his email to inventory all his furniture when moving houses: every purchase receipt, every confirmation, every dimension. Claude parsed it all and built him a 3D floor planner with his actual furniture. This same principle applies to clothing, medical records, travel history, or any domain where you’ve been emailing receipts and confirmations for years. You already have a structured database—you just need to point Claude at it.
- Go one abstraction layer up, then do it again. Felix started manually entering furniture dimensions into his floor planner, then stopped and asked Claude to figure out what furniture he had. Then he went another layer up and told Claude to find the furniture in his emails. This is the key pattern: every time you catch yourself doing tedious work, ask how Claude could do it instead. Then ask how Claude could figure out what to do without your telling it.
- Live artifacts are Claude’s answer to keeping your personal dashboards always up-to-date. Unlike static artifacts, live artifacts refresh with real-time data from your connected services—Spotify, Gmail, Calendar, Notion, whatever you’ve authorized. Felix built a personal dashboard that looks like early-2000s software that updates throughout the day. The killer feature: you never have to manually update your pitch deck, your daily briefing, or your personal reports again.
- Choose Opus when you don’t know what you’re really asking for. Felix’s heuristic for model selection: use Sonnet when the problem is well-scoped and specific. Reach for Opus when you need Claude to interpret what you actually want, not just what you said. It’s the difference between “make me a floor plan with units” (Sonnet territory) and “help me figure out how to organize my life” (Opus territory). For most tasks, Sonnet is perfectly capable, but when you need that extra layer of problem decomposition, Opus is worth it.
- Kids are the best AI users because they aren’t afraid to ask for things. Felix gets videos from parents showing what their kids build with Claude—custom video games with hand-drawn characters, interactive stories, tools that would have required a software engineer just a few years ago. Adults have spent 20 years in a “mind prison” learning what computers can’t do. Unlearning that is the unlock.
- When Claude makes mistakes, debug your workflow, not the model. Felix doesn’t curse at Claude (though he notes it’s useful for the team to know when people do). Instead, he asks it: “Here’s what I expected. Can you walk me through where things went differently? How can we prevent this in the future?” Usually the fix isn’t “Claude can’t do this”; it’s “I need to change the prompt, clean up the data source, or set up a dry run.” Treat Claude like a collaborator who needs better instructions, not a tool that’s broken.
Brought to you by:Magic Patterns—Prototypes that look like your productThoughtSpot—Build AI-powered analytics into your product
Claire breaks down the biggest launches from Google I/O 2026—from Gemini 3.5 Flash and Antigravity 2.0 to Google AI Studio, Omni, Flow, Stitch, and Pomelli. In this episode, she tests the tools live, shares what actually works, and explains where Google is catching up, where it may be pulling ahead, and why its launch-to-availability gap is still such a problem for builders.
- Gemini 3.5 Flash rivals leading frontier coding models in Google’s benchmarks while running four times faster. Google positions this as their agentic coding model, optimized for tasks requiring both high reasoning and rapid execution. If the benchmarks hold in practice, this speed advantage could shift the coding agent landscape toward Google’s tools.
- Antigravity 2.0 brings Google’s IDE to feature parity with Claude Code and Codex—but it’s playing catch-up. The update includes projects (folder-constrained workspaces), scheduled tasks on Cron, and subagents for specific tasks. The UI looks nearly identical to Codex, and the features match what Anthropic and OpenAI shipped months ago. The advantage is speed: if Gemini 3.5 Flash delivers, developers might choose Antigravity for well-scoped tasks that need to ship fast.
- The /grill-me slash command is Antigravity’s aggressive take on Claude Code’s polite clarification tool. Instead of gently asking questions, /grill-me promises to interrogate your requirements and get to the heart of what you’re building. Whether this is actually more hardcore or just clever branding remains to be seen, but it signals Google’s attempt to differentiate on personality.
- Google AI Studio now integrates directly with Workspace apps—or it’s supposed to. The promise: build no-code apps that read Sheets, draft Gmails, organize Drive, and see Calendar without setup. Claire couldn’t get it to work during testing. If it delivers, it would capture internal enterprise productivity use cases and personal assistant workflows where Google already owns the data layer.
- Omni is Google’s answer to Sora, focused on longer, production-quality video. The model creates 10-second videos (versus Sora’s 6 or 7 seconds), maintains character consistency across edits, and allows conversational editing. Claire tested it by animating her kid’s drawing, and the output was impressive. The real power will be in production workflows where you iterate on the same characters and scenes multiple times.
- Flow is Google’s production-grade video editor built on Omni. It lets you define characters, create avatars, and edit videos conversationally while maintaining cinematic quality. The tool targets creators and marketers who need consistent, high-quality video at scale. Claire tried creating an avatar of herself, but the feature failed—a recurring theme throughout I/O announcements.
- Stitch and Pomelli are Google’s design and marketing tools. Stitch is like in-browser Figma with streaming design generation, inline AI edits, and code sync. Pomelli creates brand books, campaign assets, and websites from a URL. Both show promise but suffer from “Google slop,” the generic aesthetic of AI-generated design.
- Gemini’s multimodal capabilities remain its strongest differentiator. For work involving files, videos, or transformative work across modalities (document to video, image to text), Gemini models excel. Claire uses them for generating blog posts from podcast videos and animating drawings. The 3.5 family continues this strength; for these use cases, Gemini’s multimodal performance is best-in-class.
- The biggest problem: half the features don’t actually work yet. Claire encountered broken features, missing integrations, and “coming soon” disclaimers throughout testing. Workspace integration in AI Studio? Couldn’t access it. Avatar creation in Flow? Didn’t work. When you announce features that aren’t ready, people lose patience and stop trusting your roadmap.
If you’re enjoying these episodes, reply and let me know what you’d love to learn more about: AI workflows, hiring, growth, product strategy—anything.
Catch you next week,
Lenny
*P.S. Want every new episode delivered the moment it drops? Hit “Follow” on your favorite podcast app.*
関連記事
[AINews] 今日特に大きな出来事はありませんでした
Latent Space は、GLM 5.2 が依然として注目されていると指摘しつつ、AIE WF 2026 の通常チケットが月曜日に完売すると発表しました。同サイト購読者向けに限定割引を提供し、参加者には Warp や Datadog などからのスポンサークレジットも付与されます。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
社内データ分析エージェントの構築方法について
GitHub は、大規模なデータ組織が直面する自己完結型のデータアクセスと洞察提供の課題に対し、AI を活用した信頼性の高い解決策として、社内でデータ分析エージェントを構築したことを発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み