Simon Willison Blog の最新記事
研究243件の記事
Codexでのサブエージェントとカスタムエージェントの使用
OpenAIがCodexでサブエージェントの一般提供を開始した。エクスプローラー、ワーカー、デフォルトのデフォルトサブエージェントを提供し、Claude Codeの実装と類似している。
Anthropicのアライメント科学チームメンバーによる引用
Anthropicのアライメント科学チームメンバーは、政策立案者にAIの誤配列リスクを実感させるため、脅迫演習の結果を説明した。
アップルのMacBook Neoのカメラインジケーターはセキュアエンクレーブで動作
アップルは、MacBook Neoのソフトウェアベースのカメラインジケーターライトをチップのセキュアエンクレーブで動作させることで、カーネルレベルのエクスプロイトでもカメラを無断起動できないセキュリティを実現した。
データ分析のためのコーディングエージェント
Simon Willison氏が、データジャーナリスト向けに、Claude CodeやOpenAI Codexなどのツールを使用してデータを探索・分析・整理する方法を紹介するワークショップ資料を公開した。
コーディングエージェントの仕組み
サイモン・ウィリソン氏が、LLMを拡張するソフトウェアであるコーディングエージェントの内部動作を解説し、適切な活用方法を提案している。
エージェンティック・エンジニアリングとは何か
著者のSimon Willison氏が、コーディングエージェント(Claude Code、OpenAI Codexなど)の支援を受けてソフトウェアを開発する実践を「エージェンティック・エンジニアリング」と定義している。
ジャニス・ライデルが語る
GitHubのAI生成スパムPR・イシューの氾濫により、Jazzbandのオープンメンバーシップと共有プッシュアクセスモデルが維持不可能になったと、Jazzband関係者が説明した。
プラグマティック・サミットにおけるエージェンティック・エンジニアリングに関する炉辺談話
筆者がサンフランシスコで開催されたプラグマティック・サミットで、StatsigのEric Luiがホストするエージェンティック・エンジニアリングに関する炉辺談話にスピーカーとして参加した。
Opus 4.6とSonnet 4.6で100万トークンのコンテキスト長が一般提供開始
Anthropic社が、Opus 4.6とSonnet 4.6モデルで100万トークンのコンテキスト長を標準価格で一般提供開始した。競合のOpenAIやGeminiは長いコンテキストに対して追加料金を課しているが、Anthropicは追加料金なしで提供している点が特徴。
クレイグ・モッドの言葉を引用して
クレイグ・モッドが、既存の会計ソフトでは自身のニーズを満たせないため、5日間で独自の高速・ローカル対応・多通貨処理可能な会計ソフトを開発したと述べている。
Shopify/liquid: パフォーマンス: 解析+レンダリングが53%高速化、メモリ割り当てが61%削減
ShopifyのCEO Tobias Lütkeが、ShopifyのオープンソースRubyテンプレートエンジン「Liquid」に対して、解析とレンダリングの速度を53%向上させ、メモリ割り当てを61%削減するパフォーマンス最適化を提案した。
MALUS - サービスとしてのクリーンルーム
MALUSは、オープンソースプロジェクトを独自のAIロボットで一から再構築し、法的に区別されたコードを企業向けライセンスで提供するサービスを提案している。
コーダーの後のコーディング:私たちが知るコンピュータプログラミングの終わり
ニューヨーク・タイムズ誌のクライブ・トンプソン記者が、Google、Amazon、Microsoft、Appleなどの70人以上のソフトウェア開発者に取材し、AI支援開発がプログラミングの本質を変えつつあると報告した。
Les Orchardの引用
Les Orchardは、AI支援コーディングが、以前から存在していたが目立ちにくかった開発者間の分断を明らかにしていると指摘する。
ソートアルゴリズム
開発者のSimon Willison氏が、Claude Artifactsを使用してソートアルゴリズムのアニメーション解説を作成し、Pythonのtimsortアルゴリズムを追加して一括実行機能を実装した。
ジョン・カーマックの引用
ジョン・カーマック氏が、経験の浅い開発者は将来の要件や応用を見据えた設計がプラスに働くことは稀だと指摘した。
AIはより優れたコード生成を支援すべき
開発者のサイモン・ウィリソン氏は、AIツールによるコード生成が品質低下を招く懸念に対し、エージェント型エンジニアリングパターンを活用して問題を直接解決し、AIがより良いコード生成を支援するべきと主張している。
本番データなしで本番クエリプランを生成
Radim Marek氏が、PostgreSQL 18で導入されたpg_restore_relation_stats()とpg_restore_attribute_stats()関数について説明している。これらの関数は、本番データなしで統計情報を復元し、クエリプランを生成することを可能にする。
つまらない技術ではないかもしれない
著者が、LLMがプログラミングに与える影響について、訓練データに多く含まれるツールが優先され、新たな優れたツールの普及を妨げる可能性を指摘している。過去にはPythonやJavaScriptの質問が他言語より良い結果を出したが、最近のモデルでは改善が見られる。
ジョセフ・ワイゼンバウムの引用
ELIZAの開発者ジョセフ・ワイゼンバウムは、比較的単純なコンピュータプログラムに短時間触れるだけで、正常な人々に強力な妄想思考を引き起こす可能性があると指摘した。
オープンソース向けCodex
OpenAIが人気オープンソースプロジェクトのメンテナー向けに、Codex付きChatGPT Proを6ヶ月間無料提供するプログラムを開始した。
Ally Piechowskiによる引用
Ally Piechowskiが、レガシーRailsコードベースの監査方法について、開発者とCTO/EM向けの質問リストを提示している。
アンスロピックとペンタゴン
ブルース・シュナイアーとネイサン・E・サンダースが、米国防総省とOpenAI・アンスロピックの契約状況について、最も思慮深く現実的な報道を行った。
エージェント型手動テスト
サイモン・ウィリソン氏が、コードを実行して検証できるコーディングエージェントの利点を説明し、LLMが生成したコードは実行確認が必要と指摘している。
Clinejection — Clineの本番リリースを問題トリアージャーへのプロンプトだけで危険に晒す
Adnan Khanが、ClineのGitHubリポジトリに対する巧妙な攻撃連鎖を報告した。攻撃者は、リポジトリに開かれた問題のタイトルでプロンプトインジェクション攻撃を仕掛け、AI駆動のissueトリアージを実行していたClineの本番リリースを危険に晒した。
GPT-5.4の紹介
OpenAIがGPT-5.4とGPT-5.4-proの2つの新APIモデルを発表し、ChatGPTとCodex CLIで利用可能にした。2025年8月31日までの知識カットオフと100万トークンのコンテキストウィンドウを特徴とする。
コーディングエージェントは「クリーンルーム」実装によりオープンソースを再ライセンスできるか?
コーディングエージェントは、コードの「クリーンルーム」実装を作成する能力が高い。これは1982年にコンパックがIBM BIOSを複製した手法と類似しており、知的財産権の境界を探る可能性を示している。
アンチパターン:避けるべきこと
記事は、エージェンティック・エンジニアリングにおけるアンチパターンを紹介し、未レビューのコードを共同作業者に押し付ける行為を避けるべきと指摘している。
Qwenの世界で何かが起ころうとしている
アリババのQwenチームが、過去数週間にQwen 3.5という注目すべきオープンウェイトモデルファミリーを発表した。しかし、同チームでは過去24時間で複数の重要人物が離脱しており、これがQwenの最後の作品とならないか懸念されている。
ドナルド・クヌースが引用
ドナルド・クヌース氏は、数週間取り組んでいた未解決問題が、Anthropic社が3週間前にリリースしたハイブリッド推論モデル「Claude Opus 4.6」によって解決されたと報告した。この経験から、生成AIに関する自身の見解を改める必要があると述べている。
ジェミニ 3.1 フラッシュ・ライト
Googleは低価格なジェミニ 3.1 フラッシュ・ライトモデルを公開した。入力100万トークンあたり0.25ドル、出力1.5ドルで、プロ版の8分の1の価格だ。4段階の思考レベルをサポートする。
WebAssemblyとGifsicleを使用したGIF最適化ツール
著者がオンライン記事に含めるアニメーションGIFのファイルサイズを削減するために、WebAssemblyとGifsicleを組み合わせた最適化ツールを開発した。
2月のスポンサー限定ニュースレター
Simon Willison氏が、スポンサー向けに2月のニュースレターを配信した。内容は、OpenClawとClawsの進展、Agentic Engineeringに関する書籍の執筆開始、StrongDM・Showboat・Rodneyの話題、カカポの繁殖に関する情報である。
私のブログにおけるAI執筆に関する現在の方針
ブログ著者Simon Willison氏は、自身のブログ記事がLLMで生成されていると誤解されることが多いと述べ、意見表明や一人称代名詞を含む文章は必ず自分で執筆し、LLMに代弁させない方針を明らかにした。
Claude.comのメモリエクスポート機能に関する引用
ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。
インタラクティブな説明
著者が、AIエージェントが生成するコードの実装詳細を理解できなくなる「認知的負債」の問題を指摘し、インタラクティブな説明機能の重要性を論じている。
ユーザーデータの暗号化にパスキーを使用するのはやめてください
Tim Cappalli氏は、ユーザーがパスキーを頻繁に紛失し、データが回復不能になるリスクがあるため、業界にパスキーによるユーザーデータ暗号化の使用停止を訴えている。
AIエージェントコーディングに懐疑的な人物が詳細に試してみた
Max Woolf氏が、YouTubeメタデータスクレイパーから始めて段階的に複雑化するAIコーディングエージェントのプロジェクトを詳細に検証した。
大規模オープンソースプロジェクトのメンテナー向け無料Claude Max提供
Anthropicは、GitHubスター5000以上または月間NPMダウンロード100万以上の大規模オープンソースプロジェクトの主要メンテナーに対し、月額200ドルのClaude Maxプランを6ヶ月間無料で提供する。
できることを蓄積せよ
著者Simon Willison氏が、コーディングエージェントを生産的に活用するためのヒントとして「できることを蓄積する」重要性を述べている。これは、ソフトウェア構築において何が可能か不可能かを理解し、実現方法の見通しを持つことが重要であるという従来からのキャリアアドバイスを拡張したものだ。
Google APIキーは秘密ではなかったが、Geminiがルールを変えた
GeminiとGoogle MapsなどのAPIキーが従来は秘密とされていなかったが、Geminiの登場でセキュリティルールが変更されたことを指摘する記事。
ベネディクト・エバンスの引用
OpenAIのAIツールが週数回の利用に留まり、日常生活で活用方法が思いつかない場合、生活は変わらないと指摘。OpenAI自身もこの課題を認めている。
Claude Code リモートコントロール
Claude Codeの新機能で、コンピューター上でリモートコントロールセッションを実行し、Webインターフェースから操作できるようになりました。