Simon Willison Blog の最新記事

研究

106件の記事

Turbo Pascal 3.02Aの解体分析

James Hague氏が、1985年のTurbo Pascal 3.02実行ファイル(39,731バイト)が現代の小さなファイルよりも小さいことを指摘。これが著者に同実行ファイルの分析を促し、IDEとコンパイラを内包した当時の技術的効率性を明らかにした。

Simon Willison Blog·3月21日

Kimi.aiがCursorのComposer 2立ち上げを祝福、Kimi-k2.5が基盤を提供

Kimi.aiは、CursorがComposer 2を立ち上げたことを祝福した。Kimi-k2.5が基盤モデルを提供し、Cursorの継続事前学習と高性能RL学習を通じて効果的に統合された。

Simon Willison Blog·3月21日

SQLiteタグベンチマーク:5つのタグ付け戦略の比較

研究者がSQLiteにおけるタグ付け実装の5つの手法をマイクロベンチマークで比較した。従来の多対多テーブルが最速で、FTS5が僅差で続き、LIKEクエリによる全表スキャンは予想以上に良好だったが、JSON配列とjson_each()を使った手法は大幅に遅かった。

Simon Willison Blog·3月20日

OpenAIがAstral社を買収、uv/ruff/tyプロジェクトを獲得

OpenAIはPythonエコシステムで重要なオープンソースプロジェクトuv、ruff、tyを開発するAstral社を買収した。

Simon Willison Blog·3月20日

Appleの「LLM in a Flash」を活用してQwen 397Bをローカルで実行する自動研究

研究者のDan Woodsが、Appleの「LLM in a Flash」技術を応用し、通常209GB(量子化後120GB)のQwen3.5-397B-A17Bモデルを48GB MacBook Pro M3 Maxで5.5+トークン/秒で動作させることに成功した。

Simon Willison Blog·3月19日·★★★★

Datasette 1.0a26

Datasetteがセマンティック列タイプの割り当て機能を追加し、url、email、jsonなどの組み込みタイプとプラグインによる拡張を実現した。

Simon Willison Blog·3月19日

Snowflake Cortex AIがサンドボックスを脱出しマルウェアを実行

PromptArmorが、SnowflakeのCortex Agentにおけるプロンプトインジェクション攻撃チェーンを報告した。攻撃はCortexユーザーがGitHubリポジトリをレビューするよう依頼した際に開始され、現在は修正済み。

Simon Willison Blog·3月19日

ケン・ジン氏の引用

CPython開発チームが、macOS AArch64で予定より1年以上早く、x86_64 Linuxでも数ヶ月早く、CPython JITのパフォーマンス目標を達成した。3.15アルファ版JITは、macOS AArch64で末尾呼び出しインタプリタより11-12%、x86_64 Linuxで標準インタプリタより5-6%高速化された。

Simon Willison Blog·3月18日

GPT-5.4 miniおよびnano、7万6000枚の写真記述を52ドルで実現

OpenAIがGPT-5.4 miniとnanoを発表。新モデルは従来モデルより高性能で高速。価格はGPT-5.4-miniが入力100万トークンあたり0.15ドル、出力100万トークンあたり0.60ドル。

Simon Willison Blog·3月18日·★★★★

llm 0.29

llmプロジェクトがバージョン0.29をリリースし、OpenAIの新モデル「gpt-5.4」「gpt-5.4-mini」「gpt-5.4-nano」のサポートを追加した。

Simon Willison Blog·3月18日

Tim Schillingの引用

Tim Schillingは、LLMの不適切な使用がDjangoへの貢献を阻害すると指摘する。特に、コードレビューで人間性のない対応はコミュニティの士気を下げると述べている。

Simon Willison Blog·3月18日

サブエージェント

著者が、大規模言語モデル(LLM)のコンテキスト制限を克服するための「サブエージェント」というエージェント指向エンジニアリングパターンを紹介している。

Simon Willison Blog·3月17日

Mistral Small 4の紹介

Mistralが、推論モデルMagistral、マルチモーダルモデルPixtral、エージェントコーディングモデルDevstralの機能を統合した119Bパラメータの新モデル「Mistral Small 4」をApache 2ライセンスでリリースした。

Simon Willison Blog·3月17日·★★★★

Codexでのサブエージェントとカスタムエージェントの使用

OpenAIがCodexでサブエージェントの一般提供を開始した。エクスプローラー、ワーカー、デフォルトのデフォルトサブエージェントを提供し、Claude Codeの実装と類似している。

Simon Willison Blog·3月17日

Anthropicのアライメント科学チームメンバーによる引用

Anthropicのアライメント科学チームメンバーは、政策立案者にAIの誤配列リスクを実感させるため、脅迫演習の結果を説明した。

Simon Willison Blog·3月17日

アップルのMacBook Neoのカメラインジケーターはセキュアエンクレーブで動作

アップルは、MacBook Neoのソフトウェアベースのカメラインジケーターライトをチップのセキュアエンクレーブで動作させることで、カーネルレベルのエクスプロイトでもカメラを無断起動できないセキュリティを実現した。

Simon Willison Blog·3月17日

データ分析のためのコーディングエージェント

Simon Willison氏が、データジャーナリスト向けに、Claude CodeやOpenAI Codexなどのツールを使用してデータを探索・分析・整理する方法を紹介するワークショップ資料を公開した。

Simon Willison Blog·3月17日

コーディングエージェントの仕組み

サイモン・ウィリソン氏が、LLMを拡張するソフトウェアであるコーディングエージェントの内部動作を解説し、適切な活用方法を提案している。

Simon Willison Blog·3月16日

エージェンティック・エンジニアリングとは何か

著者のSimon Willison氏が、コーディングエージェント(Claude Code、OpenAI Codexなど)の支援を受けてソフトウェアを開発する実践を「エージェンティック・エンジニアリング」と定義している。

Simon Willison Blog·3月16日

ジャニス・ライデルが語る

GitHubのAI生成スパムPR・イシューの氾濫により、Jazzbandのオープンメンバーシップと共有プッシュアクセスモデルが維持不可能になったと、Jazzband関係者が説明した。

Simon Willison Blog·3月15日

プラグマティック・サミットにおけるエージェンティック・エンジニアリングに関する炉辺談話

筆者がサンフランシスコで開催されたプラグマティック・サミットで、StatsigのEric Luiがホストするエージェンティック・エンジニアリングに関する炉辺談話にスピーカーとして参加した。

Simon Willison Blog·3月15日

Opus 4.6とSonnet 4.6で100万トークンのコンテキスト長が一般提供開始

Anthropic社が、Opus 4.6とSonnet 4.6モデルで100万トークンのコンテキスト長を標準価格で一般提供開始した。競合のOpenAIやGeminiは長いコンテキストに対して追加料金を課しているが、Anthropicは追加料金なしで提供している点が特徴。

Simon Willison Blog·3月14日

クレイグ・モッドの言葉を引用して

クレイグ・モッドが、既存の会計ソフトでは自身のニーズを満たせないため、5日間で独自の高速・ローカル対応・多通貨処理可能な会計ソフトを開発したと述べている。

Simon Willison Blog·3月14日

Shopify/liquid: パフォーマンス: 解析+レンダリングが53%高速化、メモリ割り当てが61%削減

ShopifyのCEO Tobias Lütkeが、ShopifyのオープンソースRubyテンプレートエンジン「Liquid」に対して、解析とレンダリングの速度を53%向上させ、メモリ割り当てを61%削減するパフォーマンス最適化を提案した。

Simon Willison Blog·3月13日

MALUS - サービスとしてのクリーンルーム

MALUSは、オープンソースプロジェクトを独自のAIロボットで一から再構築し、法的に区別されたコードを企業向けライセンスで提供するサービスを提案している。

Simon Willison Blog·3月13日

コーダーの後のコーディング:私たちが知るコンピュータプログラミングの終わり

ニューヨーク・タイムズ誌のクライブ・トンプソン記者が、Google、Amazon、Microsoft、Appleなどの70人以上のソフトウェア開発者に取材し、AI支援開発がプログラミングの本質を変えつつあると報告した。

Simon Willison Blog·3月13日

Les Orchardの引用

Les Orchardは、AI支援コーディングが、以前から存在していたが目立ちにくかった開発者間の分断を明らかにしていると指摘する。

Simon Willison Blog·3月13日

ソートアルゴリズム

開発者のSimon Willison氏が、Claude Artifactsを使用してソートアルゴリズムのアニメーション解説を作成し、Pythonのtimsortアルゴリズムを追加して一括実行機能を実装した。

Simon Willison Blog·3月12日

ジョン・カーマックの引用

ジョン・カーマック氏が、経験の浅い開発者は将来の要件や応用を見据えた設計がプラスに働くことは稀だと指摘した。

Simon Willison Blog·3月11日

AIはより優れたコード生成を支援すべき

開発者のサイモン・ウィリソン氏は、AIツールによるコード生成が品質低下を招く懸念に対し、エージェント型エンジニアリングパターンを活用して問題を直接解決し、AIがより良いコード生成を支援するべきと主張している。

Simon Willison Blog·3月11日

本番データなしで本番クエリプランを生成

Radim Marek氏が、PostgreSQL 18で導入されたpg_restore_relation_stats()とpg_restore_attribute_stats()関数について説明している。これらの関数は、本番データなしで統計情報を復元し、クエリプランを生成することを可能にする。

Simon Willison Blog·3月10日

つまらない技術ではないかもしれない

著者が、LLMがプログラミングに与える影響について、訓練データに多く含まれるツールが優先され、新たな優れたツールの普及を妨げる可能性を指摘している。過去にはPythonやJavaScriptの質問が他言語より良い結果を出したが、最近のモデルでは改善が見られる。

Simon Willison Blog·3月9日

ジョセフ・ワイゼンバウムの引用

ELIZAの開発者ジョセフ・ワイゼンバウムは、比較的単純なコンピュータプログラムに短時間触れるだけで、正常な人々に強力な妄想思考を引き起こす可能性があると指摘した。

Simon Willison Blog·3月8日

オープンソース向けCodex

OpenAIが人気オープンソースプロジェクトのメンテナー向けに、Codex付きChatGPT Proを6ヶ月間無料提供するプログラムを開始した。

Simon Willison Blog·3月8日

Ally Piechowskiによる引用

Ally Piechowskiが、レガシーRailsコードベースの監査方法について、開発者とCTO/EM向けの質問リストを提示している。

Simon Willison Blog·3月7日

アンスロピックとペンタゴン

ブルース・シュナイアーとネイサン・E・サンダースが、米国防総省とOpenAI・アンスロピックの契約状況について、最も思慮深く現実的な報道を行った。

Simon Willison Blog·3月7日

エージェント型手動テスト

サイモン・ウィリソン氏が、コードを実行して検証できるコーディングエージェントの利点を説明し、LLMが生成したコードは実行確認が必要と指摘している。

Simon Willison Blog·3月6日

Clinejection — Clineの本番リリースを問題トリアージャーへのプロンプトだけで危険に晒す

Adnan Khanが、ClineのGitHubリポジトリに対する巧妙な攻撃連鎖を報告した。攻撃者は、リポジトリに開かれた問題のタイトルでプロンプトインジェクション攻撃を仕掛け、AI駆動のissueトリアージを実行していたClineの本番リリースを危険に晒した。

Simon Willison Blog·3月6日

GPT-5.4の紹介

OpenAIがGPT-5.4とGPT-5.4-proの2つの新APIモデルを発表し、ChatGPTとCodex CLIで利用可能にした。2025年8月31日までの知識カットオフと100万トークンのコンテキストウィンドウを特徴とする。

Simon Willison Blog·3月6日

コーディングエージェントは「クリーンルーム」実装によりオープンソースを再ライセンスできるか?

コーディングエージェントは、コードの「クリーンルーム」実装を作成する能力が高い。これは1982年にコンパックがIBM BIOSを複製した手法と類似しており、知的財産権の境界を探る可能性を示している。

Simon Willison Blog·3月6日

アンチパターン:避けるべきこと

記事は、エージェンティック・エンジニアリングにおけるアンチパターンを紹介し、未レビューのコードを共同作業者に押し付ける行為を避けるべきと指摘している。

Simon Willison Blog·3月5日

Qwenの世界で何かが起ころうとしている

アリババのQwenチームが、過去数週間にQwen 3.5という注目すべきオープンウェイトモデルファミリーを発表した。しかし、同チームでは過去24時間で複数の重要人物が離脱しており、これがQwenの最後の作品とならないか懸念されている。

Simon Willison Blog·3月5日

ドナルド・クヌースが引用

ドナルド・クヌース氏は、数週間取り組んでいた未解決問題が、Anthropic社が3週間前にリリースしたハイブリッド推論モデル「Claude Opus 4.6」によって解決されたと報告した。この経験から、生成AIに関する自身の見解を改める必要があると述べている。

Simon Willison Blog·3月4日·★★★★

Gemini 3.1 Flash-Lite

Googleが低価格モデルファミリー「Flash-Lite」の最新版「Gemini 3.1 Flash-Lite」を発表した。入力100万トークンあたり0.25ドル、出力100万トークンあたり1.5ドルで、Gemini 3.1 Proの1/8の価格を実現している。

Simon Willison Blog·3月4日

WebAssemblyとGifsicleを使用したGIF最適化ツール

著者がオンライン記事に含めるアニメーションGIFのファイルサイズを削減するために、WebAssemblyとGifsicleを組み合わせた最適化ツールを開発した。

Simon Willison Blog·3月3日

2月のスポンサー限定ニュースレター

Simon Willison氏が、スポンサー向けに2月のニュースレターを配信した。内容は、OpenClawとClawsの進展、Agentic Engineeringに関する書籍の執筆開始、StrongDM・Showboat・Rodneyの話題、カカポの繁殖に関する情報である。

Simon Willison Blog·3月2日

私のブログにおけるAI執筆に関する現在の方針

ブログ著者Simon Willison氏は、自身のブログ記事がLLMで生成されていると誤解されることが多いと述べ、意見表明や一人称代名詞を含む文章は必ず自分で執筆し、LLMに代弁させない方針を明らかにした。

Simon Willison Blog·3月2日

Claude.comのメモリエクスポート機能に関する引用

ユーザーがClaude.comから別サービスへの移行時に、保存された記憶データと過去の会話から学習したコンテキストをコードブロック形式でエクスポートする方法を指示している。

Simon Willison Blog·3月1日

インタラクティブな説明

著者が、AIエージェントが生成するコードの実装詳細を理解できなくなる「認知的負債」の問題を指摘し、インタラクティブな説明機能の重要性を論じている。

Simon Willison Blog·3月1日

ユーザーデータの暗号化にパスキーを使用するのはやめてください

Tim Cappalli氏は、ユーザーがパスキーを頻繁に紛失し、データが回復不能になるリスクがあるため、業界にパスキーによるユーザーデータ暗号化の使用停止を訴えている。

Simon Willison Blog·2月28日