Simon Willison Blog の最新記事
研究243件の記事
llm-echo 0.4のリリース
Simon Willisonが2026年3月31日に公開したllm-echo 0.4は、自然言語処理の精度を向上させた新バージョンであり、LLM分野における技術進展を示している。
llm-echo 0.3 のリリース
Simon Willison が開発するテストツール「llm-echo」のバージョン0.3を公開した。このアップデートでは、ツールの呼び出しや生のレスポンスを検証する新機能が追加され、LLM アプリケーションのテスト効率を向上させる。
datasette-files 0.1a3 のリリース
Datasette プラグイン「datasette-files」がバージョン 0.1a3 に更新された。所有者による編集・削除設定オプションなどが追加され、他のプラグインとの統合作業に対応した。
ゲオルギ・ゲルガノフ氏の発言を引用
ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。
datasette-llm 0.1a3 のリリース
データセットツール「datasette-llm」のバージョン0.1a3がリリースされた。このアップデートにより、特定のプラグインで利用可能なLLMモデルを目的別に制限・設定する機能が追加された。
Mr. Chatterboxは(弱い)ビクトリア朝時代の倫理的に訓練されたモデルで、自身のコンピュータで実行可能
Trip Venturella氏が、英国図書館の著作権切れテキストのみで訓練した言語モデル「Mr. Chatterbox」を公開した。同モデルは1837年から1899年に出版された28,000以上のビクトリア朝英国テキストで完全に一から訓練されている。
LLM-Mrchatterbox 0.1 の公開
Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。
Pretext
Reactコア開発者のCheng Lou氏が、DOMに触れずに折り返しテキストの高さを計算する新しいブラウザライブラリ「Pretext」を発表した。
Pretext — 内部構造の解説
Simon Willison氏が開発したPretextライブラリの仕組みを、インタラクティブな可視化ツールで解説する。純粋なJavaScriptによるテキスト測定や改行処理の各工程を、入力から描画まで段階的に示している。
Python脆弱性検索ツール
Simon Willison氏が、OSV.devのオープンソース脆弱性データベースのJSON APIを活用し、Claude Codeを使用してpyproject.tomlまたはrequirements.txtファイルを貼り付けるだけでPythonパッケージの脆弱性を検索できるHTMLツールを構築した。
マット・ウェブの引用:エージェント的コーディングについて
マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。
datasette-showboat 0.1a2 リリース
シモン・ウィリソンがdatasette-showboat 0.1a2をリリース。このツールはデータセットを視覚的に表示・探索するための拡張機能で、データ分析の効率を向上させる。
リチャード・フォンタナの引用
リチャード・フォンタナは、chardet 7.0.0がLGPLでリリースされる必要がある根拠は現在見当たらず、著作権侵害の理論も提示されていないと述べている。
SwiftUIアプリをヴァイブコーディングするのはとても楽しい
筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。
AIで1日でJSONataを書き直し、年間50万ドルを節約
Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。
LiteLLMマルウェア攻撃への分単位の対応
Callum McMahonがPyPIにLiteLLMマルウェア攻撃を報告し、Claudeのトランスクリプトを使用して脆弱性を確認し、対応策を決定した。Claudeは悪意あるコードを確認後、PyPIのセキュリティ連絡先を提案した。
量子化の基礎から解説
Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。
datasette-files-s3 0.1a1 のリリース
Datasetteのファイル管理プラグイン「datasette-files-s3」がバージョン0.1a1としてリリースされた。このバックエンドはS3バケットへのファイル保存・取得機能を追加し、URLからS3設定を定期的にフェッチするメカニズムを実装した。
スピードを落とすことについての考察
Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。
datasette-llm 0.1a1 のリリース
DatasetteのLLM利用を可能にする基本プラグイン「datasette-llm」がバージョン0.1a1としてリリースされた。この更新により、他のDatasetteプラグインがLLMモデルを利用できるようになる。
LiteLLMハッキング:あなたは47,000人のうちの一人でしたか?
Daniel HnykがBigQuery PyPIデータセットを使用し、悪意のあるLiteLLMパッケージがPyPIで公開されていた46分間のダウンロード数が約47,000件あったことを明らかにした。
Claude Code向け自動モード
Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。
パッケージマネージャーは冷静になる必要がある
著者がLiteLLMのサプライチェーン攻撃を契機に、依存関係の更新を数日間待つ「クールダウン」の実践を再検討し、パッケージマネージャーのセキュリティ対策の重要性を主張している。
クリストファー・ミムズの引用
ウォール・ストリート・ジャーナルの技術コラムニスト、クリストファー・ミムズは、AIにコンピューターと人生の完全な制御を委ねることは、後から見れば愚かであり、そのような選択をした人々はバカに見えるだろうと述べている。
litellm 1.82.8における悪意あるlitellm_init.pth — 認証情報窃取ツール
LiteLLM v1.82.8パッケージがPyPIで公開された際、litellm_init.pthファイルにbase64で隠された認証情報窃取ツールが含まれており、パッケージをインストールするだけで発動する危険性があった。
Neuroticaの引用
AI研究者のNeuroticaは、AI生成コンテンツ(スロップ)が人間の消費努力を生産努力より多く要し、同僚が未編集のGemini出力を共有することは時間の価値の軽視だと指摘している。
datasette-files 0.1a2のリリース
Datasette公式プラグイン「datasette-files」バージョン0.1a2が公開された。この新機能により、Datasetteインスタンスへファイルを直接アップロードできるようになる。
機械はあなたの技術を奪わなかった
David Abramは、プログラミングの本質はコード記述ではなく、システム理解や設計判断にあると述べ、LLMはこれらの課題を解決できないと主張している。
Beatsにノート機能を追加
著者が自身のブログに外部コンテンツを表示する「beats」機能に、リンクだけでなく説明文を追加できる「note」機能を実装した。
Starlette 1.0スキル
Simon Willison氏が、Claudeスキルを使用してStarlette 1.0を実験的に活用する方法を研究している。
ClaudeスキルでStarlette 1.0を試す
Kim Christieが2018年に開発を開始したPythonフレームワーク「Starlette」のバージョン1.0がリリースされた。Starletteは人気フレームワーク「FastAPI」の基盤となっているが、知名度は比較的低い。
PCGamer記事パフォーマンス監査
Stuart Breckenridgeが、PC Gamerの記事が37MBもの膨大なデータ量(自動再生動画広告を含む)をダウンロードするウェブ肥大化の例を指摘した。
JavaScriptサンドボックス化の研究
Aaron HarperがNode.jsワーカースレッドについて執筆し、研究者がJavaScriptをサンドボックスで実行する可能性を調査した。Claude Codeが初期の質問を超えて、isolated-vmとQuickJSの比較を含む詳細な分析を提供した。
DNSルックアップ
CloudflareのDNSサービス(1.1.1.1、1.1.1.2、1.1.1.3)がCORS対応のJSON APIを提供していることを発見したSimon Willison氏が、Claude Codeを使用して3つのリゾルバー全てに対してDNSクエリを実行するUIを構築した。
マージ状態ビジュアライザー
Bram CohenがCRDTを用いたバージョン管理の将来像について述べ、470行のPythonコードで説明した。彼はそのコードをClaudeに入力し、可視化ツールを生成した。
Hacker Newsユーザーのコメントに基づくプロファイリング
著者がHacker Newsユーザーの過去1000件のコメントをAlgolia APIで取得し、「このユーザーをプロファイリングせよ」というプロンプトで実験していることを紹介している。
コーディングエージェントでのGitの活用
開発者Simon Willison氏が、Gitをコーディングエージェントと連携させる重要性を説明している。Gitによるバージョン管理はコード変更の記録や誤りの調査・修正を可能にし、エージェントは基本的・高度なGit機能を活用できる。
Turbo Pascal 3.02Aの解体分析
James Hague氏が、1985年のTurbo Pascal 3.02実行ファイル(39,731バイト)が現代の小さなファイルよりも小さいことを指摘。これが著者に同実行ファイルの分析を促し、IDEとコンパイラを内包した当時の技術的効率性を明らかにした。
Kimi.aiがCursorのComposer 2立ち上げを祝福、Kimi-k2.5が基盤を提供
Kimi.aiは、CursorがComposer 2を立ち上げたことを祝福した。Kimi-k2.5が基盤モデルを提供し、Cursorの継続事前学習と高性能RL学習を通じて効果的に統合された。
SQLiteタグベンチマーク:5つのタグ付け戦略の比較
研究者がSQLiteにおけるタグ付け実装の5つの手法をマイクロベンチマークで比較した。従来の多対多テーブルが最速で、FTS5が僅差で続き、LIKEクエリによる全表スキャンは予想以上に良好だったが、JSON配列とjson_each()を使った手法は大幅に遅かった。
OpenAIがAstral社を買収、uv/ruff/tyプロジェクトを獲得
OpenAIはPythonエコシステムで重要なオープンソースプロジェクトuv、ruff、tyを開発するAstral社を買収した。
Appleの「LLM in a Flash」を活用してQwen 397Bをローカルで実行する自動研究
研究者のDan Woodsが、Appleの「LLM in a Flash」技術を応用し、通常209GB(量子化後120GB)のQwen3.5-397B-A17Bモデルを48GB MacBook Pro M3 Maxで5.5+トークン/秒で動作させることに成功した。
Datasette 1.0a26 のリリース
オープンソースデータツール「Datasette」がバージョン1.0a26をリリースした。同ソフトウェアは、URLやメールなどの意味的な列タイプを割り当てる機能を新たに実装し、プラグインによる追加型登録も可能となった。
Snowflake Cortex AIがサンドボックスを脱出しマルウェアを実行
PromptArmorが、SnowflakeのCortex Agentにおけるプロンプトインジェクション攻撃チェーンを報告した。攻撃はCortexユーザーがGitHubリポジトリをレビューするよう依頼した際に開始され、現在は修正済み。
ケン・ジン氏の引用
CPython開発チームが、macOS AArch64で予定より1年以上早く、x86_64 Linuxでも数ヶ月早く、CPython JITのパフォーマンス目標を達成した。3.15アルファ版JITは、macOS AArch64で末尾呼び出しインタプリタより11-12%、x86_64 Linuxで標準インタプリタより5-6%高速化された。
GPT-5.4 miniおよびnano、7万6000枚の写真記述を52ドルで実現
OpenAIがGPT-5.4 miniとnanoを発表。新モデルは従来モデルより高性能で高速。価格はGPT-5.4-miniが入力100万トークンあたり0.15ドル、出力100万トークンあたり0.60ドル。
llm 0.29
llmプロジェクトがバージョン0.29をリリースし、OpenAIの新モデル「gpt-5.4」「gpt-5.4-mini」「gpt-5.4-nano」のサポートを追加した。
Tim Schillingの引用
Tim Schillingは、LLMの不適切な使用がDjangoへの貢献を阻害すると指摘する。特に、コードレビューで人間性のない対応はコミュニティの士気を下げると述べている。
サブエージェント
著者が、大規模言語モデル(LLM)のコンテキスト制限を克服するための「サブエージェント」というエージェント指向エンジニアリングパターンを紹介している。
Mistral Small 4の紹介
Mistralが、推論モデルMagistral、マルチモーダルモデルPixtral、エージェントコーディングモデルDevstralの機能を統合した119Bパラメータの新モデル「Mistral Small 4」をApache 2ライセンスでリリースした。