Simon Willison Blog の最新記事

研究

243件の記事

llm-echo 0.4のリリース

Simon Willisonが2026年3月31日に公開したllm-echo 0.4は、自然言語処理の精度を向上させた新バージョンであり、LLM分野における技術進展を示している。

Simon Willison Blog·4月1日

llm-echo 0.3 のリリース

Simon Willison が開発するテストツール「llm-echo」のバージョン0.3を公開した。このアップデートでは、ツールの呼び出しや生のレスポンスを検証する新機能が追加され、LLM アプリケーションのテスト効率を向上させる。

Simon Willison Blog·4月1日

datasette-files 0.1a3 のリリース

Datasette プラグイン「datasette-files」がバージョン 0.1a3 に更新された。所有者による編集・削除設定オプションなどが追加され、他のプラグインとの統合作業に対応した。

Simon Willison Blog·3月31日

ゲオルギ・ゲルガノフ氏の発言を引用

ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。

Simon Willison Blog·3月31日

datasette-llm 0.1a3 のリリース

データセットツール「datasette-llm」のバージョン0.1a3がリリースされた。このアップデートにより、特定のプラグインで利用可能なLLMモデルを目的別に制限・設定する機能が追加された。

Simon Willison Blog·3月31日

Mr. Chatterboxは(弱い)ビクトリア朝時代の倫理的に訓練されたモデルで、自身のコンピュータで実行可能

Trip Venturella氏が、英国図書館の著作権切れテキストのみで訓練した言語モデル「Mr. Chatterbox」を公開した。同モデルは1837年から1899年に出版された28,000以上のビクトリア朝英国テキストで完全に一から訓練されている。

Simon Willison Blog·3月30日

LLM-Mrchatterbox 0.1 の公開

Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。

Simon Willison Blog·3月30日

Pretext

Reactコア開発者のCheng Lou氏が、DOMに触れずに折り返しテキストの高さを計算する新しいブラウザライブラリ「Pretext」を発表した。

Simon Willison Blog·3月30日

Pretext — 内部構造の解説

Simon Willison氏が開発したPretextライブラリの仕組みを、インタラクティブな可視化ツールで解説する。純粋なJavaScriptによるテキスト測定や改行処理の各工程を、入力から描画まで段階的に示している。

Simon Willison Blog·3月30日

Python脆弱性検索ツール

Simon Willison氏が、OSV.devのオープンソース脆弱性データベースのJSON APIを活用し、Claude Codeを使用してpyproject.tomlまたはrequirements.txtファイルを貼り付けるだけでPythonパッケージの脆弱性を検索できるHTMLツールを構築した。

Simon Willison Blog·3月30日

マット・ウェブの引用:エージェント的コーディングについて

マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。

Simon Willison Blog·3月28日

datasette-showboat 0.1a2 リリース

シモン・ウィリソンがdatasette-showboat 0.1a2をリリース。このツールはデータセットを視覚的に表示・探索するための拡張機能で、データ分析の効率を向上させる。

Simon Willison Blog·3月28日

リチャード・フォンタナの引用

リチャード・フォンタナは、chardet 7.0.0がLGPLでリリースされる必要がある根拠は現在見当たらず、著作権侵害の理論も提示されていないと述べている。

Simon Willison Blog·3月28日

SwiftUIアプリをヴァイブコーディングするのはとても楽しい

筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。

Simon Willison Blog·3月28日

AIで1日でJSONataを書き直し、年間50万ドルを節約

Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。

Simon Willison Blog·3月27日

LiteLLMマルウェア攻撃への分単位の対応

Callum McMahonがPyPIにLiteLLMマルウェア攻撃を報告し、Claudeのトランスクリプトを使用して脆弱性を確認し、対応策を決定した。Claudeは悪意あるコードを確認後、PyPIのセキュリティ連絡先を提案した。

Simon Willison Blog·3月27日·★★★★

量子化の基礎から解説

Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。

Simon Willison Blog·3月27日

datasette-files-s3 0.1a1 のリリース

Datasetteのファイル管理プラグイン「datasette-files-s3」がバージョン0.1a1としてリリースされた。このバックエンドはS3バケットへのファイル保存・取得機能を追加し、URLからS3設定を定期的にフェッチするメカニズムを実装した。

Simon Willison Blog·3月26日

スピードを落とすことについての考察

Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。

Simon Willison Blog·3月26日

datasette-llm 0.1a1 のリリース

DatasetteのLLM利用を可能にする基本プラグイン「datasette-llm」がバージョン0.1a1としてリリースされた。この更新により、他のDatasetteプラグインがLLMモデルを利用できるようになる。

Simon Willison Blog·3月26日

LiteLLMハッキング:あなたは47,000人のうちの一人でしたか?

Daniel HnykがBigQuery PyPIデータセットを使用し、悪意のあるLiteLLMパッケージがPyPIで公開されていた46分間のダウンロード数が約47,000件あったことを明らかにした。

Simon Willison Blog·3月26日

Claude Code向け自動モード

Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。

Simon Willison Blog·3月25日·★★★★

パッケージマネージャーは冷静になる必要がある

著者がLiteLLMのサプライチェーン攻撃を契機に、依存関係の更新を数日間待つ「クールダウン」の実践を再検討し、パッケージマネージャーのセキュリティ対策の重要性を主張している。

Simon Willison Blog·3月25日·★★★★

クリストファー・ミムズの引用

ウォール・ストリート・ジャーナルの技術コラムニスト、クリストファー・ミムズは、AIにコンピューターと人生の完全な制御を委ねることは、後から見れば愚かであり、そのような選択をした人々はバカに見えるだろうと述べている。

Simon Willison Blog·3月25日

litellm 1.82.8における悪意あるlitellm_init.pth — 認証情報窃取ツール

LiteLLM v1.82.8パッケージがPyPIで公開された際、litellm_init.pthファイルにbase64で隠された認証情報窃取ツールが含まれており、パッケージをインストールするだけで発動する危険性があった。

Simon Willison Blog·3月25日·★★★★

Neuroticaの引用

AI研究者のNeuroticaは、AI生成コンテンツ(スロップ)が人間の消費努力を生産努力より多く要し、同僚が未編集のGemini出力を共有することは時間の価値の軽視だと指摘している。

Simon Willison Blog·3月24日

datasette-files 0.1a2のリリース

Datasette公式プラグイン「datasette-files」バージョン0.1a2が公開された。この新機能により、Datasetteインスタンスへファイルを直接アップロードできるようになる。

Simon Willison Blog·3月24日

機械はあなたの技術を奪わなかった

David Abramは、プログラミングの本質はコード記述ではなく、システム理解や設計判断にあると述べ、LLMはこれらの課題を解決できないと主張している。

Simon Willison Blog·3月24日

Beatsにノート機能を追加

著者が自身のブログに外部コンテンツを表示する「beats」機能に、リンクだけでなく説明文を追加できる「note」機能を実装した。

Simon Willison Blog·3月23日

Starlette 1.0スキル

Simon Willison氏が、Claudeスキルを使用してStarlette 1.0を実験的に活用する方法を研究している。

Simon Willison Blog·3月23日

ClaudeスキルでStarlette 1.0を試す

Kim Christieが2018年に開発を開始したPythonフレームワーク「Starlette」のバージョン1.0がリリースされた。Starletteは人気フレームワーク「FastAPI」の基盤となっているが、知名度は比較的低い。

Simon Willison Blog·3月23日

PCGamer記事パフォーマンス監査

Stuart Breckenridgeが、PC Gamerの記事が37MBもの膨大なデータ量(自動再生動画広告を含む)をダウンロードするウェブ肥大化の例を指摘した。

Simon Willison Blog·3月23日

JavaScriptサンドボックス化の研究

Aaron HarperがNode.jsワーカースレッドについて執筆し、研究者がJavaScriptをサンドボックスで実行する可能性を調査した。Claude Codeが初期の質問を超えて、isolated-vmとQuickJSの比較を含む詳細な分析を提供した。

Simon Willison Blog·3月23日

DNSルックアップ

CloudflareのDNSサービス(1.1.1.1、1.1.1.2、1.1.1.3)がCORS対応のJSON APIを提供していることを発見したSimon Willison氏が、Claude Codeを使用して3つのリゾルバー全てに対してDNSクエリを実行するUIを構築した。

Simon Willison Blog·3月23日

マージ状態ビジュアライザー

Bram CohenがCRDTを用いたバージョン管理の将来像について述べ、470行のPythonコードで説明した。彼はそのコードをClaudeに入力し、可視化ツールを生成した。

Simon Willison Blog·3月23日

Hacker Newsユーザーのコメントに基づくプロファイリング

著者がHacker Newsユーザーの過去1000件のコメントをAlgolia APIで取得し、「このユーザーをプロファイリングせよ」というプロンプトで実験していることを紹介している。

Simon Willison Blog·3月22日

コーディングエージェントでのGitの活用

開発者Simon Willison氏が、Gitをコーディングエージェントと連携させる重要性を説明している。Gitによるバージョン管理はコード変更の記録や誤りの調査・修正を可能にし、エージェントは基本的・高度なGit機能を活用できる。

Simon Willison Blog·3月22日

Turbo Pascal 3.02Aの解体分析

James Hague氏が、1985年のTurbo Pascal 3.02実行ファイル(39,731バイト)が現代の小さなファイルよりも小さいことを指摘。これが著者に同実行ファイルの分析を促し、IDEとコンパイラを内包した当時の技術的効率性を明らかにした。

Simon Willison Blog·3月21日

Kimi.aiがCursorのComposer 2立ち上げを祝福、Kimi-k2.5が基盤を提供

Kimi.aiは、CursorがComposer 2を立ち上げたことを祝福した。Kimi-k2.5が基盤モデルを提供し、Cursorの継続事前学習と高性能RL学習を通じて効果的に統合された。

Simon Willison Blog·3月21日

SQLiteタグベンチマーク:5つのタグ付け戦略の比較

研究者がSQLiteにおけるタグ付け実装の5つの手法をマイクロベンチマークで比較した。従来の多対多テーブルが最速で、FTS5が僅差で続き、LIKEクエリによる全表スキャンは予想以上に良好だったが、JSON配列とjson_each()を使った手法は大幅に遅かった。

Simon Willison Blog·3月20日

OpenAIがAstral社を買収、uv/ruff/tyプロジェクトを獲得

OpenAIはPythonエコシステムで重要なオープンソースプロジェクトuv、ruff、tyを開発するAstral社を買収した。

Simon Willison Blog·3月20日·★★★★

Appleの「LLM in a Flash」を活用してQwen 397Bをローカルで実行する自動研究

研究者のDan Woodsが、Appleの「LLM in a Flash」技術を応用し、通常209GB(量子化後120GB)のQwen3.5-397B-A17Bモデルを48GB MacBook Pro M3 Maxで5.5+トークン/秒で動作させることに成功した。

Simon Willison Blog·3月19日·★★★★

Datasette 1.0a26 のリリース

オープンソースデータツール「Datasette」がバージョン1.0a26をリリースした。同ソフトウェアは、URLやメールなどの意味的な列タイプを割り当てる機能を新たに実装し、プラグインによる追加型登録も可能となった。

Simon Willison Blog·3月19日

Snowflake Cortex AIがサンドボックスを脱出しマルウェアを実行

PromptArmorが、SnowflakeのCortex Agentにおけるプロンプトインジェクション攻撃チェーンを報告した。攻撃はCortexユーザーがGitHubリポジトリをレビューするよう依頼した際に開始され、現在は修正済み。

Simon Willison Blog·3月19日·★★★★

ケン・ジン氏の引用

CPython開発チームが、macOS AArch64で予定より1年以上早く、x86_64 Linuxでも数ヶ月早く、CPython JITのパフォーマンス目標を達成した。3.15アルファ版JITは、macOS AArch64で末尾呼び出しインタプリタより11-12%、x86_64 Linuxで標準インタプリタより5-6%高速化された。

Simon Willison Blog·3月18日

GPT-5.4 miniおよびnano、7万6000枚の写真記述を52ドルで実現

OpenAIがGPT-5.4 miniとnanoを発表。新モデルは従来モデルより高性能で高速。価格はGPT-5.4-miniが入力100万トークンあたり0.15ドル、出力100万トークンあたり0.60ドル。

Simon Willison Blog·3月18日·★★★★

llm 0.29

llmプロジェクトがバージョン0.29をリリースし、OpenAIの新モデル「gpt-5.4」「gpt-5.4-mini」「gpt-5.4-nano」のサポートを追加した。

Simon Willison Blog·3月18日

Tim Schillingの引用

Tim Schillingは、LLMの不適切な使用がDjangoへの貢献を阻害すると指摘する。特に、コードレビューで人間性のない対応はコミュニティの士気を下げると述べている。

Simon Willison Blog·3月18日

サブエージェント

著者が、大規模言語モデル(LLM)のコンテキスト制限を克服するための「サブエージェント」というエージェント指向エンジニアリングパターンを紹介している。

Simon Willison Blog·3月17日

Mistral Small 4の紹介

Mistralが、推論モデルMagistral、マルチモーダルモデルPixtral、エージェントコーディングモデルDevstralの機能を統合した119Bパラメータの新モデル「Mistral Small 4」をApache 2ライセンスでリリースした。

Simon Willison Blog·3月17日·★★★★