Simon Willison Blog の最新記事
研究108件の記事
Gemma 4:バイト単位で最も能力の高いオープンモデル
Google DeepMindが、2B、4B、31Bサイズの3つの視覚対応推論LLMと、26B-A4BのMixture-of-Expertsモデル、計4つのApache 2.0ライセンスのオープンモデルを発表した。同社は「パラメータあたりの知能レベルが前例ない」と強調し、小型で有用なモデルの開発が現在の研究の最重要分野の一つであることを示している。
llm-gemini 0.30
Simon Willison氏がllm-gemini 0.30をリリースし、gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it、gemma-4-31b-itの新モデルを追加した。
2026年3月スポンサー限定ニュースレター
Simon Willisonがスポンサー向けに2026年3月のニュースレターを配信した。内容はエージェント型エンジニアリングパターン、MacでのMoEモデルによるストリーミング、3月のモデルリリース、Vibe porting、サプライチェーン攻撃に関する情報を含む。
datasette-llm 0.1a6
Datasetteプロジェクトが、LLM統合ツール「datasette-llm」のバージョン0.1a6をリリースした。デフォルトモデルの設定を簡素化し、ドキュメントを改善した。
datasette-enrichments-llm 0.2a1
DatasetteのLLMエンリッチメントプラグインがバージョン0.2a1をリリースし、エンリッチメントをトリガーするアクター情報をllm.modeメソッドに渡す機能を追加した。
datasette-extract 0.3a0
Datasetteがdatasette-extractプラグインのバージョン0.3a0をリリースし、datasette-llmを統合してモデル管理を改善した。
datasette-enrichments-llm 0.2a0
Datasette-enrichments-llmプラグインがバージョン0.2a0をリリースし、datasette-llmを介してLLMモデルの設定・管理を可能にした。これにより、データ強化に使用するモデルを指定できるようになった。
datasette-llm-usage 0.2a0
Datasetteプロジェクトが、LLM使用状況追跡プラグイン「datasette-llm-usage」のバージョン0.2a0をリリースした。このリリースでは、割り当てと推定価格設定に関する機能を削除し、それらを別プラグイン「datasette-llm-accountant」に移管した。また、モデル設定のために「datasette-llm」への依存を追加した。
datasette-llm 0.1a5
Datasette-LLMプロジェクトがバージョン0.1a5をリリースした。llm_prompt_context()プラグインフックがチェーン内のプロンプトも追跡可能になり、ツール呼び出しループの監視に使用できるようになった。
Soohoon Choiの引用
Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。
Axiosへのサプライチェーン攻撃、npmから悪意のある依存関係を引き込む
Socket.devが、週間1億1,400万ダウンロードのHTTPクライアントNPMパッケージ「Axios」のバージョン1.14.1と0.30.4に、新たに公開されたマルウェア「plain-crypto-js」が依存関係として含まれていたと報告した。
datasette-llm 0.1a4
Datasette-LLMがバージョン0.1a4をリリースし、目的別に異なるAPIキーを設定する機能を追加した。例えば、エンリッチメント専用のAPIキーでgpt-5.4-miniを使用できるようになった。
llm-all-models-async 0.1
Simon Willison氏が、LLMプラグイン向けの非同期モデル定義機能をリリースした。API連携モデル向けの非同期バリアントを提供する。
llm 0.30リリース
Simon Willison氏が開発するLLMツールのバージョン0.30がリリースされた。今回のアップデートでは、register_models()プラグインフックにmodel_aliasesパラメータが追加され、他のプラグインが登録したモデルやエイリアスを参照できるようになった。
llm-echo 0.4
Simon Willison氏が、LLMプロンプトのレスポンスにinput_tokensとoutput_tokensフィールドを追加したllm-echo 0.4をリリースした。
llm-echo 0.3
Simon Willison氏がllm-echo 0.3をリリースし、ツール呼び出しテスト機能と生レスポンステスト機能を追加した。
datasette-files 0.1a3
Simon Willison氏が、datasette-filesプラグインの新バージョン0.1a3をリリースした。このリリースでは、他のプラグイン(datasette-extractなど)との統合作業に必要な設定オプションを追加した。
ゲオルギ・ゲルガノフ氏の発言を引用
ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。
datasette-llm 0.1a3
Datasette-LLMプロジェクトがバージョン0.1a3をリリースし、特定の目的に対して利用可能なLLMを設定する機能を追加した。これにより、プラグインごとに使用できるモデルを制限できるようになった。
Mr. Chatterboxは(弱い)ビクトリア朝時代の倫理的に訓練されたモデルで、自身のコンピュータで実行可能
Trip Venturella氏が、英国図書館の著作権切れテキストのみで訓練した言語モデル「Mr. Chatterbox」を公開した。同モデルは1837年から1899年に出版された28,000以上のビクトリア朝英国テキストで完全に一から訓練されている。
llm-mrchatterbox 0.1
Simon Willison氏が、ローカルPCで実行可能なヴィクトリア朝倫理訓練済みモデル「Mr. Chatterbox」の初版リリースを発表した。
Pretext
Reactコア開発者のCheng Lou氏が、DOMに触れずに折り返しテキストの高さを計算する新しいブラウザライブラリ「Pretext」を発表した。
Pretext — 内部構造
Simon Willison氏が、Pretextというツールの内部構造について解説し、関連するノートを公開している。
Python脆弱性検索ツール
Simon Willison氏が、OSV.devのオープンソース脆弱性データベースのJSON APIを活用し、Claude Codeを使用してpyproject.tomlまたはrequirements.txtファイルを貼り付けるだけでPythonパッケージの脆弱性を検索できるHTMLツールを構築した。
マット・ウェブの引用:エージェント的コーディングについて
マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。
datasette-showboat 0.1a2
開発者Simon Willisonが、アプリからMarkdownファイルをエクスポートするオプションを追加し、Showboatがリモートサーバーに更新を段階的に公開できるようにした。
リチャード・フォンタナの引用
リチャード・フォンタナは、chardet 7.0.0がLGPLでリリースされる必要がある根拠は現在見当たらず、著作権侵害の理論も提示されていないと述べている。
SwiftUIアプリをヴァイブコーディングするのはとても楽しい
筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。
AIで1日でJSONataを書き直し、年間50万ドルを節約
Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。
LiteLLMマルウェア攻撃への分単位の対応
Callum McMahonがPyPIにLiteLLMマルウェア攻撃を報告し、Claudeのトランスクリプトを使用して脆弱性を確認し、対応策を決定した。Claudeは悪意あるコードを確認後、PyPIのセキュリティ連絡先を提案した。
量子化の基礎から解説
Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。
datasette-files-s3 0.1a1
Datasetteプロジェクトが、datasette-filesのバックエンドとしてS3バケットを使用してファイルを保存・取得する機能を追加した。このリリースでは、URLから定期的にS3設定を取得するメカニズムを実装した。
スピードを落とすことについての考察
Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。
datasette-llm 0.1a1
Datasetteプロジェクトが、他のDatasetteプラグインがLLMのモデルを利用できるようにする基本プラグインの新バージョンをリリースした。
LiteLLMハッキング:あなたは47,000人のうちの一人でしたか?
Daniel HnykがBigQuery PyPIデータセットを使用し、悪意のあるLiteLLMパッケージがPyPIで公開されていた46分間のダウンロード数が約47,000件あったことを明らかにした。
Claude Code向け自動モード
Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。
パッケージマネージャーは冷静になる必要がある
著者がLiteLLMのサプライチェーン攻撃を契機に、依存関係の更新を数日間待つ「クールダウン」の実践を再検討し、パッケージマネージャーのセキュリティ対策の重要性を主張している。
クリストファー・ミムズの引用
ウォール・ストリート・ジャーナルの技術コラムニスト、クリストファー・ミムズは、AIにコンピューターと人生の完全な制御を委ねることは、後から見れば愚かであり、そのような選択をした人々はバカに見えるだろうと述べている。
litellm 1.82.8における悪意あるlitellm_init.pth — 認証情報窃取ツール
LiteLLM v1.82.8パッケージがPyPIで公開された際、litellm_init.pthファイルにbase64で隠された認証情報窃取ツールが含まれており、パッケージをインストールするだけで発動する危険性があった。
ストリーミングエキスパート
Dan Woods氏が、RAM容量が不足するハードウェアで大規模なMixture-of-Expertsモデルを実行する手法「ストリーミングエキスパート」を実験している。この手法では、処理するトークンごとに必要なエキスパートの重みをSSDからストリーミングする。
Neuroticaの引用
AI研究者のNeuroticaは、AI生成コンテンツ(スロップ)が人間の消費努力を生産努力より多く要し、同僚が未編集のGemini出力を共有することは時間の価値の軽視だと指摘している。
datasette-files 0.1a2
Datasetteプロジェクトが、Datasetteインスタンスにファイルを直接アップロードできる新プラグイン「datasette-files」のアルファ版0.1a2をリリースした。
機械はあなたの技術を奪わなかった
David Abramは、プログラミングの本質はコード記述ではなく、システム理解や設計判断にあると述べ、LLMはこれらの課題を解決できないと主張している。
Beatsにノート機能を追加
著者が自身のブログに外部コンテンツを表示する「beats」機能に、リンクだけでなく説明文を追加できる「note」機能を実装した。
Starlette 1.0スキル
Simon Willison氏が、Claudeスキルを使用してStarlette 1.0を実験的に活用する方法を研究している。
ClaudeスキルでStarlette 1.0を試す
Kim Christieが2018年に開発を開始したPythonフレームワーク「Starlette」のバージョン1.0がリリースされた。Starletteは人気フレームワーク「FastAPI」の基盤となっているが、知名度は比較的低い。
PCGamer記事パフォーマンス監査
Stuart Breckenridgeが、PC Gamerの記事が37MBもの膨大なデータ量(自動再生動画広告を含む)をダウンロードするウェブ肥大化の例を指摘した。
JavaScriptサンドボックス化の研究
Aaron HarperがNode.jsワーカースレッドについて執筆し、研究者がJavaScriptをサンドボックスで実行する可能性を調査した。Claude Codeが初期の質問を超えて、isolated-vmとQuickJSの比較を含む詳細な分析を提供した。
DNSルックアップ
CloudflareのDNSサービス(1.1.1.1、1.1.1.2、1.1.1.3)がCORS対応のJSON APIを提供していることを発見したSimon Willison氏が、Claude Codeを使用して3つのリゾルバー全てに対してDNSクエリを実行するUIを構築した。
マージ状態ビジュアライザー
Bram CohenがCRDTを用いたバージョン管理の将来像について述べ、470行のPythonコードで説明した。彼はそのコードをClaudeに入力し、可視化ツールを生成した。