Simon Willison Blog の最新記事

研究

108件の記事

Gemma 4:バイト単位で最も能力の高いオープンモデル

Google DeepMindが、2B、4B、31Bサイズの3つの視覚対応推論LLMと、26B-A4BのMixture-of-Expertsモデル、計4つのApache 2.0ライセンスのオープンモデルを発表した。同社は「パラメータあたりの知能レベルが前例ない」と強調し、小型で有用なモデルの開発が現在の研究の最重要分野の一つであることを示している。

Simon Willison Blog·4月3日

llm-gemini 0.30

Simon Willison氏がllm-gemini 0.30をリリースし、gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it、gemma-4-31b-itの新モデルを追加した。

Simon Willison Blog·4月3日

2026年3月スポンサー限定ニュースレター

Simon Willisonがスポンサー向けに2026年3月のニュースレターを配信した。内容はエージェント型エンジニアリングパターン、MacでのMoEモデルによるストリーミング、3月のモデルリリース、Vibe porting、サプライチェーン攻撃に関する情報を含む。

Simon Willison Blog·4月2日

datasette-llm 0.1a6

Datasetteプロジェクトが、LLM統合ツール「datasette-llm」のバージョン0.1a6をリリースした。デフォルトモデルの設定を簡素化し、ドキュメントを改善した。

Simon Willison Blog·4月2日

datasette-enrichments-llm 0.2a1

DatasetteのLLMエンリッチメントプラグインがバージョン0.2a1をリリースし、エンリッチメントをトリガーするアクター情報をllm.modeメソッドに渡す機能を追加した。

Simon Willison Blog·4月2日

datasette-extract 0.3a0

Datasetteがdatasette-extractプラグインのバージョン0.3a0をリリースし、datasette-llmを統合してモデル管理を改善した。

Simon Willison Blog·4月1日

datasette-enrichments-llm 0.2a0

Datasette-enrichments-llmプラグインがバージョン0.2a0をリリースし、datasette-llmを介してLLMモデルの設定・管理を可能にした。これにより、データ強化に使用するモデルを指定できるようになった。

Simon Willison Blog·4月1日

datasette-llm-usage 0.2a0

Datasetteプロジェクトが、LLM使用状況追跡プラグイン「datasette-llm-usage」のバージョン0.2a0をリリースした。このリリースでは、割り当てと推定価格設定に関する機能を削除し、それらを別プラグイン「datasette-llm-accountant」に移管した。また、モデル設定のために「datasette-llm」への依存を追加した。

Simon Willison Blog·4月1日

datasette-llm 0.1a5

Datasette-LLMプロジェクトがバージョン0.1a5をリリースした。llm_prompt_context()プラグインフックがチェーン内のプロンプトも追跡可能になり、ツール呼び出しループの監視に使用できるようになった。

Simon Willison Blog·4月1日

Soohoon Choiの引用

Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。

Simon Willison Blog·4月1日

Axiosへのサプライチェーン攻撃、npmから悪意のある依存関係を引き込む

Socket.devが、週間1億1,400万ダウンロードのHTTPクライアントNPMパッケージ「Axios」のバージョン1.14.1と0.30.4に、新たに公開されたマルウェア「plain-crypto-js」が依存関係として含まれていたと報告した。

Simon Willison Blog·4月1日·★★★★

datasette-llm 0.1a4

Datasette-LLMがバージョン0.1a4をリリースし、目的別に異なるAPIキーを設定する機能を追加した。例えば、エンリッチメント専用のAPIキーでgpt-5.4-miniを使用できるようになった。

Simon Willison Blog·4月1日

llm-all-models-async 0.1

Simon Willison氏が、LLMプラグイン向けの非同期モデル定義機能をリリースした。API連携モデル向けの非同期バリアントを提供する。

Simon Willison Blog·4月1日

llm 0.30リリース

Simon Willison氏が開発するLLMツールのバージョン0.30がリリースされた。今回のアップデートでは、register_models()プラグインフックにmodel_aliasesパラメータが追加され、他のプラグインが登録したモデルやエイリアスを参照できるようになった。

Simon Willison Blog·4月1日

llm-echo 0.4

Simon Willison氏が、LLMプロンプトのレスポンスにinput_tokensとoutput_tokensフィールドを追加したllm-echo 0.4をリリースした。

Simon Willison Blog·4月1日

llm-echo 0.3

Simon Willison氏がllm-echo 0.3をリリースし、ツール呼び出しテスト機能と生レスポンステスト機能を追加した。

Simon Willison Blog·4月1日

datasette-files 0.1a3

Simon Willison氏が、datasette-filesプラグインの新バージョン0.1a3をリリースした。このリリースでは、他のプラグイン(datasette-extractなど)との統合作業に必要な設定オプションを追加した。

Simon Willison Blog·3月31日

ゲオルギ・ゲルガノフ氏の発言を引用

ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。

Simon Willison Blog·3月31日

datasette-llm 0.1a3

Datasette-LLMプロジェクトがバージョン0.1a3をリリースし、特定の目的に対して利用可能なLLMを設定する機能を追加した。これにより、プラグインごとに使用できるモデルを制限できるようになった。

Simon Willison Blog·3月31日

Mr. Chatterboxは(弱い)ビクトリア朝時代の倫理的に訓練されたモデルで、自身のコンピュータで実行可能

Trip Venturella氏が、英国図書館の著作権切れテキストのみで訓練した言語モデル「Mr. Chatterbox」を公開した。同モデルは1837年から1899年に出版された28,000以上のビクトリア朝英国テキストで完全に一から訓練されている。

Simon Willison Blog·3月30日

llm-mrchatterbox 0.1

Simon Willison氏が、ローカルPCで実行可能なヴィクトリア朝倫理訓練済みモデル「Mr. Chatterbox」の初版リリースを発表した。

Simon Willison Blog·3月30日

Pretext

Reactコア開発者のCheng Lou氏が、DOMに触れずに折り返しテキストの高さを計算する新しいブラウザライブラリ「Pretext」を発表した。

Simon Willison Blog·3月30日

Pretext — 内部構造

Simon Willison氏が、Pretextというツールの内部構造について解説し、関連するノートを公開している。

Simon Willison Blog·3月30日

Python脆弱性検索ツール

Simon Willison氏が、OSV.devのオープンソース脆弱性データベースのJSON APIを活用し、Claude Codeを使用してpyproject.tomlまたはrequirements.txtファイルを貼り付けるだけでPythonパッケージの脆弱性を検索できるHTMLツールを構築した。

Simon Willison Blog·3月30日

マット・ウェブの引用:エージェント的コーディングについて

マット・ウェブは、AIエージェントがコーディング問題を解決する際に、効率的で保守性・適応性・構成可能性のある方法を求めるべきだと指摘している。

Simon Willison Blog·3月28日

datasette-showboat 0.1a2

開発者Simon Willisonが、アプリからMarkdownファイルをエクスポートするオプションを追加し、Showboatがリモートサーバーに更新を段階的に公開できるようにした。

Simon Willison Blog·3月28日

リチャード・フォンタナの引用

リチャード・フォンタナは、chardet 7.0.0がLGPLでリリースされる必要がある根拠は現在見当たらず、著作権侵害の理論も提示されていないと述べている。

Simon Willison Blog·3月28日

SwiftUIアプリをヴァイブコーディングするのはとても楽しい

筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。

Simon Willison Blog·3月28日

AIで1日でJSONataを書き直し、年間50万ドルを節約

Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。

Simon Willison Blog·3月27日

LiteLLMマルウェア攻撃への分単位の対応

Callum McMahonがPyPIにLiteLLMマルウェア攻撃を報告し、Claudeのトランスクリプトを使用して脆弱性を確認し、対応策を決定した。Claudeは悪意あるコードを確認後、PyPIのセキュリティ連絡先を提案した。

Simon Willison Blog·3月27日·★★★★

量子化の基礎から解説

Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。

Simon Willison Blog·3月27日

datasette-files-s3 0.1a1

Datasetteプロジェクトが、datasette-filesのバックエンドとしてS3バケットを使用してファイルを保存・取得する機能を追加した。このリリースでは、URLから定期的にS3設定を取得するメカニズムを実装した。

Simon Willison Blog·3月26日

スピードを落とすことについての考察

Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。

Simon Willison Blog·3月26日

datasette-llm 0.1a1

Datasetteプロジェクトが、他のDatasetteプラグインがLLMのモデルを利用できるようにする基本プラグインの新バージョンをリリースした。

Simon Willison Blog·3月26日

LiteLLMハッキング:あなたは47,000人のうちの一人でしたか?

Daniel HnykがBigQuery PyPIデータセットを使用し、悪意のあるLiteLLMパッケージがPyPIで公開されていた46分間のダウンロード数が約47,000件あったことを明らかにした。

Simon Willison Blog·3月26日

Claude Code向け自動モード

Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。

Simon Willison Blog·3月25日

パッケージマネージャーは冷静になる必要がある

著者がLiteLLMのサプライチェーン攻撃を契機に、依存関係の更新を数日間待つ「クールダウン」の実践を再検討し、パッケージマネージャーのセキュリティ対策の重要性を主張している。

Simon Willison Blog·3月25日·★★★★

クリストファー・ミムズの引用

ウォール・ストリート・ジャーナルの技術コラムニスト、クリストファー・ミムズは、AIにコンピューターと人生の完全な制御を委ねることは、後から見れば愚かであり、そのような選択をした人々はバカに見えるだろうと述べている。

Simon Willison Blog·3月25日

litellm 1.82.8における悪意あるlitellm_init.pth — 認証情報窃取ツール

LiteLLM v1.82.8パッケージがPyPIで公開された際、litellm_init.pthファイルにbase64で隠された認証情報窃取ツールが含まれており、パッケージをインストールするだけで発動する危険性があった。

Simon Willison Blog·3月25日

ストリーミングエキスパート

Dan Woods氏が、RAM容量が不足するハードウェアで大規模なMixture-of-Expertsモデルを実行する手法「ストリーミングエキスパート」を実験している。この手法では、処理するトークンごとに必要なエキスパートの重みをSSDからストリーミングする。

Simon Willison Blog·3月24日

Neuroticaの引用

AI研究者のNeuroticaは、AI生成コンテンツ(スロップ)が人間の消費努力を生産努力より多く要し、同僚が未編集のGemini出力を共有することは時間の価値の軽視だと指摘している。

Simon Willison Blog·3月24日

datasette-files 0.1a2

Datasetteプロジェクトが、Datasetteインスタンスにファイルを直接アップロードできる新プラグイン「datasette-files」のアルファ版0.1a2をリリースした。

Simon Willison Blog·3月24日

機械はあなたの技術を奪わなかった

David Abramは、プログラミングの本質はコード記述ではなく、システム理解や設計判断にあると述べ、LLMはこれらの課題を解決できないと主張している。

Simon Willison Blog·3月24日

Beatsにノート機能を追加

著者が自身のブログに外部コンテンツを表示する「beats」機能に、リンクだけでなく説明文を追加できる「note」機能を実装した。

Simon Willison Blog·3月23日

Starlette 1.0スキル

Simon Willison氏が、Claudeスキルを使用してStarlette 1.0を実験的に活用する方法を研究している。

Simon Willison Blog·3月23日

ClaudeスキルでStarlette 1.0を試す

Kim Christieが2018年に開発を開始したPythonフレームワーク「Starlette」のバージョン1.0がリリースされた。Starletteは人気フレームワーク「FastAPI」の基盤となっているが、知名度は比較的低い。

Simon Willison Blog·3月23日

PCGamer記事パフォーマンス監査

Stuart Breckenridgeが、PC Gamerの記事が37MBもの膨大なデータ量(自動再生動画広告を含む)をダウンロードするウェブ肥大化の例を指摘した。

Simon Willison Blog·3月23日

JavaScriptサンドボックス化の研究

Aaron HarperがNode.jsワーカースレッドについて執筆し、研究者がJavaScriptをサンドボックスで実行する可能性を調査した。Claude Codeが初期の質問を超えて、isolated-vmとQuickJSの比較を含む詳細な分析を提供した。

Simon Willison Blog·3月23日

DNSルックアップ

CloudflareのDNSサービス(1.1.1.1、1.1.1.2、1.1.1.3)がCORS対応のJSON APIを提供していることを発見したSimon Willison氏が、Claude Codeを使用して3つのリゾルバー全てに対してDNSクエリを実行するUIを構築した。

Simon Willison Blog·3月23日

マージ状態ビジュアライザー

Bram CohenがCRDTを用いたバージョン管理の将来像について述べ、470行のPythonコードで説明した。彼はそのコードをClaudeに入力し、可視化ツールを生成した。

Simon Willison Blog·3月23日