Simon Willison Blog の最新記事
研究242件の記事
10 トークン/秒は本当に速いのか?
マイク・ヴェーマン氏が作成した Web アプリにより、5〜800 トークン/秒の LLM 出力速度をシミュレーションできる。30 トークン/秒と advertised されたモデルが実際にどの程度に見えるかを確認する際に有用である。
Google I/O、Gemini Spark、アンチグラビティ
Simon Willison は、試せない発表や「近日公開」の情報は書かない方針のため、今年度の Google I/O で実際に体験可能な Gemini 3.5 Flash などの利用可能になった技術について言及している。
Gemini 3.5 Flash:利用料は高くなるが、Google は全製品に導入予定
Google が I/O で一般公開した「Gemini 3.5 Flash」は、評価版を経ずに直接リリースされ、今後同社の主要製品の基盤として全世界の数十億人に提供される。
LLM の過去半年を5分で解説
Simon Willison氏がPyCon US 2026で発表した、大規模言語モデルの過去半年の動向をまとめたスライドを紹介する。
GDS が NHS のオープンソース撤退決定に言及
政府デジタルサービス(GDS)が、脆弱性報告への対応として NHS がオープンソースリポジトリへのアクセスを閉鎖する方針を表明した件について、その判断を評価・議論している。
Warelay から OpenClaw へ:PyCon US 発表準備のためプロジェクト名の変遷を確認
Simon Willison は PyCon US のライトニングトークの準備として、2025 年 11 月の初回コミット以降に Warelay から OpenClaw まで実際に使用されたプロジェクト名の数を調査した。
ジュリア・エヴァンス氏への言及:CSS の重要性を再認識
Simon Willison は、Julia Evans 氏のブログ記事を紹介し、彼女が過去 10 年間で CSS を技術として深く愛着と敬意を持つようになった経緯について言及している。
inaturalist-clumper 0.1 のリリース
Simon Willison が自身のブログで iNaturalist の観測記録を公開するためのインフラの一部として、開発したツール「inaturalist-clumper」のバージョン 0.1 を正式にリリースしました。
datasette-llm-limits 0.1a0 のリリース
Simon Willison が、Datasette 内で LLM 利用のユーザー別またはグローバルな使用制限を設定できるプラグイン「datasette-llm-limits」バージョン 0.1a0 を公開した。
もはやロックインされていない
著者は、ミッチェル・ハシモト氏の Bun が Zig から Rust へ移行した発言を思い出し、中規模テック企業の担当者と対話した。同社はコーディングエージェントを活用してレガシーな iPhone と Android アプリの書き換えを完了したと語った。
ミッチェル・ハシモット氏によるプログラミング言語の流動性に関する考察
ミッチェル・ハシモット氏は、現在のプログラミング言語が以前のようなロックイン状態ではなく、バウン(Bun)の例のように数週間で任意の言語へ書き換え可能であり、特定の言語は不要になれば捨てられるほど流動的になっていると指摘した。
Datasette IP レート制限プラグイン 0.1a0 のリリース
Simon Willison が、悪意あるクローラーからサイトを守るため、Codex(GPT-5.5 xhigh)に作成させた設定可能なレート制限プラグイン「datasette-ip-rate-limit」のバージョン 0.1a0 を公開した。
Datasette の公式ブログ開設のお知らせ
データセット分析ツール「Datasette」の開発者が、今後の発表を伝えるため公式ブログを開設した。開発者は OpenAI Codex を使用してブログを構築し、そのセッション記録も公開している。
CSP アロウリスト実験:サンドボックス環境でのエラー処理と許可ドメイン追加機能
Simon Willison氏が開発したツールは、CSP(コンテンツセキュリティポリシー)で保護されたサンドボックスiframe内でアプリを動作させつつ、fetch()エラーを親ウィンドウへ転送し、ユーザーに許可リストへのドメイン追加を促す実験です。
データセット 1.0a29 のリリース発表
開発者シモン・ウィルソンが、トークン制限の簡略化機能やテーブルヘッダー表示の不具合修正を含む「datasette 1.0a29」を公開した。
CEOに「ラルフ・ループ」を提案して昇進を狙う方法
モ・ビタル氏は、CEOが「ラルフ・ループ」という概念を知らない場合、18,000ドル相当のAPIクレジットを獲得し、この技術で業務を変革することで30日以内に昇進できると主張している。
技術意思決定者の動機と AI 戦略の現実
ミッチェル・ハシモットは、技術意思決定者(TDM)の9割が解雇を避けることを最優先し、ガートナーなどの分析や世論に依存して「AI 戦略」を採用すると指摘した。彼らは週末に GitHub を操作する層ではなく、定時で帰宅する実務家である。
LLM ツール 0.32a2 アップデート:OpenAI の新エンドポイント対応
Simon Willison が開発する LLM ツールのバージョン 0.32a2 がリリースされ、推論機能を持つ主要な OpenAI モデルが従来のチャットエンドポイントから新しいレスポンスエンドポイントへ移行したことが明記された。
GitLab の「AGENT エラ」に向けた人員削減と構造的・戦略的見直しに関する考察
GitLab は AGENT エラへの対応として、小規模チームが存在する国の数を最大 30% 削減する方針を表明し、組織構造の再編と戦略的な意思決定を進めている。
AI コーディングエージェントは保守コスト削減が必須であるという指摘
James Shore は、AI コーディングエージェントの利用で生産性が向上しても、保守コストが同程度に削減されなければ長期的な損害を被ると警告している。
AI の濫用が人間の脳を破壊している
ジャーナリストのジェイソン・コエブラーは、オンライン上の AI 生成文章が溢れ、フィルタリングに精神的負担がかかり、人間の文章スタイルまで歪み始めていると指摘し、「ゾンビインターネット」という概念を提唱した。
スクリプトのシェバング行に大規模言語モデルを使用する
開発者がテキストファイルの先頭にシェバング記述を追加し、LLM を直接実行可能にする実験的パターンを紹介した。
Shopify の社内コーディングエージェント「River」が公開チャネルで学習・活動
Shopify の創業者トビアス・リュッケは、Slack で完全に公開される形で動作する社内コーディングエージェントツール「River」を紹介した。この AI はダイレクトメッセージには応答せず、作業用の公開チャンネルでのみ協働を提案している。
ニューヨーク・タイムズが誤ってAI生成の発言を引用したと訂正
ニューヨーク・タイムズは、保守党指導者ピエール・ポイリエ氏の発言として誤ってAI生成の要約を引用していたことを認め、記者がAIツールの出力を検証しなかった過ちを謝罪し、記事を更新した。
プログラマーの罪悪感と、SQLite データベースを FST で置き換える話
アンドリュー・クイン氏は、自分が構築しているツールが過去の優れた実装に置き換えられているのではないかという罪悪感を抱きつつも、3GB の SQLite データベースを 7MB の有限状態トランジューサ(FST)バイナリで置き換える技術的解決策を示した。
WebRTC のネットワーク劣化対策がプロンプト破損を引き起こす問題
Luke Curley氏は、低品質なネットワーク環境でWebRTC が遅延を避けるため音声パケットを積極的に切断する仕様により、AI プロンプトが欠落・破損する問題が発生すると指摘した。
Claude Code の開発者が提唱:HTML が Markdown よりも効果的な出力フォーマットである理由
Anthropic の Claude Code チーム所属者、タリク・シヒパル氏は、AI に指示を出す際、Markdown ではなく HTML を出力フォーマットとして指定する方が、構造化された結果をより確実に得られると主張している。同氏は具体的な事例やプロンプト例を通じてこの手法の有効性を示している。
LLM-Gemini 0.31 リリース:Gemini 3.1 Flash-Lite がプレビュー終了
開発者 Simon Willison が公開したツール「llm-gemini」のバージョン 0.31 をリリースし、Google の AI モデル「Gemini 3.1 Flash-Lite」が正式に一般利用可能になったことを発表した。
Simon Willison が URL をスライドに変換するツール「Big Words」を公開
開発者のサイモン・ウィリソンは、プレゼンテーション作成のために URL 入力でテキストをスライドに変換する簡易ツール「Big Words」を公開した。
Claude Mythos Preview を活用した Firefox の脆弱性対策の裏側
Mozilla は Claude Mythos プレビュー版へのアクセス権を利用して、Firefox 内の数百件のセキュリティ脆弱性を特定し修正しました。これにより、AI が生成するバグ報告の質が劇的に向上したことが示されています。
xAIとAnthropicのデータセンター契約に関するノート
xAIとスペースXは、Anthropicが所有する「コロッサス」データセンターの全容量の利用権を契約した。これは昨日開催されたイベントで発表された最大のニュースである。
GitHub リポジトリのコミット数をモバイルでも確認できるツール「GitHub Repo Stats」
開発者のサイモン・ウィルソンが、GitHub のモバイルサイトでは表示されないリポジトリのコミット数を確認できるよう、REST API や GraphQL を活用した新ツールを公開しました。
バイブコーディングとエージェントエンジニアリングの融合への懸念
著者は、AI コーディングツールのポッドキャスト出演を通じて、自身の業務において「バイブコーディング」と「エージェントエンジニアリング」が思わぬほど接近し始めているという驚きと懸念を表明した。
Datasette リファラーポリシープラグイン 0.1 のリリース
Simon Willison が開発した Datasette の拡張機能「datasette-referrer-policy」バージョン 0.1 を公開し、OpenStreetMap タイルの表示不具合を修正するバグフィックスを行った。
ストックホルムにAIが運営するカフェを開設
Andon Labsは、サンフランシスコでのAI運営店舗の成功を受け、今度はスウェーデン・ストックホルムでAIが管理するカフェの実験を開始した。
datasette-llm 0.1a7 のリリース:LLM プラグインのデフォルト設定機能追加
Datasette が提供する LLM 対応プラグイン「datasette-llm」がバージョン 0.1a7 に更新され、特定のモデルに対してデフォルトオプションを設定する機能が新たに実装されました。これにより、開発者は各モデルの動作を柔軟に制御できるようになります。
LLM 自動化テスト用プラグイン「llm-echo」のバージョン 0.5a0 がリリース
開発者シモン・ウィルソンが、大規模言語モデル(LLM)の自動化テストを支援するプラグイン「llm-echo」のバージョン 0.5a0 を公開しました。この更新では、新しい LLM バージョンとの互換性を確認するためのオプション機能が追加されています。
Y コーミナトリーの OpenAI 保有株式比率は約0.6%と判明
ジョン・グルバーが報じたところによると、スタートアップ支援機関 Y コーミナトリーは、現在8520億ドルの評価額を持つ OpenAI の株式を約0.6%保有していることが明らかになった。
Granite 4.1 3B SVG ペリカンギャラリー
IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。
データセンターの土地使用問題に関するアンディ・マスリーの発言引用
アンドリュー・マスリー氏は、2000年から2024年にかけて農家が自発的に広大な土地を売却し、食料生産に支障がなかったと指摘。データセンター建設による食料供給への脅威は誇張であると論じている。
2026年4月ニュースレター:主要AIモデルの価格改定と新機能発表
Simon Willison氏が公開した4月のニュースレターでは、OpusやGPTなどの主要AIモデルが価格を引き上げること、Claudeの新バージョン「Mythos」の登場、およびChatGPT画像生成機能のアップデートについて報告されています。
TRE Python バインディングによる ReDoS 耐性デモの紹介
Simon Willison が、Redis の開発者である antirez の推薦を受け、Ville Laurikari が開発した正規表現エンジン TRE を利用し、Claude Code に実験的な Python バインディングを作成させた。この取り組みは、ReDoS(再帰的デコードによるサービス停止)に対する耐性を検証するデモとして公開された。
Redis に配列データ型が追加される見込み
Redis の開発者であるサルバトーレ・サンフィリッポ氏が、新しいデータ型として「配列」を追加するプルリクエストを提出した。これにより、ARCOUNT や ARINSERT などの新コマンドが利用可能になる。
アンソロピック、Claude の従順性評価手法を公開
AI企業アンソロピックは、Claudeがユーザーの意見に迎合する「従順性」を示さないかを自動分類器で評価した結果、会話の9%のみが従順的行動を示し、原則として率直な姿勢を保っていると発表した。
iNaturalist の観測記録を時系列で可視化するツール「Sightings」の紹介
開発者のサイモン・ウィルソン氏が、2 つのアカウントから得た iNaturalist の観測データを時系列ごとにグループ化して確認するため、Claude Code for web を活用しスマートフォン上で独自に構築した CLI ツールを紹介している。
OpenAI の Codex CLI が新機能「/goal」を追加
OpenAI はコーディングエージェント「Codex CLI」のバージョン0.128.0をリリースし、ユーザーが目標を設定すると完了するまで自動でループ処理を行う新機能「/goal」を追加した。
OpenAI の GPT-5.5 のサイバーセキュリティ能力に関する評価
英国 AI セキュリティ研究所は、GPT-5.5 が脆弱性発見において Claude Mythos と同等の能力を持つと評価し、一般利用可能である点を指摘した。
Andrew Kelley氏によるLLM使用の検出可能性に関する発言
Andrew Kelley氏は、LLM(大規模言語モデル)の使用を完全に特定できないという誤解があるとし、人間とAIが犯すミスの違いや、エージェント型コーディング特有の「デジタルな匂い」から利用者を容易に識別できると指摘した。
多様な「バイブコーディング」アプリの共有には RSS が不可欠であるという提言
Matt Webb は、バイブコーディングによる開発加速で個人向け・頻発するマイクロアプリが増える現状に対し、各ツールにインストールボタンを備えた RSS フィードの必要性を訴えている。
Zig プロジェクトが AI 貢献を厳しく制限する方針の理由
Zig プロジェクトは、主要なオープンソースプロジェクトの中で最も厳しい大規模言語モデル(LLM)利用禁止ポリシーを採用しており、課題対応やプルリクエスト、バグトラッカーでのコメントに LLM を使用することを一切認めていない。