Simon Willison Blog の最新記事
研究242件の記事
LLM 0.32a0 は主要な後方互換性のあるリファクタリング
開発者が LLM Python ライブラリと CLI ツールのアルファ版「LLM 0.32a0」をリリースし、プロンプトとレスポンスに基づく従来のモデルから変更された重要なリファクタリングを実施した。
OpenAI Codex のベース指示:ファンタジー生物の言及制限について引用
GitHub に公開された OpenAI Codex の設定ファイルから、ユーザーの質問に絶対に関連する場合を除き、ゴブリンやトロールなどの架空生物や動物への言及を禁止するシステム指示が抽出されました。
マシュー・イグレシアス氏による引用
ジャーナリストのマシュー・イグレシアス氏は、個人が「ヴィーコード」するのではなく、専門的に運営されるソフトウェア企業がAIコーディング支援を活用して、より多く・より良い・安価な製品を消費者に販売すべきだと主張している。
pip 26.1 の新機能:ロックファイルと依存関係のクールダウン
Richard Si 氏は、Python のパッケージ管理ツール pip の新版 26.1 で導入されたロックファイル機能と依存関係のクールダウン機構について解説している。また、Python 3.9 のサポート終了にも言及し、開発環境の標準化が進んでいることを示している。
1930年代風の13Bパラメータ言語モデル「talkie」の発表
GPT開発者の一人であるAlec Radfordらにより、1930年代の文体を模した13Bパラメータの言語モデル「talkie」が公開された。このプロジェクトは、過去の文書スタイルを学習した独自の言語モデルの実装を示している。
MicrosoftのVibeVoice:MITライセンスのWhisper風音声モデル
マイクロソフトは1月21日、MITライセンスの音声認識モデル「VibeVoice」を公開した。話者識別機能を内蔵し、Whisperと同等の性能を持つ。
現在消滅したOpenAIとMicrosoftのAGI条項の履歴を追跡
マイクロソフトは2019年、OpenAIとのパートナーシップ契約にAGI達成時に知的財産権が無効化する条項を設けていた。この特異な条項のウェブサイト上での表現変化を追跡し、本日付でその効力が終了したと報じている。
Google Meetの音声翻訳機能がモバイルデバイスへ展開中
Googleは、Google Meetにおけるリアルタイム音声翻訳機能をスマートフォンやタブレットなどのモバイルデバイスへ順次展開し始めた。これにより、ユーザーは移動中でも異なる言語を話す相手と円滑にコミュニケーションを取れるようになる。
なぜあなたは如此なのか
Twitterユーザーのスコット・ラウは、ペリカンが自転車に乗るベンチマークに対し、テストを積み重ねる必要があると指摘した。
ロマン・ヒュエ氏の発言を引用
OpenAIのロマン・ヒュエ氏は、GPT-5.4でCodexを統合し、GPT-5.5のコーディング・PC操作能力が大幅向上したと明言し、別個のCodexモデルはリリースしないと確認した。
GPT-5.5 プロンプティングガイド
OpenAIはAPIで利用可能になったGPT-5.5の最適なプロンプト方法に関するガイドを公開し、応答前に長時間思考するアプリケーション向けの有用なヒントを提供している。
llm 0.31 リリース
llm開発者のsimonwはバージョン0.31を公開し、OpenAIのGPT-5.5モデルと冗長性設定オプションを追加した。
「人々は自動化を求めているわけではない」
The Vergeのニライ・パテルは、ChatGPT利用急増にもかかわらずAIが一般に嫌われる理由を分析する。人々は自動化を望まず、「ソフトウェア脳」による混乱を懸念していると指摘する。
DeepSeek V4:最前線に近い性能、価格は数分の1
中国のAIラボDeepSeekは、100万トークンコンテキストとMoEアーキテクチャを採用したV4シリーズのプレビューモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を公開した。
ミリ秒コンバーター
Simon Willison氏は、LLMの応答時間をミリ秒で表示する仕様を確認し、手動計算の手間を省くため「Millisecond Converter」ツールを作成した。
今週は特大号
シモン・ウィルソンは、今週のニュースレターでAI生成画像やブログ記事5本、そして「Agentic Engineering Patterns」の新しい章を公開した。
Claude Codeの品質報告に関する最新アップデート
アンソロピックはClaude Codeの品質低下苦情を調査し、AIモデル自体に問題はなく、ツール環境内の3つの不具合が原因であることを明らかにし、詳細な事後報告を公開した。
「おすすめ」フィードの提供
Blueskyはユーザーが独自のフィードアルゴリズムを公開できる仕組みを提供する。spacecowboy氏はこの機能を用いて、任意の推薦メカニズムで投稿を整理する「For You」フィードを運用している。
ブラウザでPDFテキストを抽出する「LiteParse for the web」
開発者はLlamaIndexの「LiteParse」をブラウザ環境へ移植し、PDFテキスト抽出ツールを公開した。AIモデルを使用せず従来の解析手法で動作する。
半公式CodexバックドアAPI経由のGPT-5.5用ペリカン
OpenAIはGPT-5.5をCodexおよび有料ChatGPTユーザー向けにリリースした。筆者はプレビュー版で高速・高精度を評価したが、公式APIは提供されていない。
LLM-OpenAI-Via-Codex のバージョン 0.1a0 がリリース
開発者のサイモン・ウィリソン氏が、Codex CLI の認証情報を流用して大規模言語モデル(LLM)に API 呼び出しを行うツール「llm-openai-via-codex」の初期版 0.1a0 を公開した。
Qwen3.6-27B:270億パラメータの密型モデルでフラッグシップ級コーディング性能
Qwenチームは270億パラメータの密型モデル「Qwen3.6-27B」を公開し、エージェント型コーディング性能で前世代の大型モデルを上回るフラッグシップ級の実績を達成した。
ボビー・ホーリー氏の引用
MozillaはAnthropicと共同でClaude Mythos PreviewをFirefoxに適用し、271件の脆弱性を特定してFirefox 150で修正した。
「GitHub Copilot 個人向けプランの変更」
GitHubは、AnthropicのClaude Code価格混乱と対照的に、公式にGitHub Copilot個人向けプランの価格改定を発表した。
Claude Codeは月額100ドルになるのか?おそらくならない-すべてが非常に混乱している
AnthropicはClaudeの価格ページを非公開で更新し、Claude Codeの月額100ドル案を追加したが、サポートページが未反映で混乱を招き、直ちに撤回された。
「ハムラジオを持つアライグマはどこ?(ChatGPT Images 2.0)」
OpenAIは画像生成モデル「ChatGPT Images 2.0」を公開した。サム・アルトマンCEOは性能向上をGPT-3からGPT-5の飛躍と評価し、筆者はテストした。
アンドレアス・ポールソン=ノティニ氏の引用
アンドレアス・ポールソン=ノティニ氏は、現在のAIエージェントが厳密性や集中力に欠けるなど「人間らしすぎる」特性を示すと指摘し、より機械的な動作を設計するよう求めている。
scosman/pelicans_riding_bicycles(ペリカン自転車画像データセット)
スティーブ・コスマン氏はペリカンが自転車に乗る画像を公開し、サイモン・ウィルソン氏がこれがAI学習データの汚染テストに有効だと評価している。
llm-openrouter 0.6 のリリース
Simon Willison は llm-openrouter バージョン 0.6 をリリースした。このアップデートでは、利用可能なモデル一覧をキャッシュ期限を待たずに更新する「refresh」コマンドが追加された。これにより、ユーザーは Kimi 2.6 など新モデルの提供開始を即座に確認・利用できるようになる。
Datasetteからデータを取得するGoogle SheetsのSQL関数
筆者は、Google Sheetsのimportdata関数やApps Scriptを用いてDatasetteからデータを取得する実装パターンを解説している。
Claudeトークンカウンター、モデル比較機能を追加
シモン・ウィルソン氏はClaudeトークンカウンターを改良し、複数モデルのトークン数を比較する機能を追加した。Opus 4.7はトークナイザーを変更したため、主に同モデルと4.6の比較に利用可能である。
パーソナルAIのための「ヘッドレス化」の普及
マット・ウェブ氏は、パーソナルAIがGUI操作よりAPI経由のヘッドレスサービスと連携する方が高速で安定し、ユーザー体験も向上するため、今後ヘッドレス化が普及すると予測する。
Claude Opus 4.6と4.7のシステムプロンプトの変更点
Anthropic社が、Claude Opus 4.7のリリースに伴い、ユーザー向けチャットシステムのシステムプロンプトを更新した。同社は主要AI研究所で唯一、システムプロンプトを公開している。
ClaudeのシステムプロンプトをGitタイムラインとして
AnthropicがClaudeチャットのシステムプロンプトを公開し、GitHubリポジトリで各モデルごとのファイルとして管理している。研究者がこの公開情報を分析し、システムプロンプトの変更履歴を追跡できる環境を構築した。
ブログからニュースレターへのツールに新しいコンテンツタイプを追加
Simon Willison氏が、自身のブログからSubstackニュースレターへの自動転送ツールに新しいコンテンツタイプを追加し、エージェンティック・エンジニアリング・パターンの例として短いプロンプトで多くの作業を完了させた手法を紹介した。
PyCon US 2026 in Long Beachに参加しよう - 今年は新たなAIとセキュリティトラックを導入
PyCon US 2026が5月にロングビーチで開催され、Pythonコミュニティが新たなAIとセキュリティのトラックを導入する。
Datasette 1.0a28のリリース
Simon Willison氏により、Datasette Cloudのアップグレードで発見された1.0a27版の互換性バグを修正した「Datasette 1.0a28」がリリースされた。
llm-anthropic 0.25リリース
Anthropicがllm-anthropic 0.25をリリースし、新モデル「claude-opus-4.7」を追加した。このモデルは「thinking_effort: xhigh」をサポートし、新たな「thinking_display」と「thinking_adaptive」オプションを導入した。
Qwen3.6-35B-A3BがClaude Opus 4.7より優れたペリカン画像を生成
著者が公開した自転車に乗るペリカンのベンチマークテストで、AlibabaのQwen3.6-35B-A3BがAnthropicのClaude Opus 4.7より優れた画像を生成したことを報告している。
datasette.io ニュースプレビュー
Simon Willison氏が、GitHubリポジトリ内のYAMLファイルから構築されたdatasette.ioウェブサイトのニュースセクションを紹介するツールを公開した。
Datasette 1.0a27のリリース
Datasette開発者はバージョン1.0a27を公開し、Django形式のCSRFトークン廃止とモダンブラウザヘッダーへの移行など、セキュリティ関連の主要な変更を実施した。
ジョン・グルーバーが引用する
ジョン・グルーバーは、Appleの競争優位性がApp Storeの手数料ではなく優れたアプリの存在にあり、それがiPhoneなどの魅力になると指摘するが、現在はサードパーティアプリの質が平均化しつつあり、その優位性が低下していると分析している。
Gemini 3.1 Flash TTS の公開
Google はプロンプトで制御可能な新しいテキスト読み上げモデル「Gemini 3.1 Flash TTS」を公開した。Gemini API経由で提供され、音声ファイルの出力のみに対応している。
Google の Gemini 3.1 Flash TTS モデルによる自然な音声合成ツール
Google は、単一話者および複数話者の会話モードに対応し、発声指示タグの適用も可能な「Gemini 3.1 Flash TTS」モデルを公開した。このツールにより、テキストから自然な音声を生成してダウンロードできるようになった。
カイル・キングズベリーの引用
カイル・キングズベリーは、AIシステムの責任を負う「肉の盾」としての役割が生まれると予測し、Metaのモデレーション監視や弁護士の法的責任など具体例を示した。
datasette-ports 0.3 のリリース
開発者simonが、ローカル上のDatasetteインスタンスの管理を支援するツール「datasette-ports」のバージョン0.3をリリースした。このアップデートでは、各プロセスIDから作業ディレクトリとデータベースファイルのフルパスを表示する機能が追加された。
Zig 0.16.0 リリースノート: "Juicy Main"
Zigプログラミング言語がバージョン0.16.0をリリースし、プログラムのmain()関数向けの依存性注入機能「Juicy Main」を導入した。
datasette PR #2689: トークンベースのCSRF保護をSec-Fetch-Siteヘッダー保護に置き換え
Datasetteプロジェクトが、従来のCSRFトークン方式をSec-Fetch-Siteヘッダーによる保護に置き換えるプルリクエストを公開した。
サイバー防衛の新時代に向けた信頼できるアクセス
OpenAIは、Claude Mythosに対抗する新モデル「GPT-5.4-Cyber」を発表した。同社は今後数ヶ月でより強力なモデルをリリースする準備として、防御的サイバーセキュリティ用途に特化したファインチューニングを進めている。
サイバーセキュリティは今やプルーフ・オブ・ワークのようだ
英国AI安全研究所がClaude Mythos Previewのサイバー攻撃能力を評価し、AIモデルのセキュリティリスクを独立分析した。