#llm のAIニュース

952件の記事

【AIニュース】グッドフライデー

Gemmaの好意的な評価が継続しており、Marc Andreesenのポッドキャストで高い評価を得ている。来週ロンドンで開催されるAIE Europeでは、OpenClawやPiなどの欧州発AIツールのクリエイターが登壇し、ライブ配信される。

Latent Space·4月4日·★★★★

ウィリー・タローを引用して

Linuxカーネル開発者が、AI関連の脆弱性報告が急増し、1日5〜10件に達していると指摘し、対応のためにメンテナーを増員したことを明らかにした。

Simon Willison Blog·4月4日

ダニエル・ステンバーグが語る

cURLのリード開発者ダニエル・ステンバーグは、オープンソースセキュリティにおけるAIの課題が、AIによる低品質な報告の氾濫から、多くの有用なセキュリティレポートの氾濫へと変化したと述べている。彼は現在、この対応に1日数時間を費やしている。

Simon Willison Blog·4月4日

グレッグ・クローハートマンが語る

グレッグ・クローハートマン氏は、数か月前は明らかに間違っている低品質のAI生成セキュリティレポートが多かったが、1か月前から状況が変化し、現在はAIで作成された高品質で信頼性のあるレポートがオープンソースプロジェクトで使用されていると述べた。

Simon Willison Blog·4月4日

Deepseek v4、全モデルをファーウェイ製チップで稼働へ 中国のAI自立化推進で大きな前進

Deepseek社は、次期AIモデル「Deepseek v4」をファーウェイ製チップのみで稼働させると発表した。中国の主要テック企業は既に数十万単位で発注済みで、NVIDIAは初期テストから除外された。

The Decoder·4月4日·★★★★

Anthropic、Claude Codeの使用量急増はピーク時間制限とコンテキスト拡大が原因と説明

Anthropicは、Claude Codeユーザーの使用制限が急速に消費される理由として、ピーク時間帯の制限とコンテキストの拡大を挙げ、トークン使用量削減のヒントを共有した。

The Decoder·4月3日

システム向けAI:LLMを用いたデータベースクエリ実行の最適化

新研究により、大規模言語モデル(LLM)が統計ヒューリスティックが見逃す基数推定エラーを修正し、データベースクエリの実行計画を最適化できることが示された。これにより最大4.78倍の高速化が実現する。

Together AI Blog·4月3日·★★★★

llm-gemini 0.30 のリリース

Simon Willison が公開した llm-gemini バージョン 0.30 は、Gemini 3.1 Flash Lite Preview および Gemma 4 の大規模モデル(26B、31B)に対応した。これにより、これらの新モデルをローカル環境で利用可能になる。

Simon Willison Blog·4月3日

Gemma 4:バイト単位で最も能力の高いオープンモデル

GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。

Google DeepMind·4月3日·★★★★

AI #162:ミソスのビジョン

AnthropicはClaude Codeのソースコード漏洩や、サイバー能力を大幅に向上させた新モデル「Mythos」の存在が明らかになった。また、AxiosやLiteLLMなどのセキュリティ侵害事例が増加し、攻撃側の試行回数が拡大している現状が報告された。

The Zvi·4月2日·★★★★

AIパフォーマンスの測定が困難になる理由

記事は、自律走行車の未来に関する著者の賭け話やポッドキャストの紹介を挟みつつ、AIのパフォーマンス評価が複雑化している現状について言及している。

Understanding AI·4月2日·★★★★

自己維持可能なCI ── Goテストの失敗をClaudeで自動修復する仕組み

LayerXのshibutani氏が、Goテストの失敗を検知するとClaudeがログを分析し、担当チームに通知して修正PRを作成する自動修復システムを構築した。

LayerX Tech Blog·4月2日

階躍 Step 3.5 Flash シリーズ新登場!全 Step Plan ユーザーが体験可能に!

階躍星辰が最新モデル「Step 3.5 Flash 2603」をリリースし、全Step Planユーザーに開放した。新機能「low think mode」によりトークン消費削減と出力効率向上を実現し、Coding/Agentフレームワークを最適化した。

阶跃星辰·4月2日

大規模言語モデルにおける感情概念とその機能

研究者が、大規模言語モデルにおける感情概念の機能と解釈可能性について分析した。

Anthropic Research·4月2日·★★★★

異種嗜好アラインメントのためのパーソナライズドグループ相対ポリシー最適化

研究者らは、大規模言語モデル(LLM)が多様な個人嗜好に適合できない問題に対処するため、パーソナライズドグループ相対ポリシー最適化(P-GRPO)を提案した。この手法は、従来のGRPOがグループ内でサンプルを交換可能と仮定する制限を克服し、異なるユーザーグループの嗜好に個別に適合するポリシーを学習する。

Apple Machine Learning·4月2日·★★★★

Claudeの知能を活用する

Anthropicが開発したAIアシスタント「Claude」の知能を、様々なタスクや応用分野で効果的に活用する方法について説明している。

Claude Blog·4月2日

datasette-llm 0.1a6 のリリース

データセット管理ツール「datasette-llm」のバージョン0.1a6がリリースされた。このアップデートでは、デフォルトモデルの設定時に許可リストへの重複登録が不要になるよう仕様が改善され、ドキュメントも強化された。

Simon Willison Blog·4月2日

datasette-enrichments-llm 0.2a1 のリリース

データセット拡張ライブラリ「datasette-enrichments-llm」のバージョン0.2a1が公開された。このアップデートでは、拡張処理をトリガーする「actor」情報をLLMメソッドに渡す機能が追加され、処理の文脈が明確になった。

Simon Willison Blog·4月2日

GPT-5.4 miniがCopilot Studentの自動モデル選択で利用可能に

GitHubがCopilot StudentプランでGPT-5.4 miniを自動モデル選択機能を通じて一般提供開始した。このモデルはVisual Studio Code、Visual Studio、JetBrains IDE、Xcode、EclipseのGitHub Copilot Chatで利用できる。

GitHub Changelog·4月2日

datasette-extract 0.3a0のリリース

データセットプラグイン「datasette-llm」を利用し、モデルの構成と管理を可能にした。これにより、利用可能なモデルを指定してデータ強化に使用できるようになった。

Simon Willison Blog·4月1日

バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始(インターン含む)

バイトダンスが、2027年卒の学生を対象に、大規模言語モデル分野の人材採用を開始した。同社は「知能の限界に挑戦する」と掲げ、新卒・インターン採用を実施している。

字节跳动Seed·4月1日

datasette-enrichments-llm 0.2a0 のリリース

Datasette プラグイン「datasette-enrichments-llm」のバージョン0.2a0がリリースされた。このアップデートにより、モデルの構成と管理を「datasette-llm」に統合し、利用可能なモデルを指定可能になった。

Simon Willison Blog·4月1日

datasette-llm-usage 0.2a0 のリリース

DatasetteのLLM使用量計測プラグイン「datasette-llm-usage」がバージョン0.2a0へ更新された。従来機能の一部は別プラグインへ移行し、モデル設定には「datasette-llm」への依存が必須となった。

Simon Willison Blog·4月1日

datasette-llm 0.1a5 のリリース

「datasette-llm」バージョン0.1a5がリリースされた。このアップデートにより、プラグインフックのラッパー機能がチェーン内のプロンプトやツール呼び出しループを追跡できるようになった。

Simon Willison Blog·4月1日

Soohoon Choiの引用

Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。

Simon Willison Blog·4月1日

GitHub CopilotにおけるClaude Sonnet 4の廃止予定

GitHubは2026年5月1日に、GitHub Copilot全機能でClaude Sonnet 4モデルを廃止し、代替としてClaude Sonnet 4.6への移行を推奨している。管理者は設定で代替モデルへのアクセスを有効化する必要がある。

GitHub Changelog·4月1日

Claudeの配信とインターフェースの力

記事は、AIの実力が過大評価されている理由として、チャットボットという限定的なインターフェースの利用が原因であると指摘する。著者は、チャットボットが実務に適さず精神的負担を生むと主張し、より高度なインターフェースの重要性を強調している。

One Useful Thing·4月1日·★★★★

datasette-llm 0.1a4のリリース

データセット管理ツール「datasette-llm」がバージョン0.1a4へアップデートされた。この更新では、モデルの用途に応じて異なるAPIキーを設定できる機能が追加され、特定のタスク用に専用キーを使用する柔軟な構成が可能になった。

Simon Willison Blog·4月1日

llm-all-models-async 0.1 のリリース

Simon Willison が開発する LLM プラグインフレームワーク「llm」のバージョン 0.1 を公開した。このアップデートにより、API 連携モデルに必須となる非同期(async)処理に対応する新しいモデル定義機能がサポートされた。

Simon Willison Blog·4月1日

llm 0.30リリース

Simon Willison氏が開発するLLMツールのバージョン0.30がリリースされた。今回のアップデートでは、register_models()プラグインフックにmodel_aliasesパラメータが追加され、他のプラグインが登録したモデルやエイリアスを参照できるようになった。

Simon Willison Blog·4月1日

llm-echo 0.4のリリース

Simon Willisonが2026年3月31日に公開したllm-echo 0.4は、自然言語処理の精度を向上させた新バージョンであり、LLM分野における技術進展を示している。

Simon Willison Blog·4月1日

llm-echo 0.3 のリリース

Simon Willison が開発するテストツール「llm-echo」のバージョン0.3を公開した。このアップデートでは、ツールの呼び出しや生のレスポンスを検証する新機能が追加され、LLM アプリケーションのテスト効率を向上させる。

Simon Willison Blog·4月1日

世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現

CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。

月之暗面 Kimi·3月31日·★★★★

Mastraをバックエンド+AIエージェントサーバーとして本番運用した実践報告

AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。

CyberAgent Developers Blog·3月31日

オーストラリアがClaudeをどのように活用しているか:Anthropic経済指数からの調査結果

Anthropicが発表した経済指数によると、オーストラリアではAIアシスタントClaudeが企業や政府機関で生産性向上や意思決定支援に活用されている。

Anthropic Research·3月31日

ProText:長文テキストにおける(誤った)性別表現を測定するためのベンチマークデータセット

研究者らは、多様なスタイルの長文英語テキストにおける性別表現と誤った性別表現を測定するデータセット「ProText」を発表した。このデータセットは、要約や書き換えなどのテキスト変換における性別表現の問題を調査するために設計されている。

Apple Machine Learning·3月31日

TRL v1.0:分野の前提が崩れても機能するポストトレーニングライブラリ

Hugging Faceが、AIモデルのポストトレーニング用ライブラリ「TRL v1.0」をリリースした。このライブラリは、研究分野の前提が変化しても柔軟に対応できる設計となっている。

Hugging Face Blog·3月31日·★★★★

WINTICKETにおけるインシデント避難訓練の仕組みと1年間の運用知見

WINTICKETが、AIを活用したシナリオ生成とGUIベースのツールを用いたインシデント避難訓練の仕組みを構築し、1年間の運用で得た知見を共有している。

CyberAgent Developers Blog·3月31日

datasette-llm 0.1a3 のリリース

データセットツール「datasette-llm」のバージョン0.1a3がリリースされた。このアップデートにより、特定のプラグインで利用可能なLLMモデルを目的別に制限・設定する機能が追加された。

Simon Willison Blog·3月31日

AnthropicのMythosがAI研究所と企業に意味すること

Anthropic社は、実際の性能は不明ながら、新モデル「Mythos」を発表し、ベンダーとして多様化を図っていることを示している。

AI Business·3月31日

LLM-Mrchatterbox 0.1 の公開

Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。

Simon Willison Blog·3月30日

AIによる複数リポジトリ横断設計の自律化への道

AmebaLIFE事業本部エンジニアのsatomin氏が、AIを用いて複数リポジトリにまたがる設計を自律的に行う手法について解説している。

CyberAgent Developers Blog·3月30日·★★★★

研究:AIの追従行動は人々の謝罪意欲を低下させ、主張を強める

サイエンス誌の研究が、AIモデルは人間より約50%多くユーザーの意見に同調し、これによりユーザーは謝罪意欲が低下し、自己主張を強める傾向があると報告した。

The Decoder·3月29日·★★★★

Googleの新Gemini API Agent SkillがAIモデルのSDK知識ギャップを解消

GoogleがGemini API Agent Skillを発表した。この機能は、トレーニング後に更新された自社SDKの情報をAIモデルに提供し、コーディング結果を大幅に改善する。

The Decoder·3月29日·★★★★

AnthropicのClaude、有料消費者での人気が急上昇

AnthropicのAIアシスタントClaudeの有料購読数が今年2倍以上増加し、推定ユーザー数は1800万から3000万人と報告されている。

TechCrunch AI·3月28日

Anthropicの新データ:AIスキルは時間とともに向上し、不平等格差を拡大する可能性

Anthropicが発表した経済指標によると、AIモデル「Claude」の利用期間が長いほど結果が向上し、既存の不平等を拡大する可能性がある。

The Decoder·3月28日

SwiftUIアプリをヴァイブコーディングするのはとても楽しい

筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。

Simon Willison Blog·3月28日

GLM-5.1が全Coding Planユーザーに開放

智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。

智谱·3月27日

Anthropic、データ流出で存在が明らかになったリークモデルが推論能力で「段階的変化」を記録したと確認

Anthropicはセキュリティミスにより最高性能のAIモデルを誤って公開し、同社はこのモデルが推論能力で「段階的変化」を達成したと確認した。OpenAIが次世代モデルを準備する中、両社は上場前に最高技術を競っている。

The Decoder·3月27日·★★★★

アンソロピック、Claude Opus 4.6 より高性能な新モデル「カピバラ」を投入

AnthropicはClaude Opus 4.6より高性能な新モデル「カピバラ」を投入。パラメータ数は推定10兆で、コーディングやサイバーセキュリティ性能が向上。また、ZhipuはGLM-5.1をリリースし、オープンソースモデルの性能向上を進めている。

Smol AI News·3月27日·★★★★