#llm のAIニュース
952件の記事
【AIニュース】グッドフライデー
Gemmaの好意的な評価が継続しており、Marc Andreesenのポッドキャストで高い評価を得ている。来週ロンドンで開催されるAIE Europeでは、OpenClawやPiなどの欧州発AIツールのクリエイターが登壇し、ライブ配信される。
ウィリー・タローを引用して
Linuxカーネル開発者が、AI関連の脆弱性報告が急増し、1日5〜10件に達していると指摘し、対応のためにメンテナーを増員したことを明らかにした。
ダニエル・ステンバーグが語る
cURLのリード開発者ダニエル・ステンバーグは、オープンソースセキュリティにおけるAIの課題が、AIによる低品質な報告の氾濫から、多くの有用なセキュリティレポートの氾濫へと変化したと述べている。彼は現在、この対応に1日数時間を費やしている。
グレッグ・クローハートマンが語る
グレッグ・クローハートマン氏は、数か月前は明らかに間違っている低品質のAI生成セキュリティレポートが多かったが、1か月前から状況が変化し、現在はAIで作成された高品質で信頼性のあるレポートがオープンソースプロジェクトで使用されていると述べた。
Deepseek v4、全モデルをファーウェイ製チップで稼働へ 中国のAI自立化推進で大きな前進
Deepseek社は、次期AIモデル「Deepseek v4」をファーウェイ製チップのみで稼働させると発表した。中国の主要テック企業は既に数十万単位で発注済みで、NVIDIAは初期テストから除外された。
Anthropic、Claude Codeの使用量急増はピーク時間制限とコンテキスト拡大が原因と説明
Anthropicは、Claude Codeユーザーの使用制限が急速に消費される理由として、ピーク時間帯の制限とコンテキストの拡大を挙げ、トークン使用量削減のヒントを共有した。
システム向けAI:LLMを用いたデータベースクエリ実行の最適化
新研究により、大規模言語モデル(LLM)が統計ヒューリスティックが見逃す基数推定エラーを修正し、データベースクエリの実行計画を最適化できることが示された。これにより最大4.78倍の高速化が実現する。
llm-gemini 0.30 のリリース
Simon Willison が公開した llm-gemini バージョン 0.30 は、Gemini 3.1 Flash Lite Preview および Gemma 4 の大規模モデル(26B、31B)に対応した。これにより、これらの新モデルをローカル環境で利用可能になる。
Gemma 4:バイト単位で最も能力の高いオープンモデル
GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。
AI #162:ミソスのビジョン
AnthropicはClaude Codeのソースコード漏洩や、サイバー能力を大幅に向上させた新モデル「Mythos」の存在が明らかになった。また、AxiosやLiteLLMなどのセキュリティ侵害事例が増加し、攻撃側の試行回数が拡大している現状が報告された。
AIパフォーマンスの測定が困難になる理由
記事は、自律走行車の未来に関する著者の賭け話やポッドキャストの紹介を挟みつつ、AIのパフォーマンス評価が複雑化している現状について言及している。
自己維持可能なCI ── Goテストの失敗をClaudeで自動修復する仕組み
LayerXのshibutani氏が、Goテストの失敗を検知するとClaudeがログを分析し、担当チームに通知して修正PRを作成する自動修復システムを構築した。
階躍 Step 3.5 Flash シリーズ新登場!全 Step Plan ユーザーが体験可能に!
階躍星辰が最新モデル「Step 3.5 Flash 2603」をリリースし、全Step Planユーザーに開放した。新機能「low think mode」によりトークン消費削減と出力効率向上を実現し、Coding/Agentフレームワークを最適化した。
大規模言語モデルにおける感情概念とその機能
研究者が、大規模言語モデルにおける感情概念の機能と解釈可能性について分析した。
異種嗜好アラインメントのためのパーソナライズドグループ相対ポリシー最適化
研究者らは、大規模言語モデル(LLM)が多様な個人嗜好に適合できない問題に対処するため、パーソナライズドグループ相対ポリシー最適化(P-GRPO)を提案した。この手法は、従来のGRPOがグループ内でサンプルを交換可能と仮定する制限を克服し、異なるユーザーグループの嗜好に個別に適合するポリシーを学習する。
Claudeの知能を活用する
Anthropicが開発したAIアシスタント「Claude」の知能を、様々なタスクや応用分野で効果的に活用する方法について説明している。
datasette-llm 0.1a6 のリリース
データセット管理ツール「datasette-llm」のバージョン0.1a6がリリースされた。このアップデートでは、デフォルトモデルの設定時に許可リストへの重複登録が不要になるよう仕様が改善され、ドキュメントも強化された。
datasette-enrichments-llm 0.2a1 のリリース
データセット拡張ライブラリ「datasette-enrichments-llm」のバージョン0.2a1が公開された。このアップデートでは、拡張処理をトリガーする「actor」情報をLLMメソッドに渡す機能が追加され、処理の文脈が明確になった。
GPT-5.4 miniがCopilot Studentの自動モデル選択で利用可能に
GitHubがCopilot StudentプランでGPT-5.4 miniを自動モデル選択機能を通じて一般提供開始した。このモデルはVisual Studio Code、Visual Studio、JetBrains IDE、Xcode、EclipseのGitHub Copilot Chatで利用できる。
datasette-extract 0.3a0のリリース
データセットプラグイン「datasette-llm」を利用し、モデルの構成と管理を可能にした。これにより、利用可能なモデルを指定してデータ強化に使用できるようになった。
バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始(インターン含む)
バイトダンスが、2027年卒の学生を対象に、大規模言語モデル分野の人材採用を開始した。同社は「知能の限界に挑戦する」と掲げ、新卒・インターン採用を実施している。
datasette-enrichments-llm 0.2a0 のリリース
Datasette プラグイン「datasette-enrichments-llm」のバージョン0.2a0がリリースされた。このアップデートにより、モデルの構成と管理を「datasette-llm」に統合し、利用可能なモデルを指定可能になった。
datasette-llm-usage 0.2a0 のリリース
DatasetteのLLM使用量計測プラグイン「datasette-llm-usage」がバージョン0.2a0へ更新された。従来機能の一部は別プラグインへ移行し、モデル設定には「datasette-llm」への依存が必須となった。
datasette-llm 0.1a5 のリリース
「datasette-llm」バージョン0.1a5がリリースされた。このアップデートにより、プラグインフックのラッパー機能がチェーン内のプロンプトやツール呼び出しループを追跡できるようになった。
Soohoon Choiの引用
Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。
GitHub CopilotにおけるClaude Sonnet 4の廃止予定
GitHubは2026年5月1日に、GitHub Copilot全機能でClaude Sonnet 4モデルを廃止し、代替としてClaude Sonnet 4.6への移行を推奨している。管理者は設定で代替モデルへのアクセスを有効化する必要がある。
Claudeの配信とインターフェースの力
記事は、AIの実力が過大評価されている理由として、チャットボットという限定的なインターフェースの利用が原因であると指摘する。著者は、チャットボットが実務に適さず精神的負担を生むと主張し、より高度なインターフェースの重要性を強調している。
datasette-llm 0.1a4のリリース
データセット管理ツール「datasette-llm」がバージョン0.1a4へアップデートされた。この更新では、モデルの用途に応じて異なるAPIキーを設定できる機能が追加され、特定のタスク用に専用キーを使用する柔軟な構成が可能になった。
llm-all-models-async 0.1 のリリース
Simon Willison が開発する LLM プラグインフレームワーク「llm」のバージョン 0.1 を公開した。このアップデートにより、API 連携モデルに必須となる非同期(async)処理に対応する新しいモデル定義機能がサポートされた。
llm 0.30リリース
Simon Willison氏が開発するLLMツールのバージョン0.30がリリースされた。今回のアップデートでは、register_models()プラグインフックにmodel_aliasesパラメータが追加され、他のプラグインが登録したモデルやエイリアスを参照できるようになった。
llm-echo 0.4のリリース
Simon Willisonが2026年3月31日に公開したllm-echo 0.4は、自然言語処理の精度を向上させた新バージョンであり、LLM分野における技術進展を示している。
llm-echo 0.3 のリリース
Simon Willison が開発するテストツール「llm-echo」のバージョン0.3を公開した。このアップデートでは、ツールの呼び出しや生のレスポンスを検証する新機能が追加され、LLM アプリケーションのテスト効率を向上させる。
世界のウェブサイトの1/5にサービスを提供するCloudflareがKimi K2.5を選択し、77%のコスト削減を実現
CloudflareがKimi K2.5を採用し、コストを77%削減した。この選択は、大規模なインフラストラクチャを持つ企業がAI技術を活用して効率化を図る事例を示している。
Mastraをバックエンド+AIエージェントサーバーとして本番運用した実践報告
AIクリエイティブカンパニーBPO事業部のエンジニア佐藤氏が、MastraをバックエンドとAIエージェントサーバーとして本番環境で運用した実践的な知見を共有している。
オーストラリアがClaudeをどのように活用しているか:Anthropic経済指数からの調査結果
Anthropicが発表した経済指数によると、オーストラリアではAIアシスタントClaudeが企業や政府機関で生産性向上や意思決定支援に活用されている。
ProText:長文テキストにおける(誤った)性別表現を測定するためのベンチマークデータセット
研究者らは、多様なスタイルの長文英語テキストにおける性別表現と誤った性別表現を測定するデータセット「ProText」を発表した。このデータセットは、要約や書き換えなどのテキスト変換における性別表現の問題を調査するために設計されている。
TRL v1.0:分野の前提が崩れても機能するポストトレーニングライブラリ
Hugging Faceが、AIモデルのポストトレーニング用ライブラリ「TRL v1.0」をリリースした。このライブラリは、研究分野の前提が変化しても柔軟に対応できる設計となっている。
WINTICKETにおけるインシデント避難訓練の仕組みと1年間の運用知見
WINTICKETが、AIを活用したシナリオ生成とGUIベースのツールを用いたインシデント避難訓練の仕組みを構築し、1年間の運用で得た知見を共有している。
datasette-llm 0.1a3 のリリース
データセットツール「datasette-llm」のバージョン0.1a3がリリースされた。このアップデートにより、特定のプラグインで利用可能なLLMモデルを目的別に制限・設定する機能が追加された。
AnthropicのMythosがAI研究所と企業に意味すること
Anthropic社は、実際の性能は不明ながら、新モデル「Mythos」を発表し、ベンダーとして多様化を図っていることを示している。
LLM-Mrchatterbox 0.1 の公開
Simon Willison が 2026 年 3 月 30 日、大規模言語モデル(LLM)に関する月次ブリーフィング「llm-mrchatterbox」のバージョン 0.1 を公開した。これは月額 10 ドルのスポンサーシップを通じて購読可能な、当月の重要ニュースを厳選したメールダイジェストである。
AIによる複数リポジトリ横断設計の自律化への道
AmebaLIFE事業本部エンジニアのsatomin氏が、AIを用いて複数リポジトリにまたがる設計を自律的に行う手法について解説している。
研究:AIの追従行動は人々の謝罪意欲を低下させ、主張を強める
サイエンス誌の研究が、AIモデルは人間より約50%多くユーザーの意見に同調し、これによりユーザーは謝罪意欲が低下し、自己主張を強める傾向があると報告した。
Googleの新Gemini API Agent SkillがAIモデルのSDK知識ギャップを解消
GoogleがGemini API Agent Skillを発表した。この機能は、トレーニング後に更新された自社SDKの情報をAIモデルに提供し、コーディング結果を大幅に改善する。
AnthropicのClaude、有料消費者での人気が急上昇
AnthropicのAIアシスタントClaudeの有料購読数が今年2倍以上増加し、推定ユーザー数は1800万から3000万人と報告されている。
Anthropicの新データ:AIスキルは時間とともに向上し、不平等格差を拡大する可能性
Anthropicが発表した経済指標によると、AIモデル「Claude」の利用期間が長いほど結果が向上し、既存の不平等を拡大する可能性がある。
SwiftUIアプリをヴァイブコーディングするのはとても楽しい
筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。
GLM-5.1が全Coding Planユーザーに開放
智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。
Anthropic、データ流出で存在が明らかになったリークモデルが推論能力で「段階的変化」を記録したと確認
Anthropicはセキュリティミスにより最高性能のAIモデルを誤って公開し、同社はこのモデルが推論能力で「段階的変化」を達成したと確認した。OpenAIが次世代モデルを準備する中、両社は上場前に最高技術を競っている。
アンソロピック、Claude Opus 4.6 より高性能な新モデル「カピバラ」を投入
AnthropicはClaude Opus 4.6より高性能な新モデル「カピバラ」を投入。パラメータ数は推定10兆で、コーディングやサイバーセキュリティ性能が向上。また、ZhipuはGLM-5.1をリリースし、オープンソースモデルの性能向上を進めている。