#llm のAIニュース
1825件の記事
Deep Agents との連携によるプロンプトキャッシング
LangChain が、Deep Agents を活用してプロンプトキャッシングを実現する機能を公開した。これにより、推論コストとレイテンシを削減できる。
OpenAI、GPT-5.6 シリーズの限定プレビューを開始
OpenAI は、主力モデル「Sol」を含む GPT-5.6 シリーズ(Sol, Terra, Luna)の限定プレビューを開始し、今後数週間で一般提供予定であることを発表した。
米国のAI規制の混乱の中、OpenAIがGPT-5.6を発表
OpenAIはトランプ政権からの要望によりモデルリリースを調整した直後、新モデル「GPT-5.6」シリーズ(旗艦のSol、中規模のTerra、小型のLuna)の限定プレビューを発表した。
Microsoft AI のコーディングモデル「MAI-Code-1-Flash」が GitHub Copilot ビジネスおよびエンタープライズ向けに一般提供開始
Microsoft AI が開発した専用コーディングモデル「MAI-Code-1-Flash」が、GitHub Copilot ビジネス版とエンタープライズ版で利用可能になった。このモデルは高速・低遅延な応答を特徴とし、大量の反復的なエージェント型コーディングワークフローに最適化されている。
もはやアンソロピック対オープンエーアイではない
TechCrunch AI は、AI 業界の対立構造が特定の企業間の競争からより広範な変化へと移行していることを指摘し、業界全体の動向を分析した。
NVIDIA モデル最適化器を用いた NVIDIA Nemotron 3 Ultra NVFP4 チェックポイントの作成方法
NVIDIA は、自社のモデル最適化ツール「NVIDIA Model Optimizer」を活用し、高精度な推論を可能にする「Nemotron 3 Ultra NVFP4」という新しいモデルチェックポイントを生成する手法を発表しました。
Apple Silicon で MLX を用いた言語モデルのファインチューニング
KDnuggets が紹介する記事で、MLX というフレームワークを使用して Apple Silicon 上で言語モデルをファインチューニングする方法について解説している。
AWS を活用した保険仲介向けドメイン特化型 AI の先駆者、Cara の取り組み
Cara は AWS 上で AI ネイティブなソリューションを提供し、保険仲介業者のバックオフィス業務を自動化することで、手作業に依存する課題や人材不足に対応している。
Anthropic の Mythos 問題がさらに深刻化
トランプ政権からの要求を受け Anthropic が Mythos クラスのモデルを停止してから2週間が経過したが、同社はワシントンDCへ幹部を送り対応しているものの、解決策を示す更新情報がなく状況は悪化している。
LLM がロボットに曖昧な指示の理解と重要詳細への集中を支援
大規模言語モデル(LLM)が、ロボットに対して人間のような「見せて教える」手法を通じて曖昧な指示を理解させ、重要な詳細に焦点を当てる能力を向上させる技術を開発した。
次世代モデル「GPT-5.6 Sol」のプレビュー公開
OpenAI が、次世代モデルである「GPT-5.6 Sol」のプレビュー版を公開した。同社はこの新モデルについて詳細な性能や特徴を紹介している。
[AINews] OpenAI、2025年11月以降の内部Codex出力トークン数が研究で56倍、カスタマーサポートで32倍に急増と報告
OpenAIが経済調査レポートを発表し、2025年11月以降、社内でのCodex利用状況が劇的に拡大したことを示しました。特に研究部門では出力トークン数が56倍に、エンジニアリング部門でも27倍に増加しています。
ある言語モデルのドイツ語話能を削除した件(3 分読)
TLDR AI は、特定の言語モデルからドイツ語での会話機能を意図的に削除したと発表した。これは多言語対応の調整の一環である可能性があるが、詳細な理由は明記されていない。
1 コマンドで HF Jobs で vLLM サーバーを実行する方法(3 分読了)
TLDR AI は、Hugging Face の Jobs サービス上で単一のコマンドにより vLLM サーバーを起動する手順を紹介している。これにより開発者は効率的に推論サーバーを構築できる。
より良質なトレーニングデータを構築するエージェント(25 分読了)
TLDR AI は、AI モデルの学習効率を向上させるために、より高品質なトレーニングデータを作成・改善するための自律型エージェントの手法について解説している。
ホワイトハウス、OpenAI に新モデルの公開延期を要請
ホワイトハウスは国家安全保障と構造的安全性の懸念から、OpenAI に対し次世代 Frontier モデルの公開延期を公式に要請した。政府高官は、高度なサイバー能力や自動社会操作の脆弱性を徹底的に監査するため、レッドチームング期間の延長を求めている。
Liquid AI、非トランスフォーマー型「Liquid Foundation Models 2.5」を公開(230M パラメータ)
Liquid AI は、状態空間と液体ニューラルネットワークに基づく非トランスフォーマーアーキテクチャの「LFM 2.5」を発表した。この 230M パラメータモデルはコンパクトながら、エッジ推論やシーケンス生成でトランスフォーマーの 3 倍サイズのモデルと同等の性能を達成している。
ホワイトハウス、安全性の懸念から OpenAI の新モデルリリースを徐々に行うよう要請
ホワイトハウスは、安全性への懸念から、OpenAI が開発中の新モデルのリリースペースを緩めるよう同社に要請した。
GitHub Copilot エージェント型ハッチのモデル・タスク間での性能と効率の評価
GitHub は、Copilot SDK に含まれるエージェント型ハッチが複数のモデルやタスク間でどのように機能するかを評価し、この共通コンポーネントの改善が CLI やアプリなど全ての体験に波及効果をもたらすことを示した。
AI と法的責任
ブルース・シュナイアーは、ドイツの裁判所がグーグルの AI 概要における誤りについて同社に責任を課した判決を引用し、AI エージェントは導入する個人または組織の代理人であり、その結果に対する責任も負うべきだと論じています。
1 コマンドで Hugging Face Jobs で vLLM サーバーを実行可能に
Hugging Face が、vLLM サーバーを Hugging Face Jobs 上で単一のコマンドで実行できる機能を導入した。これにより、大規模言語モデルの推論環境構築が簡素化された。
トランプ政権の要請により OpenAI、GPT-5.6 の公開を延期へ
セキュリティへの懸念からトランプ政権が要請し、OpenAI は CEO サム・アルトマンが従業員に伝えた通り、次期大型モデル GPT-5.6 の完全公開を延期し、限定的なプレビュー形式での提供を検討している。
Anthropic の Claude が有料消費者層で ChatGPT を凌駕し市場を席巻
Anthropic が提供する AI チャットボット「Claude」が、従来 ChatGPT が独占していた有料顧客市場において支持を集め、シェア拡大に成功していることが示された。
NVIDIA TensorRT を用いた複数 GPU での AI 推論のスケーリングとマルチデバイス推論サポートの紹介
NVIDIA は、TensorRT の新機能であるマルチデバイス推論サポートを活用し、複数の GPU にわたって AI 推論を効率的にスケーリングする手法を発表した。これにより大規模モデルの実行性能が向上する。
NVIDIA Blackwell を用いた Amazon SageMaker AI でのモデル学習の最適化
AWS は、NVIDIA の最新 GPU「Blackwell」を活用することで、Amazon SageMaker AI 上で大規模 AI モデルの学習におけるメモリ制約やシーケンス長の制限といった課題を克服し、実用的な運用範囲を広げる方法を発表した。
NVIDIA ACE を活用した KRAFTON の共演可能キャラクター「PUBG Ally」の構築方法
ゲーム開発会社 KRAFTON は、NVIDIA の AI 技術プラットフォーム「ACE」を活用し、プレイヤーと対話可能な共演可能キャラクター「PUBG Ally」を PUBG に実装した。
ハイブリッドモデルはどのトークンをより正確に予測するか?
Hugging Face Blog は、ハイブリッド型言語モデルが従来のモデルと比較して、特定のトークン予測においてどのような精度の向上を示すかを分析した研究結果を公開しました。
Gemini を活用して Google スプレッドシートを作成する方法
Google が提供する AI モデル「Gemini」を用いて、ユーザーが直接 Google スプレッドシートを生成・操作する機能の利用方法について解説している。
AI を駆使した説明と実験による脳理解の探求
マイクロソフト研究所は、大規模言語モデルを用いて人間の脳の言語反応を高精度に予測する手法を開発したが、その性能の根拠となるパラメータ群は解読不能である。同所は大学と連携し、生成因果テスト(GCT)という新たなアプローチでこの黒箱問題を解決しようとしている。
テキスト、画像、音声、動画を処理する 5 つのオープンソース・オムニ AI モデル
KDnuggets は、テキスト、画像、音声、動画のすべてのメディアタイプを処理できる 5 つの主要なオープンソース型オムニ AI モデルを紹介した。
AI SDK 7 の発表
Vercel は、週に 1600 万回のダウンロードがある TypeScript 製 AI SDK の新バージョン「7」を発表した。このアップデートにより、推論制御やツール承認機能など、エージェント開発の生産性を高める機能が強化された。
2026 年に AI エンジニアになるためのロードマップ
KDnuggets が、2026 年までに AI エンジニアとして活躍するための学習ロードマップを提示している。
OpenAI の「Jalapeño」チップの数学的背景
OpenAI は Broadcom と共同で、サードパーティ製ハードウェアへの依存による巨額の資本支出を削減するため、独自に ASIC チップ「Jalapeño」を開発した。これにより、Nvidia 製品の高い利益率から生じるコスト圧力を緩和し、自社の財務軌道を支える狙いがある。
[AINews] メタハーネスの夏が到来
メタハーネスの歴史を振り返り、ダatabricks の CTO マタイ・ザハリヤ氏が、あらゆるコーディングや知識作業を取り込むためのオープンソースでプラグ可能アーキテクチャ「オムニジェント」に賭けていると報じる。
Perplexity の弁護士向けコンピューター(3 分読み)
AI 検索企業 Perplexity が、法律専門家の業務支援を目的とした専用コンピューター機能を発表した。
Anthropic とアリババが共同で AI モデルの蒸留キャンペーンを開始
Anthropic とアリババは、最先端モデルから高度な推論能力を効率的なエッジモデルへ圧縮する共同オープンソースフレームワークを開始した。両社は Anthropic の安全性調整技術とアリババの大規模クラウドインフラを活用し、計算リソースの削減を実現する。
Qwen-AgentWorld(29 分間の読了時間)
TLDR AI が、アリババ傘下の通義千問(Qwen)を用いたエージェント開発環境「Qwen-AgentWorld」の解説記事を公開しました。
NVIDIA NeMo AutoModelによるTransformersの微調整加速
NVIDIAはHugging FaceでNeMo AutoModelを公開し、Qwen3やDeepSeek V3のような大規模Mixture-of-Expertsアーキテクチャの微調整パイプラインを最適化した。同フレームワークはExpert ParallelismとDeepEP融合通信カーネルを導入し、GPUクラスター上で専門的なエキスパート重みを動的に分散させることで、トレーニングスループットを最大3.7倍向上させ、ピークGPUメモリ使用量を32%削減した。
ジェミニ研究者らがアンソロピックへ移籍(1 分読了)
ブルームバーグによると、Google のジェミニ研究チームに所属するジョナス・アドラー氏とアレクサンダー・プリッツェル氏が、競合他社であるアンソロピックへ移籍した。これはノア・シャゼー氏やジョン・ジャッパー氏らの退社に続く、主要 AI 企業間での人材流出の波の一環である。
ブラウザ互換性データベースをSQLite化
Simon Willison氏が、MozillaのMDNが提供する包括的なブラウザ互換性情報データを基に、SQLiteデータベース形式に変換するプロジェクト「simonw/browser-compat-db」を開始した。
OpenAI と Broadcom が大規模 LLM 推論向けチップ「Jalapeño」を発表
ChatGPT を開発する OpenAI と半導体サプライヤーの Broadcom は、データセンターでの大規模言語モデル推論に特化した新チップ「Jalapeño」を共同で発表した。両社は本製品が長期プロジェクトの第1世代であると述べている。
「かつてありし未来の寓話」第4回:Claude Code の新バージョンが Fable 5 の復活を示唆
Zvi が、Claude Code v2.1.190 に「今週の Fable 5 使用権限を使い果たしました」という文言が追加されたことを指摘し、7 月までに Fable 5 が復元される可能性が高まっていると報じた。
議員がスタッフによる AI 使用を否定、法案作成には使っていないと主張
アメリカのアンナ・パウリーナ・ルナ下院議員は、スタッフが大規模防衛法案の修正案要約でスペルチェックに AI を利用したことを認めつつも、法案本文の作成には AI を使用していないと否定し、「立法は決して AI で起草されない」と強調しました。
トム・マクライトへの引用:LLM による応募書類の増加と実体の欠如
ブロガーのトム・マクライトは、最近の求人応募に LLM(大規模言語モデル)で作成された履歴書やポートフォリオサイトが増えていると指摘し、これらには人間の実像が示されていないため、応募者について何も分からないと述べている。
NVIDIA NeMo AutoModel を用いたトランスフォーマーファインチューニングの加速化
Hugging Face は、NVIDIA の NeMo AutoModel を活用することで、トランスフォーマーモデルのファインチューニング処理を大幅に高速化する手法を発表した。
OpenAI、Broadcomと共同開発した初のAI専用プロセッサ「Jalapeño」を発表
OpenAIは Broadcom と共同で開発した AI サーバー用専用チップ「Jalapeño」を公開しました。この ASIC は大規模言語モデルの推論処理に特化しており、同社の次世代モデルを支える基盤となります。
ポッドキャスト:AI に自我があるなら『帝国時代 II』にもあるという論文について
Matthew が、大規模言語モデルに自我があると仮定した場合、古典的ゲーム『帝国時代 II』も同様に自我を持つと主張する興味深い論文を紹介した。
トークン終末が到来:企業、AI への支出抑制に躍起
コンサルティング大手のアクセンチュアは、非技術職による PDF からスライド作成などの些細なタスクでの AI トークン予算の浪費を防ぐため、業界全体で急激に増加するトークン支出を抑制しようとしている。
2026 年にローカルで実行可能なトップ 7 つのコーディングモデル
KDnuggets が選定した、2026 年版のローカル環境で動作する主要な 7 つのコード生成 AI モデルを紹介している。
サムスン、AI 制限解除後 ChatGPT Enterprise と Codex の利用を従業員に開放
サムスン電子は韓国全社および DX 部門の全世界従業員に対し、技術・非技術業務で AI ツールの利用範囲を広げるため、ChatGPT Enterprise と Codex のアクセス権限を開放した。