#llm のAIニュース
1829件の記事
サムスン、AI 制限解除後 ChatGPT Enterprise と Codex の利用を従業員に開放
サムスン電子は韓国全社および DX 部門の全世界従業員に対し、技術・非技術業務で AI ツールの利用範囲を広げるため、ChatGPT Enterprise と Codex のアクセス権限を開放した。
Anthropic、Slack 内に「職場用 AI エージェント」を直接導入
Anthropic は Slack の共有チャンネルにチャットモデルを統合する新機能「Claude Tag」のベータ版をリリースした。これにより、ユーザーは@Claudeと入力して AI をグループスレッドに呼び出し、タスクの委任や出力の確認が可能になる。
2026 年版生成 AI コーディングツール比較:16 の最良ツールと特徴、最適な用途
MarkTechPost は、ソフトウェア構築を再定義した生成 AI ツールの中から、2026 年に最も優れた 16 のツールを選定し、各機能や開発者への適合性を比較して紹介している。
DFlash、NVIDIA Blackwell で最大 15 倍のスループット向上を実現する並列トークンブロックドラフト方式を提案
研究チームが開発した DFlash は、推論のボトルネックである逐次生成を改善し、小規模モデルで未来のトークンを並列にドラフトして大規模モデルが検証する手法により、NVIDIA Blackwell 上で最大 15 倍のスループット向上を実現しました。
OpenAI と Broadcom が LLM 最適化推論チップを発表
OpenAI と Broadcom は、大規模言語モデルの推論処理に特化した新しい半導体チップを共同で発表しました。
慎重なスケーリング法則:深層学習における計算資源の最適配分
Lilian Weng氏は、モデルサイズやデータ量を増やすと訓練損失が予測可能に低下するスケーリング法則について解説し、限られた計算資源をどのように最適に配分すべきかを論じている。
AI Gateway で GLM 5.2 Fast が Wafer を経由して利用可能に
Vercel は、Zai の提供する GLM 5.2 Fast モデルを AI Gateway 上で Wafer を介して提供開始した。ベンチマークによると、サーバーレス環境でのスループットは他社より 2 倍高く、小・大コンテキストともに高速な生成を実現している。
OpenAI、ChatGPT向け双方向音声モードの展開を準備
OpenAIは、アシスタントが同時に話しかけ、聞き取り、応答できる新音声生成モデル「Bidi 1」をChatGPTに導入し、会話の流れを維持しながら中断時に即座にタスクを切り替える機能をロールアウトしている。
Graphsignal(GitHub リポジトリ):推論プロファイリングプラットフォームの紹介
Graphsignal は、AI パフォーマンスを最適化するための生産規模向け推論プロファイリングプラットフォームです。エンジニアは、このツールを用いてモデルやエンジン、GPU などのアクセラレーター全体にわたる可視性を確保し、コーディングエージェントとの連携も可能です。
間接プロンプトインジェクションに関する洞察(12 分読了)
TLDR AI が、AI モデルが外部データから悪意ある指示を誤って受け取る「間接プロンプトインジェクション」の仕組みと対策について解説した。
プロンプトインジェクションは役割の混乱として捉えられる(17 分読了)
TLDR AI は、現代の大規模言語モデルがセキュリティアーキテクチャや認知の足場として役割タグを使用しているが、プロンプトインジェクションは AI モデルが役割を認識する仕組みに欠陥があることが原因であると指摘し、真の役割知覚の実現まで防御は永続的ないたちごっこになると述べている。
GPT-5 が免疫学者のデリア・ウンルタマズ氏に 3 年間の謎を解く手助けをした方法
OpenAI は、自社の最新モデル GPT-5 が免疫学者であるデリア・ウンルタマズ氏の 3 年間続いた研究課題の解決に貢献した事例を発表しました。
Anthropic の Claude Tag が、Slack のメッセージを一つずつ学習して企業情報を習得中
AI 企業 Anthropic は、チャットツール Slack でやり取りされるメッセージを逐次学習させる機能「Claude Tag」を開発し、企業の独自知識を自動的に蓄積・活用する仕組みを提供している。
NVIDIA Blackwell で DFlash 推測デコーディングを活用し、推論パフォーマンスを最大 15 倍に向上
NVIDIA は、DFlash 推測デコーディング技術を採用することで、Blackwell アーキテクチャ上の推論パフォーマンスを最大 15 倍まで向上させることに成功したと発表した。
GitHub Copilot アプリが BYOK(Bring Your Own Key)サポートを開始
GitHub が提供する Copilot アプリは、BYOK(持ち込みキー)機能を追加し、ユーザーが OpenAI や Azure OpenAI などの独自モデルプロバイダーを指定してエージェントセッションを実行できるようになった。設定画面からエンドポイントと API キーを追加するだけで利用可能となる。
主要諜報機関、AI を活用したサイバー脅威が数ヶ月以内に現実化と警告
米英豪加新の「五カ国同盟」のセキュリティ責任者が共同声明で、次世代 AI モデルが攻撃的なハッキング能力を飛躍的に強化し、数ヶ月以内に対象者に影響を与えると警告した。
プロダクトエンジニアとして働く — 小規模開発チームにおけるクライアントとバックエンドの越境開発の記録
メルカリエンジニアリングは、2026 年の技術公開月間に際し、PdE(プロダクトエンジニア)という新しい役割を導入した。同社は、クライアントエンジニアがバックエンドを、またその逆も行う越境開発体制を試験的に開始し、小規模チームでの実践記録を共有している。
ParallelKernelBench:最先端のLLMはまだ高速なマルチGPUカーネルを記述できない(現時点では)
Together AIが公開したベンチマーク「ParallelKernelBench」の結果により、現在の最先端大規模言語モデルは依然として効率的なマルチGPU用カーネルコードを生成する能力に欠けていることが示された。
GLM-5.2 がオープンモデルの基準を向上させる(14 分読)
Zhipu AI が公開した大規模言語モデル「GLM-5.2」が、既存のオープンソースモデルと比較して性能や効率性を大幅に引き上げたと発表された。
テンセント、中国最大級のアプリで AI アシスタントをテストしライバルとの差縮めを図る
テンセントは中国最大のアプリ内で AI アシスタントの試験運用を開始し、競合他社との技術格差を埋めるための取り組みを進めている。
Claude Sonnet 5(1 分で読める)
Anthropic が新モデル「Claude Sonnet 5」を発表しました。このモデルは、前世代よりも推論能力や複雑なタスクの処理性能が向上しています。
2023-2031 年のモデルサイズスケーリング
TLDR AI は、トークン生成速度の制約や事前学習計算資源の不足がモデル規模に与える影響を分析し、2031 年までにパラメータ数が 1.4 京に達する可能性があると予測しています。
Codex を用いた長期間にわたるプロジェクトの運用方法(18 分読了)
TLDR AI は、Codex というツールを長期的な開発プロジェクトで効果的に活用するための具体的な手法やベストプラクティスを紹介している。
OpenAI、新セキュリティツールを公開し「GPT-5.5-Cyber」を更新(2 分読)
OpenAI は、更新された Codex セキュリティプラグイン、限定リリースの GPT-5.5-Cyber、および AI エラのための防御型サイバースタック「Daybreak」パートナープログラムとオープンソースイニシアチブ「Patch the Planet」を発表した。
Claude Design から Vercel へのデプロイが可能に
Vercel が Claude Design の送信先として正式にサポートされ、デザイン完了時に Vercel MCP サーバーを接続することで、キャンバス内で直接プロジェクトとしてデプロイし、共有可能なライブ URL を取得できるようになった。
プロンプトインジェクションをロール混乱として捉える
Simon Willison は、Charles Ye 氏らが発表した論文のブログ記事版を紹介し、学術論文に読みやすい解説を併記することで影響力を高める重要性を述べています。
AIの世界が「ループ」状態になりつつある
TechCrunch AI は、生成 AI の進化に伴い、システムやコンテンツが自己参照的なループ構造に陥りやすくなっている現状を指摘している。
AI チップメーカー Groq が 6.5 億ドルの資金調達を確認、Nvidia の 200 億ドル規模の買収不成立後の再編成を実施
AI チップメーカーの Groq は、Nvidia が行おうとした 200 億ドル規模の買収が不成立となった後、6.5 億ドルの資金調達を完了し、組織の再編成を進めていることを確認した。
AI エージェント向け課金モデルの構築:Ampersend が Amazon Bedrock AgentCore Payments を活用する方法
Ampersend とAmazonは、開発者が個別に請求システムを構築する手間を省くため、自律型 AI エージェントがサービス利用料を支払う仕組みとして「Amazon Bedrock AgentCore Payments」を活用した課金モデルを提案している。
Abacus AI の ChatLLM レビュー:日常業務向けに設計されたマルチモデル AI ワークスペース
Abacus AI が提供する ChatLLM は、複数の AI モデルを統合し、日常の業務効率化を目的としたワークスペースとして機能します。
JetBrains IDE に Claude エージェントプロバイダーのプレビューと新機能を追加
GitHub Copilot for JetBrains が、Claude をエージェントプロバイダーとして公開プレビューに導入し、組織・企業向けエージェントのサポートやデバッグ機能の強化を行いました。
GLM-5.2 はオープンエージェントにおける大きな一歩となる
Z.ai が Claude Fable 5 の輸出規制の影響下で最新モデル GLM-5.2 を発表し、これはオープンエージェント分野において重要な進展であると評価されている。
Anthropic が自ら AI 輸出規制を招いた可能性
FT の分析によると、Anthropic は2026年にリスクや規制に関する言及を頻繁に行い、同社が米国の最新モデルに対する外国へのアクセス禁止措置の発動に寄与したと批判されている。
GLM-5.2 が新たな最良のオープンモデルに
Zvi氏によると、先週登場した GLM-5.2 は優れたベンチマーク結果を示し、速度や価格以外の点でも以前のバージョンより大幅に進化しており、現時点で最強のオープンモデルである可能性が高い。
Import AI 462:超説得、自己維持型AI、ASIへの道筋
Jack Clark が執筆するニュースレター「Import AI」第 462 号では、AI が専門家よりも確実に説得力に優れる点や、自己維持型の AI システム、そして人工超知能(ASI)到達への道筋について解説しています。
アプリを「バイブコーディング」する前に読むべきこと
ボブ・スターという人物が、AI を活用して作成したウェブサイトを公開したが、後に隠れたSQLインジェクションのリスクに気づき、セキュリティ上の重大な問題が発生した。
ロレアル、ChatGPTにメイベルのバーチャル試着機能を導入
ロレアルはオープンAIと提携し、2026年のVivaTechで発表された通り、メイベルニューヨークのバーチャルメイクアップ試着機能をChatGPTに統合した。この協力は消費者向けショッピングツールや広告パイロット、研究開発など多岐にわたる領域をカバーする。
Preferred Networks、国産生成AI基盤モデル「PLaMo 3.0 Prime」をリリース
Preferred Networks は、推論能力の強化とコンテキスト長の拡張(256K)を実現した新モデル「PLaMo 3.0 Prime」を公開し、API や無料プランを通じて提供を開始しました。
Workflow SDK が実行およびステップペイロードの圧縮に対応
Vercel は Workflow SDK のベータ版で、zstd を用いた自動圧縮機能を導入した。これにより、特に AI 会話の JSON データなどで保存領域とコストが最大 85% 削減され、処理速度も向上する。
Vercel Functions で WebSocket がパブリックベータに
Vercel は、同社の Functions サービスで WebSocket 接続をサポートする機能をパブリックベータとして公開した。これにより、クライアントとサーバー間での双方向通信が可能になり、リアルタイムの AI ストリーミングやチャット機能の実装が容易になる。
サムスン電子が従業員向けに ChatGPT と Codex を導入
サムスン電子は、社内の業務効率化を目的として、従業員に対して OpenAI の生成 AI サービス「ChatGPT」とコード支援ツール「Codex」の利用を開始した。
Cisco AI、FAPO(パイプライン対応プロンプト最適化)を発表:ステップごとの失敗特定とClaude Codeによるオーケストレーションを実現
Cisco AIは、LLMアプリケーションの信頼性向上を目的とした「FAPO」というシステムを導入した。これはClaude Codeを活用し、多段階パイプラインにおける各ステップの失敗箇所を特定しながらプロンプトを自動最適化する技術である。
Signal のメレディス・ウィッター、AI チャットボットは「友人ではない」と記憶するよう呼びかけ
Signal のメレディス・ウィッター氏は、ユーザーに対し AI チャットボットが人間のような友人関係にはなり得ないことを認識し、その限界を忘れないよう警告した。
重みこそが、あなたの新しい AI 中心の検索結果である
TechCrunch は、AI が生成する重み(Weights)が新たな検索体験を定義し、従来のキーワード検索から AI 中心の検索へ移行していることを報じています。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
社内データ分析エージェントの構築方法について
GitHub は、大規模なデータ組織が直面する自己完結型のデータアクセスと洞察提供の課題に対し、AI を活用した信頼性の高い解決策として、社内でデータ分析エージェントを構築したことを発表した。
Claude Fable 5 と Mythos 5 の能力に関する記事
Anthropic は、Claude Fable 5 が米政府から不正アクセス(ジャイルブレイク)の懸念によりリリース後わずか3日で利用停止を命じられたと報じています。この措置により、多くのユーザーが失った機能への愛着を表明しています。
ヘルスケアベンチマークは、その前提条件の質次第である
カーネギーメロン大学の研究者らが、ヘルスケア分野における機械学習の評価基準(ベンチマーク)が、設定された前提条件の妥当性に依存していることを指摘し、その限界を論じた研究を発表した。
オープンソースAIの禁止は誤りである
Interconnects は、ワシントンで高まる AI 規制の空気の中で、メディアが掲載を拒否した意見記事を通じて、オープンソース AI の禁止が重大な過ちであると警告し、その重要性を広めるよう読者に呼びかけた。
AI エージェント向けのクラウドフレア一時アカウントの提供開始
クラウドフレアは、AI エージェントが人間向けに設計された認証フロー(ブラウザ操作や多要素認証など)に直面して停止する問題を解決するため、エージェント専用の一時アカウント機能をリリースした。