#llm のAIニュース
1867件の記事
Google の新モデル「Gemma 4 12B」は 16GB RAM のノート PC で動作可能に設計
Google は、メモリ消費を抑えた新しい生成 AI モデル「Gemma 4 12B」を発表した。このモデルは、一般的な消費者向けノートパソコン(RAM 16GB)でも実行できるように最適化されており、ローカルでの AI 利用を促進するものである。
ポッドキャスト:ハッカーが Meta AI にアクセスを要求し、それが成功した話
ハッカーが Meta の AI チャットボットにターゲットの Instagram アカウントのメールアドレス変更を依頼し、AI がその指示を実行してアカウント乗っ取りを許容した事例を紹介する。
Amazon SageMaker AI で SFT と DPO を活用し、エージェントのツール呼び出し精度を向上させる方法
AWS は、Amazon SageMaker AI を使用して教師あり学習(SFT)と直接最適化(DPO)を適用することで、AI エージェントが適切なツールを選択する精度を高め、エラー率やサポートコストを削減できると発表した。
企業が Reddit を活用して ChatGPT や Google AI Search の回答を操作している
バイオハッキングサブレディットのモデレーターによると、ペプチドやホルモン補充療法関連の企業が、AI チャットボットに自社の投稿をスクレイピングさせ、その結果として生成される回答を体系的に操作しようとしている。
マイクロソフトと OpenAI の決裂後、両社は激しく対立する準備を整えた
マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。
Meta の WhatsApp ビジネス向け AI エージェントが全世界で利用可能に
Meta が、WhatsApp Business アプリ内で顧客対応を自動化する AI エージェント機能を全世界展開した。これにより中小企業でも 24 時間体制の自動応答が可能になる。
Meta の AI 追いつきへの試みを探る
マーク・ザッカーバーグは、28 歳のスタートアップ創業者アレクサンダー・ワンを起用し、1.5 兆ドル規模の Meta が「Muse Spark」という信頼性の高い AI モデルを開発した。
Visual Studio CodeにおけるGitHub Copilot、5月リリース
Microsoftは2026年5月にVisual Studio Codeをバージョン1.120から1.123へ更新し、タスク完了に焦点を当てたエージェントファースト体験を提供する「Agentsウィンドウ」を安定版でプレビューとして公開した。
GPT-Rosalind に新機能導入を発表
OpenAI が、自身の開発した GPT-Rosalind というモデルに対して、新たな機能を追加することを発表した。これにより、同モデルの性能や利用範囲が拡大する見込みである。
チャットボットを超えた直接選好最適化
Hugging Face は、チャットボットの分野に限定されない形で直接選好最適化(DPO)の応用範囲を広げる研究を発表しました。
Uber、コスト管理のためClaude CodeなどのAIツールの利用を制限
Uberは2026年のAI予算を4ヶ月で使い果たしたため、Claude CodeなどのAIツールの利用に上限を設けてコスト削減を図っている。
LLM を明確に解説する面白い論文 5 選
KDnuggets が、大規模言語モデル(LLM)の仕組みを分かりやすく説明する 5 つの有益な論文を紹介した。
ウォルマートの AI ワークフローが財務現実と直面
ウォルマートは、内部 AI アシスタント「Code Puppy」への過度な要求により、従業員の利用に固定されたトークン数を割り当てて制限を開始した。
【Next Tokyo セッション公開】スクウェア・エニックスとリクルートが「Gemini 本番実装」のアーキテクチャを公開
スクウェア・エニックスとリクルートは、Google Developers JP が開催した Next Tokyo セッションで、大規模言語モデル Gemini を本番環境に導入する際の具体的なアーキテクチャ設計について発表した。
Google、Play ストア開発者のコードを AI 訓練用に購入へ
Google は Android アプリ開発者に対し、AI コーディングツールの訓練に使用するコードへのアクセス権を購入する提案を非公式に行っている。
Anthropic、Mythos を 150 の追加組織に拡大し対象国を 15 カ国以上に
AI セキュリティ企業 Anthropic は、プロジェクト Glasswing(注:本文では Mythos と記載)のパートナー数を 150 社増やし、対象国を 15 カ国以上に拡大した。Apple や Microsoft など主要企業が参加し、これまでに 1 万件以上の重大なセキュリティ欠陥を発見している。
Wall Attention(GitHub リポジトリ)
開発者が公開した「Wall Attention」という技術の GitHub リポジトリが紹介された。具体的な機能や変更点は本文抜粋から読み取れないため、詳細は不明である。
IPO 直前のアンソロピック、AI 支出への批判に直面
企業顧客が AI 投資の見直しを迫る中、アンソロピックは高コストへの懸念から収益リスクに直面している。調査では顧客の 40% がコスト削減効果が 10% に満たないと回答しており、安価なモデルやオープンソースへの移行が脅威となっている。
オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある(8 分読)
TLDR AI は、現在のオープンソースモデルは分布外タスクで不足しているが、将来的に追いつくと指摘。最終的にオープンモデル生態系はクローズド企業寡占を超え、市場価値も OpenAI や Anthropic の累積を上回ると予測する。
大規模なAI推論の不正利用防止について(5分読了)
Vercelは、攻撃者が露出したエンドポイントを悪用して盗んだAI推論を転売する手法と、従来のレート制限が不十分な理由を説明した。同社はBotID分析を用いてすべてのリクエストを検証し、不正利用を削減するアプローチを紹介している。
Codex の新機能(6 分読)
TLDR AI が Codex の新たな機能を解説し、開発効率を向上させる新しい能力について紹介している。
Claude パートナーネットワークのサービストラックとパートナーハブを発表
Anthropic が、開発者や企業向けの Claude パートナーネットワークに「サービストラック」と「パートナーハブ」の新機能を導入したことを発表した。これにより、パートナー間の協業やリソース共有が強化される。
MiniMax、1M トークンコンテキストモデル公開後に M3 の重みを提供すると約束
MiniMax は、10 日以内に M3 モデルの重みと技術報告書を公開すると発表した。同社は現在、このモデルを MiniMax Code や API で提供しており、最大 1M トークンのコンテキストウィンドウを持つ初のオープンウェイトモデルである。
AI 活用型サイバー脅威のマッピング:LLM ATT&CK ナビゲーターからの洞察
Anthropic は過去 1 年間の調査に基づき、脅威アクターが AI を兵器として利用した実態を分析し、MITRE ATT&CK フレームワークにマッピングした。この知見は Verizon と共同で 2026 年版データ侵害調査報告書にも含まれる。
GitHub Copilot、GPT-4.1 を2026年6月1日に廃止へ
GitHub は2026年6月1日、Copilot の全機能から GPT-4.1 モデルを廃止し、代替として GPT-5.5 の利用を推奨すると発表した。管理者は設定で新モデルへのアクセスを有効化する必要がある。
マイクロソフト、新しい MAI モデルを発表
マイクロソフトは今朝、推論に特化した「MAI-Thinking-1」と GitHub コード生成向けに設計された「MAI-Code-1-Flash」の 2 つの新しいテキスト大規模言語モデルを発表した。
Datasette Agent MicroPython 0.1a0 のリリース
Simon Willison が、GPT-5.5 を使用して Python コードを安全に生成・実行する「Datasette Agent」のアルファ版「datasette-agent-micropython 0.1a0」を発表し、サンドボックスからの脱出を試みる攻撃が失敗したと報告しました。
Uber、従業員による AI 利用支出を予算超過を受けて制限
Uber は、4 ヶ月間で AI 関連の予算を大幅に超過したため、社内の従業員が AI ツールやサービスに使う支出額に上限を設ける措置を講じた。
マイクロソフト、テキスト記述から AI の動作テストを構築できる新ツールを発表
マイクロソフトは開発者がテキスト記述を用いて AI の動作テストを迅速に構築・実行できる新しいツールの提供を開始した。
トランプ大統領、AI モデルの公開前に政府レビューを義務付ける行政命令に署名
ドナルド・トランプ米大統領は火曜日、最先端 AI モデルの公開前に連邦政府への共有を促す「任意枠組み」を含む行政命令に署名した。これはセキュリティ強化と革新促進が目的である。
マイクロソフト、初の高度な推論型 AI「MAI-Thinking-1」を発表
マイクロソフトは Build 2026 で自社開発の最新モデル「MAI-Thinking-1」を発表し、OpenAI 依存から脱却して独自モデル開発に本格的に着手した。
Anthropic の IPO 申請が示す AI の企業向け実用化への成熟
生成AI開発企業のアンソロピックがIPO(株式公開)を申請し、研究段階から予測可能な課金体系や構造化されたリリーススケジュールを持つ安定した企業向けインフラへと進化していることを示しています。
Amazon Nova Forge におけるハイパーパラメータ最適化の芸術と科学
AWS は、独自データや専門知識を扱うタスクに強い大規模言語モデルを構築する「Amazon Nova Forge」において、ハイパーパラメータ最適化の手法について解説した。
GitHub Copilot の Azure Repos 向けコードレビューが技術プレビュー版として利用可能に
GitHub が、Azure DevOps ワークフローにオンデマンドのプルリクエストレビュー機能を追加する「Copilot for Azure Repos」を技術プレビューとして提供開始した。これにより、開発者はプルリクエストから直接 Copilot にコードレビューを依頼できるようになる。
GitHub Copilot CLI、クラウドエージェント、およびアプリにGeminiモデルが追加
GitHubはCopilot CLI、クラウドエージェント、アプリ(技術プレビュー)、SDKにおいて、Gemini 3.1 ProとGemini 3.5 Flashの利用を開始した。これらの機能は有料プランのサブスクライバー向けに提供される。
マイクロソフトがクアルコムに先駆けて小型 Surface 開発用ボックスを創出
マイクロソフトは、開発者向けに小型の「Surface RTX Spark Dev Box」を発表した。このデバイスは、NVIDIA の新 ARM ベースチップを搭載し、持続的な作業負荷とローカル AI タスクに最適化されている。
Eclipse における GitHub Copilot の更新:BYOK、スキル機能、チャット改善
GitHub は Eclipse プラグインの最新リリースを発表し、ビジネス・エンタープライズ向けに BYOK(Bring Your Own Key)機能を追加した。また、チャット画面を刷新し、セッションコンテキストの可視性を高め、ABAP 言語やスキル機能へのサポートを強化した。
業界の反対を受け、トランプ氏が AI 監督に関する範囲を狭めた大統領令に署名
ドナルド・トランプ米大統領は、AI 業界からの反対意見を受けた後、AI 監督に関する大統領令の範囲を縮小する形で署名を行った。
OpenAI、ホワイトカラー業務向け新 Codex ツールを発売
OpenAI は企業ユーザー獲得に注力し、職場での知識労働活用を拡大する目的で、エージェント型ツール「Codex」の新機能セットと利用状況に関する内部報告書を公開した。
Anthropic、Claude Mythos を 15 カ国以上の重要インフラに展開
AI 企業 Anthropic が、自社の最新モデル「Claude Mythos」を 15 ヶ国以上の国の重要な社会インフラシステムへ導入・拡大したと発表した。
Ai2(アレン・インスティテュート・フォー・AI)を去る挨拶:Olmo モデルへの回顧と AI 業界への示唆
Olmo モデルの開発に携わった人物が、同機関であるアレン・インスティテュート・フォー・AI(Ai2)を離れることを発表し、その功績や AI 分野における多様な影響力の道筋について振り返っている。
Claude Opus 4.8:機能と反応について
Zvi は、新モデル「Claude Opus 4.8」の理解には多数のデータポイントが必要であり、限られたベンチマークからの評価は誤解を招くと指摘し、多様なソースからの数十件のテスト結果やモデルカード情報を統合して初めて一貫したパターンが形成できると述べています。
LLM の説明可能性に関するやさしい入門ガイド
KDnuggets が、大規模言語モデル(LLM)の判断根拠を人間が理解しやすくする手法や重要性について解説した入門記事である。
ZeroDrift が AI モデルの自己破損を防ぐため 1000 万ドルを調達
スタートアップ企業の ZeroDrift は、AI モデルが学習データや環境の変化によって性能が低下する現象(ドリフト)から保護するための技術開発に注力し、シリーズ A ラウンドで 1000 万ドルの資金調達を実現した。
Vertex AIのEmbedding TuningはRAGを改善するのか?検索精度・汎用性・運用コストで検証してみた
Simon Willison Blog の「Pasted File Editor」ツール紹介
Simon Willison は、Claude などの AI ツールで大量のテキストを貼り付けるとファイルとして自動認識される機能に着想を得て、Codex Desktop を活用して同様の機能を備えたプロトタイプツール「Pasted File Editor」を開発したと発表した。
Codex がすべての人の生産性ツールへと進化中
OpenAI は、コード生成 AI「Codex」を特定の開発者だけでなく、あらゆるユーザーが日常的に活用できる汎用的な生産性ツールとして位置づけ、その普及と機能強化を進めている。
効率的な推論のための MiniMax-M3 の提供:後悔のない 100 万トークンコンテキストとマルチモーダル性の解放
Together AI は、MiniMax-M3 モデルの提供を開始し、100 万トークンのコンテキスト長とマルチモーダル機能を効率的に実現した。
Cursor がチーム利用制限を拡大
開発支援 AI ツール「Cursor」が、企業向けプランにおけるチームメンバーの利用上限を引き上げました。これにより、大規模な開発チームでもより多くのメンバーがツールを活用できるようになります。
Amazon Bedrock で OpenAI モデルを実行する方法(58 分読了)
TLDR AI が、Amazon Bedrock プラットフォーム上で OpenAI のモデルをどのように実行するかを解説した記事を紹介している。