メインコンテンツへスキップ

#llm のAIニュース

1867件の記事

Google の新モデル「Gemma 4 12B」は 16GB RAM のノート PC で動作可能に設計

Google は、メモリ消費を抑えた新しい生成 AI モデル「Gemma 4 12B」を発表した。このモデルは、一般的な消費者向けノートパソコン(RAM 16GB)でも実行できるように最適化されており、ローカルでの AI 利用を促進するものである。

Ars Technica AI·6月4日·★★★★

ポッドキャスト:ハッカーが Meta AI にアクセスを要求し、それが成功した話

ハッカーが Meta の AI チャットボットにターゲットの Instagram アカウントのメールアドレス変更を依頼し、AI がその指示を実行してアカウント乗っ取りを許容した事例を紹介する。

404 Media·6月4日·★★★★

Amazon SageMaker AI で SFT と DPO を活用し、エージェントのツール呼び出し精度を向上させる方法

AWS は、Amazon SageMaker AI を使用して教師あり学習(SFT)と直接最適化(DPO)を適用することで、AI エージェントが適切なツールを選択する精度を高め、エラー率やサポートコストを削減できると発表した。

AWS Machine Learning Blog·6月4日·★★★★

企業が Reddit を活用して ChatGPT や Google AI Search の回答を操作している

バイオハッキングサブレディットのモデレーターによると、ペプチドやホルモン補充療法関連の企業が、AI チャットボットに自社の投稿をスクレイピングさせ、その結果として生成される回答を体系的に操作しようとしている。

404 Media·6月3日·★★★★

マイクロソフトと OpenAI の決裂後、両社は激しく対立する準備を整えた

マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。

The Verge AI·6月3日·★★★★

Meta の WhatsApp ビジネス向け AI エージェントが全世界で利用可能に

Meta が、WhatsApp Business アプリ内で顧客対応を自動化する AI エージェント機能を全世界展開した。これにより中小企業でも 24 時間体制の自動応答が可能になる。

TechCrunch AI·6月3日·★★★★

Meta の AI 追いつきへの試みを探る

マーク・ザッカーバーグは、28 歳のスタートアップ創業者アレクサンダー・ワンを起用し、1.5 兆ドル規模の Meta が「Muse Spark」という信頼性の高い AI モデルを開発した。

Ars Technica AI·6月3日·★★★★

Visual Studio CodeにおけるGitHub Copilot、5月リリース

Microsoftは2026年5月にVisual Studio Codeをバージョン1.120から1.123へ更新し、タスク完了に焦点を当てたエージェントファースト体験を提供する「Agentsウィンドウ」を安定版でプレビューとして公開した。

GitHub Changelog·6月3日·★★★★

GPT-Rosalind に新機能導入を発表

OpenAI が、自身の開発した GPT-Rosalind というモデルに対して、新たな機能を追加することを発表した。これにより、同モデルの性能や利用範囲が拡大する見込みである。

OpenAI News·6月3日·★★★★

チャットボットを超えた直接選好最適化

Hugging Face は、チャットボットの分野に限定されない形で直接選好最適化(DPO)の応用範囲を広げる研究を発表しました。

Hugging Face Blog·6月3日·★★★★

Uber、コスト管理のためClaude CodeなどのAIツールの利用を制限

Uberは2026年のAI予算を4ヶ月で使い果たしたため、Claude CodeなどのAIツールの利用に上限を設けてコスト削減を図っている。

Simon Willison Blog·6月3日·★★★★

LLM を明確に解説する面白い論文 5 選

KDnuggets が、大規模言語モデル(LLM)の仕組みを分かりやすく説明する 5 つの有益な論文を紹介した。

KDnuggets·6月3日

ウォルマートの AI ワークフローが財務現実と直面

ウォルマートは、内部 AI アシスタント「Code Puppy」への過度な要求により、従業員の利用に固定されたトークン数を割り当てて制限を開始した。

AI News·6月3日·★★★★

【Next Tokyo セッション公開】スクウェア・エニックスとリクルートが「Gemini 本番実装」のアーキテクチャを公開

スクウェア・エニックスとリクルートは、Google Developers JP が開催した Next Tokyo セッションで、大規模言語モデル Gemini を本番環境に導入する際の具体的なアーキテクチャ設計について発表した。

Google Developers JP·6月3日

Google、Play ストア開発者のコードを AI 訓練用に購入へ

Google は Android アプリ開発者に対し、AI コーディングツールの訓練に使用するコードへのアクセス権を購入する提案を非公式に行っている。

404 Media·6月3日·★★★★

Anthropic、Mythos を 150 の追加組織に拡大し対象国を 15 カ国以上に

AI セキュリティ企業 Anthropic は、プロジェクト Glasswing(注:本文では Mythos と記載)のパートナー数を 150 社増やし、対象国を 15 カ国以上に拡大した。Apple や Microsoft など主要企業が参加し、これまでに 1 万件以上の重大なセキュリティ欠陥を発見している。

TLDR AI·6月3日·★★★★

Wall Attention(GitHub リポジトリ)

開発者が公開した「Wall Attention」という技術の GitHub リポジトリが紹介された。具体的な機能や変更点は本文抜粋から読み取れないため、詳細は不明である。

TLDR AI·6月3日·★★★★

IPO 直前のアンソロピック、AI 支出への批判に直面

企業顧客が AI 投資の見直しを迫る中、アンソロピックは高コストへの懸念から収益リスクに直面している。調査では顧客の 40% がコスト削減効果が 10% に満たないと回答しており、安価なモデルやオープンソースへの移行が脅威となっている。

TLDR AI·6月3日·★★★★

オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある(8 分読)

TLDR AI は、現在のオープンソースモデルは分布外タスクで不足しているが、将来的に追いつくと指摘。最終的にオープンモデル生態系はクローズド企業寡占を超え、市場価値も OpenAI や Anthropic の累積を上回ると予測する。

TLDR AI·6月3日·★★★★

大規模なAI推論の不正利用防止について(5分読了)

Vercelは、攻撃者が露出したエンドポイントを悪用して盗んだAI推論を転売する手法と、従来のレート制限が不十分な理由を説明した。同社はBotID分析を用いてすべてのリクエストを検証し、不正利用を削減するアプローチを紹介している。

TLDR AI·6月3日·★★★★

Codex の新機能(6 分読)

TLDR AI が Codex の新たな機能を解説し、開発効率を向上させる新しい能力について紹介している。

TLDR AI·6月3日·★★★★

Claude パートナーネットワークのサービストラックとパートナーハブを発表

Anthropic が、開発者や企業向けの Claude パートナーネットワークに「サービストラック」と「パートナーハブ」の新機能を導入したことを発表した。これにより、パートナー間の協業やリソース共有が強化される。

Anthropic News·6月3日·★★★★

MiniMax、1M トークンコンテキストモデル公開後に M3 の重みを提供すると約束

MiniMax は、10 日以内に M3 モデルの重みと技術報告書を公開すると発表した。同社は現在、このモデルを MiniMax Code や API で提供しており、最大 1M トークンのコンテキストウィンドウを持つ初のオープンウェイトモデルである。

TLDR AI·6月3日·★★★★

AI 活用型サイバー脅威のマッピング:LLM ATT&CK ナビゲーターからの洞察

Anthropic は過去 1 年間の調査に基づき、脅威アクターが AI を兵器として利用した実態を分析し、MITRE ATT&CK フレームワークにマッピングした。この知見は Verizon と共同で 2026 年版データ侵害調査報告書にも含まれる。

Anthropic Red Team·6月3日·★★★★

GitHub Copilot、GPT-4.1 を2026年6月1日に廃止へ

GitHub は2026年6月1日、Copilot の全機能から GPT-4.1 モデルを廃止し、代替として GPT-5.5 の利用を推奨すると発表した。管理者は設定で新モデルへのアクセスを有効化する必要がある。

GitHub Changelog·6月3日·★★★★

マイクロソフト、新しい MAI モデルを発表

マイクロソフトは今朝、推論に特化した「MAI-Thinking-1」と GitHub コード生成向けに設計された「MAI-Code-1-Flash」の 2 つの新しいテキスト大規模言語モデルを発表した。

Simon Willison Blog·6月3日·★★★★

Datasette Agent MicroPython 0.1a0 のリリース

Simon Willison が、GPT-5.5 を使用して Python コードを安全に生成・実行する「Datasette Agent」のアルファ版「datasette-agent-micropython 0.1a0」を発表し、サンドボックスからの脱出を試みる攻撃が失敗したと報告しました。

Simon Willison Blog·6月3日

Uber、従業員による AI 利用支出を予算超過を受けて制限

Uber は、4 ヶ月間で AI 関連の予算を大幅に超過したため、社内の従業員が AI ツールやサービスに使う支出額に上限を設ける措置を講じた。

TechCrunch AI·6月3日·★★★★

マイクロソフト、テキスト記述から AI の動作テストを構築できる新ツールを発表

マイクロソフトは開発者がテキスト記述を用いて AI の動作テストを迅速に構築・実行できる新しいツールの提供を開始した。

TechCrunch AI·6月3日·★★★★

トランプ大統領、AI モデルの公開前に政府レビューを義務付ける行政命令に署名

ドナルド・トランプ米大統領は火曜日、最先端 AI モデルの公開前に連邦政府への共有を促す「任意枠組み」を含む行政命令に署名した。これはセキュリティ強化と革新促進が目的である。

The Verge AI·6月3日·★★★★

マイクロソフト、初の高度な推論型 AI「MAI-Thinking-1」を発表

マイクロソフトは Build 2026 で自社開発の最新モデル「MAI-Thinking-1」を発表し、OpenAI 依存から脱却して独自モデル開発に本格的に着手した。

The Verge AI·6月3日·★★★★

Anthropic の IPO 申請が示す AI の企業向け実用化への成熟

生成AI開発企業のアンソロピックがIPO(株式公開)を申請し、研究段階から予測可能な課金体系や構造化されたリリーススケジュールを持つ安定した企業向けインフラへと進化していることを示しています。

AI News·6月3日·★★★★

Amazon Nova Forge におけるハイパーパラメータ最適化の芸術と科学

AWS は、独自データや専門知識を扱うタスクに強い大規模言語モデルを構築する「Amazon Nova Forge」において、ハイパーパラメータ最適化の手法について解説した。

AWS Machine Learning Blog·6月3日·★★★★

GitHub Copilot の Azure Repos 向けコードレビューが技術プレビュー版として利用可能に

GitHub が、Azure DevOps ワークフローにオンデマンドのプルリクエストレビュー機能を追加する「Copilot for Azure Repos」を技術プレビューとして提供開始した。これにより、開発者はプルリクエストから直接 Copilot にコードレビューを依頼できるようになる。

GitHub Changelog·6月3日·★★★★

GitHub Copilot CLI、クラウドエージェント、およびアプリにGeminiモデルが追加

GitHubはCopilot CLI、クラウドエージェント、アプリ(技術プレビュー)、SDKにおいて、Gemini 3.1 ProとGemini 3.5 Flashの利用を開始した。これらの機能は有料プランのサブスクライバー向けに提供される。

GitHub Changelog·6月3日·★★★★

マイクロソフトがクアルコムに先駆けて小型 Surface 開発用ボックスを創出

マイクロソフトは、開発者向けに小型の「Surface RTX Spark Dev Box」を発表した。このデバイスは、NVIDIA の新 ARM ベースチップを搭載し、持続的な作業負荷とローカル AI タスクに最適化されている。

The Verge AI·6月3日·★★★★

Eclipse における GitHub Copilot の更新:BYOK、スキル機能、チャット改善

GitHub は Eclipse プラグインの最新リリースを発表し、ビジネス・エンタープライズ向けに BYOK(Bring Your Own Key)機能を追加した。また、チャット画面を刷新し、セッションコンテキストの可視性を高め、ABAP 言語やスキル機能へのサポートを強化した。

GitHub Changelog·6月3日·★★★★

業界の反対を受け、トランプ氏が AI 監督に関する範囲を狭めた大統領令に署名

ドナルド・トランプ米大統領は、AI 業界からの反対意見を受けた後、AI 監督に関する大統領令の範囲を縮小する形で署名を行った。

TechCrunch AI·6月3日·★★★★

OpenAI、ホワイトカラー業務向け新 Codex ツールを発売

OpenAI は企業ユーザー獲得に注力し、職場での知識労働活用を拡大する目的で、エージェント型ツール「Codex」の新機能セットと利用状況に関する内部報告書を公開した。

TechCrunch AI·6月3日·★★★★

Anthropic、Claude Mythos を 15 カ国以上の重要インフラに展開

AI 企業 Anthropic が、自社の最新モデル「Claude Mythos」を 15 ヶ国以上の国の重要な社会インフラシステムへ導入・拡大したと発表した。

TechCrunch AI·6月2日·★★★★

Ai2(アレン・インスティテュート・フォー・AI)を去る挨拶:Olmo モデルへの回顧と AI 業界への示唆

Olmo モデルの開発に携わった人物が、同機関であるアレン・インスティテュート・フォー・AI(Ai2)を離れることを発表し、その功績や AI 分野における多様な影響力の道筋について振り返っている。

Interconnects·6月2日

Claude Opus 4.8:機能と反応について

Zvi は、新モデル「Claude Opus 4.8」の理解には多数のデータポイントが必要であり、限られたベンチマークからの評価は誤解を招くと指摘し、多様なソースからの数十件のテスト結果やモデルカード情報を統合して初めて一貫したパターンが形成できると述べています。

The Zvi·6月2日·★★★★

LLM の説明可能性に関するやさしい入門ガイド

KDnuggets が、大規模言語モデル(LLM)の判断根拠を人間が理解しやすくする手法や重要性について解説した入門記事である。

KDnuggets·6月2日

ZeroDrift が AI モデルの自己破損を防ぐため 1000 万ドルを調達

スタートアップ企業の ZeroDrift は、AI モデルが学習データや環境の変化によって性能が低下する現象(ドリフト)から保護するための技術開発に注力し、シリーズ A ラウンドで 1000 万ドルの資金調達を実現した。

TechCrunch AI·6月2日·★★★★

Vertex AIのEmbedding TuningはRAGを改善するのか?検索精度・汎用性・運用コストで検証してみた

HEROZ Tech Blog·6月2日·★★★★

Simon Willison Blog の「Pasted File Editor」ツール紹介

Simon Willison は、Claude などの AI ツールで大量のテキストを貼り付けるとファイルとして自動認識される機能に着想を得て、Codex Desktop を活用して同様の機能を備えたプロトタイプツール「Pasted File Editor」を開発したと発表した。

Simon Willison Blog·6月2日

Codex がすべての人の生産性ツールへと進化中

OpenAI は、コード生成 AI「Codex」を特定の開発者だけでなく、あらゆるユーザーが日常的に活用できる汎用的な生産性ツールとして位置づけ、その普及と機能強化を進めている。

OpenAI News·6月2日·★★★★

効率的な推論のための MiniMax-M3 の提供:後悔のない 100 万トークンコンテキストとマルチモーダル性の解放

Together AI は、MiniMax-M3 モデルの提供を開始し、100 万トークンのコンテキスト長とマルチモーダル機能を効率的に実現した。

Together AI Blog·6月2日·★★★★

Cursor がチーム利用制限を拡大

開発支援 AI ツール「Cursor」が、企業向けプランにおけるチームメンバーの利用上限を引き上げました。これにより、大規模な開発チームでもより多くのメンバーがツールを活用できるようになります。

TLDR AI·6月2日·★★★★

Amazon Bedrock で OpenAI モデルを実行する方法(58 分読了)

TLDR AI が、Amazon Bedrock プラットフォーム上で OpenAI のモデルをどのように実行するかを解説した記事を紹介している。

TLDR AI·6月2日·★★★★