#llm のAIニュース
1841件の記事
AI #172:最初の寓話
The Zvi は、Anthropic が「Mythos」クラスのモデルである Claude Fable 5 を公開したと報告し、強力な安全対策と共に非常に優れた性能を持つ新モデルであると評価している。
シークレットスキャンの信頼性向上:大規模な誤検知の削減
GitHub は、開発者が本番環境でのセキュリティインシデントを防ぐために重要な役割を果たすシークレットスキャンにおいて、誤検知が多発してアラートが信頼されなくなる問題を解決するため、大規模なシステムで誤検知を削減する取り組みを発表した。
エージェント型ワークフローに個人アクセストークンが不要に
GitHub が、エージェント型ワークフローで GitHub Actions の組み込み GITHUB_TOKEN を利用可能にした。これにより、長期の個人アクセストークンの管理やセキュリティリスクを解消し、組織単位での課金が可能になった。
チャットボットが「灯台守エライアス・ソーン」の物語を語る理由、その正体が判明か
404 Media は、ChatGPT など主要な大規模言語モデルが、時計職人や司書など異なる設定で「灯台守エライアス・ソーン」という架空人物の物語を生成し続けている現象について分析している。この一貫した誤情報が自己出版された AI 生成書籍や YouTube、偽ニュースサイトを溢れさせている背景にある理由を探っている。
Visa と ChatGPT の統合により AI エージェントが小売購入を可能に
Visa が決済インフラを ChatGPT に連携させ、AI エージェントが商品推薦から決済実行まで人間を介さず自動処理する機能を導入した。
Cohere が開発者向けコード生成モデル「North Mini Code」を発表:30B パラメータの MoE アーキテクチャで 3B アクティブ
Cohere AI チームは、ソフトウェアエンジニア向けのオープンウェイトコード生成モデル「North Mini Code」を公開した。このモデルは総パラメータ数 30B の混合専門家(MoE)アーキテクチャを採用し、トークン処理時に 3B のパラメータのみが活性化するように設計されている。
今日は何も起こらなかったわけではない:輸出規制とAI能力の緊張関係
アンソロピック社のFable/Mythos輸出管理危機がニュースを支配し、国家安全保障と最先端モデルへのアクセスの交差点が浮き彫りになった。フランソワ・ショレ氏らは不透明な規制を批判し、エージェント機能の標準化されたベンチマークを提唱している。
Anthropic のダリオ・アモダイ氏に直属の部下はたった一人だけ
AI 企業 Anthropic の CEO ダリオ・アモダイ氏が、組織運営において直属の部下を一人しか置かないという独自の管理方針を採用していることが明らかになった。
[AINews] オープンモデル、モデルラボとエージェントラボ、そして学習不可能なもの — サラ・グオ
AI投資家のサラ・グオ氏が、サブスタックで公開した記事において、オープンモデルの動向やモデルラボとエージェントラボの違い、さらに学習が不可能な領域について分析している。
AI がソフトウェアエンジニアを代替しない理由と将来展望
AI スネイクオイルは、AI の能力が一定の閾値に達しても大量解雇は起きないという証拠があるとし、ソフトウェア工学分野におけるデータに基づき、AI による雇用代替に関する不安な物語を否定している。
BBVA、OpenAI と連携し AI を銀行業務の中核に据える
スペインの大手銀行 BBVA は、OpenAI の技術を活用して AI を自社の銀行業務の中核に位置づけ、顧客体験や業務効率の向上を図ると発表した。
Grok Build に Vercel プラグインが利用可能に
Vercel が Grok Build にプラグインを提供開始し、ファイル編集やターミナルコマンドなどのリアルタイム活動情報を文脈に動的に注入することで、回答を最新のプラットフォーム API や推奨パターンと一致させる機能を追加した。
Palantir のカープ CEO が先端的 AI ラボ企業への不満を表明(5 分読了)
Palantir のアレックス・カープ最高経営責任者は、先端的 AI ラボ企業が生成 AI トークンの消費に注力し生産性を示そうとしていると主張し、企業の顧客がコスト増大に不安を抱いていると語った。
OpenAI、Nvidia 支援のオハイオ州 10GW データセンターキャンパスのリースを検討中
OpenAI は、Nvidia の支援を受けたオハイオ州に建設中の巨大データセンターキャンパス(容量 10GW)のリース契約を現在検討している。この計画は同社の AI モデル開発に必要な膨大な計算リソースを確保する目的で行われている。
EU、Meta に WhatsApp で競合 AI チャットボットのブロック停止を命令
欧州連合(EU)は、Meta がWhatsAppのビジネスAPIから競合他社のAIチャットボットを排除していることを支配的地位の濫用と認定し、無料での開放を命じた。Meta はこの決定が規制の行き過ぎであり、大企業に無償アクセスを与えるものとして異議申し立てを行う方針だ。
LLM が N 日脆弱性攻撃に与える影響を測定する(18 分読了)
TLDR AI は、公開済みだが未修正の N 日脆弱性がパッチから逆解析されるリスクについて分析し、AI がこのプロセスを加速・自動化することで脅威が拡大すると指摘した。
Fable-5 システムプロンプトの流出(27 分読了)
AI 開発企業 Fable が、自社の AI モデル「Fable-5」のシステムプロンプトが外部に漏洩したことを発表しました。
LLM に話させず、内部状態を直接プローブせよ(8 分読了)
TLDR AI は、大規模言語モデルがトークンを生成する前に内部状態に答えが存在することを示し、最後のプロンプトトークンの隠れ状態を抽出して小型ニューラルネットワークに入力することで、モデルを英語で記述された分類器として動作させる手法を紹介した。
DiffusionGemma:テキスト生成が4倍高速化(5分読了)
Google の DiffusionGemma は、26B モデルの MoE 構造を採用し、テキストブロックを並列生成することで GPU 上で最大4倍の速度向上を実現しました。このモデルは低遅延と双方向アテンションを特徴とし、量子化により高価なコンシューマー向け GPU でも動作可能ですが、標準モデルと比較して品質が若干低下します。
Claude Corps の紹介
Anthropic が、複数の Claude モデルを統合・連携させる新機能「Claude Corps」を発表した。これにより、複雑なタスク処理や大規模な推論がより効率的に行えるようになる。
AI Gateway を介して DeepSeek モデルが Azure で利用可能に
Vercel は AI Gateway に Azure プロバイダーを追加し、DeepSeek V4 Pro および Flash モデルへのリクエストを Azure 経由でルーティング可能にした。コード変更なしでフォールオーバー経路として機能する。
xAI がグロックの安全性に関する警告を上げたエンジニアを解雇、新たな訴訟が主張
xAI は、AI 生成モデル「Grok」の安全性に懸念を示したエンジニアを解雇し、これに対し同エンジニアが会社を相手取り訴訟を起こしたと主張している。
DiffusionGemma:Google の高速テキスト生成モデルが再登場
Google は昨年実験的に公開した Gemini Diffusion モデルの研究を再開し、DiffusionGemma として再発表しました。このモデルは以前 1 秒間に 857 トークンの生成速度を記録しており、テキスト生成の高速化に寄与する技術です。
Oracle クラウドコミットメントを通じて OpenAI モデルと Codex にアクセス可能に
OpenAI は、Oracle のクラウドコミットメントを利用する顧客に対し、同社の AI モデルおよびコード生成ツール「Codex」へのアクセス権を提供すると発表した。
Google DeepMind、ローカルAIを4倍高速化する拡散モデル「DiffusionGemma」を公開
Google DeepMindは、従来の逐次生成ではなくテキストブロックを並列生成する新モデル「DiffusionGemma」を発表し、Nvidia DGXやゲーミングGPUなどのローカル環境で処理速度を4倍に向上させたと発表した。
Google AI、テキスト拡散を用いた26B MoEオープンモデル「DiffusionGemma」を公開
Google DeepMindチームは、標準的な自己回帰型ではなくテキスト拡散方式を採用した実験的オープンモデル「DiffusionGemma」をApache 2.0ライセンスで公開し、開発者や研究者向けに高速な生成ワークフローを提供する。
Fable は基礎的な生物学の質問に回答しない
Anthropic が発表した最新 AI モデル「Claude Fable 5」は、生物学分野で強力とされるが、高校生レベルの基礎的な生物学質問には回答せず、別のシステムへ転送する仕様となっている。
ドイツ裁判所、AI による検索結果の誤情報について Google に責任を認める判決を下す
ドイツの裁判所は、Google の AI オーバービューが出版者を偽の情報や詐欺と結びつける誤った記述を行ったとして、同社に法的責任があると判断した。この判決は、出典リンクを不適切に要約するすべての AI 検索エンジンおよびチャットボットに影響を与える可能性がある。
マイクロソフト、データ保持を理由に従業員へのClaude Fableの利用を制限
Anthropicが新モデル「Claude Fable」を発表したが、Microsoftは同社のデータ保持要件を懸念し、社内の従業員による利用を制限した。
DiffusionGemma:テキスト生成が4倍高速化
Google DeepMind は、新しい手法「DiffusionGemma」を発表し、テキスト生成の速度を従来の4倍に向上させることに成功しました。
開発者向け高スループットテキスト生成のために NVIDIA で DiffusionGemma を実行する
NVIDIA は、開発者が NVIDIA のプラットフォーム上で DiffusionGemma モデルを実行し、高速なテキスト生成を実現する方法を公開した。
メモリツールが AI モデルの性能を低下させる理由
TechCrunch AI は、AI モデルに実装されたメモリツールの使用が、かえってモデルの精度や信頼性を低下させる可能性について分析している。
ジェレミー・ハワード氏への引用:AI の自己改善を抑制する提案
ジェレミー・ハワード氏は、最先端モデルを開発するラボがその技術を自らの研究に使用しないよう合意し、他社にはアクセスを認めることで、危険な権力格差を防ぎつつ AI 進化を抑制する解決策を提案した。
Datadog の元社員らがビッグAIの囲い込みに賭け、AI コーディングスタートアップ「Niteshift」を設立
Datadog の元従業員たちが、大手 AI ベンダーによる囲い込みへの対抗策として、新しい AI コーディング支援スタートアップ「Niteshift」を立ち上げました。
低コストでのローカルエージェント型プログラミング:Claude Code、Ollama、Gemma4の活用
KDnuggets は、Claude Code と Ollama、Gemma4 を組み合わせることで、高価なクラウドサービスに頼らずローカル環境でエージェント型プログラミングを実現する手法を紹介している。
ポッドキャスト:Google 社員の AI への不満を揶揄するミームについて
404 Media のポッドキャストでは、Google 社員が自社の AI の性能の低さを皮肉る内部ミームについて言及し、マイクロソフトが新 AI アシスタントで依存症を作ろうとしているという内部文書の内容も紹介している。
中国系影響力操作が米国の AI 議論を標的にしている
OpenAI は、中国に関連する勢力がアメリカ国内の人工知能に関する議論に介入し、影響力を行使しようとしていると警告した。
Copilot CLI に専用セキュリティレビューコマンドが追加
GitHub Copilot CLI が、コード変更のセキュリティ脆弱性を検出する「/security-review」コマンドを公開プレビューとして提供開始した。
Google の技術を採用した Siri AI が登場、しかし世界の多くは利用不可
Apple は WWDC 2026 で、ゼロから再構築された新 Siri AI を発表し、Google の技術を組み込んで多段階対話を実現したが、多くの地域ではまだ利用できない。
マクドナルド、Google 支援の AI ドライブスルー注文システムをテスト中
マクドナルドは、Google が支援する「ArchIQ」と呼ばれるAIシステムを米国の5店舗で試験運用しており、このシステムがドライブスルーでの注文受付や店舗運営をサポートしている。
Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場
Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。
AI ヘルスコーチの構築:評価、安全性、規制対応について
LangChain が AI ヘルスコーチの開発において、評価手法や安全性確保、規制遵守の重要性を解説している。
今日は何も起こらなかった
Anthropic が Fable/Mythos モデルの能力を無断で低下させたとして批判されたが、Fable 5 はエージェントやコーディングタスクで高い性能を示した。Dario Amodei は最先端 AI の監督強化を提唱している。
ストリーミング、Pandas、tiktoken を活用した NVIDIA Nemotron-Pretraining-Code-v3 メタデータからのコードデータセットパイプライン構築
MarkTechPost は、NVIDIA の大規模コード事前学習用データセット「Nemotron-Pretraining-Code-v3」のメタデータを対象に、フルダウンロードを避けてストリーミング処理し、Pandas と tiktoken を使用して分析可能なサンプルパイプラインを構築する手法を紹介している。
AIはQAを代替していない、むしろその可能性を拡張している
Claude Fable があなたを支援しなくなっても、あなたは決して知らないかもしれない
Jonathon Ready は、Anthropic の Fable 5 と Mythos 5 のシステムカードから、競合他社に対してアプリを妨害する権限が与えられている可能性という驚くべき詳細を指摘した。
Claude Fable 5 と新たな AI セーフティ・ファブル(14 分読了)
Anthropic は Claude Fable 5 のリリースに伴い、ユーザーに知らせずにモデルを改変する安全対策を導入した。この不透明な手法は業界の信頼を損ない、ユーザーが知能を制御できる必要性を浮き彫りにしている。
テック企業は安価な AI モデルを愛せるようになるか?(4 分読了)
TLDR AI は、コスト削減のために安価な AI モデルを採用する動きが業界全体に広がりつつある現状と、その技術的・経済的な課題について分析している。
FlashMemory DeepSeek-V4 リトリーバー(GitHub リポジトリ)
FlashMemory は、DeepSeek-V4 の KV キャッシュのうち将来のトークンが参照する可能性が高い断片を予測し、GPU 上に最も関連性の高い断片のみを保持します。これにより、デバイスのメモリ使用量を約 10〜15% に抑えつつ、下流タスクのパフォーマンスを維持または向上させることが報告されています。
テキストを本格的な最適化レイヤーとして位置づける(8 分読了)
TLDR AI は、テキストデータを単なる情報源ではなく、システム性能を向上させるための重要な最適化層として再評価するべきだと主張している。