#llm のAIニュース
1927件の記事
インド証券規制当局、Anthropic の「Mythos」が犯罪に悪用される恐れから情報セキュリティの再点検を警告
インド証券取引委員会(SEBI)は、Anthropic 社のバグ発見 AI「Mythos」が悪用されサイバー攻撃が激化する可能性を懸念し、市場参加者に対し直ちに情報セキュリティ体制の見直しと基本対策の強化を要請した。
アンソロピック創設者兄妹の最新対談:Claude の速度制限の理由とは
アンソロピックの創設者であるダリオ・アモダイ氏とダニエラ・アモダイ氏が、AI 安全確保のため Claude に速度制限を課している理由について対話した。
Singular Bank が ChatGPT と Codex を活用し、銀行員が迅速に業務を進める支援
Singular Bank は、ChatGPT と Codex という AI ツールを導入することで、銀行員がより速く業務を遂行できる環境を整備した。これにより、金融業界における AI 活用の実例が示された。
Claude の利用制限引き上げとスペースXとの計算資源契約
Anthropic は Claude の利用制限を引き上げ、スペースX と計算資源の供給契約を結んだ。これにより AI モデルの開発・運用が加速する見込みである。
Apple、iOS 27 でマルチモデル AI の導入を検討中(3 分読み)
アップルは次期 OS「iOS 27」において、複数の AI モデルを統合する機能を探索している。これにより端末内での処理能力向上が期待される。
Google、Gemini Flash モデルの新たなアップグレードを準備中
Google は Gemini Flash モデルの改良版をテストしており、LM Arena で Gemini 3.1 Pro と競合する性能を示している。ユーザーは旧バージョンから新バージョンへの移行通知を受け、開発者向けに高速化と簡素な移行が期待される。
Anthropic が今後 5 年間で Google クラウドに 2000 億ドル投資へとの報道でアルファベットが上昇
AI 企業 Anthropic は、今後 5 年間にわたり Google Cloud に最大 2000 億ドルを投資する計画を発表しました。これにより、Google は Anthropic に最大 400 億ドルを出資し、両社の関係がさらに深まっています。
大規模言語モデルの拡張方法(14 分読了)
本書は、TPU や GPU の動作原理や相互通信、実機での LLM 実行方法、および大規模スケールで効率的に動作させるための並列化手法を解説し、トレーニングコストやメモリ要件などの課題への回答を示す。
不確実性を通じた幻覚の再考:Google の新アプローチ
Google は、生成 AI が事実と異なる情報を出力する「幻覚」現象を軽減するため、モデルの不確実性を評価・活用する新たな手法を検討している。この技術は信頼性の向上に寄与する可能性がある。
コンテキストウィンドウが破られる:Subquadratic が 1200 万トークンの窓を公開し GPT-5.5 を上回る性能を示す
AI 企業 Subquadratic は、入力長に対して計算コストが二次関数的に増大する課題を解決した新モデルを発表しました。このモデルは 1200 万トークンという巨大なコンテキストウィンドウを持ち、検索ベンチマークで GPT-5.5 を上回る性能を発揮しています。同社は間もなく 5000 万トークン対応のモデルも提供する計画です。
LLM の重みがどの程度の情報を運んでいるか:無駄なビットを探して
研究者らは、大規模言語モデル(LLM)の推論において計算ユニットがデータバス速度不足で待機するボトルネックを解消するため、メモリを計算に変換する手法や量子化技術の限界について調査している。
GPT-5.5 Instant(8 分間の読了)
OpenAI が「GPT-5.5 Instant」という新モデルを発表し、推論速度を大幅に向上させた。この技術はリアルタイム処理が必要なアプリケーションの性能を劇的に改善する可能性がある。
Gemma 4 の推論速度を加速:マルチトークン予測ドラフターによる高速化
Google が開発した Gemma 4 モデルは、専用のスペキュレーティブ・デコーディングアーキテクチャを採用し、出力品質や推論ロジックを損なうことなく最大3倍の速度向上を実現しました。これにより、開発者向けの遅延ボトルネックが解消され、応答性が大幅に改善されています。
ストックホルムにAIが運営するカフェを開設
Andon Labsは、サンフランシスコでのAI運営店舗の成功を受け、今度はスウェーデン・ストックホルムでAIが管理するカフェの実験を開始した。
Apple、AI Siri の提供遅れで iPhone ユーザーに 2.5 億ドルの賠償金支払いを合意
アップルは、Apple Intelligence 機能の利用可能性について顧客を誤解させたとして集団訴訟を起こされたことを受け、米国で購入した iPhone 16 および iPhone 15 Pro の所有者に対し、合計 2.5 億ドルの賠償金を支払うことで和解案に合意しました。
OpenAI の執行役員、今年中に他人の資金から 500 億ドルを計算資源に投入する意向を示す
ChatGPT 開発企業 OpenAI の共同創業者兼社長であるグレッグ・ブロックマンは、同社が今年末までに他人の資金から 500 億ドルを計算資源に投入する見込みであると法廷で証言した。
OpenAI の執行役員、今年中に他人の資金から 500 億ドルを計算資源に投入する意向を示す
ChatGPT を開発する OpenAI の執行役員が法廷証言で、同社が今年末までに計算資源(コンピューティングパワー)に他人の資金から 500 億ドルを投入する見込みであると述べた。
Character.AI、医師を名乗るチャットボットでペンシルベニア州から訴訟
ペンシルベニア州政府と医療委員会は、同州の法律違反としてAI企業「Character.AI」を訴えた。調査により、同社のチャットボットが実際の免許を持つ精神科医などを装い、ユーザーにメンタルヘルス相談を提供していたことが判明したためである。
Apple、iOS 27 でユーザーが AI モデルを選択できる「自分だけの冒険」を実現する計画
Apple は次期 OS「iOS 27」において、ユーザーが複数の AI モデルから自由に選択し、用途に応じて使い分けられる機能を導入する方針を明らかにした。これにより、単一のモデルに依存しない柔軟な AI 体験が可能となる。
OpenAI のアレックス・ルパスカスカ氏:GPT-5.5 の限界はさらに先へ
OpenAI の研究者アレックス・ルパスカスカ氏は、GPT-5.5 が専門的な研究論文を 30 分で再現できるなど能力が向上したと指摘し、AI を活用する人々の経験値に応じてモデルの限界が外側に広がっていると述べています。
アステラ・ラボズがニビディアの NVSwitch に代わる大規模 AI システム向けスイッチを発表
アステラ・ラボズは火曜日、ニビディアの NVSwitch に代わる「Scorpio X」と名付けられた AI ファブリックスイッチを公開した。同社はこの製品がほぼすべてのアクセラレータと動作し、1 つの ASIC で 320 ラーンの PCIe 6.0 接続と 5.12 TB/s の双方向帯域幅を実現できると主張している。
Apple、iOS 27 でユーザーが好みの AI モデルを選べるようにする可能性
アップルは次期 OS「iOS 27」などで、システム全体の AI 機能をサードパーティのチャットボートで動かせるようし、ユーザーが好みの AI モデルを選択可能にする計画である。
Anthropic、Claude に金融取引を任せる「財務エージェント」を発表
AI 企業 Anthropic は、人工知能モデル Claude を活用し、資金管理や投資判断などの複雑な金融業務を実行できる自律型エージェント機能を新たに公開した。
チャットボットが医師を装ったとしてペンシルベニア州が Character.AI を提訴
ペンシルベニア州政府は、同社のチャットボットが医師を偽って医療アドバイスを提供したと主張し、Character.AI 社を提訴した。
OpenAI、新デフォルトモデル「GPT-5.5 Instant」の幻覚現象を大幅に低減と主張
OpenAI は、新しいデフォルトモデル「GPT-5.5 Instant」が内部評価により、以前のモデルと比較して事実誤認(幻覚)が 52.5%減少したと発表しました。これにより AI の信頼性向上が期待されます。
OpenAI、チャット GPT の新デフォルトモデル「GPT-5.5 Instant」を公開
OpenAI がチャット GPT の新デフォルトモデルとして「GPT-5.5 Instant」を発表し、応答速度と効率性を大幅に向上させた。
メタ、主要出版社から著作権侵害で集団訴訟を起こされる
メタ社は、Llama AI モデルの学習過程で膨大な著作権素材を侵害したとして、5 つの主要出版社と1 人の著者から集団訴訟を起こされた。同社は歴史上最大規模の著作権侵害を行ったと主張されている。
NSDI 2026におけるマイクロソフトの大規模ネットワークシステムに関する進展発表
マイクロソフトは、クラウドコンピューティングやAIを支える大規模ネットワークシステムの設計・運用に関する新研究と技術的進展を、USENIXシンポジウム「NSDI 2026」で発表した。
OpenAI、ChatGPT専用スマホを2027年初め量産へ
サプライチェーンアナリストの郭明錤氏によると、OpenAIはチャットGPT専用スマートフォンを開発中であり、2027年初めに量産を開始する計画である。これは同社の初となるハードウェア製品となる見込みだ。
GPT-5.5 Instant:より賢く、明確で、個別最適化されたモデル
OpenAI が「GPT-5.5 Instant」という新モデルを発表し、従来よりも推論能力が向上し、出力の明瞭さが高まり、ユーザーごとのニーズに合わせたパーソナライズ機能が強化されました。
GPT-5.5 インスタントシステムカードの発表
OpenAI が「GPT-5.5」に関する新しいシステムカードを公開し、同モデルの能力や制限事項について詳細な情報を示した。
datasette-llm 0.1a7 のリリース:LLM プラグインのデフォルト設定機能追加
Datasette が提供する LLM 対応プラグイン「datasette-llm」がバージョン 0.1a7 に更新され、特定のモデルに対してデフォルトオプションを設定する機能が新たに実装されました。これにより、開発者は各モデルの動作を柔軟に制御できるようになります。
LLM 自動化テスト用プラグイン「llm-echo」のバージョン 0.5a0 がリリース
開発者シモン・ウィルソンが、大規模言語モデル(LLM)の自動化テストを支援するプラグイン「llm-echo」のバージョン 0.5a0 を公開しました。この更新では、新しい LLM バージョンとの互換性を確認するためのオプション機能が追加されています。
Claude の金融サービス分野への展開
Anthropic は、Claude という AI モデルを金融業界の業務に導入し、リスク管理や顧客対応などの効率化を図っています。
確率的 KV ルーティング:適応型深層別キャッシュ共有を実現
研究者らは、トランスフォーマー言語モデルの推論コスト削減のため、時間軸以外の「深さ」次元に焦点を当てた新しい手法「確率的 KV ルーティング」を提案し、キーバリューキャッシュのメモリ使用量を大幅に削減できることを示した。
Gemini API の Webhooks で長時間実行ジョブの摩擦と遅延を削減
Google は Gemini API に Webhook 機能を追加し、開発者が長時間実行されるジョブの処理における待ち時間や複雑さを軽減できるようにした。これにより、非同期タスクの実行効率が向上する。
大規模言語モデルが私たちの文章表現を歪める理由
研究チームは、大規模言語モデル(LLM)の普及により、人間の文章表現に均質化や創造性の低下といった歪みが生じていると指摘し、そのメカニズムと社会的影響について分析している。
推論時代を牽引:DigitalOcean の AI ネイティブクラウドの内幕(7 分読了)
クラウドプロバイダー DigitalOcean が、AI 推論ワークロードに特化した新クラウド環境を発表し、開発者が低コストで高速な推論基盤を利用可能にした。
消費者向け AI の ARPU(1 ユーザーあたり平均収益)の課題
ChatGPT の viral な「笑顔」保持曲線は、総保有率ではなくネット保有率を追跡したため、課金ギャップを隠蔽しました。最も熱心なユーザーでも月額 20 ドルに制限される一方、Anthropic は B2B で 440 億ドルの収益を拡大しています。消費者向け AI は、コーディングエージェントや法務 AI のように価値を捉えられず、ユーザーは回答や画像にお金を払う価値を見出せず、既存の節約効果に対して追加料金を支払うことを拒んでいます。
Tuna-2(GitHub リポジトリ):メタがマルチモーダルモデルの基礎チェックポイントを公開
メタ社は、ピクセル埋め込みを活用した新モデル「Tuna-2」を発表し、既存モデルを上回る性能を示しました。同社は完全な生産用重みではなく、LLM 基盤と拡散ヘッドから一部層を削除した基礎チェックポイントのみを公開します。
Vercel のセキュリティツール「Deepsec」の内部構造(7 分読了)
開発プラットフォーム Vercel が、自社のアプリケーションセキュリティを強化するために導入した専用ツール「Deepsec」の仕組みと機能を解説している。
GPT-5.5 の価格引き上げ:実際の費用はどれくらいか(3 分読了)
OpenAI は GPT-5.5 の利用料金を引き上げ、ユーザーが支払う具体的なコスト額とその影響について解説している。
Anthropic と OpenAI が企業向け AI ベンチャーを立ち上げ
AI 開発企業の Anthropic と OpenAI は、企業顧客向けの専用 AI ビジネス部門を同時に設立し、大規模な導入支援を開始した。
モデル・ハネス・フィット:最先端 AI が特定ツールに最適化されている実態
バスタマンテ氏は、Codex CLI や Claude Code などの CLI ツールを分析し、最先端研究所が学習済みモデルの重みに特定のツールの名前やスキーマ、プロンプト構造を組み込んでいると指摘。Terminal-Bench 2.0 のデータは、同じモデルでも使用するハネス(評価枠組み)を変えるだけでスコアが大きく変動することを示している。
Granite 4.1 3B SVG ペリカンギャラリー
IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。
「他者」対「インフラ」、AI業界の新たな議論
OpenAI の従業員が Claude を称賛する発言を行い、業界内で注目すべき議論を巻き起こした。また、Sierra は評価額150億ドルで約10億ドルの資金調達に成功し、月間収益が2億ドルを超えたことが報じられた。
2026年4月ニュースレター:主要AIモデルの価格改定と新機能発表
Simon Willison氏が公開した4月のニュースレターでは、OpusやGPTなどの主要AIモデルが価格を引き上げること、Claudeの新バージョン「Mythos」の登場、およびChatGPT画像生成機能のアップデートについて報告されています。
NVIDIA の cuOpt エージェントスキルを活用したサプライチェーン意思決定システムの最適化
NVIDIA は、cuOpt エージェントスキルを導入することで、サプライチェーンの意思決定システムを最適化する手法を発表しました。これにより、物流効率やコスト削減が期待されます。
Nature が ChatGPT の教育効果に関する論文を撤回
学術誌 Nature は、AI が学生の学習成績や思考力にプラスの影響を与えると主張したメタ分析論文を撤回しました。この論文は 5 月に発表され、ChatGPT の教育的利点を示す根拠として引用されていましたが、調査の結果問題が発覚し取り下げられました。
AgentCore にエージェント品質最適化機能をプレビューとして導入
Microsoft は、モデルの進化やユーザー行動の変化によるエージェント品質の低下を防ぐため、生産環境のトレースから推奨事項を生成し、バッチ評価と A/B テストで検証する新機能「エージェント品質最適化」を AgentCore にプレビューとして追加した。