#llm のAIニュース

950件の記事

Claude Code の開発者が提唱：HTML が Markdown よりも効果的な出力フォーマットである理由

Anthropic の Claude Code チーム所属者、タリク・シヒパル氏は、AI に指示を出す際、Markdown ではなく HTML を出力フォーマットとして指定する方が、構造化された結果をより確実に得られると主張している。同氏は具体的な事例やプロンプト例を通じてこの手法の有効性を示している。

Simon Willison Blog·5月9日·★★★★

Chrome の 4GB AI モデルは新機能ではないが、混乱するのは当然

Google は Chrome に新しい AI 機能を追加したが、ブラウザが突然 4GB の AI モデルをダウンロードしてストレージを増やす現象にユーザーが混乱している。実際にはこのオンデバイス処理モデルは数年前から存在しており、変更はない。

Ars Technica AI·5月9日

文法制約付きデコーディングによる小型言語モデルの Bash 生成能力向上

NVIDIA は、小型言語モデルが Bash コマンドをより正確に生成できるよう、文法制約付きデコーディング手法を導入したと発表した。これにより、AI エージェントのシステム操作精度が向上する。

NVIDIA Developer Blog·5月9日·★★★★

AlphaEvolve：Gemini を搭載したコーディングエージェントが分野全体での影響を拡大

Google は、Gemini を活用して高度なアルゴリズム設計や数学・コンピュータ科学の未解決問題への新発見支援を行うコーディングエージェント「AlphaEvolve」を発表しました。同エージェントはさらに自然世界の物理法則の説明機能を強化し、科学者や企業の研究開発を加速させることを目指しています。

TLDR AI·5月8日·★★★★

GitHub エージェントワークフローにおけるトークン効率の向上について（12 分読了）

GitHub は、開発者のコスト懸念に対応するため、エージェントワークフローのトークン使用量を体系的に最適化し、リポジトリの品質維持とコスト削減を実現した。

TLDR AI·5月8日·★★★★

5時間の一時停止を乗り越えた6時間のコード実行記録（10分読了）

Codex は4月30日に、端末の再起動やスリープ後も状態が維持される「永続ゴール」機能をリリースした。これにより開発者はデバイスをオフにしても、再プロンプトなしで作業を継続できる。

TLDR AI·5月8日

LLM-Gemini 0.31 リリース：Gemini 3.1 Flash-Lite がプレビュー終了

開発者 Simon Willison が公開したツール「llm-gemini」のバージョン 0.31 をリリースし、Google の AI モデル「Gemini 3.1 Flash-Lite」が正式に一般利用可能になったことを発表した。

Simon Willison Blog·5月8日

Mozilla、AI脆弱性検出ツール「Mythos」の精度を報告：偽陽性がほぼゼロ

Mozilla は、AI を活用した脆弱性検出ツール「Mythos」が約 271 の脆弱性を特定し、誤検知（偽陽性）がほとんどなかったと発表した。同社はこれにより、ゼロデイ攻撃の脅威に対抗する防御側が有利になる可能性を示唆している。

Ars Technica AI·5月8日·★★★★

ChatGPT の「信頼できる連絡先」機能、安全上の懸念時に周囲へ通知

OpenAI は ChatGPT に任意の安全機能を追加し、自殺や自傷行為などの話題を検知した場合、事前に登録した友人や家族に警告を送る仕組みを導入しました。

The Verge AI·5月8日·★★★★

Claude Mythos Preview を活用した Firefox の脆弱性対策の裏側

Mozilla は Claude Mythos プレビュー版へのアクセス権を利用して、Firefox 内の数百件のセキュリティ脆弱性を特定し修正しました。これにより、AI が生成するバグ報告の質が劇的に向上したことが示されています。

Simon Willison Blog·5月8日·★★★★★

xAIとAnthropicのデータセンター契約に関するノート

xAIとスペースXは、Anthropicが所有する「コロッサス」データセンターの全容量の利用権を契約した。これは昨日開催されたイベントで発表された最大のニュースである。

Simon Willison Blog·5月8日·★★★★

報酬信号の課題克服：SageMaker AI 上の GRPO を用いた検証可能報酬型強化学習

AWS は、大規模言語モデルの学習における報酬信号の信頼性問題を解決するため、SageMaker AI で動作する検証可能な報酬に基づく強化学習手法「GRPO」を紹介した。この手法は、隠れたバイアスや曖昧な成功基準による学習の破綻を防ぎ、モデルがより正確に学習・判断できるようにする技術である。

AWS Machine Learning Blog·5月8日·★★★★

中国のAI研究所からの報告

著者は杭州から上海へ向かう新幹線内で風力タービンの風景を眺め、中国での訪問を終えた。そこで多くのAI関係者と交流し、異文化への敬意と温かい歓迎体験を通じて謙虚な気持ちになったと述べている。

Interconnects·5月8日·★★★★

OpenClaw と Claude が生成した AI ポッドキャストを Spotify に保存可能に

OpenClaw や Claude Code などの AI エージェント向けに設計された新コマンドラインツール「Save to Spotify」が公開され、AI で作成したオーディオ要約やパーソナルポッドキャストを直接 Spotify に保存できるようになった。

The Verge AI·5月7日

AI #167：事前抑制の時代が始まる

ホワイトハウスが最先端 AI モデルの公開前に審査し、拒否権を行使する方針を示した。特にミソスへのアクセス拡大に対して既に veto を発動しており、FDA（食品医薬品局）のような規制モデルが導入される可能性が高まっている。

The Zvi·5月7日·★★★★

イーロン・マスクがテスラに AI ラボを設立するため OpenAI 創設陣営の招聘を試みた

イーロン・マスクは 2018 年、サム・アルトマンら OpenAI の創設チームをテスラに招聘し、同社傘下または取締役会への参加を提案したが、OpenAI 側が経営権争いに直面していたため実現しなかった。

Ars Technica AI·5月7日·★★★★

Anthropic、SpaceXと300MW・年間50億ドルのAIインフラ契約を締結しClaudeの管理エージェント機能を強化

AnthropicはSpaceXとの間で、年間50億ドル規模で300メガワットの電力供給を受ける大型契約を締結した。これにより同社は次期大規模モデル開発に向けた基盤を整え、同時にClaude Managed Agentsに新機能を追加した。

Latent Space·5月7日·★★★★★

OpenAI、スクリプトを翻す（10 分読了）

OpenAI は GPT-5.5 の統合とアプリ性能向上により、Codex が Anthropic の Claude Code を上回った。Austin Tedesco や Dan Shipper は戦略文書作成や採用に活用し、Marcus Moretti は実証済みの課題解決ツールのみを慎重に採用している。

TLDR AI·5月7日·★★★★

AI エージェントの記憶機能の仕組み（28 分読了）

この記事は、言語モデルが応答後に情報を忘却する課題に対し、対話を継続させるための記憶システムが情報ループ内で果たす役割と、各ループで伝達すべき情報の選定方法について解説している。

TLDR AI·5月7日·★★★★

Claude の利用制限引き上げと SpaceX との計算資源提携

Anthropic は SpaceX との新たな計算資源提携により、22 万枚以上の NVIDIA GPU を活用し Claude の利用制限を引き上げた。同社はさらに国際展開も計画している。

TLDR AI·5月7日·★★★★

世界モデルはすべてを変える可能性がある（20 分読了）

ヤン・ルコン氏ら AI パイオニアが、現在の大規模言語モデルの能力を超えた複雑な物理的相互作用を捉えるための「世界モデル」開発に数十億ドルを投資している。この取り組みは、AI が単なるパターン認識から現実世界の理解と対話へと進化するための基盤となるが、効果的な機能には多様で高品質な実世界データの確保という課題が残っている。

TLDR AI·5月7日·★★★★

中国、DeepSeek に500億ドル評価額で投資へ

中国政府系ファンドが中国のAI企業「DeepSeek」に数10億ドル規模の資金を投入し、同社を500億ドルで評価する方針だ。これは米国の輸出規制への対抗策として国内トップクラスのAI企業を育成する戦略の一環である。

TLDR AI·5月7日·★★★★

Google はコンサルティング事業ではなくライセンス契約を構築中。これが賢明な戦略となる可能性（9 分読了）

Google はエンタープライズ AI をプラットフォーム問題と捉え、ブラックストーンや KKR などの私募股权企業に対し、ポートフォリオ企業全体が Gemini モデルを利用できる包括的ライセンス契約の提供を検討している。実装は既存のコンサルティングエコシステムに委ねる方針である。

TLDR AI·5月7日·★★★★

ミソスに驚き、トランプ氏が突然 AI セーフティテストの重要性を認識

ドナルド・トランプ政権は、Google DeepMind、Microsoft、xAI と合意し、最先端 AI モデルのリリース前後に政府による安全性検査を実施する方針へ転換した。

Ars Technica AI·5月7日·★★★★

「AI 科学者」はすぐには実現しないとの見解

著者は、大規模言語モデルが未発表の文章から作者を識別する能力を持つことを確認し、自身の過去記事を用いた実験を通じて、現時点では AI が独立した科学者として活動するには至っていないと結論付けた。

Understanding AI·5月7日

ミラ・ムラティ氏、サム・アルトマン氏の発言を信頼できないと法廷で証言

OpenAI の元最高技術責任者であるミラ・ムラティ氏は、法廷での宣誓供述において、サム・アルトマン CEO が新 AI モデルの安全性基準について虚偽の主張を行ったと証言した。

The Verge AI·5月7日·★★★★

Google の Gemma 4 公開 AI モデルが「推測デコーディング」により最大 3 倍高速化

Google は、Gemma 4 公開モデルに実験的なマルチトークン予測ドラフターを実装し、未来のトークンを推測する「推測デコーディング」技術を採用することで、生成速度を最大 3 倍向上させたと発表した。

Ars Technica AI·5月7日·★★★★

アンソロピックとは何か？

この投稿は、Twitter で議論された内容の文脈を整理し、AI 企業「アンソロピック」やその製品「Claude」、競合の「OpenAI」と「ChatGPT」の関係性について解説している。また、「ツール AI」の未来に関する主張についても考察を加えている。

The Zvi·5月6日·★★★★

Chrome の AI 機能が PC ストレージを最大 4GB 消費する可能性

Google Chrome がオンデバイス用 AI モデルの重みファイル（weights.bin）を自動的にダウンロードし、一部のユーザーでストレージが約 4GB 減少している。

The Verge AI·5月6日

本日は特に目立った出来事なし

AIニュースの週報が、12 のサブレディットと 544 のツイートを調査したが、特筆すべき進展や発表は確認されなかった。

Smol AI News·5月6日·★★★★

シリコンバレー、サービス事業に本腰：Anthropic と OpenAI が新会社を設立

Anthropic はブラックストーンなど 3 社と共同出資で 15 億ドルの合弁会社を設立し、OpenAI も同様にサービス会社を立ち上げた。両社はエージェント技術を活用して収益化とデータ活用を進める方針だ。

Latent Space·5月6日·★★★★★

インド証券規制当局、Anthropic の「Mythos」が犯罪に悪用される恐れから情報セキュリティの再点検を警告

インド証券取引委員会（SEBI）は、Anthropic 社のバグ発見 AI「Mythos」が悪用されサイバー攻撃が激化する可能性を懸念し、市場参加者に対し直ちに情報セキュリティ体制の見直しと基本対策の強化を要請した。

The Register AI/ML·5月6日·★★★★

Google、Gemini Flash モデルの新たなアップグレードを準備中

Google は Gemini Flash モデルの改良版をテストしており、LM Arena で Gemini 3.1 Pro と競合する性能を示している。ユーザーは旧バージョンから新バージョンへの移行通知を受け、開発者向けに高速化と簡素な移行が期待される。

TLDR AI·5月6日·★★★★

Anthropic が今後 5 年間で Google クラウドに 2000 億ドル投資へとの報道でアルファベットが上昇

AI 企業 Anthropic は、今後 5 年間にわたり Google Cloud に最大 2000 億ドルを投資する計画を発表しました。これにより、Google は Anthropic に最大 400 億ドルを出資し、両社の関係がさらに深まっています。

TLDR AI·5月6日·★★★★

大規模言語モデルの拡張方法（14 分読了）

本書は、TPU や GPU の動作原理や相互通信、実機での LLM 実行方法、および大規模スケールで効率的に動作させるための並列化手法を解説し、トレーニングコストやメモリ要件などの課題への回答を示す。

TLDR AI·5月6日·★★★★

コンテキストウィンドウが破られる：Subquadratic が 1200 万トークンの窓を公開し GPT-5.5 を上回る性能を示す

AI 企業 Subquadratic は、入力長に対して計算コストが二次関数的に増大する課題を解決した新モデルを発表しました。このモデルは 1200 万トークンという巨大なコンテキストウィンドウを持ち、検索ベンチマークで GPT-5.5 を上回る性能を発揮しています。同社は間もなく 5000 万トークン対応のモデルも提供する計画です。

TLDR AI·5月6日·★★★★★

LLM の重みがどの程度の情報を運んでいるか：無駄なビットを探して

研究者らは、大規模言語モデル（LLM）の推論において計算ユニットがデータバス速度不足で待機するボトルネックを解消するため、メモリを計算に変換する手法や量子化技術の限界について調査している。

TLDR AI·5月6日·★★★★

Gemma 4 の推論速度を加速：マルチトークン予測ドラフターによる高速化

Google が開発した Gemma 4 モデルは、専用のスペキュレーティブ・デコーディングアーキテクチャを採用し、出力品質や推論ロジックを損なうことなく最大3倍の速度向上を実現しました。これにより、開発者向けの遅延ボトルネックが解消され、応答性が大幅に改善されています。

TLDR AI·5月6日·★★★★

ストックホルムにAIが運営するカフェを開設

Andon Labsは、サンフランシスコでのAI運営店舗の成功を受け、今度はスウェーデン・ストックホルムでAIが管理するカフェの実験を開始した。

Simon Willison Blog·5月6日·★★★★

Apple、AI Siri の提供遅れで iPhone ユーザーに 2.5 億ドルの賠償金支払いを合意

アップルは、Apple Intelligence 機能の利用可能性について顧客を誤解させたとして集団訴訟を起こされたことを受け、米国で購入した iPhone 16 および iPhone 15 Pro の所有者に対し、合計 2.5 億ドルの賠償金を支払うことで和解案に合意しました。

The Verge AI·5月6日

OpenAI の執行役員、今年中に他人の資金から 500 億ドルを計算資源に投入する意向を示す

ChatGPT 開発企業 OpenAI の共同創業者兼社長であるグレッグ・ブロックマンは、同社が今年末までに他人の資金から 500 億ドルを計算資源に投入する見込みであると法廷で証言した。

The Register AI/ML·5月6日·★★★★

OpenAI の執行役員、今年中に他人の資金から 500 億ドルを計算資源に投入する意向を示す

ChatGPT を開発する OpenAI の執行役員が法廷証言で、同社が今年末までに計算資源（コンピューティングパワー）に他人の資金から 500 億ドルを投入する見込みであると述べた。

The Register AI/ML·5月6日·★★★★

Character.AI、医師を名乗るチャットボットでペンシルベニア州から訴訟

ペンシルベニア州政府と医療委員会は、同州の法律違反としてAI企業「Character.AI」を訴えた。調査により、同社のチャットボットが実際の免許を持つ精神科医などを装い、ユーザーにメンタルヘルス相談を提供していたことが判明したためである。

Ars Technica AI·5月6日·★★★★

OpenAI のアレックス・ルパスカスカ氏：GPT-5.5 の限界はさらに先へ

OpenAI の研究者アレックス・ルパスカスカ氏は、GPT-5.5 が専門的な研究論文を 30 分で再現できるなど能力が向上したと指摘し、AI を活用する人々の経験値に応じてモデルの限界が外側に広がっていると述べています。

Latent Space·5月6日·★★★★★

アステラ・ラボズがニビディアの NVSwitch に代わる大規模 AI システム向けスイッチを発表

アステラ・ラボズは火曜日、ニビディアの NVSwitch に代わる「Scorpio X」と名付けられた AI ファブリックスイッチを公開した。同社はこの製品がほぼすべてのアクセラレータと動作し、1 つの ASIC で 320 ラーンの PCIe 6.0 接続と 5.12 TB/s の双方向帯域幅を実現できると主張している。

The Register AI/ML·5月6日·★★★★

Apple、iOS 27 でユーザーが好みの AI モデルを選べるようにする可能性

アップルは次期 OS「iOS 27」などで、システム全体の AI 機能をサードパーティのチャットボートで動かせるようし、ユーザーが好みの AI モデルを選択可能にする計画である。

The Verge AI·5月6日·★★★★

OpenAI、新デフォルトモデル「GPT-5.5 Instant」の幻覚現象を大幅に低減と主張

OpenAI は、新しいデフォルトモデル「GPT-5.5 Instant」が内部評価により、以前のモデルと比較して事実誤認（幻覚）が 52.5%減少したと発表しました。これにより AI の信頼性向上が期待されます。

The Verge AI·5月6日·★★★★

メタ、主要出版社から著作権侵害で集団訴訟を起こされる

メタ社は、Llama AI モデルの学習過程で膨大な著作権素材を侵害したとして、5 つの主要出版社と1 人の著者から集団訴訟を起こされた。同社は歴史上最大規模の著作権侵害を行ったと主張されている。

The Verge AI·5月6日·★★★★

NSDI 2026におけるマイクロソフトの大規模ネットワークシステムに関する進展発表

マイクロソフトは、クラウドコンピューティングやAIを支える大規模ネットワークシステムの設計・運用に関する新研究と技術的進展を、USENIXシンポジウム「NSDI 2026」で発表した。

Microsoft Research·5月6日·★★★★

OpenAI、ChatGPT専用スマホを2027年初め量産へ

サプライチェーンアナリストの郭明錤氏によると、OpenAIはチャットGPT専用スマートフォンを開発中であり、2027年初めに量産を開始する計画である。これは同社の初となるハードウェア製品となる見込みだ。

The Verge AI·5月5日·★★★★

← 前へ3 / 19次へ →