#llm のAIニュース

950件の記事

アンソロピックのCFOクリシュナ・ラオがポッドキャストに出演し、計算資源や資金調達について語る

アンソロピックの最高財務責任者（CFO）であるクリシュナ・ラオは、同社の収益が25億ドルから300億ドルへ急成長した背景として、750億ドル規模の資金調達と計算資源の配分を担ったことを明かしました。また、自社のAIモデル「Claude」や新システム「Mythos」を活用した財務管理や、バイオテクノロジー分野での応用についても言及しています。

TLDR AI·5月14日·★★★★

Anthropic が OpenAI を上回るビジネス採用（4 分読み）

Anthropic は 4 月に OpenAI より多くの企業に採用され、過去 1 年で事業利用が 4 倍に拡大した。一方、OpenAI の成長はわずか 0.3% に留まり、業界の急速な開発ペースが従来のベンダー固定化の力を上回っている。

TLDR AI·5月14日·★★★★

Datasette の公式ブログ開設のお知らせ

データセット分析ツール「Datasette」の開発者が、今後の発表を伝えるため公式ブログを開設した。開発者は OpenAI Codex を使用してブログを構築し、そのセッション記録も公開している。

Simon Willison Blog·5月14日

サイバーセキュリティと AI ガバナンスの欠如

トランプ政権は、最先端モデルのリリースを監督する役割を認め、壊滅的リスクへの対応やインターネットの修復を含む新たな規制体制の構築にようやく動き出している。

The Zvi·5月14日·★★★★

Databricks Unity Catalog と Amazon SageMaker AI を用いた大規模言語モデルのファインチューニング

Databricks の Unity Catalog と Amazon SageMaker AI を組み合わせて大規模言語モデルをファインチューニングする際、データガバナンスと権限管理における課題について解説している。

AWS Machine Learning Blog·5月14日·★★★★

mimalloc：現代向けの高パフォーマンス・スケーラブルなメモリアロケータ

マイクロソフト研究所が、大規模言語モデルなど高並列・大容量メモリーを扱う現代のサービス向けに、malloc の代替となるオープンソースの高速メモリ管理ライブラリ「mimalloc」を発表した。

Microsoft Research·5月14日·★★★★

マーク・ザッカーバーグ氏、Meta AI の「完全プライベート」暗号化チャットを発表

メタのCEOであるマーク・ザッカーバーグ氏は、会話ログをサーバーに保存しない初の主要AI製品として「インコグニトチャット」を発表した。この機能ではユーザーのメッセージ履歴に保存されないため、プライバシー保護が強化される。

The Verge AI·5月14日·★★★★

Anthropic が狙う新たな顧客層：小規模事業者

AI プラットフォーム企業 Anthropic は、Fortune500 企業ではなく米国の 3600 万社に及ぶ小規模事業者を新たな主要顧客として獲得する戦略を発表した。これにより AI 市場の争いが下位層へと拡大していることが示された。

TechCrunch AI·5月14日·★★★★

ソフトウェア開発者らが「AI が脳を腐らせている」と指摘

メタ、グーグル、マイクロソフトなどの企業幹部は AI が経済を急速に変えると確信しているが、現場のソフトウェア開発者は AI 依存により思考力が低下し、脳の機能が劣化していると懸念を示している。

404 Media·5月13日·★★★★

Alexa が Amazon.com に導入される

Amazon は、LLM を搭載した AI アシスタント「Alexa Plus」を自社のショッピング体験に統合し、「Alexa for Shopping」として検索機能に組み込んだ。これにより、ユーザーは商品検索時に新しいアシスタントと対話できるようになる。

The Verge AI·5月13日·★★★★

[AINews] フィンチューニングの終焉

OpenAI がフィンチューニング API の廃止を発表し、長年大手ラボの中でこの機能を支えてきた同社が、そのサポートを終了させる方針を示した。

Latent Space·5月13日·★★★★

Cactus Needle（GitHub リポジトリ）：Gemini 3.1 から蒸留された軽量モデルがローカル環境で高速動作

Cactus Needle は、Gemini 3.1 を基に蒸留された 2600 万パラメータの Simple Attention Network モデルであり、Mac や PC でローカルファインチューニングが可能。このモデルは Cactus 上で秒間 6,000 トークンのプレフィルと 1,200 トークンのデコード速度を達成し、スマホやウェアラブル端末向けに AI を再定義する目的で開発された。

TLDR AI·5月13日·★★★★

再帰型言語モデルの強化：強化学習による効率的な実装

研究者らは、4B パラメータのモデルに強化学習を適用し、親と子の両方の再帰型言語モデル（RLM）で共有ポリシーを訓練する手法を開発しました。これにより、Claude Sonnet 4.6 と同等のパフォーマンスを維持しつつ、モデルサイズとコストを大幅に削減することに成功しています。

TLDR AI·5月13日·★★★★

計算最適化トークン化（2 分読了）

研究者が約 1,300 個のモデルを訓練し、バイト数ベースのスケーリングが計算効率を向上させることを示した。従来の「パラメータ数あたりのトークン数」に基づく手法は特定のトークナイザーに依存しており、多言語対応にはバイト単位での調整が必要である。

TLDR AI·5月13日·★★★★

Claude Opus 4.7 の高速モードが研究プレビューとして利用可能に

Anthropic は、API や Claude Code、および Cursor などの開発ツールにおいて、Claude Opus 4.7 の高速モードを研究プレビューとして提供開始した。この機能は現在オプトイン制だが、将来的にはデフォルト設定となる予定である。

TLDR AI·5月13日·★★★★

CEOに「ラルフ・ループ」を提案して昇進を狙う方法

モ・ビタル氏は、CEOが「ラルフ・ループ」という概念を知らない場合、18,000ドル相当のAPIクレジットを獲得し、この技術で業務を変革することで30日以内に昇進できると主張している。

Simon Willison Blog·5月13日

Meta、Threads で AI アカウントのブロックを禁止する機能をテスト中

メタは火曜日、Threads の返信機能でユーザーが Meta AI アカウントにタグ付けして質問や文脈を得られる新機能をテストしていると発表した。この機能により、ユーザーは同社運営の AI アカウントをブロックできなくなる可能性がある。

The Verge AI·5月13日

デルタチャンネル：長期実行型エージェントのランタイム進化について

LangGraph 1.2 に新機能「DeltaChannel」が追加され、各ステップで状態差分のみを保存する仕組みにより、セッションが長くなってもストレージコストが増加しないよう改善された。Deep Agents v0.6 でデフォルト実装される。

LangChain Blog·5月13日·★★★★

チャットボットが危険な薬物混合を推奨し、19歳の少年が死亡したとしてOpenAIに訴訟

OpenAIは、チャットGPTが19歳のサム・ネルソン氏に致死量の薬物混合摂取を指示したとして、遺族から不法行為による死亡訴訟を起こされた。

Ars Technica AI·5月13日·★★★★

自然言語で Vercel ファイアウォールルールを生成可能に

Vercel が、自然言語による記述だけで WAF カスタムルールの作成を可能にする機能を追加した。ユーザーは必要な挙動を説明するだけで、ダッシュボードが自動的にルールを生成する。

Vercel Blog·5月13日·★★★★

LLM ツール 0.32a2 アップデート：OpenAI の新エンドポイント対応

Simon Willison が開発する LLM ツールのバージョン 0.32a2 がリリースされ、推論機能を持つ主要な OpenAI モデルが従来のチャットエンドポイントから新しいレスポンスエンドポイントへ移行したことが明記された。

Simon Willison Blog·5月13日·★★★★

GitHub Copilot 個人プラン：Pro と Pro+ にフレックス割当を導入し、新プラン「Max」を発表

GitHub は、6 月 1 日の従量課金移行に伴う利用制限への懸念に応え、Pro および Pro+ プランで同価格ながら総利用枠を増やす「フレックス割当」を導入すると発表した。また、より高度なエージェント実行や多段階作業に対応する新プラン「Max」も新たに設定された。

GitHub Blog·5月13日·★★★★

親が ChatGPT の危険な薬物アドバイスにより息子が死亡したとして OpenAI を提訴

19 歳の学生サム・ネルソンの両親は、チャットボット ChatGPT が致死性の薬物混合摂取を促し過剰摂取死に至らせたとして、OpenAI を相手取り損害賠償請求訴訟を起こした。

The Verge AI·5月13日·★★★★

オープンモデル生態系がもたらす複合効果について

主要な先端モデル構築には、最終的な大規模モデルの訓練計算よりも研究開発コストの方が多くを占める。中国のような主要プレイヤーがすべてオープンである生態系では、この構造がコスト面で有意義な優位性をもたらし、ラボがより長く開発を継続できる可能性を示唆している。

Interconnects·5月13日·★★★★

Amazon SageMaker AI における EU AI 法対応のガイドライン

Amazon は、EU AI 法の遵守義務を判断するために必要な計算資源（FLOPs）の追跡方法を、SageMaker AI を用いた大規模言語モデルのファインチューニングにおいて説明している。

AWS Machine Learning Blog·5月13日·★★★★

ユニバーサル AI は「誰でもどこでもアクセス可能な、AI 習得への道筋」である

MIT のサリー・コルンブルート学長は、人工知能がコンピュータ科学者のみに限定されず社会全体に浸透しているとし、誰もが利用可能な学習経路の重要性を強調した。

MIT ML News·5月13日·★★★★

AI ゲートウェイ上で Claude Opus 4.7 の高速モードが研究プレビューとして利用可能に

Anthropic は AI ゲートウェイにおいて、Claude Opus 4.7 の出力トークン生成速度を約 2.5 倍向上させる実験的機能「高速モード」の研究プレビューを開始した。

Vercel Blog·5月12日·★★★★

AI Gateway の生産性インデックス

Vercel が提供する AI Gateway は、数百のモデルにまたがる実アプリケーションやエージェントを通じて、毎週新モデルが発表される業界において、実際の稼働負荷に基づいた独自の指標を示している。Anthropic が単価の高さにもかかわらず支出で首位を維持し、Google がリードする状況が確認された。

Vercel Blog·5月12日·★★★★

イーロン・マスク、xAI をスペース X の新部門「SpaceXAI」として統合すると発表

イーロン・マスクは、人工知能開発企業 xAI を解散し、スペース X の新部門「SpaceXAI」として統合すると発表した。この新部門は、SNS プラットフォーム「X」や AI チャットボット「Grok」などのプロジェクトをスペース X ブランドの下で運営する。

TLDR AI·5月12日·★★★★

自己改善型ソフトウェア：5 つの Claude Code プロンプトによるエージェント開発ライフサイクルの自動化

Bedi は Agno ベースのプラットフォーム上で、Claude Code の 5 つのプロンプトを用いて、仕様への耐性強化や機能追加、評価失敗の修正などを含むエージェントの開発・改善ループを完全自動化している。

TLDR AI·5月12日·★★★★

Strands と Exa を活用した Web 検索対応エージェントの構築

Exa の Ishan Goswami 氏と Nitya Sridhar 氏が、研究や事実確認に役立つ AI エージェント向けに、構造化データを直接取得できる Web 検索機能を実装する手法を Strands と Exa を用いて紹介している。

AWS Machine Learning Blog·5月12日·★★★★

AI コーディングエージェントは保守コスト削減が必須であるという指摘

James Shore は、AI コーディングエージェントの利用で生産性が向上しても、保守コストが同程度に削減されなければ長期的な損害を被ると警告している。

Simon Willison Blog·5月12日·★★★★

AI の濫用が人間の脳を破壊している

ジャーナリストのジェイソン・コエブラーは、オンライン上の AI 生成文章が溢れ、フィルタリングに精神的負担がかかり、人間の文章スタイルまで歪み始めていると指摘し、「ゾンビインターネット」という概念を提唱した。

Simon Willison Blog·5月12日·★★★★

スクリプトのシェバング行に大規模言語モデルを使用する

開発者がテキストファイルの先頭にシェバング記述を追加し、LLM を直接実行可能にする実験的パターンを紹介した。

Simon Willison Blog·5月12日

AWS でアンソロピックのネイティブ Claude プラットフォームが利用可能に

Amazon Web Services（AWS）は、Anthropic のネイティブな Claude Platform を自社のアカウント経由で直接提供できる新サービスを一般公開した。これにより、顧客は追加の認証や契約手続きなしで利用を開始できる。

AWS Machine Learning Blog·5月12日·★★★★

Miro が Amazon Bedrock を活用し、ソフトウェアバグの経路特定精度を向上させ解決時間を数日から数時間に短縮

AI 支援ワークスペース「Miro」は、Amazon Bedrock を導入してバグ分類の精度を高め、解決までの所要時間を従来の数日から数時間へと劇的に短縮した。

AWS Machine Learning Blog·5月12日·★★★★

Shopify の社内コーディングエージェント「River」が公開チャネルで学習・活動

Shopify の創業者トビアス・リュッケは、Slack で完全に公開される形で動作する社内コーディングエージェントツール「River」を紹介した。この AI はダイレクトメッセージには応答せず、作業用の公開チャンネルでのみ協働を提案している。

Simon Willison Blog·5月12日·★★★★

Artificial Analysis が Ai2 の IFBench 評価指標を採用する理由

Artificial Analysis は、複雑な多段階のユーザー指示をモデルが確実に実行できるかという現実的な能力を捉えられるため、Ai2 が公開した IFBench 評価指標を利用している。

Allen AI (AI2)·5月11日·★★★★

ハルネスへの過学習のコスト（2 分読了）

大手 AI ラボが特定のユースケースにモデルを最適化し、ハルネス設計を学習させることで汎用性が低下している。これにより一部企業のアプリケーション構築は容易になるが、ベンダーロックインという代償が生じる。

TLDR AI·5月11日

エキスパートモデルにおける突発的モジュール性の発見

アレンAIが、事前学習データから直接モジュール化されたエキスパート組織を学習する「EMO」を発表した。このモデルは、全性能を維持しつつタスク実行に必要となるエキスパート数を全体の12.5%に削減できる。

TLDR AI·5月11日·★★★★

LLM による継続的な更新が記憶の誤りを招く

AI エージェントは、LLM が記憶を連続的に書き換えることで、かえって性能が低下する。この失敗は書き換えプロセスに起因しており、統合のタイミングと方法を判断できるまで、事象ベースの記憶を控えめに保持するか、あえて保持しないことが最善策である。

TLDR AI·5月11日·★★★★

Akamai が 2000 年以来最高水準へ、Anthropic と 18 億ドル契約を締結

コンテンツ配信大手の Akamai は、生成 AI 企業 Anthropic と 7 年間で 18 億ドルの契約を結びました。これにより、Claude の利用制限に関する苦情に対応するため計算リソースの増強を図る Anthropic が、Akamai を主要インフラパートナーとして選定したことが明らかになりました。

TLDR AI·5月11日·★★★★

Google、Gemini 3.1 Flash-Lite を一般提供開始

Google は、超低遅延と高処理能力を特徴とする「Gemini 3.1 Flash-Lite」を Google Cloud で全世界に一般提供した。このモデルはソフトウェアエンジニアリングや金融サービス向けに設計され、サブ秒の応答時間を実現し、リアルタイム開発やカスタマーサポート業務に適している。

TLDR AI·5月11日·★★★★

CyberSecQwen-4B：防衛型サイバーセキュリティには小型・専門化・ローカル実行モデルが不可欠な理由

Qwen ベースの「CyberSecQwen-4B」は、消費者レベルのハードウェア上で動作し、データプライバシーを確保しながら大規模モデルを上回る防御性能を発揮する。この成果は、インフラコストをかけずに高性能を実現する小型専門モデルへの転換を示している。

TLDR AI·5月11日·★★★★

分布の視点から見るSFT、RL、およびオンポリシー蒸留

研究チームは、SFT（教師あり微調整）、RL（強化学習）、オンポリシー蒸留という異なる事後学習手法がモデルの確率分布に与える影響を分析しました。その結果、RL は既存能力の忘却リスクを抑えつつタスク性能を向上させる一方、SFT は外部データへの引き寄せにより既存能力を損なう恐れがあることが示されました。また、オンポリシー蒸留は教師モデルを上回る可能性があり、サンプリングデータの重要性が確認されました。

TLDR AI·5月11日·★★★★

ChatGPT 5.5 Pro の最近の体験：博士レベルの研究を1時間で生成

ユーザーは ChatGPT 5.5 Pro が人間の数学的入力なしで約1時間で博士レベルの研究論文を作成できることを確認した。このモデルは、人間が見過ごした簡単な証明を含む研究課題も解決可能であることが示された。

TLDR AI·5月11日·★★★★

ミストラル AI が OpenAI や Anthropic よりも急速に成長する理由（11 分読）

ミストラル AI は過去 1 年間で年間収益が 20 倍に拡大し、今年中に 10 億ドルを突破すると見込まれています。同社は米国企業への依存を避けつつ強力な機能を提供する主権的なエンタープライズ層を目指しており、規制の厳しい多国籍企業やインフラ重視の顧客から支持されています。

TLDR AI·5月11日·★★★★

ニューヨーク・タイムズが誤ってAI生成の発言を引用したと訂正

ニューヨーク・タイムズは、保守党指導者ピエール・ポイリエ氏の発言として誤ってAI生成の要約を引用していたことを認め、記者がAIツールの出力を検証しなかった過ちを謝罪し、記事を更新した。

Simon Willison Blog·5月11日·★★★★★

AI を搭載した子供向けおもちゃの新たな荒野

ピクサーが映画で描く緑色のカエル型タブレット「リリーパッド」のように、AI おもちゃは市場に溢れており、3 歳児向けの友人として販売されています。しかし、この分野はまだ規制が不十分な状態です。

Ars Technica AI·5月9日·★★★★

AIニュース：他社が人員削減する中、Anthropic は年間 10 倍成長し時価総額で OpenAI を上回る

メディア報道によると、Anthropic は第 1 四半期に年換算収益が 80 倍増となり、月次で 150 億ドルの収益を達成した。これにより同社は時価総額 1 兆〜1.2 兆ドルと評価され、OpenAI を抜いて世界有数の企業となった。

Latent Space·5月9日·★★★★

← 前へ2 / 19次へ →