メインコンテンツへスキップ

#llm のAIニュース

1877件の記事

MiniMax、新スパースアテンション機構と15.6倍の長文コンテキスト応答速度向上を備えた次期M3モデルを発表

中国のAI企業MiniMaxは、人気シリーズ「M2」の開発に関する技術報告書を公開し、次期モデル「M3」で採用する新スパースアテンション機構を紹介した。この技術により長文コンテキストでのデコード速度が最大15.6倍向上し、超長文コンテキスト対応AIエージェントの経済的実現が可能になる見込みである。

TLDR AI·5月29日·★★★★

データは不足していない。不足しているのは想像力だ(8 分読了)

Asuka Zheng は、トレーニングデータの枯渇への不安が市場の実態を捉えていないと指摘し、自身の SRE 代替プロジェクトで世界モデルの訓練が失敗した事例を紹介する。同氏は、最初の異常から完全な解決に至るまでの長期エンドツーエンドの事象軌跡データが存在しないことがボトルネックだったと述べている。

TLDR AI·5月29日·★★★★

オープンモデルはどれほど遅れているのか?(17 分読了)

TLDR AI は、オープンソースモデルが最高峰のクローズドモデルより約 4〜6 ヶ月遅れており、DeepSeek R1 の発表時には差が最小だったが、その後再び拡大していると分析している。

TLDR AI·5月29日·★★★★

Cursor 開発者習慣レポート(1 分で読めます)

AI コードエディタ「Cursor」が、自社のユーザーデータに基づき、開発者が AI をどのように活用しているかを示す習慣に関する報告書を公開した。

TLDR AI·5月29日·★★★★

Agent Judge:生産環境向けエージェントの長期コンテキスト評価を解決(10 分読了)

TLDR AI が紹介する「Agent Judge」は、検索・検証・適応に焦点を当て、従来の LLM 判定器が苦手とする長期コンテキストや状態保持アクションの評価精度と一貫性を向上させる手法です。

TLDR AI·5月29日·★★★★

Opus 4.8 (4 minute read)

TLDR AI·5月29日·★★★★

マイクロソフト、新モデルで AI コーディング競争に再参入を試みる(1 分読了)

マイクロソフトは、AI コーディング分野での地位を強化するため、新しい AI モデルの開発を進めています。これは業界の需要変化への対応であり、コーディング能力の向上と AI 技術の進展を支援する取り組みです。

TLDR AI·5月29日

Anthropic がシリーズ H ラウンドで 650 億ドルの資金調達を実施

AI 企業 Anthropic は、シリーズ H の資金ラウンドにおいて 650 億ドルを調達したと発表した。この巨額の資金は同社の研究開発や事業拡大に充てられる見込みである。

TLDR AI·5月29日·★★★★★

Gemini Flash の価格上昇、AI 法施行延期、エージェントがオンライントラフィックを牽引

The Batch は、シリコンバレーで注目される AI フォワードデプロイメントエンジニア(FDE)の役割について報じ、顧客組織に常駐してワークフローをカスタマイズする専門職の台頭を紹介した。

The Batch·5月29日·★★★★

Anthropic と SpaceX のリース契約期間は?見解が分かれる(3 分で読める)

SpaceX は Anthropic と月数十億ドル規模の計算リソース契約を結んだが、イーロン・マスクは数年間の長期リースではないと否定した。実際には 180 日間の短期契約で、その後 90 日間で双方解約可能となっている。

TLDR AI·5月29日·★★★★

Claude Opus 4.8:「控えめだが実感のある改善」

Anthropic が新モデル Claude Opus 4.8 を公開し、前作よりコスト削減に向けた開発も進めていると発表した。

Simon Willison Blog·5月29日·★★★★

Simon Willison Blog の llm-anthropic バージョン 0.25.1 リリース

Simon Willison が公開したライブラリ「llm-anthropic」のバージョン 0.25.1 で、Anthropic の新モデル「Claude Opus 4.8」が追加され、組織向けに高速モード機能も利用可能になった。

Simon Willison Blog·5月29日

Amazon SageMaker AI でアゼルバイジャン語の言語モデルをトレーニングする手法

AWS は、PyTorch や Hugging Face Transformers などのオープンソースツールを活用し、Azercell Telecom と共同でアゼルバイジャン語対応の言語モデルを Amazon SageMaker AI 上で構築・トレーニングするソリューションを発表した。

AWS Machine Learning Blog·5月29日·★★★★

LLM は明示的な警告後も誤った記述を信じる

Ars Technica AI が紹介した新研究によると、大規模言語モデル(LLM)は「これは嘘である」という明確な警告が示された場合でも、学習データ内の統計パターンに従って誤った記述を事実として吸収し、否定を無視する傾向があることが判明しました。

Ars Technica AI·5月29日·★★★★

Anthropic が 650 億ドルの資金調達、IPO 前に時価総額 1 兆ドルに迫る

AI 企業 Anthropic は IPO を控えて 650 億ドルの資金調達を実施し、時価総額が 1 兆ドル規模に達する見通しとなった。

TechCrunch AI·5月29日·★★★★★

金や石油と同様に、AI トークンの先物取引が間もなく可能に

TechCrunch AI は、今後 AI トークンの先物取引が可能になる見通しを報じています。

TechCrunch AI·5月29日·★★★★

Apple、iPhone に大規模 Gemini モデルを搭載し新 Siri を実現へ

Apple は Google との提携により、今年後半に iPhone の Siri に大規模言語モデル「Gemini」を組み込む開発を進めている。これにより、限られた端末処理能力の中で生成 AI 機能を強化する予定である。

Ars Technica AI·5月29日·★★★★

Claude Opus 4.8 が AWS で利用可能に

AWS は、Anthropic の最新モデル「Claude Opus 4.8」を Amazon Bedrock および「Claude Platform on AWS」で提供開始した。この新モデルは、生産環境でのワークフローやエージェント型コーディングにおいて改善をもたらす。

AWS Machine Learning Blog·5月29日·★★★★

Anthropic、新ツール「ダイナミック・ワークフロー」を搭載した Opus 4.8 をリリース

AI企業 Anthropic が、新しいツール「ダイナミック・ワークフロー」機能を追加した大規模言語モデル「Opus 4.8」を正式に発表した。

TechCrunch AI·5月29日·★★★★

Claude の新モデルは失敗時に「正直」になる

Anthropic は木曜日に Claude Opus 4.8 をリリースし、同モデルの「誠実さ」を強調している。同社はすべてのモデルを、根拠のない主張を避けるよう訓練しており、AI モデルが結論を飛び越える一般的な問題を解決するとしている。

The Verge AI·5月29日·★★★★

GitHub Copilot で Claude Opus 4.8 が一般利用可能に

Anthropic の最新モデル「Claude Opus 4.8」が GitHub Copilot で一般提供開始され、コード理解や大規模コードベースの操作能力が向上した。2026 年 6 月 1 日までの間、プレミアムリクエスト数が 15 倍になる特典が付与される。

GitHub Changelog·5月29日·★★★★

Anthropic の SpaceX におけるリース期間、見解は分かれる

AI 企業 Anthropic がクラウドインフラとして利用する SpaceX の施設に関する契約期間について、業界関係者間で見解が分かれている。

TechCrunch AI·5月29日·★★★★

Google I/O 2026 の主要な 12 の瞬間を振り返る

Google は、自社が主催した「I/O 2026」カンファレンスで発表された 12 の重要な技術動向や新機能について、その内容をまとめた記事を発表しました。

Google AI Blog·5月29日

新 Siri アプリのプレビュー、ChatGPT 対抗など Apple の計画を垣間見る

Apple が公開した新 Siri アプリのプレビューにより、同社が ChatGPT などに対抗する計画の詳細が明らかになった。

TechCrunch AI·5月28日·★★★★

Ouraリングの月額課金なし利用を可能にするアプリ「Cracked Oura」が登場

開発者が、Ouraリングユーザーが月額サブスクリプションを支払わずに健康データを照会・分析できるオープンソースアプリ「Cracked Oura」を作成した。これは、多くの人が評価する新モデル「Ring 5」発表の直後に登場した。

404 Media·5月28日

iOS 27 の新レンダリング画像が示す Siri の大規模な再設計

ブルームバーグのレンダリング画像によると、Apple は iOS 27 で Siri を大規模に再設計する予定であり、ChatGPT に似たチャットインターフェースと「リキッドグラス」風のデザインを採用すると見られる。

The Verge AI·5月28日·★★★★

RSI が新たな AGI に — 定義が極めて困難であることにも変わりはない

TechCrunch AI は、人工一般知能(AGI)の概念に代わる指標として「RSI」を提案している。しかし、この RSI も AGI と同様に明確な定義や測定基準を確立することが極めて難しいと指摘している。

TechCrunch AI·5月28日·★★★★

TechCrunch Disrupt 2026:Databricks 創業者が語るエンタープライズ AI 契約を破綻させる要因

Databricks の共同創業者は、TechCrunch Disrupt 2026 で、企業が AI 導入を進める際に契約が失敗する主な原因について言及した。

TechCrunch AI·5月28日·★★★★

AI #170:大統領令の欠如

ザヴィ・コウが、米国の AI 政策に関する大統領令が事実上廃止され、代わりにイリノイ州の法案が成立したと報告し、米国 AI 政策が依然として場当たり的であると指摘している。

The Zvi·5月28日

CNN、Perplexity を「そのままのコピー記事」作成で提訴

CNN はニューヨークの裁判所に訴訟を提起し、AI スタートアップ企業 Perplexity が自社のコンテンツをそのままコピーする AI ツールを提供し、有料記事へのアクセスも許可していると主張している。

The Verge AI·5月28日·★★★★

Vercel AI Gateway に Claude Opus 4.8 が追加

Vercel は、複雑なコーディングタスクや文書作成に適した新モデル「Claude Opus 4.8」を自社の AI Gateway に導入しました。これにより開発者は SDK を介してこの機能を容易に利用できます。

Vercel Blog·5月28日·★★★★

メルペイ&メルコイン技術オープンネス月間2026の開催のお知らせ

メルカリグループのメルペイとメルコインが、ステークホルダーとの対話を通じて技術の開放性を高めるため、2019年から続く「技術オープンネス月間」を2026年に開催すると発表しました。

Mercari Engineering·5月28日

Google の AI が「Google」や他の単語のスペルも間違える理由

TechCrunch は、Google の生成 AI モデルが自社の社名や一般的な単語のスペルを誤る現象について分析し、その技術的・データ上の原因を解説している。

TechCrunch AI·5月28日

AI ゲートウェイにチーム全体のプロバイダー許可リスト機能を追加

Vercel は AI Gateway に、チーム全体で利用可能なプロバイダーを制限する許可リスト機能を導入した。これにより、セキュリティや法務承認を受けた特定のベンダーからのリクエストのみが処理されるようになり、BYOK トラフィックにも適用される。

Vercel Blog·5月28日·★★★★

Anthropic がシリーズ H ラウンドで 650 億ドルを調達、企業価値は 9,650 億ドルに

AI 企業 Anthropic はシリーズ H の資金調達ラウンドにおいて 650 億ドルを獲得し、投後評価額が 9,650 億ドルに達したことを発表した。

Anthropic News·5月28日·★★★★★

Claude Opus 4.8 の紹介

Anthropic が、同社の最上位モデル「Claude Opus」の最新バージョンである「4.8」を発表しました。

Anthropic News·5月28日·★★★★

Google、ビジネス向けGeminiに共有可能なプロジェクト機能を追加

Googleはビジネス利用向けのAIモデル「Gemini」に、チーム間で設定やプロンプトを共有できる「プロジェクト」機能を新設した。これにより、組織内での協働効率が向上する。

TLDR AI·5月28日·★★★★

LiteParse v2.0(1 分で読める)

スタンドアロン型オープンソース PDF 解析ツール「LiteParse」がバージョン 2.0 に更新され、ローカル環境で高速なテキスト抽出やスクリーンショット生成が可能になった。

TLDR AI·5月28日·★★★★

React Native 向け高速・特化型モデル「Apex」の紹介

TLDR AI は、アーキテクチャ判断やフレームワーク固有の問題修正を分析してアプリ構築を行う React Native 特化型コーディングモデル「Apex」を発表しました。この最適化されたモデルは特定領域で性能対コスト比を大幅に改善し、現在選定チーム限定のプライベートベータ版として提供されています。

TLDR AI·5月28日·★★★★

TRL でデルタ重み同期を実装:トリリオンパラメータをハブバケットで管理

TRL は非同期強化学習において、変更されたモデルパラメータのみを送信する「デルタ重み同期」手法を導入し、データ転送量をギガバイトからメガバイトに削減した。また、Hugging Face Hub のバケット機能を活用して学習器と推論エンジンの通信を分離し、帯域幅の大幅な節約を実現した。

TLDR AI·5月28日·★★★★

Anthropic と OpenAI が製品市場適合を達成したと考える(11 分読)

Anthropic と OpenAI はコーディングや汎用エージェント製品の分野で製品市場適合を達成し、API の価格設定を積極的に行っている。ユーザーあたり月額 200 ドル以上の支出により、コスト回収が容易になっている。

TLDR AI·5月28日·★★★★

Google Pay & Wallet Developer MCP サーバーで統合ワークフローを強化

Google は、AI 開発アシスタントや IDE とリアルタイムの API やアカウント情報を安全に接続するためのオープン標準ツール「Google Pay & Wallet Developer MCP サーバー」を発表した。これにより、開発者は開発環境内で公式ドキュメントを検索し、ウォレットパスを検証できるようになる。

Google Developers AI·5月28日·★★★★

コミュニティが Tunix と TPU を活用して Gemma に「思考」能力を習得させた方法

Google が Kaggle で開催したハッカソンにおいて、開発者たちは限られた計算資源と Kaggle TPU を用いて、小規模なベースモデルに多段階の事後学習パイプラインを適用し、推論エンジンとしての能力を獲得させることに成功しました。

Google Developers AI·5月28日·★★★★

SQLite に AGENTS.md ファイルが追加される

SQLite プロジェクトが、AI エージェント向けにコードベースの理解を支援する AGENTS.md ファイルを追加した。これは開発者からのプルリクエスト受け入れ方針とは別に、エージェントによる解析を目的としている。

Simon Willison Blog·5月28日·★★★★

NVIDIA Dynamo スナップショット:Kubernetes 上の推論ワークロードにおける高速起動

NVIDIA は、Kubernetes 環境で実行される推論ワークロードの起動時間を大幅に短縮する「Dynamo」のスナップショットを公開しました。これにより、AI サービスの展開効率が向上します。

NVIDIA Developer Blog·5月28日·★★★★

Amazon Bedrock AgentCore を活用したビジネスサポート用 AI エージェントの構築

AWS は、Works Human Intelligence が日本企業の人事システム「COMPANY」で導入する事例を共有し、Amazon Bedrock AgentCore を使用して業務支援用の AI エージェントを構築する方法を紹介している。

AWS Machine Learning Blog·5月28日·★★★★

給与管理スタートアップ「Remote」が、従業員数増加なしに従業員1人あたりの収益を50%増大と発表

給与管理スタートアップの Remote が、採用人数を増やさずに従業員 1 人あたりの収益を 50% 拡大したことを発表した。これは AI や自動化技術を活用した業務効率化の結果である可能性が高い。

TechCrunch AI·5月28日·★★★★

Anthropic と OpenAI は製品市場適合を達成したと考える

Simon Willison は、Anthropic が初となる黒字四半期を迎える可能性が高いとし、OpenAI や Anthropic の両社が製品市場適合(PMF)を達成したと指摘している。

Simon Willison Blog·5月28日·★★★★

AI を通じた人間の知能の拡張

マイクロソフト・リサーチは、現代の AI システムが人間の知能を複製するのではなく、人間のコグニションや言語に既に存在する構造を前提として拡張することで強力になると主張し、その能力と限界(幻覚や推論の破綻)を説明している。

Microsoft Research·5月28日·★★★★

「脳みそを切除された」:Character.AI が示す AI の悪化現象とは

チャットボットアプリ「Character.ai」が実施した一連の変更により、ユーザーコミュニティが激しく反発し、同社に対して変更の中止を求めている。この状況は、AI サービスが利用価値を損なう「エンシチフィケーション(悪化)」の典型例として指摘されている。

404 Media·5月27日·★★★★