#llm のAIニュース

951件の記事

OpenAI、モデルの「ゴブリン」発言禁止問題について言及

OpenAI は、自社のコーディングモデルがゴブリンや妖精などの架空の生物を話題にしないよう指示された事実に言及し、これをモデルが発達させた奇妙な習慣であると説明した。

The Verge AI·4月30日

ユーザー数は少ないが財布は厚い、Anthropic が OpenAI を LLM 収益で上回る理由

Counterpoint Research の統計によると、2026 年第1四半期に Anthropic は月間利用者数約 1.34 億人で OpenAI(約 9 億人)を大きく下回っているものの、1 人あたりの収益性が極めて高く、世界 LLM 収益シェアで 31.4% を占め OpenAI の 29% を上回った。

The Register AI/ML·4月30日·★★★★

OpenAI の新セキュリティモデル「GPT-5.5-Cyber」は重要サイバー防衛者限定で提供

OpenAI は一般公開せず、信頼できる限られたサイバー防衛者のみを対象に新セキュリティモデル「GPT-5.5-Cyber」をローンチし、組織の防御体制強化を図る。

The Verge AI·4月30日·★★★★

若年層の AI 利用が増えるほど、彼らが AI を嫌う傾向が強まる

シリコンバレーが ChatGPT などの大規模言語モデルを未来の必須技術として推進して約3年が経過したが、その圧力に最も強く影響を受けているのは Z 世代である。若者たちはこの技術トレンドの最大の採用層でありながら、利用が増えるほど AI への嫌悪感を強めていることが示されている。

The Verge AI·4月30日

Grok 4.3 が Vercel AI Gateway で利用可能に

xAI は、100 万トークンのコンテキストウィンドウと高精度な機能を持つ「Grok 4.3」を Vercel AI Gateway で提供開始した。これにより開発者は SDK を通じて同モデルを呼び出しやすくなり、API の統合やコスト管理が容易になる。

Vercel Blog·4月30日·★★★★

推論計算が戦略的資源へ:AI業界の転換点

ノア・ブラウン氏とサム・アルトマン氏は、GPT-5.5の成功を背景に、推論計算が現在過小評価された戦略的資源であり、企業は本格的にAI推論会社へと転換する必要があると指摘した。

Latent Space·4月30日·★★★★

Zig プロジェクトが AI 貢献を厳しく制限する方針の理由

Zig プロジェクトは、主要なオープンソースプロジェクトの中で最も厳しい大規模言語モデル(LLM)利用禁止ポリシーを採用しており、課題対応やプルリクエスト、バグトラッカーでのコメントに LLM を使用することを一切認めていない。

Simon Willison Blog·4月30日·★★★★

イーロン・マスク氏、OpenAIへの出資を「愚かだった」と証言し1800億ドル超の損害賠償を請求

イーロン・マスク氏は、非営利団体だったOpenAIに出資したことを「愚かだった」と認め、法人化された同社に対して1800億ドル超の損害賠償と出資取り消しを裁判所に求めている。

TLDR AI·4月30日·★★★★★

AI におけるダーウィニズム的専門化

推論市場はワークロードの違いにより分断され、モデル生態系がレイテンシ層やマルチモーダルモデルなどに細分化されている。各モデルタイプには異なるインフラ要件があり、これが新たな勝者を生む余地を作っている。

TLDR AI·4月30日·★★★★

MCP サーバー構築の教訓:モデルは指針に従い、サーバーが主導する仕組み

本記事では、AI モデルが計画を立てず会話とツールリストから確率の高い動作を選ぶ際、MCP サーバー側で次の呼び出しを明白に設計することで効果的な連携を実現する方法について解説しています。

TLDR AI·4月30日

Mistral Medium 3.5 がリモート Vibe エージェントを駆動し、長時間非同期コーディングタスクを可能に

Mistral AI は、128B パラメータの高密度モデル「Mistral Medium 3.5」を発表しました。このモデルは CLI や Le Chat から起動可能なリモート Vibe エージェントを駆動し、クラウド上で複雑な多段階コーディングタスクを実行します。

TLDR AI·4月30日·★★★★

AutoSP の紹介:長文コンテキスト LLM 学習を自動化する新技術

DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。

TLDR AI·4月30日·★★★★

Granite 4.1 LLMs の構築方法(13 分読了)

IBM は、15 トリオントークンで学習した Granite 4.1 系列のオープンソース大規模言語モデルを公開しました。このシリーズは 3B、8B、30B パラメータの Dense アーキテクチャを採用し、特に 8B モデルは多段階強化学習により前世代の 32B モデルに匹敵する性能を実現しています。

TLDR AI·4月30日·★★★★

AI 評価が新たな計算リソースのボトルネックに(19 分読)

AI 評価のコストが急騰し、トレーニングコストに匹敵する計算リソースのボトルネックとなっている。一部の試行では数万ドルを要し、モデルやタスク間でコスト配分に偏りがあるため、標準化ドキュメントやデータ再利用など効率的な手法が必要とされている。

TLDR AI·4月30日·★★★★

LaDiR:潜在拡散モデルがLLMの推論能力を強化する新フレームワーク

研究者らは、既存の大規模言語モデル(LLM)に潜在拡散モデルの特性を組み合わせた「LaDiR」という新たな推論フレームワークを開発しました。この手法は多様な推論経路を並列生成し、計画と修正を包括的に行うことで、精度や解釈性を向上させます。

TLDR AI·4月30日·★★★★

PwC が AWS で AI を活用した契約分析の注目を集める

PwC は AWS 上で AI を駆使した注釈機能を開発し、法律・コンプライアンスチームが膨大な非構造化契約から重要な条項を効率的に抽出・分析できる環境を提供している。

AWS Machine Learning Blog·4月30日·★★★★

LLM 0.32a0 は主要な後方互換性のあるリファクタリング

開発者が LLM Python ライブラリと CLI ツールのアルファ版「LLM 0.32a0」をリリースし、プロンプトとレスポンスに基づく従来のモデルから変更された重要なリファクタリングを実施した。

Simon Willison Blog·4月30日·★★★★

OpenAI Codex システムプロンプトに「ゴブリンについて語るな」という明記された指示が含まれる

OpenAI が公開した Codex CLI のシステムプロンプトには、ユーザーの質問と明確に関連する場合を除き、ゴブリンやグレイムリンなどの生物について語らないよう繰り返し警告する指示が記載されている。

Ars Technica AI·4月30日

AI 学習データのプライバシー保護

医療機関や銀行などが機密データを扱う機械学習モデルを訓練する際、患者情報や取引履歴などのプライバシーを守る技術の重要性が示されています。

Amazon Science·4月30日·★★★★

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

セキュリティエンジニアは、存在しないドイツのカードゲームの世界選手権に自分が優勝していると複数のAIチャットボットを説得し、信頼性の低いウェブ情報を自信ありげな回答に変える脆弱性を証明した。

The Register AI/ML·4月30日·★★★★

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

セキュリティエンジニアが、存在しないドイツのカードゲームのチャンピオンであると嘘をつき、ドメイン登録とウィキペディア編集だけで複数の AI ボットを騙し、信頼できる回答を生成させた。これにより、大規模言語モデルへのポイズニング攻撃がいかに容易であるかが証明された。

The Register AI/ML·4月30日

異なるモデルと連携するよう深層エージェントを調整

Deep Agents は従来汎用的に設計されていたが、今日から OpenAI や Anthropic など各モデル固有のプロファイルを追加し、プロンプトやツールを最適化することでベンチマークスコアを 10〜20 ポイント向上させた。

LangChain Blog·4月30日·★★★★

タンブラー・リッジの家族らが OpenAI とサム・アルトマン氏を提訴、警察への通報義務違反を主張

カナダで発生した学校銃撃事件の犠牲者ら 7 世帯が、OpenAI と CEO のサム・アルトマン氏を相手取り訴訟を起こしました。彼らは、容疑者の ChatGPT 利用活動がシステムによって検知されたにもかかわらず、警察へ通報しなかったとして過失を主張しています。

The Verge AI·4月29日·★★★★

ChatGPT のダウンロード減少が OpenAI の IPO に悪影響を及ぼす可能性

市場調査会社 Sensor Tower のデータによると、ユーザーのアンインストールが急増しており、ChatGPT はかつてのような爆発的な成長を維持できていない。この傾向は OpenAI の株式公開(IPO)に課題をもたらす可能性がある。

The Verge AI·4月29日·★★★★

ポッドキャスト:この奇妙な画像がきっかけで生まれた大規模な陰謀説とは

ジェイソン氏はホワイトハウス記者団夕食会で話題となった奇妙な画像の陰謀説を解説し、サム氏はアリゾナ州立大学で教授の講義を無断収集して授業を生成する AI ツールの問題ある導入について説明した。

404 Media·4月29日

サム・アルトマンを「悪の顔」と断じる弁護士、学校銃乱射事件の報告義務不履行を指摘

カリフォルニア州の弁護士が、OpenAI が内部安全チームの警告を無視し、カナダで起きた学校銃乱射事件に関与した ChatGPT アカウントを警察に通報しなかったとして、同社とサム・アルトマン氏を訴えた。

Ars Technica AI·4月29日·★★★★

ゼネラルモーターズが400万台の車にGoogleのGemini AIを追加

ゼネラルモーターズは、米国の約400万台の車両(2022年以降モデル)に対し、Google製のAIアシスタント「Gemini」を過数月かけてソフトウェア更新で導入する計画を発表した。

The Verge AI·4月29日·★★★★

適応的思考:大規模言語モデルは潜在空間での思考の必要性を認識している

研究チームは、推論時の計算コスト最適化に向け、クエリの複雑度に応じて大規模言語モデルが潜在的な思考(中間推論)を行うタイミングを自己一貫性手法で制御する新アプローチを発表した。

Apple Machine Learning·4月29日·★★★★

メタの新AIモデル「Muse Spark」は初期段階で有望だが、投資家はザッカーバーグ氏の戦略を重視する

メタが新AIモデル「Muse Spark」を発表し、オープンソースから有料アクセスへ方針転換した。広告事業の強化と市場競争力を狙う一方、アナリストは慎重な楽観視を示している。

TLDR AI·4月29日·★★★★

エージェントが検索スタックを代替できるか?

AI エージェントに基本的な検索ツールを提供すると回答品質が向上し、さらに探索を促すことで改善が見られる。しかし、大規模言語モデルは未知の領域を評価できず、学習データが性能の限界を決めるため、知識不足を補う確実な方法は未だ存在しない。

TLDR AI·4月29日·★★★★

Opus 4.7 の新トークナイザー:実際のコストはどれくらいか

Anthropic は Claude Opus 4.7 の入力理解を向上させるため新しいトークナイザーを導入した。モデル価格自体は据え置きだが、同じ入力で従来モデルより 12% から 27% 高いコストがかかるようになった。ただし短いプロンプトではコスト効率が向上している。

TLDR AI·4月29日·★★★★

OpenAI CEO サム・アルトマン氏と AWS CEO マット・ガーマン氏がベドロック管理エージェントについて語るインタビュー

OpenAI のサム・アルトマンCEOとAWSのマット・ガーマンCEOは、OpenAI 製モデルを搭載したベドロック管理エージェントについて議論し、マイクロソフトとの独占契約変更の影響についても言及しました。

TLDR AI·4月29日·★★★★

OpenAI、Microsoft を離れ Amazon の Bedrock に参入

OpenAI はサンフランシスコで開催された AWS イベントで、同社の主要モデルをAmazon Web ServicesのBedrockプラットフォーム上で利用可能にすると発表した。これにより企業は、データをOpenAIのAPIに直接送信せずとも、セキュリティやプライバシーを確保しながらGPTシリーズを活用できる。

The Register AI/ML·4月29日·★★★★★

過去の時代を生きるヴィンテージチャットボットは年配の親戚のよう

AI研究者3名が、ナチスや戦争に関する記述を避けるため1930年以前のデータのみで訓練された「Talkie」と呼ばれる言語モデルを発表した。この130億パラメータのモデルは、デジタル化された英語書籍や新聞のみを学習対象としている。

The Register AI/ML·4月29日

1930 年までのデータで動作するヴィンテージチャットボットが、まるで高齢の親戚のように過去に生きる

Talkie は 1930 年末を最後に学習データを停止しており、ナチスプロパガンダや極端な発言を防ぎつつ、AI の思考プロセスを理解する実験として開発された。

The Register AI/ML·4月29日

IBM の AI コーディング支援ツール「Bob」が一般提供開始

IBM は、大規模企業向けに開発された AI コーディング支援ツール「Bob」のグローバル一般提供を開始した。同社は過去 1 年間に 8 万人のユーザーでテストを実施し、生産性の向上を確認している。また、メインフレーム向けに機能を強化したプレミアムパッケージも同時に発表した。

The Register AI/ML·4月29日·★★★★

Claude が Photoshop や Blender などに直接接続可能に

Anthropic は、AI チャットボット「Claude」が Adobe Creative Cloud や Blender、Ableton などの主要なクリエイティブソフトウェアに直接接続できるコネクタを公開した。これにより、同社は先月発表した Claude Design に続き、クリエイティブ業界への参入を強化している。

The Verge AI·4月29日·★★★★

GitHub、Copilot の課金モデルを6月1日から利用量ベースへ移行

GitHub は、限られた AI 計算資源の需要増加に対応し財務的持続性を確保するため、6月1日より GitHub Copilot の課金モデルを従来から利用量ベース(実際の使用量に応じた請求)へ変更すると発表した。

Ars Technica AI·4月29日·★★★★

GPT-5.5 の能力と反応:期待通りのシステムカードと実用性

Drake Thomas が分析した GPT-5.5 のシステムカードは、OpenAI が提示した新モデルの性能が業界の予想通りであることを示しています。このモデルは汎用的な知能や明確なコーディングタスクにおいて前世代より向上しており、特定の用途では最適な選択肢となり得る競争力を持つと評価されています。

The Zvi·4月28日·★★★★

Googleとペンタゴン、AIの「合法的な利用」に関する合意に達

Googleは米国防総省と秘密裏に契約を結び、同社のAIモデルを「あらゆる合法的な政府目的」で使用することを許可した。この合意は、従業員が軍事利用の懸念からCEOに利用停止を求めた直後に報じられた。

The Verge AI·4月28日·★★★★

ロックインと予算削減:AIベンダーの締め付けが反撃する

Cレベル経営者は数週間でAIモデルを切り替えられると考えていたが、ベンダーロックインの進行と価格上昇により、その考えは幻想だった。今後はモデル移行が困難になり、コスト増に直面している。

The Register AI/ML·4月28日

1930年代風の13Bパラメータ言語モデル「talkie」の発表

GPT開発者の一人であるAlec Radfordらにより、1930年代の文体を模した13Bパラメータの言語モデル「talkie」が公開された。このプロジェクトは、過去の文書スタイルを学習した独自の言語モデルの実装を示している。

Simon Willison Blog·4月28日

Google、YouTubeでAIチャットボット検索の実験を開始

GoogleはYouTubeにおいて、会話のような体験を提供する新しい検索機能「AI Mode」の実験を開始した。この新機能は、長編動画やYouTube Shorts、検索に関連するテキスト情報を統合して結果を表示する。

The Verge AI·4月28日

LaDiR:潜在拡散がLLMのテキスト推論能力を強化

アント・リンボーは、連続的な潜在表現の表現力と反復的修正機能を統合した新規推論フレームワークLaDiRを提案。この手法は、LLMの連鎖的思考生成における限界を克服し、より効率的かつ多様な解決策の探索を可能にする。

Apple Machine Learning·4月28日·★★★★

OpenAI、マイクロソフトとの独占提携を終了

OpenAIはマイクロソフトと改定契約を結び、Azure以外のクラウドでも製品を提供可能になった。2032年までマイクロソフトはOpenAIの知財利用権を保持するが、他社クラウドへの展開が可能となった。

Ars Technica AI·4月28日·★★★★

AIを法廷での自己弁護に利用する人が増え、システムが混乱している

ChatGPTなどの生成AI普及後、弁護士なしで自己弁護するケースが急増。その結果、司法システムに過度な負担がかかり、処理能力が限界に近づいていると研究論文で指摘されている。

404 Media·4月28日·★★★★

新ウェブサイトの3分の1がAI生成であるという研究結果

スタンフォード大学など研究者チームは、2022年以降に作成されたウェブサイトの3分の1がAI生成であることを発見した。この結果は、インターネットアーカイブのデータを用いた研究論文「AI生成テキストがインターネットに与える影響」で報告されている。

404 Media·4月28日·★★★★

Google DeepMindの論文:大規模言語モデルは永遠に意識を持たない

Google DeepMindのシニア科学者Alexander Lerchner氏は、新しい論文で「いかなるAIや計算システムも永遠に意識を持たない」と主張した。この結論は、DeepMindを含むAI企業のCEOたちが描く将来像と矛盾している。

404 Media·4月27日·★★★★

トークン最適化はAI戦略ではない

記事は、AI導入コストを評価する際、単なる価格だけでなく、自社の業務や目的に本当に適合しているかを優先して検討する必要があると指摘しています。

The Register AI/ML·4月26日

CohereがAleph Alphaを合併する理由

カナダのAI企業Cohereは、ドイツのAleph Alphaを買収する。両社は政府の承認を得て、米企業中心のAI市場において欧州企業の主権的な代替案を提供する計画である。

TechCrunch AI·4月26日·★★★★