#llm のAIニュース

1928件の記事

イーロン・マスクが証言、xAI が OpenAI のモデルを Grok の学習に使用したと認める

イーロン・マスクは公聴会で、自社の AI 企業 xAI が生成した大規模言語モデル「Grok」の訓練データとして、競合他社である OpenAI のモデルを利用していたことを認めた。

Google の AI アシスタント「Gemini」が数百万台の車両に搭載開始へ

Google は木曜日、Google Built-in を備えた車への Gemini の展開を開始すると発表した。これは現在の Google Assistant より高度な対話型 AI を運転体験に導入する動きであり、GM の発表に続く重要な技術進展である。

TechCrunch AI·5月1日·★★★★

評価駆動開発による大規模言語モデルの信頼性向上への試行錯誤

研究者らが、評価を駆動する開発手法を用いて大規模言語モデルの信頼性を高める方法を試行錯誤している。

LangChain Blog·5月1日·★★★★

LangSmith に OpenTelemetry サポートが導入されました

ラングスミス（LangSmith）が、観測可能性ツールである OpenTelemetry のサポートを追加しました。これにより、開発者は AI アプリケーションのトレーシングをより容易に統合・管理できるようになります。

LangChain Blog·5月1日·★★★★

新しいコンピューターが LangSmith を活用し、メモリ検索の想起率を 50% 向上させる方法

LangSmith を活用した新しいコンピューターが、メモリ検索技術において想起率を 50% 向上させることに成功しました。これにより AI アプリケーションの精度が大幅に改善されます。

LangChain Blog·5月1日·★★★★

LangSmith におけるエンドツーエンド OpenTelemetry サポートの導入

ラングスミスが、システム全体の観測性を向上させるため OpenTelemetry の完全サポートを導入した。これにより開発者は分散トレーシングを容易に統合できる。

LangChain Blog·5月1日·★★★★

LangSmith を用いた回帰テスト手法

ラングエクス（LangSmith）というツールを用いて、AI アプリケーションの変更が既存の機能に悪影響を与えないかを確認する回帰テストの実施方法について解説している。

LangChain Blog·5月1日·★★★★

エージェントフレームワークと観測可能性について

AI エージェントの設計におけるフレームワークと、その動作を監視・分析する観測可能性の重要性について解説している。

LangChain Blog·5月1日·★★★★

メタが AI ツールで「簡単にお金を稼ぐ」広告を展開

メタが昨年 20 億ドルで買収した AI 企業マヌスが、ウェブサイトの作成代行を提案して収益を得る手法を紹介する広告を配信している。同社はコンテンツクリエイターに報酬を支払ってこのキャンペーンを推進している。

The Verge AI·5月1日

GitHub Copilot CLI の初心者向けガイド：対話型と非対話型のモード解説

GitHub は、CLI ツール「Copilot CLI」の使い方を紹介するシリーズを開始し、本記事では対話型と非対話型の2つの主要モードの違い、起動方法、およびそれぞれの活用場面について解説している。

GitHub Blog·5月1日

セールスフォース、顧客と共同で AI ロードマップを策定

クラウド企業 Salesforce が、自社の AI 戦略の方向性を決定する際、顧客からの意見を直接募る形でロードマップ作成を共同で行う方針を発表した。

TechCrunch AI·5月1日·★★★★

Google、Gemini AI を「Google Built-in」搭載車に展開開始

Google は、Google Built-in 搭載車両に対して従来の Google アシスタントから Gemini AI アシスタントへの更新を開始する。これにより、自然な会話や車両情報の取得、設定変更などの体験が向上すると発表している。

The Verge AI·5月1日·★★★★

マイクロソフトとオープンエイトの新たな提携契約の内容解説

マイクロソフトとオープンエイトは、長年の複雑な関係を経て今週、新たな提携契約を結ぶことで合意しました。両社は経営陣の対立やインフラをめぐる不満など過去の緊張関係を乗り越え、AI 分野での協力体制を再構築します。

The Verge AI·5月1日·★★★★

データ活用型チャット機能への投稿募集

開発者が自身のデータを学習に供するチャットシステムへの提案を募っている。

LangChain Blog·4月30日

Kay、Cybersyn、LangChain が連携し SEC 提出書類の埋め込みを RAG で実現

Kay、Cybersyn、LangChain の各チームが連携し、米国証券取引委員会（SEC）の提出書類を埋め込み技術で処理する手法を開発した。これにより、検索拡張生成（RAG）システムでの金融データ分析が可能になった。

LangChain Blog·4月30日·★★★★

LangChain における個人識別情報の取り扱い

LangChain の開発チームが、AI アプリケーションで個人識別情報（PII）を安全に処理・管理するためのガイドラインとベストプラクティスを公開した。

LangChain Blog·4月30日·★★★★

高基数状況におけるクエリ分析のベンチマーク評価

研究者が高基数データ環境でのクエリ分析方法を比較検証し、各手法の精度と効率性を定量的に評価した。

LangChain Blog·4月30日·★★★★

OpenAI、モデルの「ゴブリン」発言禁止問題について言及

OpenAI は、自社のコーディングモデルがゴブリンや妖精などの架空の生物を話題にしないよう指示された事実に言及し、これをモデルが発達させた奇妙な習慣であると説明した。

The Verge AI·4月30日

ユーザー数は少ないが財布は厚い、Anthropic が OpenAI を LLM 収益で上回る理由

Counterpoint Research の統計によると、2026 年第1四半期に Anthropic は月間利用者数約 1.34 億人で OpenAI（約 9 億人）を大きく下回っているものの、1 人あたりの収益性が極めて高く、世界 LLM 収益シェアで 31.4% を占め OpenAI の 29% を上回った。

The Register AI/ML·4月30日·★★★★

ユーザー数は減っても財布は太い、これが Anthropic が OpenAI を LLM 収益面で上回る理由

Anthropic は利用者数が減少しているにもかかわらず、顧客あたりの支出額が増加したことで、大規模言語モデルの収益において OpenAI を上回った。

The Register AI/ML·4月30日·★★★★

AI コ・クリニシャンによる医療の新たなモデルの実現

AI が医師と協働する「コ・クリニシャン」という新しい医療モデルを可能にする技術が発表された。これにより、診断支援や業務効率化が進む見込みである。

Google DeepMind·4月30日·★★★★

Meta、ビジネス AI が週に 1000 万回の会話を支援と発表

Meta は自社のビジネス向け AI が現在、週間に 1000 万回もの会話支援を行っていることを明らかにした。これは同社が提供する AI ツールの利用規模を示す重要な指標である。

TechCrunch AI·4月30日·★★★★

クリーンな AI コード構築に役立つ Python デコレータ 5 つの強力な例

この記事は、Python のデコレータ機能を活用して、AI 開発におけるコードの可読性と保守性を向上させる具体的な手法を 5 つ紹介しています。

KDnuggets·4月30日

OpenAI の新セキュリティモデル「GPT-5.5-Cyber」は重要サイバー防衛者限定で提供

OpenAI は一般公開せず、信頼できる限られたサイバー防衛者のみを対象に新セキュリティモデル「GPT-5.5-Cyber」をローンチし、組織の防御体制強化を図る。

The Verge AI·4月30日·★★★★

若年層の AI 利用が増えるほど、彼らが AI を嫌う傾向が強まる

シリコンバレーが ChatGPT などの大規模言語モデルを未来の必須技術として推進して約3年が経過したが、その圧力に最も強く影響を受けているのは Z 世代である。若者たちはこの技術トレンドの最大の採用層でありながら、利用が増えるほど AI への嫌悪感を強めていることが示されている。

The Verge AI·4月30日

Grok 4.3 が Vercel AI Gateway で利用可能に

xAI は、100 万トークンのコンテキストウィンドウと高精度な機能を持つ「Grok 4.3」を Vercel AI Gateway で提供開始した。これにより開発者は SDK を通じて同モデルを呼び出しやすくなり、API の統合やコスト管理が容易になる。

Vercel Blog·4月30日·★★★★

推論計算が戦略的資源へ：AI業界の転換点

ノア・ブラウン氏とサム・アルトマン氏は、GPT-5.5の成功を背景に、推論計算が現在過小評価された戦略的資源であり、企業は本格的にAI推論会社へと転換する必要があると指摘した。

Latent Space·4月30日·★★★★

Zig プロジェクトが AI 貢献を厳しく制限する方針の理由

Zig プロジェクトは、主要なオープンソースプロジェクトの中で最も厳しい大規模言語モデル（LLM）利用禁止ポリシーを採用しており、課題対応やプルリクエスト、バグトラッカーでのコメントに LLM を使用することを一切認めていない。

Simon Willison Blog·4月30日·★★★★

情報源：Anthropic が評価額 9,000 億ドルで新たな 500 億ドルの資金調達を検討中

複数の情報源によると、AI 企業 Anthropic は評価額 9,000 億ドルを背景に、新たに 500 億ドル規模の資金調達ラウンドを実施する可能性があると報じられている。

TechCrunch AI·4月30日·★★★★★

イーロン・マスク氏、OpenAIへの出資を「愚かだった」と証言し1800億ドル超の損害賠償を請求

イーロン・マスク氏は、非営利団体だったOpenAIに出資したことを「愚かだった」と認め、法人化された同社に対して1800億ドル超の損害賠償と出資取り消しを裁判所に求めている。

TLDR AI·4月30日·★★★★★

Claude Code の構築から学んだこと：プロンプトキャッシングが全てである

Anthropic は Claude Code の開発経験から、プロンプトキャッシングの重要性を強調し、これがシステム効率を決定する鍵であると示した。

Claude Blog·4月30日·★★★★

Claude のセキュリティ機能がいよいよ公開ベータへ

Anthropic は、同社が提供する AI モデル「Claude」のセキュリティ機能を公開ベータ版として開始した。これにより、一般ユーザーも安全性向上のための新ツールを利用可能となった。

Claude Blog·4月30日·★★★★

OpenAI の Codex システムプロンプトに「ゴブリンについて語るな」という明記された指示が含まれている件

OpenAI が開発したコード生成モデル「Codex」のシステムプロンプトに、ユーザーがゴブリンに関する話題を一切行わないよう禁止する明確な指示が含まれていることが明らかになった。これは同社が特定のコンテンツフィルタリングを強化している事例を示す。

TLDR AI·4月30日

AI におけるダーウィニズム的専門化

推論市場はワークロードの違いにより分断され、モデル生態系がレイテンシ層やマルチモーダルモデルなどに細分化されている。各モデルタイプには異なるインフラ要件があり、これが新たな勝者を生む余地を作っている。

TLDR AI·4月30日·★★★★

MCP サーバー構築の教訓：モデルは指針に従い、サーバーが主導する仕組み

本記事では、AI モデルが計画を立てず会話とツールリストから確率の高い動作を選ぶ際、MCP サーバー側で次の呼び出しを明白に設計することで効果的な連携を実現する方法について解説しています。

TLDR AI·4月30日

Mistral Medium 3.5 がリモート Vibe エージェントを駆動し、長時間非同期コーディングタスクを可能に

Mistral AI は、128B パラメータの高密度モデル「Mistral Medium 3.5」を発表しました。このモデルは CLI や Le Chat から起動可能なリモート Vibe エージェントを駆動し、クラウド上で複雑な多段階コーディングタスクを実行します。

TLDR AI·4月30日·★★★★

AutoSP の紹介：長文コンテキスト LLM 学習を自動化する新技術

DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。

TLDR AI·4月30日·★★★★

信頼性の高いデータ分析エージェント（16 分読）

記事は、AI エージェントがデータ分析において信頼性を高めるための手法や課題について解説しています。具体的な技術的進展や新モデルの発表ではなく、実装における注意点やベストプラクティスに関する内容です。

TLDR AI·4月30日·★★★★

Granite 4.1 LLMs の構築方法（13 分読了）

IBM は、15 トリオントークンで学習した Granite 4.1 系列のオープンソース大規模言語モデルを公開しました。このシリーズは 3B、8B、30B パラメータの Dense アーキテクチャを採用し、特に 8B モデルは多段階強化学習により前世代の 32B モデルに匹敵する性能を実現しています。

TLDR AI·4月30日·★★★★

AI 評価が新たな計算リソースのボトルネックに（19 分読）

AI 評価のコストが急騰し、トレーニングコストに匹敵する計算リソースのボトルネックとなっている。一部の試行では数万ドルを要し、モデルやタスク間でコスト配分に偏りがあるため、標準化ドキュメントやデータ再利用など効率的な手法が必要とされている。

TLDR AI·4月30日·★★★★

LaDiR：潜在拡散モデルがLLMの推論能力を強化する新フレームワーク

研究者らは、既存の大規模言語モデル（LLM）に潜在拡散モデルの特性を組み合わせた「LaDiR」という新たな推論フレームワークを開発しました。この手法は多様な推論経路を並列生成し、計画と修正を包括的に行うことで、精度や解釈性を向上させます。

TLDR AI·4月30日·★★★★

サティア・ナデラ氏、新たな OpenAI 提携を「活用」する用意があると表明

マイクロソフトの CEO サティア・ナデラ氏は、OpenAI との新しい提携関係を積極的に活用する準備ができていると発言した。

TechCrunch AI·4月30日·★★★★

PwC が AWS で AI を活用した契約分析の注目を集める

PwC は AWS 上で AI を駆使した注釈機能を開発し、法律・コンプライアンスチームが膨大な非構造化契約から重要な条項を効率的に抽出・分析できる環境を提供している。

AWS Machine Learning Blog·4月30日·★★★★

LLM 0.32a0 は主要な後方互換性のあるリファクタリング

開発者が LLM Python ライブラリと CLI ツールのアルファ版「LLM 0.32a0」をリリースし、プロンプトとレスポンスに基づく従来のモデルから変更された重要なリファクタリングを実施した。

Simon Willison Blog·4月30日·★★★★

OpenAI Codex システムプロンプトに「ゴブリンについて語るな」という明記された指示が含まれる

OpenAI が公開した Codex CLI のシステムプロンプトには、ユーザーの質問と明確に関連する場合を除き、ゴブリンやグレイムリンなどの生物について語らないよう繰り返し警告する指示が記載されている。

Ars Technica AI·4月30日

AI 学習データのプライバシー保護

医療機関や銀行などが機密データを扱う機械学習モデルを訓練する際、患者情報や取引履歴などのプライバシーを守る技術の重要性が示されています。

Amazon Science·4月30日·★★★★

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

セキュリティエンジニアは、存在しないドイツのカードゲームの世界選手権に自分が優勝していると複数のAIチャットボットを説得し、信頼性の低いウェブ情報を自信ありげな回答に変える脆弱性を証明した。

The Register AI/ML·4月30日·★★★★

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

セキュリティエンジニアが、存在しないドイツのカードゲームのチャンピオンであると嘘をつき、ドメイン登録とウィキペディア編集だけで複数の AI ボットを騙し、信頼できる回答を生成させた。これにより、大規模言語モデルへのポイズニング攻撃がいかに容易であるかが証明された。

The Register AI/ML·4月30日

AI 評価が新たな計算リソースのボトルネックに

AI 業界において、モデル性能を測定する評価プロセスが、従来の計算資源（コンピュート）よりも重要な制約要因となりつつあると指摘されている。

Hugging Face Blog·4月30日·★★★★

タンブラー・リッジの家族らが OpenAI とサム・アルトマン氏を提訴、警察への通報義務違反を主張

カナダで発生した学校銃撃事件の犠牲者ら 7 世帯が、OpenAI と CEO のサム・アルトマン氏を相手取り訴訟を起こしました。彼らは、容疑者の ChatGPT 利用活動がシステムによって検知されたにもかかわらず、警察へ通報しなかったとして過失を主張しています。

The Verge AI·4月29日·★★★★

← 前へ23 / 39次へ →