#rag のAIニュース

99件の記事

Amazon S3 の Amazon QuickSight キーベースにおける機密ドキュメントへのアクセス制限機能の追加

AWS は、Amazon QuickSight のキーベースで機密ドキュメントやフォルダに対する詳細なアクセス制御リスト（ACL）サポートを追加した。これにより、特定のチームや個人のみがアクセスできる権限管理が可能になる。

AWS Machine Learning Blog·5月16日·★★★★

Microsoft Edge の Copilot アップデートがタブ間情報を AI で統合

マイクロソフトは Microsoft Edge ブラウザの Copilot に新機能を追加し、開いているすべてのタブから情報を収集して質問に答えたり、比較・要約したりできるようにした。

The Verge AI·5月14日

AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換

NVIDIA は、AI エージェントとスキル機能を用いて、組織が動画からリアルタイムで意味のある洞察を抽出し、それを即座に検索・活用できる技術を発表した。

NVIDIA Developer Blog·5月14日

技術意思決定者の動機と AI 戦略の現実

ミッチェル・ハシモットは、技術意思決定者（TDM）の9割が解雇を避けることを最優先し、ガートナーなどの分析や世論に依存して「AI 戦略」を採用すると指摘した。彼らは週末に GitHub を操作する層ではなく、定時で帰宅する実務家である。

Simon Willison Blog·5月13日

Amazon Finance が AWS の生成 AI を活用し規制対応を効率化

Amazon の財務技術チームは、AWS で構築した生成 AI システムを用いて、各国の当局から届く複雑な規制問い合わせへの対応プロセスを自動化・効率化している。

AWS Machine Learning Blog·5月13日·★★★★

本日は特に目立った出来事なし

AIニュース配信元「AINews」は、2026年5月11日から12日にかけて複数のコミュニティを調査したが、業界に大きな影響を与える新発表や技術進展は見られなかった。

Smol AI News·5月12日·★★★★

Strands と Exa を活用した Web 検索対応エージェントの構築

Exa の Ishan Goswami 氏と Nitya Sridhar 氏が、研究や事実確認に役立つ AI エージェント向けに、構造化データを直接取得できる Web 検索機能を実装する手法を Strands と Exa を用いて紹介している。

AWS Machine Learning Blog·5月12日·★★★★

Amazon Nova マルチモーダル埋め込みによる製造業のインテリジェンス向上

アマゾンは、航空宇宙や自動車産業向けに、技術文書内の図面やグラフから情報を抽出するマルチモーダル埋め込み技術を導入し、テキスト検索では見つけられない知見を表面化させる。

AWS Machine Learning Blog·5月12日·★★★★

Miro が Amazon Bedrock を活用し、ソフトウェアバグの経路特定精度を向上させ解決時間を数日から数時間に短縮

AI 支援ワークスペース「Miro」は、Amazon Bedrock を導入してバグ分類の精度を高め、解決までの所要時間を従来の数日から数時間へと劇的に短縮した。

AWS Machine Learning Blog·5月12日·★★★★

LLM による継続的な更新が記憶の誤りを招く

AI エージェントは、LLM が記憶を連続的に書き換えることで、かえって性能が低下する。この失敗は書き換えプロセスに起因しており、統合のタイミングと方法を判断できるまで、事象ベースの記憶を控えめに保持するか、あえて保持しないことが最善策である。

TLDR AI·5月11日·★★★★

修正：Google、AI 検索結果にウェブサイトのリンクをより多く追加へ

Google は過去2年間、AI 検索結果（AI Overviews）が上位に表示され、従来のウェブサイトへのトラフィック減少を招いたと指摘されている。これに対し同社は責任を認めないものの、AI の回答内にウェブサイトのリンクをより多く含める変更を実施し、検索体験の修正を図っている。

Ars Technica AI·5月9日·★★★★

ハルバートン、Amazon Bedrock と生成 AI を活用して地震データ処理ワークフローを強化

エネルギー探査の重要要素である地震データ分析において、ハルバートンはクラウドネイティブアプリ「Seismic Engine」に Amazon Bedrock と生成 AI を導入し、従来 100 以上の専門ツールを手動で設定する必要があった複雑なワークフロー作成を効率化しました。

AWS Machine Learning Blog·5月8日·★★★★

AI エージェントの記憶機能の仕組み（28 分読了）

この記事は、言語モデルが応答後に情報を忘却する課題に対し、対話を継続させるための記憶システムが情報ループ内で果たす役割と、各ループで伝達すべき情報の選定方法について解説している。

TLDR AI·5月7日·★★★★

Gemini API のファイル検索がマルチモーダル化：効率的で検証可能な RAG を構築可能に

Google が Gemini API のファイル検索ツールにマルチモーダル対応、カスタムメタデータフィルタリング、ページレベルの引用機能を追加し、開発者が構造化されていないテキストと画像データを処理する RAG システムを構築しやすくした。

TLDR AI·5月6日·★★★★

コンテキストウィンドウが破られる：Subquadratic が 1200 万トークンの窓を公開し GPT-5.5 を上回る性能を示す

AI 企業 Subquadratic は、入力長に対して計算コストが二次関数的に増大する課題を解決した新モデルを発表しました。このモデルは 1200 万トークンという巨大なコンテキストウィンドウを持ち、検索ベンチマークで GPT-5.5 を上回る性能を発揮しています。同社は間もなく 5000 万トークン対応のモデルも提供する計画です。

TLDR AI·5月6日·★★★★★

Anthropic、Claude に金融エージェント機能を追加し資金運用を支援

AI企業 Anthropic は、Claude が財務タスクをより効果的に支援できるよう、スキルとデータ接続を含む金融用エージェントテンプレートを公開した。

The Register AI/ML·5月6日·★★★★

Anthropic が次期プロアクティブアシスタント「Orbit」の開発中

AI企業 Anthropic は、Claude や Claude Code に統合されるブリーフィングシステム「Orbit」を開発中であり、これは接続された業務ツールから行動可能な洞察を抽出してパーソナライズされた報告を作成する機能を持つ。同社は 5 月と 6 月にサンフランシスコ、ロンドン、東京で開発者会議を開催予定だが、Orbit の正式発表時期は未定である。

TLDR AI·5月5日

エージェント性能ループの紹介：AgentCore Optimization がプレビュー開始

OpenAI は、生産環境のトレースから推奨事項を生成し、バッチ評価と A/B テストで検証して自信を持ってリリースできる「エージェント性能ループ」機能を含む AgentCore Optimization のプレビューを開始した。これにより、モデル進化やユーザー行動の変化による品質低下を防ぐ自動フィードバックループが実現する。

AWS Machine Learning Blog·5月5日·★★★★

AI推論は異なるルールに従う

NVIDIAのジェンソン・フアンCEOが「AIファクトリー」時代を宣言したが、GPUクラスターや巨大モデルへの注目が集まる中、AWSやAzureなどのクラウド環境ではデータインフラを圧迫するAIエージェントによる静かなる危機が進行している。

The Register AI/ML·5月5日·★★★★

Gemini Embedding 2 の一般提供：エージェント型マルチモーダル RAG を実現する統合モデル

Google はテキスト、画像、動画、音声、文書を単一の意味空間にマッピングする統合モデル「Gemini Embedding 2」の一般提供を開始した。この新モデルにより、開発者は1回のリクエストで複数のマルチモーダル入力を処理でき、エージェント型 RAG の性能が大幅に向上する。

Google Developers AI·4月30日·★★★★

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

セキュリティエンジニアは、存在しないドイツのカードゲームの世界選手権に自分が優勝していると複数のAIチャットボットを説得し、信頼性の低いウェブ情報を自信ありげな回答に変える脆弱性を証明した。

The Register AI/ML·4月30日·★★★★

AI に備えたデータ構築：バンガードのバーチャルアナリストへの道

投資管理大手のバンガードが、全投資家への公平な対応を目的に、独自の投資家所有構造のもとで AI 活用に向けたデータ基盤整備とバーチャルアナリズムの実践を開始した。

AWS Machine Learning Blog·4月29日·★★★★

エージェントが検索スタックを代替できるか？

AI エージェントに基本的な検索ツールを提供すると回答品質が向上し、さらに探索を促すことで改善が見られる。しかし、大規模言語モデルは未知の領域を評価できず、学習データが性能の限界を決めるため、知識不足を補う確実な方法は未だ存在しない。

TLDR AI·4月29日·★★★★

ブラウザでPDFテキストを抽出する「LiteParse for the web」

開発者はLlamaIndexの「LiteParse」をブラウザ環境へ移植し、PDFテキスト抽出ツールを公開した。AIモデルを使用せず従来の解析手法で動作する。

Simon Willison Blog·4月24日

AutoAdapt：大規模言語モデルの自動ドメイン適応

Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択（RAG等）、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。

Microsoft Research·4月23日·★★★★

社内AIヘルプデスク「精度80%の壁」を突破-ナレッジ管理ツール開発の意思決定

DeNAは社内AIヘルプデスク「Findout」の精度80%壁をナレッジ不足と特定し、RAG最適化に依存せず知識管理ツールの開発へ方針を転換したと発表した。

DeNA Engineering·4月23日·★★★★

GitBookが3万サイトのサブ秒コンテンツ更新をVercelで実現

GitBookはVercel上で3万のドキュメントサイトをホストし、月間1億2千万ページビューを処理している。NvidiaやZoomなどの企業が採用し、毎日4万件のキャッシュ無効化を300ms未満で解決。全トラフィックの41%がAIクローラーや自動化システムから発生。

Vercel Blog·4月17日·★★★★

画像・テキスト・動画を統合！オープンソースフレームワークで全モダリティ知識ベースを実現

通義実験室が、画像・テキスト・動画などの複数モダリティを統合的に処理できるオープンソースフレームワーク「VimRAG」を発表した。企業の多様な知識資産を一元的に扱い、大規模言語モデルの回答精度向上を目指す。

通义大模型·4月9日·★★★★

階層的エージェントRAGシステムの構築：自律的エラー回復を備えたマルチモーダル推論

著者が、階層的エージェントRAGシステムが専門ワーカーを構造化されたオーケストレーションで調整し、複雑な企業分析ワークフローの精度・信頼性・説明可能性を向上させる方法を探る。

InfoQ·4月9日·★★★★

Sentence Transformersによるマルチモーダル埋め込みとリランカーモデル

Sentence Transformersチームが、テキストと画像を統合的に処理できるマルチモーダル埋め込みモデルと、検索結果の精度を向上させるリランカーモデルを発表した。

Hugging Face Blog·4月9日·★★★★

Agentic RAGの前に整えるべきもの：実務RAGの入口を設計するRouter RAG

記事は、Agentic RAGの検証から、後段の高度化よりも前段の問い合わせ処理が重要であることを指摘し、実務上の問題を基に質問を適切に振り分ける「Router RAG」の設計と実装の考え方を紹介しています。

HEROZ Tech Blog·4月7日

Amazon BedrockとAmazon OpenSearchを用いたハイブリッドRAGソリューションによるインテリジェント検索の構築

Amazonは、BedrockとOpenSearchを組み合わせたハイブリッドRAGソリューションを発表した。このソリューションは、エージェント型生成AIアシスタントを実現し、LLMが複雑なタスクを処理しながらビジネスデータをリアルタイムで検索・活用できるようにする。

AWS Machine Learning Blog·4月7日·★★★★

AI時代におけるキャッシュの再考理由

Cloudflareが、自社ネットワークの32%のトラフィックがAIアシスタントを含む自動化トラフィックであることを報告し、AIエージェントの攻撃的なリクエスト行動に対応するためキャッシュシステムの再設計を進めている。

Cloudflare Blog·4月2日·★★★★

RAGを超えて：Spring Bootによるコンテキスト認識AIシステムの構築

本記事は、企業システム向けにRAGを改良した「Context-Augmented Generation（CAG）」を紹介し、Spring Bootベースのコンテキスト管理がユーザーIDやセッション状態をAIワークフローに統合し、トレーサビリティとガバナンスを向上させる方法を示している。

InfoQ·4月2日

スキルを備えたADKエージェント構築の開発者ガイド

GoogleのAgent Development Kit（ADK）SkillToolsetは、AIエージェントが要求に応じてドメイン知識を読み込める「段階的開示」アーキテクチャを導入し、従来の単一プロンプトと比較してトークン使用量を最大90％削減する。

Google Developers AI·4月2日·★★★★

LangChainとMongoDBのパートナーシップ発表：信頼できるデータベース上で動作するAIエージェントスタック

LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。

LangChain Blog·4月1日·★★★★

PDFの図表はRAGで扱えるのか？6つの方法で検証して分かった“現実的な最適解”

本記事は、PDF内の図表をRAGで扱うための6つの手法（テキスト抽出・LLMによるOCR・マルチモーダルEmbedding等）を精度・コスト・処理時間の観点から比較検証し、実務で使える現実的な最適解を整理した。

HEROZ Tech Blog·3月31日

WINTICKETにおけるインシデント避難訓練の仕組みと1年間の運用知見

WINTICKETが、AIを活用したシナリオ生成とGUIベースのツールを用いたインシデント避難訓練の仕組みを構築し、1年間の運用で得た知見を共有している。

CyberAgent Developers Blog·3月31日

RingがAmazon Bedrock Knowledge Basesでグローバルカスタマーサポートを拡張する方法

Amazonのホームセキュリティ子会社Ringは、Amazon Bedrock Knowledge Basesを活用し、多言語対応のRAGシステムを構築することで、グローバルなセルフサービスサポートの拡張を実現した。

AWS Machine Learning Blog·3月31日

AEO対GEOが2026年のAI駆動型ブランド発見をどう再構築するか

ピュー・リサーチ・センターが2025年3月のGoogle検索を分析した結果、AI生成の要約を見たユーザーは従来の結果をクリックする確率が8%と低く、要約を見なかったユーザーの15%と比較して約半分だった。また、AI要約を見たユーザーの4分の1は何もクリックせずにセッションを終了した。

AI News·3月30日·★★★★

NVIDIA Nemotron 3エージェントの構築：推論、マルチモーダルRAG、音声、安全性

NVIDIAが、計画・推論・検索・安全制御を専門モデルが連携して処理するエージェントAIシステム「Nemotron 3」を開発した。

NVIDIA Developer Blog·3月25日·★★★★

LlamaParseとGemini 3.1でスマートな財務アシスタントを構築

Googleが、非構造化文書から高品質データを抽出するワークフローを紹介。LlamaParseとGemini 3.1モデルを組み合わせ、複雑な財務表の解析と要約を実現するイベント駆動型アーキテクチャを提案している。

Google Developers AI·3月24日

エージェント型RAGは本当に必要なのか？〜RAGの社内実験と最新研究から考察

著者が2026年に注目されるエージェント型RAGについて、社内実験の比較結果と最新研究を紹介し、エンタープライズ検索に近いタスクでの検証結果と研究動向を整理した。

HEROZ Tech Blog·3月23日

1日以内にドメイン固有の埋め込みモデルを構築する

研究チームが、特定分野に特化した埋め込みモデルを24時間以内に効率的に構築する手法を発表した。

Hugging Face Blog·3月21日·★★★★

Mellea 0.4.0の新機能とGraniteライブラリのリリース

Melleaがバージョン0.4.0をリリースし、Graniteライブラリを公開した。新バージョンではパフォーマンス向上と新APIが追加され、Graniteライブラリは開発者がAI機能を統合しやすくするツールを提供する。

Hugging Face Blog·3月20日·★★★★

LlamaIndex、AIエージェント向け「LiteParse」をリリース：CLI対応のTypeScriptネイティブ空間PDF解析ライブラリ

LlamaIndexは、RAG開発のボトルネックである複雑なPDF変換を解決するため、「LiteParse」というローカル実行型のオープンソース解析ライブラリを公開した。

MarkTechPost·3月20日·★★★★

埋め込みなしで知識エージェントを構築する

Vercel社は、埋め込みモデルに依存する従来の知識エージェント構築方法の課題を指摘し、構造化データからの特定値取得に適した新たなアプローチを提案している。

Vercel Blog·3月20日·★★★★

NVIDIA AI-QとLangChainによるエンタープライズ検索向けディープエージェントの構築方法

NVIDIAがLangChainと連携し、企業向けAIエージェント「AI-Q」を開発。データの断片化や文脈不足を解決するエンタープライズ検索ソリューションを提供する。

NVIDIA Developer Blog·3月19日·★★★★

LumberChunker: 長編物語文書のセグメンテーション

IST、NeuralShift AI、CMUの研究者らが、長編物語文書を構造的に分割する「LumberChunker」を発表した。

ML@CMU·3月18日·★★★★

QCon London 2026：本番AIシステムのための信頼性のある検索

RabobankのAIテックリードLan Chu氏が、1万文書・300ユーザー以上で運用するAI検索システムの導入経験を共有。RAGシステムの失敗の多くは言語モデル自体ではなく、インデックス作成と検索に起因することを示した。

InfoQ·3月18日

1 / 2次へ →

#rag のAIニュース

Amazon S3 の Amazon QuickSight キーベースにおける機密ドキュメントへのアクセス制限機能の追加

Microsoft Edge の Copilot アップデートがタブ間情報を AI で統合

AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換

技術意思決定者の動機と AI 戦略の現実

Amazon Finance が AWS の生成 AI を活用し規制対応を効率化

本日は特に目立った出来事なし

Strands と Exa を活用した Web 検索対応エージェントの構築

Amazon Nova マルチモーダル埋め込みによる製造業のインテリジェンス向上

Miro が Amazon Bedrock を活用し、ソフトウェアバグの経路特定精度を向上させ解決時間を数日から数時間に短縮

LLM による継続的な更新が記憶の誤りを招く

修正：Google、AI 検索結果にウェブサイトのリンクをより多く追加へ

ハルバートン、Amazon Bedrock と生成 AI を活用して地震データ処理ワークフローを強化

AI エージェントの記憶機能の仕組み（28 分読了）

Gemini API のファイル検索がマルチモーダル化：効率的で検証可能な RAG を構築可能に

コンテキストウィンドウが破られる：Subquadratic が 1200 万トークンの窓を公開し GPT-5.5 を上回る性能を示す

Anthropic、Claude に金融エージェント機能を追加し資金運用を支援

Anthropic が次期プロアクティブアシスタント「Orbit」の開発中

エージェント性能ループの紹介：AgentCore Optimization がプレビュー開始

AI推論は異なるルールに従う

Gemini Embedding 2 の一般提供：エージェント型マルチモーダル RAG を実現する統合モデル

大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験

AI に備えたデータ構築：バンガードのバーチャルアナリストへの道

エージェントが検索スタックを代替できるか？

ブラウザでPDFテキストを抽出する「LiteParse for the web」

AutoAdapt：大規模言語モデルの自動ドメイン適応

社内AIヘルプデスク「精度80%の壁」を突破-ナレッジ管理ツール開発の意思決定

GitBookが3万サイトのサブ秒コンテンツ更新をVercelで実現

画像・テキスト・動画を統合！オープンソースフレームワークで全モダリティ知識ベースを実現

階層的エージェントRAGシステムの構築：自律的エラー回復を備えたマルチモーダル推論

Sentence Transformersによるマルチモーダル埋め込みとリランカーモデル

Agentic RAGの前に整えるべきもの：実務RAGの入口を設計するRouter RAG

Amazon BedrockとAmazon OpenSearchを用いたハイブリッドRAGソリューションによるインテリジェント検索の構築

AI時代におけるキャッシュの再考理由

RAGを超えて：Spring Bootによるコンテキスト認識AIシステムの構築

スキルを備えたADKエージェント構築の開発者ガイド

LangChainとMongoDBのパートナーシップ発表：信頼できるデータベース上で動作するAIエージェントスタック

PDFの図表はRAGで扱えるのか？6つの方法で検証して分かった“現実的な最適解”

WINTICKETにおけるインシデント避難訓練の仕組みと1年間の運用知見

RingがAmazon Bedrock Knowledge Basesでグローバルカスタマーサポートを拡張する方法

AEO対GEOが2026年のAI駆動型ブランド発見をどう再構築するか

NVIDIA Nemotron 3エージェントの構築：推論、マルチモーダルRAG、音声、安全性

LlamaParseとGemini 3.1でスマートな財務アシスタントを構築

エージェント型RAGは本当に必要なのか？ 〜RAGの社内実験と最新研究から考察

1日以内にドメイン固有の埋め込みモデルを構築する

Mellea 0.4.0の新機能とGraniteライブラリのリリース

LlamaIndex、AIエージェント向け「LiteParse」をリリース：CLI対応のTypeScriptネイティブ空間PDF解析ライブラリ

埋め込みなしで知識エージェントを構築する

NVIDIA AI-QとLangChainによるエンタープライズ検索向けディープエージェントの構築方法

LumberChunker: 長編物語文書のセグメンテーション

QCon London 2026：本番AIシステムのための信頼性のある検索

エージェント型RAGは本当に必要なのか？〜RAGの社内実験と最新研究から考察