#rag のAIニュース
99件の記事
Amazon S3 の Amazon QuickSight キーベースにおける機密ドキュメントへのアクセス制限機能の追加
AWS は、Amazon QuickSight のキーベースで機密ドキュメントやフォルダに対する詳細なアクセス制御リスト(ACL)サポートを追加した。これにより、特定のチームや個人のみがアクセスできる権限管理が可能になる。
Microsoft Edge の Copilot アップデートがタブ間情報を AI で統合
マイクロソフトは Microsoft Edge ブラウザの Copilot に新機能を追加し、開いているすべてのタブから情報を収集して質問に答えたり、比較・要約したりできるようにした。
AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換
NVIDIA は、AI エージェントとスキル機能を用いて、組織が動画からリアルタイムで意味のある洞察を抽出し、それを即座に検索・活用できる技術を発表した。
技術意思決定者の動機と AI 戦略の現実
ミッチェル・ハシモットは、技術意思決定者(TDM)の9割が解雇を避けることを最優先し、ガートナーなどの分析や世論に依存して「AI 戦略」を採用すると指摘した。彼らは週末に GitHub を操作する層ではなく、定時で帰宅する実務家である。
Amazon Finance が AWS の生成 AI を活用し規制対応を効率化
Amazon の財務技術チームは、AWS で構築した生成 AI システムを用いて、各国の当局から届く複雑な規制問い合わせへの対応プロセスを自動化・効率化している。
本日は特に目立った出来事なし
AIニュース配信元「AINews」は、2026年5月11日から12日にかけて複数のコミュニティを調査したが、業界に大きな影響を与える新発表や技術進展は見られなかった。
Strands と Exa を活用した Web 検索対応エージェントの構築
Exa の Ishan Goswami 氏と Nitya Sridhar 氏が、研究や事実確認に役立つ AI エージェント向けに、構造化データを直接取得できる Web 検索機能を実装する手法を Strands と Exa を用いて紹介している。
Amazon Nova マルチモーダル埋め込みによる製造業のインテリジェンス向上
アマゾンは、航空宇宙や自動車産業向けに、技術文書内の図面やグラフから情報を抽出するマルチモーダル埋め込み技術を導入し、テキスト検索では見つけられない知見を表面化させる。
Miro が Amazon Bedrock を活用し、ソフトウェアバグの経路特定精度を向上させ解決時間を数日から数時間に短縮
AI 支援ワークスペース「Miro」は、Amazon Bedrock を導入してバグ分類の精度を高め、解決までの所要時間を従来の数日から数時間へと劇的に短縮した。
LLM による継続的な更新が記憶の誤りを招く
AI エージェントは、LLM が記憶を連続的に書き換えることで、かえって性能が低下する。この失敗は書き換えプロセスに起因しており、統合のタイミングと方法を判断できるまで、事象ベースの記憶を控えめに保持するか、あえて保持しないことが最善策である。
修正:Google、AI 検索結果にウェブサイトのリンクをより多く追加へ
Google は過去2年間、AI 検索結果(AI Overviews)が上位に表示され、従来のウェブサイトへのトラフィック減少を招いたと指摘されている。これに対し同社は責任を認めないものの、AI の回答内にウェブサイトのリンクをより多く含める変更を実施し、検索体験の修正を図っている。
ハルバートン、Amazon Bedrock と生成 AI を活用して地震データ処理ワークフローを強化
エネルギー探査の重要要素である地震データ分析において、ハルバートンはクラウドネイティブアプリ「Seismic Engine」に Amazon Bedrock と生成 AI を導入し、従来 100 以上の専門ツールを手動で設定する必要があった複雑なワークフロー作成を効率化しました。
AI エージェントの記憶機能の仕組み(28 分読了)
この記事は、言語モデルが応答後に情報を忘却する課題に対し、対話を継続させるための記憶システムが情報ループ内で果たす役割と、各ループで伝達すべき情報の選定方法について解説している。
Gemini API のファイル検索がマルチモーダル化:効率的で検証可能な RAG を構築可能に
Google が Gemini API のファイル検索ツールにマルチモーダル対応、カスタムメタデータフィルタリング、ページレベルの引用機能を追加し、開発者が構造化されていないテキストと画像データを処理する RAG システムを構築しやすくした。
コンテキストウィンドウが破られる:Subquadratic が 1200 万トークンの窓を公開し GPT-5.5 を上回る性能を示す
AI 企業 Subquadratic は、入力長に対して計算コストが二次関数的に増大する課題を解決した新モデルを発表しました。このモデルは 1200 万トークンという巨大なコンテキストウィンドウを持ち、検索ベンチマークで GPT-5.5 を上回る性能を発揮しています。同社は間もなく 5000 万トークン対応のモデルも提供する計画です。
Anthropic、Claude に金融エージェント機能を追加し資金運用を支援
AI企業 Anthropic は、Claude が財務タスクをより効果的に支援できるよう、スキルとデータ接続を含む金融用エージェントテンプレートを公開した。
Anthropic が次期プロアクティブアシスタント「Orbit」の開発中
AI企業 Anthropic は、Claude や Claude Code に統合されるブリーフィングシステム「Orbit」を開発中であり、これは接続された業務ツールから行動可能な洞察を抽出してパーソナライズされた報告を作成する機能を持つ。同社は 5 月と 6 月にサンフランシスコ、ロンドン、東京で開発者会議を開催予定だが、Orbit の正式発表時期は未定である。
エージェント性能ループの紹介:AgentCore Optimization がプレビュー開始
OpenAI は、生産環境のトレースから推奨事項を生成し、バッチ評価と A/B テストで検証して自信を持ってリリースできる「エージェント性能ループ」機能を含む AgentCore Optimization のプレビューを開始した。これにより、モデル進化やユーザー行動の変化による品質低下を防ぐ自動フィードバックループが実現する。
AI推論は異なるルールに従う
NVIDIAのジェンソン・フアンCEOが「AIファクトリー」時代を宣言したが、GPUクラスターや巨大モデルへの注目が集まる中、AWSやAzureなどのクラウド環境ではデータインフラを圧迫するAIエージェントによる静かなる危機が進行している。
Gemini Embedding 2 の一般提供:エージェント型マルチモーダル RAG を実現する統合モデル
Google はテキスト、画像、動画、音声、文書を単一の意味空間にマッピングする統合モデル「Gemini Embedding 2」の一般提供を開始した。この新モデルにより、開発者は1回のリクエストで複数のマルチモーダル入力を処理でき、エージェント型 RAG の性能が大幅に向上する。
大規模言語モデルへのポイズニング攻撃が極めて容易であることを示す新たな実験
セキュリティエンジニアは、存在しないドイツのカードゲームの世界選手権に自分が優勝していると複数のAIチャットボットを説得し、信頼性の低いウェブ情報を自信ありげな回答に変える脆弱性を証明した。
AI に備えたデータ構築:バンガードのバーチャルアナリストへの道
投資管理大手のバンガードが、全投資家への公平な対応を目的に、独自の投資家所有構造のもとで AI 活用に向けたデータ基盤整備とバーチャルアナリズムの実践を開始した。
エージェントが検索スタックを代替できるか?
AI エージェントに基本的な検索ツールを提供すると回答品質が向上し、さらに探索を促すことで改善が見られる。しかし、大規模言語モデルは未知の領域を評価できず、学習データが性能の限界を決めるため、知識不足を補う確実な方法は未だ存在しない。
ブラウザでPDFテキストを抽出する「LiteParse for the web」
開発者はLlamaIndexの「LiteParse」をブラウザ環境へ移植し、PDFテキスト抽出ツールを公開した。AIモデルを使用せず従来の解析手法で動作する。
AutoAdapt:大規模言語モデルの自動ドメイン適応
Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択(RAG等)、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。
社内AIヘルプデスク「精度80%の壁」を突破-ナレッジ管理ツール開発の意思決定
DeNAは社内AIヘルプデスク「Findout」の精度80%壁をナレッジ不足と特定し、RAG最適化に依存せず知識管理ツールの開発へ方針を転換したと発表した。
GitBookが3万サイトのサブ秒コンテンツ更新をVercelで実現
GitBookはVercel上で3万のドキュメントサイトをホストし、月間1億2千万ページビューを処理している。NvidiaやZoomなどの企業が採用し、毎日4万件のキャッシュ無効化を300ms未満で解決。全トラフィックの41%がAIクローラーや自動化システムから発生。
画像・テキスト・動画を統合!オープンソースフレームワークで全モダリティ知識ベースを実現
通義実験室が、画像・テキスト・動画などの複数モダリティを統合的に処理できるオープンソースフレームワーク「VimRAG」を発表した。企業の多様な知識資産を一元的に扱い、大規模言語モデルの回答精度向上を目指す。
階層的エージェントRAGシステムの構築:自律的エラー回復を備えたマルチモーダル推論
著者が、階層的エージェントRAGシステムが専門ワーカーを構造化されたオーケストレーションで調整し、複雑な企業分析ワークフローの精度・信頼性・説明可能性を向上させる方法を探る。
Sentence Transformersによるマルチモーダル埋め込みとリランカーモデル
Sentence Transformersチームが、テキストと画像を統合的に処理できるマルチモーダル埋め込みモデルと、検索結果の精度を向上させるリランカーモデルを発表した。
Agentic RAGの前に整えるべきもの:実務RAGの入口を設計するRouter RAG
記事は、Agentic RAGの検証から、後段の高度化よりも前段の問い合わせ処理が重要であることを指摘し、実務上の問題を基に質問を適切に振り分ける「Router RAG」の設計と実装の考え方を紹介しています。
Amazon BedrockとAmazon OpenSearchを用いたハイブリッドRAGソリューションによるインテリジェント検索の構築
Amazonは、BedrockとOpenSearchを組み合わせたハイブリッドRAGソリューションを発表した。このソリューションは、エージェント型生成AIアシスタントを実現し、LLMが複雑なタスクを処理しながらビジネスデータをリアルタイムで検索・活用できるようにする。
AI時代におけるキャッシュの再考理由
Cloudflareが、自社ネットワークの32%のトラフィックがAIアシスタントを含む自動化トラフィックであることを報告し、AIエージェントの攻撃的なリクエスト行動に対応するためキャッシュシステムの再設計を進めている。
RAGを超えて:Spring Bootによるコンテキスト認識AIシステムの構築
本記事は、企業システム向けにRAGを改良した「Context-Augmented Generation(CAG)」を紹介し、Spring Bootベースのコンテキスト管理がユーザーIDやセッション状態をAIワークフローに統合し、トレーサビリティとガバナンスを向上させる方法を示している。
スキルを備えたADKエージェント構築の開発者ガイド
GoogleのAgent Development Kit(ADK)SkillToolsetは、AIエージェントが要求に応じてドメイン知識を読み込める「段階的開示」アーキテクチャを導入し、従来の単一プロンプトと比較してトークン使用量を最大90%削減する。
LangChainとMongoDBのパートナーシップ発表:信頼できるデータベース上で動作するAIエージェントスタック
LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。
PDFの図表はRAGで扱えるのか?6つの方法で検証して分かった“現実的な最適解”
本記事は、PDF内の図表をRAGで扱うための6つの手法(テキスト抽出・LLMによるOCR・マルチモーダルEmbedding等)を精度・コスト・処理時間の観点から比較検証し、実務で使える現実的な最適解を整理した。
WINTICKETにおけるインシデント避難訓練の仕組みと1年間の運用知見
WINTICKETが、AIを活用したシナリオ生成とGUIベースのツールを用いたインシデント避難訓練の仕組みを構築し、1年間の運用で得た知見を共有している。
RingがAmazon Bedrock Knowledge Basesでグローバルカスタマーサポートを拡張する方法
Amazonのホームセキュリティ子会社Ringは、Amazon Bedrock Knowledge Basesを活用し、多言語対応のRAGシステムを構築することで、グローバルなセルフサービスサポートの拡張を実現した。
AEO対GEOが2026年のAI駆動型ブランド発見をどう再構築するか
ピュー・リサーチ・センターが2025年3月のGoogle検索を分析した結果、AI生成の要約を見たユーザーは従来の結果をクリックする確率が8%と低く、要約を見なかったユーザーの15%と比較して約半分だった。また、AI要約を見たユーザーの4分の1は何もクリックせずにセッションを終了した。
NVIDIA Nemotron 3エージェントの構築:推論、マルチモーダルRAG、音声、安全性
NVIDIAが、計画・推論・検索・安全制御を専門モデルが連携して処理するエージェントAIシステム「Nemotron 3」を開発した。
LlamaParseとGemini 3.1でスマートな財務アシスタントを構築
Googleが、非構造化文書から高品質データを抽出するワークフローを紹介。LlamaParseとGemini 3.1モデルを組み合わせ、複雑な財務表の解析と要約を実現するイベント駆動型アーキテクチャを提案している。
エージェント型RAGは本当に必要なのか? 〜RAGの社内実験と最新研究から考察
著者が2026年に注目されるエージェント型RAGについて、社内実験の比較結果と最新研究を紹介し、エンタープライズ検索に近いタスクでの検証結果と研究動向を整理した。
1日以内にドメイン固有の埋め込みモデルを構築する
研究チームが、特定分野に特化した埋め込みモデルを24時間以内に効率的に構築する手法を発表した。
Mellea 0.4.0の新機能とGraniteライブラリのリリース
Melleaがバージョン0.4.0をリリースし、Graniteライブラリを公開した。新バージョンではパフォーマンス向上と新APIが追加され、Graniteライブラリは開発者がAI機能を統合しやすくするツールを提供する。
LlamaIndex、AIエージェント向け「LiteParse」をリリース:CLI対応のTypeScriptネイティブ空間PDF解析ライブラリ
LlamaIndexは、RAG開発のボトルネックである複雑なPDF変換を解決するため、「LiteParse」というローカル実行型のオープンソース解析ライブラリを公開した。
埋め込みなしで知識エージェントを構築する
Vercel社は、埋め込みモデルに依存する従来の知識エージェント構築方法の課題を指摘し、構造化データからの特定値取得に適した新たなアプローチを提案している。
NVIDIA AI-QとLangChainによるエンタープライズ検索向けディープエージェントの構築方法
NVIDIAがLangChainと連携し、企業向けAIエージェント「AI-Q」を開発。データの断片化や文脈不足を解決するエンタープライズ検索ソリューションを提供する。
LumberChunker: 長編物語文書のセグメンテーション
IST、NeuralShift AI、CMUの研究者らが、長編物語文書を構造的に分割する「LumberChunker」を発表した。
QCon London 2026:本番AIシステムのための信頼性のある検索
RabobankのAIテックリードLan Chu氏が、1万文書・300ユーザー以上で運用するAI検索システムの導入経験を共有。RAGシステムの失敗の多くは言語モデル自体ではなく、インデックス作成と検索に起因することを示した。