#rag のAIニュース
192件の記事
抽象化と具体性のバランスを取る調和型メモリ表現「Memora」の発表
Microsoft Research は、長期かつ複雑なタスクを処理する AI エージェントが過去の対話を効率的に保持・アクセスするための新しいスケーラブルなメモリシステム「Memora」を発表した。
AI エキスパートに聞く:フルスタックとは何か
Google AI Blog は、AI エキスパートへのインタビューを通じて、技術分野における「フルスタック」の正確な定義と範囲について解説している。
RAG パイプラインは役に立たない可能性が高い。より良い代替案とは
KDnuggets は、従来の RAG(検索拡張生成)パイプラインが多くの場合無効であるとし、その課題を解決する新たな代替アプローチを紹介している。
EverMind が公開したオープンソースの Markdown フォーカス型エージェントメモリランタイム「EverOS」を紹介
AI エージェント開発者向けに、EverMind が Apache 2.0 ライセンスで「EverOS」というオープンソースのメモリランタイムを公開しました。これは大規模言語モデルが状態を持たないという課題に対し、ベクトルデータベースに依存せず、Markdown ファイルを事実源として記憶を保存・編集・検索する仕組みを提供します。
ウィンブルドン、ライブ試合中継にIBMのAIツールを追加
全イングランド・ローンテニスクラブは、IBMとの協力により、ウィンブルドンのデジタルプラットフォームにAI機能を実装した。新機能としてチャットアシスタントと「キーモーメント」がアプリや公式サイトで提供される。
AI エンジニア・開発者向けの主要なノーコードツール 6 つ
MarkTechPost は、コーディング知識がなくても RAG システムやマルチエージェントワークフローを構築できる AI エンジニア向けノーコードツール 6 つを紹介し、開発時間の短縮と効率化を可能にするプラットフォームを解説している。
Pinecone のテストデータ生成方法について
Pinecone が提供するドキュメントにおいて、同社のベクトルデータベースを効果的に検証・評価するためのテストデータの作成手法が解説されています。
Google、NotebookLM でノートブックコレクションのテストを開始
Google が AI ノートブックツール「NotebookLM」において、複数のノートブックを整理・管理する機能である「コレクション」のテストを実施している。
Qwen Image Agent(12 分読み)
アリババ傘下の通義千問チームが、計画・推論・検索・記憶・フィードバックを活用して画像生成の精度を向上させた Qwen-Image-Agent を発表し、評価指標 IA-Bench も導入した。
Deep Agents との連携によるプロンプトキャッシング
LangChain が、Deep Agents を活用してプロンプトキャッシングを実現する機能を公開した。これにより、推論コストとレイテンシを削減できる。
Amazon S3 から PDF テキストを抽出するインタラクティブな仕組みの構築
AWS は、監査や契約確認など即時対応が必要なケース向けに、Amazon S3 に保存された PDF ファイルからオンデマンドでテキストを抽出するサーバー構築方法を公開した。
AWS で現代的なデータメッシュ戦略を用いたエージェント型 AI アプリケーションの構築
AWS は、顧客サービスエージェントが自律的にデータベースを照会し回答を合成する際、組織内の複数のデータソースにまたがるガバナンスアクセスが必要であると指摘。現代のデータメッシュでは、データ相互作用チェーンの各層で厳密なアクセス制御を適用することが重要であるとしている。
SmithDB の全文検索用逆インデックス構築の仕組み
LangChain チームが、SmithDB で高速な全文検索を実現するために採用した逆インデックスの設計手法と実装プロセスを解説している。
2026 年に AI エンジニアになるためのロードマップ
KDnuggets が、2026 年までに AI エンジニアとして活躍するための学習ロードマップを提示している。
Vercel でエージェントに製品デザインを教える
Vercel は、コーディングエージェントが既存のスタイルやパターンを模倣する能力は高いものの、その背景にある設計思想や文脈を理解できない課題を指摘し、コードベース外の知識をどう学習させるかについて議論している。
AI エージェントに記憶機能を実装する方法
LangChain が、AI エージェントに長期・短期の記憶機能を組み込むための具体的な手法とアーキテクチャを解説している。
Nous Research、Hermes エージェントのスキルシステムに「/learn」機能を追加、手書きなしでワークフローをスラッシュコマンドとして記録可能に
Nous Research はオープンソースの自己改善型エージェント「Hermes Agent」のスキルシステムを拡張し、「/learn」という新コマンドを追加した。これにより、ユーザーはドキュメントやコードなどの資料を指定するだけで、エージェントが自動的に再利用可能なスキル定義ファイル(SKILL.md)を作成できるようになった。
間接プロンプトインジェクションに関する洞察(12 分読了)
TLDR AI が、AI モデルが外部データから悪意ある指示を誤って受け取る「間接プロンプトインジェクション」の仕組みと対策について解説した。
Mistral OCR 4:文書知能のための最先端 OCR ツール(9 分読了)
Mistral は、170 か国語に対応し、エンタープライズ検索や構造化データパイプラインに統合可能な文書知能ツール「OCR 4」をリリースした。同ツールは単一コンテナで展開可能であり、低リソース言語を含む高精度な抽出と他システムより 4 倍の高速処理を実現している。
Mistral OCR 4 が引用対応の構造化出力を RAG、エージェント型、企業検索パイプラインに提供
Mistral AI は最新ドキュメント理解モデル「OCR 4」を発表し、抽出テキストに境界ボックスやブロック分類、信頼度スコアを追加した。このモデルは 170 か国語に対応し、自己完結型デプロイが可能で、企業検索や RAG パイプラインの ingestion コンポーネントとして機能する。
Anthropic の Claude Tag が、Slack のメッセージを一つずつ学習して企業情報を習得中
AI 企業 Anthropic は、チャットツール Slack でやり取りされるメッセージを逐次学習させる機能「Claude Tag」を開発し、企業の独自知識を自動的に蓄積・活用する仕組みを提供している。
AI エンジニア向け技術ガイド:エージェントの記憶には 7 つのタイプがある
MarkTechPost は、デフォルトで状態を持たない大規模言語モデルを、継続的な学習と行動が可能なシステムに変えるための「エージェント記憶」の重要性を解説し、その実装に必要な 7 つの記憶タイプを技術的に紹介している。
Liquid AI、11言語対応の高速多言語検索向け新モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を発表
Liquid AI は、11言語間の高速な多言語・異言語検索を実現する新たな取得モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を公開した。両モデルはパラメータ数 3.5 億で、LFM ファミリー初の双方向型であり、Hugging Face で利用可能となった。
Domyn と AISquared が Ai2 のオープンリリースをどう活用したか
Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。
Amazon Quick の自律型エージェントで毎日数時間を節約
AWS は、Amazon Quick という AI アシスタントが背景で動作し、業務の自動化や会議準備などを代行することで、ユーザーが重要な優先事項に集中できる機能を発表した。
大規模なデータと AI エージェントのための文脈知能
AWS は、AI エージェントがデータレイクやデータベースなど散在する情報源を統合し、大規模に推論できる「文脈知能」機能を発表した。これによりエージェントの判断精度向上を目指す。
Amazon Bedrock AgentCore の新機能:広範な知識と継続的学習を備えたエージェント構築が可能に
AWS は Amazon Bedrock AgentCore に新機能を追加し、 SharePoint などの外部ドキュメントへのアクセスやフィードバックの活用を通じて、エージェントが本来持つ能力を発揮できるようにした。これにより、顧客対応や研究支援などにおいて、より高度な推論と計画が可能となる。
エージェント型リソース発見:エージェントが検索できるようにする
Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。
LangSmith ベンチマークの共有について
LangChain が開発した LangSmith のベンチマーク結果を公開し、AI アプリケーションの評価基準に関する情報を提供しました。
2026 年に LLM エンジニアになるためのロードマップ
KDnuggets が、2026 年までに大規模言語モデルエンジニアとして活躍するための学習経路と必要なスキルを提示した。
Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format(OKF)」を発表
Google Cloud は、LLM の知識不足という課題に対処するため、表スキーマやメトリック定義などを整理した形式を標準化するオープン仕様の「Open Knowledge Format(OKF)」を発表しました。これにより、AI エージェントが散在する情報を統合的に活用できるようになります。
レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法
MarkTechPost は、Docling Parse を使用して PDF ドキュメントの詳細な構造レベルで分析するワークフローの構築方法を解説しています。このチュートリアルでは、安定した Python 環境の準備や Colab の依存関係問題への対処法を説明し、テキストや表、画像を含むカスタム多ページ PDF を生成する方法を示します。その後、Docling Parse で単語や文字、行を抽出して座標情報を取得し、可視化オーバーレイを描画して構造化された JSON や CSV ファイルとして保存する手順を紹介しています。
AI が読みやすい文書へ再フォーマットする提案:5 分で読める記事
著者は、AI が文書をより理解しやすく処理できるよう、すべてのドキュメントを再フォーマットするよう提案している。このアプローチにより、AI との相互作用が改善される可能性がある。
Meta の新「AI モード」が Facebook で公開情報を活用
Meta はFacebook に新機能「AI モード」を導入し、同社プラットフォーム全体から公開された情報を参照して回答を生成する機能を展開した。
Fireworks を活用した 100 倍安価なトレース判定器の構築
LangChain が Fireworks の技術を活用し、従来の 100 分の 1 のコストで動作するトレース判定器を開発したと発表した。
AI 検索を操作する手法が Reddit で容易に実現可能であることを示す研究結果
新しい研究により、ChatGPT や Google の AI 検索などを駆動する AI エージェントは、Reddit などのプラットフォームでわずか 13 語のユーザー投稿を注入されるだけで簡単に操作・汚染可能被ることが明らかになった。
Deep Agents と Bedrock AgentCore を活用した文脈豊かな研究エージェントの構築
AWS は、LLM のコンテキスト制限を克服し、深い分析と戦略的推論を両立させるため、Deep Agents と Bedrock AgentCore を組み合わせた新しいアプローチを発表しました。
Open Knowledge Format の紹介(9 分読了)
LLM とウィキの連携パターンを形式化するオープン仕様の「Open Knowledge Format」が発表されました。この規格はベンダー中立で、AI エージェントや人間に親和性が高く、現代の AI システムに必要なメタデータや文脈、キュレーション済み知識を表現可能です。
カスタムスキル、モデルプロバイダー、コンソールアクセス、ストリーミング API テストを備えた QwenPaw エージェントワークスペースの構築方法
MarkTechPost は、QwenPaw をインストール・初期化し、認証設定や Colab 経由でのモデルプロバイダー接続、カスタムスキルとローカル知識ファイルによる構造化ワークスペース作成、Cloudflare トンネルを介したコンソール公開、ストリーミング API テストを含むエージェント支援ツールの構築手順を解説している。
OpenAI WebRTC オーディオセッション、文書コンテキスト機能を追加
Simon Willison氏が開発したツールが、OpenAI の新モデルに対応し、音声対話時に文書のコンテキストを参照可能になった。
スーパーチャージャー構築:Rocket Close がエージェント型 AI でタイトル業務を最適化する方法
ロケット・カンパニーズ傘下のデトロイト拠点タイトル代理店 Rocket Close は、住宅購入プロセスのボトルネックとなっていた時間のかかる州固有のタイトル調査を、エージェント型 AI を活用することで効率化しました。
Amazon Quick と Cisco Webex MCP サーバーを用いた会議準備・フォローアップ支援アシスタントの構築
AWS は、Amazon Quick と Cisco Webex の MCP サーバーを連携させることで、会議の準備や事後処理を単一の会話型ワークフローで完結させる方法を公開した。これにより、ユーザーは複数のツールを行き来せずとも必要な情報を一元的に取得できる。
Moonshot AI、Kimi K2.6搭載のローカルデスクトップエージェント「Kimi Work」を発表
北京のAI企業Moonshot AIは、ユーザーのPC上で動作するローカル型AIエージェント「Kimi Work」をリリースした。同製品はKimi K2.6モデルを搭載し、300ものサブエージェントからなる群れで構成され、ローカルファイルの閲覧やブラウザ操作、スケジュールタスクの実行を可能にする。
シャオミのオープンソース・エージェント型 AI コーディングハルネス「MiMo Code」が、200 ステップを超える超長尺タスクにおいて Claude Code を上回る
シャオミが開発したオープンソースのターミナルネイティブ AI コーディングアシスタント「MiMo Code V0.1.0」は、独立したサブエージェントによるクロスセッション記憶システムを備え、200 ステップを超える長期的な多段階タスクにおいて Claude Code を上回る性能を示す。
最も賢い AI でも不十分な場合、ベンチリングがエージェントを構築する方法
R&D データプラットフォーム「ベンチリング」の AI 責任者ニコラス・ララスストーン氏が、生命科学分野向けに多モデルアーキテクチャや検証可能なタスク戦略を用いて AI エージェントを構築する複雑さを解説した。
Amazon Bedrock Data Automation のブループリント抽出精度を最適化する方法
AWS は、インボイスや契約書などの非構造化文書からの構造化データ抽出精度を向上させるため、Amazon Bedrock Data Automation の利用方法を解説した。
Xebia:適切なデータ基盤なしでは AI エージェントは失敗する理由
Xebia のグローバル CTO、ニールス・ゼイルメーカー氏は、組織がプロセス加速のために AI エージェントを導入する場合、AI が利用可能な形でデータを整備することから始める必要があると指摘している。
Grok Build に Vercel プラグインが利用可能に
Vercel が Grok Build にプラグインを提供開始し、ファイル編集やターミナルコマンドなどのリアルタイム活動情報を文脈に動的に注入することで、回答を最新のプラットフォーム API や推奨パターンと一致させる機能を追加した。
SmithDB における全文検索:オブジェクトストレージ用の逆インデックス設計
LangChain が SmithDB の性能向上のため、オブジェクトストレージ環境に適した逆インデックスの設計手法を公開しました。
メモリツールが AI モデルの性能を低下させる理由
TechCrunch AI は、AI モデルに実装されたメモリツールの使用が、かえってモデルの精度や信頼性を低下させる可能性について分析している。