#rag のAIニュース

192件の記事

抽象化と具体性のバランスを取る調和型メモリ表現「Memora」の発表

Microsoft Research は、長期かつ複雑なタスクを処理する AI エージェントが過去の対話を効率的に保持・アクセスするための新しいスケーラブルなメモリシステム「Memora」を発表した。

Microsoft Research·6月30日·★★★★

AI エキスパートに聞く：フルスタックとは何か

Google AI Blog は、AI エキスパートへのインタビューを通じて、技術分野における「フルスタック」の正確な定義と範囲について解説している。

Google AI Blog·6月30日

RAG パイプラインは役に立たない可能性が高い。より良い代替案とは

KDnuggets は、従来の RAG（検索拡張生成）パイプラインが多くの場合無効であるとし、その課題を解決する新たな代替アプローチを紹介している。

KDnuggets·6月29日·★★★★

EverMind が公開したオープンソースの Markdown フォーカス型エージェントメモリランタイム「EverOS」を紹介

AI エージェント開発者向けに、EverMind が Apache 2.0 ライセンスで「EverOS」というオープンソースのメモリランタイムを公開しました。これは大規模言語モデルが状態を持たないという課題に対し、ベクトルデータベースに依存せず、Markdown ファイルを事実源として記憶を保存・編集・検索する仕組みを提供します。

MarkTechPost·6月29日·★★★★

ウィンブルドン、ライブ試合中継にIBMのAIツールを追加

全イングランド・ローンテニスクラブは、IBMとの協力により、ウィンブルドンのデジタルプラットフォームにAI機能を実装した。新機能としてチャットアシスタントと「キーモーメント」がアプリや公式サイトで提供される。

AI News·6月29日·★★★★

AI エンジニア・開発者向けの主要なノーコードツール 6 つ

MarkTechPost は、コーディング知識がなくても RAG システムやマルチエージェントワークフローを構築できる AI エンジニア向けノーコードツール 6 つを紹介し、開発時間の短縮と効率化を可能にするプラットフォームを解説している。

MarkTechPost·6月29日·★★★★

Pinecone のテストデータ生成方法について

Pinecone が提供するドキュメントにおいて、同社のベクトルデータベースを効果的に検証・評価するためのテストデータの作成手法が解説されています。

Pinecone·6月29日

Google、NotebookLM でノートブックコレクションのテストを開始

Google が AI ノートブックツール「NotebookLM」において、複数のノートブックを整理・管理する機能である「コレクション」のテストを実施している。

TLDR AI·6月29日

Qwen Image Agent（12 分読み）

アリババ傘下の通義千問チームが、計画・推論・検索・記憶・フィードバックを活用して画像生成の精度を向上させた Qwen-Image-Agent を発表し、評価指標 IA-Bench も導入した。

TLDR AI·6月29日·★★★★

Deep Agents との連携によるプロンプトキャッシング

LangChain が、Deep Agents を活用してプロンプトキャッシングを実現する機能を公開した。これにより、推論コストとレイテンシを削減できる。

LangChain Blog·6月27日·★★★★

Amazon S3 から PDF テキストを抽出するインタラクティブな仕組みの構築

AWS は、監査や契約確認など即時対応が必要なケース向けに、Amazon S3 に保存された PDF ファイルからオンデマンドでテキストを抽出するサーバー構築方法を公開した。

AWS Machine Learning Blog·6月26日

AWS で現代的なデータメッシュ戦略を用いたエージェント型 AI アプリケーションの構築

AWS は、顧客サービスエージェントが自律的にデータベースを照会し回答を合成する際、組織内の複数のデータソースにまたがるガバナンスアクセスが必要であると指摘。現代のデータメッシュでは、データ相互作用チェーンの各層で厳密なアクセス制御を適用することが重要であるとしている。

AWS Machine Learning Blog·6月26日·★★★★

SmithDB の全文検索用逆インデックス構築の仕組み

LangChain チームが、SmithDB で高速な全文検索を実現するために採用した逆インデックスの設計手法と実装プロセスを解説している。

LangChain Blog·6月26日

2026 年に AI エンジニアになるためのロードマップ

KDnuggets が、2026 年までに AI エンジニアとして活躍するための学習ロードマップを提示している。

KDnuggets·6月25日

Vercel でエージェントに製品デザインを教える

Vercel は、コーディングエージェントが既存のスタイルやパターンを模倣する能力は高いものの、その背景にある設計思想や文脈を理解できない課題を指摘し、コードベース外の知識をどう学習させるかについて議論している。

Vercel Blog·6月25日·★★★★

AI エージェントに記憶機能を実装する方法

LangChain が、AI エージェントに長期・短期の記憶機能を組み込むための具体的な手法とアーキテクチャを解説している。

LangChain Blog·6月25日·★★★★

Nous Research、Hermes エージェントのスキルシステムに「/learn」機能を追加、手書きなしでワークフローをスラッシュコマンドとして記録可能に

Nous Research はオープンソースの自己改善型エージェント「Hermes Agent」のスキルシステムを拡張し、「/learn」という新コマンドを追加した。これにより、ユーザーはドキュメントやコードなどの資料を指定するだけで、エージェントが自動的に再利用可能なスキル定義ファイル（SKILL.md）を作成できるようになった。

MarkTechPost·6月24日·★★★★

間接プロンプトインジェクションに関する洞察（12 分読了）

TLDR AI が、AI モデルが外部データから悪意ある指示を誤って受け取る「間接プロンプトインジェクション」の仕組みと対策について解説した。

TLDR AI·6月24日·★★★★

Mistral OCR 4：文書知能のための最先端 OCR ツール（9 分読了）

Mistral は、170 か国語に対応し、エンタープライズ検索や構造化データパイプラインに統合可能な文書知能ツール「OCR 4」をリリースした。同ツールは単一コンテナで展開可能であり、低リソース言語を含む高精度な抽出と他システムより 4 倍の高速処理を実現している。

TLDR AI·6月24日·★★★★

Mistral OCR 4 が引用対応の構造化出力を RAG、エージェント型、企業検索パイプラインに提供

Mistral AI は最新ドキュメント理解モデル「OCR 4」を発表し、抽出テキストに境界ボックスやブロック分類、信頼度スコアを追加した。このモデルは 170 か国語に対応し、自己完結型デプロイが可能で、企業検索や RAG パイプラインの ingestion コンポーネントとして機能する。

MarkTechPost·6月24日·★★★★

Anthropic の Claude Tag が、Slack のメッセージを一つずつ学習して企業情報を習得中

AI 企業 Anthropic は、チャットツール Slack でやり取りされるメッセージを逐次学習させる機能「Claude Tag」を開発し、企業の独自知識を自動的に蓄積・活用する仕組みを提供している。

TechCrunch AI·6月24日·★★★★

AI エンジニア向け技術ガイド：エージェントの記憶には 7 つのタイプがある

MarkTechPost は、デフォルトで状態を持たない大規模言語モデルを、継続的な学習と行動が可能なシステムに変えるための「エージェント記憶」の重要性を解説し、その実装に必要な 7 つの記憶タイプを技術的に紹介している。

MarkTechPost·6月22日·★★★★

Liquid AI、11言語対応の高速多言語検索向け新モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を発表

Liquid AI は、11言語間の高速な多言語・異言語検索を実現する新たな取得モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を公開した。両モデルはパラメータ数 3.5 億で、LFM ファミリー初の双方向型であり、Hugging Face で利用可能となった。

MarkTechPost·6月19日·★★★★

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。

Allen AI (AI2)·6月18日·★★★★

Amazon Quick の自律型エージェントで毎日数時間を節約

AWS は、Amazon Quick という AI アシスタントが背景で動作し、業務の自動化や会議準備などを代行することで、ユーザーが重要な優先事項に集中できる機能を発表した。

AWS Machine Learning Blog·6月18日·★★★★

大規模なデータと AI エージェントのための文脈知能

AWS は、AI エージェントがデータレイクやデータベースなど散在する情報源を統合し、大規模に推論できる「文脈知能」機能を発表した。これによりエージェントの判断精度向上を目指す。

AWS Machine Learning Blog·6月18日·★★★★

Amazon Bedrock AgentCore の新機能：広範な知識と継続的学習を備えたエージェント構築が可能に

AWS は Amazon Bedrock AgentCore に新機能を追加し、 SharePoint などの外部ドキュメントへのアクセスやフィードバックの活用を通じて、エージェントが本来持つ能力を発揮できるようにした。これにより、顧客対応や研究支援などにおいて、より高度な推論と計画が可能となる。

AWS Machine Learning Blog·6月18日·★★★★

エージェント型リソース発見：エージェントが検索できるようにする

Hugging Face は、AI エージェントが自律的に必要なリソースを検索・発見できる新機能「Agentic Resource Discovery」を発表した。これにより、エージェントの自律的なタスク遂行能力が向上する。

Hugging Face Blog·6月17日·★★★★

LangSmith ベンチマークの共有について

LangChain が開発した LangSmith のベンチマーク結果を公開し、AI アプリケーションの評価基準に関する情報を提供しました。

LangChain Blog·6月17日

2026 年に LLM エンジニアになるためのロードマップ

KDnuggets が、2026 年までに大規模言語モデルエンジニアとして活躍するための学習経路と必要なスキルを提示した。

KDnuggets·6月16日·★★★★

Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format（OKF）」を発表

Google Cloud は、LLM の知識不足という課題に対処するため、表スキーマやメトリック定義などを整理した形式を標準化するオープン仕様の「Open Knowledge Format（OKF）」を発表しました。これにより、AI エージェントが散在する情報を統合的に活用できるようになります。

MarkTechPost·6月16日·★★★★

レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法

MarkTechPost は、Docling Parse を使用して PDF ドキュメントの詳細な構造レベルで分析するワークフローの構築方法を解説しています。このチュートリアルでは、安定した Python 環境の準備や Colab の依存関係問題への対処法を説明し、テキストや表、画像を含むカスタム多ページ PDF を生成する方法を示します。その後、Docling Parse で単語や文字、行を抽出して座標情報を取得し、可視化オーバーレイを描画して構造化された JSON や CSV ファイルとして保存する手順を紹介しています。

MarkTechPost·6月16日

1 / 4次へ →

#rag のAIニュース

抽象化と具体性のバランスを取る調和型メモリ表現「Memora」の発表

AI エキスパートに聞く：フルスタックとは何か

RAG パイプラインは役に立たない可能性が高い。より良い代替案とは

EverMind が公開したオープンソースの Markdown フォーカス型エージェントメモリランタイム「EverOS」を紹介

ウィンブルドン、ライブ試合中継にIBMのAIツールを追加

AI エンジニア・開発者向けの主要なノーコードツール 6 つ

Pinecone のテストデータ生成方法について

Google、NotebookLM でノートブックコレクションのテストを開始

Qwen Image Agent（12 分読み）

Deep Agents との連携によるプロンプトキャッシング

Amazon S3 から PDF テキストを抽出するインタラクティブな仕組みの構築

AWS で現代的なデータメッシュ戦略を用いたエージェント型 AI アプリケーションの構築

SmithDB の全文検索用逆インデックス構築の仕組み

2026 年に AI エンジニアになるためのロードマップ

Vercel でエージェントに製品デザインを教える

AI エージェントに記憶機能を実装する方法

Nous Research、Hermes エージェントのスキルシステムに「/learn」機能を追加、手書きなしでワークフローをスラッシュコマンドとして記録可能に

間接プロンプトインジェクションに関する洞察（12 分読了）

Mistral OCR 4：文書知能のための最先端 OCR ツール（9 分読了）

Mistral OCR 4 が引用対応の構造化出力を RAG、エージェント型、企業検索パイプラインに提供

Anthropic の Claude Tag が、Slack のメッセージを一つずつ学習して企業情報を習得中

AI エンジニア向け技術ガイド：エージェントの記憶には 7 つのタイプがある

Liquid AI、11言語対応の高速多言語検索向け新モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を発表

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Amazon Quick の自律型エージェントで毎日数時間を節約

大規模なデータと AI エージェントのための文脈知能

Amazon Bedrock AgentCore の新機能：広範な知識と継続的学習を備えたエージェント構築が可能に

エージェント型リソース発見：エージェントが検索できるようにする

LangSmith ベンチマークの共有について

2026 年に LLM エンジニアになるためのロードマップ

Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format（OKF）」を発表

レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法

AI が読みやすい文書へ再フォーマットする提案：5 分で読める記事

Meta の新「AI モード」が Facebook で公開情報を活用

Fireworks を活用した 100 倍安価なトレース判定器の構築

AI 検索を操作する手法が Reddit で容易に実現可能であることを示す研究結果

Deep Agents と Bedrock AgentCore を活用した文脈豊かな研究エージェントの構築

Open Knowledge Format の紹介（9 分読了）

カスタムスキル、モデルプロバイダー、コンソールアクセス、ストリーミング API テストを備えた QwenPaw エージェントワークスペースの構築方法

OpenAI WebRTC オーディオセッション、文書コンテキスト機能を追加

スーパーチャージャー構築：Rocket Close がエージェント型 AI でタイトル業務を最適化する方法

Amazon Quick と Cisco Webex MCP サーバーを用いた会議準備・フォローアップ支援アシスタントの構築

Moonshot AI、Kimi K2.6搭載のローカルデスクトップエージェント「Kimi Work」を発表

シャオミのオープンソース・エージェント型 AI コーディングハルネス「MiMo Code」が、200 ステップを超える超長尺タスクにおいて Claude Code を上回る

最も賢い AI でも不十分な場合、ベンチリングがエージェントを構築する方法

Amazon Bedrock Data Automation のブループリント抽出精度を最適化する方法

Xebia：適切なデータ基盤なしでは AI エージェントは失敗する理由

Grok Build に Vercel プラグインが利用可能に

SmithDB における全文検索：オブジェクトストレージ用の逆インデックス設計

メモリツールが AI モデルの性能を低下させる理由