#rag のAIニュース

99件の記事

ElasticがAIツール強化とOTelサポートを備えたバージョン9.3.0をリリース

Elasticがバージョン9.3.0を公開し、RAGアプリケーション向けのベクトル検索インデックスとES|QLクエリ言語を強化した。OpenTelemetry統合を深化させ、AIアシスタントの文脈分析を改善し、Kubernetesとサーバーレスアーキテクチャのセキュリティ可視性を拡張した。

InfoQ·3月15日

症状チェッカーからスマートチャットボットへ：AIが果たすバーチャルケアにおける役割

アンドレ・リベイロ氏が、Healthily社のAI症状チェッカーのアーキテクチャについて説明し、ベイズ推定とRAGモデルが医療的知見と患者の確信ある行動を結びつける方法を解説した。

InfoQ·3月11日

人間の判断を拡張：DropboxがRAGシステムのラベリング改善にLLMを活用する方法

Dropboxのエンジニアは、自社のAIアシスタント「Dropbox Dash」の応答精度向上のため、人間によるラベリング作業を大規模言語モデル（LLM）で補完する手法を導入した。このアプローチは検索拡張生成（RAG）システムの構築に有用な知見を提供する。

InfoQ·3月8日

DEIM2026参加レポート

機械学習エンジニアの宇都氏が、2026年2月28日〜3月5日に開催されたDEIM2026（第18回データ工学と情報マネジメントに関するフォーラム）への参加を報告。LayerX社はプラチナスポンサーとして協賛し、企業ブース展示と技術報告に参加した。

LayerX Tech Blog·3月6日

QCon AIボストンの初期プログラムは、本番AIの背後にあるエンジニアリング作業に焦点を当てる

QCon AIボストン（6月1-2日）の最初の発表は、コンテキストエンジニアリング、エージェントの説明可能性、基本的なRAGを超えた推論、評価、ガバナンス、現実世界の制約下でAIを確実に実行するためのプラットフォームインフラに焦点を当てている。

InfoQ·3月5日·★★★★

CloudflareがAIクローラー向けMarkdown機能とコンテンツシグナルを発表

Cloudflareは、AIクローラーがWebページのMarkdown版を要求できる「Markdown for Agents」機能を導入した。同時に、コンテンツがAIトレーニングや検索インデックスに利用可能かどうかを出版社が宣言できる「Content Signals」機構を提案している。

InfoQ·3月5日·★★★★

AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧

LINEヤフーがエンジニア向けにAI活用スキルを実践的に高めるワークショップを開始。開発業務に関わる全エンジニアが対象で、AI技術の実践的応用力向上を目指す取り組み。

LY Corp Tech Blog·2月26日·★★★★

Amazon Bedrock AgentCoreとAmazon Bedrock Knowledge Basesを使用したインテリジェントイベントエージェントの構築

Amazon Bedrock AgentCoreを用いて、参加者の好みを記憶し、時間とともにパーソナライズされた体験を構築する生産準備完了のイベントアシスタントを迅速にデプロイする方法を紹介。

AWS Machine Learning Blog·2月26日·★★★★

ベクターデータベースとAgent SkillsでRAGシステムを構築しよう！ - 全開発者向けワークショップ開催レポート

LINEのモバイルデベロッパーエクスペリエンスチームが、ベクターデータベースとAgent Skillsを活用したRAG（Retrieval-Augmented Generation）システム構築のワークショップを開催した。

LY Corp Tech Blog·2月12日

【2026年2月】AIエージェントのフレームワーク：いつ使う？どれを選ぶ？LangChain？Claude Agent SDK？

AIエージェント開発におけるフレームワーク（LangChain、Claude Agent SDK等）の選択基準と使用タイミングについて、アプリケーションの種類に応じた判断を解説。

Generative Agents·2月5日

Nemotronを使用したRAG向け文書処理パイプラインの構築方法

NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG（検索拡張生成）向け文書処理パイプラインの構築方法を紹介している。

NVIDIA Developer Blog·2月5日·★★★★

コンテキストエンジニアリングの歴史：RAGの過去から現在をたどる

RAGは2020年に提案され、検索と生成の組み合わせから自己反省機構やグラフ構造、エージェント型へ進化し、現在はコンテキストエンジニアリングの一部として位置づけられている。

Algomatic Tech Blog·1月28日·★★★★

スキルでエージェントを構築する：専門作業のためのエージェントの装備

AIエージェント開発企業が、専門作業向けにスキルを備えたAIエージェントを構築する方法を発表した。

Claude Blog·1月22日·★★★★

AIは法律業界の変革を始めているばかりである

ハーバード法科大学院の学生、ジャスティン・カール氏は、弁護士がAIをどの程度活用しているかについて言及した。調査結果にはばらつきがあるものの、AI導入は法律業界において始まったばかりの段階である。

Understanding AI·1月16日·★★★★

LLM評価：知っておくべき全知識

Shreya氏と筆者は、700人以上のエンジニアやPMにAI評価を指導する中で得た質問を整理した。これは多くのケースで有効な鋭い意見であり、普遍的真理ではない。読者は自身の判断で活用すべきである。

Hamel Husain·1月15日·★★★★

強化学習によるマルチターンAIエージェントのカスタマイズ

既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。

Amazon Science·1月14日·★★★★

Salesforce、Slackbot AIエージェントを刷新し、MicrosoftやGoogleと職場AIで競争

SalesforceはSlackbotを単なる通知ツールからAIエージェントに刷新し、MicrosoftやGoogleとの職場AI競争を強化。

VentureBeat AI·1月13日·★★★★

3行で始める文章検索 ― txtai入門

txtaiは社内資料や議事録などの固有データを検索できるAIパッケージで、LLMでは扱えない情報へのアクセスを可能にします。

AI Shift Tech Blog·1月7日

AIエージェントキャッチアップ #62 - Mem0 開催報告

AIエージェントのメモリーレイヤー「Mem0」をテーマにした勉強会を開催。Mem0はAIアシスタントの記憶機能を提供するライブラリで、GitHubや公式ドキュメントが公開されている。

Generative Agents·1月7日·★★★★

育てるほど楽になるAI開発体制の構築について

複雑なドメインを持つ新規サービス開発で、AI活用による開発生産性向上の仕組みと具体例を紹介。

DeNA Engineering·1月6日·★★★★

2025年のトップストーリー！AI大手が人材を引き抜き、推論モデルが性能向上、エージェントがコード記述、データセンターがGDPを牽引、中国が逆転

2025年はAIの急速な進歩が続き、新規参入者を含む誰もがソフトウェア構築の機会を拡大。人材争奪や技術革新が経済に大きな影響を与えている。

The Batch·12月26日

「AIが学習しやすいナレッジ基盤」メルカリが全社で導入したNotion Architecture ver1.0

メルカリが全社的にNotion Architecture ver1.0を導入し、AIが学習しやすいナレッジ基盤を構築した取り組みについて紹介しています。

Mercari Engineering·12月24日·★★★★

フォワード・デプロイド・エンジニア（FDE）とは？顧客の業務改革を技術でリードするエンジニアの実像

FDEは顧客の現場で技術を活用し、業務改革をリードするエンジニアの役割を解説。AI Shiftのエンジニアが実例を紹介。

AI Shift Tech Blog·12月24日·★★★★

Strands + Amazon Bedrock AgentCore + Athenaで簡単データ分析システムを構築する

非エンジニアでも安全にデータ分析できる環境構築の課題を、Strands、Amazon Bedrock AgentCore、Athenaを組み合わせたシステムで解決する方法を紹介。

ABEJA Tech Blog·12月24日·★★★★

CocoIndexでナレッジグラフを更新しながらRAGを実施

LayerXの鷹取氏が、従来のNative RAGの構造的弱点を克服するため、CocoIndexを用いてナレッジグラフを更新しながらRAGを実行する手法を紹介している。

LayerX Tech Blog·12月22日

Grok コレクション API

xAIは、APIに最先端のRAGシステムを直接組み込んだ「Grok Collections API」を発表した。これにより、ユーザーはAPI経由でコレクション管理と高度な検索機能を利用可能になる。

xAI News·12月22日

2種類のS3バケットをナレッジDBとして活用する

AIチームが、ナレッジDBとして2種類のS3バケットを活用し、高コストパフォーマンスを実現する方法について紹介しています。

AI Shift Tech Blog·12月17日·★★★★

NotebookLMで技術書を読む：初期理解・深掘り・理解確認のフェーズ設計

株式会社ABEJAの近藤氏が、NotebookLMを技術書の理解に活用する方法を紹介。初期理解フェーズではインフォグラムやスライド資料で全体像を把握し、フェーズ別にNotebookLMの活用を評価する。

ABEJA Tech Blog·12月16日

月末の「請求書まだですか？」をゼロに。LLM×Slackで構築した、フリーランスに優しい請求書回収アシスタント

LLMを活用したSlackボットで、フリーランスの請求書回収業務を効率化。AIが形式不備をアシストし、管理工数削減とパートナー体験向上を実現した事例。

Algomatic Tech Blog·12月16日

Amazon Nova Forge：「オープントレーニング」パラダイムで誰もが最先端AIを構築可能に

AmazonはNova Forgeサービスを発表し、顧客が独自データとAmazon Novaのトレーニングデータをモデル開発の各段階で混合できる「オープントレーニング」パラダイムを提供する。これにより、深いドメイン理解を実現しつつ「破滅的忘却」を防止する。

Amazon Science·12月9日·★★★★

社内AIヘルプデスク RAG精度改善の軌跡〜自動評価システムの構築とマネージドRAGへの移行〜

DeNAが社内AIヘルプデスクのRAG精度向上に向けて、自動評価システムを構築し、マネージドRAGへの移行を実施した取り組みを紹介している。

DeNA Engineering·11月27日·★★★★

AIエージェントを支える技術：コンテキストエンジニアリングの現状

大規模言語モデルを用いたAIエージェント構築に不可欠なコンテキストエンジニアリングについて、2025年時点での知見をまとめた記事。

Algomatic Tech Blog·10月15日·★★★★

カールパティのトークナイザー動画から書籍章を作成した方法

著者はSolveItプラットフォームを用い、アンドレイ・カールパティのトークナイザー動画チュートリアルを基に書籍章を作成した。SolveItは小さな検証可能なステップで問題を解決するアプローチであり、最終成果物には実行コードや追加解説が含まれる。

Answer.AI·10月13日·★★★★

Qwen3 Embedding：基盤モデルによるテキスト埋め込みとリランキングの高度化

QwenチームはQwen3基盤モデルを基盤とした「Qwen3 Embeddingシリーズ」を公開し、テキスト埋め込みとリランキングタスクでSOTA性能を実現した。

Qwen Blog·6月5日·★★★★

Gemmaミートアップ初開催

Googleが開発した軽量オープンソース言語モデルGemmaのコミュニティイベントが初めて開催された。

Google Developers JP·4月7日·★★★★

急速に進化するAI製品のフィールドガイド

著者はコンサルティング経験から、多くのAIチームが複雑なアーキテクチャ構築に注力しすぎていると指摘する。重要なのは技術の詳細ではなく、そのシステムが実際に機能しているかを測定する方法である。

Hamel Husain·3月24日·★★★★

推論LLMの理解

この記事は、推論モデルを構築する4つの主要なアプローチを説明し、LLMに推論能力を付与する方法を解説している。著者は2024年にLLM分野の専門化が進み、RAGからコードアシスタントまで多様な応用が登場したと指摘し、2025年にはこの傾向がさらに加速すると予測している。

Sebastian Raschka·2月5日

LangChainのエージェント機能でMCP(Model Context Protocol)を実装・検証

Anthropic社が発表したAIアシスタントと情報源を接続するプロトコルMCPを、LangChainのエージェント機能で実装・動作検証した事例。

HEROZ Tech Blog·1月6日·★★★★

新卒エンジニアの成長記録：マルチモーダルRAGハッカソンへの挑戦

新卒エンジニアが、先輩と共にマルチモーダルRAG技術を活用した3ヶ月間のハッカソン研修に取り組み、実用的なAIアプリケーション開発を通じて成長した経験を共有しています。

ExaWizards Tech Blog·11月1日

文脈に応じた検索機能の導入

OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。

Anthropic Engineering·9月19日·★★★★

実務家による大規模言語モデル（LLM）の公開講座

業界のベテラン25人以上が講師を務める「Mastering LLMs」講座を公開した。評価、RAG、ファインチューニングなど実務に即したトピックを扱い、既存の技術をLLMに応用する手法を提供している。

Hamel Husain·7月29日·★★★★

HEROZ ASKのGPT-4o対応について

HEROZ社が提供するAIサービス「HEROZ ASK」がGPT-4oに対応し、RAG（Retrieval-Augmented Generation）機能を強化した。GPT-4oはテキスト性能や日本語RAGの精度が向上し、AIアシスタント作成に活用できる。

HEROZ Tech Blog·6月6日

埋め込みモデル

Ollamaが埋め込みモデルを提供し、検索や検索拡張生成（RAG）アプリケーションで使用するベクトル埋め込みの生成を容易にした。

Ollama Blog·4月8日

RAGとMulti Query Retriever：社内ナレッジ検索の精度向上における鍵

HEROZ ASK開発チームは、LLMのハルシネーション問題を解決するため、RAGとMulti Query Retrieverを組み合わせることで社内ナレッジ検索の精度向上を実現したと発表した。

HEROZ Tech Blog·3月29日

ファインチューニングは依然として価値があるか？

ハメル・フサイン氏は、ファインチューニングへの失望の声が増える中、多くの状況で依然として非常に価値があるとの見解を示した。

Hamel Husain·3月27日·★★★★

テキスト埋め込みはテキストを完璧にエンコードするか？

Vec2textは埋め込みを正確にテキストに戻す技術で、埋め込みデータのセキュリティ見直しの必要性を示唆。

The Gradient·3月6日·★★★★

GPT連携アプリ開発の必須知識、RAGをゼロから解説する。概要＆Pythonコード例

著者のわいけいは、生成AIアプリ開発で低予算で使えるRAG（Retrieval-Augmented Generation）技術を、自然言語処理の観点から解説し、Pythonコード例を交えて実装知見を共有する。

Spiral.AI Tech Blog·2月10日

クライアントサイド技術でLLM搭載Webアプリを構築する

オープンソースのローカルソフトウェアを使用し、LangChainの人気ユースケースであるRAG（文書検索拡張生成）を実装し、文書との対話を可能にする方法を紹介。

Ollama Blog·10月13日·★★★★

LLM搭載の自律型エージェント

大規模言語モデル（LLM）を中核コントローラーとする自律型エージェントの構築は、AutoGPTやBabyAGIなどの概念実証デモにより示唆されるように、単なるコンテンツ生成を超えた可能性を秘めている。

Lilian Weng·6月23日·★★★★

← 前へ2 / 2