#rag のAIニュース
99件の記事
ElasticがAIツール強化とOTelサポートを備えたバージョン9.3.0をリリース
Elasticがバージョン9.3.0を公開し、RAGアプリケーション向けのベクトル検索インデックスとES|QLクエリ言語を強化した。OpenTelemetry統合を深化させ、AIアシスタントの文脈分析を改善し、Kubernetesとサーバーレスアーキテクチャのセキュリティ可視性を拡張した。
症状チェッカーからスマートチャットボットへ:AIが果たすバーチャルケアにおける役割
アンドレ・リベイロ氏が、Healthily社のAI症状チェッカーのアーキテクチャについて説明し、ベイズ推定とRAGモデルが医療的知見と患者の確信ある行動を結びつける方法を解説した。
人間の判断を拡張:DropboxがRAGシステムのラベリング改善にLLMを活用する方法
Dropboxのエンジニアは、自社のAIアシスタント「Dropbox Dash」の応答精度向上のため、人間によるラベリング作業を大規模言語モデル(LLM)で補完する手法を導入した。このアプローチは検索拡張生成(RAG)システムの構築に有用な知見を提供する。
DEIM2026参加レポート
機械学習エンジニアの宇都氏が、2026年2月28日〜3月5日に開催されたDEIM2026(第18回データ工学と情報マネジメントに関するフォーラム)への参加を報告。LayerX社はプラチナスポンサーとして協賛し、企業ブース展示と技術報告に参加した。
QCon AIボストンの初期プログラムは、本番AIの背後にあるエンジニアリング作業に焦点を当てる
QCon AIボストン(6月1-2日)の最初の発表は、コンテキストエンジニアリング、エージェントの説明可能性、基本的なRAGを超えた推論、評価、ガバナンス、現実世界の制約下でAIを確実に実行するためのプラットフォームインフラに焦点を当てている。
CloudflareがAIクローラー向けMarkdown機能とコンテンツシグナルを発表
Cloudflareは、AIクローラーがWebページのMarkdown版を要求できる「Markdown for Agents」機能を導入した。同時に、コンテンツがAIトレーニングや検索インデックスに利用可能かどうかを出版社が宣言できる「Content Signals」機構を提案している。
AI活用スキル向上ワークショップ「Orchestration Development Workshop」記事一覧
LINEヤフーがエンジニア向けにAI活用スキルを実践的に高めるワークショップを開始。開発業務に関わる全エンジニアが対象で、AI技術の実践的応用力向上を目指す取り組み。
Amazon Bedrock AgentCoreとAmazon Bedrock Knowledge Basesを使用したインテリジェントイベントエージェントの構築
Amazon Bedrock AgentCoreを用いて、参加者の好みを記憶し、時間とともにパーソナライズされた体験を構築する生産準備完了のイベントアシスタントを迅速にデプロイする方法を紹介。
ベクターデータベースとAgent SkillsでRAGシステムを構築しよう! - 全開発者向けワークショップ開催レポート
LINEのモバイルデベロッパーエクスペリエンスチームが、ベクターデータベースとAgent Skillsを活用したRAG(Retrieval-Augmented Generation)システム構築のワークショップを開催した。
【2026年2月】AIエージェントのフレームワーク:いつ使う?どれを選ぶ?LangChain?Claude Agent SDK?
AIエージェント開発におけるフレームワーク(LangChain、Claude Agent SDK等)の選択基準と使用タイミングについて、アプリケーションの種類に応じた判断を解説。
Nemotronを使用したRAG向け文書処理パイプラインの構築方法
NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG(検索拡張生成)向け文書処理パイプラインの構築方法を紹介している。
コンテキストエンジニアリングの歴史:RAGの過去から現在をたどる
RAGは2020年に提案され、検索と生成の組み合わせから自己反省機構やグラフ構造、エージェント型へ進化し、現在はコンテキストエンジニアリングの一部として位置づけられている。
スキルでエージェントを構築する:専門作業のためのエージェントの装備
AIエージェント開発企業が、専門作業向けにスキルを備えたAIエージェントを構築する方法を発表した。
AIは法律業界の変革を始めているばかりである
ハーバード法科大学院の学生、ジャスティン・カール氏は、弁護士がAIをどの程度活用しているかについて言及した。調査結果にはばらつきがあるものの、AI導入は法律業界において始まったばかりの段階である。
LLM評価:知っておくべき全知識
Shreya氏と筆者は、700人以上のエンジニアやPMにAI評価を指導する中で得た質問を整理した。これは多くのケースで有効な鋭い意見であり、普遍的真理ではない。読者は自身の判断で活用すべきである。
強化学習によるマルチターンAIエージェントのカスタマイズ
既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。
Salesforce、Slackbot AIエージェントを刷新し、MicrosoftやGoogleと職場AIで競争
SalesforceはSlackbotを単なる通知ツールからAIエージェントに刷新し、MicrosoftやGoogleとの職場AI競争を強化。
3行で始める文章検索 ― txtai入門
txtaiは社内資料や議事録などの固有データを検索できるAIパッケージで、LLMでは扱えない情報へのアクセスを可能にします。
AIエージェントキャッチアップ #62 - Mem0 開催報告
AIエージェントのメモリーレイヤー「Mem0」をテーマにした勉強会を開催。Mem0はAIアシスタントの記憶機能を提供するライブラリで、GitHubや公式ドキュメントが公開されている。
育てるほど楽になるAI開発体制の構築について
複雑なドメインを持つ新規サービス開発で、AI活用による開発生産性向上の仕組みと具体例を紹介。
2025年のトップストーリー!AI大手が人材を引き抜き、推論モデルが性能向上、エージェントがコード記述、データセンターがGDPを牽引、中国が逆転
2025年はAIの急速な進歩が続き、新規参入者を含む誰もがソフトウェア構築の機会を拡大。人材争奪や技術革新が経済に大きな影響を与えている。
「AIが学習しやすいナレッジ基盤」メルカリが全社で導入したNotion Architecture ver1.0
メルカリが全社的にNotion Architecture ver1.0を導入し、AIが学習しやすいナレッジ基盤を構築した取り組みについて紹介しています。
フォワード・デプロイド・エンジニア(FDE)とは?顧客の業務改革を技術でリードするエンジニアの実像
FDEは顧客の現場で技術を活用し、業務改革をリードするエンジニアの役割を解説。AI Shiftのエンジニアが実例を紹介。
Strands + Amazon Bedrock AgentCore + Athenaで簡単データ分析システムを構築する
非エンジニアでも安全にデータ分析できる環境構築の課題を、Strands、Amazon Bedrock AgentCore、Athenaを組み合わせたシステムで解決する方法を紹介。
CocoIndexでナレッジグラフを更新しながらRAGを実施
LayerXの鷹取氏が、従来のNative RAGの構造的弱点を克服するため、CocoIndexを用いてナレッジグラフを更新しながらRAGを実行する手法を紹介している。
Grok コレクション API
xAIは、APIに最先端のRAGシステムを直接組み込んだ「Grok Collections API」を発表した。これにより、ユーザーはAPI経由でコレクション管理と高度な検索機能を利用可能になる。
2種類のS3バケットをナレッジDBとして活用する
AIチームが、ナレッジDBとして2種類のS3バケットを活用し、高コストパフォーマンスを実現する方法について紹介しています。
NotebookLMで技術書を読む:初期理解・深掘り・理解確認のフェーズ設計
株式会社ABEJAの近藤氏が、NotebookLMを技術書の理解に活用する方法を紹介。初期理解フェーズではインフォグラムやスライド資料で全体像を把握し、フェーズ別にNotebookLMの活用を評価する。
月末の「請求書まだですか?」をゼロに。LLM×Slackで構築した、フリーランスに優しい請求書回収アシスタント
LLMを活用したSlackボットで、フリーランスの請求書回収業務を効率化。AIが形式不備をアシストし、管理工数削減とパートナー体験向上を実現した事例。
Amazon Nova Forge:「オープントレーニング」パラダイムで誰もが最先端AIを構築可能に
AmazonはNova Forgeサービスを発表し、顧客が独自データとAmazon Novaのトレーニングデータをモデル開発の各段階で混合できる「オープントレーニング」パラダイムを提供する。これにより、深いドメイン理解を実現しつつ「破滅的忘却」を防止する。
社内AIヘルプデスク RAG精度改善の軌跡 〜自動評価システムの構築とマネージドRAGへの移行〜
DeNAが社内AIヘルプデスクのRAG精度向上に向けて、自動評価システムを構築し、マネージドRAGへの移行を実施した取り組みを紹介している。
AIエージェントを支える技術:コンテキストエンジニアリングの現状
大規模言語モデルを用いたAIエージェント構築に不可欠なコンテキストエンジニアリングについて、2025年時点での知見をまとめた記事。
カールパティのトークナイザー動画から書籍章を作成した方法
著者はSolveItプラットフォームを用い、アンドレイ・カールパティのトークナイザー動画チュートリアルを基に書籍章を作成した。SolveItは小さな検証可能なステップで問題を解決するアプローチであり、最終成果物には実行コードや追加解説が含まれる。
Qwen3 Embedding:基盤モデルによるテキスト埋め込みとリランキングの高度化
QwenチームはQwen3基盤モデルを基盤とした「Qwen3 Embeddingシリーズ」を公開し、テキスト埋め込みとリランキングタスクでSOTA性能を実現した。
Gemmaミートアップ初開催
Googleが開発した軽量オープンソース言語モデルGemmaのコミュニティイベントが初めて開催された。
急速に進化するAI製品のフィールドガイド
著者はコンサルティング経験から、多くのAIチームが複雑なアーキテクチャ構築に注力しすぎていると指摘する。重要なのは技術の詳細ではなく、そのシステムが実際に機能しているかを測定する方法である。
推論LLMの理解
この記事は、推論モデルを構築する4つの主要なアプローチを説明し、LLMに推論能力を付与する方法を解説している。著者は2024年にLLM分野の専門化が進み、RAGからコードアシスタントまで多様な応用が登場したと指摘し、2025年にはこの傾向がさらに加速すると予測している。
LangChainのエージェント機能でMCP(Model Context Protocol)を実装・検証
Anthropic社が発表したAIアシスタントと情報源を接続するプロトコルMCPを、LangChainのエージェント機能で実装・動作検証した事例。
新卒エンジニアの成長記録:マルチモーダルRAGハッカソンへの挑戦
新卒エンジニアが、先輩と共にマルチモーダルRAG技術を活用した3ヶ月間のハッカソン研修に取り組み、実用的なAIアプリケーション開発を通じて成長した経験を共有しています。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。
実務家による大規模言語モデル(LLM)の公開講座
業界のベテラン25人以上が講師を務める「Mastering LLMs」講座を公開した。評価、RAG、ファインチューニングなど実務に即したトピックを扱い、既存の技術をLLMに応用する手法を提供している。
HEROZ ASKのGPT-4o対応について
HEROZ社が提供するAIサービス「HEROZ ASK」がGPT-4oに対応し、RAG(Retrieval-Augmented Generation)機能を強化した。GPT-4oはテキスト性能や日本語RAGの精度が向上し、AIアシスタント作成に活用できる。
埋め込みモデル
Ollamaが埋め込みモデルを提供し、検索や検索拡張生成(RAG)アプリケーションで使用するベクトル埋め込みの生成を容易にした。
RAGとMulti Query Retriever:社内ナレッジ検索の精度向上における鍵
HEROZ ASK開発チームは、LLMのハルシネーション問題を解決するため、RAGとMulti Query Retrieverを組み合わせることで社内ナレッジ検索の精度向上を実現したと発表した。
ファインチューニングは依然として価値があるか?
ハメル・フサイン氏は、ファインチューニングへの失望の声が増える中、多くの状況で依然として非常に価値があるとの見解を示した。
テキスト埋め込みはテキストを完璧にエンコードするか?
Vec2textは埋め込みを正確にテキストに戻す技術で、埋め込みデータのセキュリティ見直しの必要性を示唆。
GPT連携アプリ開発の必須知識、RAGをゼロから解説する。概要&Pythonコード例
著者のわいけいは、生成AIアプリ開発で低予算で使えるRAG(Retrieval-Augmented Generation)技術を、自然言語処理の観点から解説し、Pythonコード例を交えて実装知見を共有する。
クライアントサイド技術でLLM搭載Webアプリを構築する
オープンソースのローカルソフトウェアを使用し、LangChainの人気ユースケースであるRAG(文書検索拡張生成)を実装し、文書との対話を可能にする方法を紹介。
LLM搭載の自律型エージェント
大規模言語モデル(LLM)を中核コントローラーとする自律型エージェントの構築は、AutoGPTやBabyAGIなどの概念実証デモにより示唆されるように、単なるコンテンツ生成を超えた可能性を秘めている。