メインコンテンツへスキップ

#オブザーバビリティ のAIニュース

16件の記事

OpenTelemetryの宣言的構成仕様が安定性のマイルストーンに到達

OpenTelemetryプロジェクトが、宣言的構成仕様の主要部分が安定ステータスに達したと発表した。このオブザーバビリティフレームワークは、ベンダー中立で言語非依存のテレメトリ収集構成方法を提供する。

InfoQ·4月16日

ワンクリックを超えて:Docker向けエンタープライズグレードの可観測性拡張機能の設計

Docker社の拡張機能は開発者の速度を向上させるが、テレメトリーを分離することで「可視性のギャップ」を生む。エンタープライズのニーズを満たすためには、拡張機能が集中管理プラットフォームへの橋渡しとして機能する必要がある。本記事は、OpenTelemetry、ポリシー・アズ・コード、暗号化を使用して安全なパイプラインを構築する方法を詳細に説明する。

InfoQ·4月14日

Airbnbが大量メトリクスパイプラインをOpenTelemetryに移行

Airbnbの監視エンジニアリングチームが、StatsDと独自のVeneurベースの集計パイプラインから、OpenTelemetry CollectorとVictoriaMetricsのvmagentを基盤とするオープンソースメトリクススタックへの大規模移行を実施し、毎秒1億サンプル以上の処理を実現した。

InfoQ·4月14日

Interrupt 2026を予告:エンタープライズ規模でのエージェント

LangSmithチームが、昨年のInterruptカンファレンスでCiscoやUberなどの企業がエージェントの本番導入の実態を共有し、LangSmith Deploymentの提供や新たな監視ツールの展開を行ったことを報告している。

LangChain Blog·4月10日·★★★★

ADK Go 1.0がリリース!

GoogleがGo言語向けのAgent Development Kit(ADK)1.0を発表し、実験的なAIスクリプトから本番環境対応のサービス開発へ移行を促進。OpenTelemetry統合によるトレーシング機能やプラグインシステムを導入。

Google Developers AI·4月1日·★★★★

Kubernetesの自動スケーリングはベンダーツールを超えた新たな可観測性への焦点を要求

KarpenterなどのKubernetes自動スケーラーの採用が加速する中、プラットフォームに依存しない可観測性の実践が登場し、従来のインフラメトリクスから、プロビジョニング動作、スケジューリング遅延、コスト効率への深い洞察へと焦点が移行している。

InfoQ·3月31日

Airbnb、文化の問題ではなくツールとワークフローのギャップと判明しアラート開発を再構築

Airbnbは、監視アラートの開発と検証方法を見直し、「文化の問題」と思われていた課題が実際にはツールとワークフローのギャップであったと結論付け、観測可能性の実践を大幅に改善したことを明らかにした。

InfoQ·3月27日

Datadog MCPが使えなくても大丈夫!agent-skills × pup でAIによるインシデント調査を実現する

Datadog社が、agent-skillsとpupをGitHub Actionsで実行することで、AIを活用したインシデント調査を実現する方法を紹介している。

CyberAgent Developers Blog·3月23日

QCon London 2026: 大規模テレメトリの管理、セルフホスト型オブザーバビリティガイド

QCon London 2026でColin Douchが、セルフホスト型監視スタックの構築・運用、現行ツールの調査、ログ・メトリクス・トレースを統合したオブザーバビリティ設定の構築方法について議論した。

InfoQ·3月19日

QCon London 2026: オントロジー駆動のオブザーバビリティ:Netflix規模でのエンドツーエンド知識グラフ構築

NetflixのエンジニアであるPrasanna VijayanathanとRenzo Sanchez-Silvaが、Netflixのユーザー体験をモデル化するエンドツーエンド知識グラフの設計と実装について発表した。

InfoQ·3月18日

ClayがLangSmithを使用して月間3億エージェント実行をデバッグ・評価・監視する方法

Clayは、営業チームがターゲット企業リストを作成・拡充・活用する成長向けプラットフォームであり、LangSmithを使用して月間3億回のAIエージェント実行をデバッグ・評価・監視している。

LangChain Blog·3月2日·★★★★

エージェントの挙動は本番環境で初めてわかる

AIエージェントは従来のソフトウェアと異なり、入力が無限で非決定的な挙動を示すため、本番環境での監視・評価・継続的改善が重要である。

LangChain Blog·2月26日·★★★★

New Relicが新AIエージェントプラットフォームとOpenTelemetryツールを発表

New Relicは、企業向けにAIエージェントの作成・管理機能やOpenTelemetryデータ統合を強化した新しい可観測性ツールを提供します。

TechCrunch AI·2月24日·★★★★

DataOpsのループを閉じる:なぜ私たちがDagster+向けにCompassを構築したのか

検出はもはやボトルネックではなく、理解が課題です。CompassはDagster+の運用データを対話に変えることで、このループを閉じます。

Dagster Blog·2月3日·★★★★

Span Linksを用いた分散トレーシングの実装:異なる処理間の関係性を表現する方法

OpenTelemetryのSpan Links機能により、AI Agentアプリケーションの非同期処理間で親子関係を持たずに関連性を追跡する実装方法を解説。Pythonコード例と実践事例を紹介する。

LayerX Tech Blog·12月18日

SRE × Dynatrace - AIを活用した脆弱性対応の効率化 [DeNA インフラ SRE]

DeNAのIT基盤部が、AI機能を駆使したオブザーバビリティプラットフォームDynatraceのPoCを実施し、SREの脆弱性対応業務の効率化を目指している。

DeNA Engineering·12月12日