MOOSEnger -- MOOSEエコシステム向けドメイン特化型AIエージェント
MOOSEngerは、MOOSEシミュレーション環境向けに設計されたドメイン特化型AIエージェントであり、RAGと厳密な構文解析を組み合わせることで、自然言語からの入力生成から実行検証までのワークフローを自動化し、実行成功率を大幅に向上させる。
キーポイント
コア-plus-ドメインアーキテクチャ
再利用可能なエージェント基盤(設定、レジストリ、ツールディスパッチなど)とMOOSE固有のプラグイン(HITベースのパース、構文保存入力、ドメイン特化ユーティリティ)を分離した設計を採用。
入力前処理と修復パイプライン
隠れたフォーマットアーティファクトの除去、有界な文法制約ループによる不正なHIT構造の修正、およびアプリケーション構文レジストリを用いた類似度検索による無効なオブジェクトタイプの解決を行う。
MCPバックエンドによる実行検証
MOOSEランタイムとの連携により、ソルバー診断を反復的な「検証と修正」サイクルに変換し、ローカルフォールバック付きのMCP対応実行バックエンドで入力を検証およびスモークテストする。
ベンチマークにおける顕著な性能差
125プロンプトのベンチマーク(拡散、非定常熱伝導など多様な物理現象を含む)において、MOOSEngerは0.93の実行パス率を達成し、LLM単体のベースライン(0.08)を大幅に上回った。
影響分析・編集コメントを表示
影響分析
この研究は、科学計算やエンジニアリング分野におけるAIエージェントの実用性を示す重要な事例です。特に、LLMの出力を単なるテキスト生成に留めず、厳格なドメイン固有の構文チェックと実行検証ループで補完するアプローチは、AIを専門分野の実務に組み込むための標準的なパターンを示唆しています。これにより、複雑なシミュレーションツールの学習曲線を下げ、アクセシビリティを高める可能性があります。
編集コメント
専門的なシミュレーションツールへのAI統合において、単なる対話機能だけでなく「実行可能な検証」を内蔵したアーキテクチャの重要性が際立っています。
arXiv:2603.04756v1 発表タイプ: 新規
要約: MOOSEngerは、Multiphysics Object-Oriented Simulation Environment (MOOSE) 向けに特化した、ツール連携可能なAIエージェントです。MOOSEのシミュレーション条件はHIT ".i"入力ファイルで指定されますが、膨大なオブジェクトカタログと厳格な構文のため、初期設定とデバッグに時間がかかる課題があります。MOOSEngerは、精選されたドキュメントや事例に対する検索拡張生成 (Retrieval-Augmented Generation, RAG) と、確定的なMOOSE対応の解析、検証、実行ツールを組み合わせることで、自然言語で表された意図を実行可能な入力へと変換する対話型ワークフローを提供します。コアプラスドメインアーキテクチャを採用し、再利用可能なエージェント基盤(設定、レジストリ、ツール配信、検索サービス、永続化、評価)と、HITベースの解析、構文を保持した入力ファイルの取り込み、入力修復・チェック用のドメイン特化ユーティリティを追加するMOOSEプラグインとを分離しています。入力事前チェックパイプラインでは、隠れた書式のアーティファクトを除去し、境界付き文法制約ループにより不正なHIT構造を修正し、アプリケーション構文レジストリに対する類似性検索を通じて無効なオブジェクトタイプを解決します。その後、入力は検証され、必要に応じてMCPバックエンド実行バックエンド(ローカルフォールバック付き)を介してループ内でMOOSEランタイムによるスモークテストが実行され、ソルバーの診断結果が反復的な検証と修正の更新へと変換されます。組み込みの評価機能では、RAGメトリクス(忠実性、関連性、コンテキスト精度/再現率)と、実際の実行に基づくエンドツーエンドの成功率を報告します。拡散、過渡熱伝導、固体力学、多孔質流れ、非圧縮性ナビエ・ストークスにまたがる125のプロンプトから成るベンチマークにおいて、MOOSEngerは0.93の実行成功率を達成し、LLMのみを使用したベースラインの成功率0.08を大幅に上回りました。
原文を表示
arXiv:2603.04756v1 Announce Type: new
Abstract: MOOSEnger is a tool-enabled AI agent tailored to the Multiphysics Object-Oriented Simulation Environment (MOOSE). MOOSE cases are specified in HIT ".i" input files; the large object catalog and strict syntax make initial setup and debugging slow. MOOSEnger offers a conversational workflow that turns natural-language intent into runnable inputs by combining retrieval-augmented generation over curated docs/examples with deterministic, MOOSE-aware parsing, validation, and execution tools. A core-plus-domain architecture separates reusable agent infrastructure (configuration, registries, tool dispatch, retrieval services, persistence, and evaluation) from a MOOSE plugin that adds HIT-based parsing, syntax-preserving ingestion of input files, and domain-specific utilities for input repair and checking. An input precheck pipeline removes hidden formatting artifacts, fixes malformed HIT structure with a bounded grammar-constrained loop, and resolves invalid object types via similarity search over an application syntax registry. Inputs are then validated and optionally smoke-tested with the MOOSE runtime in the loop via an MCP-backed execution backend (with local fallback), translating solver diagnostics into iterative verify-and-correct updates. Built-in evaluation reports RAG metrics (faithfulness, relevancy, context precision/recall) and end-to-end success by actual execution. On a 125-prompt benchmark spanning diffusion, transient heat conduction, solid mechanics, porous flow, and incompressible Navier--Stokes, MOOSEnger achieves a 0.93 execution pass rate versus 0.08 for an LLM-only baseline.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み