AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
NVIDIA Developer Blog·2026年5月30日 01:00·約11分で読める

NVIDIA MCG ツールキットを用いた AI モデル文書作成の自動化方法

#EU AI Act#Model Cards#RAG#NVIDIA NIM#Regulatory Compliance
TL;DR

NVIDIA は、複雑化するAIモデルと強化される規制に対応するため、ソースコードから自動的にモデルカードを生成する「MCG ツールキット」を発表した。

AI深層分析2026年6月13日 00:12
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
5
革新性10%
3

キーポイント

1

規制対応とドキュメンテーションの課題

カリフォルニア州のAB-2013やEU AI法などの規制強化により、AIモデルの透明性と監査可能性が求められており、手動でのドキュメント作成は遅延や不整合のリスクがある。

2

NVIDIA MCG ツールキットの概要

コンテナ化されたパイプラインとして機能し、GitHubやGitLabなどのソースコードからモデルカード(Model Card++形式)を1分未満で自動生成する。

3

自動化パイプラインの仕組み

入力→インジェスト→抽出→レンダリングというモジュール構成を採用し、NVIDIA Inference Microservices (NIM) を活用したRAG(検索拡張生成)技術でメタデータを抽出する。

4

多様な入力と統合機能

URLやファイル(ZIP, PDF, DOCXなど)からの入力をサポートし、対話型UIだけでなくREST APIによるプログラムmaticな統合も可能である。

5

RAG パイプラインによる高精度な情報抽出

NVIDIA Nemotron RAG を用いてコード、設定ファイル、ドキュメントを分別し、GPT-OSS-120B が専門家のガイドラインに従って構造化された情報を生成します。

6

自動生成された 4 つのサブカード

概要情報の抽出後、バイアス、説明可能性、プライバシー、セキュリティという 4 つの重要な側面をカバーするモデルカードのサブセクションが自動的に作成されます。

7

柔軟なレンダリングと編集機能

生成された構造化 JSON をテンプレートに基づいて人間 readable な Markdown に変換でき、公開前にインターフェースで内容を直接編集して再レンダリングできます。

影響分析・編集コメントを表示

影響分析

このツールは、AI開発チームが直面している「規制遵守」と「開発スピード」のジレンマを解決する実用的な手段を提供し、業界全体のモデル透明性基準を底上げする可能性が高い。特に大規模モデルや企業向けAIシステムにおいて、監査対応コストを劇的に削減し、信頼性の高いAI展開を加速させるインフラとして機能すると期待される。

編集コメント

規制強化が現実味を帯びる中、ドキュメント作成という地味だが重要な工程を自動化するツールは、開発現場の即戦力となるでしょう。NIMを活用したRAGアプローチは、技術的な信頼性も高く注目すべき動きです。

AI モデルの複雑さが増し、カリフォルニア州 AB-2013 や EU AI 法(EU Artificial Intelligence Act)などの枠組みの下で規制監督が強化される中、ソフトウェアチームは優れたコードを提供することを超えた課題に直面しています。モデルリリース前に包括的で監査可能なモデルドキュメントを生成する必要があるのです。

モデルカード(Model Card)は、モデルの動作方法、意図された用途とライセンス、トレーニングデータ、パフォーマンス、制限事項などを記述します。これらは透明性と説明責任を促進し、下流のユーザーである顧客、規制当局、影響を受けるコミュニティが AI を選択・導入する際に情報に基づいた判断を下せるようにします。この対象者は開発者だけではありません。政策立案者、調達チーム、リスク評価担当者が、モデルの使用適合性を評価し、ベンダー間でモデルを比較するためにモデルカードを利用しています。

実際には、手動でモデルカードを作成するのは退屈で時間がかかります。ドキュメントは開発に遅れがちで、メタデータ(metadata)は出荷時点ですでに古くなっていることがよくあります。モデルがより複雑になるにつれて、フォーマットの不整合や必須項目の欠落が不要な監査リスクを生み、採用を妨げています。NVIDIA のモデルカードジェネレーター(MCG)ツールキットは、ソースデータから直接読み取ることで、1 分未満で Model Card++ フォーマットのモデルドキュメントを自動化・標準化します。

NVIDIA MCG ツールキットの紹介

MCG ツールキットは、モデルソースコードを読み込んでモデルカードを自動生成するコンテナ化されたパイプラインです。これはモジュール型の「取り込み→抽出→レンダリング」パイプラインに従います。中央のオーケストレーターが、URL またはアップロードされたファイルというリクエストを受け取り、ワークフローを調整して完全なモデルカードを返します。各ステージは別々のサービスとして実行されるため、パイプライン全体に影響を与えることなく、個々のコンポーネントを更新または交換することができます。

MCG ツールキットの仕組み

ツールキットは、URL(GitHub、GitLab、HuggingFace、または任意のパブリック Web ページ)またはアップロードされたファイル(ZIP、PDF、DOCX、Markdown)を受け付ける対話型 UI を公開しています。また、プログラムによる統合のための REST API も利用可能です。

ここからデータは 3 つのステージを流れます:

  • 入力→取り込み。システムがコンテンツを取得し、ドキュメントチャンクとして処理します。カテゴリはタイプ別に分類され、ドキュメント、設定ファイル、コードとなります。
  • ドキュメント → 抽出。この抽出ステージでは、取り込まれたドキュメントを NVIDIA Inference Microservices (NIM) に支えられた検索拡張生成 (RAG: Retrieval-Augmented Generation) パイプラインに通します。NVIDIA Nemotron RAG は、高精度な埋め込み (llama-nemotron-embed-1b-v2) と再ランク付け (llama-nemotron-rerank-500m-v2) を処理し、コード、設定ファイル、ドキュメントそれぞれに専用の検索器を設けて、より信号強度の高いソースを優先します。コアとなる抽出は GPT-OSS-120B が担当し、取得したパッセージを読み込み、専門家が手掛けたフォーマットとコンテンツガイド(NVIDIA MC++ テンプレートおよびフィールドレベルのスタイルガイド)を適用して、期待される形式でコンプライアンスに準拠した情報を生成します。応答は受け入れられる前に検証ステップによってチェックされます。出力は構造化された JSON です。概要が完了した後、同じコンテンツがサブカードステージへ流れ、4 つの Model Card++ サブカード(バイアス、説明可能性、プライバシー、セキュリティ)を生成します。
  • JSON → レンダリング。構造化された JSON は、設定可能なテンプレートを使用して人間が読みやすい Markdown 形式にレンダリングされます。インターフェース内でコンテンツを編集し、ダウンロードや他のシステムとの統合前に再レンダリングすることも可能です。最終的な成果物は、概要と 4 つのサブカードを組み合わせた完全なモデルカードであり、レビューまたは公開の準備ができています。

imageimage*図 1. MCG ツールキットのアーキテクチャ:ソースコードを直接読み込んで包括的なモデルカードを生成*

柔軟性のために設計

1 つのモデル、テンプレート、または規格に縛られる必要はありません。このツールキットは 3 つの次元においてカスタマイズ可能です:

1) モデル: システムでは、言語モデル、埋め込み(embeddings)、再ランク付け(reranking)のための設定可能なエンドポイントを使用します。プロトタイピングを小規模なモデルで行う場合でも、本番環境向けにスケールアップする場合でも、パフォーマンス、コスト、データ所在地の要件に合わせて、異なる NIM や互換性のある API を指し示すことができます。

2) テンプレート: 出力形式は Markdown テンプレートによって駆動されます。組織は抽出ロジックを変更することなく、Model Card++、社内規格、または新興する規制フォーマット向けにこれをカスタマイズできます。また、出力は CycloneDX に準拠しています。新しい開示要件が現れた場合、パイプラインではなくテンプレートを更新します。

3) ガイド: どのフィールドを捕捉し、どのように記述するかといったフィールドレベルのガイダンスは、設定可能なナレッジベースから提供されます。規制やドメインのニーズが進化しても、コアコードに触れることなくガイドを更新できます。同じパイプラインで異なる業界やコンプライアンス体制に対応可能です。

必要な場所で実行する

このツールキットは、ワンコマンドでのセットアップが可能なコンテナ化されたサービスとして提供されます。オーケストレーター、インジェクション(ingestion)、抽出、サブカードの各ステージは別々のコンテナとして実行され、インフラストラクチャ(データベースおよびタスクキュー)も含まれています。独自のクラウドへのロックインはありません。MCG はオンプレミスまたはお客様のクラウド上で動作し、Kubernetes のサポートにより、お客様のインフラストラクチャ上で簡単に起動できます。

パフォーマンス結果

公開モデルリポジトリに対して標準化されたテストを実施し、完了率、生成時間、精度を測定しました。各項目はソースドキュメントに対してスコアリングされました。精度は、プレースホルダー以外のフィールドにおける正解数の割合として計算されます。以下の表 1 に結果を示します。

モデル生成までの時間完了率精度

NVIDIA Nemotron Nano 8B56s97%92%

NVIDIA Cosmos Reason 286s94%82%

NVIDIA Parakeet65s92%87%

NVIDIA Proteina52s94%82%

サードパーティ製モデル*(DeepSeek-V3, Evo2, Gemma, Llama)*~平均 80s~89%~80%

*表 1. 標準化されたテストモデルにおける MC++ 概要のパフォーマンス。完了率 = 意味のあるコンテンツを含むフィールド数 / フィールド総数。精度 = 正解数 / プレースホルダー以外の全応答数。

このツールキットは、ほとんどのリポジトリで 1 分未満で完全なモデルカード(概要と 4 つのサブカード)を生成します。全体の完了率は 91%(サードパーティ製ベースライン)、精度は標準化されたテストセット全体で 76% です。完了率と精度はモデルおよびリポジトリによって異なりますが、README や設定ファイルが豊富なリポジトリほど高い結果を示します。

このツールキットは、サポートドキュメントが存在し、コードベースが適切に構造化されている場合に最もよく機能し、可能な限りコード解析を活用して補完します。ドキュメントが少ない場合や存在しない場合は、入力されるフィールド数が少なくなります。推測するのではなく、システムは「見つからない」または「情報利用不可」と表示し、人間のレビューが必要なギャップをフラグとして示します。

ドキュメントを完全に削除した場合にどうなるかもテストしました。標準的なテストセットと同じリポジトリを使用し、すべての.pdf、.md、.txtファイルを除去して、ツールキットをコードのみに対して再実行しました。5 つのモデル全体で、完了率は 91% から 61% に低下し、検証可能なフィールドのみを対象とした厳密な精度は、標準テスト(完了したフィールドのみを対象)での 76% と比較して 28% に落ち込みました。

この 61% の完了率から、ツールキットがコード、設定ファイル、リポジトリ構造のみからも意味のあるシグナルを抽出できていることがわかります。一方、精度の低下は、これらのフィールドを正しく埋めるためにドキュメントがどれだけ貢献しているかを反映しています。

重要なのは、ツールキットが推測によって補おうとしないことです。自信を持ってフィールドを埋められない場合、それらは「見つからなかった」または「情報利用不可」として表示されます。これにより、ドキュメント作成中のチームにとってはギャップを見つけるための有用な手段となり、ドキュメントが完成しているチームにとっては生成ツールとしても機能します。

初期採用者と業界パートナー

Oracle は、MCG ツールキットを生産インフラに統合した最初のパートナーの一つです。A10 から GB200 NVL72 に至る GPU 構成を網羅する OCI AI オファリングの一環として、Oracle は OCI コンテナエンジン for Kubernetes と AI オファリング の組み合わせを採用し、標準の VCN アーキテクチャ内で MCG ポッドと NIM ポッドを実行しています。NIM モデルにはオブジェクトストレージがバックエンドとして使用されています。

そのデプロイでは、コア抽出モデルとして Llama-3.3-Nemotron-Super-49B-v1 を使用し、Nemotron RAG が埋め込みと再ランク付けを担当しています。GPT-OSS-120B モデルは、H100 カードを 2 枚搭載した専用 AI クラスター上でも、モデルのオンデマンド提供サービス上でもホストおよびテストされました。OCI は大規模な AI トレーニングと推論のためのますます強力な GPU インフラストラクチャをサポートしており、それに伴い、一貫性があり監査可能なモデルドキュメンテーションの必要性も高まっています。

OCI Dedicated AI Cluster (DAC) は、独自の専用 GPU、エンドポイント、およびセキュリティ境界を備えた、プライベートで完全に管理された生成 AI 環境です。MCG ツールキットは、顧客が自ら構築する必要なく AI の透明性ツールをそのワークフローに直接導入するだけでなく、モデルを OCI Dedicated AI クラスター環境およびベアメタル GPU インフラストラクチャ上でホストするために最適な GPU 構成を顧客自身が特定できる能力も提供します。

はじめに

早期採用者になりたい場合は、信頼性の高い AI チーム までお問い合わせください。パートナーシップについて喜んでお話しさせていただきます。

完全自動化されたツールキットにまだ準備ができていない場合でも、Trustworthy AI GitHub リポジトリ には、青写真、データセット、コンテナ、システム向けに今日から使用できるオープンソースの Model Card++ テンプレート や AI 透明性カードが用意されています。

ドキュメンテーションは、出荷するモデルと歩調を合わせる必要があります。MCG ツールキットを採用するか、あるいはオープンソースのテンプレートから始めるかにかかわらず、NVIDIA の信頼できる AI イニシアチブ は、その実現を容易にするために取り組んでいます。

原文を表示

As AI models grow in complexity and regulatory scrutiny intensifies under frameworks including California’s AB-2013 and the EU AI Act, software teams face a challenge beyond delivering great code: They need to produce comprehensive, auditable model documentation before the models are released.

Model cards describe how a model works, its intended use and license, training data, performance, and limitations. They promote transparency and accountability so downstream users—customers, regulators, and affected communities—can make informed decisions when selecting and deploying AI. That audience extends beyond developers: Policymakers, procurement teams, and risk assessors rely on model cards to evaluate fitness for use and compare models across vendors.

In practice, creating model cards manually is tedious and slow. Documentation lags behind development, and metadata is often outdated by ship date. As models grow more complex, inconsistent formatting and missing required fields create unnecessary audit risk and slow adoption. The NVIDIA model card generator (MCG) toolkit automates and standardizes model documentation in Model Card++ format in under a minute, by reading directly from source data.

Introducing the NVIDIA MCG toolkit

The MCG toolkit is a containerized pipeline that automates the generation of model cards by reading in the model source code. It follows a modular Ingestion → Extraction → Rendering pipeline. A central orchestrator receives your request—either a URL or an uploaded file—coordinates the workflow, and returns a complete model card. Each stage runs as a separate service, so you can update or swap individual components without affecting the rest of the pipeline.

How the MCG toolkit works

The toolkit exposes an interactive UI that accepts a URL (GitHub, GitLab, HuggingFace, or any public web page) or an uploaded file (ZIP, PDF, DOCX, or Markdown). A REST API is also available for programmatic integration.

From there, data flows through three stages:

  • Input → Ingestion. The system fetches the content and processes it into document chunks, categorized by type: documentation, config files, and code.
  • Documents → Extraction. The extraction stage runs ingested documents through a retrieval-augmented generation (RAG) pipeline powered by NVIDIA Inference Microservices (NIM). NVIDIA Nemotron RAG handles high-precision embedding (llama-nemotron-embed-1b-v2) and reranking (llama-nemotron-rerank-500m-v2), with separate retrievers for code, config files, and documentation to prioritize higher-signal sources. The core extraction is performed by GPT-OSS-120B, which reads the retrieved passages and applies expert-curated formatting and content guides—the NVIDIA MC++ template and field-level style guides—to generate compliant information in the expected format. A validation step checks responses before they are accepted. Output is structured JSON. After the overview is complete, the same content flows to a subcards stage, which produces the four Model Card++ subcards: Bias, Explainability, Privacy, and Safety & Security.
  • JSON → Rendering. The structured JSON renders into human-readable Markdown using a configurable template. You can edit the content in the interface and re-render before downloading or integrating with other systems. The final artifact is a complete model card – overview plus four subcards – ready for review or publication.
Figure 1. MCG toolkit architecture: Generate a comprehensive model card by directly reading in the source code
Figure 1. MCG toolkit architecture: Generate a comprehensive model card by directly reading in the source code

Designed for flexibility

You’re not locked into one model, template, or standard. The toolkit is customizable across three dimensions:

1) Models: The system uses configurable endpoints for the language model, embeddings, and reranking. Point to different NIMs or compatible APIs to match your performance, cost, or data residency requirements, whether you’re prototyping on a smaller model or scaling up for production.

2) Templates: The output format is driven by a Markdown template. Organizations can customize it for Model Card++, internal standards, or emerging regulatory formats without modifying the extraction logic. Outputs are also CycloneDX-compliant. When a new disclosure requirement appears, you update the template rather than the pipeline.

3) Guides: Field-level guidance—what to capture, how to phrase it—comes from configurable knowledge bases. As regulations or domain needs evolve, update the guides without touching the core code. The same pipeline can serve different industries and compliance regimes.

Run it where you need it

The toolkit ships as containerized services with a one-command setup. The orchestrator, ingestion, extraction, and subcards stages each run as separate containers, with infrastructure (database and task queue) included. There’s no proprietary cloud lock-in: MCG runs on-premises or in your own cloud, with Kubernetes support to help you spin up on your own infrastructure.

Performance results

We ran the toolkit through standardized testing on public model repositories to measure completion rate, generation time, and accuracy. Each field was scored against the source documentation. Accuracy is calculated as correct fields over non-placeholder fields. Table 1, below, shows the results.

The toolkit generates a full model card (overview plus four subcards) in under a minute for most repositories. Overall completion reaches 91% (third-party baseline), with accuracy at 76% across the standardized test set. Completion and accuracy vary by model and repository; repositories with richer READMEs and config files yield higher results.

The toolkit performs best when supporting documentation exists and the codebase is well-structured, using code analysis to supplement where possible. When documentation is sparse or absent, fewer fields are populated and rather than guessing, the system surfaces “not found” or “information not available” to flag gaps for human review.

We also tested what happens when documentation is removed entirely. Using the same repositories from our standard test set, we stripped all .pdf, .md, and .txt files and re-ran the toolkit against code alone. Across five models, average completion rate dropped to 61% from 91%, and strict accuracy, measured only over verifiable fields, fell to 28%, compared with 76% in the standard test that scores accuracy over completed fields only.

The 61% completion shows the toolkit still extracts meaningful signals from code, config files, and repository structure alone; the accuracy drop reflects how much documentation contributes to getting those fields right.

Critically, the toolkit doesn’t compensate by guessing. If it cannot confidently populate fields, they are surfaced as “not found” or “information not available,” making it a useful gap-finder for teams whose documentation is still being written, as well as a generator for teams whose documentation is complete.

Early adopters and industry partners

Oracle is among our first partners to integrate the MCG Toolkit into production infrastructure. As part of their OCI AI offering, which spans GPU configurations from the A10 to the GB200 NVL72, Oracle deployed the toolkit combination of OCI container engine for Kubernetes and AI offerings, running MCG pods and NIM pods within a standard VCN architecture backed by Object Storage for the NIM models.

Their deployment uses Llama-3.3-Nemotron-Super-49B-v1 as the core extraction model, with Nemotron RAG handling embedding and reranking. GPT-OSS-120B model was hosted and tested on both the dedicated AI cluster with 2xH100 cards as well as the on-demand offering of the model. OCI supports increasingly powerful GPU infrastructure for large-scale AI training and inference, the need for consistent, auditable model documentation grows alongside it.

An OCI Dedicated AI Cluster (DAC) is a private, fully managed generative AI environment with its own dedicated GPUs, endpoints, and security boundary inside OCI. The MCG toolkit brings not only AI transparency tooling directly into that workflow without requiring customers to build it themselves but also the ability for customers to identify the optimal GPU configuration that is needed for hosting the models both in the OCI Dedicated AI cluster environments and baremetal GPU infrastructure.

Getting started

If you’d like to be an early adopter, reach out to the Trustworthy AI team. We’re happy to discuss partnerships.

Not ready for the fully automated toolkit? The Trustworthy AI GitHub repository has open source Model Card++ templates and AI transparency cards for blueprints, datasets, containers, and systems you can use today.

Documentation should keep pace with the models you ship. Whether you adopt the MCG toolkit or start with our open source templates, NVIDIA’s Trustworthy AI initiative is committed to making that easier.

この記事をシェア

関連記事

AWS Machine Learning Blog★42026年6月19日 23:15

Amazon Bedrock AgentCore に Web 検索機能を導入

AWS は、学習データに依存して最新情報を取得できない AI エージェントの課題を解決するため、Amazon Bedrock AgentCore に Web 検索機能を一般提供開始した。これによりエージェントはリアルタイムの株価やニュースなどを参照可能になった。

MarkTechPost★42026年6月19日 19:29

Liquid AI、11言語対応の高速多言語検索向け新モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を発表

Liquid AI は、11言語間の高速な多言語・異言語検索を実現する新たな取得モデル「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」を公開した。両モデルはパラメータ数 3.5 億で、LFM ファミリー初の双方向型であり、Hugging Face で利用可能となった。

Allen AI (AI2)★42026年6月18日 17:00

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む