Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format(OKF)」を発表
Google Cloud は、AI エージェントが散在する内部知識を効率的に利用できるよう、Markdown と YAML を基盤としたベンダー中立の標準規格「Open Knowledge Format (OKF)」を発表した。
キーポイント
標準化された文脈フォーマットの確立
LLM ウィキのパターンを正式な仕様として定式化し、異なるプロダクト間で知識の相互運用性を確保するベンダー中立の規格。
複雑なインフラ不要の軽量設計
圧縮スキームや専用ランタイム、SDK を必要とせず、単なる Markdown ファイルと YAML フロントマターとして動作する。
断片化された知識問題の解決
メタデータカタログ、ウィキ、ドキュメントなど散在する内部ナレッジを統合し、エージェントが文脈を組み立てるための重複作業を削減する。
ファイルパスとリンクによる構造化
各概念を単一の Markdown ファイルとし、ファイルパスをそのアイデンティティとして扱い、内部リンクでディレクトリ全体をグラフ構造として機能させます。
ベンダー中立性と相互運用性
特定のクラウドやプロバイダーに縛られず、人間が作成した文書も AI エージェントも同じ形式で読み書きできる契約ベースの仕様です。
多様なユースケースへの対応
データメタデータのコード管理、AI によるインシデント対応、組織間での知識共有など、多様なシナリオで即座に利用可能です。
RAGとの根本的な違い
RAG がクエリ時に生データチャンクから知識を再構築するのに対し、OKF はエージェントが直接読み書きできるキュレーション済みで相互接続された概念を保存します。
影響分析・編集コメントを表示
影響分析
この規格は、AI エージェント開発における最大のボトルネックである「文脈の断片化」問題に対する実用的な解決策を示すものであり、業界全体で知識管理の標準化を加速させる可能性があります。特に、特定のクラウドベンダーに依存しないオープンな形式を採用することで、マルチクラウド環境やハイブリッド構成におけるエージェントの柔軟性を大幅に向上させると期待されます。
編集コメント
専用ツールや複雑なインフラを必要としない「ファイルベース」の標準化アプローチは、現場での導入障壁を極限まで下げる賢明な戦略です。これにより、AI エージェント開発者が独自の実装に時間を費やすのではなく、知識の質そのものに集中できる環境が整います。
基盤モデルはますます強力になっていますが、依然として同じ壁にぶつかり続けています:コンテキストです。モデルはコードの記述やデータセットの分析が可能ですが、適切な内部知識があってこそです。その知識にはテーブルスキーマ、メトリック定義、ランブック、結合パスが含まれ、カタログ、ウィキ、そして数人のシニアエンジニアの頭の中に散在しています。
Google Cloud は、LLM ウィキパターンをポータブルで相互運用可能な形式に形式化したオープン仕様である Open Knowledge Format (OKF) を発表しました。これは、現代の AI システムが必要とするコンテキストのためのベンダー中立かつエージェントおよび人間に優しい標準です。
Open Knowledge Format (OKF)
OKF はサービスでもプラットフォームでもなく、フォーマットです。OKF v0.1 は、YAML フロントマッターを付与したマークダウンファイルのディレクトリとして知識を表現します。合意された少数の規約により、あるプロデューサーが作成したウィキを翻訳することなく別のエージェントが消費できるようになります。
これが全体の考え方です。圧縮方式も新しいランタイムも必要な SDK もありません。OKF ドキュメントのバンドルは単なるマークダウンであり、単なるファイルであり、単なる YAML フロントマッターです。GitHub でレンダリングされ、tarball として配布され、あらゆるファイルシステムにマウントできます。
Obsidian、Notion、または Hugo を使用したことがある方なら、その形状が馴染み深く感じられるでしょう。OKF は、それらのパターンを相互運用可能にするために必要な規約を形式化するだけです。
(function(){
window.addEventListener("message", function(ev){
if(ev && ev.data && ev.data.mtpOkfHeight){
var f = document.getElementById("mtp-okf-frame");
if(f){ f.style.height = ev.data.mtpOkfHeight + "px"; }
}
});
})();
文脈の分断という問題
ほとんどの組織において、モデルの文脈は圧倒的に内部知識に依存しています。現在、それは互換性のないサイロ(閉鎖的なシステム)の中に存在しています:独自の API を持つメタデータカタログ、ウィキ、共有ドライブ、コード内のコメント、そしてドキュストリングです。
エージェントに「イベントストリームから週次アクティブユーザーをどのように計算すればよいか?」と尋ねてみてください。その答えは、散在し互いに互換性のない様々な表面から組み立てる必要があります。各ベンダーが独自のカタログ、SDK(ソフトウェア開発キット)、知識グラフスキーマを提供しています。どの知識も製品間や組織間で移植可能ではありません。
その結果、重複した努力が生じます。すべてのエージェントビルダーが同じ文脈の統合問題をゼロから解決しようとし、すべてのカタログベンダーが同じデータモデルを再発明します。
アンドレイ・カルパティは、2026 年 4 月の LLM Wiki の gist でこの根本的なアイデアを明確にしました。彼の主張はこうです:LLM(大規模言語モデル)は飽きることがなく、相互参照の更新を忘れることもなく、一度のパスで多数のファイルを編集できます。人間が個人用ウィキを放棄させるような事務処理こそが、LLM が得意とするところです。
同じパターンが異なる名称の下で繰り返し現れています。例としては、コーディングエージェントに接続された Obsidian バルト、AGENTS.md や CLAUDE.md という名前の規約ファイル、そして「メタデータをコードとして扱う」リポジトリなどが挙げられます。それぞれの事例は個別の設計であるため、相互運用性は確保されていません。OKF はその相互運用性のレイヤーを標準化し、エージェントが重労働を引き受けられるようにします。
OKF の仕組み:1 画面で見るデザイン
OKF バンドルとは、概念(テーブル、データセット、指標、プレイブック、ランブック、または API)を表す Markdown ファイルのディレクトリです。各概念は 1 つのファイルであり、そのファイルパスがそのアイデンティティとなります。
sales/
├── index.md
├── datasets/
│ ├── index.md
│ └── orders_db.md
├── tables/
│ ├── index.md
│ ├── orders.md
│ └── customers.md
└── metrics/
├── index.md
└── weekly_active_users.md
各概念には、小さな YAML フロントマターブロックが含まれ、その後に残りの内容のための Markdown 本文が続きます。
type: BigQuery Table
description: One row per completed customer order.
resource: https://console.cloud.google.com/bigquery?p=acme&d=sales&t=orders
tags: [sales, revenue]
timestamp: 2026-05-28T14:30:00Z
Schema
| Column | Type | Description |
|---|---|---|
order_id | STRING | Globally unique order identifier. |
customer_id | STRING | FK to customers. |
予約された構造化フィールドは、type(型)、title(タイトル)、description(説明)、resource(リソース)、tags(タグ)、timestamp(タイムスタンプ)です。概念同士は通常の Markdown リンクで相互にリンクされ、これらのリンクがディレクトリをファイルシステムの親/子関係よりも豊かなグラフに変換します。バンドルには、段階的な開示のための index.md ファイルや、変更履歴用の log.md ファイルをオプションで含めることができます。
設計の背後にある 3 つの原則
最小限の意見表明:OKF は、すべての概念に対して type(型)フィールドを 1 つだけ必須とします。それ以外はプロデューサーに委ねられます。この仕様はコンテンツモデルではなく、相互運用性のインターフェースを定義するものです。
プロデューサーとコンシューマーの独立性:人間が作成したバンドルはエージェントによって読み取ることができ、パイプライン生成されたバンドルは可視化ツールで閲覧可能です。フォーマットが契約であり、両端のツールの交換が可能です。
プラットフォームではなくフォーマット:OKF は特定のクラウド、データベース、モデルプロバイダー、またはエージェントフレームワークに紐付いていません。読み取り、書き込み、提供のために専有アカウントを必要とすることはありません。
ユースケースと具体例
データチームのメタデータ・アズ・コード:BigQuery のテーブル定義やメトリック定義をバンドルとしてエクスポートします。記述対象となる SQL と同じディレクトリにコミットし、プルリクエストを通じて変更をレビューします。
エージェント向けのインシデント対応マニュアル:各対応マニュアルを概念として保存します。オンコールのエージェントが index.md を読み、クロスリンクを追跡して必要な結合パスを解決します。
組織間での知識共有:ベンダーがカタログエクスポートを OKF 形式で提供します。エージェントは統合作業なしにこれを直接消費できます。
開発者チームのウィキ:バージョン管理された Markdown で、エージェントが常に最新の状態を維持する、古くなった Notion や Obsidian のスペースを置き換えます。
OKF の比較
アプローチ 保存 スキーマ必須 ポータブル SDK/レジストリ エージェント可読性
OKF v0.1 Markdown + YAML ファイル 型のみ はい いいえ はい(翻訳不要)
Notion 独自 DB ワークスペースごと 書き出し専用 API 必要 API を経由
Obsidian バージョン管理 Markdown ファイル 強制なし はい いいえ 独自の規約
メタデータカタログ ベンダーストア ベンダースキーマ 書き出し専用 ベンダー SDK ベンダー固有
RAG インデックス ベクトルストア 埋め込みモデル いいえ はい チャンク単位、概念ではない
RAG との違いは開発者にとって有用です。RAG はクエリ実行時に生データチャンクから知識を再導出します。一方、OKF バンドルはエージェントが直接読み書きする、キュレーション済みで相互リンクされた概念を保存します。
最小限の OKF コンシューマー
OKF は標準ツールで解析可能です。このコードはバンドルを読み込み、そのリンクグラフを構築します。
コピー コード コピー済み 別のブラウザを使用してください
import pathlib, re, yaml
def load_bundle(root):
concepts, links = {}, []
for path in pathlib.Path(root).rglob("*.md"):
text = path.read_text()
meta = {}
if text.startswith("---"):
_, fm, body = text.split("---", 2)
meta = yaml.safe_load(fm) or {}
else:
body = text
concepts[str(path)] = meta # type, title, tags, etc.
for target in set(re.findall(r"\]\((/[^)]+\.md)\)", body)):
links.append((str(path), target)) # markdown cross-links
return concepts, links
concepts, graph = load_bundle("sales/")
バンドルを読み込んだり提供したりするために、バックエンドやインストールは不要です。同じファイルは、記述対象のコードと共にバージョン管理システム内に存在します。
主なポイント
Google の Open Knowledge Format (OKF) v0.1 は、LLM-wiki パターンをポータブルでベンダーに依存しない仕様として形式化しました。
バンドルとは、YAML フロントマターを持つ Markdown ファイルのディレクトリに過ぎません。SDK、ランタイム、レジストリは不要です。
各概念には type フィールドのみが必要であり、ファイル間の相互リンクが知識グラフを形成します。
Google は参照ツールとして、BigQuery 拡張エージェント、静的 HTML ビジュアライザー、および 3 つのサンプルバンドルを提供しました。
RAG とは異なり、OKF はエージェントが直接読み取り・更新できる、キュレーション済みでバージョン管理された概念を保存します。
技術詳細はこちらをご覧ください。また、Twitter でフォローしていただくか、150,000 人以上の ML サブレッドに参加し、ニュースレターを購読することを忘れないでください。待ってください!Telegram をご利用ですか?今なら Telegram でもご参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご検討の場合は、こちらからご連絡ください。
本記事「Google Cloud Introduces Open Knowledge Format (OKF): A Vendor-Neutral Markdown Spec for Giving AI Agents Curated Context」は、MarkTechPost で最初に公開されました。
原文を表示
Foundation models keep getting stronger, yet they still stall on the same thing: context. A model can write code or analyze a dataset, but only with the right internal knowledge. That knowledge includes table schemas, metric definitions, runbooks, join paths and it lives scattered across catalogs, wikis, and a few senior engineers’ heads.
Google Cloud introduced the Open Knowledge Format (OKF), an open specification that formalizes the LLM-wiki pattern into a portable, interoperable format. It is a vendor-neutral, agent- and human-friendly standard for the context modern AI systems need.
Open Knowledge Format (OKF)
OKF is a format, not a service or a platform. OKF v0.1 represents knowledge as a directory of markdown files with YAML frontmatter. A small set of agreed-upon conventions lets wikis written by one producer be consumed by a different agent without translation.
That is the whole idea. There is no compression scheme, no new runtime, and no required SDK. A bundle of OKF documents is just markdown, just files, and just YAML frontmatter. It renders on GitHub, ships as a tarball, and mounts on any filesystem.
If you have used Obsidian, Notion, or Hugo, the shape will feel familiar. OKF only formalizes the conventions needed to make those patterns interoperable.
(function(){
window.addEventListener("message", function(ev){
if(ev && ev.data && ev.data.mtpOkfHeight){
var f = document.getElementById("mtp-okf-frame");
if(f){ f.style.height = ev.data.mtpOkfHeight + "px"; }
}
});
})();
The Fragmented Context Problem
In most organizations, model context is overwhelmingly internal knowledge. Today it sits in incompatible silos: metadata catalogs with their own APIs, wikis, shared drives, code comments, and docstrings.
Ask an agent ‘How do I compute weekly active users from our event stream?’ It must assemble that answer from scattered, mutually incompatible surfaces. Every vendor offers its own catalog, SDK, and knowledge-graph schema. None of the knowledge is portable across products or organizations.
The result is duplicated effort. Every agent builder solves the same context-assembly problem from scratch. Every catalog vendor reinvents the same data models.
Andrej Karpathy articulated the underlying idea in his April 2026 LLM Wiki gist. His point: LLMs do not get bored, do not forget to update cross-references, and can edit many files in one pass. The bookkeeping that makes humans abandon personal wikis is exactly what LLMs handle well.
The same pattern keeps reappearing under different names. Examples include Obsidian vaults wired to coding agents, the AGENTS.md and CLAUDE.md convention files, and ‘metadata as code’ repos. Each instance is bespoke, so none of them interoperate. OKF standardizes that interoperability layer so agents can do the heavy lifting.
How OKF Works: The Design in One Screen
An OKF bundle is a directory of markdown files representing concepts — tables, datasets, metrics, playbooks, runbooks, or APIs. Each concept is one file, and the file path is its identity.
Copy CodeCopiedUse a different Browser
sales/
├── index.md
├── datasets/
│ ├── index.md
│ └── orders_db.md
├── tables/
│ ├── index.md
│ ├── orders.md
│ └── customers.md
└── metrics/
├── index.md
└── weekly_active_users.md
Each concept carries a small YAML front-matter block, then a markdown body for everything else.
Copy CodeCopiedUse a different Browser
type: BigQuery Table
title: Orders
description: One row per completed customer order.
resource: https://console.cloud.google.com/bigquery?p=acme&d=sales&t=orders
tags: [sales, revenue]
timestamp: 2026-05-28T14:30:00Z
Schema
| Column | Type | Description |
|---|---|---|
order_id | STRING | Globally unique order identifier. |
customer_id | STRING | FK to customers. |
The reserved structured fields are type, title, description, resource, tags, and timestamp. Concepts link to each other with normal markdown links. Those links turn the directory into a graph that is richer than file-system parent/child relationships. Bundles can optionally include index.md files for progressive disclosure and log.md files for change history.
Three Principles Behind the Design
Minimally opinionated: OKF requires exactly one field on every concept: type. Everything else is left to the producer. The spec defines the interoperability surface, not the content model.
Producer/consumer independence: A human-written bundle can be read by an agent. A pipeline-generated bundle can be browsed in a visualizer. The format is the contract; tooling at each end is swappable.
Format, not platform: OKF is tied to no cloud, database, model provider, or agent framework. It will never require a proprietary account to read, write, or serve.
Use Cases, With Examples
Data team metadata-as-code: Export BigQuery table and metric definitions as a bundle. Commit it next to the SQL it describes, and review changes through pull requests.
Incident runbooks for agents: Store each runbook as a concept. An on-call agent reads index.md, follows cross-links, and resolves the join path it needs.
Cross-org knowledge exchange: A vendor ships a catalog export as OKF. Your agent consumes it directly, with no integration work.
Developer-team wiki: Replace a stale Notion or Obsidian space with versioned markdown that an agent keeps current.
How OKF Compares
ApproachStorageSchema requiredPortableSDK/registryAgent-readable
OKF v0.1Markdown + YAML filesOnly typeYesNoYes, no translation
NotionProprietary DBPer-workspaceExport-onlyAPI neededVia API
Obsidian vaultMarkdown filesNone enforcedYesNoBespoke conventions
Metadata catalogVendor storeVendor schemaExport-onlyVendor SDKVendor-specific
RAG indexVector storeEmbedding modelNoYesChunks, not concepts
The distinction from RAG is useful for developers. RAG re-derives knowledge at query time from raw chunks. An OKF bundle stores curated, cross-linked concepts that an agent reads and updates directly.
A Minimal OKF Consumer
OKF is parseable with standard tools. This reads a bundle and builds its link graph.
Copy CodeCopiedUse a different Browser
import pathlib, re, yaml
def load_bundle(root):
concepts, links = {}, []
for path in pathlib.Path(root).rglob("*.md"):
text = path.read_text()
meta = {}
if text.startswith("---"):
_, fm, body = text.split("---", 2)
meta = yaml.safe_load(fm) or {}
else:
body = text
concepts[str(path)] = meta # type, title, tags, etc.
for target in set(re.findall(r"\]\((/[^)]+\.md)\)", body)):
links.append((str(path), target)) # markdown cross-links
return concepts, links
concepts, graph = load_bundle("sales/")
No backend or install is needed to read or serve a bundle. The same files live in version control beside the code they describe.
Key Takeaways
Google’s Open Knowledge Format (OKF) v0.1 formalizes the LLM-wiki pattern into a portable, vendor-neutral spec.
A bundle is just a directory of markdown files with YAML frontmatter—no SDK, runtime, or registry.
Every concept requires only one field, type; cross-links between files form the knowledge graph.
Google shipped reference tools: a BigQuery enrichment agent, a static HTML visualizer, and three sample bundles.
Unlike RAG, OKF stores curated, version-controlled concepts that agents read and update directly.
Check out the Technical details here. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post Google Cloud Introduces Open Knowledge Format (OKF): A Vendor-Neutral Markdown Spec for Giving AI Agents Curated Context appeared first on MarkTechPost.
関連記事
Domyn と AISquared が Ai2 のオープンリリースをどう活用したか
Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。
エージェント性は十分か?独自ツールを用いたオープンモデルのベンチマーク調査
Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。
[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定
Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み