オープンソース AI グラップマップの公開
非営利団体 Current AI が、オープンソース AI エコシステムを体系的に分類・評価する「Gap Map」およびその完全なデータセットを公開し、業界の透明性と可視化を大幅に向上させた。
キーポイント
包括的な Gap Map の公開
モデルコンポーネント、プロダクト/UX、インフラストラクチャの 3 レイヤーと 14 カテゴリに分類された、421 製品の詳細なマッピングが提供されている。
大規模データのオープン化
MIT ライセンスの下で GitHub に公開されたデータセットには、1,184 件の YAML ファイルやスクリプトが含まれ、16,185 以上のリポジトリを追跡している。
未分類のアーティファクトへの対応
詳細な分析対象外となる 24,400 件の「ロングテール」なアーティファクトも存在し、今後の調査と引用によってスコアリングされる予定である。
データ探索ツールの活用
公開された CSV データを Datasette Lite を用いて即座に探索・分析できる環境が提供されており、開発者による二次利用が容易になっている。
影響分析・編集コメントを表示
影響分析
このニュースは、散在するオープンソース AI リソースを体系的に整理・評価する初の包括的な試みであり、開発者や研究者が技術選定を行う際の基準として極めて重要な役割を果たす。特にデータセットが MIT ライセンスで公開されたことは、業界全体における透明性を高め、オープンソース生態系の健全な成長を後押しする画期的な出来事である。
編集コメント
Open Source AI の現状を可視化する「地図」が完成し、かつそのデータソースが完全にオープン化された点は、業界の成熟度を示す重要なマイルストーンです。
Current AI は、2025 年 2 月のパリで開催された AI Action サミットで非営利団体として設立され、確固たる資金(すでに 4 億ドルがコミット済み)の支援を受けている「AI に対する公共オプションを構築するグローバル・パートナーシップ」です。
彼らは数日前に Gap Map を立ち上げました。これはオープンソース AI の現状をインデックス化しようとする試みです:
Gap Map v0.1 では、421 件の製品を詳細に解説しています。これには 266 件のソフトウェアツールとライブラリ、85 件のモデル、50 件のデータセット、そして 20 件のハードウェアプロジェクトが含まれており、これらは 228 の組織によって作成されました。これらの製品は、スタックの 3 つの層(モデルコンポーネント、プロダクト/UX、インフラストラクチャ)にわたる 14 のカテゴリに整理されています。残りの 24,400 件のアーティファクトは、分類されていないオープンソース AI エコシステムのロングテールを構成しており、調査され引用されるまでスコアは付与されません。
マップそのものも探索する価値がありますが、私はむしろ基盤となるデータにより興奮しています。これは currentai-org/os-ai-map という GitHub アカウントで MIT ライセンスの下に公開されており、1,184 件の YAML ファイルに加え、それらを収集するために使用されたノートブック、スキーマ、およびその他のスクリプトが含まれています。
ファイルは GitHub にあるため、Datasette Lite を使用していくつかのファイルを探索できます。プロジェクトが追跡している 16,185 の GitHub リポジトリを Datasette Lite に CSV ファイルとして読み込んだ形式で こちら で確認できます。
Tags: open-source, ai, datasette-lite, generative-ai, local-llms, llms
原文を表示
Current AI is "a global partnership building a public option for AI", founded as a non-profit at the AI Action Summit in Paris in February 2025 and backed by serious capital ($400m already committed).
They launched their Gap Map a couple of days ago - an attempt at indexing the current state of open source AI:
The Gap Map v0.1 details 421 products in depth: 266 software tools and libraries, 85 models, 50 datasets, and 20 hardware projects, produced by 228 organizations. These products are organized into 14 categories across 3 layers of the stack (model components, product / UX, and infrastructure). The remaining 24,400 artifacts constitute the uncategorized long tail of the open source AI ecosystem, and will carry no score until they are researched and cited.
The map itself is interesting to explore, but I'm more excited about the underlying data - released under an MIT license in the currentai-org/os-ai-map GitHub account: 1,184 YAML files plus the notebooks, schemas and other scripts used to help gather them.
Since the files are on GitHub you can use Datasette Lite to explore some of them - here are 16,185 GitHub repos the project is tracking as a CSV file loaded into Datasette Lite.
Tags: open-source, ai, datasette-lite, generative-ai, local-llms, llms
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み