#open source のAIニュース

133件の記事

アント・グループ傘下のエンボディドAI企業「Robbyant」が、密集空間知覚向け10億パラメータのビジョン基盤モデル「LingBot-Vision」をオープンソース化

アント・グループ傘下のエンボディドAI企業「Robbyant」は、画像内の微細な空間構造を保持する自己教師ありVision Transformerである「LingBot-Vision」をApache-2.0ライセンスで公開した。同モデルは密集空間知覚に特化しており、4種類のサイズと技術報告書、推論コードがHugging Faceで利用可能となった。

MarkTechPost·7月8日·★★★★

Liquid AI が推論モデルの無限ループを防止する新手法「Antidoom」をオープンソース化

Liquid AI は、推論モデルで発生しやすい出力の無限ループ（ドゥーム・ループ）を防ぐための新しい最適化手法「Antidoom」を公開した。この手法は特に小規模な推論モデルにおいて、複雑な数学やコーディング問題での繰り返し出力を抑制する効果がある。

MarkTechPost·7月8日·★★★★

2026年第1四半期イノベーショングラフ更新：オープンソース協力が世界で加速

GitHubは、2026年第1四半期のデータに基づき、異なる経済圏間の開発者によるアウトバウンド協力（gitプッシュやプルリクエストの合計）が前四半期比16%増加したと発表した。これはオープンソース協力が世界的に加速していることを示す指標である。

GitHub Blog·7月8日·★★★★

Vercel、オープンソース認証ライブラリ「Better Auth」の買収を発表し加速化を推進

Vercel は、週間ダウンロード数 470 万件を超える TypeScript 製認証ライブラリ「Better Auth」の開発元を買収した。創業者らも Vercel に合流し、エージェントアイデンティティ分野での開発を継続する。

Vercel Blog·7月7日·★★★★

2026 年中時点の CLI コーディングエージェントの現状（37 分読了）

TLDR AI は、Claude Code、Codex CLI、Omp の 3 つが同等の品質で機能し、複雑なリポジトリの計画・編集・修復が可能であると報告した。一方、OpenCode は結果の質は低いがあらゆるモデルへの対応に努めていると分析している。

TLDR AI·7月7日·★★★★

Interfaze が拡散型 ASR モデル「diffusion-gemma-asr-small」を公開、6 か国語の並列ノイズ除去デコーダーで音声認識を実現

YC 支援企業 Interfaze は、260 億パラメータのバックボーンを凍結し、4200 万パラメータのみで訓練した拡散型 ASR モデル「diffusion-gemma-asr-small」をオープンソース化しました。このモデルは自己回帰方式ではなく並列ノイズ除去デコーダーを採用し、1 つのアダプターで 6 か国語の音声認識を可能にします。

MarkTechPost·7月3日·★★★★

アリババのページエージェント：DOM を介して自然言語で Web インターフェースを制御する JavaScript 内蔵 GUI エージェント

アリババが公開したオープンソースプロジェクト「Page Agent」は、外部プロセスではなくウェブページ内に JavaScript として埋め込まれ、スクリーンショットや多モーダルモデルを使わずに DOM を直接読み取って自然言語で Web インターフェースを操作する技術です。

MarkTechPost·7月3日·★★★★

Simon Willison Blog の llm-coding-agent 0.1a0 リリース

Simon Willison が自身の LLM ライブラリを基盤とした、シンプルなコーディングエージェントの原型となる Python ライブラリ「llm-coding-agent」の初期バージョン 0.1a0 を公開した。これは Fable 5 の実験プロジェクトである。

Simon Willison Blog·7月3日

大規模モジュラー LLM：デンマーク基盤モデルプロジェクトが FlexOlmo を活用し、機密データを共有せずに専門知識を集約する方法

デンマークの基盤モデルプロジェクトは、FlexOlmo を基盤とした効率的なモジュラー LLM 構造「FlexMoRE」を採用している。これにより、各機関は機密や独自データで訓練された専門モデルを貢献でき、データを共有せずに済む。また、結果として得られるモデルは高アクセシビリティのハードウェア上で実行可能となる。

Allen AI (AI2)·7月2日·★★★★

Google Cloud の力を活用した VS Code での ML 開発：Workbench エクステンションが利用可能に

Google が、VS Code からスケーラブルなクラウドベースの Jupyter 環境へ直接接続できる「Cloud Workbench Notebooks」エクステンションを正式にリリースしました。これにより、開発者はローカル IDE で機械学習ライフサイクルをシームレスに管理できるようになります。

Google Developers AI·7月1日·★★★★

Ahmad Osman が語る、ローカル AI の追い上げの理由

AI エンジニア世界博で講演した Ahmad Osman は、自身のコンピュータや専用ハードウェア上でモデルを実行する「ローカル AI」が急速に追いついていると主張している。

Latent Space·7月1日·★★★★

Meta AI、非侵襲型脳からテキストへ変換する「Brain2Qwerty v2」を公開し、タイピング中の文章を61%の単語精度で復元

Meta AIは、埋め込み手術を必要としない非侵襲型の脳波記録（MEG）を用いて、ユーザーがタイピングしている際の脳信号から自然な文章をリアルタイムに解読する「Brain2Qwerty v2」を発表した。このシステムは、61%の単語精度で復元可能であり、関連する学習コードも公開された。

MarkTechPost·6月30日·★★★★

Vercel オープンソースプログラム：2026 年春期コホート募集開始

Vercel は、開発者コミュニティの成長を支援するため、4 年に一度新プロジェクトを受け入れる「Vercel オープンソースプログラム」の 2026 年春期参加者を募集中であり、採用されたメンテナーには資金やリソースが提供される。

Vercel Blog·6月29日

EverMind が公開したオープンソースの Markdown フォーカス型エージェントメモリランタイム「EverOS」を紹介

AI エージェント開発者向けに、EverMind が Apache 2.0 ライセンスで「EverOS」というオープンソースのメモリランタイムを公開しました。これは大規模言語モデルが状態を持たないという課題に対し、ベクトルデータベースに依存せず、Markdown ファイルを事実源として記憶を保存・編集・検索する仕組みを提供します。

MarkTechPost·6月29日·★★★★

[AINews] メタハーネスの夏が到来

メタハーネスの歴史を振り返り、ダatabricks の CTO マタイ・ザハリヤ氏が、あらゆるコーディングや知識作業を取り込むためのオープンソースでプラグ可能アーキテクチャ「オムニジェント」に賭けていると報じる。

Latent Space·6月25日·★★★★

ブラウザ互換性データベースをSQLite化

Simon Willison氏が、MozillaのMDNが提供する包括的なブラウザ互換性情報データを基に、SQLiteデータベース形式に変換するプロジェクト「simonw/browser-compat-db」を開始した。

Simon Willison Blog·6月25日

ツール、メモリ、権限、スキル、マルチエージェント協調を備えた OpenHarness スタイルのエージェントランタイム設計方法

MarkTechPost は、エージェントシステムの実用的な仕組みを理解するため、ツール使用やマルチエージェント協調など主要な構成要素から OpenHarness をゼロから構築するチュートリアルを提供している。

MarkTechPost·6月25日·★★★★

Unlimited OCR Works（GitHub リポジトリ）

DeepSeek OCR をベースに定数 KV キャッシュ設計を組み合わせ、人間の作業記憶を模倣する「Unlimited OCR」モデルが開発された。この技術により、32K の最大長制限下で数十ページの文書を単一の順次処理で転写可能となり、音声認識や翻訳タスクにも応用できる。

TLDR AI·6月24日·★★★★

Dependabot の Python 3.9 サポート終了と新バージョン対応

GitHub が提供する依存関係管理ツール「Dependabot」は、サポート期限が切れた Python 3.9 の利用を廃止しました。引き続き Python 3.9 を使用すると更新用プルリクエストが作成されなくなるリスクがあるため、2026 年 5 月時点で最新となる Python 3.14 へのアップグレードが必要です。

GitHub Changelog·6月24日

AI、オープンツール、人間をループに組み込みながら huggingface_hub を毎週リリース

Hugging Face は、AI とオープンツールの活用に加え、人間のフィードバックをループに組み込むことで、huggingface_hub の毎週の更新を可能にした。

Hugging Face Blog·6月23日

SpaceX、オープンソース AI ラボの Reflection AI と計算リソース契約を締結

宇宙企業 SpaceX が、オープンソース AI 研究機関である Reflection AI と計算資源の利用に関する契約を結びました。

TechCrunch AI·6月23日

Hugging Face に PP-OCRv6 を公開：150 万パラメータから 3450 万パラメータへ拡張した 50 カ国語対応 OCR

Hugging Face が、PP-OCRv6 モデルを公開しました。このモデルは、パラメータ数を 150 万から 3450 万に増やすことで、50 の言語に対応する高精度な OCR（光学文字認識）機能を実現しています。

Hugging Face Blog·6月22日·★★★★

OpenClaw リポジトリのトリアージをローカルモデルで無料で行えるようになりました！

Hugging Face が、OpenClaw リポジトリの内容をトリアージするためにローカルモデルを利用する仕組みを無料で提供開始した。

Hugging Face Blog·6月22日

Cisco AI、FAPO（パイプライン対応プロンプト最適化）を発表：ステップごとの失敗特定とClaude Codeによるオーケストレーションを実現

Cisco AIは、LLMアプリケーションの信頼性向上を目的とした「FAPO」というシステムを導入した。これはClaude Codeを活用し、多段階パイプラインにおける各ステップの失敗箇所を特定しながらプロンプトを自動最適化する技術である。

MarkTechPost·6月21日·★★★★

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。

Allen AI (AI2)·6月18日·★★★★

エージェント性は十分か？独自ツールを用いたオープンモデルのベンチマーク調査

Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。

Hugging Face Blog·6月18日·★★★★

Hugging Face Hub からロボットハードウェアへ：Strands Agents と LeRobot の連携

Hugging Face が、同社のプラットフォーム上で開発された Strands Agents および LeRobot を活用し、AI モデルを直接ロボットハードウェアに展開する取り組みを発表した。

Hugging Face Blog·6月17日·★★★★

eve の紹介：エージェント構築・実行・スケーリングのためのオープンソースフレームワーク

Vercel は、生産環境での動作に必要な部品を組立ずに定義だけでエージェントを構築できるオープンソースフレームワーク「eve」を発表した。同社は自社のエージェント開発にこのフレームワークを採用している。

Vercel Blog·6月17日·★★★★

Android 17 が AI エージェント統合を拡大（8 分読了）

Google は Android 17 で AppFunctions と Android MCP を導入し、オンデバイス AI エージェントがアプリからツールを発見・実行できる機能を追加した。これはプラットフォーム全体での AI 統合を深める「インテリジェンスシステム」への移行の一環である。

TLDR AI·6月17日·★★★★

エージェント構築・運用・スケーリングのためのオープンソースフレームワーク「eve」の公開

Vercel が、ファイル構成でエージェントを定義し、耐久性実行やサンドボックス機能などを備えたオープンソースフレームワーク「eve」を一般プレビューとして発表した。

Vercel Blog·6月17日·★★★★

Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format（OKF）」を発表

Google Cloud は、LLM の知識不足という課題に対処するため、表スキーマやメトリック定義などを整理した形式を標準化するオープン仕様の「Open Knowledge Format（OKF）」を発表しました。これにより、AI エージェントが散在する情報を統合的に活用できるようになります。

MarkTechPost·6月16日·★★★★

レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法

MarkTechPost は、Docling Parse を使用して PDF ドキュメントの詳細な構造レベルで分析するワークフローの構築方法を解説しています。このチュートリアルでは、安定した Python 環境の準備や Colab の依存関係問題への対処法を説明し、テキストや表、画像を含むカスタム多ページ PDF を生成する方法を示します。その後、Docling Parse で単語や文字、行を抽出して座標情報を取得し、可視化オーバーレイを描画して構造化された JSON や CSV ファイルとして保存する手順を紹介しています。

MarkTechPost·6月16日

1 / 3次へ →

#open source のAIニュース

アント・グループ傘下のエンボディドAI企業「Robbyant」が、密集空間知覚向け10億パラメータのビジョン基盤モデル「LingBot-Vision」をオープンソース化

Liquid AI が推論モデルの無限ループを防止する新手法「Antidoom」をオープンソース化

2026年第1四半期イノベーショングラフ更新：オープンソース協力が世界で加速

Vercel、オープンソース認証ライブラリ「Better Auth」の買収を発表し加速化を推進

2026 年中時点の CLI コーディングエージェントの現状（37 分読了）

Interfaze が拡散型 ASR モデル「diffusion-gemma-asr-small」を公開、6 か国語の並列ノイズ除去デコーダーで音声認識を実現

アリババのページエージェント：DOM を介して自然言語で Web インターフェースを制御する JavaScript 内蔵 GUI エージェント

Simon Willison Blog の llm-coding-agent 0.1a0 リリース

大規模モジュラー LLM：デンマーク基盤モデルプロジェクトが FlexOlmo を活用し、機密データを共有せずに専門知識を集約する方法

Google Cloud の力を活用した VS Code での ML 開発：Workbench エクステンションが利用可能に

Ahmad Osman が語る、ローカル AI の追い上げの理由

Meta AI、非侵襲型脳からテキストへ変換する「Brain2Qwerty v2」を公開し、タイピング中の文章を61%の単語精度で復元

Vercel オープンソースプログラム：2026 年春期コホート募集開始

EverMind が公開したオープンソースの Markdown フォーカス型エージェントメモリランタイム「EverOS」を紹介

[AINews] メタハーネスの夏が到来

ブラウザ互換性データベースをSQLite化

ツール、メモリ、権限、スキル、マルチエージェント協調を備えた OpenHarness スタイルのエージェントランタイム設計方法

Fluree DB (GitHub Repo)

Unlimited OCR Works（GitHub リポジトリ）

Dependabot の Python 3.9 サポート終了と新バージョン対応

AI、オープンツール、人間をループに組み込みながら huggingface_hub を毎週リリース

SpaceX、オープンソース AI ラボの Reflection AI と計算リソース契約を締結

Hugging Face に PP-OCRv6 を公開：150 万パラメータから 3450 万パラメータへ拡張した 50 カ国語対応 OCR

OpenClaw リポジトリのトリアージをローカルモデルで無料で行えるようになりました！

Cisco AI、FAPO（パイプライン対応プロンプト最適化）を発表：ステップごとの失敗特定とClaude Codeによるオーケストレーションを実現

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

エージェント性は十分か？独自ツールを用いたオープンモデルのベンチマーク調査

Hugging Face Hub からロボットハードウェアへ：Strands Agents と LeRobot の連携

eve の紹介：エージェント構築・実行・スケーリングのためのオープンソースフレームワーク

Android 17 が AI エージェント統合を拡大（8 分読了）

エージェント構築・運用・スケーリングのためのオープンソースフレームワーク「eve」の公開

Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format（OKF）」を発表

レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法

OLMO-EVAL：モデル開発ループのための評価ワークベンチ（7 分読）

MiniMax のスパースアテンション技術が百万トークンコンテキストを実現（GitHub リポジトリ）

カウント・アンイシング（2 分読了）：テキストガイド付き汎用オブジェクト計数モデルの提案

Pyodide で利用可能な WASM ウィールを PyPI に公開する方法

city2graph、OSMnx、PyTorch Geometricを用いた都市機能推論のための空間グラフニューラルネットワークの実装チュートリアル

OLMO-EVAL：モデル開発ループのための評価ワークベンチ

シャオミのオープンソース・エージェント型 AI コーディングハルネス「MiMo Code」が、200 ステップを超える超長尺タスクにおいて Claude Code を上回る

データセット 1.0a33 のリリース

Cohere が開発者向けコード生成モデル「North Mini Code」を発表：30B パラメータの MoE アーキテクチャで 3B アクティブ

DiffusionGemma：Google の高速テキスト生成モデルが再登場

DiffusionGemma：テキスト生成が4倍高速化

退屈な PDF タスクを自動化する Python スクリプト 5 つ

FlashMemory DeepSeek-V4 リトリーバー（GitHub リポジトリ）

Pinecone が SaaS および BYOC 向けのオープンソース監視スタック「Full Observability」を発表

マイク不要で Amazon Nova Sonic ボイスエージェントを大規模に評価可能に

Datasette Agent Edit 0.1a0 のリリース

Harness-1 の紹介：gpt-oss-20b を基盤とし、状態管理型検索ハネス内で強化学習を用いて訓練された 20B パラメータの検索サブエージェント