#open source ai のAIニュース

18件の記事

Datalab が 9B オープンウェイトビジョンモデル「lift」をリリース:スキーマを用いた PDF から構造化 JSON を抽出

Datalab は、PDF や画像からスキーマに基づいて構造化 JSON を抽出する専用ビジョンモデル「lift」を公開した。この 9B パラメータのオープンウェイトモデルは、225 ドキュメントのベンチマークでフィールド精度 90.2% を達成している。

MarkTechPost·6月24日·★★★★

SpaceX、オープンソースAIスタートアップのReflectionと最大63億ドルの計算資源契約を締結

SpaceXは、Open-source AIスタートアップであるReflection AIと、最大63億ドル規模の契約を結びました。これにより、ReflectionはSpaceXが保有するスーパーコンピュータ「Project Colossus」およびNvidia製GB300を活用してオープンソースAIモデルの学習が可能になります。

TLDR AI·6月23日·★★★★

GLM-5.2 はオープンエージェントにおける大きな一歩となる

Z.ai が Claude Fable 5 の輸出規制の影響下で最新モデル GLM-5.2 を発表し、これはオープンエージェント分野において重要な進展であると評価されている。

Interconnects·6月22日·★★★★

Hermes エージェントが非同期サブエージェントを追加、親チャットのブロックを解消

Nous Research はオープンソースの個人エージェント「Hermes Agent」を更新し、委任ツールで子エージェント(サブエージェント)を非同期実行可能にした。これにより、委任された作業が親チャットの実行をブロック不再するようになった。

MarkTechPost·6月16日·★★★★

Zyphra が Zamba2-VL を公開:ハイブリッド Mamba2–Transformer 型ビジョン言語モデルが初トークン生成時間を約 10 倍短縮

Zyphra は、画像とテキストを同時に処理するオープンソースのビジョン言語モデル「Zamba2-VL」シリーズ(パラメータ数 1.2B/2.7B/7B)を公開した。同社は従来の密集型 Transformer に代わり、ハイブリッド状態空間設計を採用し、競合と同等の精度を維持しつつ初トークン生成時間を約 10 倍短縮する技術を実現した。

MarkTechPost·6月12日·★★★★

Nous Research が Hermes エージェントのプロファイルビルダーを公開:アイデンティティ、モデル、スキル、MCP サーバーをワンダッシュボードで管理

Nous Research は、Hermes エージェントの作成プロセスを簡素化するプロファイルビルダーを公開した。これにより、ユーザーは CLI 操作ではなく、単一のガイド付きフローを通じてエージェントのアイデンティティ定義、モデル選択、スキル追加、MCP サーバー接続をワンダッシュボードで完結できるようになった。

MarkTechPost·6月11日

MIT の研究者が AI モデルにチャートの解釈を教示

MIT の研究者らは、市場の意思決定を加速するため、生成 AI モデルが視覚・数値・言語情報を統合してチャートを正確に解釈する技術を研究している。

MIT ML News·6月3日·★★★★

オープンモデル生態系がもたらす複合効果について

主要な先端モデル構築には、最終的な大規模モデルの訓練計算よりも研究開発コストの方が多くを占める。中国のような主要プレイヤーがすべてオープンである生態系では、この構造がコスト面で有意義な優位性をもたらし、ラボがより長く開発を継続できる可能性を示唆している。

Interconnects·5月13日·★★★★

設計思想としてオープン:Ai2 が NSF OMAI の完全な AI インフラを稼働

非営利研究機関 Ai2 は、NSF(米国科学財団)の OMAI 計算リソースを活用し、再利用可能なモデルやデータを提供する完全なオープン AI 研究エコシステムを構築した。これにより、科学的発見の加速を目指す。

Allen AI (AI2)·5月7日·★★★★

Molmo が指差して行動する能力を習得

AI 研究チームは、視覚理解から視覚的行動へと拡張した「MolmoPoint」および「MolmoWeb」を発表し、モデルが世界を見ながら指差しやナビゲーション、対話を行えるようになり、研究者にオープンなツールを提供しました。

Allen AI (AI2)·4月29日·★★★★

あなたのハネス、あなたのメモリ

エージェント構築の主流であるAgent harnessは、メモリと密接に関連する。クローズドなハネスを使用すると、サードパーティにメモリの制御を委ねることになり、強力なロックインを生む。そのため、ユーザーが自身のメモリを所有できるよう、ハネスとメモリはオープンであるべきだと主張する。

LangChain Blog·4月22日·★★★★

2026年中盤におけるオープンモデルへの私の予測

著者は、オープンソースモデルがクローズドラボのモデルに追いつけるかという問いについて、否定的な見解を示す。両者の能力差が縮まることはあっても完全には追いつかず、長期的な安定したバランスの形成時期は不透明であると予測している。

Interconnects·4月16日·★★★★

サイバー戦争のスケーリング法則、AI自動化の台頭、GDP予測のパズル

Jack Clarkは、AIシステムの知能向上がサイバー攻撃能力を高める「スケーリング法則」が存在すると指摘する。また、AI自動化の拡大とGDP予測における課題について言及し、技術がセキュリティおよび経済予測に与える影響を考察している。

Import AI·4月6日·★★★★

Holo3:コンピュータ利用の新たなフロンティアを切り拓く

Holo3が、コンピュータ利用の新たなフロンティアを切り拓く技術を発表した。同技術は、ユーザー体験の革新を目指すものである。

Hugging Face Blog·4月2日·★★★★

ファルコン・パーセプション

AI企業がFalcon Perceptionを発表した。この技術は高度な視覚認識システムであり、自律走行車や監視システムへの応用が期待される。

Hugging Face Blog·4月1日·★★★★

Mamba-3:推論専用SSMの登場

Mambaチームは、推論に特化した状態空間モデル「Mamba-3」を発表した。このモデルはTransformerよりデコード速度が速く、前版Mamba-2よりも性能が高い。また、初日からオープンソースとして公開されている。

Together AI Blog·3月17日·★★★★

AI研究所が増殖する理由

AI研究所が14ある状況で、各組織が他者を信頼せず自ら開発しようとする結果、15番目の研究所が生まれるという、標準化のジレンマを描いた風刺。

Andrej Karpathy 厳選·2月23日

テキストから画像生成モデルの学習設計:アブレーション研究からの知見

研究者がテキストから画像生成モデルの学習設計を検証し、アブレーション研究を通じて効果的な学習手法を特定した。

Hugging Face Blog·2月3日·★★★★