#datalab のAIニュース
2件の記事
2026 年版オープンソース PDF から JSON への変換モデルガイド
MarkTechPost は、エンタープライズデータが PDF やスキャン文書に多く存在する現状を踏まえ、大規模言語モデルやエージェントが利用できるよう構造化された JSON へ変換するためのオープンソース抽出モデルの活用方法を解説している。
MarkTechPost·7月5日·★★★★
Datalab が 9B オープンウェイトビジョンモデル「lift」をリリース:スキーマを用いた PDF から構造化 JSON を抽出
Datalab は、PDF や画像からスキーマに基づいて構造化 JSON を抽出する専用ビジョンモデル「lift」を公開した。この 9B パラメータのオープンウェイトモデルは、225 ドキュメントのベンチマークでフィールド精度 90.2% を達成している。
MarkTechPost·6月24日·★★★★