#pdf解析 のAIニュース
4件の記事
ブラウザでPDFテキストを抽出する「LiteParse for the web」
開発者はLlamaIndexの「LiteParse」をブラウザ環境へ移植し、PDFテキスト抽出ツールを公開した。AIモデルを使用せず従来の解析手法で動作する。
Simon Willison Blog·4月24日
銀行PDF表抽出の再設計:Javaによる多層的アプローチ
筆者らは、銀行PDF明細書の表抽出で標準Javaパーサーが失敗する課題に対し、ストリーム解析・OCR・選択的機械学習を組み合わせた階層型アプローチを再設計し、抽出精度を向上させた。
InfoQ·4月21日·★★★★
LlamaIndex、AIエージェント向け「LiteParse」をリリース:CLI対応のTypeScriptネイティブ空間PDF解析ライブラリ
LlamaIndexは、RAG開発のボトルネックである複雑なPDF変換を解決するため、「LiteParse」というローカル実行型のオープンソース解析ライブラリを公開した。
MarkTechPost·3月20日·★★★★
OpenAIの1兆ドル規模の賭け、ウイルス生成、地球モデリング、学習データへの支払い
OpenAIは大規模投資を計画し、LandingAIはPDFをLLM対応のマークダウンに変換するADEを発表した。
The Batch·10月1日