#document intelligence のAIニュース

6件の記事

ハンティントン銀行：AWS を活用し 4 億件超の文書から機密データを除去

米国トップ10 のハンティントン銀行は、約 10 年間で蓄積された 4 億件を超える文書から顧客の機密情報を体系的に特定・削除する課題に対し、AWS の技術を活用して解決した。

Unlimited OCR Works（GitHub リポジトリ）

DeepSeek OCR をベースに定数 KV キャッシュ設計を組み合わせ、人間の作業記憶を模倣する「Unlimited OCR」モデルが開発された。この技術により、32K の最大長制限下で数十ページの文書を単一の順次処理で転写可能となり、音声認識や翻訳タスクにも応用できる。

TLDR AI·6月24日·★★★★

Mistral OCR 4：文書知能のための最先端 OCR ツール（9 分読了）

Mistral は、170 か国語に対応し、エンタープライズ検索や構造化データパイプラインに統合可能な文書知能ツール「OCR 4」をリリースした。同ツールは単一コンテナで展開可能であり、低リソース言語を含む高精度な抽出と他システムより 4 倍の高速処理を実現している。

TLDR AI·6月24日·★★★★

レイアウト認識ドキュメントインテリジェンスのための Docling Parse を用いた解析パイプライン構築方法

MarkTechPost は、Docling Parse を使用して PDF ドキュメントの詳細な構造レベルで分析するワークフローの構築方法を解説しています。このチュートリアルでは、安定した Python 環境の準備や Colab の依存関係問題への対処法を説明し、テキストや表、画像を含むカスタム多ページ PDF を生成する方法を示します。その後、Docling Parse で単語や文字、行を抽出して座標情報を取得し、可視化オーバーレイを描画して構造化された JSON や CSV ファイルとして保存する手順を紹介しています。

MarkTechPost·6月16日

PDF から洞察へ：AWS 生成 AI サービスを用いたインテリジェントなドキュメント処理パイプラインの構築

AWS は、従来の OCR では文脈や意味を理解できない課題に対し、生成 AI を活用した新しいドキュメント処理パイプラインを提案し、手作業によるボトルネック解消とコスト削減を実現するアーキテクチャを紹介している。

AWS Machine Learning Blog·6月12日·★★★★

Amazon Bedrock Data Automation のブループリント抽出精度を最適化する方法

AWS は、インボイスや契約書などの非構造化文書からの構造化データ抽出精度を向上させるため、Amazon Bedrock Data Automation の利用方法を解説した。

AWS Machine Learning Blog·6月12日·★★★★