メインコンテンツへスキップ

#構造化データ のAIニュース

6件の記事

HTML テーブル抽出ツールの紹介

Simon Willison が、ブラウザから貼り付けたリッチテキストに含まれるテーブルを検出し、HTML や Markdown などの形式に変換するツール「HTML table extractor」を発表した。

Simon Willison Blog·6月30日

Visa と ChatGPT の統合により AI エージェントが小売購入を可能に

Visa が決済インフラを ChatGPT に連携させ、AI エージェントが商品推薦から決済実行まで人間を介さず自動処理する機能を導入した。

AI News·6月11日·★★★★★

Issueフィールド:構造化された課題メタデータがパブリックプレビューで利用可能に

GitHubが選択された組織向けにIssueフィールドをパブリックプレビューで公開した。これはラベルベースの非構造化データを置き換え、型付けされた組織全体のメタデータを提供し、検索・レポート作成・リポジトリ間の一貫性を実現する。

GitHub Changelog·3月12日

Nimbleが4700万ドルを調達し、AIエージェントにリアルタイムWebデータへのアクセスを提供

NimbleはAIエージェントでWebを検索し、結果を検証・整理してデータベースのように問い合わせ可能な表形式に変換するサービスを開発。

TechCrunch AI·2月24日·★★★★

単一抽出器を超えて:LLM事前学習のためのHTMLからテキスト抽出の再考

大規模LLM事前学習データセット構築の初期段階であるHTMLからのテキスト抽出について、既存の単一抽出器の限界を指摘し、多様なウェブコンテンツに適応する抽出方法の必要性を提言する研究。

Apple Machine Learning·2月24日·★★★★

チェーン・オブ・テーブル:表理解のための推論チェーンにおける表の進化

Google Cloud AIチームの研究者が、表データを段階的に拡張・推論する「チェーン・オブ・テーブル」手法を発表した。この手法は表理解タスクの精度向上を目指すもので、AIによるデータ分析能力の進展を示している。

Google Research Blog·3月12日·★★★★