#データレイク のAIニュース

3件の記事

Amazon QuickSight に S3 Tables を導入し、データレイクを AI 対応分析へ

AWS は、データ可視化と自然言語対話機能を備えた分析サービス「Amazon QuickSight」に、新しいデータソース「S3 Tables」を追加した。これにより、組織は専門知識がなくてもデータレイク上のデータを直接活用し、AI を駆使した意思決定を加速できる。

AWS Machine Learning Blog·5月5日·★★★★

UberがIngestionNextを発表:ストリーミング優先のデータレイクで遅延と計算量を25%削減

Uberがストリーミング優先のデータレイク取り込みプラットフォーム「IngestionNext」を発表した。Kafka、Flink、Apache Hudiを基盤とし、データ遅延を数時間から数分に短縮し、計算使用量を25%削減する。数千のデータセットをサポートし、グローバルな分析、実験、機械学習ワークロードを高速化する。

InfoQ·3月25日·★★★★

Uberのハイブリッドクラウドデータ:エンジニアが極大規模レプリケーションの課題を解決

UberのHiveSyncチームは、ハイブリッドクラウドとオンプレミスデータレーク間のマルチペタバイトレプリケーションを処理するため、Hadoop Distcpを最適化した。タスク並列化、小規模転送用Uberジョブ、可観測性向上により、レプリケーション容量を5倍に拡大し、オンプレミスからクラウドへのシームレスな移行を実現した。

InfoQ·3月3日