#データアノテーションのAIニュース

6件の記事

Meta、Ray-Ban Meta ユーザーの性的映像を報告した下請け業者を契約解除

Meta は、スマートグラス「Ray-Ban Meta」で撮影されたユーザーの性的な私的映像をデータ注釈作業員が確認したと報告を受けた企業との契約を、約 2 か月後に解消した。

MetaはAIスマートヘッドセットの性能向上のため、ナイロビのデータ作業員に欧米家庭の個人映像（ヌードシーンや銀行情報を含む）を不十分な保護措置で送信している。欧州のプライバシー規制当局が調査する可能性がある。

Apple社は、App Storeの検索関連性を最大化するため、ユーザーの行動データとテキスト関連性を組み合わせた手法を開発した。専門家によるテキスト関連性ラベルの不足を補うため、大規模言語モデル（LLM）を活用して検索結果の品質を向上させている。

Bedrock RoboticsはAWSと連携し、建設現場の映像を分析・ラベル生成するビジョン言語モデルを活用し、物理AIシステムのデータアノテーション効率を向上させています。

現代の深層学習モデル訓練において、高品質なデータは不可欠な燃料である。多くのタスク固有のラベル付きデータは、分類作業など人間による注釈付けから得られている。

Googleが昨年公開した「GoEmotions」データセット（Redditコメント5.8万件を27の感情で分類した人間によるラベル付きデータ）の30%が誤ってラベル付けされていることが判明した。