#データアノテーション のAIニュース
6件の記事
Meta、Ray-Ban Meta ユーザーの性的映像を報告した下請け業者を契約解除
Meta は、スマートグラス「Ray-Ban Meta」で撮影されたユーザーの性的な私的映像をデータ注釈作業員が確認したと報告を受けた企業との契約を、約 2 か月後に解消した。
Ars Technica AI·5月1日·★★★★
Meta、AIメガネの個人映像をケニアに送信、保護措置は不十分 - 欧州のプライバシー規制当局が調査の可能性
MetaはAIスマートヘッドセットの性能向上のため、ナイロビのデータ作業員に欧米家庭の個人映像(ヌードシーンや銀行情報を含む)を不十分な保護措置で送信している。欧州のプライバシー規制当局が調査する可能性がある。
The Decoder·3月3日·★★★★
検索関連性のスケーリング:LLM生成判定によるApp Storeランキングの強化
Apple社は、App Storeの検索関連性を最大化するため、ユーザーの行動データとテキスト関連性を組み合わせた手法を開発した。専門家によるテキスト関連性ラベルの不足を補うため、大規模言語モデル(LLM)を活用して検索結果の品質を向上させている。
Apple Machine Learning·2月27日·★★★★
ビジョン言語モデルを用いたデータアノテーションの拡張による物理AIシステムの強化
Bedrock RoboticsはAWSと連携し、建設現場の映像を分析・ラベル生成するビジョン言語モデルを活用し、物理AIシステムのデータアノテーション効率を向上させています。
AWS Machine Learning Blog·2月24日·★★★★
高品質な人間データについて考える
現代の深層学習モデル訓練において、高品質なデータは不可欠な燃料である。多くのタスク固有のラベル付きデータは、分類作業など人間による注釈付けから得られている。
Lilian Weng·2月5日·★★★★
Googleの感情データセットの30%が誤ってラベル付けされている
Googleが昨年公開した「GoEmotions」データセット(Redditコメント5.8万件を27の感情で分類した人間によるラベル付きデータ)の30%が誤ってラベル付けされていることが判明した。
Surge AI Blog·7月11日