#データガバナンス のAIニュース
25件の記事
フロンティア・エコシステムはオープンであるべき:Databricks の Matei Zaharia 氏と Reynold Xin 氏が語る理由
Databricks の Matei Zaharia 氏と Reynold Xin 氏は、AI エンジニアリング分野の主要カンファレンスで、コードエージェント層やデータベース設計を見直すなど、フロンティア・エコシステムがオープンである必要性を強調した。
トランプ政権の新たな国勢調査データ規則は政策上の大惨事である
トランプ政権が専門家の意見を聞かずに国勢調査データの公開ルールを変更した。この変更により、再選定や自然災害対応などの信頼できる公的データが減少する恐れがある。
datasette-acl 0.6a0 のリリース
Alex Garcia 氏らが中心となり、データセットのテーブル単位での権限管理から、一般リソース共有システムへと拡張された「datasette-acl」バージョン 0.6a0 が公開されました。これにより、複数ユーザー環境でリソースへのアクセス制御が細かく行えるようになります。
主権 AI はモデルではなくサプライチェーンの問題である(20 分読)
TLDR AI が、主権 AI の実現には単に高性能なモデルを開発するだけでなく、計算資源やデータ流通を含むサプライチェーン全体の課題解決が不可欠であると指摘している。
マイクロソフト、データ保持を理由に従業員へのClaude Fableの利用を制限
Anthropicが新モデル「Claude Fable」を発表したが、Microsoftは同社のデータ保持要件を懸念し、社内の従業員による利用を制限した。
警察官が Flock を悪用して元恋人をストーキングし逮捕される事例が相次ぐ
フロリダ州の警官らが、Flock という自動ナンバープレート読み取りシステムを不正に利用し、元恋人やその家族の車両情報を無断で検索する行為を行い、逮捕されたケースが複数報告されている。
OpenAI が経済研究交換プラットフォームを立ち上げ
OpenAI は、経済分野の研究開発を促進するための新しい交換プラットフォーム「Economic Research Exchange」の運用を開始した。
イーロン・マスク氏、X のデータ処理に関する FTC 監査からの回避を試みるも再挑戦
FTC は X(旧 Twitter)に対し、2013 年から 2019 年にかけての電話番号誤収集問題を受け、20 年間のデータ使用制限と独立監査を命じている。イーロン・マスク氏はこの厳格な命令から逃れようとしているが、批判派は回避を防ぎたいと考えている。
E.ON が SAP S/4HANA を活用し AI で送電網を近代化
エネルギー大手 E.ON は、SAP S/4HANA でグリッドデータを標準化することでインフラの近代化を実現し、AI 導入を推進している。
Snowflakeとdbtでモデルの依存関係にガバナンスを効かせる
オハイオ州デイトン市がFlockカメラをゴミ袋で覆う
オハイオ州デイトン市は、警察がカメラの稼働状況や撤去権限に不確実性を感じたため、住民からの抗議を受け、Flock社の自動ナンバープレート読み取りカメラを黒いゴミ袋で覆った。
Google Cloud、豪州の取引ファンドのインフラを削除
Google Cloud は豪州の1240億ドル規模のファンドからデータを誤って削除したが、サードパーティ製のバックアップにより被害は免れた。同社CEOが責任を認め、地域複製機能でも削除を防げなかったことを認めた。
Databricks Unity Catalog と Amazon SageMaker AI を用いた大規模言語モデルのファインチューニング
Databricks の Unity Catalog と Amazon SageMaker AI を組み合わせて大規模言語モデルをファインチューニングする際、データガバナンスと権限管理における課題について解説している。
Uber、16,000データセットと10PB以上のHiveデータウェアハウスを分散化し、ダウンタイムゼロの分析を実現
Uberは、ポインタベースの連携を用いて、16,000のデータセットと10ペタバイト以上のHiveデータウェアハウスを分散化した。この移行により、ダウンタイムゼロ、厳格なアクセス制御、改善されたガバナンス、分析および機械学習ワークロードのためのスケーラブルなドメイン固有データセットを実現した。
野生生物保護警察がFlockカメラ数千台をICEのために検索
フロリダ州魚類野生生物保護委員会警察が、移民関税執行局のためにFlockのAI車両ナンバープレートスキャンカメラで数十件のナンバープレート検索を実施している。契約のないICEが地方機関を通じて技術にアクセスする実態が明らかになった。
「ピック・アンド・ミックス」カスタムリージョン:Cloudflareが詳細なデータ所在地制御を導入
Cloudflareがカスタムリージョンを発表し、顧客が国や地域ごとにデータセンターを選択してデータ処理場所を細かく定義できるようにした。これにより、TLS終端やアプリケーション層処理を選択した地理的範囲内に留め、コンプライアンスと制御を確保できる。
機密AIファクトリーのためのゼロトラストアーキテクチャ構築
NVIDIAは、機密データを扱うAIファクトリー向けにゼロトラストセキュリティアーキテクチャを提案している。企業の重要なデータの多くはパブリッククラウド外に存在するため、機密情報保護を目的とした新しいセキュリティ枠組みが必要とされている。
プレゼンテーション:データメッシュ実践記 - 構想から実装までの道のり
Anurag Kale氏がHorse Powertrain社における集中型データボトルネックから分散型データメッシュアーキテクチャへの移行を説明。ドメイン所有権、データ製品化、セルフサービスプラットフォーム、連合ガバナンスの4本柱で自律チームを強化する方法を解説。
効果的なAI実現のため、保険業界はデータ環境を整える必要がある
Autorek社の報告書によると、保険業界の250人の管理者を対象とした調査で、内部プロセスの非効率性がAIの効果的な導入を妨げていると指摘している。
Amazon SageMaker Unified StudioとSageMaker Catalogを使用したオフライン機能ストアの構築
Amazonは、SageMaker Unified StudioとSageMaker Catalogを使用して、機械学習機能の構築・管理を効率化するオフライン機能ストアの構築方法を紹介している。これにより、組織は断片化した機能パイプラインやデータ定義の不一致などの課題を解決できる。
キャピタル・ワンがAI対応データエコシステムを構築
金融サービス大手のキャピタル・ワンは、AIシステムの基盤として管理・統制可能なデータを重視し、AI対応のデータエコシステム構築を進めている。
切断されたクラウドがAIデータガバナンスを向上させる方法
規制強化下で企業がインフラを見直す中、切断されたクラウドはAIデータガバナンスの改善を目指し、隔離環境での事業継続性確保が重要になっている。
データ品質を全段階で確保する方法:コスト発生前に問題を捕捉する実践ガイド
データ品質を全段階で確保するフレームワークを提供し、早期に問題を発見し、信頼を維持し、実際に機能するプラットフォームを構築する方法を解説します。
LayerXのデータ基盤の未来を語るために、最初の1ヶ月で実施した3つの取り組み
LayerXのデータグループが、事業成果に直結するデータ基盤の構築に向け、入社1ヶ月間で実施した3つの具体的な取り組みを紹介している。
データチームはヘルプデスクであってはならない:データと共にコンパスを活用せよ
コンパスが主要なデータウェアハウス全てをサポート。自社データを接続し、ガバナンスを維持したまま、データを移動させずにSlack内でAIによる回答を得られる。