#vision のAIニュース

12件の記事

物理的 AI アプリケーション向け NVIDIA GPU における BEV ポーリングの高速化

NVIDIA は、物理的 AI アプリケーションにおいて BEV(Bird's Eye View)ポーリング処理を NVIDIA GPU で加速する手法を発表した。これにより、自動運転やロボティクスなどのリアルタイム処理性能が向上する。

NVIDIA Developer Blog·6月25日·★★★★

Hugging Face に PP-OCRv6 を公開:150 万パラメータから 3450 万パラメータへ拡張した 50 カ国語対応 OCR

Hugging Face が、PP-OCRv6 モデルを公開しました。このモデルは、パラメータ数を 150 万から 3450 万に増やすことで、50 の言語に対応する高精度な OCR(光学文字認識)機能を実現しています。

Hugging Face Blog·6月22日·★★★★

ロレアル、ChatGPTにメイベルのバーチャル試着機能を導入

ロレアルはオープンAIと提携し、2026年のVivaTechで発表された通り、メイベルニューヨークのバーチャルメイクアップ試着機能をChatGPTに統合した。この協力は消費者向けショッピングツールや広告パイロット、研究開発など多岐にわたる領域をカバーする。

AI News·6月22日·★★★★

Apple 2027 年噂:AI 搭載カメラ付き AirPods と第 2 世代折りたたみ iPhone

ブルームバーグのマーク・ガーマン記者は、Apple が 2027 年後半にカメラを搭載した AirPods を発売する計画があると報じた。また、同社は第 2 世代となる折りたたみ iPhone の開発も進めているとされている。

The Verge AI·6月17日·★★★★

Anthropic、画像理解能力で OpenAI に追いつく

Anthropic は火曜日に「Claude Mythos 5」と「Claude Fable 5」の 2 つの新モデルを公開し、画像理解能力において OpenAI と同等の水準に達したと発表した。

Understanding AI·6月11日·★★★★

このスマートな鳥の餌やり器が、私の裏庭のドラマをより多く捉える

The Verge AI は、サウスカロライナ州の低地に住む著者が、オスプレイやロゼート・スプーンビルなど多様な鳥類を観察するために導入したスマートな鳥の餌やり器について紹介している。

The Verge AI·5月27日

AI搭載カメラ付きAirPodsの量産直前、Appleが試作機テスト中

ブルームバーグによると、アップルはAI機能を持つカメラ内蔵型AirPodsの試作機をテストしており、量産前の設計検証段階にある。

The Verge AI·5月8日·★★★★

Meta、Ray-Ban Meta ユーザーの性的映像を報告した下請け業者を契約解除

Meta は、スマートグラス「Ray-Ban Meta」で撮影されたユーザーの性的な私的映像をデータ注釈作業員が確認したと報告を受けた企業との契約を、約 2 か月後に解消した。

Ars Technica AI·5月1日·★★★★

Seed Research|Depth Anything 3:単一Transformerアーキテクチャによる任意視点の空間再構築を実現

Seed Researchが、単一のTransformerアーキテクチャを用いて、任意の視点からの空間再構築を可能にする「Depth Anything 3」を発表した。この技術は、単眼深度推定と多視点再構築の技術的課題を克服するものである。

字节跳动Seed·11月27日·★★★★

Stability AIがAmazon Bedrockに画像サービスを提供、エンタープライズ向けインフラでエンドツーエンドのクリエイティブ制御を実現

Stability AIは、画像編集ツールをAPIサービスとしてAmazon Bedrockで提供開始した。これにより、AWSインフラ上でインペインティングやスタイル転送などの詳細な編集制御が可能となる。

Stability AI·9月19日·★★★★

全身条件付き自己中心視点動画予測

PEVAモデルは、過去の動画フレームと3Dポーズ動作を入力として次のフレームを予測し、原子行動の生成、反事実シミュレーション、長時間動画の実現に成功した。

Berkeley AI Research·7月1日·★★★★

Stable Video 4D 2.0:単一動画からの高忠実度新視点および4D生成の新アップグレード

Stability AIは、動画から高品質な4D生成と新視点合成を実現する「Stable Video 4D 2.0」を公開した。同モデルは最新技術を実現し、商業利用を含むStability AIコミュニティライセンスの下でHugging FaceおよびGitHubからダウンロード可能となった。

Stability AI·5月21日·★★★★