IEEE/CVF コンピュータビジョン・パターン認識会議(CVPR)2026
Apple は 2026 年 CVPR で、手話生成 AI やオンデバイス生成技術を含む複数のワークショップで基調講演を行い、研究コミュニティへの貢献と最新技術を公開する。
キーポイント
主要なワークショップでの登壇発表
Apple の研究者(Colin Lea, Oncel Tuzel, Lu Jiang)が、手話生成 AI(GenSign)、効率的な深層学習(ECV)、オンデバイス生成(EDGE)の 3 つの関連ワークショップで基調講演や招待講演を行う。
展示ブースでのデモ公開
コロラド・コンベンションセンター内の Apple ブース(#231)にて、6 月 5 日から 7 日にかけて期間限定で研究デモやポスター発表を実施する。
特定技術分野への注力
手話支援、計算効率化、オンデバイスでの生成処理といった、アクセシビリティとリソース制約下での AI 実装に重点を置いた研究が強調されている。
Apple の展示ブース情報
Apple は会場 #231 にブースを出展し、6月5日から7日の午前10時から午後3時(日曜日は午後3時まで)の間に来場者が立ち寄れる。
主要な発表と登壇者
Colin Lea 氏や Oncel Tuzel 氏らがジェネレーティブAI、効率的な深層学習、手話言語などのワークショップで基調講演を行い、Jiasen Lu 氏らによる「AToken」がオーラルセッションで発表される。
多様な研究トピックの展示
映像生成、空間機能知能の評価、画像圧縮、4D幾何表現、バイアス低減など、Vision と AI の広範な分野における最新の研究成果がポスターセッションで多数紹介される。
Apple の CVPR 2026 発表概要
Apple はビジュアルストリーミングアシスタントのリアルタイム評価(VSAS-Bench)、統一ビジョントークナイザー(AToken)、エンドツーエンド動画生成モデル(STARFlow-V)など、複数の主要研究を同会議で発表する。
影響分析・編集コメントを表示
影響分析
このニュースは、Apple が CVPR という頂点級カンファレンスにおいて、特にアクセシビリティとオンデバイス処理という実社会課題に直結する領域で主導的な役割を果たしていることを示しています。また、大規模モデルの生成能力を端末内で実現しようとする技術的挑戦が、業界全体で重要なトレンドとなっていることを裏付けるものです。
編集コメント
プレスリリース形式ですが、Apple が「手話生成」や「オンデバイス生成」といった具体的な社会実装課題にリソースを割いている点は、同社の AI 戦略の方向性を如実に表しています。
コンテンツタイプ:イベント
公開日:2026 年 5 月 28 日
Apple は、6 月 3 日から 7 日にコロラド州デンバーのコロラド・コンベンションセンターで開催される年次カンファレンス「IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)」で新しい研究成果を発表します。私たちは、コンピュータビジョンおよびパターン認識分野の学術界と産業界の研究コミュニティを一堂に集めるこのカンファレンスのスポンサーを務めることを誇りに思います。以下は、Apple の CVPR 2026 への参加概要です。
セクションへジャンプ:
- スケジュール
- Apple ブースでのポスター発表
- 採択論文
- 謝辞
展示会開催時間中に Apple ブース(#231)にお立ち寄りください。
記載されている時間はすべて MDT(現地時間)です:
- 金曜日、6 月 5 日:午前 10:00 – 午後 6:00
- 土曜日、6 月 6 日:午前 10:00 – 午後 6:00
- 日曜日、6 月 7 日:午前 10:00 – 午後 3:00
スケジュール
6月3日(水曜日)
- キーノート講演
- 手話のための生成 AI (GenSign) ワークショップ
- 午前9時00分 - 午後1時00分、会議室 112
- コリン・リーがワークショップ中にキーノート講演を行います。
- 招待講演
- コンピュータビジョンのための効率的なディープラーニング (ECV) ワークショップ 2026
- 午前9時00分 - 午後6時00分、会議室 502
- オンセル・トゥゼルがワークショップ中に招待講演を行います。
- 招待講演
- エッジデバイスでの効率的な生成 (EDGE) ワークショップ 2026
- 午後1時00分 - 午後6時00分、会議室 210/212
- オンセル・トゥゼルとル・ジャンがワークショップ中に招待講演を行います。
- アフィニティイベント
- コンピュータビジョンの女性たち (WiCV)
- 午後6時00分 - 午後8時00分、会議室 105 B(メンターシップディナーは別会場)
- シン・ピン(シンディー)・ファンとマギー・シャオが Apple を代表して WiCV メンターシップディナーに参加します。
6月4日(木曜日)
- 招待講演
- ビデオ大規模言語モデル (VidLLMs) ワークショップ 2026
- 午前8時30分 - 午後5時00分、会議室 3A-3D
- アフシン・デフガンがワークショップ中に招待講演を行います。
6月5日(金曜日)
- ポスターセッション
- STARFlow-V:正規化フローを用いたエンドツーエンドの動画生成モデル
- 午後4時00分 - 午後6時00分、展示ホールA & F、ポスターセッション2、#178
- Jiatao Gu, Ying Shen(イリノイ大学アーバナ・シャンペーン校), Tianrong Chen, Laurent Dinh, Yuyang Wang, Miguel Angel Bautista, David Berthelot, Josh Susskind, Shuangfei Zhai
- ポスターセッション
- 物の位置からその用途へ:マルチモーダルLLMの空間的・機能的知能を評価するベンチマーク
- 午後4時00分 - 午後6時00分、展示ホールA & F、ポスターセッション3、#453
- Le Zhang(Mila - ケベックAI研究所 モントリオール大学), Jihan Yang(ニューヨーク大学), Soundarya Krishnan, Jimit Majmudar, Hugh Ge, Prasoon Puri, Prathamesh Saraf, Shruti Bhargava, Dhivya Piraviperumal, Yinan Ling, Cindy Pan, Hong Yu, Aishwarya Agrawal(Mila - ケベックAI研究所 モントリオール大学), Andy Tseng
- ポスターセッション
- 実用的な学習画像圧縮において重要なのは何か
- 午後4時00分 - 午後6時00分、展示ホールA & F、ポスターセッション3、#457
- Kedar Tatwawadi, Parisa Rahimzadeh, Zhanghao Sun, Zhiqi Chen, Ziyun Yang, Sanjay Nair, Divija Hasteer, Oren Rippel
6月6日(土曜日)
- ポスターセッション
- Sign Language Models を用いた手話注釈のボートストラップ学習
- 午前7時30分~9時00分、展示ホールA、発見論文ポスター、#035
- Colin Lea, Vassilis Baltatzis, Raja Kushalnagar (ガローデット大学), Lorna Quandt (ガローデット大学), Leah Findlater, Connor Gillis
- ポスターセッション
- Velox: 4D 幾何学と外観の表現学習
- 午前11時45分~午後1時45分、展示ホールF、ポスターセッション4、#527
- Anagh Malik (トロント大学), Xiaoming Zhao, Dorian Chan, David Lindell (トロント大学), Oncel Tuzel, Rick Chang
- ポスターセッション
- AMUSE: エージェント型多話者理解のためのオーディオ・ビジュアルベンチマークおよびアライメントフレームワーク
- 午後4時45分~6時45分、展示ホールA、ポスターセッション4、#146
- Sanjoy Chowdhury, Karren D. Yang (Nuance Labs), Chun-Liang Li, Xudong Liu, Fartash Faghri, Pavan Kumar Anasosalu Vasu, Oncel Tuzel, Dinesh Manocha (メリーランド大学カレッジパーク校), Raviteja Vemulapalli
6月7日(日曜日)
- オラルセッション
- AToken: ビジョンのための統一トークナイザー
- 午前9時00分 - 午前10時15分、フォーシーズンズ・ボールルーム、オラールセッション5B:一般化と適応
- Jiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
- ポスターセッション
- AToken: ビジョンのための統一トークナイザー
- 午前11時45分 - 午後1時45分、展示ホールF、ポスターセッション5、#007
- Jiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
- ポスターセッション
- UniGen-1.5: 強化学習における報酬の統一による画像生成および編集の強化
- 午前11時45分 - 午後1時45分、展示ホールF、ポスターセッション5、#069
- Rui Tian (復旦大学), Mingfei Gao, Haiming Gang, Jiasen Lu, Zhe Gan, Yinfei Yang, Zuxuan Wu (復旦大学), Afshin Dehghan
- ポスターセッション
- TrajTok: 軌道トークンの学習がより優れた動画理解を可能にする
- 午前11時45分 - 午後1時45分、展示ホールF、ポスターセッション5、#240
- Chenhao Zheng (ワシントン大学), Jieyu Zhang (ワシントン大学), Oncel Tuzel, Chun-Liang Li, Ranjay Krishna (ワシントン大学)
- ポスターセッション
- DSO: バイアス緩和のための直接ステアリング最適化(Direct Steering Optimization)
- 午前11時45分 - 午後1時45分、展示ホールF、ポスターセッション6、#288
- Lucas Monteiro Paes, Niv Sivakumar, Yinong Wang (カーネギーメロン大学), Masha Fedzechkina Donaldson, Barry Theobald, Luca Zappella, Nick Apostoloff
- 発見論文ポスターセッション
- VSAS-Bench: ビジュアルストリーミングアシスタントモデルのリアルタイム評価
- 午後3時30分 - 午後5時30分、展示ホールA、ポスターセッション3、#298
- Pavan Kumar Anasosalu Vasu, Cem Koc, Fartash Faghri, Chun-Liang Li, Brian Feng, Jeff Lai, Meng Cao, Oncel Tuzel, Hadi Pour Ansari
- ポスターセッション
- Pico-Banana-400K: テキストガイドによる画像編集のための大規模データセット
- 午後3時30分 - 午後5時30分、展示ホールA、ポスターセッション6、#098
- Yusu Qian, Eli Bocek-Rivele, Liangchen Song, Jiasen Lu, Ashley Tong, Yinfei Yang, Wenze Hu, Zhe Gan
- ポスターセッション
- SO-Bench: 多モーダルLLMの構造化出力評価
- 午後3時30分 - 午後5時30分、展示ホールA、ポスターセッション6、#141
- Di Feng, Kaixin Ma, Feng Nan, Haofeng Chen, Bohan Zhai, David Griffiths, Mingfei Gao, Zhe Gan, Eshan Verma, Yinfei Yang, Zhifeng Chen, Afshin Dehghan
- ポスターセッション
- 効率的な運動学生成のための長期モーション埋め込みの学習
- 午後3時30分 - 午後5時30分、展示ホールA、ポスターセッション6、#595
- Nick Stracke (ミュンヘン大学), Kolja Bauer (ミュンヘン大学), Stefan Andreas Baumann (ミュンヘン大学), Joshua Susskind, Miguel Angel Bautista, Björn Ommer (ミュンヘン大学)
金曜日、6月5日 午前10時 – 午後12時
Pavan Kumar Anasosalu Vasu氏が VSAS-Bench: Visual Streaming Assistant Models のリアルタイム評価 を発表します。
金曜日、6月5日 午後2時 – 午後4時**
Byeongjoo Ahn氏と Jiasen Lu氏が AToken: ビジョンのための統一トークナイザー を発表します。
土曜日、6月6日 午前10時 – 午後12時**
Jiatao Gu氏が STARFlow-V: Normalizing Flowsを用いたエンドツーエンドの動画生成モデリング を発表します。
土曜日、6月6日 午後2時 – 午後4時**
Rick Chang氏が Velox: 4D幾何学と外観の表現学習 を発表します。
Di Feng氏が SO-Bench: マルチモーダルLLMの構造化出力評価 を発表します。
著者:Sanjoy Chowdhury†, Karren D. Yang, Xudong Liu, Fartash Faghri, Pavan Kumar Anasosalu Vasu, Oncel Tuzel, Dinesh Manocha†, Chun-Liang Li**, Raviteja Vemulapalli
著者:Jiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
著者:Colin Lea, Vasileios Baltatzis, Connor Gillis, Raja Kushalnagar†, Lorna Quandt†, Leah Findlater
著者:Lucas Monteiro Paes‡, Nivedha Sivakumar‡, Oliver Wang†‡**, Masha Fedzechkina, Barry-John Theobald, Luca Zappella, Nicholas Apostoloff
著者:Le Zhang†**, Jihan Yang‡, Soundarya Krishnan, Jimit Majmudar, Xiou Ge, Prasoon Puri, Prathamesh Saraf, Shruti Bhargava, Dhivya Piraviperumal, Yinan Ling, Cindy Pan, Hong Yu, Aishwarya Agrawal†, Bo-Hsiang Tseng
著者:Nick Stracke†‡, Kolja Bauer†‡, Stefan Andreas Baumann†‡, Miguel Ángel Bautista, Josh Susskind, Björn Ommer†‡
著者:Yusu Qian, Eli Bocek-Rivele, Liangchen Song, Jialing Tong, Yinfei Yang, Jiasen Lu, Wenze Hu, Zhe Gan
著者:Di Feng, Kaixin Ma, Feng Nan, Haofeng Chen, Bohan Zhai, David Griffiths, Mingfei Gao, Zhe Gan, Eshan Verma, Yinfei Yang, Zhifeng Chen, Afshin Dehghan
著者:Jiatao Gu†, Ying Shen‡**, Tianrong Chen, Laurent Dinh, Yuyang Wang, Miguel Ángel Bautista, David Berthelot, Josh Susskind, Shuangfei Zhai
著者:Chenhao Zheng†‡, Jieyu Zhang†‡, Jianing Zhang†, Weikai Huang†‡, Ashutosh Kumar§, Quan Kong§, Oncel Tuzel, Chun-Liang Li, Ranjay Krishna†‡
著者:Rui Tian†, Mingfei Gao§‡, Haiming Gang, Jiasen Lu, Zhe Gan, Yinfei Yang, Zuxuan Wu†§, Afshin Dehghan
著者:Anagh Malik†, Dorian Chan, Xiaoming Zhao, David B. Lindell†, Oncel Tuzel, Jen-Hao Rick Chang
著者:Pavan Kumar Anasosalu Vasu*, Cem Koc*, Fartash Faghri*, Chun-Liang Li, Bo Feng, Zhengfeng Lai, Meng Cao, Oncel Tuzel, Hadi Pouransari*
著者:Kedar Tatwawadi, Parisa Rahimzadeh, Zhanghao Sun, Zhiqi Chen, Ziyun Yang, Sanjay Nair, Divija Hasteer, Oren Rippel
Alex Colburn と Qi Shan は、優秀な領域議長として表彰されました。
Byeongjoo Ahn、Chen Chen、Fartash Faghri、Oncel Tuzel、Xiaoming Zhao はエリアチェアを務めています。
Jeffrey Bigham は、「VizWiz Grand Challenge Workshop 2026」のワークショップ共同主催者です。
Sanjoy Chowdhury、Barry-John Theobald、Santhosh Kumar Ramakrishnan、Raviteja Vemulapalli は優秀な査読者として表彰されました。
Vassilis Baltatzis、Honor Chen、Rick Chang、Haiming Gang、Mingfei Gao、Pavan Kumar Anasosalu Vasu、Colin Lea、Xianhang Li、Xudong Liu、Yongxi Lu、Huangjie Zheng は査読者です。
関連する読み物と最新情報
Apple は、12 月 10 日から 15 日にカナダのバンクーバーで開催される年次カンファレンス「Neural Information Processing Systems (NeurIPS)」で新しい研究成果を発表します。私たちは、機械学習を取り巻く学術界および産業界の研究コミュニティを結集する多トラックの学際的カンファレンスのスポンサーを務めることを再び誇りに思います。以下に、Apple の NeurIPS 2024 への参加概要を示します。
Apple は、11 月 12 日から 16 日にフロリダ州マイアミで開催される Empirical Methods in Natural Language Processing (EMNLP) 会議で新しい研究を発表します。私たちは、自然言語処理と人工知能を中心に科学界および産業界の研究コミュニティを結集させるこの会議のスポンサーを務めることを改めて誇りに思います。以下に、Apple の EMNLP 2024 への参加概要を示します。
原文を表示
content type eventpublished May 28, 2026
Apple is presenting new research at the annual IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), which takes place in person in Denver at the Colorado Convention Center from June 3 to June 7. We are proud to sponsor the conference, which brings together the scientific and industrial research communities in computer vision and pattern recognition. Below is an overview of Apple’s participation at CVPR 2026.
Jump to a section:
- Schedule
- Poster Presentations at the Apple Booth
- Accepted Papers
- Acknowledgements
Stop by the Apple booth (#231) during exhibition hours.
All times listed in MDT (local time):
- Friday, June 5: 10:00 AM – 6:00 PM
- Saturday, June 6: 10:00 AM – 6:00 PM
- Sunday, June 7: 10:00 AM – 3:00 PM
Schedule
Wednesday, June 3
- KEYNOTE TALK
- Generative AI for Sign Language (GenSign) Workshop
- 9:00 AM - 1:00 PM, Room 112
- Colin Lea will be giving a keynote talk during the workshop.
- INVITED TALK
- Efficient Deep Learning for Computer Vision (ECV) Workshop 2026
- 9:00 AM - 6:00 PM, Room 502
- Oncel Tuzel will be giving an invited talk during the workshop.
- INVITED TALK
- Efficient and On-Device Generation (EDGE) Workshop 2026
- 1:00 PM - 6:00 PM, Room 210/212
- Oncel Tuzel and Lu Jiang will be giving invited talks during the workshop.
- AFFINITY EVENT
- Women in Computer Vision (WiCV)
- 6:00 PM - 8:00 PM, Room 105 B, Mentorship Dinner Offsite
- Hsin-Ping (Cindy) Huang and Maggie Xiao will be representing Apple at the WiCV Mentorship Dinner.
Thursday, June 4
- INVITED TALK
- Video Large Language Models (VidLLMs) Workshop 2026
- 8:30 AM - 5:00 PM, Room 3A-3D
- Afshin Dehghan will be giving an invited talk during the workshop.
Friday, June 5
- POSTER
- STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows
- 4:00 PM - 6:00 PM, Exhibit Hall A & F, Poster Session 2, #178
- Jiatao Gu, Ying Shen (University of Illinois Urbana-Champaign), Tianrong Chen, Laurent Dinh, Yuyang Wang, Miguel Angel Bautista, David Berthelot, Josh Susskind, Shuangfei Zhai
- POSTER
- From Where Things Are to What They’re For: Benchmarking Spatial–Functional Intelligence for Multimodal LLMs
- 4:00 PM - 6:00 PM, Exhibition Hall A & F, Poster Session 3, #453
- Le Zhang (Mila - Quebec AI Institute Université de Montréal), Jihan Yang (New York University), Soundarya Krishnan, Jimit Majmudar, Hugh Ge, Prasoon Puri, Prathamesh Saraf, Shruti Bhargava, Dhivya Piraviperumal, Yinan Ling, Cindy Pan, Hong Yu, Aishwarya Agrawal (Mila - Quebec AI Institute Université de Montréal), Andy Tseng
- POSTER
- What Matters in Practical Learned Image Compression
- 4:00 PM - 6:00 PM, Exhibition Hall A & F, Poster Session 3, #457
- Kedar Tatwawadi, Parisa Rahimzadeh, Zhanghao Sun, Zhiqi Chen, Ziyun Yang, Sanjay Nair, Divija Hasteer, Oren Rippel
Saturday, June 6
- POSTER
- Bootstrapping Sign Language Annotations with Sign Language Models
- 7:30 AM - 9:00 AM, Exhibit Hall A, Findings Posters, #035
- Colin Lea, Vassilis Baltatzis, Raja Kushalnagar (Gallaudet University), Lorna Quandt (Gallaudet University), Leah Findlater, Connor Gillis
- POSTER
- Velox: Learning Representations of 4D Geometry and Appearance
- 11:45 AM - 1:45 PM, Exhibition Hall F, Poster Session 4, #527
- Anagh Malik (University of Toronto), Xiaoming Zhao, Dorian Chan, David Lindell (University of Toronto), Oncel Tuzel, Rick Chang
- POSTER
- AMUSE: Audio-Visual Benchmark and Alignment Framework for Agentic Multi-Speaker Understanding
- 4:45 PM - 6:45 PM, Exhibition Hall A, Poster Session 4, #146
- Sanjoy Chowdhury, Karren D. Yang (Nuance Labs), Chun-Liang Li, Xudong Liu, Fartash Faghri, Pavan Kumar Anasosalu Vasu, Oncel Tuzel, Dinesh Manocha (University of Maryland, College Park), Raviteja Vemulapalli
Sunday, June 7
- ORAL
- AToken: A Unified Tokenizer For Vision
- 9:00 AM - 10:15 AM, Four Seasons Ballroom, Oral Session 5B: Generalization and Adaptation
- Jiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
- POSTER
- AToken: A Unified Tokenizer For Vision
- 11:45 AM - 1:45 PM, Exhibition Hall F, Poster Session 5, #007
- Jiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
- POSTER
- UniGen-1.5: Enhancing Image Generation and Editing through Reward Unification in Reinforcement Learning
- 11:45 AM - 1:45 PM, Exhibition Hall F, Poster Session 5, #069
- Rui Tian (Fudan University), Mingfei Gao, Haiming Gang, Jiasen Lu, Zhe Gan, Yinfei Yang, Zuxuan Wu (Fudan University), Afshin Dehghan
- POSTER
- TrajTok: Learning Trajectory Tokens enables better Video Understanding
- 11:45 AM - 1:45 PM, Exhibition Hall F, Poster Session 5, #240
- Chenhao Zheng (University of Washington), Jieyu Zhang (University of Washington), Oncel Tuzel, Chun-Liang Li, Ranjay Krishna (University of Washington)
- POSTER
- DSO: Direct Steering Optimization for Bias Mitigation
- 11:45 AM - 1:45 PM, Exhibition Hall F, Poster Session 6, #288
- Lucas Monteiro Paes, Niv Sivakumar, Yinong Wang (Carnegie Mellon University), Masha Fedzechkina Donaldson, Barry Theobald, Luca Zappella, Nick Apostoloff
- FINDINGS POSTER
- VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models
- 3:30 PM - 5:30 PM, Exhibit Hall A, Poster Session 3, #298
- Pavan Kumar Anasosalu Vasu, Cem Koc, Fartash Faghri, Chun-Liang Li, Brian Feng, Jeff Lai, Meng Cao, Oncel Tuzel, Hadi Pour Ansari
- POSTER
- Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing
- 3:30 PM - 5:30 PM, Exhibition Hall A, Poster Session 6, #098
- Yusu Qian, Eli Bocek-Rivele, Liangchen Song, Jiasen Lu, Ashley Tong, Yinfei Yang, Wenze Hu, Zhe Gan
- POSTER
- SO-Bench: A Structural Output Evaluation of Multimodal LLMs
- 3:30 PM - 5:30 PM, Exhibition Hall A, Poster Session 6, #141
- Di Feng, Kaixin Ma, Feng Nan, Haofeng Chen, Bohan Zhai, David Griffiths, Mingfei Gao, Zhe Gan, Eshan Verma, Yinfei Yang, Zhifeng Chen, Afshin Dehghan
- POSTER
- Learning Long-term Motion Embeddings for Efficient Kinematics Generation
- 3:30 PM - 5:30 PM, Exhibition Hall A, Poster Session 6, #595
- Nick Stracke (Ludwig Maximilian University of Munich), Kolja Bauer (Ludwig Maximilian University of Munich), Stefan Andreas Baumann (Ludwig Maximilian University of Munich), Joshua Susskind, Miguel Angel Bautista, Björn Ommer (Ludwig Maximilian University of Munich)
Friday, June 5, 10:00 AM – 12:00 PM**
Pavan Kumar Anasosalu Vasu will present VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models.
Friday, June 5, 2:00 PM – 4:00 PM****
Byeongjoo Ahn and Jiasen Lu will present AToken: A Unified Tokenizer For Vision.
Saturday, June 6, 10:00 AM – 12:00 PM****
Jiatao Gu will present STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows.
Saturday, June 6, 2:00 PM – 4:00 PM**
Rick Chang will present Velox: Learning Representations of 4D Geometry and Appearance.
Di Feng will present SO-Bench: A Structural Output Evaluation of Multimodal LLMs.
AuthorsSanjoy Chowdhury†, Karren D. Yang, Xudong Liu, Fartash Faghri, Pavan Kumar Anasosalu Vasu, Oncel Tuzel, Dinesh Manocha†, Chun-Liang Li**, Raviteja Vemulapalli
AuthorsJiasen Lu, Liangchen Song, Mingze Xu, Byeongjoo Ahn, Yanjun Wang, Chen Chen, Afshin Dehghan, Yinfei Yang
AuthorsColin Lea, Vasileios Baltatzis, Connor Gillis, Raja Kushalnagar†, Lorna Quandt†, Leah Findlater
AuthorsLucas Monteiro Paes‡, Nivedha Sivakumar‡, Oliver Wang†‡**, Masha Fedzechkina, Barry-John Theobald, Luca Zappella, Nicholas Apostoloff
AuthorsLe Zhang†**, Jihan Yang‡, Soundarya Krishnan, Jimit Majmudar, Xiou Ge, Prasoon Puri, Prathamesh Saraf, Shruti Bhargava, Dhivya Piraviperumal, Yinan Ling, Cindy Pan, Hong Yu, Aishwarya Agrawal†, Bo-Hsiang Tseng
AuthorsNick Stracke†‡, Kolja Bauer†‡, Stefan Andreas Baumann†‡, Miguel Ángel Bautista, Josh Susskind, Björn Ommer†‡
AuthorsYusu Qian, Eli Bocek-Rivele, Liangchen Song, Jialing Tong, Yinfei Yang, Jiasen Lu, Wenze Hu, Zhe Gan
AuthorsDi Feng, Kaixin Ma, Feng Nan, Haofeng Chen, Bohan Zhai, David Griffiths, Mingfei Gao, Zhe Gan, Eshan Verma, Yinfei Yang, Zhifeng Chen, Afshin Dehghan
AuthorsJiatao Gu†, Ying Shen‡**, Tianrong Chen, Laurent Dinh, Yuyang Wang, Miguel Ángel Bautista, David Berthelot, Josh Susskind, Shuangfei Zhai
AuthorsChenhao Zheng†‡, Jieyu Zhang†‡, Jianing Zhang†, Weikai Huang†‡, Ashutosh Kumar§, Quan Kong§, Oncel Tuzel, Chun-Liang Li, Ranjay Krishna†‡
AuthorsRui Tian†, Mingfei Gao§‡, Haiming Gang, Jiasen Lu, Zhe Gan, Yinfei Yang, Zuxuan Wu†§, Afshin Dehghan
AuthorsAnagh Malik†, Dorian Chan, Xiaoming Zhao, David B. Lindell†, Oncel Tuzel, Jen-Hao Rick Chang
AuthorsPavan Kumar Anasosalu Vasu*, Cem Koc*, Fartash Faghri*, Chun-Liang Li, Bo Feng, Zhengfeng Lai, Meng Cao, Oncel Tuzel, Hadi Pouransari*
AuthorsKedar Tatwawadi, Parisa Rahimzadeh, Zhanghao Sun, Zhiqi Chen, Ziyun Yang, Sanjay Nair, Divija Hasteer, Oren Rippel
Alex Colburn and Qi Shan are recognized as Outstanding Area Chairs.
Byeongjoo Ahn, Chen Chen, Fartash Faghri, Oncel Tuzel, and Xiaoming Zhao are Area Chairs.
Jeffrey Bigham is a Workshop Co-Organizer for “VizWiz Grand Challenge Workshop 2026”.
Sanjoy Chowdhury, Barry-John Theobald, Santhosh Kumar Ramakrishnan, and Raviteja Vemulapalli are recognized as Outstanding Reviewers.
Vassilis Baltatzis, Honor Chen, Rick Chang, Haiming Gang, Mingfei Gao, Pavan Kumar Anasosalu Vasu, Colin Lea, Xianhang Li, Xudong Liu, Yongxi Lu, and Huangjie Zheng are Reviewers.
Related readings and updates.
Apple is presenting new research at the annual conference on Neural Information Processing Systems (NeurIPS), which takes place in person in Vancouver, Canada, from December 10 - 15. We are proud to again sponsor the multi-track interdisciplinary conference, which brings together the scientific and industrial research communities surrounding Machine Learning. Below is an overview of Apple’s participation at NeurIPS 2024.
Apple is presenting new research at the Empirical Methods in Natural Language Processing (EMNLP) conference, which takes place in person in Miami, Florida, from November 12 - 16. We are proud to again sponsor the conference, which brings together the scientific and industrial research communities around natural language processing and artificial intelligence. Below is an overview of Apple’s participation at EMNLP 2024.
関連記事
ソニー、AI カメラアシスタントの誤解を解くために説明を試みる
ソニーは、Xperia 1 XIII で公開した AI カメラアシスタント機能について、画像を編集するものではなく、照明や被写体に基づいて撮影オプションを提案するだけだと説明し、誤解を解こうとしている。
Amazon SageMaker AI LLM推論における包括的な観測可能性:GPU利用率からLLM品質まで
AWSは、大規模言語モデル(LLM)をAmazon SageMaker AI Inferenceでスケール展開する際、従来のソフトウェアとは異なる不確実な出力に対応するため、GPU利用率やLLMの品質変化を追跡する包括的な観測可能性の重要性について解説した。
テック企業があなたの家事を撮影することに必死になっている理由
AI学習スタートアップのShiftは、ニューヨークやロンドンで無料で清掃サービスを提供する代わりに、利用者の自宅での様子を撮影してデータ収集を行う計画を発表した。