ICASSP 2024 - Day6
主会报告 5:Restructuring and Recognizing Human Actions in Video 讲者:Jitendra Malik (The University of California, Berkeley) 人工智能的一个核心问题是从图像和视频中开发技术来分析和理解人类行为。Jitendra Malik介绍了研究团队在这一重大挑战方面取得的一些最新成果。其团队已经开发出了从单张图像中使用Transformer神经网络重建人体的3D网格的高精度技术。在给定视频输入的情况下,通过3D跟踪将这些重建与时间联系起来,从而产生了“四维人类”(在空间中的3D »