Valse 2024 - Day1

2024年5月5日至5月7日,第十四届视觉与学习青年学者研讨会(VALSE 2024)在山城重庆渝北区悦来国际会议中心举办。本届大会由中国人工智能学会和中国图象图形学学会联合主办,重庆邮电大学承办,重庆大学协办。VALSE 2024大会将延续往年模式,继续聚焦计算机视觉、模式识别、多媒体和机器学习等领域的国际前沿和热点方向,在3天的时间里为参会者呈现2个大会主旨报告、5个大会特邀报告、12个年度进展评述(APR)报告、4个讲习班 (Tutorial)、20个研讨会 (Workshop)共约100个专题报告、约200篇年度顶会顶刊论文墙报 (Poster)展示等内容, »

ICASSP 2024 - Day6

主会报告 5:Restructuring and Recognizing Human Actions in Video 讲者:Jitendra Malik (The University of California, Berkeley) 人工智能的一个核心问题是从图像和视频中开发技术来分析和理解人类行为。Jitendra Malik介绍了研究团队在这一重大挑战方面取得的一些最新成果。其团队已经开发出了从单张图像中使用Transformer神经网络重建人体的3D网格的高精度技术。在给定视频输入的情况下,通过3D跟踪将这些重建与时间联系起来,从而产生了“四维人类”(在空间中的3D »

ICASSP 2024 - Day5

短课2:Practical Guide to Computational Imaging: From Basics to Brilliance 讲者:Lu Fang (Tsinghua University), Jiachen Wu (Tsinghua University), Xun Cao (Nanjing University), Jinwei Gu (Chinese »

ICASSP 2024 - Day4

主会报告 3:Classical versus Modern Signal Processing Algorithms: A Contrast Study 讲者:Bhaskar D. Rao(University of California San Diego) 本次报告中,信号处理领域的专家Bhaskar D. Rao深入探讨了信号处理算法多年来的演变以及现代方法与经典方法之间的联系。这次报告引发了对现代算法性能和复杂性之间关系的深入思考,并强调了理解现代算法与经典算法之间联系的重要性。 »

ICASSP 2024 - Day3

主会报告 1:Brain-To-Speech : Neural Speech Synthesis from Brain Signals 讲者:Dr. Seong-Whan Lee(Korea University) 本次报告中,Dr. Seong-Whan Lee向学者们介绍了“Brain-To-Speech”技术的原理和应用。该技术利用了大脑信号来合成语音,而无需进行任何侵入性操作,可以将思想转换成可理解、可识别的语言,通过监测一个人的大脑活动, »

ICASSP 2024 - Day2

Tutorial 1:Fundamentals of Transformers: A Signal-processing View 讲者:Christos Thrampoulidis (University of British Columbia), Samet Oymak (University of Michigan), Ankit Singh Rawat (Google Research), Mahdi »