PRCV2022-Day1

12月24日上午,第五届中国模式识别与计算机视觉大会(PRCV 2022)在深圳市科兴ECO国际会议中心举办。PRCV中国人工智能学会(CAAI)、中国计算机学会(CCF)、中国自动化学会(CAA)和中国图象图形学会(CSIG)联合主办;由南方科技大学和深圳职业技术学院共同承办;并由香港浸会大学、香港中文大学(深圳)、哈尔滨工业大学(深圳)、中国科学院深圳先进技术研究院和中山大学联合举办,是国内顶级的模式识别和计算机视觉领域学术盛会。

图1:参会合影留念
图2:参会过程

讲者:蒲慕明(中国科学院院士)

报告题目:模式识别的生物机制

蒲院士首先对模式识别的基础进行了介绍,阐述了信息捆绑是模式识别的基础,并提出了视觉局部基本特征捆绑和全局复杂特征整合问题,比如不同类型神经连接,信息在视觉脑区多层级网络中传输与整合;之后对神经联结图谱从宏观、介观、微观这三个层面进行了分析,明确了当前介观层面神经网络的复杂性;最后指出了模式识别依赖于大脑已存贮的先验知识,可塑性是大脑认知最重要的基础,明确了生物机制与模式识别的密切联系。

图3:模式识别的生物机制

讲者:王耀南(中国工程院院士)

报告题目:机器视觉高光谱检测技术应用与发展趋势

王院士介绍道机器视觉作为机器人的“高精密眼睛”,其发展对机器人起着重要的作用,报告从研究背景与意义、研究现状与面临挑战、关键技术等方面介绍高光谱机器视觉感知技术应用,首先以智能机器人在高端制造过程中面临的感知手段有限、测量检测精度低、缺陷样本数量等挑战为牵引,介绍了高光谱机器视觉研究的总体技术路线与关键科学问题,包括高速高精快照成像、无监督异常检测方法、跨场景模型部署等方面;最后介绍了高光谱机器视觉未来的发展趋势和展望。

图4:机器视觉高光谱检测技术应用与发展趋势

讲者:梁小丹(中山大学副教授)

报告题目:Unified Autonomous Driving via Multi-modality Multi-task Learning

梁老师指出为了能够全面理解多个下游任务,需要提取那些具有更好转移性的特征,虽然目前有许多自监督预训练方法在各种视觉任务上取得了优异的性能,但其对多任务学习场景的泛化能力仍有待探索。由此提出了一种简单有效的预训练自适应微调范式,用于一般的多任务训练,其中现有的预训练模型可以在不增加训练开销的情况下进行有效的自适应。此外还提出了“LV适配器”,可以通过任务特定的提示和视觉特征与本文特征之间的对齐,在多任务模型中引入了语言优先级。最后讨论了开发高效的多模态多任务学习范式的发展前景。

讲者:周博磊(UCLA助理教授)

报告题目:Toward Generalizable Embodied AI in Machine Autonomy

周老师介绍了具身AI作为一个新兴的研究课题,已经在室内导航和自动驾驶等各种视觉运动任务中进行了研究,但大多数具身AI的研究都是在固定的模拟环境中进行的,所以AI在真正复杂场景中的通用性和安全性仍然存在疑问。周老师之后介绍了其实验室目前的、促进机器自主的可推广具身AI研究工作,比如构建了MetaDrive驾驶模拟器,其具有导入真实场景和学习生成新场景的能力,以及从数小时未经剪辑的YouTube驾驶视频中学习可概括的决策表达。

图5:Toward Generalizable Embodied AI in Machine Autonomy

讲者:许春景(华为计算视觉实验室主任)

报告题目:BEV感知实践以及未来可能的感知架构

许老师介绍了目前基于BEV的感知架构逐步得工业界的认可,并非常广泛的应用到了工程实践中,但是在应用中,对不同区域可变分辨率的要求、动静目标的融合、对更多细节线索的感知等问题,对现有架构提出了非常大的挑战,基于这些挑战,周老师指出需要探讨更新的更具有任务弹性的架构,来满足自动驾驶感知的诉求,并在最后提出了一些可能的长期研究和探索的路径。

图6:BEV感知实践以及未来可能的感知架构

讲者:刘子纬(南洋理工大学助理教授)

报告题目:Robust and Data-Efficient 3D Perception

刘老师提出准确感知RGB和LiDAR传感器背后的3D世界一直是计算机视觉的长期追求目标,具有广泛的现实应用,然后讨论了其在3D感知方面的工作,重点在进行不完全输入或监督下学习结构深度表示。之后刘老师还介绍了与真实世界传感器中出现的自然分布数据相关的挑战,以及如何通过结合新的神经计算机制来克服这些挑战,最后讨论了他们实验室在众多任务中显示出了有效性和可推广性。