PRCV2021-day2

2021年12月20日,PRCV2021正式开幕。主持人首先对大会情况以及与会嘉宾做了简要介绍,之后由王耀南院士致开幕辞。下面笔者将对大会的主题报告、特邀报告、女科学家论坛和专题论坛作简要介绍。

主题报告 1

讲者:朱松纯(北京大学)

报告题目:Computer Vision: A Task-oriented and Agent-based Perspective

朱松纯老师首先介绍了过去40多年计算机视觉两个流行的研究: (1)1980年-2000年以基于几何和物体中心的表示学习;(2) 2000年-2020年以基于外观和视图为中心的表示学习。在此基础上,朱老师提出未来计算机视觉的研究角度为基于代理和任务为中心的表示学习,这将使得计算机视觉系统将成为人工智能代理的集成部分。计算机视觉作为人工智能的代理需要执行大量的日常任务,包括搜索、识别、重建、抓取、沟通和工具使用等。朱松纯老师最后指出计算机视觉的一个研究方向,包括以物理和社会为代表的功能性、物理性、意向性、因果性和实用性。

图1:计算机视觉:面向任务和基于代理的视角

主题报告 2

讲者:虞晶怡(上海科技大学)

报告题目:Neural Human Reconstruction: From Rendering to Modeling

最近随着深度学习的快速发展,神经建模和渲染也越来越受到关注,一些研究者将其应用于三维人体重建并取得了不错的效果。神经建模和渲染克服了传统三维重建技术的局限性,通过减少重建噪声,解决无纹理区域以合成高质量的视角渲染。在这次演讲中,虞晶怡老师介绍了他们基于神经建模和渲染进行三维人体建模的相关研究,包括神经人体重建器、深度三维人脸合成器、基于解剖学上的三维手部追踪器和超现实的头发模型器。这些解决方案能够快速和高精准产生虚拟人。

图2:神经人体重建:从渲染到建模

特邀报告 1

讲者:卢湖川(大连理工大学)

报告题目:高性能视觉跟踪算法

视觉跟踪算法近年已取得突破性进展,但复杂现实环境中的各种场景变化和平台限制对跟踪算法提出了以“高精度、易迁移、低计算量”为导向的高性能要求。为此,卢湖川老师从模板和搜索区域特征融合、通用尺度估计模块设计及嵌入式平台部署需求三方面,分别介绍Transformer融合模型、Alpha-Refine尺度估计模块和NAS跟踪网络搜索模型,并从具体的论文讲解如何提升跟踪算法精度的同时降低了参数量和计算量。最后,卢湖川老师还对高性能视觉跟踪算法进行展望,提出未来该领域的几点研究方向。

图3:高性能视觉跟踪算法

特邀报告 2

讲者:王立威(北京大学)

报告题目:Towards Theoretical Understanding of Deep Learning

虽然深度学习在许多应用中取得了巨大的成功,但仍然缺乏理论上的理解。在这次报告中,王立威老师介绍他们团队最近在深度学习的表示能力、优化和泛化理论方面的工作。王老师首先展示了具有有界宽度的深度神经网络通用近似器;然后,王老师介绍了一种非传统梯度下降全局最小值优化方法,提出一种宽度神经网络的设计方案,从随机初始化开始,利用梯度下降可以证明找到具有线性收敛率的全局最优值,这种方法相比传统的梯度下降具有更好优化的特点;最后,王老师解释了为什么过度参数化的深度神经网络可以有良好的泛化能力。

图4:面向理论理解的深度学习

女科学家论坛 1

讲者:许倩倩(中科院计算所)

报告题目:跨媒体知识图谱构建与学习

近年来大数据和人工智能技术飞速发展,以知识图谱为代表的大规模知识库技术在众多应用场景取得显著效果。为将知识引入机器学习应用,许倩倩老师介绍针对社会媒体和风险检测应用构建的两类大规模跨媒体知识图谱从偏差溯源,配置效率和数据质量三个方面详细报告了三个非常前沿的工作:1)可信排序驱动的群智偏差溯源;2)数据采样驱动的群智资源配置;3)异常模式驱动的群智质量控制。同时,许老师为我们介绍了所在团队近期的研究工作为基于前期智群计算方面的算法和实践积累,研究跨媒体知识图谱构建、表征和推理。最后,陈老师所在实验室未来的研究工作将涵盖应用层、算法层和数据层构建KGLab。

图5:跨媒体知识图谱构建与学习

女科学家论坛 2

讲者:卢虹冰(第四军医大学)

报告题目:影像组学预测模型及其腔内肿瘤筛查应用

卢老师的报告介绍了基于患者CT/MRI影像的腔内肿瘤智能筛查和诊断技术,及其在临床高发的结直肠癌和膀胱癌筛查检测中的应用。在汇报中卢老师给大家介绍了课题组多篇高质量论文,包括:1)管腔内外壁的准确分割;2)创新提出多特征表征息肉/肿瘤特性;3)提出基于图像纹理特征的息肉恶性辅助诊断;4)基于扩散加权成像纹理的膀胱癌分级研究;5)膀胱肿瘤肌层浸润性预测;6)提出膀胱肿瘤浸润深度检测方法;7)构建基于新型VE的临床筛查路径。

图6:影像组学预测模型及其腔内肿瘤筛查应用

专题论坛

讲者:刘成林(中国科学院自动化研究所)

报告题目:青椒如何熬成老椒—面向问题的研究选题

刘成林老师首先介绍有价值的研究题目是面向问题或应用的:未知的理论、原理,通用模型与方法,或者应用中未解决的技术问题,因此都是面向问题的。然后,介绍研究中的创新价值,具体可分为四个层次:问题创新,理论创新,方法创新,技术创新,工程创新。刘老师指出人工智能领域的研究工作大多是方法和技术的创新。最后,刘老师以近几年模式识别和计算机视觉领域深度学习方法创新的一些成果为例,说明有价值的选题有什么样的特点,什么样的选题适合研究生和青年学者去做。

图7:面向问题的研究选题