PRCV2019-day2

  2019年11月09日,PRCV2019正式开幕。主持人首先对大会情况以及与会嘉宾做了简要介绍,之后由谭铁牛院士致开幕辞。下面笔者将对主题报告、邀请报告、论文选读和专题论坛四个部分作简要介绍。
1-2

谭铁牛院士致开幕辞
1. 主题报告

  虽然深度学习方法在各种计算机视觉任务上能够体现较好的性能,但大多数情况下任务和数据分发都是固定的,不能够提供一个持续的自学习模型。此外在现实世界中,数据分布可能会随时间变化,任务规范性也随时间变化(例如需要添加的新类别或新功能)。为此比利时鲁汶大学的Tinne Tuytelaars教授带来题为《Keep on Learning》的主题报告,详细介绍他们实验室在这个方向上的一些最新成果。她提出持续或增量学习不是研究每次条件变化都需要重新训练整个模型,而是在不访问旧数据的情况下,研究如何更新和扩展模型以适应新的需求,使得随着时间的推移能够从新经验中学习,从而不断地更新自己的模型。

2-1

Keep on Learning
  深度学习技术在计算机视觉图像处理和自然语言处理等领域有着非常广泛的应用,但深度学习这一非线性科学缺乏抵抗的数学理论支撑,因而对模型的理解与分析也带来了巨大的挑战,如可解释性问题,过拟合问题,过拟合重复问题等。西安电子科技大学的焦李成教授带来题为《后深度学习的挑战与思考》的主题报告,总结了深度学习时代下解决上述问题的相关技术,如自适应神经树模型,深度森林以及深度贝叶斯网络探索可解释性问题、针对过拟合问题的正则化理论及优化技巧和图卷积神经网络用于发现数据中的推理关系等。

6

后深度学习的挑战与思考
2. 邀请报告

  虽然一些科技公司不断提出在类似Market的数据库上达到97%以上的匹配率,但实际上他们是在较小数据集情况得到的结果。在大量复杂真实场景下,行人重识别任然存在许多问题,不但在学术上,而且在工业实际应用中也是如此。所以中山大学数据科学与计算机学院的郑伟诗教授带来主题为《行人重识别:是否已经被解决了?》的学术报告,为我们介绍行人重识别现阶段存在的问题,如不同的人穿着相同的衣服或者相同的人穿着不同的衣服等情况能否正确检测,以及基于特征变换和聚类的方法解决大规模监控网络下的行人追踪问题。

3-1

行人重识别:是否已经被解决了?
3. 论文选读

  本次会议共收录168篇优秀的论文,其中选取部分论文作为专题选读。笔者主要关注的是图像增强相关的论文。第一篇是关于在摄像头终端通过偏振成像的方式增强阴影区域的图像,其中涉及到暗电流的噪声的处理方式、偏振片质量以及多光红外对设备成像的影响。
4-1

Image Enhancement of Shadow Region Based on Polarization Imaging

  第二篇宣读的是关于单图像去雾的暗通道先导条件条件生成对抗网络的文章,作者对比传统的去雾方法,提出基于深度学习的对抗神经网络进行图像去雾处理,能够对雾天的图像产生较好的增强效果,但在浓雾的情况下并不适用。最后对能否将图像增强和目标检测融合在一起进行了探讨。
123

Dark Channel Prior Guided Conditional Generative Adversarial Network for Single Image Dehazing
4. 专题论坛

  此次的专题论坛的主题是“三维视觉前沿”,论坛的讲者从深度成像、三维重建、三维目标检测与识别、以及三维场景理解等方面,探讨三维视觉在不同领域的应用,剖析三维视觉研究面临的困难、挑战和潜在机遇。
7-1

“三维视觉前沿”专题论坛

  其中令笔者印象最为深刻的是北京大学信息科学技术学院智能科学系的查红彬教授带来的题为《移动传感器的定位与三维场景重建》的报告。查老师首先对SLAM(simultaneous localization and mapping:即时定位与地图构建)近四十年的发展进行了概述;其次提出利用时间的连续性和空间的相关性实现对移动传感器定位,并用来构建三维场景;最后利用图像和时间序列组成三维场景提取数据流用于解决预测问题。

8

移动传感器的定位与三维场景重建

第二天的会议到此全部结束,期待明天更加精彩的演讲~