PRCV2019-day1

  2019年11月08日下午,PRCV2019在两个会议厅举办了四场关于机器学习和计算机视觉相关的前沿理论和技术的讲习班。笔者主要对《鲁棒和可解释人工智能》和《大规模深度人脸生成与分析》两场报告作简要介绍。

1. 鲁棒和可解释人工智能

  近年来,尤其是以深度学习为代表的新一代人工智能算法的兴起,在图像处理、语音识别、机器翻译等诸多领域取得一系列重要突破,极大地提高了当前人工智能算法的性能,但是这类模型通常:
  1)被当作一个黑盒子使用,难以被用户理解;
  2)鲁棒性不足,容易被人眼不易识别的对抗样本所欺骗。
  这些都给人工智能模型的部署和应用带来了障碍。如何提高模型的鲁棒性和可解释性,发展对人可信的人工智能技术,是当前以及未来人工智能领域的研究热点和难点。
1

讲习班:鲁棒和可解释人工智能
  首先是来自上海交通大学John Hopcroft Center的张拳石副教授带来的主题为“Unified Understanding of Deep Neural Networks”的学术报告。张老师主要介绍了可解释的CNN和网络移植两个方面,通过增加卷积核的其他损失,使得能够对CNN的每个卷积滤波器代表特定的对象进行解释,从而量化神经网络中间层特征的可靠性,从而使其能够成为一般性的理论工具。

2

可解释CNN网络结构图
  其次是来自清华大学计算机系助理教授苏航老师带来的主题为“Adversarial Machine Learning in Deep Neural Networks”的学术报告。苏老师主要从深度神经网络的表达能力和数学建模、深度学习的对抗攻防鲁棒性等方面,介绍目前相关研究领域的最新进展,尤其关注其在图像和视频分类等计算机视觉领域的相关应用,并对相关领域的未来发展方向进行展望,提出训练滤波器可以减少运算量以及对抗噪声在隐私保护方面有着重要的应用前景。

3

对抗机器学习
2. 大规模深度人脸生成与分析

  大规模深度学习赋予了机器人类水平的识别和想象能力,可以从表达中生成新图像进而提高人脸分析能力。人脸生成与分析包含了对人脸数据的重建、编辑、识别和理解等一系列任务。其研究内容可以大体分为理论研究和应用研究两个方向,其中理论研究涵盖了深度学习、度量学习、迁移学习、强化学习、对抗学习等内容,应用研究则涉及人脸旋转、属性编辑、身份识别、表情和属性识别、对抗攻击防御等方面,为解决深度学习鲁棒性、自适应性和可泛化性等瓶颈问题提供了范例。
  首先是来自北京邮电大学信息与通信工程学院的邓伟洪教授带来的主题为“大规模深度人脸与表情识别”的学术报告,从生成式图像分析和鉴别式特征学习等基础部分进行讲解,介绍人生成与分析中所涉及的生成式深度学习、度量学习和迁移学习等主要基础理论和方法。其次是来自中国科学院自动化研究所模式识别国家重点实验室研究员赫然教授带来的主题为“人脸图像生成” 的学术报告,从人脸图像旋转、属性编辑与合成、面部上妆去妆、图像超分辨率、大规模人脸数据的识别和对抗训练、无种族偏差的人脸识别、复合和混合表情识别等方面,介绍深度人脸分析和理解的具体应用场景及其最新进展。
4

“人脸图像生成”主题报告

  最后是来自中国科学院自动化研究所模式识别国家重点实验室助理研究员黄怀波老师带来的主题为“Deep Generative Models for High Fidelity Face Synthesis” 的学术报告,介绍近期基于深度学习的人脸身份和表情识别的研究进展,并展望未来提升人脸技术的可泛化性、防伪安全性和隐私保护的研究趋势。
IMG_5300

“人脸合成深度生成模型”主题报告
  第一天的会议到此全部结束,期待明天更加精彩的演讲~