2019年11月08日下午,PRCV2019在两个会议厅举办了四场关于机器学习和计算机视觉相关的前沿理论和技术的讲习班。笔者主要对《鲁棒和可解释人工智能》和《大规模深度人脸生成与分析》两场报告作简要介绍。
1. 鲁棒和可解释人工智能
近年来,尤其是以深度学习为代表的新一代人工智能算法的兴起,在图像处理、语音识别、机器翻译等诸多领域取得一系列重要突破,极大地提高了当前人工智能算法的性能,但是这类模型通常:
1)被当作一个黑盒子使用,难以被用户理解;
2)鲁棒性不足,容易被人眼不易识别的对抗样本所欺骗。
这些都给人工智能模型的部署和应用带来了障碍。如何提高模型的鲁棒性和可解释性,发展对人可信的人工智能技术,是当前以及未来人工智能领域的研究热点和难点。
2. 大规模深度人脸生成与分析
大规模深度学习赋予了机器人类水平的识别和想象能力,可以从表达中生成新图像进而提高人脸分析能力。人脸生成与分析包含了对人脸数据的重建、编辑、识别和理解等一系列任务。其研究内容可以大体分为理论研究和应用研究两个方向,其中理论研究涵盖了深度学习、度量学习、迁移学习、强化学习、对抗学习等内容,应用研究则涉及人脸旋转、属性编辑、身份识别、表情和属性识别、对抗攻击防御等方面,为解决深度学习鲁棒性、自适应性和可泛化性等瓶颈问题提供了范例。
首先是来自北京邮电大学信息与通信工程学院的邓伟洪教授带来的主题为“大规模深度人脸与表情识别”的学术报告,从生成式图像分析和鉴别式特征学习等基础部分进行讲解,介绍人生成与分析中所涉及的生成式深度学习、度量学习和迁移学习等主要基础理论和方法。其次是来自中国科学院自动化研究所模式识别国家重点实验室研究员赫然教授带来的主题为“人脸图像生成” 的学术报告,从人脸图像旋转、属性编辑与合成、面部上妆去妆、图像超分辨率、大规模人脸数据的识别和对抗训练、无种族偏差的人脸识别、复合和混合表情识别等方面,介绍深度人脸分析和理解的具体应用场景及其最新进展。
最后是来自中国科学院自动化研究所模式识别国家重点实验室助理研究员黄怀波老师带来的主题为“Deep Generative Models for High Fidelity Face Synthesis” 的学术报告,介绍近期基于深度学习的人脸身份和表情识别的研究进展,并展望未来提升人脸技术的可泛化性、防伪安全性和隐私保护的研究趋势。