CCF_2015年第4期_计算机视觉前沿与深度学习

计算机视觉通常是指用摄像机和计算机代替人眼对目标进行识别、跟踪/测量来实现对客观三维世界的理解。计算机视觉既是科学领域中富有挑战性的理论研究,也是工程领域中的重要应用,在图像检索、安全监控、人机交互、医疗诊断和机器人等领域具有广阔的应用前景。美国和欧洲等先进国家将计算机视觉列为对经济和科学有广泛影响的重大基本问题,计算机视觉也是“谷歌大脑”、“百度大脑”等研究计划中的核心项目。为了更好地开展学术交流,推动国内计算机视觉学科发展,进一步提升我国计算机视觉研究在国际领域的影响力,中国计算机学会成立了“计算机视觉专业组”。本专题“计算机视觉前沿与深度学习”计算机视觉专业组特别邀请了多位著名的视觉专家从不同角度撰文,介绍计算机视觉前沿与深度学习研究方面的最新进展。


专题文章:

  1. ●《从统一子空间分析到联合深度学习:人脸识别的十年历程》 香港中文大学助理教授王晓刚、博士孙祎、教授汤晓鸥回顾了人脸识别近十年的发展历程。他们的团队使用深度学习开发了DeepID2+ 系统,在人脸识别最受关注的LFW数据集上取得了人脸确认任务的世界第一,识别率99.47%。深度学习在人脸识别上的巨大成功,并非只是利用复杂模型拟合数据集。DeepID2+系统的神经元响应有很多重要的性质,比如它是中度稀疏的,对人物身份和人脸属性有很强的选择性,对局部遮挡具有良好的鲁棒性。这些性质通过大数据训练自动获得,而非通过对模型显式地加入各种约束。这些研究成果启发我们进一步探索大脑是否也具有类似的性质,不断开拓新的研究方向。
  2. ●《深度学习在人脸分析与识别中的应用》 本文概述了中科院计算所在深度学习、人脸感知方面的相关工作,内容包括面向人脸识别和表情识别的特征学习,由粗到精的多阶段深度非线性人脸形状提取,姿态鲁棒的人脸特征渐进深度学习等,总结了在没有大规模人脸数据的条件下应用深度学习模型的有关经验。
  3. ●《信号与数据处理中的低秩模型》 本文介绍了稀疏低秩模型、优化算法和背景建模、图像对齐、显著区域 检测等多个代表性应用。如何鲁棒、高效地处理高维数据是一个重大挑战。幸运的是,高维数据 并不是毫无结构的,它们经常分布在低维流形附近。基于低秩的模型是近年涌现出来的鲁棒、高效处理高维数据的新工具,受稀疏表示(sparse representation)和压缩感知(compressed sensing)理论的推动,系统地发展出了二阶稀疏性的理论与应用。
  4. ●《视觉局部特征的表达学习》 本文介绍了局部特征的监督和非监督表达学习,通过卷积神经网(Convolutional Neural Networks, CNN)监督模型进行局部特征表达学习后,在百度人形分割图像测试集上达到了近87%的分割精度。该文章认为卷积神经网中的卷积操作是一种特殊的非监督局部特征编码操作,反映了滤波器与图像中每个局部区域之间的相似性。对局部特征编码的深入研究启发我们设计新的操作来代替卷积,开发出性能更好的深度模型。
  5. ●《基于深度学习的图像识别进展:百度的若干实践》 介绍了百度公司在图像分类、物体检测、光学字符识别 (Optical Character Recog- nition, OCR) 和自然语言描述图片等领域取得的一流研究成果和多层次并行分布式深度学习平台PADDLE的架构,深度学习技术被成功应用到百度识图、百度翻译和手机百度等众多产品中。人工智能的本质特征是学习的能力。作者通过大量的研发实践,总结了图像扰动、结构化损失函数、参数稀疏化等颇具价值的知识经验,指出了深度学习在增强学习,大规模弱标注数据训练,低层、高层视觉结合,硬件加速等问题的研究方向。