CCF_2015年第8期_深度学习与媒体计算

  互联网的发展已达到空前规模,新闻网站、微博、微信、社交网络、图像视频共享网站等各类网络平台正在极大地改变着人们获取信息的方式。消费类电子设备的普及使普通民众不仅是信息的消费者,也成为网络信息的提供者。同时,媒体数据的来源渠道广、内容多样化、需求多元化、计算复杂化等特点也给媒体计算(特别是媒体信息的有效表示)带来了极大挑战。深度学习是近年来出现的一种具有里程碑意义的数据表示学习技术。深度学习的本质是通过多层非线性变换从大数据中自动学习特征,从而替代手工设计。深层的结构使深度学习具有极强的表达能力和学习能力,尤其擅长提取复杂的全局特征和上下文信息,而这是浅层模型难以做到的。通过应用深度学习技术,物体识别、图像分类、语音识别等诸多领域都取得了巨大突破。在《[**深度学习与媒体计算**](http://pan.baidu.com/s/1gdnm5j1)》中,介绍了谷歌、微软、百度等互联网公司也投入大量精力研究深度学习技术,构建了相应的数据处理平台。得益于强大的数据抽象能力,深度学习技术也为媒体计算领域研究提供了新的机遇。


专题文章:

  1. ●《语音信号与信息处理中的深度学习》 本文介绍了语音识别、语音合成等语音信号与信息处理技术旨在实现智能化的人机语言交互,这也是人工智能领域中的重要研究课题。另外,深度学习技术已经在人工智能领域的其他任务上取得了成功的应用,如图像分割,特性学习,单词表征等。
  2. ●《深度匹配学习在语言匹配中的应用》 本文围绕自然语言处理的一些匹配问题,如信息检索、自动问答、短文本对话,介绍了深度匹配学习在这些问题上的应用,重点讲述了最近提出的六个深度匹配模型的结构、学习算法及特性。这些模型能够很好地描述自然语言的匹配关系,大幅提升匹配任务的准确率。深度匹配学习在自然语言处理方面已经取得了可喜的进展,但是仍然有许多新的领域值得探索,有许多困难亟须解决。
  3. ●《图像识别中的深度学习》 本文从特征学习、深层结构的优势、提取全局特征和上下文信息的能力及联合深度学习等方面介绍了深度学习为何与众不同。在文章中提到了深度学习在物体识别中的应用,比如:ImageNet图像分类、人脸识别。最后,文章对深度学习在物体检测以及视频分析方面的应用也做了一定的介绍。
  4. ●《媒体计算新进展与挑战》 本文结合互联网用户所创造的“内容”正在迅猛增长,从不同渠道涌现的文本、图像和视频等不同类型的媒体数据以及用户信息更加紧密混合。它们正在以一种新的形式,更为形象综合地表达语义、主题和事件等特点,总结出媒体计算需要重点解决的两大难点是消除“异构鸿沟”和“语义鸿沟”。介绍了多模态语义学习及媒体检索排序与哈希索引在解决该问题的应用价值,以及多种媒体知识图谱的构建方式。
123