PRCV2022-day3

12月26日,PRCV2022大会最后一天议程。今日大会分为两个主旨报告、四个特邀报告、四个专题论坛和多个口头报告。

主旨报告1

报告人:Alan Yuille

报告题目:What Have Deep Nets ever done for us?

Alan Yuille教授首先介绍一篇关于深度网络优势和劣势的论文,从而引出尽管深度网络取得了巨大的成功,但由于现实世界的复杂性,他们仍然无法克服计算机视觉的基本问题。本次报告虑到最近由Transformer和自监督学习引起的深层网络的进展,重新审视这些观点。Alan Yuille教授认为,视觉的基本问题仍然存在,当前算法的局限性被视觉界评估性能的方式所掩盖。目前主张采用更具挑战性的评估标准,如分布外测试、对抗性审查员以及构建更具挑战性的评估数据集。 此外,受到人类视觉系统属性的启发,通过建立三维世界生成模型的方法最有可能克服这些挑战。

图1 Human Intelligence and Artificial Intelligence

主旨报告2

报告人:朱文武

报告题目:图机器学习研究进展

图数据,例如社交网络、交通网络、蛋白质网络等,广泛存在于各行各业。时空图、知识图、场景图等广泛用于计算机视觉领域中。图机器学习是近年来计算机视觉与机器学习的研究热点之一,已成为视频分析、目标识别、视觉推理等计算机视觉应用的核心技术。朱教授首先回顾图机器学习的发展,包括图表征学习,即将网络/图转化为低维向量表征,和图神经网络,即在网络/图上进行端到端学习。然后介绍图机器学习研究新进展,1)自动图机器学习,包括图超参优化(HPO)和图神经架构搜索(NAS);2)分布外泛化图机器学习,即针对动态开放环境中训练与测试数据非独立同分布情况的图机器学习。最后,朱教授全面介绍了图机器学习的基本概念、面临的挑战、研究进展和未来研究方向。

图2 图机器学习研究进展

特邀报告1

报告人:耿新

报告题目:机器学习的“基因”:让机器像人一样学习

耿新介绍本轮人工智能热潮的根本动力之一是现代机器学习、尤其是深度学习技术的发展。深度学习需要大量训练数据和计算资源。然而,人类往往通过少量样本就能快速学习一个新的概念。这是因为新生儿大脑并非随机,人类千万年的进化结果通过基因初始化了新生儿大脑。受此启发,耿教授团队提出机器学习的“基因”——Learngene。基于Learngene的全新学习框架有望改变目前深度学习领域的游戏规则:现在我们只需要在少数“模型供应商”处进行面向开放世界任务的大规模训练,而一个面向具体任务的“客户”只需要从“模型供应商”处购买一个Learngene,对自己的轻量模型进行初始化,即可用少量样本快速适应自己的目标任务,达像人学习一样的目的。

图3 机器学习的“基因”:让机器像人一样学习

特邀报告2

报告人:程明明

报告题目:图像自适应感知技术

程教授首先提到图像内容的感知是人工智能的基本任务之一,随着深度学习技术的发展,相关的智能感知技术在军事、医疗、消费等领域得到了广泛的应用。然而,现有视觉感知技术依然面临着特征表达粒度自适应性差所带来的算不准问题,算力自适应性差所带来的算不动问题,对有限标注的数据自适应性差所带来的算不了的问题。为了解决上述问题,本报告从粒度自适应表征、算力自适应的高效计算、和数据自适应的无监督学习等角度出发,介绍图像自适应感知技术的最新研究进展。

图4 图像自适应感知技术

口头报告1

报告内容:医学图像分析

专题简介、目的与意义:人工智能在医学图像分析领域发挥了至关重要的作用,包括图像分割、配准、计算机辅助诊断、图像融合、图像分类和识别,以及图像引导治疗和检索等。此论坛主要关注医学图像分析领域的主要研究趋势和挑战,并介绍了国际上医学图像分析领域的前言技术和原创性工作。研讨会探讨基于深度学习等人工智能技术对医学图像分析的智能化发展的推动,以及算法的评估和临床验证的挑战等焦点问题。

图5 医学图像分析

报告人1:冯前进

冯教授主要介绍其团队近年来利用AI技术在图像分析领域开展的一部分工作,包括血管分割,DR胸片软组织成像,脊柱图像分析、基于图像的疾病预测和病理图像分析等。

报告人2:王书强

王教授主要介绍了关于生成式AI的脑影像计算方法:1)基于多模态医学影像的先验引导对抗超图学习模型,用于预测不同阶段阿尔兹海默症的异常脑连接。基于专家先验知识,估算先验分布,构建双向对抗学习网络,实现多模态表征分布的一致性和模型的稳定收敛,增强了脑网络特征的识别和表征能力。2)解耦型生成对抗网络模型,用于检测异常神经环路。基于超图理论提出了稀疏容量损失,实现了对两组神经环路之间拓扑结构差异的定量比较。该模型充分利用了多模态数据的互补信息以及高阶脑网路特征,从而实现AD相关疾病的异常脑神经环路的精准检测和分析。

图6 Multi-Scale Multi-Target Domain Adaptation for Angle Closure Classification