CCBR 2024 -2024.11.23
2024年11月22日至11月24日,第十八届中国生物特征识别大会(Chinese Conference on Biometric Recognition,CCBR)在南京国际会议大酒店举行,是国内生物特征识别领域的学术盛会。CCBR 2024由中国图象图形学学会(CSIG)、中国人工智能学会(CAAI)、中国科学院自动化研究所联合主办。本届会议汇聚国内从事生物特征识别理论与应用研究的广大科研工作者,并邀请国际同行,共同分享我国生物特征识别研究的最新理论和技术成果,为大家提供精彩的学术盛宴。视觉计算实验室的小伙伴来到了会议现场,学习生物特征领域的最新理论和前沿技术成果,并做了相关的记录和总结。
特邀报告:Advanced Biometrics: 深度探索 泛化应用
讲者:张大鹏(香港中文大学(深圳))
全世界越来越多地致力于开发可在各种安全环境中有效的自动个人识别系统。作为最强大、最可靠的个人身份验证手段之一,生物识别技术备受关注。报告详细探讨了个人身份自动识别系统在多种安全场景中的广泛应用和研究进展。报告中,张教授系统性地阐述了这一新兴研究领域的背景和意义,并将其定义为“先进生物特征识别技术”(Advanced Biometrics)。通过对生物特征识别技术的深入研究,众多算法、应用和系统相继开发,为行业发展提供了强大助力。在案例研究部分,张教授重点介绍了一项生物特征识别技术——掌纹识别(Palmprint Recognition),以及两个新兴应用方向——医疗生物特征识别(Medical Biometrics)和美学生物特征识别(Aesthetical Biometrics)。通过展示相关研究成果,报告呈现了这些技术的有效性及其潜在价值。本次报告为从事生物特征识别领域研究的学者提供了宝贵的交流平台,也为相关技术在安全、医疗、美学等领域的进一步应用指明了方向。
特邀报告:生物特征识别的隐私与安全
讲者:陈熙霖(中国科学院计算技术研究所)
生物特征识别技术的广泛应用在便捷百姓生活和优化社会治理方面发挥了重要作用,但同时也带来了极大的安全与隐私风险。近年来,全球纷纷针对人工智能技术,尤其是生物特征识别的安全性、伦理问题以及隐私保护,制定了一系列相关法规。该报告深入探讨了生物特征识别技术的广泛应用给社会生活带来的便捷,同时也直面安全隐患与隐私风险等热点议题。
报告梳理了生物特征识别技术应用的历史演进,剖析了身份假冒与信息盗用等关键问题,并从技术角度探讨了潜在的解决方案。陈教授还分享了近年来在生物特征识别技术安全领域的重要研究成果,展示了通过技术进步与合理使用来应对安全挑战的可能性。
专题论坛:多模态大模型前沿论坛
讲者:徐常胜(中国科学院自动化研究所)、魏云超(北京交通大学)
1. 开放世界的多模态大模型研究与应用
徐教授以“开放世界的多模态大模型研究与应用”为主题,深入探讨了多模态大模型的前沿研究和实际应用现状。多模态大模型因其能够从视觉、语言等不同模态数据中学习共性知识,比单一模态模型具备更强的通用性,成为当前人工智能领域进一步发展的核心突破口。徐教授指出,多模态大模型不仅在跨模态检索、跨模态生成等任务中取得了优异表现,还具备更接近人类认知的能力。然而,在开放世界的实际应用场景中,多模态大模型依然面临着多模态数据关联建模及模型泛化性等关键挑战。
在报告中,徐教授探讨了两个亟待解决的核心问题:(1)如何在保留不同模态数据本身特性的前提下建模多模态数据关联;(2)如何在保证模型泛化性的前提下实现多模态大模型在下游任务中的跨域迁移和小样本迁移。针对这些挑战,徐教授介绍了基于解耦视觉系统的多模态大模型Libra,通过优化模型架构,使其兼具模态独立性与关联性,进而实现多模态数据的高效建模。同时,他还分享了在模型泛化性保持方面取得的重要进展,介绍了多种跨域迁移与小样本迁移方法,为多模态大模型在下游任务中的应用提供了新的研究路径。
2. 从3D到4D,快速且时空一致的4D内容生成探索
魏教授以“从3D到4D,快速且时空一致的4D内容生成探索”为主题进行了学术分享。报告聚焦于近年来4D内容生成领域的最新进展,深入探讨了如何从3D生成技术出发,突破4D生成的技术瓶颈。魏教授指出,尽管借助2D生成大模型的快速发展,3D内容生成取得了显著进展,但动态3D(即4D)内容生成的研究依然面临巨大挑战,主要因为缺乏大规模4D数据集和强有力的视频预训练模型。针对这些问题,魏教授介绍了两项最新的研究工作——4DGen和Diffusion4D,并系统阐述了其在时空一致性上的创新方法。
魏教授重点介绍了:(1)时空一致的监督信号设计:通过高保真度的监督信号引导生成模型,提升4D内容在时间和空间维度的表现一致性;(2)4D数据集微调策略:探讨如何利用有限的4D数据对现有视频生成模型进行有效微调;(3)多模态控制生成:实现从文本、图像或视频等控制信号到4D内容的高质量生成,为跨模态生成领域提供了新思路。此次报告深入浅出地展示了该领域的前沿理论与实践,还启发了在场学者对于4D内容生成未来方向的思考。