时间:2025年10月18日(周六)09:00
地点:望江校区基础教学楼B座318实验室
Part1
分享者:杨鑫月
分享内容:
W. Cai, Q. Liu and Y. Wang, "SPMTrack: Spatio-Temporal Parameter-Efficient Fine-Tuning with Mixture of Experts for Scalable Visual Tracking," 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville, TN, USA, 2025, pp. 16871-16881
论文简介:
当前最先进的跟踪器大多采用单流范式,使用单个 Vision Transformer 对模板图像和搜索区域图像进行联合特征提取和关系建模。然而,不同图像块之间的关系建模存在显著差异。例如,由与目标无关的信息主导的背景区域需要减少注意力分配,而前景,尤其是边界区域,则需要得到重视。单一模型可能无法同时有效地处理所有类型的关系建模。本文提出了一种基于混合专家模型(TMoE)的新型跟踪器 SPMTrack,该模型专为视觉跟踪任务量身定制,结合多专家的能力,可以更灵活地处理各种关系建模。得益于 TMoE,我们将关系建模从图像对扩展到时空上下文,在模型参数增加最少的情况下进一步提高了跟踪精度。此外,我们采用 TMoE 作为一种参数高效的微调方法,显著减少了可训练参数,这使我们能够有效地训练不同尺度的 SPMTrack,并保留预训练模型的泛化能力,从而获得卓越的性能。

Part2
分享者:徐骏驰
分享内容:
Manz T, Lekschas F, Greene E, et al. A general framework for comparing embedding visualizations across class-label hierarchies[J]. IEEE transactions on visualization and computer graphics, 2024.
论文简介:
将高维向量投影到二维进行可视化,称为嵌入可视化,有利于感知推理和解释。在许多领域,比较多个嵌入可视化驱动决策,但传统的比较方法受到直接点对应的限制。这一要求排除了没有点对应关系的比较,例如两个不同的带注释图像数据集,并且无法捕获点组之间有意义的高层关系。为了解决这些缺点,我们提出了一个通用的框架来比较基于共享类标签而不是单个点的嵌入可视化。我们的方法将点划分为与三个关键类概念对应的区域:混淆、邻域和相对大小,以表征类内和类间的关系。通过初步的用户研究,我们实现了我们的框架,使用感知邻域图来定义这些区域,并引入度量来量化每个概念。我们通过机器学习和单细胞生物学的使用场景展示了我们框架的通用性,强调了我们的指标在标签层次结构之间进行深入比较的能力。为了评估我们方法的有效性,我们与五名机器学习研究人员和六名单细胞生物学家进行了一项评估研究,使用一个用Python、JavaScript和Rust构建的交互式可伸缩原型。我们的指标能够通过视觉指导进行更结构化的比较,并提高参与者对其结果的信心。
