2025年秋季学期视觉计算实验室第15次论文研读预告

时间：2025年12月27日(周六) 09: 00

地点：望江校区基础教学楼B座318实验室

分享者：甘小容、李天豪

Part 1

分享者：李天豪

分享内容：

Zhao S, Zhang J, Wu Y, et al. Langcell: Language-cell pre-training for cell identity understanding[C]//Proceedings of the 41st International Conference on Machine Learning (ICML-2024). 2024.

论文简介：

随着单细胞测序数据规模与来源的持续扩展，细胞身份逐渐由传统的固定细胞类型标签，演变为跨组织、跨疾病及连续状态变化的复杂表征，使得依赖监督分类的细胞注释方法在开放世界和未见细胞类型场景下面临显著局限。围绕这一现实问题，LangCell提出将细胞身份建模从离散标签预测重构为细胞与自然语言描述之间的语义对齐任务，试图以“检索与理解”替代传统“注释”范式。在方法上，该工作以基因排序的单细胞表达序列作为输入，通过全局尺度校正突出细胞特异性表达模式，并在多阶段预训练中结合掩码基因建模与细胞间对比学习，学习稳定且具有生物学一致性的细胞表示。在此基础上，引入细胞–文本对比学习与匹配机制，将细胞嵌入映射至可被自然语言表达和检索的共享语义空间，并通过检索与精细匹配相结合的两阶段推理流程，实现对细胞身份的语义检索与验证。实验结果表明，该框架不仅能够支持传统细胞注释任务，还在完全未见细胞类型的条件下展现出稳定的零样本注释能力，为广义细胞身份理解和开放场景下的单细胞分析提供了新的研究范式。

Part2

分享者：甘小容

分享内容：

Tang H, Guo Z, Wang L, et al. Similarity Memory Prior is All You Need for Medical Image Segmentation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2025: 23009-23018.

论文简介：

研究发现灵长类动物视觉皮层中的“祖母细胞”能够对特定复杂形状的输入做出反应。受此启发，作者设计了相似记忆先验网络（Sim-MPNet），通过存储相似记忆先验来引导模型学习医学图像中的关键特征。为了解决传统CNN方法被动响应局部纹理以及ViT方法依赖大量数据训练、且易退化为关注高频纹理的局限，作者设计了动态记忆权重损失注意力模块（DMW-LA），通过构建原型记忆库存储相似性记忆先验，模型从原型记忆库中直接匹配和记忆医学图像中特定器官或病变的类别特征，并采用权重损失动态更新策略（W-LD）优化记忆库，确保先验知识能有效辅助网络提取关键特征。同时，论文还引入了双相似性全局内部增强模块（DS-GIM），结合余弦相似度和欧氏距离深入挖掘特征分布的内部差异，增强模型对细微结构变化的感知能力。作者设计了消融实验，证明了由DMW-LA所组成的编码器能够有效提升分割性能。同时证明了W-LD策略和DS-GIM也能带来性能增益。

Navigation

Tag list

2025年秋季学期视觉计算实验室第15次论文研读预告