春生万物,智启未来。2026年4月18日,由四川省人工智能学院、中国图象图形学学会(CSIG)青年工作委员会、中国计算机学会(CCF)成都分部联合主办,西南石油大学、中国电信四川分公司、四川大学及电子科技大学共同承办的“2026 CVPR 西南地区预分享会”在西南石油大学思学楼 A114 隆重举行。视觉计算实验室博士生卢玉杰,刘宜松代表团队参会,并就实验室最新被国际计算机视觉顶级会议 CVPR 2026 接收的工作进行了深度的学术汇报。
本次预分享会是西南地区视觉与学习领域的一场学术交流活动。会议汇聚了西南地区众多顶尖高校与科研机构的青年学者,议程紧凑,内容全面覆盖了人工智能基础理论、生成式大模型、3D 视觉(如 Gaussian Splatting)、视频生成以及底层视觉任务的最新突破。
特邀报告高屋建瓴,指引视觉基础模型前沿
会议伊始,多位领域内知名专家带来了精彩的特邀报告。其中,重庆大学张磊教授以《视觉基础模型与泛化的统一:理论与算法》为题的报告引发了与会学者的强烈共鸣。张教授深入剖析了当前视觉大模型在面临跨域场景时的泛化瓶颈,并提出了统一的理论框架。这一探讨,与视觉计算实验室目前在医学图像领域大力推进的架构无关与跨域自适应等基础模型研究理念不谋而合,为后续的学术研讨奠定了理论基调。
在随后的论文分享环节中,多项极具突破性的顶会工作相继亮相。特别值得一提的是,来自电子科技大学的江世银同学分享了题为 Differentiable Vector Quantization for Rate Distortion Optimization of Generative Image Compression 的研究成果。该工作在今年的 CVPR 论文评审中斩获了满分评价。其在生成式图像压缩任务中,通过可微矢量量化技术巧妙解决率失真优化难题的创新思路,为底层视觉的特征压缩与重建提供了重要范式。
此外,日程中关于 3D 视觉的探讨也异常火热。如吴海崎等同学分享的关于细粒度与泛化 3D 高斯溅射(Gaussian Splatting)的工作,展示了空间渲染技术的新高度;而多位学者在视频生成与多模态大模型测试时间自适应(Test-time Adaptation)领域的报告,也充分展现了西南地区青年学者在 AI 最前沿领域的工作。
产学研深度融合,算力筑基科研创新
在大模型时代,算力是驱动科研前行的核心引擎。会议期间,中国电信(天翼云公司)的专家特别带来了《数智赋能科研 算力驱动创新》的主题分享。报告详细介绍了当前高性能算力集群的建设情况,这也让在场重度依赖高性能 GPU 进行基础模型预训练与微调的学者们,看到了未来校企算力合作的广阔空间。
VCL 成果惊艳登场,底层算法赋能精准医疗
下午 15:00,在林言老师的主持下,实验室 2025 级博士生卢玉杰登台作学术报告。他代表团队,向与会专家详细解读了由朱敏教授指导、并已被 CVPR 2026 接收为 Oral的文章——SegMoTE: Token-Level Mixture of Experts for Medical Image Segmentation。
卢玉杰在报告中深入浅出地剖析了临床医学图像处理的痛点。他指出,面对复杂的医疗数据,传统单一尺度的特征提取网络往往难以兼顾病灶的全局语境与局部细节。为此,团队创新性地引入了 Token 级别的混合专家机制(MoE),使得模型能够根据输入图像的不同区域和模态特征,自适应地进行特征路由与融合。
在现场交流环节,卢玉杰进一步分享了该模型在不需要依赖原始 Mask 的高效训练策略,以及其在海量多模态医学数据中的泛化表现。这一底层算法的精进,不仅在客观评测指标上实现了对现有方法的超越,更展示了其未来作为即插即用模块,赋能临床辅助诊断的潜力。
结语
此次预分享会不仅是一次最新科研成果的集中展示,更是西南地区青年视觉学者交流的平台。通过参与此次盛会,视觉计算实验室不仅扩大了团队在医学图像基础算法领域的学术影响力,也为后续开展更广泛的跨学科、跨校际合作积蓄了力量。未来,实验室将继续深耕视觉计算底座,力争在通用医学特征精炼与跨模态感知方向产出更多立足国家需求、具有国际视野的顶尖成果。