2026年春季学期视觉计算实验室第10次论文研读报告

时间：2026年05月23日（周六）上午09:00

地点：望江校区基础教学楼B座318实验室

分享者：张键军、张晋博、徐骏驰

Part1

分享者：张键军

分享内容：

[1] Lekssays A, Mouhcine H, Tran K, et al. {LLMxCPG}:{Context-Aware} vulnerability detection through code property {Graph-Guided} large language models[C]//34th USENIX Security Symposium (USENIX Security 25). 2025: 489-507.

[1] 软件漏洞持续构成安全挑战，仅2024年，通用漏洞披露（CVE）数据库中就新增了超过25,000个漏洞。尽管基于深度学习的方法在漏洞检测方面展现出潜力，但近期研究揭示了其在准确性和鲁棒性方面的关键局限：在经严格验证的数据集上，检测准确率最高下降45%，且在简单的代码修改下，性能会显著退化。本文提出了LLMxCPG——一种将代码属性图（CPG）与大语言模型（LLM）相结合的新型框架，旨在实现鲁棒的漏洞检测。所提出的基于CPG的切片构建技术可在保留漏洞相关上下文的同时，将代码规模缩减67.84%至90.93%。该方法能够提供更简洁、准确的代码片段表示，从而支持对更大代码段（包括整个项目）的分析。这种简洁表示是该检测方法能力提升的关键因素，使其能够识别跨多个函数的漏洞。实证评估表明，LLMxCPG在经验证的数据集上效果显著，与最先进的基线方法相比，F1分数提升了15%至40%。此外，LLMxCPG在函数级和多函数代码库上均能保持高性能，并在各种语法代码修改下表现出稳健的检测能力。

Part2

分享者：张晋博

分享内容：

[1] He N, Deng Y, Yue S, et al. RAG4DMC: Retrieval-Augmented Generation for Data-Level Modality Completion[C]. The Fourteenth International Conference on Learning Representations, 2026.

[1] 针对多模态数据集中普遍存在的模态缺失问题，提出了一种面向数据层模态补全的检索增强生成框架RAG4DMC。不同于以往仅在特征层面对缺失模态进行隐式补偿的方法，该方法直接生成缺失的图像或文本模态，从而构建可复用的完整多模态训练数据。其核心思想是：生成模型不应仅依赖已有模态进行“凭空生成”，而应先从知识库中检索语义相关的完整样本作为参考，再引导生成过程。为此，论文构建了由目标数据集内部完整样本和外部公开数据组成的双知识库，并通过跨模态映射、聚类过滤和跨域对齐缓解模态差异、外部噪声和领域偏移问题。在检索阶段，方法先基于同模态相似度从全库中召回候选样本，再结合伪缺失模态特征进行跨模态融合重排序，以获得更可靠的生成参考。最后，模型生成多个候选补全结果，并根据语义一致性和生成质量进行筛选。实验在MSCOCO、Flickr30K和RSICD数据集上验证了该方法在图文检索和图像描述任务中的有效性，表明其补全后的数据能够更好地提升下游多模态模型性能。

Part3

分享者：徐骏驰

分享内容：

[1] L. Weng et al., "InsightLens: Augmenting LLM-Powered Data Analysis With Interactive Insight Management and Navigation," in IEEE Transactions on Visualization and Computer Graphics, vol. 31, no. 6, pp. 3719-3732, June 2025, doi: 10.1109/TVCG.2025.3567131.

[1] 大型语言模型（LLM）的激增彻底改变了自然语言接口（NLI）用于数据分析的能力。LLM可以执行多步骤和复杂的推理，根据用户的分析意图生成数据见解。然而，这些见解往往与分析对话中的大量上下文纠缠在一起，如代码、可视化和自然语言解释。这阻碍了在当前基于聊天的LLM界面中高效记录、组织和导航见解。在本文中，我们首先对八名数据分析师进行了形成性研究，以了解他们在LLM驱动的数据分析过程中的一般工作流程和洞察力管理的难点。因此，我们引入了InsightLens，一个克服这些挑战的交互式系统。InsightLens建立在基于LLM代理的框架之上，该框架自动化了洞察记录和组织以及分析过程，从多个方面可视化了复杂的对话上下文，以促进洞察导航。一项针对12名数据分析师的用户研究证明了InsightLens的有效性，表明它显著减少了用户的手动和认知工作，而不会中断他们的会话数据分析工作流程，从而带来了更高效的分析体验。