
ICIC 2025 记录
2025年7月27日,第二十一届智能计算国际会议(2025 International Conference on Intelligent Computing)在美丽的宁波开幕,该会议围绕人工智能、机器学习、模式识别、生物信息学和计算生物学领域的新兴和挑战性课题。视觉计算实验室21级硕士研究生吴美璇参加了此次盛会。今天会议的主要内容包括专题报告、论文报告和海报展示。
专题报告:
Trusted AI and Reasoning Beyond LLM
报告人:Jin-Song Dong(National University of Singapore)
来自新加坡国立大学的Jin-Song Dong教授展示其最新研究:Trusted AI and Reasoning Beyond LLM,该工作针对机器学习系统在安全关键领域长期存在的可解释性与可验证性缺失问题,提出“可信机器学习”系统性解决方案——通过开发“Silas”平台深度融合开放机器学习框架与形式化自动推理技术,构建可验证的算法基础。同时创新性地探索大语言模型与形式化方法的协同机制,利用概率推理约束生成过程、引入逻辑一致性验证模块以提升LLM推理的可靠性,建立具备严格安全保障的可信LLM代理框架。在实证层面,团队成功将概率推理、机器学习、LLM及计算机视觉技术整合应用于体育策略分析,开发出基于马尔可夫决策过程的网球比赛预判模型,其决策精度堪比世界顶尖选手水平。该研究进一步提出“多模态对齐算法”优化路径,推动可信AI在医疗诊断、金融风控等高敏场景的落地。

Towards Robust Learning-Based Multimedia Forensics
报告人:Jiantao Zhou(University of Macau)
来自澳门大学的周建涛教授介绍了其前沿研究“Towards Robust Learning-Based Multimedia Forensics”,该工作针对深度伪造与高级图像、视频编辑技术导致真实与伪造内容界限模糊的严峻挑战,提出强化学习型多媒体取证的创新框架:通过开发抗传输失真退化的新型特征提取技术,解决传统取证方法难以追踪快速演变的篡改技术之困局;设计抵御对抗攻击的鲁棒检测模型,突破现有系统易受恶意操作干扰的瓶颈;建立动态威胁防御机制以应对媒体传播中的特征劣化与混淆策略,为数字时代构建可信赖的多媒体真伪鉴别体系开辟新路径。
论文报告:
PLHGMDA: Pre-trained Language model and Heterogeneous Graph neural network for MiRNA-Disease Association Prediction
汇报人:Meixuan Wu(Sichuan University)
miRNA在各种疾病的发病机制和进展中起着至关重要的作用。精准识别miRNA-疾病关联(MDA)对疾病诊断与治疗具有重要意义。尽管深度学习在MDA预测领域取得显著进展,现有方法仍面临未能充分利用生物实体的原始语义信息、对miRNA-疾病网络中的异质关系建模不足的两个关键挑战。针对上述问题,作者团队提出PLHGMDA——一种融合预训练语言模型微调与异构图神经网络的新型预测模型。首先,构建一个包含类内和类间边的miRNA-疾病异质图,并将miRNA和疾病的原始特征作为节点属性。接下来,使用预训练的语言模型表征节点属性,并通过参数微调使预训练模型有效适配MDA预测任务,生成富含语义信息的节点嵌入。在此基础上,通过具有多层次注意力机制、多深度消息传递机制的异质图神经网络,获得包含丰富语义与异质图结构信息的miRNA和疾病嵌入表示。为协调预训练语言模型与图神经网络间学习率敏感度差异,作者团队提出了渐进式训练策略,通过时序参数解冻机制分步调整模型参数。

The Cyber-Physical System of Oral Health Monitoring: a Data-Driven Approach for Inference
汇报人:Shuo Wang(University of Science and Technology of China)
在本研究中,作者团队提出一种数据驱动的口腔健康监测信息物理系统(CPS),其核心为创新的深度学习模型。通过整合物理世界的传感器数据与信息域的人工智能算法,该系统构建了从数据采集、诊断推演到反馈驱动决策的闭环流程。新型深度学习模型CBASNet(复合注意力主干分割网络)专用于分析口腔全景X射线影像,可实现多病灶诊断及修复方案识别。实验结果表明该系统在口腔健康监测与疾病诊断方面性能卓越,超越了传统诊断方法与现有技术。这些成果凸显了该系统提升口腔疾病早期检出率、优化治疗结局的能力,为牙科智能诊断提供创新解决方案。
*该研究由中国科学技术大学的研究者与四川大学华西医院联合完成

Multimodal Large Model Perception Guided by Hyperbolic Geometric Prior Knowledge for 3D Complex Scenes
汇报人:Zesheng Zhan(Xiamen University)
针对现实人机交互面临的关键挑战——显著尺度差异的多样物体几何结构与复杂人类意图,导致大模型难以从单模态数据有效捕获3D几何语义。因此,从多模态数据中学习隐式高维几何与拓扑信息是十分有必要的。为此,作者团队提出通过交叉注意力强化学习联合训练多模态大模型与双曲几何引导的点云感知网络框架,实现组件间知识迁移,使大模型能够从点云中理解3D场景各元素的空间拓扑关系。针对新物体形状理解问题,该研究运用共形几何理论将3D轮廓关联至双曲流形内在结构,以学习多尺度形状不变量。具体而言,引入轻量化3D注意力门控机制,在全局与局部点云间建立更有效的几何-语义关联。同时,为降低单度量标注噪声,设计融合先验知识的混合物理度量以稳定抓取位姿训练。实验验证了该方法的效能与可扩展性。

DCA-Enhancer: A Dual-Scale Convolutional Attention Network for Accurate Enhancer Identification and Strength Prediction
汇报人:Haitao Li(Anhui University)
增强子作为顺式调控DNA元件,其精准识别与强度预测对于理解基因调控机制至关重要,但由于序列变异性强且标记数据有限,该任务仍具挑战性。作者团队提出DCA-Enhancer神经网络模型:通过集成微调DNABERT-2嵌入表示、双尺度卷积滤波器及空间注意力机制,协同捕获短程和长程基序特征并强化关键区域表征。在基准数据集上经五折交叉验证评估,并针对七种领先模型进行独立测试,结果表明该模型在基因组序列分析中具有卓越的鲁棒性与性能优势。

海报展示:
Talk2Doc: A Patient Q&A system using Retrieval-Augmented Generation with Weighted Knowledge Graphs and LLMs
展示者:Asad Khan(Southeast University)
患者问答系统中高效检索对解决复杂医疗健康咨询至关重要。针对这个领域,作者团队提出了创新性的问答系统Talk2Doc,融合RAG、WKG与LLM以提升医疗应答质量与语境理解。该系统通过患者问诊构建权重化知识图谱,同时保留病例内结构及病例间关联。基于相关子图检索生成精准语境感知答案,有效修正文本表征碎片化缺陷。经标准检索指标与文本生成指标严格评估,Talk2Doc显著优于现有方法,通过强化医疗实体语义关联优先机制,该方法保证了系统优化检索性能的高质量响应。
