2022年9月12日,四川大学视觉计算实验室周怡、王心翌、姚林和朱敏教授在生物信息学国际权威期刊《Briefings in Bioinformatics》在线发表学术论文“LDAformer: Predicting lncRNA-disease associations based on topological feature extraction and Transformer encoder”。
长链非编码RNA(long non-coding RNA,lncRNA)-疾病的关联检验对疾病的诊断和治疗具有重要价值,当前常用计算方法来预测潜在的lncRNA-疾病关联。然而,现有的方法在数据处理过程中往往未能充分提取关键特征,且学习模型的部分普遍存在能力不足或过于复杂的问题。因此,计算方法的预测性能仍有待提高。
针对上述背景,本文提出了一种基于拓扑特征提取和Transformer编码器的lncRNA-疾病关联预测方法LDAformer。具体贡献包括:
1. 统一地将相似性和关联信息视为节点间的连通性,构建lncRNA-disease-miRNA带权邻接矩阵。
2. 设计了一项多跳拓扑特征提取过程,从而获得具有明确通路语义的输入特征。
3. 引入Transformer编码器进行lncRNA-疾病关联预测,其强大的全局自注意力机制可以捕获拓扑通路之间的相互依赖关系。
实验结果表明,LDAformer的预测性能优于目前的SOTA方法。案例研究也进一步表明了LDAformer具有挖掘潜在关联的能力。
未来,实验室还将从数据特征和模型算法方面进一步探索疾病-调控因子关联预测问题。一方面,尝试引入更多不同类型的疾病调控因子,构建多源异构图;另一方面,尝试构建适应大规模异构图数据的预测模型。
《Briefings in Bioinformatics》是生物信息学领域的国际权威期刊,2022年度其影响因子为13.994。根据中科院SCI期刊分区2021最新基础版,它在小类学科Mathematical & Computational Biology属于1区Top期刊。