CBC2019-day2

8月25日,第四届中国计算机学会生物信息学会议第二天的精彩报告如约而至。
特邀报告
来自中山大学中山眼科中心的刘奕志教授为我们带来了题为“用人工智能进行常见眼病筛查诊断、风险和预后预测的研究”的精彩报告。刘教授团队近年来利用高速发展的机器学习新算法,对眼科诊疗大数据进行挖掘学习,构建了白内障图像识别诊疗决策云平台、青光眼多模态诊断体系、眼底多疾病诊断系统和近视发展预测的一系列人工智能模型,经过内外部的机器数据验证,准确率均可达到90%以上。以上系统已经在临床上初步投入使用,并取得了临床实践上的真实反馈,可辅助或部分代替医生,远程为广大患者提供专家级别的筛查、诊断、诊疗决策、风险评估和预后预测的新型医疗服务。
1

来自中国科技大学的黄德双教授为我们带来了题为“Motif Mining in Biological Sequences by Deep Neural Networks ”的精彩报告。黄教授今天讲述的主题是使用深度学习方法进行序列的motif挖掘,有研究表明结合位点motif挖掘在转录和翻译中发挥着至关重要的作用,将motif挖掘与深度神经网络相结合已成为研究趋势。接下来列举了多种神经网络模型,如:卷积神经网络、半监督神经网络、大型卷积神经网络等,结合序列和结构信息,用于预测RNA与DNA的motif。在最后黄教授也提出了motif预测的难点,因结构信息是通过序列信息预测,所以可能产生冗余信息,无法保证预测高准确性,进一步来讲,序列编码以及模型选择也对预测准确性有一定影响。
2

来自中科院“基因组科学与信息”的方向东博士为我们带来了题为“基因组大数据与全民健康”的额精彩报告。方博士主要介绍了目前关于基因组大数据的使用瓶颈以及实现全民健康需要做出的努力。随着基因测序的价格越来越低,越来越多的基因数据积累起来,目前关键技术瓶颈是生命健康大数据不能得到有效利用,如果能够及时获取、结构化整合、快速分析这些数据,并且有效整合临床医疗与卫生健康数据,才能开展精准的疾病分类与诊断,实现个性化疾病防治和健康管理的全新模式。生命健康大数据不能得到有效利用的主要原因在于:数据多元异构、物理分散,亟需集成与融合,需要开发组学和医疗数据集成引擎,建立标准化的、可拓展、可共享的精准医学大数据平台;在充分保障健康数据的隐私和安全的前提下 ,有效实现精准医学大数据的互联、互通、互操作。国家主管部门要及时出台相关的法规和标准,加快建设统一权威、互联互通的人口健康信息平台。
3

分会场报告
下午的报告分别在三个分会场举行,分会场的主题分别为:生物信息学算法,基因组学分析,生物网络、RNA与疾病关联分析。下面对其中的部分报告做简单介绍:
来自南开大学人工智能学院的张瀚教授为我们带来了题为“Detecting Hidden Batch Factors Through Data-Adaptive Adjustment tor Biological Effects ”的精彩讲座。批量效应是影响高吞吐量研究(如RNA测序)测量技术变化的主要来源之一,有研究表明,不同的实验平台、实验室条件、不同的样品来源和人员差异可能会导致批量效应差异,这些差异会导致假阳性。批量校正算法的一个关键是弄清楚批量因素,但在许多情况下,这些因素是未知的或不准确的,因此,检测隐藏的批量因素尤为重要。张教授团队提出了一种基于数据自适应收缩和半非负矩阵分解的检测未知批量效应的新算法,能够识别原始研究遗漏的新的批量因子,导致差异表达基因的表达不足,同时在检测细微批量效应方面也具有强大功能。
4

来自大连理工大学软件学院的何增有教授为我们带来了题为“统计显著社区发现及其在生物信息中的应用”的精彩报告。社区发现是数据挖掘以及网络科学等诸多领域中的核心算法问题之一,何教授团队将统计显著社区发现算法应用在蛋白质与蛋白质网络发现等生物信息学问题中,最近提出评估社区统计显著性的P值计算方法(社区划分越合理,P值越小),以及如何利用启发式的方式来对目标函数进行优化,搜索具有统计显著意义的社区。
5

来自吉林大学周丰丰团队的成员为我们带来了一场名为“Two Straws May Make a Perfect Diamond: Selecting Individually Weak Features for a Better Accuracy ”的精彩报告。由于算法时间复杂度等问题,生物医学大数据的常用分析方法是考察组间差异指标(特征),来发掘表型相关的功能模块。通过理论构造和实验验证多个途径表明,组间差异性较小的单个特征,组合在一起可以取得非常好的数据模型。该团队在IFS方法的基础上,提出了一种名为RIFS的特征打分排序算法,并进一步给出了多个不同生物医学大数据领域的实际应用案例。
WechatIMG118

来自湖南大学信息科学与工程学院的骆嘉伟教授为我们带来了一场名为“基于癌症基因组学数据的miRNA功能模块识别算法研究”的精彩报告。大量研究表明miRNA的异常表达与癌症的发生、发展有关,且miRNA通常以组合的方式发挥其协同调控作用。本报告主要介绍如何通过聚类手段发现miRNA的功能模块,即利用粗糙集算法识别miRNA调控模块和利用亲和力传播聚类算法发现miRNA预后模块。
WechatIMG119

最后,中国科学院计算机技术研究所研究员张法进行闭幕式致辞,并宣布下一届CBC会议拟于2020年8月16-19日在哈尔滨华旗饭店举行。期待明年的会议~
WechatIMG120