2020年秋季学期视觉计算实验室第六周论文研读预告

时间: 2020年11月5日(本周四) 09 : 00
地点: 望江校区基础教学楼B座318实验室
研读成员: 张馨艺 王心翌

Part1
分享者:张馨艺
分享内容:
[1] Cui Z, Badam S K, Yalçin M A, et al. Datasite: Proactive visual data exploration with computation of insight-based recommendations[J]. Information Visualization, 2019, 18(2): 251-267.
[2] Kammer D, Keck M, Gründer T, et al. Glyphboard: Visual Exploration of High-Dimensional Data Combining Glyphs with Dimensionality Reduction[J]. IEEE Transactions on Visualization and Computer Graphics, 2020, 26(4): 1661-1671.
论文简介:
[1] 有效的数据分析理想地要求分析人员具有很高的专业知识和数据知识。即使如此熟悉,手动执行所有可能的假设并探索所有可能的观点也是不切实际的。因此,本文提出了一个主动的视觉分析系统DataSite,其中选择和执行合适的计算的负担由服务器端自动计算引擎承担。所有自动后台过程中识别出的显著特征会在feed视图中以通知的形式呈现给用户。DataSite有效地将数据分析变成了分析人员和计算机之间的对话,从而减少了用户的认知负荷和领域知识要求。最后,作者通过一项用户研究验证了该系统的有效性,并将其与最近的可视化推荐系统进行了比较。

图1 DataSite系统界面

[2] 严格的数据科学是跨学科的。为了理解高维数据,数据科学家需要与领域专家进行对话。基于此,本文作者提出了Glyphboard可视化工具,旨在支持数据科学家与领域专家之间的对话。Glyphboard是一个可缩放的用户界面,它在一个新颖、无缝且集成的工具中结合了例如降维和基于glyph的可视化等可视化方法。降维可以快速概览数据,而基于glyph的可视化视图可以一目了然地显示数据集中最相关的尺寸。此外,作者提供了Glyphboard的一种用于高维数据的通用交换格式的开源原型,以及来自四个示例性领域的九位数据科学家和领域专家的案例研究,目的是评估用户如何使用Glyphboard的不同可视化和交互功能。

图2 Glyphbboard系统界面

Part2
分享者:王心翌
分享内容:
[1] Zhang S, Wang Y, Zhang X, et al. Prediction of the RBP binding sites on IncRNAs using the high-order nucleotide encoding convolutional neural network[J]. Analytical Bioclemistry, 583, 2019.
[2] Deng L, Liu Y, Shi Y, et al. A deep neural network approach using distributed representations of RNA sequence and structure for identifying binding site of RNA-binding proteins[C]// 2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE, 2019.

论文简介:
[1] 长非编码RNA(lncRNA)与RNA结合蛋白(RBPs)的相互作用在细胞中起着重要作用。在lncRNA链上寻找RBPs结合位点有助于了解转录后的调控机制、探索癌症的发病机制等。虽然已经开发了许多预测lncRNA与RBPs相互作用的计算方法,但这些方法缺乏对核苷酸间依赖关系的考虑。本文提出了一种基于卷积神经网络的深度学习框架,HOCNNLB,来预测lncRNA链上的RBPs结合位点。HOCNNLB采用高阶编码(high-order coding)的方法,该方法通过考虑核苷酸之间的依赖关系对lncRNA序列进行编码,然后将编码的lncRNA序列送入卷积神经网络(CNN)预测RBP结合位点。本文在31个实验数据集上对HOCNNLB进行了评估,实验结果表明,HOCNNLB能够可靠地预测lncRNA链上的RBP结合位点,且优于当前最好的预测模型。

图3 HOCNNLB模型框架

[2] RNA结合蛋白(RBPs)在RNA转录后调控中起着至关重要的作用。识别RBP结合位点是了解转录后调控生物学机制的关键步骤。虽然已经开发了许多预测RNA蛋白结合位点的计算方法,但很少有研究考虑RNA初级序列和二级结构特异性的k-mer嵌入表示。本文开发了一个深度学习框架,DeepRKE,以预测RNA-蛋白质结合位点。DeepRKE采用无监督的浅层两层神经网络,通过考虑它们的邻居上下文,自动学习k-mers的分布式表示。与传统的k-mers方法相比,分布式表示法有效地检测了k-mers之间的潜在关系和相似性。将序列和二级结构的分布表示输入卷积神经网络(CNN)和双向长时记忆网络(BLSTM),以区分RBP结合位点和未结合位点。本文在两个大规模的RBP结合位点数据集上综合评估了DeepRKE,实验结果表明DeepRKE有着更好的性能。

图4 DeepRKE模型框架