2021年秋季学期视觉计算实验室第十三次论文研读预告

时间:2021年12月30日(本周四) 09: 30

地点:望江校区基础教学楼B座318实验室

研读成员:张馨艺、李希垚

Part1

研读成员:张馨艺

分享内容:

[1] Fujiwara T, Wei X, Zhao J, Ma KL. Interactive Dimensionality Reduction for Comparative Analysis[J]. IEEE Transactions on Visualization and Computer Graphics, 2021.

[2] Li Y, Musabandesu E, Fujiwara T, Loge FJ, Ma KL. A Visual Analytics System for Water Distribution System Optimization[C]//IEEE Visualization Conference (VIS) . IEEE, 2021: 126-130.

论文简介

[1] 寻找数据集组之间的异同是一项基本的分析任务。针对高维数据,我们通常使用降维(DR)方法来寻找每个组的特征。然而,现有的 DR 方法在此类比较分析方面能力和灵活性有限。每种DR方法仅适用于狭窄的分析目标,例如识别最能区分簇的因子。本文提出了一个交互式 DR 框架,将一种新的 DR 方法(ULCA(unified linear comparative analysi))与交互式可视化界面相结合。ULCA 统一了判别分析(LDA)和对比学习(cPCA)两种 DR 方案,以支持多种比较分析任务。我们提出了一种优化算法,为比较分析提供灵活性,使分析师能够以交互的方式改进 ULCA 结果。此外,交互式可视化界面有助于解释和改进 ULCA 结果。最后,我们评估 ULCA 和优化算法的效率,并通过多个基于真实世界数据集的案例分析来证明该框架的实用性。

图1 框架的分析流(左)和可视化实现(右)

[2] 优化配水系统 (WDS) 对于最大限度地降低其运营所需的能源成本至关重要。研究人员采用的主要方法是通过检查 WDS 的计算模拟方法来确定水泵控制的最佳方案。然而,由于大量可能的控制组合和 WDS 模拟的复杂性,通过回顾模拟结果来确定最佳泵控制仍然非常重要。为了解决这个问题,我们设计了一个可视化分析系统,帮助理解模拟输入和输出之间的关系,以实现更好的优化。我们的系统结合了可解释的机器学习以及多个链接的可视化,以从复杂的 WDS 模拟中捕获基本的输入-输出关系。我们通过实际案例研究证明我们系统的有效性,并通过专家评审评估其可用性。我们的结果表明,我们的系统可以减轻分析负担并有助于确定最佳运行方案。

图2 用于 WDS 优化的可视化分析系统的界面

Part2

研读成员:李希垚

分享内容

[1] Tahir M, Tayara H, Hayat M, et al. kDeepBind: Prediction of RNA-Proteins binding sites using convolution neural network and k-gram features[J]. Chemometrics and Intelligent Laboratory Systems, 2021, 208: 104217.

[2] Zhang YW, Wang MB, Li SC. SuperTAD: robust detection of hierarchical topologically associated domains with optimized structural information[J]. Genome Biology, 2021, 22(1): 1-20.

论文简介

[1] RNA结合蛋白在基因调控、转录等不同的生物学过程中发挥着核心作用。本文提出了一个基于深度学习的RBPs结合位点智能预测模型kDeepBind。我们利用卷积神经网络模型自动学习抽象特征,从识别出的序列中搜寻隐含信息。此外,本文应用k-Gram特征提取技术,并与CNN特征进行拼接。我们用从CLIP-SEQ数据集中获得的RBP结合位点标签,对所提出的预测模型kDeepBind进行了评估。结果表明,本文提出的预测模型的和其他方法相比性能更优。kDeepBind模型将成为RNA-RBPs结合位点预测的学术研究及药物开发的有用工具。

图3 kDeepBind模型示意图

[2] 拓扑关联结构域(TADS)是染色体结构的组织单位。TAD可以包含TAD,从而形成层次结构。TAD的层次结构可以通过从Hi-C数据中构建编码树推断出来。然而,目前计算编码树的方法并不是最优的。在本文中,我们提出了这一计算的优化算法。与两个公共数据集的七种最先进的方法相比,SuperTAD检测到的TAD边界周围的结构蛋白和组蛋白修饰更为丰富,并且在相同的Hi-C矩阵的不同分辨率之间高度一致。

图4 SuperTAD算法流程示意图