2022年秋季学期视觉计算实验室第十一次论文研读预告

时间:2022年12月11日(本周日) 09: 30

地点:腾讯会议(线上)

分享者:李希垚、杨丹

Part1

分享者:李希垚

分享内容:

[1] ZHAO B-W, HU L, YOU Z-H, et al. HINGRL: predicting drug–disease associations with graph representation learning on heterogeneous information networks [J]. Briefings in Bioinformatics, 2021, 23(1).

[2] ZHANG P, WU Y, ZHOU H, et al. CLNN-loop: a deep learning model to predict CTCF-mediated chromatin loops in the different cell lines and CTCF-binding sites (CBS) pair types [J]. Bioinformatics, 2022, 38(19): 4497-504.

论文简介

[1] 确定药物的新适应症在药物研发的许多阶段都起着至关重要的作用,计算方法被认为是将药物与新适应症相关联的有效方法。现有的大多数方法通过构建各种异构网络来完成任务,而没有考虑药物和疾病的生物学知识。本文提出了一种新的基于异构信息网络(HIN)的模型HINGRL,基于图表示学习技术精确识别药物的新适应症。HINGRL首先通过将药物-疾病、药物-蛋白质和蛋白质-疾病生物网络与药物和疾病的生物学知识相结合来构建HIN,然后应用不同的表示策略从拓扑和生物学的角度学习HIN中节点的特征。最后,HINGRL基于上一步获得的药物和疾病的综合特征,采用随机森林分类器预测未知的药物-疾病关联。 实验结果表明,HINGRL 在两个真实数据集上取得了最佳性能。案例研究表明,同时考虑网络拓扑结构和药物与疾病的生物学知识能够从更全面的角度精确预测药物-疾病关联。

图1 HINGRL工作流程

[2] 三维基因组组织在基因调控和疾病机制中至关重要,而先前的研究表明了CTCF 介导的染色质环对于研究细胞的 3D 结构的重要性。现有的检测染色质环的各种实验技术既费时又昂贵。如今,各种基于序列的计算方法可以捕获 3D 基因组组织的重要特征,并有助于预测染色质环;然而这些方法的预测性能较低,且泛化能力差。本文提出了一种新的深度学习模型 CLNN-loop,通过融合多个基于序列的特征来预测不同细胞系和 CTCF 结合位点 (CBS) 对类型中的染色质环。 基于先前研究中的数据集进行的一系列实验表明,CLNN-loop 具有令人满意的性能,在预测染色质环方面优于现有方法。 此外,我们应用 SHAP 框架来解释不同模型的预测,发现 CTCF 基序和序列保守性是不同细胞系和 CBS 对类型中染色质环的重要标志。

图2 CLNN-loop模型结构

Part2

分享者:杨丹

分享内容:

[1] Zeng Z, Moh P, Du F, et al. An evaluation-focused framework for visualization recommendation algorithms[J]. IEEE Transactions on Visualization and Computer Graphics, 2021, 28(1): 346-356.

[2] Zhao J, Xu S, Chandrasegaran S, et al. Chartstory: Automated partitioning, layout, and captioning of charts into comic-style narratives[J]. arXiv preprint arXiv:2103.03996, 2021.

论文简介

[1] 推荐算法通过自动生成可视化图表帮助用户分析人员探索数据,发现数据中的有意义的见解。目前的大多可视化系统倾向于生成新的可视化推荐算法,而没有对如何评估它们给出相应的思路,对于如何有效地应用这些推荐算法缺乏严格的理论和经验指导。本文提出一个以评估为中心的框架来比较广泛的可视化推荐算法,该框架由三个部分组成:表示可能可视化设计全部空间的图、用于遍历图的潜在候选推荐的方法与用于对候选设计排序的oracle。为了说明该框架如何有效指导推荐算法的比较,文章从理论上比较了五个现有的代表性推荐算法,而且还实例评估比较了基于理论比较结果产生的4个新算法。评估结果表明,这些算法在用户性能方面的表现类似,突出说明了我们需要对推荐算法进行更严格的形式比较,以进一步明确它们在各种分析场景中的优势。

图3 以电影数据为例说明推荐算法的可视化设计空间和枚举步骤

[2] 数据可视化叙事作为呈现数据驱动的信息和数据分析结果的有效方式,目前人们提出了许多设计原则与新的创作工具来帮助用户完成数据可视化叙事。然而,数据分析师通常缺乏足够的设计和故事背景来有效利用这些原则和创作工具。为了协助用户更好地完成数据可视化叙事工作,本文提出了ChartStory用于从用户创建的图表集合中创建数据故事,并使用类似于漫画面板的风格来暗示数据驱动的叙事潜在序列和逻辑。ChartStory通过推荐划分、布局和描述故事片段的方法来服务于叙事,还使用直观的用户交互来更好地完善数据漫画的设计。最后本文通过三项实验广泛而全面地评估了ChartStory,专家反馈表明ChartStory能够为数据可视化叙事的创作提供了有效的建议,并且与手动创建的数据漫画相比,ChartStory创作的更好。

图4 ChartStory Pipeline