2020年春季学期视觉计算实验室第八周论文研读预告

时间: 2020年4月23日 09:00
地点: 四川大学视觉计算实验室钉钉群
Part 1
分享者: 姚林
分享内容:
[1] Liu T , Porter J , Zhao C , et al. TADKB: Family classification and a knowledge base of topologically associating domains[J]. Bmc Genomics, 2019, 20(1).
[2] Zheng X , Guosheng Z , Cong W , et al. FastHiC: a fast and accurate algorithm to detect long-range chromosomal interactions from Hi-C data[J]. Bioinformatics(17):17.
论文简介:
[1] 染色质拓扑关联结构域(TAD)被视为生物基因的结构和功能单元。作者面向TAD汇总分析的资源缺乏,整合十一种细胞的数据库,开发了具备检索、可视化、数据分析功能的在线知识库TADKB。该数据库包含了TAD的二维和三维结构、染色体的三维结构、编码基因和非编码基因的注释、环/峰、TAD的家族分类。TADKB允许用户逐步探索编码基因和IncRNA在染色体上的三维位置、TAD中形成的环。作者通过系统分析发现,染色质状态较为匮乏的TAD基本也存在于按结构划分的集群中,他们具有较小的指数参数和较大的回转半径,表明TAD结构和功能存在对应关系。

1-1

图1 TADKB染色体界面中TAD信息的呈现

1-2-1

图2 以状态和结构做TAD家族聚类的热力图对比分析

[2] 染色质如何在三维空间折叠与转录调控密切相关。然而,从Hi-C数据中检测有生物学意义的染色质相互作用,如结合峰寻找(peak calling)的方法,仍在发展中。在之前的工作中,作者研究了一种新的基于隐马尔可夫随机场(HMRF)的贝叶斯方法,对高分辨率Hi-C数据中相邻两对位点之间的空间依赖性进行显式建模,在结合峰寻找中获得了显著提高的鲁棒性和统计能力,但计算量较大。在本文中,作者研究了一种基于模拟场近似的新方法FastHiC,该方法通过一组独立随机变量来近似隐藏结合峰状态的联合分布。经验证,FastHiC获得了更高的精度和效率,并在之后的一篇综述中表现出采样率降低时的良好鲁棒性。

2-1

图3 FastHiC的实验结果

Part 2
分享者: 吴若婷
分享内容:
[3] S. Liu and X. Wang, "Bridging Text Visualization and Mining: A Task-Driven Survey" in IEEE Transactions on Visualization and Computer Graphics, vol. 25, no. 7, pp. 2482-2504 July. 2019
论文简介:
[3] 文本可视化是目前学术界和商业界最关注的话题之一,本文为了对文本挖掘、可视化技术、可视分析任务之间的联系进行综述,综合分析了1992-2017年间发表的263篇可视化论文和4346篇数据挖掘相关的论文,主要集中于可视化和文本挖掘上。通过分析,作者团队提取除了大约300个概念,并为每种类型的概念进行分类,提取出概念之间的共现关系。这一研究的主要贡献在于了解研究主题的通用概念;促进探索两个领域上的关系;通过缩小基于分析任务的可视化和挖掘技术之间的鸿沟,寻找潜在的研究机会;并且这一方法还可以用于分析其他跨学科研究领域。作者还提供了一个基于网络的可视化工具,用于分析和理解文本可视化分析的研究趋势和机会。

3-1

图4 可视化系统
123