2020年春季学期视觉计算实验室第三周论文研读预告

时间: 2020年03月19日 09: 00
地点: 四川大学视觉计算实验室钉钉群
研读成员: 龙春林
研读内容:
[1] Zhang Y, Zhang B, Zheng W J, et al.: HiCComp: Multiple-level Comparative Analysis of Hi-C Data by Triplet Network, Hu X H, Shyu C R, Bromberg Y, Gao J, Gong Y, Korkin D, Yoo I, Zheng J H, editor, 2017 Ieee International Conference on Bioinformatics and Biomedicine, 2017: 92-96.
[2] Chen J, Hero A O, Iii, Rajapakse I. Spectral identification of topological domains[J]. Bioinformatics, 2016, 32(14): 2151-2158.
论文简介:
[1] Hi-C技术是研究三维基因组织的重要工具。在过去的几年中,各种细胞/组织类型中Hi-C数据呈现爆炸式增长,这些数据为研究染色体体系结构提供了前所未有的机会。但是如何定量比较不同组织之间Hi-C数据的差异、鉴定组织特异性的染色质相互作用仍然是个挑战。本文受triplet network启发开发一个用于比较Hi-C数据的模型—HiCComp。HiCComp利用卷积神经网络自动提取Hi-C交互矩阵中的关键特征,鉴定不同细胞类型的Hi-C矩阵之间的显著差异。此外,本文将系统的遮挡方法整合到模型中,以便从Hi-C矩阵中识别动态交互区域。最后,本文将动态交互区域和与基因调节相关的组蛋白修饰位点进行比较,表明三维基因组结构中这的写差异和基因调控有着潜在关联。
1

图1 HiCComp模型示意图

2-4

图2 结果分析图
[2]染色质构象研究表明真核细胞的基因组在细胞核中自组织成拓扑关联结构域(topologically associating domains, TADs)。拓扑关联结构域被定义为染色质的线性折叠单元,具有域内相互作用显著高于域间相互作用的性质。此外,大多数基因调节蛋白结合位点位于拓扑关键结构域内,这表现基因调控与拓扑关联结构域高度相关。因此,检测拓扑关联结构域有助于研究染色体组织与基因转录之间的关系。本文将染色质片段抽象成顶点,片段之间的交互频次抽象成带权边,使用谱划分进行TAD检测。相比于现有方法,本文方法具有鲁棒性更好,结果稳定、对初始化不敏感、检测结果与基因转录高度相关等优点。

3

图3 模型示意图

4

图4 计算流程图

5

图5 费德勒向量与转录子相关性
123