2018年秋季学期视觉计算实验室第2周论文研读预告

论文TITLE:DeepMirTar: a deep-learning approach for predicting human miRNA targets
分享者:李亚男
时 间:2018年9月14日 上午9:30 地 点: 基础教学楼B座视觉计算实验室

论文简介
miRNA(microRNA)是一种通过与mRNA靶位点进行碱基配对,从而抑制和调控mRNA表达的非编码RNA,miRNA的mRNA靶位点预测一直是miRNA研究领域的一个重要研究方向.

本文数据集: mirMark(Menor et al., 2014)数据集和CLASH(Helwak et al., 2013)数据集这两个miRNA靶位点研究领域常用的数据集.
Menor,M. et al. (2014) mirMark: a site-level and UTR-level classifier for miRNA target prediction. Genome Biol., 15, 500.
Helwak,A. et al. (2013) Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell, 153, 654–665.

本文使用特征: 1)miRNA靶位点预测研究中的位点保守性,位点可达性,种子区域匹配程度,自由能等常规特征;2)miRNA与mRNA原始序列数据特征

本文模型:栈式去躁自编码器.

本文相较以前使用深度学习进行位点预测的研究,在特征维度上进行了扩充及细化,如加入了序列组成等具体特征,扩充了计算位点保守性和可达性时的上下游区域,同时也在模型中输入了原始数据,在人工测定的特征基础上,让神经网络从原始数据中学习相关特征.

同时在最后的特征重要性比较中也可以看出序列组成,原始数据等扩充和添加的特征对于模型的预测有着很大的影响.
QQ20180913-140025

本文使用了目前在深度学习解决基因序列问题中常用的自编码模型的结构和思想,因此,本次论文研读也会对自编码及其相关的内容做一个简单的介绍.