IsomiR是指与已知miRNA存在细微序列差异的异构体,是miRNA研究领域的新话题。本课题基于深度测序数据,系统研究isomiR的加工机制及对靶基因的调控功能,从新的角度揭示miRNA参与的转录后调控机制。IsomiR表达丰度较低,相同miRNA前体分子上能产生多种不同序列形式的isomiR,仅用生物学手段难以从海量信息中有效筛选不同加工过程涉及的相关因子,且这些isomiR在调控靶基因时相互影响也犹未可知。针对这些问题,本项目从分析深度测序数据出发,提出基于模式识别与分子生物学实验相结合的思路,设计isomiR鉴定方法,对不同序列形式的isomiR类别间提取序列特征并进行特征选择,基于选出的序列motif特征结合生物学验证推测相关RNA结合蛋白,来理解isomiR的被加工机制。融合Ago免疫共沉淀、靶基因RNA测序以及芯片表达等多重信息,进一步理解isomiR调控靶基因的生物学功能。
miRNA是一类起重要调控作用的小的非编码RNA,单个miRNA可调控数百个靶基因,形成复杂的miRNA调控网络。miRNA从前体到成熟体的加工过程中会出现一些与数据库中已知miRNA序列有细微差异的异构体,即isomiR。这些isomiR也可以参与靶标基因的调控,更进一步的拓宽miRNA的调控网络。研究表明isomiR参与不同的生理及病理过程,其异常调控与肿瘤等多种复杂疾病密切相关。系统鉴定不同种类的isomiR并阐明其参与生理病理过程的分子机制具有重要的意义。最新的高通量测序技术可以对样本的miRNA进行深度检测,这为鉴定出表达丰度相对偏低的isomiR提供基础,进而有助于发现isomiR的序列改变如何影响靶标调控以及整个调控网络,为进一步阐明miRNA复杂的调控机制奠定基础。 鉴于isomiR与已知序列仅存在细微差别,普通的序列比对方法难以有效鉴定不同类型的异构体形式。因此,基于miRNA的测序数据,我们通过将复杂的序列比对转化为简单的数值分析,开发了一套专门用于鉴定不同类型isomiR的新方法IsomiRscan。该方法引入一种“单词分析”的策略,允许序列两端的剪切位点在一个用户设定的范围内偏移,允许3’端末尾发生碱基的非模板增加,以及序列中出现一处碱基的修饰(碱基插入、删除和替换)。IsomiRscan可以为多达31个物种鉴别isomiR,并且输出每一条isomiR具体的变异信息以及表达丰度。该方法还考虑将由SNP,RNA编辑等因素导致产生的isomiR过滤掉。与已知isomiR数据比较,IsomiRscan具有非常高的准确性。 我们进一步将该方法应用到不同病理条件的肝癌样品中,鉴定出了一些miRNA的isomiR形式与特定的病理过程相关,为肝癌的治疗提供潜在标志物。 该课题相关成果已在Bioinformatics、Animo Acids等生物信息学和系统生物学领域重要期刊上发表研究论文2篇,同时公开发布了1款分析软件和1个可用数据库。还有两篇论文正在审稿中。