RNA二级结构预测是 RNA组学中的关键研究问题。在现有 RNA二级结构预测算法中,目前常用的基于热力学自由能和协变性分析的方法普遍存在空间与时间复杂度过高、无法处理伪结等问题,严重影响了其预测精度,限制了二级结构预测算法的适用范围,而非编码RNA 的识别与结构比对等问题则是RNA 结构预测中需要预先解决的工具性技术问题。本项目以哺乳动物基因组为对象,主要研究大规模 RNA二级结构预测算法及其并行处理技术。主要研究内容包括非编码RNA 的识别技术、基于种子扩展的快速结构比对算法、带伪结的结构预测算法,以及相关算法的并行化处理技术。本项目将构建一套RNA 数据分析系统,以此预测出更多、更精确的RNA 二级结构,旨在提高我国RNA 数据的处理能力,为识别ncRNA 基因及其作用靶奠定基础,为揭示ncRNA 的功能并全面阐释生命活动的信息机理提供科学依据。
英文主题词cRNA; RNA secondary structure prediction; RNA structural alignment; parallelization