RNA不同于DNA和蛋白质,既可携带遗传信息,又可作为功能分子,而RNA功能与其结构密切相关,因此,研究RNA的二级结构可揭示RNA在生命过程中的进化规律,对推进人类后基因组计划和医学生物学的发展具有重要意义。但由于RNA分子降解速度快,通过生物试验方法测定RNA结构相当困难,借助于计算机及其算法预测其结构成为一种公认的有效方法。假结在RNA的二级结构以及RNA的功能活性中起着重要作用,预测带假结的RNA二级结构是极为重要的理论与技术难题。目前很多RNA二级结构预测的基础是最小自由能算法,其不足是不能预测假结,而其它可预测带假结的RNA二级结构的算法存在时间复杂度高、序列最大长度受到限制等问题,制约了算法的应用。为此,本项目拟建立带假结的RNA二级结构预测的一般方法,解决预测算法实用化的关键技术难题,并将结果用于流感病毒基因反向遗传操作分子设计,具有较高的学术与应用价值。
RNA secondary tructure;Pseudoknot;Hidden Markov Model;Balance energy;Reverse genetic
本研究建立了更加贴近实际的平衡能能量模型,基于该平衡能能量模型,提出了多种RNA二级结构的预测方法,并将预测得到的RNA二级结构应用到药物设计理论研究中。平衡能能量模型是以生物实验中测定的RNA二级结构熵、焓及能量变化数据为基础,并结合有可靠二级结构的RNA数据库建立的,同时完善了多分支环能量计算,加入了初步假结能量,使得能量计算更为精确,更贴近实际。基于能量模型,提出了四种RNA二级结构预测方法一、基于蚁群算法的RNA二级结构预测算法,此算法与RNAstructure、GA算法相比,敏感度、特异性、MCC虽然增加量不大,但运行时间有显著改进,与RNAstructure相比,运行时间平均缩短了39.1%,与GA相较,运行时间平均缩短了41.1%;二、基于隐马模型的RNA二级结构预测算法,此算法与其它算法在算法复杂度上相当;三、基于茎区动态规划的RNA二级结构预测算法,此算法与GA相比,敏感度增加了7.5%,特异性增加了2.7%,MCC增加了9.68%;四、基于粒子群优化的带假结RNA二级结构预测算法,此算法与Mfold相比,敏感度增加了9.56%,特异性增加了8.81%,与RnaPredict相比,敏感度增加了3.9%,特异性增加了4.53%。本研究将应用上述四种预测方法得到的RNA二级结构及其能量应用到如下的药物设计理论研究中一、miRNA靶标寻找算法,将结构与能量信息等特征加入miRNA靶标特征中,再使用SVM聚类,与使用传统特征的算法相比,提高了靶基因的聚类程度;二、针对人类流感病毒的miRNA发现算法,在人类流感病毒中发现了5条人编码miRNA,将理论中的多条miRNA数量减少至实验可验证的范围;三、针对H1N1病毒的siRNA特征分析和药物设计,提出了多个siRNA特征,提高了siRNA的药物设计效率,对药物设计的理论研究起到了推动作用。在本项目研究中,共发表论文15篇,其中SCI检索5篇,EI检索10篇;提出专利申请两个《基于CPLD碱基片段编码和蚁群算法的RNA序列二级结构预测方法》和《基于ARM微处理器的siRNA干扰效率预测新方法》 ;完成软件著作权两个《ACRNA二级结构预测软件[简称ACRNA]V1.0》和《miRNA靶基因预测软件V1.0》,已取得了预期的研究成果。