miRNA是近年来发现的一类长度为~22nt的内源、单链、非编码小RNA,不仅参与机体内大量生理过程的调控,还与人类重大疾病- - 癌症密切相关。cDNA克隆测序方法很难克隆出在不同时期表达或只在特定组织或细胞系中表达的miRNA,也很难捕获表达丰度较低的miRNA;计算预测方法不受miRNA表达的时间和组织特异性以及表达水平的影响,可以弥补cDNA克隆测序方法的不足。在本项目中,我们开展了以下研究:(1)系统地分析了人miRNA的特征;(2)建立了哺乳动物小RNA基因组分析平台BatchGenAna;(3)提出了基于遗传算法和支持向量机的miRNA预测方法,结果表明我们的方法在具有较高敏感性的同时也具有较高的特异性;(4)提出了基于属性bagging和支持向量机集成的miRNA预测方法,结果表明,我们的方法可以有效地提高分类器的性能,与国际上现有分类器相比,我们的分类器具有更高的性能;(5)对piRNA的转录生成进行了研究;(6)在拟南芥基因组中预测出了37个可能的miRNA前体。本项目的开展对miRNA的发现提供了支持和帮助。
英文主题词miRNA; genome; prediction; machine learning; SVM