自2002年首次实验证实microRNA与疾病密切相关以来,致病microRNA识别已成为生物医药领域的研究热点。目前致病microRNA识别主要依赖生物学实验,识别费用高、周期长。近几年高通量生物数据呈爆炸性增长,如何发展基于海量数据融合的生物信息学方法来识别致病microRNA,意义重大。本项目拟融合海量数据来明确编码基因间的功能相关性,构建权重型编码基因功能网络,识别疾病特异的网络模块,量化疾病间的表型相似度,从而发展基于数据融合的致病microRNA识别算法,开发致病microRNA识别系统。本项目的完成将为生命科学研究者有针对性地进行生物实验提供指导,为基于microRNA的疾病诊断、治疗、药物开发提供线索。
Disease micoRNA;Biological network;Support vector machine;LncRNA;
在本项目的资助下,项目负责人及团队系统研究了microRNA和人类疾病关系的生物信息学,取得了较好的科研成果,完成了既定的目标。项目负责人发现了”功能相似的microRNA失调倾向导致表型相似的疾病“这一规律,开发了全球首个人类疾病microRNA数据库系统,相应的论文发表在牛津大学的著名期刊NAR上,影响因子7.459,已经被他引390次,入选“中国百篇最具国际影响力学术论文(2009)”,获第十二届黑龙江省自然科学技术学术成果一等奖。此外,提出了4种疾病microRNA预测方法,实验结果显示了方法的有效性,相应论文发表在BMC systems biology以及国际学术会议上。 在完成既定目标之后,我们对microRNA的研究进行了扩展,重点研究了比microRNA长的非编码RNA (lncRNA)。lncRNA是长度大于200bp的非编码RNA,lncRNA的失调能导致疾病的发生发展。我们研究了人类lncRNA基因自身如何被转录调控( Jiang et al., 2014, BioMed research internatinoal),人类lncRNA有哪些生物潜在的生物学功能(Jiang et al., 2015, BMC genomics) ,以及lncRNA调控哪些靶基因(Jiang et al., 2015, NAR),取得了较好的研究成果。 在本项目的支持下,课题组共发表已标注基金号的SCI论文10篇,开发了1个疾病micorRNA数据库系统(http://www.mir2disease.org),4套疾病microRNA预测软件,1个lncRNA的靶基因数据库 (http://www.lncrna2target.org),1个lncRNA的功能注释系统 (http://mlg.hit.edu.cn/lncrna2function),以及1个lncRNA转录调控系统(http://mlg.hit.edu.cn/tf2lncrna).