本项目研究研究新一代深度测序数据处理与分析的统计学方法及其在人类复杂疾病研究中的应用。在基金资助下,本项目进展顺利,完成了预期目标,取得了一定成果,包括(1) 提出了RNA深度测序数据的误差模型和基于该模型的基因差异表达估计方法,提出了基于染色质免疫沉淀深度测序数据精确定位转录因子结合位点的方法;(2) 比较了生物序列局部比对中的多个统计量,为局部序列比对打分函数的选取提出了指导;(3) 从生物功能的角度研究了识别疾病相关蛋白质结构域的计算方法;(4) 在宏基因组学方面进行了综述,在微生物群落比较问题上提出了一个新的更有效的统计量。基于这些研究成果,本项目组共发表学术论文15篇,其中期刊论文14篇(SCI检索12篇),会议论文1篇(EI检索)。项目组成员积极参加国际国内学术交流活动,进一步扩大了学术影响力。本项目在人才培养方面也取得了成果,参加本项目的3名硕士研究生已有2人毕业,继续攻读博士学位。
英文主题词Next generation sequencing; Sequence alignment; Complex diseases; Meta-genomics