位置:立项数据库 > 立项详情页
基于拷贝数变异的疾病易感基因定位中的统计方法研究
  • 项目名称:基于拷贝数变异的疾病易感基因定位中的统计方法研究
  • 项目类别:面上项目
  • 批准号:11171075
  • 申请代码:A011103
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2015-12-31
  • 项目负责人:胡跃清
  • 依托单位:复旦大学
  • 批准年度:2011
中文摘要:

基因拷贝数变异是近五年内受到高度关注的人类基因组的新一代多态性特征,大多数科学家认为它跟生物的表现型和疾病的易感性有很大的关系,越来越多的研究结果表明了基因拷贝数变异跟人类常见复杂疾病有关联,比如帕金森综合症和艾滋病。本项目将着力研究(1)基于一般家系基因拷贝数的关联分析;(2)利用拷贝数信息进行简单高效的亲源效应检验;(3)个体特征值拓展到质量性状,数量性状,分类或排序数据;(4)当基因型的缺失依赖于基因型时,利用条件似然检验亲源效应;(5)利用比对法检验数据的缺失跟基因型是否独立;(6)利用多位点信息进行具亲源效应易感基因的定位研究;(7)直接利用基因芯片得到的原始强度值进行关联分析和亲源效应检验;(8)利用半参数贝叶斯方法估计基因拷贝数;(9)利用混合贝叶斯模型整合多个平台的高通量基因组数据。从而对人类复杂疾病易感基因的定位以及个性化的治疗方案提供统计学上的理论根据。

结论摘要:

变异是导致疾病的一个重要潜在因素,检测变异发生的位置是疾病易感基因定位中的一项重要任务。常见的变异有基因拷贝数变异,单核苷酸多态性,DNA结构变异等。本项目发展了针对不同场合的系列检测各种变异的统计学方法(1)基于核心家系中的基因拷贝数信息构造非参数检验统计量;(2)充分利用一个家系中患病和健康小孩的基因型信息,双亲信息或单亲信息,检验等位基因是否具有基因印记;(3)利用在家系内部或家系之间配对患病小孩及父母和健康小孩及父母,这里的父或母的基因型信息可缺失,构建偏似然函数,绕过需要强假设条件的多余参数,同时检测母系效应和亲源效应;(4)利用Kullback-Leibler度量衡量病例组和对照组中变异分布之间的差别,构建稳健的检验统计量,同时检验常见变异和罕见变异跟疾病的关联,简单易用,无任何参数的假设条件(5)对核心家系数据,利用父母中未传给患病小孩的两个等位基因形成健康对照组,比较健康组和病例组之间变异分布的差别来构建相应的检验统计量;(6)研究精神类疾病时常见分类属性的性状值,目前文献中还没有高效的方法可以用在位点数较多的场合,利用信息论中的互信息来度量多位点基因型和分类性状值之间的依赖关系,从而可以有效地检测出相关联的变异位点;(7)融合位点之间连锁不平衡信息以及重组率的信息进行病例对照组关联分析研究(8)利用广义Kendall检验统计量,进行基因或染色体区域与有序性状值的关联分析研究,以及多位点与多相关性状的关联分析研究。(9)基于单倍型分布差别的关联分析研究。以上所有方法均通过大量的随机模拟验证,结果表明都能很好地控制住第一类错误,比起文献中现有的方法有更高的检验功效。在实际数据分析中取得了好的效果,并形成相应的数据分析软件包,方便实际工作者使用。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 4
  • 0
  • 0
  • 0
  • 0
相关项目
期刊论文 1 会议论文 1
胡跃清的项目