位置:立项数据库 > 立项详情页
中国北方汉族慢性阻塞性肺疾病及其表型的遗传易感性的生物信息学分析
  • 项目名称:中国北方汉族慢性阻塞性肺疾病及其表型的遗传易感性的生物信息学分析
  • 项目类别:青年科学基金项目
  • 批准号:31100905
  • 申请代码:C060404
  • 项目来源:国家自然科学基金
  • 研究期限:2012-01-01-2014-12-31
  • 项目负责人:安立
  • 依托单位:首都医科大学
  • 批准年度:2011
中文摘要:

慢性阻塞性肺疾病(COPD)是一复杂的多基因疾病,传统的遗传分析难以分析高通量性的疾病数据,随着第三代遗传标记SNP数据的出现,使得寻找复杂疾病的易感位点成为可能。本课题连续收集600名中国北方汉族稳定期的COPD患者和600名健康对照者,进行肺功能检查、运动能力测定以及呼吸困难症状评分等数量性状的测定,同时对选取的四个COPD候选基因的180个单核苷酸多态性(SNP)位点进行基因分型。对基因分型的结果,除了采用传统的统计遗传学方法对遗传位点进行分析,同时将生物信息学算法Variable Threshold(VT)检验和有害突变SNP的功能预测分数相结合来提取疾病的易感位点,筛选出与疾病及相关性状关联的基因与位点。此外,采用数据挖掘算法利用风险SNP协同对疾病的贡献来构建SNP-SNP的虚拟互作网络,以期丰富国人COPD遗传易感方面的知识,为高危人群的筛查和COPD的早期诊断提供一定依据。

结论摘要:

慢性阻塞性肺疾病(COPD)是一复杂的多基因疾病,它与单基因疾病的不同之处在于其不仅受到多个基因控制,而且多个基因间又存在交互作用,因而在表型和基因型间并不只存在简单的一一对应关系。此时,作为研究疾病和单点基因的连锁关联的统计遗传学方法显示出不足。而其它传统的统计遗传学分析方法在应用过程中受样本量的限制统计效能不高,难以分析高通量性的疾病数据。随着第三代遗传标记SNP数据的出现,使得寻找复杂疾病的易感位点成为可能。本课题连续收集310名中国北方汉族稳定期的COPD患者和203名健康对照者,进行肺功能检查、运动能力测定以及呼吸困难症状评分等数量性状的测定,同时对选取的四个COPD候选基因( SERPINE2、EPHX1、GSTP1和TGF-β1的48个SNP位点进行基因分型。对基因分型的结果,除了采用传统的统计遗传学方法对遗传位点进行分析,同时将生物信息学算法Variable Threshold(VT)检验和有害突变SNP的功能预测分数相结合来提取疾病的易感位点,筛选出与疾病及相关性状关联的基因与位点。结果发现,GSTP1是与COPD最为相关的易感基因,SERPINE2有两个预测分数证实是与COPD相关联,而EPHX1与COPD不相关。应用最新的数量性状多因子降维方法(QMDR)方法研究与COPD数量性状相关的基因-基因互作,结果发现EPHX1和GSTP1的互作与FEV1关联,SERPINE2和TGFB1的互作与FVC相关联。此外,本研究中应用贝叶斯网络方法构建了基因和环境的虚拟互作网络。网络结点包括和COPD最为相关的三个环境变量(年龄,吸烟和性别),COPD表型,FEV1性状、恶性突变的非同义SNP及与COPD显著相关的SNP (p<0.01),结果发现环境变量和贝叶斯网络提取的2个恶性突变的非同义SNP(rs1138272和rs6712954)构成的模型对样本分类的预测效果最好。本研究可望丰富国人COPD遗传易感方面的知识,为高危人群的筛查和COPD的早期诊断和预防提供一定依据。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 5
  • 3
  • 0
  • 0
  • 0
相关项目
期刊论文 18 会议论文 3
安立的项目