本课题旨在开发新的遗传统计学方法,用于寻找与常见遗传性状相关的多个基因及交互。常见遗传疾病对公众健康存在强烈的影响。这些疾病更加趋向于是由多个基因共同作用导致的。传统的遗传统计方法如连锁分析和关联分析主要用于发现单个致病基因。这里,我们将研究一种新的关联分析方法通过综合分析不同基因上的SNP发现位于基因组不同区域与疾病相关的突变多态组合。寻找这些与疾病相关联的多态组合是一个很难的统计计算任务,因为我们需要找遍10万个或更多的SNP位点的组合。这里需要结合计算机领域的技术,如数据库技术,模式识别技术等。当前已有的频繁项集挖掘(Frequent Itemset Mining)方法是解决该类组合爆炸问题的主要方法。但这类方法解决的组合问题与我们的组合问题尚有本质区别。我们将研究这类算法的本质并结合生物学背景,开发新方法。研究成果将做成免费软件,用于确定常见遗传性状如糖尿病,心脏病等多基因疾病。
英文主题词approach; model; case-control association studies; locus