研究表明复杂生物基因组90%以上的序列是不编码蛋白质的,这些非编码序列在基因的表达调控过程中起着关键作用。因此,深入研究这些非编码功能序列的模式特征对于理解生命现象具有重大的意义。 顺式调控元件(启动子)和部分非编码的功能序列在基因调控表达中起着关键的作用。目前大多数识别预测算法都是基于词频分析、CpG岛、碱基成分以及二级结构等个别模式特征,但由于不同个体同一基因的相同调控位点的功能序列具有多样性,而且不同基因的调控位点也各不相同,利用上述方法提高识别精度面临巨大困难。因此,本计划将重点放在调控位点的多样性研究及其组合功能预测方面。在此基础上,我们将研究外源高效表达的基因序列特征及其侧翼的非编码功能序列特征,并开发相应的识别预测算法来指导高效表达基因的载体设计,这对仅仅依靠实验手段来探索外源高效表达基因是一种新的尝试,具有较好的应用前景。