基因重复是生物进化的原动力,因为重复基因为生物的进化提供了原材料。对重复基因功能分化的研究是目前生物学中的热点和前沿。然而,已有的研究主要集中于重复基因在表达模式上的分化,而对编码区的分化关注的不多。我们在前期研究中发现了外显子化、假外显子化、外显子丢失、外显子重复、外显子重排和插入/缺失等多种能够导致重复基因结构分化的机制,并发现这些机制可以在重复基因进化的早期阶段起作用。此外,我们还发现外显子化/假外显子化和插入/缺失对重复基因结构分化的贡献方式是不同的,而且似乎具有偏好性。这些结果表明编码区的分化机制可能很复杂,值得进一步研究。本项目拟在已有工作的基础上,对重复基因的分化问题进行深入研究,特别关注重复基因的早期阶段,从结构分化的机制、偏好性及其与时间、功能和表达分化的相关性等方面开展研究。本项目的开展将在揭示重复基因结构分化规律的同时,为理解基因组乃至生物的进化提供新的思路和见解。
duplicate genes;coding region;intron-exon structure;divergence;
基因重复是生物进化的原动力,因为重复基因为生物的进化提供了原材料。对重复基因功能分化的研究是目前生物学中的热点和前沿。然而,已有的研究主要集中于重复基因在表达模式上的分化,而对编码区的分化关注的不多。项目申请人和主要参加者在前期研究中发现了外显子化、假外显子化、外显子丢失、外显子重复、外显子重排和插入/缺失等多种能够导致重复基因结构分化的机制,并发现外显子化/假外显子化和插入/缺失对重复基因结构分化的贡献方式是不同的,而且似乎具有偏好性。这些结果表明编码区的分化机制可能很复杂,值得进一步研究。本项目在已有工作的基础上,对代表植物、动物和真菌基因组中搜索获得的可靠重复基因对进行了编码区的比较研究,结果表明在不同的真核生物类群中,内含子-外显子结构分化都普遍存在,但分化频率和机制有所不同;插入/缺失和外显子化/假外显子化等导致重复基因发生结构分化的机制随进化时间的延长呈现不同的变化趋势;重复基因在编码区的分化的确存在偏好性,其中保留祖先基因结构的子基因具有更高的表达水平和联接性,说明结构发生变化的子基因有可能在调控区也发生了变化,并建立了新的互作网络。这些研究结果从基因组水平上确认了内含子-外显子结构分化在重复基因进化过程中的重要性,并为新功能和新性状的起源和演化提供了新的线索和资料。本项目的部分研究结果已在SCI核心刊物PNAS和Mol. Biol. Evol.上发表。