真核生物转录过程受转录调控网络、染色质状态、细胞核结构三个层面的调控。复杂的调控机制使多细胞生物中有同样基因组的不同细胞类型具有不同细胞表型。研究表明转录因子、RNA调控分子、染色质修饰、核内染色质结构均参与转录调控并共同决定细胞特异的转录组,从而决定特异的细胞表型。研究细胞特异的转录组,需高效准确的转录组检测手段。为此,该项目建立了转录组抽样统计模型,为转录组测序提供必要理论框架。对一组人体胚胎干细胞LongSAGE数据进行的评估比较表明转录组内转录本的相对丰度服从generalized inverse Gaussian分布,据此建立的generalized inverse Gaussian-Poisson(GIGP)混合概率模型能很好地拟和实验数据,真实描述转录组测序的随机抽样过程。利用该模型可对转录组复杂度,转录组抽样曲线等参数进行估计该项目系统分析了人体EST数据基因表达的组织特异性与基因结构、进化选择、起源时间、启动子结构等的关联性。研究表明多细胞生物中基因表达的组织特异性受到复杂的系统调控,与基因的多个性质存在关联,这对理解多细胞生物基因表达调控有重要意义。
英文主题词transcriptome; sampling model; tissue specificity; transcriptional regulation