申请人着重开发生物信息新技术新方法,并通过对生物数据的整合从整体水平研究生物学问题。自主研发的11种算法软件和二级数据库均发表于生物信息技术领域权威杂志,在网上公开,外部有效点击总数三千五百万,用户IP数42万,国外占60%,预测结果多次被实验验证。主要围绕两个平台和研究方向分子通路网络这一平台以KOBAS为核心,利用跨物种比较和超几何分布检验来鉴定有统计显著性的分子通路;并以通路为骨架,整合蛋白相互作用和转录因子结合位点数据构建分子网络;构建了成瘾分子网络,发现五条通路是四种成瘾类型所共有的,两条是首次被报道与成瘾相关;发现遗传学和分子生物学技术虽然鉴定出很不相同的成瘾相关基因,但其在分子通路水平上高度一致。天然反义转录组平台整合转录组和基因组数据,在十个物种中鉴定出顺式和反式天然反义转录本对集合,统计了其靶标的分子通路;观察到两种不同的表达相关性模式;发现10%以上涉及非编码RNA。
bioinformatics;non-coding RNA;antisense transcript;autism;next-generation sequencing
在研究反义核酸及非编码RNA的表达和调控研究方面,我们对于不同性别的黑腹果蝇转录组进行分析,发现15%的雄性或雌性偏好表达的转录本是基因间非编码RNA。进而发现非编码RNA存在X染色体去雄性化过程,可能由减数分裂性染色体失活和性拮抗这两种演化机制共同导致。比较基因组学研究发现这些雄性偏好表达的非编码RNA在常染色体和X染色体上的分布与其基因年龄有关。我们还在线虫中研究RNA编辑对转录调控的影响机制,通过新一代测序分析线虫不同发育时段的RNA编辑组,发现RNA编辑大量发生于DNA转座子中,从而破坏来自同一家族的转座子之间的序列相似性,干扰其形成互补配对的反式反义核酸对。我们也发现RNA编辑可能可以干扰顺式反义核酸对的形成。在研究反义核酸及非编码RNA对于神经疾病的贡献方面,我们通过对13个孤独症脑背外侧前额叶组织样本和34个正常对照者相同脑区样本的RNA-seq数据的分析,发现5个非编码RNA在孤独症样本和正常对照中有统计显著的差异表达。进而我们发现28个孤独症核心基因在背外侧前额叶脑区有共表达的顺式反义核酸,其中13个基因与非编码RNA形成顺式反义对。我们还建立了中国人群的大规模孤独症样本库和基于MySQL关联数据库的孤独症样本信息管理系统,迄今已收集超过1000个孤独症家系的血液样本及详细的表型测评数据。此外,我们结合“星星雨”孤独症训练中心成立20年来所收集的孤独症患儿信息,分析并总结了中国大陆在过去20年间孤独症发病、诊断和干预等各方面的发展历程。除了以上的学术研究成果之外,我们课题组开发的所有生物信息学软件及数据库都在网上免费公开,以指导和协助其它同行进行相关研究。这些数据库具有大量的国际用户。通过我们构建的反义核酸数据库,我们发现DHPS基因是WDR83基因的顺式反义核酸基因。我们的合作者通过实验证明DHPS和WDR83可以通过互补配对形成RNA-RNA二聚体的方式互相正向调控对方mRNA和蛋白的表达水平。我们还发现这对反义核酸在胃癌和其它癌症样本中存在表达上调,通过激活ERK通路促进癌细胞增殖。