本项目研究当前宏基因组学的两个重要的生物信息学问题序列拼接和基因预测。以正在进行的人肠道微生物组为研究对象,根据宏基因组中随机片段序列的复杂特征,针对细菌和古细菌的基因组结构与序列信息,基于我们近年来在原核生物基因组研究成果的优势,发展一种从短序列片段(包括未拼接的reads和拼接得到的contigs)中预测编码蛋白基因的高效、准确的新方法;设计一种对短序列reads进行序列拼接的新算法,以期得到更长的contig甚至可能的全基因组序列;在序列片段的有效拼接和基因注释的基础上,进一步进行物种组分和优势种群基因组等探索性分析。最终开发出可应用于国际微生物组测序计划的序列拼接和基因注释软件。
Metagenome;Human gut microbiome;gene prediction;sequence assembly;
本项目研究当前宏基因组学的两个重要的生物信息学问题序列拼接和基因预测。以正在进行的人肠道微生物组为主要研究对象,根据宏基因组中随机片段序列的复杂特征,针对细菌和古细菌的基因组结构与序列信息,发展了从短序列片段(包括未拼接的reads和拼接得到的contigs)中预测编码蛋白基因的高效、准确的新方法,并开发了相应的软件MetaGun;设计了对短序列reads进行序列拼接的新算法MAP和MA-Pipeline;在序列片段的有效拼接和基因注释的基础上,进一步进行了代谢通路和物种社会关系的探索性分析。