以基金委"拟南芥全部转录因子的蛋白组研究"重大国际合作项目产生的数据为基础,利用数据库技术和生物信息学工具,对拟南芥基因组1500多个转录因子及其顺式调控元件进行收集、整理、分析、注释,建立拟南芥转录因子数据库信息系统和数据分析平台。利用序列比对、功能识别、结构预测等生物信息学方法和软件,预测MYB、AP2家族等具有重要生物学意义的未知转录因子的生物学功能。研究新的统计学、信息学模型和算法,分析转
基于已完成的模式生物基因组和大规模EST测序计划所得DNA序列,开发了基于隐马氏模型序列谱和序列相似性比对的转录因子大规模预测平台,预测了22个植物基因组25579个转录因子,包括拟南芥、水稻等5个模式生物,以及玉米、棉花、大豆、柑橘、西红柿等17个经济作物;构建了植物转录因子数据库PalntTFDB,对上述转录因子按物种、基因家族和基因三个层次进行分类,并进行了详尽注释,预测了直系同源基因。数据库界面友好、使用方便,用户可进行浏览、检索、序列相似性搜索和大规模数据下载,为国内外植物基因组和转录调控等研究提供了大量数据资源和注释信息。预测了绿藻、小立碗藓、江南卷柏、松树、拟南芥、水稻等代表性类群中植物特异转录因子SBP基因家族成员,进行了系统发育、基因结构和保守序列模体分析,提出了SBP家族起源和演化模型。与耶鲁大学邓兴旺课题组合作,利用覆瓦式芯片数据,分析了光发育相关基因转录因子HY5可能的靶基因。配合“拟南芥全部转录因子的蛋白组研究”,与北京大学朱玉贤和瞿礼嘉课题组合作,对拟南芥转录因子AP2/EREBP和MYB家族进行了预测、分类、保守域识别和系统发育等分析。