由于蛋白质在疾病中的重要作用使得确定蛋白质功能在人类疾病的研究中有着极为重要的价值。然而目前,在蛋白质功能方面的研究是极其缺乏的。除了生物学家努力通过新的实验技术和生物理论来研究问题外,利用数据挖掘方法分析生物数据,实现蛋白质功能预测,成为计算机研究人员所关注的热点问题。本项目拟以蛋白质相互作用等蛋白质相关数据为主要研究对象,构建生物数据的图模型,发展生物功能预测的创新性理论、算法、软件及数据库系统。主要研究包括(1)提出面向高噪音生物数据的图挖掘算法,系统地提高数据的质量,提高预测结果的可靠性;(2)以多种蛋白质相关数据为研究对象,发展高伸缩性的交叉图挖掘算法,提高蛋白质功能预测的准确度。(3)构建蛋白质参与的生物途径。