蛋白质-蛋白质相互作用(Protein-protein interaction,PPI)是生命体结构和生命活动的基础和特征,控制着生命活动的各个过程.PPI网络是研究蛋白质相互作用的有效手段.随着高通量实验技术的发展,越来越多的PPI数据得以使用,收录蛋白质相互作用的数据库数据每年都有变化.本文对DIP数据库从2003年到2008年的PPI网络数据分别计算度分布.为提高可信度,对注释蛋白质数据库交集进行抽样,分别探讨对不同年份的数据和注释数据库抽样对PPI网络度分布的影响.结果表明,从2003年到2008年的数据增长对PPI网络度分布没有明显影响,而且拟合度分布最优的函数并不是以往所认为的幂率分布(power-law),而是广延指数(stretched exponential)函数,数据库交集抽样同样得到广延指数(stretched exponential)函数分布最优且可信度的高低并不影响PPI网络的度分布.
Protein-protein interactions(PPI) control the whole process of life,which played a vital role in life cycle.PPI networks provided an effective way to study protein interacting.With development of high-throughput experimental technologies,increasing amount of data on protein interaction networks available.This paper studied the degree distribution of PPI networks' data of DIP database from 2003 to 2008.In order to improve confidence of protein information,we used the annotating database intersection method.Yet,this paper investigated degree distribution of PPI networks in different years and intersection database.The results showed that data in different years and different annotating database intersection could not effect degree distribution of PPI networks.And stretched exponential function distribution is best describing the degree distribution.