关于蛋白质家族、结构和新功能的统计推断是应用数理统计的一个前沿交叉研究方向.本文以蛋白质结构分类数据库SCOP和序列分类数据库Pfam为基础,结合SCOP数据库的动态信息,我们估计出覆盖当前Pfam数据库所需的折叠子总数;通过SCOP中新增家族在Pfam中的对应家族所属的折叠子是否已知为先验信息构建贝叶斯模型,估计了不同规模的Pfam家族贡献新折叠子的概率分布.