目前已有大量关于聚类方法的研究.然而,绝大部分现有方法都要求输入簇的个数,该数目在很多情形下都无法事先确定.提出了一个能估计簇的个数的推广的K-means算法.新算法无需对不同的输入参数重复运行,而是在划分过程中分裂某些簇直到满足一定的终止条件.划分过程应用了Ward的最小方差方法(Ward's minimum variance method),最佳的簇个数则由一个基于组间方差的指标决定.实验结果表明,新算法不仅能正确估计实际的簇个数,而且运行效率高.