应用于说话人识别的矢量量化算法在匹配识别时需要对已有码本进行全搜索,当说话人数量增加时,全搜索的匹配计算量也随之增大,影响系统性能,且不利于片上系统应用开发。针对这一问题,本文提出码本聚类矢量量化算法,通过对训练得到的码本进行聚类处理,获取说话人码本的分类情况及各子类的代表码本。在匹配识别时,首先确定待识别说话人所属的子类,再与该子类的初级码本进行匹配,最终确定说话人身份,通过这种方式减少了与其他不可能子类码本之间的匹配计算量。实验结果表明:选择优化后的码本聚类方式,系统使用全搜索计算次数的42.56%时,误识别率不超过5.00%。