为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的C1ass N—gram模型,该文研究了汉语词的自动聚类技术。提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大提高了聚类算法的工作效率。