垃圾短信制造者出于商业目的或其他诈骗目的向手机用户大量发送垃圾短信或诈骗短信,使得手机用户不胜其扰。运营商在发送短信之前对短信加以辨识后,给可能是垃圾短信的信息贴上标签后再发送,将会大大降低手机用户受骗的机率。该文采用IF-IDF算法和离散特征的贝叶斯分类器,进行特征词选取,构建垃圾短信鉴别模型。通过垃圾短信训练数据集构建的中文垃圾短信贝叶斯分类模型,能够使垃圾短信的识别率保持在94%以上,具有较高的实用性。