位置:成果数据库 > 期刊 > 期刊详情页
一种有限混合模型对无监督文本聚类的广义方法
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]天津大学管理学院,天津300072
  • 相关基金:国家自然科学基金项目(No.70571057)、新世纪优秀人才支持计划项目(No.NECT-05-R013)资助
中文摘要:

提出一种有限混合模型对无监督文本聚类的广义方法.它将特征对各混合成员的相关性作为隐变量引入混合模型,在一个统一框架中完成混合模型的模型选择、特征选择以及参数估计.在大规模文本数据集上的实验结果表明该方法在模型选择、特征选择和聚类结果3个方面都取得较好效果.

英文摘要:

A generalized method is presented for unsupervised text clustering. The relevance of the features to the mixture components is introduced to the mixture model as a set of latent variables.Then the model selection, feature selection and parameter estimation of the mixture model are integrated into one general framework. Experimental results on four large scale document datasets show that the proposed method achieves fine results in model selection, feature selection and clustering performance.

同期刊论文项目
期刊论文 34 会议论文 6 获奖 2
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169