位置:成果数据库 > 期刊 > 期刊详情页
基于混合模型的文本聚类研究综述
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京大学信息管理学院,南京210023
  • 相关基金:国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究(12&ZD221)”以及国家自然科学基金项目“融合范式视角下的链接分析理论集成框架及其实证研究(71273125)”的资助.
中文摘要:

相较于其他聚类算法,模型聚类的实证研究结果表现出了独特的优势,越来越受到学界的关注。本文梳理了混合模型文本聚类的相关研究,根据聚类分析的技术路线,主要综述了文本建模、参数建模以及模型推理等三个主要模块,在此基础上总结了特征降维、半监督聚类以及聚类过程的系统整合等不同研究中的共性问题。最后,提出了本领域未来可能的研究方向。

英文摘要:

Model-based clustering has attracted more and more attention, and empirical studies also showed distinct advantage. This paper reviews the status of the document clustering based on mixture models. According to the technical routes, it summarizes three main parts, such as document modeling, parameter modeling, and model inference, and analyses the common problems in different researches, including feature reduction, semi-supervised clustering and the integration of clustering process. At last it presents possible future research directions in this field.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778