位置:成果数据库 > 期刊 > 期刊详情页
面向专题检测的主题与社群联合聚类模型
  • ISSN号:1674-909X
  • 期刊名称:《指挥信息系统与技术》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:苏州大学计算机科学与技术学院,江苏苏州215006
  • 相关基金:国家自然科学基金(61373097,61672368,61672367,61331011)、江苏省科技计划(SBK2015022101)和教育部-中国移动科研基金(MCM20150602)资助项目.
中文摘要:

专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于 层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索. 通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类模型.该模型通过主题-致性辨 识内容相关的文本,并借助文本中的命名实体社群,进一步细分内容相关的文本聚类,从而避免大 规模文本中“事同人不同”的类似专题错误合并.最后,借助该模型在专题检测的层次和粒度上进一步求精,在搜狐人工 标记的69项专题万余篇文档上进行专题检测测试.试验结果表明,该模型 聚类纯度高于82% ,具有实用价值.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《指挥信息系统与技术》
  • 主管单位:中国电子科技集团公司
  • 主办单位:中国电子科技集团公司第二十八研究所
  • 主编:丁冠东
  • 地址:南京市苜蓿园东街1号(南京1406信箱62分箱)
  • 邮编:210007
  • 邮箱:cist2010@126.com
  • 电话:025-84288968 84285034
  • 国际标准刊号:ISSN:1674-909X
  • 国内统一刊号:ISSN:32-1818/TP
  • 邮发代号:28-430
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1251