位置:成果数据库 > 期刊 > 期刊详情页
初始化类中心的增量K均值法及其在新闻事件探测中的应用
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G212[文化科学—新闻学] H08[语言文字—语言学]
  • 作者机构:[1]国防科学技术大学信息系统与管理学院,长沙410073, [2]武汉大学商学院,武汉430072
  • 相关基金:国家自然科学基金资助项目(60473117);国家863高技术研究发展计划基金资助项目(2001AA115123).
中文摘要:

传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于回溯探测,并且执行结果受新闻语料被处理顺序的影响较小。本文对有效密度半径和特征空间维数的选择问题进行了讨论,并比较了该方法和Single—pass法及传统的K均值法的性能差异。实验结果表明本文所提出的方法是有效的。

英文摘要:

There are lots of drawbacks to traditional incremental K-means in event detection. In order to overcome its shortcomings, this paper proposed an improved incremental K-means (IIKM) for detecting events. The algorithm utilizes density function to initialize cluster centers to select initial cluster centers objectively, it can be used in both on-line detection and retrospective detection, and the quantity of clusters is affected little by the order in which the news stories are processed. The problems of effective density radius selection and feature space dimension selection are discussed, and the performance difference between this method and other methods including Single-pass and traditional K - means. The result of experiments indicates the proposed algorithm is feasible.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778