位置:成果数据库 > 期刊 > 期刊详情页
面向动态演化的话题检测研究
  • ISSN号:1002-0470
  • 期刊名称:《高技术通讯》
  • 时间:0
  • 分类:O431.2[机械工程—光学工程;理学—光学;理学—物理]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:国家自然科学重点基金(60435020)和863计划(2004AA117010-08)资助项目.
中文摘要:

受CURE聚类算法的启发,在分析了动态演化特性的基础上,提出了一种面向动态演化特性的双质心话题模型,以解决话题动态演化特性对话题检测的影响。该模型动态地建立分界点,以其为界将话题表示成初始质心和当前质心两个质心。初始质心代表分界点之前话题所关注的内容,当前质心表示从分界点到当前时间之间话题所关注的内容。提出了基于时间和词分布密度两种不同的分界点确定方法。详细描述了分界点、初始质心、当前质心的建立及更新方法。最后对基于双质心话题模型的英语话题检测算法进行了研究探讨,通过实验证明了该算法的有效性。

英文摘要:

Inspired by the CURE algorithm, on the basis of analyzing the dynamic evolvement properties, the authors proposed a dynamic evolvement-orient topic model based on the double centroids to solve the negative influence of the topic's dynamic evolvement properties on topic detection. This topic model dynamically chooses a division point, and expresses a topic as double centroids, i.e. the initial centroid and the current centroid. The initial centroid is about the contents involved before division point, and the current centroid is about the contents interested between the division point and the current time. This paper researches into two distinct methods to create division point, which are based on time and distribution density, respectively. This paper depicts in detail the creation and the modification of the division point, the initial centroid and the current centroid, and finally discusses the English topic detection algorithm based on the double centroids topic model, which is proved to be successful by experiments.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178