位置:成果数据库 > 期刊 > 期刊详情页
网络食品安全问题话题发现的LDA-K-means算法
  • ISSN号:1671-8844
  • 期刊名称:《武汉大学学报:工学版》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉大学计算机学院,湖北武汉430072, [2]武汉大学国际软件学院,湖北武汉430072
  • 相关基金:国家自然科学基金项目(编号:61303214,61672393).
中文摘要:

提出一种基于LDA模型的K-means聚类的话题发现,并在网络食品安全问题中进行效果验证.该算法中使用LDA模型对文档空间建模,并选取文档对主题的概率分布作为每篇文档的向量,利用K-means算法对这些向量进行聚类处理,最终得到话题发现的结果.为了验证试验的效果,还进行了1组使用传统的VSM模型下的Kmeans算法的实验作为对照组.通过在涵盖43个食品安全分类的1 920条新闻报道和腾讯微博的数据上的实验,记录了6个不同迭代次数下的结果并得到平均值,实验结果表明该方法在3个评估指标P、R、F上都比传统方法提高了20%.

英文摘要:

This paper presents an algorithm for the topic detection of food safety problems, which is using K-means clustering algorithm based on the latent dirichlet algorithm (LDA) model. The algorithm model- ing the document space with LDA model, and select the probability distribution of the themes to the docu- ment as a vector of each document, process the vectors with K-means clustering algorithm, and finally get the results of the topic detection. In order to verify the effect of the test, this paper also carries out a set of traditional experiment as a control group, by using K-means algorithm based on VSM mode. Through the experiments on the data which covers 43 classes of 1920 news and Tencent micro blogging, we record the results of six experiments under different iterations and take the average. The experimental results show that the method proposed has a 20 percent increase than traditional methods on the three evaluation indices P, R and F.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《武汉大学学报:工学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:武汉大学
  • 主编:李晓红
  • 地址:武汉市 珞珈山
  • 邮编:430072
  • 邮箱:ejwhu@whu.edu.cn
  • 电话:027-68755516 68752082
  • 国际标准刊号:ISSN:1671-8844
  • 国内统一刊号:ISSN:42-1675/T
  • 邮发代号:38-18
  • 获奖情况:
  • 水利工程类核心期刊,全国优秀高校自然科学学报,湖北省优秀期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:11402