位置:成果数据库 > 期刊 > 期刊详情页
基于概念格的K—Means算法研究
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连海事大学信息科学技术学院,辽宁大连116026
  • 相关基金:国家自然科学基金项目(60972090);辽宁省自然科学基金项目(20072142);大连市政府IT优秀教师基金项目(大信发2008-40-6).
中文摘要:

针对现有的K—Means算法K值需要人工赋值、随机选取初始中心点、文本表示维度高且缺乏语义的缺陷,提出了一种基于概念格的K-Means算法——-K—MeansBCC(K-means algorithm based on concept lattice)。将文本集经预处理转化为形式背景,在此基础上生成概念格;利用概念格中的概念表示文本,根据文本中概念的权重确定K值、选取初始中心点。最后设计了文本间的概念相似度计算公式,并由K—Means算法产生聚类结果。实验结果表明,该算法提高了聚类的效率和准确性。

英文摘要:

Aiming at the problems of the existing K-Means algorithm, such as artificial assignation of number of final clustering, random selection of initial centers, high dimension and lack of semantic information in text representation, a new K-Means algorithm called K- MeansBCC is proposed. Firstly, concept lattice is generated on the basis of formal context to which texts are converted by pre-process, then K-MeansBCC expresses texts using the concepts in concept lattice, and determines K values and initial centers according to the weight of concepts, finally the formula of concept similarity between texts is designed, and clustering result by K-Means algorithm is generated. The experimental result show that this algorithm improves the efficiency and accuracy of the clustering.

同期刊论文项目
期刊论文 58 会议论文 25
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616