位置:成果数据库 > 期刊 > 期刊详情页
一种大规模文本分类大间隔近邻算法
  • ISSN号:1006-2475
  • 期刊名称:《计算机与现代化》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:广西大学计算机与电子信息学院,广西南宁530004
  • 相关基金:国家自然科学基金项目(61363027);广西自然科学基金项目(2015GXNSFAA139292)资助
中文摘要:

【目的】针对K最近邻(K-Nearest Neighbor,KNN)算法中k值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k值。【方法】引入k的可信度的概念,提出一种基于局部密度和纯度的自适应选取k值的方法,并将其引入到传统的KNN分类算法中。【结果】该算法合理的考虑了样本的局部密度、纯度与选取k值的关系,不仅解决了k值的选取问题,并且避免了固定k值对分类的影响。【结论】该算法是有效的,可以得到较高的准确率,但算法的时效性有待提高。

英文摘要:

【Objective】Aiming at the selection of parameter kvalue(usually fixed)in KNN algorithm is usually set by users,we should study how to better select kvalues.【Methods】This paper introduces the concept of the credibility of k,and proposes an improved adaptive selection of kvalues based on the local density and purity,and introduces into the traditional KNN classification algorithm.【Results】The algorithm is reasonable to consider the relationship between the local density and purity and the selection of k values,which not only solves the problems of choosing kvalues,but also avoids the influence of fixed kvalue on classification.【Conclusion】The algorithm is effective and can get higher accuracy,and the timeliness is also enhanced.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机与现代化》
  • 中国科技核心期刊
  • 主管单位:江西省科学技术厅
  • 主办单位:江西省计算机学会 江西省计算技术研究所
  • 主编:刘波平
  • 地址:南昌市西湖区井冈山大道1416号8楼
  • 邮编:330003
  • 邮箱:jgsdd@163.com
  • 电话:0791-86490996
  • 国际标准刊号:ISSN:1006-2475
  • 国内统一刊号:ISSN:36-1137/TP
  • 邮发代号:44-121
  • 获奖情况:
  • 中国科技核心期刊 中国科技论文统计源期刊 江西省...
  • 国内外数据库收录:
  • 波兰哥白尼索引,中国中国科技核心期刊
  • 被引量:14808