位置:成果数据库 > 期刊 > 期刊详情页
一种基于特征加权的KNN文本分类算法
  • ISSN号:1003-3254
  • 期刊名称:《计算机系统应用》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽财经大学,安徽蚌埠233000, [2]哈尔滨工程大学,黑龙江哈尔滨150001
  • 相关基金:教育部社科研究基金青年项目(07JC870006); 安徽省哲学社会科学规划项目基金(AHSKF07-08D03); 安徽财经大学教研重点项目(ACJYZD200914)
中文摘要:

KNN文本分类算法是一种简单、有效、非参数的分类方法。针对传统的KNN文本分类算法的不足,出现了很多改进的KNN算法。但改进的KNN分类算法大多数是建立在样本选择的基础上。即以损失分类精度换取分类速度。针对传统的KNN文本分类算法的不足,提出一种基于特征加权的KNN文本分类算法(KNNFW),该算法考虑各维特征对模式分类贡献的不同,给不同的特征赋予不同的权值,提高重要特征的作用,从而提高了算法的分类精度。最后给出实验结果并对实验数据进行分析得出结论。

英文摘要:

KNN classification algorithm is a simple and effective method of classification.According to the deficiencies of traditional KNN,there appear a lot of improved KNN algorithms,but most improved KNN classification algorithm is based on the sample selection,namely,loss of classification accuracy for classification rate.According to the deficiencies of traditonal KNN algorithm,a KNN algorithm basd on feature weighting(KNNFW)is proposed in this paper.the a-lgorithm considers different contributions of the fractal features to the pattern classification,gives different weight to different characteristics,improves the important role of the features,so as to improve the accuracy of classification algorithm.The experimental results are presented and the experimental data analysis conclusion is also achieved.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机系统应用》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所
  • 主编:苏振泽
  • 地址:北京8718信箱
  • 邮编:100190
  • 邮箱:csa@iscas.ac.cn
  • 电话:010-62661041
  • 国际标准刊号:ISSN:1003-3254
  • 国内统一刊号:ISSN:11-2854/TP
  • 邮发代号:82-558
  • 获奖情况:
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2000版)
  • 被引量:15201