位置:成果数据库 > 期刊 > 期刊详情页
基于KNN的中文文本分类性能研究
  • ISSN号:1671-7341
  • 期刊名称:科技风
  • 时间:0
  • 页码:71-72
  • 分类:TP391.12[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]西北民族大学中国民族语言文字信息技术重点实验室,甘肃兰州730030
  • 相关基金:国家自然基金重点项目多民族文字识别及理解的理论与方法研究(61032008); 西北民族大学中央高校基本科研业务费专项项目(zyz2011101); 模式识别重点实验室开发课题(201001051)
  • 相关项目:面向Web环境下藏语社会网络分析的关键技术研究
中文摘要:

本文针对文本分类的文本表示、分类器等关键技术进行了研究,并且使用基于K最近邻(k-NearestNeighbor,KNN)分类算法在系统上实现了文本分类器。在此基础上通过实验数据针对样本集、K的取值等因素对分类效果的影响做了详细的研究比较,通过对性能变化原因分析,提出了最优性能解决方案。

英文摘要:

The paper is researched on the key technology of classifier and text representation for classification, and adapted classified algorithm of KNN (k-Nearest Neighbor)to realize the text classifieron the system.compared the classify influence based on the factor of sample set and the value of k through test data.After analyzing the reason of performance change,put forward the best relative performance solution plan.

同期刊论文项目
期刊论文 41 会议论文 33 获奖 5 著作 3
同项目期刊论文
期刊信息
  • 《科技风》
  • 主管单位:河北省科学技术协会
  • 主办单位:河北省科技咨询服务中心
  • 主编:
  • 地址:河北省石家庄市裕华东路103号
  • 邮编:050011
  • 邮箱:hebeikejifeng@163.com,hbkjfzzs@126.com,kjfzzs@yeah.net
  • 电话:0311-86049786
  • 国际标准刊号:ISSN:1671-7341
  • 国内统一刊号:ISSN:13-1322/N
  • 邮发代号:18-38
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:32124