位置:成果数据库 > 期刊 > 期刊详情页
SVM-KNN分类器在网页分类中的应用
  • ISSN号:1671-1815
  • 期刊名称:《科学技术与工程》
  • 时间:0
  • 分类:TP183[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]北京物资学院信息学院,北京101149
  • 相关基金:北京市属高等学校人才强教计划项目(PHR210)、北京教育委员会科研基地建设项目、北京市教育委员会科技计划项目(101200810037001)、国家自然科学基金重点项目(10673017)资助
中文摘要:

为了提高中文网页自动分类的分类精度,将SVM-KNN方法用于中文网页分类。提出了一种中文网页的表示方法,在将下载的网页全部表示为向量空间的向量后,用SVM构造了一个多类分类器。在分类时通过在特征空间计算网页所表示的向量和分界面的距离决定采用SVM方法还是KNN方法对其分类。实验证明该方法是一种有效的方法,对网页分类的各类,使用该方法比使用SVM方法具有更高的分类精度,同时能缓解SVM训练时对核参数的选择困难问题。

英文摘要:

The SVM-KNN method is applied to Chinese web page classification in order to improve the classify accuracy of Chinese Web page. After analyzing the characteristics of web pages, a new vector representation of web pages was proposed and applies to web page classification. A multi-class classifier is constructed using SVM after the downloaded web pages was presented as a vector of vector space. In the classify phase, the distance is computed from vector to hyper-plane, based on which the SVM and KNN method are chosen. Experiment result shows the SVM-KNN method is valid method, which has a higher classify racy than that of the SVM. Besides, the problem of choosing kernel function parameters SVM is solved using this method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478