位置:成果数据库 > 期刊 > 期刊详情页
一种基于C4.5决策树算法的Web页面分类算法
  • ISSN号:1001-4748
  • 期刊名称:《山东师范大学学报:自然科学版》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山东师范大学信息科学与工程学院,济南250014
  • 相关基金:国家自然科学基金资助项目(61373148);国家社科基金资助项目(12BXW040);教育部人文社科基金资助项目(14YJC860042);山东省自然科学基金资助项目(ZR2012FM038,ZR2014FLOIO);山东省优秀中青年科学家奖励基金资助项目(BS2013DX033);山东省高等学校科技计划项目(J12LN21);山东省社科规划项目(12BXWJ01).
中文摘要:

页面分类是Web信息处理的一个基础性问题,而页面分类算法是页面分类中设计实现分类器的理论基础.在页面分类算法领域,目前最典型的分类算法包括决策树算法、贝叶斯算法、KNN算法等.笔者讨论了这几种典型的分类算法的理论基础,分析了每个算法的优缺点,最后,笔者给出了一种基于C4.5算法的Web页面分类器的实现过程.

英文摘要:

Page classfication is a basic problem of Web information processing, and the page classification algorithm is the theoretical basis of the design of the classifier page classification. In the field of page classification algorithm, classification algorithm is the most typical include decision tree algorithm and Bias algorithm and KNN algorithm. This paper discusses the theoretical basis ~of the typical classification algorithms, analyzes the advantages and disadvantages of each algorithm, finally, this paper gives an implementation of Web Page Classifier Based on C4.5 algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《山东师范大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:山东省教育厅
  • 主办单位:山东师范大学
  • 主编:刘凯
  • 地址:山东济南市文化东路88号
  • 邮编:250014
  • 邮箱:jsnun@sdnu.edu.cn
  • 电话:0531-86180056 86180057
  • 国际标准刊号:ISSN:1001-4748
  • 国内统一刊号:ISSN:37-1166/N
  • 邮发代号:
  • 获奖情况:
  • 全国高校优秀学报,华东地区优秀期刊,山东省优秀期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,中国中国科技核心期刊
  • 被引量:6742