位置:成果数据库 > 期刊 > 期刊详情页
一种新型的网页去噪及网页类型判断方法
  • ISSN号:1671-1122
  • 期刊名称:《信息网络安全》
  • 时间:0
  • 分类:TP309[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]海军指挥学院信息战研究系,江苏南京211800
  • 相关基金:全军军事学研究生课题[2010JY0674-388]
中文摘要:

传统的网页聚类方法存在准确率不高和计算复杂度高的问题。因此,文章提出了一种新型的基于URL相似性和简单DOM树的网页聚类方法,使用树匹配算法进行去噪,之后再利用统计的方法进行网页类型判断。实验结果表明,该方法达到了较高的准确性。

英文摘要:

Traditional web page clustering methods exist low accuracy and high computational complexity.The article puts forward a new Web pages clustering method based on URL similarity and simple DOM tree, denosing by using tree matching algorithm ,then using statistical methods to identify Web pages type. The experimental results show that the method achieved higher accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《信息网络安全》
  • 主管单位:中华人民共和国公安部
  • 主办单位:公安部第三研究所 中国计算机学会 计算机安全专业委员会
  • 主编:关非
  • 地址:北京市海淀区阜成路58号新洲商务大厦301B
  • 邮编:100142
  • 邮箱:gassbj@163.com
  • 电话:010-88114408 88111078 88118778
  • 国际标准刊号:ISSN:1671-1122
  • 国内统一刊号:ISSN:31-1859/TN
  • 邮发代号:4-688
  • 获奖情况:
  • 万方,同方,维普
  • 国内外数据库收录:
  • 被引量:6058