位置:成果数据库 > 期刊 > 期刊详情页
基于CSS选择器的深网结果页抽取方法
  • ISSN号:2095-6002
  • 期刊名称:《食品科学技术学报》
  • 时间:0
  • 分类:TP311.135.4[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京工商大学计算机与信息工程学院,北京100048
  • 相关基金:北京市科技新星计划项目(2006B10);北京优秀人才计划项目(20071D0500300136)
中文摘要:

提出一种基于CSS选择器的深网结果页数据抽取方法,用于抽取深网结果页中的数据记录.实验结果表明在大多数情况下,该方法都能准确抽取出页面中的数据记录.

英文摘要:

We propose a methodology sult pages. Experimental evaluation based on CSS selector to extract data records from deep web reon a large number of Web page collections indicates that our methodology correctly extracts data records in most cases

同期刊论文项目
同项目期刊论文
期刊信息
  • 《食品科学技术学报》
  • 主管单位:北京市教育委员会
  • 主办单位:北京工商大学
  • 主编:孙宝国
  • 地址:北京市海淀区阜成路33号北京工商大学
  • 邮编:100048
  • 邮箱:spxb@btbu.edu.cn
  • 电话:010-68984535
  • 国际标准刊号:ISSN:2095-6002
  • 国内统一刊号:ISSN:10-1151/TS
  • 邮发代号:
  • 获奖情况:
  • 2015年入选中国科技核心期刊2015年入选RCCSE中...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国食品科技文摘
  • 被引量:695