位置:成果数据库 > 期刊 > 期刊详情页
基于Rhino的JavaScript动态页面解析研究与实现
  • ISSN号:1673-629X
  • 期刊名称:《计算机技术与发展》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海交通大学信息安全工程学院,上海200240
  • 相关基金:国家自然科学基金项目(60502032,60402019);上海市科委项目(065115020);教育部新世纪优秀人才支持计划项目(NECT-06-0393)
中文摘要:

面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。

英文摘要:

Dynamlc Web page holds more than 50% of the total Web pages in countywide;however,the information collector of current network public opinion monitoring system can not get the information of Internet medium which uses dynamic Web page as its main content distribution form. Thereby,there is a scheme for interpreting JavaScript dynamic Web page by using Rhino engine presented in this psper. Proved by the experiments, this scheme is an effective one for extracting the hyperlink network addresses and content of dynamic Web page and it has enriched the work data set of network public opinion monitoring.

同期刊论文项目
期刊论文 32 会议论文 11 著作 1
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263