位置:成果数据库 > 期刊 > 期刊详情页
一种并行的网页解析算法
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学技术大学计算机科学与技术学院,合肥230027, [2]安徽省计算与通信软件重点实验室,合肥230027, [3]中国科学技术大学中科院沈阳计算所网络与通信联合实验室,合肥230027
  • 相关基金:国家“核高基”重大专项项目(2009ZX01028-002-003-005)资助;国家自然科学基金项目(60833004)资助;高等学校创新引智计划项目(B07033)资助.
作者: 张开敏[1,2,3]
中文摘要:

如今,Web应用已经可以提供接近传统桌面应用的用户体验,其网页也相应地变得更加复杂,从而对web浏览器的性能提出了巨大挑战.传统的Web浏览器通常使用单一线程处理网页,无法充分利用多处理器设备的运算能力,针对于此提出了一种并行的网页解析算法.与现有针对网页处理的并行算法不同,本算法基于数据并行的方案,通过将输入数据划分成多个部分,对其进行并行处理,再合并各个部分的结果以得到最终结果.本算法可以充分利用现有的高度优化的串行网页处理算法,并且兼容现有的Web标准和技术.在Webkit浏览器引擎上进行的实验指出,本并行算法可以有效利用多核处理器的运算能力,显著提高了网页解析过程的速度.

英文摘要:

Web applications have become more complex and rich in user experiences that can compete with desktop applications. This poses great challenges to Web browsers, which traditionally process a Webpage in a single thread therefore cannot exploit the compu- ting power in modem multi-processor devices. This paper presents a parallel algorithm for Webpage parsing. Unlike the existing par- allel algorithms for Webpage processing, the algorithm proposed in this paper is based on the data parallel scheme. By partitioning the input data into several parts, then processing them in parallel and finally merging the partial results to generate the final results, this algorithm in this paper could leverage the existing highly optimized algorithms and be compatible with existing Web standards and technologies. The experimental results on the Webkit Web browser engine show that the parallel algorithm could dramatically speed up the Webpage parsing on a device with multi-core processors.

同期刊论文项目
期刊论文 75 会议论文 63 专利 12
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212