位置:成果数据库 > 期刊 > 期刊详情页
基于Hole-Filler模型的XML数据流上的SLCA算法
  • ISSN号:1000-1239
  • 期刊名称:《计算机研究与发展》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]上海理工大学光电信息与计算机工程学院,上海200093, [2]东北大学信息科学与工程学院,沈阳110004
  • 相关基金:国家自然科学基金项目(60970012); 上海市重点学科建设基金项目(S30501); 上海市高校优秀青年教师科研专项基金项目(SLG08012); 上海市教委科技创新基金项目(08YZ98)~~
中文摘要:

与传统数据库对XML数据的处理不同,对XML数据流的处理不仅受实时性的约束,还受存储空间的限制.在XML片段无序传送的广播模型中,考虑在XML数据流上进行高效的关键字查询,进而首次提出近似SLCA算法.SLCA算法利用结构Hash表和LCA表对关键字进行匹配并计算SLCA,从而避免冗余操作.同时,SLCA算法可以对匹配结果立即输出而不必等到数据流传输结束.实验结果表明,基于Hole-Filler模型的XML数据流上的SLCA算法在节省时间和空间开销方面均表现出较好的性能.

英文摘要:

Unlike in traditional databases,queries on XML streams are bounded not only by memory but also by real time processing.A novel technique for keyword search over streamed XML fragments is presented,which adopts broadcast model and hole-filler model for XML fragments dissemination,addressing the problem of disordered fragment transmission and considering the quality of searching results due to either keyword mismatch or data absence.Two efficient indexes for candidate elements are developed to further improve the performance:Hierarchical hash table and LCA table.The former indexes structure keywords which act as the structure of result,while the latter indexes the condition keywords which refine the keyword search condition.SLCA computing algorithm,which is triggered by condition keywords,only computes the candidate fragments that involve keywords,thus avoiding redundant operations that will not contribute to the final result.The algorithm produces part of the matched answers continuously without having to wait for the end of the stream.The experiments evaluate the performance of the SLCA algorithm with different types of keywords,different document fragmentation and different keyword frequencies,and compare the SLCA algorithm with other XML keyword matching algorithms.The experiment study shows that the SLCA algorithm performs well on saving processing power and memory space.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349