位置:成果数据库 > 期刊 > 期刊详情页
倒排索引查询处理技术
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科学技术大学计算机学院,湖南长沙410073, [2]国防科学技术大学信息中心,湖南长沙410073
  • 相关基金:国家自然科学基金项目(61170286)
中文摘要:

介绍索引系统的基本结构以及经典查询处理方式DAAT和TAAT,给出在AND和OR两种布尔查询下的查询处理算法实现细节。分析结果表明,在海量索引规模查询的情况下,DAAT索引遍历方式要优于TAAT索引遍历方式,OR查询和AND查询的性能差距进一步加大,基于TREC WT2G和GOV2的多组实验验证了分析的结论。指出下一步在海量索引规模下搜索引擎查询处理研究的方向。

英文摘要:

A brief overview of index structure and the state-of-the-art query processing strategies were given,i.e.DAAT(document-at-a-time)and TAAT(term-at-a-time).An explicit implementation of the two strategies of AND and OR operators was presented.The analytic conclusions show that operator OR is extremely slower than operator AND and DAAT is more efficient than TAAT,especially for large indexes.The experimental results on TREC WT2 Gand GOV2datasets verified the analytic conclusions.Finally,the future study of query processing based on large scale of indexes was presented.

同期刊论文项目
期刊论文 19 会议论文 10
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616