位置:成果数据库 > 期刊 > 期刊详情页
基于权重查询词的XML结构查询扩展
  • ISSN号:1000-9825
  • 期刊名称:软件学报
  • 时间:0
  • 页码:2611-2619
  • 语言:中文
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西财经大学信息管理学院,江西南昌330013, [2]江西财经大学数据与知识工程江西省高校重点实验室,江西南昌330013
  • 相关基金:Supported by the National Natural Science Foundation of China under Grant No.60763001 (国家自然科学基金); the National Social Science Foundation of China under Grant No.07BTQ025 (国家社会科学基金); the Key Science-Technology Project of the Education Department of Jiangxi Provincial of China under Grant No.[2006]320 (江西省教育厅重点科技项目)
  • 相关项目:基于隐式反馈和伪反馈的XML文本文档检索技术研究
作者: 万常选|鲁远|
中文摘要:

文本文档信息检索中检索质量不高的一个主要原因是用户难以提出准确的描述查询意图的查询表达式.而XML文档除了具有文本文档的内容特征外,还具有结构特征,导致用户更难以提出准确的查询表达式.为了解决这一问题,提出一种基于相关反馈的查询扩展方法,可以帮助用户构建满足查询意图的“内容+结构”的查询表达式.该方法首先进行查询词扩展,找到最能代表用户查询意图的权重扩展查询词:然后在扩展查询词的基础上进行结构查询扩展;最终形成完整的“内容+结构”的查询扩展表达式.实验结果表明,与未进行查询扩展相比,扩展后prec@10和prec@20的平均准确率提高30%以上.

英文摘要:

The main reason of low precision in information retrieval (IR) is that it is difficult for the users to submit a precise query expression for their query intensions. Furthermore, XML documents have characteristics not only in the eontent, but also in its structure. Therefore it is more difficult for users to submit precise query expressions. In order to solve this problem, this paper puts forward a new query expansion method based on relevance feedback. It can help users to construct a content and structure query expression which can satisfy users' intentions. This method includes two steps. The first step is to expand keywords for finding the weighted keyword which can represent the user's intentions. The second step is structural expansion based on the weighted keywords. Finally a full-edged content-structure query is formalized. Experimental results show that the method can obtain better retrieval results. The average precision ofprec@10 and prec@20 is 30% higher than the original query.

同期刊论文项目
期刊论文 33 会议论文 14 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《软件学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院软件研究所 中国计算机学会
  • 主编:赵琛
  • 地址:北京8718信箱中国科学院软件研究所
  • 邮编:100190
  • 邮箱:jos@iscas.ac.cn
  • 电话:010-62562563
  • 国际标准刊号:ISSN:1000-9825
  • 国内统一刊号:ISSN:11-2560/TP
  • 邮发代号:82-367
  • 获奖情况:
  • 2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:54609