位置:成果数据库 > 期刊 > 期刊详情页
基于关键词距离模型的XML文档检索方法
  • ISSN号:1671-1815
  • 期刊名称:《科学技术与工程》
  • 时间:0
  • 分类:TP391.3[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]西北工业大学计算机学院,西安710072, [2]河南科技大学电信学院,洛阳471003
  • 相关基金:863基金项目(2009AA1Z134); 国家自然科学基金(60803043 60720106001)资助
中文摘要:

在信息检索中,关键词之间的距离反映了其对信息描述的集中程度,并对检索结果与用户需求的相关度产生影响。通过对XML数据固有的结构信息进行深入分析,确定了被检索数据的信息对象和信息分支的概念,并考虑以上因素建立语义距离模型。通过该模型的计算,能够更准确地计算出查询结果的相关度。实验结果证明:在真实数据集上,查询质量方面优于现有的主流算法(EASE、SLCA),同时具有较高的查询效率。

英文摘要:

Keywords proxim ity reflects the degree of information concentration and affects the relevance between search results and information needs.W ith deeply analyzing the inherent structure information of XML data,the concepts of information object and information branch are proposed.Then the keyword proxim ity model based on these concepts is established.W ith the model,the semantic d istance of keywords can be measure for computing more relevant results.Extensive experiments on real datasets demonstrate effectiveness and efficiency of the pro-posed approach.

同期刊论文项目
期刊论文 24 会议论文 13 专利 4
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478