位置:成果数据库 > 期刊 > 期刊详情页
层次数据上关键字检索的结果聚合
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]复旦大学计算机科学技术学院,上海200433
  • 相关基金:国家科技重大专项基金(2010ZX01042-003-004); 国家自然科学基金(60703093 61033010 61073001); 国家“八六三”高技术研究发展计划项目基金(2009AA062803); 上海市科委现代服务业专项基金(10dz1511000)资助
中文摘要:

由于使用方便等优点,数据库上的关键字检索技术使用户可以得到所需信息而不必书写复杂的SQL语句.但大部分现有的检索方法都关注通过连接操作得到包含所有关键字的元组连接树,忽略了对于检索结果的信息整合,这从某种程度上影响了用户对于检索结果的判断.文中提出并实现一种改进的关键字检索系统框架,在具有层次结构的属性指导下对得到的元组连接树结果做聚合操作,通过寻找最低层次最小覆盖聚合将关系更为紧密的元组作为更加相关的检索结果反馈给用户.文中还提出了基本的聚合算法并对其做改进从而减少了系统的响应时间.同时,为了改善用户体验,文中定义并给出了检索结果的摘要问题及其算法,使用户最大程度地了解检索结果.实验数据表明,文中的方法能够以较高的效率和较低的计算代价有效地完成检索结果的聚合和摘要.

英文摘要:

Keyword search(KWS) has been well accepted as a proven,user-friendly way to re-trieve information,and recently applied successfully on relational databases.Today,this tech-nique allows users to find pieces of information without having to compose complicated SQL que-ries.However,almost all the existing approaches focus on finding joined tuples matching a set of key words and return the results as joining networks of tuples.In order to feed back the user more relative information,this paper formulates an expanding version of existing system to answer aggregate keyword queries over hierarchical relational databases in which the value of a specific attribute is organized in hierarchical structure.This version retrieves information in the form of MaxLMC(Max-Lowest hierarchy Minimum Coverage aggregate,which consists of tuples more similar and closer to each other) under the conduct of the above hierarchical structure.A Nave algorithm is proposed to obtain MaxLMC and its enhancement is designed to reduce the system's responding time.Meanwhile,recognized that the number of returned answer might be extremely large in practical,we defined and studied the problem of effective exploration of large sets of aggregating tuples: summarization,a technique which has been applied to help the user find diverse aggregating tuples,thus can be used to improve the user experience.An extensive empirical evaluation using both real data sets and synthetic data sets is reported to verify the effectiveness and the efficiency of our methods.

同期刊论文项目
期刊论文 17 会议论文 13 专利 5
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433