位置:成果数据库 > 期刊 > 期刊详情页
基于关键词的RDF数据查询方法
  • ISSN号:1001-0505
  • 期刊名称:《东南大学学报:自然科学版》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]东南大学计算机科学与工程学院,南京210096
  • 相关基金:国家自然科学基金资助项目(60773106); 江苏省自然科学基金资助项目(BK2008290)
中文摘要:

在建立关键词倒排索引和路径索引的基础上,提出一个利用量化均衡规则和等距规则的启发式查询算法,并按照查询结果的大小排序返回最相关的前k个结果.通过建模RDF数据为RDF句子图,将文本信息封装到句子节点,同时将查询结果建模为包括所有查询关键词并且叶节点是关键词节点的无根树,将关键词查询问题转化为斯坦纳树问题.假设RDF句子图包括n个节点,最坏情况下索引占用的空间是3n^2.假设关键词节点数为k,查询算法的时间复杂度为O(kn).该方法不需要依赖RDF数据的模式信息,支持对数据中的属性和关系名进行关键词查询.实验证明该方法能够快速而有效地实现RDF数据的关键词查询.

英文摘要:

Based on the Keyword inverted-list index and the path index,a heuristic searching algorithm is proposed.The algorithm uses the cost-balanced strategy and the equi-distance strategy to find the top-k answers.Resource description framework(RDF) data is modeled as an RDF sentence graph,and all text information is encapsulated by the sentence nodes.An answer to a keyword query is an RDF sentence tree which contains all the keywords,and all the leaf nodes are relevant to keywords.Therefore,to find a shortest answer tree is a Steiner tree problem.Supposing that there are n nodes in RDF sentence graph,the index space would be 3n^2 in the worst case.Supposing that there are k relevant nodes,the time complexity would be O(kn).The proposed approach supports keywords that match attributes and relation contained in the data,without the information of the RDF data schema.The experimental results show that the approach is feasible and effective.

同期刊论文项目
期刊论文 14 会议论文 5
同项目期刊论文
期刊信息
  • 《东南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:东南大学
  • 主编:毛善锋
  • 地址:南京四牌楼2号
  • 邮编:210096
  • 邮箱:xuebao@seu.edu.cn
  • 电话:025-83794323
  • 国际标准刊号:ISSN:1001-0505
  • 国内统一刊号:ISSN:32-1178/N
  • 邮发代号:28-15
  • 获奖情况:
  • 先后荣获第三届国家期刊奖百种重点期刊奖,2006-2...,2013年荣获首届江苏省新闻出版政府奖"报刊奖"
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23651