东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于概率SLCA的XML过滤

ISSN号：0254-4164
期刊名称：计算机学报
时间：2014.9.15
页码：1959-1971
分类：TP312[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]上海海洋大学信息学院,上海201306, [2]华东师范大学软件学院,上海200062, [3]复旦大学上海市智能信息处理实验室,上海200433
相关基金：本课题得到工信部核高基项目（2010ZX01042-002-003-004）、国家自然科学基金重点项目（61033007）、教育部新世纪人才支撑计划（NCET-10-0388）、上海高校知识服务平台项目（ZFl213）资助.
相关项目：数据密集型计算环境下的数据管理方法与技术

关键词：不确定数据, 概率XML, 关键字过滤, SLCA, 关键字概率分布表, uncertain data, probabilistic XML, keywords filtering, smallest lowest common ancestor, keyword distribution probability table

中文摘要：

不确定数据管理逐渐成为一个重要的研究方向。作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点。基于关键字的概率XML检索是其中一个重要的分支。目前对于概率XML关键字检索的研究，都只考察了结点之间的独立（IND）关系和互斥（MUX）关系。由于更普遍的结点依赖关系在表述和计算上的复杂性，较少有工作讨论。文中讨论概率XML模型PrXML｛exp，ind，mux｝中基于SLCA语义的关键字过滤。这种模型中通过EXP结点描述更普遍的结点依赖关系。文中在定义了子树中关键字概率分布表狋犪犫及其相关的运算后，分别给出了模型中不同类型结点关键字概率分布表的计算方法，并给出了不需要构造可能世界直接求解SLCA结点概率的算法。文章通过实验评估了算法的特性和性能。

英文摘要：

Uncertain data management is becoming an important research focus. Uncertainmanagement of XML data which is the main store and exchange standard of web data is naturallybecoming a hot point. One of the branches is keyword-based search over probabilistic XML. Inrecent work of keyword search over probabilistic XML, only the independent and the mutually-exclusive relationships among sibling nodes have been discussed. Because of the complexity ofrepresentation and computation, more general relationship among sibling nodes has got littleattention up to now. This paper addresses the problem of keyword filtering over probabilisticXML data model PrXML^{exp,ind,mux}. In the model, exp node is used to represent more generalrelationship among sibling nodes, tab is defined as keyword distribution probability table of onesubtree. The dot product, Cartesian product, and addition operation of tab are also defined.Then the computation of different type of nodes ＇ tab are given. Furthermore, an algorithm ofhow to obtain SLCAs and the probability of being a SLCA node is also given without generatingpossible worlds. Finally, the features and efficiency of our method are evaluated with extensiveexperimental results.

同期刊论文项目

数据密集型计算环境下的数据管理方法与技术

期刊论文 125 会议论文 77

同项目期刊论文

面向路网的不确定移动范围查询技术

A framework for supporting tree-like indexes on the Chord overlay

异构存储系统性能监测技术研究

多层次RFID数据流上复杂事件检测

大规模图挖掘算法并行化研究

基于ETW的Windows系统性能监测技术

基于MapReduce的封闭数据立方

一种基于局部冲突分配的DST组合规则

Asyn-SimRank:一种可异步执行的大规模SimRank算法

大图数据上顶点驱动的并行最小生成树算法

Efficient mining differential co-expression biclusters in microarray datasets

一种云环境下基于分级管理的自律计算模型

MapReduce集群中最大收益问题的研究

在线视频点播系统节能方法与策略研究

TBPRS:基于信任关系的社交用户推荐系统

Lightweight Locking for Main Memory Database Systems

面向路网空间的不确定性移动范围查询技术的研究

基于消息传递机制的MapReduce图算法研究

RM-LCDF:一种块级连续数据保护高效数据恢复方法

用户评论的质量检测与控制研究综述

面向路网的不确定移动范围查询

针对不确定射频识别数据流的改进概率推导方法

基于共享的MapReduce多查询优化技术

基于私有云的虚拟实验平台的设计与实现

基于蛋白质网络的模块动态特性挖掘研究

Semantic relevance ranking for XML keyword search

云计算环境下的大规模图数据处理技术

针对不确定RFID数据流上的改进概率推导方法

<h3 style="color:#222222;text-indent:0px;background-color:#FFFFFF;" class="gs_rt&q

Scalable SPARQL querying of large RDF graphs

FDSS:基于HDFS的海量音乐特征数据存储系统

SERA:股票历史交易重现和分析的原型系统

一种基于LBS的移动个性化推荐系统

基于MapReduce的数据聚集运算算法

云存储性能评测技术与方法研究

A high-level energy consumption model for heterogeneous data centers

云存储性能评测技术研究

海量存储系统能耗评测模型的研究

面向BSP 模型的负载均衡Hash 图数据划分

应用信息论的数据导向模式匹配方法

不确定RFID数据流上基于熵的数据推导方法

S-TRAP: Optimization and Evaluation of Timely Recovery to Any Point-in-time (TRAP)

RFID交叉读仲裁方法研究

RFID数据流上多目标复杂事件检测

异构信息空间中实体关联关系挖掘算法CFRQ4A

ERE:基于半结构化Web页面的实体关系抽取系统

BHP:面向BSP模型的负载均衡Hash图数据划分

Reverse k-ranks query

NTFS文件系统空间回收方法的研究

在线-离线数据流上复杂事件检测

基于Hadoop的封闭直方图立方

Group Location Selection Queries over Uncertain Objects

Performance Evaluation of Online Backup Cloud Storage

支持大数据管理的NoSQL 系统研究综述

异构网络中关联实体识别模型及增量式验证算法研究

A unified framework for semi-supervised PU learning

Differentially private histogram publication

基于分布式的自律计算模型研究与设计

智能超市中在线与离线RFID数据仓库技术研究

基于数据差异的连续数据保护恢复算法

基于OpenFlow的虚拟网络架构的设计与实现

一种基于图结构的Web实体排序方法

一种面向情感分析的微博表情情感词典构建及应用

共享的MapReduce环境下批量作业的调度算法研究

空间数据库中主题相关区域查询

一种基于增量分区的社交网络数据管理与维护方法

Efficient mining differential co-expression bicluster in microarray datasets. Elsevier Gene

Efficient mining differential co-expression constant row bicluster in real-valued gene expression da

多标签数据挖掘技术研究综述

A Novel Approach Based on Multi-View Content Analysis and Semi-Supervised

Query intent disambiguation of keyword-based semantic entity search in dataspaces

一种有效的多数据源RFID冗余数据清洗技术

基于数据价值的云存储动态备份一致性机制

基于信息流动分析的动态社区发现方法

基于关键字语义信息的XML文档分类

<span style="color:red;font-family:宋体;font-size:12pt;"><span style="font-fam

<span style="font-family:宋体;font-size:12pt;"><span style="font-family:;"

<a class="fz14" href="http://epub.cnki.net/kns/detail/detail.aspx?QueryID=2&am

Fast Distributed Transactions and Strongly Consistent Replication for OLTP Database Systems

Marianne Winslett. Differentially private histogram publication

广告点击率估算技术综述

面向用户观点分析的多分类器集成和优化技术

一种障碍空间数据库中的连续反k近邻查询方法

图数据中Top—k属性差异q-clique查询

支持大数据管理的NoSQL系统研究综述

基于堆叠文件系统的云计算存储优化

一种基于Hadoop的多表链接策略

基于关联数据的一致性和时效性清洗方法

基于增量式分区策略的MapReduce数据均衡方法

BOD：一种高效的分布式离群点检测算法

新型OLTP数据库系统设计的关键技术及挑战

大数据环境下并行计算模型的研究进展

一种面向海量分布式数据库的嵌套查询策略

HDFS下海量小文件高效存储与索引方法

面向Web数据集成的真值发现算法

基于差分隐私的频繁序列模式挖掘算法

面向微博系统的实时个性化推荐

SERA:股票历史交易重现和分析系统

Constrained query of order-preserving submatrix in gene expression data

A Novel Approach Based on Multi-View Content Analysis and Semi- Supervised Enrichment for Movie Recommendation

异构数据联合式的真值发现算法

一种面向多源知识图谱的样例查询方法

期刊信息

《计算机学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国计算机学会中国科学院计算技术研究所
主编：孙凝晖
地址：北京中关村科学院南路6号
邮编：100190
邮箱：cjc@ict.ac.cn
电话：010-62620695

国际标准刊号：ISSN：0254-4164
国内统一刊号：ISSN：11-1826/TP
邮发代号:2-833

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
美国数学评论（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:48433