东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

面向Tabular库的数据模型及其查询问题

ISSN号：0253-2778
期刊名称：《中国科学技术大学学报》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]上海海洋大学信息学院,上海201306, [2]国家海洋局东海预报中心,上海200136
相关基金：国家自然科学基金（61272098）资助

关键词： Tabular库, 查询, 数据模型, PartiPath划分树, 关系模型, Tabular repository, query, data model, PartiPath tree, relation model

中文摘要：

信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据特点.然而使用无结构和半结构化文档组织和管理Excel等表单数据,存在着数据弱可控、弱可用、及访问效率差的问题.针对该类问题,本文以Excel文本为数据源,提出了一种新的面向Tabular库的关系数据模型并讨论了其上的查询及优化问题.首先,给出了Tabular表单数据的形式化定义,其次,设计PartiPath划分树实现表格的关系划分及结构转换,在关系模型的基础上,给出其数据模型及数据模式,再者,定义了表单数据上的基本查询问题及融合用户兴趣指数改进查询相似度指标,最后给出实验分析并作出总结.

英文摘要：

With the rapid development of information technologies, data storage and representation of various sources, including not only the traditional structured data such as relational databases and object- oriented databases, but also those special unstructured data like Excel, CSV documents, manifest distributed and heterogeneous characteristics. Undoubtedly, all above data features high-volume, continuously-updating, low-usability, which falls into Big Data. However, the organization and management of Excel and other forms of data by using unstructured and semi-structured methods leads to a weakly-controllable, weakly-usable data structure with poor access efficiency. To solve this problem, this paper, taking Excel data source into consideration, aims to propose a new tabular-oriented relational data model and discusses Tabular querying and optimizing issues. Firstly, the formal definition of Tabular form data is given; secondly, PartiPath tree is designed to achieve structural transformation by tabular division and its relation schema as well; then its data model is presented. After that, four basic queries and their optimization by improved DICE with user interest similarity are described. Finally, the experiment was conducted and a conclusion was drawm.

同期刊论文项目

“数字海洋”中海量复杂类型数据的质量检验及存储问题研究

期刊论文 14

同项目期刊论文

基于Henon映射的加密遥感图像的安全检索方案

基于时空一体化的海洋大数据快速展示平台

基于ADMD融合策略的海洋大数据索引技术研究

一种基于空间相关性的海洋环境监测数据优化抽样方法

含排他性选择规则的主动规则集的汇流性判定方法

SmartMS:Android平台下灵活的海监执法取证及分析系统

强关联海洋数据划分研究

一种适用于近海环境监测的WSNs节点设计方法

ArtiMate：一种以Artifact为中心的多粒度协作流程建模方法

云环境下基于秘密共享的海洋遥感影像认证方案

面向Spark的遥感影像金字塔模型的并行构建方法

基于DBNMI模型的海洋遥感影像自动标注方法

TSEA：极地科考在线系统中海量走航数据的剔除算法

期刊信息

《中国科学技术大学学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学技术大学
主编：何多慧
地址：安徽省合肥市金寨路96号
邮编：230026
邮箱：JUST@USTC.EDU.CN
电话：0551-63601961 63607694

国际标准刊号：ISSN：0253-2778
国内统一刊号：ISSN：34-1054/N
邮发代号:26-31

获奖情况:
1999年，全国优秀高等学校自然科学学报及教育部优...,2001年，安徽省1999-2001年度优秀科技期刊一等奖,2002年，第三届华东地区优秀期刊奖

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:8237