东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于熵相关系数的关联性自动判别方法——COCA

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TP311.132[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]中国人民大学信息学院,北京100872
相关基金：国家自然科学基金资助项目（60473069;60496325）

关键词：查询优化, 统计信息, 关联性, 熵相关系数, query optimization, statistical information, correlation, entropy correlated coefficient

中文摘要：

数据库自管理、自调优中查询计划的自动优化是目前的关注热点。为保证优化器估值精度，用统计学方法，给出了一种基于熵相关系数的对字段关联性的自动判别的新算法——COCA。该算法有下列特点：（1）限制少，没有卡方检验的频数限制，卡方检验只有在列联表中至少有80％的格子频数大于5的情况下才可信；（2）结果多，卡方检验（CORDS）只判断字段之间是否有关联，新方法可计算字段之间双向的关联程度。实验表明，新方法更坚固，产生更多的统计信息，可以支持后面更高效、准确地建立直方图。

英文摘要：

Self-managing and self-optimizing is currently a hot research field in database. To guarantee the accuracy of the estimates made by optimizer, this paper proposed a new method named COCA （entropy-COrrelated-Coefficient-based Auto-detection of association）. In comparison with CORDS, COCA has the following features：（1） Fewer limitations. It overcomes the limitation that Chi-square test needs at least 80% of the cells in the contingency table have frequencies greater than 5. （2） More results. CORDS can tell the correlation between columns, while COCA can further discern the specific association degree for both directions. Experiments show that COCA is more robust and produces more statistical information, which is supportive to the creation of more effective and efficient histograms.

同期刊论文项目

因特网上非规范知识处理实验平台

期刊论文 57 著作 1

网格环境下数据库信息检索新技术研究

期刊论文 36 会议论文 12 获奖 2

同项目期刊论文

DETECTOR:基于关系数据库通用的

P2P环境下数据库管理系统上的TOP

网格环境下的数据库系统.

LinkNet:一种用于大规模P2P系统

PostgreSQL中文全文索引技术研究与实现

LinkNet:一种用于大规模P2P系统查找的新方法

2DCMA: An Effective Maintenance Algorithm of Materialized Views in Peer Data Management Systems

内存数据库在TPC-H负载下的处理器性能

Peer数据管理系统中的视图维护策略

SEEKER: 基于关键词的关系数据库

基于本体的关系数据库语义检索

S-CBR: 基于数据库模式展现数据

CLASCN: Candidate Network Sele

Searching Databases with Keywo

纯Peer to Peer环境下有效的TOP-

基于P2P的数据索引与查询

网格数据检索中结果集的合并算法

网格环境下的数据库检索系统设计

本体学习研究综述

Efficient Incremental Maintenance for Distributive and Non-Distributive Aggregate Functions

面向不同数据分布的多维直方图算法COCA-Hist

基于动态校验码的敏感信息保护技术研究与实现

XML元素级检索的反馈算法

支持What-if分析的OLAP系统研究

S-CBR：基于数据库模式展现数据库关键词检索结果

CLASCN： Candidate Network Selection for Efficient Top-κ Keyword Queries over Databases

P2P环境下基于Bayesian网络的多粒度信任模型

主存OLAP系统中what-if查询处理策略

基于Hilbert曲线的许可证存储策略及查找算法

一种面向高速度数据流的频繁模式挖掘算法

一种能力属性增强的WEB服务信任评估模型

关联规则挖掘的取样误差量化模型和快速估计算法

数据库和信息检索技术的融合

SEEKER: 基于关键词的关系数据库信息检索

LinkNet:一种用于大规模P2P系统查找的新方法

纯Peer to Peer环境下有效的TOP-K查询

CLASCN: Candidate Network Selection Supporting Efficient Top-k Keyword Queries over Databases

Searching Databases with Keywords

DETECTOR:基于关系数据库通用的在线关键词查询系统

S-CBR: 基于数据库模式展现数据库关键词检索结果

基于分形技术的数据流突变检测算法

知识网格研究

A Review-based Reputation Evaluation Approach for Web services

基于WSMO的语义Web服务发现框架研究

2DCMA: An Effective Maintenance Algorithm of Materialized Views in Peer Data Management Systems

内存数据库在TPC-H负载下的处理器性能

Peer数据管理系统中的视图维护策略

一种支持多维数据范围查询的对等计算索引框架

挖掘多关系关联规则

本体学习研究综述

非结构化对等计算系统中多维范围搜索

LEO:基于序列化的XML文档高效查询处理方法

QoS-Aware Composite Services Retrieval

基于高维空间的在线高效子空间Skyline算法——CSky

iRIPPER——一种改进的基于规则学习的文本分类算法

语义Web环境中本体库管理系统体系结构研究

语义Web数据管理研究进展

Prefetching J^＋-Tree： A Cache-Optimized Main Memory Database Index Structure

Efficient Incremental Maintenance for Distributive and Non-Distributive Aggregate Functions

电子商务系统的性能评测与数据存取优化

动态Web技术架构及其性能分析

缓存敏感的封闭冰山立方体计算

面向不同数据分布的多维直方图算法COCA-Hist

基于动态校验码的敏感信息保护技术研究与实现

XML元素级检索的反馈算法

面向更新密集型应用的内存数据库高效检查点技术

支持What-if分析的OLAP系统研究

S-CBR：基于数据库模式展现数据库关键词检索结果

Cache-Conscious Data Cube Computation on a Modern Processor

信息检索中一种基于词语-主题词相关度的语言模型

基于图形处理器的数据流快速聚类

CLASCN： Candidate Network Selection for Efficient Top-κ Keyword Queries over Databases

面向电信运营应用的数据库基准测试

基于滑动窗口的进化数据流聚类

P2P环境下基于Bayesian网络的多粒度信任模型

主存OLAP系统中what-if查询处理策略

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679