位置:成果数据库 > 期刊 > 期刊详情页
基于属性预扫描的不确定性函数依赖挖掘
  • ISSN号:1000-0054
  • 期刊名称:清华大学学报(自然科学版)
  • 时间:0
  • 页码:904-908
  • 语言:中文
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]清华大学经济管理学院,管理科学与工程系,北京100084
  • 相关基金:国家自然科学基金资助项目(70231010,70621061)
  • 相关项目:基于信息技术的供应链管理理论和应用研究
中文摘要:

函数依赖是关系数据库和数据建模中所需的关键约束知识。在海量数据中挖掘函数依赖时为降低噪音干扰和提高效率,该文采用带有满意度函数依赖的概念及挖掘带有满意度函数依赖的算法(MFDD),对噪音进行测度与表达,并有效挖掘得到函数依赖最小集。利用对属性散列度的测度概念,在带有满意度函数依赖的理论框架内采用3条优化策略,实现了属性预扫描算法。结果表明:基于该算法可显著提高挖掘效率。

英文摘要:

The functional dependency (FD) is a key constraint knowledge in relational databases and data modeling. However, noisy data and low efficiencies restrict the ability to mine functional dependencies in massive databases. Functional dependencies with degrees of satisfaction were used to discover minimal sets of functional dependencies (MFDD). The method not only measures the noises, but also efficiently discovers the minimal set of functional dependencies. A degree of diversity was used with a pre-scanning operation to evaluate the attribute value diversity to develop three optimization strategies for the functional dependency with a degree of satisfaction. Both theoretical analyses and test results show that the algorithm significantly improves the mining efficiency.

同期刊论文项目
期刊论文 183 会议论文 70 著作 1
期刊论文 98 会议论文 82 获奖 6 著作 13
同项目期刊论文
期刊信息
  • 《清华大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:清华大学
  • 主编:梁恩忠
  • 地址:北京市海淀区清华大学学研大厦B座908
  • 邮编:100084
  • 邮箱:xuebaost@tsinghua.edn.cn
  • 电话:010-62788108 62792976
  • 国际标准刊号:ISSN:1000-0054
  • 国内统一刊号:ISSN:11-2223/N
  • 邮发代号:2-90
  • 获奖情况:
  • 国家期刊奖,国家“双高”期刊,1992年以来,历次国家级和省部级一等奖,第一、二届全国优秀科技期刊一等奖,教育部优秀期...,第三届中国出版政府奖提名奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,美国应用力学评论,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:43470