东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

多尺度数据挖掘方法

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP182[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]河北师范大学数学与信息科学学院,河北石家庄050024, [2]河北省计算数学与应用重点实验室(河北师范大学),河北石家庄050024, [3]冀广传媒集团河北广电无限传媒有限公司,河北石家庄050000
相关基金：国家自然科学基金（71271067）; 国家社会科学基金（13BTY011,13＆ZD091）

作者：柳萌萌[1,2], 赵书良[1,2], 韩玉辉[1,2], 苏东海[3], 李晓超[1,2], 陈敏[1,2]

关键词：多尺度, 频繁项集, 关联规则, 尺度转换, 多尺度关联规则挖掘, multi-scale, frequent item-set, association rule, scale conversion, multi-scale association rules mining

中文摘要：

多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA（multi-scale association rules mining algorithm）,实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明：算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的.

英文摘要：

Many researches of data mining have paid close attention to multi-scale theory. However the study of multi-scale data mining still comes short on universal theories and approaches. To overcome this limitation, this paper conducts a study of universal multi-scale data mining on theoretical and methodological aspect. First, the paper lays out the definition of data-scale-partition and data-scale based on concept hierarchy, and characterizes the relationship of upper-layer and lower-layer datasets between multi-scale datasets. Next, it illustrates the definition and essence of multi-scale data mining, and presents the classification of multi-scale data mining methods. Finally, it introduces the algorithm framework and its theoretical basis of multi-scale data mining, and proposes an algorithm named MSARMA（multi-scale association rules mining algorithm） to realize the transition of knowledge in multi-scale data expressions. Experiments are carried out to test MSARMA with the help of IBM T10I4D100 K dataset and demographic dataset from H province, and the results indicate that MSARMA is effective and feasible with better coverage rate, better accuracy and lower average support error.

同期刊论文项目

　基于物联网的健身服务商业模式研究

期刊论文 5

基于Multi-Agent的企业动态联盟合作中信任问题研究

期刊论文 11

　明清华北地区府县历史文化研究与专题数据库建设

期刊论文 11

同项目期刊论文

一种解决稀疏数据和冷启动问题的组合推荐方法

基于词频统计的文本关键词提取方法

邻域结构为复杂网络的差分演化算法

邻域结构为复杂网络的粒子群算法

基于奇异值分解与蜂群优化的鲁棒图像水印算法

多尺度关联规则尺度上推算法

基于超图的关联规则可视化方法

基于词频统计规律的文本数据预处理方法

中文文本同频词统计规律及在关键词提取中的应用

多尺度关联规则挖掘的尺度上推算法

基于词频统计的文本关键词提取方法

多尺度关联规则尺度上推算法

基于超图的关联规则可视化方法

基于词频统计规律的文本数据预处理方法

20世纪以来明代地方财政史研究述评

人口、盛世与民生：对于清前期经济增长方式的反思

明清之际华北家谱中的燕赵悲歌与士人担当

民间有史书民众有历史——读《又到甲午》

清代教化体系及其变化——以清代华北府县为考察中心

浅谈农历公历换算与史梦兰生卒年代换算的辨证

一种解决稀疏数据和冷启动问题的组合推荐方法

基于词频统计的文本关键词提取方法

中文文本同频词统计规律及在关键词提取中的应用

多尺度关联规则挖掘的尺度上推算法

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609