位置:成果数据库 > 期刊 > 期刊详情页
基于主要特征抽取的重现概念漂移处理算法
  • ISSN号:1004-9037
  • 期刊名称:《数据采集与处理》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]桂林电子科技大学计算机科学与工程学院,桂林541004, [2]桂林电子科技大学广西可信软件重点实验室,桂林541004, [3]湖南商学院计信学院,长沙410205
  • 相关基金:国家自然科学基金(61363029,61540053)资助项目;广西区科学研究与技术开发(桂科攻14124005-2-1)资助项目;湖南省博士后科研专项资助计划(2011RS4073)资助项目;广西信息科学中心(YB408)资助项目。
中文摘要:

针对重现概念漂移检测中的概念表征和分类器选择问题,提出了一种适用于含重现概念漂移的数据流分类的算法———基于主要特征抽取的概念聚类和预测算法(Conceptual clustering and predic‐tion through main feature extraction ,MFCCP)。MFCCP通过计算不同批次样本的主要特征及影响因子的差异度以识别重复出现的概念,为每个概念维持且及时更新一个分类器,并依据Hoeffding不等式选择最合适的分类器对当前样本集实施分类,以提高对概念漂移的反应能力。在3个数据集上的实验表明:M FCCP在含重现概念漂移的数据集上的分类准确率,对概念漂移的反应能力及对概念漂移检测的准确率均明显优于其他4种对比算法,且M FCCP也适用于对不含重现概念漂移的数据流进行分类。

英文摘要:

Recurring concept drift is one of the sub‐types of concept drift .In recurring concept drift detec‐tion ,it is very important to represent concepts and select the most appropriate classifier to classify .We propose an algorithm ,conceptual clustering and prediction through main feature extraction (MFCCP) , for classifying data stream with recurring concept drifts .MFCCP can recognize recurring concepts by computing the differences of main features and impact factors of different batches of samples .It main‐tains a classifier for each concept and monitors the classification accuracy to select classifier according to hoeffding inequality in order to enhance the ability of adapting to concept drift .The experimental results over the three datasets illustrate that M FCCP achieves better classification accuracy ,adapts faster to con‐cept drift ,and detects concept drift more accurately than the other four algorithms on the data streams with recurring concept drifts ,and therefore ,M FCCP is apt to classify data stream without recurring con‐cept drif t .

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数据采集与处理》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会 仪器仪表学会 信号处理学会 中国一汽仪表学会 中国物理学会 微弱信号检测学会 南京航空航天大学
  • 主编:贲德
  • 地址:南京市御道街29号
  • 邮编:210016
  • 邮箱:sjcj@nuaa.edu.cn
  • 电话:025-84892742
  • 国际标准刊号:ISSN:1004-9037
  • 国内统一刊号:ISSN:32-1367/TN
  • 邮发代号:28-235
  • 获奖情况:
  • 中国科技论文统计源用刊,2007年被评为江苏省优秀期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:8148