位置:成果数据库 > 期刊 > 期刊详情页
基于粒计算的决策树并行算法的应用
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]南昌大学计算机科学与技术系,江西南昌330031
  • 相关基金:国家自然科学基金项目(61070139);江西省科技支撑计划基金项目(20112BBG70087);江西省教育厅科技计划基金项目(GJJ14134、GJJ14143)
中文摘要:

针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型M apReduce ,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;基于二进制信息粒关联矩阵,提出属性的信息增益的计算方法,设计基于M apReduce的粒计算决策树并行分类算法。通过使用标准数据集和实际气象领域的雷电真实数据集进行测试,验证了该算法的有效性。

英文摘要:

Because the traditional decision tree algorithm fails to solve the mass data mining ,combining with MapReduce ,the parallel ID3 algorithm based on the granular computing (GrC) was studied .Based on binary representation of information granu‐lar ,a binary vector of attribute was constructed ,a binary information granule correlation matrix of dataset was also given .On the basis of this ,a algorithm was proposed to compute information gain of attributes ,and a decision tree method using granular computing was also proposed ,which was a parallel classical algorithm based on MapReduce .UCI benchmark datasets and the real thunder data from meteorological bureau were used in the experiments to verify the effectiveness the presented algorithm .

同期刊论文项目
期刊论文 33 会议论文 4
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616