东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

Hadoop环境下基于敏感度的随机森林分类算法研究

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：内蒙古科技大学信息工程学院,内蒙古包头014010
相关基金：国家自然科学基金资助项目（71363040）

关键词：分类, 云计算, MAPREDUCE, 随机森林, 特征选择, classification, cloud computing, MapReduce, Random Forest, feature selection

中文摘要：

针对当前大数据环境下随机森林分类算法在处理不平衡数据集分类任务时存在的小类样本被忽视及效率低的问题,提出了一种Hadoop环境下基于敏感度的随机森林分类算法.该算法引入了文本分类特征选择技术中的相关方法,采用MapReduce编程模型,在Hadoop云计算平台上实现了算法的并行化.通过实验对比分析了该算法与传统随机森林分类算法对不平衡数据的分类效果.结果表明,该算法显著提高了传统随机森林分类算法的性能,且具有高效性和易扩展性.

英文摘要：

When applied to deal with the imbalanced dataset classification task under the circumstance of big data,Random Forest classification algorithm always suffers from the neglect of minority class and inefficiency problem. A Random Forest classification algorithm based on Sensitivity Degree in Hadoop environment is proposed to solve the above-mentioned problems,which introduced the method from feature selection of text classification,and is parallelized by using MapReduce programming model in Hadoop cloud computing environment. Comparison was made through experiments in regard to the effect of the imbalanced dataset classification by this algorithm and by the traditional Random Forest classification algorithm. The experimental results show that this algorithm significantly improves the performance of the traditional Random Forest classification algorithm,and has high efficiency and ease of scalability.

同期刊论文项目

基于系统动力学的能源-经济-环境-人口可持续发展建模研究

期刊论文 9

同项目期刊论文

矿石体重取值方法对储量估算的影响——以某铁铜矿为例

基于光网络的深度学习算法研究

基于Hadoop的Dirichlet朴素贝叶斯文本分类算法

面向外包空间数据库的范围查询验证

矿山地质环境综合评价方法研究

能源系统动力学应用研究综述

呼和浩特3E系统协调发展研究

能源-经济-环境系统协调发展研究——以呼包银榆经济区为例

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679