位置:成果数据库 > 期刊 > 期刊详情页
C5.0算法的改进及应用
  • ISSN号:1006-0456
  • 期刊名称:《南昌大学学报:工科版》
  • 时间:0
  • 分类:TP183[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:南昌大学信息工程学院,江西南昌330031
  • 相关基金:国际自然科学基金资助项目(61070139,81460769)
中文摘要:

C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。

英文摘要:

C5. 0 algorithm is a classification method with intuitive and efficient,and has problems like information gain rate calculation is complex,prone to over-fitting and decision tree bias. Aiming to solve these problems,a new improved C5. 0 algorithm was proposed in this paper,which by converting formulas to simplify the calculation procedure of information gain rate,pruning judgment through using a combination of loss matrix and a confidence interval,and adjusting the weights of the established models. It was applied to the prediction of overdue credit. Finally,conduct an experiment in borrower's historical repayment data,and compared it with other algorithms. The results showed that the improved C5. 0 algorithm has higher accuracy and efficiency than other algorithms.

同期刊论文项目
期刊论文 33 会议论文 4
同项目期刊论文
期刊信息
  • 《南昌大学学报:工科版》
  • 中国科技核心期刊
  • 主管单位:南昌大学
  • 主办单位:南昌大学
  • 主编:谢明勇
  • 地址:南昌市南京东路235号南昌大学期刊社
  • 邮编:330047
  • 邮箱:NCDG@chinajournal.net.cn
  • 电话:0791-88305803
  • 国际标准刊号:ISSN:1006-0456
  • 国内统一刊号:ISSN:36-1194/T
  • 邮发代号:44-38
  • 获奖情况:
  • 曾获首届江西省优秀期刊质量奖,第二届江西省优秀科技期刊评比先进科技期刊奖,第三届江西省优秀期刊版式设计奖
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊
  • 被引量:4072