位置:成果数据库 > 期刊 > 期刊详情页
一种近邻局部学习的稳健性分析
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学院自动化研究所复杂系统与智能科学重点实验室,北京100190
  • 相关基金:国家重点基础研究发展规划项目(No.2004CB318103)、国家自然科学基金项目(No.60573078)资助
中文摘要:

在统计推断中,稳健性是指实际问题的数据来源与我们的模型假定有偏离时,所采用算法的结果受到的扰动很小,并且保持算法的预测性能.本文将统计稳健性的研究方法引入机器学习中,分析得到近邻估计这种局部学习能够在大样本的情形下收敛到Bayes最优估计,同时收敛条件可说明近邻估计是稳健估计.在模拟数据和真实数据库上进行实验,结果表明在某些离群点影响模型的情况下,仍保持监督学习预测的泛化性能.

英文摘要:

Robustness in statistical inference means that the departure of real data from an assumed sample distribution has little influence on the results of the remarkable prediction performance of the algorithm. The research methods of statistical robustness are introduced into machine learning in this paper. The nearest neighbor estimation algorithm, a kind of local learning, can converge to Bayes optimal estimation in the case of large number of samples, and meanwhile the nearest neighbor estimation algorithm is a kind of robust algorithm under the convergent condition. Finally, experimental results on synthetic and real datasets demonstrate that the generalization performance of the nearest neighbor estimation algorithm can be guaranteed when the model is affected by some outliers.

同期刊论文项目
期刊论文 17 会议论文 6
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169