位置:成果数据库 > 期刊 > 期刊详情页
基于非参数密度估计的异常点诊断方法
  • ISSN号:1000-0984
  • 期刊名称:《数学的实践与认识》
  • 时间:0
  • 分类:O212.7[理学—概率论与数理统计;理学—数学]
  • 作者机构:[1]中国人民大学商学院,北京100872, [2]中国人民银行征信中心,北京100031, [3]中国科学院数学与系统科学研究院,北京100190
  • 相关基金:国家自然科学基金(71003100);教育部人文社会科学研究一般项目(11YJC630270);中央高校基本科研业务费专项资金(11XNK027,10XNF020).
中文摘要:

异常点诊断是统计学中的经典问题.发现并减少异常点对纳税评估数据分析的影响是一项很有意义的研究.然而,通常的异常点诊断一般采用适用于单峰分布的全局识别方法.借鉴局部域相关积分(Local correlation integral)理论,提出基于非参数密度估计的识别方法.方法适用于多峰分布,能识别局域性质的异常点,对异常点占比较高的样本也有较强的识别能力.基于某市10920个企业样本,实证分析对比研究了税务局目前使用的和建议的纳税评估方法,结果表明税务局采用的方法有较大的纳税评估风险(误判风险).

英文摘要:

Outlier detection is a classical problem in statistics. It is a very meaningful research to find and reduce the effects on analysis of outlier on tax assessment data. However, the former outlier diagnosis generally applied the global recognition method which suits for the unimodal distribution. This paper adopts the theory of local correlation integral and proposes the detection method based on nonparametric density estimation. This method suits for the multimodal distribution, can detect the local outliner, and have strong recognition ability about the sample which has the high proportion of outliner. Based on the samples of 10920 enterprises, the empirical analysis compares the tax assessment 'methods used by Tax Bureau currently and proposed by this paper, and the result shows the method used by Tax Bureau has great risk of tax assessment (the misjudged risk).

同期刊论文项目
期刊论文 23 会议论文 1 著作 1
同项目期刊论文
期刊信息
  • 《数学的实践与认识》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院数学与系统科学研究院
  • 主编:林群
  • 地址:北京大学数学科学学院
  • 邮编:100871
  • 邮箱:bjmath@math.pku.edu.cn
  • 电话:010-62759981
  • 国际标准刊号:ISSN:1000-0984
  • 国内统一刊号:ISSN:11-2018/O1
  • 邮发代号:2-809
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:22973