位置:成果数据库 > 期刊 > 期刊详情页
高维数据选元:方法比较及其在纳税评估中的应用
  • ISSN号:1003-1952
  • 期刊名称:管理评论
  • 时间:2013.8.8
  • 页码:10-20
  • 分类:F812.42[经济管理—财政学]
  • 作者机构:[1]中国人民大学商学院,北京100872, [2]江苏省盐城市国税局,盐城224001, [3]中国人民银行征信中心博士后科研工作站,北京100031, [4]中国科学院数学与系统科学研究院,北京100190
  • 相关基金:国家自然科学基金项目(71003100);教育部人文社会科学研究资助项目(11YJC630270);中央高校基本科研业务费专项资金项目(11XNK027;10XNF020).
  • 相关项目:中国纳税评估指标体系研究
中文摘要:

线性回归中当备选变元的个数(P)大于样本量(n),尤其当p〉〉n时,很多经典的统计推断可能失效。因此.高维数据分析技术的理论和实证探讨很有必要。本文讨论了高维数据分析面临的3种新问题.并介绍了SIS、LASSO等6种高维选元方法。模拟部分选用了5种评价准则比较了上述6种方法的选元效果,对比后发现p/n比率和选元效果是相关的:p/n比率较高时SIS的选元效果最好。而当p/n比率降低,特别是降低到p〈n的情形时,除平方根LASSO外的5种选元方法的选元效果趋近一致。在纳税评估中,行业细分一般会提高评估效果,但细分会使得备选变元的个数大于样本量.此时需要借助高维数据选元技术。本文使用SIS方法对某市13个细分行业的进项税额进行建模,研究结果表明SIS方法的选元效果显著。

英文摘要:

When the number of candidate predictor variables (p) is greater than the sample size (n) in linear regression, especially if p 〉〉n, a lot of classical statistical inference might be invalid. Therefore, it is necessary to do the theoretical and empirical research of high-dimensional data analysis techniques. This article discusses three new problems that would be encountered in high-dimensional data analysis, and introduced six variable selection methods such as SIS and LASSO. At the simulation part, five evaluation criteria are chosen to compare the variable selecting effect of the above six methods. After comparison, it is found that the p/n ratio is related to variable selecting effect: when the p/n ratio is high, the best method is SIS, and as the ratio reduces, especially as the p/n ratio satisfies the condition of p 〈n, the effects of the above five methods except the square-root LASSO are beginning to converge. In the tax assessment, industry segmentation will generally improve the effect of assessment, but the segmentation will cause the number of candidate predictor variables become greater than the sample size. So it is needed to resort to the variable selection techniques in high- dimensional data. In this paper the SIS method is employed to model the VAT input tax of 13 subdivided industries in one city. The results indicate that SIS method has the significant variable selecting effect.

同期刊论文项目
期刊论文 23 会议论文 1 著作 1
同项目期刊论文
期刊信息
  • 《管理评论》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院大学
  • 主编:吕本富
  • 地址:北京市中关村东路80号7号楼112室中国科学院大学经济与管理学院
  • 邮编:100190
  • 邮箱:mreview@gucas.ac.cn
  • 电话:010-82680674
  • 国际标准刊号:ISSN:1003-1952
  • 国内统一刊号:ISSN:11-5057/F
  • 邮发代号:82-395
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:15896