高维数据选元:方法比较及其在纳税评估中的应用
外文标题:Variable Selection in High-dimensional Data: Method Comparison and its Application in Tax Assessment
文献类型:期刊
作者:吴武清[1]
机构:[1]中国人民大学商学院
[2]江苏省盐城市国税局
[3]中国人民银行征信中心博士后科研工作站
[4]中国科学院数学与系统科学研究院
年:2013
期刊名称:管理评论
卷:25
期:8
页码范围:10-20
增刊:正刊
收录情况:中文核心期刊要目总览
所属部门:商学院
语言:中文
ISSN:1003-1952
链接地址:http://d.g.wanfangdata.com.cn/Periodical_glpl201308002.aspx
人气指数:1
浏览次数:1
基金:国家自然科学基金项目; 教育部人文社会科学研究资助项目; 中央高校基本科研业务费专项资金项目
关键词:高维数据;降维;选元方法;SIS;LASSO
摘要:线性回归中当备选变元的个数(p)大于样本量(n),尤其当p>>n时,很多经典的统计推断可能失效.因此,高维数据分析技术的理论和实证探讨很有必要.本文讨论了高维数据分析面临的3种新问题,并介绍了SIS、LASSO等6种高维选元方法.模拟部分选用了5种评价准则比较了上述6种方法的选元效果,对比后发现p/n比率和选元效果是相关的:p/n比率较高时SIS的选元效果最好,而当p/n比率降低,特别是降低到p<n的情形时,除平方根LASSO外的5种选元方法的选元效果趋近一致.在纳税评估中,行业细分一般会提高评估效果,但细分会使得备选变元的个数大于样本量,此时需要借助高维数据选元技术.本文使用SIS方法对某市13个细分行业的进项税额进行建模,研究结果表明SIS方法的选元效果显薯.
作者其他论文
中国进口和出口的相依性:时变相关系数方法.吴武清;毛志杰;李楠,等.管理工程学报.2014,28(1),81-88.
新的指数跟踪方法及其应用.蒋勇;温琪;吴武清,等.数理统计与管理.2014,33(3),508-518.
稀释效应,非参数修正和中国股本权证的定价.樊鹏英;吴武清;李楠,等.数理统计与管理.2014,33(2),371-380.
股指期货的价格发现机制:基于结构变点分析框架.蒋勇;王国长;吴武清.财经科学.2014,52-62.
论儒家文化的思想政治教育价值.陈敏;鲁力.理论学刊.2015,118-124.