大数据下Leverage重要性抽样方法的稳健改进
外文标题:Robust Modification of Leverage Importance Sampling for Big Data
文献类型:期刊
作者:秦磊[1]
机构:[1]对外经济贸易大学统计学院
[2]对外经济贸易大学统计学院
[3]中国人民大学统计学院
年:2016
期刊名称:统计研究
卷:33
期:8
页码范围:101-105
增刊:正刊
收录情况:中文核心期刊要目总览
所属部门:统计学院
语言:中文
ISSN:1002-4565
链接地址:http://d.g.wanfangdata.com.cn/Periodical_tongjyj201608013.aspx
DOI:10.19343/j.cnki.11-1302/c.2016.08.013
人气指数:1
浏览次数:1
基金:对外经济贸易大学学科建设专项经费“大数据下Leverage重要性抽样方法的稳健改进”; 对外经济贸易大学中央高校基本科研业务费专项资金资助“高维成分数据的稀硫分类算法及应用”; 对外经济贸易大学中国企业“走出去”协同创新中心科研项目“大数据与投资选点”
关键词:大数据;重要性抽样;异质性问题;协方差矩阵
摘要:大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题.本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行回归估计,还规避了方差大和异质性导致协方差矩阵估计不准的问题.模拟数据的分析显示,相比于Ma (2015)的方法,本文提出的方法具有更为优良的估计结果.
作者其他论文
基于分位回归的国家形象影响因素分析.李泽昱;苏宇楠;田茂再.统计研究.2014,31(8),59-65.
负二项抽样下需处理数置信区间构造方法的改进.舒焕;封达道;田茂再.系统科学与数学.2012,32(9),1047-1056.
逆抽样下流行病发病率的逼近与渐近置信区间.田茂再;吴喜之;李远,等.系统科学与数学.2008,28(5),513-523.
条件分位中的分层线性回归模型.田茂再;陈歌迈.中国科学A辑.2006,36(10),1103-1118.
关于纵向数据分析方法的比较研究.陈彦靓;田茂再.统计与决策.2013,23-26.