删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于杠杆值大数据集抽样的异常点诊断

中国人民大学 辅仁网/2017-07-05

文献详情
基于杠杆值大数据集抽样的异常点诊断
外文标题:Outliers Diagnosis in Big Data Leveraging Sampling
文献类型:期刊
作者:晏振[1]戴晓文[2]田茂再[3]
机构:[1]广西师范大学数学与统计学院,广西桂林541004;中国人民大学应用统计科学研究中心,统计学院,北京100872
[2]中国人民大学应用统计科学研究中心,统计学院,北京100872
[3]中国人民大学应用统计科学研究中心,统计学院,北京100872;兰州财经大学统计学院,甘肃兰州730020;新疆财经大学统计与信息学院,新疆乌鲁木齐830001

年:2016
期刊名称:数理统计与管理
卷:35
期:5
页码范围:794-802
增刊:正刊
收录情况:中文核心期刊要目总览中国科技核心期刊CSSCI(11F0582016050005)
所属部门:统计学院
语言:中文
ISSN:1002-1566
链接地址:http://d.g.wanfangdata.com.cn/Periodical_sltjygl201605005.aspx
DOI:10.13860/j.cnki.sltj.20160922-021
基金:国家自然科学基金(11271368,11261009)/教育部高等学校博士学科点专项科研基金(20130004110007)/国家社会科学基金重点项目(13AZD064)/北京市社会科学基金重大项目(15ZDAl7)/兰州商学院“飞天学者特聘计划”
关键词:大数据;杠杆值;异常点;不等概抽样;最小二乘估计
摘要:本文主要研究大数据集下利用杠杆值抽样后的异常点诊断问题.首先讨论了数据删除模型中参数估计的统计性质,构造了四种异常点诊断统计量;其次,根据均值漂移模型的漂移参数的假设检验问题,构造了三种检验统计量;最后,通过模拟和实证数据分析结果得出本文的结论—异常点诊断对于基于杠杆值的大数据集抽样估计起到重要的影响作用.
作者其他论文



基于分位回归的国家形象影响因素分析.李泽昱;苏宇楠;田茂再.统计研究.2014,31(8),59-65.
混合空间自回归模型的异常值检验.金立斌;戴晓文;石磊.统计与决策.2015,12-16.
负二项抽样下需处理数置信区间构造方法的改进.舒焕;封达道;田茂再.系统科学与数学.2012,32(9),1047-1056.
逆抽样下流行病发病率的逼近与渐近置信区间.田茂再;吴喜之;李远,等.系统科学与数学.2008,28(5),513-523.
条件分位中的分层线性回归模型.田茂再;陈歌迈.中国科学A辑.2006,36(10),1103-1118.

相关话题/统计 统计学院 科学 数据 检验