缺失数据插补方法探讨--基于最近邻插补法和关联规则法
外文标题:The Research of Missing Data Imputation Method:Based on Nearest Neighbor Imputation and Association Rules
文献类型:期刊
作者:于力超[1]
机构:中国人民大学 统计学院,北京,100872;中国人民大学 应用统计科学研究中心,北京,100872
年:2015
期刊名称:统计与信息论坛
卷:30
期:1
页码范围:35-39,40
增刊:增刊
收录情况:中文核心期刊要目总览
所属部门:统计学院
语言:中文
ISSN:1007-3116
链接地址:http://d.g.wanfangdata.com.cn/Periodical_tjyxxlt201501007.aspx
DOI:10.3969/j.issn.1007-3116.2015.01.007
人气指数:8
浏览次数:8
基金:全国统计科学研究重点项目《小微工业企业抽样调查问题研究》(2013LZ34);北京市社科基金重点项目《基于北京市地理分布的空间抽样设计研究》(14JGA022);北京市优博论文指导教师人文社科项目
关键词:关联规则;缺失数据;最近邻插补;加权距离
摘要:提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离进行加权处理,得到加权距离,再用加权距离最小的样本单元对应的属性值对缺失值进行插补。这种方法可以解决由不同最近距离样本单元得到不同插补值的问题,最后给出了该方法的实施步骤和应用范例。
作者其他论文
构建以科研为导向的博士生选拔和激励机制--基于博士生科研绩效测度和影响因素的分析.李艳丽;王俊;胡涛,等.学位与研究生教育.2014,43-46.
解决小域估计的一种新思路:样本外推.胡丹丹;金勇进;艾小青.调研世界.2014,44-46.
对我国人口普查数据质量评估的若干思考.陈培培;金勇进.现代管理科学.2014,3-5.
抽样调查中的权数问题研究.金勇进;张喆.统计研究.2014,31(9),79-84.
序贯抽样在计算机辅助电话调查中的应用.金勇进;王华.数理统计与管理.2006,25(6),649-654.