非平衡数据集的改进SMOTE再抽样算法
外文标题:An Improved SMOTE Algorithm for Re-Sampling Imbalanced Data Sets
文献类型:期刊
作者:薛薇[1]
机构:中国人民大学应用统计科学研究中心
年:2012
期刊名称:统计研究
卷:29
期:6
页码范围:95-98
增刊:增刊
收录情况:中文核心期刊要目总览
所属部门:统计学院
语言:中文
ISSN:1002-4565
链接地址:http://d.g.wanfangdata.com.cn/Periodical_tongjyj201206014.aspx
DOI:10.3969/j.issn.1002-4565.2012.06.014
关键词:SMOTE算法;再抽样;非平衡数据集
摘要:非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想.改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本.实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获得较理想的分类效果.
作者其他论文
网络舆论倾向性的动态跟踪方法及实证研究.薛薇;闫阳.统计与信息论坛.2013,28(1),81-87.
文本聚类中罚多项混合模型的特征选择及其在互联网舆情分析中的应用.薛薇;陈欢歌.统计与信息论坛.2012,27(1),9-14.
银行最终金融服务是否应课以增值税的理论述评.薛薇;李艳艳.经济纵横.2007,77-79.
养老金计划与个人所得税政策.薛薇.涉外税务.2007,22-27.
税收收入Granger因果和协整关系检验.薛薇;张曼.中央财经大学学报.2005,16-19.