面向不平衡分类的固定半径最近邻逐步竞争算法(FRNNPC)
周鹏1,2,伊静1,3,朱振方4,刘培玉1,2*1.山东师范大学信息科学与工程学院, 山东 济南 250358;2.山东省分布式计算机软件新技术重点实验室, 山东 济南 250358;3.山东建筑大学计算机科学与技术学院, 山东 济南 250014;4.山东交通学院信息科学与电气工程学院, 山东 济南 250357
发布日期:
2019-03-19作者简介:
周鹏(1990— )男,硕士研究生,研究方向为网络信息全. E-mail:zhoucepan1990@163.com*通信作者简介:刘培玉(1960— )男,博士,教授,研究方向为网络信息安全. E-mail:1257639125@qq.com基金资助:
国家自然科学基金资助项目(61373148,61502151);教育部人文社科基金资助项目(14YJC860042);山东省自然科学基金资助项目(ZR2014FL010)Fixed-radius nearest neighbor progressive competition algorithm for imbalanced classification
ZHOU Peng1,2, YI Jing1,3, ZHU Zhen-fang4, LIU Pei-yu1,2*1. School of Information Science &
Engineering, Shandong Normal University, Jinan 250358, Shandong, China;
2. Shandong ProvincialKey Laboratory for Distributed Computer Software Novel Technology, Jinan 250358, Shandong, China;
3. School of Computer Science &
Technology, Shandong Jianzhu University, Jinan 250014, Shandong, China;
4. School of Information Science and Electric Engineering, Shandong Jiaotong University, Jinan 250357, Shandong, China
Published:
2019-03-19摘要/Abstract
摘要: 许多真实世界的数据集都存在一个称为类不平衡问题的问题。传统的分类算法在对不平衡数据进行分类时,容易导致少数类被错分。为了提高少数类样本的分类准确度,提出了一种基于固定半径最近邻的逐步竞争算法(FRNNPC),通过固定半径邻(FRNN)对数据集进行预处理,在全局范围内消除不必要的数据,在得到的候选数据中使用逐步竞争算法(NPC),即逐渐计算查询样本邻近样本的分值,直到一个类的分值总和高于另一个类。简而言之,该方法能够有效地处理不平衡问题,而且不需要任何手动设置的参数。实验结果将所提出的方法与4种代表性算法在10个不平衡数据集上进行了比较,并验证了该算法的有效性。
PDF全文下载地址:
http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3053