基于最大相关信息系数的FCBF特征选择算法
张俐, 袁玉宇, 王枞北京邮电大学 可信分布式计算与服务教育部重点实验室, 北京 100876
收稿日期:
2017-12-05出版日期:
2018-08-28发布日期:
2018-10-09作者简介:
张俐(1977-),男,博士生,E-mail:zhangli_3913@163.com;袁玉宇(1971-),教授,博士生导师.基金资助:
国家科技基础性工作专项项目(2015FY111700-6)FCBF Feature Selection Algorithm Based on Maximum Information Coefficient
ZHANG Li, YUAN Yu-yu, WANG CongKey Laboratory of Trustworthy Distributed Computing and Service(Ministry of Education), Beijing University of Posts and Telecommunications, Beijing 100876, China
Received:
2017-12-05Online:
2018-08-28Published:
2018-10-09摘要/Abstract
摘要: 在相关性快速过滤特征选择算法(FCBF)基础上,通过最大相关系数的方式改进FCBF算法.首先,通过最大相关系数和对称不确定性度量准则,计算出每个特征与标签之间的相关度量值,并按照数值大小顺序进行排序;其次,通过最大相关系数和近似马尔可夫毯原理进行无关特征和冗余特征的筛选,最终选择出最优特征子集.在加利福尼亚大学欧文分校的机器学习库(UCI)的8个公开数据集中进行对比实验结果表明基于最大相关系数的特征选择算法(NFCBF)总体优于FCBF算法,它所选择出特征数比FCBF算法所选择特征数平均少了3.625个,分类准确率平均提高了0.075%.与互信息最大算法(MIM)、最少的绝对收缩和选择算法(Lasso)和岭算法(Ridge)等相比也具有明显的优势.
中图分类号:
TP181
引用本文
张俐, 袁玉宇, 王枞. 基于最大相关信息系数的FCBF特征选择算法[J]. 北京邮电大学学报, 2018, 41(4): 86-90.
ZHANG Li, YUAN Yu-yu, WANG Cong. FCBF Feature Selection Algorithm Based on Maximum Information Coefficient[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2018, 41(4): 86-90.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3201