机器学习中的特征选择方法研究及展望
崔鸿雁1,2,3, 徐帅1,2,3, 张利锋1,2,3, Roy E. Welsch4, Berthold K. P. Horn51. 北京邮电大学 网络与交换技术国家重点实验室, 北京 100876;
2. 北京邮电大学 网络体系构建与融合北京市重点实验室, 北京 100876;
3. 先进信息网络北京实验室, 北京 100876;
4. Sloan School of Management, Massachusetts Institute of Technology, MA 02139, USA;
5. Csail Laboratory, Massachusetts Institute of Technology, MA 02139, USA
收稿日期:
2017-07-20出版日期:
2018-02-28发布日期:
2018-01-04作者简介:
崔鸿雁(1977-),女,博士生导师,E-mail:cuihy@bupt.edu.cn.基金资助:
教育部-中国移动科研基金项目(MCM20170306)The Key Techniques and Future Vision of Feature Selection in Machine Learning
CUI Hong-yan1,2,3, XU Shuai1,2,3, ZHANG Li-feng1,2,3, Roy E. Welsch4, Berthold K. P. Horn51. State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Key Laboratory of Network System Architecture and Convergence, Beijing University of Posts and Telecommunications, Beijing 100876, China;
3. Beijing Laboratory of Advanced Information Networks, Beijing 100876, China;
4. Sloan School of Management, Massachusetts Institute of Technology, MA 02139, USA;
5. Csail Laboratory, Massachusetts Institute of Technology, MA 02139, USA
Received:
2017-07-20Online:
2018-02-28Published:
2018-01-04摘要/Abstract
摘要: 任何领域的大数据研究都离不开用机器学习方法提取特征.为了探求满足海量大数据分析需求的特征选择方法,笔者对利用机器学习进行特征选择的常用方法做了深入分析,归纳总结出特征选择的五大类方法:相关性度量方法、Lasso稀疏选择方法、集成方法、神经网络方法、主成分分析方法.通过对比不同特征选择方法的原理、实现过程以及应用场景,给出了不同算法下进行特征选择时的适用范围、优缺点和关键点,为研究者提供参考.
中图分类号:
TN929.53
引用本文
崔鸿雁, 徐帅, 张利锋, Roy E. Welsch, Berthold K. P. Horn. 机器学习中的特征选择方法研究及展望[J]. 北京邮电大学学报, 2018, 41(1): 1-12.
CUI Hong-yan, XU Shuai, ZHANG Li-feng, Roy E. Welsch, Berthold K. P. Horn. The Key Techniques and Future Vision of Feature Selection in Machine Learning[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2018, 41(1): 1-12.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3148