福建农林大学计算机与信息学院,福州 350002
出版日期:
2018-01-25发布日期:
2018-03-06Two-Stage Stepwise Variable Selection Based on Random Forests
FENG Panfeng, WEN YongxianCollege of Computer and Information Sciences, Fujian Agriculture and Forestry University, Fuzhou 350002
Online:
2018-01-25Published:
2018-03-06摘要
图/表
参考文献
相关文章
编辑推荐
-->Metrics
本文评论
变量选择在高维数据处理中尤为重要,其中变量的重要性评级是关键问题.文章提出基于随机森林两阶段逐步变量选择算法.第一阶段提出变量重要性排序改进方法,目的进一步提高重要变量与噪声变量的区分度.第二阶段基于随机森林的逐步变量选择.通过模拟数据验证该方法的有效性和可行性.对水稻数据QTL定位进行实证研究,将基于两阶段随机森林逐步变量选择算法与SCAD、Elastic Net、传统QTL定位WinQTLcart2.5 软件的运行结果比较,发现基于随机森林两阶段逐步变量选择算法能有效筛选变量.
分享此文: