删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于随机森林算法的两阶段变量选择研究

本站小编 Free考研考试/2021-12-27

冯盼峰,温永仙
福建农林大学计算机与信息学院,福州 350002
出版日期:2018-01-25发布日期:2018-03-06




Two-Stage Stepwise Variable Selection Based on Random Forests

FENG Panfeng, WEN Yongxian
College of Computer and Information Sciences, Fujian Agriculture and Forestry University, Fuzhou 350002
Online:2018-01-25Published:2018-03-06







摘要



编辑推荐
-->


变量选择在高维数据处理中尤为重要,其中变量的重要性评级是关键问题.文章提出基于随机森林两阶段逐步变量选择算法.第一阶段提出变量重要性排序改进方法,目的进一步提高重要变量与噪声变量的区分度.第二阶段基于随机森林的逐步变量选择.通过模拟数据验证该方法的有效性和可行性.对水稻数据QTL定位进行实证研究,将基于两阶段随机森林逐步变量选择算法与SCAD、Elastic Net、传统QTL定位WinQTLcart2.5 软件的运行结果比较,发现基于随机森林两阶段逐步变量选择算法能有效筛选变量.

分享此文:


()


[1]闫懋博,田茂再. 多种分布下选择后变量显著性分析及其在CEPS数据中的应用[J]. 系统科学与数学, 2020, 40(1): 141-155.
[2]林鹏. 一般线性混合效应模型的随机效应选择研究[J]. 系统科学与数学, 2015, 35(6): 617-626.

-->

PDF全文下载地址:

http://sysmath.com/jweb_xtkxysx/CN/article/downloadArticleFile.do?attachType=PDF&id=13325
相关话题/数据 数学 科学 系统 信息学院