1(山西大学计算机与信息技术学院 太原 030006);2(计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006);3(山西大学数学科学学院 太原 030006) (gxq0079@sxu.edu.cn)
出版日期:
2021-11-01基金资助:
国家自然科学基金项目(61876103,61673249,U1805263,62006148);山西省重点研发计划项目(201903D421050);山西省1331工程项目Space Transformation Based Random Forest Algorithm
Guan Xiaoqiang1, Wang Wenjian1,2, Pang Jifang1, Meng Yinfeng31(School of Computer and Information Technology, Shanxi University, Taiyuan 030006);2(Key Laboratory of Computational Intelligence and Chinese Information Processing (Shanxi University), Ministry of Education, Taiyuan 030006);3(School of Mathematical Sciences, Shanxi University, Taiyuan 030006)
Online:
2021-11-01Supported by:
This work was supported by the National Natural Science Foundation of China (61876103, 61673249, U1805263, 62006148), the Key Research and Development Program of Shanxi Province (201903D421050), and the 1331 Engineering Project of Shanxi Province.摘要/Abstract
摘要: 随机森林是机器学习领域中一种常用的分类算法,具有适用范围广且不易过拟合等优点.为了提高随机森林处理多分类问题的能力,提出一种基于空间变换的随机森林算法(space transformation based random forest algorithm, ST-RF).首先,给出一种考虑优先类别的线性判别分析方法(priority class based linear discriminant analysis, PCLDA),利用针对优先类别的投影矩阵对样本进行空间变换,以增强优先类别样本与其他类别样本的区分效果.进而,将PCLDA方法引入随机森林构建过程中,在为每棵决策树随机选择一个优先类别保证随机森林多样性的基础上,利用PCLDA方法创建侧重于不同优先类别的决策树,以提高单棵决策树的分类准确性,从而实现集成模型整体分类性能的有效提升.最后,在10个标准数据集上对ST-RF算法与7种典型随机森林算法进行比较分析,验证所提算法的有效性,并将基于PCLDA的空间变换策略应用到对比算法中,对改进前后的算法性能进行比较分析.实验结果表明:ST-RF算法在处理多分类问题方面具有明显优势,所提出的空间变换策略具有较强的普适性,可以显著提升原算法的分类性能.
参考文献
相关文章 15
[1] | 张文钧, 蒋良孝, 张欢, 陈龙. 一种双层贝叶斯模型:随机森林朴素贝叶斯[J]. 计算机研究与发展, 2021, 58(9): 2040-2051. |
[2] | 廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538. |
[3] | 吴志军, 张入丹, 岳猛. 一种联合检测命名数据网络中攻击的方法[J]. 计算机研究与发展, 2021, 58(3): 569-582. |
[4] | 王继娜, 陈军华, 高建华. 基于排序损失的ECC多标签代码异味检测方法[J]. 计算机研究与发展, 2021, 58(1): 178-188. |
[5] | 张云洁, 张璇, 王旭, 任峻民, 唐子淇. 基于边际贡献的需求变更技术债务量化评估[J]. 计算机研究与发展, 2021, 58(1): 208-223. |
[6] | 张晓阳,许佳豪,胡燏翀. 云存储系统中的预测式局部修复码[J]. 计算机研究与发展, 2019, 56(9): 1988-2000. |
[7] | 任家东,刘新倩,王倩,何海涛,赵小林. 基于KNN离群点检测和随机森林的多层入侵检测方法[J]. 计算机研究与发展, 2019, 56(3): 566-575. |
[8] | 杨妮亚,彭涛,刘露. 基于聚类和决策树的链路预测方法[J]. 计算机研究与发展, 2017, 54(8): 1795-1803. |
[9] | 许行,王文剑,任丽芳. 一种基于决策森林的单调分类方法[J]. 计算机研究与发展, 2017, 54(7): 1477-1487. |
[10] | 朱琛刚,程光,胡一非,王玉祥. 基于流行度预测的互联网+电视节目缓存调度算法[J]. 计算机研究与发展, 2016, 53(4): 742-751. |
[11] | 崔振,山世光,陈熙霖. 结构化稀疏线性判别分析[J]. 计算机研究与发展, 2014, 51(10): 2295-2301. |
[12] | 陈达遥 陈秀宏 董昌剑. 基于零空间核判别分析的人脸识别[J]. 计算机研究与发展, 2013, 50(9): 1924-1932. |
[13] | 佘俏俏 俞 扬 姜 远 周志华. 一种基于标记传播的大规模图像分类方法[J]. , 2012, 49(11): 2289-2295. |
[14] | 邓小鹏, 邢春晓, 张 勇, 蔡莲红,. 一种面向QoS的Web服务组测试方法TF[J]. , 2009, 46(8): 1285-1293. |
[15] | 翟俊海, 王熙照, 张素芳,. 基于模糊积分的多模糊决策树融合[J]. , 2009, 46(3): 470-477. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4530