一种基于深度属性加权的数据流自适应集成分类算法
李尧(),王志海*(),孙艳歌,张伟北京交通大学计算机与信息技术学院, 北京 100044
收稿日期:
2018-05-25出版日期:
2018-12-20发布日期:
2018-12-26通讯作者:
王志海E-mail:16120396@bjtu.edu.cn;zhhwang@bjtu.edu.cn作者简介:
李尧(1993—),男,安徽黄山人,硕士研究生,主要研究方向为数据挖掘和机器学习.E-mail:基金资助:
北京市自然科学基金(4182052);国家自然科学基金(61672086);国家自然科学基金(61702030);国家自然科学基金(61771058)An adaptive ensemble classification method based on deep attribute weighting for data stream
Yao LI(),Zhihai WANG*(),Yan′ge SUN,Wei ZHANGSchool of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
Received:
2018-05-25Online:
2018-12-20Published:
2018-12-26Contact:
Zhihai WANG E-mail:16120396@bjtu.edu.cn;zhhwang@bjtu.edu.cnSupported by:
北京市自然科学基金(4182052);国家自然科学基金(61672086);国家自然科学基金(61702030);国家自然科学基金(61771058)摘要/Abstract
摘要: 针对现有的大多数数据流集成分类算法对分类器的评估时未考虑历史数据的重要性,同时忽略对无关属性和噪声属性干扰的处理等问题,提出一种基于深度属性加权的数据流自适应集成分类算法,旨在有效组合多个基于深度属性加权的朴素贝叶斯模型。通过在不同数据块中深入分析不同属性取值对类属性归属的贡献,并将学习到的局部属性权重作用于不同的属性取值,以降低噪声数据干扰。在评价基分类器时,权衡历史数据和当前最新数据的重要性;采用基于测试实例的分类器置信度和分类正确率权重的组合投票策略进行子分类器组合以提高整体分类性能。通过在多个基准数据集上与经典算法对比试验,本研究算法在分类正确率和概念漂移适应性上具有一定优势。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1773