删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于时序窗口的概念漂移类别检测

本站小编 Free考研考试/2022-01-01

郭虎升1,2,任巧燕1,王文剑1,2
1(山西大学计算机与信息技术学院 太原 030006);2(计算智能与中文信息处理教育部重点实验室(山西大学) 太原 030006) (guohusheng@sxu.edu.cn)
出版日期: 2022-01-01


基金资助:国家自然科学基金项目(61503229,U1805263,62076154);山西省自然科学基金项目(201901D111033);山西省重点研发计划项目(国际合作)(201903D421050) 62076154), the Natural Science Foundation of Shanxi Province (201901D111033), and the Key Research and Development Program of Shanxi Province (International Cooperation) (201903D421050).

Concept Drift Class Detection Based on Time Window

Guo Husheng1,2, Ren Qiaoyan1, Wang Wenjian1,2
1(School of Computer and Information Technology, Shanxi University, Taiyuan 030006);2(Key Laboratory of Computational Intelligence and Chinese Information Processing(Shanxi University), Ministry of Education, Taiyuan 030006)
Online: 2022-01-01


Supported by:This work was supported by the National Natural Science Foundation of China (61503229, U1805263,




摘要/Abstract


摘要: 流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window, CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能.






[1]张炳, 文峥, 魏筱瑜, 任家东. InterDroid:面向概念漂移的可解释性Android恶意软件检测方法[J]. 计算机研究与发展, 2021, 58(11): 2456-2474.
[2]程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682.
[3]季一木,张永潘,郎贤波,张殿超,王汝传. 面向流数据的决策树分类算法并行化[J]. 计算机研究与发展, 2017, 54(9): 1945-1957.
[4]吴英杰,张立群,康健,王一蕾. 差分隐私流数据自适应发布算法[J]. 计算机研究与发展, 2017, 54(12): 2805-2817.
[5]文益民,唐诗淇,冯超,高凯. 基于在线迁移学习的重现概念漂移数据流分类[J]. 计算机研究与发展, 2016, 53(8): 1781-1791.
[6]邓大勇,苗夺谦,黄厚宽. 信息表中概念漂移与不确定性分析[J]. 计算机研究与发展, 2016, 53(11): 2607-2612.
[7]李志杰,李元香,王峰,何国良,匡立. 面向大数据分析的在线学习算法综述[J]. 计算机研究与发展, 2015, 52(8): 1707-1721.
[8]邓大勇,徐小玉,黄厚宽. 基于并行约简的概念漂移探测[J]. 计算机研究与发展, 2015, 52(5): 1071-1079.
[9]郭躬德 李 南 陈黎飞. 一种基于混合模型的数据流概念漂移检测算法[J]. 计算机研究与发展, 2014, 51(4): 731-742.
[10]许敏,邓赵红,王士同,史荧中. MMCKDE:基于数据流的m-混合聚类核概率密度估计[J]. 计算机研究与发展, 2014, 51(10): 2277-2294.
[11]吴佩莉, 刘奎恩, 郝身刚, 张全新, 谭毓安,. 基于浮动车数据的快速交通拥堵监控[J]. 计算机研究与发展, 2014, 51(1): 189-198.
[12]辛轶, 郭躬德, 陈黎飞, 毕亚新,. IKnnM-DHecoc:一种解决概念漂移问题的方法[J]. , 2011, 48(4): 592-601.
[13]王 涛, 李舟军, 颜跃进, 陈火旺,. 数据流挖掘分类技术综述[J]. , 2007, 44(11): 1809-1815.
[14]刘学军, 徐宏炳, 董逸生, 王永利, 钱江波,. 挖掘数据流中的频繁模式[J]. , 2005, 42(12): 2192-2198.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4563
相关话题/数据 计算机 山西大学 信息 中文

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于属性分割的高维二值数据差分隐私发布
    洪金鑫1,吴英杰1,蔡剑平2,孙岚11(福州大学数学与计算机科学学院福州350108);2(厦门华厦学院信息与智能机电工程学院福建厦门361024)(fzu_hjx@163.com)出版日期:2022-01-01基金资助:福建省自然科学基金项目(2017J01754,2018J01797)Diffe ...
    本站小编 Free考研考试 2022-01-01
  • 融合上下文信息的篇章级事件时序关系抽取方法
    王俊1,3,史存会1,3,张瑾2,俞晓明1,刘悦1,程学旗2,31(中国科学院计算技术研究所数据智能系统研究中心北京100190);2(中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所)北京100190);3(中国科学院大学北京100049)(wyswangjun@163.com)出 ...
    本站小编 Free考研考试 2022-01-01
  • 基于滑动窗口模型的数据流闭合高效用项集挖掘
    程浩东,韩萌,张妮,李小娟,王乐(北方民族大学计算机科学与工程学院银川750021)(734811467@qq.com)出版日期:2021-11-01基金资助:国家自然科学基金项目(62062004);宁夏自然科学基金项目(2020AAC03216);北方民族大学研究生创新项目(YCX20077)C ...
    本站小编 Free考研考试 2022-01-01
  • 区块链数据隐私保护:研究现状与展望
    王晨旭1,3,程加成1,桑新欣1,李国栋2,管晓宏31(西安交通大学软件学院西安710049);2(西安交通大学网络信息中心西安710049);3(智能网络与网络安全教育部重点实验室(西安交通大学)西安710049)(cxwang@mail.xjtu.edu.cn)出版日期:2021-10-01基金 ...
    本站小编 Free考研考试 2022-01-01
  • 面向超导量子计算机的程序映射技术研究
    窦星磊,刘磊,陈岳涛(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院计算技术研究所北京100190)(liulei2010@ict.ac.cn)出版日期:2021-09-01基金资助:国家自然科学基金项目(62072432,61502452)AnInvesti ...
    本站小编 Free考研考试 2022-01-01
  • 量子假设检验互信息
    张淑仪,席政军(陕西师范大学计算机科学学院西安710062)(zsy18@snnu.edu.cn)出版日期:2021-09-01基金资助:国家自然科学基金项目(61671280);中央高校基本科研业务费专项资金(GK201902007);陕西师范大学优秀学术青年骨干项目(16QNGG013)Quan ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度学习的数据库自然语言接口综述
    潘璇1,3,徐思涵1,3,蔡祥睿2,3,温延龙1,3,袁晓洁2,31(南开大学计算机学院天津300350);2(南开大学网络空间安全学院天津300350);3(天津市网络与数据安全技术重点实验室(南开大学)天津300350)(panxuan@dbis.nankai.edu.cn)出版日期:2021- ...
    本站小编 Free考研考试 2022-01-01
  • 基于K阶互信息估计的位置感知网络表征学习
    储晓恺1,2,范鑫鑫2,毕经平21(中国科学院大学北京100049);2(中国科学院计算技术研究所北京100190)(chuxiaokai@ict.ac.cn)出版日期:2021-08-01基金资助:国家自然科学基金项目(62077044,61702470,62002343)Position-Awa ...
    本站小编 Free考研考试 2022-01-01
  • 基于融合多尺度标记信息的深度交互式图像分割
    丁宗元1,孙权森1,王涛1,王洪元21(南京理工大学计算机科学与技术学院南京210094);2(常州大学计算机与人工智能学院江苏常州213164)(dzyha2011@163.com)出版日期:2021-08-01基金资助:国家自然科学基金项目(61802188,61673220,61976028) ...
    本站小编 Free考研考试 2022-01-01
  • 虚假信息检测专题前言
    出版日期:2021-07-01Online:2021-07-01摘要/Abstract摘要:虚假信息检测旨在综合应用自然语言处理、社交挖掘、跨模态分析等智能处理手段,发现并利用信息的内在特征、产生机理与传播规律,为以假新闻为代表的虚假、伪造信息的识别与干预提供理论和技术支持.《Science》在20 ...
    本站小编 Free考研考试 2022-01-01