删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

融合选择提取与子类聚类的快速Shapelet发现算法

本站小编 Free考研考试/2022-01-02

摘要:基于Shapelet的时间序列分类算法具有可解释性,且分类准确率高、分类速度快.在这些算法中,Shapelet学习算法不依赖于单一分类器,能够学习出不在原始时间序列中的Shapelet,可以取得较高的分类准确率,同时还可以保证Shapelet发现和分类器构建同时完成;但如果产生的Shapelet过多,会增加依赖参数,导致训练时间太长,分类速度低,动态更新困难,且相似重复的Shapelet会降低分类的可解释性.提出一种选择性提取方法,用于更精准地选择Shapelet候选集,并改变学习方法以加速Shapelet学习过程;方法中提出了两个优化策略,通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的Shapelet,同时在选择性提取算法中加入投票机制,以解决产生Shapelet过多的问题.实验表明,该算法在保持较高准确率的同时,可以显著地提高训练速度.



Abstract:The time series classification algorithm based on Shapelet has the characteristics of interpretability, high classifica-tion accuracy and fast classification speed. Among these Shapelet-based algorithms, learning Shapelet algorithm does not rely on a single classifier, and Shapelet that is not in the original time series can be learned, which can achieve a high classification accuracy and ensure that Shapelet discovery and classifier construction are completed at the same time. However, if too many Shapelets are generated, it will increase the dependent parameters, resulting in too long training time, low classification speed, and difficult dynamic updates. And similar redundancy Shapelets will reduce the interpretability of the classification. This study proposes a new selective extraction algorithm to select Shapelet candidate set and change the learning method to accelerate the learning process of Shapelet and puts forward two optimization strategies. By using time series clustering for the original training set, Shapelets not in the original time series can be obtained. Meanwhile, a voting mechanism is added into the selective extraction algorithm to solve the problem of excessive Shapelet generation. Experiments show that the proposed algorithm can improve the training speed while maintaining high accuracy.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5912
相关话题/序列 优化 过程 实验 算法

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 融合显式反馈与隐式反馈的协同过滤推荐算法
    摘要:显式反馈与隐式反馈相结合,可以有效提升推荐性能.但是现有的融合显式反馈与隐式反馈的推荐系统存在未能发挥隐式反馈数据缺失值反映用户隐藏偏好的能力,或者未能保留显式反馈数据反映用户偏好程度的能力的局限性.为了解决这个问题,提出了一种融合显式反馈与隐式反馈的协同过滤推荐算法.该算法分为两个阶段:第1 ...
    本站小编 Free考研考试 2022-01-02
  • 基于注意力机制的规范化矩阵分解推荐算法
    摘要:近年来,矩阵分解(MF)技术因其有效性和简便性在推荐系统中得到广泛应用.但是,数据稀疏和冷启动问题导致MF学习到的用户特征向量不能准确地代表用户的偏好以及反映用户间的相似关系,影响了模型的性能.为了解决该问题,规范化矩阵分解(RMF)技术引起了研究者的关注.挖掘用户间可靠的相似关系,是RMF需 ...
    本站小编 Free考研考试 2022-01-02
  • 集成偏好的高维多目标最优软件产品选择算法
    摘要:在基于搜索的软件工程研究领域,高维多目标最优软件产品选择问题是当前的一个研究热点.既往工作主要采用后验方式(即先搜索再选择)处理软件工程师或终端用户的偏好.与此不同,将用户偏好集成于优化过程,提出了一种新算法以定向搜索用户最感兴趣的软件产品.在算法中,运用权向量表达用户偏好,采用成就标量化函数 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于分解和协同的高维多目标进化算法
    摘要:现实中大量存在的高维多目标优化问题对以往高效的多目标进化算法提出了严峻的挑战.通过将分解策略和协同策略相结合提出一种高维多目标进化算法MaOEA/DCE.该算法利用混合水平正交实验方法在聚合系数空间产生一组均匀分布的权重向量以改善初始种群的分布性;其次,算法将差分进化算子和自适应SBX算子进行 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于协同上下文关系学习的同城活动推荐算法
    摘要:新兴的基于活动的社交网络以活动为核心,结合线上关系与线下活动促进用户真实、有效的社交关系的形成,但过多的活动信息会使用户难以分辨和选择.结合上下文进行个性化同城活动推荐,是解决活动信息过载问题的一种有效手段.然而大部分现有的同城活动推荐算法都是从用户参与活动记录中间接统计用户对上下文信息的偏好 ...
    本站小编 Free考研考试 2022-01-02
  • 基于符号语义的不完整数据聚集查询处理算法
    摘要:研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义中扩展了传统关系数据库模型,提出了一种通用不完整数据库模型.该模型可以处 ...
    本站小编 Free考研考试 2022-01-02
  • 基于低密度分割几何距离的半监督KFDA算法
    摘要:提出了一种基于低密度分割几何距离的半监督KFDA(kernelFisherdiscriminantanalysis)算法(semisupervisedKFDAbasedonlowdensityseparationgeometrydistance,简称SemiGKFDA).该算法以低密度分割几何 ...
    本站小编 Free考研考试 2022-01-02
  • HDFS 存储和优化技术研究综述
    摘要:HDFS(Hadoopdistributedfilesystem)作为面向数据追加和读取优化的开源分布式文件系统,具备可移植、高容错和可大规模水平扩展的特性.经过10余年的发展,HDFS已经广泛应用于大数据的存储.作为存储海量数据的底层平台,HDFS存储了海量的结构化和非结构化数据,支撑着复杂 ...
    本站小编 Free考研考试 2022-01-02
  • 混合个体选择机制的多目标进化算法
    摘要:在多目标进化算法中,如何从后代候选集中选择最优解,显著地影响优化过程.当前,最优解的选择方式主要是基于实际目标值或者代理模型估计目标值.然而,这些选择方式往往是非常耗时或者存在精度差等问题,特别是对于一些实际的复杂优化问题.最近,一些研究人员开始利用有监督分类辅助后代选择,但是这些工作难以准备 ...
    本站小编 Free考研考试 2022-01-02
  • 基于深度置信网络的广告点击率预估的优化
    摘要:随着互联网广告的飞速发展,如何预测目标用户对互联网广告的点击率(click-throughrate,简称CTR),成为精确广告推荐投放的关键技术,并成为计算广告领域的研究热点和深度神经网络的应用热点.为了提高广告点击率预估的精确度,提出了基于深度置信网络的广告点击率预估模型,并通过基于Kagg ...
    本站小编 Free考研考试 2022-01-02