删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

密度峰值聚类算法综述

本站小编 Free考研考试/2022-01-01

陈叶旺1,2,3,4, 申莲莲1, 钟才明5, 王 田1, 陈 谊2, 杜吉祥1
1(华侨大学计算机科学与技术学院 福建厦门 361021);2(食品安全大数据技术北京市重点实验室(北京工商大学) 北京 100048);3(江苏省计算机信息处理技术重点实验室(苏州大学) 江苏苏州 215006);4(福建省大数据智能与安全重点实验室(华侨大学) 福建厦门 361021);5(宁波大学信息学院 浙江宁波 315211) (ywchen@hqu.edu.cn)
出版日期: 2020-02-01


基金资助:国家自然科学基金项目(61673186,71771094,61876068,61972010);泉州市高层次人才创新创业项目(2018C114R,2018C110R);福建省科技计划项目(2017H01010065,2019H01010129)

Survey on Density Peak Clustering Algorithm

Chen Yewang1,2,3,4, Shen Lianlian1, Zhong Caiming5, Wang Tian1, Chen Yi2, and Du Jixiang1
1(College of Computer Science and Technology, Huaqiao University, Xiamen, Fujian 361021);2(Beijing Key Laboratory of Big Data Technology for Food Safety (Beijing Technology and Business University), Beijing 100048);3(Provincial Key Laboratory for Computer Information Processing Technology (Soochow University), Suzhou, Jiangsu 215006);4(Fujian Key Laboratory of Big Data Intelligence and Security (Huaqiao University), Xiamen, Fujian 361021);5(College of Information, Ningbo University, Ningbo, Zhejiang 315211)
Online: 2020-02-01


Supported by:This work was supported by the National Natural Science Foundation of China (61673186, 71771094, 61876068, 61972010), the Quanzhou City Science & Technology Program of China (2018C114R, 2018C110R), and the Project of Science and Technology Plan of Fujian Province of China (2017H01010065, 2019H01010129).




摘要/Abstract


摘要: 密度峰值聚类(density peak, DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望.






[1]蒲勇霖, 于炯, 鲁亮, 李梓杨, 国冰磊, 廖彬. 基于Storm平台的数据恢复节能策略[J]. 计算机研究与发展, 2021, 58(3): 479-496.
[2]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[3]林霄, 姬硕, 岳胜男, 孙卫强, 胡卫生. 面向跨数据中心网络的节点约束存储转发调度方法[J]. 计算机研究与发展, 2021, 58(2): 319-337.
[4]陶涛, 孙玉娥, 陈冬梅, 杨文建, 黄河, 罗永龙. 一种基于智能手机传感器数据的地图轮廓生成方法[J]. 计算机研究与发展, 2020, 57(7): 1490-1507.
[5]许丹亚, 王晶, 王利, 张伟功. 基于Spark的大数据访存行为跨层分析工具[J]. 计算机研究与发展, 2020, 57(6): 1179-1190.
[6]申毅杰, 曾丹, 熊劲. 基于收益模型的Spark SQL数据重用机制[J]. 计算机研究与发展, 2020, 57(2): 318-332.
[7]赵慧慧, 赵凡, 陈仁海, 冯志勇. 基于地理空间大数据的高效索引与检索算法[J]. 计算机研究与发展, 2020, 57(2): 333-345.
[8]胡学钢, 刘菲, 卜晨阳. 教育大数据中认知跟踪模型研究进展[J]. 计算机研究与发展, 2020, 57(12): 2523-2546.
[9]田继伟,王劲松,石凯. 基于PU与生成对抗网络的POI定位算法[J]. 计算机研究与发展, 2019, 56(9): 1843-1850.
[10]刘芳,李戈,胡星,金芝. 基于深度学习的程序理解研究进展[J]. 计算机研究与发展, 2019, 56(8): 1605-1620.
[11]洪敏,贾彩燕,李亚芳,于剑. 样本加权的多视图聚类算法[J]. 计算机研究与发展, 2019, 56(8): 1677-1685.
[12]艾科,马国帅,杨凯凯,钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395.
[13]高腾飞,刘勇琰,汤云波,张垒,陈丹. 面向时间序列大数据海量并行贝叶斯因子化分析方法[J]. 计算机研究与发展, 2019, 56(7): 1567-1577.
[14]赵宇海,印莹,李源,汪嗣尧,王国仁. 一种面向大规模序列数据的交互特征并行挖掘算法[J]. 计算机研究与发展, 2019, 56(5): 992-1006.
[15]王悦,樊凯. 隐藏访问策略的高效CP-ABE方案[J]. 计算机研究与发展, 2019, 56(10): 2151-2159.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4124
相关话题/计算机 数据 华侨大学 空间 网络

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于多通道空间光谱全变差的衍射光谱图像复原算法
    王旭,陈强,孙权森(南京理工大学计算机科学与工程学院南京210094)(loxaywx@126.com)出版日期:2020-02-01基金资助:国家自然科学基金项目(61673220)MultichannelSpectral-SpatialTotalVariationModelforDiffract ...
    本站小编 Free考研考试 2022-01-01
  • 数据中心网络传输协议综述
    曾高雄,胡水海,张骏雪,陈凯(香港科技大学计算机科学与工程系香港999077)(kaichen@cse.ust.hk)出版日期:2020-01-01TransportProtocolsforDataCenterNetworks:ASurveyZengGaoxiong,HuShuihai,ZhangJ ...
    本站小编 Free考研考试 2022-01-01
  • 面向非易失内存的数据一致性研究综述
    肖仁智1,冯丹1,2,胡燏翀2,3,张晓祎1,程良锋21(华中科技大学武汉光电国家研究中心武汉430074);2(华中科技大学计算机科学与技术学院武汉430074);3(深圳华中科技大学研究院广东深圳518061)(rzxiao@hust.edu.cn)出版日期:2020-01-01基金资助:国家重 ...
    本站小编 Free考研考试 2022-01-01
  • 基于图注意力网络的因果关系抽取
    许晶航1,左万利1,2,梁世宁1,王英1,21(吉林大学计算机科学与技术学院长春130012);2(符号计算与知识工程教育部重点实验室(吉林大学)长春130012)(xujh17@mails.jlu.edu.cn)出版日期:2020-01-01基金资助:国家自然科学基金项目(61976103,618 ...
    本站小编 Free考研考试 2022-01-01
  • 基于特征融合时序分割网络的行为识别研究
    李洪均1,2,3,4,丁宇鹏1,李超波1,张士兵1,31(南通大学信息科学技术学院江苏南通226019);2(计算机软件新技术国家重点实验室(南京大学)南京210023);3(南通智能信息技术联合研究中心江苏南通226019);4(通科微电子学院江苏南通226019)(lihongjun@ntu.e ...
    本站小编 Free考研考试 2022-01-01
  • 2019大数据知识工程及应用专题
    郑庆华(西安交通大学西安710049)出版日期:2019-12-01Online:2019-12-01摘要/Abstract摘要:实际工程问题的求解往往涉及跨领域、跨模态的海量碎片化知识,这些知识不能仅靠专家提供,而需要从环境中动态学习和融合生成.知识工程旨在研究计算机对知识的获取、表征和处理.随着 ...
    本站小编 Free考研考试 2022-01-01
  • 道路网环境下K-支配空间Skyline查询方法
    李松1,窦雅男1,郝晓红1,张丽平1,郝忠孝1,21(哈尔滨理工大学计算机科学与技术学院哈尔滨150080);2(哈尔滨工业大学计算机科学与技术学院哈尔滨150001)(lisongbeifen@163.com)出版日期:2020-01-01基金资助:国家自然科学基金项目(61872105);黑龙江 ...
    本站小编 Free考研考试 2022-01-01
  • 基于邻节点和关系模型优化的网络表示学习
    冶忠林1,2,3,赵海兴1,2,3,张科1,3,朱宇1,3,肖玉芝1,31(青海师范大学计算机学院西宁810008);2(陕西师范大学计算机科学学院西安710119);3(藏文信息处理教育部重点实验室(青海师范大学)西宁810008)(zhonglin_ye@foxmail.com)出版日期:201 ...
    本站小编 Free考研考试 2022-01-01
  • 融合非稀疏信任网络的时间底限变动的智能体协商模型
    王金迪,童向荣(烟台大学计算机与控制工程学院山东烟台264005)(wangjindi117@163.com)出版日期:2019-12-01基金资助:国家自然科学基金项目(61572418)AgentNegotiationModelBasedonRoundLimitChangeofNon-Spars ...
    本站小编 Free考研考试 2022-01-01
  • 时频联合长时循环神经网络
    庄连生1,吕扬1,杨健2,3,李厚强11(中国科学技术大学信息科学技术学院合肥230027);2(军事科学院系统工程研究院北京100191);3(鹏城实验室广东深圳518000)(lszhuang@ustc.edu.cn)出版日期:2019-12-01基金资助:国家自然科学基金项目(61472379 ...
    本站小编 Free考研考试 2022-01-01