(School of Computer Science and Technology, China University of Mining and Technology, Xuzhou, Jiangsu 221116)
出版日期:
2018-11-01基金资助:
国家自然科学基金项目(61379101,61672522);中国博士后科学基金项目(2016M601910)Large-Scale Density Peaks Clustering Algorithm Based on Grid Screening
Xu Xiao, Ding Shifei, Sun Tongfeng, Liao Hongmei(中国矿业大学计算机科学与技术学院 江苏徐州 221116) (xu_xiao@cumt.edu.cn)
Online:
2018-11-01摘要/Abstract
摘要: 密度峰值聚类算法(density peaks clustering algorithm, DPC)是2014年提出的一种新型聚类分析算法,它基于聚类中心局部密度大以及与密度更大点之间的距离较远两大特点绘制决策图寻找聚类中心,从而得到任意形状的簇.但在寻找聚类中心的过程中,求解局部密度以及高密度距离属性都依赖于相似度矩阵的计算,计算复杂度较高,限制了密度峰值聚类算法在大规模数据集中的应用.针对此不足,提出基于网格筛选的密度峰值聚类算法(density peaks clustering algorithm based on grid screening, SDPC),根据数据的不均匀分布,使用网格化方法去除部分密度稀疏的点,然后再使用密度峰值聚类算法中决策图的方法选取聚类中心,可以在保证聚类准确性的基础上有效降低计算复杂度.理论分析和实验测试表明:基于网格筛选的密度峰值聚类算法不仅可以对大规模数据集进行正确的聚类,还极大地降低了计算复杂度.
参考文献
相关文章 6
[1] | 赵晓非,史忠植,冯志勇. 面向异构语义映射的D3L转换算法及其性质研究[J]. 计算机研究与发展, 2018, 55(12): 2715-2724. |
[2] | 董荣胜,张新凯,刘华东,古天龙. 大规模图数据的k\+2-MDD表示方法与操作研究[J]. 计算机研究与发展, 2016, 53(12): 2783-2792. |
[3] | 江 华. 命题μ-演算全局模型检测的高效算法设计[J]. , 2010, 47(8): 1424-1433. |
[4] | 王凤芹 胡定磊 刘春林. 一种基于谓词执行优化技术的寄存器分配算法[J]. , 2006, 43(8): 1471-1476. |
[5] | 王海霞 韩承德. 整数乘法电路的形式化验证方法研究[J]. , 2005, 42(3): -. |
[6] | 柳 毅, 王育民,. 基于移动代理的一个鲁棒路由协议[J]. , 2005, 42(12): 2106-2110. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3809