删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种海量数据快速聚类算法

本站小编 Free考研考试/2021-12-25

一种海量数据快速聚类算法

何倩1, 李双富1,2, 黄焕1, 徐红1
1. 桂林电子科技大学 卫星导航定位与位置服务国家地方联合工程研究中心, 桂林 541004;
2. 广西交科集团有限公司, 南宁 530007
收稿日期:2019-05-11出版日期:2020-06-28发布日期:2020-06-24

作者简介:何倩(1979-),男,教授,博士生导师,E-mail:heqian@guet.edu.cn.
基金资助:国家自然科学基金项目(61661015,61967005);广西创新驱动重大专项项目(AA17202024);广西科技创新团队项目(2019GXNSFGA245004)

A Fast Clustering Algorithm for Massive Data

HE Qian1, LI Shuang-fu1,2, HUANG Huan1, XU Hong1
1. State and Local Joint Engineering Research Center for Satellite Navigation and Location Service, Guilin University of Electronic Technology, Guilin 541004, China;
2. Guangxi Jiaoke Group Company Limited, Nanning 530007, China
Received:2019-05-11Online:2020-06-28Published:2020-06-24


Supported by:




摘要/Abstract


摘要: 为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.
中图分类号:
TP311

引用本文



何倩, 李双富, 黄焕, 徐红. 一种海量数据快速聚类算法[J]. 北京邮电大学学报, 2020, 43(3): 118-124.
HE Qian, LI Shuang-fu, HUANG Huan, XU Hong. A Fast Clustering Algorithm for Massive Data[J]. Journal of Beijing University of Posts and Telecommunications, 2020, 43(3): 118-124.





PDF全文下载地址:

https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4641
相关话题/数据 广西 计算 北京邮电大学 桂林电子科技大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 移动边缘计算中的时延和能耗均衡优化算法
    移动边缘计算中的时延和能耗均衡优化算法景泽伟1,杨清海1,秦猛21.西安电子科技大学综合业务网理论及关键技术国家重点实验室,西安710071;2.鹏城实验室,深圳518055收稿日期:2019-05-28发布日期:2020-04-28通讯作者:杨清海(1976-),男,教授,E-mail:qhyan ...
    本站小编 Free考研考试 2021-12-25
  • 一种面向边缘计算的混合内存系统
    一种面向边缘计算的混合内存系统孙浩1,2,陈岚1,郝晓冉1,刘晨吉1,2,倪茂11.中国科学院微电子研究所,北京100029;2.中国科学院大学,北京100049收稿日期:2019-05-28发布日期:2020-04-28通讯作者:陈岚(1968-),女,研究员,博士生导师,E-mail:chenl ...
    本站小编 Free考研考试 2021-12-25
  • Spark环境下基于数据倾斜模型的Shuffle分区优化方案
    Spark环境下基于数据倾斜模型的Shuffle分区优化方案阎逸飞,王智立,邱雪松,王嘉潞北京邮电大学网络与交换技术国家重点实验室,北京100876收稿日期:2019-05-28发布日期:2020-04-28通讯作者:王智立(1975-),男,副教授,E-mail:zlwang@bupt.edu.c ...
    本站小编 Free考研考试 2021-12-25
  • 非平稳噪声下稀疏表示的DOA估计算法
    非平稳噪声下稀疏表示的DOA估计算法韦娟1,曹凯军1,宁方立2,31.西安电子科技大学通信工程学院,西安710071;2.西北工业大学机电学院,西安710072;3.东莞市三航军民融合创新研究院,东莞523808收稿日期:2019-04-04出版日期:2020-02-28发布日期:2020-03-2 ...
    本站小编 Free考研考试 2021-12-25
  • 大数据环境下基于深度学习的行人再识别
    大数据环境下基于深度学习的行人再识别李鹏1,王德勇1,师文喜1,姜志国21.中国电子科技集团公司电子科学研究院新疆联海创智信息科技有限公司,北京100041;2.北京航空航天大学宇航学院,北京100191收稿日期:2019-07-01出版日期:2019-12-28发布日期:2019-11-15通讯作 ...
    本站小编 Free考研考试 2021-12-25
  • 基于深度学习的融合多源异构数据的推荐模型
    基于深度学习的融合多源异构数据的推荐模型冀振燕,宋晓军,皮怀雨,杨春北京交通大学软件学院,北京100044收稿日期:2019-07-30出版日期:2019-12-28发布日期:2019-11-15作者简介:冀振燕(1970-),女,副教授,硕士生导师,E-mail:jzhenyan@hotmail. ...
    本站小编 Free考研考试 2021-12-25
  • 一种数据驱动的三维流场流线特征化筛选方法
    一种数据驱动的三维流场流线特征化筛选方法熊光正1,黄智濒1,戴志涛1,杨武兵21.北京邮电大学智能通信软件与多媒体北京市重点实验室,北京100876;2.中国航天空气动力技术研究院,北京100074收稿日期:2019-07-10出版日期:2019-12-28发布日期:2019-11-15通讯作者:黄 ...
    本站小编 Free考研考试 2021-12-25
  • 一种混合网台跳频参数盲估计算法
    一种混合网台跳频参数盲估计算法付卫红,胡展西安电子科技大学通信工程学院,西安710071收稿日期:2018-11-12出版日期:2019-08-28发布日期:2019-08-26通讯作者:胡展(1995-),男,硕士生,E-mail:1165221030@qq.com.E-mail:11652210 ...
    本站小编 Free考研考试 2021-12-25
  • 基于出租车轨迹数据的车联网通信机会间隔模型
    基于出租车轨迹数据的车联网通信机会间隔模型皇甫伟1,2,杨心竹1,王欢1,2,胡晓彦31.北京科技大学计算机与通信工程学院人工智能研究院,北京100083;2.北京市融合网络与泛在业务工程技术研究中心,北京100083;3.中国移动通信集团设计院有限公司,北京100080收稿日期:2018-09-1 ...
    本站小编 Free考研考试 2021-12-25
  • 车联网中基于停车协同的边缘计算卸载方法
    车联网中基于停车协同的边缘计算卸载方法吴振铨1,叶东东1,余荣1,周文辉2,何昭水11.广东工业大学自动化学院,广州510006;2.电子科技大学中山学院,广东中山528402收稿日期:2018-06-26出版日期:2019-04-28发布日期:2019-04-09通讯作者:周文辉(1972-),男 ...
    本站小编 Free考研考试 2021-12-25