非均匀数据的变异系数聚类算法
杨天鹏1,徐鲲鹏1,陈黎飞1,2*1. 福建师范大学数学与信息学院, 福建 福州 350117;2. 数字福建环境监测物联网实验室, 福建 福州 350117
收稿日期:
2017-08-24出版日期:
2018-06-20发布日期:
2017-08-24通讯作者:
陈黎飞(1972— ),男,福建长乐人,教授,博导,博士,主要研究方向为统计机器学习,数据挖掘,模式识别.E-mail: clfei@fjnu.edu.cnE-mail:yangplace@163.com作者简介:
杨天鹏(1991— ),男,湖北十堰人,硕士研究生,主要研究方向为数据挖掘.E-mail:yangplace@163.com基金资助:
国家自然科学基金资助项目(61175123);福建省自然科学基金资助项目(2015J01238);福建师范大学创新团队资助项目(IRTL1704)Coefficient of variation clustering algorithm for non-uniform data
YANG Tianpeng1, XU Kunpeng1, CHEN Lifei1,2*1. College of Mathematics and Informatics, Fujian Normal University, Fuzhou 350117, Fujian, China;
2. Digit Fujian Internet-of-Things Laboratory of Environmental Monitoring, Fujian Normal University, Fuzhou 350117, Fujian, China
Received:
2017-08-24Online:
2018-06-20Published:
2017-08-24摘要/Abstract
摘要: 针对现有基于划分的聚类算法无法有效聚类簇大小和簇密度有较大差异的非均匀数据的问题,提出一种基于变异系数聚类算法。从聚类优化目标的角度出发,分析了以K-means为代表的划分聚类算法引发“均匀效应”的成因;提出以变异系数度量非均匀数据的分布散度,并基于变异系数定义一种非均匀数据的相异度公式;基于相异度公式定义了聚类目标优化函数,并根据局部优化方法给出聚类算法过程。在合成和真实数据集上的试验结果表明,与K-means、Verify2、ESSC聚类算法相比,本研究提出的非均匀数据的变异系数聚类算法(coefficient of variation clustering for non-uniform data, CVCN)聚类精度提升5%~40%。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1740