基于核K-means的增量多视图聚类算法
张佩瑞,杨燕*,邢焕来,喻琇瑛西南交通大学信息科学与技术学院, 四川 成都 611756
收稿日期:
2017-05-05出版日期:
2018-06-20发布日期:
2017-05-05通讯作者:
杨燕(1964— ),女,安徽合肥人,工学博士,博士生导师,主要研究方向为数据挖掘、集成学习. E-mail:yyang@swjtu.edu.cnE-mail:15803118626@139.com作者简介:
张佩瑞(1992—),女,河北邢台人,硕士,主要研究方向为数据库与数据挖掘. E-mail:15803118626@139.com基金资助:
国家自然科学基金资助项目(61572407);国家科技支撑计划课题资助项目(2015BAH19F02)Incremental multi-view clustering algorithm based on kernel K-means
ZHANG Peirui, YANG Yan*, XING Huanlai, YU XiuyingSchool of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, Sichuan, China
Received:
2017-05-05Online:
2018-06-20Published:
2017-05-05摘要/Abstract
摘要: 针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1735