删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法

本站小编 Free考研考试/2022-01-01

李顺勇1,张苗苗1,曹付元2
1(山西大学数学科学学院 太原 030006);2(山西大学计算机与信息技术学院 太原 030006) (lisy75@sxu.edu.cn)
出版日期: 2019-06-01


基金资助:国家自然科学基金项目(61573229);山西省基础研究计划项目(201701D121004);山西省回国留学人员科研资助项目(2017-020);山西省高等学校教学改革创新项目(J2017002)

A MD fuzzy k-modes Algorithm for Clustering Categorical Matrix-Object Data

Li Shunyong1, Zhang Miaomiao1, Cao Fuyuan2
1(School of Mathematical Sciences, Shanxi University, Taiyuan 030006);2(School of Computer and Information Technology, Shanxi University, Taiyuan 030006)
Online: 2019-06-01


Supported by:This work was supported by the National Natural Science Foundation of China (61573229), the Shanxi Provincial Basic Research Foundation of China (201701D121004), the Shanxi Scholarship Council of China (2017-020), and the Shanxi Provincial Teaching Reform and Innovation Program in Higher Education (J2017002).




摘要/Abstract


摘要: 传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,针对矩阵对象数据聚类算法的研究相对较少,还有很多问题有待解决.利用fuzzy k-modes算法的聚类过程,提出一种基于矩阵对象数据的matrix-object data fuzzy k-modes(MD fuzzy k-modes)聚类算法.该算法结合模糊集的概念引入模糊因子β,重新定义了矩阵对象间的相异性度量,并给出类中心的启发式更新算法.最后,在5个真实数据集上验证了MD fuzzy k-modes算法的有效性,并分析了模糊因子β与隶属度w之间的关系.大数据时代,利用MD fuzzy k-modes算法对多条记录进行聚类,能更易发现顾客的消费偏好,从而做出更有针对性的推荐.






[1]夏冬雪, 杨燕, 王浩, 阳树洪. 基于邻域多核学习的后融合多视图聚类算法[J]. 计算机研究与发展, 2020, 57(8): 1627-1638.
[2]朱颖雯, 陈松灿. 基于随机投影的高维数据流聚类[J]. 计算机研究与发展, 2020, 57(8): 1683-1696.
[3]王婷, 王娜, 崔运鹏, 李欢. 基于半监督学习的无线网络攻击行为检测优化方法[J]. 计算机研究与发展, 2020, 57(4): 791-802.
[4]赵慧慧, 赵凡, 陈仁海, 冯志勇. 基于地理空间大数据的高效索引与检索算法[J]. 计算机研究与发展, 2020, 57(2): 333-345.
[5]陈叶旺, 申莲莲, 钟才明, 王田, 陈谊, 杜吉祥. 密度峰值聚类算法综述[J]. 计算机研究与发展, 2020, 57(2): 378-394.
[6]秦红, 王皓, 魏晓超, 郑志华. 安全的常数轮多用户k-均值聚类计算协议[J]. 计算机研究与发展, 2020, 57(10): 2188-2200.
[7]刘逸凡, 徐昆. 多光源绘制方法综述[J]. 计算机研究与发展, 2020, 57(1): 17-31.
[8]张佳影,王祺,张知行,阮彤,张欢欢,何萍. 区域医疗健康平台中检验检查指标的标准化算法[J]. 计算机研究与发展, 2019, 56(9): 1897-1906.
[9]洪敏,贾彩燕,李亚芳,于剑. 样本加权的多视图聚类算法[J]. 计算机研究与发展, 2019, 56(8): 1677-1685.
[10]闫小强,叶阳东. 共享和私有信息最大化的跨媒体聚类[J]. 计算机研究与发展, 2019, 56(7): 1370-1382.
[11]胥皇,於志文,郭斌,王柱. 人才流动的时空模式:分析与预测[J]. 计算机研究与发展, 2019, 56(7): 1408-1419.
[12]李明月,罗向阳,柴理想,袁福祥,甘勇. 基于网络节点聚类的目标IP城市级定位方法[J]. 计算机研究与发展, 2019, 56(3): 467-479.
[13]杜瑞忠,李明月,田俊峰. 基于聚类索引的多关键字排序密文检索方案[J]. 计算机研究与发展, 2019, 56(3): 555-565.
[14]李赫,印莹,李源,赵宇海,王国仁. 基于多目标演化聚类的大规模动态网络社区检测[J]. 计算机研究与发展, 2019, 56(2): 281-292.
[15]龚卫华,金蓉,裴小兵,梅建萍. LBSN中基于社区联合聚类的协同推荐方法[J]. 计算机研究与发展, 2019, 56(11): 2506-2517.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3955
相关话题/计算机 数据 山西大学 网络 社区