1(交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京 100044);2(北京交通大学计算机与信息技术学院 北京 100044);3(北京工业大学信息学部 北京 100124) (16120372@bjtu.edu.cn)
出版日期: 2019-08-01基金资助:国家自然科学基金项目(61876016,61632004);中央高校基本科研业务费专项资金项目(2018JBZ006)Sample-Weighted Multi-View Clustering
Hong Min1,2, Jia Caiyan1,2, Li Yafang3, Yu Jian1,21(Beijing Key Laboratory of Traffic Data Analysis and Mining (Beijing Jiaotong University), Beijing 100044);2(School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044);3(Faculty of Information Technology, Beijing University of Technology, Beijing 100124)
Online: 2019-08-01摘要/Abstract
摘要: 大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果.
参考文献
相关文章 15
| [1] | 吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527. |
| [2] | 夏冬雪, 杨燕, 王浩, 阳树洪. 基于邻域多核学习的后融合多视图聚类算法[J]. 计算机研究与发展, 2020, 57(8): 1627-1638. |
| [3] | 朱颖雯, 陈松灿. 基于随机投影的高维数据流聚类[J]. 计算机研究与发展, 2020, 57(8): 1683-1696. |
| [4] | 陶涛, 孙玉娥, 陈冬梅, 杨文建, 黄河, 罗永龙. 一种基于智能手机传感器数据的地图轮廓生成方法[J]. 计算机研究与发展, 2020, 57(7): 1490-1507. |
| [5] | 王婷, 王娜, 崔运鹏, 李欢. 基于半监督学习的无线网络攻击行为检测优化方法[J]. 计算机研究与发展, 2020, 57(4): 791-802. |
| [6] | 赵慧慧, 赵凡, 陈仁海, 冯志勇. 基于地理空间大数据的高效索引与检索算法[J]. 计算机研究与发展, 2020, 57(2): 333-345. |
| [7] | 陈叶旺, 申莲莲, 钟才明, 王田, 陈谊, 杜吉祥. 密度峰值聚类算法综述[J]. 计算机研究与发展, 2020, 57(2): 378-394. |
| [8] | 秦红, 王皓, 魏晓超, 郑志华. 安全的常数轮多用户k-均值聚类计算协议[J]. 计算机研究与发展, 2020, 57(10): 2188-2200. |
| [9] | 刘逸凡, 徐昆. 多光源绘制方法综述[J]. 计算机研究与发展, 2020, 57(1): 17-31. |
| [10] | 田继伟,王劲松,石凯. 基于PU与生成对抗网络的POI定位算法[J]. 计算机研究与发展, 2019, 56(9): 1843-1850. |
| [11] | 张佳影,王祺,张知行,阮彤,张欢欢,何萍. 区域医疗健康平台中检验检查指标的标准化算法[J]. 计算机研究与发展, 2019, 56(9): 1897-1906. |
| [12] | 刘芳,李戈,胡星,金芝. 基于深度学习的程序理解研究进展[J]. 计算机研究与发展, 2019, 56(8): 1605-1620. |
| [13] | 闫小强,叶阳东. 共享和私有信息最大化的跨媒体聚类[J]. 计算机研究与发展, 2019, 56(7): 1370-1382. |
| [14] | 胥皇,於志文,郭斌,王柱. 人才流动的时空模式:分析与预测[J]. 计算机研究与发展, 2019, 56(7): 1408-1419. |
| [15] | 李顺勇,张苗苗,曹付元. 基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法[J]. 计算机研究与发展, 2019, 56(6): 1325-1337. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3986
