删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

共享和私有信息最大化的跨媒体聚类

本站小编 Free考研考试/2022-01-01

闫小强,叶阳东
(郑州大学信息工程学院 郑州 450001) (iexqyan@zzu.edu.cn)
出版日期: 2019-07-01


基金资助:国家重点研发计划项目(2018YFB1201403);国家自然科学基金项目(61772475,61502434)

Cross-Media Clustering by Share and Private Information Maximization

Yan Xiaoqiang, Ye Yangdong
(School of Information Engineering, Zhengzhou University, Zhengzhou 450001)
Online: 2019-07-01







摘要/Abstract


摘要: 近年来,具有典型多源异构特性的跨媒体数据的快速涌现给数据分析带来巨大挑战.然而,绝大多数现有跨媒体数据分析方法仅依赖模态间的共享信息发掘跨媒体数据中蕴含的模式结构,忽略各模态自身的重要信息.针对此问题,提出共享和私有信息最大化(share and private information maximization)的跨媒体聚类算法,通过兼顾跨媒体数据的共享和私有信息,以求得更加合理的聚类模式.首先,提出2种跨媒体数据的共享信息构建模型:1)混合单词模型,该模型将各模态的底层特征转换为统一的词频向量表示,然后使用一种新的自凝聚信息最大化方法自底向上地构建多模态的混合单词空间,最大化地保持各模态底层特征的统计相似性;2)聚类集成模型,构建各模态自身的聚类划分,通过互信息度量各模态聚类划分间的信息量,抽取各模态的高层聚类划分之间的相关性.其次,提出基于信息论的目标函数,将跨媒体数据的共享和私有信息融合在同一目标函数中,在抽取聚类模式结构的过程中兼顾跨媒体数据的共享和私有信息.最后,采用顺序“抽取-合并”过程优化SPIM算法的目标函数,保证其收敛到局部最优解.在6种跨媒体数据上的实验结果表明SPIM算法的优越性.






[1]吴宾,娄铮铮,叶阳东. 一种面向多源异构数据的协同过滤推荐算法[J]. 计算机研究与发展, 2019, 56(5): 1034-1047.
[2]彭宇新,綦金玮,黄鑫. 多媒体内容理解的研究现状与展望[J]. 计算机研究与发展, 2019, 56(1): 183-208.
[3]綦小龙,高阳,王皓,宋蓓,周春蕾,张友卫. 一种可度量的贝叶斯网络结构学习方法[J]. 计算机研究与发展, 2018, 55(8): 1717-1725.
[4]王玲,孟建瑶. 基于特征变权的动态模糊特征选择算法[J]. 计算机研究与发展, 2018, 55(5): 893-907.
[5]许行,张凯,王文剑. 一种小样本数据的特征选择方法[J]. 计算机研究与发展, 2018, 55(10): 2321-2330.
[6]李峰,苗夺谦,张志飞,张维. 基于互信息的粒化特征加权多标签学习k近邻算法[J]. 计算机研究与发展, 2017, 54(5): 1024-1035.
[7]祝烈煌,高峰,沈蒙,李艳东,郑宝昆,毛洪亮,吴震. 区块链隐私保护研究综述[J]. 计算机研究与发展, 2017, 54(10): 2170-2186.
[8]赵兴旺,梁吉业. 一种基于信息熵的混合数据属性加权聚类算法[J]. 计算机研究与发展, 2016, 53(5): 1018-1028.
[9]张 维,苗夺谦,高 灿,岳晓冬. 邻域粗糙协同分类模型[J]. 计算机研究与发展, 2014, 51(8): 1811-1820.
[10]肖 宇 于 剑. 加权的自适应相似度度量[J]. 计算机研究与发展, 2013, 50(9): 1876-1882.
[11]娄铮铮 叶阳东 刘瑞娜. 基于IB方法的无冗余多视角聚类[J]. 计算机研究与发展, 2013, 50(9): 1865-1875.
[12]宫继兵, 王 睿, 王晓峰, 崔 莉,. 基于概率因子图模型的医疗社会网络用户健康状态检测方法[J]. 计算机研究与发展, 2013, 50(6): 1285-1296.
[13]徐峻岭 , 周毓明 , 陈 林, 徐宝文,. 基于互信息的无监督特征选择[J]. , 2012, 49(2): 372-382.
[14]田建伟 李石君. 基于层次树模型的Deep Web数据提取方法[J]. , 2011, 48(1): 94-102.
[15]田志宏, 张永铮, 张伟哲, 李 洋, 叶建伟, . 基于模式挖掘和聚类分析的自适应告警关联[J]. , 2009, 46(8): 1304-1315.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3958
相关话题/数据 计算机 信息 结构 网络