1(同济大学计算机科学与技术系 上海 201804); 2(嵌入式系统与服务计算教育部重点实验室(同济大学) 上海 201804); 3(计算机软件新技术国家重点实验室(南京大学) 南京 210023) (tjluosheng@gmail.com)
出版日期:
2019-03-01基金资助:
国家自然科学基金项目(61673301,61502259);南京大学计算机软件新技术国家重点实验室开放课题(KFKT2017B22)A Link Prediction Model Based on Hierarchical Information Granular Representation for Attributed Graphs
Luo Sheng1,2, Miao Duoqian1,2, Zhang Zhifei1,3, Zhang Yuanjian1,2, Hu Shengdan1,21(Department of Computer Science and Technology, Tongji University, Shanghai 201804); 2(Key Laboratory of Embedded System and Service Computing (Tongji University), Ministry of Education, Shanghai 201804); 3(State Key Laboratory for Novel Software Technology (Nanjing University), Nanjing 210023)
Online:
2019-03-01摘要/Abstract
摘要: 随着具有结点属性信息的网络图数据的增加,结点属性及结点链接关系越来越复杂,这对复杂网络的链接预测任务带来了一系列的挑战.这些不同来源的原始数据之间存在着不一致性,即结点的属性诱导的潜在链接关系与网络拓扑结构观测到的链接边之间存在着不一致的情况,这一现象将直接影响结点对之间的链接预测准确性与精确性.为了有效处理多源数据的不一致性,融合异构数据的差异,借助粒计算思想,通过对原始数据的多粒度表示,将原始数据在不同层次的粒度进行信息表示建模.最终依据这些数据的粒度表示,寻找最优的粒层结构,并最大化地消除数据内在的不一致性.首先,定义了数据的粒度不同层次表示及粒层关系;其次,对所观测到的链接数据,构建对数似然统计模型,并综合不同粒度层数据特点对模型进行修正;最后,使用多源数据训练统计模型,将学习好的模型用于预测结点对之间的链接概率.实验表明:与现有链接预测模型相比,多源数据经过粒度表示极大地平衡了多源数据的不一致性,有效提升了链接预测任务的准确性.
参考文献
相关文章 15
[1] | 陈可佳, 鲁浩, 张嘉俊. 条件变分时序图自编码器[J]. 计算机研究与发展, 2020, 57(8): 1663-1673. |
[2] | 崔员宁, 李静, 沈力, 申扬, 乔林, 薄珏. Duration-HyTE:基于持续时间建模的时间感知知识表示学习方法[J]. 计算机研究与发展, 2020, 57(6): 1239-1251. |
[3] | 李金海, 李玉斐, 米允龙, 吴伟志. 多粒度形式概念分析的介粒度标记方法[J]. 计算机研究与发展, 2020, 57(2): 447-458. |
[4] | 陈玉明,李伟. 粒向量与K近邻粒分类器[J]. 计算机研究与发展, 2019, 56(12): 2600-2611. |
[5] | 许志伟,张玉军. 高效物联网虚假数据融合结果检测机制[J]. 计算机研究与发展, 2018, 55(7): 1488-1497. |
[6] | 吴伟志,杨丽,谭安辉,徐优红. 广义不完备多粒度标记决策系统的粒度选择[J]. 计算机研究与发展, 2018, 55(6): 1263-1272. |
[7] | 周艳红,张贤勇,莫智文. 粒化单调的条件邻域熵及其相关属性约简[J]. 计算机研究与发展, 2018, 55(11): 2395-2405. |
[8] | 顾沈明,顾金燕,吴伟志,李同军,陈超君. 不完备多粒度决策系统的局部最优粒度选择[J]. 计算机研究与发展, 2017, 54(7): 1500-1509. |
[9] | 陈德华,殷苏娜,乐嘉锦,王梅,潘乔,朱立峰. 一种面向临床领域时序知识图谱的链接预测模型[J]. 计算机研究与发展, 2017, 54(12): 2687-2697. |
[10] | 王鑫,王英,左万利. 基于交互意见和地位理论的符号网络链接预测模型[J]. 计算机研究与发展, 2016, 53(4): 764-775. |
[11] | 孟小峰,杜治娟. 大数据融合研究:问题与挑战[J]. 计算机研究与发展, 2016, 53(2): 231-246. |
[12] | 薛见新,申德荣,寇月,聂铁铮,于戈. 面向数据融合的半环溯源计算方法[J]. 计算机研究与发展, 2016, 53(2): 316-325. |
[13] | 廖国琼,王汀利,邓琨,万常选. 离线瞬态社会网络中的多用户位置邻近预测[J]. 计算机研究与发展, 2016, 53(11): 2645-2653. |
[14] | 马如霞, 孟小峰. 基于数据源分类可信性的真值发现方法研究[J]. 计算机研究与发展, 2015, 52(9): 1931-1940. |
[15] | 刘冶,朱蔚恒,潘炎,印鉴. 基于低秩和稀疏矩阵分解的多源融合链接预测算法[J]. 计算机研究与发展, 2015, 52(2): 423-436. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3892