1(南京邮电大学计算机学院 南京 210023);2(江苏省无线传感网高技术研究重点实验室(南京邮电大学) 南京 210023);3(南京大学网络信息中心 南京 210023) (hhp@njupt.edu.cn)
出版日期:
2020-02-01基金资助:
国家自然科学基金项目(61672297);江苏省重点研发计划项目(BE2017742)Weighted Large-Scale Social Network Data Privacy Protection Method
Huang Haiping1,2, Zhang Dongjun1,2, Wang Kai1,2, Zhu Yikai3, and Wang Ruchuan1,21(Institute of Computer, Nanjing University of Posts and Telecommunications, Nanjing 210023);2(High Technology Research Key Laboratory of Wireless Sensor Network of Jiangsu Province (Nanjing University of Posts and Telecommunications), Nanjing 210023);3(Network Information Center, Nanjing University, Nanjing 210023)
Online:
2020-02-01Supported by:
This work was supported by the National Natural Science Foundation of China (61672297) and the Key Research and Development Program of Jiangsu Province (BE2017742).摘要/Abstract
摘要: 各类移动社交网络应用的发展促使了海量网络用户的出现,从而形成了大规模的社交图结构数据.这些图结构数据中包含着大量的用户隐私信息,因此发布之前需要进行隐私保护处理以防数据遭到泄露.同时,用户间错综复杂的社交关系并非均等,个体间关系的强弱可能直接影响到隐私的分布和保护的效率.目前存在相当多的针对无权值的社交网络图数据的隐私保护方法,但这些方法不能直接应用于带权值(社交关系敏感程度不均等)的社交网络图数据中.为解决这一问题,提出一种基于非交互的差分隐私保护模型的带权值的社交网络图扰动方法dp-noisy,可实现对边权值以及图结构的强保护.该方法基于单源最短路径约束模型来添加扰动噪音,根据不同的权值划分出关键边和非关键边,有效减少了需要扰动的边关系.实验结果表明:在大规模数据集中(节点数为30 000),dp-noisy在运行效率上比K-MPNP(K-shortest path privacy)提高了47.3%,比LWSPA(protection algorithm based on Laplace noise for weighted social networks)提高了41.8%,比DER(density-based exploration and reconstruc-tion)提高了52.6%.在相似的数据隐私保护程度下,dp-noisy的数据可用性比lp-noisy提高了10%,显著优于DER的数据可用性,略好于LWSPA.此外,dp-noisy的平均扰动质量比lp-noisy提高了14%,比DER提高了11.3%,比K-MPNP提高了27%; 在达到最优数据效用时(ε=10),dp-noisy的平均扰动质量比LWSPA提高了6%.综上,dp-noisy具有较高的运行效率和数据效用,同时满足抵御图结构攻击的特性,可适用于大规模的社交网络数据分析.
参考文献
相关文章 15
[1] | 张啸剑, 徐雅鑫, 付楠, 孟小峰. 基于直方图的隐私键-值数据收集算法[J]. 计算机研究与发展, 2021, 58(3): 624-637. |
[2] | 孟小峰, 刘立新. 基于区块链的数据透明化:问题与挑战[J]. 计算机研究与发展, 2021, 58(2): 237-252. |
[3] | 陈亦琦, 钱铁云, 李万理, 梁贻乐. 基于复合关系图卷积的属性网络嵌入方法[J]. 计算机研究与发展, 2020, 57(8): 1674-1682. |
[4] | 刘子图, 全紫薇, 毛如柏, 刘勇, 朱敬华. NT-EP:一种无拓扑结构的社交消息传播范围预测方法[J]. 计算机研究与发展, 2020, 57(6): 1312-1322. |
[5] | 罗浩, 闫光辉, 张萌, 包峻波, 李俊成, 刘婷, 杨波, 魏军. 融合多元信息的多关系社交网络节点重要性研究[J]. 计算机研究与发展, 2020, 57(5): 954-970. |
[6] | 王会勇, 唐士杰, 丁勇, 王玉珏, 李佳慧. 生物特征识别模板保护综述[J]. 计算机研究与发展, 2020, 57(5): 1003-1021. |
[7] | 黄克振, 连一峰, 冯登国, 张海霞, 刘玉岭, 马向亮. 基于区块链的网络安全威胁情报共享模型[J]. 计算机研究与发展, 2020, 57(4): 836-846. |
[8] | 张啸剑, 付楠, 孟小峰. 基于本地差分隐私的空间范围查询方法[J]. 计算机研究与发展, 2020, 57(4): 847-858. |
[9] | 王斌, 张磊, 张国印. 敏感渐进不可区分的位置隐私保护[J]. 计算机研究与发展, 2020, 57(3): 616-630. |
[10] | 刘俊旭, 孟小峰. 机器学习的隐私保护研究综述[J]. 计算机研究与发展, 2020, 57(2): 346-362. |
[11] | 芦效峰, 廖钰盈, Pietro Lio, Pan Hui. 一种面向边缘计算的高效异步联邦学习机制[J]. 计算机研究与发展, 2020, 57(12): 2571-2582. |
[12] | 王涛春, 金鑫, 吕成梅, 陈付龙, 赵传信. 移动群智感知中融合数据的隐私保护方法[J]. 计算机研究与发展, 2020, 57(11): 2337-2347. |
[13] | 周俊, 沈华杰, 林中允, 曹珍富, 董晓蕾. 边缘计算隐私保护研究进展[J]. 计算机研究与发展, 2020, 57(10): 2027-2051. |
[14] | 林玥, 刘鹏, 王鹤, 王文杰, 张玉清. 网络安全威胁情报共享与交换研究综述[J]. 计算机研究与发展, 2020, 57(10): 2052-2065. |
[15] | 魏立斐, 陈聪聪, 张蕾, 李梦思, 陈玉娇, 王勤. 机器学习的安全问题及隐私保护[J]. 计算机研究与发展, 2020, 57(10): 2066-2085. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4123