大数据模式分解的隐私保护研究
外文标题:Privacy Preserving Based on Model Division for Large Data
文献类型:期刊
作者:李宁[1]
机构:[1]中国人民大学信息学院计算机系
[2]中国人民大学信息学院计算机系
年:2012
期刊名称:计算机科学与探索
卷:06
期:11
页码范围:961-973
增刊:增刊
收录情况:中国科技核心期刊
所属部门:信息学院
语言:中文
ISSN:1673-9418
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjkxyts201211001.aspx
DOI:10.3778/j.issn.1673-9418.2012.11.001
人气指数:1
浏览次数:1
基金:国家自然科学基金
关键词:数据隐私保护;属性聚类;模式分解
摘要:现有的大多数隐私保护技术往往忽略了敏感属性不同取值和准标识符属性之间存在的特殊关联,并且各领域对数据隐私保护的多方面要求,使得发布的匿名数据需要满足复合隐私约束.对近似敏感属性值和复合隐私约束进行分析,提出了基于大数据模式分解和聚类分析的隐私保护算法.给出了聚类敏感属性值保护相似值方法,设置不同权重的敏感属性,保留重要的属性.使用三维不规则结构矩阵的效用矩阵,来获取精度较高的匿名数据,实现匿名数据的模式分解.在真实数据集上的大量实验结果表明,该算法的数据精确率、数据纠错率都有明显提升,近似攻击率降低.
作者其他论文
基于压缩全文索引的演变图查询.肖洋;朱青;吴粤皖.计算机工程与应用.2015,117-124.
时序图上动态子图查询优化算法.朱青;李红.计算机科学与探索.2014.
完善我国地方税体系的构想.朱青.财贸经济.2014,5-13.
HyDB:集成MapReduce和数据库的高效SaaS架构.覃左言;朱青;李伏.小型微型计算机系统.2012,33(3),512-518.
基于语义相似度的Web信息可信分析.王腾;朱青;王珊.计算机学报.2013,36(8),1668-1681.