1(浙江科技学院大数据学院 杭州 310023);2(海康威视&浙江科技学院边缘智能安全联合实验室 杭州 310023);3(西安电子科技大学网络与信息安全学院 西安 710071);4(广州大学网络空间先进技术研究院 广州 510006);5(浙江大学控制科学与工程学院 杭州 310058);6(浙江大学计算机科学与技术学院 杭州 310058) (qianyg@yeah.net)
出版日期:
2021-05-01基金资助:
国家重点研发计划项目(2018YFB2100400,2018YFB1800601);国家自然科学基金项目(61902082);浙江省重点研发计划项目(2020C01077,2021C01036,2020C01021);之江实验室科技预研项目(2018FD0ZX01)An Evasion Algorithm to Fool Fingerprint Detector for Deep Neural Networks
Qian Yaguan1,2, He Niannian1,2, Guo Yankai1,2, Wang Bin2, Li Hui3, Gu Zhaoquan4, Zhang Xuhong5, Wu Chunming61(School of Big-data Science, Zhejiang University of Science and Technology, Hangzhou 310023);2(Edge Intelligence Security Joint Laboratory, Hikvision & Zhejiang University of Science and Technology, Hangzhou 310023);3(School of Cyber Engineering, Xidian University, Xi’an 710071);4(Cyberspace Institute of Advanced Technology, Guangzhou University, Guangzhou 510006);5(College of Control Science and Engineering, Zhejiang University, Hangzhou 310058);6(College of Computer Science and Technology, Zhejiang University, Hangzhou 310058)
Online:
2021-05-01Supported by:
This work was supported by the National Key Research and Development Program of China (2018YFB2100400, 2018YFB1800601), the National Natural Science Foundation of China (61902082), the Key Research and Development Program of Zhejiang Province (2020C01077, 2021C01036, 2020C01021), and the Major Scientific Project of Zhejiang Lab (2018FD0ZX01).摘要/Abstract
摘要: 随着深度神经网络在不同领域的成功应用,模型的知识产权保护成为了一个备受关注的问题.由于深度神经网络的训练需要大量计算资源、人力成本和时间成本,攻击者通过窃取目标模型参数,可低成本地构建本地替代模型.为保护模型所有者的知识产权,最近提出的模型指纹比对方法,利用模型决策边界附近的指纹样本及其指纹查验模型是否被窃取,具有不影响模型自身性能的优点.针对这类基于模型指纹的保护策略,提出了一种逃避算法,可以成功绕开这类保护策略,揭示了模型指纹保护的脆弱性.该逃避算法的核心是设计了一个指纹样本检测器——Fingerprint-GAN.利用生成对抗网络(generative adversarial network, GAN)原理,学习正常样本在隐空间的特征表示及其分布,根据指纹样本与正常样本在隐空间中特征表示的差异性,检测到指纹样本,并向目标模型所有者返回有别于预测的标签,使模型所有者的指纹比对方法失效.最后通过CIFAR-10,CIFAR-100数据集评估了逃避算法的性能,实验结果表明:算法对指纹样本的检测率分别可达95%和94%,而模型所有者的指纹比对成功率最高仅为19%,证明了模型指纹比对保护方法的不可靠性.
参考文献
相关文章 5
[1] | 付章杰, 李恩露, 程旭, 黄永峰, 胡雨婷. 基于深度学习的图像隐写研究进展[J]. 计算机研究与发展, 2021, 58(3): 548-568. |
[2] | 于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530. |
[3] | 张宪, 史沧红, 李孝杰. 基于特征对抗对的视觉特征归因网络研究[J]. 计算机研究与发展, 2020, 57(3): 604-615. |
[4] | 田继伟,王劲松,石凯. 基于PU与生成对抗网络的POI定位算法[J]. 计算机研究与发展, 2019, 56(9): 1843-1850. |
[5] | 戴臣超,王洪元,倪彤光,陈首兵. 基于深度卷积生成对抗网络和拓展近邻重排序的行人重识别[J]. 计算机研究与发展, 2019, 56(8): 1632-1641. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4415