1(浙江工业大学信息工程学院 杭州 310023);2(浙江工业大学网络空间安全研究院 杭州 310023);3(浙江大学控制科学与工程学院 杭州 310063);4(南京航空航天大学计算机科学与技术学院 南京 211106);5(华为技术有限公司南京研究所 南京 210029);6(浙江大学计算机科学与技术学院 杭州 310063) (haibinzheng320@gmail.com)
出版日期:
2021-08-01基金资助:
国家自然科学基金项目(62072406);浙江省自然科学基金项目(LY19F020025);宁波市“科技创新2025”重大专项(2018B10063)Survey of Adversarial Attack, Defense and Robustness Analysis for Natural Language Processing
Zheng Haibin1, Chen Jinyin1,2, Zhang Yan1, Zhang Xuhong3, Ge Chunpeng4, Liu Zhe4, Ouyang Yike5, Ji Shouling61(College of Information Engineering, Zhejiang University of Technology, Hangzhou 310023);2(Cyberspace Security Research Institute, Zhejiang University of Technology, Hangzhou 310023);3(College of Control Science and Engineering, Zhejiang University, Hangzhou 310063);4(College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 211106);5(Nanjing Research Center, Huawei Technologies Co., Ltd., Nanjing 210029);6(College of Computer Science and Technology, Zhejiang University, Hangzhou 310063)
Online:
2021-08-01Supported by:
This work was supported by the National Natural Science Foundation of China (62072406), the Natural Science Foundation of Zhejiang Province (LY19F020025), and the Major Special Funding for “Science and Technology Innovation 2025” in Ningbo (2018B10063).摘要/Abstract
摘要: 随着人工智能技术的飞速发展,深度神经网络在计算机视觉、信号分析和自然语言处理等领域中都得到了广泛应用.自然语言处理通过语法分析、语义分析、篇章理解等功能帮助机器处理、理解及运用人类语言.但是,已有研究表明深度神经网络容易受到对抗文本的攻击,通过产生不可察觉的扰动添加到正常文本中,就能使自然语言处理模型预测错误.为了提高模型的鲁棒安全性,近年来也出现了防御相关的研究工作.针对已有的研究,全面地介绍自然语言处理攻防领域的相关工作,具体而言,首先介绍了自然语言处理的主要任务与相关方法;其次,根据攻击和防御机制对自然语言处理的攻击方法和防御方法进行分类介绍;然后,进一步分析自然语言处理模型的可验证鲁棒性和评估基准数据集,并提供自然语言处理应用平台和工具包的详细介绍;最后总结面向自然语言处理的攻防安全领域在未来的研究发展方向.
参考文献
相关文章 15
[1] | 孙岩, 姬伟峰, 翁江, 赵蓓英. 基于微分博弈的移动目标防御最优策略[J]. 计算机研究与发展, 2021, 58(8): 1789-1800. |
[2] | 邵天竺, 王晓亮, 陈文龙, 唐晓岚, 徐敏. 一种减少网络振动的智能路由选择算法设计[J]. 计算机研究与发展, 2021, 58(6): 1261-1274. |
[3] | 潘旭东, 张谧, 颜一帆, 陆逸凡, 杨珉. 通用深度学习语言模型的隐私风险评估[J]. 计算机研究与发展, 2021, 58(5): 1092-1105. |
[4] | 李明慧, 江沛佩, 王骞, 沈超, 李琦. 针对深度学习模型的对抗性攻击与防御[J]. 计算机研究与发展, 2021, 58(5): 909-926. |
[5] | 陈晋音, 黄国瀚, 张敦杰, 张旭鸿, 纪守领. 一种面向图神经网络的图重构防御方法[J]. 计算机研究与发展, 2021, 58(5): 1075-1091. |
[6] | 张颖君, 陈恺, 周赓, 吕培卓, 刘勇, 黄亮. 神经网络水印技术研究进展[J]. 计算机研究与发展, 2021, 58(5): 964-976. |
[7] | 汪烨, 陈骏武, 夏鑫, 姜波. 智能需求获取与建模研究综述[J]. 计算机研究与发展, 2021, 58(4): 683-705. |
[8] | 向杰, 杨哲慜, 周顺帆, 杨珉. 一种基于运行时信息的以太坊智能合约防御技术[J]. 计算机研究与发展, 2021, 58(4): 834-848. |
[9] | 吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527. |
[10] | 曾碧卿, 曾锋, 韩旭丽, 商齐. 基于交互特征表示的评价对象抽取模型[J]. 计算机研究与发展, 2021, 58(1): 224-232. |
[11] | 李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448. |
[12] | 蓝天, 彭川, 李森, 叶文政, 李萌, 惠国强, 吕忆蓝, 钱宇欣, 刘峤. 单声道语音降噪与去混响研究综述[J]. 计算机研究与发展, 2020, 57(5): 928-953. |
[13] | 王子晔, 苗夺谦, 赵才荣, 罗晟, 卫志华. 基于多粒度特征的行人跟踪检测结合算法[J]. 计算机研究与发展, 2020, 57(5): 996-1002. |
[14] | 孙胜, 李叙晶, 刘敏, 杨博, 过晓冰. 面向异构IoT设备协作的DNN推断加速研究[J]. 计算机研究与发展, 2020, 57(4): 709-722. |
[15] | 马陈城, 杜学绘, 曹利峰, 吴蓓. 基于深度神经网络burst特征分析的网站指纹攻击方法[J]. 计算机研究与发展, 2020, 57(4): 746-766. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4477