语义分析及向量化大数据跨站脚本攻击智检
张海军1(),陈映辉2,*()1. 嘉应学院计算机学院, 广东 梅州 514015
2. 嘉应学院数学学院, 广东 梅州 514015
收稿日期:
2019-01-29出版日期:
2020-04-20发布日期:
2020-04-16通讯作者:
陈映辉E-mail:nihaoba_456@163.com作者简介:
张海军(1978—),男,江西赣州人,讲师,博士,主要研究方向为智能计算,智能控制,模式识别,深度学习等. E-mail:基金资助:
国家自然科学基金资助项目(61171141);国家自然科学基金资助项目(61573145);广东省自然科学基金重点资助项目(2014B010104001);广东省自然科学基金重点资助项目(2015A030308018);广东省普通高等学校人文社会科学省市共建重点研究基地资助项目(18KYKT11);广东省嘉应学院自然科学基金重点资助项目(2017KJZ02)Semantic analysis and vectorization for intelligent detection of big data cross-site scripting attacks
Haijun ZHANG1(),Yinghui CHEN2,*()1. School of Computer, Jiaying University, Meizhou 514015, Guangdong, China
2. School of Mathematics, Jiaying University, Meizhou 514015, Guangdong, China
Received:
2019-01-29Online:
2020-04-20Published:
2020-04-16Contact:
Yinghui CHEN E-mail:nihaoba_456@163.comSupported by:
国家自然科学基金资助项目(61171141);国家自然科学基金资助项目(61573145);广东省自然科学基金重点资助项目(2014B010104001);广东省自然科学基金重点资助项目(2015A030308018);广东省普通高等学校人文社会科学省市共建重点研究基地资助项目(18KYKT11);广东省嘉应学院自然科学基金重点资助项目(2017KJZ02)摘要/Abstract
摘要: 基于语义情景分析及向量化对访问流量语料库大数据进行词向量化处理,实现面向大数据跨站脚本攻击智能检测。利用自然语言处理方法进行数据获取、数据清洗、数据抽样、特征提取等数据预处理。设计基于神经网络的词向量化算法,实现词向量化得到词向量大数据;通过理论分析和推导,实现多种不同深度的长短时记忆网络智能检测算法。设计不同的超参数并进行反复试验,分别得到最大识别率为0.999 5、最低识别率为0.264 3、识别率均值为99.88%、方差为0、标准差为0.000 4的识别率变化过程曲线图、损失误差变化过程曲线图、词向量样本余弦距离变化曲线图和平均绝对误差变化过程曲线图等。研究结果表明该算法有高识别率、稳定性强、总体性能优良等优点。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1917