基于连续特征的未知协议消息聚类算法
卢政宇(),李光松,申莹珠,张彬信息工程大学, 河南 郑州 450001
收稿日期:
2018-09-20出版日期:
2019-05-20发布日期:
2019-05-09作者简介:
卢政宇(1993—),男,硕士研究生,研究方向为密码协议分析. E-mail:基金资助:
国家重点研发计划资助项目(2016YFB080010);国家重点研发计划资助项目(2016YFB0800100);国家自然科学基金创新研究群体项目(61521003)Unknown protocol message clustering algorithm based on continuous features
Zheng-yu LU(),Guang-song LI,Ying-zhu SHEN,Bin ZHANGInformation Engineering University, Zhengzhou 450001, Henan, China
Received:
2018-09-20Online:
2019-05-20Published:
2019-05-09Supported by:
国家重点研发计划资助项目(2016YFB080010);国家重点研发计划资助项目(2016YFB0800100);国家自然科学基金创新研究群体项目(61521003)摘要/Abstract
摘要: 对未知协议消息序列进行聚类处理是分析协议格式的基础。从字符串匹配的角度出发,利用协议格式字段的连续性,在传统K-均值算法基础上提出一种基于连续特征的未知协议消息聚类算法。首先基于协议格式字段连续性对待测数据集进行粗聚类,提取出K-均值算法的初始聚类中心,再使用消息距离及收敛函数改进的迭代算法对数据进行迭代处理实现消息的进一步聚类。实验表明,提出的新方法与传统K-均值算法相比,在聚类准确度上提升了17.58%,迭代次数上减少了约58.27%,与EM算法、DBSCAN算法相比在聚类准确率与时间上均有明显提升。
PDF全文下载地址:
http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3077