基于对称KL距离的用户行为时序聚类方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

李文璟,
曾祥健^,,
李梦,
喻鹏
北京邮电大学网络与交换技术国家重点实验室 ??北京 ??100876
基金项目:国家电网公司科技项目(52010116000W)

详细信息

作者简介:李文璟：女，1973年生，教授，研究方向为网络管理与通信软件、未来网络智能管理
曾祥健：男，1993年生，硕士生，研究方向为网络管理与智能信息处理
李梦：女，1993年生，硕士生，研究方向为网络管理与智能信息处理
喻鹏：男，1986年生，副教授，研究方向为基于人工智能的网络管理

通讯作者:曾祥健　 zeng_fsh@163.com

中图分类号:TN915.07

计量

文章访问数:1443
HTML全文浏览量:372
PDF下载量:60
被引次数:0

出版历程

收稿日期:2018-01-04
修回日期:2018-06-27
网络出版日期:2018-07-30
刊出日期:2018-10-01

Time Series Method Clustering in User Behavior Based on Symmetric Kullback-Leibler Distance

Wenjing LI,
Xiangjian ZENG^,,
Meng LI,
Peng YU
State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China
Funds:The Project of Science and Technology of State Grid Corporation of China (52010116000W)

摘要
摘要:网络用户随时间变化的行为分析是近年来用户行为分析的热点，通常为了发现用户行为的特征需要对用户做聚类处理。针对用户时序数据的聚类问题，现有研究方法存在计算性能差，距离度量不准确的缺点，无法处理大规模数据。为了解决上述问题，该文提出基于对称KL距离的用户行为时序聚类方法。首先将时序数据转化为概率模型，从划分聚类的角度出发，在距离度量中引入KL距离，用以衡量不同用户间的时间分布差异。针对实网数据中数据规模大的特点，该方法在聚类的各个环节针对KL距离的特点做了优化，并证明了一种高效率的聚类质心求解办法。实验结果证明，该算法相比采用欧式距离和DTW距离度量的聚类算法能提高4%的准确度，与采用medoids聚类质心的聚类算法相比计算时间少了一个量级。采用该算法对实网环境中获取的用户流量数据处理证明了该算法拥有可行的应用价值。
关键词:时序聚类/
用户分析/
Kullback-Leibler距离
Abstract:Behavioral analysis of Internet users over time is a hot spot in user behavior analysis in recent years, usually clustering users is a way to find the feature of user behavior. Problems like poor computing performance or inaccurate distance metric exist in present research about clustering user time series data, which is unable to deal with large scale data. To solve this problem, a method for clustering time series in user behavior is proposed based on symmetric Kullback-Leibler (KL) distance. First time series data is transformed into probability models, and then a distance metric named KL distance is introduce, using partition clustering method, the different time distribution between different users. For the Large-scale feature of physical network data, each process of clustering is optimized based on the characteristics of KL distance. It also proves an efficient solution for finding the clustering centroids. The experimental results show that this method can improve the accuracy of 4% compared with clustering algorithm using the Euclidean distance metric or DTW metric, and the calculation time of this method is less a quantity degree than clustering algorithm using medoids centroids. This method is used to deal with user traffic data obtained in physical network which proves its application value.
Key words:Time series clustering/
User analysis/
Kullback-Leibler distance

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=f804164a-8401-420b-ab36-fc191957ea5f

相关话题/数据 网络 智能 计算 信息

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
融合空间-时间双网络流和视觉注意的人体行为识别
刘天亮1,,,谯庆伟1,万俊伟1,戴修斌1,罗杰波21.南京邮电大学江苏省图像处理与图像通信重点实验室??南京??2100032.罗彻斯特大学计算机科学系??纽约州??罗彻斯特市??14627基金项目:国家自然科学基金(61001152,31200747,61071091,61071166,6117 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于信号-数据联合处理的压制-距离欺骗复合干扰抑制算法
王国宏,白杰,,孙殿星,张翔宇海军航空大学信息融合研究所??烟台??264001基金项目:国家自然科学基金(61731023,61701519,61501489)；泰山****攀登计划详细信息作者简介:王国宏：男，1963年生，教授，博士生导师，研究方向为雷达抗干扰、信息融合等白杰：男，1993年生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于自适应波段聚类主成分分析和反向传播神经网络的高光谱图像压缩
陈善学,张燕琪,1.重庆邮电大学通信与信息工程学院??重庆??4000652.重庆邮电大学移动通信技术重庆市重点实验室??重庆??400065基金项目:国家自然科学基金(61271260)，重庆市教委科学技术研究项目(KJ1400416)详细信息作者简介:陈善学：男，1966年生，教授，研究方向为图 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
软件定义网络中基于密码标识的报文转发验证机制
秦晰,唐国栋,,常朝稳,王瑞云信息工程大学??郑州??450001基金项目:国家自然科学基金(61572517)详细信息作者简介:秦晰：女，1978年生，副教授，硕士生导师，研究方向为SDN安全、可信计算唐国栋：男，1992年生，硕士生，研究方向为SDN安全常朝稳：男，1965年生，教授，博士生导师 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种无线传感器网络中目标跟踪的自适应节点调度算法
胡波,王祺尧,冯辉,,罗灵兵1.复旦大学信息科学与工程学院??上海??2004332.复旦大学智慧网络与系统研究中心??上海??200433基金项目:国家自然科学基金(61501124)，上海市公安局科学技术发展基金(2017012)详细信息作者简介:胡波：男，1968年生，教授，研究方向为数字信号 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于拓扑的命名数据网络缓存优化策略
魏欣1,,,颜拥2,郭少勇1,于卓3,邱雪松11.北京邮电大学网络与交换技术国家重点实验室??北京??1008762.国网浙江省电力公司电力科学研究院??杭州??3100093.北京中电普华信息技术有限公司??北京??100192基金项目:国家自然科学基金(61702048)，国家电网公司科技项目( ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
流特征感知的软件定义网络控制器动态关联机制
张少军,,兰巨龙,江逸茗,孙鹏浩国家数字交换系统工程技术研究中心??郑州??450002基金项目:国家自然科学基金(61521003,61572519,61502530)，国家863计划项目(2015AA016102)详细信息作者简介:张少军：男，1989年生，博士生，研究方向为软件定义网络兰巨龙： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
非理想信道状态信息的认知无线网络下行功率分配和波束赋形方法
季中恒,,季新生,黄开枝国家数字交换系统工程技术研究中心??郑州??450002基金项目:国家863计划(SS2015AA011306)，国家自然科学基金(61379006,61521003)详细信息作者简介:季中恒：男，1971年生，副研究员，研究方向为无线通信理论及技术应用季新生：男，1968年 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于目标高度先验信息的多站时差无源定位方法
秦兆涛1,王俊1,魏少明1,,,毕严先2,魏子翔11.北京航空航天大学电子信息工程学院　北京　1001912.中国电子科技集团电子科学研究院　北京　100041基金项目:国家自然科学基金(61501011,61501012,61671035)详细信息作者简介:秦兆涛：男，1989年生，博士生，研究方 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于互信息的荧光素眼底血管造影图像序列的自动配准方法
刘小燕1,,,王皓浩1,孙刚1,张谱2,刘敏1,高玲21.湖南大学电气与信息工程学院??长沙??4100822.中南大学湘雅附属第二医院??长沙??410011详细信息作者简介:刘小燕：女，1973年生，教授，博士生导师，研究方向为图像处理技术及其应用、智能建模与控制王皓浩：男，1994年生，硕士生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03