一种基于邻接表的最大频繁项集挖掘算法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

殷茗¹,
王文杰^1,,,
张煊宇¹,
姜继娇²
1.西北工业大学软件与微电子学院西安 710072
2.西北工业大学管理学院西安 710072
基金项目:教育部人文与社会科学基金(16YJA630068, 18YJA630043)，航空科学基金(2016ZG53071)，陕西省自然科学基础研究计划项目(2018JM7008)，陕西省社会科学基金(2018S28)，西北工业大学研究生种子基金(ZZ2018222)

详细信息

作者简介:殷茗：女，1978年生，博士，副教授，主要研究方向为企业信息化、信息管理与信息系统、电子服务
王文杰：男，1992年生，硕士，主要研究方向为数据挖掘、机器学习
张煊宇：男，1995年生，硕士，主要研究方向为信息管理与信息系统
姜继娇：男，1979年生，博士，副教授，主要研究方向为行为金融与风险管理

通讯作者:王文杰　wenjie@mail.nwpu.edu.cn

中图分类号:TP311.5

计量

文章访问数:1437
HTML全文浏览量:892
PDF下载量:58
被引次数:0

出版历程

收稿日期:2018-07-08
修回日期:2019-05-17
网络出版日期:2019-05-29
刊出日期:2019-08-01

A Maximal Frequent Itemsets Mining Algorithm Based on Adjacency Table

Ming YIN¹,
Wenjie WANG^1,,,
Xuanyu ZHANG¹,
Jijiao JIANG²
1. Institute of Software and Microelectronics, Northwestern Polytechnical University, Xi’an 710072, China
2. Management School, Northwestern Polytechnical University, Xi’an 710072, China
Funds:Ministry of Education Humanities and Social Science Foundation (16YJA630068, 18YJA630043), Aeronautical Science Fund of China (2016ZG53071), Shaanxi Natural Science Basic Research Project (2018JM7008), Shaanxi Social Science Foundation Project (2018S28), Graduate Student Seed Fund Project of Northwestern Polytechnical University (ZZ2018222)

摘要
摘要:针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题，该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次，同时用哈希表对邻接表进行辅助存储，减小了遍历的空间规模。理论分析与实验结果表明，该算法时间与空间复杂度较低，提高了最大频繁项集挖掘速率，尤其在处理稠密数据集时具有较好的优越性。
关键词:数据挖掘/
频繁项集/
Apriori/
FP-Growth/
FP-Tree
Abstract:To solve the problems of Apriori algorithm and FP-Growth algorithm in the process of mining the maximal frequent itemsets, which refer to inefficient operation, high memory consumption, difficulty in adapting to the process of dense datasets, and affecting the time-effectiveness of large data value mining, this paper proposes a maximal frequent itemsets mining algorithm based on adjacency table. The algorithm only needs to traverse the database once and adopts the hash table to store the adjacency table, which reduces the memory consumption. Theoretical analysis and experimental results show that the algorithm has lower time and space complexity and improves the mining rate of maximal frequent itemsets, especially when dealing with dense datasets.
Key words:Data mining/
Frequent itemsets/
Apriori/
FP-Growth/
FP-Tree

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=814c3f90-c787-4d85-a41f-fba40c96a52e

相关话题/西北工业大学 基金 数据 博士 社会科学

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
无可信第三方的数据匿名化收集协议
周治平1,2,,,李智聪11.江南大学物联网工程学院??无锡??2141222.江南大学物联网技术应用教育部工程研究中心??无锡??214122详细信息作者简介:周治平：男，1962年生，博士，教授，研究方向为检测技术与自动化装置、信息安全等李智聪：男，1992年生，硕士生，研究方向为物联网安全认证 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种利用少快拍数据的宽带干扰鲁棒性抑制算法
王昊1,,,徐晓男2,马启明21.杭州应用声学研究所??杭州??3100232.杭州应用声学研究所声呐技术重点实验室??杭州??310023详细信息作者简介:王昊：男，1989年生，工程师，研究方向为阵列信号处理徐晓男：男，1981年生，高级工程师，研究方向为阵列信号处理、水声信号处理马启明：男，1 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
多变量时间序列中基于克罗内克压缩感知的缺失数据预测算法
郭艳,宋晓祥,,李宁,钱鹏陆军工程大学通信工程学院??南京??210007基金项目:国家自然科学基金(61571463,61371124,61472445)；江苏省自然科学基金(BK20171401)详细信息作者简介:郭艳：女，1971年生，教授，研究方向为大数据、信号处理、压缩感知宋晓祥：男，19 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
面向带宽碎片最小化和QoS保障的数据中心网络流量调度算法
唐宏,王欣欣,,刘亦星重庆邮电大学移动通信技术重庆市重点实验室??重庆??400065基金项目:****和创新团队发展计划(IRT_16R72)详细信息作者简介:唐宏：男，1967年生，教授，研究方向为计算机网络、移动通信王欣欣：女，1994年生，硕士生，研究方向为数据中心网络、软件定义网络刘亦星： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于四阶累积量张量联合对角化的多数据集联合盲源分离
龚晓峰1,,,毛蕾1,林秋华1,徐友根2,刘志文21.大连理工大学信息与通信工程学院??大连??1160242.北京理工大学信息与电子学院??北京??100081基金项目:国家自然科学基金面上项目(61671106,61871067)，国家自然科学基金重点项目(61331019)详细信息作者简介:龚 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于马尔科夫分割的单极化SAR数据洪涝水体检测方法
唐德可1,2,3,王峰1,2,,,王宏琦1,2,31.中国科学院大学??北京??1000492.中国科学院电子学研究所??北京??1001903.中国科学院空间信息处理与应用系统技术重点实验室??北京??100190详细信息作者简介:唐德可：男，1980年生，高级工程师，博士生，研究方向为动态目标识 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于删失数据的低通信量融合检测方法
曹鼎,,周生华,刘宏伟,高畅,邵志强1.西安电子科技大学雷达信号处理国家重点实验室??西安??7100712.西安电子科技大学信息感知技术协同创新中心??西安??710071基金项目:国家自然科学基金(61372134,61401329,61501351)，国家****科学基金(61525105)详 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于实测数据的空中目标分类识别算法
李明,吴娇娇,,左磊,宋万杰,刘慧敏1.西安电子科技大学雷达信号处理国家重点实验室??西安??7100712.西安电子科技大学雷达技术协同创新中心??西安??710071基金项目:国防预研基金(61424010302162401002)，国家自然科学基金(61501342)，陕西省自然科学基金(20 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于信号-数据联合处理的压制-距离欺骗复合干扰抑制算法
王国宏,白杰,,孙殿星,张翔宇海军航空大学信息融合研究所??烟台??264001基金项目:国家自然科学基金(61731023,61701519,61501489)；泰山****攀登计划详细信息作者简介:王国宏：男，1963年生，教授，博士生导师，研究方向为雷达抗干扰、信息融合等白杰：男，1993年生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于拓扑的命名数据网络缓存优化策略
魏欣1,,,颜拥2,郭少勇1,于卓3,邱雪松11.北京邮电大学网络与交换技术国家重点实验室??北京??1008762.国网浙江省电力公司电力科学研究院??杭州??3100093.北京中电普华信息技术有限公司??北京??100192基金项目:国家自然科学基金(61702048)，国家电网公司科技项目( ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03