删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种基于邻接表的最大频繁项集挖掘算法

本站小编 Free考研考试/2022-01-03

殷茗1,
王文杰1,,,
张煊宇1,
姜继娇2
1.西北工业大学软件与微电子学院 西安 710072
2.西北工业大学管理学院 西安 710072
基金项目:教育部人文与社会科学基金(16YJA630068, 18YJA630043),航空科学基金(2016ZG53071),陕西省自然科学基础研究计划项目(2018JM7008),陕西省社会科学基金(2018S28),西北工业大学研究生种子基金(ZZ2018222)

详细信息
作者简介:殷茗:女,1978年生,博士,副教授,主要研究方向为企业信息化、信息管理与信息系统、电子服务
王文杰:男,1992年生,硕士,主要研究方向为数据挖掘、机器学习
张煊宇:男,1995年生,硕士,主要研究方向为信息管理与信息系统
姜继娇:男,1979年生,博士,副教授,主要研究方向为行为金融与风险管理
通讯作者:王文杰 wenjie@mail.nwpu.edu.cn
中图分类号:TP311.5

计量

文章访问数:1437
HTML全文浏览量:892
PDF下载量:58
被引次数:0
出版历程

收稿日期:2018-07-08
修回日期:2019-05-17
网络出版日期:2019-05-29
刊出日期:2019-08-01

A Maximal Frequent Itemsets Mining Algorithm Based on Adjacency Table

Ming YIN1,
Wenjie WANG1,,,
Xuanyu ZHANG1,
Jijiao JIANG2
1. Institute of Software and Microelectronics, Northwestern Polytechnical University, Xi’an 710072, China
2. Management School, Northwestern Polytechnical University, Xi’an 710072, China
Funds:Ministry of Education Humanities and Social Science Foundation (16YJA630068, 18YJA630043), Aeronautical Science Fund of China (2016ZG53071), Shaanxi Natural Science Basic Research Project (2018JM7008), Shaanxi Social Science Foundation Project (2018S28), Graduate Student Seed Fund Project of Northwestern Polytechnical University (ZZ2018222)


摘要
摘要:针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次,同时用哈希表对邻接表进行辅助存储,减小了遍历的空间规模。理论分析与实验结果表明,该算法时间与空间复杂度较低,提高了最大频繁项集挖掘速率,尤其在处理稠密数据集时具有较好的优越性。
关键词:数据挖掘/
频繁项集/
Apriori/
FP-Growth/
FP-Tree
Abstract:To solve the problems of Apriori algorithm and FP-Growth algorithm in the process of mining the maximal frequent itemsets, which refer to inefficient operation, high memory consumption, difficulty in adapting to the process of dense datasets, and affecting the time-effectiveness of large data value mining, this paper proposes a maximal frequent itemsets mining algorithm based on adjacency table. The algorithm only needs to traverse the database once and adopts the hash table to store the adjacency table, which reduces the memory consumption. Theoretical analysis and experimental results show that the algorithm has lower time and space complexity and improves the mining rate of maximal frequent itemsets, especially when dealing with dense datasets.
Key words:Data mining/
Frequent itemsets/
Apriori/
FP-Growth/
FP-Tree



PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=814c3f90-c787-4d85-a41f-fba40c96a52e
相关话题/西北工业大学 基金 数据 博士 社会科学