一种基于压缩矩阵的改进Apriori算法
刘芳(

华南理工大学数学学院, 广东 广州 510641
收稿日期:
2018-05-31出版日期:
2018-12-20发布日期:
2018-12-26通讯作者:
吴广潮E-mail:913259707@qq.com;magchwu@scut.edu.com作者简介:
刘芳(1996—),女,河南驻马店人,硕士研究生,主要研究方向为数据挖掘和机器学习. E-mail:基金资助:
国家自然科学基金面上项目(61370102)An improved Apriori algorithm based on compression matrix
Fang LIU(

School of Mathematics, South China University of Technology, Guangzhou 510641, Guangdong, China
Received:
2018-05-31Online:
2018-12-20Published:
2018-12-26Contact:
Guangchao WU E-mail:913259707@qq.com;magchwu@scut.edu.comSupported by:
国家自然科学基金面上项目(61370102)摘要/Abstract
摘要: 针对Apriori算法需要频繁扫描事务数据库并且会产生大量候选项集的不足,提出一种改进的Apriori算法。采用矩阵压缩的思想,增加了3个向量,分别表示事务矩阵中各行各列1的个数,即事务项目数和项目支持数,以及重复的事务出现次数,从而减小矩阵规模,避免多次扫描数据库。在矩阵运算过程中,对矩阵中事务项目数和项目支持数进行排序并删除不满足条件的项集和非频繁项集,形成新的矩阵结构,提高空间效率。对改进后的算法进行性能分析和试验分析发现,该算法相对于Apriori算法具有更高的效率,同时可以更有效的挖掘出频繁项集。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1777