NB-MAFIA: 基于N-List的最长频繁项集挖掘算法
沈戈晖1, 刘沛东1, 邓志鸿2,3 1. 北京大学信息科学技术学院计算机科学技术系, 北京 1008712. 北京大学信息科学技术学院智能科学系, 北京 100871
3. 北京大学机器感知与智能教育部重点实验室, 北京 100871
收稿日期:
2014-12-30出版日期:
2016-03-20基金资助:
国家自然科学基金(61170091)和863 计划(2015AA015403)资助NB-MAFIA: An N-List Based Maximal Frequent Itemset Algorithm
SHEN Gehui1, LIU Peidong1, DENG Zhihong2,3 1. Department of Computer Science and Technology, School of Electronics Engineering and Computer Science, Peking University, Beijing 1008712. Department of Machine Intelligence, School of Electronics Engineering and Computer Science, Peking University, Beijing 100871
3. Key Laboratory Machine Perception (MOE), Peking University, Beijing 100871
Received:
2014-12-30Published:
2016-02-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 本文在深度优先搜索的框架上, 引入基于项集前缀树节点链表的项集表示方法N-List, 提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算, 同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上, 通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法, 尤其在真实和稠密数据集上优势更为明显。
中图分类号:
-->TP302
引用本文
沈戈晖, 刘沛东, 邓志鸿. NB-MAFIA: 基于N-List的最长频繁项集挖掘算法[J]. 北京大学学报(自然科学版), 2016, 52(2): 199-209.
SHEN Gehui, LIU Peidong, DENG Zhihong. NB-MAFIA: An N-List Based Maximal Frequent Itemset Algorithm[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(2): 199-209.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2840