数据流上近似非可导项集的挖掘算法
外文标题:An Approximate Non-Derivable Itemset Mining Algorithm over Data Streams
文献类型:期刊
作者:黄崇争[1]
机构:[1]中国人民大学信息学院
[2]广西建设职业技术学院计算机与信息技术系
[3]中央财经大学信息学院
通讯作者:Huang, C.-Z.(52708332@qq.com)
年:2010
期刊名称:计算机学报
卷:33
期:8
页码范围:1427-1436
增刊:增刊
收录情况:EI(20103613222386)
所属部门:信息学院
语言:中文
ISSN:0254-4164
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjxb201008012.aspx
DOI:10.3724/SP.J.1016.2010.01427
人气指数:1
浏览次数:1
基金:国家"八六三"高技术研究发展计划项目基金
关键词:近似非可导频繁项集;纵向数据格式;数据流;数据流挖掘
摘要:频繁项集是通过对大规模数据进行挖掘获取的代表数据模式的知识结构.非可导频繁项集作为频繁项集的有效压缩方式,能够高效深入地挖掘海量数据、稠密数据与数据流当中的规律.针对项集在计算界限值时代价昂贵的缺点,提出了近似可导项集的概念,并基于纵向数据格式实现了挖掘算法MANDI,能够提高支持度计算和项集间操作的速度.另外,为了满足数据流实时、快速的特点,讨论并证明了近似可导项集的增量性质,提出了可动态更新的算法UANDI.通过实验验证了两种算法的可行性和有效性.
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
无线传感器网络中隐私保护通用近似查询协议.范永健;陈红;张晓莹,等.计算机学报.2014,915-926.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.
大数据下基于异步累积更新的高效P-Rank计算方法.王旭丛;李翠平;陈红.软件学报.2014,2136-2148.
符号社会网络中正负关系预测算法研究综述.蓝梦微;李翠平;王绍卿,等.计算机研究与发展.2015,52(2),410-422.