一种分布式数据集上top-n异常点挖掘的高效算法
文献类型:会议
作者:张重生[1]
机构: 中国人民大学信息学院;数据工程与知识工程教育部重点实验室
年:2008
会议名称:第二十五届中国数据库学术会议
会议论文集: 科学出版社(Science Press)
页码范围:6
会议地点:中国广西桂林
会议开始日期:2008-10-24
所属部门:信息学院
语言:中文
关键词:异常点挖掘;分布式数据集;top-n
摘要:异常点挖掘是一种从数据中分析并发现潜在的反常对象的数据挖掘技术,它在实际生活中有很多的应用,如入侵检测、金融数据分析、病症数据分析等.异常点挖掘具体技术与所研究的数据类型和数据环境有密切关系,已有研究大多是假定数据是集中分布在一张单表上的,而实际应用中很多数据是分布式的.分析了水平分布的数据集上异常点挖掘的问题,并提出了一个改进的基于Birch的分布式数据集中上top-n异常点挖掘的算法MOD.MOD首先在各分支节点上提取聚类特征概要信息,并将其发送到查询节点.查询节点同步地构造特征向量树CF-tree,并使用K-Means算法对CF-tree的叶节点聚类生成微聚类.通过估量微聚类的异常值的范...
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
无线传感器网络中隐私保护通用近似查询协议.范永健;陈红;张晓莹,等.计算机学报.2014,915-926.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.
大数据下基于异步累积更新的高效P-Rank计算方法.王旭丛;李翠平;陈红.软件学报.2014,2136-2148.
符号社会网络中正负关系预测算法研究综述.蓝梦微;李翠平;王绍卿,等.计算机研究与发展.2015,52(2),410-422.