摘要:聚类作为无监督学习技术,已在实际中得到了广泛的应用.但是对于带有噪声的数据集,一些主流算法仍然存在着噪声去除不彻底和聚类结果不准确等问题.提出了一种基于密度差分的自动聚类算法(clustering based on density difference,简称CDD),实现了对含有噪声数据集的自动分类.所提算法根据噪声数据和有用数据密度的不同,实现了去噪声和数据的分类,并通过构建数据间的邻域,进一步实现了对有用数据间不同类别的划分.通过实验验证了所提算法的有效性.
Abstract:As an unsupervised learning technology, clustering has been widely used in practice. However, some mainstream algorithms still have problems such as incomplete noise removal and inaccurate clustering results for the datasets with noise. In this paper, an automatic clustering algorithm based on density difference (CDD) is proposed to realize automatic classification of the datasets containing the noise. The algorithm is based on the density difference between noise data and useful data to achieve removing noise and data classification. Moreover, the useful data are classified into different classes through the neighborhood construction procedure. Experimental results demonstrate that the CDD algorithm has high performance.
PDF全文下载地址:
http://jos.org.cn/jos/article/pdf/5415
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于密度差分的自动聚类算法
本站小编 Free考研考试/2022-01-02
相关话题/数据 实验 技术 噪声 算法
多视角数据缺失补全
摘要:随着信息技术的快速发展,现实生活中不断涌现出大量的多视角数据,由此应运而生的多视角学习已成为机器学习领域的研究热点.然而,在数据获取过程中,由于收集的难度、高额成本或设备故障等问题,往往导致收集到的多视角数据出现视角缺失,这使得一些多视角学习方法无法有效进行.为此,提出一种基于视角相容性的多视 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于同态加密系统的图像鲁棒可逆水印算法
摘要:同态加密技术可用于保护数据隐私并允许对密文数据进行算术操作,在云计算安全上有着很好的应用前景.针对云计算中的隐私保护和数据安全等问题,提出了一种基于同态加密系统的图像鲁棒可逆水印算法,主要思想为:(1)对原始图像进行分块和利用Paillier加密系统进行加密得到密文图像;(2)在加密域中,通过 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于权值不确定性的玻尔兹曼机算法
摘要:受限制的玻尔兹曼机(RBM)是一种无向图模型.基于RBM的深度学习模型包括深度置信网(DBN)和深度玻尔兹曼机(DBM)等.在神经网络和RBM的训练过程中,过拟合问题是一个比较常见的问题.针对神经网络的训练,权值随机变量(weightrandomvariables)、Dropout方法和早期停 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02HMOFA:一种混合型多目标萤火虫算法
摘要:现实中不断涌现出数目众多且日益复杂的多目标优化问题,迫切需要发展新型多目标优化算法以应对挑战.将基本萤火虫算法拓展至多目标优化领域,提出一种混合型多目标萤火虫算法HMOFA(hybridmulti-objectivefireflyalgorithm).该算法提出使用混合水平正交实验设计和连续决 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于图结构的大数据分析与管理技术专刊前言
摘要:Abstract:PDF全文下载地址:http://jos.org.cn/jos/article/pdf/5458 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02分布式图处理系统技术综述
摘要:图作为一种基本的数据类型,是对现实世界中对象及其关联关系的一种抽象.现实中,许多科学问题都可以被模型化为图的问题,因此,对图数据进行分析非常重要.图数据分析在语义Web分析、社交网络、生物基因分析以及信息检索等领域有着广泛的应用.随着移动互联、物联网等信息技术的发展,图数据的规模处于持续增长的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于MapReduce的图结构聚类算法
摘要:图结构聚类(SCAN)是一种著名的基于密度的图聚类算法,该算法不仅能够找到图中的聚类结构,而且还能发现图中的Hub节点和离群节点.然而,随着图数据规模越来越大,传统的SCAN算法的复杂度为O(m1.5)(m为图中边的条数),因此很难处理大规模的图数据.为了解决SCAN算法的可扩展性问题,提出一 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02动态图模式匹配技术综述
摘要:随着大数据时代的到来,多源异构数据的快速增长已经成为开放性问题,数据之间的内在关联通常可以用图数据的形式来表现.然而在实际应用中,例如网络安全分析和社交网络舆情分析,描述实体对象之间关系的图数据的结构和内容往往不是固定不变的,图数据的结构以及节点和边的属性会随着时间的推移发生更新变化.因此,如 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02路网环境下的最近邻查询技术
摘要:最近邻查询作为基于位置服务的重要支持性技术之一,引起了众多****的广泛关注和深入研究.相对于欧式空间而言,路网环境下的最近邻查询更贴近人们的生活,有着更重要的研究意义.路网环境下庞大的数据量和复杂的数据结构,使得最近邻查询的操作代价变得非常昂贵,如何有效地提高查询效率,是研究者面临的主要挑战 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02社交网络高效高精度去匿名化算法
摘要:自从社交网络成为重要的研究课题,社交网络隐私保护也成为了重要的研究内容,尤其是关于公开发布以供研究的大规模社交网络图数据的隐私保护.为了评估用户的隐私风险,研究者们设计了不同的方法对图进行去匿名化,在不同的图网络中识别个体的身份.但是,当前的去匿名化算法或者需要高质量的种子匹配,或者在精确度和 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02