摘要:受限制的玻尔兹曼机(RBM)是一种无向图模型.基于RBM的深度学习模型包括深度置信网(DBN)和深度玻尔兹曼机(DBM)等.在神经网络和RBM的训练过程中,过拟合问题是一个比较常见的问题.针对神经网络的训练,权值随机变量(weight random variables)、Dropout方法和早期停止方法已被用于缓解过拟合问题.首先,改变RBM模型中的训练参数,使用随机变量代替传统的实值变量,构建了基于随机权值的受限的波尔兹曼机(weight uncertainty RBM,简称WRBM),接下来,在WRBM基础上构建了相应的深度模型:Weight uncertainty Deep Belief Network(WDBN)和Weight uncertainty Deep Boltzmann Machine(WDBM),并且通过实验验证了WDBN和WDBM的有效性.最后,为了更好地建模输入图像,引入基于条件高斯分布的RBM模型,构建了基于spike-and-slab RBM(ssRBM)的深度模型,并通过实验验证了模型的有效性.
Abstract:Based on the restricted Boltzmann machine (RBM), which is a probabilistic graphical model, deep learning models contain deep belief net (DBN) and deep Boltzmann machine (DBM). The overfitting problems commonly exist in neural networks and RBM models. In order to alleviate the overfitting problem, this paper introduces weight random variables to the conventional RBM model and, then builds weight uncertainty deep models based on maximum likelihood estimation. In the experimental section, the paper verifies the effectiveness of the weight uncertainty RBM. In order to improve the image recognition ability, the paper introduces the spike-and-slab RBM (ssRBM) to weight uncertainty RBM and then builds the deep models. The experiments show that the deep models based on weight random variables are effective.
PDF全文下载地址:
http://jos.org.cn/jos/article/pdf/5263
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于权值不确定性的玻尔兹曼机算法
本站小编 Free考研考试/2022-01-02
相关话题/实验 图像 模型 深度 变量
基于边采样的网络表示学习模型
摘要:近年来,以微博、微信、Facebook为代表的社交网络不断发展,网络表示学习引起了学术界和工业界的广泛关注.传统的网络表示学习模型利用图矩阵表示的谱特性,由于其效率低下、效果不佳,难以应用到真实网络中.近几年,基于神经网络的表示学习方法因算法效率高、较好地保存了网络结构信息,逐渐成为网络表示学 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02深度网络模型压缩综述
摘要:深度网络近年来在计算机视觉任务上不断刷新传统模型的性能,已逐渐成为研究热点.深度模型尽管性能强大,然而由于参数数量庞大、存储和计算代价高,依然难以部署在受限的硬件平台上(如移动设备).模型的参数在一定程度上能够表达其复杂性,相关研究表明,并不是所有的参数都在模型中发挥作用,部分参数作用有限、表 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02一种混合多变量签名方案
摘要:RGB(red-green-blue)方案是一个可以抵抗已知代数攻击的混合多变量签名方案,但是和其他多变量公钥方案一样,它也具有公钥量大的缺点.针对RGB方案这一不足,采用循环公钥的思想对RGB方案进行优化,提出了一个新的方案——CyclicRGB混合多变量签名方案.与RGB方案相比,Cycl ...中科院软件研究所 本站小编 Free考研考试 2022-01-02非刚性三维模型检索特征提取技术研究
摘要:三维模型特征描述符是一种简洁且信息量丰富的表示方式,特征提取是许多三维模型分析处理任务的关键步骤.近年来,针对非刚性三维模型特征提取技术的研究引起了人们的广泛关注.首先,汇总了常用的非刚性三维模型基准数据集和算法评价标准;然后,在广泛调研大量文献和最新成果的基础上,将非刚性三维模型特征分为人工 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于模型的自适应方法综述
摘要:自适应为管理现代软件系统的复杂性提供了有效的解决方案,被设计为自适应系统的软件能够持续地演化以应对环境中的不确定性.在现有的研究工作中,基于模型的自适应方法是一类广泛使用的方法,它将模型驱动工程技术的应用从设计时扩展到运行时,以支持自适应能力的实现.通过利用软件模型对运行时丰富和不确定的信息进 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02物联网环境下数据转发模型研究
摘要:随着5G移动通信技术、软件定义网络、命名数据网、移动边缘计算或雾计算等新兴技术或方法的出现及深入研究,物联网应用得到进一步升华.在这种应用场景多样化、服务质量高要求、参与对象普及化的环境下,隶属物联网子范畴的传统无线传感器网络数据转发模型已经不能完全适应这种时代需求,更加适合物联网应用的数据转 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02多层城市冠层模型参数优化及对京津冀城市群的高温模拟
摘要摘要:针对京津冀高温模拟,综合运用卫星和地面气象观测数据、参数敏感性试验等技术方法,确定了耦合了多层城市冠层模型的中尺度数值模式(WRF/BEP/BEM)的地表反照率、比辐射率和人为热等参数的本地化配置。数值对比试验表明,参照试验中优化地表反照率、比辐射率和人为热(通过本地优化BEM输入参数来实 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02多层城市冠层模型参数优化及对京津冀城市群的高温模拟
摘要摘要:针对京津冀高温模拟,综合运用卫星和地面气象观测数据、参数敏感性试验等技术方法,确定了耦合了多层城市冠层模型的中尺度数值模式(WRF/BEP/BEM)的地表反照率、比辐射率和人为热等参数的本地化配置。数值对比试验表明,参照试验中优化地表反照率、比辐射率和人为热(通过本地优化BEM输入参数来实 ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02最佳子集多元线性回归模型在热带气旋风圈变化预报中的应用
摘要摘要:基于最佳路径(IBTrACS)数据集和欧洲中期天气预报中心(ECMWF)的再分析(ERA-Interim)数据,建立了西北太平洋上(WesternNorthPacific,WNP)热带气旋(TropicalCyclone,TC)的七级风圈(R17)变化的最佳子集多元线性回归(bs-MLR) ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02最佳子集多元线性回归模型在热带气旋风圈变化预报中的应用
摘要摘要:基于最佳路径(IBTrACS)数据集和欧洲中期天气预报中心(ECMWF)的再分析(ERA-Interim)数据,建立了西北太平洋上(WesternNorthPacific,WNP)热带气旋(TropicalCyclone,TC)的七级风圈(R17)变化的最佳子集多元线性回归(bs-MLR) ...中科院大气物理研究所 本站小编 Free考研考试 2022-01-02