基于深度置信网络的广告点击率预估的优化

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-02

摘要:随着互联网广告的飞速发展，如何预测目标用户对互联网广告的点击率（click-through rate，简称CTR），成为精确广告推荐投放的关键技术，并成为计算广告领域的研究热点和深度神经网络的应用热点.为了提高广告点击率预估的精确度，提出了基于深度置信网络的广告点击率预估模型，并通过基于Kaggle数据挖掘平台数据集的1 000万条随机数据的实验，研究不同的隐藏层层数和隐含节点数目对预测结果的影响.为了解决深度置信网络在数据规模较大的工业界解决方案中的训练效率问题，通过实验证明：广告点击率预估中，深度置信网络的损失函数存在大量的驻点，并且这些驻点对网络训练效率有极大的影响.为了提高模型效率，从发掘网络损失函数特性入手，进一步提出了基于随机梯度下降算法和改进型粒子群算法的融合算法，以优化网络训练.融合算法在迭代步长小于阈值时可以跳出驻点平面，继续正常迭代.实验结果表明，与传统的基于梯度提升决策树和逻辑回归的广告点击率预估模型以及模糊深度神经网络模型相比，基于深度置信网络的预估模型具有更好的预估精度，在均方误差、曲线下面积和对数损失函数指标上分别提升2.39%，9.70%，2.46%和1.24%，7.61%，1.30%；使用融合方法训练深度置信网络，训练效率提高30%~70%.

Abstract:With the rapid development of Internet advertising, how to predict the target user's click-through rate of Internet advertisement has become a key technology for accurate advertising and has become a hot topic in the field of computational advertising and the application of deep neural networks. To improve the accuracy of CTR (click-through rate) prediction, this work proposed a prediction model based on deep belief nets and studied the influence of the number of hidden layers and the number of units in each layer on prediction results by taking experiments on the 10 million samples in the dataset provided by Kaggle Data Mining platform. In order to solve the problem of training efficiency of deep belief nets in large-scale industrial solutions, this study took wide experiments to prove that there are a lot of stagnation points in the loss function of deep belief nets and it has great negative effect on the training process. To improve the efficiency of training, starting from the characteristics of network loss function, this study further proposed a network optimization fusion model based on stochastic gradient descent algorithm and improved particle swarm optimization algorithm. The fusion algorithm can jump out of the stagnation ground and continue the normal training process. The experiment results show that compared with the traditional prediction model based on gradient boost regression tree and logistic regression, and the deep learning model based on fuzzy deep neural network, the proposed training model has better accuracy in prediction and performs 2.39%, 9.70%, 2.46% and 1.24%, 7.61%, 1.30% better in mean squared error, area under curves, and LogLoss. The fusion method will improve the training efficiency of deep belief nets at the level of 30%~70%.

PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5640

相关话题/网络 广告 数据 实验 互联网

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
一种网络间可信连接协议
摘要:为了解决深化“互联网+先进制造业”进程中网络可信互连问题，引入了可信连接架构（trustedconnectarchitecture，简称TCA）技术.基于TCA技术思想，针对网络间可信认证需求，设计了一种支持网络间互连的可信连接协议（TCA-SNI）.引入了网络间双向认证过程，给出了TCA-S ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
节点不对称转移概率的网络社区发现算法
摘要:社区发现是当前社会网络研究领域的一个热点和难点，现有的研究方法包括：（1）优化以网络拓扑结构为基础的社区质量指标；（2）评估节点间的相似性并进行聚类；（3）根据特定网络设计相应的社区模型等.这些方法存在如下问题：（1）通用性不高，难以同时在无向网络和有向网络上发挥出好的效果；（2）无法充分利用 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
移动社交网络中矩阵混淆加密交友隐私保护策略
摘要:随着移动设备和在线社交网络的快速发展，通过用户的个人属性配置文件匹配，能够帮助用户在邻近的社交网络中迅速找到和自己共同特征的朋友.然而，交友匹配很有可能泄漏用户的敏感信息，因此用户隐私得不到保障.提出一种移动社交网络中交友匹配过程中的隐私保护协议，用户利用混淆矩阵变换算法和内积计算实现交友过程 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
联合Laplacian正则项和特征自适应的数据聚类算法
摘要:在信息爆炸时代，大数据处理已成为当前国内外热点研究方向之一.谱分析型算法因其特有的性能而获得了广泛的应用，然而受维数灾难影响，主流的谱分析法对高维数据的处理仍是一个极具挑战的问题.提出一种兼顾维数特征优选和图Laplacian约束的聚类模型，即联合拉普拉斯正则项和自适应特征学习（jointLa ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
使用共享变量分析和约束求解检测安卓应用数据竞争
摘要:安卓系统在移动端操作系统始终占据主导地位，在增强用户体验和提高程序性能的同时，其特有的事件驱动模型和多线程模型也造成了并发缺陷.并发程序中，线程调度的不确定性和难以再现性是并发缺陷检测困难的原因.现有技术主要在动态生成执行路径的基础上进行发生序（happens-before）分析，进而检测安卓 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
面向人机对话意图分类的混合神经网络模型
摘要:随着人机对话的不断发展，让计算机能够准确地理解用户查询意图，对整个人机对话领域都有着重要意义.意图分类的主要目标是在人机对话的过程中判断用户的意图，提升人机对话系统的准确度与自然度.首先分析多个分类模型在意图分类任务上的优缺点.在此基础上，提出一种混合神经网络模型，综合利用多个深度网络模型的多 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
基于噪声数据与干净数据的深度置信网络
摘要:建立以受限玻尔兹曼机（restrictedBoltzmannmachine，简称RBM）为基石的深度网络模型，是深度学习研究的热点领域之一.Point-wiseGated受限玻尔兹曼机（point-wisegatedRBM，简称pgRBM）是一种RBM的变种算法.该算法能够在含噪声的数据中自适 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
分布式数据库下基于剪枝的并行合并连接策略
摘要:排序合并连接是数据库系统一种重要的连接实现方式，比哈希连接有更广泛的应用.分布式环境下，数据分片、分布存储，面对昂贵的网络代价，进行高效排序合并连接的挑战巨大.传统策略首先针对连接数据进行排序，然后基于排好序的数据执行合并连接.这两部分操作均基于原始数据进行操作，通常情况下，原始连接数据存在无 ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
引入序列信息的残基相互作用网络比对算法
摘要:残基相互作用网络比对，对于研究蛋白质结构与功能的关系具有重要意义.在基于网络拓扑信息进行网络比对的MAGNA算法基础上，将蛋白质的序列信息（即残基匹配度）引入到其优化函数中，确定拓扑信息和序列信息对比对的影响程度，提出适合于残基相互作用网络比对的SI-MAGNA算法.实验结果表明，SI-MAG ...
中科院软件研究所本站小编 Free考研考试 2022-01-02
软件定义网络中延迟满足的路由选择与实时调度更新
摘要:由于数据流的动态性和流量负载转移，软件定义网络（softwaredefinednetworking，简称SDN）需要频繁更新数据平面以优化网络性能.大多数已有路由更新策略首先根据网络当前流量状态确定目标路由配置，然后更新数据流的路由.然而，由于交换机基于TCAM（ternarycontenta ...
中科院软件研究所本站小编 Free考研考试 2022-01-02