一种用户成长性画像的建模方法
董哲瑾(),王健*(),钱凌飞,林鸿飞大连理工大学计算机科学与技术学院,辽宁 大连 116024
收稿日期:
2018-10-17出版日期:
2019-03-01发布日期:
2019-03-19通讯作者:
王健E-mail:zd2221@columbia.edu.cn;wangjian@dlut.edu.cn作者简介:
董哲瑾(1995—),女,硕士研究生,研究方向为数据挖掘. E-mail:基金资助:
国家重点研发计划项目资助(2016YFB1001103)A modeling method of user growth profile
Zhe-jin DONG(),Jian WANG*(),Ling-fei QIAN,Hong-fei LINInstitute of Computer Science and Technology, Dalian University of Technology, Dalian 116024, Liaoning, China
Received:
2018-10-17Online:
2019-03-01Published:
2019-03-19Contact:
Jian WANG E-mail:zd2221@columbia.edu.cn;wangjian@dlut.edu.cnSupported by:
国家重点研发计划项目资助(2016YFB1001103)摘要/Abstract
摘要: 用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。
PDF全文下载地址:
http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3046