删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

中国科技云门户用户忠诚度的研究

本站小编 Free考研考试/2022-01-02

危婷,*, 张宏海, 蔺小丽, 张蕾蕾, 王妍, 贾金峰, 吴笛中国科学院计算机网络信息中心,北京 100190

User Loyalty Study of CSTCloud

WEI Ting,*, ZHANG Honghai, LIN Xiaoli, ZHANG Leilei, WANG Yan, JIA Jinfeng, WU DiComputer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China

通讯作者: 危婷(E-mail:weiting@cnic.cn

收稿日期:2020-08-5网络出版日期:2020-12-20
基金资助:中国科学院“十三五”信息化专项中国科技云工程项目(XXH13503)


Received:2020-08-5Online:2020-12-20
作者简介 About authors

危婷,中国科学院计算机网络信息中心,博士,高级工程师,主要研究方向为数据分析、云资源调度算法。本文中负责撰稿,中国科技云用户行为数据分析和建模。
WEI Ting, Ph.D., is a senior engineer of Computer Network Information Center, Chinese Academy of Sciences. Her recent research interests focus on the unified scheduling of cloud resources and the research and development of cloud service platform. Her main research direction is data analysis and cloud resource scheduling algorithm. In this paper, she is responsible for the paper writing, data analysis and modeling user behaviors on CSTCloud.E-mail: weiting@cnic.cn


张宏海,中国科学院计算机网络信息中心,硕士,副研究员,科技云发展部云服务软件研发业务室主任,主要研究方向为云资源的统一调度和云服务平台的研发。本文中负责总体统稿、科技云用户行为分析系统设计与应用。
ZHANG Honghai is an associate researcher of Computer Network Information Center, Chinese Academy of Sciences, and the Director of Cloud Service Software Research and Development Business Department of Science and Technology Cloud Development Department. His main research directions are the unified scheduling of cloud resources and the research and development of cloud service platform.In this paper, he is responsible for the final compilation, and the design and application of CSTCloud user behavior analysis system.E-mail: zhh@cnic.cn


蔺小丽,中国科学院计算机网络信息中心,硕士,工程师,目前主要从事系统部署、数据采集、数据库构建的工作。本文中负责用户行为分析系统数据采集部分。LIN Xiaoli is an engineer of Computer Network Information Center, Chinese Academy of Sciences. She mainly engages in system deployment, data acquisition and database construction.In this paper, she is responsible for data acquisition of user behavior analysis system.E-mail: linxiaoli@cnic.cn


张蕾蕾,中国科学院计算机网络信息中心,硕士,工程师,目前主要从事前端开发的工作。本文中负责用户行为分析系统的开发。
ZHANG Leilei is an engineer of Computer Network Information Center, Chinese Academy of Sciences. She mainly engages in front-end development. In this paper, she is responsible for the development of user behavior analysis system.E-mail: zhangleilei@cnic.cn


王妍,中国科学院计算机网络信息中心,硕士,工程师,目前主要从事前端开发的工作。本文中负责用户行为分析系统的开发。
WANG yan is an engineer of Computer Network Information Center, Chinese Academy of Sciences. She mainly engages in front-end development. In this paper, she is responsible for the development of user behavior analysis system.E-mail: wangyan@cnic.cn


贾金峰,中国科学院计算机网络信息中心,硕士,工程师,目前主要从事系统开发的工作。本文中负责用户行为分析系统的开发。
Jia Jinfeng is an engineer of Computer Network Information Center, Chinese Academy of Sciences. He mainly engages in system development.In this paper, he is responsible for the development of user behavior analysis system.E-mail: jiajinfeng@cnic.cn


吴笛,中国科学院计算机网络信息中心,硕士,目前主要从事系统开发的工作。本文中负责用户行为分析系统的开发。
WU Di is an associate engineer of Com-puter Network Information Center, Chinese Academy of Sciences. She mainly engages in system development.In this paper, she is responsible for the development of user behavior analysis system.E-mail: wudi@cnic.cn



摘要
【背景】中国科技云(CSTCloud)是一个面向科学工作者提供资源和服务的云平台,汇聚了包括云计算、云存储、高性能计算、科学软件等多种资源,自2018年4月发布以来受到了广泛关注。中国科技云门户作为资源的汇聚和入口,是用户获取和使用资源的重要途径。【方法】为了解用户在此平台的行为特征和粘性,基于中国科技云门户用户的真实访问数据,探索性提出改进的RFM模型来量化评定用户忠诚度的方法。【结果】此模型结合了现有用户行为数据的特点,并突出了近度指标Recency与用户价值的反向关系;此外,基于实际的忠诚度分析的结果,对用户群的粘性进行分类,以评估用户群的潜在价值。【结论】本文的研究基于现有的用户真实访问数据,有利于对用户群进行分类和个性化的运营决策,以便更好地为科技云用户提供服务。
关键词: 中国科技云;用户行为;忠诚度;RFM模型

Abstract
[Background] China Science and Technology Cloud (CSTCloud) has been a widely concerned cloud platform which aggregates resource of cloud computing, cloud storage and high performance computing for scientists since its establishment in April, 2018. As the entrance of aggregated resources, CSTCloud is of great importance for users to obtain and utilize resources. [Methods] In order to understand user activities and stickiness, this paper develops an improved RFM model to evaluate loyalty of users based on real data of CSTCloud visitors. [Results] The model reflects the user data characteristics and the negative correlation between Recency index and the user value. In addition, users are classified by real loyalty analysis results, assessing the potential value of users for CSTCloud. [Conclusions] Based on real data, this study can help the CSTCloud operator to learn about user activity characteristics and to provide personalized services for classified users.
Keywords:CSTCloud;user activity;user loyalty;RFM model


PDF (4938KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
危婷, 张宏海, 蔺小丽, 张蕾蕾, 王妍, 贾金峰, 吴笛. 中国科技云门户用户忠诚度的研究[J]. 数据与计算发展前沿, 2020, 2(6): 74-81 doi:10.11871/jfdc.issn.2096-742X.2020.06.008
WEI Ting, ZHANG Honghai, LIN Xiaoli, ZHANG Leilei, WANG Yan, JIA Jinfeng, WU Di. User Loyalty Study of CSTCloud[J]. Frontiers of Data and Computing, 2020, 2(6): 74-81 doi:10.11871/jfdc.issn.2096-742X.2020.06.008


引 言

中国科技云是中国科学院打造的一个面向科技工作者提供资源服务的云平台。中国科技云门户于2018年4月正式上线。门户汇聚了包括云计算、云存储、超算云等在内的25个平台,11类58款软件。截止2019年9月,通过中国科技云门户访问科技云资源的访问量超过7.2万。为了让科技云更好地满足广大科技工作者的需求,提供更满意的资源和服务,需要不断地了解目标用户需求,优化和改善用户体验,进而提升用户的满意度。当用户的预期不断被满足时,用户就会喜欢上这个产品,进而成为产品的忠诚用户。忠诚用户不但自身为产品创造价值,还可以为产品带来很多隐性的收益,比如品牌和口碑的推广、带动其他用户的进入和成长等。因此对用户忠诚度进行量化评定具有重要的意义。

在网站运营过程中,加强用户对网站的粘性是最关键的。不仅要维持常用户,还要扩大常用户群体。常用户群体对企业收益贡献是最大的。国家相关部门2002对全国旅客特征调查发现,常旅客只占所有旅客的11.47%,但这些旅客为航空公司贡献的旅行次数大约占49%。也就是说,我国航空公司将近一半的运输量是由经常旅行的旅客贡献的 [1]。这个例子表明企业收益掌握在一部分客户手中,必须牢牢留住这部分用户才能有利于企业的收益增长,可见对产品数据分析是非常重要的[2,3]。本文将通过用户行为数据分析深入了解用户群体的分类,通过计算用户忠诚度来分析网站的常用户,以及有可能发展成为常用户的潜在价值用户。

用户忠诚度衡量包含行为和态度两个方面 [4,5,6],衡量指标进一步细化为:态度的忠诚,主要表现为对所使用产品的推荐和对竞争产品的免疫力;行为的忠诚主要表现为重复购买、购买频率、购买数量。在实际应用中,行为的忠诚度比较容易采集和量化,因此本文主要采用后者。

用户行为的忠诚度评价通常采用的方法包括专家经验评分法[7]、权重评分法、RFM模型评分法 [8,9]。其中RFM模型评分法是最直观也是最客观的。 RFM模型以用户历史数据来描述行为特征和忠诚度。其中近度R(Recency)表示最近一次交易距离当前的时间间隔;频度F(Frequency)表示一段时间内的交易的次数;值度M (Monetary)表示一段时间内的交易金额。RFM模型在用户购买偏好和用户价值方面都具有很好的表征意义。用户的近度R越小,频度F和值度M越大,表示用户进行下一次的交易的可能性越大,用户的潜在价值更大。如果采集用户行为数据的时间足够长,可以追踪用户的长期价值以便对用户进行分类和个性化的运营决策。一些**** [10]在RFM模型基础上,围绕用户评论这一行为,对变量RFM进行了重新定义,并引入了情感变量来构造用户价值。在基于RFM模型的客户价值研究中,大多只是引入了权值,并未突出变量R与客户价值的反向关系。即近度越小,用户进行下一次行为的可能性越大。本文在RFM模型基础上进行改进,突出这一反向关系。虽然RFM模型大多应用在金融领域,很少有研究利用RFM模型来描述云平台网站的用户粘性,但RFM模型的近度、频度、值度指标很好地契合了用户对云平台网站的访问特点,如最近访问时间间隔、用户访问频率、用户停留时间、用户访问页面数、用户操作数等。因此本文采用改进的RFM模型来构造科技云门户网站的用户忠诚度评估模型。

1 用户行为模型

1.1 数据介绍

为了获取用户准确、实时的行为信息,在科技云门户多个服务器节点上部署了数据采集脚本。采集的数据涵盖了用户浏览数据、用户属性数据、用户行为数据、访问深度数据等,如表1所示。数据采集频率设置为5秒,按照其所记录的信息分类存于30个数据库表,涉及280多个字段和若干个扩展字段。所采集的数据全部来源于真实的对外提供服务的科技云门户,且数据能够完整记录一次访问的所有浏览操作轨迹。数据记录的信息实时,全面,能够真实的反映用户的行为特点。

Table 1
表1
表1中国科技云数据解析表
Table 1CSTCloud data notes
数据分类数据举例数据来源
总体浏览数据
用户属性数据
用户个性化访问数据
访问深度数据
用户总访问量;访问用户数;访问页面数
科技云通行证账号;单位;浏览器;操作系统;终端;国家;城市
访问频率;访问时间间隔;访问次数;平均停留时间;平均访问页面数
跳出率;访问路径
用户行为分析系统日志;服务器日志

新窗口打开|下载CSV

本文采用的数据时间跨度为2018年8月到2019年9月,共13个月。数据涉及3 786个不同的用户ID,包括38 468次完整的访问。

1.2 忠诚度模型

本文评估用户的忠诚度是基于RFM模型。用户行为分析系统日志采集到用户访问科技云门户的近度、频度,但目前科技云门户并未收费,因此值度的数值由用户访问过程中的操作数visit_total_actions代替。一个用户如果在科技云门户网站的操作活动数越多,那么这个用户对网站的兴趣越大,愿意花费的概率也越大。虽然这个数据字段不能完全反映用户的花费,但是在一定程度上能反映用户的兴趣和意愿。此外,不论是近度、频度还是值度,都需要多个有序时间段累积统计,才更能体现用户的实际行为。

将指定的时间区间T分成m个时间段, ,对每个时间段Ti计算近度RTi,频度FTi,值度MTi。由于以上三个参数是不同的单位标度,为了便于统一计算,将其标准化为RSTi,FSTi,MSTi。对近度、频度和值度分别用权重ωRFM表示它们对忠诚度的影响程度。具体参数如表2。某个用户的忠诚度评估模型如下:

$UL=w_{R} \sum{RS_{Ti}}{1} + w_{F} \sum{i}{} FS_{Ti} + w_{M} \sum{i}{}MS_{Ti}$
Table 2
表2
表2各项参数列表
Table 2parameter list
参数释义
T
Ti
m
RTi
FTi
MTi
RSTi
FSTi
MSTi
ωR
ωF
ωM
指定时间区间
计量的时间段
时间区间被划分的时间段的数量
对应时间段内的近度
对应时间段内的频度
对应时间段内的值度
对应时间段内的近度的标准化值
对应时间段内的频度的标准化值
对应时间段内的值度的标准化值
近度的权重
频度的权重
值度的权重

新窗口打开|下载CSV

接下来确定变量的权值。确定权值的方法有很多,不同的方法适用于不同的应用场景[11]。常用的客观赋权方法有熵值和主成分分析法等。其中熵值法用的比较多,它定权采用的是决策矩阵,指标权重反映了指标值的离散程度。本文的三个指标:近度,频度和值度的权重需要反映各指标的变异性和波动性,以及三个指标间的相关程度,因此本文采用CRITIC权重 [12]。指标的变异性适用标准差进行衡量,标准差越大则权重越大;冲突性使用指标之间的相关系数进行衡量,指标之间的相关性越强则冲突性越低,权重越小。信息量的计算方式为指标变异性与冲突性之间的乘积。最终权重由信息量进行归一化计算得到。本文对13个月的数据进行计算得到三个指标的权重分别为29.92% 、8.88% 、61.20%。

接下来计算用户的忠诚度。先对数据进行标准化。由于各种类别指标数据间的度量不同,比如进度是最后一次访问距离上一次访问的天数,频率是一段时间内用户的访问次数,因此无法基于这些数值大小来进行统一计算,要先对数据进行标准化。标准化的方法有很多种[13],如SPSS软件自带数据标准化功能。本文选择采用极差法对数据进行标准化,方法如下:

$xs_{Ti}=\frac{x_{Ti}-min(x_{Ti})}{max(x_{Ti})-min(x_{Ti})}$

$xs_{Ti}=\frac{max(x_{Ti})-x_{Ti}}{max(x_{Ti})-min(x_{Ti})}$

2 实际数据分析

2.1 忠诚度分布

为了更好地体现用户访问时间段对忠诚度的影响,本文基于所采集的数据筛选出每个月访问次数为2次以上的用户来分析用户群的忠诚度分布。将每个月各用户忠诚度进行排序,如图1,显示了2018年8月- 2019年4月每个月用户忠诚度的分布。

图1

新窗口打开|下载原图ZIP|生成PPT
图1用户忠诚度分布

Fig.1Users loyalty distribution



横坐标是用户计数,纵坐标是排序之后的用户忠诚度。用户忠诚度的数值范围从0到10。用户忠诚度为0是因为该用户当前指标值是所有用户中最小的,在标准化的时候成为0。图1中每个月用户群的忠诚度分布类似,80%以上的用户忠诚度低于6,不到20%的用户忠诚度高于6,不到10%的用户忠诚度高于8,符合典型的“二八定律”。根据图1忠诚度数值的分布情况,可以将忠诚度数值分成3段,来初步衡量用户对网站的粘性和潜在价值,方法如下:

$UL= \begin{equation} \begin{cases} 0~2,UL较高,潜在价值高的用户,重点保证不流失的用户\\ 2~6,UL中等,潜在价值中等的用户,重点发展的用户,\\ 6~10,UL较低潜在价值较低的用户,可暂时不关注的用户 \end{cases} \end{equation}$

2.2 单个用户忠诚度分析

为了解单个用户每个月忠诚度的变化情况和相关性,本文取出2018年8月-2019年9月共13个月期间,访问次数最多的4个用户,以一个月为周期,了解他们每个月的忠诚度变化,如图2所示。

图2

新窗口打开|下载原图ZIP|生成PPT
图2用户忠诚度每月的变化

Fig.2Users loyalty varies with month



横坐标是月份的计数,纵坐标是当前用户的忠诚度。用户的忠诚度在13个月期间没有特殊的分布规律,每个月的忠诚度之间也没有特别的相关性。也就是说,某个月的忠诚度很高,但之后几个月也可能较低。总体来说,单个用户的忠诚度变化比较平稳。这说明一般情况下,用户对该网站的忠诚度比较稳定,除非是某种特殊事件的触发,可以引起忠诚度发生较大变化。

3 结论与展望

本文在实时采集的科技云门户网站数据的基础上,根据数据本身的特点,提出改进的RFM模型来计算用户忠诚度的方法。同时根据忠诚度的分布特点,将忠诚度进行等级划分以衡量用户的潜在价值。本文提出的模型能很好的将不同粘性和潜在价值的用户群体进行分类,有利于对用户粘性进行预测,构建不同用户的画像,这对于产品的运营,以及运营策略的制定有重要的意义。

本文在数据分析过程中发现,用户访问各类不同资源,体现出对不同资源的偏好和忠诚度差异。因此在下一步工作中对用户忠诚度评定方法构建上还需要考虑:(1)根据不同资源的使用特点来完善RFM指标,例如对于使用的计算资源,需要考虑申请资源的期限对访问近度R的影响;(2)根据不同资源的使用特点修订RFM指标的权重。例如对于科研社区资源,需要考虑浏览和社交的功能对页面操作访问次数的影响;(3)根据不同资源的使用特点,体现用户在不同时间段的数据特征,对RFM指标权重进行分段修正。

本文以一个月为一个时间单元分析了最活跃的4个用户在13个月间的忠诚度变化情况。下一步工作将基于忠诚度变化了解用户的价值迁移特点,并对用户价值变化进行预测,以提高网站个性化运营的效率。

利益冲突声明

所有作者声明不存在利益冲突关系。

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

文光 .顾客忠诚度是企业利润的主要来源
[EB/OL].http://www.360doc.com/content/17/0102/10/39541475_619462086.shtml .2017年1月.

URL [本文引用: 1]

张耀南, 艾鸣浩, 康建芳 , . 地学大数据处理架构与关键技术研究
[J]. 数据与计算发展前沿, 2020,2(2):91-100.

[本文引用: 1]

廖方宇, 洪学海, 汪洋, 褚大伟 . 数据与计算平台是驱动当代科学研究发展的重要基础设施
[J]. 数据与计算发展前沿, 2019,1(1):2-10.

[本文引用: 1]

王文贤, 金阳, 陈道斌 . 基于RFM模型的个人客户忠诚度研究
[J]. 金融论坛, 2012,3(195):75-80.

[本文引用: 1]

迈克尔D约翰逊, 安德斯 . 古斯塔夫森. 忠诚效应-如何建立客户综合衡量与管理体系[M]. 刘吉, 张国华,译.上海:上海交通大学出版社, 2002.
[本文引用: 1]

严浩仁 . 顾客忠诚管理:机理分析与策略指导[M]. 北京: 东方出版社, 2004.
[本文引用: 1]

刘鲲鹏, 赵宵飒, 胡一睿 , . 个体及团体异构多方面评分行为建模
[J]. 数据与计算发展前沿, 2020,2(2):59-77.

[本文引用: 1]

赵萌 . 基于评论行为的客户终身价值模型改进
[D]. 北京邮电大学, 2015.

[本文引用: 1]

马宝龙, 李飞, 王高 , . 随机RFM模型及其在零售顾客价值识别中的应用
[J]. 管理工程学报, 2011,25(1):102-108.

[本文引用: 1]

蔡淑琴, 马玉涛, 王瑞 . 在线口碑传播的意见领袖识别方法的研究
[J]. 中国管理科学, 2013,21(2):185-192.

[本文引用: 1]

Hughes A M . Strategic database marketing
[M]. New York: McGraw-Hill, 2006.

[本文引用: 1]

Critic赋值法的实例应用
[EB/OL]. http://www.doc88.com/p-4082292004105.html . 2014年6月.

URL [本文引用: 1]

数据标准化的几种方法
[EB/OL].http://wenku.bandu.com/view/47a89854482fb4daa48d4b6c.html .2018年6月.

URL [本文引用: 1]

相关话题/数据 科技 指标 计算 资源