当前位置 > 首页 > 会员服务 > CPDA数据分析师优秀原创文章:运用数据分析方法提升电信存量用户捆绑率的研究

CPDA数据分析师优秀原创文章:运用数据分析方法提升电信存量用户捆绑率的研究

来源:中国数据分析行业网 | 时间:2019-09-23 | 作者:数据委

作者:武汉 CPDA数据分析师:李毅、王月皎、李纯、郭轶、刘莎、王荆

 

一、研究现状和发展趋势

存量用户价值问题已越来越受到电信运营商的重视。随着移动通信与其相关行业互相融合,利用新技术、新项目以及应用需求满足当前人们的生活需求,人们享受到互联网时代移动通信技术发展带来的优质用户体验。在新的5G时代,客户价值将成为竞争焦点,对存量价值客户的争夺将成为新赛场。

 

二、大数据时代存量用户价值提升的方式

(一)存量经营的涵义

存量经营囊括了运营商除拓展新客户外的大部分经营活动,除了前端的市场活动,还包括后端的支撑活动(如网建、网优、IT系统完善等)。表现为运营商针对现有客户,以提升客户忠诚度、释放客户价值为目的的一系列经营方针和策略,主要是通过客户信息挖掘、精细化管理、差异化服务来实现客户保有和价值提升,体现出运营商对流失率的控制,除了要留住客户,还要对客户的价值进行挖掘和提升。随着用户市场日趋饱和,用户增量市场的空间不断减少、增速日益放缓,运营商对存量市场的依赖程度将不断增加。

 

(二)精准营销流程

精准营销不但提高了营销的准确率和命中率,同时也提高了服务水平。基于运营商的用户大数据,通过大数据挖掘、机器学习等方式进行数据价值的获取,具体营销流程见下图。

图1:精准营销流程

 

三、基于聚类分析的客户细分模型建立与评估

细分客户可以帮助运营商更加精准的了解客户的消费行为,了解客户的特征。对客户按照一定的标准进行划分,实现对市场精准的分割,实现精准营销。

 

(一)提取用户画像

用户画像即商业目的下用户标签的集合。运营商制定自有的标签体系,并对用户的语音和流量使用情况进行数据统计和分析,从而确定用户所匹配的相应标签。用户标签可以分为两部分,一是自然标签,包括用户的基础信息、性别、年龄、家庭住址等,二是用根据用户的基础信息和行为数据的归纳和分析而来的特征标签,如最常用的APP、最喜欢的电商网站等等。根据用户的基础信息和行为信息,对用户进行360度的属性特征和行为偏好画像。用户标签产品能全方位的了解用户行为特征,为锁定潜在目标用户群、营销决策等提供数据支撑基础。

 

(二)数据维度与样本量的确定

本文所用实验取公司数据服务支撑平台的用户数据为样本。根据电信用户特点,针对性的选取了用户属性,剔除了无效的属性,因数据维度较低,无需对数据做降维处理。根据电信业务经营的常识,结合本次实验的需要,在数据选取时将遵从以下两条原则:

 

1.在不损坏数据完整性的情况下,合并意义相近或相同的字段;

2.与本实验无关的字段进行剔除,裁剪掉无效的字段。

 

本实验将随机抽取100000户样本用户(在网6个月以上),剔除无效的或缺省值较多的字段,有效数据占样本整体量的98.05%,最后得到98050户数据作为样本参与客户细分模型建立。

 

(三)用户分类

用户中包含两部分,一部分是订阅过流量包的用户,一类是非订阅用户,计算二者比例。

拟符合流量包订购条件样本62950户,另4770户已为冰激凌套餐,10327户近半年无流量需求。

 

流量包 层级 国内 赠送省内 样本数 备注
半年包 40半年包 - 3G 14504
流量月包 10元 100M - 18300 流量1元卡(OCS)12户、ARPU值小于等于10元8户
20元 300M - 13005
30元 500M 1000M+2G省内*12个月促销 9700
50元 1G 5G 4652
70元 2G 10G 2599 腾讯大王卡等2I资费35户,其中ARPU值小于60元的30户。
100元 3G 15G 190

 

(四)数据建模

根据数据字段及样本的选取规则,从上述的98050个数据中筛选过滤,得到下面部分字段的客户数据信息。有部分字段在系统中直接提取出来是无法使用的,经过转化求和等方式进行了加工,才得到以下内容,主要字段列举如下:

 

表1:客户画像数据字段

字段名 数据类型 说明
用户识别号 Text 用户唯一识别码
用户号码 Text 用户服务号码
在网时长 Number 用户在网时长
用户产品名称 Text 用户产品名称
是否订购流量包 Text 用户是否订购流量包
使用网络类型 Number 用户使用网络类型
手机上网费 Number 用户6个月平均上网费用
ARPU值 Number 用户6个月平均ARPU值
国内语音时长 Number 用户6个月国内语音平均时长
国内流量 Number 用户6个月平均国内流量

剔除存在缺失值、空值样本后,选取有通信行为的客户数据98050条作为聚类目标对象集,部分客户数据如下表所示(本文涉及的数据均经过特殊加工处理)

 

表2客户使用行为数据表

用户标识 在网时长 产品名称 流量包 使用网络 上网费(元) ARPU值 国内语音时长 国内流量(MB)
155**588 99 2 1 2G 0 9.65 10 0
130**362 148 4 1 3G 0 140 24 0
131**856 5 4 0 3G 3.75 53.1 57 1.1
130**912 37 3 0 4G 34 120.5 0 1899
156**872 42 1 1 2G 13.6 30.5 138 707
131**949 46 4 0 4G 0 10.5 63 267
155**603 75 2 1 4G 86 100.2 294 4300
186**686 42 1 1 4G 170 230.2 217 8905
155**690 89 3 1 3G 6 138.1 23 6.3
131**698 24 2 0 2G 0 36.8 31 0

 

(五)客户细分模型建立与评估

使用datahoop平台,将套餐名称、网龄、ARPU值   、国内语音(分钟)、月均国内流量(G)、age、月均消费、免费流量、收费流量、收费和流量费等变量都放在X轴导入系统进行分析。

 

使用“异常值分析”,有39个异常值占比不高,可不做处理。

 

使用“相关系数矩阵”工具计算相关性,可知免费流量和收费流量系数大于0.9,属于强相关,其他均小于0.7,因此将免费流量和收费流量的比值 作为新的变量,与网龄、ARPU值、月均国内语音(分钟)、月均国内流量(G)一起作为变量进行下一步建模。

 

将上述五个变量再次导入datahoop平台进行“相关系数矩阵”。结果显示其相关性均小于0.8,不存在强相关,可以使用聚类分析来对这些用户进行分类。

 

使用聚类中的K-means计算方法,在datahoop平台中建立数据流,将聚类系数分别设定为3、4、5,来检测何种分类下情况最佳。

结果显示,在聚类系数为4时,平均轮廓系数为0.6537,此时分类效果最佳。

k-value silhouette coefficient
3 0.4539
4 0.6537
5 0.6497

图1:各种分类下的轮廓系数结果

 

 

 

       

(0为不常使用用户;1为中端日常用户;2为中端商务用户;3为高端商务用户)

 

类别 ARPU值(Y) Domestic Voice(S) Domestic flows(M) Network age(M) 客户分类
0 19.62 58 1.13 6 不常使用用户
1 45.72 1823 325.72 15 中端日常用户
2 98.9 6582 4321.69 18 中端商务用户
3 135.5 31257 10732.78 8 高端商务用户

 

通过聚类模型分析结果如下:

0类用户为不常使用用户,可以尝试推荐10元100M-30元500M流量包,培养用户使用流量习惯,提高用户在网时长,目的在于挽留用户继续使用。

 

1类用户为中端日常用户,适合推荐存费送电子劵产品预存120元赠送240元,12个月。

 

2类用户为中端商务用户,适合推荐存费送电子劵产品预存240元赠送480元,12个月。

 

3类用户为高端商务用户, 适合推荐用户迁转为畅越冰激凌套餐。

 

通过聚类分析后得到的分类结果,还是比较符合用户实际使用情况的。接下来就运用这种分类方式对我们将要推荐业务的用户数据进行分类并进行实践。

 

四、存量用户价值提升实证分析及研究

取出一批待维系的用户数据,提取他们的属性,即建模过程张选取的属性,将这些数据导入datahoop平台,使用聚类k-means算法进行分类。按照分类的结果对不同类的用户进行不同产品的推荐。

 

建模目标在于,确定用户的个人属性和消费能力对其订购相应业务的影响力大小,以便于对其他非订购用户进行业务适配,并进行相应推荐。

 

由于研究能提供的触点渠道存在局限性,本次采用了电话营销的传统方式进行渠道触达。电话营销方式的客户感知是远低于通过APP或网上营业厅等渠道的客户主动行为转化的感知。据统计,前期存费送电子券、套餐迁转和流量包订购为1.3%,通过大数据精准营销转化率达到了2.3%,提升了个1个PP。从实证结果来看,模型的运行结果实际可行,可以运用于日常工作中。

 

五、结束语

通过参加中国数据分析专业委员会数据分析师(CPDA)培训并获得认证,使我们建立了数据分析思维、熟悉了数据分析流程、掌握了数据分析方法和技能,并结合工作需求进行实际应用的研究,但由于资源条件、设备工具和水平所限,本文在数据分析,模型选择及描述等方面尚有很多不足,需要在未来研究中进一步验证价值,提升研究的有效性和科学性及工作实际应用性。通过数据分析方法,在一定程度上拓展相关领域的分析视角和方法,充分挖掘数据价值,产生数据效益,促进行业的发展。