CN109451449A - 一种基于决策树算法的移动通信4g套餐降档预测方法 - Google Patents

一种基于决策树算法的移动通信4g套餐降档预测方法 Download PDF

Info

Publication number
CN109451449A
CN109451449A CN201811039659.2A CN201811039659A CN109451449A CN 109451449 A CN109451449 A CN 109451449A CN 201811039659 A CN201811039659 A CN 201811039659A CN 109451449 A CN109451449 A CN 109451449A
Authority
CN
China
Prior art keywords
set meal
month
downshift
decision
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811039659.2A
Other languages
English (en)
Other versions
CN109451449B (zh
Inventor
林诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU HANXIN COMMUNICATION TECHNOLOGY Co Ltd
Original Assignee
GUANGZHOU HANXIN COMMUNICATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU HANXIN COMMUNICATION TECHNOLOGY Co Ltd filed Critical GUANGZHOU HANXIN COMMUNICATION TECHNOLOGY Co Ltd
Priority to CN201811039659.2A priority Critical patent/CN109451449B/zh
Publication of CN109451449A publication Critical patent/CN109451449A/zh
Application granted granted Critical
Publication of CN109451449B publication Critical patent/CN109451449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/24Accounting or billing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/80Rating or billing plans; Tariff determination aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/80Rating or billing plans; Tariff determination aspects
    • H04M15/8083Rating or billing plans; Tariff determination aspects involving reduced rates or discounts, e.g. time-of-day reductions or volume discounts

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于决策树算法的移动通信4G套餐降档预测方法,包括以下步骤:S1确定对办理套餐降档具有影响的变量;S2进行数据进行合并提取,并选取正负两种样本作为训练数据;S3取最新月份数据作为预测数据;S4建立决策树模型;S5把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,选出潜在套餐降档目标客户。本发明可***出潜在4G套餐降档用户,支撑市场部门的精准营销,节约营销成本;同时增加4G套餐用户的粘性。

Description

一种基于决策树算法的移动通信4G套餐降档预测方法
技术领域
本发明涉及移动通信领域,更具体地,涉及一种基于决策树算法的移动通信4G套餐降档预测方法。
背景技术
随着移动通信技术的发展,4G套餐类型的丰富多样化,部分用户出现了出现了4G套餐降档现象,大市场客户的自然进行套餐降档概率在1.0%,导致公司收入的减少以及市场部门营销成本的增加。
发明内容
本发明的目的是解决上述一个或多个缺陷,提出一种基于决策树算法的移动通信4G套餐降档预测方法。
为实现以上发明目的,采用的技术方案是:
一种基于决策树算法的移动通信4G套餐降档预测方法,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量;
S2:剔除套餐资费以是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
优选的是,步骤S1所述确定对办理套餐降档具有影响的变量具体包括通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性等分析后,最终保留以下27个特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;具体27个变量包括:品牌、终端品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额。其中ARPU指每用户平均收入,DOU指平均每户每月上网流量。
优选的是,步骤S2所述正负样本按1:1,1:2取两份训练数据;其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码。
优选的是,步骤S3所述取最新月份数据作为预测数据只取正使用号码,剔除套餐资费以是最低的4G套餐客户
优选的是,步骤S4所述决策树模型用方差衡量有序性。
与现有技术相比,本发明的有益效果是:
本发明可***出潜在4G套餐降档用户,支撑市场部门的精准营销,节约营销成本;同时增加4G套餐用户的粘性。
附图说明
图1为本发明的流程图;
图2为是否合约捆绑用户图;
图3为当月APRU图;
图4为当月充值金额图;
图5为近三个月平均DOU图;
图6为模型准确率图;
图7为模型提升倍数图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
一种基于决策树算法的移动通信4G套餐降档预测方法,请参考图1,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量;
S2:剔除套餐资费以是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
本实施例中,请参考图2-5,其中非合约捆绑客户办理套餐降档的办理率要显著高于合约捆绑客户的办理率,客户办理套餐降档的办理率随着客户当月ARPU档次的提升而逐渐提升,客户办理套餐降档的办理率随着客户当月充值金额档次的提升而呈现波动上升的趋势,随着近三个月平均DOU档次的提升降档套餐的办理率在逐渐升高。
通过对初始选取的变量进行特征探索、相关性等分析后,最终保留下面27个特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量,包括通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性等分析后,最终保留以下27个特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;具体27个变量包括:品牌、终端品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额。
本实施例中,步骤S2所述正负样本按1:1,1:2取两份训练数据;剔除套餐资费以是最低的4G套餐客户。连续多个月数据合并取;在27个变量中增加一个维度:下月是否降低套餐档次,按正负样本比例1:1,1:2取两份训练数据,其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码。
本实施例中,步骤S3所述取最新月份数据作为预测数据只取正使用号码,剔除套餐资费以是最低的4G套餐客户
本实施例中,步骤S4所述决策树模型用方差衡量有序性,利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模。
具体算法模型如下:
使用模型后,预测4G套餐降档客户的准确率为未使用模型时的4.3倍。8月大市场的145.6万4G客户中,在9月有1.4万名客户办理套餐降档,大市场降档率为0.97%。而使用模型选出的概率参考值排名前5万名的客户中,在9月有2127名为办理套餐降档客户,预测降档准确率为4.12%,是自然发生概率的4.25倍。也即说明寻找潜在4G套餐降档客户精确率大大提升。
4G套餐降档模型效果分析
4G套餐降档模型效果分析参见图6-7。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (5)

1.一种基于决策树算法的移动通信4G套餐降档预测方法,其特征在于,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量;
S2:剔除套餐资费以是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
2.根据权利要求1所述的一种基于决策树模型的移动通信4G套餐降档预测方法,其特征在于,步骤S1所述确定对办理套餐降档具有影响的变量具体包括通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性等分析后,最终保留以下27个特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;具体27个变量包括:品牌、终端品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额。
3.根据权利要求1所述的一种基于决策树模型的移动通信4G套餐降档预测方法,其特征在于,步骤S2所述正负样本按1:1,1:2取两份训练数据;其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码。
4.根据权利要求1、3所述的一种基于决策树模型的移动通信4G套餐降档预测方法,其特征在于,步骤S3所述取最新月份数据作为预测数据只取正使用号码,剔除套餐资费以是最低的4G套餐客户。
5.根据权利要求1所述的一种基于决策树模型的移动通信4G套餐降档预测方法,其特征在于,步骤S4所述决策树模型用方差衡量有序性。
CN201811039659.2A 2018-09-06 2018-09-06 一种基于决策树算法的移动通信4g套餐降档预测方法 Active CN109451449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811039659.2A CN109451449B (zh) 2018-09-06 2018-09-06 一种基于决策树算法的移动通信4g套餐降档预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811039659.2A CN109451449B (zh) 2018-09-06 2018-09-06 一种基于决策树算法的移动通信4g套餐降档预测方法

Publications (2)

Publication Number Publication Date
CN109451449A true CN109451449A (zh) 2019-03-08
CN109451449B CN109451449B (zh) 2021-10-26

Family

ID=65530294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811039659.2A Active CN109451449B (zh) 2018-09-06 2018-09-06 一种基于决策树算法的移动通信4g套餐降档预测方法

Country Status (1)

Country Link
CN (1) CN109451449B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114785627A (zh) * 2022-03-25 2022-07-22 中国联合网络通信集团有限公司 基于通信合约的资费处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760128A (zh) * 2011-04-26 2012-10-31 华东师范大学 一种基于智能客服机器人交互的电信领域套餐推荐方法
CN103854065A (zh) * 2012-11-30 2014-06-11 西门子公司 一种用于客户流失预测的方法和装置
CN105825311A (zh) * 2015-01-05 2016-08-03 ***通信集团湖南有限公司 一种套餐确定方法及***
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760128A (zh) * 2011-04-26 2012-10-31 华东师范大学 一种基于智能客服机器人交互的电信领域套餐推荐方法
CN103854065A (zh) * 2012-11-30 2014-06-11 西门子公司 一种用于客户流失预测的方法和装置
CN105825311A (zh) * 2015-01-05 2016-08-03 ***通信集团湖南有限公司 一种套餐确定方法及***
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114785627A (zh) * 2022-03-25 2022-07-22 中国联合网络通信集团有限公司 基于通信合约的资费处理方法、装置、设备及存储介质
CN114785627B (zh) * 2022-03-25 2023-05-30 中国联合网络通信集团有限公司 基于通信合约的资费处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109451449B (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN106815252B (zh) 一种搜索方法和设备
CN107392627B (zh) 一种基于交往频度和交往指数的用户交往圈关系识别方法
CN111506801B (zh) 一种应用App中子应用的排序方法及装置
CN110008399A (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN109299344A (zh) 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN104573304A (zh) 一种基于信息熵和聚类分群的用户质态评估方法
CN110033342A (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
US20180246962A1 (en) Playlist list determining method and device, electronic apparatus, and storage medium
CN104133817A (zh) 网络社区交互方法、装置及网络社区平台
CN109409928A (zh) 一种素材推荐方法、装置、存储介质、终端
CN110866767A (zh) 电信用户满意度的预测方法、装置、设备及介质
CN106203473B (zh) 一种基于安装包列表的移动用户性别预测方法
CN103488714A (zh) 一种基于社交网络的图书推荐方法和***
CN109902235A (zh) 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法
CN109255115A (zh) 一种文本标点调整方法及装置
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
CN108664515A (zh) 一种搜索方法及装置,电子设备
CN105630890A (zh) 基于智能问答***会话历史的新词发现方法及***
CN111581516A (zh) 投资产品的推荐方法及相关装置
CN109345285A (zh) 一种活动的投放方法、装置及设备
CN108984711A (zh) 一种基于分层嵌入的个性化app推荐方法
CN110020099A (zh) 一种视频交友的用户推荐方法和装置
CN108256924A (zh) 一种产品销售预测装置
CN113158050A (zh) 疑似问题评论审核筛选方法、***及存储介质
CN110032625A (zh) 一种人机对话方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant