CN113517990B - 一种网络净推荐值nps的预测方法及装置 - Google Patents

一种网络净推荐值nps的预测方法及装置 Download PDF

Info

Publication number
CN113517990B
CN113517990B CN202010274198.8A CN202010274198A CN113517990B CN 113517990 B CN113517990 B CN 113517990B CN 202010274198 A CN202010274198 A CN 202010274198A CN 113517990 B CN113517990 B CN 113517990B
Authority
CN
China
Prior art keywords
network
nps
sample
group
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010274198.8A
Other languages
English (en)
Other versions
CN113517990A (zh
Inventor
林亦楠
张轩荣
丁智
余越
张晓宇
黄汝超
周琼枝
刘美丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010274198.8A priority Critical patent/CN113517990B/zh
Publication of CN113517990A publication Critical patent/CN113517990A/zh
Application granted granted Critical
Publication of CN113517990B publication Critical patent/CN113517990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种网络净推荐值NPS的预测方法及装置。其中,该方法包括:基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;确定各个样本用户的常驻小区,其中,常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与样本用户同组的全网用户的网络NPS进行预测。

Description

一种网络净推荐值NPS的预测方法及装置
技术领域
本发明涉及通信领域/终端领域,尤其涉及一种网络净推荐值NPS的预测方法及装置。
背景技术
NPS(Net Promoter Score净推荐值)是一种计量某个客户将会向其他人推荐某个企业或服务可能性的指数。
网络NPS是运营商网络为提升网络质量而定义的一种用户网络感知测量方法。从整体的NPS问卷中抽取出提及了网络感知点的用户,将该部分用户的NPS分值(0-10分)作为网络NPS值。例如,电信运营商在每个季度选择一定比例的用户通过电话、短信方式进行调研,将用户反馈的网络满意度分值为网络NPS值。
现有的网络NPS值满意度分析一般采用的技术方案为:首先,对一定量用户进行调研,获取用户反馈的网络NPS(0至10分之间),其中0-6分,表示不满意,用“0”标识;9-10分,用“1”标识,表示满意;然后计算并筛选影响网络NPS的网络、业务、用户属性等指标;再对指标数据进行探索,识别指标与网络NPS相关性;将一定比例的调研结果和相关度较高的指标数据导入逻辑回归分类算法进行建模,模型的输出结果是各指标对网络NPS影响系数;通过调整模型参数,检验不同环境下模型表现,直至甄选出最优模型;基于优化后的模型对全网用户的网络NPS进行预测;然后再分析预测的结果和影响网络NPS的指标,确定提升指标的方法(如增加新站、扩容小区容量、调整网络设备参数等);最后可以基于下一次的网络NPS调研和网络指标变化对前一次分析效果进行评估。
在上述技术方案中,通常选取用户一个月或一个季度的全部时间、全部通信小区的网络指标,累加每个用户的全部通信小区的指标数据,将所有用户归为同一类,认为用户的网络NPS值都是由相同网络因素导致的,且对指标的影响系数是相同的,而实际上基于用户对通信网络的使用偏好不同,比如有些偏重语音需求、有些偏重上网需求还有些是两者并重,不同偏好的用户影响其网络NPS的指标也不完全一样,对不同类的用户采用相同的模型会导致指标选择性差,最后预测的网络NPS值不准确。
发明内容
本发明实施例提供一种网络净推荐值NPS的预测方法,以解决网络NPS值预测不准确的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,提供了一种网络净推荐值NPS的预测方法,该方法包括:基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
第二方面,提供了一种网络NPS的预测装置,该包括:分组模块,用于基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;确定模块,用于基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;第一获取模块,用于对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;第二获取模块,用于对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;预测模块,用于基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
在本发明实施例中,基于样本用户对网络使用的行为和使用的网络协议,对样本用户进行分组,并将样本用户的常驻小区分为单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区,再基于每组样本用户的常驻小区的目标指标,获取每线样本用户的网络NPS指标,基于每组的样本用户反馈的网络NPS,获取网络NPS指标对网络NPS的影响因子,按照各组的网络NPS指标对网络NPS的影响因子,对同组的全网用户的网络NPS进行预测,能够提高网络NPS预测的准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本申请实施例提供的一种网络NPS的预测方法的流程图;
图2是本申请实施例提供的一种网络NPS的预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本申请实施例提供的一种网络NPS的预测方法的流程图,如图1所示,该方法主要包括以下步骤。
步骤S102,基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组。
在本申请实施例的一个可选实现方式中,步骤S102可以包括以下步骤:
步骤S1021,基于各个所述样本用户对网络使用的行为和使用的网络协议,获取各个所述样本用户的各类通信业务的网络使用时长。
例如,可以先对用户的网络使用的行为进行分类:用户对网络使用主要包语音类、短信类、上网类,其中上网类业务主要包括IM、视频、游戏和网页浏览(包括新闻、资讯等)等4大类通信业务。然后再统计各类通信业务网络使用时长。其中,语音类:基于用户话单CDR的通话开始时间和结束时间统计语音时长;短信类:由于微信/QQ等IM工具的广泛使用,当前用户主动发短信情况已经很少,短信主要是平台发给用户即P2A方式,即用户主要是接收方,故短信对用户使用网络的影响可以忽略不计;上网类:IM、游戏、网页浏览基于HTTP协议,从2G/3G/4G的HTTP信令的开始时间和结束时间累积HTTP业务使用时间,视频类业务部分使用HTTP协议,部分使用RTMP协议,从3G/4G的HTTP和RTMP信令中获取视频业务的累积时长。
基于以上方式可以获取每个样本用户对通信网络使用的语音类业务时长、IM类业务时长、视频类业务时长、游戏类业务时长、浏览类业务时长,为了获取用户长期较稳定通信网络使用行为,可以通过累积每个用户的1个自然月的各类通信业务的累积分钟数。
步骤S1022,基于各个所述样本用户的各类通信业务的网络使用时长,通过预定的聚类算法对多个所述样本用户进行聚类,将多个所述样本用户分为多组。
其中,预定的聚类算法可以为k均值(K-Means)聚类算法,当然,并不限于此,在具体应用中,还可以采用其它的聚类算法,例如,层次聚类算法或密度聚类算法等。
下面以K-Means算法为例,对步骤S1022进行说明。
在聚类之前需要初始化k个聚类中心,在一个可选的实现方式中,步骤S1022可以包括:
在数据集(即多个所述样本用户)随机选取一个样本点(每个样本点包括一个样本用户的各类通信业务的网络使用时长)作为初始的聚类中心;
选择出其余的聚类中心方法如下:
计算数据集中每个样本点与已经初始化的聚类中心之间的距离,并选择其中最短的距离记为di
以概率选择距离最大的样本点作为新的聚类中心重复上述过程,直到k个聚类中心都被确定;
对k个初始化聚类中心,再利用K-Means算法计算最终的聚类中心。
在上述过程中,在计算样本点与聚类中心之间的距离时,可以采用的距离算法主要有以下几种算法:欧氏距离、曼哈顿距离和切比雪夫距离。以上几种距离算法中,所有的属性的权重都是相同的,但对于用户对网络业务使用情况来说,各业务对于距离的贡献是不一样的。例如,对于语音类业务,用户在使用该类业务时一般很少同时使用其他业务,但在使用IM、网页浏览类、视频和游戏类业务时,这几类业务可能会同时使用,比如在发送IM或玩游戏的同时浏览器在后台进行网页加载或者移动Apps特别是视频类业务为了提高使用体验采用并发HTTP调用方式,从而导致这几类业务基于信令累积的时间之和会大于自然时间,进而导致用户使用这几类业务时间大于真实时间。因此,在一个可选的实现方式中,可以通过设置权重来改善这个问题,具体实现方式如下:
语音类业务:权重设置为1;
视频类、游戏类、IM和网页浏览类业务:统计某个样本用户的该类用户面信令数量,假设总数为n,对于同一样本用户的同一业务的信令的开始时间和结束时间如果有交叠则只计入1条,累积信令总数为m,则n/m即为并发度,则并发度的倒数m/n即为该业务权重,优化后的距公式如下:
Figure BDA0002444194190000061
其中wk为权重
基于改进的K-Means算法和优化后的距离算法进行聚类,对于用户分组的数量可以通过k取值[1,10]之间,然后通过轮廓系数SC最大或误差平方和指标SSE最小确定k值,最终模型会基于各业务使用时长分布将用户分为语音类重度用户、语音和IM类重度用户、视频类重度用户、游戏类重度用户等有限几类,不同的用户业务使用可能会导致分类的数量有所不同。
步骤S104,基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区。
其中,单位时间可以根据实际应用选择,例如,可以为一天,则第一时间段可以为(08:00~18:00),即白天,第二时间段可以为(20:00~02:00),即夜间。
在一个可选的实现方式中,步骤S104可以包括以下步骤:
步骤S1041,按照预设的粒度将单位时间内的目标时间段划分为多个子区间,其中,所述目标时间段包括所述第一时间段或所述第二时间段;
步骤S1042,获取多个所述样本用户的通信数据,其中,所述通信数据包括:样本用户的标识、通信的起始时间和通信小区标识;
步骤S1043,基于各个所述样本用户在经历的多个通信小区的各个所述子区间是否有通信数据,统计所述目标时间段内各个所述样本用户在多个所述通信小区的活跃度;
步骤S1044,基于各个所述样本用户在经历的多个通信小区的各个所述子区间产生通信数据的次数,统计所述目标时间段内各个所述样本用户在多个所述通信小区的通信频率;
步骤S1045,累积统计周期内各个所述样本用户在经历的每个所述通信小区的活跃度和通信频率,确定各个所述样本用户在所述目标时间段的常驻小区。
例如,以白天常驻小区为例,可以通过以下方式确定各个样本用户的白天常驻小区:
(1)时间分段:将每个小时的话分为12个5分钟粒度,即8点至9点之间有12个5分钟,这样白天(08:00~18:00)有12×10=120个5分钟;
(2)活跃度累积:获取用户的通信数据,其中,通信数据类型包括:语音、短信和数据信令数据,其中数据信令数据包括用户面数据和控制面数据,用户面数据包括DNS、EMAIL、IM、MMS、P2P、RTSP、VIDEO、VOIP、FTP等业务,控制面数据包括S1-MME、S6a、S11、UU、SGS、X2、Mc、A口等;每条通信数据都至少包括用户手机号码、开始时间、结束之间和通信小区唯一标志(CELL_ID或者LAC/TAC+CI),对于上述120个时间段的每一个时间段只要与任意(语音、短信和数据)信令的[开始时间,结束之间]有交集则认为该用户在该通信小区CELL_ID累计1积分,假设一个用户在位置基本保持不变的情况下,并且在持续使用通信网络,则该用户在所处的通信小区累计白天累计的最大积分是120;
(3)通信频率累积:对于上述120个时间段的每一个时间段只要与任意(语音、短信和数据)信令的[开始时间,结束之间]有交集则认为该用户在该通信小区CELL_ID使用网络1次,假设一个用户在某一时段有2次语音、1次短信、4次网络点击、1次周期性TAU,那么在该时段累积的次数(即频率)是2+1+1+4=8次;
(4)常驻小区判断:累积1个自然月中每个用户在经历的每个通信小区的积分和次数,取Top 3积分的小区作为用户的白天常驻小区,如果排在第4名的小区与第3名小区具有相同的积分,则选择次数高的小区作为第3名,最终确定各个样本用户的白天常驻小区。
对于用户夜间常驻小区,可以采用相应的方式确定。具体不再赘述。
通过上述可选的实现方式,采用时间切片方式而不是基于单用户信令数据排序方式识别用户常驻小区的方法,可以避免信令数据较大,经常存在信令数据丢失情况(网络设备原因、传输原因、DPI原因等),很多时候无法回溯用户真实常驻情况,且用户信令数据量巨大(每天TB级)按每个单用户对其信令按时间数序进行排序需要消耗巨大的计算和存储资源,用于数据质量等问题,提高了判定速率,极大降低了硬件资源开销。
步骤S106,对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标。
在一个可选的实现方式中,步骤S106可以包括以下步骤:
步骤S1061,基于预定的影响网络NPS的指标类型,获取该组的各个样本用户的常驻小区的指标参数;
步骤S1062,获取各个所述指标参数的信息价值,从所述多个指标参数中选择信息价值大于第一阈值的指标参数作为所述目标指标;
步骤S1063,计算多个所述目标指标中每两个所述目标指标的相关系数,对于相关系数大于第二阈值的两个所述目标指标,删除其中的一个所述目标指标,将剩余的所述目标指标作为该组样本用户的网络NPS指标。
在实际应用中,通过对相关指标参数梳理,可以整理出9大类500多个指标参数,但这些指标参数很多与网络NPS无关,另外有些指标参数之间有很强的强相关性,需要在后续的步骤中进行剔除。其中,这些指标参数包括但不限于以下参数:
通信小区属性:小区类型、小区归属、覆盖范围、小区可用性等;
通信小区质量:故障小区、故障处理时长等;
语音质量指标(月度):主被叫失败率、主被叫失败率、语音质量SQI、TCH拥塞率等;
语音切换指标(月度):呼叫回落次数、呼叫回落时延、寻呼成功次数等;
高清语音指标(月度):切换成功率、呼叫建立时延、全程成功率等;
基础上网指标(月度):DOU、访问时长、访问次数等;
数据控制面信令指标(月度):附着成功率、业务请求成功率、TAU成功率等;
数据用户面信令指标(月度):DNS成功率、TCP建链时延、视频缓冲时长等;
客户服务指标(近半年):投诉次数、解决时间、解决满意度等。
为了从这些指标参数中找到对网络NPS有影响的目标指标,可以通过IV对影响网络NPS指标进行甄选。
其中,IV是信息价值或者信息量。IV值的作用和信息增益、信息增益比、基尼不纯度类似,都是用作特征选择的。通过计算IV值进行特征筛选,可以筛选出与网络NPS相关性强的指标,其中,指标参数的IV值越大表明该变量对网络NPS影响也越大。
IV的计算是以WOE(Weight of Evidence,证据权重)为基础,以“E-RAB建立请求时均失败次数”的IV计算为例,第i个常驻区域内的WOC:
Figure BDA0002444194190000091
其中,#yi是分组内(某个常驻区域内)E-RAB建立请求时均失败数量,#ni是分组内所有用户数量,#yT是所有常驻区域内的用户E-RAB建立请求时均失败数量,#nT是所有常驻区域内的用户总数。
对于每个分组i:
Figure BDA0002444194190000092
最终“E-RAB建立请求时均失败次数”的IV为:
Figure BDA0002444194190000093
其中,n为常驻区域分组个数。
最后得到的部分指标IV结果如下表1所示。
表1.
Figure BDA0002444194190000101
通过对各指标参数逐一计算IV可以发现基于用户常驻通信小区计算的相关指标的IV值同用户全部通信小区计算的相关网络指标的IV值普遍要大一些,说明基于用户常驻通信小区的网络指标与网络NPS的相关性更强,保留IV大于第一阈值(例如,0.1)的指标参数(即目标指标),其他指标参数与网络NPS相关性弱,后续步骤不再考虑。
然后通过变量相关性对目标指标进行甄选,从而得到网络NPS指标。例如,通过计算两两目标指标的Pearson相关系数,对相关性较强(相关系数大于第二阈值,例如,0.4)的指标做仅保留一个处理。
在实际应用中,通过对500个指标参数进行IV和相关系数分析,最后有78个指标对网络NPS有明显影响,将78个指标作为网络NPS指标。
步骤S108,对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子。
在一个可选的实现方式中,步骤S108可以包括以下步骤:
步骤S1081,基于该组样本用户所属的通信业务类型,从该组样本用户的网络NPS指标中选择目标网络NPS指标,其中,所述目标网络NPS指标为与该组样本用户所属的通信业务类型相关的网络NPS指标。
在该可选的实现方式,使用与业务相关指标计算影响因子,从而可以减少不必要的计算。例如,如果用户为重度语音类业务,即没有上网行为,则上网相关网络指标如数据相关信令指标,与该用户的网络NPS无关,其影响因子基本为0,因此,不参与后续建模。
步骤S1082,利用该组的每个样本用户的各个所述目标网络NPS指标和该样本用户反馈的网络NPS作为参数,通过因子分解机FM算法进行建模,获取各个所述目标网络NPS指标对该组样本用户的网络NPS的影响因子。
例如,
Figure BDA0002444194190000111
对于度为2的因子分解机FM的模型为:
Figure BDA0002444194190000112
Figure BDA0002444194190000113
其中,w0为常数项系数,wi为一次项系数,对特征i∈{1,2…n},特征即为网络NPS指标,vi和vj为交叉项系数。对于交叉项系数vi,其具体的形式为:
vi=(vi,1,vi,2,…vi,k)1Xk
在FM模型的定义中,首先需要分别定义三个参数:w0,w和v。在本实施例,可以采用Python开源训练库进行操作:
w0=0//常数项的系数
m,n=shape(dataMatrix)//设置一次项系数的个数
alpha=0.01
w=zeros((n,1))ctor,num_attribute)
v=normalvariate(0,0.2)*ones((n,k))
FM算法二分类问题利用随机梯度下降SGD方法进行求解在利用梯度下降法对模型中的参数进行调整的过程中,假设损失函数为l,则对于回归问题来说,其损失函数为:
Figure BDA0002444194190000121
其中σ为Sigmoid函数:
Figure BDA0002444194190000122
对于σ(x),其导函数为:σ′=σ(1-σ)
损失函数的梯度为:
Figure BDA0002444194190000123
在定义好上述的计算方法后,其核心的问题是如何计算
Figure BDA0002444194190000124
已知:
Figure BDA0002444194190000125
因此,当
Figure BDA0002444194190000126
分别对w0,wi以及vi,f求偏导时,其结果为:
Figure BDA0002444194190000127
其中,
Figure BDA0002444194190000128
为第i样本用户反馈的网络NPS值。
利用梯度的方法中,其参数θ的更新方法为:
Figure BDA0002444194190000129
其中η为学习率,重复步骤,直到满足评估条件后终止。
在本实施例的一个可选实施方式中,可以选取网络NPS调研样本数据中的聚类的其中一组样本用户的75%作为训练集,把网络NPS值和筛选的网络NPS指标作为参数,通过FM算法进行建模,获取每个指标对网路NPS值的影响因子。在实际应用中,部分指标的影响因子如下表2所示。
表2.
指标名称 影响因子w<sub>i</sub>
PDN断开连接日均请求次数 1.554
HTTP请求失败率 -3.15
即时通讯业务请求失败率 -2.87
PDN连接请求失败小时占比 1.546
E-RAB建立请求时均失败次数 1.685
HTTP请求成功率 1.402
HTTP请求平均小时时延 9.36
S1接口切出请求失败率 7.92
PSPaging请求失败率 6.13
选取NPS调研样本数据中的聚类的同一组样本用户的剩余25%作为测试集,对用户的网络NPS值进行预测(0表示不满意,1表示满意),以测试模型准确性。
步骤S110,基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
在本实施例的一个可选实施方式中,在步骤S110之前,可以采用与对所述多个样本用户进行分组相同的分组方式,对所述全网用户进行分组。例如,可以在步骤S102中,对样本用户数据基于用户对网络使用的行为和使用的网络协议进行聚类,生成聚类模型,基于该模型对全量用户进行分组。
在本申请实施例的一个可选实施方式中,在步骤S108之后,还可以基于影响因子大于第三阈值的网络NPS指标,确定提高网络NPS的改善策略。即在该可选的实施方式中,对于网络NPS值有明显影响的网络NPS指标,即影响因子大的网络NPS指标进行分析,分析改善指标的手段,比如通过新建基站、增加网络带宽、调整现网设备参数改善指标等,进而通过网络指标的改善提高网络NPS。
在本申请实施例提供的上述技术方案中,充分考虑到用户通信网络使用行为差异,通过改进的有权重的聚类方法对相似网络使用行为用户进行分组,对有明显特征的每一组用户有针对性分析影响网络NPS值的关键指标,对每一组用户都能识别到较明显指标;不采用传统的随机森林、逻辑回归、决策树算法,而是采用非线性的,支持二分类的因子分解机FM算法进行建模,明显提高了预测的准确性;采用时间切片方式而不是基于单用户信令数据排序方式识别用户常驻小区的方法,提高了判定速率,极大降低了硬件资源开销。
与上述方法实施例相对应,本申请实施例还提供了一种网络NPS的预测装置,该装置可以用于实现上述的网络NPS的预测方法。
图2为本申请实施例提供的一种网络NPS的预测装置的结构示意图,如图2所示,该装置主要包括:分组模块201、确定模块202、第一获取模块203、第二获取模块204、和预测模块205。下面主要对本实施例中的各个功能模块的功能进行说明,其它细节可以参见上述方法实施例中的描述。
在本实施例中,分组模块201,用于基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;确定模块202,用于基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;第一获取模块203,用于对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;第二获取模块204,用于对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;预测模块205,用于基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
在一个可选的实施方式中,所述分组模块201可以包括:第一获取单元,用于基于各个所述样本用户对网络使用的行为和使用的网络协议,获取各个所述样本用户的各类通信业务的网络使用时长;聚类单元,用于基于各个所述样本用户的各类通信业务的网络使用时长,通过预定的聚类算法对多个所述样本用户进行聚类,将多个所述样本用户分为多组。
在一个可选的实施方式中,所述确定模块202包括:划分单元,用于按照预设的粒度将单位时间内的目标时间段划分为多个子区间,其中,所述目标时间段包括所述第一时间段或所述第二时间段;第二获取单元,用于获取多个所述样本用户的通信数据,其中,所述通信数据包括:样本用户的标识、通信的起始时间和通信小区标识;第一统计单元,用于基于各个所述样本用户在经历的多个通信小区的各个所述子区间是否有通信数据,统计所述目标时间段内各个所述样本用户在多个所述通信小区的活跃度;第二统计单元,用于基于各个所述样本用户在经历的多个通信小区的各个所述子区间产生通信数据的次数,统计所述目标时间段内各个所述样本用户在多个所述通信小区的通信频率;第一确定单元,用于累积统计周期内各个所述样本用户在经历的每个所述通信小区的活跃度和通信频率,确定各个所述样本用户在所述目标时间段的常驻小区。
在一个可选的实施方式中,所述第一获取模块203包括:第三获取单元,用于基于预定的影响网络NPS的指标类型,获取该组的各个样本用户的常驻小区的指标参数;第一选择单元,用于获取各个所述指标参数的信息价值,从所述多个指标参数中选择信息价值大于第一阈值的指标参数作为所述目标指标;筛选单元,用于计算多个所述目标指标中每两个所述目标指标的相关系数,对于相关系数大于第二阈值的两个所述目标指标,删除其中的一个所述目标指标,将剩余的所述目标指标作为该组样本用户的网络NPS指标。
在一个可选的实施方式中,所述第二获取模块204包括:第二选择单元,用于基于该组样本用户所属的通信业务类型,从该组样本用户的网络NPS指标中选择目标网络NPS指标,其中,所述目标网络NPS指标为与该组样本用户所属的通信业务类型相关的网络NPS指标;第四获取单元,用于利用该组的每个样本用户的各个所述目标网络NPS指标和该样本用户反馈的NPS作为参数,通过因子分解机FM算法进行建模,获取各个所述目标网络NPS指标对该组样本用户的NPS的影响因子。
在一个可选的实施方式中,所述分组模块201还用于采用与对所述多个样本用户进行分组相同的分组方式,对所述全网用户进行分组。
在一个可选的实施方式中,还包括:改善模块,用于基于影响因子大于第三阈值的网络NPS指标,确定提高网络NPS的改善策略。
本发明实施例提供的预测装置能够实现上述方法实施例中的各个过程,并具有相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述网络NPS的预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (13)

1.一种网络净推荐值NPS的预测方法,其特征在于,包括:
基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;
基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;
对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;
对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;
基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
2.根据权利要求1所述的方法,其特征在于,基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组,包括:
基于各个所述样本用户对网络使用的行为和使用的网络协议,获取各个所述样本用户的各类通信业务的网络使用时长;
基于各个所述样本用户的各类通信业务的网络使用时长,通过预定的聚类算法对多个所述样本用户进行聚类,将多个所述样本用户分为多组。
3.根据权利要求2所述的方法,其特征在于,所述预定的聚类算法包括:k均值聚类算法。
4.根据权利要求1所述的方法,其特征在于,基于预设的常驻小区判定方法,确定多个所述样本用户的常驻小区,包括:
按照预设的粒度将单位时间内的目标时间段划分为多个子区间,其中,所述目标时间段包括所述第一时间段或所述第二时间段;
获取多个所述样本用户的通信数据,其中,所述通信数据包括:样本用户的标识、通信的起始时间和通信小区标识;
基于各个所述样本用户在经历的多个通信小区的各个所述子区间是否有通信数据,统计所述目标时间段内各个所述样本用户在多个所述通信小区的活跃度;
基于各个所述样本用户在经历的多个通信小区的各个所述子区间产生通信数据的次数,统计所述目标时间段内各个所述样本用户在多个所述通信小区的通信频率;
累积统计周期内各个所述样本用户在经历的每个所述通信小区的活跃度和通信频率,确定各个所述样本用户在所述目标时间段的常驻小区。
5.根据权利要求1所述的方法,其特征在于,对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标,包括:
基于预定的影响网络NPS的指标类型,获取该组的各个样本用户的常驻小区的指标参数;
获取各个所述指标参数的信息价值,从多个所述指标参数中选择信息价值大于第一阈值的指标参数作为所述目标指标;
计算多个所述目标指标中每两个所述目标指标的相关系数,对于相关系数大于第二阈值的两个所述目标指标,删除其中的一个所述目标指标,将剩余的所述目标指标作为该组样本用户的网络NPS指标。
6.根据权利要求1所述的方法,其特征在于,对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子,包括:
基于该组样本用户所属的通信业务类型,从该组样本用户的网络NPS指标中选择目标网络NPS指标,其中,所述目标网络NPS指标为与该组样本用户所属的通信业务类型相关的网络NPS指标;
利用该组的每个样本用户的各个所述目标网络NPS指标和该样本用户反馈的网络NPS作为参数,通过因子分解机FM算法进行建模,获取各个所述目标网络NPS指标对该组样本用户的网络NPS的影响因子。
7.根据权利要求1至6任一项所述的方法,其特征在于,
在基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测之前,所述方法还包括:采用与对所述多个样本用户进行分组相同的分组方式,对所述全网用户进行分组;和/或,
获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子之后,所述方法还包括:基于影响因子大于第三阈值的网络NPS指标,确定提高网络NPS的改善策略。
8.一种网络NPS的预测装置,其特征在于,包括:
分组模块,用于基于多个样本用户对网络使用的行为和使用的网络协议,对多个样本用户进行分组;
确定模块,用于基于预设的常驻小区判定方法,确定各个所述样本用户的常驻小区,其中,所述常驻小区包括:单位时间内的第一时间段的常驻小区和单位时间内的第二时间段的常驻小区;
第一获取模块,用于对于一组样本用户,基于该组的各个样本用户的常驻小区的目标指标,获取该组样本用户的网络NPS指标;
第二获取模块,用于对于一组样本用户,基于该组的各个样本用户反馈的网络NPS,获取该组样本用户的网络NPS指标对该组样本用户的网络NPS的影响因子;
预测模块,用于基于一组样本用户的网络NPS指标对网络NPS的影响因子,对与所述样本用户同组的全网用户的网络NPS进行预测。
9.根据权利要求8所述的装置,其特征在于,所述分组模块包括:
第一获取单元,用于基于各个所述样本用户对网络使用的行为和使用的网络协议,获取各个所述样本用户的各类通信业务的网络使用时长;
聚类单元,用于基于各个所述样本用户的各类通信业务的网络使用时长,通过预定的聚类算法对多个所述样本用户进行聚类,将多个所述样本用户分为多组。
10.根据权利要求8所述的装置,其特征在于,所述确定模块包括:
划分单元,用于按照预设的粒度将单位时间内的目标时间段划分为多个子区间,其中,所述目标时间段包括所述第一时间段或所述第二时间段;
第二获取单元,用于获取多个所述样本用户的通信数据,其中,所述通信数据包括:样本用户的标识、通信的起始时间和通信小区标识;
第一统计单元,用于基于各个所述样本用户在经历的多个通信小区的各个所述子区间是否有通信数据,统计所述目标时间段内各个所述样本用户在多个所述通信小区的活跃度;
第二统计单元,用于基于各个所述样本用户在经历的多个通信小区的各个所述子区间产生通信数据的次数,统计所述目标时间段内各个所述样本用户在多个所述通信小区的通信频率;
第一确定单元,用于累积统计周期内各个所述样本用户在经历的每个所述通信小区的活跃度和通信频率,确定各个所述样本用户在所述目标时间段的常驻小区。
11.根据权利要求8所述的装置,其特征在于,所述第一获取模块包括:
第三获取单元,用于基于预定的影响网络NPS的指标类型,获取该组的各个样本用户的常驻小区的指标参数;
第一选择单元,用于获取各个所述指标参数的信息价值,从多个所述指标参数中选择信息价值大于第一阈值的指标参数作为所述目标指标;
筛选单元,用于计算多个所述目标指标中每两个所述目标指标的相关系数,对于相关系数大于第二阈值的两个所述目标指标,删除其中的一个所述目标指标,将剩余的所述目标指标作为该组样本用户的网络NPS指标。
12.根据权利要求8所述的装置,其特征在于,所述第二获取模块包括:
第二选择单元,用于基于该组样本用户所属的通信业务类型,从该组样本用户的网络NPS指标中选择目标网络NPS指标,其中,所述目标网络NPS指标为与该组样本用户所属的通信业务类型相关的网络NPS指标;
第四获取单元,用于利用该组的每个样本用户的各个所述目标网络NPS指标和该样本用户反馈的NPS作为参数,通过因子分解机FM算法进行建模,获取各个所述目标网络NPS指标对该组样本用户的NPS的影响因子。
13.根据权利要求8至12任一项所述的装置,其特征在于,
所述分组模块还用于采用与对所述多个样本用户进行分组相同的分组方式,对所述全网用户进行分组;和/或,
所述装置还包括:改善模块,用于基于影响因子大于第三阈值的网络NPS指标,确定提高网络NPS的改善策略。
CN202010274198.8A 2020-04-09 2020-04-09 一种网络净推荐值nps的预测方法及装置 Active CN113517990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010274198.8A CN113517990B (zh) 2020-04-09 2020-04-09 一种网络净推荐值nps的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010274198.8A CN113517990B (zh) 2020-04-09 2020-04-09 一种网络净推荐值nps的预测方法及装置

Publications (2)

Publication Number Publication Date
CN113517990A CN113517990A (zh) 2021-10-19
CN113517990B true CN113517990B (zh) 2023-02-17

Family

ID=78060381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010274198.8A Active CN113517990B (zh) 2020-04-09 2020-04-09 一种网络净推荐值nps的预测方法及装置

Country Status (1)

Country Link
CN (1) CN113517990B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151872B (zh) * 2022-11-28 2023-11-14 荣耀终端有限公司 产品特性分析方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230090A (zh) * 2016-03-23 2017-10-03 ***通信集团上海有限公司 一种净推荐值nps分类方法及装置
CN108985830A (zh) * 2018-07-05 2018-12-11 北京邮电大学 基于异质信息网络的推荐评分方法、装置
CN109377252A (zh) * 2018-08-30 2019-02-22 广州崇业网络科技有限公司 一种基于大数据框架的客户满意度预测方法
CN109548036A (zh) * 2017-09-22 2019-03-29 ***通信集团浙江有限公司 一种移动网络潜在投诉用户预测方法和装置
CN110267288A (zh) * 2019-05-22 2019-09-20 中国联合网络通信集团有限公司 移动网络投诉定位方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230090A (zh) * 2016-03-23 2017-10-03 ***通信集团上海有限公司 一种净推荐值nps分类方法及装置
CN109548036A (zh) * 2017-09-22 2019-03-29 ***通信集团浙江有限公司 一种移动网络潜在投诉用户预测方法和装置
CN108985830A (zh) * 2018-07-05 2018-12-11 北京邮电大学 基于异质信息网络的推荐评分方法、装置
CN109377252A (zh) * 2018-08-30 2019-02-22 广州崇业网络科技有限公司 一种基于大数据框架的客户满意度预测方法
CN110267288A (zh) * 2019-05-22 2019-09-20 中国联合网络通信集团有限公司 移动网络投诉定位方法及装置

Also Published As

Publication number Publication date
CN113517990A (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
CA2983495C (en) Improving performance of communication network based on end to end performance observation and evaluation
EP2806594B1 (en) Method and device for evaluating the stability of a telecommunication line
CN110337059B (zh) 一种用户家庭关系的分析算法、服务器及网络***
CN107026750B (zh) 一种用户上网QoE评价方法及装置
WO2013135201A1 (zh) 一种获取qoe的方法、装置及保证qoe的方法、装置
CN108768695B (zh) Kqi的问题定位方法及装置
CN111294819B (zh) 一种网络优化方法及装置
CN109548036B (zh) 一种移动网络潜在投诉用户预测方法和装置
CN109936857B (zh) 一种无线感知度智能识别方法
CN112101692A (zh) 移动互联网质差用户的识别方法及装置
CN111294812A (zh) 一种资源扩容规划的方法及***
WO2012109958A1 (zh) 通信网络中数据处理的方法及设备
CN115470867A (zh) 基于知识图谱的坐席匹配方法、装置、设备及存储介质
CN113517990B (zh) 一种网络净推荐值nps的预测方法及装置
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN113947260A (zh) 用户满意度预测方法、装置及电子设备
CN109963292B (zh) 投诉预测的方法、装置、电子设备和存储介质
CN112200375A (zh) 预测模型生成方法、预测模型生成装置和计算机可读介质
CN115086140A (zh) 宽带业务的质量评估方法、装置、电子设备及存储介质
CN113038537B (zh) 分配移动网络频谱资源的方法和电子设备
CN111368858A (zh) 用户满意度评估方法及装置
US20170034035A1 (en) Real time event monitoring and analysis system
CN113079521B (zh) 一种通话质量优化方法、装置和设备
CN109962956B (zh) 用于向用户推荐通信业务的方法和***
CN118171196B (zh) 一种基于光网络大数据的视频业务客户体验质量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant