CN111813764A - 一种投诉预测模型的训练方法、装置及电子设备 - Google Patents
一种投诉预测模型的训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111813764A CN111813764A CN201910291155.8A CN201910291155A CN111813764A CN 111813764 A CN111813764 A CN 111813764A CN 201910291155 A CN201910291155 A CN 201910291155A CN 111813764 A CN111813764 A CN 111813764A
- Authority
- CN
- China
- Prior art keywords
- complaint
- user
- sample user
- mobile
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000006399 behavior Effects 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000013145 classification model Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000007787 long-term memory Effects 0.000 claims 1
- 230000002265 prevention Effects 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004140 cleaning Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请提供一种投诉预测模型的训练方法、装置及电子设备。方法包括:从移动用户中选取样本用户;确定样本用户对应至少一种特征维度的特征值;至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;将样本用户对应至少一种特征维度的特征值作为投诉预测模型的输入,将指示样本用户是否具有投诉行为的标签作为投诉预测模型的输出,对投诉模型进行训练。本申请基于移动网络中样本用户对应的移动用户属性、移动网络属性和移动业务属性中至少一者的特征值,对预测投诉模型进行训练,使得预测投诉模型具被识别移动网络中潜在投诉用户的能力,从而为改善潜在投诉用户的网络质量提供依据,实现对投诉事件的防患于未然。
Description
技术领域
本申请实施例通信技术领域,尤其涉及一种投诉预测模型的训练方法、装置及电子设备。
背景技术
随着移动业务的不断发展,网络投诉量也不断增多。网络投诉是反应网络质量的一个关键指标。
针对移动网络投诉问题,目前还没有能够预测潜在投诉用户的技术方案。对于移动运营商来讲,只能通过投诉平台或者用户满意度调查等传统方式收集已发生的投诉问题,并进行补救处理,无法做到防患于未然。
有鉴于此,当前亟需一种能够预测移动网络中潜在投诉用户的技术方案,从而推动移动网络运行质量的提升,进而为用户提供更好的移动服务体验。
发明内容
本申请实施例目的是提供一种投诉预测模型的训练方法、装置及电子设备,能够通过学习模型机械预测出移动网络中的潜在投诉用户,以用于在投诉行为发生之前,为潜在投诉用户改善网络质量,实现对投诉行为的防患于未然。
为了实现上述目的,本申请实施例是这样实现的:
第一方面,提供一种投诉预测模型的训练方法,包括:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
第二方面,提供一种投诉预测模型的训练装置,包括:
选取模块,用于从移动用户中选取出样本用户;
确定模块,用于确定样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括:移动用户属性、移动网络属性和移动业务属性中的至少一者;
训练模块,用于将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
第三方面,提供一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
第四方面,提供一种算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
本申请实施例基于移动网络中样本用户对应的移动用户属性、移动网络属性和移动业务属性中至少一者的特征值,对预测投诉模型进行训练、优化,使得预测投诉模型具被识别移动网络中潜在投诉用户的能力,从而为改善潜在投诉用户的网络质量提供依据,可实现对投诉事件的防患于未然。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的投诉预测模型的训练方法的第一种流程示意图。
图2为本申请实施例提供的投诉预测模型的训练方法的第二种流程示意图。
图3为本申请实施例提供的投诉预测模型的训练装置的结构示意图。
图4为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
如前所述,针对移动网络投诉问题,目前还没有一套完整的预测潜在投诉用户的技术案,导致投诉问题只能在发生后进行补救,无法做到防患于未然。针对这一问题,本申请旨在提供一种能够预测移动网络中潜在投诉用户的技术方案,可以用于对符合条件的潜在投诉用户进行针对性的网络改善。
一方面,如图1所示,本申请实施例提供一种投诉预测模型的训练方法,包括:
步骤S102,从移动用户中选取出样本用户。
其中,样本用户应包括:具有投诉行为的黑样本用户和不具有投诉行为的白样本用户。
步骤S104,确定样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者。
具体地,每一特征维度具有至少一种指标,样本用户对应目标特征维的特征值是基于样本用户对应目标特征维度的各指标的指标值确定得到的。比如,对样本用户对应目标特征维度的各指标的指标值进行逻辑计算或组合,得到样本用户对应目标特征维度的特征值。
其中,
移动用户属性可以包括:用户归属地、用户年龄、用户级别和用户套餐中的少一者指标。
移动网络属性可以包括户常驻地数量、用户常驻小区数量、常驻地平均信号强度、常驻地网络类型、小区掉线率、小区接通率、小区切换成功率、移动网利用率和移动网拥塞率中的少一者指标。
移动业务属性可以包括:异常外部数据表示类型、通话时长、上网时长、视频时长和游戏时长中的少一者指标。
步骤S106,将样本用户对应上述至少一种特征维度的特征值作为投诉预测模型的输入,将指示样本用户是否具有投诉行为的标签作为投诉预测模型的输出,对投诉模型进行训练。
具体地,可以将样本用户对应的各特征维度的特征值组合成特征向量,以作为投诉预测模型的输入,得到投诉预测模型输出的训练结果。本步骤可以基于最大似然估计推导得到投诉预测模型的损失函数。之后基于损失函数计算出训练结果与标签的损失,并以降低损失为目的,对投诉预测模型中的参数(如特征向量对应权重值)进行调整,达到优化效果。
通过图1所示的训练方法可以知道:本申请实施例基于移动网络中样本用户对应的移动用户属性、移动网络属性和移动业务属性中至少一者的特征值,对预测投诉模型进行训练、优化,使得预测投诉模型具被识别移动网络中潜在投诉用户的能力,从而为改善潜在投诉用户的网络质量提供依据,可实现对投诉事件的防患于未然。
下面对本申请实施例的方法进行详细介绍。
本申请实施例的方法基于历史投诉用户和未投诉用户作为样本用户,建立用户特征数据库,提取反应潜在投诉的移动用户属性、移动业务属性和移动网络属性三种特征维度,将特征维度映射为具体的特征值,以对于基于长短期记忆网络(LSTM,Long Short-TermMemory)的投诉预测模型进行深入的学习训练,最终实现对移动网络潜在投诉用户的识别。
其中,如图2所示,主要流程包括:
步骤S201,选取样本用户。
在本步骤中,随机选择一定周期内移动网络GPRS/EDGE、WLAN、家庭宽带、消息类、网络覆盖、通话质量等投诉用户和未投诉用户作为样本用户。其中,样本用户数量大于10000,黑样本用户的数量与白样本用户的数量之比以小于或等于1:9且大于或等于1:20为宜。
步骤S202,同步用户特征数据库。
在本步骤中,对移动网络***进行针对样本用户的匹配查询,获取样本用户对应的移动数据,并对移动数据按照移动用户属性、移动网络属性和移动业务属性三种特征维度进行分类,得到样本用户对应各特征维度的特征数据。
其中,
移动用户属性可以包括:用户归属地、用户年龄、用户级别(VIP级别)和用户套餐等指标。
移动网络属性可以包括户常驻地数量、用户常驻小区数量、常驻地平均信号强度、常驻地网络类型、小区掉线率、小区接通率、小区切换成功率、移动网利用率和移动网拥塞率等指标。
移动业务属性可以包括:异常外部数据表示类型、通话时长、上网时长、视频时长和游戏时长等指标。
步骤S203,对用户特征数据库中的数据进行清洗。
清洗方式包括:
(1)缺失值清洗,去掉不需要的字段,合理填充缺失的内容;
(2)格式内容清洗,对不符合格式的内容进行纠正或删除处理,如手机号码包含字母;
(3)逻辑错误清洗,数据去重,去除不合理值,修正矛盾内容;
(4)非需求数据清洗。
步骤S204,从用户特征数据库中提取样本用户对应各特征维度的特征数据。
在本步骤中,可以提取样本用户一天对应各特征维度的特征数据,为便于理解特征数据可以如下表所示:
之后,对上表中的特征数据进行编码,统一转换成特征值。
比如,用户归属地一列,可以把地名映射为数值。其中,成都的值为1,绵阳的值为2,自贡的值为3;VIP一列,如果是VIP,则值为1,否则值为0;常驻地网络类型一列,如果为4G,则值为1,否则为0;异常XDR类型一列,如果掉话,则值为1,否则为0。
之后,按照预先约定的训练策略,将样本用户对应的各特征维度的特征值组合成特征向量,以作为模型的训练输入数据。
比如,上表中号码为139XXXXXX的用户对应的一天粒度的特征向量是:(1,20,1,88,1,3,24,-110,1,1,35,136,70,98,0.03,0.991,0.995,0.78,0.63)。其中,(1,20,1,88,1)是移动用户属性向量,(3,24,-110,1,0.03,0.991,0.995,0.78,0.63)是移动网络属性向量,(1,35,136,70,98,)是移动业务属性向量。
再比如,上表中150XXXXXX的用户对应的一天粒度的特征向量是:(1,30,1,58,1,5,45,-85,1,0,83,150,20,15,0.005,0.997,0.998,0.75,0.54)。其中,(1,30,1,58,1)是移动用户属性向量,(5,45,-85,1,0.005,0.997,0.998,0.75,0.54)是移动网络属性向量,(0,83,150,20,15)是移动业务属性向量。
按照上述方法,采集样本用户对应相邻N天的特征向量,并标注样本用户的训练标签。如具有投诉行为的样本用户标签值为1,否则为0。
步骤S205,训练LSTM模型。
在本步骤中,将样本用户对应相邻N天的特征向量,作为LSTM模型的输入,将样本用户的训练标签作为LSTM模型的输出,对LSTM模型进行训练。
具体地,本申请实施例的方法可以选取10%的特征向量作为测试集,剩余的90%随机分成9份,每次取其中8份作为训练集,剩下的1份作为验证集。之后,使用随时间反向传算法(BPTT,Backpropagation through time)对LSTM模型的参数进行更新。训练过程中,采用随机梯度下降方法进行反复迭代(为了抵制梯度***,可以对梯度范数进行调整)。
这里需要给予说明的是,模型训练方法属于现有技术,本申请并不涉及针对LSTM模型训练方式的改进,因此不举例赘述具体的训练过程。
步骤S204,测试LSTM模型。
在本步骤中,可以将上述测试集中的特征向量作为LSTM模型输入,得到LSTM模型的测试结果,如果LSTM模型输出的测试结果值小于0.5,则表示不投诉,如果输出的测试结果值大于等于0.5,则表示投诉。
之后,将测试结果与测试集中的特征向量对应标签进行比对。统计预测准确率,以对模型的性能进行评估。
如果,预测准确率不满足要求,则再次训练,重复步骤S202至S203,或者对训练迭代次数、训练终止阈值、时间步长及输入的特征向量进行调整,直至LSTM模型满足准确率要求。
步骤S205,更新LSTM模型。
在本步骤中,如果LSTM模型实际预测结果出错的情况,可以把其相应的特征数据加入用户特征数据库,在现有LSTM模型的基础上继续训练,达到优化目的。
应理解,在确定最终的LSTM模型后,即可基于该LSTM模型对移动用户是否为潜在投诉用户进行识别。如果是潜在投诉用户,则可以对潜在投诉用户常驻的小区、节点设备等进行调整,以改善移动网络质量。由于本申请实施例并不涉及网络改善方面的改进,因此不再举例赘述。
综上所述,本申请实施例的方法弥补了现有技术方案中只能对投诉问题发生以后进行处理的问题。通过基于LSTM模型,可以识别移动网络中的潜在投诉用户,并未在投诉用户进行具有针对性的网络质量改善,以为用户提供更好的服务体验。
以上是对本实施例的方法的介绍。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。比如,本申请实施例的投诉预测模型并不限于是LSTM模型,作为其他可行方案。投诉预测模型还可以是迭代决策树模型、逻辑回归模型、随机森林模型、朴素贝叶斯型和支持向量机模型中的任一者。此外,投诉预测模型输出的分类结果不限于是具有潜在投诉行为和不具有前在投诉行为两种结果,作为其他可行方案,预测模型输出的分类结果可以是用于判断是否具有潜在投诉行为的置信值,样本用户的置信值越高,则之后发生投诉行为的概率越大;反之,样本用户的置信值越低,则之后发生投诉行为的概率越小。
另一方面,本申请实施例还提供一种投诉预测模型的训练装置,如图3所示,包括:
选取模块301,用于从移动用户中选取出样本用户;
确定模块302,用于确定样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括:移动用户属性、移动网络属性和移动业务属性中的至少一者;
训练模块303,用于将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
通过图3所示的训练装置可以知道:本申请实施例基于移动网络中样本用户对应的移动用户属性、移动网络属性和移动业务属性中至少一者的特征值,对预测投诉模型进行训练、优化,使得预测投诉模型具被识别移动网络中潜在投诉用户的能力,从而为改善潜在投诉用户的网络质量提供依据,可实现对投诉事件的防患于未然。
可选地,每一特征维度具有至少一种指标,所述样本用户对应目标特征维的特征值是基于所述样本用户对应所述目标特征维度的各指标的指标值确定得到的。
可选地,所述训练模块303具体将所述样本用户对应的各特征维度的特征值组合成特征向量,以作为投诉预测模型的输入。
可选地,
所述移动用户属性包括以下至少一者指标:
用户归属地、用户年龄、用户级别和用户套餐;
所述移动网络属性包括以下至少一者指标:
用户常驻地数量、用户常驻小区数量、常驻地平均信号强度、常驻地网络类型、小区掉线率、小区接通率、小区切换成功率、移动网利用率和移动网拥塞率;
所述移动业务属性包括以下至少一者指标:
异常外部数据表示类型、通话时长、上网时长、视频时长和游戏时长。
可选地,所述确定模块302具体在从移动用户中选取出样本用户后,对移动网络***进行针对所述样本用户的匹配查询,以将所述移动网络***中记录的所述样本用户对应所述至少一种特征维度的特征数据存储至预设的用户特征数据库;之后,基于所述用户特征数据库记录的所述样本用户对应所述至少一种特征维度的特征数据,确定所述样本用户对应所述至少一种特征维度的特征值。
可选地,所述投诉预测模型为基于长短期记忆网络的分类模型。
可选地,所述样本用户包括具有投诉行为的黑样本用户和不具有投诉行为的白样本用户;其中,黑样本用户的数量与白样本用户的数量之比小于或等于1:9且大于或等于1:20。
显然,本申请实施例的训练装置可以作为上述图1所示的训练方法的执行主体,因此该训练装置能够实现训练方法在图1和图2所实现的功能。由于原理相同,本文不再赘述。
图4是本申请的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponentInterconnect,外设部件互连标准)总线或EISA(Extended IndustryStandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成问答对数据挖掘装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
本申请实施例的电子设备基于移动网络中样本用户对应的移动用户属性、移动网络属性和移动业务属性中至少一者的特征值,对预测投诉模型进行训练、优化,使得预测投诉模型具被识别移动网络中潜在投诉用户的能力,从而为改善潜在投诉用户的网络质量提供依据,可实现对投诉事件的防患于未然。
上述如本申请图1所示实施例揭示的训练方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
应理解,本申请实施例的电子设备可以实现上述训练装置在图1和图2所示的实施例的功能,本文不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
此外,本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下方法:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
应理解,上述指令当被包括多个应用程序的便携式电子设备执行时,能够使上文所述的训练装置实现图1和图2所示实施例的功能,本文不再赘述。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种投诉预测模型的训练方法,其特征在于,包括:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
2.根据权利要求1所述的方法,其特征在于,
每一特征维度具有至少一种指标,所述样本用户对应目标特征维的特征值是基于所述样本用户对应所述目标特征维度的各指标的指标值确定得到的。
3.根据权利要求2所述的方法,其特征在于,
将所述样本用户对应至少一种特征维度下的特征值作为投诉预测模型的输入,包括:
将所述样本用户对应的各特征维度的特征值组合成特征向量,以作为投诉预测模型的输入。
4.根据权利要求2任一项所述的方法,其特征在于,
所述移动用户属性包括以下至少一者指标:
用户归属地、用户年龄、用户级别和用户套餐;
所述移动网络属性包括以下至少一者指标:
用户常驻地数量、用户常驻小区数量、常驻地平均信号强度、常驻地网络类型、小区掉线率、小区接通率、小区切换成功率、移动网利用率和移动网拥塞率;
所述移动业务属性包括以下至少一者指标:
异常外部数据表示类型、通话时长、上网时长、视频时长和游戏时长。
5.根据权利要求1-4任一项所述的方法,其特征在于,
确定样本用户在至少一种特征维度下对应的特征值,包括:
在从移动用户中选取出样本用户后,对移动网络***进行针对所述样本用户的匹配查询,以将所述移动网络***中记录的所述样本用户对应所述至少一种特征维度的特征数据存储至预设的用户特征数据库;
基于所述用户特征数据库记录的所述样本用户对应所述至少一种特征维度的特征数据,确定所述样本用户对应所述至少一种特征维度的特征值。
6.根据权利要求1-4任一项所述的方法,其特征在于,
所述投诉预测模型为基于长短期记忆网络的分类模型。
7.根据权利要求1-4任一项所述的方法,其特征在于,
所述样本用户包括具有投诉行为的黑样本用户和不具有投诉行为的白样本用户;其中,黑样本用户的数量与白样本用户的数量之比小于或等于1:9且大于或等于1:20。
8.一种投诉预测模型的训练装置,其特征在于,包括:
选取模块,用于从移动用户中选取出样本用户;
确定模块,用于确定样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括:移动用户属性、移动网络属性和移动业务属性中的至少一者;
训练模块,用于将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
9.一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被所述处理器执行:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如下步骤:
从移动用户中选取出样本用户;
确定所述样本用户对应至少一种特征维度的特征值;所述至少一种特征维度包括移动用户属性、移动网络属性和移动业务属性中的至少一者;
将所述样本用户对应所述至少一种特征维度的特征值作为投诉预测模型的输入,将指示所述样本用户是否具有投诉行为的标签作为所述投诉预测模型的输出,对所述投诉模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910291155.8A CN111813764A (zh) | 2019-04-11 | 2019-04-11 | 一种投诉预测模型的训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910291155.8A CN111813764A (zh) | 2019-04-11 | 2019-04-11 | 一种投诉预测模型的训练方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111813764A true CN111813764A (zh) | 2020-10-23 |
Family
ID=72843599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910291155.8A Pending CN111813764A (zh) | 2019-04-11 | 2019-04-11 | 一种投诉预测模型的训练方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111813764A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112188014A (zh) * | 2020-10-28 | 2021-01-05 | 中国联合网络通信集团有限公司 | 信息处理方法及设备 |
CN112529602A (zh) * | 2020-12-23 | 2021-03-19 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、可读存储介质和电子设备 |
CN112699099A (zh) * | 2020-12-30 | 2021-04-23 | 广州杰赛科技股份有限公司 | 用户投诉数据库扩充方法、装置及存储介质 |
CN112884020A (zh) * | 2021-01-29 | 2021-06-01 | 北京联合大学 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
CN113099475A (zh) * | 2021-04-20 | 2021-07-09 | ***通信集团陕西有限公司 | 网络质量检测方法、装置、电子设备及可读存储介质 |
CN113592297A (zh) * | 2021-07-30 | 2021-11-02 | 国家电网有限公司客户服务中心 | 一种电力***专属式客户管理方法及*** |
CN114154765A (zh) * | 2022-01-07 | 2022-03-08 | 中国联合网络通信集团有限公司 | 小区预测方法、装置、电子设备及存储介质 |
CN114449569A (zh) * | 2020-11-02 | 2022-05-06 | ***通信集团广东有限公司 | 用户流量使用量处理方法、网络设备及业务处理*** |
CN115442832A (zh) * | 2021-06-03 | 2022-12-06 | ***通信集团四川有限公司 | 投诉问题定位方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095588A (zh) * | 2015-08-05 | 2015-11-25 | 中国联合网络通信集团有限公司 | 移动互联网用户投诉的预测方法和装置 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN107786364A (zh) * | 2016-08-25 | 2018-03-09 | 刘俊声 | 一种qoe体系预测投诉倾向建模方法 |
-
2019
- 2019-04-11 CN CN201910291155.8A patent/CN111813764A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095588A (zh) * | 2015-08-05 | 2015-11-25 | 中国联合网络通信集团有限公司 | 移动互联网用户投诉的预测方法和装置 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN107786364A (zh) * | 2016-08-25 | 2018-03-09 | 刘俊声 | 一种qoe体系预测投诉倾向建模方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112188014B (zh) * | 2020-10-28 | 2022-04-26 | 中国联合网络通信集团有限公司 | 信息处理方法及设备 |
CN112188014A (zh) * | 2020-10-28 | 2021-01-05 | 中国联合网络通信集团有限公司 | 信息处理方法及设备 |
CN114449569B (zh) * | 2020-11-02 | 2024-01-16 | ***通信集团广东有限公司 | 用户流量使用量处理方法、网络设备及业务处理*** |
CN114449569A (zh) * | 2020-11-02 | 2022-05-06 | ***通信集团广东有限公司 | 用户流量使用量处理方法、网络设备及业务处理*** |
CN112529602A (zh) * | 2020-12-23 | 2021-03-19 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、可读存储介质和电子设备 |
CN112699099A (zh) * | 2020-12-30 | 2021-04-23 | 广州杰赛科技股份有限公司 | 用户投诉数据库扩充方法、装置及存储介质 |
CN112699099B (zh) * | 2020-12-30 | 2024-06-04 | 中电科普天科技股份有限公司 | 用户投诉数据库扩充方法、装置及存储介质 |
CN112884020A (zh) * | 2021-01-29 | 2021-06-01 | 北京联合大学 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
CN112884020B (zh) * | 2021-01-29 | 2024-06-04 | 北京联合大学 | 一种基于多尺度圆形卷积神经网络的业务质量预测方法 |
CN113099475A (zh) * | 2021-04-20 | 2021-07-09 | ***通信集团陕西有限公司 | 网络质量检测方法、装置、电子设备及可读存储介质 |
CN115442832A (zh) * | 2021-06-03 | 2022-12-06 | ***通信集团四川有限公司 | 投诉问题定位方法、装置及电子设备 |
CN115442832B (zh) * | 2021-06-03 | 2024-04-09 | ***通信集团四川有限公司 | 投诉问题定位方法、装置及电子设备 |
CN113592297B (zh) * | 2021-07-30 | 2023-11-24 | 国家电网有限公司客户服务中心 | 一种电力***专属式客户管理方法及*** |
CN113592297A (zh) * | 2021-07-30 | 2021-11-02 | 国家电网有限公司客户服务中心 | 一种电力***专属式客户管理方法及*** |
CN114154765A (zh) * | 2022-01-07 | 2022-03-08 | 中国联合网络通信集团有限公司 | 小区预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111813764A (zh) | 一种投诉预测模型的训练方法、装置及电子设备 | |
CN111294819B (zh) | 一种网络优化方法及装置 | |
CN110598109A (zh) | 一种信息推荐方法、装置、设备及存储介质 | |
CN112154420A (zh) | 自动智能云服务测试工具 | |
CN112861346A (zh) | 数据处理***、方法及电子设备 | |
JP7177152B2 (ja) | ターゲティングおよびその他の設定を改善するためのコンテンツプロバイダの推薦 | |
US20230041339A1 (en) | Method, device, and computer program product for user behavior prediction | |
CN110875983B (zh) | 终端业务质量的评估方法、装置、设备及介质 | |
CN110634018A (zh) | 一种流失用户的特征刻画方法、识别方法及相关装置 | |
CN115174237B (zh) | 一种物联网***恶意流量的检测方法、装置和电子设备 | |
CN107733806B (zh) | 一种数据处理方法及装置 | |
CN111814051B (zh) | 一种资源类型确定方法及装置 | |
CN111582456B (zh) | 用于生成网络模型信息的方法、装置、设备和介质 | |
CN113824797A (zh) | 一种授课资源自适应同步方法及装置 | |
CN106339482A (zh) | 确定商家最佳沟通时间的方法及装置 | |
CN110801630A (zh) | 作弊程序确定方法、装置、设备和存储介质 | |
CN110674839A (zh) | 异常用户识别方法、装置、存储介质及电子设备 | |
CN111352825A (zh) | 数据接口的测试方法、装置及服务器 | |
CN115988475B (zh) | 快携用户的预测方法、设备及存储介质 | |
CN110895567A (zh) | 一种实体嵌入方法及装置 | |
CN113536806B (zh) | 一种文本分类方法及装置 | |
CN113628032B (zh) | 一种确定用户关系的方法及装置 | |
CN112312445B (zh) | 语音呼叫的处理方法、装置、存储介质和服务器 | |
CN111274118B (zh) | 一种应用优化处理方法、装置和*** | |
CN107315780A (zh) | 应用软件推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201023 |