CN112001756A - 异常电信业务场景的确定方法、装置、计算机设备 - Google Patents

异常电信业务场景的确定方法、装置、计算机设备 Download PDF

Info

Publication number
CN112001756A
CN112001756A CN202010854354.8A CN202010854354A CN112001756A CN 112001756 A CN112001756 A CN 112001756A CN 202010854354 A CN202010854354 A CN 202010854354A CN 112001756 A CN112001756 A CN 112001756A
Authority
CN
China
Prior art keywords
telecommunication service
index data
service index
clustered
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010854354.8A
Other languages
English (en)
Other versions
CN112001756B (zh
Inventor
罗兵
赵从标
潘晓磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Daolong Huaer Software Co ltd
Original Assignee
Beijing Daolong Huaer Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Daolong Huaer Software Co ltd filed Critical Beijing Daolong Huaer Software Co ltd
Priority to CN202010854354.8A priority Critical patent/CN112001756B/zh
Publication of CN112001756A publication Critical patent/CN112001756A/zh
Application granted granted Critical
Publication of CN112001756B publication Critical patent/CN112001756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种异常电信业务场景的确定方法、装置、计算机设备和存储介质。该方法包括:获取初始的电信业务指标数据;从初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;提取各群组中所包含的聚类后的电信业务指标数据的指标特征,将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。采用本方法能够实现根据电信业务指标数据自动确定异常的电信业务场景,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入。

Description

异常电信业务场景的确定方法、装置、计算机设备
技术领域
本申请涉及互联网应用技术领域,特别是涉及一种异常电信业务场景的确定方法、装置、计算机设备和存储介质。
背景技术
随着电信行业的快速发展,电信运营商的营业***承载能力越来越强,业务也越来越复杂,所产生的电信业务数据也越来越繁杂。通常,电信运营商需要根据电信业务数据来监控各业务环节存在的收入流失风险、分析、诊断与处理稽核出的各类问题,从而最大程度地保障电信业务数据的质量与业务收入的准确实现,挽回或避免收入的流失。
传统的针对电信业务场景的数据稽核通常采用人工稽核,然而,采用传统的电信业务数据的稽核方法,稽核效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高稽核效率的异常电信业务场景的确定方法、装置、计算机设备和存储介质。
一种异常电信业务场景的确定方法,所述方法包括:
获取初始的电信业务指标数据;
从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
在其中一个实施例中,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
在所述匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得所述任意两种类型的电信业务指标数据之间的相似度;
从所述匹配的电信业务指标数据中,删除所述相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;
对所述第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在其中一个实施例中,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
在所述匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;
从所述匹配的电信业务指标数据中,删除所述离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;
对所述第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在其中一个实施例中,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
通过四分位法,确定所述匹配的电信业务指标数据中的第一四分位数和第三四分位数;
根据所述第一四分位数和所述第三四分位数,确定所述匹配的电信业务指标数据中的下边缘和上边缘;
在所述匹配的电信业务指标数据中,将小于所述下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于所述上边缘的电信业务指标数据替换为所述主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,所述主体指标数据区间由位于所述下边缘和所述上边缘之间的电信业务指标数据构成;
对所述第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在其中一个实施例中,所述对所述第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
对所述第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据;
对所述归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在其中一个实施例中,所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
通过Kmeans++算法,选取多个候选分群个数,并根据所述多个候选分群个数分别对所述匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;
根据各所述候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在其中一个实施例中,所述从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据,包括:
从所述初始的电信业务指标数据中,选取所述电信业务场景所需的电信业务指标数据,并根据所述电信业务场景关联的所需电信业务指标数据对应的权重,对所述所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
一种异常电信业务场景的确定装置,所述装置包括:
数据获取模块,用于获取初始的电信业务指标数据;
数据匹配模块,用于从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
数据聚类模块,用于对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
场景确定模块,用于提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取初始的电信业务指标数据;
从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取初始的电信业务指标数据;
从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
上述异常电信业务场景的确定方法、装置、计算机设备,首先从初始的电信业务指标数据中选取与电信业务场景相匹配的电信业务指标数据,然后对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,之后提取各群组中所包含的聚类后的电信业务指标数据的指标特征,并将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。可以理解,本申请通过对电信业务指标数据进行数据匹配、聚类及特征提取并最终输入异常电信业务场景确定模型中以确定出异常的电信业务场景,实现了根据电信业务指标数据自动确定异常的电信业务场景的效果,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入(arpu值)。
附图说明
图1为一个实施例中异常电信业务场景的确定方法的流程示意图;
图2为一个实施例中对于相似度较高的两种类型的电信业务指标数据进行删除的流程示意图;
图3为一个实施例中对于相似度较高的同种类型的电信业务指标数据进行删除的流程示意图;
图4为一个实施例中对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据的补充方案的流程示意图;
图5为另一个实施例中对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据的补充方案的流程示意图;
图6为一个实施例中异常电信业务场景的确定装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种异常电信业务场景的确定方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的***,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤S202,获取初始的电信业务指标数据。
具体地,服务器获取初始的电信业务指标数据。其中,初始的电信业务指标数据是指电信业务在计算机设备中运行时所生成的与电信业务相关的指标数据。可选地,初始的电信业务指标数据包括多种类型的电信业务指标数据。在一个实施例中,初始的电信业务指标数据包括用户占用资源数据、电信实际收入数据、电信投入成本数据这三种类型的指标数据。
步骤S204,从初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据。
具体地,通常,电信业务场景的类型众多,不同类型的电信业务场景产生的电信业务指标数据一般存储在一起。因此,针对不同的电信业务场景,服务器根据电信业务场景的类型,从初始的电信业务指标数据中匹配相应的电信业务指标数据并进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
步骤S206,对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
具体地,服务器采用预设的聚类算法,对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。可以理解,电信业务指标数据经过聚类后会分成多个群组,每个群组中包含聚类后的电信业务指标数据。其中,分群个数即聚类后得到的群组的个数。
步骤S208,提取各群组中所包含的聚类后的电信业务指标数据的指标特征,将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。
其中,异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。在一个实施例中,异常电信业务场景确定模型是根据对聚类后的各群组中所包含的电信业务指标数据样本进行特征提取、电信业务规则解析匹配,并分析出各群组的样本特征,从而根据各群组的样本特征确定的。
具体地,在获得目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据后,服务器对每一群组中所包含的聚类后的电信业务指标数据进行特征提取,得到多组指标特征,之后将指标特征输入预设的异常电信业务场景确定模型,由于该异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本经过训练得到的,因此,使用该异常电信业务场景确定模型可分析出存在异常的电信业务指标数据,并确定异常的电信业务场景。可选地,服务器可针对异常的电信业务场景生成警示信息并输出。
上述异常电信业务场景的确定方法中,首先从初始的电信业务指标数据中选取与电信业务场景相匹配的电信业务指标数据,然后对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,之后提取各群组中所包含的聚类后的电信业务指标数据的指标特征,并将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。可以理解,本方法通过对电信业务指标数据进行数据匹配、聚类及特征提取并最终输入异常电信业务场景确定模型中以确定出异常的电信业务场景,实现了根据电信业务指标数据自动确定异常的电信业务场景的效果,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入。
在一个实施例中,用户占用资源数据包括用户使用语音量、用户使用流量、用户使用短信量、用户占用宽带宽、用户ITV档次、用户固话个数中的至少一个。电信实际收入数据包括用户出账金额、用户欠费金额、用户折扣及赠款金额、一次费收入中的至少一个。电信投入成本数据根据用户对应终端金额和施工折算金额来计算得到。例如,电信投入成本可根据用户对应终端金额、施工折算金额以及预设的公式分摊得到。
本实施例中,采用不同类型的电信业务指标数据,有利于提高异常电信业务场景判别的准确性,并且,采用的电信业务指标数据的类型越多,异常电信业务场景判别的准确性越高。
通常,电信业务的场景多种多样。对于不同类型的电信业务场景,其所产生的电信业务指标数据通常也是不同的。为了有效地对不同类型的电信业务进行分析,在一个实施例中,步骤S204具体可以通过以下步骤实现:
步骤S2042,从初始的电信业务指标数据中,选取电信业务场景所需的电信业务指标数据,并根据电信业务场景关联的所需电信业务指标数据对应的权重,对所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
具体地,服务器首先根据电信业务场景的类型,从初始的电信业务指标数据中,选取该类型的电信业务场景所需的电信业务指标数据。之后服务器根据该电信业务场景中设定好的所需电信业务指标数据对应的权重及相关系数,对所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
本实施例中,通过选取电信业务场景所需的电信业务指标数据并进行数字化处理,保证电信业务场景分析的准确性,并提高了分析效率。
在一个实施例中,在得到匹配的电信业务指标数据后,服务器对该匹配的电信业务指标数据进行质量检测,具体包括:服务器识别该匹配的电信业务指标数据中的空值、零值、与电信业务场景不匹配的异常值,之后,服务器统计每种类型的电信业务指标数据的空值或零值的占比,并从匹配的电信业务指标数据中,删除占比大于占比阈值的电信业务指标数据。可选地,服务器可基于95分位原则,删除占比大于95%的电信业务指标数据。可以理解,占比阈值还可以设定为其他数值。
本实施例中,将包含大量的空值、零值、与电信业务场景不匹配的异常值等没有分析意义的电信业务指标数据进行删除,一方面可以减少确定异常电信业务场景的数据量,提高数据处理效率;另一方面降低错误的电信业务指标数据对于异常电信业务场景分析所带来的不利影响,提高异常电信业务场景确定的准确性。
在一个实施例中,如图2所示,步骤S206具体可以通过以下步骤实现:
步骤S2062,在匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得任意两种类型的电信业务指标数据之间的相似度;
步骤S2064,从匹配的电信业务指标数据中,删除相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;
步骤S2066,对第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
具体地,在匹配的电信业务指标数据中,对于不同类型的电信业务指标数据,服务器遍历计算两两类型的电信业务指标数据之间的相似度,并从匹配的电信业务指标数据中,删除相似度大于相似度阈值的两种类型的电信业务指标数据中的任意一种类型的电信业务指标数据,即只保留其中一种类型的电信业务指标数据,得到第一电信业务指标数据。例如,假设电信业务指标数据包括用户使用语音量、用户欠费金额以及电信投入成本数据,那么,遍历计算任意两种两两类型的电信业务指标数据之间的相似度是指计算用户使用语音量与用户欠费金额之间的相似度,计算用户欠费金额与电信投入成本数据之间的相似度以及计算用户使用语音量与电信投入成本数据之间的相似度。之后,服务器对该第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。可选地,服务器可基于95分位原则,删除相似度大于0.95的两种类型的电信业务指标数据中的任意一种类型的电信业务指标数据,续举前例,假设用户使用语音量与用户欠费金额之间的相似度为0.98,用户欠费金额与电信投入成本数据之间的相似度为0.7,用户使用语音量与电信投入成本数据之间的相似度为0.5,那么,服务器通过比较各相似度与相似度阈值0.95,确定相似度大于相似度阈值的电信业务指标数据为用户使用语音量与用户欠费金额,从而删除用户使用语音量或用户欠费金额。若服务器删除用户使用语音量,则保留用户欠费金额;若服务器删除用户欠费金额,则保留用户使用语音量。可以理解,相似度阈值还可以设定为其他数值。
可选地,在一个实施例中,任意两种类型的电信业务指标数据之间的相似度包括任意两种类型的电信业务指标数据之间的皮尔逊相关系数。具体地,服务器可基于95分位原则,删除相似度大于0.95或小于-0.95的两种类型的电信业务指标数据中的任意一种类型的电信业务指标数据。在另一个实施例中,任意两种类型的电信业务指标数据之间的相似度包括任意两种类型的电信业务指标数据之间的杰卡德相似系数。
本实施例中,考虑到相似度很高的两种不同类型的电信业务指标数据对于分析电信业务场景的作用几乎是等同的,因此,通过删除其中一种类型的电信业务指标数据,不仅可以减少数据量的处理,还可以保证异常电信业务场景分析的准确性。
在一个实施例中,如图3所示,步骤S206具体可以通过以下步骤实现:
步骤S2061,在匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;
步骤S2063,从匹配的电信业务指标数据中,删除离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;
步骤S2065,对第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
其中,电信业务指标数据的离散值可以用来表征同种类型的电信业务指标数据的相似度。
具体地,在匹配的电信业务指标数据中,对于每种类型的电信业务指标数据,服务器确定每种类型的电信业务指标数据的离散值,并从匹配的电信业务指标数据中,删除离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据。之后,服务器对该第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。可选地,服务器可基于95分位原则,删除离散值小于0.05的电信业务指标数据。可以理解,离散值阈值还可以设定为其他数值。
本实施例中,若同种类型的电信业务指标数据相似度很高,表明该电信业务指标数据出现异常的概率较小,其对于异常电信业务场景的分析作用也较小,因此,将该电信业务指标数据删除,不仅可以减少数据量的处理,还可以保证异常电信业务场景分析的准确性。
在一个实施例中,如图4所示,步骤S206具体可以通过以下步骤实现:
步骤S206a,通过四分位法,确定匹配的电信业务指标数据中的第一四分位数和第三四分位数;
步骤S206c,根据第一四分位数和第三四分位数,确定匹配的电信业务指标数据中的下边缘和上边缘;
步骤S206e,在匹配的电信业务指标数据中,将小于下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于上边缘的电信业务指标数据替换为主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,主体指标数据区间由位于下边缘和上边缘之间的电信业务指标数据构成;
步骤S206g,对第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
具体地,服务器通过四分位法,确定匹配的电信业务指标数据中的第一四分位数、第二四分位和第三四分位数,其中,第一四分位数小于第二四分位,第二四分位小于第三四分位数。然后,服务器通过公式:least(第三四分位数+(第三四分位数-第一四分位数)*1.5,匹配的电信业务指标数据中的最大值),确定匹配的电信业务指标数据中的下边缘,其中,least函数返回入参加的最小值。之后,服务器通过公式:largest(第一四分位数-(第三四分位数-第一四分位数)*1.5,匹配的电信业务指标数据中的最小值),确定匹配的电信业务指标数据中的上边缘,其中,largest函数返回入参加的最大值。之后,服务器将位于下边缘和上边缘之间的电信业务指标数据作为主体指标数据区间,将小于下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于上边缘的电信业务指标数据替换为主体指标数据区间的最大数,替换完成后,得到第三电信业务指标数据。最后,服务器对第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
进一步地,在一个实施例中,步骤S206g具体可以通过以下步骤实现:服务器对第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据,并对归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。本实施例中,通过将电信业务指标数据映射到0-1之间,有利于后续地运算和分析,提高运算效率。
在一个实施例中,如图5所示,步骤S206具体可以通过以下步骤实现:
步骤S206b,通过Kmeans++算法,选取多个候选分群个数,并根据多个候选分群个数分别对匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;
步骤S206d,根据各候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
具体地,服务器通过Kmeans++算法,选取多个候选分群个数K。可选地,K可以选择5-50中的部分值或全部值。服务器根据多个候选分群个数分别对匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值。表1表示一示例性的分群个数K与聚类后的评价分值的关系分布,其中,横坐标表示分群个数K,纵坐标表示聚类后的评价分值。评价分值越高,表明聚类效果越好。
Figure BDA0002645866590000121
表1
接着,服务器采用如下公式确定目标分群个数:
max((Val-min(valList))/(max(valList)-min(valList))*(1-0.618)+(k-5)/(50-5))*0.618)
其中,max表示max函数,取最大值;min表示min函数,取最小值;val表示聚类后的评价分值;valList表示候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据;k表示候选分群个数;5-50是电信运营商的渠道个数在9000-30000之间,根据3σ原则(μ-3σ,μ+3σ),取值空间在10-30之间,但是为了防止有特殊情况,在不明显增加运算量的基础上,候选分群个数的取值空间定义为5-50;0.618表示黄金分隔线,由于在相近val值的情况下,优先取K值较大的结果,所以对k值的运算结果适当地添加权重。
续接表1,经过上述计算,服务器确定目标分群个数k=9,虽然k=9时的评价分值略低于k=6时的评价分值,但是k=9时更利于群组的细分,因此综合来看,取k=9时聚类效果更佳。
本实施例中,根据各候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值进行计算,选出聚类效果更佳的目标分群个数,基于该目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据进行异常电信业务场景的确定,可提高场景确定的准确性。
在一具体的应用场景中,服务器可将历史电信业务指标数据输入异常电信业务场景确定模型,识别出历史的电信业务场景,从而挖掘出未知的风险。
未知风险挖掘结果如表2:
Figure BDA0002645866590000131
表2
其中,采用本申请实施例涉及的异常电信业务场景的确定方法的实际运用效果包括:
异常电信业务场景1:用户行为数据对收入的影响异常表现为:用户使用量很大,对应出账金额却很少,对应收入少计的风险;用户使用量小,对应出账金额却很大,对应离网风险或投诉风险。
异常电信业务场景2:电信投入对收入的影响异常表现为:电信的投入大,对应的收入却很少,对应风险为收入少计,或协议期违反合约导致收入不及预期。
应该理解的是,虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种异常电信业务场景的确定装置,包括:数据获取模块302、数据匹配模块304、数据聚类模块306和场景确定模块308,其中:
数据获取模块302,用于获取初始的电信业务指标数据;
数据匹配模块304,用于从初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
数据聚类模块306,用于对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
场景确定模块308,用于提取各群组中所包含的聚类后的电信业务指标数据的指标特征,将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
上述异常电信业务场景的确定装置中,首先从初始的电信业务指标数据中选取与电信业务场景相匹配的电信业务指标数据,然后对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,之后提取各群组中所包含的聚类后的电信业务指标数据的指标特征,并将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。可以理解,本装置通过对电信业务指标数据进行数据匹配、聚类及特征提取并最终输入异常电信业务场景确定模型中以确定出异常的电信业务场景,实现了根据电信业务指标数据自动确定异常的电信业务场景的效果,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入。
在一个实施例中,数据聚类模块306具体用于在匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得任意两种类型的电信业务指标数据之间的相似度;从匹配的电信业务指标数据中,删除相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;对第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,数据聚类模块306具体用于在匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;从匹配的电信业务指标数据中,删除离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;对第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,数据聚类模块306具体用于通过四分位法,确定匹配的电信业务指标数据中的第一四分位数和第三四分位数;根据第一四分位数和第三四分位数,确定匹配的电信业务指标数据中的下边缘和上边缘;在匹配的电信业务指标数据中,将小于下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于上边缘的电信业务指标数据替换为主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,主体指标数据区间由位于下边缘和上边缘之间的电信业务指标数据构成;对第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,数据聚类模块306具体用于对第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据;对归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,数据聚类模块306具体用于通过Kmeans++算法,选取多个候选分群个数,并根据多个候选分群个数分别对匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;根据各候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,数据匹配模块304具体用于从初始的电信业务指标数据中,选取电信业务场景所需的电信业务指标数据,并根据电信业务场景关联的所需电信业务指标数据对应的权重,对所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
关于异常电信业务场景的确定装置的具体限定可以参见上文中对于异常电信业务场景的确定方法的限定,在此不再赘述。上述异常电信业务场景的确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常电信业务场景的确定方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取初始的电信业务指标数据;
从初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取各群组中所包含的聚类后的电信业务指标数据的指标特征,将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
上述计算机设备中,首先从初始的电信业务指标数据中选取与电信业务场景相匹配的电信业务指标数据,然后对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,之后提取各群组中所包含的聚类后的电信业务指标数据的指标特征,并将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。可以理解,本计算机设备通过对电信业务指标数据进行数据匹配、聚类及特征提取并最终输入异常电信业务场景确定模型中以确定出异常的电信业务场景,实现了根据电信业务指标数据自动确定异常的电信业务场景的效果,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:在匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得任意两种类型的电信业务指标数据之间的相似度;从匹配的电信业务指标数据中,删除相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;对第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:在匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;从匹配的电信业务指标数据中,删除离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;对第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过四分位法,确定匹配的电信业务指标数据中的第一四分位数和第三四分位数;根据第一四分位数和第三四分位数,确定匹配的电信业务指标数据中的下边缘和上边缘;在匹配的电信业务指标数据中,将小于下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于上边缘的电信业务指标数据替换为主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,主体指标数据区间由位于下边缘和上边缘之间的电信业务指标数据构成;对第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据;对归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过Kmeans++算法,选取多个候选分群个数,并根据多个候选分群个数分别对匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;根据各候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从初始的电信业务指标数据中,选取电信业务场景所需的电信业务指标数据,并根据电信业务场景关联的所需电信业务指标数据对应的权重,对所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取初始的电信业务指标数据;
从初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取各群组中所包含的聚类后的电信业务指标数据的指标特征,将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
上述计算机可读存储介质中,首先从初始的电信业务指标数据中选取与电信业务场景相匹配的电信业务指标数据,然后对匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,之后提取各群组中所包含的聚类后的电信业务指标数据的指标特征,并将指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景。可以理解,本计算机可读存储介质通过对电信业务指标数据进行数据匹配、聚类及特征提取并最终输入异常电信业务场景确定模型中以确定出异常的电信业务场景,实现了根据电信业务指标数据自动确定异常的电信业务场景的效果,由此提高了电信业务数据的稽核效率,可挽回不必要的投入及提高每用户平均收入。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:在匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得任意两种类型的电信业务指标数据之间的相似度;从匹配的电信业务指标数据中,删除相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;对第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:在匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;从匹配的电信业务指标数据中,删除离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;对第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过四分位法,确定匹配的电信业务指标数据中的第一四分位数和第三四分位数;根据第一四分位数和第三四分位数,确定匹配的电信业务指标数据中的下边缘和上边缘;在匹配的电信业务指标数据中,将小于下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于上边缘的电信业务指标数据替换为主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,主体指标数据区间由位于下边缘和上边缘之间的电信业务指标数据构成;对第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据;对归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过Kmeans++算法,选取多个候选分群个数,并根据多个候选分群个数分别对匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;根据各候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从初始的电信业务指标数据中,选取电信业务场景所需的电信业务指标数据,并根据电信业务场景关联的所需电信业务指标数据对应的权重,对所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种异常电信业务场景的确定方法,其特征在于,所述方法包括:
获取初始的电信业务指标数据;
从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
在所述匹配的电信业务指标数据中,遍历计算两两类型的电信业务指标数据并获得所述任意两种类型的电信业务指标数据之间的相似度;
从所述匹配的电信业务指标数据中,删除所述相似度大于相似度阈值的两种类型的电信业务指标数据中的其中一种类型的电信业务指标数据,得到第一电信业务指标数据;
对所述第一电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
3.根据权利要求1所述的方法,其特征在于,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
在所述匹配的电信业务指标数据中,确定每种类型的电信业务指标数据的离散值;
从所述匹配的电信业务指标数据中,删除所述离散值小于离散值阈值的电信业务指标数据,得到第二电信业务指标数据;
对所述第二电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
4.根据权利要求1所述的方法,其特征在于,所述初始的电信业务指标数据包括多种类型的电信业务指标数据;所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
通过四分位法,确定所述匹配的电信业务指标数据中的第一四分位数和第三四分位数;
根据所述第一四分位数和所述第三四分位数,确定所述匹配的电信业务指标数据中的下边缘和上边缘;
在所述匹配的电信业务指标数据中,将小于所述下边缘的电信业务指标数据替换为主体指标数据区间中的最小数,将大于所述上边缘的电信业务指标数据替换为所述主体指标数据区间中的最大数,得到第三电信业务指标数据,其中,所述主体指标数据区间由位于所述下边缘和所述上边缘之间的电信业务指标数据构成;
对所述第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
5.根据权利要求4所述的方法,其特征在于,所述对所述第三电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
对所述第三电信业务指标数据进行归一化处理,得到归一化后的电信业务指标数据;
对所述归一化后的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
6.根据权利要求1所述的方法,其特征在于,所述对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据,包括:
通过Kmeans++算法,选取多个候选分群个数,并根据所述多个候选分群个数分别对所述匹配的电信业务指标数据进行聚类计算,得到多个候选分群个数对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值;
根据各所述候选分群个数及其对应的各群组中所包含的聚类后的电信业务指标数据和聚类后的评价分值,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据。
7.根据权利要求1所述的方法,其特征在于,所述从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据,包括:
从所述初始的电信业务指标数据中,选取所述电信业务场景所需的电信业务指标数据,并根据所述电信业务场景关联的所需电信业务指标数据对应的权重,对所述所需的电信业务指标数据进行数字化处理,得到与电信业务场景相匹配的电信业务指标数据。
8.一种异常电信业务场景的确定装置,其特征在于,所述装置包括:
数据获取模块,用于获取初始的电信业务指标数据;
数据匹配模块,用于从所述初始的电信业务指标数据中,选取与电信业务场景相匹配的电信业务指标数据;
数据聚类模块,用于对所述匹配的电信业务指标数据进行聚类计算,确定目标分群个数对应的各群组中所包含的聚类后的电信业务指标数据;
场景确定模块,用于提取所述各群组中所包含的聚类后的电信业务指标数据的指标特征,将所述指标特征输入预设的异常电信业务场景确定模型,确定异常的电信业务场景,其中,所述异常电信业务场景确定模型是根据异常电信业务场景的电信业务指标数据样本训练得到的。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010854354.8A 2020-08-24 2020-08-24 异常电信业务场景的确定方法、装置、计算机设备 Active CN112001756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010854354.8A CN112001756B (zh) 2020-08-24 2020-08-24 异常电信业务场景的确定方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010854354.8A CN112001756B (zh) 2020-08-24 2020-08-24 异常电信业务场景的确定方法、装置、计算机设备

Publications (2)

Publication Number Publication Date
CN112001756A true CN112001756A (zh) 2020-11-27
CN112001756B CN112001756B (zh) 2022-07-12

Family

ID=73473136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010854354.8A Active CN112001756B (zh) 2020-08-24 2020-08-24 异常电信业务场景的确定方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN112001756B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633638A (zh) * 2020-12-03 2021-04-09 北京道隆华尔软件股份有限公司 业务风险评估方法、装置、计算机设备和存储介质
CN112783725A (zh) * 2021-01-26 2021-05-11 中国工商银行股份有限公司 指标采集方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180248905A1 (en) * 2017-02-24 2018-08-30 Ciena Corporation Systems and methods to detect abnormal behavior in networks
CN108809745A (zh) * 2017-05-02 2018-11-13 ***通信集团重庆有限公司 一种用户异常行为检测方法、装置及***
CN110837874A (zh) * 2019-11-18 2020-02-25 上海新炬网络信息技术股份有限公司 基于时间序列分类的业务数据异常检测方法
CN111371581A (zh) * 2018-12-26 2020-07-03 ***通信集团重庆有限公司 物联网卡业务异常检测的方法、装置、设备和介质
CN111445259A (zh) * 2018-12-27 2020-07-24 ***通信集团辽宁有限公司 业务欺诈行为的确定方法、装置、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180248905A1 (en) * 2017-02-24 2018-08-30 Ciena Corporation Systems and methods to detect abnormal behavior in networks
CN108809745A (zh) * 2017-05-02 2018-11-13 ***通信集团重庆有限公司 一种用户异常行为检测方法、装置及***
CN111371581A (zh) * 2018-12-26 2020-07-03 ***通信集团重庆有限公司 物联网卡业务异常检测的方法、装置、设备和介质
CN111445259A (zh) * 2018-12-27 2020-07-24 ***通信集团辽宁有限公司 业务欺诈行为的确定方法、装置、设备及介质
CN110837874A (zh) * 2019-11-18 2020-02-25 上海新炬网络信息技术股份有限公司 基于时间序列分类的业务数据异常检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633638A (zh) * 2020-12-03 2021-04-09 北京道隆华尔软件股份有限公司 业务风险评估方法、装置、计算机设备和存储介质
CN112633638B (zh) * 2020-12-03 2022-07-08 北京道隆华尔软件股份有限公司 业务风险评估方法、装置、计算机设备和存储介质
CN112783725A (zh) * 2021-01-26 2021-05-11 中国工商银行股份有限公司 指标采集方法及装置
CN112783725B (zh) * 2021-01-26 2024-04-09 中国工商银行股份有限公司 指标采集方法及装置

Also Published As

Publication number Publication date
CN112001756B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN111506498B (zh) 测试用例的自动生成方法、装置、计算机设备及存储介质
WO2019218699A1 (zh) 欺诈交易判断方法、装置、计算机设备和存储介质
CN110363387A (zh) 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN112001756B (zh) 异常电信业务场景的确定方法、装置、计算机设备
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN111915156B (zh) 基于用户价值的业务推送方法、电子设备及存储介质
CN110503566B (zh) 风控模型建立方法、装置、计算机设备及存储介质
CN110737818A (zh) 网络发布数据处理方法、装置、计算机设备和存储介质
CN110610431A (zh) 基于大数据的智能理赔方法及智能理赔***
CN114125154B (zh) 外呼策略参数调整方法、装置、计算机设备及存储介质
CN111652661B (zh) 一种手机客户端用户流失预警处理方法
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN111177217A (zh) 数据预处理方法、装置、计算机设备及存储介质
CN110348215B (zh) 异常对象识别方法、装置、电子设备及介质
CN113448955B (zh) 数据集质量评估方法、装置、计算机设备及存储介质
CN116739742A (zh) 信贷风控模型的监控方法、装置、设备及存储介质
CN114359993A (zh) 模型训练方法、人脸识别方法、装置、设备、介质及产品
CN111859057B (zh) 数据特征处理方法及数据特征处理装置
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
CN115130577A (zh) 一种欺诈号码识别方法、装置及电子设备
CN112308466A (zh) 企业资质审核方法、装置、计算机设备和存储介质
CN116012123B (zh) 一种基于Rete算法的风控规则引擎方法及***
CN113239236B (zh) 视频处理方法、装置、电子设备及存储介质
CN112633638B (zh) 业务风险评估方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant