CN112381548A - 稽核异常话单的方法、电子设备及存储介质 - Google Patents
稽核异常话单的方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112381548A CN112381548A CN202010949589.5A CN202010949589A CN112381548A CN 112381548 A CN112381548 A CN 112381548A CN 202010949589 A CN202010949589 A CN 202010949589A CN 112381548 A CN112381548 A CN 112381548A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- users
- historical
- date
- day
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 137
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000006870 function Effects 0.000 claims description 41
- 238000012216 screening Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 6
- 238000004891 communication Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract 1
- 238000012550 audit Methods 0.000 description 18
- 238000001914 filtration Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Finance (AREA)
Abstract
本发明实施例涉及通信技术,公开了一种稽核异常话单的方法、电子设备及存储介质。本发明中稽核异常话单的方法,包括:获取预设个数的历史日期各自的用户数预测值以及获取当日的用户数实际值,其中,历史日期为当日之前的日期;根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数,生成当日的用户数波动范围;根据当日的用户数波动范围以及当日的用户数实际值,生成当日的稽核异常话单的稽核结果。通过本实施例,使得可以快速、准确地稽核出异常结算话单,保护用户的利益。
Description
技术领域
本发明实施例涉及通信技术领域,特别涉及一种稽核异常话单的方法、电子设备及存储 介质。
背景技术
由于业务发展,各家运营商均通过精细化管理来提高运营效率,保证运营收入和竞争力。 目前通信业务的不断增多,出现了刷单、违规吸费的情况,为例保护用户的利益,需要对结 算话单进行稽核,以查找出异常的结算话单。
目前稽核结算话单的方法通常是统计用户的行为日志数据,抽取用户上行使用业务的日 志数据;分别统计每一个用户终端号码的日志数据中存在的异常频次,稽核出异常用户。发 明人发现现有技术中至少存在如下问题:根据日志数据中的异常频次确定的异常错误较为片 面,导致用于核算的结算话单不准确。
发明内容
本发明实施方式的目的在于提供一种稽核异常话单的方法、电子设备及存储介质,使得 可以快速、准确地稽核出异常结算话单,保护用户的利益。
为解决上述技术问题,本发明的实施方式提供了一种稽核异常话单的方法,包括:获取 预设个数的历史日期各自的用户数预测值以及获取当日的用户数实际值,其中,历史日期为 当日之前的日期;根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函 数,生成当日的用户数波动范围;根据当日的用户数波动范围以及当日的用户数实际值,生 成当日的稽核异常话单的稽核结果。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个 处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被所 述至少一个处理器执行,以使所述至少一个处理器能够执行上述的稽核异常话单的方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序 被处理器执行时实现上述的稽核异常话单的方法。
本发明实施方式相对于现有技术而言,由于每日的话单数据不同,导致每日的用户数的 波动范围也不同,而根据历史日期的用户预测数可以较为准确地反应当日的用户数的波动范 围;通过当日的用户数波动范围以及当日的用户数实际值,可以快速确定当日的话单是否异 常,通过用户数波动范围检测的方式还可以检测出话单数据中隐藏的异常,避免出现漏检的 问题,使得生成的稽核结果更加准确;同时采用预设个数的历史日期的用户数预测值,由于 可以包含多个历史日期的用户数预测值,可以提高获取用户数波动范围的准确度,进而提高 确定稽核结果的准确性。
另外,获取预设个数的历史日期各自的用户数预测值,包括:针对每个历史日期进行如 下处理:获取历史日期前一天的用户数实际值以及历史日期前一天的用户数预测值,其中, 第一个历史日期的用户数预测值等于第一个历史日期的用户数实际值;根据历史日期前一天 的用户数实际值、历史日期前一天的用户数预测值以及预设的第一预测关系,生成历史日期 的用户数预测值。每个历史日期的用户数预测值是基于前一天的用户数实际值确定,通过多 个历史日期的用户数预测值可以不断矫正第一预测关系,提高每个历史日期的用户数预测值 的准确性。
另外,根据历史日期前一天的用户数实际值、历史日期前一天的用户数预测值以及预设 的第一预测关系,生成历史日期的用户数预测值之后,方法还包括:根据每个历史日期的用 户数预测值,获取每个历史日期对应的用户数波动范围;针对每个历史日期对应的用户数预 测值进行如下处理:判断历史日期的用户数预测值是否超过历史日期对应的用户数波动范围, 若是,则为历史日期的用户数预测值添加异常标签,否则,为历史日期的用户数预测值添加 正常标签。为每个历史日期的用户数预测值添加标签信息,通过标签信息可以快速查找到异 常的用户数预测值对应的历史日期,以便后续重新更新异常标签对应的历史日期的用户数预 测值。
另外,根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数,生 成当日的用户数波动范围之前,该方法还包括:判断当日的前一天的用户数预测值的标签是 否为异常标签,若是,则更新至少一个历史日期的用户数预测值。仅针对当日的前一天的用 户数预测值的标签进行检测,确定是否需要重新确定异常标签对应的历史日期的用户数预测 值,减少了判断的次数;提高预设稽核的速度;同时更新至少一个历史日期的用户数预测值, 可以提高历史日期的用户数预测值的准确性,进而可以准确提高当日用户数波动范围的准确 性。
另外,更新至少一个历史日期的用户数预测值,包括:获取包含未知参数的第二预测函 数;从预设个数的用户数预测值的标签中查找异常标签;根据每个异常标签,获取未知参数, 得到每个异常标签对应的历史日期各自的第二预测函数;根据每个历史日期各自的第二预测 函数,重新生成每个异常标签对应的历史日期的用户数预测值。根据异常标签确定第二预测 函数中的未知参数,获取的第二预测函数,通过更换用户数预测函数,提高用户数预测值的 准确性。
另外,异常标签包括:正向标签和负向标签,正向标签用于指示用户数预测值超出对应 历史日期的用户数波动范围的上限值,负向标签用于指示所述用户数预测值超出对应历史日 期的用户数波动范围的下限值;根据每个异常标签,获取未知参数,得到每个异常标签对应 的历史日期各自对应的所述第二预测函数,包括:在当日之前的预设个数中查找首次出现异 常标签的历史日期,将查到的历史日期作为定位日;若检测到定位日之后连续出现N个相同 的异常标签,则为N个相同的异常标签对应历史日期的未知参数分配不同的第一预设值,获 得N个相同的异常标签对应历史日期的第二预测函数,其中,第一预设值的范围为0~1;若检 测到定位日之后相邻的异常标签相异,则指定相异的异常标签对应的历史日期的未知参数为 第二预设值,获得异常标签对应的历史日期的第二预测函数,第二预设值的范围为0~1;若 定位日之后未出现异常标签,则指定定位日对应的所述未知参数为第三预设值。针对不同异 常标签,指定不同的未知参数,使得确定的未知参数更加准确。
另外,获取当日的用户数实际值,包括:获取当日的源话单数据;根据预设的异常筛选 策略对当日的源话单数据进行异常检测,获得初始话单数据以及常规异常话单数据;根据初 始话单数据中的指定特征数据,提取当日的用户数实际值。通过对当日的源话单数据进行异 常检测,获得初始话单数据;由于先过滤掉了属于常规异常的话单数据,减少了对获取当日 的用户数实际值的干扰,进而可以提高整个稽核的速度和准确度。
异常筛选策略包括:高频筛选策略;高频筛选策略包括:获取当日中每个用户的话单量 以及当日话单量阈值;选取话单量超过当日话单量阈值的用户;将选取的用户的话单数据作 为常规异常话单数据;从当日的源话单数据中删除常规异常话单数据,获得初始话单数据。 通过用户的话单量与当日话单量阈值进行比较,可以快速筛出结算话单过密的用户,该检测 方式简单、快速。
另外,根据当日的用户数波动范围以及当日的用户数实际值,生成当日的稽核异常话单 的稽核结果,包括:判断当日的用户数实际值是否超出当日的用户数波动范围,若是,则判 断当日的话单量是否超过预设阈值,若超过,则确定稽核结果为当日话单异常。若判断结果 指示当日的用户数实际值超出当日的用户数波动范围之后,再次判断用户数实际值是否超过 预设阈值,进一步提高确定稽核结果的准确度。
另外,指定特征数据包括以下特征的一种或多种组合:页面特征、国际移动设备识别码、 省份名称、城市名称、渠道类型、IP地址、版本信息。指定特征数据可以包括多种特征组合, 从不同角度稽核异常结算话单,提高判断异常的准确性。
另外,若指定特征数据包括至少两种特征数据;判断当日的用户数实际值是否超过预设 阈值之前,还包括:查找至少两种特征是否属于同类的特征,若是,则获取每种特征各自对 应的阈值,选取最小阈值作为所属类别的预设阈值。提高每种类别对应阈值的准确度。
另外,异常筛选策略还包括:接口滤除策略和/或版本过滤策略;接口滤除策略为:检测 话单数据通过的接口是否属于安全接口,若不属于安全接口,删除检测的话单数据;版本过 滤策略为:删除属于异常版本的话单数据。提供多种过滤方式,过滤更加灵活。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不 构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别 申明,附图中的图不构成比例限制。
图1是根据本发明第一实施例提供的一种稽核异常话单的方法的流程图;
图2是根据本发明第二实施例提供的一种稽核异常话单的方法的流程图;
图3是根据本发明第三实施例提供的一种稽核异常话单的方法的流程图;
图4是根据本发明第三实施例提供的一种更新用户数预测值的具体实现示意图;
图5是根据本发明第四实施例提供的一种电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实 施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中, 为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于 以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定, 各个实施例在不矛盾的前提下可以相互结合相互引用。
目前采用稽核异常话单的方法通常是统计用户的行为日志数据,抽取用户上行使用业务 的日志数据;分别统计每一个用户终端号码的日志数据中存在的异常频次,稽核出异常用户。 例如,按SP业务分别统计异常用户的上行使用业务的日志数据中出现“182”错误的上行数, 稽核出异常SP业务;对用户点播异常SP业务的操作进行业务鉴权控制。发明人发现该稽核 方法,通过统计182错误代码的数目,进而确定出异常数据,但是,在实际应用中,还存在 其他的异常情况,该方式稽核具有明显的局限性,导致稽核结果不准确。另一种稽核异常话 单的方式,是通过接收原始话单文件,在原始话单文件中增加标识,并对增加标识的原始话单文 件进行处理,生成带有该标识的后续话单文件,对含有该标识的话单文件的处理进行稽核,并在 稽核异常时通过该标识对话单文件进行跟踪,定位异常处理步骤;该方式可以对已经标记为异 常的话单进行仔细稽核,但是由于需要对每条话单进行稽核,若需要处理大量的话单,稽核 效率低。
本发明的第一实施方式涉及一种稽核异常话单的方法。该稽核异常话单的方法应用于电 子设备,如,服务器;其流程如图1所示,包括:
步骤101:获取预设个数的历史日期各自的用户数预测值以及获取当日的用户数实际值, 其中,历史日期为当日之前的日期。
步骤102:根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数, 生成当日的用户数波动范围。
步骤103:根据当日的用户数波动范围以及当日的用户数实际值,生成当日的稽核异常 话单的稽核结果。
本发明实施方式相对于现有技术而言,由于每日的话单数据不同,导致每日的用户数的 波动范围也不同,而根据历史日期的用户预测数可以较为准确地反应当日的用户数的波动范 围;通过当日的用户数波动范围以及当日的用户数实际值,可以快速确定当日的话单是否异 常,通过用户数波动范围检测的方式还可以检测出话单数据中隐藏的异常,避免出现漏检的 问题,使得生成的稽核结果更加准确;同时采用预设个数的历史日期的用户数预测值,由于 可以包含多个历史日期的用户数预测值,可以提高获取用户数波动范围的准确度,进而提高 确定稽核结果的准确性。
本发明的第二实施方式涉及一种稽核异常话单的方法。其流程如图2所示:
步骤201:获取当日的源话单数据。
具体地,可以从话单数据结算页面中获取当日的源话单数据。
步骤202:根据预设的异常筛选策略对当日的源话单数据进行异常检测,获得初始话单 数据以及常规异常话单数据。
在一个例子中,异常筛选策略可以包括:高频筛选策略。高频筛选策略可以为:获取当 日中每个用户的话单量以及当日话单量阈值;选取话单量超过当日话单量阈值的用户;将选 取的用户的话单数据作为常规异常话单数据;从当日的源话单数据中删除常规异常话单数据, 获得初始话单数据。
具体地,从当日的源话单数据中抽取用户号码,可以以用户号码标记用户;根据每个用 户号码,统计每个用户每分钟的结算话单量。当日话单量阈值可以预先设置,也可以根据当 日的结算话单量,生成当日话单量阈值。例如,将当日全部用户的结算话单量的均值的3倍 标准差作为当日话单量阈值。
下面介绍异常检测的过程:
例如,统计当日所有用户的话单量,获取所有用户的话单量均值,将该均值的3倍标准 差作为当日话单量阈值A1,用户号码138XXX可以作为用户的标识信息,统计该138XXX当日的话单量a1;将a1与A1进行比较,若a1>A1,则表征该a1对应的用户是话单结算高 频用户,该用户的话单数据标记为常规异常话单数据;若a1<A1,表征该a1对应的用户不属 于话单结算高频用户;从当日的源话单数据中删除所有常规异常话单数据,即可得到初始话 单数据。
在另一个例子中,异常筛选策略还可以包括:接口滤除策略和/或版本过滤策略。接口滤 除策略为:检测话单数据通过的接口是否属于安全接口,若不属于安全接口,从当日的源话 单数据中删除检测到的话单数据。版本过滤策略为:从当日的源话单数据中删除属于异常版 本的话单数据。
具体地,可以预先标记安全接口,检测话单数据通过的接口是否属于安全接口,若不属 于,则从当日的源话单数据中删除检测到的话单数据。同理,可以预先设置异常版本的版本 号,检测属于异常版本的话单数据,从当日的源话单数据中删除属于异常版本的话单数据。
需要说明的是,可以将不属于安全接口的话单数据、异常版本的话单数据以及高频用户 的话单数据作为常规异常话单数据。
值得一提的是,异常检测策略无需对当日的源话单数据进行深入分析,可以快速从当日 的源话单数据中过滤常规异常话单数据,得到初始话单数据。该过滤方式速度快,过滤准确。
步骤203:根据初始话单数据中的指定特征数据,提取当日的用户数实际值。
具体地,提取初始话单数据中的指定特征数据,指定特征数据包括以下特征的一种或多 种组合:页面特征、国际移动设备识别码、省份名称、城市名称、渠道类型、IP地址、版本 信息。例如,指定特征数据可以是国际移动设备识别码Imei。由于Imei是移动电话网络中用 户移动终端的唯一标识信息,因而可以根据Imei统计当日的用户数实际值。
需要说明的是,步骤201~步骤203是对第一实施例中步骤101中获取当日的用户数实际 值的具体说明。
步骤204:针对每个历史日期进行如下处理:获取历史日期前一天的用户数实际值以及 历史日期前一天的用户数预测值,其中,第一个历史日期的用户数预测值等于第一个历史日 期的用户数实际值。
具体地,历史日期的用户数实际值的获取方式与步骤201类似,此处将不再进行赘述, 第一个历史日期的用户数预测值等于第一个历史日期的用户数实际值。第1个历史日期的用 户数预测值可以如公式(1)所示:
P1=R1公式(1);
其中,P1表示第1个历史日期的用户数预测值,R1表示第1个历史日期的用户数实际值。
步骤205:根据历史日期前一天的用户数实际值、历史日期前一天的用户数预测值以及 预设的第一预测关系,生成历史日期的用户数预测值。
本示例中,可以基于第i-1天的用户数,预测第i天的用户数预测值;由于相邻两天的关 系紧密,获取的用户数预测值更准确。基于此原理,获取用户数预测值的方式有多种,例如, 第i天的用户数预测值可以是第i-1天的用户数实际值的x倍,x的值可以根据实际应用设置, 如0.7等;i≥2,且i为整数。
可以理解的是,为了获取更为准确的用户数预测值,还可以采用如公式(2)的方式:
Pi=x1×Pi-1+x2×Ri-1公式(2);
其中,Pi表示第i天的用户数预测值,Pi-1表示第i-1天的用户数预测值,Ri-1表示第i-1 天的用户数实际值;第1天的用户数预测值可以是第1天的用户数实际值,x1和x2为参数, x1和x2的值可以根据实际应用设置,例如,x1可以为0.75,x2为0.25,第1个历史日期的用户数预测值P1=R1。
需要说明的是,步骤204和步骤205是针对每个历史日期进行的处理,是对第一实施例 步骤101中获取预设个数的历史日期各自的用户数预测值的具体说明,其中,预设个数可以 是1个、2个或2个以上。预设个数的历史日期中的第1个历史日期可以是指最早的历史日 期,例如,当日日期为20180109,预设个数为2个,第一个历史日期为20180107,第2个历 史日期为20180108。
步骤206:根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数, 生成当日的用户数波动范围。
具体地,可以根据采集的当日之前的话单数据,设置波动范围预测函数,波动范围预测 函数可以如公式(3)和公式(4)所示:
Mlimit i-=Pi-A*MAX(STDEV(Pi-k:Pi-1),B×Pi-1)公式(3);
Mlimiti+=Pi+A*MAX(STDEV(Pi-k:Pi-1),B×Pi-1)公式(4);
其中,Mlimit_i+表示第i天的用户数波动范围的上限值,Mlimit_i-表示第i天的用户数波 动范围的下限值,Pi表示第i天的用户数预测值,Pi-k表示第i-k天的用户数预测值,k为小 于i且大于0的整数;A表示第一可变参数,B表示第二可变参数;第一可变参数为大于0的数,例如,A可以为1.5;第二可变参数为大于0的数,例如,B为0.15。
例如,若当日为第8天,获取了7个当日之前的日期的用户数预测值,即公式(3)和公式(4)中的i为8,k为7,表示7个历史日期;那么第8天的用户数波动范围可以表 示为:
Mlimit8-=P8-1.5×MAX(STDEV(P1:P7),0.15×P7)公式(5);
Mlimit8+=P8+1.5×MAX(STDEV(P1:P7),0.15×P7)公式(6);
根据公式(5)和公式(6),即可获取第8天的用户数预测范围。
可以理解的是,预设个数可以根据实际需要进行选取,例如,预设个数可以1个、2个 或者2个以上。
步骤207:根据当日的用户数波动范围以及当日的用户数实际值,生成当日的稽核异常 话单的稽核结果。
具体地,将当日的用户数实际值与用户数预测范围进行比较,判断该当日的用户数实际 值是否超过当日的用户数波动范围,若超过,则确定该当日的用户数实际值超过当日的用户 数波动范围,否则,确定该当日的用户数实际值属于当日的用户数波动范围内。
在一个例子中,若该当日的用户数实际值超过当日的用户数波动范围,则确定稽核结果 为当日话单异常;若确定当日的用户数实际值属于当日的用户数波动范围内,则确定稽核结 果为当日话单正常。
具体地,若指定特征数据包括至少两种特征数据;判断当日的用户数实际值是否超过预 设阈值之前,还包括:查找至少两种特征是否属于同类的特征,若是,则获取每种特征各自 对应的阈值,选取最小阈值作为所属类别的预设阈值。
例如,以省份和城市两种特征组合,本示例中选取省份-江苏、城市-南京为例,江苏省 的话单量为1000,南京市统计的每天结算话单量为500,判断省份和城市属于地理位置的类 型,可以将结算话单量500作为预设阈值。此时,可以理解取各自对应阈值的交集,而对于 其他的组合,也可能是选取话单量的并集。在实际监测时,预设阈值需要根据特征组合后的 话单量进行调整。
在另一个例子中,判断当日的用户数实际值是否超出当日的用户数波动范围,若是,则 判断当日的话单量是否超过预设阈值,若超过,则确定稽核结果为当日话单异常;否则,确 定稽核结果为当日话单正常。
例如,当日是20180109,根据20180101-20180107的数据判断出20180108数据是否异常。 当20180108的话单量>100,且当日的用户数实际值超出当日的用户数波动范围,则确定稽 核结果为当日话单异常;同时还可以输入该异常检测结果以及异常信息,例如:输出:日期、 特征类型、当日话单量、前7日平均结算话单量、波动绝对值(当日结算话单量-前7日平均 结算话单量)、波动相对值(当日结算话单量-前7日平均结算话单量)、前7日平均结算话单 量等。
本发明的第三实施方式涉及一种稽核异常话单的方法。本实施方式是对第二实施方式的 进一步改进,主要改进之处在于:本实施方式中在根据预设个数的历史日期各自的用户数预 测值以及预设的波动范围预测函数,生成当日的用户数波动范围之前,检测历史日期的用户 数预测值是否准确。其的流程如图3所示。
步骤301:获取当日的源话单数据。
步骤302:根据预设的异常筛选策略对所述当日的源话单数据进行异常检测,获得初始 话单数据以及常规异常话单数据。
步骤303:根据初始话单数据中的指定特征数据,提取当日的用户数实际值。
步骤304:针对每个历史日期进行如下处理:获取历史日期前一天的用户数实际值以及 历史日期前一天的用户数预测值,其中,第一个历史日期的用户数预测值等于第一个历史日 期的用户数实际值。
步骤305:根据历史日期前一天的用户数实际值、历史日期前一天的用户数预测值以及 预设的第一预测关系,生成历史日期的用户数预测值。
步骤301~步骤305与第二实施例中的步骤201~步骤205大致相同,此处将不再进行赘述。
步骤306:根据每个历史日期的用户数预测值,获取每个历史日期对应的用户数波动范 围。
具体地,可以根据公式(3)和公式(4),生成每个历史日期对应的用户数波动范围。获 取每个历史日期对应的用户数波动范围的过程,此处将不再赘述。
步骤307:针对每个历史日期对应的用户数预测值进行如下处理:判断历史日期的用户 数预测值是否超过历史日期对应的用户数波动范围,若是,则为历史日期的用户数预测值添 加异常标签,否则,为历史日期的用户数预测值添加正常标签。
具体地,异常标签包括:正向标签和负向标签,正向标签用于指示用户数预测值超出所 属日子的用户数波动范围的上限值,负向标签用于指示用户数预测值超出所属日子的用户数 波动范围的下限值。
针对每个历史日期对应的用户数预测值进行如下处理:判断该历史日期的用户数预测值 是否超过该历史日期的用户数波动范围;若是超过,则为该用户数预测值添加异常标签,否 则,为该用户数预测值添加常规标签。由于用户数波动范围包括上限值和下限值,为了准确 指示异常,异常标签包括正向标签和反向标签,正向标签可以用“+1”表示,负向标签可以 用“-1”表示;常规标签可以用“0”表示。可以理解的是,还可以采用其他方式表示异常标 签。
步骤308:判断当日的前一天的用户数预测值的标签是否为异常标签,若是,则执行步 骤309;否则,执行步骤310。
步骤309:更新至少一个历史日期的用户数预测值。
在一个例子中,更新至少一个历史日期的用户数预测值的具体过程可以如图4所示:
步骤S1:获取包含未知参数的第二预测函数。
具体地,可以预先设置包含未知参数的第二预测函数,第二预测函数可以根据实际需要 进行设置,本示例中含有未知参数的第二预测函数可以如公式(7)所示:
其中,Pt表示第t日的用户数预测值;为该新的预测函数的未知参数;C和D分别表示 可调参数,C和D可以根据实际应用确定,例如,C可以是0.75;D可以是0.25;Rifout=0表 示常规标签对应历史日期的用户数实际值;Pifout=0表示常规标签对应的历史日期的用户预测数;Pt-1表示第t-1个历史日期的用户数预测值。
步骤S2:从预设个数的用户数预测值的标签中查找异常标签。
具体地,有预设个数的历史日期,则对应有预设个数的用户数预测值,从预设个数的用 户数预测值的标签中查找异常标签。
步骤S3:根据每个异常标签,获取未知参数,得到每个异常标签对应的历史日期各自的 第二预测函数。
在一个例子中,在当日之前的预设个数中查找首次出现异常标签的日子,将查到的历史 日期作为定位日;若检测到定位日之后连续出现N个相同的异常标签,则为N个相同的异常 标签对应历史日期的未知参数分配不同的第一预设值,获得N个相同的异常标签对应历史日 期的第二预测函数,其中,第一预设值的范围为0~1;若检测到定位日之后相邻的异常标签 相异,则指定相异的异常标签对应的历史日期的未知参数为第二预设值,获得异常标签对应 的历史日期的第二预测函数,第二预设值的范围为0~1;若定位日之后的日子未出现异常标 签,则指定定位日对应的未知参数为第三预设值。
例如:当第3天第一次出现异常标签IFOUT_R=±1时,那么将第3天作为定位日,该定 位日的第二预测函数的未知参数当检测到定位日之后连续出现2个相同的异常标签, 即第4天和第5天的异常标签均为IFOUT_R=+1,或者均为IFOUT_R=-1;那么 依次取0.1,0.2;第一预设值可以设置多个,如0,0.1,0.2,0.4,0.7。根据定位日之后相同标 签的天数,依次取设置的第一预设值,依次取0,0.1,0.2,0.4,0.7,1,之后全部为1。若 检测到定位日之后相邻的异常标签相异,则指定相异的异常标签对应的历史日期的未知参数为第二预设值,如,第4天的IFOUT_R=+1、第5天的异常标签为IFOUT_R=-1;那么第一预设值为0。
步骤S4:根据每个历史日期各自的第二预测函数,重新生成每个异常标签对应的历史日 期的用户数预测值。
具体地,确定了第二预测函数,则按照第二预测函数重新生成异常标签对应的历史日期 的用户预测值,并更新标签信息。
表1示出了从第8天至第11天获取的用户数实际值、用户数预测值、用户数波动范围以 及标签信息。
表1
步骤310:根据预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数, 生成当日的用户数波动范围。
步骤311:根据当日的用户数波动范围以及当日的用户数实际值,生成当日的稽核异常 话单的稽核结果。
通过本实施例中的方式,当日之前的用户数预测值异常的情况下,通过更换用户数预测 函数,提高用户数预测值的准确性。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些 步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对 算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的 核心设计都在该专利的保护范围内。
本发明第四实施方式涉及一种电子设备,其结构框图如图5所示,该电子设备40包括: 至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行上述的稽核异常话单的方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥, 总线将一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如***设备、稳 压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此, 本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个 元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装 置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收 数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压 调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的 数据。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序,计算机程序被 处理器执行时实现上述的稽核异常话单的方法。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指 令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可 以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分 步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、 随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码 的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实 际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种稽核异常话单的方法,其特征在于,包括:
获取预设个数的历史日期各自的用户数预测值以及获取当日的用户数实际值,其中,所述历史日期为所述当日之前的日期;
根据所述预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数,生成所述当日的用户数波动范围;
根据所述当日的用户数波动范围以及所述当日的用户数实际值,生成所述当日的稽核异常话单的稽核结果。
2.根据权利要求1所述的稽核异常话单的方法,其特征在于,所述获取预设个数的历史日期各自的用户数预测值,包括:
针对每个所述历史日期进行如下处理:
获取所述历史日期前一天的用户数实际值以及所述历史日期前一天的用户数预测值,其中,第一个历史日期的用户数预测值等于所述第一个历史日期的用户数实际值;
根据所述历史日期前一天的用户数实际值、所述历史日期前一天的用户数预测值以及预设的第一预测关系,生成所述历史日期的用户数预测值。
3.根据权利要求2所述的稽核异常话单的方法,其特征在于,所述根据所述历史日期前一天的用户数实际值、所述历史日期前一天的用户数预测值以及预设的第一预测关系,生成所述历史日期的用户数预测值之后,所述方法还包括:
根据每个所述历史日期的用户数预测值,获取每个所述历史日期对应的用户数波动范围;
针对每个所述历史日期对应的用户数预测值进行如下处理:判断所述历史日期的用户数预测值是否超过所述历史日期对应的用户数波动范围,若是,则为所述历史日期的用户数预测值添加异常标签,否则,为所述历史日期的用户数预测值添加正常标签。
4.根据权利要求3所述的稽核异常话单的方法,其特征在于,所述根据所述预设个数的历史日期各自的用户数预测值以及预设的波动范围预测函数,生成所述当日的用户数波动范围之前,所述方法还包括:
判断所述当日的前一天的用户数预测值的标签是否为异常标签,若是,则更新至少一个所述历史日期的用户数预测值。
5.根据权利要求4所述的稽核异常话单的方法,其特征在于,所述更新至少一个所述历史日期的用户数预测值,包括:
获取包含未知参数的第二预测函数;
从所述预设个数的用户数预测值的标签中查找所述异常标签;
根据每个所述异常标签,获取所述未知参数,得到每个所述异常标签对应的所述历史日期各自的所述第二预测函数;
根据每个所述历史日期各自的所述第二预测函数,重新生成每个异常标签对应的所述历史日期的所述用户数预测值。
6.根据权利要求5所述的稽核异常话单的方法,其特征在于,所述异常标签包括:正向标签和负向标签,所述正向标签用于指示所述用户数预测值超出对应所述历史日期的用户数波动范围的上限值,所述负向标签用于指示所述用户数预测值超出对应所述历史日期的用户数波动范围的下限值;
所述根据每个所述异常标签,获取所述未知参数,得到每个所述异常标签对应的历史日期各自对应的所述第二预测函数,包括:
在所述当日之前的预设个数中查找首次出现异常标签的所述历史日期,将查到的所述历史日期作为定位日;
若检测到所述定位日之后连续出现N个相同的异常标签,则为所述N个相同的异常标签对应所述历史日期的所述未知参数分配不同的第一预设值,获得所述N个相同的异常标签对应所述历史日期的所述第二预测函数,其中,所述第一预设值的范围为0~1;
若检测到所述定位日之后相邻的所述异常标签相异,则指定相异的所述异常标签对应的所述历史日期的所述未知参数为第二预设值,获得所述异常标签对应的所述历史日期的所述第二预测函数,所述第二预设值的范围为0~1;
若所述定位日之后未出现所述异常标签,则指定所述定位日对应的所述未知参数为第三预设值。
7.根据权利要求1-6中任一项所述的稽核异常话单的方法,其特征在于,所述获取当日的用户数实际值,包括:
获取所述当日的源话单数据;
根据预设的异常筛选策略对所述当日的源话单数据进行异常检测,获得初始话单数据以及常规异常话单数据;
根据所述初始话单数据中的指定特征数据,提取所述当日的用户数实际值。
8.根据权利要求7所述的稽核异常话单的方法,其特征在于,所述异常筛选策略包括:高频筛选策略;
所述高频筛选策略包括:
获取所述当日中每个用户的话单量以及当日话单量阈值;
选取话单量超过所述当日话单量阈值的用户;
将选取的用户的话单数据作为常规异常话单数据;
从所述当日的源话单数据中删除所述常规异常话单数据,获得所述初始话单数据。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一所述的稽核异常话单的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的稽核异常话单的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010949589.5A CN112381548B (zh) | 2020-09-10 | 2020-09-10 | 稽核异常话单的方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010949589.5A CN112381548B (zh) | 2020-09-10 | 2020-09-10 | 稽核异常话单的方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112381548A true CN112381548A (zh) | 2021-02-19 |
CN112381548B CN112381548B (zh) | 2024-03-12 |
Family
ID=74586457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010949589.5A Active CN112381548B (zh) | 2020-09-10 | 2020-09-10 | 稽核异常话单的方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381548B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101764893A (zh) * | 2009-10-12 | 2010-06-30 | 南京联创科技集团股份有限公司 | 基于数据中间层的通信话务波动监控方法 |
CN101771758A (zh) * | 2008-12-31 | 2010-07-07 | 北京亿阳信通软件研究院有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
CN103167202A (zh) * | 2011-12-19 | 2013-06-19 | ***通信集团甘肃有限公司 | 一种不同源话单稽核方法和装置 |
CN104796560A (zh) * | 2014-01-21 | 2015-07-22 | 携程计算机技术(上海)有限公司 | 呼叫中心的呼叫量预测方法及*** |
CN105162994A (zh) * | 2015-09-24 | 2015-12-16 | 携程计算机技术(上海)有限公司 | 呼叫中心话务量故障的检测方法、***及服务器 |
CN105636070A (zh) * | 2014-10-25 | 2016-06-01 | 史军 | 移动通信话务量预测方法 |
US20160253484A1 (en) * | 2013-10-10 | 2016-09-01 | Beijing Zhigu Rui Tuo Tech Co., Ltd | Ranking fraud detection for application |
CN106357939A (zh) * | 2016-09-30 | 2017-01-25 | 携程旅游信息技术(上海)有限公司 | 呼叫话务量监控方法和监控*** |
CN107231493A (zh) * | 2017-06-30 | 2017-10-03 | 携程旅游信息技术(上海)有限公司 | 呼叫中心的自动报警方法及其装置、存储介质、电子设备 |
-
2020
- 2020-09-10 CN CN202010949589.5A patent/CN112381548B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771758A (zh) * | 2008-12-31 | 2010-07-07 | 北京亿阳信通软件研究院有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
CN101764893A (zh) * | 2009-10-12 | 2010-06-30 | 南京联创科技集团股份有限公司 | 基于数据中间层的通信话务波动监控方法 |
CN103167202A (zh) * | 2011-12-19 | 2013-06-19 | ***通信集团甘肃有限公司 | 一种不同源话单稽核方法和装置 |
US20160253484A1 (en) * | 2013-10-10 | 2016-09-01 | Beijing Zhigu Rui Tuo Tech Co., Ltd | Ranking fraud detection for application |
CN104796560A (zh) * | 2014-01-21 | 2015-07-22 | 携程计算机技术(上海)有限公司 | 呼叫中心的呼叫量预测方法及*** |
CN105636070A (zh) * | 2014-10-25 | 2016-06-01 | 史军 | 移动通信话务量预测方法 |
CN105162994A (zh) * | 2015-09-24 | 2015-12-16 | 携程计算机技术(上海)有限公司 | 呼叫中心话务量故障的检测方法、***及服务器 |
CN106357939A (zh) * | 2016-09-30 | 2017-01-25 | 携程旅游信息技术(上海)有限公司 | 呼叫话务量监控方法和监控*** |
CN107231493A (zh) * | 2017-06-30 | 2017-10-03 | 携程旅游信息技术(上海)有限公司 | 呼叫中心的自动报警方法及其装置、存储介质、电子设备 |
Non-Patent Citations (2)
Title |
---|
许文强 等: "基于用户数趋势的季节指数模型话务量预测", 《移动通信》, no. 23 * |
陶伟宜: "基于回归方法的移动通信话务量预测", 《邮电设计技术》, no. 05 * |
Also Published As
Publication number | Publication date |
---|---|
CN112381548B (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509658B (zh) | 一种xml文件的解析方法和装置 | |
CN109272219B (zh) | 绩效考核方法、装置、计算机设备及存储介质 | |
CN113765881A (zh) | 异常网络安全行为的检测方法、装置、电子设备及存储介质 | |
CN104731816A (zh) | 一种处理异常业务数据的方法和装置 | |
CN107911397B (zh) | 一种威胁评估方法及装置 | |
CN111159243A (zh) | 用户类型识别方法、装置、设备及存储介质 | |
CN109450869B (zh) | 一种基于用户反馈的业务安全防护方法 | |
CN111476375B (zh) | 一种确定识别模型的方法、装置、电子设备及存储介质 | |
CN105989457A (zh) | 一种信息查询方法及装置 | |
CN110191097B (zh) | 登录页面安全性的检测方法、***、设备及存储介质 | |
CN114757639A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN115242434A (zh) | 应用程序接口api的识别方法及装置 | |
CN108805725B (zh) | 风险事件确认方法、服务器及计算机可读存储介质 | |
CN110876072A (zh) | 一种批量注册用户识别方法、存储介质、电子设备及*** | |
CN112381548A (zh) | 稽核异常话单的方法、电子设备及存储介质 | |
CN111865923A (zh) | 一种物联网卡异常行为识别方法、***、装置及介质 | |
CN111625700A (zh) | 防抓取的方法、装置、设备及计算机存储介质 | |
CN114531306B (zh) | 一种基于威胁行为的实时检测方法与*** | |
CN113297583B (zh) | 漏洞风险分析方法、装置、设备及存储介质 | |
CN112468444B (zh) | 互联网域名滥用识别方法和装置,电子设备,存储介质 | |
CN111507397A (zh) | 一种异常数据的分析方法及装置 | |
CN113657675B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN116647412B (zh) | 一种Web服务器的安全防御方法和*** | |
CN118297296A (zh) | 一种审批***管理方法及相关设备 | |
CN115827681A (zh) | 数据管控方法、装置、终端设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |