业务异常检测方法、装置及计算机可读存储介质
技术领域
本发明涉及互联网技术,特别涉及一种业务异常的检测方法、装置和计算机可读存储介质。
背景技术
为了对线下服务商和众包商家进行新商家拓展,交易平台通常可以根据商家的交易向商家返回部分佣金。这种返回佣金的业务模式通常被简称为返佣。目前,交易平台已在返佣过程中投入了大量的营销资金。但是,在返佣业务开展的同时也出现了一些不良商家通过虚假交易和换码交易套取大量返佣资金的作弊行为。这类作弊行为通常被称为套返佣,具有批量性且危害性大的特点,而且通过一般的识别模型很难保证准确的防控,覆盖率也较低。因此,需要一种检测业务异常情况的方案,可以用于检测套返佣等业务异常情况。
发明内容
有鉴于此,本发明提出一种业务异常检测方法,包括:确定待监测业务的至少一个监测维度以及至少一个待监测业务指标;根据所述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每条监测路径对应所述至少一个监测维度中一个或多个监测维度的组合;针对每条监测路径,获取所述至少一个待监测业务指标对应的时序序列;对所述至少一个待监测业务指标对应的时序序列进行时序异常检测;以及根据时序异常检测结果输出业务异常提醒。
其中,上述根据所述至少一个监测维度确定进行业务异常监测的至少一条监测路径包括:将所有监测维度进行全排列组合,并将得到的组合作为所述至少一条监测路径。
其中,上述方法进一步包括:获取所述待监测业务的业务数据;其中,所述针对每条监测路径,获取所述至少一个待监测业务指标对应的时序序列包括:针对每条监测路径,对由所述监测路径所确定的监测维度组合进行赋值;以赋值后的监测路径为条件从所述业务数据中提取出符合所述条件且与所述至少一个待监测业务指标相关的业务数据;以及对提取的数据进行统计,确定所述至少一个待监测业务指标在一个预定的时间窗口内的时序序列。
其中,上述针对每条监测路径获取所述至少一个待监测业务指标对应的时序序列包括:发送至少一个业务数据请求至交易平台的服务器,其中,每个业务数据请求对应一个待监测业务指标以及一个赋值后监测路径;从所述交易平台的服务器接收所述至少一个待监测业务指标对应的时序序列。
其中,上述至少一个待监测业务指标对应的时序序列分别进行时序异常检测包括:采用S-H-ESD方法对所述至少一个待监测业务指标对应的时序序列分别进行时序异常检测进行所述时序异常检测。
其中,在采用S-H-ESD方法对所述至少一个待监测业务指标对应的时序序列分别进行时序异常检测过程中通过如下公式确定GESD的统计量:
其中,xi是上述时序序列中的第i个样本的值;是样本的中位数;s是样本的平均差。
其中,上述业务异常提醒包括所述至少一个待监测业务指标的异常值、异常分、及其对应的监测路径。
其中,上述方法在获取所述至少一个待监测业务指标对应的时序序列之后进一步包括:根据预先设置的过滤条件,对所述时序序列进行过滤,删除满足所述过滤条件的时序序列。
其中,上述待监测业务包括返佣业务;所述监测维度包括:开户渠道、商家经营类型、商家类型、开户区域、以及开户系数之一或其任意组合;所述待监测业务指标包括:新签约商家数、3天满60笔商家占比、返佣商家占比、商家留存率、以及商家开户成本之一或其任意组合。
其中,上述待监测业务包括商家准入业务;所述待监测业务指标包括:申请准入的商家数量。
其中,上述待监测业务包括小程序巡检业务;所述待监测业务指标包括:小程序页面访问量和/或小程序日交易量。
本发明提出一种业务异常检测方法,包括:
输入模块,用于确定待监测业务的至少一个监测维度以及至少一个待监测业务指标;
监测路径生成模块,用于根据所述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每一条监测路径对应所述至少一个监测维度中一个或多个监测维度的组合;
时序序列获取模块,用于针对每条监测路径获取所述至少一个待监测业务指标对应的时序序列;
时序异常检测模块,用于对提取的所述至少一个待监测业务指标对应的时序序列分别进行时序异常检测;以及
输出模块,用于根据时序异常检测结果输出业务异常提醒。
其中,上述装置进一步包括:数据获取模块,用于获取所述待监测业务的业务数据;其中,所述时序序列获取模块包括:
赋值单元,用于针对每条监测路径,对由所述监测路径所确定的监测维度组合进行赋值;
数据提取单元,用于以赋值后的监测路径为条件从所述业务数据中提取出符合所述条件且与所述至少一个待监测业务指标相关的业务数据;以及
统计单元,用于对提取的数据进行统计,确定所述至少一个待监测业务指标在一个预定的时间窗口内的时序序列。
其中,上述时序序列获取模块包括:
请求单元,用于发送至少一个业务数据请求至交易平台的服务器,其中,每个业务数据请求对应一个待监测业务指标以及一个赋值后监测路径;
接收单元,用于从所述交易平台的服务器接收所述至少一个待监测业务指标对应的时序序列。
其中,上述监测路径生成模块将所有监测维度进行全排列组合,并将得到的全排列组合作为所述至少一条监测路径。
其中,上述时序异常检测模块采用S-H-ESD方法对提取的所述至少一个待监测业务指标对应的时序序列分别进行时序异常检测。
其中,上述时序异常检测模块在采用S-H-ESD方法对提取的所述至少一个待监测业务指标对应的时序序列分别进行时序异常检测过程中通过如下公式确定GESD的统计量:
其中,x
i是上述时序序列中的第i个样本的值;
是样本的中位数;s是样本的平均差。
其中,上述输出模块输出的业务异常提醒中包括业务指标的异常值、异常分、及其对应的监测路径。
上述装置进一步包括:过滤模块,用于根据预先设置的过滤条件,对所述至少一个待监测业务指标对应的时序序列进行过滤,删除满足所述过滤条件的时序序列。
本发明提出一种计算设备,包括:
至少一个处理器;
存储器;
网络通信装置;
输入装置;
输出装置;以及
连接所述至少一个处理器、存储器、网络通信装置、输入装置以及输出装置的总线;其中,
所述至少一个处理器用于执行存储器存储的机器可读指令模块,执行上述的业务异常检测方法。
本发明提出一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的业务异常检测方法。
通过上述业务异常检测方法、装置可以从多个监测维度对业务指标对应的时序序列进行时序异常检测,保证了在多个维度上对业务指标异常的覆盖,从而可以有效防止异常情况的漏检,具有鲁棒性强,风险漏过率低的优点,实现全面以及快速地业务异常检测。
附图说明
图1显示了本发明实施例所应用***100结构示意图;
图2显示了本发明实施例所述的业务异常检测方法流程图;
图3显示了本发明实施例所述根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径的示例;
图4显示了本发明实施例所述业务异常检测装置的内部结构;
图5显示了本发明另一实施例所述的业务异常检测方法流程图;
图6显示了本发明另一实施例所述业务异常检测装置的内部结构;以及
图7显示了本发明实施例所述计算设备的内部结构。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如前所述,在对商家返佣的过程中,存在套返佣的作弊行为。而为了对由这样的作弊行为所导致的业务异常情况进行识别特提出本发明的技术方案。图1显示了本发明实施例所应用***100结构示意图。如图1所示,在本发明实施例所应用的***100中,各个商家101通过可网络连接到交易平台的服务器102,并通过与交易平台签约成为签约商家。成为签约商家后,这些商家101即可作为卖家通过交易平台进行和买家线上交易。各个商家101的信息(包括商家信息以及交易信息)都将记录在交易平台的服务器102的数据库103中。此外,在执行各种业务的期间,上述数据库103还会记录与各种业务相关的业务数据。例如,对于返佣业务应用,数据库103中将记录新签约商家信息(包括商家标识、开户时间、开户渠道、商家经营类型、商家类型、开户区域、开户系数以及是否为返佣商家等等)、各个商家的交易信息、以及新注销商家信息(包括商家标识、注销时间、开户渠道、商家经营类型、商家类型、开户区域、开户系数以及是否为返佣商家)等等。除上述商家101、交易平台的服务器102和数据库103之外,上述***100还包括一个业务异常检测装置104。该业务异常检测装置104可以连接到上述数据库103,从上述数据库103中获取上述业务信息,并对获取的业务信息进行处理、分析以及统计,从而进行业务异常检测,以便发现套返佣等作弊行为。上述业务异常检测装置104还可以连接到上述交易平台的服务器102,从上述交易平台的服务器102获取与待监测业务相关的信息,并对获取的信息进行分析,从而进行业务异常检测,以便发现套返佣等作弊行为。
需要说明的是,在本发明的实施例中,上述业务异常检测装置104具体可以是一个具有计算功能的单独计算设备,例如工作站等;此外,上述业务异常检测装置104也可以是集成在交易平台服务器102上的一个功能模块。
下面就结合附图详细说明本发明实施例所述业务异常检测装置104进行业务异常检测的具体过程。
图2显示了本发明实施例所述的业务异常检测方法流程图。如前所述,该方法可以应用于上述业务异常检测装置104。如图2所示,该业务异常检测方法主要包括如下步骤:
步骤201,获取待监测业务的业务数据。
在本发明的实施例中,上述待监测业务是指存在作弊风险需要监测的业务,例如上述返佣业务,此外还可以包括商家准入业务或者小程序巡检业务等等其他存在作弊风险的业务。
在本发明的实施例中,上述业务数据是指针对某个特定的业务,与该业务相关的数据。例如,对于返佣业务而言,上述业务数据可以包括新签约商家信息(包括商家标识、开户时间、开户渠道、商家经营类型、商家类型、开户区域、开户系数以及是否为返佣商家等等)、各个商家的交易信息、以及新注销商家信息(包括商家标识、注销时间、开户渠道、商家经营类型、商家类型、开户区域、开户系数以及是否为返佣商家)等等。对于商家准入业务而言,上述业务数据可以包括申请准入的商家信息(包括商家标识、准入时间、商家经营类型、商家类型、区域等等)。对于小程序巡检业务而言,上述业务数据可以包括小程序页面访问信息、小程序交易信息等等。
在本发明的实施例中,上述待监测业务的业务数据可以从整个交易平台的数据库103中获取,例如,通过交易平台服务器102从数据库103获取或者直接从上述数据库103获取。
步骤202,确定至少一个监测维度以及至少一个待监测业务指标。其中,上述至少一个监测维度中的每一个监测维度可以有至少一个取值。
在本发明的实施例中,上述至少一个监测维度以及至少一个待监测业务指标可以是由业务方根据实际需求设置的。
在本发明的实施例中,上述监测维度指的是对待监测业务指标进行监测的粒度的划分。例如,仍以商家返佣场景为例,上述监测维度可以包括:开户渠道,商家经营类型,商家类型,开户区域,以及开户系数等等。其中,开户区域这一监测维度还可以进一步划分为开户省,开户市,以及开户区等更细的监测维度。其中,每个监测维度的设置代表可以从这一维度对业务指标进行监测。此外,每个监测维度可以有不同的取值。例如,开户渠道这一监测维度的取值可以包括:服务商开户、众包开户等。商家经营类型这一监测维度的取值可以包括:门店类、流动类、交通运输类以及摊贩类等。商家类型这一监测维度的取值可以包括:应用类型商家、线下收款商家、回炉商家等。而开户区域这一监测维度的取值可以包括:各个省份、市以及区县等等。对于商家准入业务以及小程序巡检等业务的异常检测也可以采用类似的监测维度设置。
在本发明的实施例中,上述待监测业务指标通常是能够反映待监测业务潜在风险的业务指标,也可称为风险指标。上述待监测业务指标的选取主要依靠业务经验,通常可以是一些业务高度关注的且随时间变化的时序指标。仍以商家返佣业务场景为例,上述待监测业务指标可以包括:事前、事中和事后业务指标。其中事前风险指标可以包括:新签约商家数等。事中风险指标可以包括:3天满60笔商家占比、返佣商家占比等。事后风险指标可以包括:商家留存率、商家开户成本等。对于商家准入业务而言,上述待监测业务指标可以包括申请准入的商家数量。对于小程序巡检业务而言,上述待监测业务指标可以包括小程序页面访问量、小程序日交易量等等。对于商家准入业务以及小程序巡检等业务的异常检测也可以根据业务情况进行待监测业务指标的设置。
需要说明的是,上述实施例是以返佣业务、商家准入业务以及小程序巡检业务为例进行说明的。在本发明的实施例中,还可以针对不同的业务场景设置不同的监测维度以及待监测的业务指标,也即上述至少一个监测维度和至少一个待监测业务指标是根据所要监测的业务进行设置的。
步骤203,根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每一条监测路径对应上述至少一个监测维度中一个或多个监测维度的组合。
在本发明的实施例中,上述监测路径可以作为从上述业务数据中提取数据的条件。
例如,对于开户渠道、商家经营类型、开户区域这三个监测维度,可以将这三个监测维度进行组合确定一条监测路径,也即开户区域-开户渠道-商家经营类型。例如,广东省-广州市-服务商开户-流动类商家是一个对上述监测路径进行赋值后的一个示例。这一条监测路径的示例就对应服务商开户(开户渠道的取值)、流动类商家(商家经营类型的取值)以及广东省-广州市(开户区域的取值),这三个监测维度的组合。
图3显示了本发明实施例所述根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径的示例。在图3所示的示例中,假设监测维度有Ti(i=1,2,3,4)四种,每种监测维度又有不同的取值Tij(i=1,2,3,4;j=1,2,…Ki)。图3中的每个节点代表一种监测维度的组合方式,从上之下监测维度的组合程度逐渐加深。其中,第一层的四个节点T1、T2、T3和T4,代表监测维度没有进行组合,每个监测维度单独构成一个监测路径。第二层的六个节点T12、T13、T14、T23、T24和T34,代表任意两个监测维度进行组合(例如T12代表两个监测维度T1和T2的组合),每两个监测维度组合构成一个监测路径。第三层的四个节点T123、T124、T134和T234,代表任意三个监测维度进行组合(例如T123代表三个监测维度T1、T2和T3的组合),每三个监测维度的组合构成一个监测路径。第四层的一个节点T1234,代表四个监测维度组合一起,这四个监测维度的组合构成一个监测路径。在对上述四个监测维度的取值进行全组合(叉乘)的情况下,将会得到赋值后的∏Tij个监测路径。这样,在后续进行异常检测时可以对所有赋值后的∏Tij个监测路径上的待监测的业务指标进行时序异常检测,从而保证在所有的监测颗粒度进行异常检测,而不会漏过异常情况。
在本发明的实施例中,上述根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径可以将上述至少一个监测维度中一个或多个监测维度进行全排列组合,将得到的全排列组合作为上述至少一条监测路径。
在本发明的实施例中,还可以根据待监测业务的实际情况进一步从上述全排列组合中删除部分组合,然后将剩余的组合作为上述至少一个监测路径。上述删除部分组合的主要原因是,在监测维度的数量比较多的情况下,对全排列组合中的每一个组合分别进行异常检测是非常耗时的。因此,可以根据业务的实际情况修剪掉无需考虑的组合,例如已知对于某个或某些组合业务数据量很少,则没有进行异常检测的必要,或者对于某个或某些组合的业务数据无需考虑,就可以删除这个组合。从而可以减少异常检测所需的时间,节省计算资源。
步骤204,针对每条监测路径,根据上述至少一个待监测业务指标从上述业务数据中提取业务数据,并进行统计,确定上述至少一个待监测业务指标对应的时序序列。
在本发明的实施例中,上述业务数据中包含了确定上述至少一个待检测业务指标所需要的全部原始数据。
且如前所述,每一条监测路径对应至少一个监测维度的一个组合,也即构成了一个提取数据的条件或者也可以称为数据范围。因此,在本步骤中,对于每一条监测路径,可以对由所述监测路径所确定的监测维度组合进行赋值,以赋值后的监测路径为条件从业务数据中提取出符合上述条件且与上述至少一个待监测业务指标相关的数据,并对提取的数据进行统计,从而得到上述至少一个待监测业务指标在一个预定的时间窗口内的时序序列。
例如,对于广东省-广州市-服务商开户-流动类商家这一监测路径的一个取值,对于新签约商家数这一待监测业务指标,可以从业务数据的新签约商家信息中提取出广东省-广州市-服务商开户-流动类商家的新签约商家信息,并对提取的新签约商家信息进行统计,从而得到新签约商家这一待监测业务指标在一个预定的时间窗口内的时序序列(例如,在30天内符合广东省-广州市-服务商开户-流动类商家这一条件的每天新签约商家数)。在本发明的实施例中,依据每一条监测路径的全部取值和每一个待监测业务指标的组合重复执行上述操作,从而得到所有监测路径下每个待监测业务指标对应的时序序列。
在本发明的实施例中,在得到所有监测路径下每个待监测业务指标对应的时序序列后,还可以根据预先设定的过滤条件对由这些时序序列进行过滤处理,删除满足预先设定的过滤条件的时序序列。例如,预先设置时序序列上0的个数阈值或比例阈值,当一个时序序列上的0的个数大于上述个数阈值或者一个时序序列上的0的比例大于上述比例阈值时,则删除该时序序列。需要说明的是,上述预先设定的条件可以根据业务情况设定。
步骤205,对上述至少一个待监测业务指标对应的时序序列分别进行时序异常检测。
通常,在本步骤中,可以基于3σ原则进行时序异常检测。然而,由于采用3σ原则进行检测通常无法有效发现局部的异常波动,并且对于时序中存在的极端异常情况鲁棒性较差,通常会造成较多误检。
在此种情况下,本发明的实施例采用节令性混合极端学生化偏差(SeasonalHybrid ESD,S-H-ESD)算法进行上述时序异常检测。S-H-ESD算法,先采用节令性趋势分解(Seasonal-Trend decomposition procedure,STL)方法对时序序列进行分解,从而解决了残差分量容易受到极端异常值影响的问题。STL方法包含了一个外部循环和一个内部循环,内部循环利用LOESS方法得到周期行性分量,可以实现更复杂的时序分解关系。外部循环通过对时序数据点的加权,实现对异常值更强的鲁棒性。而在对残差进行异常检测的部分,采用了泛化版ESD(GESD)假设检验。GESD检验是一种检测近似满足正态分布的单变量数据中的多个异常值的方法。在GESD检验的过程中,通常根据样本的均值以及样本的方差来确定GESD的统计量。但是,由于均值和方差很容易受到极端异常值的影响,所以在采用S-H-ESD算法进行时序异常检测的过程中用了更为鲁棒的统计量:用中位数和平均差代替确定GESD的统计量过程中的均值和方差,并且利用中位数作为时序趋势的估计,使得当时序数据中异常值占比很大,异常值很极端点时,检测的结果都具有较高的鲁棒性。具体地,在S-H-ESD算法中,可以通过下面的公式(1)确定GESD的统计量:
其中,xi是上述时序序列中的第i个样本的值;是样本的中位数;s是样本的平均差。做GESD检验时,需循环r次,每次循环中,移除上一次循环中统计量最大的数据,然后重新计算统计量,直到移除r个数据后,得到统计量R1,R2,……,Rr。并且根据计算得到统计量以及计算得到的临界值确定异常值λi,其中,异常值的个数就是最大的满足Ri>λi的i。
然而,上述应用了中位数和平均差的S-H-ESD算法,对于趋势变化较大的时序序列仍可能有适应性较差的问题。基于上述问题,本发明的实施例中,使用滑动中位数代替上述中位数,用以确定上述GESD的统计量,从而更适应对趋势变化较大的时序数据。其中,滑动中位数就是在一个时间窗口中针对整个时间序列滑动计算每个时间窗口的中位数。例如,上述时间窗口可以设置为5天。
步骤206,根据时序异常检测结果输出业务异常提醒。
在本发明的实施例中,上述时序异常检测结果为在上述至少一个监测路径上对待监测业务指标对应的时序序列的异常感知情况,也即时序序列是否存在数值异常的点。如果有,则上述业务异常提醒中可以包括业务指标的异常值、异常分、以及对应的监测路径等。而对于比例型业务指标还可以分别输出分子和分母的具体数值。
具体地,上述异常值就是在某个特定的监测路径下,某个时间单位内业务指标数值异常的点,例如,某个业务指标对应的时序序列上表现为过高或过低的点。上述异常分是指该异常的点在时序序列中的标准分数(z-score),通常是一个数与平均数的差再除以标准差的过程。对应的监测路径是指该异常的点所在时序序列对应的监测路径。此外,由于一些待监测业务指标属于比例型业务指标,这时,输出的异常值就包括分子和分母的数值。例如,对于返佣商家比例这个指标,分母是商家总数,而分子是有返佣的商家数。
在接收到上述业务异常提醒后,管理人员将根据业务异常提醒中携带的信息进行业务风险控制。
通过上述业务异常检测方法可以从多个监测维度对业务指标对应的时序序列进行时序异常检测,保证了在多个维度上对业务指标异常的覆盖,从而可以有效防止异常情况的漏检,具有鲁棒性强,风险漏过率低的优点,实现全面以及快速地业务异常检测。
对应上述业务异常检测方法,本发明的实施例还提供了一种业务异常检测装置。图4显示了上述业务异常检测装置的内部结构。如图4所示,该业务异常检测装置包括:
数据获取模块401,用于获取待监测业务的业务数据;
输入模块402,用于确定至少一个监测维度以及至少一个待监测业务指标;
监测路径生成模块403,用于根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每一条监测路径对应所述至少一个监测维度中一个或多个监测维度的组合;
时序序列获取模块404,用于针对每条监测路径获取上述至少一个待监测业务指标对应的时序序列;
时序异常检测模块405,对上述至少一个待监测业务指标对应的时序序列分别进行时序异常检测;以及
输出模块406,用于根据时序异常检测结果输出业务异常提醒。
在本发明的实施例中,上述数据获取模块401可以从交易平台的数据库中获取待监测业务的业务统计数据。
在本发明的实施例中,上述监测路径生成模块403可以将上述至少一个监测维度的所有监测维度进行全排列组合,并将得到的全排列组合作为上述至少一条监测路径。
在本发明的实施例中,上述监测路径生成模块403还可以根据待监测业务的实际情况进一步从上述全排列组合中删除部分组合,然后将剩余的组合作为上述至少一个监测路径,从而可以减少异常检测所需的时间,节省计算资源。
在本发明的实施例中,上述时序序列提取模块404可以包括:赋值单元,用于针对每条监测路径,对由所述监测路径所确定的监测维度组合进行赋值;数据提取单元,用于以赋值后的监测路径为条件从所述业务数据中提取出符合所述条件且与所述至少一个待监测业务指标相关的业务数据;以及统计单元,用于对提取的数据进行统计,确定所述至少一个待监测业务指标在一个预定的时间窗口内的时序序列。
在本发明的实施例中,上述时序异常检测模块405可以基于3σ原则进行时序异常检测或者采用S-H-ESD算法进行时序异常检测。更进一步,在上述S-H-ESD算法中,可以使用滑动中位数确定上述GESD的统计量,从而更适应对趋势变化较大的时序数据。其中,滑动中位数就是在一个时间窗口中针对整个时间序列滑动计算每个时间窗口的中位数。例如,上述时间窗口可以设置为5天。
在本发明的实施例中,上述输出模块406输出的业务异常提醒中可以包括业务指标的异常值、异常分、以及对应的监测路径等。而对于比例型业务指标还可以分别输出分子和分母的具体数值。
在本发明的实施例中,上述业务异常检测装置可以进一步包括:过滤模块,用于根据预先设置的过滤条件,对所述至少一个待监测业务指标对应的时序序列进行过滤,删除满足所述过滤条件的时序序列。
作为上述方案的替代方案,上述针对每条监测路径根据上述至少一个待监测业务指标从待监测业务的业务数据中提取业务数据,并进行统计,确定至少一个待监测业务指标对应的时序序列的操作也可以由交易平台的服务器102执行。在这种情况下,在确定了至少一条监测路径之后,针对每条监测路径,上述业务异常检测装置104可以依据确定的检测路径向交易平台的服务器102请求上述至少一个待监测业务指标对应的时序序列。在上述实施例中,由业务异常检测装置104实现的业务异常检测方法可以如图5所示,主要包括如下步骤:
步骤501,确定至少一个监测维度以及至少一个待监测业务指标。
步骤502,根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每一条监测路径对应上述至少一个监测维度中一个或多个监测维度的组合。
步骤503,针对每条监测路径获取上述至少一个待监测业务指标对应的时序序列。
在本发明的实施例中,业务异常检测装置104可以从交易平台的服务器直接获取上述至少一个待监测业务指标对应的时序序列。
在本发明的实施例中,在确定了至少一个待监测业务指标和至少一个监测路径之后,业务异常检测装置104将发送至少一个业务数据请求至交易平台的服务器102,其中每个业务数据请求对应一个待监测业务指标以及一个赋值后的监测路径。上述交易平台的服务器102在接收到上述至少一个业务数据请求之后,针对每一个业务数据请求,以其中监测路径所确定的监测维度组合为条件从数据库103记录的业务数据中提取与待监测业务指标相关的业务数据,并进行统计,确定待监测业务指标对应的时序序列。然后,作为上述每一个业务请求的响应,上述交易平台的服务器102可以向业务异常检测装置104返回对应一条监测路径以及一个待监测业务指标的时序序列。
例如,对于广东省-广州市-服务商开户-流动类商家这一监测路径的取值,对于新签约商家数这一待监测业务指标,业务异常检测装置104将发送一个业务数据请求至交易平台的服务器102。交易平台的服务器102在收到上述业务数据请求之后,可以从数据库103记录业务数据的新签约商家信息中提取出广东省-广州市-服务商开户-流动类商家的新签约商家信息,并对提取的新签约商家信息进行统计,从而得到新签约商家这一业务指标在一个预定的时间窗口内的时序序列(例如,在30天内符合广东省-广州市-服务商开户-流动类商家这一条件的每天新签约商家数)。然后,将上述时序序列作为上述业务数据请求的响应反馈给业务异常检测装置104。
步骤504,对上述至少一个待监测业务指标对应的时序序列分别进行时序异常检测。
步骤505,根据时序异常检测结果输出业务异常提醒。
需要说明的是,上述步骤501-502以及步骤504-505的实现方法与图2中步骤202-203以及步骤205-206相同,因此,在此就不在赘述了。
对应上述业务异常检测方法,本发明的实施例还提出了一种业务异常检测装置,其结构如图6所示,主要包括:
输入模块402,用于确定至少一个监测维度以及至少一个待监测业务指标;
监测路径生成模块403,用于根据上述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每一条监测路径对应所述至少一个监测维度中一个或多个监测维度的组合;
时序序列获取模块404,用于针对每条监测路径获取上述至少一个待监测业务指标对应的时序序列;
时序异常检测模块405,对上述至少一个待监测业务指标对应的时序序列分别进行时序异常检测;以及
输出模块406,用于根据时序异常检测结果输出业务异常提醒。
在本发明的实施例中,上述时序序列获取模块601可以从交易平台的服务器获取上述至少一个待监测业务指标对应的时序序列。具体地,上述时序序列获取模块404可以包括:
请求单元,用于发送至少一个业务数据请求至交易平台的服务器102,其中,每个业务数据请求对应一个待监测业务指标以及一个赋值后的监测路径;
接收单元,用于从所述交易平台的服务器接收所述至少一个待监测业务指标对应的时序序列。
上述交易平台的服务器102在接收到上述业务数据请求之后,针对每一个业务数据请求,以其中赋值后的监测路径所确定的监测维度组合的取值为条件从数据库103记录的业务数据中提取与待监测业务指标相关的业务数据,并进行统计,确定待监测业务指标对应的时序序列;然后,作为上述每一个业务请求的响应,向时序序列获取模块601返回对应一条监测路径以及一个待监测业务指标的时序序列。
需要说明的是,上述输入模块402、监测路径生成模块403、时序异常检测模块405以及输出模块406与图4中的对应模块相同,因此,各个模块的实现方法在此就不在赘述了。
在本发明的实施例中,上述业务异常检测装置可以进一步包括:过滤模块,用于根据预先设置的过滤条件,对所述至少一个待监测业务指标对应的时序序列进行过滤,删除满足所述过滤条件的时序序列。
通过上述业务异常检测装置可以从多个监测维度对业务指标对应的时序序列进行时序异常检测,保证了在多个维度上对业务指标异常的覆盖,从而可以有效防止异常情况的漏检,具有鲁棒性强,风险漏过率低的优点,实现全面以及快速地业务异常检测。
基于上述不同的实施例,本发明提供了一种业务异常检测方法,该方法包括:确定待监测业务的至少一个监测维度以及至少一个待监测业务指标;根据所述至少一个监测维度确定进行业务异常监测的至少一条监测路径;其中,每条监测路径对应所述至少一个监测维度中一个或多个监测维度的组合;针对每条监测路径获取所述至少一个待监测业务指标对应的时序序列;对所述至少一个待监测业务指标对应的时序序列进行时序异常检测;以及根据时序异常检测结果输出业务异常提醒。
如前所述,上述针对每条监测路径获取所述至少一个待监测业务指标对应的时序序列可以从获取的业务数据中提取也可以从平台的服务器处获取。此外,上述各个步骤的具体实现方法可以参考上述实施例,在此不再赘述。
本发明的实施例还提出了一种计算设备,该计算设备的内部结构如图7所示主要包括:至少一个处理器702,存储器704,网络通信装置706、输入装置708、输出装置710以及连接上述装置的总线712。其中,上述至少一个处理器702用于执行存储器存储的机器可读指令模块。在本发明的实施例中,上述一个或多个处理器执行的机器可读指令模块以实现上述图2或图5所示的业务异常检测方法。
本发明的实施例还提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述图2或图5所示的业务异常检测方法。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。