CN117828300A - 一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 - Google Patents
一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 Download PDFInfo
- Publication number
- CN117828300A CN117828300A CN202410012725.6A CN202410012725A CN117828300A CN 117828300 A CN117828300 A CN 117828300A CN 202410012725 A CN202410012725 A CN 202410012725A CN 117828300 A CN117828300 A CN 117828300A
- Authority
- CN
- China
- Prior art keywords
- index
- vector
- time sequence
- cluster
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 41
- 238000004458 analytical method Methods 0.000 title claims abstract description 33
- 230000005856 abnormality Effects 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 36
- 239000013598 vector Substances 0.000 claims description 159
- 230000006870 function Effects 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 19
- 230000009191 jumping Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 8
- 235000014443 Pyrus communis Nutrition 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 7
- 206010000117 Abnormal behaviour Diseases 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质,该***包括包括数据库、异常检测模块、关联指标分析模块和指标时序关系建立模块。当某一项指标出现异常时,本发明根据各项指标的历史数据,实时、动态分析不同指标之间的时序相关性,据此找出导致异常的根因指标。该发明在实现上比专家知识库的方法要高效、简便,且可行性高,在分析根因过程中,能够给出完整的根因链条,明确不同指标之间相关影响的关系。找到根因指标的意义在于能够帮助确定造成其他指标异常的原因,当某些指标出现异常时,便于确定异常的根本原因。
Description
技术领域
本发明涉及一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质,属于智能运维领域。
背景技术
银行业务的复杂性使得银行面临着各种各样的风险,包括信用风险、市场风险等。信用风险是银行业务中的一个重要风险。银行通过向客户提供贷款、***等业务获取收益,但同时也面临着客户无法按时还款的风险。异常检测可以通过监控客户的还款历史、收入水平、负债比例等信息,及时发现高风险客户,从而采取相应的风险控制措施。市场风险是指银行在市场中进行交易时,由于市场波动产生的潜在损失。例如,在外汇交易中,银行可能会因为汇率波动产生损失。异常检测可以通过监控市场变化、交易价格和交易量等信息,及时发现市场风险,从而采取适当的风险管理措施。
由此可见,异常检测在银行业务中扮演着至关重要的角色。银行有必要构建有效的异常检测***,及时发现和处理各种风险的,提高银行的竞争力和盈利能力。
异常检测旨在发现业务中的异常情况,但是异常检测有时可能并不是根本目的。比如监测到某用户的还款历史出现异常,单纯从还款历史角度看,仅仅是这一个指标而已,而常见的一种情况是,还款历史异常由收入水平异常导致,即收入水平和还款历史的异常构成了一对因果关系。因此,分析某一项指标的异常,进而分析出其根因指标,是一个完整的过程。
目前,银行业务中使用的异常检测和根因分析***通常基于机器学习和数据挖掘技术构建。这些***通常会收集银行业务中的大量数据,包括客户信息、交易记录、账户余额、信用评分等,使用机器学习算法对这些数据进行分析和建模。通过对数据的分析和建模,***可以学习并识别正常业务和异常行为之间的差异,从而及时发现和处理异常行为。发现异常行为后,***还需要对其进行根因分析,以确定异常行为的具体原因。根因分析的过程通常需要事先建立一个专家知识库,如知识图谱等,用以确定不同指标之间的关联关系。当某个指标出现异常时,根据专家知识库给出最可能的根因。
专家知识库是领域专家知识、经验的总结,能够给出相对准确的根因,但知识库建立的过程却比较艰难,尤其是对于一些中小规模的银行而言,建立专家知识库困难重重。
附图说明
图1为本发明流程图。
发明内容
为解决现有技术中存在的问题,本发明提出一种基于异常指标时序关系的银行业务根因指标分析方法,该方法具体步骤如下:
(1)使用数据库存储银行业务中的各指标历史数据和最新数据;
(2)利用异常检测模块发现异常指标;
(3)对异常指标进行分析,计算其关联指标;
(4)根据检测到的异常指标及其关联指标,按照时序关系,发现根因指标。
进一步地,步骤(3)中,计算关联指标的具体步骤为:
3.1对于每个指标Ti,1≤i≤N,有vi=[ti1,ti2,…,tiM],M为过去一个时间窗口内的采集次数,所有vi组成矩阵
3.2令其中/>表示向上取整;从N个指标向量中随机选择num个向量作为簇质心向量;
3.3计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度,该相似度用pearson相关系数的绝对值P(i,j)=|pear(vi,vj)|表示;
3.4向量vi与某一个簇C的质心向量c相似度最高,将向量vi划分到簇C中;在将向量vi划分到簇C中前,若pear(vi,c)<0,将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;将向量vi划分到簇C中后,更新质心向量c,其值为簇C中各向量的均值;
3.5若迭代次数超出最大次数,跳转到步骤3.6;如果未超出,跳转到步骤3.3;
3.6对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;假设与指标T1同簇的其他指标有K个,分别记为S1,S2,…,SK,对应的关联指标向量分别记为s1,s2,…,sK。
进一步地,步骤(4)中,分别计算关联指标向量s1,s2,…,sK与v1的动态时间规整路径path(sk,v1)=(wk1,wk2,…,wkL),其中1≤k≤K,L为自然数,wkz=(xkz,y1z),xkz为向量sk的第x个元素,y1z为向量v1的第y个元素,1≤z≤L,1≤x≤M,1≤y≤M,且wk1=(1,1),wkL=(M,M);若seq(sk,v1)<0,表示按照时序关系向量sk可能发生在向量v1之前,且该值越小,表示发生越早;若seq(sk,v1)>0,表示按照时序关系向量sk可能发生在向量v1之后,且该值越大,表示发生越晚;再计算seq(s1,v1),seq(s2,v1),…,seq(sK,v1);最后按照从小到大的顺序对函数值排序,排在前面的指标可以作为排在后面指标的根因指标。
本发明又提出一种基于异常指标时序关系的银行业务根因指标分析***,该***包括数据库、异常检测模块、关联指标分析模块和指标时序关系建立模块,其中:
(1)数据库,用于存储银行业务中的各指标的历史数据和最新数据;
(2)异常检测模块,用于发现异常指标;
(3)关联指标分析模块,对异常指标进行分析,计算其关联指标;
(4)指标时序关系建立模块,该模块根据检测到的异常指标及其关联指标,按照时序关系,发现根因指标。
进一步地,关联指标分析模块中,计算关联指标的具体步骤为:
3.1对于每个指标Ti,1≤i≤N,有vi=[ti1,ti2,…,tiM],M为过去一个时间窗口内的采集次数,所有vi组成矩阵
3.2令其中/>表示向上取整;从N个指标向量中随机选择num个向量作为簇质心向量;
3.3计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度,该相似度用pearson相关系数的绝对值P(i,j)=|pear(vi,vj)|表示;
3.4向量vi与某一个簇C的质心向量c相似度最高,将向量vi划分到簇C中;在将向量vi划分到簇C中前,若pear(vi,c)<0,将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;将向量vi划分到簇C中后,更新质心向量c,其值为簇C中各向量的均值;
3.5若迭代次数超出最大次数,跳转到步骤3.6;如果未超出,跳转到步骤3.3;
3.6对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;假设与指标T1同簇的其他指标有K个,分别记为S1,S2,…,SK,对应的关联指标向量分别记为s1,s2,…,sK。
进一步地,指标时序关系建立模块中,分别计算关联指标向量s1,s2,…,sK与v1的动态时间规整路径path(sk,v1)=(wk1,wk2,…,wkL),其中1≤k≤K,L为自然数,wkz=(xkz,y1z),xkz为向量sk的第x个元素,y1z为向量v1的第y个元素,1≤z≤L,1≤x≤M,1≤y≤M,且wk1=(1,1),wkL=(M,M);若seq(sk,v1)<0,表示按照时序关系向量sk可能发生在向量v1之前,且该值越小,表示发生越早;若seq(sk,v1)>0,表示按照时序关系向量sk可能发生在向量v1之后,且该值越大,表示发生越晚;再计算seq(s1,v1),seq(s2,v1),…,seq(sK,v1);最后按照从小到大的顺序对函数值排序,排在前面的指标可以作为排在后面指标的根因指标。
本发明又提供了一种设备,所述设备包括:数据采集装置、处理器和存储器;所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行上述任一项方法。
本发明又提供了一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述任一项方法。
当某一项指标出现异常时,本发明根据各项指标的历史数据,实时、动态分析不同指标之间的时序相关性,据此找出导致异常的根因指标。该发明在实现上比专家知识库的方法要高效、简便,且可行性高,在分析根因过程中,能够给出完整的根因链条,明确不同指标之间相关影响的关系。找到根因指标的意义在于能够帮助确定造成其他指标异常的原因,当某些指标出现异常时,便于确定异常的根本原因。
具体实施方式
本发明公开一种基于异常指标时序关系的根因指标分析***,当某一项指标出现异常时,该***根据各项指标的历史数据,实时、动态地分析不同指标之间的时序相关性,据此找出导致异常的根因指标。该发明在实现上比专家知识库的方法要高效、简便,且可行性高,在分析根因过程中,能够给出完整的根因链条,明确不同指标之间相关影响的关系。具体流程见图1。
找到根因指标的意义在于能够帮助确定造成其他指标异常的原因,当某些指标出现异常时,便于确定异常的根本原因。
基于异常时间链的根因指标分析***的主要模块包括数据库、异常检测、关联指标分析和建立指标时序关系,各模块的具体信息分别为:
1)数据库:数据库中存储了各指标的历史数据以及最新数据,是其他模块进行数据分析的数据源;
2)异常检测:该模块的主要功能是发现异常指标;
该模块主要利用3Sigma规则对数据库中的各指标进行异常检测。3Sigma规则是统计学中非常重要的一种计算方法,在该规则下,假设数据服从正态分布,则异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值,即在正态分布的假设下,距离平均值三倍标准差之外的值出现的概率非常低,因此可认为是异常值。
因为在数据库中,各指标的值以时间序列形式存储。根据3Sigma规则,周期性地对各指标的数据进行检测,及时发现指标中的异常情况。
3)关联指标分析:对异常指标进行分析,计算其关联指标;
假设在数据库中,用户对关心的对象存储了N个指标,记为T1,T2,…,TN,假设异常检测模块判定指标T1出现异常,需从其他指标中找出与T1密切关联的指标,这些指标可能是导致指标T1出现异常的诱因。为找出关联指标,本发明设计了一种关联指标搜索算法,该算法的详细步骤如下:
步骤1:对于每个指标Ti,1≤i≤N,假设在过去的一个时间窗口内共采集了M次,则Ti所采集的指标值的时间序列可以表示为向量vi=[ti1,ti2,…,tiM],所有的vi可组成如下的矩阵:
在矩阵V中,每行代表一个指标所对应的向量值,每列代表某个时刻各指标的值;
步骤2:令其中/>表示向上取整;从N个指标向量中随机选择num个向量作为簇质心向量;
步骤3:计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度,该相似度用pearson相关系数的绝对值表示,例如,对于指标Ti和Tj对应的向量vi和vj,其pearson相似度可表示为P(i,j)=|pear(vi,vj)|,其中1≤j≤N,||表示绝对值,pear()表示两个指标向量之间的pearson相关系数;在自然科学领域中,pearson相关系数广泛用于度量两个变量之间的相关程度,其值介于-1与1之间。
步骤4:计算指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度后,假设在上述num个簇中,向量vi与某一个簇C的质心向量c相似度最高,表明指标Ti与该簇最相关,将向量vi划分到簇C中;
在将向量vi划分到簇C中之前,判断下pear(vi,c)的取值范围,若pear(vi,c)<0,表明向量vi与簇C的质心向量c相似度虽然在各质心中最高,但是为负相关,此时将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;
将向量vi划分到簇C中后,更新质心向量c的值,其值为簇C中各向量的均值,即质心向量c的每一个元素等于簇C中的所有向量在矩阵V对应列上元素的均值;
步骤5:判断迭代次数是否超出最大次数,如果超出,则跳转到步骤6;如果未超出,跳转到步骤3继续执行;
步骤6:对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;假设与指标T1同簇的其他指标有K个,分别记为S1,S2,…,SK,对应的向量分别记为s1,s2,…,sK;
4)建立指标时序关系:根据检测到的异常指标及其关联指标,按照时序关系,进而发现根因指标。
对于出现异常的指标T1,对应的向量为v1,确定其关联指标为S1,S2,…,SK,对应的向量分别为s1,s2,…,sK;分别计算关联指标向量s1,s2,…,sK与v1的动态时间规整路径Dynamic Time Warping;
假设向量sk和v1之间的规整路径为path(sk,v1)=(wk1,wk2,…,wkL),其中1≤k≤K,L为自然数,wkz=(xkz,y1z),xkz为向量sk的第x个元素,y1z为向量v1的第y个元素,1≤z≤L,1≤x≤M,1≤y≤M,且满足wk1=(1,1),wkL=(M,M);在这种情况下,定义一个函数seq(sk,v1)用以表示向量sk和v1之间的时序先后关系,该函数表示为:
函数seq(sk,v1)的取值可以表示向量sk和v1之间的时序先后关系,该函数值可能为负值,也可能为正值;若seq(sk,v1)<0,表示按照时序关系向量sk可能发生在向量v1之前,且该值越小,表示发生越早;若若seq(sk,v1)>0,表示按照时序关系向量sk可能发生在向量v1之后,且该值越大,表示发生越晚。
按照函数seq(sk,v1)的计算方法,可以分别计算关联指标向量s1,s2,…,sK与v1的时序先后关系值,即seq(s1,v1),seq(s2,v1),…,seq(sK,v1);然后按照从小到大的顺序对函数值进行排序,即可得出不同指标之间的时序先后顺序,此时排在前面的指标可以作为排在后面指标的根因进行分析。
更具体的一个例子:
基于异常时间链的根因指标分析***的主要模块包括数据库、异常检测、关联指标分析和建立指标时序关系,各模块的具体信息分别为:
1)数据库:数据库中存储了各指标的历史数据以及最新数据,是其他模块进行数据分析的数据源;
2)异常检测:该模块的主要功能是发现异常指标;
根据3Sigma规则,周期性地对各指标的数据进行检测,发现指标T1的数值出现异常,该指标在过去一个时间窗口的取值组成了向量v1=[2,2,4,4,3,5,2,2,4,9,9,5]。
3)关联指标分析:对异常指标进行分析,计算其关联指标;
假设在数据库中,用户对关心的对象存储了20个指标,记为T1,T2,…,T20,假设异常检测模块判定指标T1出现异常,需从其他指标中找出与T1密切关联的指标,这些指标可能是导致指标T1出现异常的诱因。为找出关联指标,本发明设计了一种关联指标搜索算法,该算法的详细步骤如下:
步骤1:对于每个指标Ti,1≤i≤20,假设在过去的一个时间窗口内共采集了12次,则Ti所采集的指标值的时间序列可以表示为向量vi=[ti1,ti2,…,ti20];
步骤2:令从20个指标向量中随机选择num个向量作为簇质心向量;
步骤3:计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度。
步骤4:计算指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度后,假设在上述num个簇中,向量vi与某一个簇C的质心向量c相似度最高,表明指标Ti与该簇最相关,将向量vi划分到簇C中;
在将向量vi划分到簇C中之前,判断下pear(vi,c)的取值范围,若pear(vi,c)<0,表明向量vi与簇C的质心向量c相似度虽然在各质心中最高,但是为负相关,此时将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;
将向量vi划分到簇C中后,更新质心向量c的值,其值为簇C中各向量的均值,即质心向量c的每一个元素等于簇C中的所有向量在矩阵V对应列上元素的均值;
步骤5:判断迭代次数是否超出最大次数,即10次,如果超出,则跳转到步骤6;如果未超出,跳转到步骤3继续执行;
步骤6:对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;
与指标T1同簇的其他指标有3个,分别记为S1,S2,S3,对应的向量分别为
s1=[2,2,4,4,3,5,5,4,3,5,8,8],s2=[2,2,4,4,3,8,8,4,3,4,3,5],s3=[2,2,3,3,
9,9,2,4,3,4,3,5];
4)建立指标时序关系:根据检测到的异常指标及其关联指标,按照时序关系,进而发现根因指标。
对于出现异常的指标T1,对应的向量为v1,确定其关联指标为S1,S2,S3,对应的向量分别为s1,s2,s3;分别计算关联指标向量s1,s2,s3与v1的动态时间规整路径Dynamic TimeWarping;
经计算,path(s1,v1)=[(0,0),(0,1),(1,1),(2,2),(2,3),(3,3),(4,4),(5,5),(6,5),(7,5),(8,6),(8,7),(9,8),(10,9),(11,10),(11,11)];path(s2,v1)=[(0,0),(0,1),(1,1),(2,2),(2,3),(3,3),(4,4),(4,5),(4,6),(4,7),(4,8),(5,9),(6,10),(7,11),(8,11),(9,11),(10,11),(11,11)];path(s3,v1)=[(0,0),(0,1),(1,1),(2,2),(2,3),(2,4),(3,4),(3,5),(3,6),(3,7),(3,8),(4,9),(4,10),(5,10),(6,11),(7,11),(8,11),(9,11),(10,11),(11,11)];
且计算后可分别得到函数seq(sk,v1)的取值:seq(s1,v1)=7,seq(s2,v1)=-30,seq(s3,v1)=-50。按照该函数取值从小到大的顺序排列后,可得指标排列顺序为:指标S3、指标S2、指标T1、指标S1;即从时序关系上,可分析得到指标S3出现异常导致指标S2出现异常,进而导致指标T1出现异常,且该指标异常后,又导致了指标S1出现异常。也就是说,指标S3、指标S2、指标T1、指标S1形成了一个根因链条,可以方便地呈现出不同指标之间的相关影响关系。从各指标向量的实际数值来看,各指标的异常的确存在变化趋势上的先后关系,即算法所呈现的结论符合实际情况,达到本发明预设的技术效果。
本发明又提供了一种设备,所述设备包括:数据采集装置、处理器和存储器;所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行上述任一项方法。
本发明又提供了一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述任一项方法。
上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
以上所述的具体实施例,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施例而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种基于异常指标时序关系的银行业务根因指标分析方法,其特征在于:该方法具体步骤如下:
(1)使用数据库存储银行业务中的各指标历史数据和最新数据;
(2)利用异常检测模块发现异常指标;
(3)对异常指标进行分析,计算其关联指标;
(4)根据检测到的异常指标及其关联指标,按照时序关系,发现根因指标。
2.如权利要求1所述的一种基于异常指标时序关系的银行业务根因指标分析方法,其特征在于:步骤(3)中,计算关联指标的具体步骤为:
3.1对于每个指标Ti,1≤i≤N,有vi=[ti1,ti2,…,tiM],M为过去一个时间窗口内的采集次数,所有vi组成矩阵
3.2令其中/>表示向上取整;从N个指标向量中随机选择num个向量作为簇质心向量;
3.3计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度,该相似度用pearson相关系数的绝对值P(i,j)=|pear(vi,vj)|表示;
3.4向量vi与某一个簇C的质心向量c相似度最高,将向量vi划分到簇C中;在将向量vi划分到簇C中前,若pear(vi,c)<0,将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;将向量vi划分到簇C中后,更新质心向量c,其值为簇C中各向量的均值;
3.5若迭代次数超出最大次数,跳转到步骤3.6;如果未超出,跳转到步骤3.3;
3.6对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;假设与指标T1同簇的其他指标有K个,分别记为S1,S2,…,SK,对应的关联指标向量分别记为s1,s2,…,sK。
3.如权利要求1所述的一种基于异常指标时序关系的银行业务根因指标分析方法,其特征在于:步骤(4)中,分别计算关联指标向量s1,s2,…,sK与v1的动态时间规整路径path(sk,v1)=(wk1,wk2,…,wkL),其中1≤k≤K,L为自然数,wkz=(xkz,y1z),xkz为向量sk的第x个元素,y1z为向量v1的第y个元素,1≤z≤L,1≤x≤M,1≤y≤M,且wk1=(1,1),wkL=(M,M);若seq(sk,v1)<0,表示按照时序关系向量sk可能发生在向量v1之前,且该值越小,表示发生越早;若seq(sk,v1)>0,表示按照时序关系向量sk可能发生在向量v1之后,且该值越大,表示发生越晚;再计算seq(s1,v1),seq(s2,v1),…,seq(sK,v1);最后按照从小到大的顺序对函数值排序,排在前面的指标可以作为排在后面指标的根因指标。
4.一种基于异常指标时序关系的银行业务根因指标分析***,该***包括数据库、异常检测模块、关联指标分析模块和指标时序关系建立模块,其特征在于:
(1)数据库,用于存储银行业务中的各指标历史数据和最新数据;
(2)异常检测模块,用于发现异常指标;
(3)关联指标分析模块,对异常指标进行分析,计算其关联指标;
(4)指标时序关系建立模块,该模块根据检测到的异常指标及其关联指标,按照时序关系,发现根因指标。
5.如权利要求4所述的一种基于异常指标时序关系的银行业务根因指标分析***,其特征在于:关联指标分析模块中,计算关联指标的具体步骤为:
3.1对于每个指标Ti,1≤i≤N,有vi=[ti1,ti2,…,tiM],M为过去一个时间窗口内的采集次数,所有vi组成矩阵
3.2令其中/>表示向上取整;从N个指标向量中随机选择num个向量作为簇质心向量;
3.3计算每个指标Ti对应的向量vi与上述num个簇质心向量之间的pearson相似度,该相似度用pearson相关系数的绝对值P(i,j)=|pear(vi,vj)|表示;
3.4向量vi与某一个簇C的质心向量c相似度最高,将向量vi划分到簇C中;在将向量vi划分到簇C中前,若pear(vi,c)<0,将向量vi中各元素全部取相反数,即vi=[-ti1,-ti2,…,-tiM],然后再将向量vi划分到簇C中;将向量vi划分到簇C中后,更新质心向量c,其值为簇C中各向量的均值;
3.5若迭代次数超出最大次数,跳转到步骤3.6;如果未超出,跳转到步骤3.3;
3.6对于出现异常的指标T1,找出与指标T1在同一个簇中的其他指标,认为这些指标与指标T1密切相关;假设与指标T1同簇的其他指标有K个,分别记为S1,S2,…,SK,对应的关联指标向量分别记为s1,s2,…,sK。
6.如权利要求4所述的一种基于异常指标时序关系的银行业务根因指标分析***,其特征在于:指标时序关系建立模块中,分别计算关联指标向量s1,s2,…,sK与v1的动态时间规整路径path(sk,v1)=(wk1,wk2,…,wkL),其中1≤k≤K,L为自然数,wkz=(xkz,y1z),xkz为向量sk的第x个元素,y1z为向量v1的第y个元素,1≤z≤L,1≤x≤M,1≤y≤M,且wk1=(1,1),wkL=(M,M);若seq(sk,v1)<0,表示按照时序关系向量sk可能发生在向量v1之前,且该值越小,表示发生越早;若seq(sk,v1)>0,表示按照时序关系向量sk可能发生在向量v1之后,且该值越大,表示发生越晚;再计算seq(s1,v1),seq(s2,v1),…,seq(sK,v1);最后按照从小到大的顺序对函数值排序,排在前面的指标可以作为排在后面指标的根因指标。
7.一种设备,所述设备包括:数据采集装置、处理器和存储器;所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行上述1-2任一项方法。
8.一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述1-2任一项方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410012725.6A CN117828300A (zh) | 2024-01-03 | 2024-01-03 | 一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410012725.6A CN117828300A (zh) | 2024-01-03 | 2024-01-03 | 一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117828300A true CN117828300A (zh) | 2024-04-05 |
Family
ID=90505670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410012725.6A Pending CN117828300A (zh) | 2024-01-03 | 2024-01-03 | 一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117828300A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170201897A1 (en) * | 2016-01-08 | 2017-07-13 | Futurewei Technologies, Inc. | Fingerprinting root cause analysis in cellular systems |
CN109684181A (zh) * | 2018-11-20 | 2019-04-26 | 华为技术有限公司 | 告警根因分析方法、装置、设备及存储介质 |
US20190188238A1 (en) * | 2016-08-26 | 2019-06-20 | 1Qb Information Technologies Inc. | Method and system for performing real-time analytics on a plurality of data streams |
CN110955575A (zh) * | 2019-11-14 | 2020-04-03 | 国网浙江省电力有限公司信息通信分公司 | 一种基于关联分析模型的业务***故障定位方法 |
CN114090396A (zh) * | 2022-01-24 | 2022-02-25 | 华南理工大学 | 一种云环境多指标无监督异常检测和根因分析方法 |
CN114422325A (zh) * | 2021-12-30 | 2022-04-29 | 优刻得科技股份有限公司 | 内容分发网络异常定位方法、装置、设备及存储介质 |
CN114461792A (zh) * | 2021-12-24 | 2022-05-10 | 阿里巴巴(中国)有限公司 | 告警事件关联方法、装置、电子设备、介质及程序产品 |
CN115514627A (zh) * | 2022-09-21 | 2022-12-23 | 深信服科技股份有限公司 | 一种故障根因定位方法、装置、电子设备及可读存储介质 |
WO2023010823A1 (zh) * | 2021-08-03 | 2023-02-09 | 华为技术有限公司 | 网络故障根因的确定方法、装置、设备及存储介质 |
CN115964211A (zh) * | 2022-12-28 | 2023-04-14 | 支付宝(杭州)信息技术有限公司 | 一种根因定位方法、装置、设备和可读介质 |
CN116070934A (zh) * | 2022-12-09 | 2023-05-05 | 京东科技信息技术有限公司 | 指标故障原因的确定方法和装置 |
-
2024
- 2024-01-03 CN CN202410012725.6A patent/CN117828300A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170201897A1 (en) * | 2016-01-08 | 2017-07-13 | Futurewei Technologies, Inc. | Fingerprinting root cause analysis in cellular systems |
US20190188238A1 (en) * | 2016-08-26 | 2019-06-20 | 1Qb Information Technologies Inc. | Method and system for performing real-time analytics on a plurality of data streams |
CN109684181A (zh) * | 2018-11-20 | 2019-04-26 | 华为技术有限公司 | 告警根因分析方法、装置、设备及存储介质 |
CN110955575A (zh) * | 2019-11-14 | 2020-04-03 | 国网浙江省电力有限公司信息通信分公司 | 一种基于关联分析模型的业务***故障定位方法 |
WO2023010823A1 (zh) * | 2021-08-03 | 2023-02-09 | 华为技术有限公司 | 网络故障根因的确定方法、装置、设备及存储介质 |
CN114461792A (zh) * | 2021-12-24 | 2022-05-10 | 阿里巴巴(中国)有限公司 | 告警事件关联方法、装置、电子设备、介质及程序产品 |
CN114422325A (zh) * | 2021-12-30 | 2022-04-29 | 优刻得科技股份有限公司 | 内容分发网络异常定位方法、装置、设备及存储介质 |
CN114090396A (zh) * | 2022-01-24 | 2022-02-25 | 华南理工大学 | 一种云环境多指标无监督异常检测和根因分析方法 |
CN115514627A (zh) * | 2022-09-21 | 2022-12-23 | 深信服科技股份有限公司 | 一种故障根因定位方法、装置、电子设备及可读存储介质 |
CN116070934A (zh) * | 2022-12-09 | 2023-05-05 | 京东科技信息技术有限公司 | 指标故障原因的确定方法和装置 |
CN115964211A (zh) * | 2022-12-28 | 2023-04-14 | 支付宝(杭州)信息技术有限公司 | 一种根因定位方法、装置、设备和可读介质 |
Non-Patent Citations (1)
Title |
---|
贾统;李影;吴中海;: "基于日志数据的分布式软件***故障诊断综述", 软件学报, no. 07, 15 July 2020 (2020-07-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614073B2 (en) | System and method for using data incident based modeling and prediction | |
CN116340796B (zh) | 时序数据分析方法、装置、设备及存储介质 | |
CN113434575B (zh) | 基于数据仓库的数据归因处理方法、装置及存储介质 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN111160329A (zh) | 一种根因分析的方法及装置 | |
Ruyu et al. | A comparison of credit rating classification models based on spark-evidence from lending-club | |
JP5697146B2 (ja) | リスク管理装置 | |
CN113835947A (zh) | 一种基于异常识别结果确定异常原因的方法和*** | |
CN116882756B (zh) | 基于区块链的电力安全管控方法 | |
CN107480703A (zh) | 交易故障检测方法及装置 | |
KR20110114181A (ko) | 예측 정확성이 향상된 대출 심사 방법 | |
CN117828300A (zh) | 一种基于异常指标时序关系的银行业务根因指标分析方法、***、设备及可读存储介质 | |
CN116149895A (zh) | 大数据集群性能预测方法、装置和计算机设备 | |
CN114493662A (zh) | 一种商品价格数据分析方法、平台、***以及存储介质 | |
JP7298286B2 (ja) | モデル提供プログラム、モデル提供方法及びモデル提供装置 | |
Sheraz et al. | EXTREME VALUE ANALYSIS AND RISK ASSESSMENT: A CASE OF PAKISTAN STOCK MARKET. | |
Minnoor et al. | Nifty price prediction from Nifty SGX using machine learning, neural networks and sentiment analysis | |
Singh et al. | Time Series Forecast With Stock's Price Candlestick Patterns And Sequence Similarities | |
Padhi et al. | Intraday Stock Prices Forecasting Using an Autoregressive Model | |
CN117332212B (zh) | 一种基于混沌工程故障实验的智能化风险探索方法及*** | |
Muniandy et al. | Deep learning in detecting financial statement fraud: an application of deep neural network (DNN) | |
Kong et al. | Pattern recognition in micro-trading behaviors before stock price jumps: A framework based on multivariate time series analysis | |
TW202349316A (zh) | 應用人工智慧的金融證券產品價值模型分析方法及其系統 | |
Kojima et al. | Risk analysis of software process measurements | |
Andersson et al. | Bankruptcy determinants among Swedish SMEs:-The predictive power of financial measures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |