CN116361059B - 一种银行业务异常根因诊断方法及诊断*** - Google Patents

一种银行业务异常根因诊断方法及诊断*** Download PDF

Info

Publication number
CN116361059B
CN116361059B CN202310567128.5A CN202310567128A CN116361059B CN 116361059 B CN116361059 B CN 116361059B CN 202310567128 A CN202310567128 A CN 202310567128A CN 116361059 B CN116361059 B CN 116361059B
Authority
CN
China
Prior art keywords
abnormal
data
business
root cause
anomaly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310567128.5A
Other languages
English (en)
Other versions
CN116361059A (zh
Inventor
林建法
刘佳
刘强
邓拓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202310567128.5A priority Critical patent/CN116361059B/zh
Publication of CN116361059A publication Critical patent/CN116361059A/zh
Application granted granted Critical
Publication of CN116361059B publication Critical patent/CN116361059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种银行业务异常根因诊断方法及诊断***。所述方法包括以下步骤:对银行业务***进行数据采集和数据预处理,得到银行业务异常数据;利用关联规则挖掘技术对银行业务异常数据进行离线计算,得到异常检测规则数据;通过预设的异常检测模型对异常检测规则数据进行异常检测,以得到异常数据;对异常数据进行特征提取,得到异常数据特征;构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行根因分析,得到异常根因数据;利用置信度传播分析和血缘分析技术对异常根因数据进行异常定位,得到异常源数据。本发明通过业务异常血缘图谱进一步修正异常根因点,以提高根因诊断的正确率。

Description

一种银行业务异常根因诊断方法及诊断***
技术领域
本发明涉及数据处理技术领域,尤其涉及一种银行业务异常根因诊断方法及诊断***。
背景技术
随着互联网技术的快速发展,银行业务***在实现高效的金融服务方面扮演着越来越重要的角色。由于业务复杂性和数据处理量的大幅度增加,银行业务***经常出现各种异常情况,例如进程失败、数据错误、网络连接问题等,这些异常将严重影响银行业务流程的正常运行,甚至会对客户的利益和商业信誉产生威胁。因此,银行业务异常根因诊断技术成为了一个重要的研究方向。现有的异常根因诊断方法主要关注于找到导致异常发生的根源,并识别异常的类型、过程和原因等相关因素。这些技术使用机器学习、数据挖掘、知识图谱、人工智能等方法,以有效地诊断银行***中的各种异常情况。特别是,在大量数据集合中,诊断银行业务***中的异常数据节点和异常数据关系的复杂度非常高。为了解决这种问题,银行业务异常根因诊断技术发展出了一种基于图分析和深度学习的方法,实现了高效、准确和实时异常数据识别和根因诊断。然而,银行中业务***众多,一个业务流程涉及非常多的***,对应的基础设施也是非常的多。通常一个业务异常产生,需要对各关联应用、设施进行排查诊断,往往耗时耗力,导致异常持续时间较长,异常处置效率较低。
发明内容
基于此,本发明提供一种银行业务异常根因诊断方法及诊断***,以解决至少一个上述技术问题。
为实现上述目的,一种银行业务异常根因诊断方法,所述方法包括以下步骤:
步骤S1:对银行业务***进行数据采集和数据预处理,得到银行业务异常数据;
步骤S2:利用关联规则挖掘技术对银行业务异常数据进行离线计算,得到异常检测规则数据;
步骤S3:通过预设的异常检测模型对异常检测规则数据进行异常检测,以得到异常数据;
步骤S4:对异常数据进行特征提取,得到异常数据特征;构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行根因分析,得到异常根因数据;
步骤S5:利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,得到异常源数据;
步骤S6:根据异常源数据构建业务异常血缘图谱,通过业务异常血缘图谱进一步了解银行业务异常之间的关系,以执行相应的异常根因诊断进程。
本发明通过数据采集,有助于准确地捕获银行业务***中的异常数据,从而为异常根因分析提供基础数据,并通过对数据进行清洗、归一化等预处理操作,可以提高数据的质量和准确性,从而为后续分析和处理提供更加可靠的数据基础。通过关联规则挖掘技术,能够有效地发现银行业务***中的异常规律和模式,从而能够更加准确地检测银行业务异常数据。并且通过将异常检测规则数据离线计算,能够减少在线检测的运算量,提高异常检测效率。通过利用预设的异常检测模型,能够较为准确地检测出异常数据,从而为后续的异常根因分析提供必要的数据基础。通过对异常数据的特征提取和基于决策树的根因分类模型的构建,能够较为准确地识别出银行业务异常的根因,为后续的异常定位和解决提供支持。另外,通过对异常数据进行特征提取,可以得到更加清晰、简洁和易于理解的数据特征,从而提高数据的可解释性和应用价值。通过利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,能够提高异常定位的准确性和精度。然后,通过异常定位,能够快速准确地定位异常源数据,进一步缩小了异常根因的范围,为后续的异常根因诊断提供必要的数据依据。通过构建业务异常血缘图谱,可以深度挖掘银行业务异常之间的关联关系,发现异常数据的隐藏关联关系,从而为异常根因分析提供更加丰富的数据依据。最后,通过利用业务异常血缘图谱,能够快速识别银行业务异常之间的关系和联系,提高异常根因的诊断效率和精度,缩短异常修复时间,降低银行业务风险损失,从而帮助银行业务***的运维人员快速定位和解决异常情况。
优选地,步骤S1包括以下步骤:
通过对银行业务***进行数据采集,得到银行业务数据;
对银行业务数据进行数据预处理,以得到银行业务异常数据。
本发明通过采集和处理银行业务数据,可以自动发现银行业务***中的异常数据,这将使得银行业务运营人员能够及时识别出***故障和业务异常波动,从而更快地采取必要的措施减少损失。数据采集和预处理步骤可以提供有关银行业务***绩效的有用信息。根据这些信息,银行业务运营人员可以做出更好的决策,从而优化***绩效,并提高业务效率和结果,同时也可以减少人为错误和错误报告。
优选地,步骤S2包括以下步骤:
步骤S21:通过对银行业务异常数据进行数据转化,得到业务异常规则数据;
步骤S22:利用基于Apriori算法的频繁项集挖掘获取业务异常规则数据中关联规则,得到业务异常频繁项集;
步骤S23:根据关联规则算法计算业务异常频繁项集的置信度,获取置信度的关联规则,得到规则置信度;
其中,关联规则算法公式如下所示:
式中,为规则置信度,/>为指数函数,/>为业务异常频繁项集中的集合数量,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率,/>为规则置信度的修正系数;
本发明构建了一个关联规则算法的公式,为了得到准确的规则置信度,通过使用关联规则算法公式,能够帮助业务运营人员快速定位业务的异常情况,帮助他们更好地处理问题,并提高银行业务运营的效率,利用关联规则算法计算业务异常频繁项集的置信度和获取规则置信度,可以提高银行业务异常检测的效率和准确性,该公式充分考虑了业务异常频繁项集中的集合数量,业务异常频繁项集中的第/>个频繁项集/>,业务异常频繁项集中的第/>个频繁项集/>,业务异常频繁项集中的第/>个频繁项集出现的概率/>,业务异常频繁项集中的第/>个频繁项集出现的概率/>,业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率/>,其中为了防止得到的规则置信度出现偏差,还需要对其进行归一化处理,根据规则置信度/>与各参数之间的相互联系构成了一种函数关系/>,实现了通过关联规则算法计算业务异常频繁项集的置信度,以得到规则置信度,同时,该公式中规则置信度的修正系数可以根据实际情况进行调整,从而提高关联规则算法的准确性和适用性。
步骤S24:按照从大到小的顺序将规则置信度对应的业务异常频繁项集进行排序,选择规则置信度较高的业务异常频繁项集,以得到异常检测规则数据。
本发明通过对银行业务异常数据的转化和基于Apriori算法的频繁项集挖掘,可以帮助银行快速有效地发现业务异常频繁项集。然后通过计算业务异常频繁项集的置信度,可以筛选出有意义的业务异常规则数据,并根据置信度高低选择相应的业务异常频繁项集,进一步提高业务异常检测的准确性。通过从业务异常数据中派生关联规则、挖掘频繁项集,并计算置信度确定关联规则的有效性,可以有效防范银行的业务风险。置信度高的关联规则,说明相关的业务异常规则数据之间具有较强的关联性,是实际规律的反映。通过选择置信度较高的关联规则,可以进一步提高业务异常检测的准确性。根据关联规则算法计算业务异常频繁项集的置信度,可以得到规则置信度,帮助银行更好地了解业务异常情况,提高业务运营质量,减少业务风险,为银行的业务发展提供有力的支撑。按照规则置信度由高到低的顺序,选择规则置信度较高的业务异常频繁项集进行异常检测,可以提高检测的准确性,降低误报率,优化业务决策,从而对银行的业务管理和决策提供有益的支持。
优选地,步骤S3包括以下步骤:
步骤S31:对异常检测规则数据进行数据预处理和数据转换,得到异常检测数据;将异常检测数据划分为训练数据集、优化数据集和检测数据集;
步骤S32:构建基于支持向量机的异常检测模型,其中异常检测模型包括训练模型、模型优化和检测模型;
步骤S33:将训练数据集输入至基于支持向量机的训练模型进行模型训练,并通过如下的异常检测损失函数将优化数据集输入至训练模型进行参数调优,以生成检测模型;
其中,异常检测损失函数的公式如下所示:
式中,为异常检测损失函数,/>为异常检测损失值,/>为优化数据集的数据项数量,/>为优化数据集中的第/>个数据项,/>为模型训练结果的数据集合中的第/>个数据项,/>为正则化参数,/>为训练模型的参数,/>为异常检测损失函数的修正系数;
本发明构建了一个异常检测损失函数,用于计算异常检测训练模型的损失值,在通过异常检测模型对异常检测数据进行训练时,为了帮助模型尽可能地拟合数据,通过使用异常检测损失函数作为模型参数优化的指标,来评估训练模型的准确性,该函数公式充分考虑了优化数据集的数据项数量,异常检测损失值/>,通过优化数据集中的第/>个数据项和模型训练结果的数据集合中的第/>个数据项/>形成了关联关系/>,使用正则化参数/>对训练模型的参数/>进行参数调优,根据异常检测损失函数/>与各参数之间的相互作用构成了一种函数关系/>,该函数公式实现了利用异常检测损失函数对异常检测模型损失值的计算,同时通过异常检测损失函数的修正系数/>的引入,可以针对在模型训练时出现的特殊情况进行调整,进一步提高异常检测损失函数的适用性和稳定性,从而提高异常检测训练模型的泛化能力和鲁棒性。
步骤S34:将检测数据集输入至经过参数优化后的检测模型进行模型检测,得到最优异常检测模型;将异常检测规则数据重新输入到最优异常检测模型中进行异常分析检测,以得到异常数据。
本发明通过对异常检测规则数据进行预处理和转换,可以更方便地对数据进行分类、分析和诊断,划分异常检测数据集能够使异常检测模型训练过程更为精确,使得正常数据和异常数据被充分利用,在检测时更为准确。支持向量机是一种高效、精确的机器学***。基于支持向量机构建的异常检测模型具有高效性和稳定性,检测能力强,这使得银行可以更加快速地处理异常问题。在训练模型时,使模型更好地拟合训练数据集,同时通过异常检测损失函数优化模型参数,最终生成精确的检测模型。通过异常检测损失函数调优模型参数,有助于提高模型的泛化能力,使得模型在未知数据集中也能够准确地检测异常数据。通过使用最优异常检测模型进行检测,可以更准确地捕获异常数据,检测异常数据时,异常检测模型能够帮助银行发现潜在的风险问题,及时处理问题,减小风险损失,通过使用异常检测模型检测异常数据,能够更快地处理业务管理问题,提高工作效率和产出,能够提高异常数据检测和风险控制的准确性和效率,为银行业务管理和决策提供了有益的支持和帮助。
优选地,步骤S4包括以下步骤:
步骤S41:对异常数据进行数据预处理并提取相关特征,得到异常数据特征;
步骤S42:构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行模型训练,得到异常点数据特征;通过交叉验证方法进行验证和优化模型,以生成最优根因分类模型;
步骤S43:将异常点数据特征输入至最优根因分类模型中进行根因分析,通过使用特征重要性分析函数对异常点数据特征进行权重计算,得到异常点特征权值;
其中,特征重要性分析函数的公式如下所示:
;
式中,为决策树中第/>个节点,/>为决策树中第/>个节点的异常点特征权值,/>为决策树的数量,/>为第/>棵树的非叶子节点数量,/>为第/>棵树的第/>个非叶子节点的划分异常点特征,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点,/>为第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和,/>为第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和,/>为/>的调和平滑参数,/>为异常点特征权值的修正系数;
本发明构建了一个特征重要性分析函数的公式,用于提高根因诊断的准确性,通过使用特征重要性分析函数计算和评估每个异常点数据特征的权重,特征重要性分析函数使用决策树算法来对异常点数据特征进行分类和回归,然后根据这些权重对其进行排序和筛选,确定最重要的特征,以便用于后续的根因分析,从而提高根因诊断的准确性,该公式充分考虑了决策树中第个节点/>,决策树的数量/>,第/>棵树的非叶子节点数量/>,第/>棵树的第/>个非叶子节点的划分异常点特征/>,指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点的指示函数/>,指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点的指示函数/>,第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和/>,第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和/>,第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和/>,第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和/>,第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和/>,第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和/>,为了不让第/>棵树的第/>个非叶子节点的左、右节点上的二阶导数之和出现偏差,通过引入调和平滑参数对其进行调整,其中第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和/>的调和平滑参数为/>,第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和/>的调和平滑参数为/>,第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和的调和平滑参数为/>,根据决策树中第/>个节点的异常点特征权值/>与各参数之间的相互作用构成了一种函数关系,该函数公实现了利用特征重要性分析函数对异常点特征权值的计算,同时,通过异常点特征权值的修正系数/>的引入,可以在使用特征重要性分析函数对异常点数据特征权重计算的过程中所出现的特殊情况进行调整,进一步提高特征重要性分析函数的适用性和稳定性,从而提高根因诊断的准确性。
步骤S44:按照从大到小的顺序对异常点特征权值进行排序,得到异常根因数据。
本发明通过预处理异常数据并提取相关特征有助于减少数据的噪声和冗余,从而降低计算复杂度,提高计算效率,通过将异常数据特征提取出来,可以更加清晰地描述异常数据的属性和特点,提高数据的可解释性。基于决策树构建的根因分类模型具有高精度和稳定性,能够更准确地分类异常数据的根因,利用交叉验证方法进行模型验证和优化,有助于提高模型的泛化能力,使得模型在未知数据上的表现也能够更好。通过使用最优根因分类模型进行根因分析,可以准确地确定异常数据的根因,从而更好地解决异常问题,使用特征重要性分析函数能够计算每个异常点特征在根因分类中的重要性,使得根因分析结果更为准确和可信。通过对异常点特征权值进行排序,可以识别出异常数据的主要根因,从而更好地解决异常问题,对识别出的主要异常根因进行针对性处理,能够更加有效地解决异常问题,同时提高业务效率和减少风险损失。综上所述,构建了一套完善的异常根因分析流程,通过对异常数据的处理、模型构建、根因分析和异常根因确定等步骤,能够提高异常问题的解决效率和准确性,为业务管理和决策提供了有益的指导和支持。
优选地,步骤S41包括以下步骤:
步骤S411:通过对异常数据进行数据预处理,得到异常数据集;
步骤S412:对异常数据集进行特征提取,得到异常数据特征数据集;构建异常数据特征数据库,并将异常数据特征数据集保存至异常数据特征数据库;
步骤S413:获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,得到异常数据特征。
本发明通过对异常数据进行数据预处理,数据预处理有助于清洗、减少数据噪声、筛选出异常数据,从而得到清洗后的异常数据集,为后续的异常检测提供准确数据基础,提高检测精度。然后,通过对异常数据集进行特征提取,可以将异常数据映射到特征空间中,将高维度的特征数据进行降维,提炼出关键特征,为后续的异常检测提供依据和基础,降低异常检测所需时间和计算成本。构建异常数据特征数据库并将异常数据特征数据集保存至其中,有助于管理、维护和保障异常数据特征的完整性、可用性和保密性。获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,可以将异常数据特征进行分析、挖掘,发现潜在的异常数据特征规律和趋势,为银行的业务决策和管理提供参考依据,同时也为根因分类模型的优化提供有价值的数据支撑。
优选地,步骤S5包括以下步骤:
步骤S51:对异常根因数据进行预处理和清洗,得到标准根因数据;
步骤S52:利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,得到初始业务异常血缘图谱;
步骤S53:利用预设的置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,得到异常源数据。
本发明通过异常根因数据预处理有助于清洗数据、快速筛选出标准根因数据,为后续的异常根因分析提供准确的数据基础,并且提高分析精度。利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,可以帮助银行分析业务数据之间的联系与关联,建立异常数据的影响力和传播力图谱,从而快速定位和分析并行异常点,同时为异常根因定位提供有效的信息支持。通过利用置信度传播分析技术,可以通过迭代的方式不断调整节点置信度,最终得到异常源节点的置信度值,从而快速定位异常源并优化异常检测精度。同时通过置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,可以快速定位异常源、提高异常检测的准确性、优化业务流程和流程改造,为银行业务管理和决策提供重要的支持和帮助,从而获取准确的异常源数据。
优选地,步骤S53包括以下步骤:
步骤S530:构建置信度传播分析技术,其中置信度传播分析技术包括置信度分析技术、置信度传播技术和置信度追踪技术;
步骤S531:通过置信度分析技术求解初始业务异常血缘图谱,得到初始节点置信度;
步骤S532:对初始节点置信度进行置信度传播,根据各节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,得到终极置信度;
步骤S533:对终极置信度进行排序处理,使用置信度追踪技术查找终极置信度较高节点的前驱节点,得到异常源数据。
本发明通过构建置信度传播分析技术,可以对业务异常根因进行分析和定位,为银行提供有益的分析工具和方法,进一步优化银行的业务管理和决策。通过置信度传播分析技术中的置信度分析技术求解初始业务异常血缘图谱,可以得到初始节点的置信度,为后续置信度传播提供依据和基础,同时可为银行提供业务异常根源分析的参考信息。对初始节点置信度进行置信度传播,可以根据节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,最终得到终极置信度,从而实现对异常根因的精准定位,为银行提供精准异常分析和处理的基础。通过节点间的置信度传播,可以逐步筛选出候选异常根因,加快定位异常根因的速度和准确性,节点间置信度传播技术可以避免数据信息的漏洞,从而有效避免异常根因的遗漏和误判现象,提高了异常检测的准确率。另外,对初始节点置信度进行置信度传播,可以提高异常检测的准确性和速度,加快精准定位异常根因的速度和准确性,增强业务决策的科学性,并优化业务流程,为银行提供有益的支持和帮助。通过排序和置信度追踪技术,可以快速找到终极置信度较高的异常节点,并查找其前驱节点,从而更加准确地定位业务异常源数据,帮助银行更好地解决业务问题和提升服务水平。置信度追踪技术能够有效地查找前驱节点并获取其信息,有助于银行及时接受并处理海量异常数据,在时间上具备了优势,对银行的日常业务运营和风险管理具有重要的实用价值。
优选地,步骤S6包括以下步骤:
步骤S61:对异常源数据进行数据分析,构建不同类型的业务异常血缘图谱;
步骤S62:根据异常情况对不同类型的业务异常血缘图谱进行详细分析,了解银行业务异常之间的属性和类型,得到异常根因诊断方案;
步骤S63:银行工作人员通过查看和分析异常根因诊断方案,执行相应的异常根因诊断进程。
本发明通过对异常源数据进行数据分析,根据不同类型的异常,构建相应的业务异常血缘图谱,为分析和诊断异常提供有益的工具和数据支持。根据异常情况对不同类型的业务异常血缘图谱进行详细分析,可以更深入地了解异常性质和类型,定位异常根因的精确性和速度更高,从多维度分析问题,统计异常数据以帮助风险控制。这些有益效果可以大大提高银行业务的管理水平和客户的商业体验,能够深入了解银行业务异常的各种类型和属性,为提出相应的异常根因诊断方案提供有益的信息和指导。银行工作人员通过查看和分析异常根因诊断方案,能够快速定位业务异常源,并进行相应的处理,从而提高银行业务效率和客户满意度、信任感,避免类似异常事件再次发生,同时也有益于团队协作效率的提升。
优选地,在本说明书中,还提供了一种银行业务异常根因诊断***,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上任一项所述的银行业务异常根因诊断方法。
综上所述,本发明提供了一种银行业务异常根因诊断***,该***能够实现本发明所述任意一种银行业务异常根因诊断方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种银行业务异常根因诊断方法,***内部结构互相协作,银行业务异常根因诊断***基于业务异常血缘图谱技术,采用高级算法和模型来分析银行数据节点的关系和连接方式,实现异常数据源的快速定位和识别。***的核心技术包括异常血缘图谱构建、异常源数据定位、异常源数据影响分析以及异常根因诊断等。***结合了人工智能、机器学习和知识图谱等先进技术,可以实时监测银行业务***的异常数据情况,分析异常数据之间的关系和组织结构,以及异常数据与其他业务流程的影响关系,从而帮助银行***的运维人员快速定位和解决异常情况。这种技术可以提高银行业务流程的稳定性和可靠性,为客户提供更高质量的金融服务。
附图说明
通过阅读参照以下附图所作的对非限制性实施所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一种银行业务异常根因诊断方法的步骤流程示意图;
图2为图1中步骤S2的详细实施步骤流程示意图;
图3为图1中步骤S3的详细实施步骤流程示意图;
图4为图1中步骤S4的详细实施步骤流程示意图;
图5为图4中步骤S41的详细实施步骤流程示意图;
图6为图1中步骤S5的详细实施步骤流程示意图;
图7为图6中步骤S53的详细实施步骤流程示意图;
图8为图1中步骤S6的详细实施步骤流程示意图。
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
为实现上述目的,请参阅图1至图8,本发明提供了一种银行业务异常根因诊断方法,所述方法包括以下步骤:
步骤S1:对银行业务***进行数据采集和数据预处理,得到银行业务异常数据;
步骤S2:利用关联规则挖掘技术对银行业务异常数据进行离线计算,得到异常检测规则数据;
步骤S3:通过预设的异常检测模型对异常检测规则数据进行异常检测,以得到异常数据;
步骤S4:对异常数据进行特征提取,得到异常数据特征;构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行根因分析,得到异常根因数据;
步骤S5:利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,得到异常源数据;
步骤S6:根据异常源数据构建业务异常血缘图谱,通过业务异常血缘图谱进一步了解银行业务异常之间的关系,以执行相应的异常根因诊断进程。
本发明实施例中,参考图1所示,为本发明一种银行业务异常根因诊断方法的步骤流程示意图,在本实例中,所述银行业务异常根因诊断方法的步骤包括:
步骤S1:对银行业务***进行数据采集和数据预处理,得到银行业务异常数据;
本发明实施例通过对银行业务***进行数据采集和数据预处理,银行业务***的数据采集通常会包括实时采集和离线采集两种方式。实时采集可以通过监控***,对交易数据、日志数据等进行实时监控并采集,离线采集可以通过备份、数据传输等方式进行。然后,对采集后的数据进行数据去重、清洗和缺失值填补等操作,最终得到银行业务异常数据。
步骤S2:利用关联规则挖掘技术对银行业务异常数据进行离线计算,得到异常检测规则数据;
本发明实施例通过使用关联规则挖掘技术对银行业务异常数据中的不同业务流程异常检测规则以及异常检测阈值等信息进行离线计算,最终得到异常检测规则数据。
步骤S3:通过预设的异常检测模型对异常检测规则数据进行异常检测,以得到异常数据;
本发明实施例通过利用预先构建的基于支持向量机的异常检测模型对异常检测规则数据进行异常检测,其中对异常检测规则数据划分为训练数据集、优化数据集和检测数据集对异常检测模型进行模型训练、参数优化以及模型验证,通过异常检测模型识别出异常数据,最终得到异常数据。
步骤S4:对异常数据进行特征提取,得到异常数据特征;构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行根因分析,得到异常根因数据;
本发明实施例通过对异常数据进行特征提取,以获得异常数据的关键特征,然后,通过构建一个基于决策树的根因分类模型,将提取的异常数据特征输入至根因分类模型中进行根因分析,最终得到异常根因数据。
步骤S5:利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,得到异常源数据;
本发明实施例通过置信度传播分析和血缘分析技术相结合,对异常根因数据进行异常定位,确定异常根因数据的来源和相关因素,最终得到异常源数据。
步骤S6:根据异常源数据构建业务异常血缘图谱,通过业务异常血缘图谱进一步了解银行业务异常之间的关系,以执行相应的异常根因诊断进程。
本发明实施例通过异常源数据和异常字段构建业务异常血缘图谱,该业务异常血缘图谱是一个表示数据来源和数据流向的拓扑关系图,它可以帮助理解异常源数据之间的关系,通过业务异常血缘图谱,对异常源数据的来源、流向、变化进行分析确定异常根因,根据异常根因,选择解决方案并执行,例如修复可能存在的故障、修改异常配置和参数等,最终得到异常根因诊断方案,银行工作人员通过查看和分析异常根因诊断方案,能够快速定位业务异常源,并进行相应的异常根因诊断处理。
本发明通过数据采集,有助于准确地捕获银行业务***中的异常数据,从而为异常根因分析提供基础数据,并通过对数据进行清洗、归一化等预处理操作,可以提高数据的质量和准确性,从而为后续分析和处理提供更加可靠的数据基础。通过关联规则挖掘技术,能够有效地发现银行业务***中的异常规律和模式,从而能够更加准确地检测银行业务异常数据。并且通过将异常检测规则数据离线计算,能够减少在线检测的运算量,提高异常检测效率。通过利用预设的异常检测模型,能够较为准确地检测出异常数据,从而为后续的异常根因分析提供必要的数据基础。通过对异常数据的特征提取和基于决策树的根因分类模型的构建,能够较为准确地识别出银行业务异常的根因,为后续的异常定位和解决提供支持。另外,通过对异常数据进行特征提取,可以得到更加清晰、简洁和易于理解的数据特征,从而提高数据的可解释性和应用价值。通过利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,能够提高异常定位的准确性和精度。然后,通过异常定位,能够快速准确地定位异常源数据,进一步缩小了异常根因的范围,为后续的异常根因诊断提供必要的数据依据。通过构建业务异常血缘图谱,可以深度挖掘银行业务异常之间的关联关系,发现异常数据的隐藏关联关系,从而为异常根因分析提供更加丰富的数据依据。最后,通过利用业务异常血缘图谱,能够快速识别银行业务异常之间的关系和联系,提高异常根因的诊断效率和精度,缩短异常修复时间,降低银行业务风险损失,从而帮助银行业务***的运维人员快速定位和解决异常情况。
优选地,步骤S1包括以下步骤:
通过对银行业务***进行数据采集,得到银行业务数据;
本发明实施例通过实时采集和离线采集在银行业务***中采集交易数据、客户数据和账号数据等,并对数据进行相应的脱敏和加密处理,最终得到银行业务数据。
优选地,对银行业务数据进行数据预处理,以得到银行业务异常数据。
本发明实施例通过对采集来的原始银行业务数据进行去除重复值、缺失值填补、数据类型转换等预处理操作,从银行业务数据中检测出业务异常数据,最终得到银行业务异常数据。
本发明通过采集和处理银行业务数据,可以自动发现银行业务***中的异常数据,这将使得银行业务运营人员能够及时识别出***故障和业务异常波动,从而更快地采取必要的措施减少损失。数据采集和预处理步骤可以提供有关银行业务***绩效的有用信息。根据这些信息,银行业务运营人员可以做出更好的决策,从而优化***绩效,并提高业务效率和结果,同时也可以减少人为错误和错误报告。
优选地,步骤S2包括以下步骤:
步骤S21:通过对银行业务异常数据进行数据转化,得到业务异常规则数据;
步骤S22:利用基于Apriori算法的频繁项集挖掘获取业务异常规则数据中关联规则,得到业务异常频繁项集;
步骤S23:根据关联规则算法计算业务异常频繁项集的置信度,获取置信度的关联规则,得到规则置信度;
其中,关联规则算法公式如下所示:
式中,为规则置信度,/>为指数函数,/>为业务异常频繁项集中的集合数量,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率,/>为规则置信度的修正系数;
步骤S24:按照从大到小的顺序将规则置信度对应的业务异常频繁项集进行排序,选择规则置信度较高的业务异常频繁项集,以得到异常检测规则数据。
作为本发明的一个实施例,参考图2所示,为图1中步骤S2的详细步骤流程示意图,在本实施例中步骤S2包括以下步骤:
步骤S21:通过对银行业务异常数据进行数据转化,得到业务异常规则数据;
本发明实施例根据银行业务的特点和需求定义业务异常规则,对通过采集和预处理后的银行业务异常数据进行业务异常规则转化,最终得到业务异常规则数据。
步骤S22:利用基于Apriori算法的频繁项集挖掘获取业务异常规则数据中关联规则,得到业务异常频繁项集;
本发明实施例通过利用基于Apriori算法的频繁项集挖掘获取业务异常规则数据中关联规则,基于Apriori算法确定满足最小支持度和最小置信度阈值的关联规则,对于挖掘出来的关联规则,对其进行评估和优化,调整置信度阈值或者删减无效规则,最终得到业务异常频繁项集。
步骤S23:根据关联规则算法计算业务异常频繁项集的置信度,获取置信度的关联规则,得到规则置信度;
本发明实施例通过利用关联规则算法对挖掘出来的业务异常频繁项集进行计算,得到业务异常频繁项集的置信度,根据前面设定的置信度阈值,剪枝不满足要求的置信度规则,获取符合要求的置信度集合,最终得到规则置信度。
其中,关联规则算法公式如下所示:
式中,为规则置信度,/>为指数函数,/>为业务异常频繁项集中的集合数量,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率,/>为规则置信度的修正系数;
本发明构建了一个关联规则算法的公式,为了得到准确的规则置信度,通过使用关联规则算法公式,能够帮助业务运营人员快速定位业务的异常情况,帮助他们更好地处理问题,并提高银行业务运营的效率,利用关联规则算法计算业务异常频繁项集的置信度和获取规则置信度,可以提高银行业务异常检测的效率和准确性,该公式充分考虑了业务异常频繁项集中的集合数量,业务异常频繁项集中的第/>个频繁项集/>,业务异常频繁项集中的第/>个频繁项集/>,业务异常频繁项集中的第/>个频繁项集出现的概率/>,业务异常频繁项集中的第/>个频繁项集出现的概率/>,业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率/>,其中为了防止得到的规则置信度出现偏差,还需要对其进行归一化处理,根据规则置信度/>与各参数之间的相互联系构成了一种函数关系/>,实现了通过关联规则算法计算业务异常频繁项集的置信度,以得到规则置信度,同时,该公式中规则置信度的修正系数可以根据实际情况进行调整,从而提高关联规则算法的准确性和适用性。
步骤S24:按照从大到小的顺序将规则置信度对应的业务异常频繁项集进行排序,选择规则置信度较高的业务异常频繁项集,以得到异常检测规则数据。
本发明实施例通过对业务异常频繁项集按照规则置信度从大到小进行排序,根据排序后的结果,选择规则置信度较高的业务异常频繁项集,根据选择的业务异常频繁项集,建立对应的业务异常规则,最终得到异常检测规则数据。
本发明通过对银行业务异常数据的转化和基于Apriori算法的频繁项集挖掘,可以帮助银行快速有效地发现业务异常频繁项集。然后通过计算业务异常频繁项集的置信度,可以筛选出有意义的业务异常规则数据,并根据置信度高低选择相应的业务异常频繁项集,进一步提高业务异常检测的准确性。通过从业务异常数据中派生关联规则、挖掘频繁项集,并计算置信度确定关联规则的有效性,可以有效防范银行的业务风险。置信度高的关联规则,说明相关的业务异常规则数据之间具有较强的关联性,是实际规律的反映。通过选择置信度较高的关联规则,可以进一步提高业务异常检测的准确性。根据关联规则算法计算业务异常频繁项集的置信度,可以得到规则置信度,帮助银行更好地了解业务异常情况,提高业务运营质量,减少业务风险,为银行的业务发展提供有力的支撑。按照规则置信度由高到低的顺序,选择规则置信度较高的业务异常频繁项集进行异常检测,可以提高检测的准确性,降低误报率,优化业务决策,从而对银行的业务管理和决策提供有益的支持。
优选地,步骤S3包括以下步骤:
步骤S31:对异常检测规则数据进行数据预处理和数据转换,得到异常检测数据;将异常检测数据划分为训练数据集、优化数据集和检测数据集;
步骤S32:构建基于支持向量机的异常检测模型,其中异常检测模型包括训练模型、模型优化和检测模型;
步骤S33:将训练数据集输入至基于支持向量机的训练模型进行模型训练,并通过如下的异常检测损失函数将优化数据集输入至训练模型进行参数调优,以生成检测模型;
其中,异常检测损失函数的公式如下所示:
式中,为异常检测损失函数,/>为异常检测损失值,/>为优化数据集的数据项数量,/>为优化数据集中的第/>个数据项,/>为模型训练结果的数据集合中的第/>个数据项,/>为正则化参数,/>为训练模型的参数,/>为异常检测损失函数的修正系数;
步骤S34:将检测数据集输入至经过参数优化后的检测模型进行模型检测,得到最优异常检测模型;将异常检测规则数据重新输入到最优异常检测模型中进行异常分析检测,以得到异常数据。
作为本发明的一个实施例,参考图3所示,为图1中步骤S3的详细步骤流程示意图,在本实施例中步骤S3包括以下步骤:
步骤S31:对异常检测规则数据进行数据预处理和数据转换,得到异常检测数据;将异常检测数据划分为训练数据集、优化数据集和检测数据集;
本发明实施例通过对异常检测规则数据进行清洗、去重和填充等处理,确保数据的准确性和一致性,将清洗后的数据转换为适合进行模型训练和异常检测的数据格式,最终得到异常检测数据,将预处理和转换后的异常检测数据按7:2:1的比例划分为三个不同的数据集,用于训练、优化和检测,其中训练数据集用于训练异常检测模型,占异常检测数据的70%;优化数据集用于优化异常检测模型的参数,在训练阶段使用,占异常检测数据的20%;检测数据集用于测试和验证已训练好的异常检测模型,占异常检测数据的10%。
步骤S32:构建基于支持向量机的异常检测模型,其中异常检测模型包括训练模型、模型优化和检测模型;
本发明实施例通过构建基于支持向量机的异常检测模型,构建的异常检测模型包括训练模型、模型优化和检测模型,其中训练模型通过使用训练数据集训练异常检测模型,并对模型进行评估;模型优化则是通过使用优化数据集对训练好的异常检测模型进行参数调优,得到检测模型;而检测模型则是通过使用检测数据集对异常检测模型进行测试和验证,发现潜在的异常和风险。
步骤S33:将训练数据集输入至基于支持向量机的训练模型进行模型训练,并通过如下的异常检测损失函数将优化数据集输入至训练模型进行参数调优,以生成检测模型;
本发明实施例通过将划分好的训练数据集来训练基于支持向量机的异常检测模型,并通过选择的异常检测损失函数来拟合异常检测模型优化模型参数,将优化数据集通过异常检测损失函数输入至训练模型中迭代计算梯度下降,来优化模型参数得到最优的超参数,最终生成检测模型。
其中,异常检测损失函数的公式如下所示:
式中,为异常检测损失函数,/>为异常检测损失值,/>为优化数据集的数据项数量,/>为优化数据集中的第/>个数据项,/>为模型训练结果的数据集合中的第/>个数据项,/>为正则化参数,/>为训练模型的参数,/>为异常检测损失函数的修正系数;
本发明构建了一个异常检测损失函数,用于计算异常检测训练模型的损失值,在通过异常检测模型对异常检测数据进行训练时,为了帮助模型尽可能地拟合数据,通过使用异常检测损失函数作为模型参数优化的指标,来评估训练模型的准确性,该函数公式充分考虑了优化数据集的数据项数量,异常检测损失值/>,通过优化数据集中的第/>个数据项和模型训练结果的数据集合中的第/>个数据项/>形成了关联关系/>,使用正则化参数/>对训练模型的参数/>进行参数调优,根据异常检测损失函数/>与各参数之间的相互作用构成了一种函数关系/>,该函数公式实现了利用异常检测损失函数对异常检测模型损失值的计算,同时通过异常检测损失函数的修正系数/>的引入,可以针对在模型训练时出现的特殊情况进行调整,进一步提高异常检测损失函数的适用性和稳定性,从而提高异常检测训练模型的泛化能力和鲁棒性。
步骤S34:将检测数据集输入至经过参数优化后的检测模型进行模型检测,得到最优异常检测模型;将异常检测规则数据重新输入到最优异常检测模型中进行异常分析检测,以得到异常数据。
本发明实施例通过使用检测数据集来验证已经训练好的检测模型的性能和准确度,最终得到最优异常检测模型,并将最优异常检测模型应用于异常检测规则数据中,通过模型检测异常数据来识别潜在的风险和异常情况,最终得到异常数据。
本发明通过对异常检测规则数据进行预处理和转换,可以更方便地对数据进行分类、分析和诊断,划分异常检测数据集能够使异常检测模型训练过程更为精确,使得正常数据和异常数据被充分利用,在检测时更为准确。支持向量机是一种高效、精确的机器学***。基于支持向量机构建的异常检测模型具有高效性和稳定性,检测能力强,这使得银行可以更加快速地处理异常问题。在训练模型时,使模型更好地拟合训练数据集,同时通过异常检测损失函数优化模型参数,最终生成精确的检测模型。通过异常检测损失函数调优模型参数,有助于提高模型的泛化能力,使得模型在未知数据集中也能够准确地检测异常数据。通过使用最优异常检测模型进行检测,可以更准确地捕获异常数据,检测异常数据时,异常检测模型能够帮助银行发现潜在的风险问题,及时处理问题,减小风险损失,通过使用异常检测模型检测异常数据,能够更快地处理业务管理问题,提高工作效率和产出,能够提高异常数据检测和风险控制的准确性和效率,为银行业务管理和决策提供了有益的支持和帮助。
优选地,步骤S4包括以下步骤:
步骤S41:对异常数据进行数据预处理并提取相关特征,得到异常数据特征;
步骤S42:构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行模型训练,得到异常点数据特征;通过交叉验证方法进行验证和优化模型,以生成最优根因分类模型;
步骤S43:将异常点数据特征输入至最优根因分类模型中进行根因分析,通过使用特征重要性分析函数对异常点数据特征进行权重计算,得到异常点特征权值;
其中,特征重要性分析函数的公式如下所示:
;
式中,为决策树中第/>个节点,/>为决策树中第/>个节点的异常点特征权值,/>为决策树的数量,/>为第/>棵树的非叶子节点数量,/>为第/>棵树的第/>个非叶子节点的划分异常点特征,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点,/>为第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和,/>为第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和,/>为/>的调和平滑参数,/>为异常点特征权值的修正系数;
步骤S44:按照从大到小的顺序对异常点特征权值进行排序,得到异常根因数据。
作为本发明的一个实施例,参考图4所示,为图1中步骤S4的详细步骤流程示意图,在本实施例中步骤S4包括以下步骤:
步骤S41:对异常数据进行数据预处理并提取相关特征,得到异常数据特征;
本发明实施例通过对得到的异常数据进行清洗、去重、填补缺失值等处理,随后,通过特征提取算法从预处理后的异常数据中提取相关特征,最终得到异常数据特征。
步骤S42:构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行模型训练,得到异常点数据特征;通过交叉验证方法进行验证和优化模型,以生成最优根因分类模型;
本发明实施例通过使用基于决策树的分类算法来构建根因分类模型,将异常数据特征送入根因分类模型中进行训练,将异常信息相似的异常数据特征划分为同一类,得到相应的异常点数据特征,并通过交叉验证方法来优化根因分类模型,在交叉验证的过程中,使用网格搜索和随机搜索等方式来寻找最优的超参数组合,最终生成最优根因分类模型。
步骤S43:将异常点数据特征输入至最优根因分类模型中进行根因分析,通过使用特征重要性分析函数对异常点数据特征进行权重计算,得到异常点特征权值;
本发明实施例通过使用最优根因分类模型对异常点数据特征进行根因分析,识别引起异常的具体特征,然后使用特征重要性分析函数计算每个特征在模型中的重要性,该特征重要性用于度量特征对异常数据的影响程度,以帮助识别根因,最终得到异常点特征权值。
其中,特征重要性分析函数的公式如下所示:
;
式中,为决策树中第/>个节点,/>为决策树中第/>个节点的异常点特征权值,/>为决策树的数量,/>为第/>棵树的非叶子节点数量,/>为第/>棵树的第/>个非叶子节点的划分异常点特征,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点,/>为第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和,/>为第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和,/>为/>的调和平滑参数,/>为异常点特征权值的修正系数;
本发明构建了一个特征重要性分析函数的公式,用于提高根因诊断的准确性,通过使用特征重要性分析函数计算和评估每个异常点数据特征的权重,特征重要性分析函数使用决策树算法来对异常点数据特征进行分类和回归,然后根据这些权重对其进行排序和筛选,确定最重要的特征,以便用于后续的根因分析,从而提高根因诊断的准确性,该公式充分考虑了决策树中第个节点/>,决策树的数量/>,第/>棵树的非叶子节点数量/>,第/>棵树的第/>个非叶子节点的划分异常点特征/>,指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点的指示函数/>,指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点的指示函数/>,第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和/>,第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和/>,第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和/>,第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和/>,第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和/>,第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和/>,为了不让第/>棵树的第/>个非叶子节点的左、右节点上的二阶导数之和出现偏差,通过引入调和平滑参数对其进行调整,其中第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和/>的调和平滑参数为/>,第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和/>的调和平滑参数为/>,第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和的调和平滑参数为/>,根据决策树中第/>个节点的异常点特征权值/>与各参数之间的相互作用构成了一种函数关系/>,该函数公实现了利用特征重要性分析函数对异常点特征权值的计算,同时,通过异常点特征权值的修正系数/>的引入,可以在使用特征重要性分析函数对异常点数据特征权重计算的过程中所出现的特殊情况进行调整,进一步提高特征重要性分析函数的适用性和稳定性,从而提高根因诊断的准确性。
步骤S44:按照从大到小的顺序对异常点特征权值进行排序,得到异常根因数据。
本发明实施例通过对异常点特征权值进行排序,按照从大到小的顺序排列异常点数据特征权重,确定引起异常的最重要的特征,并将其作为异常根因的依据,最终得到异常根因数据。
本发明通过预处理异常数据并提取相关特征有助于减少数据的噪声和冗余,从而降低计算复杂度,提高计算效率,通过将异常数据特征提取出来,可以更加清晰地描述异常数据的属性和特点,提高数据的可解释性。基于决策树构建的根因分类模型具有高精度和稳定性,能够更准确地分类异常数据的根因,利用交叉验证方法进行模型验证和优化,有助于提高模型的泛化能力,使得模型在未知数据上的表现也能够更好。通过使用最优根因分类模型进行根因分析,可以准确地确定异常数据的根因,从而更好地解决异常问题,使用特征重要性分析函数能够计算每个异常点特征在根因分类中的重要性,使得根因分析结果更为准确和可信。通过对异常点特征权值进行排序,可以识别出异常数据的主要根因,从而更好地解决异常问题,对识别出的主要异常根因进行针对性处理,能够更加有效地解决异常问题,同时提高业务效率和减少风险损失。综上所述,构建了一套完善的异常根因分析流程,通过对异常数据的处理、模型构建、根因分析和异常根因确定等步骤,能够提高异常问题的解决效率和准确性,为业务管理和决策提供了有益的指导和支持。
优选地,步骤S41包括以下步骤:
步骤S411:通过对异常数据进行数据预处理,得到异常数据集;
步骤S412:对异常数据集进行特征提取,得到异常数据特征数据集;构建异常数据特征数据库,并将异常数据特征数据集保存至异常数据特征数据库;
步骤S413:获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,得到异常数据特征。
作为本发明的一个实施例,参考图5所示,为图4中步骤S41的详细步骤流程示意图,在本实施例中步骤S41包括以下步骤:
步骤S411:通过对异常数据进行数据预处理,得到异常数据集;
本发明实施例通过对异常数据进行数据清洗、去重、填补缺失值等处理,并对异常数据进行标准化和归一化等操作后,最终得到异常数据集。
步骤S412:对异常数据集进行特征提取,得到异常数据特征数据集;构建异常数据特征数据库,并将异常数据特征数据集保存至异常数据特征数据库;
本发明实施例通过使用特征提取算法从异常数据集中提取有关信息,根据提取到的特征数据,构建异常数据特征数据库,并将提取到的异常数据特征数据集保存至该异常数据特征数据库中。
步骤S413:获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,得到异常数据特征。
本发明实施例通过运用查询和访问语句获取异常数据特征数据库中异常数据特征数据集的特征数据包,对这些特征数据包进行分析,提取最有价值的特征数据,作为对异常数据进行根因分析的依据,最终得到异常数据特征。
本发明通过对异常数据进行数据预处理,数据预处理有助于清洗、减少数据噪声、筛选出异常数据,从而得到清洗后的异常数据集,为后续的异常检测提供准确数据基础,提高检测精度。然后,通过对异常数据集进行特征提取,可以将异常数据映射到特征空间中,将高维度的特征数据进行降维,提炼出关键特征,为后续的异常检测提供依据和基础,降低异常检测所需时间和计算成本。构建异常数据特征数据库并将异常数据特征数据集保存至其中,有助于管理、维护和保障异常数据特征的完整性、可用性和保密性。获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,可以将异常数据特征进行分析、挖掘,发现潜在的异常数据特征规律和趋势,为银行的业务决策和管理提供参考依据,同时也为根因分类模型的优化提供有价值的数据支撑。
优选地,步骤S5包括以下步骤:
步骤S51:对异常根因数据进行预处理和清洗,得到标准根因数据;
步骤S52:利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,得到初始业务异常血缘图谱;
步骤S53:利用预设的置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,得到异常源数据。
作为本发明的一个实施例,参考图6所示,为图1中步骤S5的详细步骤流程示意图,在本实施例中步骤S5包括以下步骤:
步骤S51:对异常根因数据进行预处理和清洗,得到标准根因数据;
本发明实施例通过对异常根因数据进行去除重复数据、填充缺失值、异常数据处理等措施,将异常根因数据变成标准化数据,最终得到标准根因数据。
步骤S52:利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,得到初始业务异常血缘图谱;
本发明实施例通过使用血缘分析技术对标准根因数据中的异常根因点进行分析,从而构建异常根因点的血缘关系图谱,最终得到初始业务异常血缘图谱。
步骤S53:利用预设的置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,得到异常源数据。
本发明实施例通过利用预设的置信度传播分析技术对异常根因点进行异常优化定位,确定最可能的异常源数据,通过分析初始业务异常血缘图谱中的异常根因点之间的相互影响关系、置信度传播的距离和方向,并采取相应的措施进行异常根因点修正,最终得到异常源数据。
本发明通过异常根因数据预处理有助于清洗数据、快速筛选出标准根因数据,为后续的异常根因分析提供准确的数据基础,并且提高分析精度。利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,可以帮助银行分析业务数据之间的联系与关联,建立异常数据的影响力和传播力图谱,从而快速定位和分析并行异常点,同时为异常根因定位提供有效的信息支持。通过利用置信度传播分析技术,可以通过迭代的方式不断调整节点置信度,最终得到异常源节点的置信度值,从而快速定位异常源并优化异常检测精度。同时通过置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,可以快速定位异常源、提高异常检测的准确性、优化业务流程和流程改造,为银行业务管理和决策提供重要的支持和帮助,从而获取准确的异常源数据。
优选地,步骤S53包括以下步骤:
步骤S530:构建置信度传播分析技术,其中置信度传播分析技术包括置信度分析技术、置信度传播技术和置信度追踪技术;
步骤S531:通过置信度分析技术求解初始业务异常血缘图谱,得到初始节点置信度;
步骤S532:对初始节点置信度进行置信度传播,根据各节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,得到终极置信度;
步骤S533:对终极置信度进行排序处理,使用置信度追踪技术查找终极置信度较高节点的前驱节点,得到异常源数据。
作为本发明的一个实施例,参考图7所示,为图6中步骤S53的详细步骤流程示意图,在本实施例中步骤S53包括以下步骤:
步骤S530:构建置信度传播分析技术,其中置信度传播分析技术包括置信度分析技术、置信度传播技术和置信度追踪技术;
本发明实施例通过构建置信度传播分析技术来确定最可能的异常源数据,置信度传播分析技术是一种基于图论和概率统计的根因分析方法。在该技术中,异常点的置信度表示该异常点为根因节点的概率。其中,置信度分析技术用于计算各异常点的初始置信度;置信度传播技术用于将置信度从前驱节点传递到后继节点,并更新后继节点的置信度;置信度追踪技术则用于查找异常根因节点的前驱节点,确定异常根因节点所对应的数据或过程。
步骤S531:通过置信度分析技术求解初始业务异常血缘图谱,得到初始节点置信度;
本发明实施例通过利用置信度分析技术计算初始业务异常血缘图谱中每个节点的初始置信度,以衡量它们可能成为根因节点的概率,最终得到初始节点置信度。
步骤S532:对初始节点置信度进行置信度传播,根据各节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,得到终极置信度;
本发明实施例通过利用置信度传播技术将置信度从前驱节点传递到后继节点,根据各节点之间的相互依赖关系,并通过概率统计技术更新后继节点的置信度,最终得到终极置信度。
步骤S533:对终极置信度进行排序处理,使用置信度追踪技术查找终极置信度较高节点的前驱节点,得到异常源数据。
本发明实施例根据计算出的终极置信度对异常根因节点进行排序处理,以找出置信度较高的异常根因节点。随后,可以通过置信度追踪技术查找置信度较高的异常根因节点的前驱节点,确定异常根因节点所对应的数据或过程,从而得到异常源数据。
本发明通过构建置信度传播分析技术,可以对业务异常根因进行分析和定位,为银行提供有益的分析工具和方法,进一步优化银行的业务管理和决策。通过置信度传播分析技术中的置信度分析技术求解初始业务异常血缘图谱,可以得到初始节点的置信度,为后续置信度传播提供依据和基础,同时可为银行提供业务异常根源分析的参考信息。对初始节点置信度进行置信度传播,可以根据节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,最终得到终极置信度,从而实现对异常根因的精准定位,为银行提供精准异常分析和处理的基础。通过节点间的置信度传播,可以逐步筛选出候选异常根因,加快定位异常根因的速度和准确性,节点间置信度传播技术可以避免数据信息的漏洞,从而有效避免异常根因的遗漏和误判现象,提高了异常检测的准确率。另外,对初始节点置信度进行置信度传播,可以提高异常检测的准确性和速度,加快精准定位异常根因的速度和准确性,增强业务决策的科学性,并优化业务流程,为银行提供有益的支持和帮助。通过排序和置信度追踪技术,可以快速找到终极置信度较高的异常节点,并查找其前驱节点,从而更加准确地定位业务异常源数据,帮助银行更好地解决业务问题和提升服务水平。置信度追踪技术能够有效地查找前驱节点并获取其信息,有助于银行及时接受并处理海量异常数据,在时间上具备了优势,对银行的日常业务运营和风险管理具有重要的实用价值。
优选地,步骤S6包括以下步骤:
步骤S61:对异常源数据进行数据分析,构建不同类型的业务异常血缘图谱;
步骤S62:根据异常情况对不同类型的业务异常血缘图谱进行详细分析,了解银行业务异常之间的属性和类型,得到异常根因诊断方案;
步骤S63:银行工作人员通过查看和分析异常根因诊断方案,执行相应的异常根因诊断进程。
作为本发明的一个实施例,参考图8所示,为图1中步骤S6的详细步骤流程示意图,在本实施例中步骤S6包括以下步骤:
步骤S61:对异常源数据进行数据分析,构建不同类型的业务异常血缘图谱;
本发明实施例通过对异常源数据进行分析、统计和处理,以构建不同类型的业务异常血缘图谱,从而识别出不同类型的业务异常情况。
步骤S62:根据异常情况对不同类型的业务异常血缘图谱进行详细分析,了解银行业务异常之间的属性和类型,得到异常根因诊断方案;
本发明实施例通过对不同类型的业务异常血缘图谱进行进一步分析,了解银行业务异常之间的属性和类型,并从中识别出异常根因节点,通过分析异常根因节点之间的关系,最终得到异常根因诊断方案。
步骤S63:银行工作人员通过查看和分析异常根因诊断方案,执行相应的异常根因诊断进程。
本发明实施例银行的工作人员通过查看和分析异常根因诊断方案,了解异常根因节点的具体情况,从而制定相应的异常根因诊断进程,其中根因诊断进程可能涉及到对数据、业务流程、监管政策等方面的进一步分析和排查,以准确识别异常根因并解决相关问题。
本发明通过对异常源数据进行数据分析,根据不同类型的异常,构建相应的业务异常血缘图谱,为分析和诊断异常提供有益的工具和数据支持。根据异常情况对不同类型的业务异常血缘图谱进行详细分析,可以更深入地了解异常性质和类型,定位异常根因的精确性和速度更高,从多维度分析问题,统计异常数据以帮助风险控制。这些有益效果可以大大提高银行业务的管理水平和客户的商业体验,能够深入了解银行业务异常的各种类型和属性,为提出相应的异常根因诊断方案提供有益的信息和指导。银行工作人员通过查看和分析异常根因诊断方案,能够快速定位业务异常源,并进行相应的处理,从而提高银行业务效率和客户满意度、信任感,避免类似异常事件再次发生,同时也有益于团队协作效率的提升。
优选地,在本说明书中,还提供了一种银行业务异常根因诊断***,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上任一项所述的银行业务异常根因诊断方法。
综上所述,本发明提供了一种银行业务异常根因诊断***,该***能够实现本发明所述任意一种银行业务异常根因诊断方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种银行业务异常根因诊断方法,***内部结构互相协作,银行业务异常根因诊断***基于业务异常血缘图谱技术,采用高级算法和模型来分析银行数据节点的关系和连接方式,实现异常数据源的快速定位和识别。***的核心技术包括异常血缘图谱构建、异常源数据定位、异常源数据影响分析以及异常根因诊断等。***结合了人工智能、机器学习和知识图谱等先进技术,可以实时监测银行业务***的异常数据情况,分析异常数据之间的关系和组织结构,以及异常数据与其他业务流程的影响关系,从而帮助银行***的运维人员快速定位和解决异常情况。这种技术可以提高银行业务流程的稳定性和可靠性,为客户提供更高质量的金融服务。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种银行业务异常根因诊断方法,其特征在于,包括以下步骤:
步骤S1:对银行业务***进行数据采集和数据预处理,得到银行业务异常数据;
步骤S2:利用关联规则挖掘技术对银行业务异常数据进行离线计算,得到异常检测规则数据;
步骤S3:通过预设的异常检测模型对异常检测规则数据进行异常检测,以得到异常数据;
步骤S4:对异常数据进行特征提取,得到异常数据特征;构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行根因分析,得到异常根因数据;
步骤S5:利用置信度传播分析和血缘分析技术相结合的方法对异常根因数据进行异常定位,得到异常源数据;
步骤S6:根据异常源数据构建业务异常血缘图谱,通过业务异常血缘图谱进一步了解银行业务异常之间的关系,以执行相应的异常根因诊断进程。
2.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S1包括以下步骤:
通过对银行业务***进行数据采集,得到银行业务数据;
对银行业务数据进行数据预处理,以得到银行业务异常数据。
3.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S2包括以下步骤:
步骤S21:通过对银行业务异常数据进行数据转化,得到业务异常规则数据;
步骤S22:利用基于Apriori算法的频繁项集挖掘获取业务异常规则数据中关联规则,得到业务异常频繁项集;
步骤S23:根据关联规则算法计算业务异常频繁项集的置信度,获取置信度的关联规则,得到规则置信度;
其中,关联规则算法公式如下所示:
式中,为规则置信度,/>为指数函数,/>为业务异常频繁项集中的集合数量,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集出现的概率,/>为业务异常频繁项集中的第/>个频繁项集和业务异常频繁项集中的第/>个频繁项集同时出现的概率,/>为规则置信度的修正系数;
步骤S24:按照从大到小的顺序将规则置信度对应的业务异常频繁项集进行排序,选择规则置信度较高的业务异常频繁项集,以得到异常检测规则数据。
4.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S3包括以下步骤:
步骤S31:对异常检测规则数据进行数据预处理和数据转换,得到异常检测数据;将异常检测数据划分为训练数据集、优化数据集和检测数据集;
步骤S32:构建基于支持向量机的异常检测模型,其中异常检测模型包括训练模型、模型优化和检测模型;
步骤S33:将训练数据集输入至基于支持向量机的训练模型进行模型训练,并通过如下的异常检测损失函数将优化数据集输入至训练模型进行参数调优,以生成检测模型;
其中,异常检测损失函数的公式如下所示:
式中,为异常检测损失函数,/>为异常检测损失值,/>为优化数据集的数据项数量,/>为优化数据集中的第/>个数据项,/>为模型训练结果的数据集合中的第/>个数据项,/>为正则化参数,/>为训练模型的参数,/>为异常检测损失函数的修正系数;
步骤S34:将检测数据集输入至经过参数优化后的检测模型进行模型检测,得到最优异常检测模型;将异常检测规则数据重新输入到最优异常检测模型中进行异常分析检测,以得到异常数据。
5.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S4包括以下步骤:
步骤S41:对异常数据进行数据预处理并提取相关特征,得到异常数据特征;
步骤S42:构建基于决策树的根因分类模型,将异常数据特征输入至根因分类模型中进行模型训练,得到异常点数据特征;通过交叉验证方法进行验证和优化模型,以生成最优根因分类模型;
步骤S43:将异常点数据特征输入至最优根因分类模型中进行根因分析,通过使用特征重要性分析函数对异常点数据特征进行权重计算,得到异常点特征权值;
其中,特征重要性分析函数的公式如下所示:
;
式中,为决策树中第/>个节点,/>为决策树中第/>个节点的异常点特征权值,/>为决策树的数量,/>为第/>棵树的非叶子节点数量,/>为第/>棵树的第/>个非叶子节点的划分异常点特征,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第/>个节点,/>为指定第/>棵树的第/>个非叶子节点的划分异常点特征是决策树中第k-1个节点,/>为第/>棵树的第/>个非叶子节点的左节点上的一阶导数之和,为第/>棵树的第/>个非叶子节点的左节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点的右节点上的一阶导数之和,/>为第/>棵树的第/>个非叶子节点的右节点上的二阶导数之和,/>为/>的调和平滑参数,/>为第/>棵树的第/>个非叶子节点上所有节点的一阶导数之和,/>为第/>棵树的第/>个非叶子节点上所有节点的二阶导数之和,/>为/>的调和平滑参数,/>为异常点特征权值的修正系数;
步骤S44:按照从大到小的顺序对异常点特征权值进行排序,得到异常根因数据。
6.根据权利要求5所述的银行业务异常根因诊断方法,其特征在于,步骤S41包括以下步骤:
步骤S411:通过对异常数据进行数据预处理,得到异常数据集;
步骤S412:对异常数据集进行特征提取,得到异常数据特征数据集;构建异常数据特征数据库,并将异常数据特征数据集保存至异常数据特征数据库;
步骤S413:获取异常数据特征数据库中异常数据特征数据集的特征数据包,提取特征数据包中的特征数据,得到异常数据特征。
7.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S5包括以下步骤:
步骤S51:对异常根因数据进行预处理和清洗,得到标准根因数据;
步骤S52:利用血缘分析技术分析标准根因数据所属的异常根因点,构建异常根因点的血缘关系图,得到初始业务异常血缘图谱;
步骤S53:利用预设的置信度传播分析技术对初始业务异常血缘图谱中的异常根因点进行异常优化定位,得到异常源数据。
8.根据权利要求7所述的银行业务异常根因诊断方法,其特征在于,步骤S53包括以下步骤:
步骤S530:构建置信度传播分析技术,其中置信度传播分析技术包括置信度分析技术、置信度传播技术和置信度追踪技术;
步骤S531:通过置信度分析技术求解初始业务异常血缘图谱,得到初始节点置信度;
步骤S532:对初始节点置信度进行置信度传播,根据各节点之间的相互依赖关系,通过置信度传播技术传递并更新每个节点的置信度,得到终极置信度;
步骤S533:对终极置信度进行排序处理,使用置信度追踪技术查找终极置信度较高节点的前驱节点,得到异常源数据。
9.根据权利要求1所述的银行业务异常根因诊断方法,其特征在于,步骤S6包括以下步骤:
步骤S61:对异常源数据进行数据分析,构建不同类型的业务异常血缘图谱;
步骤S62:根据异常情况对不同类型的业务异常血缘图谱进行详细分析,了解银行业务异常之间的属性和类型,得到异常根因诊断方案;
步骤S63:银行工作人员通过查看和分析异常根因诊断方案,执行相应的异常根因诊断进程。
10.一种银行业务异常根因诊断***,其特征在于,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如权利要求1至9中任一项所述的银行业务异常根因诊断方法。
CN202310567128.5A 2023-05-19 2023-05-19 一种银行业务异常根因诊断方法及诊断*** Active CN116361059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310567128.5A CN116361059B (zh) 2023-05-19 2023-05-19 一种银行业务异常根因诊断方法及诊断***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310567128.5A CN116361059B (zh) 2023-05-19 2023-05-19 一种银行业务异常根因诊断方法及诊断***

Publications (2)

Publication Number Publication Date
CN116361059A CN116361059A (zh) 2023-06-30
CN116361059B true CN116361059B (zh) 2023-08-08

Family

ID=86909993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310567128.5A Active CN116361059B (zh) 2023-05-19 2023-05-19 一种银行业务异常根因诊断方法及诊断***

Country Status (1)

Country Link
CN (1) CN116361059B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116661426B (zh) * 2023-07-14 2023-09-22 创域智能(常熟)网联科技有限公司 传感器运行控制***的异常ai诊断方法及***
CN117874686B (zh) * 2024-03-11 2024-05-10 中信证券股份有限公司 异常数据定位方法、装置、电子设备和计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373894A (zh) * 2015-11-20 2016-03-02 广州供电局有限公司 基于稽查数据的电力营销业务诊断模型的建立方法及***
KR20180060044A (ko) * 2016-11-28 2018-06-07 주식회사 나라시스템 클라우드 환경에서 개인정보 보호를 지원하는 p2p 중개 보안 시스템
CN110046145A (zh) * 2019-04-02 2019-07-23 国网安徽省电力有限公司 基于电能量大数据研究的专家智能分析服务平台
CN115344449A (zh) * 2021-05-14 2022-11-15 ***通信集团浙江有限公司 一种告警分析方法、装置、设备及存储介质
CN115576731A (zh) * 2022-10-27 2023-01-06 中国农业银行股份有限公司 ***故障根因定位方法及装置、设备、存储介质
CN116028467A (zh) * 2022-11-15 2023-04-28 珠海市新德汇信息技术有限公司 智能服务大数据建模方法、***、存储介质及计算机设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9075912B2 (en) * 2012-03-26 2015-07-07 Nec Laboratories America, Inc. Method and system for software system performance diagnosis with kernel event feature guidance
US20150242856A1 (en) * 2014-02-21 2015-08-27 International Business Machines Corporation System and Method for Identifying Procurement Fraud/Risk
US11716240B2 (en) * 2021-09-21 2023-08-01 Rakuten Mobile, Inc. Method, device and computer program product for anomaly detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373894A (zh) * 2015-11-20 2016-03-02 广州供电局有限公司 基于稽查数据的电力营销业务诊断模型的建立方法及***
KR20180060044A (ko) * 2016-11-28 2018-06-07 주식회사 나라시스템 클라우드 환경에서 개인정보 보호를 지원하는 p2p 중개 보안 시스템
CN110046145A (zh) * 2019-04-02 2019-07-23 国网安徽省电力有限公司 基于电能量大数据研究的专家智能分析服务平台
CN115344449A (zh) * 2021-05-14 2022-11-15 ***通信集团浙江有限公司 一种告警分析方法、装置、设备及存储介质
CN115576731A (zh) * 2022-10-27 2023-01-06 中国农业银行股份有限公司 ***故障根因定位方法及装置、设备、存储介质
CN116028467A (zh) * 2022-11-15 2023-04-28 珠海市新德汇信息技术有限公司 智能服务大数据建模方法、***、存储介质及计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据挖掘的电信家庭电话分类研究;蒋国瑞;王晓谊;谢凤玲;;科技管理研究(第12期);111-115 *

Also Published As

Publication number Publication date
CN116361059A (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN116361059B (zh) 一种银行业务异常根因诊断方法及诊断***
Chen et al. Entity embedding-based anomaly detection for heterogeneous categorical events
US11748227B2 (en) Proactive information technology infrastructure management
Zhong et al. Unsupervised learning for expert-based software quality estimation.
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及***
CN112910859B (zh) 基于c5.0决策树和时序分析的物联网设备监测预警方法
CN111563524A (zh) 一种多站融合***运行态势异常监测和告警合并方法
CN115185736B (zh) 基于图卷积神经网络的微服务调用链异常检测方法及装置
US20220367057A1 (en) Missing medical diagnosis data imputation method and apparatus, electronic device and medium
CN116108371B (zh) 基于级联异常生成网络的云服务异常诊断方法与***
Homayouni et al. Anomaly detection in COVID-19 time-series data
CN115544519A (zh) 对计量自动化***威胁情报进行安全性关联分析的方法
CN114416573A (zh) 一种应用程序的缺陷分析方法、装置、设备及介质
CN114372093A (zh) 一种变压器dga在线监测数据的处理方法
Mahammad et al. Machine Learning Approach to Predict Asthma Prevalence with Decision Trees
Febriansyah et al. Outlier detection and decision tree for wireless sensor network fault diagnosis
CN117539920B (zh) 基于房产交易多维度数据的数据查询方法及***
CN118052558B (zh) 基于人工智能的风控模型决策方法及***
Supardi et al. An evolutionary stream clustering technique for outlier detection
CN117690601B (zh) 基于大数据分析的结核病流行趋势预测***
Biswas et al. An Iterative Clustering Approach for Tracking Server Logs for Monitoring SCADA EMS/DMS
Weng et al. A Correlation Analysis-Based Multivariate Alarm Method With Maximum Likelihood Evidential Reasoning
Liu et al. MTAD: Tools and Benchmarks for Multivariate Time Series Anomaly Detection
CN117149500B (zh) 基于指标数据和日志数据的异常根因获得方法及***
CN117593101B (zh) 基于多维数据的金融风险数据处理分析方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant