CN114565457A - 风险数据识别方法、装置、存储介质及电子设备 - Google Patents

风险数据识别方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114565457A
CN114565457A CN202210036046.3A CN202210036046A CN114565457A CN 114565457 A CN114565457 A CN 114565457A CN 202210036046 A CN202210036046 A CN 202210036046A CN 114565457 A CN114565457 A CN 114565457A
Authority
CN
China
Prior art keywords
risk
index
weight
determining
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210036046.3A
Other languages
English (en)
Inventor
郭芷秀
刘润佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210036046.3A priority Critical patent/CN114565457A/zh
Publication of CN114565457A publication Critical patent/CN114565457A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种风险数据识别方法、装置、存储介质及电子设备。涉及金融科技领域,方法包括:获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据第一权重和熵权确定多个指标分别对应的目标权重;根据多个指标和分别对应的目标权重,确定目标对象的风险等级。通过本申请,解决了相关技术中风险识别采用单一赋权法的准确率较差的问题。

Description

风险数据识别方法、装置、存储介质及电子设备
技术领域
本申请涉及金融科技技术领域,具体而言,涉及一种风险数据识别方法、装置、存储介质及电子设备。
背景技术
金融产品创新进程加速以及不断涌现的新型技术手段,在为客户提供更加丰富、便捷金融服务的同时,也衍生出了更加复杂且难以识别的非法资金转移风险。此外,人民币国际化进程的不断推进、跨境资金交易频率及绝对数额持续上升,非法资金转移及恐怖融资等犯罪通过技术链条传播的方式更为多样且隐蔽,给传统商业银行非法资金转移风险防控带来了新的冲击。随着国际和国内反非法资金转移监管形势不断趋严,金融机构的合规压力持续增加,急需通过更加先进的科技手段有效识别、应对非法资金转移风险,以实现监管合规。
由于非法资金转移风险管理起步时间较晚,在行业内缺乏相对统一的标准且金融机构对数据保密性要求较高,对非法资金转移风险的管理更加依赖于金融机构自身的内部模型和管理方法,目前对非法资金转移风险的管理主要存在以下三个方面的问题:
1.客户身份识别方面:客户身份识别是反非法资金转移人员履职的首要工作,但是,由于金融机构希望不断提升金融服务可获得性和便利性,导致对客户身份信息的采集重视程度不高且较为片面。特别是对于非自然人客户,其身份识别的过程包含了对最终受益所有人识别,但是,由于部分非自然人客户股权结构复杂,在人工识别最终受益所有人时存在识别困难或识别有误的操作风险。
2.尽职调查流程方面:尽职调查在一定程度上可以对客户身份信息缺失形成补充,但是由于客户身份背景、交易背景等存在较大差异性,而网点尽职调查人员可能存在专业不高的问题,可能导致无效尽职调查的问题。目前,商业银行尝试通过下发尽职调查指引的方式对尽职调查要点进行提示,但对非标准化的客户采取标准化的尽职调查流程则较为粗略,导致尽职调查的有效性较低。
3.风险特征识别成果的应用方面:由于非法资金转移风险管理一直以来是一个事后管理的概念,金融机构对客户、交易的识别均在事后进行,且对风险等级的应用存在一定的局限性,导致金融机构对非法资金转移风险管理的主观能动性较低。究其原因,一方面是因为对非法资金转移风险的识别有一定的周期性,存在一定程度的时滞,另一方面则是由于缺乏金融机构整体的非法资金转移风险特征视图,主动管理的成本较高。
针对相关技术中风险识别采用单一赋权法的准确率较差的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种风险数据识别方法、装置、存储介质及电子设备,以解决相关技术中风险识别采用单一赋权法的准确率较差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种风险数据识别方法,包括:获取目标对象在多个维度的风险数据,其中,所述风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据所述第一权重和所述熵权确定所述多个指标分别对应的目标权重;根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级。
可选的,确定多个指标的第一权重和的熵权包括:确定多个指标的第一权重;确定多个指标的熵权;根据所述第一权重和所述熵权确定所述指标的目标权重包括:通过第一权重和对应的第一预设比例,以及熵权和对应的第二预设比例确定所述目标权重,其中,所述第一预设比例与所述第二预设比例之和为一。
可选的,确定多个指标的第一权重包括:通过对低层级的多个指标相对于高层级的指标的重要性进行比较,结合预设标度,生成判断矩阵,其中,所述判断矩阵每一个元素表示相对于高层级的指标,第一指标与第二指标的重要程度,所述低层级的多个指标属于所述高层级的指标的下一层级;通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重;根据多个指标的相对权重,以及多个指标的原始数据,生成指标矩阵,其中,所述指标矩阵的每一个元素表示一个指标与一个相对权重的乘积;通过所述指标矩阵确定多个指标的第一权重。
可选的,通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,所述方法还包括:确定所述判断矩阵的一致性指标;根据所述一致性指标,确定所述判断矩阵的一致性比率指标;在所述一致性比率指标处于预设值范围的情况下,确定所述判断矩阵一致性合格,执行通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤;在所述一致性比率指标不处于预设值范围的情况下,确定所述判断矩阵一致性不合格,对所述判断矩阵的元素进行修改,直至所述判断矩阵的一致性合格。
可选的,通过所述指标矩阵确定多个指标的第一权重包括:对所述指标矩阵中的原始数据进行无量纲化;通过无量纲化后的指标矩阵,确定指标矩阵中每一指标对应的行/列中的最优值,其中,所述最优值为极大值或者极小值,在所述指标的类型为收益性指标的情况下,所述最优值为极大值,在所述指标的类型为成本性指标的情况下,所述最优值为极小值;根据所述最优值和指标对应的相对权重,确定指标的第一权重。
可选的,确定多个指标的熵权包括:对所述指标的原始数据进行无量纲化处理;根据处理后的指标的原始数据,计算所述指标的熵值和差异系数;根据所述熵值和差异系数,确定所述指标的熵权。
可选的,所述目标对象包括:客户,业务,地域。
可选的,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:根据所述风险等级更新客户风险的风险数据;根据更新后的风险数据对客户风险进行识别;其中,所述客户风险的风险数据包括内部数据和外部数据,所述内部数据为***内部的客户账户的数据,所述外部数据为***外部的客户数据。
可选的,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:根据所述风险等级更新业务风险的风险数据;根据更新后的风险数据对业务风险识别模型进行训练,其中,所述业务风险识别模型为半监督模糊聚类算法FCM模型;其中,所述业务风险的风险数据包括业务风险数据以及与客户有关的客户数据。
可选的,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:根据所述风险等级更新地域风险的风险数据;根据更新后的风险数据生成地域风险特征;其中,所述地域风险的风险数据包括地域***数据,地域对应的与业务有关的业务数据以及与客户有关的客户数据。
为了实现上述目的,根据本申请的另一方面,提供了一种风险数据识别装置,包括:获取模块,获取目标对象在多个维度的风险数据,其中,所述风险数据在每个维度上包括不同层级的多个指标;第一确认模块,确定多个指标的第一权重和的熵权;第二确定模块,根据所述第一权重和所述熵权确定所述多个指标分别对应的目标权重;第三确定模块,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可以存储介质用于存储程序,其中,所述程序运行时执行上述中任意一项所述的风险数据识别方法。
为了实现上述目的,根据本申请的另一方面,提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述中任意一项所述的风险数据识别方法。
通过本申请,采用以下步骤:获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据第一权重和熵权确定多个指标分别对应的目标权重;根据多个指标和分别对应的目标权重,确定目标对象的风险等级,通过利用目标对象的多个维度,多个层级的多个指标确定第一权重以及熵权,综合得出多个指标的目标权重,进而确定目标对象的风险等级,解决了相关技术中风险识别采用单一赋权法的准确率较差的问题。进而达到了提高风险识别的高效性以及准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的风险数据识别方法的流程图;
图2是根据本申请实施方式提供的以客户为中心的非法资金转移风险特征识别及可视化方法的***流程图;
图3是根据本申请实施方式提供的AHP法和熵权法结合评价方法流程图;
图4是根据本申请实施方式提供的基于深度神经网络的综合分析***流程图;
图5是根据本申请实施方式提供的外部舆情信息处理流程图;
图6是根据本申请实施方式提供的样本甄别流程图;
图7是根据本申请实施方式提供的综合风险等级计算流程图;
图8是根据本申请实施例提供的风险数据识别装置的示意图;
图9是根据本申请实施例提供的电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的风险数据识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;
步骤S102,确定多个指标的第一权重和的熵权;
步骤S103,根据第一权重和熵权确定多个指标分别对应的目标权重;
步骤S104,根据多个指标和分别对应的目标权重,确定目标对象的风险等级。
上述步骤的执行主体可以为处理器或控制器,通过上述步骤,获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据第一权重和熵权确定多个指标分别对应的目标权重;根据多个指标和分别对应的目标权重,确定目标对象的风险等级通过利用目标对象的多个维度,多个层级的多个指标确定第一权重以及熵权,综合得出多个指标的目标权重,进而确定目标对象的风险等级,解决了相关技术中风险识别采用单一赋权法的准确率较差的问题。进而达到了提高风险识别的高效性以及准确性的效果。
上述目标对象可以是存在金融资产风险的多个方面,例如,目标对象可以是客户风险,业务风险,或是地域风险,为保证对上述目标对象的风险等级进行准确评估,解决现有技术中可以在目标对象中划分多个评价维度,并且在每个维度上可以设置不同层级的多个指标,上述多个评价维度可作为一级评价指标,在一级评价评价指标下可以设置更低级指标,如可以设置二级指标,三级指标等,多级的多个指标层级,每一层级指标中可包括多个指标,例如,图2是根据本申请实施方式提供的以客户为中心的非法资金转移风险特征识别及可视化方法的***流程图,客户风险、业务风险、地域风险维度下可以设置评价指标,以及评价指标的子项,需要说明是上述多个不同层级的指标可以包括图2中的指标,但不限于图2中的指标个数,以及指标等级。
上述多个指标的第一权重可以是不同维度的风险数据的除第一层级之外的低层级的多个指标相对于低层级的上一层级的相对权重,可以通过低层级的多个指标相对于高层级的指标的重要性进行比较,其中,重要性程度可以通过预设标度进行主观划分,可以通过上述重要性以及预设标度生成指标权重判断矩阵,通过指标矩阵的运算确定多个指标的第一权重。在本实施例中,上述第一权重可以通过层次分析法AHP确定的主观权重。
上述熵权可以是上述多个指标的另一客观评价方法,可以通过对指标的原始数据进行无量纲化处理,消除多个指标间单位或数量级不同对指标权重造成的影响,可以通过将原始数据矩阵转化为无量纲化后的指标矩阵,计算每个指标的熵值,再通过熵值可以确定差异系数,进而根据熵值和差异系数确定上述多个指标的熵权。
上述目标权重可以是上述多个指标的第一权重以及熵权确定的多个指标的综合权重,通过设置第一权重的第一预设比例,以及熵权的第二预设比例,综合确定上述多个指标的任一指标的目标权重,其中,上述第一预设比例与第二预设比例的和为一,也即是上述第一权重和熵权在目标权重中分别占不同的预设比例。
需要说明的是,通过上述第一权重以及熵权确定多个指标的目标权重,可以有效的避免现有技术中采用的风险评价***复杂,且采用单一赋权法准确率较差的技术问题。
上述风险等级可以是上述目标对象的风险等级,可以用于对上述目标的风险情况进行可视化呈现,通过上述多个指标以及多个指标所对应的目标权重可以确定上述风险的等级,通过上述风险等级的确定方法,还可更新目标对象的风险数据,对上述目标对象进行风险识别。
通过利用目标对象的多个维度,多个层级的多个指标确定第一权重以及熵权,综合得出多个指标的目标权重,进而确定目标对象的风险等级,解决了相关技术中风险识别采用单一赋权法的准确率较差的问题。进而达到了提高风险识别的高效性以及准确性的效果。
可选的,确定多个指标的第一权重和的熵权包括:确定多个指标的第一权重;确定多个指标的熵权;根据第一权重和熵权确定指标的目标权重包括:通过第一权重和对应的第一预设比例,以及熵权和对应的第二预设比例确定目标权重,其中,第一预设比例与第二预设比例之和为一。
确定上述多个指标的第一权重,也即是确定上述多个指标对于多个指标上一层级的相对重要性的权重,重要性可以通过预设标度进行重要性程度划分。确定上述多个指标的熵权,也即是确定上述多个指标对于其上一层级的客观重要性的权重,可以以风险原始数据利用熵值以及差异系数进行计算得到。
上述目标权重可以是上述多个指标的任一指标的综合权重,可以通过上述第一权重以及第二权重在目标权重的所占的预设比例进行确定,其中,上述第一权重在目标权重中对应第一预设比例,上述熵权在目标权重中对应第二预设比例,通过第一预设比例以及第二预设比例可以确定上述目标权重,第一预设比例与第二预设比例的和为一。例如,以最小信息熵原理确定的最佳组合权重结果(也即是上述目标权重)为AHP 法主观权重(也即是上述第一权重)和熵权法客观权重(也即是上述熵权)各占50%,组合权重w表示为:w=0.5wi+0.5wj,其中w表示组合权重,wi表示AHP法主观权重,wj表示熵权法客观权重;根据权重得出最终权重计算结果如表1所示。
通过上述第一权重以及第二权重综合确定指标的目标权重,解决了现有技术中指标的风向评价形式单一存在不准确的技术问题,达到了提高风险评价结果准确性的技术效果。
可选的,确定多个指标的第一权重包括:通过对低层级的多个指标相对于高层级的指标的重要性进行比较,结合预设标度,生成判断矩阵,其中,判断矩阵每一个元素表示相对于高层级的指标,第一指标与第二指标的重要程度,低层级的多个指标属于高层级的指标的下一层级;通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重;根据多个指标的相对权重,以及多个指标的原始数据,生成指标矩阵,其中,指标矩阵的每一个元素表示一个指标与一个相对权重的乘积;通过指标矩阵确定多个指标的第一权重。
上述多个指标的第一权重可以通过上述多个指标相对于多个指标的上一层级的指标的重要性进行比较,也即是通过对低层级的多个指标相对于高层级的指标的重要性进行比较,低层级的指标可以是高层级的下一层级指标,任意两指标间相对于上一层级的重要程度可以通过预设标度进行标识,例如,第一指标与第二指标的重要程度,可以引入1~9标度法,进而可以生成权重的判断矩阵,通过判断矩阵可以通过数学运算计算出判断矩阵的最大特征值,以及最大特征值对应的特征向量。
上述多个指标的相对权重可以是多个指标相对于其上一层指标的指标权重,通过上述判断矩阵的最大特征值和对应的特征向量可以确定上述多个指标的相对权重,根据多个指标的相对权重,以及多个指标的原始数据,可以生成指标矩阵,其中,指标矩阵的每一个元素可以表示一个指标与一个相对权重的乘积;通过指标矩阵可以确定多个指标的第一权重。
可选的,通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,方法还包括:确定判断矩阵的一致性指标;根据一致性指标,确定判断矩阵的一致性比率指标;在一致性比率指标处于预设值范围的情况下,确定判断矩阵一致性合格,执行通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤;在一致性比率指标不处于预设值范围的情况下,确定判断矩阵一致性不合格,对判断矩阵的元素进行修改,直至判断矩阵的一致性合格。
通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,还可以对判断矩阵进行一致性检验,可以通过判断矩阵的一致性指标,判断矩阵一致性是否合格,其中,一致性指标可以通过预设的方式进行设定,如果判断矩阵的一致性比率指标对判断矩阵中的偏离一致性的预设范围,可以对判断矩阵中的元素值进行修改。
在一致性比率指标处于预设值范围的情况下,可以确定判断矩阵一致性合格,执行通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤。
可选的,通过指标矩阵确定多个指标的第一权重包括:对指标矩阵中的原始数据进行无量纲化;通过无量纲化后的指标矩阵,确定指标矩阵中每一指标对应的行/列中的最优值,其中,最优值为极大值或者极小值,在指标的类型为收益性指标的情况下,最优值为极大值,在指标的类型为成本性指标的情况下,最优值为极小值;根据最优值和指标对应的相对权重,确定指标的第一权重。
通过指标矩阵确定多个指标的第一权重过程中,为了避免多个指标原始数据的数量级或是数量单位对多个指标的第一权重的计算结果的影响,还可以对指标中的原始数据进行无量纲化处理,可以采用极值化法对原始数据进行无量纲化处理,通过无量纲化的指标矩阵,可以确定指标矩阵中每一指标对应的行/列中的最优值,其中,最优值可以为极大值或者极小值,在指标的类型为收益性指标的情况下,最优值可以为极大值,在指标的类型为成本性指标的情况下,最优值可以为极小值。根据最优值和指标对应的相对权重,可以确定指标的第一权重。
可选的,确定多个指标的熵权包括:对指标的原始数据进行无量纲化处理;根据处理后的指标的原始数据,计算指标的熵值和差异系数;根据熵值和差异系数,确定指标的熵权。
上述熵权可以上述多个指标的另一客观评价方法,可以通过对指标的原始数据进行无量纲化处理,消除多个指标间单位或数量级不同对指标权重造成的影响,可以通过将原始数据矩阵转化为无量纲化后的新评价矩阵,计算每个指标的熵值,再通过熵值可以确定差异系数,进而确定上述多个指标的熵权。
可选的,目标对象包括:客户,业务,地域。
上述目标对象可以包括存在金融资产风险的多个方面,可以是客户风险,业务风险,或是地域风险。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新客户风险的风险数据;根据更新后的风险数据对客户风险进行识别;其中,客户风险的风险数据包括内部数据和外部数据,内部数据为***内部的客户账户的数据,外部数据为***外部的客户数据。
上述风险数据可以包括内部数据以及外部数据,内部数据可以为***内部的客户账户的风险数据,例如,机构***数据仓库中的客户画像数据、核心业务***中的特征数据、反非法资金转移监控数据等,外部数据可以为***外部的客户数据,例如,公开的数据平台中的工商信息、行政处罚信息、征信信息、司法诉讼等外部舆情信息。
根据多个指标和分别的对应的目标权重,确定目标对象的风险等级之后,还可以根据风险等级更新客户风险的风险数据,还可以根据更新后的上述风险数据对客户身份风险情况进行识别,及时做出金融资产安全保护的响应措施。
需要说明的是,上述客户身份风险的识别,采用的外部数据集也可以作为对上说多个指标的权重的一个技术手段,上述指标权重的变化也可以影响客户身份风险的识别,即也可以产生对客户风险等级的影响。
通过利用多个指标分别对应的目标权重,确定的目标对象的风险等级,实现对客户风险进行识别,解决了现有技术中客户风险识别易出错的问题,达到了提高客户身份风险识别的有效性的技术效果。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新业务风险的风险数据;根据更新后的风险数据对业务风险识别模型进行训练,其中,业务风险识别模型为半监督模糊聚类算法FCM模型;其中,业务风险的风险数据包括业务风险数据以及与客户有关的客户数据。
为提升对可疑的新产品、复杂交易中非法资金转移的自动识别能力,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,还可根据风险等级更新业务风险的风险数据,根据更新后的业务风险数据以及与客户有关的客户数据,可以对业务风险识别模型进行训练,也即是可以通过半监督模糊聚类算法FCM算法,利用上述风险数据对业务风险识别模型,即半监督模糊聚类算法FCM模型进行训练,还可以利用已训练的半监督模糊聚类算法FCM模型,监测业务中的可疑交易,自动生成可疑报告,并对可以交易进行动态监控预警。
通过利用更新后的业务风险数据以及与客户有关的客户数据训练业务风险识别模型,解决了现有技术中业务风险识别效率低下且易出错的问题,实现了提高业务交易的安全性的技术效果。
上述根据多个指标的目标权重确定客户风险和业务风险之后,可以根据更新后的客户风险和业务风险,对多个指标进行更新,从而更新指标的目标权重,形成反馈和动态自调整。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新地域风险的风险数据;根据更新后的风险数据生成地域风险特征;其中,地域风险的风险数据包括地域***数据,地域对应的与业务有关的业务数据以及与客户有关的客户数据。
上述地域风险的风险数据可以包括地域***数据,如,金融机构自身的非法资金转移风险数据,还可以包括地域对应的与业务有关的业务数据,或者是与客户有关的客户数据。
根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,还可以根据风险等级更新地域风险的风险数据,根据更新后的风险数据可以生成地域风险特征,以此可以反应地域内的***的风险。
例如,使用特定国家/地区内的数据,使用前文通过AHP-熵权法建立的评价体系中的地域风险维度进行计算,可得到所有特定国家、地区的非法资金转移风险特征。结合了外部评级数据、金融机构自身的非法资金转移风险特征数据,从***性风险和非***性风险两个角度对金融机构地域维度的非法资金转移风险进行评价和监控,指导特定地域内的尽职调查岗对客户身份、交易特征进行针对性的尽职调查,提前识别非法资金转移风险隐患。
通过利用风险等级更新地域风险数据,生成地域风险特征,解决了现有技术中地域风险识别评价方法忽视了金融机构自身客户、业务中在各地域内的风险特征的技术问题,达到了扩大地域风险识别范围的技术效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种可选的实施方式,下面对该实施方式进行详细说明。
本实施方式针对现有技术中存在的缺陷和不足。提供了一种以客户为中心的非法资金转移风险特征识别及可视化方法。
图2是根据本申请实施方式提供的以客户为中心的非法资金转移风险特征识别及可视化方法的***流程图,***整体流程如图2所示。
为解决目前存在的问题,分别从以下几个方面进行:
(一)基于AHP-熵权法的非法资金转移风险特征可视化;
本实施方式根据融资风险安全指引的要求和金融机构现状,将非法资金转移风险的监控分为客户、业务、地域三个维度。在当前金融机构对单一维度评价的基础上,分别从(1)单一维度的风险分布特征;(2)综合维度统计分析两个角度对金融机构非法资金转移风险特征进行可视化,从全面风险管理角度为非法资金转移风险的主动管理提供依据。
1.单一维度的风险分布特征可视化;
(1)评价维度;
.表1是单一维度的风险分布特征可视化评价表,评价维度如表1所示:
表1单一维度的风险分布特征可视化评价表
Figure RE-GDA0003612103200000111
注:金融机构可根据自身对各类风险的评价维度进行调整;
(2)评价方法;
以单一风险维度为模块,分别对各评价指标的子项进行取数计算,并绘制统计图。
2.综合维度统计分析;
(1)评价维度;
基于风险为本的管理原则,本实施方式对涉及高风险的非法资金转移风险特征(A)进行综合分析。
2.综合维度统计分析;
(1)评价维度;
表2是综合维度评价表,如表2所示,以基于风险为本的管理原则,本实施方式对涉及高风险的非法资金转移风险特征(A)进行综合分析。
表2综合维度评价表
Figure RE-GDA0003612103200000121
Figure RE-GDA0003612103200000131
注:金融机构可根据自身对各类风险的评价维度进行调整;
(2)评价方法;
本实施方式通过将AHP法和熵权法相结合对非法资金转移风险各维度指标进行组合赋权,通过将AHP法主观赋权结果与熵权法客观赋权结果进行加权平均,确定非法资金转移风险评价中各指标的权重大小,避免采用单一赋权法的局限,保证了测算结果与实际情况的一致,更好地反映金融机构整体的非法资金转移风险水平。确定指标权重的具体步骤如下:
首先,运用AHP(Analytic Hierarchy Process,层次分析法)法求得指标的主观权重,目标层为金融机构非法资金转移风险水平,准则层为一级指标,方案层为25个二级指标。
①对该层次中的指标两两比较,确定其相对于准则层指标的相对重要性。即以风险维度B为准则,层D的指标e1,e2,…,em,评价对于准则B,ei和ej哪个更重要。通过引入合适的标度将这种判断定量化,并用矩阵形式表示出来,即构成判断矩阵。记 n阶矩阵表示A=(αij)m×m,aij相对于指标ei和ej的支配指标,指标ei比ej的重要(或不重要)的程度。表3是指标ei和ej成对比较表,如表3所示,引入1~9标度法对指标成对定量化比较。由这种方法得到的矩阵A具有如下性质:
Figure RE-GDA0003612103200000132
其中,aij是相对于指标ei和ej的支配指标,m,n为自然数,e1,e2,…,em为层D 的指标,由矩阵A满足上式,可知矩阵A是正互反矩阵。
表3指标ei和ej成对比较表
Figure RE-GDA0003612103200000143
注:若ei和ej的差异程度介于上述某两个相邻等级之间则的值取相应的为2,4,6,8,
Figure RE-GDA0003612103200000141
②根据上一步得到的判断矩阵A,求出指标e1,e2,…,em相对于其支配指标B的指标权重。在计算权重时,先假定A具有一致性,即aij×ajk=aik。计算出的判断矩阵 A的最大特征值和该最大特征值对应的特征向量,即满足Aω=λmax的ω,其中ω=(ω1,ω2,…,ωm);
Figure RE-GDA0003612103200000142
其中,ω为判断矩阵A的最大特征值对应特征向量,入为矩阵A的最大特征值, m为自然数。
则(ω1,ω2,…,ωm)为e1,e2,…,em对于准则B的相对权重值。
③对矩阵A进行一致性检验。一般情况下由专家评价给出的判断矩阵A不满足完全一致性,即不完全满足aij×ajk=aik。则可给出一致性标准,当判断矩阵A满足给定的标准时,即可认为A满足一致性。
定义矩阵A的一致性指标CI来衡量A的一致性程度:
Figure RE-GDA0003612103200000151
即根据判断矩阵A的最大特征根的变化来检验判断矩阵A的一致性程度。CI越大,说明判断矩阵A偏离一致性的程度就越大;反之,CI越小,说明判断矩阵A偏离一致性的程度就越小。
对于阶数较大的判断矩阵,上述一致性检验方法的适用性将有所降低,需要对一致性指标CI进行修正。这里引入平均随机一致性指标RI,其计算过程如下:
i.对m阶判断矩阵,从
Figure RE-GDA0003612103200000152
中随机取值,重复
Figure RE-GDA0003612103200000153
次,其中,m 为自然数,每一次都是独立的,将值作为新矩阵的上三角元素,该矩阵的主对角元素取1,下三角元素取上三角元素的倒数,即构造一个随机正互反矩阵;
ii.计算所得矩阵的一致性指标CI;
iii.重复上述两步以得到足够多的样本,计算CI的样本均值,将这个均值作为RI,表4是R1与m相关数值表,显然RI是与m有关的数值(如表4所示)。
表4是R1与m相关数值表
m 1 2 3 4 5 6 7 8 9
RI 0.00 0.00 0.58 0.90 1.12 1.24 1.32 1.41 1.45
当m=1,2时,RI=0,即判断矩阵总是具有完全一致性。
当m>2时,引入一致性比率指标CR,定义
Figure RE-GDA0003612103200000154
将判断矩阵的一致性准则修正为:
Figure RE-GDA0003612103200000155
当CR<0.1时,认为判断矩阵A具有可接受的一致性;反之,认为判断矩阵A偏离一致性的程度过大,需要对A中的元素值进行修改。
④得到一组指标相对其上一层支配指标的指标权重后,可依此方法得到所有指标相对其上一层支配指标的指标权重。根据支配关系,按层对指标权重进行加权。最终将得到最底层各指标相对于最高层指标的指标权重。假定第k-1层nk-1个指标相对于最高层指标的权重向量为
Figure RE-GDA0003612103200000161
第k层上nk个指标对第k-1层的第j个指标的权重向量为
Figure RE-GDA0003612103200000162
其中不受第j个指标支配的指标的权重为0,则第 k层上指标相对于最高层指标的权重向量为βi
Figure RE-GDA0003612103200000163
其中,βi为第k层上指标相对于最高层指标的权重向量,k表示层数,n为自然数。
以此类推,从上到下可推算出最底层指标相对于最高层即总目标的指标权重。
最后,结合上述求出的指标权重值和原始数据,即可评价各待评对象的优劣。设想该体系中有m个被评价对象,最底层有n个指标相对于总目标的指标权重为ωj,j=1,2,...,n。被评价对象对应的指标值可以下列矩阵形式R表示:
Figure RE-GDA0003612103200000164
由于各指标值的数据可能不在一个数量级,为便于比较,需要采用极值化法对原始数据值进行无量纲处理。
首先对原始数据进行无量纲化处理:记R中每列的最优值为rj*:
Figure RE-GDA0003612103200000165
其中,收益性指标是指指标值越大越好,成本性指标是指指标值越小越好;
令S=(sij)m×n,则
Figure RE-GDA0003612103200000171
其中,S为定义所求的Sij组成的矩阵。
则第i个对象的相对评价值为
Figure RE-GDA0003612103200000172
根据xi值的大小,判断所评价对象的优劣。xi越大,表示第i个对象越优。
其次,利用熵权法确定指标的客观权重,计算方法如下:
①原始数据处理:运用线性比例变换法对指标数据进行无量纲化处理(方法同上),将原始数据矩阵e转化为无量纲化后的新评价矩阵为S=(sij)mn(m为指标个数,n 为评价年份数)。
②计算第i个指标的熵值Hi
Figure RE-GDA0003612103200000173
Figure RE-GDA0003612103200000174
其中,
Figure RE-GDA0003612103200000175
(i=1,...,m;j=1,2,...,n),表示计算第i个指标值所占的比重,ln m指对m求自然对数。
③计算第i项指标的差异系数αi
aj=1-Hi,(j=1,2,…,n)
某个指标的信息熵Hi与1之间的差值αi决定了该指标的信息效用价值,αi直接影响权重的大小,信息效用值越大,意味着该指标对评价的重要性就越大,所以权重也越大。
④计算第i项指标的熵权ωi
Figure RE-GDA0003612103200000181
最后,以最小信息熵原理确定的最佳组合权重结果为AHP法主观权重和熵权法客观权重各占50%,组合权重w表示为:
w=0.5wi+0.5wj
其中,w为最佳组合权重,wi为AHP法主观权重,wj为熵权法客观权重。
表5是利用熵权法确定指标的客观权重结果表,根据权重得出最终权重计算结果如表5所示:
表5利用熵权法确定指标的客观权重结果表
Figure RE-GDA0003612103200000182
其中,
Figure RE-GDA0003612103200000191
其中,x1,x2…,xm为第m个对象的相对评价值,S为定义的Sij组成的矩阵,ω为判断矩阵A的最大特征值对应特征向量m为自然数。
表6是指标层计算结果表,根据权重得出指标层的计算结果如表6所示:
表6指标层计算结果表
客户风险/% 业务风险/% 地域风险/% 非法资金转移风险水平/%
Y<sub>1</sub> Y<sub>2</sub> Y<sub>3</sub> Y
其中,
Figure RE-GDA0003612103200000192
此时,金融结构的各维度非法资金转移风险、整体非法资金转移风险水平已被可视化处理,金融机构可以定期进行评估,从而可以从全局的角度监控各风险维度的动态变化,将非法资金转移风险管理的时间前移,一定程度上提升主观能动性。
图3是根据本申请实施方式提供的AHP法和熵权法结合评价方法流程图,上述计算过程流程图如图3所示。
(二)客户身份识别技术;
为实现通过***自动抓取尽可能多的客户身份信息,在目前金融机构对个人客户九要素进行完整性判断、法人客户24要素和受益所有人完整性判断的基础上,进一步补充客户身份信息识别方式。
在个人客户信息的采集和身份识别中,提升生物识别技术的应用范围,如人脸识别、声纹、指纹等,并将生物识别模块全面纳入银行非面对面及核心业务***中,控制非面对面交易中较高程度的潜在非法资金转移风险。
在对公客户及受益所有人的识别中,利用金融机构内部数据和工商、征信、海关等外部数据,构建基于深度神经网络的综合分析***,实现对最终受益所有人的穿透式识别,以应对复杂股权结构下人工判断过程中的操作风险,图4是根据本申请实施方式提供的基于深度神经网络的综合分析***流程图,技术实现步骤如图4所示。具体如下:
(1)提取金融机构数据仓库中对公客户画像数据、核心业务***中的特征数据、反非法资金转移监控数据,形成内部数据集合;
(2)提取外部公开数据平台中的工商信息、行政处罚信息、征信信息、司法诉讼等外部舆情数据,形成外部数据集合;
(3)提取内部、外部的已标准化信息形成尽职调查表中基础信息字段;
(4)对外部舆情等非标准化信息进行数据清洗、语义分析,对企业最终受益所有人进行识别,并向尽职调查过程提供进行进一步识别。
图5是根据本申请实施方式提供的外部舆情信息处理流程图,过程如图5所示,通过整合内部数据和外部数据,一方面可以结合受益所有人间的关联关系对复杂股权结构下的最终受益所有人进行识别,另一方面可以根据外部舆情信息识别可能隐藏的受益所有人信息,并通过在尽职调查过程中访问此类信息,提升客户身份识别的有效性。
(三)基于半监督FCM聚类的业务风险监控;
为提升对可疑模型对新产品、复杂交易中非法资金转移风险的自动识别能力,方案通过引入半监督模糊聚类算法(fuzzy c-means algorithm,FCM),以提升对交易风险的监控能力。主要思想是基于金融机构已有的可疑监控模型和人工甄别结果作为标签样本,对海量无标签样本进行训练,提升现有模型的识别能力。
首先,在FCM算法中假设聚类数据集X的样本数为n,即X=(x1,x2,...,xn),聚类中心为ci,则目标函数可表示为:
Figure RE-GDA0003612103200000201
其中,U为函数的隶属度矩阵;uik∈[0,1],表示对应类别的归属度,其值越大表明归属于该聚类中心的可能性越大;dik=||xk-ci||表示第k个数据到聚类中心ci的欧几里得距离;m∈[0,+∞)为加权指数,用来控制目标函数的模糊程度,通常m=2。
计算目标函数时,若目标函数值小于阈值或迭代次数大于最大次数时终止算法,得到聚类中心ci;反正则重新计算聚类中心进行迭代。
Figure RE-GDA0003612103200000211
的约束条件下,通过Lagrange(拉格朗日)数乘法取目标函数最小值,得到隶属度矩阵uik和聚类中心ci
Figure RE-GDA0003612103200000212
Figure RE-GDA0003612103200000213
其次,在此基础上将已甄别的可疑样本作为先验信息,并纳入到FCM算法的目标函数中,对聚类过程进行引导,新的目标函数为:
Figure RE-GDA0003612103200000214
其中,fij为包含已有标签信息的隶属度矩阵,表示xj归属ci的程度大小;bj为虚拟变量,其中,xj表示样本数据集:
Figure RE-GDA0003612103200000215
此外,α为调节系数,用于平衡无监督信息和有监督信息。通过Lagrange(拉格朗日)数乘法取目标函数最小值,得到隶属度矩阵uik和聚类中心ci的迭代表达式为:
Figure RE-GDA0003612103200000216
Figure RE-GDA0003612103200000217
其中,dik=||xk-ci||表示第k个数据到聚类中心ci的欧几里得距离;fij为包含已有标签信息的隶属度矩阵。
计算目标函数时,若目标函数值小于阈值或迭代次数大于最大次数时终止算法,得到聚类中心ci;反正则重新计算聚类中心进行迭代。
图6是根据本申请实施方式提供的样本甄别流程图,如图6所示,算法结束后,一方面可以对监测到的可疑交易自动生成可疑报告,并对交易进行动态监控并预警;另一方面可以实现对目标客户的尽职调查要点推送,使网点工作人员更能够针对性的对客户资金来源及用途进行尽职调查,提升尽职调查的有效性。
(四)地域风险监控技术;
目前金融机构对地域风险的分类多为直接采用外部机构的评级,该类评级方法基于宏观变量对国家/地区风险进行评价,反映了该地域内的***性风险。但是,就金融机构的非法资金转移风险管理而言,直接采取该分类方法忽视了金融机构自身客户、业务中在各地域内的风险特征,即非***性风险表7地域风险特征评价表,如表7所示,本实施方式使用特定国家/地区内的数据,使用前文通过AHP-熵权法建立的评价体系中的地域风险维度进行计算,可得到所有特定国家、地区的非法资金转移风险特征。
表7地域风险特征评价表
Figure RE-GDA0003612103200000221
Figure RE-GDA0003612103200000231
图7是根据本申请实施方式提供的综合风险等级计算流程图,如图7所示,该评价方法结合了外部评级数据、金融机构自身的非法资金转移风险特征数据,从***性风险和非***性风险两个角度对金融机构地域维度的非法资金转移风险进行评价和监控,指导特定地域内的尽职调查岗对客户身份、交易特征进行针对性的尽职调查,提前识别非法资金转移风险隐患。
本实施方式对金融机构整体而言,可实现对金融机构整体非法资金转移风险特征的可视化,提升非法资金转移风险主动管理过程提供可能性;从分支机构而言,可应用各维度风险特征的识别成果,在***层面自动推送尽职调查要点,提升尽职调查过程的有效性,进而提升客户身份信息存储的完整性和识别的准确性,充分发挥金融机构风险管理模块二道防线的职能,为各业务***提供更为有效的支持。
本申请实施例还提供了一种风险数据识别装置,需要说明的是,本申请实施例的风险数据识别装置可以用于执行本申请实施例所提供的用于风险数据识别方法。以下对本申请实施例提供的风险数据识别装置进行介绍。
图8是根据本申请实施例的风险数据识别装置的示意图。如图8所示,该装置包括:获取模块82,第一确定模块84,第二确定模块86和第三确定模块88,下面对该装置进行详细说明。
获取模块82,获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;第一确定模块84,与上述获取模块相连,确定多个指标的第一权重和的熵权;第二确定模块86,与上述第一确定模块相连,根据第一权重和熵权确定多个指标分别对应的目标权重;第三确定模块88,与上述第二确定模块相连,根据多个指标和分别对应的目标权重,确定目标对象的风险等级。
通过上述装置,获取模块82获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;第一确定模块84,确定多个指标的第一权重和的熵权;第二确定模块86,根据第一权重和熵权确定多个指标分别对应的目标权重;第三确定模块88根据多个指标和分别对应的目标权重,确定目标对象的风险等级通过利用目标对象的多个维度,多个层级的多个指标确定第一权重以及熵权,综合得出多个指标的目标权重,进而确定目标对象的风险等级,解决了相关技术中风险识别采用单一赋权法的准确率较差的问题。进而达到了提高风险识别的高效性以及准确性的效果。
所述风险数据识别装置包括处理器和存储器,上述获取模块82,第一确定模块54,第二确定模块86和第三确定模块88等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来通过目标对象检测模型检测目标图像是否具有目标对象,在具有目标对象的情况下,识别目标对象姿态是否异常。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述风险数据识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述风险数据识别方法。
如图9所示,本发明实施例提供了一种电子设备,电子设备90包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据第一权重和熵权确定多个指标分别对应的目标权重;根据多个指标和分别对应的目标权重,确定目标对象的风险等级。
可选的,确定多个指标的第一权重和的熵权包括:确定多个指标的第一权重;确定多个指标的熵权;根据第一权重和熵权确定指标的目标权重包括:通过第一权重和对应的第一预设比例,以及熵权和对应的第二预设比例确定目标权重,其中,第一预设比例与第二预设比例之和为一。
可选的,确定多个指标的第一权重包括:通过对低层级的多个指标相对于高层级的指标的重要性进行比较,结合预设标度,生成判断矩阵,其中,判断矩阵每一个元素表示相对于高层级的指标,第一指标与第二指标的重要程度,低层级的多个指标属于高层级的指标的下一层级;通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重;根据多个指标的相对权重,以及多个指标的原始数据,生成指标矩阵,其中,指标矩阵的每一个元素表示一个指标与一个相对权重的乘积;通过指标矩阵确定多个指标的第一权重。
可选的,通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,方法还包括:确定判断矩阵的一致性指标;根据一致性指标,确定判断矩阵的一致性比率指标;在一致性比率指标处于预设值范围的情况下,确定判断矩阵一致性合格,执行通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤;在一致性比率指标不处于预设值范围的情况下,确定判断矩阵一致性不合格,对判断矩阵的元素进行修改,直至判断矩阵的一致性合格。
可选的,通过指标矩阵确定多个指标的第一权重包括:对指标矩阵中的原始数据进行无量纲化;通过无量纲化后的指标矩阵,确定指标矩阵中每一指标对应的行/列中的最优值,其中,最优值为极大值或者极小值,在指标的类型为收益性指标的情况下,最优值为极大值,在指标的类型为成本性指标的情况下,最优值为极小值;根据最优值和指标对应的相对权重,确定指标的第一权重。
可选的,确定多个指标的熵权包括:对指标的原始数据进行无量纲化处理;根据处理后的指标的原始数据,计算指标的熵值和差异系数;根据熵值和差异系数,确定指标的熵权。
可选的,目标对象包括:客户,业务,地域。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新客户风险的风险数据;根据更新后的风险数据对客户风险进行识别;其中,客户风险的风险数据包括内部数据和外部数据,内部数据为***内部的客户账户的数据,外部数据为***外部的客户数据。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新业务风险的风险数据;根据更新后的风险数据对业务风险识别模型进行训练,其中,业务风险识别模型为半监督模糊聚类算法FCM模型;其中,业务风险的风险数据包括业务风险数据以及与客户有关的客户数据。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新地域风险的风险数据;根据更新后的风险数据生成地域风险特征;其中,地域风险的风险数据包括地域***数据,地域对应的与业务有关的业务数据以及与客户有关的客户数据。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取目标对象在多个维度的风险数据,其中,风险数据在每个维度上包括不同层级的多个指标;确定多个指标的第一权重和的熵权;根据第一权重和熵权确定多个指标分别对应的目标权重;根据多个指标和分别对应的目标权重,确定目标对象的风险等级。
可选的,确定多个指标的第一权重和的熵权包括:确定多个指标的第一权重;确定多个指标的熵权;根据第一权重和熵权确定指标的目标权重包括:通过第一权重和对应的第一预设比例,以及熵权和对应的第二预设比例确定目标权重,其中,第一预设比例与第二预设比例之和为一。
可选的,确定多个指标的第一权重包括:通过对低层级的多个指标相对于高层级的指标的重要性进行比较,结合预设标度,生成判断矩阵,其中,判断矩阵每一个元素表示相对于高层级的指标,第一指标与第二指标的重要程度,低层级的多个指标属于高层级的指标的下一层级;通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重;根据多个指标的相对权重,以及多个指标的原始数据,生成指标矩阵,其中,指标矩阵的每一个元素表示一个指标与一个相对权重的乘积;通过指标矩阵确定多个指标的第一权重。
可选的,通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,方法还包括:确定判断矩阵的一致性指标;根据一致性指标,确定判断矩阵的一致性比率指标;在一致性比率指标处于预设值范围的情况下,确定判断矩阵一致性合格,执行通过判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤;在一致性比率指标不处于预设值范围的情况下,确定判断矩阵一致性不合格,对判断矩阵的元素进行修改,直至判断矩阵的一致性合格。
可选的,通过指标矩阵确定多个指标的第一权重包括:对指标矩阵中的原始数据进行无量纲化;通过无量纲化后的指标矩阵,确定指标矩阵中每一指标对应的行/列中的最优值,其中,最优值为极大值或者极小值,在指标的类型为收益性指标的情况下,最优值为极大值,在指标的类型为成本性指标的情况下,最优值为极小值;根据最优值和指标对应的相对权重,确定指标的第一权重。
可选的,确定多个指标的熵权包括:对指标的原始数据进行无量纲化处理;根据处理后的指标的原始数据,计算指标的熵值和差异系数;根据熵值和差异系数,确定指标的熵权。
可选的,目标对象包括:客户,业务,地域。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新客户风险的风险数据;根据更新后的风险数据对客户风险进行识别;其中,客户风险的风险数据包括内部数据和外部数据,内部数据为***内部的客户账户的数据,外部数据为***外部的客户数据。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新业务风险的风险数据;根据更新后的风险数据对业务风险识别模型进行训练,其中,业务风险识别模型为半监督模糊聚类算法FCM模型;其中,业务风险的风险数据包括业务风险数据以及与客户有关的客户数据。
可选的,根据多个指标和分别对应的目标权重,确定目标对象的风险等级之后,方法还包括:根据风险等级更新地域风险的风险数据;根据更新后的风险数据生成地域风险特征;其中,地域风险的风险数据包括地域***数据,地域对应的与业务有关的业务数据以及与客户有关的客户数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种风险数据识别方法,其特征在于,包括:
获取目标对象在多个维度的风险数据,其中,所述风险数据在每个维度上包括不同层级的多个指标;
确定多个指标的第一权重和的熵权;
根据所述第一权重和所述熵权确定所述多个指标分别对应的目标权重;
根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级。
2.根据权利要求1所述的方法,其特征在于,确定多个指标的第一权重和的熵权包括:
确定多个指标的第一权重;
确定多个指标的熵权;
根据所述第一权重和所述熵权确定所述指标的目标权重包括:
通过第一权重和对应的第一预设比例,以及熵权和对应的第二预设比例确定所述目标权重,其中,所述第一预设比例与所述第二预设比例之和为一。
3.根据权利要求2所述的方法,其特征在于,确定多个指标的第一权重包括:
通过对低层级的多个指标相对于高层级的指标的重要性进行比较,结合预设标度,生成判断矩阵,其中,所述判断矩阵每一个元素表示相对于高层级的指标,第一指标与第二指标的重要程度,所述低层级的多个指标属于所述高层级的指标的下一层级;
通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重;
根据多个指标的相对权重,以及多个指标的原始数据,生成指标矩阵,其中,所述指标矩阵的每一个元素表示一个指标与一个相对权重的乘积;
通过所述指标矩阵确定多个指标的第一权重。
4.根据权利要求3所述的方法,其特征在于,通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重之后,所述方法还包括:
确定所述判断矩阵的一致性指标;
根据所述一致性指标,确定所述判断矩阵的一致性比率指标;
在所述一致性比率指标处于预设值范围的情况下,确定所述判断矩阵一致性合格,执行通过所述判断矩阵的最大特征值和对应的特征向量,确定多个指标的相对权重的步骤;
在所述一致性比率指标不处于预设值范围的情况下,确定所述判断矩阵一致性不合格,对所述判断矩阵的元素进行修改,直至所述判断矩阵的一致性合格。
5.根据权利要求4所述的方法,其特征在于,通过所述指标矩阵确定多个指标的第一权重包括:
对所述指标矩阵中的原始数据进行无量纲化;
通过无量纲化后的指标矩阵,确定指标矩阵中每一指标对应的行/列中的最优值,其中,所述最优值为极大值或者极小值,在所述指标的类型为收益性指标的情况下,所述最优值为极大值,在所述指标的类型为成本性指标的情况下,所述最优值为极小值;
根据所述最优值和指标对应的相对权重,确定指标的第一权重。
6.根据权利要求2所述的方法,其特征在于,确定多个指标的熵权包括:
对所述指标的原始数据进行无量纲化处理;
根据处理后的指标的原始数据,计算所述指标的熵值和差异系数;
根据所述熵值和差异系数,确定所述指标的熵权。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述目标对象包括:客户,业务,地域。
8.根据权利要求7中所述的方法,其特征在于,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:
根据所述风险等级更新客户风险的风险数据;
根据更新后的风险数据对客户风险进行识别;
其中,所述客户风险的风险数据包括内部数据和外部数据,所述内部数据为***内部的客户账户的数据,所述外部数据为***外部的客户数据。
9.根据权利要求7中所述的方法,其特征在于,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:
根据所述风险等级更新业务风险的风险数据;
根据更新后的风险数据对业务风险识别模型进行训练,其中,所述业务风险识别模型为半监督模糊聚类算法FCM模型;
其中,所述业务风险的风险数据包括业务风险数据以及与客户有关的客户数据。
10.根据权利要求7中所述的方法,其特征在于,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级之后,所述方法还包括:
根据所述风险等级更新地域风险的风险数据;
根据更新后的风险数据生成地域风险特征;
其中,所述地域风险的风险数据包括地域***数据,地域对应的与业务有关的业务数据以及与客户有关的客户数据。
11.一种风险数据识别装置,其特征在于,包括:
获取模块,获取目标对象在多个维度的风险数据,其中,所述风险数据在每个维度上包括不同层级的多个指标;
第一确认模块,确定多个指标的第一权重和的熵权;
第二确定模块,根据所述第一权重和所述熵权确定所述多个指标分别对应的目标权重;
第三确定模块,根据所述多个指标和分别对应的所述目标权重,确定所述目标对象的风险等级。
12.一种计算机可读存储介质,其特征在于,所述存储介质用于存储程序,其中,所述程序运行时执行权利要求1至10中任意一项所述的风险数据识别方法。
13.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至10中任意一项所述的风险数据识别方法。
CN202210036046.3A 2022-01-11 2022-01-11 风险数据识别方法、装置、存储介质及电子设备 Pending CN114565457A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210036046.3A CN114565457A (zh) 2022-01-11 2022-01-11 风险数据识别方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210036046.3A CN114565457A (zh) 2022-01-11 2022-01-11 风险数据识别方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114565457A true CN114565457A (zh) 2022-05-31

Family

ID=81711253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210036046.3A Pending CN114565457A (zh) 2022-01-11 2022-01-11 风险数据识别方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114565457A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132400A (zh) * 2023-10-25 2023-11-28 中国建设银行股份有限公司 非法资金转移交易的识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132400A (zh) * 2023-10-25 2023-11-28 中国建设银行股份有限公司 非法资金转移交易的识别方法及装置

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和***
Lokanan et al. Detecting anomalies in financial statements using machine learning algorithm: The case of Vietnamese listed firms
US20150019405A1 (en) System and method for building and validating a credit scoring function
CN111861698B (zh) 一种基于贷款多头数据的贷前审批预警方法及***
CN110807700A (zh) 一种基于政府数据的无监督融合模型个人信用评分方法
CN111401600A (zh) 基于关联关系的企业信用风险评价方法和***
Abdou et al. Prediction of financial strength ratings using machine learning and conventional techniques
CN112989621A (zh) 一种模型性能评价方法、装置、设备及存储介质
CN116468273A (zh) 客户风险识别方法及装置
Chimonaki et al. Identification of financial statement fraud in Greece by using computational intelligence techniques
Mukherjee et al. Detection of defaulters in P2P lending platforms using unsupervised learning
CN114565457A (zh) 风险数据识别方法、装置、存储介质及电子设备
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
Sebt et al. Implementing a data mining solution approach to identify the valuable customers for facilitating electronic banking
Yang et al. An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity
Nazari et al. Evaluating the effectiveness of data mining techniques in credit scoring of bank customers using mathematical models: a case study of individual borrowers of Refah Kargaran Bank in Zanjan Province, Iran
CN114862563A (zh) 基于主成分分析和神经网络的中小信贷策略模型
Pang et al. WT combined early warning model and applications for loaning platform customers default prediction in smart city
CN114841239A (zh) 基于机器学习的上市公司财务异常分析方法
Lee et al. Application of machine learning in credit risk scorecard
Leevy et al. Assessing one-class and binary classification approaches for identifying medicare fraud
Khoraskani et al. Application and comparison of neural network, C5. 0, and classification and regression trees algorithms in the credit risk evaluation problem (case study: a standard German credit dataset)
Ayhan et al. Determining customer limits by data mining methods in credit allocation process
Adelabu et al. Credit Risk: Assessing Defaultability through Machine Learning Algorithms
Şakar Variable Importance Analysis in Default Prediction using Machine Learning Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination