CN113849580A - 一种主体评级预测方法、装置、电子设备及存储介质 - Google Patents

一种主体评级预测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113849580A
CN113849580A CN202111143690.2A CN202111143690A CN113849580A CN 113849580 A CN113849580 A CN 113849580A CN 202111143690 A CN202111143690 A CN 202111143690A CN 113849580 A CN113849580 A CN 113849580A
Authority
CN
China
Prior art keywords
node
neural network
graph
rating
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111143690.2A
Other languages
English (en)
Inventor
刘静蕾
张雷
汪子芃
连代星
张莹莹
庞德智
王顺利
程仕湘
李胜男
尹洋标
袁东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianhong Asset Management Co ltd
Original Assignee
Tianhong Asset Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianhong Asset Management Co ltd filed Critical Tianhong Asset Management Co ltd
Priority to CN202111143690.2A priority Critical patent/CN113849580A/zh
Publication of CN113849580A publication Critical patent/CN113849580A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种主体评级预测方法、装置、电子设备及存储介质,该方法包括:获取目标主体的节点标识;从知识图谱中查询节点标识对应的目标主体节点;使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。通过从知识图谱中查询所述节点标识对应的目标主体节点,并使用预先训练的图卷积神经网络模型对所述目标主体节点进行分类评级预测,获得所述目标主体节点的分类评级,避免了使用传统的回归模型或者多种回归集成算法来预测分类评级,使用图卷积神经网络模型能够更加注意发债主体的关联公司的影响和风险,从而有效地提高了对发债主体进行评级的准确率。

Description

一种主体评级预测方法、装置、电子设备及存储介质
技术领域
本申请实施例涉及深度学习和知识图谱的技术领域,具体而言,涉及一种主体评级预测方法、装置、电子设备及存储介质。
背景技术
主体评级,是指以企业、公司或个人等等经济主体为对象进行的信用相关的分类评级,具体例如:主体信用评级、发债/债务/债券评级、贷款评级或者交易评级等等。
目前的主体评级方法大部分都是,基于传统的回归模型或者多种回归集成算法等等,根据发债公司的财务指标或者基本经营状况等信息数据,使用各类回归模型并结合集成算法对这些信息数据进行计算,以此来预测发债公司的分类评级,从而评估该发债主体的违约风险。
发明内容
本申请实施例的目的在于提供一种主体评级预测方法、装置、电子设备及存储介质,用于改善对发债主体进行评级的准确率不足的问题。
本申请实施例提供了一种主体评级预测方法,包括:获取目标主体的节点标识;从知识图谱中查询节点标识对应的目标主体节点;使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。在上述的实现过程中,通过从知识图谱中查询节点标识对应的目标主体节点,并使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级,避免了使用传统的回归模型或者多种回归集成算法来预测分类评级,使用图卷积神经网络模型能够更加注意发债主体的关联公司的影响和风险,从而有效地提高了对发债主体进行评级的准确率。
可选地,在本申请实施例中,使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,包括:获取目标主体节点的特征数据和关系数据;使用图卷积神经网络模型根据目标主体节点的特征数据和关系数据,对目标主体节点进行分类评级预测。在上述的实现过程中,通过使用图卷积神经网络模型根据目标主体节点的特征数据和关系数据,对目标主体节点进行分类评级预测,避免了使用传统的回归模型或者多种回归集成算法来预测分类评级,使用图卷积神经网络模型能够更加注意发债主体的关联公司的影响和风险,从而有效地提高了对发债主体进行评级的准确率。
可选地,在本申请实施例中,在从知识图谱中查询节点标识对应的目标主体节点之前,还包括:以目标主体的节点标识为节点,以目标主体之间关系数据为边,以目标主体的特征数据作为节点的特征,建立知识图谱。在上述的实现过程中,使用知识图谱中的样本节点的分类评级、特征数据和关系数据来训练图卷积神经网络模型,并使用图卷积神经网络模型来对发债主体进行评级,从而提高了图卷积神经网络模型对发债主体进行评级的准确率。
可选地,在本申请实施例中,在建立知识图谱之后,还包括:获取图卷积神经网络;使用图卷积神经网络对知识图谱中的边的权重值进行重构。在上述的实现过程中,通过使用图卷积神经网络对知识图谱中的边的权重值进行重构,并使用知识图谱中的样本节点的分类评级、特征数据和关系数据来训练图卷积神经网络模型,并使用图卷积神经网络模型来对发债主体进行评级,从而提高了图卷积神经网络模型对发债主体进行评级的准确率。
可选地,在本申请实施例中,在使用图卷积神经网络对知识图谱中的边进行重构之后,还包括:获取多个样本节点的分类评级,以及每个样本节点的特征数据和关系数据;以多个样本节点的特征数据和关系数据为训练数据,以多个样本节点的分类评级为训练标签,对图卷积神经网络进行训练,获得图卷积神经网络模型。在上述的实现过程中,通过以多个样本节点的特征数据和关系数据为训练数据,以多个样本节点的分类评级为训练标签,对图卷积神经网络进行训练,并使用训练获得的图卷积神经网络模型来对发债主体进行评级,从而提高了图卷积神经网络模型对发债主体进行评级的准确率。
可选地,在本申请实施例中,对图卷积神经网络进行训练,包括:使用图卷积神经网络根据样本节点的特征数据和关系数据,对样本节点的分类评级进行预测,获得样本节点的预测评级;计算样本节点的预测评级与样本节点的分类评级之间的损失值;根据损失值对图卷积神经网络进行训练。
可选地,在本申请实施例中,在对图卷积神经网络进行训练之前,还包括:对图卷积神经网络中的卷积核进行修改。在上述的实现过程中,通过对图卷积神经网络中的卷积核进行修改,可以使得图卷积神经网络模型更具有现实意义,提高了图卷积神经网络模型对主体评级进行预测的准确率。
本申请实施例还提供了一种主体评级预测装置,包括:节点标识获取模块,用于获取目标主体的节点标识;目标节点查询模块,用于从知识图谱中查询节点标识对应的目标主体节点;分类评级获得模块,用于使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。
可选地,在本申请实施例中,分类评级获得模块,包括:特征关系获取模块,用于获取目标主体节点的特征数据和关系数据;分类评级预测模块,用于使用图卷积神经网络模型根据目标主体节点的特征数据和关系数据,对目标主体节点进行分类评级预测。
可选地,在本申请实施例中,主体评级预测装置,还包括:知识图谱建立模块,用于以目标主体的节点标识为节点,以目标主体之间关系数据为边,以目标主体的特征数据作为节点的特征,建立知识图谱。
可选地,在本申请实施例中,主体评级预测装置,还包括:图卷积网络获取模块,用于获取图卷积神经网络;边权重值重构模块,用于使用图卷积神经网络对知识图谱中的边的权重值进行重构。
可选地,在本申请实施例中,主体评级预测装置,还包括:训练数据获取模块,用于获取多个样本节点的分类评级,以及每个样本节点的特征数据和关系数据;网络模型获得模块,用于以多个样本节点的特征数据和关系数据为训练数据,以多个样本节点的分类评级为训练标签,对图卷积神经网络进行训练,获得图卷积神经网络模型。
可选地,在本申请实施例中,网络模型获得模块,包括:分类评级预测模块,用于使用图卷积神经网络根据样本节点的特征数据和关系数据,对样本节点的分类评级进行预测,获得样本节点的预测评级;评级损失计算模块,用于计算样本节点的预测评级与样本节点的分类评级之间的损失值;根据损失值对图卷积神经网络进行训练。
可选地,在本申请实施例中,主体评级预测装置,还包括:卷积核修改模块,用于对图卷积神经网络中的卷积核进行修改。
本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上面描述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请实施例的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出的本申请实施例提供的主体评级预测方法的流程示意图;
图2示出的本申请实施例提供的构建的知识图谱的示意图;
图3示出的本申请实施例提供的构建的重构边的权重值的示意图;
图4示出的本申请实施例提供的训练图卷积神经网络的流程示意图;
图5示出的本申请实施例提供的主体评级预测装置的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请实施例的实施例的详细描述并非旨在限制要求保护的本申请实施例的范围,而是仅仅表示本申请实施例的选定实施例。基于本申请实施例的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请实施例保护的范围。
在介绍本申请实施例提供的主体评级预测方法之前,先介绍本申请实施例中所涉及的一些概念:
知识图谱(Knowledge Graph),是指将知识按照一定规律联系在一起,并能够以图谱的形式展现的方法或工具,在图书情报界称为知识域可视化知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
图卷积神经网络(Graph Convolutional Network,GCN),是指针对非欧几里德结构(Non Euclidean Structure)的拓扑关系数据进行处理的卷积神经网络。此处的非欧几里德结构的拓扑关系数据例如:社交网络中的组织与组织或者人与人构成的拓扑关系数据,信息网络中的路由器与路由器或者交换机与交换机构成的拓扑关系数据等等。
需要说明的是,本申请实施例提供的主体评级预测方法可以被电子设备执行,这里的电子设备是指具有执行计算机程序功能的设备终端或者上述的服务器,设备终端例如:智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personaldigital assistant,PDA)或者移动上网设备(mobile Internet device,MID)等。服务器例如:x86服务器以及非x86服务器,非x86服务器包括:大型机、小型机和UNIX服务器。
下面介绍该主体评级预测方法适用的应用场景,这里的应用场景包括但不限于金融风险防控领域,具体例如:对公司或者个人进行主体信用评级、发债评级、债务评级、债券评级、贷款评级或者交易评级等等。可以注意到的是,实际应用场景中的信用债违约不仅和发债主体本身的财务或基本面情况有关,也与发债主体的股东、控股公司、担保公司、有共同高管的公司等关联公司甚至于关联公司的关联公司密切相关。传统违约模型只考虑了发债主体本身的财务状况、经营状况等因素,忽略了关联公司对发债主体的负面影响,所以这种方式对发债主体进行评级的准确率较低。
请参见图1示出的本申请实施例提供的主体评级预测方法的流程示意图;该主体评级预测方法的主要思路是,通过从知识图谱中查询节点标识对应的目标主体节点,并使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级,避免了使用传统的回归模型或者多种回归集成算法来预测分类评级,使用图卷积神经网络模型能够更加注意发债主体的关联公司的影响和风险,从而有效地提高了对发债主体进行评级的准确率。上述主体评级预测方法可以包括:
步骤S110:获取目标主体的节点标识。
目标主体是指以企业、公司或个人(个体经营或者个体户)等等经济主体;目标主体的节点标识是指目标主体在知识图谱上的节点唯一标识,此处企业的公司可以使用的节点标识包括但不限于:公司名称(企业名称)、组织机构代码、统一社会信用代码或者纳税人识别号等等。
上述步骤S110的实施方式有很多种,包括但不限于:第一种获得方式,接收其它终端设备发送的目标主体的节点标识,将目标主体的节点标识存储至文件***、数据库或移动存储设备中;第二种获得方式,获取预先存储的目标主体的节点标识,具体例如:从文件***中获取目标主体的节点标识,或者从数据库中获取目标主体的节点标识,或者从移动存储设备中获取目标主体的节点标识;第三种获得方式,使用浏览器等软件获取互联网上的目标主体的节点标识,或者使用其它应用程序访问互联网获得目标主体的节点标识。
在步骤S110之后,执行步骤S120:从知识图谱中查询节点标识对应的目标主体节点。
可以理解的是,在使用知识图谱之前,还需要构建知识图谱,构建知识图谱的过程太复杂,因此,将建知识图谱的过程放在后面详细地描述。
在步骤S120之后,执行步骤S130:使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。
上述步骤S130的实施方式可以包括:使用图卷积神经网络模型获取目标主体节点的特征数据和关系数据。使用图卷积神经网络模型根据目标主体节点的特征数据和关系数据,对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。可选地,在获得目标主体节点的分类评级之后,还可以根据该分类评级来评估目标主体的违约风险,即评估目标主体的违约概率。
在上述的实现过程中,通过从知识图谱中查询节点标识对应的目标主体节点,并使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级,避免了使用传统的回归模型或者多种回归集成算法来预测分类评级,使用图卷积神经网络模型能够更加注意发债主体的关联公司的影响和风险,从而有效地提高了对发债主体进行评级的准确率。
可以理解的是,在使用知识图谱之前,还需要构建知识图谱,构建知识图谱的过程可以包括:
步骤S121:获取目标主体的节点标识和特征数据,以及目标主体与目标主体之间的关系数据。
上述步骤S121的实施方式例如:此处以公司或者企业作为目标主体,目标主体的节点标识可以选择公司名称(企业名称)、组织机构代码、统一社会信用代码或者纳税人识别号等等。特征数据是指公司或者企业等目标主体的属性数据,例如:资产负债率、存货周转率、应收账款/总资产、授信额度降幅、员工人数、裁判文书败诉金额、注册地址、官网地址、邮箱地址、法定代表人和公司企业简介等等数据。目标主体与目标主体之间的关系数据例如:股权关系(持股比例)、担保关系(担保金额/净资产)、质押关系(质押金额/净资产)、共同高管和共同股东等等。
可选地,在获取关系数据、节点标识和特征数据之后,还可以对这些数据进行预处理,预处理的具体例如:通过将企业的财务情况和经营情况以及其关联方的状况作为影响隐含评级判定的因素,并根据筛选的发债主体以及关联公司的公开财务指标、经营状况指标等加工相关因子,对于知识图谱中的节点特征数据,按照预设逻辑规则来填补因子中的缺失值,并对填补后的因子进行变换,具体变换操作包括计算行业因子排名百分比,计算因子相对去年同期变化值以及计算变化值排名百分比。上述的预设逻辑规则是指针对知识图谱中的不同类型的数据处理方式不同,针对连续型数据,可以获取行业排名百分比,针对离散型数据,可以采用原数据作为节点特征等等。针对关系数据,股权关系使用持股比例作为边的权重,担保关系使用担保金额/被担保公司的总资本作为边的权重,质押关系使用质押金额/出质公司的总资本作为边的权重。针对知识图谱中的边的权重值进行重构例如:如果第一公司和第二公司之间有多条关系的边,则可以将多条关系的合并为一条边,并取多条关系的最大权重作为边权重。
步骤S122:以目标主体的节点标识为节点,以目标主体之间关系数据为边,以目标主体的特征数据作为节点的特征,建立知识图谱。
请参见图2示出的本申请实施例提供的构建的知识图谱的示意图;上述步骤S122的实施方式例如:以目标主体的节点标识为节点(表示为
Figure BDA0003284937100000091
),以目标主体之间关系数据为边(表示为ε),以目标主体的特征数据作为节点的特征(表示为
Figure BDA0003284937100000092
),使用关系型数据库来建立知识图谱,此处的知识图谱可以表示为
Figure BDA0003284937100000093
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
可选地,在建立知识图谱之后,还可以对知识图谱中的边的权重值进行重构,权重值重构的过程可以包括:
步骤S123:获取图卷积神经网络。
上述步骤S123的实施方式有很多种,包括但不限于:第一种方式,从头开始构建图卷积神经网络,具体例如:获取图数据,图数据包括:公司与公司之间持股、担保、质押、上下游等关系和公司与自然人之间持股、法定代表人、高管、实控人等关系;然后,从图数据中提取特征,使用这些特征进行节点分类(node classification)、图分类(graphclassification)、边预测(link prediction)等等操作后,获得图卷积神经网络。第二种方式,获取预先存储的图卷积神经网络,具体例如:从文件***中获取图卷积神经网络,或者从数据库中获取图卷积神经网络,或者从移动存储设备中获取图卷积神经网络;第三种方式,使用浏览器等软件获取互联网上的图卷积神经网络,或者使用其它应用程序访问互联网获得图卷积神经网络。
步骤S124:使用图卷积神经网络对知识图谱中的边的权重值进行重构。
上述步骤S124的实施方式例如:由于知识图谱中的部分边的权重不确定,可以通过图神经网络的对比学习方式来对知识图谱中的部分边的权重值进行重构;具体地,给定一个知识图谱
Figure BDA0003284937100000101
获得的图神经网络表示为fθ,那么可以通过最大化该图神经网络模型的可能性p(G;θ)来对知识图谱中的边的权重值进行重构,这个过程可以表示为θ*=maxθp(G;θ)。上述该图神经网络模型的可能性p(G;θ)的具体技术过程例如:在获知该模型fθ和知识图谱中的所有节点的排列组合π的情况下,图神经网络的分布等于所有排列组合的下的预期概率,也就是说,可以使用公式表示为p(G;θ)=Eπ[pθ(Xπ,Eπ)];其中,Xπ表示不同排列组合的节点分类,Eπ表示不同排列组合的边。然后,将pθ(X,E)的进行对数拆分,得到
Figure BDA0003284937100000102
Figure BDA0003284937100000103
由此可得,
Figure BDA0003284937100000104
Figure BDA0003284937100000105
其中,Ei,o表示知识图谱中已知的边,
Figure BDA0003284937100000106
表示知识图谱中未知的边。通过上面的方式可以将上面的问题拆分成两部分,一是给定边,生成节点分类,二是给定边和生成的节点分类,生成剩余的边。
请参见图3示出的本申请实施例提供的构建的重构边的权重值的示意图;第一子图中有A、B、C和D四个节点,其中节点方向包括:A到B的边、A到C的边、A到D的边、B到D的边。首先,参照第二子图,可以抹去B到D的边,将剩下的边(A到B的边、A到C的边、A到D的边)作为已知的边。其次,使用已知的边(A到B的边、A到C的边、A到D的边)生成节点D的分类(即主体评级),根据节点D的分类来获取当前节点D的分类与其相邻节点(节点A和节点B)的关系。然后,使用图卷积神经网络根据已知的边(A到B的边、A到C的边、A到D的边)和生成的节点分类预测抹去的边(即B到D的边)权重,从而获取到节点D分类与抹去的边(即B到D的边)的关系权重。
请参见图4示出的本申请实施例提供的训练图卷积神经网络的流程示意图;可以理解的是,在使用图卷积神经网络模型进行分类预测之前,还需要先对图卷积神经网络模型进行训练,训练图卷积神经网络模型的过程可以包括:
步骤S210:获取多个样本节点的分类评级,以及每个样本节点的特征数据和关系数据。
上述步骤S210的实施方式例如:上述的样本节点的分类评级和样本节点的特征数据和关系数据可以分开获取,具体例如:人工的搜集样本节点的分类评级,并人工地识别样本节点的分类评级的样本节点的特征数据和关系数据;当然,也可以将样本节点的分类评级和样本节点的特征数据和关系数据打包为训练数据集一起获取,这里以训练数据集一起获取为例进行说明。训练数据集的获得方式包括:第一种获得方式,接收其它终端设备发送的训练数据集,将训练数据集存储至文件***、数据库或移动存储设备中;第二种获得方式,获取预先存储的训练数据集,具体例如:从文件***中获取训练数据集,或者从数据库中获取训练数据集,或者从移动存储设备中获取训练数据集;第三种获得方式,使用浏览器等软件获取互联网上的训练数据集,或者使用其它应用程序访问互联网获得训练数据集。
在步骤S210之后,执行步骤S220:以多个样本节点的特征数据和关系数据为训练数据,以多个样本节点的分类评级为训练标签,对图卷积神经网络进行训练,获得图卷积神经网络模型。
上述步骤S220的实施方式可以包括:使用图卷积神经网络根据样本节点的特征数据和关系数据,对样本节点的分类评级进行预测,获得样本节点的预测评级。使用交叉熵损失(Cross Entropy Loss,CELoss或者CeLoss)函数计算样本节点的预测评级与样本节点的分类评级之间的损失值。根据损失值对图卷积神经网络进行训练,获得图卷积神经网络模型。
可选地,在对图卷积神经网络进行训练之前,还可以对图卷积神经网络中的卷积核进行修改,修改的具体方式例如:对图卷积神经网络的卷积核进行优化,使用的卷积计算公式为Hl+1=σ(L′HlWl),其中L′=(In-A)Cn,Cn表示由知识图谱中的特征数据中由注册资本组成的对角线矩阵,Wl为第l层的权重参数矩阵,σ(·)为非线性激活函数,Hl为第l隐含层的输入值,A关系临接矩阵,I是单位矩阵。可以注意到的是,常见的图神经网络中卷积计算公式为Hl+1=σ(LsymHlWl),其中
Figure BDA0003284937100000121
Figure BDA0003284937100000122
Wl为第l层的权重参数矩阵,σ(·)为非线性激活函数,Hl为第l层输入,D为度矩阵,A为邻接矩阵。这一卷积方法是为了引入自身度矩阵,解决没有考虑自身节点信息自传递的问题,同时对邻接矩阵的归一化操作,通过对邻接矩阵两边乘以节点的度开方然后取逆得到,以使不同节点具有同样的影响力。然而,在实际研究过程中发现公司的权重并不是一样的,注册资本更高、关系越多的公司往往具有越高的影响力,因此这样的归一化方式与实际经济意义不相符。因此,对图卷积神经网络中的卷积核进行修改,可以使得图卷积神经网络模型更具有现实意义,提高了图卷积神经网络模型对主体评级进行预测的准确率。
请参见图5示出的本申请实施例提供的主体评级预测装置的结构示意图。本申请实施例提供了一种主体评级预测装置300,包括:
节点标识获取模块310,用于获取目标主体的节点标识。
目标节点查询模块320,用于从知识图谱中查询节点标识对应的目标主体节点。
分类评级获得模块330,用于使用预先训练的图卷积神经网络模型对目标主体节点进行分类评级预测,获得目标主体节点的分类评级。
可选地,在本申请实施例中,分类评级获得模块,包括:
特征关系获取模块,用于获取目标主体节点的特征数据和关系数据。
分类评级预测模块,用于使用图卷积神经网络模型根据目标主体节点的特征数据和关系数据,对目标主体节点进行分类评级预测。
可选地,在本申请实施例中,主体评级预测装置,还包括:
知识图谱建立模块,用于以目标主体的节点标识为节点,以目标主体之间关系数据为边,以目标主体的特征数据作为节点的特征,建立知识图谱。
可选地,在本申请实施例中,该主体评级预测装置,还包括:
图卷积网络获取模块,用于获取图卷积神经网络。
边权重值重构模块,用于使用图卷积神经网络对知识图谱中的边的权重值进行重构。
可选地,在本申请实施例中,该主体评级预测装置,还可以包括:
训练数据获取模块,用于获取多个样本节点的分类评级,以及每个样本节点的特征数据和关系数据。
网络模型获得模块,用于以多个样本节点的特征数据和关系数据为训练数据,以多个样本节点的分类评级为训练标签,对图卷积神经网络进行训练,获得图卷积神经网络模型。
可选地,在本申请实施例中,网络模型获得模块,包括:
分类评级预测模块,用于使用图卷积神经网络根据样本节点的特征数据和关系数据,对样本节点的分类评级进行预测,获得样本节点的预测评级。
评级损失计算模块,用于计算样本节点的预测评级与样本节点的分类评级之间的损失值。
根据损失值对图卷积神经网络进行训练。
可选地,在本申请实施例中,该主体评级预测装置还可以包括:
卷积核修改模块,用于对图卷积神经网络中的卷积核进行修改。
应理解的是,该装置与上述的主体评级预测方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作***(operating system,OS)中的软件功能模块。
本申请实施例提供的一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上的方法。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上的方法。其中,计算机可读存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以和附图中所标注的发生顺序不同。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这主要根据所涉及的功能而定。
另外,在本申请实施例中的各个实施例的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (10)

1.一种主体评级预测方法,其特征在于,包括:
获取目标主体的节点标识;
从知识图谱中查询所述节点标识对应的目标主体节点;
使用预先训练的图卷积神经网络模型对所述目标主体节点进行分类评级预测,获得所述目标主体节点的分类评级。
2.根据权利要求1所述的方法,其特征在于,所述使用预先训练的图卷积神经网络模型对所述目标主体节点进行分类评级预测,包括:
获取所述目标主体节点的特征数据和关系数据;
使用所述图卷积神经网络模型根据所述目标主体节点的特征数据和关系数据,对所述目标主体节点进行分类评级预测。
3.根据权利要求1所述的方法,其特征在于,在所述从知识图谱中查询所述节点标识对应的目标主体节点之前,还包括:
以目标主体的节点标识为节点,以目标主体之间关系数据为边,以目标主体的特征数据作为节点的特征,建立所述知识图谱。
4.根据权利要求3所述的方法,其特征在于,在所述建立所述知识图谱之后,还包括:
获取图卷积神经网络;
使用所述图卷积神经网络对所述知识图谱中的边的权重值进行重构。
5.根据权利要求4所述的方法,其特征在于,在所述使用所述图卷积神经网络对所述知识图谱中的边进行重构之后,还包括:
获取多个样本节点的分类评级,以及每个所述样本节点的特征数据和关系数据;
以所述多个样本节点的特征数据和关系数据为训练数据,以所述多个样本节点的分类评级为训练标签,对所述图卷积神经网络进行训练,获得所述图卷积神经网络模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述图卷积神经网络进行训练,包括:
使用所述图卷积神经网络根据所述样本节点的特征数据和关系数据,对所述样本节点的分类评级进行预测,获得所述样本节点的预测评级;
计算所述样本节点的预测评级与所述样本节点的分类评级之间的损失值;
根据所述损失值对所述图卷积神经网络进行训练。
7.根据权利要求5所述的方法,其特征在于,在所述对所述图卷积神经网络进行训练之前,还包括:
对图卷积神经网络中的卷积核进行修改。
8.一种主体评级预测装置,其特征在于,包括:
节点标识获取模块,用于获取目标主体的节点标识;
目标节点查询模块,用于从知识图谱中查询所述节点标识对应的目标主体节点;
分类评级获得模块,用于使用预先训练的图卷积神经网络模型对所述目标主体节点进行分类评级预测,获得所述目标主体节点的分类评级。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法。
CN202111143690.2A 2021-09-28 2021-09-28 一种主体评级预测方法、装置、电子设备及存储介质 Pending CN113849580A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111143690.2A CN113849580A (zh) 2021-09-28 2021-09-28 一种主体评级预测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111143690.2A CN113849580A (zh) 2021-09-28 2021-09-28 一种主体评级预测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113849580A true CN113849580A (zh) 2021-12-28

Family

ID=78980305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111143690.2A Pending CN113849580A (zh) 2021-09-28 2021-09-28 一种主体评级预测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113849580A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227939A (zh) * 2023-05-04 2023-06-06 深圳市迪博企业风险管理技术有限公司 基于图卷积神经网络和em算法的企业信用评级方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227939A (zh) * 2023-05-04 2023-06-06 深圳市迪博企业风险管理技术有限公司 基于图卷积神经网络和em算法的企业信用评级方法和装置

Similar Documents

Publication Publication Date Title
CN107945024B (zh) 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
US11763403B2 (en) Systems and methods for automated assessment for remediation and/or redevelopment of brownfield real estate
CN110704730A (zh) 基于大数据的产品数据推送方法、***及计算机设备
CN113657993B (zh) 信用风险识别方法、装置、设备及存储介质
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及***
CN112163963A (zh) 业务推荐方法、装置、计算机设备和存储介质
US9858526B2 (en) Method and system using association rules to form custom lists of cookies
CN110796269A (zh) 一种生成模型的方法、装置、信息处理的方法及装置
Yang et al. Improvement of e-government service process via a grey relation agent mechanism
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN113849580A (zh) 一种主体评级预测方法、装置、电子设备及存储介质
Neumann et al. Machine Learning-based predictions of customers’ decisions in car insurance
US20220215142A1 (en) Extensible Agents in Agent-Based Generative Models
CN114897607A (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN115439079A (zh) 项目分类方法及装置
CN114493853A (zh) 信用等级评价方法、装置、电子设备及存储介质
CN114693428A (zh) 数据确定方法、装置、计算机可读存储介质及电子设备
CN114170000A (zh) ***用户风险类别识别方法、装置、计算机设备和介质
US11004156B2 (en) Method and system for predicting and indexing probability of financial stress
CN112116253A (zh) 一种中心网点选择的方法、装置和***
US20200342302A1 (en) Cognitive forecasting
CN113837677A (zh) 物流线路生成策略的确定方法、装置以及设备
Hassannezhad et al. Dynamic modelling of relationships in complex service design systems
CN111882339B (zh) 预测模型训练及响应率预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination