CN116796909A - 一种司法诉讼风险预测方法、装置、设备及存储介质 - Google Patents
一种司法诉讼风险预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116796909A CN116796909A CN202311027466.6A CN202311027466A CN116796909A CN 116796909 A CN116796909 A CN 116796909A CN 202311027466 A CN202311027466 A CN 202311027466A CN 116796909 A CN116796909 A CN 116796909A
- Authority
- CN
- China
- Prior art keywords
- enterprises
- data
- enterprise
- risk
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000005096 rolling process Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000002372 labelling Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000011835 investigation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种司法诉讼风险预测方法、装置、设备及存储介质,涉及诉讼风险预测领域,包括:获取若干企业的数据并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用关系图谱对初始关系图卷积网络进行训练得到目标关系图卷积网络;利用目标关系图卷积网络对待检测企业进行司法诉讼风险预测得到预测概率,若预测概率大于预设阈值则判定待检测企业为高风险企业。本申请通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。
Description
技术领域
本发明涉及诉讼风险预测领域,特别涉及一种司法诉讼风险预测方法、装置、设备及存储介质。
背景技术
当前,众多学者利用AI(Artificial Intelligence,人工智能)技术对法律诉讼风险进行相关的研究,部分学者利用裁判文书并结合数据挖掘技术和机器学习算法,建立一个涉诉风险预警模型,对判决书进行风险评估和预测,从而提供智能化支持。同时,AI在法律问答、信息处理、文书制作、类案推送、案件分析、辅助裁判等方面的都有一定的作用和挑战,可以利用各种舆情获取技术对其进行分析,但对于司法诉讼风险预测的研究技术相对比较单一。
司法诉讼风险通常是一些企业的连锁反映状态,比如A企业如果发生重大司法案件,则相关的投资方对其进行起诉的可能性就会变高;另外,通常能披露的数据往往是上市公司的数据,其关联的通常是无披露数据的中小微企业。因此,传统的机器学习通常针对独立的单一个体进行风险的捕捉与预警,通常会筛选出该企业的众多风险特征,但很难利用其本身的特征,判别其是否存在风险。
发明内容
有鉴于此,本发明的目的在于提供一种司法诉讼风险预测方法、装置、设备及存储介质,能够通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。其具体方案如下:
第一方面,本申请提供了一种司法诉讼风险预测方法,包括:
获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;
基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;
利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;
利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
可选的,所述获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:
获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;
基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。
可选的,所述关联关系包括投资股权关系和担保关系。
可选的,所述获取若干企业的数据,包括:
获取若干企业的基本信息、征信数据和司法数据。
可选的,所述获取若干企业的数据之后,还包括:
对所述若干企业的数据中的数值型数据进行归一化;
和/或,对所述若干企业的数据中的类别型数据进行编码。
可选的,所述利用所述关系图谱对初始关系图卷积网络进行训练之前,还包括:
对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;
和/或,对所述关系图谱中不存在关联关系的企业进行剔除。
可选的,所述利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:
通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;
通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。
第二方面,本申请提供了一种司法诉讼风险预测装置,包括:
司法诉讼标注模块,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;
关系图谱构建模块,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;
网络训练模块,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;
诉讼风险预测模块,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现前述的司法诉讼风险预测方法。
第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的司法诉讼风险预测方法。
本申请中,获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。由此可见,本申请通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种司法诉讼风险预测方法流程图;
图2为本申请公开的一种关系图谱示意图;
图3为本申请公开的一种司法诉讼风险预测流程图;
图4为本申请公开的一种司法诉讼风险预测装置结构示意图;
图5为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的机器学习通常针对独立的单一个体进行风险的捕捉与预警,通常会筛选出该企业的众多风险特征,但很难利用其本身的特征,判别其是否存在风险。为此,本申请提供了一种司法诉讼风险预测方法,能够通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。
参见图1所示,本发明实施例公开了一种司法诉讼风险预测方法,包括:
步骤S11、获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注。
本实施例中,获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。其中,第二历史时间段为最近一个月的时间,第一历史时间段为最近一个月之前的两年时间。具体的,通过从历史案例、法律文书、新闻报道等多种数据源获取最近一个月之前的两年时间内的若干企业的数据,并对最近一个月内的若干企业的裁判文书进行采集。由于公开数据源中一般只记录了大企业的信息,因此能采集到裁判文书的只有少量企业,例如,获取第一历史时间段内约100万个企业的数据,在第二历史时间段内能采集到裁判文书的企业只有10万个左右。然后基于采集到的裁判文书对若干企业中相应的少量企业进行是否发生司法诉讼的标注,若发生司法诉讼,则标注为1;若未发生司法诉讼,则标注为0。其中,司法诉讼包括但不限于经济诉讼。
本实施例中,所述获取若干企业的数据,包括:获取若干企业的基本信息、征信数据和司法数据,然后对若干企业的数据中的数值型数据进行归一化;以及对若干企业的数据中的类别型数据进行编码。通过将数值型数据进行归一化以及将类别型数据进行编码,以便于后续用于关系图卷积网络进行学习。其中,对于若干企业的基本信息,是不会随着时间的变化而变化的,主要包括企业所在省份、注册资本、行业规模、行业类型等。对于若干企业的征信数据和司法数据,一般指的是企业在不同时间区间具有当前时间特点的数据,往往在不同时间点会发生某些变化,是具有一定的周期规律或自身特点的波动规律的数据。
本实施例中,企业的征信数据和司法数据包括企业不同时间点的变更信息、企业财务信息、企业软件著作权\专利信息、企业贷款信息、企业征信信息、企业负面舆情信息、企业被执行人信息、企业欠税以及税务违法信息、企业严重违规信息、企业历年来发生的司法诉讼信息、企业限制高消费信息等。其中,企业不同时间点的变更信息包括不同时间区间的变更次数、变更性质等,通常无故频繁变更的企业存在极高的法律诉讼风险。企业财务信息包括不同时间区间内企业的盈利额、亏损额、收益率等能反映企业财务状况或间接反映是否存在财务风险的指标。企业软件著作权\专利信息可以反映企业是否存在知识产权类的经济纠纷,通常情况下,相互合作的企业共享某些类似的专利技术时容易发生司法纠纷。企业欠税以及税务违法信息包括虚开***、恶意逃税等行为,税务违法的企业通常容易产生相关的司法诉讼。企业严重违规信息包括违反劳动法等行为,这些行为容易产生司法诉讼。企业历年来发生的司法诉讼信息包括历年的司法诉讼数量、性质、类型等,通常认为企业历史上发生诉讼数量越多,则未来发生诉讼可能性也越大。企业限制高消费信息包括企业是否存在被司法机关限制高消费等行为。企业负面舆情信息主要包括企业重大负面舆情数量、类型、舆情发生时间、舆情性质等。
步骤S12、基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱。
本实施例中,所述关联关系包括投资股权关系和担保关系,一般情况下,不同企业之间的经济纠纷,与企业自身的风险存在很大的关系,例如,如果A企业发生重大司法案件,则相关的投资方对其进行起诉的可能性就会变高。具体的,可以按照预设比例,例如7:3,将所有的已标注企业划分为训练集和验证集。由于具有裁判文书的企业只是少部分企业,因此对于关系图卷积网络(R-GCN,Relational Graph Convolutional Network)的训练采用半监督训练,也即基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各个企业之间的关联关系构建关系图谱,以作为训练集。图2即为一个关系图谱,其中,带斜线的圆圈表示存在司法诉讼的企业,带点的圆圈表示不存在司法诉讼的企业,各圆圈之间的边表示各个企业之间的关联关系。
步骤S13、利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络。
本实施例中,在利用关系图谱对初始关系图卷积网络进行训练之前,还包括:对关系图谱中不存在征信数据和司法数据的企业进行剔除;以及对关系图谱中不存在关联关系的企业进行剔除。可以理解的是,由于只具有基本信息的企业不具有参考性,例如,该企业只具有企业名称,因此可以将这些企业进行剔除;另外,对于不存在关联关系的企业也不具有参考性,需要将这些企业也进行剔除,从而得到新的关系图谱。然后利用关系图谱对初始关系图卷积网络进行半监督训练,并利用验证集对训练得到的关系图卷积网络进行验证,以选取具有最优参数的目标关系图卷积网络。
步骤S14、利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
本实施例中,利用目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:通过目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到待检测企业的向量表示;通过目标关系图卷积网络中的解码器并利用打分函数对待检测企业的向量表示进行司法诉讼风险预测,以得到待检测企业的预测概率。可以理解的是,编码器使用图卷积层结合待检测企业的数据,可以生成待检测企业的向量表示;解码器使用打分函数可以对待检测企业的向量表示进行司法诉讼风险的预测,以得到预测概率。例如,如果利用目标关系图卷积网络对图2中的A企业和B企业进行司法诉讼风险预测,由于A节点(企业)和B节点(企业)均会聚合周边节点的特征、关联关系以及邻居节点的邻居特征,最后对于A企业发生司法诉讼风险的预测概率会明显大于B企业。进一步的,通过设置一个概率阈值,例如0.6,当预测概率大于0.6时,则表明待检测企业极有可能发生司法诉讼风险但目前尚未发生,也即可以将待检测企业判定为高风险企业。其中,目标关系图卷积网络中涉及到的聚合函数公式如下:
;
需要说明的是,h表示神经网络隐藏层;表示激活函数;r表示关系;R表示关系集合;j表示节点i的邻居节点;/>表示节点i的关系为r的邻居节点集合;/>是一个正则化常量,其中/>的取值为/>;/>是线性转化函数,用于将同类型边的邻居节点,使用一个参数矩阵/>进行转化;/>表示节点i的第/>层节点表示;/>表示节点i的第/>层节点表示;/>表示节点i的邻居节点的第/>层节点表示;/>表示自身节点的特征权重矩阵。
由此可见,本申请通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
参见图3所示,本发明实施例公开了一种司法诉讼风险预测方法,包括:
获取最近一个月之前的两年时间内的若干企业的数据,并对最近一个月内的若干企业的裁判文书进行采集。利用专家规则并基于采集到的裁判文书对若干企业中相应的部分企业进行是否发生司法诉讼的标注,若发生司法诉讼,则标注为1;若未发生司法诉讼,则标注为0。然后利用特征工程对若干企业的数据中的数值型数据进行归一化,以及对若干企业的数据中的类别型数据进行编码。按照7:3的比例将所有已标注企业划分为训练集和验证集,对于训练集的构建,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各个企业之间的关联关系构建关系图谱,从而利用关系图谱对初始R-GCN进行半监督训练,并利用验证集对训练得到的R-GCN进行验证和评估,以选择具有最优参数的R-GCN作为目标R-GCN。
在得到目标R-GCN之后,利用目标R-GCN对待检测企业的数据以及与其他企业之间的关联关系进行司法诉讼风险预测,以得到待检测企业的预测概率。若预测概率大于预设概率阈值,则表明待检测企业发生司法诉讼的风险较高,也即待检测企业为高风险企业,然后可以将待检测企业存储到数据库中,从而方便用户查看高风险企业的信息。
由此可见,本申请通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
参见图4所示,本发明实施例公开了一种司法诉讼风险预测装置,包括:
司法诉讼标注模块11,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;
关系图谱构建模块12,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;
网络训练模块13,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;
诉讼风险预测模块14,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
由此可见,本申请通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
在一些具体实施例中,所述司法诉讼标注模块11,具体可以包括:
裁判文书采集单元,用于获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;
司法诉讼标注单元,用于基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。
在一些具体实施例中,所述司法诉讼标注模块11,具体可以包括:
数据获取单元,用于获取若干企业的基本信息、征信数据和司法数据。
在一些具体实施例中,所述司法诉讼风险预测装置,还可以包括:
数据归一化单元,用于对所述若干企业的数据中的数值型数据进行归一化;
数据编码单元,用于对所述若干企业的数据中的类别型数据进行编码。
在一些具体实施例中,所述司法诉讼风险预测装置,还可以包括:
第一企业剔除单元,用于对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;
第二企业剔除单元,用于对所述关系图谱中不存在关联关系的企业进行剔除。
在一些具体实施例中,所述诉讼风险预测模块14,具体可以包括:
特征向量提取单元,用于通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;
诉讼风险预测单元,用于通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。
进一步的,本申请实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备 20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的司法诉讼风险预测方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵 循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进 行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、 磁盘或者光盘等,其上所存储的资源可以包括操作***221、计算机程序222 等,存储方式可以是短暂存储或者永久存储。
其中,操作***221用于管理与控制电子设备20上的各硬件设备以及计算 机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的司法诉讼风险预测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的司法诉讼风险预测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种司法诉讼风险预测方法,其特征在于,包括:
获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;
基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;
利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;
利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
2.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:
获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;
基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。
3.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述关联关系包括投资股权关系和担保关系。
4.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据,包括:
获取若干企业的基本信息、征信数据和司法数据。
5.根据权利要求4所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据之后,还包括:
对所述若干企业的数据中的数值型数据进行归一化;
和/或,对所述若干企业的数据中的类别型数据进行编码。
6.根据权利要求5所述的司法诉讼风险预测方法,其特征在于,所述利用所述关系图谱对初始关系图卷积网络进行训练之前,还包括:
对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;
和/或,对所述关系图谱中不存在关联关系的企业进行剔除。
7.根据权利要求1至6任一项所述的司法诉讼风险预测方法,其特征在于,所述利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:
通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;
通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。
8.一种司法诉讼风险预测装置,其特征在于,包括:
司法诉讼标注模块,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;
关系图谱构建模块,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;
网络训练模块,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;
诉讼风险预测模块,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的司法诉讼风险预测方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的司法诉讼风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027466.6A CN116796909A (zh) | 2023-08-16 | 2023-08-16 | 一种司法诉讼风险预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027466.6A CN116796909A (zh) | 2023-08-16 | 2023-08-16 | 一种司法诉讼风险预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116796909A true CN116796909A (zh) | 2023-09-22 |
Family
ID=88049928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311027466.6A Pending CN116796909A (zh) | 2023-08-16 | 2023-08-16 | 一种司法诉讼风险预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796909A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9552548B1 (en) * | 2016-07-01 | 2017-01-24 | Intraspexion Inc. | Using classified text and deep learning algorithms to identify risk and provide early warning |
CN109272202A (zh) * | 2018-08-24 | 2019-01-25 | 中国科学院大学 | 一种基于卷积神经网络的企业信用评级方法及*** |
CN109829631A (zh) * | 2019-01-14 | 2019-05-31 | 北京中兴通网络科技股份有限公司 | 一种基于记忆网络的企业风险预警分析方法及*** |
CN111222681A (zh) * | 2019-11-05 | 2020-06-02 | 量子数聚(北京)科技有限公司 | 用于企业破产风险预测的数据处理方法以及装置、设备、存储介质 |
CN113011961A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 公司关联信息风险监测方法、装置、设备及存储介质 |
CN114118089A (zh) * | 2021-11-01 | 2022-03-01 | 上海生腾数据科技有限公司 | 一种基于裁判文书的企业司法诉讼关系的构建方法及*** |
CN114970926A (zh) * | 2021-02-26 | 2022-08-30 | 中国科学院微电子研究所 | 一种模型训练方法、企业经营风险预测方法和装置 |
-
2023
- 2023-08-16 CN CN202311027466.6A patent/CN116796909A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9552548B1 (en) * | 2016-07-01 | 2017-01-24 | Intraspexion Inc. | Using classified text and deep learning algorithms to identify risk and provide early warning |
CN109272202A (zh) * | 2018-08-24 | 2019-01-25 | 中国科学院大学 | 一种基于卷积神经网络的企业信用评级方法及*** |
CN109829631A (zh) * | 2019-01-14 | 2019-05-31 | 北京中兴通网络科技股份有限公司 | 一种基于记忆网络的企业风险预警分析方法及*** |
CN111222681A (zh) * | 2019-11-05 | 2020-06-02 | 量子数聚(北京)科技有限公司 | 用于企业破产风险预测的数据处理方法以及装置、设备、存储介质 |
CN113011961A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 公司关联信息风险监测方法、装置、设备及存储介质 |
CN114970926A (zh) * | 2021-02-26 | 2022-08-30 | 中国科学院微电子研究所 | 一种模型训练方法、企业经营风险预测方法和装置 |
CN114118089A (zh) * | 2021-11-01 | 2022-03-01 | 上海生腾数据科技有限公司 | 一种基于裁判文书的企业司法诉讼关系的构建方法及*** |
Non-Patent Citations (1)
Title |
---|
焦李成等: "《现代机器学习 第1版》", 西安:西安电子科学技术大学出版社, pages: 213 - 218 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9483544B2 (en) | Systems and methods for calculating category proportions | |
CN112182246B (zh) | 通过大数据分析建立企业画像的方法、***、介质及应用 | |
CN110674970A (zh) | 企业法务风险预警方法、装置、设备及可读存储介质 | |
CN113657993B (zh) | 信用风险识别方法、装置、设备及存储介质 | |
CN112990281A (zh) | 异常投标识别模型训练方法、异常投标识别方法及装置 | |
CN113592287A (zh) | 风险评估方法和装置 | |
CN114860882A (zh) | 一种基于文本分类模型的公平竞争审查辅助方法 | |
CN113723737A (zh) | 一种基于企业画像的政策匹配方法、装置、设备及介质 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
Sietsma et al. | The next generation of machine learning for tracking adaptation texts | |
CN112365344B (zh) | 一种业务规则自动生成方法和*** | |
CN114092230A (zh) | 一种数据处理方法、装置、电子设备及计算机可读介质 | |
CN112434862B (zh) | 上市企业财务困境预测方法及装置 | |
CN115982646B (zh) | 一种基于云平台的多源测试数据的管理方法及*** | |
Aly et al. | Machine Learning Algorithms and Auditor’s Assessments of the Risks Material Misstatement: Evidence from the Restatement of Listed London Companies | |
Hart et al. | Accuracy and power analysis of social networks built from count data | |
CN111738610A (zh) | 一种基于舆情数据的企业流失性风险预警***和方法 | |
CN111353728A (zh) | 一种风险分析方法和*** | |
CN116596662A (zh) | 基于企业舆情信息的风险预警的方法、装置、电子设备和介质 | |
CN116166999A (zh) | 异常交易数据识别方法、装置、计算机设备及存储介质 | |
CN112712270B (zh) | 信息处理方法、装置、设备及存储介质 | |
CN114493853A (zh) | 信用等级评价方法、装置、电子设备及存储介质 | |
CN113742495B (zh) | 基于预测模型的评级特征权重确定方法及装置、电子设备 | |
CN116796909A (zh) | 一种司法诉讼风险预测方法、装置、设备及存储介质 | |
Bright et al. | Explaining download patterns in open government data: citizen participation or private enterprise? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |