CN117495538A

CN117495538A - 订单融资的风险性评估方法和模型训练方法

Info

Publication number: CN117495538A
Application number: CN202311423786.3A
Authority: CN
Inventors: 祝捷; 孙杰; 黄聪; 陈灏; 王悦
Original assignee: Beijing Ronghe Cloud Chain Technology Co ltd
Current assignee: Beijing Ronghe Cloud Chain Technology Co ltd
Priority date: 2023-10-30
Filing date: 2023-10-30
Publication date: 2024-02-02

Abstract

本公开提出了一种订单融资的风险性评估方法和模型训练方法，涉及自然语言处理、深度学习技术领域，该方法包括：获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词；将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。由此，可以自动生成待融资订单的风险性评估报告，并可以降低人力资源成本，且可以有效避免因为人的主观性导致的风险性评估报告的不准确的问题。

Description

订单融资的风险性评估方法和模型训练方法

技术领域

本公开涉及自然语言处理、深度学习技术领域，尤其涉及一种订单融资的风险性评估方法、知识图谱模型的训练方法和语言模型的训练方法。

背景技术

随着全球经济的快速发展，企业在市场竞争中越来越需要灵活的资金支持来满足订单的执行需求。订单融资作为一种供应链金融模式，为企业提供了一种有效的融资方式，可以帮助企业解决***的问题，提高企业的竞争力。

供应商，指的是为核心企业提供原材料的上游企业；订单融资是指供应商通过将未来的订单质押给金融机构，以获得资金支持来满足订单的生产和交付需求的一种融资方式。

其中，订单融资的特点主要包括以下几个方面：

1.高度灵活：订单融资可以根据企业的具体需求来制定融资方案，包括融资金额、期限等。同时，订单融资还可以根据订单的具体情况进行调整，满足企业在不同阶段的资金需求。

2.高效快速：订单融资通常采用线上平台进行操作和管理，可以大大缩短融资流程和提高融资效率。通过订单融资，企业可以迅速获得所需资金，提高订单的执行速度。

3.风险可控：订单融资通常以订单作为抵押物，金融机构可以根据订单的真实性和可执行性来评估风险。同时，金融机构还可以通过合理的风险管理措施来减少风险的发生和损失的产生。

当金融机构收到企业的融资申请后，会对订单的真实性和可执行性进行评估，并进行企业的信用调查和风险评估。

发明内容

本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本公开的第一个目的在于提出一种订单融资的风险性评估方法。

本公开的第二个目的在于提出一种知识图谱模型的训练方法。

本公开的第三个目的在于提出一种语言模型的训练方法。

本公开的第四个目的在于提出一种订单融资的风险性评估装置。

本公开的第五个目的在于提出一种知识图谱模型的训练装置。

本公开的第六个目的在于提出一种语言模型的训练装置。

本公开的第七个目的在于提出一种电子设备。

本公开的第八个目的在于提出一种计算机可读存储介质。

本公开的第九个目的在于提出一种计算机程序产品。

为达上述目的，本公开第一方面实施例提出了一种订单融资的风险性评估方法，包括：获取待融资订单的目标信息，并获取所述目标信息的至少一个初始关键词；将所述至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；基于所述至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；根据所述目标信息、所述至少一个目标关键词和所述至少一个第一检索新闻，采用第一语言模型，生成所述待融资订单的风险性评估报告。

根据本公开的一个实施方式，所述根据所述目标信息、所述至少一个目标关键词和所述至少一个第一检索新闻，采用第一语言模型，生成所述待融资订单的风险性评估报告，包括：对所述至少一个第一检索新闻进行筛选，以得到至少一个目标新闻；将均为设定格式的所述目标信息、所述至少一个目标关键词和所述至少一个目标新闻进行拼接，得到拼接信息；根据所述拼接信息，采用所述第一语言模型，生成所述待融资订单的风险性评估报告。

根据本公开的一个实施方式，所述根据所述拼接信息，采用所述第一语言模型，生成所述待融资订单的风险性评估报告，包括：将所述拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息；对所述第一提示信息进行压缩，以得到压缩信息；将所述压缩信息输入至所述第一语言模型，以得到所述第一语言模型输出的风险性评估报告。

根据本公开的一个实施方式，所述对所述至少一个第一检索新闻进行筛选，以得到至少一个目标新闻，包括：根据所述至少一个第一检索新闻，采用所述第一语言模型，得到各所述第一检索新闻对应的第一可靠性分值；根据所述至少一个第一检索新闻，采用第二语言模型，得到各所述第一检索新闻对应的第二可靠性分值；针对任一所述第一检索信息，对所述第一检索新闻对应的所述第一可靠性分值和所述第二可靠性分值进行加权求和，得到所述第一检索新闻对应的权重；根据各所述第一检索新闻对应的权重，从所述至少一个第一检索新闻中筛选得到所述目标新闻。

根据本公开的一个实施方式，所述根据各所述第一检索新闻对应的权重，从所述至少一个第一检索新闻中筛选得到所述目标新闻，包括：按照权重从大到小的顺序对各所述第一检索新闻进行排序，以得到第一排序序列；将所述第一排序序列中序号小于设定序号的第一检索新闻确定为所述目标新闻。

根据本公开的一个实施方式，所述获取所述目标信息的至少一个初始关键词，包括：根据所述目标信息，采用所述第一语言模型，获取所述目标信息的至少一个初始关键词。

根据本公开的一个实施方式，所述将所述至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词，包括：将所述至少一个初始关键词输入所述知识图谱模型，获取与各所述初始关键词有关联关系的实体关系对象；将各所述实体关系对象和各所述初始关键词作为所述目标关键词。

为达上述目的，本公开第二方面实施例提出了一种知识图谱模型的训练方法，包括：获取第一初始训练数据；其中，所述第一初始训练数据包括供应链金融信息和订单融资信息；基于所述第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组；基于所述第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组；根据所述多组第一实体关系三元组和所述多组第二实体关系三元组，获取第一目标训练数据；基于所述第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。

根据本公开的一个实施方式，所述基于所述第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组，包括：将所述第一初始训练数据输入至所述第三语言模型，以从所述第一初始训练数据中抽取至少一组第三实体关系三元组；其中，任一所述第三实体关系三元组中包括两个第一实体；通过第一搜索引擎对各所述第一实体进行新闻搜索，以获取多个第一搜索新闻；将各所述第一搜索新闻输入至所述第三语言模型，以得到多组第一实体关系三元组。

根据本公开的一个实施方式，所述基于所述第一初始训练数据，采用关系抽取模型，获取至少一组第二实体关系三元组，包括：通过所述关系抽取模型对所述第一初始训练数据进行实体关系三元组抽取，以得到至少一组第四实体关系三元组；其中，任一所述第四实体关系三元组中包括两个第二实体；通过第二搜索引擎对各所述第二实体进行新闻搜索，以获取多个第二搜索新闻；通过所述关系抽取模型对各所述第二搜索新闻进行实体关系三元组抽取，以得到多组第二实体关系三元组。

根据本公开的一个实施方式，所述根据所述多组第一实体关系三元组和所述多组第二实体关系三元组，获取第一目标训练数据，包括：响应于所述多组第一实体关系三元组和所述多组第二实体关系三元组中存在至少一组第一目标三元组，将任一所述第一目标三元组确定为第一目标训练数据；其中，任一所述第一目标三元组同时为所述第一实体关系三元组和所述第二实体关系三元组；将仅为所述第一实体关系三元组的实体关系三元组，以及仅为所述第二实体关系三元组的实体关系三元组确定为第二目标三元组；针对任一所述第二目标三元组，在所述第二目标三元组校验无误的情况下，将校验无误的第二目标三元组确定为第一目标训练数据。

为达上述目的，本公开第三方面实施例提出了一种语言模型的训练方法，包括：获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集；基于所述自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型；基于所述正负样本训练数据集，对所述经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型；基于所述指令微调训练数据集，对所述经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

为达上述目的，本公开第四方面实施例提出了一种订单融资的风险性评估装置，包括：

获取模块，用于获取待融资订单的目标信息，并获取所述目标信息的至少一个初始关键词；

输入模块，用于将所述至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；

检索模块，用于基于所述至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；

生成模块，用于根据所述目标信息、所述至少一个目标关键词和所述至少一个第一检索新闻，采用第一语言模型，生成所述待融资订单的风险性评估报告。

为达上述目的，本公开第五方面实施例提出了一种知识图谱模型的训练装置，所述装置包括：

第一获取模块，用于获取第一初始训练数据；其中，所述第一初始训练数据包括供应链金融信息和订单融资信息；

第二获取模块，用于基于所述第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组；

第三获取模块，用于基于所述第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组；

第四获取模块，用于根据所述多组第一实体关系三元组和所述多组第二实体关系三元组，获取第一目标训练数据；

训练模块，用于基于所述第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。

为达上述目的，本公开第六方面实施例提出了一种语言模型的训练装置，所述装置包括：

获取模块，用于获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集；

第一训练模块，用于基于所述自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型；

第二训练模块，用于基于所述正负样本训练数据集，对所述经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型；

第三训练模块，用于基于所述指令微调训练数据集，对所述经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

为达上述目的，本公开第七方面实施例提出了一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；所述存储器存储计算机执行指令；所述处理器执行所述存储器存储的计算机执行指令，以实现如本公开第一方面实施例所述的订单融资的风险性评估方法，或第二方面实施例所述的知识图谱模型的训练方法，或第三方面实施例所述的语言模型的训练方法。

为达上述目的，本公开第八方面实施例提出了一种存储有计算机执行指令的计算机可读存储介质，其中，所述计算机执行指令被处理器执行时用于实现如本公开第一方面实施例所述的订单融资的风险性评估方法，或第二方面实施例所述的知识图谱模型的训练方法，或第三方面实施例所述的语言模型的训练方法。

为达上述目的，本公开第九方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时用于实现如本公开第一方面实施例所述的订单融资的风险性评估方法，或第二方面实施例所述的知识图谱模型的训练方法，或第三方面实施例所述的语言模型的训练方法。

本公开的订单融资的风险性评估方法，通过获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词；将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。由此，可以自动生成待融资订单的风险性评估报告，并可以降低人力资源成本，且可以有效避免因为人的主观性导致的风险性评估报告的不准确的问题。

附图说明

图1为本公开实施例一所提供的订单融资的风险性评估方法的流程示意图；

图2为本公开实施例二所提供的订单融资的风险性评估方法的流程示意图；

图3为本公开实施例三所提供的订单融资的风险性评估方法的流程示意图；

图4为本公开实施例四所提供的知识图谱模型的训练方法的流程示意图；

图5为本公开实施例五所提供的语言模型的训练方法的流程示意图；

图6为本公开实施例六所提供的订单融资的风险性评估装置的结构示意图；

图7为本公开实施例七所提供的知识图谱模型的训练装置的结构示意图；

图8为本公开实施例八所提供的语言模型的训练装置的结构示意图；

图9是本公开实施例九所提供的一种电子设备的示意图。

具体实施方式

下面详细描述本公开的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本公开，而不能理解为对本公开的限制。

相关技术中，在对一些行业(比如电力行业)的供应链金融中待融资订单进行风险性分析与评估时，常常采用以下几种方式：

一、通过核心企业及供应商的相关信息、数据等，依托丰富的领域专家经验进行预判；其缺点是非常耗时，预测准确性波动较大，拥有丰富经验的领域专家较为稀缺，且领域专家在做风险性分析与评估时具有一定的主观性。

二、基于供应商与核心企业的数据建立大量指标后，收集历史信息作为样本，采用逻辑回归等简单统计学习方法对样本进行建模，拟合出系数得到合适模型，以通过模型对供应链金融中待融资订单进行风险性分析与评估；其缺点是需要精细的特征工程进行大量的特征尝试，模型所用到的特征只能做简单切片统计衍生，且当供应商与核心企业的数据中的信息有所缺失时，得到的模型精度不足。

三、使用深度学习模型(比如CNN(Convolutional Neural Network，卷积神经网络)模型)进行风险分析；然而，目前的深度学习模型仅从某一个角度对待融资订单的风险性进行分析与评估，缺乏一个对风险性进行全面分析的深度学习模型。

针对上述存在的至少一项问题，本公开提出一种订单融资的风险性评估方法、知识图谱模型的训练方法和语言模型的训练方法。

下面参考附图描述本公开实施例的订单融资的风险性评估方法、知识图谱模型的训练方法和语言模型的训练方法。

图1为本公开实施例一所提供的订单融资的风险性评估方法的流程示意图。

本公开实施例以该订单融资的风险性评估方法被配置于订单融资的风险性评估装置中来举例说明，该订单融资的风险性评估装置可以应用于任一电子设备中，以使该电子设备可以执行订单融资的风险性评估功能。

其中，电子设备可以为任一具有计算能力的设备，例如可以为PC(PersonalComputer，个人电脑)、移动终端、服务器等，移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作***、触摸屏和/或显示屏的硬件设备。

如图1所示，该订单融资的风险性评估方法可以包括以下步骤：

步骤S101，获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词。

在本公开实施例中，目标信息可以包括待融资订单的订单信息，比如可以为订单合同、融资信息等。其中，需要说明的是，在存在分析师评估报告，即分析师对待融资订单的风险性评估报告的情况下，目标信息还可以包括分析师评估报告。

在本公开实施例中，初始关键词比如可以包括核心企业名称、供应商名称、供应商法人名字、供应商总经理名字、待融资订单所属的行业、待融资订单的起始时间、待融资订单的截止时间等，本公开对此不做限制。

在本公开实施例中，可以获取待融资订单的目标信息。比如，可以通过人工上传或发送至本公开的执行主体所在的设备，以获取待融资订单的目标信息；或者，也可以从本地存储中获取获取待融资订单的目标信息，等等，本公开对此不做限制。

在本公开实施例中，可以获取目标信息的初始关键词。其中，需要说明的是，目标信息中的初始关键词可以为但不限于为一个，本公开对此不做限制。

作为一种示例，假设待融资订单的订单信息为核心企业A向供应商B采购一批电池的订单合同，从该份订单合同中获取的初始关键词比如可以包括A、B、新能源、电池。

需要说明的是，上述对待融资订单的订单信息及其初始关键词的示例仅是示例性的，在实际应用中，还可以为其它。

步骤S102，将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词。

在本公开实施例中，知识图谱模型可以为但不限于为基于LSTM(Long Short-TermMemory，长短时记忆网络)的知识图谱关系抽取模型，本公开对此不做限制。

在本公开实施例中，可以将各初始关键词输入知识图谱模型，可以获取至少一个目标关键词。需要说明的是，目标关键词的数量可以为但不限于为一个，本公开对此不做限制。

作为一种可能的实现方式，可以将至少一个初始关键词输入知识图谱模型，获取与各初始关键词有关联关系的实体关系对象，并可以将各实体关系对象和各初始关键词作为目标关键词。

仍以上述示例进行说明，假设初始关键词为“A”、“电池”，将该初始关键词输入知识图谱模型，可以获取与初始关键词“A”有关联关系的实体关系对象、与初始关键词“电池”有关联关系的实体关系对象；比如，与初始关键词“A”有关联关系的实体关系对象“C”，其中，C为核心企业，核心企业A与核心企业C之间的关联关系为“竞争对手”关系，即核心企业A与核心企业C为竞争对手；与初始关键词“电池”有关联关系的实体关系对象“锂电池”，其中，电池与锂电池之间的关联关系为“包含”关系，即电池包含锂电池；从而，在获取与上述各初始关键词有关联关系的实体关系对象之后，可以将各实体关系对象和各初始关键词均作为目标关键词，即将“A”、“电池”、“C”、“锂电池”均作为目标关键词。

需要说明的是，上述对与初始关键词有关联关系的实体关系对象的示例仅是示例性的，在实际应用中还可以为其它，本公开对此不做限制。

步骤S103，基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻。

在本公开实施例中，第一检索新闻比如可以为企业新闻、行业新闻、供应商新闻等等，本公开对此不做限制。

在本公开实施例中，可以根据各目标关键词，对目标数据库进行新闻检索，从而可以得到第一检索新闻。其中，需要说明的是，第一检索新闻的数量可以为但不限于为一个，本公开对此不做限制。

作为一种可能的实现方式，在获取至少一个第一检索新闻之后，可以对至少一个第一检索新闻进行清洗处理。

作为一种示例，对至少一个第一检索新闻进行清洗处理，可以包括：

1、去除所有第一检索新闻中的重复新闻；

2、根据第一检索新闻所属的源网站，去除所有第一检索新闻中源网站属于设定源网站的目标新闻；其中，设定源网站可以为预先设定的，本公开对此不做限制。

3、去除所有第一检索新闻中的无关信息。比如，去除通过爬虫技术获取的HTMLTag信息。

由此，对至少一个第一检索新闻进行清洗处理，可以有效减少噪声，便于后续的数据处理。

步骤S104，根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。

在本公开实施例中，第一语言模型比如可以为但不限于为训练好的百川Baichuan-13B大模型，本公开对此不做限制。

在本公开实施例中，可以根据目标信息、各目标关键词和各第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。

在本公开实施例的一种可能的实现方式中，为了获取目标信息中的初始关键词，可以根据目标信息，采用第一语言模型，获取目标信息的至少一个初始关键词。比如，可以将目标信息输入至第一语言模型，并可以将第一语言模型的输出作为目标信息的初始关键词。

本公开实施例的订单融资的风险性评估方法，通过获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词；将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。由此，可以自动生成待融资订单的风险性评估报告，并可以降低人力资源成本，且可以有效避免因为人的主观性导致的风险性评估报告的不准确的问题。

为了清楚说明本公开上述实施例中，是如何根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告的，本公开还提出一种订单融资的风险性评估方法。

图2为本公开实施例二所提供的订单融资的风险性评估方法的流程示意图。

如图2所示，该订单融资的风险性评估方法可以包括以下步骤：

步骤S201，获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词。

步骤S202，将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词。

步骤S203，基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻。

步骤S201至步骤S203的解释说明可以参见本公开任一实施例中的相关描述，在此不做赘述。

步骤S204，对至少一个第一检索新闻进行筛选，以得到至少一个目标新闻。

在本公开实施例中，可以对得到的至少一个第一检索新闻进行筛选，从至少一个第一检索新闻中得到至少一个目标新闻。

其中，需要说明的是，目标新闻的数量可以为但不限于为一个，本公开对此不做限制。

为了获取目标新闻，在本公开实施例的一种可能的实现方式中，可以采用以下步骤实现对目标新闻的获取：

步骤S2041，根据至少一个第一检索新闻，采用第一语言模型，得到各第一检索新闻对应的第一可靠性分值。

在本公开实施例中，第一语言模型可以对各第一检索新闻的可靠性进行评估。

在本公开实施例中，针对任一第一检索新闻，可以对第一检索新闻，采用第一语言模型，得到第一检索新闻对应的第一可靠性分值。比如，可以将第一检索新闻输入至第一语言模型，从而得到第一检索新闻对应的第一可靠性分值。

步骤S2042，根据至少一个第一检索新闻，采用第二语言模型，得到各第一检索新闻对应的第二可靠性分值。

在本公开实施例中，第二语言模型比如可以为文心一言大模型、通义千问大模型等等，本公开对此不做限制。

需要说明的是，在本公开中，第二语言模型与第一语言模型不相同。

在本公开实施例中，第二语言模型也可以对各第一检索新闻的可靠性进行评估。

在本公开实施例中，针对任一第一检索新闻，可以对第一检索新闻采用第二语言模型，得到第一检索新闻对应的第二可靠性分值。比如，可以将第一检索新闻输入至第二语言模型，从而得到第一检索新闻对应的第二可靠性分值。

需要说明的是，本公开对步骤S2041和步骤S2042的执行时序不做限制，也就是说，步骤S2042可以与步骤S2041并列执行，或者，步骤S2042可以在步骤S2041之前执行，本公开仅以步骤S2041在步骤S2042之前执行进行示例，本公开对此不做限制。

步骤S2043，针对任一第一检索信息，对第一检索新闻对应的第一可靠性分值和第二可靠性分值进行加权求和，得到第一检索新闻对应的权重。

在本公开实施例中，针对任一第一检索信息，对第一检索新闻对应的第一可靠性分值和第二可靠性分析进行加权求和，得到第一检索新闻对应的权重。

作为一种示例，假设可靠性分值包括逻辑性分值和有效信息所占比例，即对第一检索新闻的可靠性的评估从新闻的逻辑性(比如，新闻内容是否自相矛盾)和有效信息所占比例两个方面进行评估，比如，假设第一检索新闻为New1，针对该第一检索新闻New1，采用第一语言模型得到该第一检索新闻New1对应的第一可靠性分值为：[逻辑性分值为A1，有效信息所占比例为B1]；针对该第一检索新闻New1，采用第二语言模型得到该第一检索新闻New1对应的第二可靠性分值为：[逻辑性分值为A2，有效信息所占比例为B2]；可以按照以下公式，对该第一检索新闻New1对应的第一可靠性分值和第二可靠性分值进行加权求和，得到该第一检索新闻New1对应的权重W为：

W＝50％*(A1+A2)/2+50％*(B1+B2)/2； (1)

步骤S2044，根据各第一检索新闻对应的权重，从至少一个第一检索新闻中筛选得到目标新闻。

在本公开实施例中，可以根据各第一检索新闻对应的权重，从至少一个第一检索新闻中筛选得到目标新闻。

作为一种可能的实现方式，可以按照权重从大到小的顺序对各第一检索新闻进行排序，以得到第一排序序列，并可以将第一排序序列中序号小于设定序号的第一检索新闻确定为目标新闻。

在本公开实施例中，设定序号可以为预先设定的，比如，可以为4、5等，本公开对此不做限制。

作为一种示例，假设存在第一检索新闻N₁、N₂、N₃、N₄、N₅，设定序号为3；假设按照权重从大到小的顺序对各第一检索新闻进行排序，得到的第一排序序列为：N₃、N₂、N₄、N₁、N₅，可以将第一排序序列中序号小于设定序号的第一检索新闻，即将N₃和N₂确定为目标新闻。

由此，可以有效确定目标新闻。

步骤S205，将均为设定格式的目标信息、至少一个目标关键词和至少一个目标新闻进行拼接，得到拼接信息。

在本公开实施例中，设定格式可以为预先设定的，比如，可以为JSON(JavaScriptObject Notation，JS键值对数据)格式、XML(Extensible Markup Language，可扩展标记语言)格式等，本公开对此不做限制。

在本公开实施例中，可以将均为设定格式的目标信息、至少一个目标关键词和至少一个目标新闻进行拼接，得到拼接信息。

步骤S206，根据拼接信息，采用第一语言模型，生成待融资订单的风险性评估报告。

在本公开实施例中，可以根据拼接信息，采用第一语言模型，生成待融资订单的风险性评估报告。

本公开实施例的订单融资的风险性评估方法，通过对至少一个第一检索新闻进行筛选，以得到至少一个目标新闻；将均为设定格式的目标信息、至少一个目标关键词和至少一个目标新闻进行拼接，得到拼接信息；根据拼接信息，采用第一语言模型，生成待融资订单的风险性评估报告。由此，可以有效获取拼接信息，从而可以实现基于拼接信息，有效获取待融资订单的风险性评估报告。

为了清楚说明本公开上述实施例中，是如何根据拼接信息，采用第一语言模型，生成待融资订单的风险性评估报告的，本公开还提出一种订单融资的风险性评估方法。

图3为本公开实施例三所提供的订单融资的风险性评估方法的流程示意图。

如图3所示，基于本公开上述实施例，该订单融资的风险性评估方法还可以包括以下步骤：

步骤S301，将拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息。

在本公开实施例中，可以将拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息。

作为一种示例，假设第一提示模板为：

角色：你是一个擅长数据分析的金融机构的风险评估专家

任务：根据以下JSON格式的信息，对一家供应商企业、凭据合同contract所示订单、融资目标信贷targetCredit的人民币的风险进行评估，并生成2000字以内的风险性评估报告。请以报告的准确性、真实性为最高优先级。如JSON格式的信息中包含分析师报告analysis，请为每个分析师报告打分。

JSON信息：

$${(此处为填充位置)}$$

评估报告格式：

···

风险打分：

分析师报告评分(如有)：

报告正文：

···

假设拼接信息为拼接信息1，可以将拼接信息1填充到上述第一提示模板中对应的填充位置，可以得到第一提示信息，即：

角色：你是一个擅长数据分析的金融机构的风险评估专家

JSON信息：

$${拼接信息1}$$

评估报告格式：

···

风险打分：

分析师报告评分(如有)：

报告正文：

···

需要说明的是，上述对第一提示模板的示例仅是示例性的，在实际应用中，第一提示模板还可以为其它，本公开对此不做限制。

步骤S302，对第一提示信息进行压缩，以得到压缩信息。

在本公开实施例中，可以对第一提示信息进行压缩，以得到压缩信息。

作为一种示例，可以采用以下步骤对第一提示信息进行压缩：

步骤1、在第一提示信息中的目标信息(或拼接信息)包括订单信息的情况下，对订单信息进行压缩：

1.1当订单信息所包括的字符单元token的第一总数量大于第一设定个数(比如1000、1500等)时，可以采用第一语言模型，将订单信息压缩至第二设定个数(比如800、1000等)；

1.2当订单信息所包括的字符单元token的第一总数量未大于第一设定个数时，可以不对订单信息执行压缩操作。

步骤2、在第一提示信息中的目标信息(或拼接信息)包括分析师评估报告的情况下，对分析师评估报告进行压缩：

2.1当分析师评估报告所包括的字符单元token的第二总数量大于第三设定个数(比如500、600等)时，可以采用第一语言模型，将分析师评估报告压缩至第四设定个数(比如500、400等)；

2.2当分析师评估报告所包括的字符单元token的第二总数量未大于第三设定个数时，可以不对分析师评估报告执行压缩操作。

步骤3、对第一提示信息中拼接信息中的至少一个目标新闻进行压缩：

3.1确定第一语言模型可承载token的最大取值、拼接信息中目标信息中的token的第一取值、拼接信息中除目标信息和各目标新闻中的token之外的token的第二取值、第一提示信息中除拼接信息中的token之外的token的第三取值；

3.2根据最大取值、第一取值、第二取值、和第三取值，确定第一语言模型的剩余可输入token的第四取值；

比如，假设最大取值为n、第一取值为k、第二取值为q、第三取值为p，可以根据以下公式，确定第四取值m：

m＝n-p-q-k； (2)

3.3对拼接信息中至少一个目标新闻进行压缩，以使压缩后的各目标新闻中的token数之和不大于第四取值。

作为一种示例，确定拼接信息中任一目标新闻中的token的第五取值，并将各目标新闻的第五取值进行加和，得到第一和数y；假设第四取值为m，当m<y<10m时，对所有目标新闻进行拼接，得到第一拼接新闻；将第一拼接新闻划分为份第一子新闻；针对任一份第一子新闻，将第一子新闻压缩至第五设定个数，其中，第五设定个数小于/>将各压缩后的第一子新闻进行合并，得到压缩后的至少一个目标新闻。

仍以上述示例进行说明，当y>10m时，确定至少一个目标新闻中的第一类新闻和第二类新闻；其中，第一类新闻可以为企业新闻和/或创始人新闻，第二类新闻可以为行业新闻；针对第一类新闻，获取各第一类新闻的权重(或优先级)，并可以按照权重从大到小的顺序对各第一类新闻进行排序，以得到第二排序序列；按照第二排序序列对各第一类新闻进行拼接，得到第二拼接新闻；从第二拼接新闻的起始位置截取包含5m个token的第一截取新闻；将第一截取新闻划分为5(＝5m/m)份第二子新闻；针对任一份第二子新闻，将第二子新闻压缩至第六设定个数，其中，第六设定个数小于将各压缩后的第二子新闻进行合并，得到压缩后的第一类新闻；

针对第二类新闻，获取各第二类新闻的权重(或优先级)，并可以按照权重从大到小的顺序对各第二类新闻进行排序，以得到第三排序序列；按照第三排序序列对各第二类新闻进行拼接，得到第三拼接新闻；从第三拼接新闻的起始位置截取包含5m个token的第二截取新闻；将第二截取新闻划分为5(＝5m/m)份第三子新闻；针对任一份第三子新闻，将第三子新闻压缩至第七设定个数，其中，第七设定个数小于将各压缩后的第三子新闻进行合并，得到压缩后的第二类新闻。

由此，通过上述步骤1、步骤2和步骤3，可以实现对第一提示信息的压缩，从而可以实现对压缩信息的获取。

步骤S303，将压缩信息输入至第一语言模型，以得到第一语言模型输出的风险性评估报告。

在本公开实施例中，可以将压缩信息输入至第一语言模型，从而可以得到第一语言模型输出的风险性评估报告。

本公开实施例的订单融资的风险性评估方法，通过将拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息；对第一提示信息进行压缩，以得到压缩信息；将压缩信息输入至第一语言模型，以得到第一语言模型输出的风险性评估报告。由此，可以实现基于拼接信息，有效获取压缩信息，从而可以实现基于压缩信息，有效获取待融资订单的风险性评估报告。

上述为订单融资的风险性评估方法对应的实施例，下面说明是如何对知识图谱模型进行训练的。

图4为本公开实施例四所提供的知识图谱模型的训练方法的流程示意图。

如图4所示，该知识图谱模型的训练可以包括以下步骤：

步骤S401，获取第一初始训练数据。

其中，需要说明的是，第一初始训练数据可以包括供应链金融信息和订单融资信息。

步骤S402，基于第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组。

在本公开实施例中，第三语言模型比如可以为文心一言大模型、通义千问大模型等等，本公开对此不做限制。

需要说明的是，在本公开中，第三语言模型与第一语言模型不相同。

还需要说明的是，第三语言模型可以与第二语言模型相同，或者也可以不相同，本公开对此不做限制。

在本公开实施例中，可以基于第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组。

作为一种可能的实现方式，首先，可以将第一初始训练数据输入至第三语言模型，以从第一初始训练数据中抽取至少一组第三实体关系三元组；其中，任一第三实体关系三元组中可以包括两个第一实体；其次，通过第一搜索引擎对各第一实体进行新闻搜索，可以获取多个第一搜索新闻；最后，可以将各第一搜索新闻输入至第三语言模型，从而得到多组第一实体关系三元组。

其中，需要说明的是，第三实体关系三元组的数量可以为但不限于为一组，本公开对此不做限制。

由此，可以实现对第一实体关系三元组的获取。

步骤S403，基于第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组。

在本公开实施例中，关系抽取模型比如可以为BERT模型、BiLSTM-CRF(Bi-directional Long Short Term Memory-Conditional Random Field，双向长短记忆时-条件随机场)模型等，本公开对此不做限制。

在本公开实施例中，可以基于第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组。

作为一种可能的实现方式，首先，可以通过关系抽取模型对第一初始训练数据进行实体关系三元组的抽取，以得到至少一组第四实体关系三元组；其中，任一第四实体关系三元组中可以包括两个第二实体；其次，可以通过第二搜索引擎对各第二实体进行新闻搜索，以获取多个第二搜索新闻；最后，可以通过关系抽取模型对各第二搜索新闻进行实体关系三元组的抽取，从而得到多组第二实体关系三元组。

其中，需要说明的是，第四实体关系三元组的数量可以为但不限于为一组，本公开对此不做限制。

由此，可以实现对第二实体关系三元组的获取。

步骤S404，根据多组第一实体关系三元组和多组第二实体关系三元组，获取第一目标训练数据。

作为一种可能的实现方式，响应于多组第一实体关系三元组和多组第二实体关系三元组中存在至少一组第一目标三元组，可以将任一第一目标三元组确定为第一目标训练数据，其中，任一第一目标三元组可以同时为第一实体关系三元组和第二实体关系三元组；并可以将仅为第一实体关系三元组的实体关系三元组，以及仅为第二实体关系三元组的实体关系三元组均确定为第二目标三元组；针对任一第二目标三元组，在第二目标三元组校验无误的情况下，可以将校验无误的第二目标三元组也确定为第一目标训练数据。

作为一种示例，假设多组第一实体关系三元组包括三元组A、三元组B、三元组C，多组第二实体关系三元组包括三元组A、三元组C、三元组E，其中，将上述多组第一实体关系三元组和多组第二实体关系三元组进行对比，三元组A和三元组C同时为第一实体关系三元组和第二实体关系三元组，可以确定三元组A和三元组C均为第一目标三元组；可以将任一第一目标三元组确定为第一目标训练数据；

而仅为第一实体关系三元组的实体关系三元组包括三元组B、仅为第二实体关系三元组的实体关系三元组包括三元组E，则可以将三元组B和三元组E均确定为第二目标三元组；假设对三元组B进行校验，在三元组B校验无误的情况下，可以将三元组B确定为第一目标训练数据；假设对三元组E进行校验，在三元组E校验有误的情况下，该三元组E不确定为第一目标训练数据。

由此，可以实现对第一目标训练数据的确定。

步骤S405，基于第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。

在本公开实施例中，可以基于第一目标训练数据，对初始知识图谱模型进行训练，可以得到训练好的知识图谱模型。

本公开实施例的知识图谱模型的训练方法，通过获取第一初始训练数据；其中，第一初始训练数据包括供应链金融信息和订单融资信息；基于第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组；基于第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组；根据多组第一实体关系三元组和多组第二实体关系三元组，获取第一目标训练数据；基于第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。由此，可以实现对知识图谱模型的训练，提升模型对实体关系三元组中实体的预测能力。

下面说明是如何对第一语言模型进行训练的。

图5为本公开实施例五所提供的语言模型的训练方法的流程示意图。

如图5所示，该语言模型的训练方法可以包括以下步骤：

步骤S501，获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集。

在本公开实施例中，自监督训练数据集比如可以包括开放新闻媒体或平台中的金融新闻、社交媒体中的财经新闻、集团公司报刊相关新闻、集团公司取得授权的订单信息及融资信息、百科数据、开源的LLaMa-Alpaca中文数据集、中文核心期刊Meta数据集等等，本公开对此不做限制。

在本公开实施例中，正负样本训练数据集可以包括正样本新闻和负样本新闻。

在本公开实施例的一种可能的实现方式中，正样本新闻中可以包括标注为“正确且相关(即True And Relative)”的新闻和标注为“正确但不相关(即True ButInrelative)”的新闻；负样本新闻中可以包括标注为“错误但相关(即False ButRelative)”的新闻和标注为“错误且不相关(即False And Inrelative)”的新闻。

需要说明的是，本公开对正样本新闻中标注为“正确且相关(即True AndRelative)”的新闻的数量和标注为“正确但不相关(即True But Inrelative)”的新闻的数量不做限制，也就是说，标注为“正确且相关(即True And Relative)”的新闻的数量可以与标注为“正确但不相关(即True But Inrelative)”的新闻的数量可以相同，或者也可以不相同。

与正样本新闻类似地，本公开对负样本新闻中标注为“错误但相关(即False ButRelative)”的新闻的数量和标注为“错误且不相关(即False And Inrelative)”的新闻的数量不做限制，也就是说，标注为“错误但相关(即False But Relative)”的新闻的数量可以与标注为“错误且不相关(即False And Inrelative)”的新闻的数量可以相同，或者也可以不相同。

在本公开实施例中，指令微调训练数据集可以采用人工构建样本的方式来获取。

作为一种示例，人工构建样本时，可以预先设置多组与订单融资、供应链金融等相关的指令、问题与回答，比如：

1、指令：请用一句话回答下面的问题

问题：动产质押业务的主要还款来源有哪些？

回答：销售回笼资金、质押物变现

2、指令：请选出下面句子中正确的句子的序号，用逗号分隔

问题：1.保兑仓适用于存在销售压力较大的商品，而未来货权质押一般适用于紧俏的商品。2.保兑仓必须为厂商核定授信额度，未来货权质押不必为厂商核定授信额度。3.保兑仓和未来货权质押都是先款/票后货模式

回答：1，2，3

根据上述预先设置的指令、问题与回答，生成样本，样本比如可以为：

{

instruction:“请选出下面句子中正确的句子的序号，用逗号分隔”，

input:“1.保兑仓适用于存在销售压力较大的商品，而未来货权质押一般适用于紧俏的商品。2.保兑仓必须为厂商核定授信额度，未来货权质押不必为厂商核定授信额度。3.保兑仓和未来货权质押都是先款/票后货模式”，result:“1，2，3”

}

{

instruction:“请用一句话回答下面的问题”，

input:“动产质押业务的主要还款来源有哪些？”，

result:“销售回笼资金、质押物变现”

}

需要说明的是，上述对指令、问题与回答的设置和样本的示例仅是示例性的，在实际应用中，可以根据需要设置指令、问题、回答，以及对应的样本。

从而本公开中，在人工构建多个样本之后，可以将多个样本作为指令微调训练数据集。

在本公开实施例中，可以获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集。

步骤S502，基于自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型。

在本公开实施例中，初始的第一语言模型可以为开源的语言大模型，比如可以为开源的百川Baichuan-13B大模型(即预训练好的百川Baichuan-13B大模型)，本公开对此不做限制。

在本公开实施例中，可以基于自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型。

作为一种示例，在对初始的第一语言模型进行第一训练时，可以加载初始的第一语言模型，冻结初始的第一语言模型的底层参数，并可以直接向冻结底层参数的第一语言模型输入自监督训练数据集，以进行自回归训练，从而可以实现对初始的第一语言模型进行微调，得到经过第一训练的第一语言模型。

步骤S503，基于正负样本训练数据集，对经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型。

在本公开实施例中，可以正负样本训练数据集，对经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型。

作为一种示例，在对经过第一训练的第一语言模型进行第二训练时，可以将正样本新闻和负样本新闻输入至经过第一训练的第一语言模型，以进行常规有监督的机器学习分类模型训练，得到经过第二训练的第一语言模型；其中，正样本新闻中可以包括标注为“正确且相关(即True And Relative)”的新闻和标注为“正确但不相关(即True ButInrelative)”的新闻，负样本新闻中可以包括标注为“错误但相关(即False ButRelative)”的新闻和标注为“错误且不相关(即False And Inrelative)”的新闻。需要说明的是，经过上述第二训练，第一语言模型可以识别新闻中的正确且相关新闻、正确但不相关新闻、错误且不相关新闻以及错误但相关新闻。

步骤S504，基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

在本公开实施例中，可以基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

作为一种示例，可以将指令微调训练数据集输入至经过第二训练的第一语言模型，以进行指令微调的模型训练，即进行第三训练。需要说明的是，当开源的第一语言模型提供用于进行指令微调的接口时，可以直接调用该接口，以对模型进行第三训练；当开源的第一语言模型未提供用于进行指令微调的接口时，在指令微调训练数据集是采用人工设置的指令、问题与回答生成的情况下，可以对人工设置的指令、问题与回答做拼接处理，以得到拼接指令，并可以基于拼接指令，构建指令微调训练数据集，从而可以基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

比如，假设人工设置的指令、问题与回答分别为：

指令：请用一句话回答下面的问题

问题：动产质押业务的主要还款来源有哪些？

回答：销售回笼资金、质押物变现

对上述人工设置的指令、问题与回答做拼接处理，得到对应的拼接指令可以为：

User:[CLS]+“请用一句话回答下面的问题”+[SEP]+“动产质押业务的主要还款来源有哪些？”+[SEP]，System:[CLS]+“销售回笼资金、质押物变现”+[SEP]

其中，上述拼接指令中采用User和System作为指令、问题与回答的标记头，并采用分隔符(比如[SEP]、[CLS]等)来分隔不同成分的token。

从而，在采用上述方式得到拼接指令之后，可以基于拼接指令，构建指令微调训练数据集，进一步地，可以基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

本公开实施例的语言模型的训练方法，通过获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集；基于自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型；基于正负样本训练数据集，对经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型；基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。由此，可以实现对第一语言模型的训练。

与上述图1至图3实施例提供的订单融资的风险性评估方法相对应，本公开的一种实施例还提供一种订单融资的风险性评估装置，由于本公开实施例提供的订单融资的风险性评估装置与上述图1至图3实施例提供的订单融资的风险性评估方法相对应，因此在订单融资的风险性评估方法的实施方式也适用于本实施例提供的订单融资的风险性评估装置，在本实施例中不再详细描述。

图6为本公开实施例六所提供的订单融资的风险性评估装置的结构示意图。

如图6所示，该订单融资的风险性评估装置600，包括：获取模块601、输入模块602、检索模块603和生成模块604。

其中，获取模块601，用于获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词。

输入模块602，用于将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词。

检索模块603，用于基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻。

生成模块604，用于根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。

在本公开的一个实施例中，生成模块604，用于：对至少一个第一检索新闻进行筛选，以得到至少一个目标新闻；将均为设定格式的目标信息、至少一个目标关键词和至少一个目标新闻进行拼接，得到拼接信息；根据拼接信息，采用第一语言模型，生成待融资订单的风险性评估报告。

在本公开的一个实施例中，生成模块604，用于：将拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息；对第一提示信息进行压缩，以得到压缩信息；将压缩信息输入至第一语言模型，以得到第一语言模型输出的风险性评估报告。

在本公开的一个实施例中，生成模块604，用于：根据至少一个第一检索新闻，采用第一语言模型，得到各第一检索新闻对应的第一可靠性分值；根据至少一个第一检索新闻，采用第二语言模型，得到各第一检索新闻对应的第二可靠性分值；针对任一第一检索信息，对第一检索新闻对应的第一可靠性分值和第二可靠性分值进行加权求和，得到第一检索新闻对应的权重；根据各第一检索新闻对应的权重，从至少一个第一检索新闻中筛选得到目标新闻。

在本公开的一个实施例中，生成模块604，用于：按照权重从大到小的顺序对各第一检索新闻进行排序，以得到第一排序序列；将第一排序序列中序号小于设定序号的第一检索新闻确定为目标新闻。

在本公开的一个实施例中，获取模块601，用于：根据目标信息，采用第一语言模型，获取目标信息的至少一个初始关键词。

在本公开的一个实施例中，输入模块602，用于：将至少一个初始关键词输入知识图谱模型，获取与各初始关键词有关联关系的实体关系对象；将各实体关系对象和各初始关键词作为目标关键词。

本公开实施例的订单融资的风险性评估装置，通过获取待融资订单的目标信息，并获取目标信息的至少一个初始关键词；将至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；基于至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；根据目标信息、至少一个目标关键词和至少一个第一检索新闻，采用第一语言模型，生成待融资订单的风险性评估报告。由此，可以自动生成待融资订单的风险性评估报告，并可以降低人力资源成本，且可以有效避免因为人的主观性导致的风险性评估报告的不准确的问题。

与上述图4实施例提供的知识图谱模型的训练方法相对应，本公开的一种实施例还提供一种知识图谱模型的训练装置，由于本公开实施例提供的知识图谱模型的训练装置与上述图4实施例提供的知识图谱模型的训练方法相对应，因此在知识图谱模型的训练方法的实施方式也适用于本实施例提供的知识图谱模型的训练装置，在本实施例中不再详细描述。

图7为本公开实施例七所提供的知识图谱模型的训练装置的结构示意图。

如图7所示，该知识图谱模型的训练装置700，包括：第一获取模块701、第二获取模块702、第三获取模块703、第四获取模块704和训练模块705。

其中，第一获取模块701，用于获取第一初始训练数据；其中，第一初始训练数据包括供应链金融信息和订单融资信息。

第二获取模块702，用于基于第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组。

第三获取模块703，用于基于第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组。

第四获取模块704，用于根据多组第一实体关系三元组和多组第二实体关系三元组，获取第一目标训练数据。

训练模块705，用于基于第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。

在本公开的一个实施例中，第二获取模块702，用于：将第一初始训练数据输入至第三语言模型，以从第一初始训练数据中抽取至少一组第三实体关系三元组；其中，任一第三实体关系三元组中包括两个第一实体；通过第一搜索引擎对各第一实体进行新闻搜索，以获取多个第一搜索新闻；将各第一搜索新闻输入至第三语言模型，以得到多组第一实体关系三元组。

在本公开的一个实施例中，第三获取模块703，用于：通过关系抽取模型对第一初始训练数据进行实体关系三元组抽取，以得到至少一组第四实体关系三元组；其中，任一第四实体关系三元组中包括两个第二实体；通过第二搜索引擎对各第二实体进行新闻搜索，以获取多个第二搜索新闻；通过关系抽取模型对各第二搜索新闻进行实体关系三元组抽取，以得到多组第二实体关系三元组。

在本公开的一个实施例中，第四获取模块704，用于：响应于多组第一实体关系三元组和多组第二实体关系三元组中存在至少一组第一目标三元组，将任一第一目标三元组确定为第一目标训练数据；其中，任一第一目标三元组同时为第一实体关系三元组和第二实体关系三元组；将仅为第一实体关系三元组的实体关系三元组，以及仅为第二实体关系三元组的实体关系三元组确定为第二目标三元组；针对任一第二目标三元组，在第二目标三元组校验无误的情况下，将校验无误的第二目标三元组确定为第一目标训练数据。

本公开实施例的知识图谱模型的训练装置，通过获取第一初始训练数据；其中，第一初始训练数据包括供应链金融信息和订单融资信息；基于第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组；基于第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组；根据多组第一实体关系三元组和多组第二实体关系三元组，获取第一目标训练数据；基于第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。由此，可以实现对知识图谱模型的训练，提升模型对实体关系三元组中实体的预测能力。

与上述图5实施例提供的语言模型的训练方法相对应，本公开的一种实施例还提供一种语言模型的训练装置，由于本公开实施例提供的语言模型的训练装置与上述图5实施例提供的语言模型的训练方法相对应，因此在语言模型的训练方法的实施方式也适用于本实施例提供的语言模型的训练装置，在本实施例中不再详细描述。

图8为本公开实施例八所提供的语言模型的训练装置的结构示意图。

如图8所示，该语言模型的训练装置800，包括：获取模块801、第一训练模块802、第二训练模块803和第三训练模块804。

其中，获取模块801，用于获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集。

第一训练模块802，用于基于自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型。

第二训练模块803，用于基于正负样本训练数据集，对经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型。

第三训练模块804，用于基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

本公开实施例的语言模型的训练装置，通过获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集；基于自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型；基于正负样本训练数据集，对经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型；基于指令微调训练数据集，对经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。由此，可以实现对第一语言模型的训练。

为了实现上述实施例，本公开实施例九还提出一种电子设备900，如图9所示，该电子设备900包括：处理器901和处理器通信连接的存储器902，存储器902存储有可被至少一个处理器执行的指令，指令被至少一个处理器901执行，以实现如本公开第一方面实施例的订单融资的风险性评估方法。

为了实现上述实施例，本公开实施例还提出一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机实现如本公开第一方面实施例的订单融资的风险性评估方法，或第二方面实施例所述的知识图谱模型的训练方法，或第三方面实施例所述的语言模型的训练方法。

为了实现上述实施例，本公开实施例还提出一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如本公开第一方面实施例的订单融资的风险性评估方法，或第二方面实施例所述的知识图谱模型的训练方法，或第三方面实施例所述的语言模型的训练方法。

在本公开的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本公开和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本公开的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本公开的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本公开的限制，本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种订单融资的风险性评估方法，其特征在于，所述方法包括：

获取待融资订单的目标信息，并获取所述目标信息的至少一个初始关键词；

将所述至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词；

基于所述至少一个目标关键词，对目标数据库进行新闻检索，以得到至少一个第一检索新闻；

根据所述目标信息、所述至少一个目标关键词和所述至少一个第一检索新闻，采用第一语言模型，生成所述待融资订单的风险性评估报告。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标信息、所述至少一个目标关键词和所述至少一个第一检索新闻，采用第一语言模型，生成所述待融资订单的风险性评估报告，包括：

对所述至少一个第一检索新闻进行筛选，以得到至少一个目标新闻；

将均为设定格式的所述目标信息、所述至少一个目标关键词和所述至少一个目标新闻进行拼接，得到拼接信息；

根据所述拼接信息，采用所述第一语言模型，生成所述待融资订单的风险性评估报告。

3.根据权利要求2所述的方法，其特征在于，所述根据所述拼接信息，采用所述第一语言模型，生成所述待融资订单的风险性评估报告，包括：

将所述拼接信息填充到第一提示模板中对应的填充位置，以得到第一提示信息；

对所述第一提示信息进行压缩，以得到压缩信息；

将所述压缩信息输入至所述第一语言模型，以得到所述第一语言模型输出的风险性评估报告。

4.根据权利要求2所述的方法，其特征在于，所述对所述至少一个第一检索新闻进行筛选，以得到至少一个目标新闻，包括：

根据所述至少一个第一检索新闻，采用所述第一语言模型，得到各所述第一检索新闻对应的第一可靠性分值；

根据所述至少一个第一检索新闻，采用第二语言模型，得到各所述第一检索新闻对应的第二可靠性分值；

针对任一所述第一检索信息，对所述第一检索新闻对应的所述第一可靠性分值和所述第二可靠性分值进行加权求和，得到所述第一检索新闻对应的权重；

根据各所述第一检索新闻对应的权重，从所述至少一个第一检索新闻中筛选得到所述目标新闻。

5.根据权利要求4所述的方法，其特征在于，所述根据各所述第一检索新闻对应的权重，从所述至少一个第一检索新闻中筛选得到所述目标新闻，包括：

按照权重从大到小的顺序对各所述第一检索新闻进行排序，以得到第一排序序列；

将所述第一排序序列中序号小于设定序号的第一检索新闻确定为所述目标新闻。

6.根据权利要求1所述的方法，其特征在于，所述获取所述目标信息的至少一个初始关键词，包括：

根据所述目标信息，采用所述第一语言模型，获取所述目标信息的至少一个初始关键词。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述将所述至少一个初始关键词输入知识图谱模型，以获取至少一个目标关键词，包括：

将所述至少一个初始关键词输入所述知识图谱模型，获取与各所述初始关键词有关联关系的实体关系对象；

将各所述实体关系对象和各所述初始关键词作为所述目标关键词。

8.一种知识图谱模型的训练方法，其特征在于，所述方法包括：

获取第一初始训练数据；其中，所述第一初始训练数据包括供应链金融信息和订单融资信息；

基于所述第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组；

基于所述第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组；

根据所述多组第一实体关系三元组和所述多组第二实体关系三元组，获取第一目标训练数据；

基于所述第一目标训练数据，对初始知识图谱模型进行训练，以得到训练好的知识图谱模型。

9.根据权利要求8所述的方法，其特征在于，所述基于所述第一初始训练数据，采用第三语言模型，获取多组第一实体关系三元组，包括：

将所述第一初始训练数据输入至所述第三语言模型，以从所述第一初始训练数据中抽取至少一组第三实体关系三元组；其中，任一所述第三实体关系三元组中包括两个第一实体；

通过第一搜索引擎对各所述第一实体进行新闻搜索，以获取多个第一搜索新闻；

将各所述第一搜索新闻输入至所述第三语言模型，以得到多组第一实体关系三元组。

10.根据权利要求8所述的方法，其特征在于，所述基于所述第一初始训练数据，采用关系抽取模型，获取多组第二实体关系三元组，包括：

通过所述关系抽取模型对所述第一初始训练数据进行实体关系三元组抽取，以得到至少一组第四实体关系三元组；其中，任一所述第四实体关系三元组中包括两个第二实体；

通过第二搜索引擎对各所述第二实体进行新闻搜索，以获取多个第二搜索新闻；

通过所述关系抽取模型对各所述第二搜索新闻进行实体关系三元组抽取，以得到多组第二实体关系三元组。

11.根据权利要求8-10中任一项所述的方法，其特征在于，所述根据所述多组第一实体关系三元组和所述多组第二实体关系三元组，获取第一目标训练数据，包括：

响应于所述多组第一实体关系三元组和所述多组第二实体关系三元组中存在至少一组第一目标三元组，将任一所述第一目标三元组确定为第一目标训练数据；其中，任一所述第一目标三元组同时为所述第一实体关系三元组和所述第二实体关系三元组；

将仅为所述第一实体关系三元组的实体关系三元组，以及仅为所述第二实体关系三元组的实体关系三元组确定为第二目标三元组；

针对任一所述第二目标三元组，在所述第二目标三元组校验无误的情况下，将校验无误的第二目标三元组确定为第一目标训练数据。

12.一种语言模型的训练方法，其特征在于，所述方法包括：

获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集；

基于所述自监督训练数据集，对初始的第一语言模型进行第一训练，得到经过第一训练的第一语言模型；

基于所述正负样本训练数据集，对所述经过第一训练的第一语言模型进行第二训练，得到经过第二训练的第一语言模型；

基于所述指令微调训练数据集，对所述经过第二训练的第一语言模型进行第三训练，得到训练好的第一语言模型。

13.一种订单融资的风险性评估装置，其特征在于，所述装置包括：

14.一种知识图谱模型的训练装置，其特征在于，所述装置包括：

15.一种语言模型的训练装置，其特征在于，所述装置包括：

16.一种电子设备，其特征在于，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如权利要求1-7中任一项所述的方法，或权利要求8-11中任一项所述的方法，或权利要求12所述的方法。

17.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-7中任一项所述的方法，或权利要求8-11中任一项所述的方法，或权利要求12所述的方法。