WO2021169208A1

WO2021169208A1 - 一种文本审核方法、装置、计算机设备及可读存储介质

Info

Publication number: WO2021169208A1
Application number: PCT/CN2020/111641
Authority: WO
Inventors: 张晶莹; 罗先贤
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-02-25
Filing date: 2020-08-27
Publication date: 2021-09-02
Also published as: CN111274782A; CN111274782B

Abstract

本申请公开了一种文本审核方法体，该方法体包括：接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示；本申请可以提高审核文本的精准度和速度。

Description

一种文本审核方法、装置、计算机设备及可读存储介质

相关申请的交叉引用

本申请申明享有2020年02月25日递交的申请号为202010116229.7、名称为“一种文本审核方法、装置、计算机设备及可读存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及人工智能技术领域，具体涉及一种文本审核方法、装置、计算机设备及可读存储介质。

背景技术

随着互联网技术的不断发展，越来越多的信息通过互联网进行传播；其中，信息传播的一个重要载体就是文本；由于在文本中会包含敏感或不良信息，为了防止敏感信息泄露以及防止不良信息的传播，需要审核人员人工的对文本进行风险内容审核；但是，发明人意识到由于每份文本的文字数量大、内容繁杂、表述多样，需要耗费较多的人力成本，不仅审核效率较低，而且审核准确率也得不到保障。因此，如何提高审核文本的效率和准确率成为目前亟待解决的技术问题。

发明内容

本申请的目的在于提供一种文本审核方法、装置、计算机设备及可读存储介质，可以提高审核文本的精准度和速度。

根据本申请的一个方面，提供了一种文本审核方法，具体包括以下步骤：

接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。

根据本申请的另一个方面，还提供了一种文本审核装置，具体包括以下组成部分：

接收模块，用于接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

拆分模块，用于从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

获取模块，用于根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

判断模块，用于根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。

根据本申请的另一个方面，还提供了一种计算机设备，具体包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，当所述处理器执行所述程序时实现以下步骤：

根据本申请的另一个方面，还提供了一种计算机可读存储介质，其上存储有计算机程序，当所述程序被处理器执行时实现以下步骤：

本申请提供的文本审核方法、装置、计算机设备及可读存储介质，将待审核文本拆分为多个审核片段，并为每个审核片段设置对应的审核规则；通过每个审核规则对对应的审核片段进行文本审核，可以有针对性的进行风险检查，从而提高文本审核的精准度。此外，在本申请中还可以并行的对待审核文本中的各个审核片段进行审核，从而提高了审核文本的效率。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为实施例一提供的文本审核方法的一种可选的流程示意图；

图2为实施例二提供的文本审核装置的一种可选的程序模块示意图；

图3为实施例三提供的计算机设备的一种可选的硬件架构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

本申请实施例提供了一种文本审核方法，如图1所示，该方法具体包括以下步骤：

步骤S101：接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型。

优选的，本实施例中的文本可以为合同；合同关系到公司或个人的利益，在实际的业务场景中，为保证合同双方的权利与义务，需要对合同内容进行审核。因此，在步骤S101中，当接收到待审核合同时，通过分析所述待审核合同的合同结构以确定出所述待审核合同的合同类型。

在本实施例中，待审核合同是根据不同类型的合同模板生成的，每种类型的合同模板均有对应的合同结构，通过分析待审核合同的合同结构即可确定出待审核合同所使用的合同模板的类型，从而得到待审核合同的合同类型。

具体的，合同类型包括：采购类、销售类、意向合作类和保密类。

步骤S102：从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签。

具体的，在步骤S102之前，所述方法还包括：

步骤A1：针对一种文本类型，获取与所述文本类型对应的训练样本集；其中，所述训练样本集包括：设定数量的历史文本、每个历史文本的片段信息以及每个片段的主题标签；

合同通常包括多个部分，每个部分都有对应的标题和正文；由于在人工审核合同的场景中，审核人员在审核合同的时候会一部分一部分的审核合同，从而确认每个部分是否满足对应的法律等方面的条款，所以根据审核人员的审核习惯分别将所述训练样本集中的各个历史合同按照标题和正文拆分为多个片段，且根据每个片段的内容分别为拆分后的每个片段添加对应的主题标签。

例如，采购类的待审核合同被划分为以下片段：双方权利与义务、费用与付款、违约责任与责任限制、第三方权利保证、独立性与可分割性、协议变更及终止、合同标的及产品/服务标准、知识产权、合同生效及期限、最惠待遇。

步骤A2：根据所述训练样本集中的各个历史文本所包含的主题标签，将包含在所有历史文本中的主题标签确定为所述文本类型的必要主题标签。

步骤A3：根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型。

进一步的，所述根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型，具体包括：

步骤A31：针对所述训练样本集中的一个主题标签，获取各个历史文本中的与所述主题标签对应的片段；

步骤A32：对获取到的每个片段进行分词处理，并提取出每个片段的名词；

步骤A33：从所有片段的名词中确定出用于代表所述主题标签的设定数量的显著名词，并计算出每个显著名词的显著系数，以形成与所述主题标签对应的显著词集合；

步骤A34：汇聚所述训练样本集中的各个主题标签的显著词集合，作为与所述文本类型对应的分类模型。

需要说明的是，所述显示词集合中的各个显著名词均有对应的显著系数；显著名词的显著系数值越大，说明该显著名词越能代表对应的主题标签。

优选的，在实际应用中，在步骤A33中，根据每个名词在各个片段中的出现概率进行降序排序，将排在前设定数量的名词设置为显著名词，并根据每个显著名词的出现概率计算出对应的显著系数。

此外，在实际应用中预设模型还可采用朴素贝叶斯分类模型，根据所述训练样本集对朴素贝叶斯分类模型进行训练学习，以得到与所述文本类型对应的分类模型。

更进一步的，步骤S102，包括：

步骤B1：确定出包含在所述待审核文本中的各个标题，并根据确定出的各个标题将所述待审核文本拆分为多个审核片段；其中，每个审核片段包括：标题部分和正文部分；

步骤B2：分别对每个审核片段进行分词处理，并提取出每个审核片段的名词；

步骤B3：针对一个审核片段，分别从每个显著词集合中确定出目标显著词，其中，所述目标显著词为同时出现在显著词集合和所述审核片段中的名词；根据每个显著词集合中的目标显著词的显著系数，计算出每个显著词集合的显著系数总和；并将显著系数总和最大的显著词集合所对应的主题标签添加到所述审核片段上。

步骤S103：根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则。

具体的，步骤S103，包括：

判断在所述待审核文本的所有主题标签中是否包含所述文本类型的所有必要主题标签；若是，则根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；若否，则将包含缺少的必要主题标签的信息发送至所述用户终端。

在本实施例中，首先是对待审核合同的完整性进行审核，根据待审核合同所包含的主题标签的种类，确定出待审核合同是否缺少必要内容，在待审核合同缺少必要主题标签时进行提醒操作。

在本实施例中，事先分别为不同类型的合同设置对应的规则库；在一个规则库中包括与不同的主题标签对应的审核规则，即，待审核合同中的每个审核片段均有对应的审核规则，通过每个审核片段的审核规则，有针对性的进行风险检查，从而提高合同审核的精准度。

具体的，审核规则包括：审核要素和审核子规则，且一个审核要素对应一个审核子规则；其中，审核要素是文本审核的最小审核单元，审核子规则是用于对审核要素进行风险审核的判断规则。

例如，当合同类型为采购类、审核片段的主题标签为费用与付款时，对应的审核规则的审核要素包括：支付期限、账期、费用、税务；针对审核要素为费用，审核子规则为：判断是否包含金额和金额单位，若否，则存在风险。

步骤S104：根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。

具体的，步骤S104，包括：

步骤C1：根据所述审核规则中的各个审核要素，从所述审核片段中分别提取出与每个审核要素对应的要素内容；

步骤C2：针对一个审核要素的要素内容，判断所述要素内容是否满足与所述审核要素对应的审核子规则；若否，则将所述要素内容作为风险要素内容发送至所述用户终端。

进一步的，所述判断所述要素内容是否满足与所述审核要素对应的审核子规则，包括：

判断所述要素内容是否包含预设关键词；或者，

判断所述要素内容是否与预设内容一致；或者，

判断所述要素内容中包含的币种或金额的大小写是否一致。

在本实施例中，将待审核合同拆分为多个审核片段，并可以并行的对待审核合同中的各个审核片段进行审核，从而提高了审核合同的效率；此外，针对每个审核片段设置对应的审核规则，因此，可以针对性的进行合同审核，准确性更高。

更进一步的，在步骤S104之后，所述方法还包括：

步骤D1：接收由所述用户终端发送来的审核结果信息，根据所述审核结果信息判断确定出的风险要素内容是否正确，若是，则为所述风险要素内容所对应的审核规则的准确值加一，若否，则为所述风险要素内容所对应的审核规则的准确值减一；

在本实施例中，分别为每个审核规则设置准确值，且每个审核规则的初始化的准确值均一致；当将风险要素内容发送至用户终端时，用户根据自身的专业知识背景，对风险要素内容进行人工纠正，并将审核结果信息反馈回来；再根据审核结果信息，调整每个审核规则的准确值。

步骤D2：将准确值小于预设阈值的审核规则发送至所述用户终端，以供所述用户终端对所述审核规则进行修改；

在本实施例中，利用审核结果信息不断的对审核规则进行修正，以让审核规则不断完善。

实施例二

本申请实施例提供了一种文本审核装置，如图2所示，该装置具体包括以下组成部分：

接收模块201，用于接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

拆分模块202，用于从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

获取模块203，用于根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

判断模块204，用于根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。

具体的，所述装置还包括：

训练模块，用于在所述从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签之前，针对一种文本类型，获取与所述文本类型对应的训练样本集；其中，所述训练样本集包括：设定数量的历史文本、每个历史文本的片段信息以及每个片段的主题标签；根据所述训练样本集中的各个历史文本所包含的主题标签，将包含在所有历史文本中的主题标签确定为所述文本类型的必要主题标签；根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型。

进一步的，所述训练模块在实现所述根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型的功能时，具体包括：

针对所述训练样本集中的一个主题标签，获取各个历史文本中的与所述主题标签对应的片段；对获取到的每个片段进行分词处理，并提取出每个片段的名词；从所有片段的名词中确定出用于代表所述主题标签的设定数量的显著名词，并计算出每个显著名词的显著系数，以形成与所述主题标签对应的显著词集合；汇聚所述训练样本集中的各个主题标签的显著词集合，作为与所述文本类型对应的分类模型。

此外，拆分模块202，具体用于：

确定出包含在所述待审核文本中的各个标题，并根据确定出的各个标题将所述待审核文本拆分为多个审核片段；其中，每个审核片段包括：标题部分和正文部分；分别对每个审核片段进行分词处理，并提取出每个审核片段的名词；针对一个审核片段，分别从每个显著词集合中确定出目标显著词，其中，所述目标显著词为同时出现在显著词集合和所述审核片段中的名词；根据每个显著词集合中的目标显著词的显著系数，计算出每个显著词集合的显著系数总和；并将显著系数总和最大的显著词集合所对应的主题标签添加到所述审核片段上。

获取模块203，具体用于：

进一步的，所述审核规则包括：审核要素和审核子规则，且一个审核要素对应一个审核子规则；

此外，判断模块204，具体用于：

根据所述审核规则中的各个审核要素，从所述审核片段中分别提取出与每个审核要素对应的要素内容；针对一个审核要素的要素内容，判断所述要素内容是否满足与所述审核要素对应的审核子规则；若否，则将所述要素内容作为风险要素内容发送至所述用户终端。

更进一步的，所述装置还包括：

修正模块，用于在所述根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示之后，接收由所述用户终端发送来的审核结果信息，根据所述审核结果信息判断确定出的风险要素内容是否正确；若是，则为所述风险要素内容所对应的审核规则的准确值加一；若否，则为所述风险要素内容所对应的审核规则的准确值减一；将准确值小于预设阈值的审核规则发送至所述用户终端，以供所述用户终端对所述审核规则进行修改。

实施例三

本实施例还提供一种计算机设备，如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器（包括独立的服务器，或者多个服务器所组成的服务器集群）等。如图3所示，本实施例的计算机设备30至少包括但不限于：可通过***总线相互通信连接的存储器301、处理器302。需要指出的是，图3仅示出了具有组件301-302的计算机设备30，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器301（即可读存储介质）包括闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、随机访问存储器（RAM）、静态随机访问存储器（SRAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、可编程只读存储器（PROM）、磁性存储器、磁盘、光盘等。在一些实施例中，存储器301可以是计算机设备30的内部存储单元，例如该计算机设备30的硬盘或内存。在另一些实施例中，存储器301也可以是计算机设备30的外部存储设备，例如该计算机设备30上配备的插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）等。当然，存储器301还可以既包括计算机设备30的内部存储单元也包括其外部存储设备。在本实施例中，存储器301通常用于存储安装于计算机设备30的操作***和各类应用软件，例如实施例二的文本审核装置的程序代码等。此外，存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器302在一些实施例中可以是中央处理器（Central Processing Unit，CPU）、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备30的总体操作。

具体的，在本实施例中，处理器302用于执行处理器302中存储的文本审核方法的程序，所述文本审核方法的程序被执行时实现如下步骤：

上述方法步骤的具体实施例过程可参见第一实施例，本实施例在此不再重复赘述。

实施例四

本实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，如闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、随机访问存储器（RAM）、静态随机访问存储器（SRAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、可编程只读存储器（PROM）、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，所述计算机程序被处理器执行时实现如下方法步骤：

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种文本审核方法，其中，所述方法包括：

接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。
根据权利要求1所述的文本审核方法，其中，在所述从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签之前，所述方法还包括：

针对一种文本类型，获取与所述文本类型对应的训练样本集；其中，所述训练样本集包括：设定数量的历史文本、每个历史文本的片段信息以及每个片段的主题标签；

根据所述训练样本集中的各个历史文本所包含的主题标签，将包含在所有历史文本中的主题标签确定为所述文本类型的必要主题标签；

根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型。
根据权利要求2所述的文本审核方法，其中，所述根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型，具体包括：

针对所述训练样本集中的一个主题标签，获取各个历史文本中的与所述主题标签对应的片段；对获取到的每个片段进行分词处理，并提取出每个片段的名词；从所有片段的名词中确定出用于代表所述主题标签的设定数量的显著名词，并计算出每个显著名词的显著系数，以形成与所述主题标签对应的显著词集合；

汇聚所述训练样本集中的各个主题标签的显著词集合，作为与所述文本类型对应的分类模型。
根据权利要求3所述的文本审核方法，其中，所述利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签，具体包括：

确定出包含在所述待审核文本中的各个标题，并根据确定出的各个标题将所述待审核文本拆分为多个审核片段；其中，每个审核片段包括：标题部分和正文部分；

分别对每个审核片段进行分词处理，并提取出每个审核片段的名词；

针对一个审核片段，分别从每个显著词集合中确定出目标显著词，其中，所述目标显著词为同时出现在显著词集合和所述审核片段中的名词；根据每个显著词集合中的目标显著词的显著系数，计算出每个显著词集合的显著系数总和；并将显著系数总和最大的显著词集合所对应的主题标签添加到所述审核片段上。
根据权利要求2所述的文本审核方法，其中，所述根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则，具体包括：

判断在所述待审核文本的所有主题标签中是否包含所述文本类型的所有必要主题标签；若是，则根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；若否，则将包含缺少的必要主题标签的信息发送至所述用户终端。
根据权利要求1所述的文本审核方法，其中，所述审核规则包括：审核要素和审核子规则，且一个审核要素对应一个审核子规则；

所述根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示，具体包括：

根据所述审核规则中的各个审核要素，从所述审核片段中分别提取出与每个审核要素对应的要素内容；

针对一个审核要素的要素内容，判断所述要素内容是否满足与所述审核要素对应的审核子规则；若否，则将所述要素内容作为风险要素内容发送至所述用户终端。
根据权利要求1所述的文本审核方法，其中，在所述根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示之后，所述方法还包括：

接收由所述用户终端发送来的审核结果信息，根据所述审核结果信息判断确定出的风险要素内容是否正确；若是，则为所述风险要素内容所对应的审核规则的准确值加一；若否，则为所述风险要素内容所对应的审核规则的准确值减一；

将准确值小于预设阈值的审核规则发送至所述用户终端，以供所述用户终端对所述审核规则进行修改。
一种文本审核装置，其中，所述装置包括：

接收模块，用于接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

拆分模块，用于从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

获取模块，用于根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

判断模块，用于根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。
一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，当所述处理器执行所述程序时实现以下步骤：

接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。
根据权利要求9所述的计算机设备，其中，当所述处理器执行所述程序时还实现以下步骤：

针对一种文本类型，获取与所述文本类型对应的训练样本集；其中，所述训练样本集包括：设定数量的历史文本、每个历史文本的片段信息以及每个片段的主题标签；

根据所述训练样本集中的各个历史文本所包含的主题标签，将包含在所有历史文本中的主题标签确定为所述文本类型的必要主题标签；

根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型。
根据权利要求10所述的计算机设备，其中，当所述处理器执行所述程序以实现所述根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型的步骤时，具体包括：

针对所述训练样本集中的一个主题标签，获取各个历史文本中的与所述主题标签对应的片段；对获取到的每个片段进行分词处理，并提取出每个片段的名词；从所有片段的名词中确定出用于代表所述主题标签的设定数量的显著名词，并计算出每个显著名词的显著系数，以形成与所述主题标签对应的显著词集合；

汇聚所述训练样本集中的各个主题标签的显著词集合，作为与所述文本类型对应的分类模型。
根据权利要求11所述的计算机设备，其中，当所述处理器执行所述程序以实现所述利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签的步骤时，具体包括：

确定出包含在所述待审核文本中的各个标题，并根据确定出的各个标题将所述待审核文本拆分为多个审核片段；其中，每个审核片段包括：标题部分和正文部分；

分别对每个审核片段进行分词处理，并提取出每个审核片段的名词；

针对一个审核片段，分别从每个显著词集合中确定出目标显著词，其中，所述目标显著词为同时出现在显著词集合和所述审核片段中的名词；根据每个显著词集合中的目标显著词的显著系数，计算出每个显著词集合的显著系数总和；并将显著系数总和最大的显著词集合所对应的主题标签添加到所述审核片段上。
根据权利要求10所述的计算机设备，其中，当所述处理器执行所述程序以实现所述根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则的步骤时，具体包括：

判断在所述待审核文本的所有主题标签中是否包含所述文本类型的所有必要主题标签；若是，则根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；若否，则将包含缺少的必要主题标签的信息发送至所述用户终端。
根据权利要求9所述的计算机设备，其中，所述审核规则包括：审核要素和审核子规则，且一个审核要素对应一个审核子规则；

当所述处理器执行所述程序以实现所述根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示的步骤时，具体包括：

根据所述审核规则中的各个审核要素，从所述审核片段中分别提取出与每个审核要素对应的要素内容；

针对一个审核要素的要素内容，判断所述要素内容是否满足与所述审核要素对应的审核子规则；若否，则将所述要素内容作为风险要素内容发送至所述用户终端。
一种计算机可读存储介质，其上存储有计算机程序，其中，当所述程序被处理器执行时实现以下步骤：

接收用户终端发送来的待审核文本，并将所述待审核文本与多个文本类型的文本模板进行文本结构的匹配，以确定出所述待审核文本的文本类型；

从预设的分类模型库中获取与所述文本类型对应的分类模型，利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签；

根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；

根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示。
根据权利要求15所述的计算机可读存储介质，其中，当所述程序被处理器执行时还实现以下步骤：

针对一种文本类型，获取与所述文本类型对应的训练样本集；其中，所述训练样本集包括：设定数量的历史文本、每个历史文本的片段信息以及每个片段的主题标签；

根据所述训练样本集中的各个历史文本所包含的主题标签，将包含在所有历史文本中的主题标签确定为所述文本类型的必要主题标签；

根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型。
根据权利要求16所述的计算机可读存储介质，其中，当所述程序被处理器执行以实现所述根据所述训练样本集对预设模型进行训练学习，以得到与所述文本类型对应的分类模型的步骤时，具体包括：

针对所述训练样本集中的一个主题标签，获取各个历史文本中的与所述主题标签对应的片段；对获取到的每个片段进行分词处理，并提取出每个片段的名词；从所有片段的名词中确定出用于代表所述主题标签的设定数量的显著名词，并计算出每个显著名词的显著系数，以形成与所述主题标签对应的显著词集合；

汇聚所述训练样本集中的各个主题标签的显著词集合，作为与所述文本类型对应的分类模型。
根据权利要求17所述的计算机可读存储介质，其中，当所述程序被处理器执行以以实现所述利用所述分类模型将所述待审核文本拆分为多个审核片段，并为每个审核片段添加对应的主题标签的步骤时，具体包括：

确定出包含在所述待审核文本中的各个标题，并根据确定出的各个标题将所述待审核文本拆分为多个审核片段；其中，每个审核片段包括：标题部分和正文部分；

分别对每个审核片段进行分词处理，并提取出每个审核片段的名词；

针对一个审核片段，分别从每个显著词集合中确定出目标显著词，其中，所述目标显著词为同时出现在显著词集合和所述审核片段中的名词；根据每个显著词集合中的目标显著词的显著系数，计算出每个显著词集合的显著系数总和；并将显著系数总和最大的显著词集合所对应的主题标签添加到所述审核片段上。
根据权利要求16所述的计算机可读存储介质，其中，当所述程序被处理器执行以实现所述根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则的步骤时，具体包括：

判断在所述待审核文本的所有主题标签中是否包含所述文本类型的所有必要主题标签；若是，则根据每个审核片段的主题标签，从与所述文本类型对应的规则库中分别获取与各个主题标签对应的审核规则；若否，则将包含缺少的必要主题标签的信息发送至所述用户终端。
根据权利要求15所述的计算机可读存储介质，其中，所述审核规则包括：审核要素和审核子规则，且一个审核要素对应一个审核子规则；

当所述程序被处理器执行以实现所述根据所述审核规则，判断在对应的审核片段中是否存在风险要素内容，若是，则将所述风险要素内容发送至所述用户终端，以进行风险提示的步骤时，具体包括：

根据所述审核规则中的各个审核要素，从所述审核片段中分别提取出与每个审核要素对应的要素内容；

针对一个审核要素的要素内容，判断所述要素内容是否满足与所述审核要素对应的审核子规则；若否，则将所述要素内容作为风险要素内容发送至所述用户终端。