CN118194985A - 任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 - Google Patents
任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 Download PDFInfo
- Publication number
- CN118194985A CN118194985A CN202410199304.9A CN202410199304A CN118194985A CN 118194985 A CN118194985 A CN 118194985A CN 202410199304 A CN202410199304 A CN 202410199304A CN 118194985 A CN118194985 A CN 118194985A
- Authority
- CN
- China
- Prior art keywords
- graph
- task
- target
- text
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 298
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 title claims abstract description 61
- 238000004590 computer program Methods 0.000 title claims abstract description 20
- 238000010586 diagram Methods 0.000 claims abstract description 80
- 238000006243 chemical reaction Methods 0.000 claims abstract description 66
- 238000003672 processing method Methods 0.000 claims abstract description 24
- 238000005065 mining Methods 0.000 claims description 218
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000009412 basement excavation Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 22
- 238000000605 extraction Methods 0.000 description 13
- 238000011160 research Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 4
- 231100000331 toxic Toxicity 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001590 oxidative effect Effects 0.000 description 3
- 230000006916 protein interaction Effects 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- YTAHJIFKAKIKAV-XNMGPUDCSA-N [(1R)-3-morpholin-4-yl-1-phenylpropyl] N-[(3S)-2-oxo-5-phenyl-1,3-dihydro-1,4-benzodiazepin-3-yl]carbamate Chemical compound O=C1[C@H](N=C(C2=C(N1)C=CC=C2)C1=CC=CC=C1)NC(O[C@H](CCN1CCOCC1)C1=CC=CC=C1)=O YTAHJIFKAKIKAV-XNMGPUDCSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品,应用于计算机技术领域,其中任务处理方法包括:获取目标关系图和目标任务的描述文本;根据描述文本,从目标关系图中提取目标任务对应的待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。通过文本转换获得待处理文本,能够将待处理图的表示形式转换为格式统一的待处理文本,使任务处理模型能对输入数据进行识别和处理,实现跨领域、跨任务的图处理,提高目标任务的执行效率和任务处理结果的准确性。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种任务处理方法、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品。
背景技术
关系图是一种能够表示物体与物体之间存在的关联关系的结构。现实世界中,通过神经网络模型以及图学习算法,通常能够基于关系图中各种层级的数据信息,挖掘得到图中对象的更多未知信息。
然而,由于不同领域、不同任务类型下的图数据信息存在差异,造成难以对现实世界中大量、丰富的图数据进行统一学习,获得通用的图学习算法。因此,目前只能针对不同领域、不同任务类型分别设计不同的图学习算法,从而导致图处理任务的任务布局耗时长、成本高,任务处理能力具有较大局限性。
发明内容
有鉴于此,本说明书实施例提供了一种任务处理方法。本说明书一个或者多个实施例同时涉及一种任务处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种任务处理方法,包括:
获取目标关系图和目标任务的描述文本;
根据描述文本,从目标关系图中提取目标任务对应的待处理图;
对待处理图进行文本转换,获得待处理图对应的待处理文本;
将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
根据本说明书实施例的第二方面,提供了一种法律任务处理方法,包括:
接收前端用户发送的目标法律任务的处理请求,其中,处理请求包括法律知识图谱和任务描述文本;
根据任务描述文本,从法律知识图谱中提取目标法律任务对应的待处理子图;
对待处理子图进行文本转换,获得待处理子图对应的待处理文本;
将任务描述文本和待处理文本输入法律任务处理模型,基于任务描述文本对待处理文本执行目标法律任务,获得处理结果;
将处理信息反馈至前端用户。
根据本说明书实施例的第三方面,提供了一种应用于云侧设备的任务处理模型的训练方法,包括:
获取样本集,其中,样本集包括多个领域下采集的样本关系图;
基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据;
对样本输入图进行文本转换,获得样本输入图对应的样本文本;
将样本文本输入任务处理模型,获得任务预测结果;
基于任务预测结果和标签任务数据,计算损失值;
基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型;
将任务处理模型的模型参数反馈至端侧设备。
根据本说明书实施例的第四方面,提供了一种任务处理装置,包括:
第一获取模块,被配置为获取目标关系图和目标任务的描述文本;
第一提取模块,被配置为根据描述文本,从目标关系图中提取目标任务对应的待处理图;
第一转换模块,被配置为对待处理图进行文本转换,获得待处理图对应的待处理文本;
第一处理模块,被配置为将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
根据本说明书实施例的第五方面,提供了一种法律任务处理装置,包括:
接收模块,被配置为接收前端用户发送的目标法律任务的处理请求,其中,处理请求包括法律知识图谱和任务描述文本;
第二提取模块,被配置为根据任务描述文本,从法律知识图谱中提取目标法律任务对应的待处理子图;
第二转换模块,被配置为对待处理子图进行文本转换,获得待处理子图对应的待处理文本;
第二处理模块,被配置为将任务描述文本和待处理文本输入法律任务处理模型,基于任务描述文本对待处理文本执行目标法律任务,获得处理结果;
第二反馈模块,被配置为将处理信息反馈至前端用户。
根据本说明书实施例的第六方面,提供了一种配置于云侧设备的任务处理模型的训练装置,包括:
第二获取模块,被配置为获取样本集,其中,样本集包括多个领域下采集的样本关系图;
第三提取模块,被配置为基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据;
第三转换模块,被配置为对样本输入图进行文本转换,获得样本输入图对应的样本文本;
输入模块,被配置为将样本文本输入任务处理模型,获得任务预测结果;
计算模块,被配置为基于任务预测结果、标签任务数据,计算损失值;
第二训练模块,被配置为基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型;
第三反馈模块,被配置为将任务处理模型的模型参数反馈至端侧设备。
根据本说明书实施例的第七方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
根据本说明书实施例的第八方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述方法的步骤。
根据本说明书实施例的第九方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。
本说明书一个实施例实现了获取目标关系图和目标任务的描述文本;根据描述文本,从目标关系图中提取目标任务对应的待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
如此,通过描述文本,能够从目标关系图中提取目标任务对应的待处理图;通过对待处理图进行文本转换,获得待处理图对应的待处理文本,能够将待处理图的表示形式转换为文本表示形式,这样无论待处理图原本的图结构、以及表示形式是什么,都能够通过格式转换获得输入格式统一的待处理文本以使任务处理模型能够直接识别和处理,从而实现跨领域、跨任务的图处理;通过将描述文本和待处理文本输入任务处理模型,能够基于跨领域、跨任务的图学习算法,对待处理文本进行处理,获得任务处理结果,提高目标任务的任务执行效率和任务处理结果的准确性。
附图说明
图1是本说明书一个实施例提供的一种任务处理***的架构图;
图2是本说明书一个实施例提供的一种任务处理方法的流程图;
图3是本说明书一个实施例提供的一种法律任务处理方法的流程图;
图4是本说明书一个实施例提供的一种应用于云侧设备的任务处理模型的训练方法的流程图;
图5是本说明书一个实施例提供的一种任务处理方法的处理过程示意图;
图6是本说明书一个实施例提供的一种任务处理装置的结构示意图;
图7是本说明书一个实施例提供的一种法律任务处理装置的结构示意图;
图8是本说明书一个实施例提供的一种配置于云侧设备的任务处理模型的训练装置的结构示意图;
图9是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
本说明书一个或多个实施例中,大模型是指具有大规模模型参数的深度学习模型,通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。大模型又可以称为基石模型/基础模型(Foundation Model),通过大规模无标注的语料进行大模型的预训练,产出亿级以上参数的预训练模型,这种模型能适应广泛的下游任务,模型具有较好的泛化能力,例如大规模语言模型(Large Language Model,LLM)、多模态预训练模型(multi-modal pre-training model)等。
大模型在实际应用时,仅需少量样本对预训练模型进行微调即可应用于不同的任务中,大模型可以广泛应用于自然语言处理(Natural Language Processing,NLP)、计算机视觉等领域,具体可以应用于如视觉问答(Visual Question Answering,VQA)、图像描述(Image Caption,IC)、图像生成等计算机视觉领域任务,以及基于文本的情感分类、文本摘要生成、机器翻译等自然语言处理领域任务,大模型主要的应用场景包括数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
关系图:用于表示物体与物体之间存在某种关系的图结构。数学抽象后的“物体”称作节点或顶点,节点间的关系则称作边。关系图可以包括知识图谱、分子图、电商图谱等任意领域的图数据。
节点属性预测(Node Property Prediction):给定一个具体的图,一个节点属性预测任务一般定义为根据这个图预测该图上部分节点的某些属性的值。例如,在一个用户和商品形成的购买关系的图中,预测一个用户的性别或者年龄。
边属性预测(Link Property Prediction):给定一个具体的图,一个边属性预测任务一般定义为根据这个图预测该图上部分边的某些属性的值,包括预测一条边是否存在。例如,在一个用户和电影形成的点评关系的图中,预测一个用户是否会点评特定的电影,或者是预测一个用户对于一部电影的评分是多少。
图属性预测(Graph Property Prediction):给定一个具体的图,一个图属性预测任务一般定义为根据这个图预测该图整体的某些属性的值。例如,在一个由原子(节点)之间通过化学键(边)形成的分子图上,预测该分子是否具有特定的化学属性,例如氧化性。
大型语言模型(Large Language Model,LLM):大型语言模型是一种语言模型,由具有许多参数(通常数十亿个权重或更多数量级)的人工神经网络组成。对于文本具有非常强大的理解、推理能力。
实际应用中,关系图是一种能够表示物体与物体之间存在的关联关系的图结构。不同领域下关系图的图结构、以及图数据等可以是不同的,比如同构图和异构图的图结构不同,又比如化学领域下的分子图和法律领域下的法律图谱中的数据信息不同。这些差异导致针对不同的图处理任务,需要分别设计不同的图学习算法,以实现对不同领域、不同任务类型下的关系图中结构和关系等数据信息的学习。
现实世界中,通过神经网络模型以及图学习算法,通常能够基于关系图中各种层级的数据信息,挖掘得到图中对象的更多未知信息。针对关系图的挖掘任务往往可以包括节点层级的挖掘任务(例如在学术知识图谱上预测一个作者的研究领域)、边层级的挖掘任务(例如在蛋白质相互作用的图谱上预测两种蛋白质之间是否存在特定的相互作用)、以及图层级的挖掘任务(在单个分子图上预测一个该分子是否具有毒性),这些不同类型的挖掘任务所属的技术领域也可以是不同的。
然而,由于不同领域、不同任务类型下的图数据信息存在差异,导致在代码层面无法对不同领域、不同任务的数据集之间直接迁移使用。因此造成难以对现实世界中大量、丰富的图数据进行统一学习,难以获得一种能够跨领域、跨任务的通用的图学习算法。目前,往往只能针对不同领域、不同任务类型分别设计不同的图学习算法,以实现对不同图挖掘任务的处理。这就导致图挖掘任务的任务布局耗时长、成本高、数据集难以采集。基于这些不同的图学习算法训练得到的任务处理模型,会存在由于训练样本数据量有限,而难以提升模型准确性的问题,并且不具备通用的图处理能力,具有较大局限性。从而使目前针对图的任务处理方法具有较大局限性,无法满足实际应用中的图处理需求。
基于此,本说明书提供一种任务处理方法,获取目标关系图和目标任务的描述文本;根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型;基于图挖掘任务类型,从目标关系图中提取待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
如此,通过描述文本,能够从目标关系图中提取目标任务对应的待处理图;通过对待处理图进行文本转换,获得待处理图对应的待处理文本,能够将待处理图的表示形式转换为文本表示形式,这样无论待处理图原本的图结构、以及表示形式是什么,都能够通过格式转换获得输入格式统一的待处理文本以使任务处理模型能够直接识别和处理,从而实现跨领域、跨任务的图处理;通过将描述文本和待处理文本输入任务处理模型,能够基于跨领域、跨任务的图学习算法,对待处理文本进行处理,获得任务处理结果,提高目标任务的任务执行效率和任务处理结果的准确性。
参见图1,图1示出了根据本说明书一个实施例提供的一种任务处理***的架构图,任务处理***具体可以包括客户端100和服务端200。
客户端100,用于向服务端200发送目标关系图和目标任务的描述文本。
服务端200,用于根据描述文本,从目标关系图中提取目标任务对应的待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果;将任务处理结果发送至客户端100。
客户端100,还用于接收服务端200发送的任务处理结果。
应用本说明书实施例提供的任务处理***,客户端可以向服务端发送目标关系图和目标任务的描述文本。服务端接收目标关系图和目标任务的描述文本,可以根据描述文本,从目标关系图中提取目标任务对应的待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果;将任务处理结果发送至客户端。
由于将待处理数据输入至任务处理模型之前,会根据图挖掘任务类型从目标关系图中提取待处理图,并对待处理图进行文本转换,获得待处理图对应的待处理文本。因此,能够针对目标任务对应的待处理对象,从目标关系图中提取所需的图数据,从而提高任务处理结果的准确性,并且,通过对待处理图进行文本转换,获得待处理图对应的待处理文本,能够对待处理图的格式进行标准化处理,使得输入任务处理模型的表示形式统一,从而使任务处理模型能够对输入数据进行识别和处理,实现跨领域、跨任务的图处理,提高任务处理效率。
实际应用中,任务处理***可以包括多个客户端100以及服务端200。多个客户端100可以分别与服务端200建立通信连接。在任务处理场景中,服务端200用于获取各客户端100对应的目标关系图和目标任务的描述文本,为各客户端提供任务处理服务。多个客户端100可以分别作为发送端或接收端,通过服务端200实现通信。
其中,客户端100与服务端200之间通过网络建立连接。网络为客户端100与服务端200之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端100所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端200。
客户端100可以为浏览器、应用程序(Application,APP)、或网页应用如超文本标记语言第5版应用(Hyper Text Markup Language5,H5)、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端100可以基于服务端200提供的相应服务的软件开发工具包(Software Development Kit,SDK),如基于实时通信(Real Time Communication,RTC)SDK开发获得等。客户端100可以部署在电子设备中,需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等端侧设备。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
服务端200可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端200可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式***的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器(云侧设备),或者是带人工智能技术的智能云计算服务器或智能云主机。
值得说明的是,本说明书实施例中提供的任务处理方法一般由服务端执行,但是,在本说明书的其它实施例中,客户端也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的任务处理方法。在其它实施例中,本说明书实施例所提供的任务处理方法还可以是由客户端与服务端共同执行。
在本说明书中,提供了一种任务处理方法,本说明书同时涉及一种法律任务处理方法,一种应用于云侧设备的任务处理模型的训练方法,一种任务处理装置,一种法律任务处理装置,一种配置于云侧设备的任务处理模型的训练装置,一种计算设备,一种计算机可读存储介质,以及一种计算机程序产品,在下面的实施例中逐一进行详细说明。
参见图2,图2示出了根据本说明书一个实施例提供的一种任务处理方法的流程图,具体包括以下步骤。
步骤202:获取目标关系图和目标任务的描述文本。
实际应用中,要实现针对关系图的数据信息的挖掘,可以获取目标关系图和目标任务的描述文本。
具体地,目标任务可以理解为是针对目标关系图所要执行的待处理任务。目标任务可以是对目标关系图中的数据信息进行分析的任务,比如分析目标关系图中具有多少个节点、多少条边、指定两个节点之间的关系等等;也可以是针对目标关系图的待预测任务或者待挖掘任务。与分析任务不同,预测任务或者挖掘任务往往可以用于对无法直接从目标关系图中获取的信息进行预测,比如预测一个作者的研究领域、预测一个分子是否具有毒性、预测法律案件可能的刑期等等。
具体地,目标关系图可以理解为是待分析或者待挖掘的关系图。目标关系图可以是任意领域下的关系图,目标关系图中包括至少一个节点、以及至少一个节点之间的关联关系。描述文本可以理解为是描述目标任务执行方式的文本(比如:这是一个针对节点A的挖掘任务,请预测节点A的属性信息),也可以是针对目标关系图提出的问题文本(比如:请问图中作者A的研究领域是什么?可以从‘人工智能’、‘数据库’、‘操作***’中选择答案)。
在本说明书一种可选的实施例中,获取目标关系图和目标任务的描述文本,可以是接收前端用户通过客户端发送的目标关系图和描述文本。
在本说明书另一种可选的实施例中,获取目标关系图和目标任务的描述文本,也可以是接收前端用户通过客户端发送的目标任务的描述文本,基于描述文本确定对应的目标关系图。
步骤204:根据描述文本,从目标关系图中提取目标任务对应的待处理图。
实际应用中,在获取目标关系图和目标任务的描述文本的基础上,可以根据描述文本,从目标关系图中提取目标任务对应的待处理图。
具体地,待处理图可以理解为是执行目标任务所需的图。待处理图是从目标关系图中提取获得的。
在本说明书一种可选的实施例中,待处理图可以是基于目标任务所要预测或挖掘的目标关系图中的目标节点,提取获得的包含目标节点的局部子图。
在本说明书另一种可选的实施例中,待处理图可以是基于目标任务所要预测或挖掘的目标关系图中的目标边,提取获得的包含目标边的局部子图。
在本说明书再一种可选的实施例中,在目标任务是要针对整张目标关系图,预测或挖掘的整张图对应的属性信息的情况下,待处理图可以是整张目标关系图。
实际实现过程中,可以基于不同任务场景中的描述文本,确定待处理图的具体提取方式。
可选地,在本说明书一种可选的实施例中,根据描述文本,从目标关系图中提取目标任务对应的待处理图,可以包括如下步骤:
根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型;
基于图挖掘任务类型,从目标关系图中提取目标任务对应的待处理图。
具体地,图挖掘任务类型可以理解为是针对目标关系图,对目标关系图中对象属性执行挖掘任务的任务类型。其中,目标关系图中的对象可以包括各个节点、各个节点之间的关系、以及整张目标关系图本身。对象属性可以理解为是目标关系图中各对象包含的属性信息。目标关系图中的对象可以对应真实世界中的实体对象。
示例性地,在目标关系图是学术知识图谱的情况下,目标关系图中的节点可以对应真实世界中的某位作者。该节点的属性可以包括该作者的年龄、生日、研究领域等属性信息。
基于目标关系图中不同类型的对象在目标关系图中的层级不同,针对不同类型对象的图挖掘任务可以分别对应不同的图挖掘任务类型。图挖掘任务类型可以包括节点层级的任务类型、边层级的任务类型和图层级的任务类型,上述三种类型可以分别对应目标任务所要挖掘的对象是目标关系图中的节点、边、整张目标关系图。
需要说明的是,根据图挖掘任务类型的不同,目标关系图的数量也可能不同。示例性地,在图挖掘任务类型为节点层级的任务类型或边层级的任务类型的情况下,目标关系图通常为一张,对应的图挖掘任务通常是对该目标关系图中的一个或多个节点的节点属性,或者一条或多条边的边属性进行挖掘。而在图挖掘任务类型为图层级的任务类型的情况下,目标关系图可以为一张或者多张,对应的图挖掘任务通常是对至少一张目标关系图的其中一整张图的图属性进行挖掘。
实际应用中,在确定目标任务相对于目标关系图的图挖掘任务类型的基础上,可以基于图挖掘任务类型,从目标关系图中提取待处理图。
具体地,待处理图可以理解为是用于输入任务处理模型以使模型执行目标任务的输入图。待处理图可以是完整的目标关系图,也可以是基于目标关系图中的节点或者边提取得到的包含目标节点或者目标边的局部子图。进一步地,待处理图还可以包括以目标节点为中心的节点的自我中心图、以目标边为中心的边的自我中心图和完整的图。其中,目标节点为目标任务对应挖掘的节点,目标边为目标任务对应挖掘的边,完整的图为目标任务对应挖掘的整张图。
需要说明的是,目标任务对应的待处理图可以是一个也可以是多个,待处理图的数量以及待处理图的类型均可以根据实际应用中的需求确定,本说明书对此不做任何限定。
在本说明书一种可选的实施例中,根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型,可以包括如下步骤:
根据描述文本,识别目标任务对应的待处理对象;
根据待处理对象在目标关系图中的层级分布、以及层级分布与图挖掘任务类型之间的预设对应关系,确定目标任务相对于目标关系图的图挖掘任务类型。
具体地,待处理对象可以理解为是目标任务所要挖掘的对象,待处理对象是目标关系图中的对象,也即可以是目标关系图中的节点,也可以是目标关系图中的边(也即图中两个节点之间的关系),还可以是整张目标关系图。需要说明的是,目标关系图中的各类对象,可以用于表征真实世界中的实体、或者实体之间的关系。
示例性地,在一种应用场景下,目标关系图中的节点可以表征真实世界中的用户、边可以表征用户与用户之间的关联关系,或者用户与商品之间的关联关系。在另一种应用场景下,整张目标关系图可以表征真实世界中的一个分子或者原子,对整张目标关系图进行图挖掘,即是对该分子或者该原子的属性进行挖掘。
在待处理对象为节点的情况下,目标任务可以是对节点的属性进行预测(例如在学术知识图谱上预测一个作者的研究领域);在待处理对象为边的情况下,目标任务可以是对边的属性进行预测(例如在蛋白质相互作用的图谱上预测两种蛋白质之间是否存在特定的相互作用);在待处理对象为整张图的情况下,目标任务可以是对整张图的属性进行预测(例如在单个分子图上预测一个该分子是否具有毒性)。
实际应用中,由于待处理对象可以是图中的节点(节点层级)、也可以是图中任两个节点之间的关系(边层级),还可以是整张图的某种属性信息(图层级),因此,在识别得到待处理对象的基础上,就可以基于待处理对象在目标关系图中的层级分布、以及层级分布与图挖掘任务类型之间的预设对应关系,确定目标任务相对于目标关系图的图挖掘任务类型。
具体地,待处理对象在目标关系图中的层级分布,可以理解为待处理对象在目标关系图中所处的层级。在待处理对象为节点或者某个实体的情况下,待处理对象在目标关系图中所对应的层级可以是节点层级;在待处理对象为边或者某两个实体之间的关联关系的情况下,待处理对象在目标关系图中所对应的层级可以是边层级;在待处理对象为图或者某个实体的情况下,待处理对象在目标关系图中所对应的层级可以是图层级。
相应地,层级分布与图挖掘任务类型之间的预设对应关系,可以包括:图层级的待处理对象对应的图挖掘任务类型为图层级任务类型、边层级的待处理对象对应的图挖掘任务类型为边层级任务类型、节点层级的待处理对象对应的图挖掘任务类型为节点层级任务类型。
应用本说明书实施例,通过根据描述文本,识别目标任务对应的待处理对象,能够根据待处理对象在目标关系图中的层级,确定目标任务相对于目标关系图的图挖掘任务类型,从而能够基于图挖掘任务类型从目标关系图中提取用于执行挖掘任务的待处理图,提高任务处理效率和准确性。
在本说明书一种可选的实施例中,图挖掘任务类型包括节点层级任务类型。相应地,基于图挖掘任务类型,从目标关系图中提取目标任务对应的待处理图,可以包括如下步骤:
在图挖掘任务类型为节点层级任务类型的情况下,从目标关系图中确定目标任务对应的目标节点;
从目标关系图中,提取包含目标节点的第一局部关系子图,获得目标任务对应的待处理图。
具体地,目标节点可以理解为是,在目标任务的图挖掘任务类型是节点层级的任务类型的情况下,目标任务所要挖掘数据信息的节点。第一局部关系子图可以理解为是针对目标节点,从目标关系图中提取得到的局部子图,也可以理解为是以目标节点为中心的节点的自我中心图。
需要说明的是,目标任务所要挖掘的目标节点可以为一个或多个,因此,基于目标关系图提取获得的第一局部关系子图可以是一个或多个目标节点分别对应的节点的自我中心图。
示例性地,目标关系图是某购物软件上所有商品和用户之间形成的交互记录图。目标任务是要预测该交互记录图中随机一万个用户的用户职业(节点层级的图挖掘任务)。则,目标节点为该图中的随机一万个节点,第一局部关系子图为这随机一万个节点分别对应的节点的自我中心图。
可选地,在本说明书一种具体的实现方式中,基于目标关系图,提取目标节点对应的第一局部子关系图,可以是将目标节点作为中心节点,按照预设距离不超过j步,从目标关系图中提取目标节点对应的节点的自我中心图。其中,j为大于等于0的整数。
可选地,在本说明书另一种具体的实现方式中,也可以将目标关系图、目标节点、以及j步输入至预先训练获得的图处理模型中,获得模型输出的第一局部关系子图。
应用本说明书实施例,在目标任务的图挖掘任务类型是节点层级任务类型的情况下,从目标关系图中确定目标任务对应的目标节点,能够针对目标任务想要挖掘数据信息的节点,从目标关系图中提取目标节点对应的第一局部关系子图,获得待处理图,从而提高任务处理的准确性和效率。
在本说明书另一种可选的实施例中,图挖掘任务类型包括边层级任务类型。相应地,基于图挖掘任务类型,从目标关系图中提取目标任务对应的待处理图,可以包括如下步骤:
在图挖掘任务类型为边层级任务类型的情况下,从目标关系图中确定目标任务对应的目标边;
从目标关系图中,提取包含目标边的第二局部关系子图,获得目标任务对应的待处理图。
具体地,目标边可以理解为是,在目标任务的图挖掘任务类型是边层级的任务类型的情况下,目标任务所要挖掘数据信息的边。第二局部关系子图可以理解为是针对目标边,从目标关系图中提取得到的局部子图,也可以理解为是以目标边为中心的边的自我中心图。
需要说明的是,目标任务所要挖掘的目标边可以为一个或多个,因此,基于目标关系图提取获得的第二局部关系子图可以是一个或多个目标边分别对应的边的自我中心图。
示例性地,目标关系图是某购物软件上所有商品和用户之间形成的交互记录图。目标任务是要预测该交互记录图中,随机一万个用户是否会购买某件商品(边层级的图挖掘任务)。则,目标边为该图中的随机一万个节点与指定商品之间的连接线,第二局部关系子图为以这些连接线作为中心边,提取得到的边的自我中心图。
可选地,在本说明书一种具体的实现方式中,基于目标关系图,提取目标边对应的第二局部关系子图,可以是将目标边作为中心边,按照预设距离不超过K步,从目标关系图中提取目标边对应的边的自我中心图。其中,k为大于等于0的整数。
可选地,在本说明书另一种具体的实现方式中,也可以将目标关系图、目标边、以及K步输入至预先训练获得的图处理模型中,获得模型输出的第二局部关系子图。
应用本说明书实施例,在目标任务的图挖掘任务类型是边层级的图挖掘任务的情况下,从目标关系图中确定目标任务对应的目标边,能够针对目标任务想要挖掘数据信息的边,从目标关系图中提取目标边对应的第二局部关系子图,获得待处理图,从而提高任务处理的准确性和效率。
在本说明书再一种可选的实施例中,图挖掘任务类型包括图层级任务类型。相应地,基于图挖掘任务类型,从目标关系图中提取目标任务对应的待处理图,可以包括如下步骤:
在图挖掘任务类型为图层级任务类型的情况下,确定目标关系图为目标任务对应的待处理图。
实际应用中,在目标任务的图挖掘任务类型为图层级任务类型的情况下,由于目标任务的目的就是要针对整张图进行图层级属性信息的挖掘和预测,因此,可以直接将目标关系图确定为待处理图。
需要说明的是,在目标任务的图挖掘任务类型为图层级任务类型的情况下,目标关系图可以为一个或多个,相应地,待处理图也可以为一个或多个。
示例性地,目标任务是判断化学分子是否具有氧化性。该目标任务可以对应一个目标关系图集合,该集合中每个目标关系图都是一个化学分子的分子图。通过目标任务,可以预测该集合中所有的化学分子分别是否具有氧化性。
因此,在本说明书一种可选的实施例中,还可以是从目标任务对应的目标关系图集合中确定目标关系图。
应用本说明书实施例,在目标任务的图挖掘任务类型是图层级任务类型的情况下,将目标关系图确定为目标任务对应的待处理图,能够进一步提高任务处理的准确性和效率。
步骤206:对待处理图进行文本转换,获得待处理图对应的待处理文本。
实际应用中,在将待处理图作为输入图输入至任务处理模型进行预测之前,为了使任务处理模型能够准确识别出输入图中的特征,可以对待处理图进行文本转换,获得待处理图对应的待处理文本。
具体地,待处理文本可以理解为是待处理图对应的文本形式的表示,是通过文本表示方案,以文本的形式对图进行叙述从而得到的文本。待处理文本和待处理图本质上是同一种数据,只不过一个是以图结构的形式表示,一个是以文本的形式表示。
实际实现过程中,文本表示方案可以包括JSON、GML、GraphML、RDF等多种文本格式,可以根据实际应用中的需求,选择任一种文本表示方案对待处理图进行文本转换,获得待处理图对应的待处理文本。
在本说明书一种可选的实施例中,对待处理图进行文本转换,获得待处理图对应的待处理文本,可以是通过任一种文本表示方案将待处理图转换为对应格式的文本表示,从而获得待处理图对应的待处理文本。
在本说明书另一种可选的实施例中,还可以将待处理图输入至预先训练完成的格式转换模型中,获得模型输出的待处理文本。
步骤208:将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
实际应用中,在获得待处理图对应的待处理文本的基础上,可以将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
具体地,任务处理模型可以理解为是预先完成训练的具有跨领域、跨任务的图处理能力的模型。任务处理模型具体可以是一种大语言模型。任务处理结果可以理解为是基于描述文本对待处理文本执行目标任务,获得的针对目标关系图的挖掘结果或者预测结果。
在本说明书一种可选的实施例中,为了提高任务处理模型处理目标任务的效率,在将描述文本输入任务处理模型之前,还可以判断描述文本是否符合任务处理规范,若否,则对描述文本的文本表示形式进行规范化处理。具体地,在判断得到描述文本不是自然语言的表示形式的情况下,可以通过文本叙述,将描述文本处理为自然语言的叙述形式。
示例性地,自然语言的叙述形式可以是:“问题:请问输入图中作者A的研究领域是什么?可选的***括‘人工智能’、‘数据库’、‘操作***’”。
根据本说明书一个可选的实施例,在将描述文本和待处理文本输入任务处理模型之前,还可以包括如下S21002-S21012:
S21002:获取样本集,其中,样本集包括多个领域下采集的样本关系图。
具体地,样本集可以用于对任务处理模型进行训练。样本集中包括从多个领域下采集的样本关系图。
可选地,在本说明书一个具体的实现方式中,获取样本集,可以通过采集现实世界中多种领域下丰富的图数据、以及图挖掘任务实现。
可选地,在本说明书一个具体的实现方式中,获取样本集,除了采集现实世界中多种领域下丰富的图数据、以及图挖掘任务以外,还可以通过获取公共数据集,或者购买第三方数据集的方式实现。
S21004:基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据。
具体地,样本输入图可以理解为是基于样本关系图提取得到的图,样本输入图可以包括包含目标样本节点的局部子图、包含目标样本边的局部子图和完整的样本关系图,其中,包含目标样本节点的局部子图可以是节点的自我中心图、包含目标样本边的局部子图可以是边的自我中心图。标签任务数据可以理解为是携带标注标签的任务数据。标签任务数据可以包括图挖掘任务对应的挖掘对象、以及挖掘对象的对象属性信息。
具体地,挖掘对象可以理解为是图挖掘任务需要挖掘的样本关系图中的对象。挖掘对象可以是样本关系图中的节点、边或者整张样本关系图。对象属性信息是挖掘对象实际对应的属性值信息。示例性地,图挖掘任务是在学术知识图谱上预测一个作者的研究领域,则样本关系图为学术知识图谱,作者的研究领域为节点层级的挖掘对象,对象属性信息可以是人工智能等具体的研究领域。
在本说明书一种可选的实施例中,样本输入图对应的标签任务数据,可以是基于现实世界中已携带挖掘对象、及挖掘对象的对象属性信息的图挖掘任务获得。
在本说明书另一种可选的实施例中,样本输入图对应的标签任务数据,也可以是基于样本关系图构建得到的图挖掘任务,对样本输入图进行人工标注获得。
进一步地,在本说明书一种可选的实施例中,从样本关系图中提取样本输入图,可以包括如下步骤:
基于预设的多种图挖掘任务,从样本关系图中提取样本输入图。
具体地,预设的多种图挖掘任务是用于对样本关系图种的各种挖掘对象进行挖掘或者预测的任务。预设的多种图挖掘任务,可以是基于收集的现实世界种已有的图挖掘任务获得,也可以是基于多个领域下采集的样本关系图,基于样本关系图构建得到。
可选地,根据本说明书一种具体的实施方式,基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,可以是从样本关系图中提取一部分局部子图,也可以是将整张样本关系图确定为样本输入图。
可选地,根据本说明书另一种具体的实施方式,基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,可以是基于图挖掘任务对应的任务类型,从样本关系图中提取样本输入图。
实际实现过程中,图挖掘任务类型可以包括节点层级任务类型、边层级任务类型和图层级任务类型。在图挖掘任务类型为节点层级任务类型的情况下,从样本关系图中提取样本输入图可以包括:确定图挖掘任务对应的节点层级的挖掘对象,从样本关系图中提取包含该节点层级的挖掘对象的局部子图,作为样本输入图。在图挖掘任务类型为边层级任务类型的情况下,从样本关系图中提取样本输入图可以包括:确定图挖掘任务对应的边层级的挖掘对象,从样本关系图中提取包含该边层级的挖掘对象的局部子图,作为样本输入图。在图挖掘任务类型为图层级任务类型的情况下,从样本关系图中提取样本输入图可以包括:将样本关系图确定为样本输入图。
相应地,确定样本输入图对应的标签任务数据,可以包括如下步骤:
基于图挖掘任务,确定样本输入图对应的挖掘对象;
从样本输入图中提取挖掘对象的对象属性信息,获得样本输入图对应的标签任务数据。
可选地,根据本说明书一种具体的实施方式,基于图挖掘任务,确定样本输入图对应的挖掘对象,可以包括:根据图挖掘任务携带的任务描述信息,确定样本输入图对应的挖掘对象。
可选地,根据本说明书一种具体的实施方式,从样本输入图中提取挖掘对象的对象属性信息,可以是解析样本输入图的图结构,获得挖掘对象的对象属性信息;也可以是识别样本输入图中的文字内容,获得挖掘对象的对象属性信息。
应用本说明书实施例,基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,基于图挖掘任务,确定样本输入图对应的挖掘对象,从样本输入图中提取挖掘对象的对象属性信息,获得样本输入图对应的标签任务数据,能够提高样本输入图的准确性,从而提高标签任务数据的准确性和获取效率。
S21006:对样本输入图进行文本转换,获得样本输入图对应的样本文本。
具体地,样本文本可以理解为是以文本表示的形式对输入图进行叙述。
在本说明书一种可选的实施例中,对样本输入图进行文本转换,获得样本输入图对应的样本文本,可以是通过任一种文本表示方案将样本输入图转换为对应格式的文本表示,从而获得样本输入图对应的样本文本。
在本说明书另一种可选的实施例中,还可以将样本输入图输入至预先训练完成的格式转换模型中,获得模型输出的样本文本。
S21008:将样本文本输入任务处理模型,获得任务预测结果。
具体地,任务预测结果可以理解为是任务处理模型针对样本文本执行图挖掘任务,输出的预测结果。
S21010:基于任务预测结果和标签任务数据,计算损失值。
具体地,任务预测结果是任务处理模型基于样本文本,推理获得的挖掘对象对应的预测对象属性信息。
实际实现过程中,在获得任务预测结果的基础上,就可以基于任务预测结果和标签任务数据中挖掘对象对应的对象属性信息,计算任务处理模型的模型损失值,并基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型。具体地,模型损失值的计算方式包括交叉熵损失值计算方式、以及其他损失函数计算方式,具体可以根据实际需求确定,本说明书对此不做任何限定。
S21012:基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型。
可选地,判定任务处理模型完成训练的方式可以包括:任务处理模型达到预设收敛条件,或者任务处理模型的训练步数达到预设阈值等等,具体可以根据实际需求确定,本说明书对此不做任何限定。
需要说明的是,由于现实世界中存在大量已知的图挖掘任务、以及各领域各图挖掘任务下丰富的图数据。示例性地,图挖掘任务可以包括:在学术知识图谱上预测一个作者的研究领域(节点层级的图挖掘任务)、在蛋白质相互作用的图谱上预测两种蛋白质之间是否存在特定的相互作用(边层级的图挖掘任务)、在单个分子图上预测该分子是否具有毒性(图层级的图挖掘任务)等等。
因此,可以收集现实世界中的图挖掘任务和这些图挖掘任务对应的丰富的图数据,并在收集的过程中获得各图挖掘任务的标签任务数据。从而基于收集得到的图数据、以及图挖掘任务,开发跨领域、跨任务的图学习算法。其中,丰富的图数据可以作为样本集中的样本关系图,标签任务数据可以包括挖掘对象和挖掘对象的对象属性信息。
进一步地,除了收集现实世界中已有的图挖掘任务、以及获得各图挖掘任务的标签任务数据外。还可以针对各样本关系图,构造新的图挖掘任务,确定新的图挖掘任务的挖掘对象,并人工标注对应的对象属性信息。从而进一步增加用于图学习的数据集中样本的数量。
应用本说明书实施例,通过收集图挖掘任务、样本关系图、以及标签任务数据,可以基于不同挖掘任务类型、不同领域下的大量样本数据,开发跨领域、跨任务的通用的图学习算法,并能够借助模型实现对不同领域、不同任务的关系图的图推理和预测。
为了避免不同图结构(例如同构图和异构图)、不同任务类型、不同领域对应的图数据之间存在差异,导致任务处理模型无法对各种不同的图数据进行处理,本说明书一个或多个实施例在将样本输入图输入至任务处理模型之前,还会对样本输入图进行文本转换。从而使输入任务处理模型的图数据统一转换为文本表示的形式,使得任务处理模型能够对各种不同类型的图数据均可以进行识别和处理。
在说明书一个可选的实施例中,对样本输入图进行文本转换,获得样本输入图对应的样本文本,可以包括如下步骤:
采用多种目标文本表示策略,对样本输入图进行文本转换,获得各目标文本表示策略对应的文本格式下的样本文本。
具体地,目标文本表示策略可以理解为是一种文本表示方案,可以将图结构以自然语言的形式进行叙述,从而实现将样本输入图转换为文本格式的样本文本。目标文本表示策略包括但不限于将图结构以JOSN、GML、RDF、GraphML等格式转换为文本表示。进一步地,在基于样本关系图提取获得样本输入图的基础上,可以将每一张样本输入图都经过多种目标文本表示策略,转换为多个格式不同的样本文本。
示例性地,假设目标文本表示策略包括:1.将图结构以JOSN格式转换为文本表示。2.将图结构以GML格式转换为文本表示。3.将图结构以RDF格式转换为文本表示。4.将图结构以GraphML格式转换为文本表示。则每张样本输入图对应的样本文本都可以对应JOSN、GML、RDF、和GraphML格式的文本表示。
实际实现过程中,根据现实世界中采集获得的丰富的图数据,可以获得大量不同的样本关系图。每个样本关系图,都可以存在节点层级的图挖掘任务、边层级的图挖掘任务和图层级的图挖掘任务。每个图挖掘任务均可以对应至少一个样本输入图。通过多种目标文本表示策略,对样本输入图进行文本转换,可以获得节点层级的文本表示集合G1、边层级的文本表示集合G2、以及图层级的文本表示集合G3。
示例性地,假设获取的图挖掘任务包括i个节点层级的图挖掘任务、j个边层级的图挖掘任务、以及k个图层级的图挖掘任务。其中,i个节点层级的图挖掘任务中每个任务分别对应a1、a2、...、ai个输入图。则采用m种目标文本表示策略,对样本输入图进行文本转换,获得的节点层级的文本表示集合G1中,包括的样本文本的数量可以为:(a1+a2+...+ai)×m。同理,j个边层级的图挖掘任务中每个任务分别对应b1、b2、...、bj个输入图,则采用m种目标文本表示策略,对样本输入图进行文本转换,获得的边层级的文本表示集合G2中,包括的样本文本的数量可以为:(b1+b2+...+bj)×m。k个图层级的图挖掘任务中每个任务分别对应c1、c2、...、ck个输入图,则采用m种目标文本表示策略,对样本输入图进行文本转换,获得的图层级的文本表示集合G3中,包括的样本文本的数量可以为:(c1+c2+...+ck)×m。也即是,i个节点层级的图挖掘任务、j个边层级的图挖掘任务、k个图层级的图挖掘任务,可以通过m种目标文本表示策略,转换得到[(a1+a2+...+ai)+(b1+b2+...+bj)+(c1+c2+...+ck)]×m个样本文本。
可见,通过现实世界已知的图挖掘任务、以及人工构造的图挖掘任务,能够获得大量的用于进行跨领域、跨任务的图学习的样本文本,提高图学习算法跨领域、跨任务的图学习能力,进而提高图学习算法的通用性。
相应地,将样本文本输入任务处理模型,获得任务预测结果,包括:
将任一样本文本输入任务处理模型,获得任务预测结果。
可选地,在本说明书一种具体的实现方式中,将任一样本文本输入任务处理模型,可以是将挖掘任务对应的任一格式的样本文本输入任务处理模型。
可选地,在本说明书另一种具体的实现方式中,将任一样本文本输入任务处理模型,也可以是将挖掘任务对应的全部格式的样本文本输入任务处理模型。
应用本说明书实施例,采用多种目标文本表示策略,对样本输入图进行文本转换,获得多种文本格式的样本文本,能够提高样本数据的多样性,从而提高后续用于训练任务处理模型的数据多样性,进一步推动任务处理模型更好地理解各种文本格式下的图数据,从而提高任务处理模型的任务处理效率。
在说明书一个可选的实施例中,在将样本文本输入任务处理模型,获得任务预测结果之前,还可以包括如下步骤:
针对样本输入图,构建图分析任务,并获得图分析任务的任务描述文本。
具体地,图分析任务可以理解为是对关系图中已有的结构和数据信息进行分析的任务。图分析任务具有通用性,对任意领域下的图数据都能够从图中直接找到答案。
示例性地,图分析任务可以包括:询问输入图中某节点的某已知属性的值(节点层级的图分析任务),或判断某两个节点之间是否具有某种关系(边层级的图分析任务),或判断输入图一共具有多少个节点(图层级的图分析任务),询问某两点之间的最短路径(图层级的图分析任务)。
可选地,可以从通用数据集中获取图分析任务,也可以构造图分析任务。图分析任务的答案可以由人工从输入图中查找获得,也可以基于计算机自动分析获得。
实际实现过程中,针对样本输入图构建图分析任务,可以通过对图分析任务中的任务描述语句或者问题文本进行文本叙述处理,获得图分析任务的任务描述文本。根据任务描述文本、样本输入图和图分析任务的答案,可以构造自监督任务的任务样本和样本标签,从而获得丰富的自监督任务。对于样本输入图,同样也可以构造节点层级、边层级和图层级的自监督任务。
示例性地,沿用上例,假设输入图分别对应的文本表示集合G1、G2、G3中分别包括(a1+a2+...+ai)×m、(b1+b2+...+bj)×m、(c1+c2+...+ck)×m个文本表示,且构造得到的节点层级、边层级和图层级的自监督任务分别为p、q、r个,则能够构造得到的文本表示的数量为[(a1+a2+...+ai)+(b1+b2+...+bj)+(c1+c2+...+ck)]×m×(p+q+r)。
将样本文本输入任务处理模型,获得任务预测结果,包括:
将任务描述文本和样本文本输入任务处理模型,获得任务预测结果。
具体地,任务预测结果为自监督任务的任务预测结果。
应用本说明书实施例,根据任务描述文本、样本输入图和图分析任务的答案,可以构造自监督任务的任务样本和样本标签,从而通过丰富的自监督任务提高后续用于训练任务处理模型的样本数据的多样性,进一步提高任务处理模型记忆、理解、推理图数据的能力。
在说明书一个可选的实施例中,在将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果之后,还可以包括如下步骤:
将任务处理结果反馈至前端用户;
接收前端用户发送的结果反馈信息,其中,结果反馈信息表征了任务处理结果的准确性;
根据结果反馈信息,获取更新的样本集;
基于更新的样本集,对任务处理模型进行训练。
具体地,前端用户可以理解为是通过前端输入目标关系图和目标任务的描述文本,想要获得针对目标关系图的预测结果的用户。结果反馈信息可以理解为是前端用户在获取到任务处理结果后,针对任务处理结果反馈的信息。结果反馈信息可以用于表征任务处理结果的准确性,具体可以是“准确”、或“不准确”、或“满意”、或“不满意”等反馈信息。
实际应用中,将任务处理结果反馈至前端用户,前端用户可以判断任务处理结果是否能够满足需求,或者是否为预期想要获得的结果。前端用户可以根据实际情况向服务器发送结果反馈信息。在前端用户的结果反馈信息为不准确的情况下,可以基于结果反馈信息中的详细信息,对样本集进行更新,并基于更新的样本集,对任务处理模型进行训练。从而使任务处理模型能够基于用户的结果反馈信息进行不断迭代和优化,提高任务处理模型的任务处理效率和准确性。
示例性地,若结果反馈信息反映出,用户对于节点层级的图挖掘任务的任务处理结果的准确性不满意,则可以增加样本集中与节点层级的图挖掘任务相关的样本数据在总样本数据中的占比,从而通过后续的训练提高模型针对节点层级的图挖掘任务的处理能力。或者也可以对待预测属性和属性值的正确性进行校验,提高样本数据的质量。
应用本说明书实施例,获取目标关系图和目标任务的描述文本;根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型;基于图挖掘任务类型,从目标关系图中提取待处理图;对待处理图进行文本转换,获得待处理图对应的待处理文本;将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
如此,通过根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型,能够基于图挖掘任务类型,从目标关系图中提取待处理图;通过对待处理图进行文本转换,获得待处理图对应的待处理文本,能够将待处理图的表示形式转换为文本表示形式,这样无论待处理图原本的图结构、以及表示形式是什么,都能够通过格式转换获得输入格式统一的待处理文本以使任务处理模型能够直接识别和处理,从而实现跨领域、跨任务的图处理;通过将描述文本和待处理文本输入任务处理模型,能够基于跨领域、跨任务的图学习算法,对待处理文本进行处理,获得任务处理结果,提高目标任务的任务执行效率和任务处理结果的准确性。
参见图3,图3示出了根据本说明书一个实施例提供的一种法律任务处理方法的流程图,具体包括以下步骤。
步骤302:接收前端用户发送的目标法律任务的处理请求,其中,处理请求包括法律知识图谱和任务描述文本。
具体地,法律知识图谱可以是根据法律场景中所涉及的要素以及这些要素之间的关联关系构建获得的知识图谱。法律知识图谱可以包含法条、案由、法官、法院、律师、律所、当事人、案件、事实、诉请等等一系列法律场景中所涉及的要素。示例性地,法律知识图谱中可以包含:某案件需参考的法条有哪些等等的关联或逻辑关系。目标法律任务可以包括法条检索任务、类案推荐任务、判决预测任务等等。
步骤304:根据任务描述文本,从法律知识图谱中提取目标法律任务对应的待处理子图。
步骤306:对待处理子图进行文本转换,获得待处理子图对应的待处理文本。
步骤308:将任务描述文本和待处理文本输入法律任务处理模型,基于任务描述文本对待处理文本执行目标法律任务,获得处理结果。
步骤310:将处理结果反馈至前端用户。
实际应用中,可以根据具体情况,将相关的待预测内容在法律知识图谱中对应的局部子图作为输入的一部分,以支持具体任务。示例性地,在判决预测的任务中,可以将案件相关的事实描述匹配到法律知识图谱中的相关事实上,然后将匹配到的相关事实的局部自我中心图召回,然后对这些相关事实的局部自我中心图进行文本转换,获得对应的待处理文本。最后将待处理文本和目标法律任务的任务描述文本(例如:“请给出该案件所涉法条、罪名及可能的刑期”)输入至法律任务处理模型,获得法律任务处理模型输出的处理结果。
需要说明的是,步骤302-步骤310的具体实现方式与上述步骤202-步骤210的实现方式相同,本说明书实施例便不再进行赘述。
应用本说明书实施例的方案,接收前端用户发送的目标法律任务的处理请求,其中,处理请求包括法律知识图谱和任务描述文本;根据任务描述文本,识别对于法律知识图谱的图挖掘任务类型;基于图挖掘任务类型,从法律知识图谱中提取待处理子图;对待处理子图进行文本转换,获得待处理子图对应的待处理文本;将任务描述文本和待处理文本输入法律任务处理模型,基于任务描述文本对待处理文本执行目标法律任务,获得处理结果;将处理信息反馈至前端用户。能够根据前端用户发送的目标法律任务的处理请求,获取法律知识图谱和任务描述文本,从而能够根据任务描述文本对法律知识图谱进行图推理或预测。通过根据任务描述文本,识别对于法律知识图谱的图挖掘任务类型,能够基于图挖掘任务类型,从法律知识图谱中提取待处理子图,提高对目标法律任务的任务处理效率和准确性。通过对待处理子图进行文本转换,获得待处理子图对应的待处理文本,能够将待处理子图的格式统一转换为文本格式,便于法律任务处理模型识别和处理,提高法律任务处理模型的任务处理效率。通过将处理信息反馈至前端用户,能够通过与前端用户的交互,不断迭代优化法律任务处理模型,提高处理结果的准确性。
在本说明书一个可选的实施例中,在接收前端用户发送的目标法律任务的处理请求之后,还可以包括如下步骤:
识别处理请求是否符合执行条件;
若否,则向前端用户发送提示消息,其中,提示消息用于指示前端用户更新处理请求直至符合执行条件。
可选地,识别处理请求是否符合执行条件,可以通过识别法律知识图谱、以及任务描述文本是否清楚、完整实现。
具体地,提示消息可以理解为,是在处理请求不符合执行条件的情况下,生成的引导用户对法律知识图谱或者任务描述文本进行更改的信息。
应用本说明书实施例,可以在用户输入的法律知识图谱、以及任务描述文本不清楚、不完整等难以识别到有效信息的情况下,生成提示消息,以引导用户发送更准确的处理请求。
参见图4,图4示出了根据本说明书一个实施例提供的一种任务处理模型的训练方法的流程图,应用于云侧设备,具体包括以下步骤。
步骤402:获取样本集,其中,样本集包括多个领域下采集的样本关系图。
步骤404:基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据。
步骤406:对样本输入图进行文本转换,获得样本输入图对应的样本文本。
步骤408:将样本文本输入任务处理模型,获得任务预测结果。
步骤410:基于任务预测结果和标签任务数据,计算损失值。
步骤412:基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型。
步骤414:将任务处理模型的模型参数反馈至端侧设备。
需要说明的是,步骤402-步骤414的具体实现方式与上述S21002-S21012的实现方式相同,本说明书实施例便不再进行赘述。
应用本说明书实施例,通过获取预设的多种图挖掘任务、采集多个领域下的样本关系图、获取标签任务数据,可以从样本关系图中提取样本输入图,可以基于多种图挖掘任务以及标签任务数据获得图挖掘任务的任务描述文本。通过将样本输入图统一转换为文本表示形式,可以基于不同挖掘任务类型、不同领域下的大量样本数据,开发跨领域、跨任务的通用的图学习算法,并能够借助模型实现对不同领域、不同任务的关系图的图推理和预测。
下述结合附图5,以本说明书提供的任务处理方法在跨领域、跨任务的图学习算法开发的应用为例,对所述任务处理方法方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的一种任务处理方法的处理过程示意图。
首先,可以收集现实世界中丰富的图数据、以及已知的图挖掘任务。根据现实世界中丰富的图数据获得大量的待预测样本图。根据已知的图挖掘任务获得针对待预测样本图的节点层级的待预测任务、边层级的待预测任务、以及图层级的待预测任务。并在收集上述数据的过程中,收集待预测属性以及对应的属性值。
针对每个待预测样本图,都可以基于其对应的节点层级的待预测任务、边层级的待预测任务和图层级的待预测任务,分别对待预测样本图进行处理,获得不同挖掘类型的任务分别对应的样本输入图。具体地,节点层级的待预测任务对应的样本输入图为节点的自我中心图;边层级的待预测任务对应的样本输入图为边的自我中心图;图层级的待预测任务对应的样本输入图为完整的待预测样本图。需要说明的是,每个图挖掘任务均可以对应一个或多个样本输入图。节点层级的待预测任务可以为节点属性预测的任务;边层级的待预测任务可以为节边属性预测的任务;图层级的待预测任务可以为图属性预测的任务。
其次,在获得不同挖掘类型的任务分别对应的样本输入图的基础上,可以通过多种文本表示方案,将这些样本输入图进行文本格式转换,转换为多种文本表示。从而获得节点层级的文本表示集合G1、边层级的文本表示集合G2、以及图层级的文本表示集合G3。
示例性地,假设获取的图挖掘任务包括i个节点层级的图挖掘任务、j个边层级的图挖掘任务、以及k个图层级的图挖掘任务。其中,i个节点层级的图挖掘任务中每个任务分别对应a1、a2、...、ai个输入图;j个边层级的图挖掘任务中每个任务分别对应b1、b2、...、bj个输入图;k个图层级的图挖掘任务中每个任务分别对应c1、c2、...、ck个输入图。则采用m种文本表示方案,对样本输入图进行文本转换,获得的节点层级的文本表示集合G1中,包括的样本文本的数量可以为:(a1+a2+...+ai)×m;获得的边层级的文本表示集合G2中,包括的样本文本的数量可以为:(b1+b2+...+bj)×m;获得的图层级的文本表示集合G3中,包括的样本文本的数量可以为:(c1+c2+...+ck)×m。
再次,可以根据i个节点层级的图挖掘任务、j个边层级的图挖掘任务、k个图层级的图挖掘任务、以及待预测属性和属性值,获得i个节点层级的待预测任务、j个边层级的待预测任务和k个图层级的待预测任务,并根据待预测属性和属性值获得待预测任务的任务描述文本。通过文本叙述的方式,将任务描述文本转换为自然语言描述的形式。从而获得由i个节点层级的待预测任务的任务描述信息构成的文本表示集合T1、由j个边层级的待预测任务的任务描述信息构成的文本表示集合T2、以及由k个图层级的待预测任务的任务描述信息构成的文本表示集合T3。
示例性地,自然语言描述形式的任务描述信息可以为:“问题:请问输入图中作者A的研究领域是什么?可选的***括‘人工智能’、‘数据库’、‘操作***’。答案:‘人工智能’”。
根据文本表示集合G1、G2、G3和文本表示集合T1、T2、T3,可以构造得到[(a1+a2+...+ai)+(b1+b2+...+bj)+(c1+c2+...+ck)]×m个样本文本。根据文本表示集合G1、G2、G3和文本表示集合T1、T2、T3,可以构造样本对,将通过样本输入图转换得到的样本文本、以及任务描述文本输入至大型语言模型中,训练获得具有跨领域、跨任务的通用图处理能力的大型语言模型。
应用本说明书提供的实施例,收集各领域下的丰富的图数据、以及各种类型的图挖掘任务,可以获得大量的待预测样本图、和多种类型的待预测任务以及待预测任务的任务描述文本,提高样本数量。按照待预测任务的类型对各待预测样本图进行提取,获得多个样本输入图,并对样本输入图进行文本转换,获得对应的样本文本,可以将不同类型、不同结构、不同领域的图数据统一转换为文本表示形式,从而便于按照统一的方式对图数据进行学习,便于开发跨领域、跨任务的图学习算法。通过样本输入图对应的文本表示、和待预测任务的待预测属性及值对应的任务描述文本,构成输入对输入至大型语言模型中,能够综合利用广泛的图数据,推动大型语言模型进行更好的图学习。通过利用多种文本表示方案将样本输入图转换为多种格式的文本表示,能够提高训练数据的多样性,进一步推动大型语言模型更好地理解图数据。从而能够通过跨领域、跨任务的通用的图学习算法,训练获得具有跨领域、跨任务的通用的图处理能力的大型语言模型。
在此基础上,还可以根据样本输入图、以及通用的数据集,直接构造大量、多层级的自监督任务。对于任意一个输入图,都可以构造节点/边/图层级的自监督任务,并自动获得自监督任务的任务处理结果。自监督任务的任务描述文本同样也可以通过文本叙述的方式转换为自然语言描述的文本表示。
示例性地,假设节点层级的自监督任务数量为p,边层级的自监督任务数量为q,图层级的自监督任务数量为r,则通过文本叙述,转换得到节点层级的自监督任务的文本表示集合Q1包括p个文本表示、边层级的自监督任务的文本表示集合Q2包括q个文本表示、图层级的自监督任务的文本表示集合Q3包括r个文本表示。沿用上例,根据文本表示集合G1、G2、G3和文本表示集合Q1、Q2、Q3,可以构造得到[(a1+a2+...+ai)+(b1+b2+...+bj)+(c1+c2+...+ck)]×m×(p+q+r)个样本文本。
根据文本表示集合G1、G2、G3和文本表示集合Q1、Q2、Q3,可以构造自监督任务对应的样本对,将通过样本输入图转换得到的样本文本、以及自监督任务的文本表示输入至具有跨领域、跨任务的图处理能力的大型语言模型中,通过有监督微调的方式进一步训练获得具有更好的跨领域、跨任务的通用图处理能力的大型语言模型。通过自监督任务训练得到的大型语言模型能够对图结构进行更深入的学习,并且,通过丰富的自监督任务,能够提高模型训练数据的多样性,进一步提高模型对图数据的记忆、理解和推理能力。
应用本说明书实施例提供的跨领域、跨任务的图学习算法,通过待预测任务和自监督任务,构造针对大型语言模型进行模型训练的样本数据,能够充分利用海量的图数据来训练同一个模型,使得被训练的模型能从不同的领域、任务中更好地学习得到更广泛的知识,同时可以具备天然的迁移能力。
与上述方法实施例相对应,本说明书还提供了任务处理装置实施例,图6示出了本说明书一个实施例提供的一种任务处理装置的结构示意图。如图6所示,该装置包括:
第一获取模块602:被配置为获取目标关系图和目标任务的描述文本。
第一提取模块604:被配置为根据描述文本,从目标关系图中提取目标任务对应的待处理图。
第一转换模块606:被配置为对待处理图进行文本转换,获得待处理图对应的待处理文本。
第一处理模块618:被配置为将描述文本和待处理文本输入任务处理模型,基于描述文本对待处理文本执行目标任务,获得任务处理结果。
可选地,第一提取模块604,进一步被配置为:
根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型;
基于图挖掘任务类型,从目标关系图中提取目标任务对应的待处理图。
可选地,第一提取模块604,进一步被配置为:
根据描述文本,识别目标任务对应的待处理对象;
根据待处理对象在目标关系图中的层级分布、以及层级分布与图挖掘任务类型之间的预设对应关系,确定目标任务相对于目标关系图的图挖掘任务类型。
可选地,图挖掘任务类型包括节点层级任务类型;
相应地,第一提取模块604,进一步被配置为:
在图挖掘任务类型为节点层级任务类型的情况下,从目标关系图中确定目标任务对应的目标节点;
从目标关系图中,提取包含目标节点的第一局部关系子图,获得目标任务对应的待处理图。
可选地,图挖掘任务类型包括边层级任务类型;
相应地,第一提取模块604,进一步被配置为:
在图挖掘任务类型为边层级任务类型的情况下,从目标关系图中确定目标任务对应的目标边;
从目标关系图中,提取包含目标边的第二局部关系子图,获得目标任务对应的待处理图。
可选地,图挖掘任务类型包括图层级任务类型;
相应地,第一提取模块604,进一步被配置为:
在图挖掘任务类型为图层级任务类型的情况下,确定目标关系图为目标任务对应的待处理图。
可选地,任务处理装置还包括训练模块,被配置为:
获取样本集,其中,样本集包括多个领域下采集的样本关系图;
从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据;
对样本输入图进行文本转换,获得样本输入图对应的样本文本;
将样本文本输入任务处理模型,获得任务预测结果;
基于任务预测结果和标签任务数据,计算损失值;
基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型。
可选地,训练模块,进一步被配置为:
基于预设的多种图挖掘任务,从样本关系图中提取样本输入图;
确定样本输入图对应的标签任务数据,包括:
基于图挖掘任务,确定样本输入图对应的挖掘对象;
从样本输入图中提取挖掘对象的对象属性信息,获得样本输入图对应的标签任务数据。
可选地,训练模块,进一步被配置为:
采用多种目标文本表示策略,对样本输入图进行文本转换,获得各目标文本表示策略对应的文本格式下的样本文本;
可选地,训练模块,进一步被配置为:
将任一样本文本输入任务处理模型,获得任务预测结果。
可选地,训练模块,进一步被配置为:
针对样本输入图,构建图分析任务,并获得图分析任务的任务描述文本;
将样本文本输入任务处理模型,获得任务预测结果,包括:
将任务描述文本和样本文本输入任务处理模型,获得任务预测结果。
可选地,任务处理装置还包括更新模块,被配置为:
将任务处理结果反馈至前端用户;
接收前端用户发送的结果反馈信息,其中,结果反馈信息表征了任务处理结果的准确性;
根据结果反馈信息,获取更新的样本集;
基于更新的样本集,对任务处理模型进行训练。
应用本说明书实施例,通过根据描述文本,识别目标任务相对于目标关系图的图挖掘任务类型,能够基于图挖掘任务类型,从目标关系图中提取待处理图;通过对待处理图进行文本转换,获得待处理图对应的待处理文本,能够将待处理图的表示形式转换为文本表示形式,这样无论待处理图原本的图结构、以及表示形式是什么,都能够通过格式转换获得输入格式统一的待处理文本以使任务处理模型能够直接识别和处理,从而实现跨领域、跨任务的图处理;通过将描述文本和待处理文本输入任务处理模型,能够基于跨领域、跨任务的图学习算法,对待处理文本进行处理,获得任务处理结果,提高目标任务的任务执行效率和任务处理结果的准确性。
上述为本实施例的一种任务处理装置的示意性方案。需要说明的是,该任务处理装置的技术方案与上述的任务处理方法的技术方案属于同一构思,任务处理装置的技术方案未详细描述的细节内容,均可以参见上述任务处理方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了法律任务处理装置实施例,图7示出了本说明书一个实施例提供的一种法律任务处理装置的结构示意图。如图7所示,该装置包括:
接收模块702:被配置为接收前端用户发送的目标法律任务的处理请求,其中,处理请求包括法律知识图谱和任务描述文本。
第二提取模块704:被配置为根据任务描述文本,从法律知识图谱中提取目标法律任务对应的待处理子图。
第二转换模块706:被配置为对待处理子图进行文本转换,获得待处理子图对应的待处理文本。
第二处理模块708:被配置为将任务描述文本和待处理文本输入法律任务处理模型,基于任务描述文本对待处理文本执行目标法律任务,获得处理结果。
第二反馈模块710:被配置为将处理结果反馈至前端用户。
可选地,法律任务处理装置还包括提示模块,被配置为:
识别处理请求是否符合执行条件;
若否,则向前端用户发送提示消息,其中,提示消息用于指示前端用户更新处理请求直至符合执行条件。
应用本说明书实施例,能够根据前端用户发送的目标法律任务的处理请求,获取法律知识图谱和任务描述文本,从而能够根据任务描述文本对法律知识图谱进行图推理或预测。通过根据任务描述文本,识别对于法律知识图谱的图挖掘任务类型,能够基于图挖掘任务类型,从法律知识图谱中提取待处理子图,提高对目标法律任务的任务处理效率和准确性。通过对待处理子图进行文本转换,获得待处理子图对应的待处理文本,能够将待处理子图的格式统一转换为文本格式,便于法律任务处理模型识别和处理,提高法律任务处理模型的任务处理效率。通过将处理信息反馈至前端用户,能够通过与前端用户的交互,不断迭代优化法律任务处理模型,提高处理结果的准确性。
上述为本实施例的一种法律任务处理装置的示意性方案。需要说明的是,该法律任务处理装置的技术方案与上述的法律任务处理方法的技术方案属于同一构思,法律任务处理装置的技术方案未详细描述的细节内容,均可以参见上述法律任务处理方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了配置于云侧设备的任务处理模型的训练装置实施例,图8示出了本说明书一个实施例提供的一种任务处理模型的训练装置的结构示意图。如图8所示,该装置包括:
第二获取模块802:被配置为获取样本集,其中,样本集包括多个领域下采集的样本关系图。
第三提取模块804:被配置为基于预设的多种图挖掘任务,从样本关系图中提取样本输入图,并确定样本输入图对应的标签任务数据。
第三转换模块806:被配置为对样本输入图进行文本转换,获得样本输入图对应的样本文本。
输入模块808:被配置为将样本文本输入任务处理模型,获得任务预测结果。
计算模块810:被配置为基于任务预测结果、标签任务数据,计算损失值。
第二训练模块812:被配置为基于损失值,对任务处理模型进行训练,获得完成训练的任务处理模型。
第三反馈模块814:被配置为将任务处理模型的模型参数反馈至端侧设备。
应用本说明书实施例,通过获取预设的多种图挖掘任务、采集多个领域下的样本关系图、获取标签任务数据,可以从样本关系图中提取样本输入图,可以基于多种图挖掘任务以及标签任务数据获得图挖掘任务的任务描述文本。通过将样本输入图统一转换为文本表示形式,可以基于不同挖掘任务类型、不同领域下的大量样本数据,开发跨领域、跨任务的通用的图学习算法,并能够借助模型实现对不同领域、不同任务的关系图的图推理和预测。
上述为本实施例的一种配置于云侧设备的任务处理模型的训练装置的示意性方案。需要说明的是,该训练装置的技术方案与上述的应用于云侧设备的任务处理模型的训练方法的技术方案属于同一构思,训练装置的技术方案未详细描述的细节内容,均可以参见上述训练方法的技术方案的描述。
图9示出了根据本说明书一个实施例提供的一种计算设备900的结构框图。该计算设备900的部件包括但不限于存储器910和处理器920。处理器920与存储器910通过总线930相连接,数据库950用于保存数据。
计算设备900还包括接入设备940,接入设备940使得计算设备900能够经由一个或多个网络960通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备940可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,networkinterface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX,WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near FieldCommunication)。
在本说明书的一个实施例中,计算设备900的上述部件以及图9中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图9所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备900可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备900还可以是移动式或静止式的服务器。
其中,处理器920用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。
上述为本实施例的一种计算机程序产品的示意性方案。需要说明的是,该计算机程序产品的技术方案与上述方法的技术方案属于同一构思,计算机程序产品的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (17)
1.一种任务处理方法,包括:
获取目标关系图和目标任务的描述文本;
根据所述描述文本,从所述目标关系图中提取所述目标任务对应的待处理图;
对所述待处理图进行文本转换,获得所述待处理图对应的待处理文本;
将所述描述文本和所述待处理文本输入任务处理模型,基于所述描述文本对所述待处理文本执行所述目标任务,获得任务处理结果。
2.根据权利要求1所述的方法,所述根据所述描述文本,从所述目标关系图中提取所述目标任务对应的待处理图,包括:
根据所述描述文本,识别所述目标任务相对于所述目标关系图的图挖掘任务类型;
基于所述图挖掘任务类型,从所述目标关系图中提取所述目标任务对应的待处理图。
3.根据权利要求2所述的方法,所述根据所述描述文本,识别所述目标任务相对于所述目标关系图的图挖掘任务类型,包括:
根据所述描述文本,识别所述目标任务对应的待处理对象;
根据所述待处理对象在所述目标关系图中的层级分布、以及所述层级分布与图挖掘任务类型之间的预设对应关系,确定所述目标任务相对于所述目标关系图的图挖掘任务类型。
4.根据权利要求2所述的方法,所述图挖掘任务类型包括节点层级任务类型;
所述基于所述图挖掘任务类型,从所述目标关系图中提取所述目标任务对应的待处理图,包括:
在所述图挖掘任务类型为所述节点层级任务类型的情况下,从所述目标关系图中确定所述目标任务对应的目标节点;
从所述目标关系图中,提取包含所述目标节点的第一局部关系子图,获得所述目标任务对应的待处理图。
5.根据权利要求2所述的方法,所述图挖掘任务类型包括边层级任务类型;
所述基于所述图挖掘任务类型,从所述目标关系图中提取所述目标任务对应的待处理图,包括:
在所述图挖掘任务类型为所述边层级任务类型的情况下,从所述目标关系图中确定所述目标任务对应的目标边;
从所述目标关系图中,提取包含所述目标边的第二局部关系子图,获得所述目标任务对应的待处理图。
6.根据权利要求2所述的方法,所述图挖掘任务类型包括图层级任务类型;
所述基于所述图挖掘任务类型,从所述目标关系图中提取所述目标任务对应的待处理图,包括:
在所述图挖掘任务类型为所述图层级任务类型的情况下,确定所述目标关系图为所述目标任务对应的待处理图。
7.根据权利要求1-6中任一项所述的方法,在所述将所述描述文本和所述待处理文本输入任务处理模型之前,还包括:
获取样本集,其中,所述样本集包括多个领域下采集的样本关系图;
从所述样本关系图中提取样本输入图,并确定所述样本输入图对应的标签任务数据;
对所述样本输入图进行文本转换,获得所述样本输入图对应的样本文本;
将所述样本文本输入所述任务处理模型,获得任务预测结果;
基于所述任务预测结果和所述标签任务数据,计算损失值;
基于所述损失值,对所述任务处理模型进行训练,获得完成训练的所述任务处理模型。
8.根据权利要求7所述的方法,所述从所述样本关系图中提取样本输入图,包括:
基于预设的多种图挖掘任务,从所述样本关系图中提取样本输入图;
所述确定所述样本输入图对应的标签任务数据,包括:
基于所述图挖掘任务,确定所述样本输入图对应的挖掘对象;
从所述样本输入图中提取所述挖掘对象的对象属性信息,获得所述样本输入图对应的标签任务数据。
9.根据权利要求7所述的方法,所述对所述样本输入图进行文本转换,获得所述样本输入图对应的样本文本,包括:
采用多种目标文本表示策略,对所述样本输入图进行文本转换,获得各目标文本表示策略对应的文本格式下的样本文本;
所述将所述样本文本输入所述任务处理模型,获得任务预测结果,包括:
将任一所述样本文本输入所述任务处理模型,获得所述任务预测结果。
10.根据权利要求7所述的方法,在所述将所述样本文本输入所述任务处理模型,获得任务预测结果之前,还包括:
针对所述样本输入图,构建图分析任务,并获得所述图分析任务的任务描述文本;
所述将所述样本文本输入所述任务处理模型,获得任务预测结果,包括:
将所述任务描述文本和所述样本文本输入所述任务处理模型,获得所述任务预测结果。
11.根据权利要求7所述的方法,在所述将所述描述文本和所述待处理文本输入任务处理模型,基于所述描述文本对所述待处理文本执行所述目标任务,获得任务处理结果之后,还包括:
将所述任务处理结果反馈至前端用户;
接收所述前端用户发送的结果反馈信息,其中,所述结果反馈信息表征了所述任务处理结果的准确性;
根据所述结果反馈信息,获取更新的样本集;
基于所述更新的样本集,对所述任务处理模型进行训练。
12.一种法律任务处理方法,包括:
接收前端用户发送的目标法律任务的处理请求,其中,所述处理请求包括法律知识图谱和任务描述文本;
根据所述任务描述文本,从所述法律知识图谱中提取所述目标法律任务对应的待处理子图;
对所述待处理子图进行文本转换,获得所述待处理子图对应的待处理文本;
将所述任务描述文本和所述待处理文本输入法律任务处理模型,基于所述任务描述文本对所述待处理文本执行所述目标法律任务,获得处理结果;
将所述处理结果反馈至所述前端用户。
13.根据权利要求12所述的方法,在所述接收前端用户发送的目标法律任务的处理请求之后,还包括:
识别所述处理请求是否符合执行条件;
若否,则向所述前端用户发送提示消息,其中,所述提示消息用于指示所述前端用户更新所述处理请求直至符合所述执行条件。
14.一种任务处理模型的训练方法,应用于云侧设备,包括:
获取样本集,其中,所述样本集包括多个领域下采集的样本关系图;
从所述样本关系图中提取样本输入图,并确定所述样本输入图对应的标签任务数据;
对所述样本输入图进行文本转换,获得所述样本输入图对应的样本文本;
将所述样本文本输入任务处理模型,获得任务预测结果;
基于所述任务预测结果和所述标签任务数据,计算损失值;
基于所述损失值,对所述任务处理模型进行训练,获得完成训练的所述任务处理模型;
将所述任务处理模型的模型参数反馈至端侧设备。
15.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机程序/指令,所述处理器用于执行所述计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1至14任意一项所述方法的步骤。
16.一种计算机可读存储介质,其存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1至14任意一项所述方法的步骤。
17.一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1至14任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410199304.9A CN118194985A (zh) | 2024-02-22 | 2024-02-22 | 任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410199304.9A CN118194985A (zh) | 2024-02-22 | 2024-02-22 | 任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118194985A true CN118194985A (zh) | 2024-06-14 |
Family
ID=91397295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410199304.9A Pending CN118194985A (zh) | 2024-02-22 | 2024-02-22 | 任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118194985A (zh) |
-
2024
- 2024-02-22 CN CN202410199304.9A patent/CN118194985A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答*** | |
CN109284399B (zh) | 相似度预测模型训练方法、设备及计算机可读存储介质 | |
US20190005126A1 (en) | Artificial intelligence based method and apparatus for processing information | |
CN110232109A (zh) | 一种网络舆情分析方法以及*** | |
CN107491547A (zh) | 基于人工智能的搜索方法和装置 | |
CN107451153A (zh) | 输出结构化查询语句的方法和装置 | |
CN110866093A (zh) | 机器问答方法及装置 | |
CN114840671A (zh) | 对话生成方法、模型的训练方法、装置、设备及介质 | |
CN116595154B (zh) | 任务处理方法以及自动问答方法 | |
CN113159187B (zh) | 分类模型训练方法及装置、目标文本确定方法及装置 | |
CN116610781A (zh) | 任务模型训练方法以及装置 | |
CN117573842B (zh) | 文档检索方法以及自动问答方法 | |
CN113705192B (zh) | 文本处理方法、装置与存储介质 | |
CN117971420A (zh) | 任务处理、交通任务处理以及任务处理模型训练方法 | |
CN117390198A (zh) | 构建电力领域科技知识图谱的方法、装置、设备及介质 | |
CN116881462A (zh) | 文本数据处理、文本表示、文本聚类的方法及设备 | |
CN115688758A (zh) | 一种语句意图识别方法、装置和存储介质 | |
CN115905508A (zh) | 面向评论文本的摘要方法及装置 | |
CN115470790A (zh) | 一种识别文件中的命名实体的方法和装置 | |
CN118194985A (zh) | 任务处理、法律任务处理及任务处理模型训练方法、计算设备、计算机可读存储介质、及计算机程序产品 | |
Manasa et al. | Detection of twitter spam using GLoVe vocabulary features, bidirectional LSTM and convolution neural network | |
CN116414938A (zh) | 一种知识点标注方法、装置、设备及存储介质 | |
CN117633540B (zh) | 样本数据构建方法及装置 | |
KR20210059196A (ko) | Lstm을 이용한 국가별 선호도 예측 시스템 및 방법 | |
CN113609275B (zh) | 信息处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |