CN116860949B - 问答处理方法、装置、***、计算设备及计算机存储介质 - Google Patents
问答处理方法、装置、***、计算设备及计算机存储介质 Download PDFInfo
- Publication number
- CN116860949B CN116860949B CN202311056160.3A CN202311056160A CN116860949B CN 116860949 B CN116860949 B CN 116860949B CN 202311056160 A CN202311056160 A CN 202311056160A CN 116860949 B CN116860949 B CN 116860949B
- Authority
- CN
- China
- Prior art keywords
- prompt word
- government
- library
- knowledge graph
- demonstration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 12
- 230000009191 jumping Effects 0.000 claims description 6
- 239000000463 material Substances 0.000 abstract description 13
- 239000013598 vector Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种问答处理方法、装置、***、计算设备及计算机存储介质,该方法包括:获取用户端发送的问题查询语句;根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将答复结果返回至用户端。通过上述方式,本发明能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种问答处理方法、装置、***、计算设备及计算机存储介质。
背景技术
我国一向重视电子政务体系的建设。根据《2022***电子政务调查报告(中文版)》,我国的电子政务发展水平进入全球第一梯队,位于“领跑者”行列。作为政府电子政务体系的重要组成部分,先进的政务问答***有助于提升政府在信息时代的治理水平,推动政府治理能力的现代化。
目前现有运行的政务问答***以单轮回复和检索回复为主,采用了复杂的模板和规则产生回复,回答比较固定和机械,但是实际应用场景中,用户问题多样,模板无法完全涵盖,未能满足用户预期。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的问答处理方法、装置、***、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种问答处理方法,包括:
获取用户端发送的问题查询语句;
根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;
将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将答复结果返回至用户端。
根据本发明的另一方面,提供了一种问答处理装置,包括:
获取模块,适于获取用户端发送的问题查询语句;
查询模块,适于根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;
输入模块,适于将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果;
返回模块,适于将答复结果返回至用户端。
根据本发明的另一方面,提供了一种问答处理***,包括:上述问答处理装置、目标提示词演示库、政务知识图谱、经过训练的自然语言生成模型。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述问答处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述问答处理方法对应的操作。
根据本发明提供的方案,能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项(如办理驾驶证)时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的问答处理方法的流程示意图;
图2A为图数据库查询语句生成器调用向量检索器的流程示意图;
图2B为目标提示词演示库的构建方法的流程示意图;
图3示出了根据本发明一个实施例的问答处理装置的结构示意图;
图4示出了根据本发明一个实施例的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的问答处理方法的流程示意图。该方法应用于应用服务器,如图1所示,该方法包括以下步骤:
步骤S101,获取用户端发送的问题查询语句。
具体地,用户端在实际应用中可以分为桌面端和移动端,用于向用户提供输入问题查询语句的可视化界面,也就是说,用户通过用户端所提供的可视化界面可以输入问题查询语句,用户端将该问题查询语句发送至应用服务器,应用服务器获取用户端发送的问题查询语句。
步骤S102,根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示。
目标提示词演示库存储有大量的提示词演示,用于向自然语言生成模型(例如,大语言模型)提供参考演示。其中,目标提示词演示库存储于数据服务器中。政务知识图谱用于向自然语言生成模型(例如,大语言模型)提供回应用户查询所需的上下文知识信息,政务知识图谱由政务实体、政务实体属性及政务实体关系组成。其中,政务知识图谱可以存储于数据服务器中。
具体地,在获取到用户端发送的问题查询语句后,可以根据问题查询语句来查询目标提示词演示库及政务知识图谱,通过查询能够得到与问题查询语句相关的E个提示词演示以及知识图谱数据集,其中,所得到的知识图谱数据集为三元组形式。
在本发明一种可选实施方式中,目标提示词演示库包含:第一目标提示词演示库及第二目标提示词演示库;
根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示进一步可以通过如下方法实现:
根据问题查询语句检索第一目标提示词演示库,得到与问题查询语句相关的K个提示词演示;
将问题查询语句、K个提示词演示输入至经过训练的自然语言生成模型,得到知识图谱查询语句;
根据知识图谱查询语句查询政务知识图谱,得到知识图谱数据集;
根据知识图谱数据集及问题查询语句检索第二目标提示词演示库,得到与问题查询语句相关的E个提示词演示。
具体地,在获取到用户端发送的问题查询语句后,调用图数据库查询语句生成器,该图数据库查询语句生成器基于LangChain的chain类模块,自定义LLMCypherStatementChain类实现,图数据库查询语句生成器包括调用向量检索器、处理检索结果和调用大语言模型生成知识图谱查询语句三大功能。向量检索器的实现基于LangChain提供的langchain.vectorstores.faiss模块。向量检索器的构建基于稠密向量的高效相似度搜索和聚类库Faiss。向量检索器的功能是返回提示词演示库中与问题查询语句相似得分高的提示词演示。向量检索器部署在应用服务器中,用于支持应用于知识图谱的LLM工具的演示检索。
例如,可以利用文本编码器将问题查询语句编码为向量化查询语句,图数据库查询语句生成器调用向量检索器,根据问题查询语句及向量化查询语句检索第一目标提示词演示库,其中,第一目标提示词演示库为如下形式的提示词演示库:<问题查询语句,向量化查询语句→知识图谱查询语句>,从而得到与向量化查询语句最相关的K个提示词演示(d1,d2,..,dK),将其作为提示词中的示例演示和问题查询语句一起输入到大语言模型中,如图2A所示。其中,K个提示词演示(d1,d2,..,dK)是向大语言模型提供生成知识图谱查询语句所需的良好示例。K个提示词演示(d1,d2,..,dK)有助于提高大语言模型所生成的知识图谱查询语句的准确性。大语言模型是经过训练的模型,该模型具有多个功能,其中一个功能是输出知识图谱查询语句。利用大语言模型的上下文学习能力,生成知识图谱查询语句。
根据知识图谱查询语句查询政务知识图谱,若没有符合条件的查询结果,则向用户反馈解答查询语句所需信息超出本问答***的知识范围,例如,返回“政务知识图谱中不包括问题查询语句涉及的信息”。若知识图谱数据集不为空,输出符合查询条件的知识图谱数据集,其中,知识图谱数据集可以是三元组,然后,调用图数据库结果解释器,其中,图数据库结果解析器基于LangChain的chain类,自定义LLMCypherResultExplainChain实现。图数据库结果解析器包括调用向量检索器、处理检索结果、调用大语言模型生成文本化的答复结果三个功能。图数据库结果解析器调用向量检索器的过程类似图2A,但检索的提示词演示库不同,这里检索的是第二目标提示词演示库,第二目标提示词演示库的形式如下<查询语句,图数据库查询结果→回复>,最终返回E个与问题查询语句相关的提示词演示(d1,d2,..,dE)。E个提示词演示(d1,d2,..,dE)是向大语言模型提供生成答复所需的良好示例。E个提示词演示(d1,d2,..,dE)有助于提高大语言模型所生成的答复的准确性。
图2B为目标提示词演示库的构建方法的流程示意图,目标提示词演示库的构建方式利用了大语言模型的上下文学习能力,即大语言模型具备通过少量演示(demonstrations)形式的示例学习如何完成任务的范式的能力,通过循环采样、生成、语言判断和过滤的过程产生足够的提示词演示数据,组成目标提示词演示库。目标提示词演示库存储在数据服务器,用于向大语言模型提供生成时的参考演示。目标提示词演示库的构建方法包括以下步骤:
步骤S201,构建包含N个提示词演示的初始提示词演示库;
步骤S202,从初始提示词演示库中抽取M个提示词演示,将M个提示词演示输入至经过训练的自然语言生成模型中,得到第M+1个提示词演示;
步骤S203,对第M+1个提示词演示进行语法检查处理;若第M+1个提示词演示未通过语法检查,则跳转执行步骤S206;若第M+1个提示词演示通过语法检查,则跳转执行步骤S204。
步骤S204,判断初始提示词演示库中是否存在与第M+1个提示词演示相同的提示词演示,若否,则跳转执行步骤S205;若是,则跳转执行步骤S206;
步骤S205,将第M+1个提示词演示存储至初始提示词演示库;
步骤S206,判断初始提示词演示库中提示词演示的数量是否大于或等于预设阈值;若是,则跳转执行步骤S207;若否,则跳转执行步骤S202;
步骤S207,生成目标提示词演示库。
具体地,人工构建N个提示词演示,N个人工构建的提示词演示构成了初始提示词演示库。初始提示词演示库分为两类演示库:第一初始提示词演示库<问题查询语句,向量化查询语句→知识图谱查询语句>和第二初始提示词演示库<查询语句,图数据库查询结果→回复>。
构造输入大语言模型的提示词模板,形式为(任务描述,提示词演示)。从初始提示词演示库中抽取M个提示词演示(d1,d2,..,dM)。通过提示词模板将提示词演示输入大语言模型中。大语言模型通过处理输出新的提示词演示dM+1。
在得到提示词演示dM+1后,利用语法检查器对提示词演示dM+1进行语法检查判断提示词演示dM+1是否能够正确执行。语法检查器可根据实际要求自行定义设计,如经过微调的LLM分类器,通过政务知识图谱真正执行等。此外,语法检查器还可以设定语法检查规则,通过语法检查规则来确定语法是否正确,语法不正确的提示词演示会被丢弃,重新选取M个提示词演示,每次选取的M个提示词演示均不同,进入新的迭代。
提示词演示dM+1通过语法检查后,利用过滤器判断dM+1是否与初始提示词演示库中的其他提示词演示是否存在重复。若重合度高,该提示词演示dM+1被丢弃;否则,将提示词演示dM+1加入初始提示词演示库。过滤器可根据实际要求自行定义设计,如判断语句是否完全一致、设置ROUGE-L相似度阈值等。
然后,判断初始提示词演示库中提示词演示的数量是否大于或等于预设阈值,当初始提示词演示库达到预设阈值时,结束迭代,从而生成目标提示词演示库。利用文本编码器将提示词演示中问题查询语句部分编码为向量。最终存储到数据服务器上的演示格式为(问题查询语句,向量化查询语句,其他部分)。文本编码器可以为Bert、text2Chinese等开源模型。
最终生成的目标提示词演示库由人工构建的提示词演示和自动生成的提示词演示组成。在迭代开始,初始提示词演示库演示池由N个人工构建的提示词演示组成,随着迭代的进行,初始提示词演示库逐步增加由大语言模型生成的自动演示。
在本发明一种可选实施方式中,政务知识图谱的构建方法包括:获取政务数据,对政务数据进行政务实体、政务实体属性识别及政务实体关系抽取,得到政务实体集合、政务实体属性集合及政务实体关系集合;根据政务实体集合、政务实体属性集合及政务实体关系集合构建政务知识图谱。
具体地,获取政务数据,根据政务数据特点,在分析政府多种服务场景后,得到政务信息的重点是名词实体信息,如部门名、事项名等。利用HanLp工具识别出重点政务实体及其政务实体属性,同时基于依存句法分析抽取政务实体之间的关系。所抽取的政务实体主要为政务事项实体、办理材料实体、政务部门实体和办理流程实体。政务实体关系抽取过程如下:根据某事项由某部门办理、某事项的办理材料是什么、某事项的办理流程为某流程,抽取得到政务事项、办理材料、办理流程、办理部门的实体关系。
政务实体的政务属性考虑如下:政务事项实体包括事项标识符、咨询电话、监督电话、申请条件、办理时间、预期办结天数、承诺办结天数、是否收费属性;办理材料实体包括材料要点、原件数量和复印件数量属性;政务部门实体包括办理地址属性;办理流程实体包括下一流程标识符、流程名称、环节名称、审查标准、审批结果、流程序号、办理事项、证照名称和发证方式属性。
利用Neo4j图数据库存储政务知识图谱信息。政务知识图谱由多种<head,relation,tail>三元组构成,其中head为政务实体名称,tail为政务实体属性,relation为连接政务实体名称和政务实体属性的关系。以政务部门信息为例,head为头实体,头实体由政务实体名称(政务部门名称)组成,tail为尾实体,尾实体由政务实体属性(办理地址)组成,relation为连接头实体head和尾实体tail的关系。将政务部门知识图谱存入数据服务器。政务事项信息、办理材料信息、办理流程信息构建相应的知识图谱的方法同理。
建立不同实体之间的关系,例如,连接政务事项实体和办理材料实体,形成三元组<政务事项实体,办理材料,办理材料实体>;连接政务事项实体和政务部门实体,形成三元组<政务事项实体,所属部门,政务部门实体>;连接政务事项实体和办理流程实体,形成三元组<政务事项实体,办理流程,办理流程实体>。此时,政务知识图谱构建完毕。
步骤S103,将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将答复结果返回至用户端。
在得到E个提示词演示、知识图谱数据集之后,图数据库结果解析器将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,自然语言生成模型通过处理输出对应的答复结果。若答复结果有效,则向用户端传递答复结果,用户端以可视化对话界面的形式,展示答复结果;若答复结果无效,则向用户端发送开启相近查询的信号,用户端接收应用服务器传递的信息,反馈用户相近查询,开启下轮问答。
大语言模型采用支持中文或中英双语的开源大语言模型,如ChatGLM和ChatGLM2,大语言模型部署于应用服务器中,用于支持回复生成。
在本发明一种可选实施方式中,在根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示之前,方法还包括:
判断问题查询语句是否为政务事项查询语句;
若是,则根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示。
具体地,应用服务器获取用户通过用户端输入的问题查询语句之后,对问题查询语句进行解析,解析方法可能包括重写问题查询语句、判断是否为高频问题查询语句等,基于解析方法判断问题查询语句是否为政务事项查询语句,若判断为涉及政务事项查询,则根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;否则,向用户反馈查询内容不属于政务问答领域。
问答处理方法具体实现的应用框架为LangChain,其将大语言模型、目标提示词演示库、政务知识图谱与应用工具相结合,从而实现完整的问答处理查询流程。向量检索器的实现基于LangChain提供的langchain.vectorstores.faiss模块。应用于知识图谱的LLM工具(图数据库查询语句生成器、图数据库结果解析器)的实现依赖LangChain提供的链式处理模块Chain。应用服务判断调用应用功能的实现依赖LangChian提供的Agent类,它用于判断在什么时候调用Chain类应用工具。
本发明提供的方案引入了大语言模型,吸收了大模型语义理解能力强、生成文本能力强的优点,有效满足了问答***用户预期,解决了传统政府网站政务问答***模板化、检索化回复的问题;基于上下文学习的生成特点建立了目标提示词演示库,提升大语言模型生成知识图谱查询语句和专业化回复的能力;将政务知识图谱以图的形式存储到图数据库,准确描述了政务信息映射到政务知识图谱的实体、实体属性和实体关系信息;将知识图谱作为大模型生成回复的参考知识信息,提升了大语言模型回复的准确性。
根据本发明提供的方案,能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项(如办理驾驶证)时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。
图3示出了根据本发明一个实施例的问答处理装置的结构示意图。如图3所示,该装置包括:
获取模块301,适于获取用户端发送的问题查询语句;
查询模块302,适于根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;
输入模块303,适于将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果;
返回模块304,适于将答复结果返回至用户端。
可选地,目标提示词演示库包含:第一目标提示词演示库及第二目标提示词演示库;
查询模块进一步适于:根据问题查询语句检索第一目标提示词演示库,得到与问题查询语句相关的K个提示词演示;
将问题查询语句、K个提示词演示输入至经过训练的自然语言生成模型,得到知识图谱查询语句;
根据知识图谱查询语句查询政务知识图谱,得到知识图谱数据集;
根据知识图谱数据集及问题查询语句检索第二目标提示词演示库,得到与问题查询语句相关的E个提示词演示。
可选地,装置还包括:目标提示词演示库构建模块,适于S1,构建包含N个提示词演示的初始提示词演示库;
S2,从初始提示词演示库中抽取M个提示词演示,将M个提示词演示输入至经过训练的自然语言生成模型中,得到第M+1个提示词演示;
S3,将第M+1个提示词演示存储至初始提示词演示库;
S4,判断初始提示词演示库中提示词演示的数量是否大于或等于预设阈值;若是,则生成目标提示词演示库;若否,则跳转执行S2。
可选地,目标提示词演示库构建模块还适于:判断初始提示词演示库中是否存在与第M+1个提示词演示相同的提示词演示;
若否,则将第M+1个提示词演示存储至初始提示词演示库。
可选地,目标提示词演示库构建模块还适于:对第M+1个提示词演示进行语法检查处理;
若第M+1个提示词演示未通过语法检查,则跳转执行S4;
若第M+1个提示词演示通过语法检查,则跳转执行S3。
可选地,装置还包括:政务知识图谱构建模块,适于获取政务数据,对政务数据进行政务实体、政务实体属性识别及政务实体关系抽取,得到政务实体集合、政务实体属性集合及政务实体关系集合;
根据政务实体集合、政务实体属性集合及政务实体关系集合构建政务知识图谱。
根据本发明提供的方案,能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项(如办理驾驶证)时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。
本申请实施例还提供了一种问答处理***,包括:图3所示实施例中的问答处理装置、目标提示词演示库、政务知识图谱、经过训练的自然语言生成模型。
本申请实施例还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的问答处理方法。
图4示出了根据本发明一个实施例的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述问答处理方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的问答处理方法。程序410中各步骤的具体实现可以参见上述问答处理实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (7)
1.一种问答处理方法,包括:
获取用户端发送的问题查询语句;
根据所述问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与所述问题查询语句相关的E个提示词演示;
将所述问题查询语句、E个提示词演示、所述知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将所述答复结果返回至用户端;
其中,所述目标提示词演示库包含:第一目标提示词演示库及第二目标提示词演示库;
所述根据所述问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与所述问题查询语句相关的E个提示词演示进一步包括:
根据所述问题查询语句检索第一目标提示词演示库,得到与所述问题查询语句相关的K个提示词演示;
将所述问题查询语句、K个提示词演示输入至经过训练的自然语言生成模型,得到知识图谱查询语句;
根据所述知识图谱查询语句查询政务知识图谱,得到知识图谱数据集;
根据所述知识图谱数据集及所述问题查询语句检索第二目标提示词演示库,得到与所述问题查询语句相关的E个提示词演示;
其中,所述目标提示词演示库的构建方法包括:
S1,构建包含N个提示词演示的初始提示词演示库;
S2,从所述初始提示词演示库中抽取M个提示词演示,将所述M个提示词演示输入至经过训练的自然语言生成模型中,得到第M+1个提示词演示;
S3,将所述第M+1个提示词演示存储至初始提示词演示库;
S4,判断所述初始提示词演示库中提示词演示的数量是否大于或等于预设阈值;若是,则生成目标提示词演示库;若否,则跳转执行S2;
所述政务知识图谱的构建方法包括:获取政务数据,对所述政务数据进行政务实体、政务实体属性识别及政务实体关系抽取,得到政务实体集合、政务实体属性集合及政务实体关系集合;
根据所述政务实体集合、政务实体属性集合及政务实体关系集合构建政务知识图谱。
2.根据权利要求1所述的方法,其中,在将所述第M+1个提示词演示存储至初始提示词演示库之前,所述方法还包括:
判断所述初始提示词演示库中是否存在与第M+1个提示词演示相同的提示词演示;
若否,则将所述第M+1个提示词演示存储至初始提示词演示库。
3.根据权利要求1或2所述的方法,其中,在将所述第M+1个提示词演示存储至初始提示词演示库之前,所述方法还包括:
对所述第M+1个提示词演示进行语法检查处理;
若所述第M+1个提示词演示未通过语法检查,则跳转执行S4;
若所述第M+1个提示词演示通过语法检查,则跳转执行S3。
4.一种问答处理装置,包括:
获取模块,适于获取用户端发送的问题查询语句;
查询模块,适于根据所述问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与所述问题查询语句相关的E个提示词演示;
输入模块,适于将所述问题查询语句、E个提示词演示、所述知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果;
返回模块,适于将所述答复结果返回至用户端;
其中,目标提示词演示库包含:第一目标提示词演示库及第二目标提示词演示库;
查询模块进一步适于:根据问题查询语句检索第一目标提示词演示库,得到与问题查询语句相关的K个提示词演示;
将问题查询语句、K个提示词演示输入至经过训练的自然语言生成模型,得到知识图谱查询语句;
根据知识图谱查询语句查询政务知识图谱,得到知识图谱数据集;
根据知识图谱数据集及问题查询语句检索第二目标提示词演示库,得到与问题查询语句相关的E个提示词演示;
装置还包括:目标提示词演示库构建模块,适于S1,构建包含N个提示词演示的初始提示词演示库;
S2,从初始提示词演示库中抽取M个提示词演示,将M个提示词演示输入至经过训练的自然语言生成模型中,得到第M+1个提示词演示;
S3,将第M+1个提示词演示存储至初始提示词演示库;
S4,判断初始提示词演示库中提示词演示的数量是否大于或等于预设阈值;若是,则生成目标提示词演示库;若否,则跳转执行S2;
政务知识图谱构建模块,适于获取政务数据,对政务数据进行政务实体、政务实体属性识别及政务实体关系抽取,得到政务实体集合、政务实体属性集合及政务实体关系集合;根据政务实体集合、政务实体属性集合及政务实体关系集合构建政务知识图谱。
5.一种问答处理***,包括:权利要求4所述的问答处理装置、目标提示词演示库、政务知识图谱、经过训练的自然语言生成模型。
6.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-3中任一项所述的问答处理方法对应的操作。
7.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-3中任一项所述的问答处理方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311056160.3A CN116860949B (zh) | 2023-08-21 | 2023-08-21 | 问答处理方法、装置、***、计算设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311056160.3A CN116860949B (zh) | 2023-08-21 | 2023-08-21 | 问答处理方法、装置、***、计算设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116860949A CN116860949A (zh) | 2023-10-10 |
CN116860949B true CN116860949B (zh) | 2024-04-05 |
Family
ID=88232506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311056160.3A Active CN116860949B (zh) | 2023-08-21 | 2023-08-21 | 问答处理方法、装置、***、计算设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116860949B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117216227B (zh) * | 2023-10-30 | 2024-04-16 | 广东烟草潮州市有限责任公司 | 基于知识图谱与大语言模型的烟草企业智能信息问答方法 |
CN117271754B (zh) * | 2023-11-17 | 2024-06-04 | 杭州海康威视数字技术股份有限公司 | 数据检索方法、装置及设备 |
CN117251473B (zh) * | 2023-11-20 | 2024-03-15 | 摩斯智联科技有限公司 | 车辆数据查询分析方法、***、装置和存储介质 |
CN118093836B (zh) * | 2024-04-23 | 2024-07-16 | 湘江实验室 | 一种基于大语言模型的在线问答提示词优化生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036281A (zh) * | 2021-11-22 | 2022-02-11 | 华南农业大学 | 基于知识图谱的柑橘管控问答模块构建方法及问答*** |
CN114880480A (zh) * | 2022-04-08 | 2022-08-09 | 北京捷通华声科技股份有限公司 | 一种基于知识图谱的问答方法及装置 |
WO2022227162A1 (zh) * | 2021-04-25 | 2022-11-03 | 平安科技(深圳)有限公司 | 问答数据处理方法、装置、计算机设备及存储介质 |
CN116521893A (zh) * | 2023-04-28 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 智能对话***的控制方法、控制装置和电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230134933A1 (en) * | 2021-11-03 | 2023-05-04 | Electronics And Telecommunications Research Institute | Knowledge-based dialogue system for self-learning dialogues and learning method thereof |
US20230153534A1 (en) * | 2021-11-15 | 2023-05-18 | Adobe Inc. | Generating commonsense context for text using knowledge graphs |
-
2023
- 2023-08-21 CN CN202311056160.3A patent/CN116860949B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022227162A1 (zh) * | 2021-04-25 | 2022-11-03 | 平安科技(深圳)有限公司 | 问答数据处理方法、装置、计算机设备及存储介质 |
CN114036281A (zh) * | 2021-11-22 | 2022-02-11 | 华南农业大学 | 基于知识图谱的柑橘管控问答模块构建方法及问答*** |
CN114880480A (zh) * | 2022-04-08 | 2022-08-09 | 北京捷通华声科技股份有限公司 | 一种基于知识图谱的问答方法及装置 |
CN116521893A (zh) * | 2023-04-28 | 2023-08-01 | 苏州浪潮智能科技有限公司 | 智能对话***的控制方法、控制装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116860949A (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116860949B (zh) | 问答处理方法、装置、***、计算设备及计算机存储介质 | |
US20190213116A1 (en) | Generation of automated testing scripts by converting manual test cases | |
Harel et al. | Modeling languages: Syntax, semantics and all that stu | |
CN112149399B (zh) | 基于rpa及ai的表格信息抽取方法、装置、设备及介质 | |
McTear et al. | Creating a conversational interface using chatbot technology | |
US11651015B2 (en) | Method and apparatus for presenting information | |
CN111194401B (zh) | 意图识别的抽象和可移植性 | |
US11042467B2 (en) | Automated searching and identification of software patches | |
EP3846089A1 (en) | Generating a knowledge graph of multiple application programming interfaces | |
CN111158648B (zh) | 一种基于实景语义理解的互动帮助***开发方法及其平台 | |
CN116186219A (zh) | 一种人机对话交互方法方法、***及存储介质 | |
CN110110050B (zh) | 一种新闻事件生成式问答数据集的生成方法 | |
US20220156174A1 (en) | Automated identification of lines of code related to errors field | |
CN110515653B (zh) | 文档生成方法、装置、电子设备及计算机可读存储介质 | |
US11605006B2 (en) | Deep-learning model catalog creation | |
CN111966895A (zh) | 一种基于Watson对话服务的电影问答***构建方法、装置及*** | |
CN111221843A (zh) | 大数据处理方法及装置 | |
CN117667979B (zh) | 基于大语言模型的数据挖掘方法、装置、设备及介质 | |
CN116909627B (zh) | 一种可执行程序解析方法、装置、电子设备和存储介质 | |
CN117235236B (zh) | 对话方法、装置、计算机设备和存储介质 | |
CN111209348B (zh) | 用于输出信息的方法和装置 | |
CN109933788B (zh) | 类型确定方法、装置、设备和介质 | |
Dos Santos et al. | AI-driven user story generation | |
Vijayaraghavan et al. | Text Classification for Task-based Source Code Related Questions | |
JP2024089449A (ja) | 検索装置、及び検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |