CN118152537A - 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备 - Google Patents

一种提升大模型话术生成质量的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN118152537A
CN118152537A CN202410333016.8A CN202410333016A CN118152537A CN 118152537 A CN118152537 A CN 118152537A CN 202410333016 A CN202410333016 A CN 202410333016A CN 118152537 A CN118152537 A CN 118152537A
Authority
CN
China
Prior art keywords
reply
replied
question
current
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410333016.8A
Other languages
English (en)
Inventor
于洋
曾文佳
梁鹏斌
李航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lingxi Beijing Technology Co Ltd
Original Assignee
Lingxi Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lingxi Beijing Technology Co Ltd filed Critical Lingxi Beijing Technology Co Ltd
Priority to CN202410333016.8A priority Critical patent/CN118152537A/zh
Publication of CN118152537A publication Critical patent/CN118152537A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本申请涉及智能客服技术领域,具体提供了一种提升大模型话术生成质量的方法、装置、存储介质及电子设备,该方法包括:基于对话内容中的当前问题,确定待回复问题;基于检索增强生成模型RAG(Retrieval‑Augmented Generation)获取与所述待回复问题相匹配的多条回复话术;将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。本申请的一些实施例可以提高回复话术的推理效率、质量和效果,提升用户体验。

Description

一种提升大模型话术生成质量的方法、装置、存储介质及电子 设备
技术领域
本申请涉及智能客服技术领域,具体而言,涉及一种提升大模型话术生成质量的方法、装置、存储介质及电子设备。
背景技术
随着人工智能的发展,智能客服机器人被广泛应用至各种不同的业务领域中。
目前,智能客服机器人与用户进行交互的过程中,通常通过对用户输入的文本内容进行关键词提取或者进行语义分析后,生成与文本内容对应的回复内容。然而这种方式只是对用户当前输入的文本内容进行分析,无法保证上下文的逻辑统一性,存在回复话术无法精准对应用户输入问题的情况。
因此,如何提供一种精准度较高的回复话术生成的方法的技术方案成为亟需解决的技术问题。
发明内容
本申请的一些实施例的目的在于提供一种提升大模型话术生成质量的方法、装置、存储介质及电子设备,通过本申请的实施例的技术方案可以提升回复话术的效率、质量和回复精准度,为用户提供高质量的服务。
第一方面,本申请的一些实施例提供了一种提升大模型话术生成质量的方法,包括:基于对话内容中的当前问题,确定待回复问题;基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术;将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
本申请的一些实施例通过对话内容中的当前问题确定出待回复问题后,匹配出多条回复话术,之后将待回复问题和多条回复话术输入至目标大语言模型生成目标回复话术,以此可以提升回复话术的效率和回复精准度,基于RAG处理后生成的回复话术质量较高,进而为用户提供高质量的服务,提升用户体验。
在一些实施例,所述基于对话内容中的当前问题,确定待回复问题,包括:判断所述对话内容中的当前问题是否存在父级话题,得到判定结果;根据所述判定结果,获取所述待回复问题。
本申请的一些实施例通过当前问题判定其是否存在父级话题,通过判定结果确定待回复问题,可以提升回复精准度,避免出现答非所问的情况。
在一些实施例,所述判断所述对话内容中的当前问题是否存在父级话题,得到判定结果,包括:确认所述当前问题存在所述父级话题,则所述判定结果为存在;所述根据所述判定结果,获取所述待回复问题,包括:生成与所述当前问题对应的回复内容后,回调至所述父级话题对应的问题内容,其中,所述问题内容作为所述待回复问题。
本申请的一些实施例通过确认当前问题存在父级话题后,处理完成当前问题的回复内容后回到父级话题对应的问题内容,以此可以得到待回复问题,可以提升后续回复精准度,避免出现答非所问的情况。
在一些实施例,所述判断所述对话内容中的当前问题是否存在父级话题,得到判定结果,包括:确认所述当前问题不存在所述父级话题,则所述判定结果为不存在;所述根据所述判定结果,获取所述待回复问题,包括:将所述当前问题作为所述待回复问题。
本申请的一些实施例通过确认当前问题不存在父级话题后,可以针对当前问题进行回复,确保后续回复内容的精准度。
在一些实施例,所述基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术,包括:利用相似度算法,从业务知识库中检索与所述待回复问题相匹配的回复话术集合;对所述回复话术集合中的话术进行过滤,得到所述多条回复话术。
本申请的一些实施例通过从业务知识库中检索出回复话术集合后,通过过滤得到多条回复话术,可以提升检索结果的多样性和可靠性。
在一些实施例,所述对所述回复话术集合中的话术进行过滤,得到所述多条回复话术,包括:获取所述回复话术集合中的话术对应的嵌入向量;将所述话术对应的嵌入向量输入至贪婪算法中,输出所述多条回复话术。
本申请的一些实施例通过贪婪算法从回复话术集合中筛选出多条回复话术,避免出现冗余和缺乏多样性。
第二方面,本申请的一些实施例提供了一种提升大模型话术生成质量的装置,包括:确定模块,用于基于对话内容中的当前问题,确定待回复问题;获取模块,用于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术;生成模块,用于将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
在一些实施例,确定模块510,用于判断所述对话内容中的当前问题是否存在父级话题,得到判定结果;根据所述判定结果,获取所述待回复问题。
在一些实施例,确定模块510,用于确认所述当前问题中存在所述父级话题,则所述判定结果为存在;生成与所述当前问题对应的回复内容后,回调至所述父级话题对应的问题内容,其中,所述问题内容作为所述待回复问题。
在一些实施例,确定模块510,用于确认所述当前问题中不存在所述父级话题,则所述判定结果为不存在;将所述当前问题作为所述待回复问题。
在一些实施例,获取模块520,用于利用相似度算法,从业务知识库中检索与所述待回复问题相匹配的回复话术集合;对所述回复话术集合中的话术进行过滤,得到所述多条回复话术。
在一些实施例,获取模块520,用于获取所述回复话术集合中的话术对应的嵌入向量;将所述话术对应的嵌入向量输入至贪婪算法中,输出所述多条回复话术。
第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的方法。
第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的方法。
第五方面,本申请的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的方法。
附图说明
为了更清楚地说明本申请的一些实施例的技术方案,下面将对本申请的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请的一些实施例提供的提升大模型话术生成质量的***图;
图2为本申请的一些实施例提供的提升大模型话术生成质量的方法流程图之一;
图3为本申请的一些实施例提供的提升大模型话术生成质量的方法流程图之二;
图4为本申请的一些实施例提供的基于RAG的回复话术生成的结构示意图;
图5为本申请的一些实施例提供的提升大模型话术生成质量的装置组成框图;
图6为本申请的一些实施例提供的一种电子设备示意图。
具体实施方式
下面将结合本申请的一些实施例中的附图,对本申请的一些实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
相关技术中,为了提升对用户的服务效率,智能客服机器人被广泛应用到各种业务领域中。在实际的交互场景中,智能客服机器人和用户沟通产品业务需求的过程往往不是一句话能沟通完的,即需要多轮对话。然而在多轮对话之间可能还存在上下文关联和逻辑。现有技术中在针对用户输入的文本内容进行回复时,通过对文本内容提取关键词,基于关键词分析生成对应的回复话术。然而,这种分析方式无法分析出上下文之间的关联,使得回复话术与历史对话的逻辑关联性较差,回复质量差,影响用户体验。
鉴于此,本申请的一些实施例提供了一种提升大模型话术生成质量的方法,该方法可以通过用户的对话内容中的当前问题确定出待回复问题,然后匹配出与待回复问题对应的多条回复话术,之后将多条回复话术和待回复问题输入至目标大语言模型中,生成目标回复话术。本申请的一些实施例可以分析当前问题与历史对话之间的逻辑,利用检索增强生成模型RAG(Retrieval-Augmented Generation)技术,增强回复话术的事实性;借助目标大模型的推理能力,提高回复话术的推理效率、质量和效果。其中,提升大模型话术生成质量的方法是基于RAG做进一步处理的,生成效果和质量得以保证。
下面结合附图1示例性阐述本申请的一些实施例提供的提升大模型话术生成质量的***的整体组成结构。
如图1所示,本申请的一些实施例提供了一种提升大模型话术生成质量的***,该提升大模型话术生成质量的***包括:终端100和生成服务器200。用户可以通过终端100与生成服务器200内部署的智能客服机器人进行交互。生成服务器200可以从终端100的对话问题中的当前问题确定出待回复问题,之后生成服务器200可以从内部署的业务知识库中筛选出多条回复话术,最后将多条回复话术和待回复问题输入至内部部署的目标大语言模型中生成目标回复话术。
在本申请的一些实施例中,终端100可以为移动终端,也可以为非便携的电脑终端,本申请实施例在此不作具体限定。并且,目标大语言模型可以是针对不同的业务场景采用不同的业务数据进行微调得到的,以此可以针对不同的业务场景生成不同的目标回复话术。
下面结合附图2示例性阐述本申请的一些实施例提供的由生成服务器200执行的提升大模型话术生成质量的实现过程。
请参见附图2,图2为本申请的一些实施例提供的一种提升大模型话术生成质量的方法流程图,该提升大模型话术生成质量的方法可以包括:
S210,基于对话内容中的当前问题,确定待回复问题。
例如,在本申请的一些实施例中,用户和智能客服机器人多轮对话过程中,智能客服机器人需要针对每轮对话的回复进行推理。本申请利用LLM(目标大语言模型)Agent技术,根据用户的当前问题识别出当前的待回复问题。
在本申请的一些实施例中,S210可以包括:判断所述对话内容中的当前问题是否存在父级话题,得到判定结果;根据所述判定结果,获取所述待回复问题。
例如,在本申请的一些实施例中,LLM Agent技术分析当前问题与历史对话之间的逻辑,即当前问题是否隶属于某个父级topic(作为父级话题的一个具体示例)***,以此来确定出待回复问题。
作为一个示例,在LLM的prompt里会列出业务场景包含的常见的父级topic和对应的子级topic的映射关系,LLM Agent可以基于上下文对话(也就是历史对话)语义推理出当前的待回复问题,然后做语义匹配判断是否属于子级topic。如下枚举出一种父子问题:
【父级topic】用户询问如何提升额度;
【子级topic】用户在提升额度操作的过程中可能遇到的产品操作问题;比如其中一种提额方法-公积金提额的操作相关问题(其余三种是个税提额、支付宝提额、微信提额,每一种提额操作都可能遇到问题,每一种提额操作成功都可以帮用户提升额度)。
在本申请的一些实施例中,S210可以包括:确认所述当前问题存在所述父级话题,则所述判定结果为存在;生成与所述当前问题对应的回复内容后,回调至所述父级话题对应的问题内容,其中,所述问题内容作为所述待回复问题。
例如,在本申请的一些实施例中,若当前问题是某个父级topic的子级topic,需要子级topic沟通结束后,再回调处理父级topic的待回复问题。即不会在未回复父级topic的情况下,直接岔开话题向后交流。处理子级topic时,针对要处理的子级topic里的当前问题,做了指代消解等检测。例如:用户提问时,询问的是一个大范围的问题,解决这个问题需要先操作步骤1、2;带着用户操作步骤1的过程,用户又遇到了步骤1环节内的操作疑问;这时当步骤1、2都操作完成后,可以回退到之前对用户询问的大范围问题的回复,即大范围问题即为待回复问题。
在本申请的另一些实施例中,S210可以包括:确认所述当前问题不存在所述父级话题,则所述判定结果为不存在;将所述当前问题作为所述待回复问题。
例如,在本申请的一些实施例中,若检测到当前问题没有父级topic,直接把当前问题当成待回复问题即可。
S220,基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术。
例如,在本申请的一些实施例中,确定好待回复问题后,可以通过RAG(Retrieval-Augmented Generation)匹配出符合用户问题的多条回复话术。
在本申请的一些实施例中,S220可以包括:利用相似度算法,从业务知识库中检索与所述待回复问题相匹配的回复话术集合;对所述回复话术集合中的话术进行过滤,得到所述多条回复话术。
例如,在本申请的一些实施例中,通过待回复问题,可以从预构建的业务知识库召回多条相关业务知识Context(作为回复话术集合的一个具体示例)。然后,“知识筛选模块”可以过滤多条相关业务知识Context中内容相近的知识Context,避免知识Context冗余且缺乏多样性。
具体的,业务知识库是根据智能客服机器人要服务的业务场景预先构建的问答知识,其作用是适配业务场景做检索知识增强,后续使LLM Agent做推理时,更有业务依据。业务知识库的一种工程实现形式是将一条条业务知识整理到问答格式的表格文档中,然后利用Faiss等工具,将表格文档编码成检索时用的“embedding知识索引”。以待回复问题为检索参数,检索“embedding知识索引”时,利用相似度等算法,可以召回前M条相关业务知识Context(也就是多条相关业务知识Context)。
在本申请的一些实施例中,S220可以包括:获取所述回复话术集合中的话术对应的嵌入向量;将所述话术对应的嵌入向量输入至贪婪算法中,输出所述多条回复话术。
例如,在本申请的一些实施例中,为了减弱所选多条相关业务知识Context高度相似而造成的冗余,通过K-Center Greedy算法(即贪婪算法)做筛选,在保证相关性且最大化多样性的情况下,使知识Context集合最小,即得到多条回复话术。在实际应用时,K-CenterGreedy算法的输入是召回的前M条相关业务知识Context的embedding向量(作为嵌入向量的一个具体示例),输出的是筛选后映射出的多条回复话术。
具体的,K-Center Greedy算法可以将这些embedding向量看成高维空间的点,即知识Context点集,具体算法步骤如下:
[s1.]从知识Context点集,随机或按某种策略,选择初始化中心点c0。
[s2.]在剩余的知识Context点集中,选择离当前已选择的各中心点最远的点,作为新的中心点ci。
[s3.]重复[s2.]里的操作,直到选择了K个中心点为止。
最终得到的K个中心点,即为要保留的K条知识Context(作为多条回复话术的一个具体示例)。其中,[s1.]中的策略可以根据业务规则制定,这里不做具体限制。
本申请使用K-Center Greedy算法可以带来的效果是:保证检索到的各知识条目Context与待回复问题具有相关性的情况下,最大化各知识条目之间的多样性,避免相似含义的知识条目输入至LLM中产生冗余,可以在保证回复质量不降的情况,减小输入LLMAgent的文本长度,提升目标大语言模型的推理效率。
S230,将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
例如,在本申请的一些实施例中,基于筛选后的K条知识Context,结合待回复问题输入至LLM中,使得在仅支持有限长度文本输入做LLM推理的情况下,给出高质量的目标回复话术。
下面结合附图3示例性阐述本申请的一些实施例提供的提升大模型话术生成质量的具体过程。
请参见附图3,图3为本申请的一些实施例提供的一种提升大模型话术生成质量的方法流程图。
下面示例性阐述上述过程。
S310,获取用户输入的对话内容中的当前问题。
S320,判断当前问题是否存在父级话题,若是则执行S321,否则执行S322。
例如,作为本申请的一个具体示例,图3提供了回复话术生成的结构图。topic跟踪模块可以针对当前问题从历史对话中判定是否存在其对应的父级话题,进而可以识别出待回复问题。
S321,生成与当前问题对应的回复内容后,回调至父级话题对应的问题内容,问题内容即为待回复问题。
S322,将当前问题作为待回复问题。
S330,利用相似度算法,从业务知识库中检索与待回复问题相匹配的回复话术集合。
例如,作为本申请的一个具体示例,图4中的RAG模块中的知识库即为业务知识库,从知识库中可以检索出于待回复问题匹配的回复话术集合Context。
S340,获取回复话术集合中的话术对应的嵌入向量。
S350,将话术对应的嵌入向量输入至贪婪算法中,输出多条回复话术。
例如,作为本申请的一个具体示例,图4中的知识筛选模块中的K-Center Greedy算法可以对Context中的话术对应的嵌入向量进行处理,输出多条回复话术。
S360,将待回复问题和多条回复话术输入至目标大语言模型,生成目标回复话术。
例如,作为本申请的一个具体示例,图4中的LLM回复推理模块内部署的目标大语言模型可以通过topic跟踪模块得到的待回复问题和知识筛选模块输出的多条回复话术可以生成目标回复话术。
可以理解的是,S310~S360的具体实现过程可以参照上文提供的方法实施例,为避免重复,此处适当省略详细描述。上文所涉及的算法可以基于实际业务场景进行选择,本申请实施例并不局限于此。
请参考图5,图5示出了本申请的一些实施例提供的提升大模型话术生成质量的装置的组成框图。应理解,该提升大模型话术生成质量的装置与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该提升大模型话术生成质量的装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
图5的提升大模型话术生成质量的装置包括至少一个能以软件或固件的形式存储于存储器中或固化在提升大模型话术生成质量的装置中的软件功能模块,该提升大模型话术生成质量的装置包括:确定模块510,用于基于对话内容中的当前问题,确定待回复问题;获取模块520,用于基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术;生成模块530,用于将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
在本申请的一些实施例中,确定模块510,用于判断所述对话内容中的当前问题是否存在父级话题,得到判定结果;根据所述判定结果,获取所述待回复问题。
在本申请的一些实施例中,确定模块510,用于确认所述当前问题存在所述父级话题,则所述判定结果为存在;生成与所述当前问题对应的回复内容后,回调至所述父级话题对应的问题内容,其中,所述问题内容作为所述待回复问题。
在本申请的一些实施例中,确定模块510,用于确认所述当前问题不存在所述父级话题,则所述判定结果为不存在;将所述当前问题作为所述待回复问题。
在本申请的一些实施例中,获取模块520,用于利用相似度算法,从业务知识库中检索与所述待回复问题相匹配的回复话术集合;对所述回复话术集合中的话术进行过滤,得到所述多条回复话术。
在本申请的一些实施例中,获取模块520,用于获取所述回复话术集合中的话术对应的嵌入向量;将所述话术对应的嵌入向量输入至贪婪算法中,输出所述多条回复话术。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
本申请的一些实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
本申请的一些实施例还提供了一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。
如图6所示,本申请的一些实施例提供一种电子设备600,该电子设备600包括:存储器610、处理器620以及存储在存储器610上并可在处理器620上运行的计算机程序,其中,处理器620通过总线630从存储器610读取程序并执行所述程序时可实现如上述任意实施例的方法。
处理器620可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器620可以是微处理器。
存储器610可以用于存储由处理器620执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本申请实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器620可以用于执行存储器610中的指令以实现上述所示的方法。存储器610包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种提升大模型话术生成质量的方法,其特征在于,包括:
基于对话内容中的当前问题,确定待回复问题;
基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术;
将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
2.如权利要求1所述的方法,其特征在于,所述基于对话内容中的当前问题,确定待回复问题,包括:
判断所述对话内容中的当前问题是否存在父级话题,得到判定结果;
根据所述判定结果,获取所述待回复问题。
3.如权利要求2所述的方法,其特征在于,所述判断所述对话内容中的当前问题是否存在父级话题,得到判定结果,包括:
确认所述当前问题存在所述父级话题,则所述判定结果为存在;
所述根据所述判定结果,获取所述待回复问题,包括:
生成与所述当前问题对应的回复内容后,回调至所述父级话题对应的问题内容,其中,所述问题内容作为所述待回复问题。
4.如权利要求2所述的方法,其特征在于,所述判断所述对话内容中的当前问题是否存在父级话题,得到判定结果,包括:
确认所述当前问题不存在所述父级话题,则所述判定结果为不存在;
所述根据所述判定结果,获取所述待回复问题,包括:
将所述当前问题作为所述待回复问题。
5.如权利要求1-4中任一项所述的方法,其特征在于,所述基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术,包括:
利用相似度算法,从业务知识库中检索与所述待回复问题相匹配的回复话术集合;
对所述回复话术集合中的话术进行过滤,得到所述多条回复话术。
6.如权利要求5所述的方法,其特征在于,所述对所述回复话术集合中的话术进行过滤,得到所述多条回复话术,包括:
获取所述回复话术集合中的话术对应的嵌入向量;
将所述话术对应的嵌入向量输入至贪婪算法中,输出所述多条回复话术。
7.一种提升大模型话术生成质量的装置,其特征在于,包括:
确定模块,用于基于对话内容中的当前问题,确定待回复问题;
获取模块,用于基于检索增强生成模型RAG获取与所述待回复问题相匹配的多条回复话术;
生成模块,用于将所述待回复问题和所述多条回复话术输入至目标大语言模型,生成目标回复话术。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行如权利要求1-6中任意一项权利要求所述的方法。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并在所述处理器上运行的计算机程序,其中,所述计算机程序被所述处理器运行时执行如权利要求1-6中任意一项权利要求所述的方法。
10.一种计算机程序产品,其特征在于,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器运行时执行如权利要求1-6中任意一项权利要求所述的方法。
CN202410333016.8A 2024-03-22 2024-03-22 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备 Pending CN118152537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410333016.8A CN118152537A (zh) 2024-03-22 2024-03-22 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410333016.8A CN118152537A (zh) 2024-03-22 2024-03-22 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN118152537A true CN118152537A (zh) 2024-06-07

Family

ID=91292534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410333016.8A Pending CN118152537A (zh) 2024-03-22 2024-03-22 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN118152537A (zh)

Similar Documents

Publication Publication Date Title
CN108170859B (zh) 语音查询的方法、装置、存储介质及终端设备
CN106776544B (zh) 人物关系识别方法及装置和分词方法
CN109514586B (zh) 实现智能客服机器人的方法及***
CN112671886B (zh) 基于边缘计算和人工智能的信息推送方法及大数据服务器
CN110019742B (zh) 用于处理信息的方法和装置
EP4060517A1 (en) System and method for designing artificial intelligence (ai) based hierarchical multi-conversation system
WO2024114374A1 (zh) 服务处理方法及装置
CN111858854A (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN112364622B (zh) 对话文本分析方法、装置、电子装置及存储介质
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN113051384B (zh) 基于对话的用户画像抽取方法及相关装置
CN113051389B (zh) 知识推送方法及装置
CN111309882B (zh) 用于实现智能客服问答的方法和装置
CN117575008A (zh) 训练样本生成方法、模型训练方法、知识问答方法及设备
CN111625636A (zh) 一种人机对话的拒绝识别方法、装置、设备、介质
CN111464687A (zh) 一种陌生呼叫请求的处理方法及装置
CN114020898B (zh) 人机自动对话方法、装置、电子设备及存储介质
CN118152537A (zh) 一种提升大模型话术生成质量的方法、装置、存储介质及电子设备
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN113868396A (zh) 基于知识图谱的任务类智能对话构建方法及***
CN113609373A (zh) 知识推荐方法、装置、电子设备及存储介质
CN111881266A (zh) 一种应答方法及装置
CN113468306B (zh) 语音对话方法、装置、电子设备及存储介质
CN113283995B (zh) 一种保险公估远程访问纪要方法、装置以及设备
CN112527975B (zh) 人机交互方法、装置、智能机器人和存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination