CN117786086A - 答复文本生成方法、装置、计算机设备和可读存储介质 - Google Patents

答复文本生成方法、装置、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN117786086A
CN117786086A CN202410033722.0A CN202410033722A CN117786086A CN 117786086 A CN117786086 A CN 117786086A CN 202410033722 A CN202410033722 A CN 202410033722A CN 117786086 A CN117786086 A CN 117786086A
Authority
CN
China
Prior art keywords
text
question
answer
reply
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410033722.0A
Other languages
English (en)
Inventor
王慧敏
赖炜
吴贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202410033722.0A priority Critical patent/CN117786086A/zh
Publication of CN117786086A publication Critical patent/CN117786086A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种答复文本生成方法,包括:在问答界面显示包含问题文本的问题文本消息,以触发通过第一问答模型识别问题文本的语义信息;当知识库中存在与语义信息相似度达到相似度阈值的答复文本,在问答界面,针对问题文本消息,显示包含从答复文本中选择的第一答复文本的第一答复文本消息;当知识库中的答复文本与语义信息的相似度低于相似度阈值,在问答界面,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型基于问题文本和合并文本进行文本生成得到。本方法能够提高智能问答的准确性。

Description

答复文本生成方法、装置、计算机设备和可读存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种答复文本生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,出现了智能问答技术。智能问答技术是一种利用人工智能技术进行问答的应用,它可以自动识别问题,提取关键词和上下文,并生成相应的答案或建议。智能问答技术被广泛应用于各个领域,例如知识问答、智能客服、智能推荐等。
传统的智能问答方法通常是预先构建问答库,并在问答库中生成问题和答案。当用户输入问题,从问答库中筛选与用户输入的问题最相似的问题所对应的答案返回给用户。然而,当问答库中不存在与用户输入的问题相似的问题时,所提供的答案并不准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高准确性的答复文本生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种答复文本生成方法。所述方法包括:
显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
第二方面,本申请还提供了一种答复文本生成装置。所述装置包括:
问题文本显示模块,用于显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
第一答复文本显示模块,用于当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
第二答复文本显示模块,用于当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现以下步骤:
显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
上述答复文本生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过显示问答界面,在问答界面以消息形式显示用户输入的问题文本,该问题文本用于触发通过第一问答模型识别问题文本的语义信息,使得当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,表示知识库中存在能够解答用户问题的答复文本,可直接从已有的答复文本中选择第一答复文本,从而在问答界面中显示包含第一答复文本的第一答复文本消息,以快速响应用户请求。当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,表示知识库中不存在能够解答用户的问题的答复文本,则基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本,以通过第二问答模型,基于问题文本和合并文本进行文本生成第二答复文本,使得在第一问答模型无法解答用户的问题的情况下,能够使用第二问答模型实时生成第二答复文本。并且,所生成的第二答复文本是基于第一问题模型筛选出的多个答复文本和问题文本生成的,使得所生成的第二答复文本更准确。
附图说明
图1为一个实施例中答复文本生成方法的应用环境图;
图2为一个实施例中答复文本生成方法的流程示意图;
图3为一个实施例中在问答界面显示问题文本消息和第一答复文本消息的界面示意图;
图4为一个实施例中在问答界面显示问题文本消息和第二答复文本消息的界面示意图;
图5为一个实施例中显示反馈控件的界面示意图;
图6为一个实施例中显示编辑区域触发控件和语音输入控件的界面示意图;
图7为一个实施例中显示问题文本消息和关联问题文本消息的界面示意图;
图8为一个实施例中从召回的至少一个答复文本中选择第一答复文本的流程示意图;
图9为一个实施例中获得针对问题文本的第二答复文本的流程示意图;
图10为另一个实施例中答复文本生成方法的流程示意图;
图11为一个实施例中第一问答模型和第二问答模型形成的问答框架示意图;
图12为一个实施例中大模型生成第二答复文本的架构示意图;
图13为另一个实施例中大模型生成第二答复文本的架构示意图;
图14为一个实施例中答复文本生成装置的结构框图;
图15为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。例如,可应用于人工智能(Artificial Intelligence,AI)技术领域,其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。本申请实施例提供的方案涉及人工智能的答复文本生成方法,具体通过如下各实施例进行说明。
本申请实施例提供的答复文本生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储***可以存储服务器104需要处理的数据。数据存储***可以集成在服务器104上,也可以放在云上或其他服务器上。终端102显示问答界面,在问答界面显示输入的问题文本消息;问题文本消息包含问题文本,用于触发通过服务器104中的第一问答模型识别问题文本的语义信息。当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,终端102在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息。当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,终端102在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息。第二答复文本,是服务器104基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过服务器104中的第二问答模型,基于问题文本和合并文本进行文本生成得到。
其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。第一问答模型和第二问答模型可在终端102上运行,也可以在服务器104上运行。
在一个实施例中,如图2所示,提供了一种答复文本生成方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S202,显示问答界面,在问答界面显示输入的问题文本消息;问题文本消息包含问题文本,用于触发通过第一问答模型识别问题文本的语义信息。
其中,问答界面是指用于输入问题和显示答复文本的用户界面。该问答界面可以是弹窗、浮层或独立界面。
问题文本消息是指将用户输入的问题文本以消息形式呈现。问题文本是指以文本形式呈现的用户咨询的问题。
本实施例中,第一问答模型是特定实体对象的专用问题模型,第二问答模型是问题文本所属领域的通用问答模型。例如,第一问答模型是特定医院的院务知识的专用问答模型,第二问答模型是医疗领域的通用问答模型。
具体地,用户可运行终端上的问答应用,启动问答应用以显示问答界面。用户可在问答界面中输入需要查询的问题文本,终端响应于用户输入的问题文本,生成包含问题文本的问题文本消息,并在问答界面显示该问题文本消息。
终端获取用户输入的问题文本,调用第一问答模型,并通过第一问答模型识别问题文本的语义信息。
本实施例中,问答应用可以是以应用程序的方式向用户呈现,用户可以通过应用程序来进行问答。该应用程序可以是指安装在终端中的客户端,客户端是指安装并运行在终端中的程序。应用程序也可以是指免安装的应用程序,即无需下载安装即可使用的应用程序,这类应用程序又可以称为小程序,它通常作为子程序运行于客户端中,则该客户端称为母应用,运行在该客户端中的子程序称为子应用。应用程序还可以是指通过浏览器打开的web应用程序等。
其中一个实施例中,在问答界面显示编辑区域触发控件;响应于对编辑区域触发控件的触发操作,显示文本编辑区域;响应于在文本编辑区域中的文本编辑操作,文本编辑操作所编辑的问题文本。
其中,触发操作是指触发编辑区域触发控件的操作,具体可以是触摸操作、光标操作、按键操作或者语音操作等。其中,触摸操作可以是触摸点击操作、触摸按压操作或者触摸滑动操作,触摸操作可以是单点触摸操作或者多点触摸操作。光标操作可以是控制光标进行点击、按压或者滑动的操作。按键操作可以是虚拟按键操作或者实体按键操作等。
编辑区域触发控件是指可供用户操作的可视化元素,编辑区域触发控件的表现形式多种多样,例如,可以是按钮、填空框、单选框、选项组、图像、文字、标识、链接等,但不限于此。可视化元素是指可以显示出来使人眼可见用以传达信息的元素。
文本编辑区域是用于编辑问题文本的用户界面,具体可以是弹窗、浮层或独立界面等。
其中一个实施例中,在问答界面显示编辑区域触发控件或语音输入控件中的至少一种。响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息。其中,语音输入控件是指供用户输入语音的操作控件。
步骤S204,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息。
其中,知识库是指限定领域内的非结构化知识集合。知识库中包括多个答复文本。进一步地,知识库中包括多个问答对,每个问答对包含候选问题文本和该候选问题文本对应的答复文本。本实施例中,候选问题文本还可以包含预设意图实体。
第一答复文本消息是指将第一答复文本以消息形式呈现。
具体地,终端通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度。当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,终端通过第一问答模型,从知识库中召回至少一个答复文本。终端通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本。
终端基于第一答复文本生成第一答复文本消息,并在问答界面中,针对问题文本消息显示第一答复文本消息。
本实施例中,当存在多个维度的知识库,且至少一个维度的知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息。
具体地,当存在多个维度的知识库,终端通过第一问答模型,确定每个维度的知识库中每个答复文本与语义信息之间的相似度。终端通过第一问答模型,从多个维度的知识库中,召回与语义信息相似度达到相似度阈值的至少一个答复文本,以从至少一个答复文本中选择的第一答复文本。
如图3所示,在问答界面300中显示问题文本消息302,该问题文本消息302包含问题文本“我要怎么样去医院呢?”。当知识库中存在与该问题文本的语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面300中,针对问题文本消息302,显示第一答复文本消息304,第一答复文本304包含第一答复文本“【医院地理位置】--某某医院的地理位置是某某市某某区某某路XX号。”。
步骤S206,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于问题文本和合并文本进行文本生成得到。
其中,基本相似条件是指预设的相似度条件,可通过相似度阈值表征,该相似度阈值不同于获得第一答复文本所使用的相似度阈值。
具体地,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,终端通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本。例如,按照相似度从高到低的顺序,从知识库召回预设数量个答复文本。
终端基于多个答复文本生成合并文本。终端通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
终端基于第二答复文本生成第二答复文本消息,并在问答界面中,针对问题文本消息显示第二答复文本消息。
如图4所示,在问答界面300中显示问题文本消息302,该问题文本消息302包含问题文本“我要怎么样去医院呢?”。当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面300中,针对问题文本消息302,显示第二答复文本消息306。该第二答复文本消息306包括第二答复文本“您可以乘坐XX路公交车到XX站下车,步行直走300米即可到达”。
本实施例中,第一答复文本的结构不同于第二答复文本的结构。第一答复文本包括意图实体和针对意图实体的描述问题。
其他实施例中,第一答复文本消息的结构不同于第二答复文本消息的结构。
在其中一个实施例中,该方法还包括:将问题文本和第二答复文本构建为问答对,并将问答对添加到第二问答模型对应的问答库中。
在其中一个实施例中,该方法还包括:将问题文本和第二答复文本构建为问答对,并将问答对添加到知识库中。
在其中一个实施例中,该方法还包括:对问题文本和第二答复文本进行验证;当验证通过,将问题文本和第二答复文本构建为问答对,并将问答对添加到第二问答模型对应的问答库中。
在其中一个实施例中,该方法还包括:对问题文本和第二答复文本进行验证;当验证通过,将问题文本和第二答复文本构建为问答对,并将问答对添加到知识库中。
上述答复文本生成方法,通过显示问答界面,在问答界面以消息形式显示用户输入的问题文本,该问题文本用于触发通过第一问答模型识别问题文本的语义信息,使得当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,表示知识库中存在能够解答用户问题的答复文本,可直接从已有的答复文本中选择第一答复文本,从而在问答界面中显示包含第一答复文本的第一答复文本消息,以快速响应用户请求。当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,表示知识库中不存在能够解答用户的问题的答复文本,则基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本,以通过第二问答模型,基于问题文本和合并文本进行文本生成第二答复文本,使得在第一问答模型无法解答用户的问题的情况下,能够使用第二问答模型实时生成第二答复文本。并且,所生成的第二答复文本是基于第一问题模型筛选出的多个答复文本和问题文本生成的,使得所生成的第二答复文本更准确。
在一个实施例中,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息,包括:
当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息,在问答界面中,针对问题文本消息,显示包含第一答复文本的第一答复文本消息;上文文本消息包含问题文本的上文文本,第一答复文本是基于上文文本从至少一个答复文本中选择的。
其中,上文文本是在问题文本之前的文本,具体可以包括在问题文本之前的其他问题文本或在问题文本之前的其他答复文本中的至少一种。在问题文本之前的其他答复文本,可以包括第一答复文本或第二答复文本中的至少一种。
具体地,用户可能在问答界面进行多次问答,当终端获取用户在问答界面输入的问题文本,检测在该问题文本之前的其他问题文本和在该问题文本之前的答复文本。
当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,终端通过第一问答模型,从知识库中召回至少一个答复文本。
终端通过第一问答模型,基于上文文本从至少一个答复文本中选择第一答复文本。终端生成包含第一答复文本的第一答复文本消息,并在问答界面显示。
在其中一个实施例中,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息,包括:
当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息或下文文本消息中的至少一种,在问答界面中,针对问题文本消息,显示包含第一答复文本的第一答复文本消息;上文文本消息包含问题文本的上文文本,下文文本消息包含问题文本的下文文本,第一答复文本是基于上文文本或下文文本消息中的至少一种从至少一个答复文本中选择的。
可以理解的是,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息,第一答复文本是基于上文文本从至少一个答复文本中选择的。
当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在下文文本消息,第一答复文本是基于下文文本从至少一个答复文本中选择的。
当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息和下文文本消息,第一答复文本是基于上文文本和下文文本从至少一个答复文本中选择的。
其中,下文文本是在问题文本之后的文本,具体可以包括在问题文本之后的其他问题文本、在问题文本之后的其他答复文本、或与问题文本相关联的关联问题文本中的至少一种。
本实施例中,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息,将上文文本作为选择本次的答复文本的提示,能够结合多轮问答的信息更准确地筛选出第一答复文本。
在一个实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息,包括:
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;上文文本消息包含问题文本的上文文本,第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于上文文本、问题文本和合并文本进行文本生成得到。
具体地,用户可能在问答界面进行多次问答,当终端获取用户在问答界面输入的问题文本,检测在该问题文本之前的其他问题文本和在该问题文本之前的答复文本。
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,终端通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本。终端基于多个答复文本生成合并文本。终端通过第二问答模型,基于问题文本、上文文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
终端生成包含第二答复文本的第二答复文本消息,并在问答界面显示。
在其中一个实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息,包括:
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息或下文文本消息中的至少一种,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;上文文本消息包含问题文本的上文文本,下文文本消息包含问题文本的下文文本,第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于上文文本或下文文本中的至少一种、以及问题文本和合并文本进行文本生成得到。
可以理解的是,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息,第二答复文本是通过第二问答模型,基于上文文本、问题文本和合并文本进行文本生成得到。
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在下文文本消息,第二答复文本是通过第二问答模型,基于下文文本、问题文本和合并文本进行文本生成得到。
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息和下文文本消息,第二答复文本是通过第二问答模型,基于上文文本、下文文本、问题文本和合并文本进行文本生成得到。
本实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息,将上文文本作为第二问答模型本次生成答复文本的提示信息,以结合问题文本和合并文本更准确地生成第二答复文本。将多轮问答的信息作为答复文本生成的提示信息,能够更准确地预测用户意图,从而促使第二问答模型生成更符合用户意图的第二答复文本。
在一个实施例中,该方法还包括:
在问答界面显示针对第一答复文本消息的多个反馈控件;响应于针对反馈控件触发的反馈操作,基于第一答复文本消息包含的第一答复文本,调整第一问答模型,其中,多个反馈控件触发的反馈操作表征相反的反馈结果,用于对第一问答模型进行相反的调整。
具体地,在问答界面显示第一答复文本消息后,显示针对第一答复文本消息的多个反馈控件,每个反馈控件用于生成不同的反馈结果。每个反馈控件触发生成的反馈结果相反。
用户可触发任一反馈控件,终端响应于用户针对反馈控件触发的反馈操作,基于第一答复文本调整第一问答模型。
本实施例中,当多个反馈控件包括表征已解答问题文本的反馈控件,响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第一类调整。第一类调整可以是增大第一问答模型的排序权重,使得第一问答模型针对问答文本,能够提高输出第一答复文本的概率。
本实施例中,当多个反馈控件包括表征未解答问题文本的反馈控件,响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第二类调整。第二类调整可以是减小第一问答模型的排序权重,使得第一问答模型针对问答文本,能够降低输出第一答复文本的概率。
例如,用户在询问关于药物副作用的问题时,更倾向于选择包含具体药物名称和详细副作用描述的答案,那么第一问答模型就可以自动调整排序算法,提高这类答案的权重。当下一次用户再次询问类似问题时,第一问答模型就可以提供更符合用户需求的答案。
本实施例中,在问答界面显示针对第一答复文本消息的多个反馈控件,响应于针对反馈控件触发的反馈操作,基于第一答复文本消息包含的第一答复文本,调整第一问答模型,其中,多个反馈控件触发的反馈操作表征相反的反馈结果,用于对第一问答模型进行相反的调整,从而能够根据用户的反馈行为,自动调整第一问答模型的排序策略,对于一些用户需求和行为变化较大的场景,强化学习算法可以提供更灵活的排序。
在一个实施例中,多个反馈控件,包括表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件;
响应于针对反馈控件触发的反馈操作,基于第一答复文本消息包含的第一答复文本,调整第一问答模型,包括:
响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第一类调整;响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第二类调整,第一类调整与第二类调整相反。
其中,第一类调整和第二类调整是指对第一问答模型的排序权重的调整。一类调整用于提高第一问答模型的排序权重,第二类调整用于降低第一问答模型的排序权重。
具体地,在问答界面显示第一答复文本消息后,显示表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件。
当用户认为第一答复文本已经解答了自己的问题,可触发表征已解答问题文本的反馈控件的反馈操作,终端响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本,对第一问答模型进行第一类调整,以增大第一问答模型针对第一答复文本的排序权重。
当用户认为第一答复文本没有解答自己的问题,可触发表征未解答问题文本的反馈控件的反馈操作,终端响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本,对第一问答模型进行第二类调整,以减小第一问答模型针对第一答复文本的排序权重。
如图5所示,在问答界面500中显示问题文本消息502。在问答界面500中显示包含第一答复文本504的第一答复文本消息506后,显示针对第一答复文本消息506的反馈控件508和反馈控件510。其中,反馈控件508表示用户认为第一答复文本504能够解决自己的问题,反馈控件510表示用户认为第一答复文本504不能解决自己的问题。
当用户点击反馈控件508,终端基于第一答复文本504对第一问答模型进行正向调整,以提高第一问答模型输出第一答复文本504的概率。
当用户点击反馈控件510,终端基于第一答复文本504对第一问答模型进行负向调整,以降低第一问答模型输出第一答复文本504的概率。
本实施例中,响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本对第一问答模型进行第一类调整,以增大第一问答模型针对第一答复文本的排序权重,使得后续出现与该问题文本相似的问题时,能够提高输出第一答复文本的概率。响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本对第一问答模型进行第二类调整,以减小第一问答模型针对第一答复文本的排序权重,使得后续出现与该问题文本相似的问题时,能够降低输出第一答复文本的概率。本实施例能够根据用户的反馈行为,自动调整第一问答模型的排序策略,使得第一问答模型能够输出更符合用户需求的答复文本。
在一个实施例中,在问答界面显示输入的问题文本消息,包括:
在问答界面显示文本编辑区域;响应于在文本编辑区域触发的文本编辑事件,在问答界面显示包含编辑获得的问题文本的问题文本消息。
具体地,终端显示问答界面,在问答界面显示文本编辑区域。用户可在文本编辑区域进行文本编辑,终端响应于用户在文本编辑区域触发的文本编辑事件,确定编辑获得的问题文本。终端基于该问题文本,生成包含该问题文本的问题文本消息,并在问答界面显示该问题文本消息。
本实施例中,响应于在文本编辑区域触发的文本编辑事件,获得编辑获得的原始问题文本;当原始问题文本的格式不符合预设格式,将原始问题文本的格式调整为预设格式,获得问题文本。
本实施例中,在问答界面显示文本编辑区域,以给用户提供文本编辑功能。响应于在文本编辑区域触发的文本编辑事件,在问答界面显示包含编辑获得的问题文本的问题文本消息,能够以消息形式在问答界面显示用户的问题。
在一个实施例中,在问答界面显示输入的问题文本消息,包括:
在问答界面显示语音输入控件;响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息。
具体地,终端显示问答界面,在问答界面显示语音输入控件。用户可触发语音输入控件以输入语音,终端响应于用户针对语音输入控件触发的语音输入事件,获得用户输入的语音。终端对输入的语音进行语音识别和文本转换,获得输入的语音对应的问题文本。终端基于该问题文本,生成包含该问题文本的问题文本消息,并在问答界面显示该问题文本消息。
本实施例中,在问答界面显示语音输入控件,以给用户提供语音输入功能,便于用户通过语音快速输入需要咨询的问题。响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息,能够将用户语音输入的问题以文本形式在问答界面中显示,便于用户查看自己输入的问题是否准确。
如图6所示,在问答界面600显示编辑区域触发控件602和语音输入控件604。用户点击编辑区域触发控件602,在问答界面600显示文本编辑区域606。用户在文本编辑区域606中编辑问题文本608,编辑完成后,终端获取用户编辑的问题文本608生成问题文本消息610。在问答界面600中显示问题文本消息610。
本实施例中,用户可以点击语音输入控件602,以输入用户语音,终端将用户输入的语音转换为问题文本608,并在问答界面600中显示包含问题文本608的问题文本消息610。
在一个实施例中,该方法还包括:
在问答界面,显示至少一个关联问题文本消息,该关联问题文本消息包含与问题文本相关联的关联问题文本。
其中,关联问题文本消息是指将关联问题文本以消息形式在问答界面呈现。关联问题文本是指与用户输入的问题文本相关联的问题文本。
具体地,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,终端在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息。
终端从知识库获取与用户输入的问题文本相关联的至少一个关联问题文本。在显示第一答复文本消息后,终端在问答界面中,显示包含至少一个关联问题文本的关联问题文本消息。
如图7所示,在问答界面700中显示问题文本消息702,该问题文本消息702包含问题文本704。当在问答界面700中,针对问题文本消息702,显示第一答复文本消息706后,显示关联问题文本消息708。关联问题文本消息708包含与问题文本704相关联的多个关联问题文本710。
本实施例中,在显示第一答复文本消息后,终端在问答界面显示针对第一答复文本消息的多个反馈控件。多个反馈控件,包括表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件。响应于针对表征未解答问题文本的反馈控件的反馈操作,终端在问答界面中,显示包含至少一个关联问题文本的关联问题文本消息。
本实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,终端在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息。
终端从知识库获取与用户输入的问题文本相关联的至少一个关联问题文本。在显示第二答复文本消息后,终端在问答界面中,显示包含至少一个关联问题文本的关联问题文本消息。
本实施例中,在显示第二答复文本消息后,终端在问答界面显示针对第二答复文本消息的多个反馈控件。多个反馈控件,包括表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件。响应于针对表征未解答问题文本的反馈控件的反馈操作,终端在问答界面中,显示包含至少一个关联问题文本的关联问题文本消息。
本实施例中,在问答界面,显示至少一个关联问题文本消息,该关联问题文本消息包含与问题文本相关联的关联问题文本,从而能够显示与用户咨询的问题相关的其他问题,以为用户提供进一步的解答。
在一个实施例中,如图8所示,该方法还包括:
步骤S802,获取问题文本,通过第一问答模型识别问题文本的语义信息。
具体地,终端获取用户在问答界面输入的问题文本,将问题文本输入第一问答模型,通过第一问答模型对问题文本进行语义识别,获得问题文本的语义信息。
本实施例中,当问题文本的格式不符合第一问答模型对应的预设格式,将问题文本调整为预设格式。将预设格式的问题文本输入第一问答模型,通过第一问答模型识别问题文本的语义信息。
步骤S804,通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度。
具体地,第一问答模型与知识库相关联。终端通过第一问答模型,确定知识库的每个答复文本与问题文本的语义信息之间的相似度。
本实施例中,第一问答模型与多个维度的知识库相关联。针对每个维度的知识库,终端通过第一问答模型确定所针对知识库中的每个答复文本与语义信息之间的相似度。
本实施例中,知识库中包括多个问答对,问答对包含候选问题文本和答复文本;通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度,包括:
当问题文本中存在意图实体,通过第一问答模型,确定问答对包含的候选问题文本中的预设意图实体和问题文本中的意图实体之间的相似度;将候选问题文本中的预设意图实体和问题文本中的意图实体之间的相似度,作为候选问题文本对应的答复文本与语义信息之间的相似度。
本实施例中,通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度,包括:
确定问题文本的关键词;基于关键词分别在问题文本和候选问题文本中的词频,确定问题文本和候选问题文本之间的相似度;将问题文本和候选问题文本之间的相似度,作为候选问题文本对应的答复文本与语义信息之间的相似度。
本实施例中,通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度,包括:确定每个候选问题文本和问题文本之间的编辑距离,将该编辑距离作为候选问题文本对应的答复文本与语义信息之间的相似度。
步骤S806,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,通过第一问答模型,从知识库中召回至少一个答复文本。
具体地,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,终端通过第一问答模型,从知识库中召回与语义信息相似度达到相似度阈值的至少一个答复文本。
步骤S808,通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本。
具体地,终端通过第一问答模型,按照相似度对召回的答复文本进行排序,并从中选择第一答复文本。可以选择最高相似度的答复文本作为第一答复文本,也可以选择任一一个答复文本作为第一答复文本。
本实施例中,通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本:
通过第一问答模型,确定召回的答复文本对应的候选问题文本与用户输入的问题文本之间的编辑距离;通过第一问答模型,基于编辑距离召回的答复文本中选择第一答复文本。例如,可以选择编辑距离最短的答复文本作为第一答复文本。
本实施例中,获取问题文本,通过第一问答模型识别问题文本的语义信息,通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,表示知识库中存在能够解答用户的问题的答复文本,则通过第一问答模型,从知识库中召回至少一个可用的答复文本,通过第一问答模型,从召回的至少一个答复文本中选择最符合用户需求的第一答复文本,以快速响应用户请求。
在一个实施例中,语义信息通过问题文本中的意图实体或关键词中的至少一种表征,知识库中包括多个问答对,问答对包含候选问题文本和答复文本;通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度,包括:
当问题文本中存在意图实体,通过第一问答模型,确定问答对包含的候选问题文本中的预设意图实体和问题文本中的意图实体之间的相似度;当问题文本中不存在预设意图实体,确定问题文本的关键词;基于关键词分别在问题文本和候选问题文本中的词频,确定问题文本和候选问题文本之间的相似度;
通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本,包括:
通过第一问答模型,基于召回的问答对包含的候选问题文本和问题文本之间的编辑距离,从召回的问答对包含的答复文本中选择第一答复文本。
具体地,终端可通过第一问答模型识别问题文本中是否存在意图实体,当问题文本中存在意图实体,通过第一问答模型,确定问答对包含的候选问题文本中的预设意图实体和问题文本中的意图实体之间的相似度。
当问题文本中不存在预设意图实体,终端通过第一问答模型,确定问题文本的关键词。终端通过第一问答模型,基于关键词分别在问题文本和候选问题文本中的词频,确定问题文本和候选问题文本之间的相似度。
终端通过第一问答模型,基于召回的问答对包含的候选问题文本和问题文本之间的编辑距离,从召回的问答对包含的答复文本中选择第一答复文本。
本实施例中,当问题文本中存在意图实体,可基于意图实体从知识库中召回答复文本,当问题文本中不存在意图实体,可基于问题文本中的关键字从知识库中召回答复文本,以能够在不同情况下均可召回答复问题。文本之间的编辑距离可表征文本之间的相似度,基于文本之间的编辑距离来筛选出第一答复文本,可准确筛选出相似度高的第一答复文本。
在一个实施例中,如图9所示,该方法还包括:
步骤S902,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本。
具体地,当知识库中的每个答复文本与语义信息的相似度低于相似度阈值,终端通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本。
步骤S904,基于多个答复文本生成合并文本。
具体地,终端可识别多个答复文本中每个答复文本的语义信息,基于每个答复文本的语义信息,对多个答复文本进行合并,获得合并文本。
本实施例中,可通过第一问答模型,识别每个答复文本的语义信息。通过第一问答模型,基于多个答复文本的语义信息,合并多个答复文本,获得合并文本。
本实施例中,可通过第二问答模型,基于多个答复文本生成合并文本。
步骤S906,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
具体地,终端通过第二问答模型,对问题文本提取文本语义特征,获得问题文本语义特征。通过第二问答模型,对合并文本提取文本语义特征,获得合并文本语义特征。通过第二问答模型,基于问题文本语义特征和合并文本语义特征进行文本生成,获得第二答复文本。
本实施例中,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本,包括:
获取问题文本的上文文本或下文文本中的至少一种,上文文本包括在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种,下文文本包括在问题文本之后的问题文本或在问题文本之后的第二答复文本中的至少一种;通过第二问答模型,基于上文文本或下文文本中的至少一种,以及问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
本实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,表示知识库中不存在能够解答用户的问题的答复文本。从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本,基于多个答复文本生成合并文本,以通过第二问答模型,基于问题文本和合并文本进行文本生成第二答复文本,使得在第一问答模型无法解答用户的问题的情况下,能够使用第二问答模型实时生成第二答复文本。并且,所生成的第二答复文本是基于第一问题模型筛选出的多个答复文本和问题文本生成的,使得所生成的第二答复文本更准确。
在一个实施例中,基于多个答复文本生成合并文本,包括:
提取多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示;基于每个文本特征的文本特征表示,将多个答复文本进行合并,获得合并文本,合并文本表达的语义信息,多于多个答复文本所表达的语义信息。
具体地,终端可分别提取多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示。终端基于每个文本特征的文本特征表示,将多个答复文本进行合并,获得合并文本。合并文本表达的语义信息,多于多个答复文本所表达的语义信息。
本实施例中,终端基于每个文本特征的文本特征表示进行文本扩展,获得合并文本。
本实施例中,提取多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示,以基于每个文本特征的文本特征表示,将多个答复文本合并为一个文本,使得合并文本表达的语义信息,多于多个答复文本所表达的语义信息,以为第二问答模型生成答复文本提供更多参考信息,使得生成的第二答复文本能够解答用户的问题。
在一个实施例中,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得第二答复文本,包括:
基于问题文本的语义信息,识别问题文本所属的领域;确定与问题文本所属的领域对应的第二问答模型,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得第二答复文本。
具体地,不同领域对应不同的第二问答模型,该第二问答模型是问题文本所属领域的通用问答模型。例如,若问题文本属于医疗领域,该第二问答模型是在医疗领域的通用问答模型,用于生成医疗领域的答复文本。若问题文本属于交通领域,该第二问答模型是在交通领域的通用问答模型,用于生成交通领域的答复文本。
终端基于问题文本的语义信息,识别问题文本所属的领域。终端确定与问题文本所属的领域对应的第二问答模型,并调用该第二问答模型,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得第二答复文本。
本实施例中,基于问题文本的语义信息,识别问题文本所属的领域,从而能够确定所要使用的第二问答模型。通过第二问答模型,基于问题文本和合并文本进行文本生成,能够准确获得解答用户问题的第二答复文本。
在一个实施例中,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本,包括:
获取问题文本的上文文本,上文文本包括在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种;通过第二问答模型,基于问题文本、上文文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
具体地,用户可能进行多次问答,当终端获取用户在问答界面输入的问题文本,检测在该问题文本之前的其他问题文本和在该问题文本之前的答复文本。将在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种,作为问题文本的上文文本。
终端将问题文本、上文文本和合并文本输入第二问答模型,第二问答模型分别对问题文本、上文文本和合并文本进行文本语义特征提取,获得问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征。第二问答模型基于问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征进行文本生成,获得第二答复文本。
本实施例中,将在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种作为上文文本,使得第二问答模型基于多轮问答的信息更准确地预测用户意图,从而基于问题文本、上文文本和合并文本生成更符合用户意图的第二答复文本。
在一个实施例中,通过第二问答模型,基于问题文本、上文文本和合并文本进行文本生成,获得针对问题文本的第二答复文本,包括:
通过第二问答模型,分别对问题文本、上文文本和合并文本进行文本语义特征提取;通过第二问答模型,基于问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征进行文本生成,获得第二答复文本。
具体地,通过第二问答模型,分别对问题文本、上文文本和合并文本进行文本语义特征提取,获得问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征。通过第二问答模型,基于问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征进行文本生成,获得第二答复文本。
本实施例中,通过第二问答模型,分别对上文文本、上文和合并文本进行文本语义特征提取,通过第二问答模型,基于持续问题文本的文本语义特征、上文的文本语义特征和合并文本的文本语义特征进行文本生成,获得第二答复文本,能够将本轮问题之前的所有问题和答复文本都作为上文,以作为本轮生成答复文本的提示,从而准确生成第二答复文本。
在一个实施例中,该方法还包括:
获取针对第二答复文本的反馈结果;当反馈结果表征第二答复文本对问题文本的解答通过,将问题文本和第二答复文本构建为问答对;将问答对添加到第二问答模型对应的问答库中。
具体地,在问答界面显示针对第二答复文本消息的多个反馈控件,多个反馈控件,包括表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件。
响应于针对表征已解答问题文本的反馈控件的反馈操作,终端生成对应的反馈结果,该反馈结果表征第二答复文本对问题文本的解答通过。终端将问题文本和第二答复文本构建为问答对,并将问答对添加到第二问答模型对应的问答库中。
本实施例中,当反馈结果表征第二答复文本对问题文本的解答未通过,删除第二答复文本。进一步地,响应于针对表征未解答问题文本的反馈控件的反馈操作,生成对应的反馈结果,该反馈结果表征第二答复文本对问题文本的解答未通过,则终端删除第二答复文本。
本实施例中,获取针对第二答复文本的反馈结果,当反馈结果表征第二答复文本对问题文本的解答通过,表示该第二答复文本能够解决用户的问题,则将问题文本和第二答复文本构建为问答对,并添加到第二问答模型对应的问答库中,从而能够自动扩充第二问答模型的问答库。
在一个实施例中,该方法还包括:
获取针对第二答复文本的反馈结果;当反馈结果表征第二答复文本对问题文本的解答通过,将问题文本和第二答复文本构建为问答对;将问答对添加到第一问答模型对应的知识库中。
当反馈结果表征第二答复文本对问题文本的解答通过,表示该第二答复文本能够解决用户的问题,则将问题文本和第二答复文本构建为问答对,并添加到第一问答模型对应的问答库中,从而能够自动扩充第一问答模型的知识库,使得后续可以快速获取该答复文本反馈给用户。
在一个实施例中,如图10所示,提供了一种答复文本生成方法,应用于终端,包括:
步骤S1002,显示问答界面,在问答界面显示文本编辑区域和语音输入控件。
步骤S1004,响应于在文本编辑区域触发的文本编辑事件,在问答界面显示包含编辑获得的问题文本的问题文本消息,问题文本消息包含问题文本。
步骤S1006,响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息。
步骤S1008,通过第一问答模型识别问题文本的语义信息。
步骤S1010,通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度。
步骤S1012,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,通过第一问答模型,从知识库中召回至少一个答复文本。
步骤S1014,通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本,在问答界面中,针对问题文本消息,显示包含第一答复文本的第一答复文本消息。
步骤S1016,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本。
步骤S1018,基于多个答复文本生成合并文本。
步骤S1020,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本,在问答界面中,显示包含第二答复文本的第二答复文本消息。
步骤S1022,在问答界面显示表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件。
步骤S1024,响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第一类调整。
步骤S1026,响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第二类调整,第一类调整与第二类调整相反。
在一个实施例中,提供了一种应用场景为医疗领域的答复文本生成方法的实施例。在该应用场景中,使用小模型和大模型协同工作,小模型即第一问答模型,大模型即第二问答模型,小模型和大模型均能够处理多轮问答。全局任务的输入是用户的问题,根据和问答对的匹配情况直接输出问答库中的答案、或者推荐问题进一步明确用户的诉求、或者推荐关联问题、后者热门问题引导就医流程、或者生成问题弥补问答库覆盖不足的短板。具体处理如下:
小模型部分主要包括两个子任务:问答对召回和问答排序。在召回阶段,使用基于词频的召回模型(如TF-IDF和BM25)从问答库中召回相关的问答对。这个过程主要是通过比较用户问题和问答库中问题的词频相似度,找出最相关的问答对。然后,在排序阶段,使用文本匹配模型(如Albert)对召回的问答对进行排序。这个过程主要是通过比较用户问题和召回的问答对的语义相似度,确定最相关的答案。
大模型部分主要包括两个子任务:答案生成和问答库构建。首先当小模型无法输出答案时,大模型会根据召回的问答对(如果有)生成答案直接反馈给用户。这个过程通过生成模型的能力,对用户问题进行理解和回答,填补了未知问答的逻辑空白。同时,还利用大模型进行知识整理和问答对自动生成,以缓解问答库构建的人工压力。这个过程主要是通过大模型的生成能力,自动产生新的问答对,从而扩充问答库,减少人工构建问答库的工作量。
为了提升问答***在院务问答场景中的回复质量,借助大模型的优势,把问答任务同时建模为文本判别问题和文本生成问题,并使用大量医学语料优化大模型和任务相关的数据优化文本匹配模型。图11中展示了大小模型协同的召回生成式院务问答框架图,它由以下几个部分组成:
1)考虑到医院现有问答库的数据特点和产品功能需求,开发了一个基于多层意图实体分析和BERT向量化的文本理解模块。这个模块的目标是对用户问题和问答库文本进行深度解析。通过这种方式,能够理解用户问题的真实意图,并将这些问题与问答库中的文本进行匹配。这个过程涉及到对文本的语义理解,包括识别关键词,理解词语之间的关系,以及理解整个句子的含义。
2)使用基于词频和的文本表示学习模型进行二阶段文本召回模型获取多种问答场景下的支撑知识库。这个过程主要包括两个阶段:首先,使用基于词频的模型对文本进行初步的召回;然后,使用Transformer模型对初步召回的文本进行深度学习,以获取更精确的文本表示。这样,就能够从大量的文本中召回与用户问题最相关的文本。
3)开发了基于编辑距离、文本相似度、意图实体匹配等综合排序算法实现各种场景下的答案文本构建。编辑距离可以帮助衡量用户问题和召回文本之间的差异;文本相似度可以帮助衡量用户问题和召回文本之间的语义相似度;意图实体匹配则可以帮助理解用户问题和召回文本之间的意图匹配程度。通过这些排序算法,可以从召回的文本中找出最合适的答案。
4)根据召回结果和小模型输出结构,同时构建基于大模型的召回生成逻辑,综合利用召回知识和prompt工程(提示工程)进行答案生成。这个过程主要是通过大模型的生成能力,对召回的知识进行整合和生成,以提供最准确的答案。同时,还利用prompt工程,将对话历史和用户问题作为提示,引导大模型生成更准确的答案。
文本解析:意图实体识别引擎通过输入文本,输出相关的意图和实体,从而对文本进行结构化解析。采用了三层的意图体系,包括9个一级意图(涵盖客服、疾病、药物等领域),56个二级意图,以及总共94个细分意图。目前,定义了19个实体,如症状、部位、医生等。当前的意图实体识别逻辑采用层次识别方法,先从一级意图出发,再检查二级意图。
将意图识别定义为一个多类别多标签的分类问题。意图实体识别的主模型是Flat-Lattice Transformer,其独特之处在于其预训练任务的设计,能够解析中文词语和语义解析树的信息,从而更好地处理中文。模型的输入信息包括问题的字向量、bigram向量和位置向量。每个输入向量都带有一个特殊的起始符,该符号对应于Transformer的输出,集合了整个问题的信息,并用于意图分类。同时,实体识别可以看作是一个序列生成问题,因此Transformer Encoder的其他位置的输出结合BIO标注法,输出相应的实体信息。然后,在transformer上增加注意力机制和意图输出头,以输出意图类别。例如,对于输入“今天有点畏光”,模型获取字序列和词序列,并对“畏光”加上症状词标签作为模型输入。最后,Transformer识别出“今天”对应时间实体,“畏光”对应症状实体,最后意图分类器将输入分类为导诊意图。为了充分利用意图信息和实体信息的相关性,实现互助互长,采用了意图实体联合训练的方式。使用6万左右的意图实体数据,同时对错分类别进行了数据增强和采取可放回采样等技巧缓解数据分布不均和不足问题。
基于Albert的文本向量化。整个Albert模型基于BERT骨架,采用了Transformer以及GELU激活函数。Albert通过将嵌入的参数进行了因式分解解绑了嵌入维度和隐藏层维度、使用跨层的参数共享减小参数和提升学习效率、同时抛弃了原来的“下一句预测”任务改用“句间连贯损失任务”进行训练让模型能更好的学习中文预料的上下文和语义信息。
基于大模型进行问答库自动构建:传统的问答库大多年久失修,覆盖率极低,无法满足医疗行业的需求。为了弥补当前问答库构建困难和覆盖率低的问题,本实施例中的答复文本生成方法是一种基于大模型构建问答库和知识库的自动化方案,直观的可以借助大模型进行问答对生成,自动扩充问答库。这样,整个过程就自动化了,大大降低了人力和时间成本。
如图12所示,首先,收集医院可提供的知识文本或者图片。这些知识文本或者图片可能包括医疗知识、医疗流程、医疗政策等内容。然后,对这些知识文本或者图片进行预处理,包括OCR(光学字符识别)和文本分段等。OCR可以将图片中的文字转化为电子文本,使得大模型可以处理。文本分段则是将长篇的知识文本切分为一段段的小文本,使得大模型可以更好地理解和处理。
接下来,将预处理后的知识文本直接提供大模型,让它进行问答对生成或者收集未知问题进行条件化问答对生成。大模型可以根据知识文本生成相关的问答对,这些问答对既可以是基于知识文本的直接提问和回答,也可以是基于知识文本的推理和总结。这样,就可以生成大量的问答对,用于扩充问答库。最后,对生成的问答对进行人工校验。人工校验主要是检查问答对的准确性和相关性,确保问答对真实反映了知识文本的内容,而且对医疗行业有实际的帮助。符合要求的问答对将被入库,用于扩充问答库。通过这种方式,可以大大降低医院问答库的维护成本,提高问答库的覆盖率,同时也可以提高院务问答的效率和质量。这对于医疗行业来说,无疑是一种巨大的进步。
知识召回和召回生成:知识召回是一种重要的信息检索技术,它通过比对输入问题的意图实体和输出问题的意图实体,然后使用基于意图实体匹配和基于词频的召回模型进行召回。这种方法可以在意图实体全重合、同意图和不同意图的情况下进行有效的召回。
在实际应用中,知识召回可以用于大模型和小模型的生成。特别是在知识依赖的场景中,大模型召回生成可以有效地缓解大模型的幻想导致的事实错误问题。
大模型的召回生成逻辑如图13所示。首先,使用召回器从各个知识库(如问答库、服务链接库和内部知识库等)中根据输入问题召回相关的问答对、服务链接或者其它文本段。然后,对召回的内容进行总结,形成支撑文档。最后,将支撑文本和输入问题合并,统一输入到大模型中,使其能够根据知识进行可控的生成。
例如,当输入问题为“五联疫苗有哪些不良反应?”时,可以从知识库中召回相关的文本段,如“每个宝宝的体质情况不一样,不只是五联疫苗,宝宝接种完针剂疫苗都有可能会出现红肿、低热,哭闹等常见不良反应的情况,建议每次接种完多留意宝宝的状态及勤测体温,避免揉搓针眼处哦。”等。然后,将这些召回的文本段总结成支撑文档,与输入问题一起输入到大模型中,生成最终的回答。
通过这种方式,可以确保大模型的生成结果既准确又可控,从而提高了信息检索的效率和质量。
大模型与小模型协同工作的多轮问答***:
如图11所示,小模型采用召回排序框架,首先使用基于词频的TF-IDF和BM25等召回模型召回相关问答对,然后使用Albert等文本匹配模型进行排序。其主要通过构建用户问题和问答库问答对的匹配,根据匹配程度进行直推答案,推荐问题,关联问题,热门问题等。当前支撑的数据库有问答库,文章库、医院版本库等。医院版本库用于更新引擎测具体医院对应的问答库和文章库。小模型侧的具体业务逻辑如下:
启动智能问答服务后,服务端开始收集用户查询,医院id,以及可选的意图/实体信息。然后首先判断医院id是否有效,如果是无效的医院id直接输出空。
如果是有效的医院id接着判断是否输入意图实体信息,如果没有意图实体信息则调用意图实体引擎获取意图实体,接着把用户问题,意图实体信息输入信息匹配模块查找答案或者相似问题。这部分首先进行实体匹配,如果问答库里有和查询一致的问题,则直接输出最先匹配的问答对和分数;如果实体匹配失败则开始文本匹配。
文本匹配会先用TF-IDF字符召回的方法,然后用Albert进行精排,最后会得到一个列表,里面包含所有搜索到与用户查询最接近的问题和答案,并按照相关度打分进行排序。
最后,针对列表里的问题,会通过编辑距离的方式与用户查询进行匹配,通过此来判断是否能得出准确答案,可以则直接输出意图实体,否则进行意图实体比对,完全一致直接输出,否则查看文本匹配结果,符合阈值条件直接输出,否则最后进行问题推荐进一步明确用户意图。
当小模型无法输出答案时,大模型作为补充逻辑进行生成。此外,在时序上保存大、小模型的对话历史作为每轮附加的提示,使大模型具备结合上下文进行多轮回复的能力。大小模型的协同逻辑主要体现在以下两个方面:
当小模型无法输出答案时,大模型作为补充逻辑进行生成。在召回失败的场景大模型会直接解析问题借助现有知识生成答案;在召回生成而小模型没有输出的场景,大模型进行召回生成。
在时序上保存大、小模型的对话历史作为每轮附加的提示,使大模型具备结合上下文进行多轮回复的能力。
例如用户问:“我想知道如何预防糖尿病?”,小模型可能无法提供满意的答案,因为这个问题涉及到的知识点比较广泛。但是,大模型可以根据其在医疗领域的训练,生成一份详细的预防糖尿病的建议,如合理饮食、定期运动等。同时,如果用户对某个建议有进一步的问题,如“我应该怎么合理饮食?”大模型还可以继续提供更详细的建议,如低糖饮食、高纤维食物等。这种交互不仅真实自然,而且能够提供全面准确的信息,大大提升了用户体验。
本实施例中,大模型与小模型协同工作的多轮问答***能够有效地处理各种查询情况,提供准确、及时的回答。小模型主要负责简单的问答对匹配,而大模型则在小模型无法找到合适答案时进行补充生成。同时,***还具备结合上下文进行多轮回复的能力,使得回答更加精准和贴近实际需求。
本实施例中使用的基于词频和的文本表示学习模型进行二阶段文本召回,也可以考虑采用仅仅基于深度学习的文本召回模型。深度学习模型可以更好地理解文本的语义,对于一些语义相近但词频不高的文本,深度学习模型可以提供更准确的召回。
其他实施例中,还可以使用基于知识图谱的文本理解模块。相比于基于多层意图实体分析和BERT向量化的文本理解模块,可以考虑使用基于知识图谱的文本理解模块。知识图谱可以更好地理解和表示复杂的实体关系,对于一些涉及多个实体和关系的问题,知识图谱可以提供更准确的解析。
其他实施例中,还可以使用基于强化学习的排序算法。相比于基于编辑距离、文本相似度、意图实体匹配的综合排序算法,可以考虑使用基于强化学习的排序算法。强化学习算法可以根据用户的反馈和行为,自动调整排序策略,对于一些用户需求和行为变化较大的场景,强化学习算法可以提供更灵活的排序。例如,假设***发现用户在询问关于药物副作用的问题时,更倾向于选择包含具体药物名称和详细副作用描述的答案,那么***就可以自动调整排序算法,提高这类答案的权重。这样,当下一次用户再次询问类似问题时,***就可以提供更符合用户需求的答案。这种自我学习和优化的能力,大大提升了***的用户体验和满意度。
本实施例能够针对传统院务问答***回复率低,交互不自然、问答库覆盖率不足等问题,提出了一种基于症状序列生成和强化学习微调的自动诊断模型方案,当文本匹配度高时,小模型可以快速准确地提供答案;当小模型无法提供满意答案时,大模型可以补充生成答案,从而有效提升了回答的覆盖率,无论问题的复杂度如何,都能得到满意的答复文本,从而提升了用户体验。
并且,使用大模型进行自动问答对构建,这种方式可以大大解放人力,提升知识利用效率。通过大模型的生成能力,可以自动产生新的问答对,从而扩充问答库,提升问答库的覆盖率。
并且,通过召回生成,可以根据用户问题和对话历史生成最相关的答案,通过多轮问答,可以模拟真实的对话场景,使得交互更加自然,从而提升大模型回复的真实性和交互的自然性。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的答复文本生成方法的答复文本生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个答复文本生成装置实施例中的具体限定可以参见上文中对于答复文本生成方法的限定,在此不再赘述。
在一个实施例中,如图14所示,提供了一种答复文本生成装置1400,包括:问题文本显示模块1402、第一答复文本显示模块1404和第二答复文本显示模块1406,其中:
问题文本显示模块1402,用于显示问答界面,在问答界面显示输入的问题文本消息;问题文本消息包含问题文本,用于触发通过第一问答模型识别问题文本的语义信息。
第一答复文本显示模块1404,用于当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,在问答界面中,针对问题文本消息,显示包含从至少一个答复文本中选择的第一答复文本的第一答复文本消息。
第二答复文本显示模块1406,用于当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于问题文本和合并文本进行文本生成得到。
本实施例中,通过显示问答界面,在问答界面以消息形式显示用户输入的问题文本,该问题文本用于触发通过第一问答模型识别问题文本的语义信息,使得当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,可直接从已有的答复文本中选择第一答复文本,从而在问答界面中显示包含第一答复文本的第一答复文本消息。当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,表示知识库中不存在能够解答用户的问题的答复文本,则基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本,以通过第二问答模型,基于问题文本和合并文本进行文本生成第二答复文本,使得在第一问答模型无法解答用户的问题的情况下,能够使用第二问答模型实时生成第二答复文本。并且,所生成的第二答复文本是基于第一问题模型筛选出的多个答复文本和问题文本生成的,使得所生成的第二答复文本更准确。
在一个实施例中,第一答复文本显示模块1404,还用于当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息,在问答界面中,针对问题文本消息,显示包含第一答复文本的第一答复文本消息;上文文本消息包含问题文本的上文文本,第一答复文本是基于上文文本从至少一个答复文本中选择的。
本实施例中,当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,且问题文本消息在问答界面中存在上文文本消息,将上文文本作为选择本次的答复文本的提示,能够结合多轮问答的信息更准确地筛选出第一答复文本。
在一个实施例中,第二答复文本显示模块1406,还用于当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;上文文本消息包含问题文本的上文文本,第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于上文文本、问题文本和合并文本进行文本生成得到。
在其中一个实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息,包括:
当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息或下文文本消息中的至少一种,在问答界面中,针对问题文本消息,显示包含第二答复文本的第二答复文本消息;上文文本消息包含问题文本的上文文本,下文文本消息包含问题文本的下文文本,第二答复文本,是基于知识库中与问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于上文文本或下文文本中的至少一种、以及问题文本和合并文本进行文本生成得到。
本实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,且问题文本消息在问答界面中存在上文文本消息,将上文文本作为第二问答模型本次生成答复文本的提示信息,以结合问题文本和合并文本更准确地生成第二答复文本。将多轮问答的信息作为答复文本生成的提示信息,能够更准确地预测用户意图,从而促使第二问答模型生成更符合用户意图的第二答复文本。
在一个实施例中,该装置还包括:
控件显示模块,用于在问答界面显示针对第一答复文本消息的多个反馈控件;
调整模块,用于响应于针对反馈控件触发的反馈操作,基于第一答复文本消息包含的第一答复文本,调整第一问答模型,其中,多个反馈控件触发的反馈操作表征相反的反馈结果,用于对第一问答模型进行相反的调整。
本实施例中,在问答界面显示针对第一答复文本消息的多个反馈控件,响应于针对反馈控件触发的反馈操作,基于第一答复文本消息包含的第一答复文本,调整第一问答模型,其中,多个反馈控件触发的反馈操作表征相反的反馈结果,用于对第一问答模型进行相反的调整,从而能够根据用户的反馈行为,自动调整第一问答模型的排序策略,对于一些用户需求和行为变化较大的场景,强化学习算法可以提供更灵活的排序。
在一个实施例中,多个反馈控件,包括表征已解答问题文本的反馈控件和表征未解答问题文本的反馈控件;
调整模块,还用于响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第一类调整;响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本消息包含的第一答复文本,对第一问答模型进行第二类调整,第一类调整与第二类调整相反。
本实施例中,响应于针对表征已解答问题文本的反馈控件的反馈操作,基于第一答复文本对第一问答模型进行第一类调整,以增大第一问答模型针对第一答复文本的排序权重,使得后续出现与该问题文本相似的问题时,能够提高输出第一答复文本的概率。响应于针对表征未解答问题文本的反馈控件的反馈操作,基于第一答复文本对第一问答模型进行第二类调整,以减小第一问答模型针对第一答复文本的排序权重,使得后续出现与该问题文本相似的问题时,能够降低输出第一答复文本的概率。本实施例能够根据用户的反馈行为,自动调整第一问答模型的排序策略,使得第一问答模型能够输出更符合用户需求的答复文本。
在一个实施例中,问题文本显示模块1402,还用于在问答界面显示文本编辑区域;响应于在文本编辑区域触发的文本编辑事件,在问答界面显示包含编辑获得的问题文本的问题文本消息。
本实施例中,在问答界面显示文本编辑区域,以给用户提供文本编辑功能。响应于在文本编辑区域触发的文本编辑事件,在问答界面显示包含编辑获得的问题文本的问题文本消息,能够以消息形式在问答界面显示用户的问题。
在一个实施例中,问题文本显示模块1402,还用于在问答界面显示语音输入控件;响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息。
本实施例中,在问答界面显示语音输入控件,以给用户提供语音输入功能,便于用户通过语音快速输入需要咨询的问题。响应于针对语音输入控件触发的语音输入事件,在问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息,能够将用户语音输入的问题以文本形式在问答界面中显示,便于用户查看自己输入的问题是否准确。
在一个实施例中,问题文本显示模块1402,还用于在问答界面,显示至少一个关联问题文本消息,关联问题文本消息包含与问题文本相关联的关联问题文本。
本实施例中,在问答界面,显示至少一个关联问题文本消息,该关联问题文本消息包含与问题文本相关联的关联问题文本,从而能够显示与用户咨询的问题相关的其他问题,以为用户提供进一步的解答。
在一个实施例中,该装置还包括:
获取模块,用于获取问题文本,通过第一问答模型识别问题文本的语义信息;
确定模块,用于通过第一问答模型,确定知识库的每个答复文本与语义信息之间的相似度;
召回模块,用于当知识库中存在与语义信息相似度达到相似度阈值的至少一个答复文本,通过第一问答模型,从知识库中召回至少一个答复文本;
选择模块,用于通过第一问答模型,从召回的至少一个答复文本中选择第一答复文本。
在一个实施例中,语义信息通过问题文本中的意图实体或关键词中的至少一种表征,知识库中包括多个问答对,问答对包含候选问题文本和答复文本;确定模块,还用于当问题文本中存在意图实体,通过第一问答模型,确定问答对包含的候选问题文本中的预设意图实体和问题文本中的意图实体之间的相似度;当问题文本中不存在预设意图实体,确定问题文本的关键词;基于关键词分别在问题文本和候选问题文本中的词频,确定问题文本和候选问题文本之间的相似度;
选择模块,还用于通过第一问答模型,基于召回的问答对包含的候选问题文本和问题文本之间的编辑距离,从召回的问答对包含的答复文本中选择第一答复文本。
在一个实施例中,召回模块,还用于当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,通过第一问答模型,从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本;
合并模块,用于基于多个答复文本生成合并文本;
生成模块,用于通过第二问答模型,基于问题文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
本实施例中,生成模块,还用于通过第二问答模型,对问题文本提取文本语义特征,获得问题文本语义特征;通过第二问答模型,对合并文本提取文本语义特征,获得合并文本语义特征;通过第二问答模型,基于问题文本语义特征和合并文本语义特征进行文本生成,获得第二答复文本。
本实施例中,当知识库中的任一答复文本与语义信息的相似度低于相似度阈值,表示知识库中不存在能够解答用户的问题的答复文本。从知识库召回与问题文本的相似度满足基本相似条件的多个答复文本,基于多个答复文本生成合并文本,以通过第二问答模型,基于问题文本和合并文本进行文本生成第二答复文本,使得在第一问答模型无法解答用户的问题的情况下,能够使用第二问答模型实时生成第二答复文本。并且,所生成的第二答复文本是基于第一问题模型筛选出的多个答复文本和问题文本生成的,使得所生成的第二答复文本更准确。
在一个实施例中,合并模块,还用于提取多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示;基于每个文本特征的文本特征表示,将多个答复文本进行合并,获得合并文本,合并文本表达的语义信息,多于多个答复文本所表达的语义信息。
本实施例中,提取多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示,以基于每个文本特征的文本特征表示,将多个答复文本合并为一个文本,使得合并文本表达的语义信息,多于多个答复文本所表达的语义信息,以为第二问答模型生成答复文本提供更多参考信息,使得生成的第二答复文本能够解答用户的问题。
在一个实施例中,生成模块,还用于基于问题文本的语义信息,识别问题文本所属的领域;确定与问题文本所属的领域对应的第二问答模型,通过第二问答模型,基于问题文本和合并文本进行文本生成,获得第二答复文本。
本实施例中,基于问题文本的语义信息,识别问题文本所属的领域,从而能够确定所要使用的第二问答模型。通过第二问答模型,基于问题文本和合并文本进行文本生成,能够准确获得解答用户问题的第二答复文本。
在一个实施例中,生成模块,还用于获取问题文本的上文文本,上文文本包括在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种;通过第二问答模型,基于问题文本、上文文本和合并文本进行文本生成,获得针对问题文本的第二答复文本。
在一个实施例中,生成模块,还用于通过第二问答模型,分别对问题文本、上文文本和合并文本进行文本语义特征提取;
通过第二问答模型,基于问题文本的文本语义特征、上文文本的文本语义特征和合并文本的文本语义特征进行文本生成,获得第二答复文本。
本实施例中,将在问题文本之前的问题文本或在问题文本之前的第二答复文本中的至少一种作为上文文本,使得第二问答模型基于多轮问答的信息更准确地预测用户意图,从而基于问题文本、上文文本和合并文本生成更符合用户意图的第二答复文本。
在一个实施例中,该装置还包括:
添加模块,用于获取针对第二答复文本的反馈结果;当反馈结果表征第二答复文本对问题文本的解答通过,将问题文本和第二答复文本构建为问答对;将问答对添加到第二问答模型对应的问答库中。
在一个实施例中,添加模块,还用于将问题文本和第二答复文本构建为问答对,并将问答对添加到第二问答模型对应的问答库中。
在一个实施例中,添加模块,还用于对问题文本和第二答复文本进行验证;当验证通过,将问题文本和第二答复文本构建为问答对,并将问答对添加到第二问答模型对应的问答库中。
本实施例中,获取针对第二答复文本的反馈结果,当反馈结果表征第二答复文本对问题文本的解答通过,表示该第二答复文本能够解决用户的问题,则将问题文本和第二答复文本构建为问答对,并添加到第二问答模型对应的问答库中,从而能够自动扩充第二问答模型的问答库。
上述答复文本生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端或服务器。以终端为例,其内部结构图可以如图15所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种答复文本生成方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (20)

1.一种答复文本生成方法,其特征在于,所述方法包括:
显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
2.根据权利要求1所述的方法,其特征在于,所述当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息,包括:
当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,且所述问题文本消息在所述问答界面中存在上文文本消息,在所述问答界面中,针对所述问题文本消息,显示包含第一答复文本的第一答复文本消息;所述上文文本消息包含所述问题文本的上文文本,所述第一答复文本是基于所述上文文本从所述至少一个答复文本中选择的。
3.根据权利要求1所述的方法,其特征在于,所述当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息,包括:
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,且所述问题文本消息在所述问答界面中存在上文文本消息,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述上文文本消息包含所述问题文本的上文文本,所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述上文文本、所述问题文本和所述合并文本进行文本生成得到。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述问答界面显示针对所述第一答复文本消息的多个反馈控件;
响应于针对所述反馈控件触发的反馈操作,基于所述第一答复文本消息包含的第一答复文本,调整所述第一问答模型,其中,所述多个反馈控件触发的反馈操作表征相反的反馈结果,用于对所述第一问答模型进行相反的调整。
5.根据权利要求4所述的方法,其特征在于,所述多个反馈控件,包括表征已解答所述问题文本的反馈控件和表征未解答所述问题文本的反馈控件;
所述响应于针对所述反馈控件触发的反馈操作,基于所述第一答复文本消息包含的第一答复文本,调整所述第一问答模型,包括:
响应于针对所述表征已解答所述问题文本的反馈控件的反馈操作,基于所述第一答复文本消息包含的所述第一答复文本,对所述第一问答模型进行第一类调整;
响应于针对所述表征未解答所述问题文本的反馈控件的反馈操作,基于所述第一答复文本消息包含的所述第一答复文本,对所述第一问答模型进行第二类调整,所述第一类调整与所述第二类调整相反。
6.根据权利要求1所述的方法,其特征在于,所述在所述问答界面显示输入的问题文本消息,包括:
在所述问答界面显示文本编辑区域;
响应于在所述文本编辑区域触发的文本编辑事件,在所述问答界面显示包含编辑获得的问题文本的问题文本消息。
7.根据权利要求1所述的方法,其特征在于,所述在所述问答界面显示输入的问题文本消息,包括:
在所述问答界面显示语音输入控件;
响应于针对所述语音输入控件触发的语音输入事件,在所述问答界面显示包含由输入的语音转换获得的问题文本的问题文本消息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述问答界面,显示至少一个关联问题文本消息,所述关联问题文本消息包含与所述问题文本相关联的关联问题文本。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取问题文本,通过第一问答模型识别所述问题文本的语义信息;
通过所述第一问答模型,确定知识库的每个答复文本与所述语义信息之间的相似度;
当所述知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,通过所述第一问答模型,从所述知识库中召回所述至少一个答复文本;
通过所述第一问答模型,从召回的所述至少一个答复文本中选择第一答复文本。
10.根据权利要求9所述的方法,其特征在于,所述语义信息通过所述问题文本中的意图实体或关键词中的至少一种表征,所述知识库中包括多个问答对,所述问答对包含候选问题文本和答复文本;所述通过所述第一问答模型,确定知识库的每个答复文本与所述语义信息之间的相似度,包括:
当所述问题文本中存在意图实体,通过所述第一问答模型,确定所述问答对包含的候选问题文本中的预设意图实体和所述问题文本中的意图实体之间的相似度;
当所述问题文本中不存在所述预设意图实体,确定所述问题文本的关键词;
基于所述关键词分别在所述问题文本和所述候选问题文本中的词频,确定所述问题文本和所述候选问题文本之间的相似度;
所述通过所述第一问答模型,从召回的所述至少一个答复文本中选择第一答复文本,包括:
通过所述第一问答模型,基于召回的所述问答对包含的候选问题文本和所述问题文本之间的编辑距离,从召回的所述问答对包含的答复文本中选择第一答复文本。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,通过所述第一问答模型,从所述知识库召回与所述问题文本的相似度满足基本相似条件的多个答复文本;
基于所述多个答复文本生成合并文本;
通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本。
12.根据权利要求11所述的方法,其特征在于,所述基于所述多个答复文本生成合并文本,包括:
提取所述多个答复文本各自的文本特征,并确定每个文本特征的文本特征表示;
基于所述每个文本特征的文本特征表示,将所述多个答复文本进行合并,获得合并文本,所述合并文本表达的语义信息,多于所述多个答复文本所表达的语义信息。
13.根据权利要求11所述的方法,其特征在于,所述通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本,包括:
基于所述问题文本的语义信息,识别所述问题文本所属的领域;
确定与所述问题文本所属的领域对应的第二问答模型,通过所述第二问答模型,基于所述问题文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本。
14.根据权利要求11所述的方法,其特征在于,所述通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本,包括:
获取所述问题文本的上文文本,所述上文文本包括在所述问题文本之前的问题文本或在所述问题文本之前的第二答复文本中的至少一种;
通过所述第二问答模型,基于所述问题文本、所述上文文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本。
15.根据权利要求14所述的方法,其特征在于,所述通过所述第二问答模型,基于所述问题文本、所述上文文本和所述合并文本进行文本生成,获得针对所述问题文本的第二答复文本,包括:
通过所述第二问答模型,分别对所述问题文本、所述上文文本和所述合并文本进行文本语义特征提取;
通过所述第二问答模型,基于所述问题文本的文本语义特征、所述上文文本的文本语义特征和所述合并文本的文本语义特征进行文本生成,获得第二答复文本。
16.根据权利要求1至15任意一项所述的方法,其特征在于,所述方法还包括:
获取针对所述第二答复文本的反馈结果;
当所述反馈结果表征所述第二答复文本对所述问题文本的解答通过,将所述问题文本和所述第二答复文本构建为问答对;
将所述问答对添加到所述第二问答模型对应的问答库中。
17.一种答复文本生成装置,其特征在于,所述装置包括:
问题文本显示模块,用于显示问答界面,在所述问答界面显示输入的问题文本消息;所述问题文本消息包含问题文本,用于触发通过第一问答模型识别所述问题文本的语义信息;
第一答复文本显示模块,用于当知识库中存在与所述语义信息相似度达到相似度阈值的至少一个答复文本,在所述问答界面中,针对所述问题文本消息,显示包含从所述至少一个答复文本中选择的第一答复文本的第一答复文本消息;
第二答复文本显示模块,用于当所述知识库中的任一答复文本与所述语义信息的相似度低于所述相似度阈值,在所述问答界面中,针对所述问题文本消息,显示包含第二答复文本的第二答复文本消息;所述第二答复文本,是基于所述知识库中与所述问题文本的相似度满足基本相似条件的多个答复文本生成合并文本后,通过第二问答模型,基于所述问题文本和所述合并文本进行文本生成得到。
18.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至16中任一项所述的方法的步骤。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至16中任一项所述的方法的步骤。
20.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至16中任一项所述的方法的步骤。
CN202410033722.0A 2024-01-08 2024-01-08 答复文本生成方法、装置、计算机设备和可读存储介质 Pending CN117786086A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410033722.0A CN117786086A (zh) 2024-01-08 2024-01-08 答复文本生成方法、装置、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410033722.0A CN117786086A (zh) 2024-01-08 2024-01-08 答复文本生成方法、装置、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN117786086A true CN117786086A (zh) 2024-03-29

Family

ID=90381674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410033722.0A Pending CN117786086A (zh) 2024-01-08 2024-01-08 答复文本生成方法、装置、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN117786086A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118052221A (zh) * 2024-04-16 2024-05-17 腾讯科技(深圳)有限公司 文本处理方法、装置、设备、存储介质及产品
CN118132731A (zh) * 2024-05-06 2024-06-04 杭州数云信息技术有限公司 对话方法及装置、存储介质、终端、计算机程序产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118052221A (zh) * 2024-04-16 2024-05-17 腾讯科技(深圳)有限公司 文本处理方法、装置、设备、存储介质及产品
CN118132731A (zh) * 2024-05-06 2024-06-04 杭州数云信息技术有限公司 对话方法及装置、存储介质、终端、计算机程序产品

Similar Documents

Publication Publication Date Title
US20210232762A1 (en) Architectures for natural language processing
Liang et al. Multibench: Multiscale benchmarks for multimodal representation learning
US10534863B2 (en) Systems and methods for automatic semantic token tagging
CN111753198B (zh) 信息推荐方法和装置、以及电子设备和可读存储介质
Nie et al. Data-driven answer selection in community QA systems
US20210256543A1 (en) Predictive Analytics Diagnostic System and Results on Market Viability and Audience Metrics for Scripted Media
CN112163165A (zh) 信息推荐方法、装置、设备及计算机可读存储介质
US11023503B2 (en) Suggesting text in an electronic document
CN117786086A (zh) 答复文本生成方法、装置、计算机设备和可读存储介质
US12020267B2 (en) Method, apparatus, storage medium, and device for generating user profile
KR20200047006A (ko) 머신 러닝 기반의 근사모델 구축 방법 및 시스템
CN117523275A (zh) 基于人工智能的属性识别方法及属性识别模型训练方法
CN111242710A (zh) 业务的分类处理方法、装置、服务平台及存储介质
Jing et al. Knowledge-enhanced attentive learning for answer selection in community question answering systems
US20190295110A1 (en) Performance analytics system for scripted media
Wei et al. Online education recommendation model based on user behavior data analysis
CN116578729B (zh) 内容搜索方法、装置、电子设备、存储介质和程序产品
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
Ruichen [Retracted] The Basic Principles of Marxism with the Internet as a Carrier
Wang Spring festival holiday tourism data mining based on the deep learning model
US11914844B2 (en) Automated processing and dynamic filtering of content for display
Cheng Design of the college students’ music big data management system based on computer assistance
Ng Predicting energy consumption pattern based on top trending videos YouTube 2021 using machine learning techniques
CN116975083A (zh) 信息搜索方法、装置、计算机设备和存储介质
WO2020251580A1 (en) Performance analytics system for scripted media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication