CN116932710A - 一种人机对话方法、***及相关装置 - Google Patents

一种人机对话方法、***及相关装置 Download PDF

Info

Publication number
CN116932710A
CN116932710A CN202310678656.8A CN202310678656A CN116932710A CN 116932710 A CN116932710 A CN 116932710A CN 202310678656 A CN202310678656 A CN 202310678656A CN 116932710 A CN116932710 A CN 116932710A
Authority
CN
China
Prior art keywords
current
content
historical
reply
current demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310678656.8A
Other languages
English (en)
Inventor
程坤
刘聪
潘青华
郭松矗
于继栋
严亚路
赵明路
胡国平
高建清
王士进
魏思
刘权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202310678656.8A priority Critical patent/CN116932710A/zh
Publication of CN116932710A publication Critical patent/CN116932710A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种人机对话方法、***及相关装置,该方法包括:获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果;基于所述相关性分析结果,确定所述当前轮次对应的待分析内容;其中,当所述相关性分析结果为相关时,所述待分析内容包括所述当前需求以及与所述当前需求相关的所述历史交互内容,当所述相关性分析结果为无关时,所述待分析内容包括所述当前需求;基于所述待分析内容,得到与所述当前需求匹配的目标回复。通过上述方式,本申请能够提高目标回复与用户需求的契合度。

Description

一种人机对话方法、***及相关装置
技术领域
本申请涉及人机交互技术领域,特别是涉及一种人机对话方法、***及相关装置。
背景技术
随着人机交互技术的不断发展,对话机器人能根据用户提出的需求给出相应的目标回复。其中,为了提高生成的回复与历史交互内容之间的相关性,对话机器人通常结合所有历史交互内容得到当前需求对应的目标回复。然而,该方式无法对所有历史交互内容进行筛选,以得到与当前需求相关的历史交互内容,导致对话机器人处理冗余信息,在增加计算成本的同时,对得到目标回复形成干扰。因此,对历史交互内容进行有效筛选,并提高目标回复与用户当前需求的契合度,成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种人机对话方法***以及相关装置,能够提高目标回复与用户需求的契合度。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种人机对话方法,包括:获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果;基于所述相关性分析结果,确定所述当前轮次对应的待分析内容;其中,当所述相关性分析结果为相关时,所述待分析内容包括所述当前需求以及与所述当前需求相关的所述历史交互内容,当所述相关性分析结果为无关时,所述待分析内容包括所述当前需求;基于所述待分析内容,得到与所述当前需求匹配的目标回复。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种人机对话***,包括:分析模块,用于获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果;处理模块,用于基于所述相关性分析结果,确定所述当前轮次对应的待分析内容;其中,当所述相关性分析结果为相关时,所述待分析内容包括所述当前需求以及与所述当前需求相关的所述历史交互内容,当所述相关性分析结果为无关时,所述待分析内容包括所述当前需求;回复模块,用于基于所述待分析内容,得到与所述当前需求匹配的目标回复。
为解决上述技术问题,本申请采取的又一个技术方案是:提供一种移动终端,包括:显示屏、存储器和处理器,所述显示屏和所述存储器分别耦接于所述处理器,所述显示屏至少用于向用户展示内容以及供用户输入或选择内容,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现如上述技术方案中提到的人机对话方法。
为解决上述技术问题,本申请采取的又一个技术方案是:提供一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如上述技术方案中提到的人机对话方法。
本申请的有益效果是:区别于现有技术的情况,本申请提出的人机对话方法,在获取到用户当前轮次的当前需求后,对当前需求以及至少部分轮次的历史交互内容进行相关性分析,以得到相关性分析结果。从而根据该相关性分析结果确定是否存在与当前需求相关的历史交互内容。若存在,则结合相关的历史交互内容得到与目标回复,使得目标回复与当前需求契合度较高的同时,也避免了在得到目标回复过程中无关历史交互内容的干扰,提高了获得目标回复的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请人机对话方法一实施方式的流程示意图;
图2是步骤S101对应一实施方式的流程示意图;
图3是本申请人机对话方法一实施方式的示意图;
图4是步骤S103对应一实施方式的流程示意图;
图5是本申请人机对话方法另一实施方式的流程示意图;
图6是本申请人机对话***一实施方式的结构示意图;
图7是本申请移动终端一实施方式的结构示意图;
图8是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文中术语“***”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
本申请提出的人机对话方法依托于对话机器人实现的,并且,该对话机器人可以是智能终端上的应用或者至少集成有文本处理功能的智能终端。其中,上述智能终端可以为手机、平板电脑或个人电脑等设备。
请参阅图1,图1是本申请人机对话方法一实施方式的流程示意图,该方法包括:
S101:获取当前轮次的当前需求,利用智能分析模型对当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果。
在一实施方式中,步骤S101包括:获取用户输入的当前轮次的当前需求。其中,当前需求可以是根据用户输入的语音指令,也可以是用户手动输入的文本指令。
在一实施场景中,响应于当前需求为用户输入的语音指令,获取该语音指令,对该语音指令进行语音识别以得到对应的转换文本,并将该转换文本作为当前轮次的当前需求。或者,响应于当前需求为输入的文本指令,将该文本指令对应的文本作为当前轮次的当前需求。
需要说明的是,在实际应用中,与用户进行对话的过程中,包括用户提出的多个轮次的需求以及输出的与用户的需求匹配的回复,将用户最新提出的需求作为当前需求,以及将当前需求之前的需求作为历史需求,每个历史需求匹配有相应的历史回复。
进一步地,请参阅图2,图2为步骤S101对应一实施方式的流程示意图。步骤S101具体还包括:
S201:将当前需求及其之前的至少部分轮次的历史交互内容输入至智能分析模型,得到当前需求对应的当前主题,以及至少部分轮次的历史交互内容对应的至少一个历史主题。
在一实施方式中,步骤S201的实施过程包括:将未包括屏蔽标识的历史交互内容作为可用交互内容。其中,可用交互内容至少包括上一轮次的历史交互内容。
具体地,在获取到用户输入的当前需求之后,将当前需求上一轮次的历史交互内容作为相邻历史内容;并且,响应于历史交互内容中至少部分与上述相邻历史内容相关,则将相邻历史内容以及与该相邻历史内容相关的历史交互内容作为可用交互内容。其中,上述可用交互内容不包括屏蔽标识。
需要说明的是,上述屏蔽标识用于在后续生成目标回复的过程中屏蔽对应的历史交互内容,以避免带有屏蔽标识的历史交互内容对生成的目标回复时造成干扰。另外,对历史交互内容添加或移除屏蔽标识的过程可参照后续对应实施方式。
在一具体实施场景中,请参阅图3,图3为本申请人机对话方法一实施方式的示意图。获取用户当前轮次的当前需求40后,将当前需求40上一轮次的第一历史需求30以及匹配的第一历史回复31作为可用交互内容。由于第一历史需求30是用户在上一轮次的第二历史需求20的基础上追加的需求条件,因此第一历史需求30与上一轮次的第二历史需求20相关。另外,响应于第二历史需求20与上一轮次的第三历史需求10无关,在本具体实施场景中,将第一历史需求30及其匹配的第一历史回复31以及第二历史需求20及其匹配的第二历史回复21作为可用交互内容。
进一步地,将当前需求和可用交互内容输入至智能分析模型,并要求智能分析模型输出当前需求对应的当前主题,以及可用交互内容对应的历史主题。
在一实施场景中,上述智能分析模型为具备较优的语言理解能力以及文本生成能力的大语言模型,将当前需求和可用交互内容提供给大语言模型,并要求大语言模型对当前需求和可用交互内容进行语义分析以输出当前需求对应的当前主题以及可用交互内容对应的至少一个历史主题。
在一具体应用场景中,上述大语言模型为生成式预训练Transformer模型(Generative Pre-Training,GPT)。
S202:基于当前主题和至少一个历史主题,确定相关性分析结果。
在一实施方式中,步骤S202的实施过程包括:将当前需求对应的当前主题与历史交互内容对应的至少一个历史主题进行比较,确定相关性分析结果。其中,该相关性分析结果包括相关或无关。
在一实施场景中,响应于历史交互内容包括可用交互内容,首先将当前需求对应的当前主题与可用交互内容对应的历史主题进行比较。响应于当前主题与可用交互内容对应的历史主题一致,判定当前需求与至少部分历史交互内容相关,且未发生主题切换;即确定相关性分析结果为与可用交互内容相关,后续需要结合可用交互内容得到当前需求对应的目标回复,以使得目标回复与用户的当前需求的契合度较高。
在另一实施场景中,响应于当前主题与可用交互内容对应的历史主题相互区别,判定发生主题切换,获取至少部分轮次包括屏蔽标识的历史交互内容作为参考交互内容,将所有参考交互内容输入至智能分析模型,得到所有参考交互内容对应的至少一个参考主题。
具体地,响应于当前需求发生了主题的切换,此时需要判断当前需求对应的当前主题是否与可用交互内容之前的至少部分历史交互内容相关。获取当前需求对应的当前时间戳,将当前时间戳之前预设时间长度内所有包括屏蔽标识的历史交互内容作为参考交互内容,并利用智能分析模型得到参考交互内容对应的至少一个参考主题。例如,响应于上述预设时间长度为2小时,则将距离当前时间戳两个小时内所有包括屏蔽标识的历史交互内容作为参考交互内容。其中,上述预设时间长度也可以为其他,具体可以根据实际需求进行设置,本申请对此不作限定。
可选地,将当前轮次之前第一预设数值个轮次的包括屏蔽标识的历史交互内容作为参考交互内容。例如,响应于上述第一预设数值为十,则将当前需求对应的当前轮次之前十个轮次内包括屏蔽标识对的历史交互内容作为参考交互内容。又或者,当前轮次之前且与当前轮次最邻近的第二预设数值个包括屏蔽标识的历史交互内容作为参考交互内容。例如,响应于上述第二预设数值为五,则以距离当前轮次由近至远的顺序,依次获得当前轮次之前的五个包括屏蔽标识的历史交互内容,以作为参考交互内容。需要说明的是,上述第一预设数值和第二预设数值的具体数值可以根据实际情况进行设置,本申请对此不作限定。
在一具体实施场景中,请继续参阅图3,由于当前需求40对应的当前主题为第一主题,可用交互内容包括的第一历史需求30、第一历史回复31、第二历史需求20和第二历史回复21对应的历史主题为区别于第一主题的第二主题,即当前需求发生主题的切换。此时,将可用交互内容之前轮次的历史交互内容第三历史需求10以及匹配的第三历史回复11作为参考交互内容,并利用智能分析模型获取参考交互内容对应的参考主题。
进一步地,响应于当前主题与任一参考主题一致,判定当前需求与至少部分历史交互内容相关,即确定的相关性分析结果为与当前主题一致的各轮次参考交互内容相关;同时移除与当前主题一致的各轮次参考交互内容的屏蔽标识,并为可用交互内容添加屏蔽标识。
具体地,请继续参阅图3,响应于参考交互内容中的第三历史需求10和第三历史回复11对应的参考主题为第一主题,即与当前需求40对应的当前主题一致,则判定当前需求40与第三历史需求10和第三历史回复11相关,并将第三历史需求10和第三历史回复11的屏蔽标识移除;以及,将可用交互内容添加屏蔽标识,即将第一历史需求30、第一历史回复31、第二历史需求20和第二历史回复21添加屏蔽标识。
或者,响应于当前主题与所有参考主题相互区别,判定当前需求与历史交互内容无关,即确定相关性分析结果为与所有交互内容无关,并为可用交互内容添加屏蔽标识。
上述方案可以使得后续仅根据未标注有屏蔽标识的历史交互内容以及当前需求,生成当前需求对应的目标回复,避免结合所有历史交互内容,在节省计算成本的同时,避免了无关信息对获得目标回复的干扰,提高了获得目标回复的准确性。
S102:基于相关性分析结果,确定当前轮次对应的待分析内容。其中,当相关性分析结果为相关时,待分析内容包括当前需求以及与当前需求相关的历史交互内容,当相关性分析结果为无关时,待分析内容包括当前需求。
在一实施场景中,响应于相关性分析结果为相关,即当前需求与至少部分轮次的历史交互内容相关,将当前需求以及与当前需求相关的历史交互内容作为当前轮次对应的待分析内容。
在另一实施场景中,响应于相关性分析结果为无关,即当前需求与所有轮次的历史交互内容都无关,则将仅将当前需求作为待分析内容。
S103:基于待分析内容,得到与当前需求匹配的目标回复。
在一实施方式中,请参阅图4,图4为步骤S103对应一实施方式的流程示意图。步骤S103具体包括:
S301:将待分析内容输入至智能分析模型,得到智能分析模型输出的第一候选回复;以及,基于待分析内容,对回复内容进行预估,得到第二候选回复。
在一实施场景中,响应于相关性分析结果为相关,将当前需求以及当前需求相关的历史交互内容输入至智能分析模型,得到智能分析模型输出的第一候选回复,基于当前需求以及与当前需求相关的历史交互内容,对回复内容进行预估,得到第二候选回复。
在一具体实施场景中,对话机器人包括回复预估模型。在确定待分析内容后,回复预估模型通过对待分析内容进行语义分析,并结合相关数据,生成与当前需求匹配的第二候选回复。上述相关数据可以是预先存储的与用户相关的信息数据,也可以是通过网络获取到的与当前需求相关的信息数据。其中,上述回复预估模型是利用多个训练数据进行训练获得的,该训练数据包括标注有回复标签的训练需求;另外,该回复预估模型的具体结构可参照现有的语义分析模型结构,本申请对此不进行详细阐述。
在另一实施场景中,响应于相关性分析结果为无关,将当前需求输入至智能分析模型,得到智能分析模型输出的第一候选回复,基于当前需求对回复内容进行预估,得到第二候选回复。与上述实施场景不同的是,由于相关分析结果为无关,在得到当前需求对应的目标回复时无需结合历史交互内容。其中,本场景下第一候选回复以及第二候选回复的生成过程可参照上述实施场景。
S302:基于第一候选回复和第二候选回复,得到目标回复。
在一实施方式中,步骤S302的实施过程包括:将当前需求对应的当前主题、第一候选回复和第二候选回复,输入至智能分析模型,以要求智能分析模型从第一候选回复和第二候选回复中选择与当前需求契合度更高的回复,作为目标回复。在得到智能分析模型输出的目标回复后,将该目标回复在展示界面向用户进行展示。
在一实施场景中,使得智能分析模型根据当前主题,确定第一候选回复和第二候选回复分别与当前主题的相关度得分。响应于第一候选回复对应的相关度得分大于第二候选回复对应的相关度得分,则智能分析模型将第一候选回复输出以作为目标回复。或者,响应于第一候选回复对应的相关度得分小于第二候选回复对应的相关度得分,则智能分析模型将第二候选回复输出以作为目标回复。又或者,响应于第一候选回复对应的相关度得分与第二候选回复对应的相关度得分相同,则任意选取第一候选回复或第二候选回复作为目标回复。
在又一实施场景中,在将当前主题、第一候选回复和第二候选回复输入至智能分析模型后,使得智能分析模型根据当前需求,确定第一候选回复和第二候选回复分别与当前需求之间的契合度得分,并将最大契合度得分对应的回复作为目标回复。
在又一实施场景中,由于智能分析模型的语言理解能力以及文本生成能力优于对话机器人,而对话机器人在于用户交互过程中存储有与用户相关的用户信息。在将当前主题、第一候选回复和第二候选回复输入至智能分析模型后,智能分析模型将当前主题与历史主题进行比较。若当前主题与任一历史主题一致,即当前需求与至少部分历史交互内容相关,此时智能分析模型采用其输出的第一候选答复作为目标答复,以保证最终得到的目标答复与用户的当前需求的契合度更高。若当前主题与任一历史主题相互区别,即当前需求与所有历史交互内容无关,此时智能分析模型将第二候选答复作为目标答复,以使得得到的目标答复与用户信息的契合度更高。
本申请提出的人机对话方法,在获取到用户当前轮次的当前需求后,对当前需求以及至少部分轮次的历史交互内容进行相关性分析,以得到相关性分析结果。从而根据该相关性分析结果确定是否存在与当前需求相关的历史交互内容。若存在,则结合相关的历史交互内容得到与目标回复,使得目标回复与当前需求契合度较高的同时,也避免了在得到目标回复过程中无关历史交互内容的干扰,提高了获得目标回复的准确性。
在另一实施方式中,请参阅图5,图5为本申请人机对话方法另一实施方式的流程示意图。本实施方式具体包括:
S401:获取当前轮次的当前需求,利用智能分析模型对当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果。
在一实施方式中,步骤S401的实施过程可参照图1中步骤S101,在此不进行详细阐述。
S402:获取与当前主题相关的所有轮次的历史交互内容对应的已交互次数,将已交互次数输入至智能分析模型。
在一实施方式中,已交互次数表示与当前主题相关的所有轮次的历史交互内容至当前需求之间,主题切换的次数。通过获取该已交互次数以表示与当前主题相关的所有轮次的历史交互内容与当前需求之间的相关度,以助于提高后续智能分析模型输出的决策指令的准确度。
在一具体实施方式中,请继续参阅图3,响应于第三历史需求10和第三历史回复11为与当前第一主题相关的历史交互内容,且该历史交互内容至当前需求40之间发生两次主题切换,则第三历史需求10和第三历史回复11对应的已交互次数为2。
可选地,在另一实施方式中,已交互次数也可以为当前需求的当前轮次与对应历史交互内容对应的轮次之间的差值。其中,响应于与当前主题相关的所有轮次的历史交互内容包括多个相邻的历史交互内容,则将当前轮次与对应历史交互内容对应轮次之间的差值的最小值,作为与当前主题相关的所有轮次的历史交互内容对应的已交互次数。
S403:获取智能分析模型基于当前主题和已交互次数输出的决策指令。其中,决策指令用于指示是否利用智能分析模型获取与当前需求匹配的目标回复。
在一实施方式中,步骤S403的实施过程包括:将已交互次数和当前主题输入至智能分析模型后,要求智能分析模型根据当前主题和已交互次数输出决策指令。
在另一实施方式中,步骤S403中决策指令也可以是对话机器人根据当前主题和已交互次数生成的,过程包括:响应于已交互次数小于次数阈值,则表明对应的历史交互内容与当前需求之间的主题切换次数较少,对应的历史交互内容与当前需求之间的相关度较高,此时生成利用智能分析模型获取目标回复的决策指令,以助于后续利用语言理解能力以及文本生成能力更优的智能分析模型得到目标回复,提高目标回复的准确度。响应于已交互次数大于或等于次数阈值,则表明对应的历史交互内容与当前需求之间的主题切换次数较多,对应的历史交互内容与当前需求之间的相关度较低,此时生成利用对话机器人自身处理器生成目标回复的决策指令,以助于后续直接利用对话机器人自身处理器得到目标回复,提高目标回复的获得效率。
S404:基于相关性分析结果,确定当前轮次对应的待分析内容。
在一实施方式中,步骤S404的实施过程包括:响应于相关性分析结果为相关,将当前需求以及与当前需求相关的历史交互内容作为当前轮次对应的待分析内容。或者,响应于相关性分析结果为无关,即当前需求与所有轮次的历史交互内容都无关,则将仅将当前需求作为待分析内容。
S405:基于待分析内容,得到与当前需求匹配的目标回复。
在一实施方式中,步骤S405的实施过程包括:基于决策指令和待分析内容,得到与当前需求匹配的目标回复。其中,决策指令包括第一标识或第二标识;当决策指令包括第一标识时,利用智能分析模型获取与当前需求匹配的目标回复,当决策指令包括第二标识时,由对话机器人自身处理器基于待分析内容得到与当前需求匹配的目标回复。
在一实施场景中,响应于相关性分析结果为相关,且决策指令包括第一标识,将当前需求以及与当前需求相关的历史交互内容输入至智能分析模型,以利用语言理解能力以及文本生成能力更优的智能分析模型输出目标回复。其中,利用智能分析模型输出目标回复的具体过程可参照上述对应实施方式,在此不进行详细阐述。
在另一实施场景中,响应于相关性分析结果为相关,且决策指令包括第二标识,基于当前需求以及与当前需求相关的历史交互内容,对回复内容进行预估,得到目标回复。
其中,利用对话机器人所包含的回复预估模型基于当前需求以及与当前需求相关的历史交互内容,得到目标回复,具体过程可参照上述对应的实施方式,在此不进行详细阐述。
在又一实施场景中,响应于相关性分析结果为无关,且决策指令包括第一标识,将当前需求输入至智能分析模型,得到智能分析模型输出的目标回复,具体过程可参照上述实施场景。
在又一实施场景中,响应于相关性分析结果为无关,且决策指令包括第二标识,基于当前需求对回复内容进行预估,得到目标回复,具体过程可参照上述实施场景。
在另一实施方式中,步骤S101中获取当前轮次的当前需求的步骤还可以包括:获取当前场景下的音频信息,基于音频信息,得到当前场景对应的转写文本。
具体地,响应于当前场景下的音频信息包括用户与其他人物之间的对话音频以及用户对于对话机器人的需求音频。基于语音识别技术对当前场景下的音频信息进行识别,得到音频信息对应的转写文本,即该转写文本中既包含用户向对话机器人提出的需求文本,也包含用户与当前场景中用户与其他人物之间的对话文本。
进一步地,将转写文本输入至智能分析模型,得到智能分析模型输出的当前轮次的当前需求。
具体地,利用智能分析模型对转写文本进行语义分析,以识别出转写文本中所包含的用户向对话机器人提出的需求,作为当前轮次的当前需求。该方式可以从复杂场景下的音频中自动识别得到用户需求,无需用户在每次提出需求之前给出相应的触发词,提高了对用户需求的识别效率。
在又一实施方式中,步骤S201的实施过程还可以包括:将当前需求及其之前的至少部分轮次的历史交互内容输入至智能分析模型,得到当前需求对应的当前主题,以及输入的历史交互内容对应的至少一个历史主题。
进一步地,响应于当前主题与任一历史主题一致,则判定当前需求与至少部分历史交互内容相关,并得到相关性分析结果为相关。或者,响应于当前主题与所有历史主题相关区别,则判定发生主题切换,并得到相关性分析结果为无关。
进一步地,基于相关性分析结果确定当前轮次对应的待分析内容,并基于待分析内容,得到与当前需求匹配的目标回复。其中,确定待分析内容以及得到目标回复的具体过程可参照上述对应实施方式,在此不进行详细阐述。
请参阅图6,图6为本申请人机对话***一实施方式的结构示意图。该人机对话***包括分析模块50、处理模块60和回复模块70。
具体而言,分析模块50用于获取当前轮次的当前需求,利用智能分析模型对当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果。
处理模块60用于基于相关性分析结果,确定当前轮次对应的待分析内容。其中,当相关性分析结果为相关时,待分析内容包括当前需求以及与当前需求相关的历史交互内容,当相关性分析结果为无关时,待分析内容包括当前需求。
回复模块70用于基于待分析内容,得到与当前需求匹配的目标回复。
在一实施方式中,分析模块50利用智能分析模型对当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果,包括:将当前需求及其之前至少部分轮次的历史交互内容输入至智能分析模型,得到当前需求对应的当前主题,以及至少部分轮次的历史交互内容对应的至少一个历史主题;基于当前主题和至少一个历史主题,确定相关性分析结果。
在一实施场景中,请继续参阅图6,本申请提出的人机对话***中,分析模块50还包括主题获取子模块51,该主题获取子模块51用于将未包括屏蔽标识的历史交互内容作为可用交互内容;其中,可用交互内容至少包括上一轮次的历史交互内容;将当前需求和可用交互内容输入至智能分析模型,得到当前需求对应的当前主题,以及可用交互内容对应的历史主题。
在另一实施场景中,请继续参阅图6,本申请提出的人机对话***中,分析模块50还包括转写子模块52,该转写子模块52用于获取当前场景下的音频信息,基于音频信息,得到当前场景下对应的转写文本;将转写文本输入至智能分析模型,得到智能分析模型输出的当前轮次的当前需求。
在一实施场景中,分析模块50基于当前主题和至少一个历史主题,确定相关性分析结果,包括:响应于当前主题与可用交互内容对应的历史主题一致,判定当前需求与至少部分历史交互内容相关,且未发生主题切换;响应于当前主题与可用交互内容对应的历史主题相互区别,判定发生主题切换,获取至少部分轮次包括屏蔽标识的历史交互内容作为参考交互内容,将所有参考交互内容输入至智能分析模型,得到所有参考交互内容对应的至少一个参考主题;响应于当前主题与任一参考主题一致,判定当前需求与至少部分历史交互内容相关,移除与当前主题一致的各轮次参考交互内容的屏蔽标识,并为可用交互内容添加屏蔽标识;响应于当前主题与所有参考主题相互区别,判定当前需求与历史交互内容无关,为可用交互内容添加屏蔽标识。
在一具体实施场景中,分析模块50获取至少分轮次包括屏蔽标识的历史交互内容作为参考交互内容,包括:获取当前需求对应的当前时间戳,将当前时间戳之前预设时间长度内所有包括屏蔽标识的历史交互内容作为参考交互内容;或者,将当前轮次之前预设数值个轮次的包括屏蔽标识的历史交互内容作为参考交互内容。
在另一实施方式中,请继续参阅图6,本申请提出的人机对话***中,还包括与回复模块70相互耦接的决策指令生成子模块71。在得到相关性分析结果之后,该决策指令生成子模块71用于获取与当前主题相关的所有轮次的历史交互内容对应的已交互次数,将已交互次数输入至智能分析模型;获取智能分析模型基于当前主题和已交互次数输出的决策指令;其中,决策指令用于指示是否利用智能分析模型获取与当前需求匹配的目标回复。
在一实施场景中,决策指令包括第一标识或第二标识,回复模块70基于待分析内容,得到与当前需求匹配的目标回复,包括:响应于相关性分析结果为相关,且决策指令包括第一标识,将当前需求以及与当前需求相关的历史交互内容输入至智能分析模型,得到智能分析模型输出的目标回复;响应于相关性分析结果为相关,且决策指令包括第二标识,基于当前需求以及与当前需求相关的历史交互内容,对回复内容进行预估,得到目标回复;响应于相关性分析结果为无关,且决策指令包括第一标识,将当前需求输入至智能分析模型,得到智能分析模型输出的目标回复;响应于相关性分析结果为无关,且决策指令包括第二标识,基于当前需求对回复内容进行预估,得到目标回复。
在又一实施方式中,回复模块70基于待分析内容,得到与当前需求匹配的目标回复,包括:响应于相关性分析结果为相关,将当前需求以及与当前需求相关的历史交互内容输入至智能分析模型,得到智能分析模型输出的第一候选回复,基于当前需求以及与当前需求相关的历史交互内容,对回复内容进行预估,得到第二候选回复;响应于相关性分析结果为无关,将当前需求输入至智能分析模型,得到智能分析模型输出的第一候选回复,基于当前需求对回复内容进行预估,得到第二候选回复;基于第一候选回复和第二候选回复,得到目标回复。
在一实施场景中,回复模块70基于第一候选回复和第二候选回复,得到目标回复,包括:将当前主题、第一候选回复和第二候选回复,输入至智能分析模型,得到智能分析模型输出的目标回复。
请参阅图7,图7为本申请移动终端一实施方式的结构示意图。该移动终端包括:显示屏80、存储器90和处理器100。显示屏80和存储器90分别耦接于处理器100,显示屏80至少用于向用户展示内容以及供用户输入或选择内容,存储器90中存储有程序指令,处理器100用于执行程序指令以实现上述任一实施方式中提到的人机对话方法。具体地,电子设备包括但不限于:台式计算机、笔记本电脑、平板电脑、服务器等,在此不做限定。此外,处理器100还可以称为CPU(Center Processing Unit,中央处理单元)。处理器100可能是一种集成电路芯片,具有信号处理能力。处理器100还可以是、通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器100可以由集成电路芯片共同实现。
请参阅图8,图8为本申请计算机可读存储介质一实施方式的结构示意图,该计算机可读存储介质110上存储有能够被处理器运行的程序指令120,程序指令120被处理器执行时实现上述任一实施例中提到的人机对话方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (13)

1.一种人机对话方法,其特征在于,包括:
获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果;
基于所述相关性分析结果,确定所述当前轮次对应的待分析内容;其中,当所述相关性分析结果为相关时,所述待分析内容包括所述当前需求以及与所述当前需求相关的所述历史交互内容,当所述相关性分析结果为无关时,所述待分析内容包括所述当前需求;
基于所述待分析内容,得到与所述当前需求匹配的目标回复。
2.根据权利要求1所述的方法,其特征在于,所述利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果,包括:
将所述当前需求及其之前至少部分轮次的所述历史交互内容输入至所述智能分析模型,得到所述当前需求对应的当前主题,以及至少部分轮次的所述历史交互内容对应的至少一个历史主题;
基于所述当前主题和至少一个所述历史主题,确定所述相关性分析结果。
3.根据权利要求2所述的方法,其特征在于,所述将所述当前需求及其之前至少部分轮次的所述历史交互内容输入至所述智能分析模型,得到所述当前需求对应的当前主题,以及至少部分轮次的所述历史交互内容对应的至少一个历史主题,包括:
将未包括屏蔽标识的所述历史交互内容作为可用交互内容;其中,所述可用交互内容至少包括上一轮次的所述历史交互内容;
将所述当前需求和所述可用交互内容输入至所述智能分析模型,得到所述当前需求对应的当前主题,以及所述可用交互内容对应的历史主题。
4.根据权利要求3所述的方法,其特征在于,所述基于所述当前主题和至少一个所述历史主题,确定所述相关性分析结果,包括:
响应于所述当前主题与所述可用交互内容对应的历史主题一致,判定所述当前需求与至少部分所述历史交互内容相关,且未发生主题切换;
响应于所述当前主题与所述可用交互内容对应的历史主题相互区别,判定发生主题切换,获取至少部分轮次包括所述屏蔽标识的所述历史交互内容作为参考交互内容,将所有所述参考交互内容输入至所述智能分析模型,得到所有所述参考交互内容对应的至少一个参考主题;
响应于所述当前主题与任一所述参考主题一致,判定所述当前需求与至少部分所述历史交互内容相关,移除与所述当前主题一致的各轮次所述参考交互内容的所述屏蔽标识,并为所述可用交互内容添加所述屏蔽标识;
响应于所述当前主题与所有所述参考主题相互区别,判定所述当前需求与所述历史交互内容无关,为所述可用交互内容添加所述屏蔽标识。
5.根据权利要求4所述的方法,其特征在于,所述获取至少部分轮次包括所述屏蔽标识的所述历史交互内容作为参考交互内容,包括:
获取所述当前需求对应的当前时间戳,将所述当前时间戳之前预设时间长度内所有包括所述屏蔽标识的所述历史交互内容作为参考交互内容;或者,
将所述当前轮次之前预设数值个轮次的包括所述屏蔽标识的所述历史交互内容作为参考交互内容。
6.根据权利要求2所述的方法,其特征在于,所述获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果之后,包括:
获取与所述当前主题相关的所有轮次的历史交互内容对应的已交互次数,将所述已交互次数输入至所述智能分析模型;
获取所述智能分析模型基于所述当前主题和所述已交互次数输出的决策指令;其中,所述决策指令用于指示是否利用所述智能分析模型获取与所述当前需求匹配的目标回复。
7.根据权利要求6所述的方法,其特征在于,所述决策指令包括第一标识或第二标识,所述基于所述待分析内容,得到与所述当前需求匹配的目标回复,包括:
响应于所述相关性分析结果为相关,且所述决策指令包括所述第一标识,将所述当前需求以及与所述当前需求相关的所述历史交互内容输入至所述智能分析模型,得到所述智能分析模型输出的所述目标回复;
响应于所述相关性分析结果为相关,且所述决策指令包括所述第二标识,基于所述当前需求以及与所述当前需求相关的所述历史交互内容,对回复内容进行预估,得到所述目标回复;
响应于所述相关性分析结果为无关,且所述决策指令包括所述第一标识,将所述当前需求输入至所述智能分析模型,得到所述智能分析模型输出的所述目标回复;
响应于所述相关性分析结果为无关,且所述决策指令包括所述第二标识,基于所述当前需求对回复内容进行预估,得到所述目标回复。
8.根据权利要求2所述的方法,其特征在于,所述基于所述待分析内容,得到与所述当前需求匹配的目标回复,包括:
响应于所述相关性分析结果为相关,将所述当前需求以及与所述当前需求相关的所述历史交互内容输入至所述智能分析模型,得到所述智能分析模型输出的第一候选回复,基于所述当前需求以及与所述当前需求相关的所述历史交互内容,对回复内容进行预估,得到第二候选回复;
响应于所述相关性分析结果为无关,将所述当前需求输入至所述智能分析模型,得到所述智能分析模型输出的第一候选回复,基于所述当前需求对回复内容进行预估,得到第二候选回复;
基于所述第一候选回复和所述第二候选回复,得到所述目标回复。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第一候选回复和所述第二候选回复,得到所述目标回复,包括:
将所述当前主题、所述第一候选回复和所述第二候选回复,输入至所述智能分析模型,得到所述智能分析模型输出的所述目标回复。
10.根据权利要求1所述的方法,其特征在于,所述获取当前轮次的当前需求,包括:
获取当前场景下的音频信息,基于所述音频信息,得到当前场景对应的转写文本;
将所述转写文本输入至智能分析模型,得到所述智能分析模型输出的所述当前轮次的当前需求。
11.一种人机对话***,其特征在于,包括:
分析模块,用于获取当前轮次的当前需求,利用智能分析模型对所述当前需求和至少部分轮次的历史交互内容进行相关性分析,得到相关性分析结果;
处理模块,用于基于所述相关性分析结果,确定所述当前轮次对应的待分析内容;其中,当所述相关性分析结果为相关时,所述待分析内容包括所述当前需求以及与所述当前需求相关的所述历史交互内容,当所述相关性分析结果为无关时,所述待分析内容包括所述当前需求;
回复模块,用于基于所述待分析内容,得到与所述当前需求匹配的目标回复。
12.一种移动终端,其特征在于,包括:显示屏、存储器和处理器,所述显示屏和所述存储器分别耦接于所述处理器,所述显示屏至少用于向用户展示内容以及供用户输入或选择内容,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1至10中任一项所述的人机对话方法。
13.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1至10中任一项所述的人机对话方法。
CN202310678656.8A 2023-06-07 2023-06-07 一种人机对话方法、***及相关装置 Pending CN116932710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310678656.8A CN116932710A (zh) 2023-06-07 2023-06-07 一种人机对话方法、***及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310678656.8A CN116932710A (zh) 2023-06-07 2023-06-07 一种人机对话方法、***及相关装置

Publications (1)

Publication Number Publication Date
CN116932710A true CN116932710A (zh) 2023-10-24

Family

ID=88378139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310678656.8A Pending CN116932710A (zh) 2023-06-07 2023-06-07 一种人机对话方法、***及相关装置

Country Status (1)

Country Link
CN (1) CN116932710A (zh)

Similar Documents

Publication Publication Date Title
US11551007B2 (en) Determining intent from a historical vector of a to-be-analyzed statement
CN107908803B (zh) 问答交互的响应方法及装置、存储介质、终端
CN112365894B (zh) 基于ai的复合语音交互方法、装置及计算机设备
CN109522564B (zh) 语音翻译方法和装置
US20190205743A1 (en) System and method for detangling of interleaved conversations in communication platforms
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
CN113840040B (zh) 一种人机协作的外呼方法、装置、设备及存储介质
EP3734472A1 (en) Method and device for text processing
CN113505272A (zh) 基于行为习惯的控制方法和装置、电子设备和存储介质
CN111611369B (zh) 基于人工智能的交互方法和相关装置
CN115083412B (zh) 语音交互方法及相关装置、电子设备、存储介质
CN116932710A (zh) 一种人机对话方法、***及相关装置
CN112786041B (zh) 语音处理方法及相关设备
CN103297389A (zh) 人机对话方法及装置
CN115906797A (zh) 文本实体对齐方法、装置、设备及介质
CN110535749B (zh) 对话推送方法、装置、电子设备及存储介质
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN113961689A (zh) 对话方法、装置、电子设备及计算机可读存储介质
CN110674268B (zh) 人机对话方法及相关设备
CN114202363A (zh) 基于人工智能的话术调用方法、装置、计算机设备及介质
CN112417095A (zh) 语音消息处理方法和装置
CN111143524A (zh) 一种用户意图确定方法及电子设备
CN111859148A (zh) 主题的提取方法、装置、设备及计算机可读存储介质
CN111161737A (zh) 数据处理方法、装置、电子设备和存储介质
CN111400475A (zh) 信息处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination