CN110196927A - 一种多轮人机对话方法、装置及设备 - Google Patents

一种多轮人机对话方法、装置及设备 Download PDF

Info

Publication number
CN110196927A
CN110196927A CN201910383367.9A CN201910383367A CN110196927A CN 110196927 A CN110196927 A CN 110196927A CN 201910383367 A CN201910383367 A CN 201910383367A CN 110196927 A CN110196927 A CN 110196927A
Authority
CN
China
Prior art keywords
user
reply data
instruction
client
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910383367.9A
Other languages
English (en)
Other versions
CN110196927B (zh
Inventor
吕飞飞
张子隆
刘炎
吴浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Original Assignee
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen Mobvoi Beijing Information Technology Co Ltd filed Critical Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority to CN201910383367.9A priority Critical patent/CN110196927B/zh
Publication of CN110196927A publication Critical patent/CN110196927A/zh
Application granted granted Critical
Publication of CN110196927B publication Critical patent/CN110196927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种多轮人机对话方法、装置和设备,该方法包括:客户端获取用户在当前对话轮次下输入的用户交互语音,并解析以得到解析指令;所述客户端若确定为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;所述客户端接收到所述服务器的确认返回响应,将存储的所述上一级机器应答数据呈现给用户。本发明实施例的技术方案,客户端解析用户交互语音为返回指令时,通过发送信息标识以及获取服务器的确认返回响应,调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,同时减少了客户端占用的数据带宽,节省了服务器资源。

Description

一种多轮人机对话方法、装置及设备
技术领域
本发明实施例涉及人机交互技术领域,尤其涉及一种多轮人机对话方法、装置及设备。
背景技术
随着软件技术的不断进步,各种各样的应用程序(Application,简称APP)出现在人们视野中,语音交互功能作为用户与应用程序之间的一个无形纽带,已经成为了应用程序开发中一个极为重要的组成部分。
目前开发的应用程序,在语音交互的会话过程中都是采用单轮会话,例如,用户在说“附近有什么好吃的”,语音交互功能返回的是美食列表,用户可以说餐厅的名字或者列表的索引标号,比如“第一个”,进入待该餐厅的详情界面,当用户不喜欢该餐厅或者想查看其它餐厅时,那么用户需要重新输入“附近有什么好吃的”。
这样的语音交互方式在逻辑上存在较大缺陷,尤其缺乏上下文之间的关联性,需要服务器多次提供相同的会话内容,尤其当用户会话的层级较多时,用户往往需要频繁输入同一个问题,经过多次筛选后,才能到达需要的对话层级,大大增加了交互次数,延长了会话时长。
发明内容
本发明实施例提供了一种多轮人机对话方法、装置及设备实现了人机之间的多轮对话,保证了呈现数据的准确性,避免了客户端重复获取相同的数据内容,节省了服务器资源。
第一方面,本发明实施例提供了一种多轮人机对话方法,包括:
客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
第二方面,本发明实施例提供了一种多轮人机对话方法,包括:
服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
第三方面,本发明实施例提供了一种多轮人机对话装置,应用于客户端中,包括:
指令解析模块,用于获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
信息标识获取模块,用于若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
机器应答数据呈现模块,用于根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
第四方面,本发明实施例提供了一种多轮人机对话装置,应用于服务器中,包括:
用户交互语音获取模块,用于接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
指令响应模块,用于若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
第一数据同步模块,用于将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
第五方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的多轮人机对话方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的多轮人机对话方法。
本发明实施例的技术方案,通过客户端对用户交互语音进行解析,在用户交互语音为返回指令时,将存储的信息标识发送至服务器,并在收到服务器的确认返回响应后,本地调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性,同时,减少了客户端占用的数据带宽,避免了从服务器重复获取相同的数据内容,节省了服务器资源。
附图说明
图1A是本发明实施例一提供的多轮人机对话方法的流程图;
图1B是本发明实施例一提供的多轮人机对话方法的数据流程图;
图2A是本发明实施例二提供的多轮人机对话方法的流程图;
图2B是本发明实施例二提供的多轮人机对话方法的数据流程图;
图3是本发明实施例三提供的多轮人机对话装置的结构框图;
图4是本发明实施例四提供的多轮人机对话装置的结构框图;
图5是本发明实施例五提供的设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1A为本发明实施例一提供的一种多轮人机对话方法的流程图,本实施例可适用于用户与客户端进行多轮人机对话的情况,该方法可以由本发明实施例中的多轮人机对话装置来执行,该装置可以通过软件和/或硬件实现,并一般可以集成在提供人机交互功能的客户端中,与提供机器应答数据的服务器配合使用,典型的,可以集成在车载导航客户端中,该方法具体包括如下步骤:
S110、客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令。
客户端(Client)是为用户提供本地服务的应用程序,安装在用户的客户机中,例如,安装在手机和电脑等电子设备中;安装在汽车、火车和飞机等交通工具的通信装置中。客户端包括了多种形式,例如,浏览网页使用的浏览器以及各种类型的应用程序(Application,APP)等。可选的,在本发明实施例中,对客户端的类型以及安装有客户端的客户机类型不作具体限定。
本发明实施例中的客户端是具有人机交互功能的客户端,可以获取用户的交互语音。在当前对话中,客户端在获取到用户交互语音时,对所述用户交互语音进行指令解析,得到解析指令。可选的,在本发明实施例中,利用自动语音识别(Automatic SpeechRecognition,简称ASR)技术和/或自然语言理解(Natural Language Understanding,简称NLU)技术对所述用户交互语音进行指令解析,得到解析指令。ASR是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。NLU则是关注于文本的语义,即将文本内容转换为文本语义,文本中单词的确切含义并不重要,重要的是文本传达的语义信息。
S120、所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器。
客户端根据解析后的指令,如果确认为返回指令;所述返回指令是用户发出的查看上一级机器应答数据的指令;若当前对话轮次的机器应答数据是基于另一个机器应答数据中的相关信息获取的,那么所述当前对话轮次的机器应答数据即作为所述另一个机器应答数据的下一级机器应答数据,所述另一个机器应答数据则作为当前对话轮次的机器应答数据的上一级机器应答数据;例如,识别出指令中包括“返回”、“上一级”或“重选”等关键词,则认定该指令为返回指令,那么此时客户端获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识并发送至服务器。例如,用户通过发出语音信息“附近的美食”,客户端提供了相应的“美食列表”,该“美食列表”作为第一级机器应答数据;在该对话下,用户再次通过发出语音信息选择“美食列表”中的“美食名称”或者“索引标号”以查看其中一个美食的详细信息,那么客户端提供的该美食的详细信息则作为第二级机器应答数据,第一级机器应答数据即为第二级机器应答数据的上一级机器应答数据。每一个机器应答数据在生成时,都会生成一个与之匹配的且唯一的信息标识,用来表示该机器应答数据,因此,客户端在当前对话轮次的机器应答数据下,也即该美食的详细信息的对话下,获取到返回指令时,则查找上一级的机器应答数据对应的信息标识,即“美食列表”对应的信息标识,并发送至服务器。
S130、所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
客户端若获取到服务器反馈的确认返回响应,则说明该信息标识有效,例如,上述“美食列表”对应的信息标识,即确定了所述用户交互语音满足历史机器应答数据请求条件,客户端将存储于本地的当前机器应答数据的上一级机器应答数据,即该美食的详细信息的上一级机器应答数据“美食列表”呈现给用户。特别的,机器应答数据可以以语音和/或文字列表的方式呈现给用户,也可以以其它方式呈现给用户,在本发明实施例中,可选的,对机器应答数据的呈现方式不作具体限定。
客户端若获取到服务器反馈的信息标识无效指令或者在设定时间内未收到服务器反馈的确认返回响应,则以语音和/或文字的形式通知用户该返回指令无效,以使用户重新进行语音交互。
可选的,在本发明实施例中,在所述客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令之后,所述客户端若确定所述解析指令为非返回指令,则将所述解析指令发送至服务器,以使所述服务器查找与所述解析指令匹配的机器应答数据并生成与所述机器应答数据匹配的信息标识;所述非返回指令,是除返回指令之外的其它用户指令;特别的,若识别出用户指令中不包括“返回”、“上一级”和“重选”等关键词即将该用户指令视为非返回指令,例如,当前轮次对话为客户端根据用户发出的语音信息“附件的美食”而提供的“美食列表”,用户再次发出的语音信息为“附近的超市”,客户端根据解析后的指令,确认该解析指令为非返回指令,那么此时将解析指令发送至服务器,以使所述服务器查找与“附近的超市”匹配的“超市列表”并生成与“超市列表”匹配的信息标识;客户端若获取到由所述服务器发送的所述“超市列表”以及与所述“超市列表”匹配的信息标识,则进行本地存储,并将所述“超市列表”呈现给用户。
本发明实施例的技术方案,通过客户端对用户交互语音进行解析,在用户交互语音为返回指令时,将存储的信息标识发送至服务器,并在收到服务器的确认返回响应后,本地调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性,同时,减少了客户端占用的数据带宽,避免了从服务器重复获取相同的数据内容,节省了服务器资源。
具体应用场景一
图1B是本发明具体应用场景一在上述实施例的基础上提供的一种多轮人机对话方法的数据流程图,该数据流程如下:
客户端获取用户在当前对话轮次下输入的用户交互语音并解析;客户端确定解析后的指令为返回指令;客户端获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识;客户端将所述信息标识发送至服务器;服务器接收客户端发送的信息标识;服务器验证所述信息标识有效;服务器生成与所述信息标识匹配的确认返回响应,并更新当前机器应答数据,以保证与客户端的数据同步;服务器将所述确认返回响应发送至客户端;客户端接收服务器发送的确认返回响应;客户端确定用户交互语音满足历史机器应答数据请求条件;客户端将存储的上一级机器应答数据呈现给用户。
本发明实施例的技术方案,通过客户端对用户交互语音进行解析,在用户交互语音为返回指令时,将存储的信息标识发送至服务器,并在收到服务器的确认返回响应后,本地调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性,同时,减少了客户端占用的数据带宽,避免了从服务器重复获取相同的数据内容,节省了服务器资源。
实施例二
图2A为本发明实施例二提供的一种多轮人机对话方法的流程图,本实施例可适用于用户与客户端进行多轮人机对话的情况,该方法可以由本发明实施例中的多轮人机对话装置来执行,该装置可以通过软件和/或硬件实现,并一般可以集成在具有人机对话处理功能的服务器中,与获取用户交互语音的客户端配合使用,典型的,可以集成在车载导航服务器中,该方法具体包括如下步骤:
S210、服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音。
S220、所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件。
可选的,在本发明实施例中,服务器根据ASR技术和/或NLU技术确定用户交互语音是否为返回指令;若服务器确定用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识;若能获取到所述信息标识,则证明该返回指令有效,则向客户端发送确认返回响应,以使客户端响应用户的返回指令;若不能获取到所述信息标识,则证明该返回指令无效,向客户端发送无效返回响应,以使客户端通知用户该返回指令无效。
可选的,在本发明实施例中,可以设定信息标识的有效时间,服务器在有效时间内保存该信息标识,超过有效时间后删除该信息标识,也即无法再查询到该信息标识,该信息标识失效;例如,以上述实施例中当前对话轮次的机器应答数据为美食的详细数据,且信息标识的有效时间为十分钟为例,若服务器在某一时刻确定所述用户交互语音为返回指令,如果该时刻与上一级机器应答数据,即“美食列表”的信息标识的生成时间之间的相差时间小于或等于十分钟,那么该信息标识依然保存在服务器中,服务器可以获取到该信息标识,即该信息标识为有效。还可以根据用户的层级来设定不同的信息标识保存时间,例如,VIP用户设定较长的信息标识保存时间,普通用户设定较短的信息标识保存时间。
可选的,所述信息标识包括哈希值;哈希值,是通过一定的哈希算法,例如MD5消息摘要算法(MD5Message-Digest Algorithm)和安全散列算法1(Secure Hash Algorithm 1,简称SHA-1)等,将一段较长数据映射为较短数据的过程,映射后的较短数据就是该较长数据的哈希值。在本发明实施例中,对获取哈希值采用的算法不作具体限定。特别的,对于同一时间相同内容的用户请求,例如,同一时间不同用户发出同样的交互语音“附近的美食”,由于用户所处位置以及用户层级的不同,查询获得的机器应答数据也不相同,即数据源不同,因而根据机器应答数据生成的哈希值也不相同,因此,利用哈希值具有唯一性这一特点,将哈希值作为信息标识,可以准确的区分不同的机器应答数据。
服务器反馈与信息标识对应的确认返回响应,既利用了信息标识的唯一性,保证了响应的准确性,同时又避免了再次向客户端发送同样的机器应答数据,减少了客户端占用的数据带宽,节省了服务器通信资源。
S230、所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
服务器在向客户端发送确认返回响应的同时,将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
可选的,在本发明实施例中,在服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音之后,所述服务器若确定所述用户交互语音为非返回指令,则获取与所述用户交互语音匹配的机器应答数据,生成与所述机器应答数据匹配的信息标识,将所述机器应答数据和所述信息标识反馈给所述客户端,以使所述客户端将所述机器应答数据呈现给用户;例如,当前轮次对话为服务器解析用户的语音信息为“附件的美食”,进而提供了“美食列表”作为当前机器应答数据,服务器再次获得该用户的交互语音,并解析为“附近的超市”时,则确定该解析指令为非返回指令,则获取与“附近的超市”匹配的“超市列表”,并生成与“超市列表”匹配的信息标识,服务器将“超市列表”以及与“超市列表”匹配的信息标识发送至客户端,以使客户端将“超市列表”呈现给用户,同时,服务器将“超市列表”作为当前机器应答数据,以保证与客户端的数据同步。
本发明实施例的技术方案,通过服务器对用户交互语音进行解析,在用户交互语音为返回指令时,根据信息标识发送确认返回响应至客户端,并更新当前机器应答数据,以保持与客户端的数据同步,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性以及客户端和服务器之间的数据同步,同时,避免了服务器向同一客户端重复发送相同的数据内容,节省了通信资源。
具体应用场景二
图2B是本发明具体应用场景二在上述实施例的基础上提供的一种多轮人机对话方法的数据流程图,该数据流程如下:
客户端获取用户在当前对话轮次下输入的用户交互语音;客户端将所述用户交互语音发送至服务器;服务器接收客户端发送的用户交互语音,并解析;服务器确定所述用户交互语音为返回指令;服务器获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识;服务器生成与所述信息标识匹配的确认返回响应,并更新当前机器应答数据;服务器将与所述信息标识匹配的确认返回响应发送至客户端;客户端接收服务器发送的确认返回响应;客户端将存储的上一级机器应答数据呈现给用户。
本发明实施例的技术方案,通过服务器对用户交互语音进行解析,在用户交互语音为返回指令时,根据信息标识发送确认返回响应至客户端,并更新当前机器应答数据,以保持与客户端的数据同步,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性以及客户端和服务器之间的数据同步,同时,避免了服务器向同一客户端重复发送相同的数据内容,节省了通信资源。
实施例三
图3是本发明实施例三所提供的一种多轮人机对话装置的结构框图,该装置应用于客户端中,具体包括:指令解析模块310、信息标识获取模块320和机器应答数据呈现模块330。
指令解析模块310,用于获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
信息标识获取模块320,用于若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
机器应答数据呈现模块330,用于根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
本发明实施例的技术方案,通过客户端对用户交互语音进行解析,在用户交互语音为返回指令时,将存储的信息标识发送至服务器,并在收到服务器的确认返回响应后,本地调取对应的机器应答数据呈现给用户,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性,同时,减少了客户端占用的数据带宽,避免了从服务器重复获取相同的数据内容,节省了服务器资源。
可选的,在上述各实施例的基础上,多轮人机对话装置,还包括:
非返回指令确定模块,用于若确定所述解析指令为非返回指令,则将所述解析指令发送至服务器,以使所述服务器查找与所述解析指令匹配的机器应答数据并生成与所述机器应答数据匹配的信息标识;
本地存储模块,用于若获取到由所述服务器发送的所述机器应答数据以及与所述机器应答数据匹配的信息标识,则进行本地存储,并将所述机器应答数据呈现给用户。
可选的,在上述各实施例的基础上,指令解析模块310,具体用于:
利用自动语音识别技术和/或自然语言理解技术对所述用户交互语音进行指令解析,得到解析指令。
上述装置可执行本发明任意实施例所提供的多轮人机对话方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的方法。
实施例四
图4是本发明实施例四所提供的一种多轮人机对话装置的结构框图,该装置应用于服务器中,具体包括:用户交互语音获取模块410、指令响应模块420和第一数据同步模块430。
用户交互语音获取模块410,用于接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
指令响应模块420,用于若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
第一数据同步模块430,用于将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
本发明实施例的技术方案,通过服务器对用户交互语音进行解析,在用户交互语音为返回指令时,根据信息标识发送确认返回响应至客户端,并更新当前机器应答数据,以保持与客户端的数据同步,实现了人机之间的多轮对话,提高了用户体验,并通过验证了信息标识的有效性,保证了呈现数据的准确性以及客户端和服务器之间的数据同步,同时,避免了服务器向同一客户端重复发送相同的数据内容,节省了通信资源。
可选的,在上述各实施例的基础上,多轮人机对话装置,还包括:
机器应答数据发送模块,用于若确定所述用户交互语音为非返回指令,则获取与所述用户交互语音匹配的机器应答数据,生成与所述机器应答数据匹配的信息标识,将所述机器应答数据和所述信息标识反馈给所述客户端,以使所述客户端将所述机器应答数据呈现给用户;
第二数据同步模块,用于将所述机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
可选的,在上述各实施例的基础上,所述信息标识包括哈希值。
上述装置可执行本发明任意实施例所提供的多轮人机对话方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的方法。
实施例五
图5为本发明实施例五提供的多轮人机对话设备的结构示意图,如图5所示,该设备包括处理器50、存储器51、输入装置52和输出装置53;设备中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;设备处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的由客户端执行的多轮人机对话装置对应的模块(指令解析模块310、信息标识获取模块320和机器应答数据呈现模块330)。或者,如本发明实施例中由服务器执行的多轮人机对话装置对应的模块(用户交互语音获取模块410、指令响应模块420和第一数据同步模块430)处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的多轮人机对话方法。
存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置52可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置53可包括显示屏等显示设备。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,所述计算机可读存储介质在由计算机处理器执行时用于执行多轮人机对话方法,该方法包括:
客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
或者,所述计算机可读存储介质在由计算机处理器执行时用于执行多轮人机对话方法,该方法包括:
服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的多轮人机对话方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述多轮人机对话装置的实施例中,所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种多轮人机对话方法,其特征在于,包括:
客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
所述客户端若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
所述客户端根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
2.根据权利要求1所述的方法,其特征在于,在所述客户端获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令之后,包括:
所述客户端若确定所述解析指令为非返回指令,则将所述解析指令发送至服务器,以使所述服务器查找与所述解析指令匹配的机器应答数据并生成与所述机器应答数据匹配的信息标识;
所述客户端若获取到由所述服务器发送的所述机器应答数据以及与所述机器应答数据匹配的信息标识,则进行本地存储,并将所述机器应答数据呈现给用户。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述用户交互语音进行指令解析,得到解析指令,包括:利用自动语音识别技术和/或自然语言理解技术对所述用户交互语音进行指令解析,得到解析指令。
4.一种多轮人机对话方法,其特征在于,包括:
服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
所述服务器若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
所述服务器将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
5.根据权利要求4所述的方法,其特征在于,在服务器接收客户端发送的用户在当前对话轮次下输入的用户交互语音之后,包括:
所述服务器若确定所述用户交互语音为非返回指令,则获取与所述用户交互语音匹配的机器应答数据,生成与所述机器应答数据匹配的信息标识,将所述机器应答数据和所述信息标识反馈给所述客户端,以使所述客户端将所述机器应答数据呈现给用户;
所述服务器将所述机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
6.根据权利要求4所述的方法,其特征在于,所述信息标识包括哈希值。
7.一种多轮人机对话装置,应用于客户端中,其特征在于,包括:
指令解析模块,用于获取用户在当前对话轮次下输入的用户交互语音,并对所述用户交互语音进行指令解析,得到解析指令;
信息标识获取模块,用于若确定所述解析指令为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识发送至服务器;
机器应答数据呈现模块,用于根据所述服务器反馈的与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件,并将存储的所述上一级机器应答数据呈现给用户。
8.根据权利要求7所述的装置,其特征在于,所述多轮人机对话装置还包括:
非返回指令确定模块,用于若确定所述解析指令为非返回指令,则将所述解析指令发送至服务器,以使所述服务器查找与所述解析指令匹配的机器应答数据并生成与所述机器应答数据匹配的信息标识;
本地存储模块,用于若获取到由所述服务器发送的所述机器应答数据以及与所述机器应答数据匹配的信息标识,则进行本地存储,并将所述机器应答数据呈现给用户。
9.根据权利要求7或8所述的装置,其特征在于,所述指令解析模块,具体用于:
利用自动语音识别技术和/或自然语言理解技术对所述用户交互语音进行指令解析,得到解析指令。
10.一种多轮人机对话装置,应用于服务器中,其特征在于,包括:
用户交互语音获取模块,用于接收客户端发送的用户在当前对话轮次下输入的用户交互语音;
指令响应模块,用于若确定所述用户交互语音为返回指令,则获取与所述当前对话轮次的机器应答数据匹配的上一级机器应答数据的信息标识,并反馈与所述信息标识匹配的确认返回响应,确定所述用户交互语音满足历史机器应答数据请求条件;
第一数据同步模块,用于将所述上一级机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
11.根据权利要求10所述的装置,其特征在于,所述多轮人机对话装置还包括:
机器应答数据发送模块,用于若确定所述用户交互语音为非返回指令,则获取与所述用户交互语音匹配的机器应答数据,生成与所述机器应答数据匹配的信息标识,将所述机器应答数据和所述信息标识反馈给所述客户端,以使所述客户端将所述机器应答数据呈现给用户;
第二数据同步模块,用于将所述机器应答数据作为当前机器应答数据,以使所述服务器与所述客户端保持数据同步。
12.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的多轮人机对话方法,或如权利要求4-6中任一所述的多轮人机对话方法。
CN201910383367.9A 2019-05-09 2019-05-09 一种多轮人机对话方法、装置及设备 Active CN110196927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910383367.9A CN110196927B (zh) 2019-05-09 2019-05-09 一种多轮人机对话方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910383367.9A CN110196927B (zh) 2019-05-09 2019-05-09 一种多轮人机对话方法、装置及设备

Publications (2)

Publication Number Publication Date
CN110196927A true CN110196927A (zh) 2019-09-03
CN110196927B CN110196927B (zh) 2021-09-10

Family

ID=67752607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910383367.9A Active CN110196927B (zh) 2019-05-09 2019-05-09 一种多轮人机对话方法、装置及设备

Country Status (1)

Country Link
CN (1) CN110196927B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737765A (zh) * 2019-10-25 2020-01-31 上海喜马拉雅科技有限公司 多轮对话的对话数据处理方法及相关装置
CN110941693A (zh) * 2019-10-09 2020-03-31 深圳软通动力信息技术有限公司 基于任务的人机对话方法、***、电子设备及存储介质
CN112417109A (zh) * 2020-10-26 2021-02-26 出门问问(苏州)信息科技有限公司 一种人机对话***的测试方法及装置
CN113079400A (zh) * 2021-03-25 2021-07-06 海信视像科技股份有限公司 显示设备、服务器及语音交互方法
CN113656562A (zh) * 2020-11-27 2021-11-16 话媒(广州)科技有限公司 一种多轮次人机心理交互方法及装置
CN116521841A (zh) * 2023-04-18 2023-08-01 百度在线网络技术(北京)有限公司 用于生成回复信息的方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927006A (zh) * 2014-04-08 2014-07-16 弗徕威智能机器人科技(上海)有限公司 一种基于机器人的资讯互动***及方法
US20140278403A1 (en) * 2013-03-14 2014-09-18 Toytalk, Inc. Systems and methods for interactive synthetic character dialogue
CN106095568A (zh) * 2016-06-01 2016-11-09 努比亚技术有限公司 内存管理装置、移动终端及方法
CN107053208A (zh) * 2017-05-24 2017-08-18 北京无忧创新科技有限公司 一种主动交互式对话机器人***及该***主动对话的方法
US20180004729A1 (en) * 2016-06-29 2018-01-04 Shenzhen Gowild Robotics Co., Ltd. State machine based context-sensitive system for managing multi-round dialog
CN108366281A (zh) * 2018-02-05 2018-08-03 山东浪潮商用***有限公司 一种应用于机顶盒的全语音交互方法
CN109151063A (zh) * 2018-10-10 2019-01-04 小雅智能平台(深圳)有限公司 一种控制智能机器人的方法和***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140278403A1 (en) * 2013-03-14 2014-09-18 Toytalk, Inc. Systems and methods for interactive synthetic character dialogue
CN103927006A (zh) * 2014-04-08 2014-07-16 弗徕威智能机器人科技(上海)有限公司 一种基于机器人的资讯互动***及方法
CN106095568A (zh) * 2016-06-01 2016-11-09 努比亚技术有限公司 内存管理装置、移动终端及方法
US20180004729A1 (en) * 2016-06-29 2018-01-04 Shenzhen Gowild Robotics Co., Ltd. State machine based context-sensitive system for managing multi-round dialog
CN107053208A (zh) * 2017-05-24 2017-08-18 北京无忧创新科技有限公司 一种主动交互式对话机器人***及该***主动对话的方法
CN108366281A (zh) * 2018-02-05 2018-08-03 山东浪潮商用***有限公司 一种应用于机顶盒的全语音交互方法
CN109151063A (zh) * 2018-10-10 2019-01-04 小雅智能平台(深圳)有限公司 一种控制智能机器人的方法和***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941693A (zh) * 2019-10-09 2020-03-31 深圳软通动力信息技术有限公司 基于任务的人机对话方法、***、电子设备及存储介质
CN110737765A (zh) * 2019-10-25 2020-01-31 上海喜马拉雅科技有限公司 多轮对话的对话数据处理方法及相关装置
CN112417109A (zh) * 2020-10-26 2021-02-26 出门问问(苏州)信息科技有限公司 一种人机对话***的测试方法及装置
CN112417109B (zh) * 2020-10-26 2023-08-01 问问智能信息科技有限公司 一种人机对话***的测试方法及装置
CN113656562A (zh) * 2020-11-27 2021-11-16 话媒(广州)科技有限公司 一种多轮次人机心理交互方法及装置
CN113079400A (zh) * 2021-03-25 2021-07-06 海信视像科技股份有限公司 显示设备、服务器及语音交互方法
CN116521841A (zh) * 2023-04-18 2023-08-01 百度在线网络技术(北京)有限公司 用于生成回复信息的方法、装置、设备及介质
CN116521841B (zh) * 2023-04-18 2024-05-14 百度在线网络技术(北京)有限公司 用于生成回复信息的方法、装置、设备及介质

Also Published As

Publication number Publication date
CN110196927B (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
US10733983B2 (en) Parameter collection and automatic dialog generation in dialog systems
CN110196927A (zh) 一种多轮人机对话方法、装置及设备
US10679622B2 (en) Dependency graph generation in a networked system
CN102737104B (zh) 任务驱动的用户意图
US9177551B2 (en) System and method of providing speech processing in user interface
JP2019144598A (ja) 開発者音声アクションシステム
US9373322B2 (en) System and method for determining query intent
CN103365833B (zh) 一种基于上下文场景的输入候选词提示方法及***
JP2019503526A5 (zh)
WO2016004763A1 (zh) 业务推荐方法和具有智能助手的装置
US20160027440A1 (en) Selective speech recognition for chat and digital personal assistant systems
US20160048500A1 (en) Concept Identification and Capture
CN104239459A (zh) 语音搜索方法、装置和***
US9898455B2 (en) Natural language understanding cache
CN111213136B (zh) 联网***中特定于域的模型的生成
WO2015014122A1 (zh) 语音交互的方法、***以及交互终端
US20180213062A1 (en) Speed and accuracy of computers when resolving client queries by using graph database model
US20230169102A1 (en) Determining responsive content for a compound query based on a set of generated sub-queries
CN110692040A (zh) 在网络***中激活远程设备
KR20190109498A (ko) 미등록 리소스를 사용한 오디오-기반의 네트워크 세션 수립
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
CN114596854A (zh) 基于全双工通信协议的语音处理方法及***、计算机设备
CN107577728B (zh) 一种用户请求处理方法及设备
CN117235235A (zh) 一种基于云平台的信息处理方法、装置、设备及介质
CN111881253A (zh) 同义实体对的确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant