CN115410601A - 人机对话场景中基于场景识别的语音交互方法 - Google Patents

人机对话场景中基于场景识别的语音交互方法 Download PDF

Info

Publication number
CN115410601A
CN115410601A CN202211355953.0A CN202211355953A CN115410601A CN 115410601 A CN115410601 A CN 115410601A CN 202211355953 A CN202211355953 A CN 202211355953A CN 115410601 A CN115410601 A CN 115410601A
Authority
CN
China
Prior art keywords
user
statement
information
conversation
scenario
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211355953.0A
Other languages
English (en)
Other versions
CN115410601B (zh
Inventor
龙方舟
韦武杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Renma Interactive Technology Co Ltd
Original Assignee
Shenzhen Renma Interactive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Renma Interactive Technology Co Ltd filed Critical Shenzhen Renma Interactive Technology Co Ltd
Priority to CN202211355953.0A priority Critical patent/CN115410601B/zh
Publication of CN115410601A publication Critical patent/CN115410601A/zh
Application granted granted Critical
Publication of CN115410601B publication Critical patent/CN115410601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/04Telephonic communication systems specially adapted for combination with other electrical systems with alarm systems, e.g. fire, police or burglar alarm systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供了一种人机对话场景中基于场景识别的语音交互方法,应用于人机对话服务***中的服务器;所述方法包括:调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息;若根据所述用户语音信息确定出所述用户处于伪装报警应用场景;选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。能够提高人机对话场景中进行语义转换的智能性和准确度,同时提高伪装报警应用场景中用户的安全性和隐蔽性。

Description

人机对话场景中基于场景识别的语音交互方法
技术领域
本申请属于互联网产业的一般数据处理技术领域,具体涉及一种人机对话场景中基于场景识别的语音交互方法。
背景技术
目前,用户处于一些特殊场景时,比如与危险人物处于同一空间环境时,用户在报警时输入的内容和语句本义对应的意图可能不同,此时若不能根据用户场景灵活转换用户意图,则可能无法准确理解用户的真实意图,使得用户错过报警时机,危险事件发生概率变高。
发明内容
本申请提供了一种人机对话场景中基于场景识别的语音交互方法,以期提高在紧急场景下识别用户的真实意图的准确性和隐蔽性,保证用户安全。
第一方面,本申请实施例提供了一种人机对话场景中基于场景识别的语音交互方法,应用于人机对话服务***中的服务器,所述人机对话服务***包括所述服务器和终端设备,其中,所述服务器设置有人机对话引擎;所述方法包括:
调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;
若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,所述其他人是指所述用户当前所处环境空间中的其他人,所述关注度的情况包括关注度高、关注度低、以及关注度无法准确确认,所述目标事务场景是指事务主题为除报警事务之外的任一事务场景;
选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息,所述基本信息包括地点信息和人物信息,所述人机对话剧本包括至少一个对话剧情节点,该对话剧情节点包括机器输出语句,所述机器输出语句包括案情询问语句和答复指引语句,所述案情询问语句是指以询问的方式陈述所述地点信息和/或人物信息,所述答复指引语句包括针对将所述案情询问语句的肯定答复的肯定语义转换语句、以及包括针对将所述案情询问语句的否定答复的否定语义转换语句,且所述肯定语义转换语句和所述否定语义转换语句的字面语义与所述用户前一次的对话语义之间的对话逻辑符合所述目标事务场景的对话逻辑;
根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
第二方面,本申请实施例提供了一种人机对话场景中基于场景识别的语音交互装置,应用于人机对话服务***中的服务器,所述人机对话服务***包括所述服务器和终端设备,其中,所述服务器设置有人机对话引擎;所述装置包括:
接收单元,用于调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;
确定单元,用于若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,所述其他人是指所述用户当前所处环境空间中的其他人,所述关注度的情况包括关注度高、关注度低、以及关注度无法准确确认,所述目标事务场景是指事务主题为除报警事务之外的任一事务场景;
选择单元,用于选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息,所述基本信息包括地点信息和人物信息,所述人机对话剧本包括至少一个对话剧情节点,该对话剧情节点包括机器输出语句,所述机器输出语句包括案情询问语句和答复指引语句,所述案情询问语句是指以询问的方式陈述所述地点信息和/或人物信息,所述答复指引语句包括针对将所述案情询问语句的肯定答复的肯定语义转换语句、以及包括针对将所述案情询问语句的否定答复的否定语义转换语句,且所述肯定语义转换语句和所述否定语义转换语句的字面语义与所述用户前一次的对话语义之间的对话逻辑符合所述目标事务场景的对话逻辑;
创建单元,用于根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
第三方面,本申请实施例提供了一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面和第二方面中任一方面的步骤的指令。
第四方面,本申请实施例提供了一种计算机存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面和第二方面中任一方面所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面和第二方面中任一方面所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,首先通过调用所述人机对话引擎与所述终端设备建立的通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况;选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。如此,能够提高人机对话场景中进行语义转换的智能性和准确度,同时提高伪装报警应用场景中用户的安全性和隐蔽性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种人机对话服务***的结构示意图;
图1b是本申请实施例提供的一种电子设备的结构框图;
图2是本申请提供的一种人机对话场景中基于场景识别的语音交互方法的流程示意图;
图3是本申请实施例提供的一种人机交互界面示意图;
图4是本申请实施例提供的另一种人机交互界面的示意图;
图5是本申请实施例提供的又一种人机交互界面的示意图;
图6是本申请实施例提供的一种人机对话场景中基于场景识别的语音交互装置的功能单元组成框图;
图7是本申请实施例提供的另一种人机对话场景中基于场景识别的语音交互装置的功能单元组成框图;
图8是本申请实施例提供的一种服务器的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面先对本申请涉及到的相关术语进行介绍。
目前,由于用户在遇到危险或者紧急情况时输入的语音内容和语句本义对应的意图可能不同,现有的人机对话引擎无法在报警场景中对用户本意进行准确理解,因此人机对话引擎的智能度还不够,使得用户错过报警时机,危险事件发生概率变高。
为解决上述问题,本申请实施例提供了一种人机对话场景中基于场景识别的语音交互方法。该人机对话场景中基于场景识别的语音交互方法可以用于用户处于伪装报警的人机交互的场景中。可以通过调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息;若根据所述用户语音信息确定出所述用户处于伪装报警应用场景;选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
本方案可以使用于多种场景,包括但不限于上述提到的应用场景。
下面介绍本申请实施例涉及的***架构。
请参阅图1a,图1a是本申请实施例提供的一种人机对话服务***100的结构示意图。如图1a所示,所述人机对话服务***包括所述服务器110和所述终端设备120,其中所述服务器110包括人机对话引擎111,所述人机对话引擎111用于在多场景下与所述终端设备120进行人机交互。服务器110通过调用所述人机对话引擎111与所述终端设备120建立通话连接,所述服务器110通过所述通话连接接受来自所述终端设备120的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息;若所述服务器根据所述用户语音信息确定出所述用户处于伪装报警应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况;然后由所述服务器110选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;最后所诉服务器110根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
本申请还提供了一种电子设备10,如图1b所示,所述电子设备10包括至少一个处理器(processor)11;显示屏12;以及存储器(memory)13,还可以包括通信接口(Communications Interface)15和总线14。其中,处理器11、显示屏12、存储器13和通信接口15可以通过总线14完成相互间的通信。显示屏12设置为显示初始设置模式中预设的用户引导界面。通信接口15可以传输信息。处理器11可以调用存储器13中的逻辑指令,以执行上述实施例中的方法。
可选的,所述电子设备10可以是移动电子设备,也可以是电子设备或其他设备,在此不做唯一性限定。
此外,上述的存储器13中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器13作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器11通过运行存储在存储器13中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器13可包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据电子设备10的使用所创建的数据等。此外,存储器13可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
下面对具体的方法进行详细的介绍。
请参阅图2,图2是本申请提供的一种人机对话场景中基于场景识别的语音交互方法的流程示意图,应用于人机对话服务***中的服务器,所述人机对话服务***包括所述服务器和终端设备,其中,所述服务器设置有人机对话引擎;所述方法包括:
步骤201,调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息。
其中,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务。
具体地,所述环境音信息包括所述用户所处空间环境内的人物脚步声、争吵声、对话声、以及异响等声音。
在一个可能的示例中,在所述接收来自所述终端设备的第一语音信息之后,所述方法还包括:若根据所述用户语音信息确定出所述用户未处于所述伪装报警应用场景,则切换至正常报警应用场景,并执行所述人机对话操作直至获取所述用户当前次的报警事件的基本信息,所述正常报警应用场景是指所述用户以报警事务场景的对话逻辑进行对话以实现报警目的应用场景,所述报警事务场景是指事务主题为报警事务的事务场景;以及,根据所述用户当前次的报警事件的基本信息创建第二出警任务,并向对应的警务人员发布所述第二出警任务。
具体地,在实际场景中,若用户第一句就明确表达了报警意图,则无需进行在所述伪装报警应用场景下的语义转换,比如用户说“警官,我想报警/报案”。
其中,正常报警应用场景中包括必要信息询问语句等,一切适配正常报警问话流程的内容,根据用户回复进行记录并生成出警任务,最后完成出警。
可见,本示例中,提供了在正常报警应用场景下,人机对话引擎进行报警流程的人机交互,实现适配多种场景,满足用户实际需求,提高正常报警事务场景中人机交互的智能性,提高报警效率。
步骤202,若根据所述用户语音信息确定出所述用户处于伪装报警应用场景。
其中,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,所述其他人是指所述用户当前所处环境空间中的其他人,所述关注度的情况包括关注度高、关注度低、以及关注度无法准确确认。
其中,所述目标事务场景是指事务主题为除报警事务之外的任一事务场景。
具体地,所述伪装报警应用场景是指用户在该场景中不能正常表达自己意图,否则可能发生危险,在实际应用中,比如遭遇到危险分子挟持,不能让危险分子发现自己正在打通报警电话的场景,只能通过一些“暗语”、“暗号”,暗示警务人员自身处于危险并且不便于说话。
在一个可能的示例中,所述根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,包括:分析所述环境音信息中是否存在多人争吵声音;若存在所述多人争吵声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低;若不存在所述多人争吵声音,则分析所述环境音信息中是否存在针对所述用户当前次的通话事件的关联询问语音信息;若存在所述关联询问语音信息,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;若不存在所述关联询问语音信息,则分析所述环境音信息中是否存在处于所述用户当前所处环境中的人物走动的声音;若存在所述处于所述用户当前所处环境中的人物走动的声音,确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;若不存在所述处于所述用户当前所处环境中的人物走动的声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度无法准确确认。
具体地,所述关联询问语音信息指所述其他人对用户处于通话状态的询问信息,比如在环境音的判断中分析出其他人在用户身边询问“你在打电话吗”等,说明所述其他人可能已经发现用户在打电话或者尚未发现用户在打电话但是已经注意到用户有打电话的可能性,此时判断出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高。
具体地,同理,若所述环境音中存在所述用户当前所处环境附近的人物走动的声音,则说明所述其他人可能已经发现用户在打电话或者尚未发现用户在打电话但是已经注意到用户有打电话的可能性,同理可判断出所述其他人对所述用户当前次的报警事件的关注度的情况为关注度高。
其中,若在环境音中无法直接准确确认用户当前受到的关注度,则判断所述其他人对所述用户当前次的报警事件的关注度的情况为关注度无法准确确认。
可见,本示例中,根据环境音对他人针对用户关注度进行判断分类,通过人机对话引擎切换人机对话剧本进行人机交互,以适配针对用户当前对话应用场景,提高了人机对话剧本与当前用户所处场景的适配性,保证了用户的安全,提升了报警效率。
在一个可能的示例中,所述根据所述用户语音信息确定出所述用户处于伪装报警应用场景,包括:综合分析所述用户语音信息的语速、语气、以及连贯性,以确认所述用户当前处于意识清醒的状态;分析所述用户语音信息的语义,根据所述用户语音信息的语义确定所述用户是否处于所述伪装报警应用场景。
其中,若所述用户语音信息的语速过于缓慢或者过于急促、语气较为激动或者带有嘲弄、且语句不连贯,可以判断所述用户当前状态处于非清醒状态,可能是处于醉酒、或者其他处于非清醒状态下拨打报警电话的情况。
具体地,这里的语速可以通过调节语音识别的参数进行设置,比如1s一个字的语速就过慢了,并不符合正常对话语速,可以判断为恶搞、报假警之类事件;语气则通过语句中是否带有憋笑、环境音信息中是否存在笑声、以及语气是否平静稳定等信息对语气进行判断。
其中,分析所述用户语音信息的语义包括,根据上述判断确定所述用户处于清醒状态时,根据用户语义确定用户是否处于所述伪装报警应用场景,若用户语义清楚明确,且能清晰识别所述用户的表述为非报警事务的其他事务主题,则判断为处于所述伪装报警应用场景;若用户语义表述为报警事务主题,则判断为不处于所述伪装报警应用场景,具体地,可以是如“我的外卖到了吗”、“我的水果送到了吗”类似具有暗示含义且表达准确的语句。
可见,本示例中,首先综合分析用户语音的语速等信息进行初步判断,判断用户当前的精神状态以及意识状态是否正常,接着对用户语音的语义进行分析,排除了多种可能会干扰到人机对话引擎进行语义转换的情况,快速且智能地识别用户所处的报警应用场景,提高了报警效率的同时,优化用户体验。
步骤203,选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息。
其中,所述基本信息包括地点信息和人物信息,所述人机对话剧本包括至少一个对话剧情节点,该对话剧情节点包括机器输出语句,所述机器输出语句包括案情询问语句和答复指引语句,所述案情询问语句是指以询问的方式陈述所述地点信息和/或人物信息,所述答复指引语句包括针对将所述案情询问语句的肯定答复的肯定语义转换语句、以及包括针对将所述案情询问语句的否定答复的否定语义转换语句,且所述肯定语义转换语句和所述否定语义转换语句的字面语义与所述用户前一次的对话语义之间的对话逻辑符合所述目标事务场景的对话逻辑。
具体地,在实际应用中的警务***可以在短时间内,通过通话定位***对用户正在通话的终端设备进行定位,在本实施例这里的询问地点信息,是为了在人机对话过程中快速准确确认地点信息,起到辅助确认地点信息的作用。
在一个可能的示例中,适配所述关注度低的情况的人机对话剧本为第一人机对话剧本,所述第一人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;所述机器输出语句包括所述人物询问语句和/或地点询问语句、以及所述答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户以简短字词实现针对所述机器输出语句的肯定答复或否定答复的指引语句,所述简短字词的字数不超过预设数量。
具体地,所述人物询问语句中还包括询问针对所述其他人的人物危险程度的语句。
其中,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述定位地点信息包括通过警务***中对通话连接的设备实时定位到的地点信息,还包括通过提前预登记在数据库中实时根据电话号码查询到的登记地址,所述定位地点信息包括小区信息、住房楼号信息、以及门牌号信息。
可见,本示例中,通过人机对话引擎对人物信息、地点信息进行询问,同时适配用户受到的关注度低的情况,在保证用户安全的前提下获取报警事件的必要信息,提高了报警事务的效率的同时,提高用户在关注度低的伪装报警应用场景中进行人机对话的隐蔽性,以及提升用户进行人机交互时的智能体验感。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的答复指引语句为“是的话,请回复嗯;不是的话,请回复不”;所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,以及,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复嗯;不是的话,请回复不”。
其中,请参阅图3,图3是本申请实施例提供的一种人机交互界面示意图,如图3所示,所述第一信息获取剧情节点是从对话31开始,直到所述人机对话引擎输出的机器后结束,应理解的是,这里将对话31与对话32进行了拆分示意,所述对话31在本示例中即是所述人物询问语句,其中所述人物询问语句包括询问其他人数量、以及包括询问其他人的危险程度具体如图中的对话33所示的“他们有危险物品吗”;所述对话32在本示例中是所述第一机器输出语句中的所述答复指引语句。
具体地,在图3中,接收到来自用户的语音信息“我的外卖送到了吗”之后,还包括人机对话引擎输出的“我这里是110,请问是不方便说话吗”确认用户所处状态的语句,再次确认用户是否处于伪装报警场景中,并同时输出引导回复语句“如果是的话,请回复嗯”引导用户回复。
其中,所述多个信息获取剧情节点还包括所述用户的回复信息,所述人机对话引擎根据所述用户的回复信息进行语义识别,以判断用户根据所述第一机器输出语句中的所述答复指引语句进行回复的信息的真实意图,同时根据所述用户的回复信息触发跳转至下一信息获取剧情节点;如图3所示,根据所述答复指引语句所述用户的回复信息为“嗯”。
具体地,由于当前所述其他人对所述用户的关注度低,所述用户不能用过多语句进行表达,否则可能引起所述其他人注意,导致危险,所以只能通过简短的语气词、肯定词、或者否定词来进行语义表达。
可见,在本示例中,应用于目标事务包括外卖事务的场景,适配所述关注度低的第一人机对话剧本进行人机交互,回复语句简短同时不易引人关注,能够提高用户进行人机交互时的隐蔽性,保证了用户安全。
在一个可能的示例中,适配所述关注度高的情况的人机对话剧本为第二人机对话剧本,所述第二人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;所述机器输出语句包括所述人物询问语句和/或所述地点询问语句、以及所述答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户回复预设对话语句以实现针对所述机器输出语句的肯定答复或否定答复的,且所述预设对话语句的字面语义符合所述目标事务场景的前后文对话逻辑。
可见,本示例中,通过人机对话引擎对人物信息、地点信息进行询问,同时适配用户受到的关注度高的情况,在保证用户安全的前提下获取报警事件的必要信息,提高处理报警事务的效率的同时,提升人机交互的智能性,以及提高用户在关注度高的伪装报警应用场景中进行人机对话的伪装程度。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的答复指引语句为“是的话,请回复‘还没送到’;不是的话,请回复‘还没取餐’”;所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复‘好的请尽快送达’;不是的话,请回复‘应该送到(你现在所处的)A小区B楼C号的取餐架上’”。
具体地,这里所述人机对话引擎询问的“我这里是110,请问是不方便说话吗”应理解为警务人员的标准问话流程,辅助判断当前用户所处场景的情况。
其中,请参阅图4,图4实本申请实施例提供的另一种人机交互界面的示意图,如图4所示,在所述人物询问语句输出之后,相邻的对话41为所述第一机器输出语句中的所述答复指引语句,根据当前对话的前后逻辑进行设计,如对话41所示“是的话,请回复‘还没送到’;不是的话,请回复‘还没取餐’”,在正常的接收外卖对话场景中,对话逻辑应为用户询问“我的外卖到了吗”,骑手回复“还没有到请稍等”或者“还没取到餐请稍等”,用户回复的“还没送到”以及“还没取餐”都是对之前用户询问的“我的外卖送到了吗”的符合对话逻辑的答复。
具体地,应理解的是,在对话41之后,用户根据所述答复指引语句回复的“还没送到”意在指示:我身边有两个人;在这之后回复的“多久能送到”意在指示:他们有危险物品;在这之后回复的“好的请尽快送达”意在指示:我正处于A小区B楼C号。
可选地,若所述用户说的是“还没取餐”,其伪装的真实情况是用户质疑骑手,骑手可能回复抱歉之类的信息,然后用户应继续追问多久取到餐,这里所述人机对话引擎输出的所述第二机器输出语句中的所述答复指引语句为“是的话,请回复‘还要多久取到’;不是的话,请回复‘还要多久取餐’”,符合对话逻辑。
具体地,在所述输出所述地点询问语句时,可能因为***功能故障的原因导致用户定位地点存在偏差时,指引用户对所处地点信息进行反馈,通过所述第二机器输出语句中的所述答复指引语句“如果不是的话,请回复‘应该送到(你现在所处的)A小区B楼C号的取餐架上’”,指引用户输出符合实际对话逻辑的携带所述用户所处地点信息的语句。
可见,在本示例中,应用于目标事务包括外卖事务的场景,适配所述关注度高的第二人机对话剧本进行人机交互,回复的语句经过伪装后符合实际外卖事务场景的对话逻辑,但实际意图仍指示所述报警事件的基本信息,降低了其他人的戒备程度,提高了用户进行人机交互时的伪装程度,保证了用户安全。
在一个可能的示例中,适配所述关注度无法准确确认的人机对话剧本为第三人机对话剧本,所述第三人机对话剧本包括剧情节点位置排序在第一个的第一剧情节点,所述第一剧情节点包括第一机器输出语句;所述第一机器输出语句包括关注度询问语句和所述答复指引语句,所述答复指引语句包括肯定语义转换语句和否定语义转换语句;所述肯定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;所述否定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低。
可见,本示例中,适配用户受到的关注度无法确认的情况,首先对用户当前所处场景进行询问,再根据回复结果确定用户当前次的报警事件的关注度的情况,在保证用户安全的前提下,获取必要信息,准确高效地确定用户当前所处场景情况,提高了报警事务的处理效率,提高语义转换的智能性。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述第一机器输出语句的所述关注度询问语句为“请问你现在被其他人监视着吗”;所述第一机器输出语句中的所述肯定语义转换语句为“如果是的话,请回复‘为什么外卖还没送到’”,所述第一机器输出语句中的所述否定语义转换语句为“如果不是的话,请回复嗯”。
其中,请参阅图5,图5是本申请实施例提供的又一种人机交互界面的示意图,如图5所示,对话51“请问你现在被其他人监视着吗”为所述关注度询问语句,相邻的对话52“如果是的话,请回复‘为什么外卖还没送到’”为所述肯定语义转换语句,相邻的对话53如果不是的话,请回复嗯”为所述否定语义转换语句,应理解的是,这里若用户回复如对话54所示的语句“为什么外卖还没送到”,则判断当前所述用户处于关注度高的情况,并切换至适配的所述第二人机对话剧本;若用户回复如对话55所示的语句“嗯”,则判断当前所述用户处于关注度低的情况,并切换至适配的所述第一人机对话剧本。
具体地,根据所述关注度询问语句的设计,所述引导肯定语义转换语句所处的场景为“被人监视”,所以指引语句要符合当前目标事务场景的对话逻辑,并判断当前所述用户处于关注度高的情况,切换至适配的所述第二人机对话剧本;应理解的是,所述引导否定语义转换语句所处的场景为“未被人监视”,所以指引语句要足够简短、不易引人关注,并判断当前所述用户处于关注度低的情况,切换至适配的所述第一人机对话剧本。
可见,在本示例中,应用于目标事务包括外卖事务的场景,适配所述关注度无法准确确认的第三人机对话剧本进行人机交互,降低其他人的戒备程度,提高了人机交互的智能性,准确识别当前场景,并选择适配当前场景的人机对话剧本,保证了用户的安全。
步骤204,根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
具体地,所述出警任务中包括有获取到的所述报警事件的所述基本信息。
可见,图2是本申请提供的一种人机对话场景中基于场景识别的语音交互方法的流程示意图,服务器首先通过调用所述人机对话引擎与所述终端设备建立的通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况;选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。如此,能够提高人机对话场景中进行语义转换的智能性和准确度,同时提高伪装报警应用场景中用户的安全性和隐蔽性。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,移动电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图6,图6是本申请实施例提供的一种人机对话场景中基于场景识别的语音交互装置的功能单元组成框图,应用于人机对话服务***中的服务器,所述人机对话服务***包括所述服务器和终端设备,其中,所述服务器设置有人机对话引擎;所述装置600包括:
接收单元601,用于调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;
确定单元602,用于若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,所述其他人是指所述用户当前所处环境空间中的其他人,所述关注度的情况包括关注度高、关注度低、以及关注度无法准确确认,所述目标事务场景是指事务主题为除报警事务之外的任一事务场景;
选择单元603,用于选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息,所述基本信息包括地点信息和人物信息,所述人机对话剧本包括至少一个对话剧情节点,该对话剧情节点包括机器输出语句,所述机器输出语句包括案情询问语句和答复指引语句,所述案情询问语句是指以询问的方式陈述所述地点信息和/或人物信息,所述答复指引语句包括针对将所述案情询问语句的肯定答复的肯定语义转换语句、以及包括针对将所述案情询问语句的否定答复的否定语义转换语句,且所述肯定语义转换语句和所述否定语义转换语句的字面语义与所述用户前一次的对话语义之间的对话逻辑符合所述目标事务场景的对话逻辑;
创建单元604,用于根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
可以看出,本申请实施例中,首先通过调用所述人机对话引擎与所述终端设备建立的通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况;选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息;根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。如此,提高了在紧急场景下识别用户的真实意图的准确性和隐蔽性,保证用户安全。
在一个可能的示例中,所述根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,包括:分析所述环境音信息中是否存在多人争吵声音;若存在所述多人争吵声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低;若不存在所述多人争吵声音,则分析所述环境音信息中是否存在针对所述用户当前次的通话事件的关联询问语音信息;若存在所述关联询问语音信息,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;若不存在所述关联询问语音信息,则分析所述环境音信息中是否存在处于所述用户当前所处环境中的人物走动的声音;若存在所述处于所述用户当前所处环境中的人物走动的声音,确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;若不存在所述处于所述用户当前所处环境中的人物走动的声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度无法准确确认。
在一个可能的示例中,适配所述关注度低的情况的人机对话剧本为第一人机对话剧本,所述第一人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;所述机器输出语句包括人物询问语句和/或地点询问语句、以及答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户以简短字词实现针对所述机器输出语句的肯定答复或否定答复的指引语句,所述简短字词的字数不超过预设数量。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括所述人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的所述答复指引语句为“是的话,请回复嗯;不是的话,请回复不”;所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,以及,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复嗯;不是的话,请回复不”。
在一个可能的示例中,适配所述关注度高的情况的人机对话剧本为第二人机对话剧本,所述第二人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;所述机器输出语句包括所述人物询问语句和/或所述地点询问语句、以及所述答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户回复预设对话语句以实现针对所述机器输出语句的肯定答复或否定答复的,且所述预设对话语句的字面语义符合所述目标事务场景的前后文对话逻辑。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括所述人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的所述答复指引语句为“是的话,请回复‘还没送到’;不是的话,请回复‘还没取餐’”;所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复‘好的请尽快送达’;不是的话,请回复‘应该送到(你现在所处的)A小区B楼C号的取餐架上’”。
在一个可能的示例中,适配所述关注度无法准确确认的人机对话剧本为第三人机对话剧本,所述第三人机对话剧本包括剧情节点位置排序在第一个的第一剧情节点,所述第一剧情节点包括第一机器输出语句;所述第一机器输出语句包括关注度询问语句和所述答复指引语句,所述答复指引语句包括肯定语义转换语句和否定语义转换语句;所述肯定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;所述否定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低。
在一个可能的示例中,所述目标事务场景包括外卖事务场景,所述第一机器输出语句的所述关注度询问语句为“请问你现在被其他人监视着吗”;所述第一机器输出语句中的所述肯定语义转换语句为“如果是的话,请回复‘为什么外卖还没送到’”,所述第一机器输出语句中的所述否定语义转换语句为“如果不是的话,请回复嗯”。
在一个可能的示例中,在所述根据所述用户语音信息确定出所述用户处于伪装报警应用场景的方面,所述确定单元602具体用于包括:综合分析所述用户语音信息的语速、语气、以及连贯性,以确认所述用户当前处于意识清醒的状态;分析所述用户语音信息的语义,根据所述用户语音信息的语义确定所述用户是否处于所述伪装报警应用场景。
在一个可能的示例中,在所述接收来自所述终端设备的第一语音信息之后的方面,所述创建单元604具体还用于:若根据所述用户语音信息确定出所述用户未处于所述伪装报警应用场景,则切换至正常报警应用场景,并执行所述人机对话操作直至获取所述用户当前次的报警事件的基本信息,所述正常报警应用场景是指所述用户以报警事务场景的对话逻辑进行对话以实现报警目的应用场景,所述报警事务场景是指事务主题为报警事务的事务场景;以及,根据所述用户当前次的报警事件的基本信息创建第二出警任务,并向对应的警务人员发布所述第二出警任务。
在采用集成的单元的情况下,如图7所示,图7是本申请实施例提供的另一种语音交互装置的功能单元组成框图。在图7中,人机对话场景中基于场景识别的语音交互装置71包括:处理模块712和通信模块711。处理模块712用于对人机对话场景中基于场景识别的语音交互装置的动作进行控制管理,例如,接收单元601、确定单元602、选择单元603和创建单元604的步骤,和/或用于执行本文所描述的技术的其它过程。通信模块711用于支持人机对话场景中基于场景识别的语音交互装置与其他设备之间的交互。如图7所示,人机对话场景中基于场景识别的语音交互装置还可以包括存储模块713,存储模块713用于存储人机对话场景中基于场景识别的语音交互装置的程序代码和数据。
其中,处理模块712可以是处理器或控制器,例如可以是中央处理器(CentralProcessing Unit,CPU),通用处理器,数字信号处理器(Digital Signal Processor,DSP),ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块711可以是收发器、RF电路或通信接口等。存储模块713可以是存储器。
其中,上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。上述人机对话场景中基于场景识别的语音交互装置71均可执行上述图2所示的一种人机对话场景中基于场景识别的语音交互方法。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
图8是本申请实施例提供的一种服务器的结构框图。如图8所示,服务器800可以包括一个或多个如下部件:处理器801、与处理器801耦合的存储器802,其中存储器802可存储有一个或多个计算机程序,一个或多个计算机程序可以被配置为由一个或多个处理器801执行时实现如上述各实施例描述的方法。所述服务器800可以是上述实施例中的服务器110。
处理器801可以包括一个或者多个处理核。处理器801利用各种接口和线路连接整个服务器800内的各个部分,通过运行或执行存储在存储器802内的指令、程序、代码集或指令集,以及调用存储在存储器802内的数据,执行服务器800的各种功能和处理数据。可选地,处理器801可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogicArray,PLA)中的至少一种硬件形式来实现。处理器801可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作***、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器801中,单独通过一块通信芯片进行实现。
存储器802可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。存储器802可用于存储指令、程序、代码、代码集或指令集。存储器802可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作***的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等。存储数据区还可以存储服务器800在使用中所创建的数据等。
可以理解的是,服务器800可包括比上述结构框图中更多或更少的结构元件,在此不进行限定。
本申请实施例还提供一种计算机存储介质,其中,其上存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和***,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、磁碟、光盘、易失性存储器或非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,RAM)可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)等各种可以存储程序代码的介质。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,可轻易想到变化或替换,均可作各种更动与修改,包含上述不同功能、实施步骤的组合,包含软件和硬件的实施方式,均在本发明的保护范围。

Claims (10)

1.一种人机对话场景中基于场景识别的语音交互方法,其特征在于,应用于人机对话服务***中的服务器,所述人机对话服务***包括所述服务器和终端设备,其中,所述服务器设置有人机对话引擎;所述方法包括:
调用所述人机对话引擎与所述终端设备建立通话连接,通过所述通话连接接收来自所述终端设备的第一语音信息,所述第一语音信息包括用户语音信息和环境音信息,所述通话连接对应警务平台的电话报警业务;
若根据所述用户语音信息确定出所述用户处于伪装报警应用场景,所述伪装报警应用场景是指所述用户以目标事务场景的对话逻辑进行对话以实现报警目的应用场景,则根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,所述其他人是指所述用户当前所处环境空间中的其他人,所述关注度的情况包括关注度高、关注度低、以及关注度无法准确确认,所述目标事务场景是指事务主题为除报警事务之外的任一事务场景;
选择适配确定出的所述关注度的情况的人机对话剧本与所述用户执行人机对话操作,直至获取所述用户当前次的报警事件的基本信息,所述基本信息包括地点信息和人物信息,所述人机对话剧本包括至少一个对话剧情节点,该对话剧情节点包括机器输出语句,所述机器输出语句包括案情询问语句和答复指引语句,所述案情询问语句是指以询问的方式陈述所述地点信息和/或人物信息,所述答复指引语句包括针对将所述案情询问语句的肯定答复的肯定语义转换语句、以及包括针对将所述案情询问语句的否定答复的否定语义转换语句,且所述肯定语义转换语句和所述否定语义转换语句的字面语义与所述用户前一次的对话语义之间的对话逻辑符合所述目标事务场景的对话逻辑;
根据所述用户当前次的报警事件的基本信息创建第一出警任务,并向对应的警务人员发布所述第一出警任务。
2.根据权利要求1所述的方法,其特征在于,所述根据所述环境音信息确定其他人对所述用户当前次的报警事件的关注度的情况,包括:
分析所述环境音信息中是否存在多人争吵声音;
若存在所述多人争吵声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低;
若不存在所述多人争吵声音,则分析所述环境音信息中是否存在针对所述用户当前次的通话事件的关联询问语音信息;
若存在所述关联询问语音信息,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;
若不存在所述关联询问语音信息,则分析所述环境音信息中是否存在处于所述用户当前所处环境中的人物走动的声音;
若存在所述处于所述用户当前所处环境中的人物走动的声音,确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;
若不存在所述处于所述用户当前所处环境中的人物走动的声音,则确定出所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度无法准确确认。
3.根据权利要求2所述的方法,其特征在于,适配所述关注度低的情况的人机对话剧本为第一人机对话剧本,所述第一人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;
所述机器输出语句包括所述人物询问语句和/或地点询问语句、以及所述答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户以简短字词实现针对所述机器输出语句的肯定答复或否定答复的指引语句,所述简短字词的字数不超过预设数量。
4.根据权利要求3所述的方法,其特征在于,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;
所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括所述人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的所述答复指引语句为“是的话,请回复嗯;不是的话,请回复不”;
所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,以及,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复嗯;不是的话,请回复不”。
5.根据权利要求2所述的方法,其特征在于,适配所述关注度高的情况的人机对话剧本为第二人机对话剧本,所述第二人机对话剧本包括至少一个信息获取剧情节点,单个信息获取剧情节点包括机器输出语句;
所述机器输出语句包括所述人物询问语句和/或所述地点询问语句、以及所述答复指引语句,所述人物询问语句是指用于询问所述用户所处现场其他人员的数量是否为根据所述环境音信息确定出的目标数量的询问语句,所述地点询问语句是指询问所述用户的地址是否为所述终端设备的定位地点信息的询问语句,所述答复指引语句是指引导所述用户回复预设对话语句以实现针对所述机器输出语句的肯定答复或否定答复的,且所述预设对话语句的字面语义符合所述目标事务场景的前后文对话逻辑。
6.根据权利要求5所述的方法,其特征在于,所述目标事务场景包括外卖事务场景,所述至少一个信息获取剧情节点包括第一信息获取剧情节点和第二信息获取剧情节点;
所述第一信息获取剧情节点包括第一机器输出语句,所述第一机器输出语句包括所述人物询问语句,所述人物询问语句为“你身边是有两个人吗”,所述第一机器输出语句中的所述答复指引语句为“是的话,请回复‘还没送到’;不是的话,请回复‘还没取餐’”;
所述第二信息获取剧情节点包括第二机器输出语句,所述第二机器输出语句包括地点询问语句,所述地点询问语句为“请问你现在处于A小区B楼C号吗”,所述第二机器输出语句中的所述答复指引语句为“是的话,请回复‘好的请尽快送达’;不是的话,请回复‘应该送到(你现在所处的)A小区B楼C号的取餐架上’”。
7.根据权利要求2所述的方法,其特征在于,适配所述关注度无法准确确认的人机对话剧本为第三人机对话剧本,所述第三人机对话剧本包括剧情节点位置排序在第一个的第一剧情节点,所述第一剧情节点包括第一机器输出语句;
所述第一机器输出语句包括关注度询问语句和所述答复指引语句,所述答复指引语句包括肯定语义转换语句和否定语义转换语句;
所述肯定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度高;所述否定语义转换语句用于指示所述其他人对所述用户当前次的报警事件的关注度的情况为所述关注度低。
8.根据权利要求7所述的方法,其特征在于,所述目标事务场景包括外卖事务场景,所述第一机器输出语句的所述关注度询问语句为“请问你现在被其他人监视着吗”;
所述第一机器输出语句中的所述肯定语义转换语句为“如果是的话,请回复‘为什么外卖还没送到’”,所述第一机器输出语句中的所述否定语义转换语句为“如果不是的话,请回复嗯”。
9.根据权利要求1所述的方法,其特征在于,所述根据所述用户语音信息确定出所述用户处于伪装报警应用场景,包括:
综合分析所述用户语音信息的语速、语气、以及连贯性,以确认所述用户当前处于意识清醒的状态;
分析所述用户语音信息的语义,根据所述用户语音信息的语义确定所述用户是否处于所述伪装报警应用场景。
10.根据权利要求1-9任一项所述的方法,其特征在于,在所述接收来自所述终端设备的第一语音信息之后,所述方法还包括:
若根据所述用户语音信息确定出所述用户未处于所述伪装报警应用场景,则切换至正常报警应用场景,并执行所述人机对话操作直至获取所述用户当前次的报警事件的基本信息,所述正常报警应用场景是指所述用户以报警事务场景的对话逻辑进行对话以实现报警目的应用场景,所述报警事务场景是指事务主题为报警事务的事务场景;以及,
根据所述用户当前次的报警事件的基本信息创建第二出警任务,并向对应的警务人员发布所述第二出警任务。
CN202211355953.0A 2022-11-01 2022-11-01 人机对话场景中基于场景识别的语音交互方法 Active CN115410601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211355953.0A CN115410601B (zh) 2022-11-01 2022-11-01 人机对话场景中基于场景识别的语音交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211355953.0A CN115410601B (zh) 2022-11-01 2022-11-01 人机对话场景中基于场景识别的语音交互方法

Publications (2)

Publication Number Publication Date
CN115410601A true CN115410601A (zh) 2022-11-29
CN115410601B CN115410601B (zh) 2022-12-30

Family

ID=84169216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211355953.0A Active CN115410601B (zh) 2022-11-01 2022-11-01 人机对话场景中基于场景识别的语音交互方法

Country Status (1)

Country Link
CN (1) CN115410601B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115565518A (zh) * 2022-11-30 2023-01-03 深圳市人马互动科技有限公司 互动游戏中玩家配音的处理方法及相关装置
CN116050939A (zh) * 2023-03-07 2023-05-02 深圳市人马互动科技有限公司 基于互动小说的用户测评方法及相关装置
CN116091136A (zh) * 2023-01-28 2023-05-09 深圳市人马互动科技有限公司 基于代言人的电话营销方法、装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080143548A1 (en) * 2006-12-19 2008-06-19 Swn Communications Inc. On-demand alerting and response system and method
CN103945049A (zh) * 2013-01-23 2014-07-23 三星电子(中国)研发中心 用于在移动终端中收集证据和自动报警的装置和方法
CN107959748A (zh) * 2016-10-17 2018-04-24 腾讯科技(深圳)有限公司 自动报警方法及装置
CN109817202A (zh) * 2019-01-22 2019-05-28 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及语音设备
CN113345434A (zh) * 2021-05-31 2021-09-03 平安科技(深圳)有限公司 网约车用户报警方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080143548A1 (en) * 2006-12-19 2008-06-19 Swn Communications Inc. On-demand alerting and response system and method
CN103945049A (zh) * 2013-01-23 2014-07-23 三星电子(中国)研发中心 用于在移动终端中收集证据和自动报警的装置和方法
CN107959748A (zh) * 2016-10-17 2018-04-24 腾讯科技(深圳)有限公司 自动报警方法及装置
CN109817202A (zh) * 2019-01-22 2019-05-28 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及语音设备
CN113345434A (zh) * 2021-05-31 2021-09-03 平安科技(深圳)有限公司 网约车用户报警方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115565518A (zh) * 2022-11-30 2023-01-03 深圳市人马互动科技有限公司 互动游戏中玩家配音的处理方法及相关装置
CN115565518B (zh) * 2022-11-30 2023-03-24 深圳市人马互动科技有限公司 互动游戏中玩家配音的处理方法及相关装置
CN116091136A (zh) * 2023-01-28 2023-05-09 深圳市人马互动科技有限公司 基于代言人的电话营销方法、装置
CN116091136B (zh) * 2023-01-28 2023-06-23 深圳市人马互动科技有限公司 基于代言人的电话营销方法、装置
CN116050939A (zh) * 2023-03-07 2023-05-02 深圳市人马互动科技有限公司 基于互动小说的用户测评方法及相关装置

Also Published As

Publication number Publication date
CN115410601B (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN115410601B (zh) 人机对话场景中基于场景识别的语音交互方法
US10839803B2 (en) Contextual hotwords
CN110392913A (zh) 在共用的启用语音的装置上处理呼叫
CN111970409B (zh) 基于人机交互的语音处理方法、装置、设备和存储介质
KR20190012255A (ko) 선택적으로 조종 가능한 상태 머신을 갖는 개인 보조 모듈 제공
US20160293157A1 (en) Contextual Voice Action History
CN112201246B (zh) 基于语音的智能控制方法、装置、电子设备及存储介质
US9542074B2 (en) Method and apparatus for enhancing an interactive voice response (IVR) system
CN105814535A (zh) 呼叫中的虚拟助理
KR20200005617A (ko) 화자 구분
CN109726265A (zh) 辅助聊天的信息处理方法、设备及计算机可读存储介质
CN113674742B (zh) 人机交互方法、装置、设备以及存储介质
US20190349480A1 (en) Inquiry processing method, system, terminal, automatic voice interactive device, display processing method, telephone call controlling method, and storage medium
CN112313930A (zh) 管理保持的方法和装置
JP2023506087A (ja) スキルの音声ウェイクアップ方法および装置
CN112767916A (zh) 智能语音设备的语音交互方法、装置、设备、介质及产品
KR20230147157A (ko) 어시스턴트 명령(들)의 컨텍스트적 억제
CN113037914A (zh) 用于处理呼入电话的方法、相关装置及计算机程序产品
CN115563262B (zh) 机器语音外呼场景中对话数据的处理方法及相关装置
KR101798765B1 (ko) 통화중 질의에 대한 실시간 응답 장치 및 방법
CN112420043A (zh) 基于语音的智能唤醒方法、装置、电子设备及存储介质
CN109788128A (zh) 一种来电提示方法、来电提示装置及终端设备
CN116016779A (zh) 语音通话翻译辅助方法、***、计算机设备和存储介质
CN116233316A (zh) 语音信息处理方法、装置、***、设备及介质
CN104503736A (zh) 一种信息提示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant