CN108962235B - 语音交互方法及装置 - Google Patents

语音交互方法及装置 Download PDF

Info

Publication number
CN108962235B
CN108962235B CN201711446766.2A CN201711446766A CN108962235B CN 108962235 B CN108962235 B CN 108962235B CN 201711446766 A CN201711446766 A CN 201711446766A CN 108962235 B CN108962235 B CN 108962235B
Authority
CN
China
Prior art keywords
content acquisition
acquisition instruction
instruction
content
skill field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711446766.2A
Other languages
English (en)
Other versions
CN108962235A (zh
Inventor
高慧湍
韩伟
李茂全
***
修铭徽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orion Star Technology Co Ltd
Original Assignee
Beijing Orion Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orion Star Technology Co Ltd filed Critical Beijing Orion Star Technology Co Ltd
Priority to CN201711446766.2A priority Critical patent/CN108962235B/zh
Publication of CN108962235A publication Critical patent/CN108962235A/zh
Application granted granted Critical
Publication of CN108962235B publication Critical patent/CN108962235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提出一种语音交互方法及装置,其中方法包括:接收第一内容获取指令,根据第一内容获取指令获取内容;若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容,本实施例能够实现用户通过多次内容获取指令来表达意图;且由于周围环境中的噪音等的领域与用户的内容获取指令的技能领域一般不相关,因此本实施例能够避免语音设备“错误”的执行周围环境中的语音指令,从而提高语音交互效率,提高用户使用语音设备的体验。

Description

语音交互方法及装置
技术领域
本发明涉及语音设备技术领域,尤其涉及一种语音交互方法及装置。
背景技术
目前的语音交互方法主要有两种,一种是每次唤醒后,只执行一次语音指令。另一种是每次唤醒后,允许执行在特定时间段内接收到的语音指令。然而,第一种方案中需要用户频繁地唤醒语音设备,尤其是在用户无法通过一次语音指令表达意图的情况下,通过第一种方案难以实现用户与语音设备之间的有效交互。第二种方案中,由于语音设备一般使用在开放场景中,面临的噪音和背景音很多,容易导致语音设备“错误”的执行周围环境中的语音指令,难以实现用户与语音设备之间的有效交互,降低了语音交互效率,降低了用户使用语音设备的体验。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种语音交互方法,用于解决现有技术中语音交互效率差,影响用户使用语音设备体验的问题。
本发明的第二个目的在于提出一种语音交互装置。
本发明的第三个目的在于提出一种电子设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种语音交互方法,包括:
接收第一内容获取指令,根据所述第一内容获取指令获取内容;
若在预设时间段内接收到第二内容获取指令,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域;
若确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域或者相关技能领域,根据所述第二内容获取指令获取内容。
进一步的,所述的方法还包括:
若确定所述第二内容获取指令与所述第一内容获取指令不属于相同技能领域或者相关技能领域,不响应所述第二内容获取指令。
进一步的,若确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域,根据所述第二内容获取指令获取内容,具体包括:
根据所述第二内容获取指令的解析结果,结合所述第一内容获取指令的解析结果,获取内容;
若确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域,根据所述第二内容获取指令获取内容,具体包括:
根据所述第二内容获取指令的解析结果,获取内容。
进一步的,所述预设时间段根据第一内容获取指令所属的技能领域确定。
进一步的,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域,具体包括:
根据指令解析结果,确定所述第一内容获取指令所属的第一技能领域,以及所述第二内容获取指令所属的第二技能领域;
若所述第一技能领域与所述第二技能领域相同,确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域;
若所述第一技能领域与所述第二技能领域不相同,查询预设的相关领域映射规则,确定与所述第一技能领域对应的预设相关技能领域;
若所述预设相关技能领域中包括所述第二技能领域,确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域。
进一步的,在判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域之前,还包括:
确定所述第二内容获取指令不为唤醒指令。
进一步的,所述的方法还包括:若所述第二内容获取指令为唤醒指令,响应所述唤醒指令。
本实施例提供的语音交互方法,接收第一内容获取指令,根据第一内容获取指令获取内容;若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容,本实施例能够实现用户通过多次内容获取指令来表达意图;且由于周围环境中的噪音等的领域与用户的内容获取指令的技能领域一般不相关,因此本实施例能够避免语音设备“错误”的执行周围环境中的语音指令,从而提高语音交互效率,提高用户使用语音设备的体验。
为达上述目的,本发明第二方面实施例提出了一种语音交互装置,包括:
获取模块,用于接收第一内容获取指令,根据所述第一内容获取指令获取内容;
判断模块,用于在预设时间段内接收到第二内容获取指令时,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域;
所述获取模块,还用于在确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域或者相关技能领域时,根据所述第二内容获取指令获取内容。
进一步的,所述的装置还包括:
处理模块,用于在确定所述第二内容获取指令与所述第一内容获取指令不属于相同技能领域或者相关技能领域时,不响应所述第二内容获取指令。
进一步的,所述获取模块具体用于,
在确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域时,根据所述第二内容获取指令的解析结果,结合所述第一内容获取指令的解析结果,获取内容;
在确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域时,根据所述第二内容获取指令的解析结果,获取内容。
进一步的,所述预设时间段根据第一内容获取指令所属的技能领域确定。
进一步的,所述判断模块具体用于,
根据指令解析结果,确定所述第一内容获取指令所属的第一技能领域,以及所述第二内容获取指令所属的第二技能领域;
若所述第一技能领域与所述第二技能领域相同,确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域;
若所述第一技能领域与所述第二技能领域不相同,查询预设的相关领域映射规则,确定与所述第一技能领域对应的预设相关技能领域;
若所述预设相关技能领域中包括所述第二技能领域,确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域。
进一步的,所述判断模块还用于,在判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域之前,确定所述第二内容获取指令不为唤醒指令。
进一步的,所述的装置还包括:
响应模块,用于在所述第二内容获取指令为唤醒指令时,响应所述唤醒指令。
本实施例提供的语音交互装置,接收第一内容获取指令,根据第一内容获取指令获取内容;若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容,本实施例能够实现用户通过多次内容获取指令来表达意图;且由于周围环境中的噪音等的领域与用户的内容获取指令的技能领域一般不相关,因此本实施例能够避免语音设备“错误”的执行周围环境中的语音指令,从而提高语音交互效率,提高用户使用语音设备的体验。
为达上述目的,本发明第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上所述的语音交互方法。
为了实现上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的语音交互方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上所述的语音交互方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种语音交互方法的流程示意图;
图2为本发明实施例提供的一种语音交互装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的语音交互方法及装置。
图1为本发明实施例提供的一种语音交互方法的流程示意图。如图1所示,该语音交互方法包括以下步骤:
S101、接收第一内容获取指令,根据第一内容获取指令获取内容。
本发明提供的语音交互方法的执行主体为语音交互装置,语音交互装置具体可以为语音设备对应的后台服务器,或者语音设备。语音设备例如可以为,智能音箱、智能空调、智能洗衣机、智能电视等可以与用户进行语音交互,根据用户的指令进行相应操作的设备。
本实施例中,在语音交互装置为语音设备对应的后台服务器的情况下,第一内容获取指令的获取方式可以为,语音设备与用户进行交互的过程中,监听获取到用户的语音指令后,直接发送到后台服务器。后台服务器获取到第一内容获取指令后,可以对第一内容获取指令进行语音识别,获取第一内容获取指令的解析结果,根据第一内容获取指令的解析结果获取内容。
本实施例中,在语音交互装置为语音设备的情况下,第一内容获取指令的获取方式可以为,语音设备与用户进行交互的过程中,监听获取到的用户的语音指令。语音交互装置获取到第一内容获取指令后,可以对第一内容获取指令进行语音识别,获取第一内容获取指令的解析结果,根据第一内容获取指令的解析结果获取内容。
需要说明的是,本实施例中,内容可以为对第一内容获取指令的应答结果。例如,在第一内容获取指令为“我想听忘情水”时,对应的内容可以为“路人甲版本的忘情水”;又例如,在第一内容获取指令为“我想听逻辑思维”,对应的内容可以为“逻辑思维的第12集”;在第一内容获取指令为“查询天气”,对应的内容可以为“下雨”。
S102、若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域。
其中,预设时间段根据第一内容获取指令所属的技能领域确定。本实施例中,步骤102之前,语音交互装置在接收到第一内容获取指令后,可以根据第一内容获取指令的解析结果,确定第一内容获取指令所属的第一技能领域,确定第一技能领域对应的预设时间段,并进行计时,判断在预设时间段内是否接收到第二内容获取指令;若在预设时间段内未接收到第二内容获取指令,则此次语音交互结束。
本实施例中,在语音交互装置为语音设备对应的后台服务器的情况下,语音交互结束后,语音交互装置可以向语音设备发送停止交互指令,使得语音设备不再接收语音指令,直至语音设备接收到用户的唤醒指令,进行唤醒操作后,重新接收并向语音交互装置发送语音指令。在语音交互装置为语音设备的情况下,语音交互结束后,语音交互装置不再接收语音指令,直至接收到用户的唤醒指令,进行唤醒操作后,重新开始接收用户的语音指令。
本实施例中,在语音交互装置为语音设备对应的后台服务器的情况下,语音交互装置根据第一内容获取指令的解析结果,确定第一内容获取指令所属的第一技能领域的第一种方式可以为:将第一内容获取指令的解析结果输入预设的技能领域模型,得到解析结果属于各个技能领域的概率;根据解析结果属于各个技能领域的概率,确定第一内容获取指令所属的第一技能领域。其中,预设的技能领域模型可以为根据各个技能领域对应的大量语句或者词语训练得到的技能领域模型。
在语音交互装置为语音设备对应的后台服务器的情况下,语音交互装置根据第一内容获取指令的解析结果,确定第一内容获取指令所属的第一技能领域的另一种方式可以为:对第一内容获取指令的解析结果进行分词,获取分词结果;将分词结果中的各个词语与各个技能领域中的词语进行比对,确定分词结果中属于各个技能领域的词语的数量;根据分词结果中属于各个技能领域的词语的数量,确定第一内容获取指令所属的第一技能领域。
当然,也可以采用其它方式确定第一内容获取指令所属的第一技能领域,在此不再举例。
确定第二内容获取指令所属的第二技能领域的实现方式可以与确定第一内容获取指令所属的第一技能领域的实现方式相同,在此不再详述。
本实施例中,各个技能领域对应的预设时间段可以根据实际需要进行设定,此处不做具体限定。
若在预设时间段内接收到第二内容获取指令,语音交互装置判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域的第一种方式具体可以为,根据指令解析结果,确定第一内容获取指令所属的第一技能领域,以及第二内容获取指令所属的第二技能领域;若第一技能领域与第二技能领域相同,确定第二内容获取指令与第一内容获取指令属于相同技能领域;若第一技能领域与第二技能领域不相同,查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域;若预设相关技能领域中包括第二技能领域,确定第二内容获取指令与第一内容获取指令属于相关技能领域。若预设相关技能领域中不包括第二技能领域,则确定第二内容获取指令与第一内容获取指令不属于相同技能领域,也不属于相关技能领域。
其中,预设的相关领域映射规则中保存有各技能领域对应的预设相关技能领域。
若在预设时间段内接收到第二内容获取指令,语音交互装置判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域的第二种方式具体可以为,根据指令解析结果,确定第一内容获取指令所属的第一技能领域,以及第二内容获取指令所属的第二技能领域;查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域;若预设相关技能领域中包括第二技能领域,确定第二内容获取指令与第一内容获取指令属于相关技能领域;若预设相关技能领域中不包括第二技能领域,则判断第一技能领域与第二技能领域是否相同,若第一技能领域与第二技能领域相同,确定第二内容获取指令与第一内容获取指令属于相同技能领域;若第一技能领域与第二技能领域不同,则确定第二内容获取指令与第一内容获取指令不属于相同技能领域,也不属于相关技能领域。
进一步的,在上述实施例的基础上,语音交互装置在判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域之前,可以先判断第二内容获取指令是否为唤醒指令;若第二内容获取指令不为唤醒指令,则判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若第二内容获取指令为唤醒指令,则响应唤醒指令。
S103、若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容。
本实施例中,若确定第二内容获取指令与第一内容获取指令属于相同技能领域,则语音交互装置可以根据第二内容获取指令的解析结果,结合第一内容获取指令的解析结果,获取内容。若确定第二内容获取指令与第一内容获取指令属于相关技能领域,则语音交互装置可以根据第二内容获取指令的解析结果,获取内容。
例如,在第一内容获取指令为“我想听忘情水”,第二内容获取指令为“我想听刘德华的”的情况下,第二内容获取指令与第一内容获取指令属于相同技能领域,则对应的内容可以为“刘德华的忘情水”。在第一内容获取指令为“我想听逻辑思维”,第二内容获取指令为“第9集”的情况下,第二内容获取指令与第一内容获取指令属于相同技能领域,对应的内容可以为“逻辑思维的第9集”。
又例如,在第一内容获取指令为“查询天气”,第二内容获取指令为“给我叫一辆车,我也打车去公司”的情况下,第二内容获取指令与第一内容获取指令属于相关技能领域,对应的内容可以为“开启打车功能”,比如根据地点调起打车软件、自动输入公司地址、预定行程等。
另外,还需要进行说明的是,所述的方法还包括:若确定第二内容获取指令与第一内容获取指令不属于相同技能领域或者相关技能领域,则语音交互装置不响应第二内容获取指令,并继续进行计时,判断在预设时间段到达之前,是否接收到第三内容获取指令;若未接收到第三内容获取指令,则此次语音交互结束。
本实施例提供的语音交互方法,接收第一内容获取指令,根据第一内容获取指令获取内容;若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容,本实施例能够实现用户通过多次内容获取指令来表达意图;且由于周围环境中的噪音等的领域与用户的内容获取指令的技能领域一般不相关,因此本实施例能够避免语音设备“错误”的执行周围环境中的语音指令,从而提高语音交互效率,提高用户使用语音设备的体验。
图2为本发明实施例提供的一种语音交互装置的结构示意图。如图2所示,包括:获取模块21和判断模块22。
其中,获取模块21,用于接收第一内容获取指令,根据所述第一内容获取指令获取内容;
判断模块22,用于在预设时间段内接收到第二内容获取指令时,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域;
所述获取模块21,还用于在确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域或者相关技能领域时,根据所述第二内容获取指令获取内容。
本发明提供的语音交互装置具体可以为语音设备,或者语音设备对应的后台服务器。语音设备例如可以为,智能音箱、智能空调、智能洗衣机、智能电视等可以与用户进行语音交互,根据用户的指令进行相应操作的设备。
本实施例中,在语音交互装置为语音设备的情况下,第一内容获取指令的获取方式可以为,语音设备与用户进行交互的过程中,监听获取到的用户的语音指令。语音交互装置获取到第一内容获取指令后,可以对第一内容获取指令进行语音识别,获取第一内容获取指令的解析结果,根据第一内容获取指令的解析结果获取内容。
在语音交互装置为语音设备对应的后台服务器的情况下,第一内容获取指令的获取方式可以为,语音设备与用户进行交互的过程中,监听获取到用户的语音指令后,直接发送到后台服务器。后台服务器获取到第一内容获取指令后,可以对第一内容获取指令进行语音识别,获取第一内容获取指令的解析结果,根据第一内容获取指令的解析结果获取内容。
其中,预设时间段根据第一内容获取指令所属的技能领域确定。本实施例中,步骤102之前,语音交互装置在接收到第一内容获取指令后,可以根据第一内容获取指令的解析结果,确定第一内容获取指令所属的第一技能领域,确定第一技能领域对应的预设时间段,并进行计时,判断在预设时间段内是否接收到第二内容获取指令;若在预设时间段内未接收到第二内容获取指令,则此次语音交互结束。
在语音交互装置为语音设备的情况下,语音交互结束后,语音交互装置不再接收语音指令,直至接收到用户的唤醒指令,进行唤醒操作后,重新开始接收用户的语音指令。在语音交互装置为语音设备对应的后台服务器的情况下,语音交互结束后,语音交互装置可以向语音设备发送停止交互指令,使得语音设备不再接收语音指令,直至语音设备接收到用户的唤醒指令,进行唤醒操作后,重新接收并向语音交互装置发送语音指令。
进一步的,所述判断模块22具体可以用于,根据指令解析结果,确定第一内容获取指令所属的第一技能领域,以及第二内容获取指令所属的第二技能领域;若第一技能领域与第二技能领域相同,确定第二内容获取指令与第一内容获取指令属于相同技能领域;若第一技能领域与第二技能领域不相同,查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域;若预设相关技能领域中包括第二技能领域,确定第二内容获取指令与第一内容获取指令属于相关技能领域。若预设相关技能领域中不包括第二技能领域,则确定第二内容获取指令与第一内容获取指令不属于相同技能领域,也不属于相关技能领域。
进一步的,所述判断模块22具体还可以用于,根据指令解析结果,确定第一内容获取指令所属的第一技能领域,以及第二内容获取指令所属的第二技能领域;查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域;若预设相关技能领域中包括第二技能领域,确定第二内容获取指令与第一内容获取指令属于相关技能领域;若预设相关技能领域中不包括第二技能领域,则判断第一技能领域与第二技能领域是否相同,若第一技能领域与第二技能领域相同,确定第二内容获取指令与第一内容获取指令属于相同技能领域;若第一技能领域与第二技能领域不同,则确定第二内容获取指令与第一内容获取指令不属于相同技能领域,也不属于相关技能领域。
其中,预设的相关领域映射规则中保存有各技能领域对应的预设相关技能领域。
进一步的,所述获取模块21具体用于,在确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域时,根据所述第二内容获取指令的解析结果,结合所述第一内容获取指令的解析结果,获取内容;在确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域时,根据所述第二内容获取指令的解析结果,获取内容。
例如,在第一内容获取指令为“我想听忘情水”,第二内容获取指令为“我想听刘德华的”的情况下,第二内容获取指令与第一内容获取指令属于相同技能领域,则对应的内容可以为“刘德华的忘情水”。在第一内容获取指令为“我想听逻辑思维”,第二内容获取指令为“第9集”的情况下,第二内容获取指令与第一内容获取指令属于相同技能领域,对应的内容可以为“逻辑思维的第9集”。在第一内容获取指令为“查询天气”,第二内容获取指令为“给我叫一辆车,我也打车去公司”的情况下,第二内容获取指令与第一内容获取指令属于相关技能领域,对应的内容可以为“开启打车功能”,比如根据地点调起打车软件、自动输入公司地址、预定行程等。
进一步的,在上述实施例的基础上,所述判断模块22还用于,在判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域或者相关技能领域之前,先判断第二内容获取指令是否为唤醒指令;若第二内容获取指令不为唤醒指令,则判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域。另外,所述的语音交互装置还包括:响应模块,用于在第二内容获取指令为唤醒指令时,响应唤醒指令。
进一步的,在上述实施例的基础上,所述的装置还可以包括:处理模块,用于在确定第二内容获取指令与第一内容获取指令不属于相同技能领域或者相关技能领域时,不响应第二内容获取指令,并继续进行计时,判断在预设时间段到达之前,是否接收到第三内容获取指令;若未接收到第三内容获取指令,则此次语音交互结束。
本实施例提供的语音交互装置,接收第一内容获取指令,根据第一内容获取指令获取内容;若在预设时间段内接收到第二内容获取指令,判断第二内容获取指令与第一内容获取指令是否属于相同技能领域或者相关技能领域;若确定第二内容获取指令与第一内容获取指令属于相同技能领域或者相关技能领域,根据第二内容获取指令获取内容,本实施例能够实现用户通过多次内容获取指令来表达意图;且由于周围环境中的噪音等的领域与用户的内容获取指令的技能领域一般不相关,因此本实施例能够避免语音设备“错误”的执行周围环境中的语音指令,从而提高语音交互效率,提高用户使用语音设备的体验。
图3为本发明实施例提供的一种电子设备的结构示意图。该电子设备包括:
存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。
处理器1002执行所述程序时实现上述实施例中提供的语音交互方法。
进一步地,电子设备还包括:
通信接口1003,用于存储器1001和处理器1002之间的通信。
存储器1001,用于存放可在处理器1002上运行的计算机程序。
存储器1001可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
处理器1002,用于执行所述程序时实现上述实施例所述的语音交互方法。
如果存储器1001、处理器1002和通信接口1003独立实现,则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1001、处理器1002及通信接口1003,集成在一块芯片上实现,则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。
处理器1002可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的语音交互方法。
本发明还提供一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,实现如上所述的语音交互方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技能领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技能领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (16)

1.一种语音交互方法,其特征在于,包括:
接收第一内容获取指令,根据所述第一内容获取指令获取所述第一内容获取指令的应答结果;
若在预设时间段内接收到第二内容获取指令,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域;
若确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域,根据所述第二内容获取指令,结合所述第一内容获取指令获取所述第二内容获取指令的应答结果;否则,不根据所述第二内容获取指令,结合所述第一内容获取指令获取所述第二内容获取指令的应答结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
若确定所述第二内容获取指令与所述第一内容获取指令不属于相同技能领域,判断所述第二内容获取指令与所述第一内容获取指令是否属于相关技能领域;
若确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域,根据所述第二内容获取指令获取所述第二内容获取指令的应答结果。
3.根据权利要求2所述的方法,其特征在于,还包括:
若确定所述第二内容获取指令与所述第一内容获取指令不属于相关技能领域,不响应所述第二内容获取指令。
4.根据权利要求1所述的方法,其特征在于,所述预设时间段根据第一内容获取指令所属的技能领域确定。
5.根据权利要求2所述的方法,其特征在于,
判断所述第二内容获取指令与所述第一内容获取指令是否属于相关技能领域,具体包括:
查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域,其中,所述第一技能领域为所述第一内容获取指令所属的技能领域;
若所述预设相关技能领域中包括第二技能领域,确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域,其中,所述第二技能领域为所述第二内容获取指令所属的技能领域。
6.根据权利要求1所述的方法,其特征在于,在判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域之前,还包括:
确定所述第二内容获取指令不为唤醒指令。
7.根据权利要求6所述的方法,其特征在于,还包括:
若所述第二内容获取指令为唤醒指令,响应所述唤醒指令。
8.一种语音交互装置,其特征在于,包括:
获取模块,用于接收第一内容获取指令,根据所述第一内容获取指令获取所述第一内容获取指令的应答结果;
判断模块,用于若在预设时间段内接收到第二内容获取指令,判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域;
所述获取模块,还用于若确定所述第二内容获取指令与所述第一内容获取指令属于相同技能领域,根据所述第二内容获取指令,结合所述第一内容获取指令获取所述第二内容获取指令的应答结果;否则,不根据所述第二内容获取指令,结合所述第一内容获取指令获取所述第二内容获取指令的应答结果。
9.根据权利要求8所述的装置,其特征在于,所述判断模块,还用于若确定所述第二内容获取指令与所述第一内容获取指令不属于相同技能领域,判断所述第二内容获取指令与所述第一内容获取指令是否属于相关技能领域;
所述获取模块,还用于若确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域,根据所述第二内容获取指令获取所述第二内容获取指令的应答结果。
10.根据权利要求8所述的装置,其特征在于,还包括:
处理模块,用于若确定所述第二内容获取指令与所述第一内容获取指令不属于相关技能领域,不响应所述第二内容获取指令。
11.根据权利要求8所述的装置,其特征在于,所述预设时间段根据第一内容获取指令所属的技能领域确定。
12.根据权利要求9所述的装置,其特征在于,所述判断模块具体用于,
查询预设的相关领域映射规则,确定与第一技能领域对应的预设相关技能领域,其中,所述第一技能领域为所述第一内容获取指令所属的技能领域;
若所述预设相关技能领域中包括第二技能领域,确定所述第二内容获取指令与所述第一内容获取指令属于相关技能领域,其中,所述第二技能领域为所述第二内容获取指令所属的技能领域。
13.根据权利要求8所述的装置,其特征在于,所述判断模块还用于,在判断所述第二内容获取指令与所述第一内容获取指令是否属于相同技能领域之前,确定所述第二内容获取指令不为唤醒指令。
14.根据权利要求13所述的装置,其特征在于,还包括:
响应模块,用于若所述第二内容获取指令为唤醒指令,响应所述唤醒指令。
15.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-7中任一所述的语音交互方法。
16.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的语音交互方法。
CN201711446766.2A 2017-12-27 2017-12-27 语音交互方法及装置 Active CN108962235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711446766.2A CN108962235B (zh) 2017-12-27 2017-12-27 语音交互方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711446766.2A CN108962235B (zh) 2017-12-27 2017-12-27 语音交互方法及装置

Publications (2)

Publication Number Publication Date
CN108962235A CN108962235A (zh) 2018-12-07
CN108962235B true CN108962235B (zh) 2021-09-17

Family

ID=64495731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711446766.2A Active CN108962235B (zh) 2017-12-27 2017-12-27 语音交互方法及装置

Country Status (1)

Country Link
CN (1) CN108962235B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960754A (zh) * 2019-03-21 2019-07-02 珠海格力电器股份有限公司 一种语音设备及其语音交互方法、装置和存储介质
CN110047481B (zh) * 2019-04-23 2021-07-09 百度在线网络技术(北京)有限公司 用于语音识别的方法和装置
CN110838292A (zh) * 2019-09-29 2020-02-25 广东美的白色家电技术创新中心有限公司 一种语音交互方法及电子设备、计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103594089A (zh) * 2013-11-18 2014-02-19 联想(北京)有限公司 一种语音识别方法及电子设备
US9098467B1 (en) * 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
CN105448293A (zh) * 2014-08-27 2016-03-30 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
CN106648530A (zh) * 2016-11-21 2017-05-10 海信集团有限公司 语音控制方法及终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040138885A1 (en) * 2003-01-09 2004-07-15 Xiaofan Lin Commercial automatic speech recognition engine combinations
CN105404161A (zh) * 2015-11-02 2016-03-16 百度在线网络技术(北京)有限公司 智能语音交互方法和装置
CN105810194B (zh) * 2016-05-11 2019-07-05 北京奇虎科技有限公司 待机状态下语音控制信息获取方法和智能终端
CN107293293A (zh) * 2017-05-22 2017-10-24 深圳市搜果科技发展有限公司 一种语音指令识别方法、***及机器人

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098467B1 (en) * 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
CN103594089A (zh) * 2013-11-18 2014-02-19 联想(北京)有限公司 一种语音识别方法及电子设备
CN105448293A (zh) * 2014-08-27 2016-03-30 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
CN106648530A (zh) * 2016-11-21 2017-05-10 海信集团有限公司 语音控制方法及终端

Also Published As

Publication number Publication date
CN108962235A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN107919130B (zh) 基于云端的语音处理方法和装置
US11074924B2 (en) Speech recognition method, device, apparatus and computer-readable storage medium
CN107591151B (zh) 远场语音唤醒方法、装置和终端设备
CN107610702B (zh) 终端设备待机唤醒方法、装置及计算机设备
CN107680589B (zh) 语音信息交互方法、装置及其设备
CN108962235B (zh) 语音交互方法及装置
CN107591152B (zh) 基于耳机的语音控制方法、装置及其设备
JP6811755B2 (ja) 読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体、プログラム
CN108009303B (zh) 基于语音识别的搜索方法、装置、电子设备和存储介质
CN105183422B (zh) 语音控制应用程序的方法和装置
CN108932944B (zh) 解码方法及装置
CN111091813B (zh) 语音唤醒模型更新及唤醒方法、***、装置、设备及介质
CN109841214B (zh) 语音唤醒处理方法、装置和存储介质
CN107203265B (zh) 信息交互方法和装置
US20200265843A1 (en) Speech broadcast method, device and terminal
CN109450747B (zh) 一种唤醒智能家居设备的方法、装置及计算机存储介质
CN105047198A (zh) 语音纠错处理方法及装置
CN108665900B (zh) 云端唤醒方法及***、终端以及计算机可读存储介质
CN111954868A (zh) 一种多语音助手控制方法、装置、***及计算机可读存储介质
CN109979467B (zh) 人声过滤方法、装置、设备及存储介质
CN106887228B (zh) 机器人的语音控制方法、装置及机器人
CN107680598B (zh) 基于好友声纹通讯录的信息交互方法、装置及其设备
CN111123728A (zh) 无人车仿真方法、装置、设备及计算机可读介质
CN110718224B (zh) 一种语音控制方法、装置、存储介质和智能设备
CN111354336B (zh) 分布式语音交互方法、装置、***及家电设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant