CN113450792A - 终端设备的语音控制方法、终端设备及服务器 - Google Patents

终端设备的语音控制方法、终端设备及服务器 Download PDF

Info

Publication number
CN113450792A
CN113450792A CN202110688867.0A CN202110688867A CN113450792A CN 113450792 A CN113450792 A CN 113450792A CN 202110688867 A CN202110688867 A CN 202110688867A CN 113450792 A CN113450792 A CN 113450792A
Authority
CN
China
Prior art keywords
voice
instruction
terminal equipment
voice instruction
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110688867.0A
Other languages
English (en)
Inventor
王冰
李含珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN202110688867.0A priority Critical patent/CN113450792A/zh
Publication of CN113450792A publication Critical patent/CN113450792A/zh
Priority to PCT/CN2022/100547 priority patent/WO2022268136A1/zh
Priority to CN202280038248.XA priority patent/CN117882130A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本实施例提供一种终端设备的语音控制方法、终端设备及服务器。本实施例的服务器接收第一终端设备发送的语音信号,根据语音信号生成语音指令,并将该语音指令反馈至第一终端设备。如果第一终端设备可执行语音指令对应的操作,则响应于该语音指令执行对应的操作。如果第一终端不可执行语音指令对应的操作,则向服务器发送指令分发请求。服务器根据指令分发请求,将语音指令发送至第二终端设备,以使第二终端设备响应于该语音指令执行对应操作。其中,第二终端可执行该语音指令对应的操作。本申请能够实现即使用户未移动到有效距离,或者未提高音量,也能够语音控制目标终端设备的效果,从而提升用户使用体验。

Description

终端设备的语音控制方法、终端设备及服务器
技术领域
本申请涉及语音交互技术领域,尤其涉及一种终端设备的语音控制方法、终端设备及服务器。
背景技术
随着语音交互技术的发展,越来越多的家用终端设备中都具备语音交互功能。利用语音交互功能,用户可语音控制这些终端设备执行相应的操作,例如启动、停止运转等。
目前用户语音控制终端设备的过程为,用户输入语音信号,终端设备采集到语音信号后,将语音信号转化为相应的指令,以使得终端根据指令进行相应的操作。
然而,目前大部分的终端设备的语音交互功能,都受距离的限制。用户无法在室内任意地点操控其想操控的设备。例如,无法在厨房语音控制卧室的智能电视关机或开机,无法在客厅通过语音控制调节卧室空调温度。用户要想操控终端设备,需要移动至有效距离或者提高音量,导致用户使用体验较差。
发明内容
本申请提供了一种终端设备的语音控制方法、终端设备及服务器,用于解决目前大部分的终端设备的语音交互功能,都受距离的限制,用户要想操控终端设备,需要移动至有效距离或者提高音量,导致用户使用体验较差的问题。
第一方面,本实施例提供一种服务器,用于执行:
接收第一终端设备发送的语音信号,根据所述语音信号生成语音指令,以及将所述语音指令反馈至所述第一终端设备;
在所述第一终端设备不可执行所述语音指令对应的操作时,接收所述第一终端设备发送的指令分发请求,所述指令分发请求携带有所述语音指令;
根据所述指令分发请求,查找可执行所述语音指令对应操作的第二终端设备,以及将所述语音指令发送至所述第二终端设备,以使所述第二终端设备响应于所述语音指令执行对应的操作;
在所述第一终端设备可执行所述语音指令对应的操作时,不接收所述第一终端设备发送的指令分发请求。
第二方面,本实施例提供一种终端设备,包括:
声音采集器,被配置为采集用户输入的语音信号;
控制器,被配置为:
从所述声音采集器接收用户输入的语音信号,将所述语音信号发送至服务器,以及从所述服务器接收语音指令,其中,所述语音指令为根据所述语音信号生成的;
在所述终端设备可执行所述语音指令对应的操作时,响应于所述语音指令,执行所述语音指令对应的操作;
在所述终端设备不可执行所述语音指令对应的操作时,生成指令分发请求,以及将所述指令分发请求发送至所述服务器,以使所述服务器根据所述指令分发请求,查找可执行所述语音指令对应操作的其他终端设备,将所述语音指令发送至其他终端设备。
第三方面,本实施例提供一种终端设备的语音控制方法,所述方法应用于服务器,包括:
接收第一终端设备发送的语音信号,根据所述语音信号生成语音指令,以及将所述语音指令反馈至所述第一终端设备;
在所述第一终端设备不可执行所述语音指令对应的操作时,接收所述第一终端设备发送的指令分发请求,所述指令分发请求携带有所述语音指令;
根据所述指令分发请求,查找可执行所述语音指令对应操作的第二终端设备,以及将所述语音指令发送至所述第二终端设备,以使所述第二终端设备响应于所述语音指令执行对应的操作;
在所述第一终端设备可执行所述语音指令对应的操作时,不接收所述第一终端设备发送的指令分发请求。
第四方面,本实施例提供一种终端设备的语音控制方法,所述方法应用于终端设备的控制器,包括:
从声音采集器接收用户输入的语音信号,将所述语音信号发送至服务器,以及从所述服务器接收语音指令,其中,所述语音指令为根据所述语音信号生成的;
在所述终端设备可执行所述语音指令对应的操作时,响应于所述语音指令,执行所述语音指令对应的操作;
在所述终端设备不可执行所述语音指令对应的操作时,生成指令分发请求,以及将所述指令分发请求发送至所述服务器,以使所述服务器根据所述指令分发请求,查找可执行所述语音指令对应操作的其他终端设备,将所述语音指令发送至其他终端设备。
本实施例提供终端设备的语音控制方法、终端设备及服务器,首先服务器接收第一终端设备发送的语音信号,根据语音信号生成语音指令,并将该语音指令反馈至第一终端设备。如果第一终端设备可执行语音指令对应的操作,则响应于该语音指令执行对应的操作。如果第一终端不可执行语音指令对应的操作,则向服务器发送指令分发请求。服务器根据指令分发请求,将语音指令发送至第二终端设备,以使第二终端设备响应于该语音指令执行对应操作。其中,第二终端可执行该语音指令对应的操作。本申请能够实现即使用户未移动到有效距离,或者未提高音量,也能够语音控制目标终端设备的效果,从而提升用户使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示例性示出了根据一些实施例的语音交互原理的示意图;
图2示例性示出了根据一些实施例的终端设备的语音控制***框架示意图;
图3示例性示出了根据一些实施例中终端设备的语音控制***场景示意图;
图4示例性示出了根据一些实施例中又一种终端设备的语音控制***场景示意图;
图5示例性示出了根据一些实施例中又一种终端设备的语音控制***场景示意图;
图6示例性示出了根据一些实施例的一种终端设备的语音控制方法信令图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语″包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语″模块″是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
为清楚说明本申请的实施例,下面结合图1对本申请实施例提供的一种语音识别网络架构进行描述。
参见图1,图1为本申请实施例提供的一种语音识别网络架构示意图。图1中,智能设备用于接收输入的信息以及输出对该信息的处理结果。语音识别服务设备为部署有语音识别服务的电子设备,语义服务设备为部署有语义服务的电子设备,业务服务设备为部署有业务服务的电子设备。这里的电子设备可包括服务器、计算机等,这里的语音识别服务、语义服务(也可称为语义引擎)和业务服务为可部署在电子设备上的web服务,其中,语音识别服务用于将音频识别为文本,语义服务用于对文本进行语义解析,业务服务用于提供具体的服务如墨迹天气的天气查询服务、QQ音乐的音乐查询服务等。在一个实施例中,图1所示架构中可存在部署有不同业务服务的多个实体服务设备,也可以一个或多个实体服务设备中集合一项或多项功能服务。
一些实施例中,下面对基于图1所示架构处理输入智能设备的信息的过程进行举例描述,以输入智能设备的信息为通过语音输入的查询语句为例,上述过程可包括如下三个过程:
[语音识别]
智能设备可在接收到通过语音输入的查询语句后,将该查询语句的音频上传至语音识别服务设备,以由语音识别服务设备通过语音识别服务将该音频识别为文本后返回至智能设备。在一个实施例中,将查询语句的音频上传至语音识别服务设备前,智能设备可对查询语句的音频进行去噪处理,这里的去噪处理可包括去除回声和环境噪声等步骤。
[语义理解]
智能设备将语音识别服务识别出的查询语句的文本上传至语义服务设备,以由语义服务设备通过语义服务对该文本进行语义解析,得到文本的业务领域、意图等。
[语义响应]
语义服务设备根据对查询语句的文本的语义解析结果,向相应的业务服务设备下发查询指令以获取业务服务给出的查询结果。智能设备可从语义服务设备获取该查询结果并输出。作为一个实施例,语义服务设备还可将对查询语句的语义解析结果发送至智能设备,以由智能设备输出该语义解析结果中的反馈语句。
需要说明的是,图1所示架构只是一种示例,并非对本申请保护范围的限定。本申请实施例中,也可采用其他架构来实现类似功能,例如:三个过程全部或部分可以由智能终端来完成,在此不做赘述。
在一些实施例中,图1所示的智能设备可为显示设备,如智能电视,语音识别服务设备的功能可由显示设备上设置的声音采集器和控制器配合实现,语义服务设备和业务服务设备的功能可由显示设备的控制器实现,或者由显示设备的服务器来实现。
随着语音交互技术的发展,越来越多的家用终端设备中都具备语音交互功能。利用语音交互功能,用户可语音控制这些终端设备执行相应的操作,例如启动、停止运转等。
目前用户语音控制终端设备的过程为,用户输入语音信号,终端设备采集到语音信号后,将语音信号转化为相应的指令,以使得终端根据指令进行相应的操作。
然而,目前大部分的终端设备的语音交互功能,都受距离的限制。用户无法在室内任意地点操控其想操控的设备。例如,无法在厨房语音控制卧室的智能电视关机或开机,无法在客厅通过语音控制调节卧室空调温度。用户要想操控终端设备,需要移动至有效距离或者提高音量,导致用户使用体验较差。
为了解决上述问题,本申请提供一种终端设备语音控制***,如图2所示的终端设备语音控制***框架示意图。该***包括至少两台终端设备100和服务器200。终端设备100用于采集用户输入的语音信号。终端设备100与服务器200通信连接。服务器200用于接收终端设备100发送的信号或者请求,并向终端设备100反馈相应的指令。
在一些实施例中,终端设备100-1的声音采集器采集到用户输入的语音信号。之后终端设备100-1将采集的语音信号发送至服务器200。服务器200根据该语音信号生成语音指令。需要说明的是,服务器200利用语义***将语音信号转化为语音指令,这里的具体转化过程本申请不作限制。
进一步服务器200将转化得到的语音指令反馈至终端设备100-1。终端设备100-1接收到语音指令后,终端设备100-1的本机执行能力模块判断本机是否有执行该语音指令对应操作的能力。如果判断结果为有能力执行该语音指令对应操作,则将该语音指令发送至控制器。控制器响应于该语音指令,控制终端设备100-1执行该语音指令对应的操作。
如果判断结果为本机没有能力执行该语音指令对应操作,则根据该语音指令生成指令分发请求,该指令分发请求携带有该语音指令。之后将指令分发请求发送至服务器200。服务器200接收到指令分发请求后,查找可执行该语音指令的终端设备100。例如,查找到终端设备100-2可执行该语音指令对应的操作,则将语音指令发送至终端设备100-2,以使终端设备100-2的控制器,响应于该语音指令腔制终端设备100-2执行该语音指令对应的操作。
示例性的,在一种场景中,用户在智能音箱附近输入语音信号″打开电视″,电视在卧室,但是智能音箱在厨房。智能音箱接收到语音信号″打开电视″后,将语音信号发送至服务器200。服务器将该语音信号转化为语音指令,并将语音指令反馈至智能音箱。
由于智能音箱不能执行″打开电视″的操作,因而智能音箱向服务器200发送携带有语音指令″打开电视″的指令分发请求。服务器200接收到指令分发请求后,查找可执行语音指令″打开电视″的终端设备。查找到可执行语音指令″打开电视″的终端设备为电视,则将语音指令″打开电视″发送至卧室的电视。卧室的电视接收到语音指令″打开电视″后,响应于该语音指令,执行打开操作。从而实现不在卧室也能语音控制卧室电视打开的目的。
在一些实施例中,每一台终端设备都配置有本机执行能力过滤模块,本机执行能力过滤模块配置有本机能力属性参数。终端设备在确定本机是否有能力执行语音指令对应操作的具体步骤为:
从语音指令中解析待处理能力属性参数,其中待处理能力属性参数则为对应的操作。将本机能力属性参数与待处理能力属性参数进行匹配,如果本机能力属性参数与待处理能力属性参数匹配,则表示该终端设备能够执行该语音指令对应的操作。如果本机能力属性参数与待处理能力属性参数不匹配,则表示该终端设备不能够执行该语音指令对应的操作。
示例性的,终端设备100-1为显示设备、终端设备100-2为空调设备、终端100-3为洗衣机设备、终端100-4为冰箱设备。则终端设备100-1的本机能力属性参数为播放音视频,终端100-2的本机能力属性参数为制冷和制热,终端100-3的本机能力属性参数为洗衣,终端100-4的本机能力属性参数为制冷。
如果用户在终端设备100-2的信号可接收范围内,输入语音信号″制热″,则终端设备100-2采集到语音信号并接收服务器200发送的语音指令″制热″。进一步从语音指令中能够解析得到待处理能力属性参数为″制热″。再通过终端设备100-2的本机能力过滤模块,终端设备100-2的本机能力属性参数为″制热″。终端设备100-2的本机能力属性参数能够与待处理能力属性参数匹配。则表示终端设备100-2能够执行语音指令″制热″对应的操作。
需要说明的是,如果待处理能力属性参数,在文本上,不能够完全与本机能力属性参数匹配。本申请的本机能力过滤模块还能够根据对解析出的待处理能力属性参数进行相应的转化。例如,如果用户在终端设备100-2信号可接收的范围内,输入语音信号″加热″,经过本机能力属性模块解析后得到文本″加热″。此时待处理能力属性参数,不能够完全与终端设备100-2的本机能力属性参数″制热″匹配。本机能力过滤模块可以对待处理能力属性参数进行分析,得到″加热″与″制热″的含义相同。因此,将待处理能力属性参数视为与本机能力属性参数匹配。即得到终端设备100-2能够实现语音信号″加热″对应的操作。
如果用户在终端设备100-2的信号可接收范围内,输入语音信号″播放音乐″,则终端设备100-2采集到语音信号并接收服务器200发送的语音指令″播放音乐″。进一步从语音指令中能够解析得到待处理能力属性参数为″播放音乐″。再通过终端100-2的本机能力过滤模块,终端设备100-2的本机能力属性参数为″制冷″和″制冷″。则终端设备100-2的本机能力属性参数与待处理能力属性参数不匹配。则表示终端设备100-2不能执行语音指令″播放音乐″对应的操作。
在一些实施例中,如果语音指令中只包括设备名称,则服务器根据指令分发请求,查找与设备名称对应的第二终端设备,以及将语音指令发送至第二终端设备。以使第二终端设备响应于该语音指令执行对应操作。
示例性的,如图3所示的应用场景示意图,用户在设备1信号可接收范围内容输入″打开设备3″、″设备3状态″、″关闭设备3″等语音指令。这些语音指令都只包括设备名称″设备3″。设备1的设备名称与语音指令中包括的设备名称不匹配,则设备1无法执行该语音指令对应的操作。服务器根据设备名称查找名称匹配的终端设备。最终查找到设备3的设备名称与语音指令中包括的设备名称相匹配,服务器将语音指令发送至设备3。设备3接收到语音指令″打开设备3″之后,响应于该语音指令,执行启动的操作。或者,设备3接收到语音指令″关闭设备3″之后,响应于该语音指令,执行关闭的操作。
在一些实施例中,服务器查找到第二终端设备,将语音指令发送至第二终端设备之后,第二终端设备也可以利用本机能力过滤模块,再次确认本机是否可执行语音指令对应操作。如果再次确认本机可执行语音指令对应操作,则响应于该语音指令,执行对应操作。如果经过再次确认本机并不可执行语音指令对应操作,则第二终端设备可向服务器反馈错误信号,使得服务器重新查找可执行语音指令对应操作的终端设备。
在一些实施例中,如果语音指令中只包括设备能力,则服务器根据指令分发请求,查找具备该设备能力的第二终端设备,以及将语音指令发送至第二终端设设备。以使第二终端设备响应于该语音指令执行对应操作。
示例性的,如图4所示的应用场景示意图,用户在音箱设备信号可接收范围内输入″降低温度″、″温度调到20度″、″升高温度″、″提升风速″等语音指令。这些语音指令只包括设备能力。音箱设备的本机能力属性参数不符合上述语音指令包括的设备能力参数,则音响设备不能执行上述语音指令对应的操作。音箱设备向服务器发送指令分发请求,服务器根据指令分发请求查找符合该设备能力参数的终端设备。图4所示的设备中只有空调的本机能力属性参数符合该设设备能力参数。则服务器将该语音指令发送至空调,空调接收到该语音指令后,响应于该语音指令,执行对应操作。
需要说明的是,如果语音指令中包括的设备能力参数有多个终端设备符合,并且语音指令只包括设备能力参数,则服务器将语音指令发送至符合条件的多个终端设备。多个终端设备响应于该语音指令,执行对应操作。
示例性的,用户在空调信号可接收范围内输入″降低温度″,空调的本机能力过滤模块首先根据本机能力属性参数,判断本机可执行该语音指令对应的操作。进一步空调还向服务器发送指令分发请求。服务器根据指定分发请求携带的设备能力参数,查找除了空调之外,同样符合该设备能力参数的终端设备。即查找可执行语音指令″降低温度″对应操作的终端设设备。最后查找到冰箱也可可执行语音指令″降低温度″对应操作。服务器将语音指令″降低温度″发送至冰箱,以使冰箱响应于该语音指令,执行对应操作。通过本实施例,可以实现用户输入一次语音指令,同时控制多台终端设备的效果。
还需要说明的是,如果用户输入一次语音指令,可以同时控制多台终端设备,但是用户并不需要控制多台终端设备。用户可以输入同时包括设备名称和设备能力参数的语音指令。
例如,用户在空调信号可接收范围内输入″降低空调的温度″,该语音指令同时包括设备名称″空调″和设备能力参数″降低温度″。则空调通过本机能力过滤模块判断本机可执行该语音指令对应的操作,同时空调的设备名称符合语音指令携带的设备名称。因此,空调不再向服务器发送指令分发请求,服务器也不再查找其他终端设备。
在一些实施例中,如果语音指令中只携带有自定义规则,则服务器根据自定义规则查找匹配的第二终端。其中,在自定义规则中语音指令与终端设备具有对应关系。
例如,如图5所示的场景中,自定义规则包括:由设备2优先播放音乐,由设备3优先播放影视,由设备4优先播放有声小说等,即播放音乐指令与设备2对应,播放影视与设备3对应,播放有声小说与设备4对应。当用户在设备1信号接收范围内输入语音指令″播放音乐″,首先设备1的本机能力过滤模块判断本机不能执行该语音指令对应的操作,之后设备1向服务器发送指令分发指令。服务器根据自定义规则,查找到与语音指令″播放音乐″对应的终端设备为设备2,则将该语音指令发送至设备2。
当用户在设备1信号接收范围内输入语音指令″播放影视″,首先设备1的本机能力过滤模块判断本机不能执行该语音指令对应的操作,之后设备1向服务器发送指令分发指令。服务器根据自定义规则,查找到与语音指令″播放影视″对应的终端设备为设备3,则将该语音指令发送至设备3。
在一些实施例中,服务器包括融合能力规则数据库和指令分发模块。融合能力规则数据库中存储有所有设备的本机能力属性参数。运营人员可在融合能力规则数据库中更新设备的本机能力属性参数。例如,某台终端设备经过更新,具备了某种新的能力,则需要增加该设备的本机能力属性参数。在融合能力规则数据库中所有设备按照设备名称,设备ID存储。
指令分发模块接收终端设备发送的指令分发请求,并且可从指令分发请求携带的语音指令中解析待处理能力属性参数。之后指令分发模块从融合能力规则数据库中查找与待处理能力属性参数匹配的本机能力属性参数,从而查找到能够执行语音指令对应操作的终端设备。另外,终端设备的本机能力过滤模块也可以从融合能力规则数据库中查找本机能力属性参数。
在一些实施例中,当用户输入模糊的语音指令,可能会存在多台终端设备可执行语音指令对应操作。模糊的语音指令可以是模糊的设备控制指令,模糊的媒资播放指令等。
例如,家庭场景中,可能存在多台空调。当用户输入语音指令″打开客厅空调″时,根据设备名称规则和具体空间规则,可以直接将语音指令发送至客厅空调,以使客厅空调执行启动的操作。当用户输入语音指令″打开空调″时,根据设备名称规则,客厅空调和卧室空调均可执行该语音指令对应操作。因此可以设置其他属性,以锁定更具体的设备。例如制定时间规则:11:00~14:00打开客厅空调,15:00~17:00打开卧室空调。当用户在12:00的时刻输入语音指令″打开空调″,根据时间规则,将该语音指令发送至客厅空调,以使客厅空调执行启动操作。
如果家庭场景中,存在多台音箱。当用户输入的语音指令与儿童故事、儿歌相关,则可制定规则,与与儿童故事、儿歌相关的语音指令发送至儿童房的音箱。
在一些实施例中,还可以根据用户需要播放的影视节目的播放时间,控制不同空间的显示设备的开关。例如,用户输入语音指令″播放新闻联播″,用户可能在制定规则中指定新闻联播在客厅中观看,则服务器将该语音指令发送至客厅的显示设备。以使客厅的显示设备执行播放新闻联播的操作。
在一些实施例中,用户输入的语音指令可能包括多个匹配项,例如,可以包括设备名称、设备响应时间段、设备存在的空间、设备能力参数等。不同的终端设备可能同时满足语音指令中包括的匹配项。例如,语音指令中同时包括设备名称、设备响应时间段、设备存在的空间、设备能力参数四个匹配项。设备1满足匹配项设备名称和时间段,设备2满足匹配项时间段和设备能力参数。此时可为每一个匹配项设置对应的权重值。例如,设备名称的权重值为10,时间段的权重值为5,空间的权重值为3,设备能力参数的权重值为8。根据公式
Figure BDA0003125730410000101
其中,ai为各个终端设备符合的匹配项的权重值,分别得到设备1和设备2最终权重值。设备1的权重属性总值为15,设备2的权重属性总值为11。则设备1的权重属性总值最大,设备1为最优匹配的终端设备。最终服务器将语音指令发送至设备1,以使设备1响应于该语音指令执行对应操作。
需要说明的是,本申请的服务器可以区分为语义服务器和指令分发服务器。语义服务器用于从用户输入的语音信号识别出语音指令。指令分发服务器保存有融合能力规则数据库,用于根据指令分发请求,查找可执行语音指令对应操作的终端设备。语义服务器可以是网络服务器,而指令分发服务器是本地服务器。由于本地服务器具有响应快的优势,因而能够提升整个语音控制过程的响应速度。
基于上述实施例,本申请还提供一种终端设备的语音控制方法,如图6所示的信令图,所述方法包括以下步骤:
步骤一、第一终端设备的麦克风接收用户输入的语音信号,将语音信号发送至服务器,服务器根据语音信号生成语音指令,以及将语音指令反馈至第一终端设备。
步骤二、第一终端设备判断本机是否可执行语音指令对应的操作。如果本机可执行语音指令对应的操作,则响应于该语音指令执行对应操作。
步骤三、如果本机不可执行该语音指令对应的操作,则向服务器发送指令分发请求。指令分发请求携带有该语音指令。
步骤四、服务器接收到指令分发请求之后,根据指令分发请求,查找可执行该语音指令对应操作的第二终端设备,以及将语音指令发送至第二终端设备,以使第二终端设备响应于该语音指令执行对应的操作。
在一些实施例中,第一终端设备判断本机是否可执行该语音指令对应的操作的具体过程为:
从语音指令中解析待处理能力属性参数,第一终端设备的本机能力过滤模块可以从融合能力规则数据库中获取本机能力属性参数。之后将本机能力属性参数和待处理能力属性参数进行匹配,如果能够匹配,则第一终端设备可执行该语音指令对应的操作。如果不匹配,则第一终端设备不可执行该语音指令对应的操作。
在一些实施例中,如果语音指令中只携带有设备名称,则服务器在查找第二终端设设备时,为查找与设备名称对应的第二终端设备。例如,语音指令为″打开音箱″,则服务器根据设备名称″音箱″查找音箱设备。
在一些实施例中,如果语音指令中只携带有设备能力参数时,则服务器在查找第二终端设备时,为查找具备该设备能力参数的第二终端设备。例如,语音指令为″降低温度″,则识别出待处理设备能力参数为″降低温度″。服务器的指令分发模块可从融合能力规则数据库中查找,与待处理设备能力参数匹配的本机能力属性参数。即查找到可执行该语音指令对应操作的终端设备。
在一些实施例中,如果语音指令为自定义规则对应的指令。则服务器在查找第二终端设备时,为查找与自定义规则具有对应关系的第二终端设备。例如,如图5所示的场景中,自定义规则包括:由设备2优先播放音乐,由设备3优先播放影视,由设备4优先播放有声小说等。用户输入的语音指令为″播放音乐″,则设备2与自定义规则对应,则将设备2确定为第二终端设备。
在一些实施例中,如果语音指令中包括至少两条匹配项,每一条匹配项设置有权重属性值。如果服务器在根据匹配项查找时,存在至少两个终端设备满足至少一条匹配项时,则计算这些终端设备满足的所有匹配项的权重属性总值,即权重值的总和。权重属性总值最大的确定为第二终端设备。
本申请各个实施例之间相同或相似的内容可相互参照,相关实施例不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (10)

1.一种服务器,其特征在于,所述服务器,用于执行:
接收第一终端设备发送的语音信号,根据所述语音信号生成语音指令,以及将所述语音指令反馈至所述第一终端设备;
在所述第一终端设备不可执行所述语音指令对应的操作时,接收所述第一终端设备发送的指令分发请求,所述指令分发请求携带有所述语音指令;
根据所述指令分发请求,查找可执行所述语音指令对应操作的第二终端设备,以及将所述语音指令发送至所述第二终端设备,以使所述第二终端设备响应于所述语音指令执行对应的操作;
在所述第一终端设备可执行所述语音指令对应的操作时,不接收所述第一终端设备发送的指令分发请求。
2.根据权利要求1所述的服务器,其特征在于,在所述语音指令只携带有设备名称时,根据所述指令分发请求,将所述语音指令发送至第二终端设备,具体为:
根据所述指令分发请求,查找所述设备名称对应的所述第二终端设备,以及将所述语音指令发送至所述第二终端设备。
3.根据权利要求1所述的服务器,其特征在于,在所述语音指令只携带有设备能力参数时,根据所述指令分发请求,将所述语音指令发送至第二终端设备,具体为:
根据所述指令分发请求,查找具备所述设备能力参数的所述第二终端设备,以及将所述语音指令发送至所述第二终端设备。
4.根据权利要求1所述的服务器,其特征在于,在所述语音指令为自定义规则对应的指令时,其中,在所述自定义规则中所述语音指令与所述终端设备具有对应关系,根据所述指令分发请求,将所述语音指令发送至第二终端设备,具体为:
根据所述指令分发请求,查找与所述自定义规则具有对应关系的所述第二终端设备,以及将所述语音指令发送至所述第二终端设备。
5.根据权利要求1所述的服务器,其特征在于,所述语音指令包括至少两条匹配项,每一条所述匹配项设置有权重属性值;
根据所述指令分发请求,将所述语音指令发送至第二终端设备,具体为:
在存在至少两个终端设备满足所述语音指令中的至少一条所述匹配项时,计算所述终端设备满足的所述匹配项的权重属性总值,将所述语音指令发送至所述第二终端设设备,其中,所述权重属性总值为所述匹配项的权重值的总和,所述第二终端设设备的权重属性总值最大。
6.根据权利要求5所述的服务器,其特征在于,所述匹配项为设备名称、设备响应时间段、设备存在的空间以及设备能力参数中的其中一种。
7.一种终端设备,其特征在于,包括:
声音采集器,被配置为采集用户输入的语音信号;
控制器,被配置为:
从所述声音采集器接收用户输入的语音信号,将所述语音信号发送至服务器,以及从所述服务器接收语音指令,其中,所述语音指令为根据所述语音信号生成的;
在所述终端设备可执行所述语音指令对应的操作时,响应于所述语音指令,执行所述语音指令对应的操作;
在所述终端设备不可执行所述语音指令对应的操作时,生成指令分发请求,以及将所述指令分发请求发送至所述服务器,以使所述服务器根据所述指令分发请求,查找可执行所述语音指令对应操作的其他终端设备,将所述语音指令发送至其他终端设备。
8.根据权利要求7所述的终端设备,其特征在于,所述终端设备配置有本机能力属性参数,所述终端设备确定是否可执行所述语音指令对应的操作的具体步骤为:
从所述语音指令中解析待处理能力属性参数;
在所述本机能力属性参数与所述待处理能力属性参数匹配时,所述终端设备可执行所述语音指令对应的操作;
在所述本机能力属性参数与所述待处理能力属性参数不匹配时,所述终端设备不可执行所述语音指令对应的操作。
9.一种终端设备的语音控制方法,其特征在于,所述方法应用于服务器,包括:
接收第一终端设备发送的语音信号,根据所述语音信号生成语音指令,以及将所述语音指令反馈至所述第一终端设备;
在所述第一终端设备不可执行所述语音指令对应的操作时,接收所述第一终端设备发送的指令分发请求,所述指令分发请求携带有所述语音指令;
根据所述指令分发请求,查找可执行所述语音指令对应操作的第二终端设备,以及将所述语音指令发送至所述第二终端设备,以使所述第二终端设备响应于所述语音指令执行对应的操作;
在所述第一终端设备可执行所述语音指令对应的操作时,不接收所述第一终端设备发送的指令分发请求。
10.一种终端设备的语音控制方法,所述方法应用于终端设备的控制器,其特征在于,包括:
从声音采集器接收用户输入的语音信号,将所述语音信号发送至服务器,以及从所述服务器接收语音指令,其中,所述语音指令为根据所述语音信号生成的;
在所述终端设备可执行所述语音指令对应的操作时,响应于所述语音指令,执行所述语音指令对应的操作;
在所述终端设备不可执行所述语音指令对应的操作时,生成指令分发请求,以及将所述指令分发请求发送至所述服务器,以使所述服务器根据所述指令分发请求,查找可执行所述语音指令对应操作的其他终端设备,将所述语音指令发送至其他终端设备。
CN202110688867.0A 2021-06-22 2021-06-22 终端设备的语音控制方法、终端设备及服务器 Pending CN113450792A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110688867.0A CN113450792A (zh) 2021-06-22 2021-06-22 终端设备的语音控制方法、终端设备及服务器
PCT/CN2022/100547 WO2022268136A1 (zh) 2021-06-22 2022-06-22 一种进行语音控制的终端设备及服务器
CN202280038248.XA CN117882130A (zh) 2021-06-22 2022-06-22 一种进行语音控制的终端设备及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110688867.0A CN113450792A (zh) 2021-06-22 2021-06-22 终端设备的语音控制方法、终端设备及服务器

Publications (1)

Publication Number Publication Date
CN113450792A true CN113450792A (zh) 2021-09-28

Family

ID=77812119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110688867.0A Pending CN113450792A (zh) 2021-06-22 2021-06-22 终端设备的语音控制方法、终端设备及服务器

Country Status (1)

Country Link
CN (1) CN113450792A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022268136A1 (zh) * 2021-06-22 2022-12-29 海信视像科技股份有限公司 一种进行语音控制的终端设备及服务器
WO2023174155A1 (zh) * 2022-03-18 2023-09-21 华为技术有限公司 一种多设备的语音控制***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818782A (zh) * 2016-09-12 2018-03-20 上海声瀚信息科技有限公司 一种实现家用电器智能控制的方法及***
EP3382698A1 (en) * 2017-03-30 2018-10-03 LG Electronics Inc. Voice server, voice recognition server system, and method of operating the same
CN108766432A (zh) * 2018-07-02 2018-11-06 珠海格力电器股份有限公司 一种控制家电间协同工作的方法
CN111883129A (zh) * 2020-08-03 2020-11-03 海信视像科技股份有限公司 终端设备控制方法、装置及终端设备
CN112017652A (zh) * 2019-05-31 2020-12-01 华为技术有限公司 一种交互方法和终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818782A (zh) * 2016-09-12 2018-03-20 上海声瀚信息科技有限公司 一种实现家用电器智能控制的方法及***
EP3382698A1 (en) * 2017-03-30 2018-10-03 LG Electronics Inc. Voice server, voice recognition server system, and method of operating the same
CN108766432A (zh) * 2018-07-02 2018-11-06 珠海格力电器股份有限公司 一种控制家电间协同工作的方法
CN112017652A (zh) * 2019-05-31 2020-12-01 华为技术有限公司 一种交互方法和终端设备
CN111883129A (zh) * 2020-08-03 2020-11-03 海信视像科技股份有限公司 终端设备控制方法、装置及终端设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022268136A1 (zh) * 2021-06-22 2022-12-29 海信视像科技股份有限公司 一种进行语音控制的终端设备及服务器
WO2023174155A1 (zh) * 2022-03-18 2023-09-21 华为技术有限公司 一种多设备的语音控制***及方法

Similar Documents

Publication Publication Date Title
US11854547B2 (en) Network microphone device with command keyword eventing
US11501773B2 (en) Network microphone device with command keyword conditioning
US11361756B2 (en) Conditional wake word eventing based on environment
US11710487B2 (en) Locally distributed keyword detection
US11551669B2 (en) Locally distributed keyword detection
US20210160130A1 (en) Method and Apparatus for Determining Target Object, Storage Medium, and Electronic Device
CN113450792A (zh) 终端设备的语音控制方法、终端设备及服务器
US11482224B2 (en) Command keywords with input detection windowing
US20210383796A1 (en) Wakewordless Voice Quickstarts
CN101283576A (zh) 用于处理能被呈现给用户的数据项的设备
US11200900B2 (en) Offline voice control
US20220148592A1 (en) Network Device Interaction by Range
US11771866B2 (en) Locally distributed keyword detection
CN114172757A (zh) 服务器、智能家居***及多设备语音唤醒方法
US11556307B2 (en) Local voice data processing
WO2021212907A1 (zh) 语音控制方法、装置、计算机设备和存储介质
CN114067798A (zh) 一种服务器、智能设备及智能语音控制方法
CN111640435A (zh) 基于智能音箱控制红外家电的方法及装置
CN112151013A (zh) 智能设备交互方法
CN113053369A (zh) 智能家电的语音控制方法及装置、智能家电
CN109343481B (zh) 一种控制设备的方法与设备
WO2022268136A1 (zh) 一种进行语音控制的终端设备及服务器
CN114402383A (zh) 电子设备及其控制语音识别的方法
EP3557574A1 (en) Voice control method, server, and voice exchange system
CN115547321A (zh) 一种业务处理方法和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination