CN113421559A - 基于语音唤醒的控制方法、电子设备及控制器 - Google Patents
基于语音唤醒的控制方法、电子设备及控制器 Download PDFInfo
- Publication number
- CN113421559A CN113421559A CN202110611312.6A CN202110611312A CN113421559A CN 113421559 A CN113421559 A CN 113421559A CN 202110611312 A CN202110611312 A CN 202110611312A CN 113421559 A CN113421559 A CN 113421559A
- Authority
- CN
- China
- Prior art keywords
- voice
- electronic device
- controller
- user
- intensity value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 151
- 230000004044 response Effects 0.000 claims abstract description 158
- 238000004891 communication Methods 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 description 48
- 238000012545 processing Methods 0.000 description 25
- 230000003993 interaction Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006855 networking Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/2821—Avoiding conflicts related to the use of home appliances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种基于语音唤醒的控制方法、电子设备及控制器,涉及通信技术领域。通过本申请方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒其中某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过等),并指示满足唤醒响应条件的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种基于语音唤醒的控制方法、电子设备及控制器。
背景技术
随着终端技术及人工智能的快速发展,电子设备(例如智能家居设备)通常都可以支持语音唤醒,例如将运行在后台的语音引擎或语音助手唤醒,以此实现用户与电子设备的语音交互。
当用户需要触发某一电子设备开启某一功能时,直接说出唤醒关键词,即可触发唤醒该电子设备。该电子设备的语音引擎在被唤醒后,可输出应答语(例如“在”)作为对用户的响应。进一步地,电子设备可以支持与用户进行语音交互,为用户提供一些应用服务。
然而,在家庭场景中通常有多个智能家居设备,例如一个或更多个智能音箱、智慧屏等,其中某些智能家居设备出厂预设的唤醒语可能是相同的,在此情况下,用户说出的语音唤醒语可能会同时唤醒家庭场景中的多个智能家居设备,导致多个电子设备均会输出应答语进行响应,与用户进行语音交互,这样无法满足用户唤醒某一电子设备的需求。
发明内容
本申请提供一种基于语音唤醒的控制方法、电子设备及控制器,解决了现有技术中在多个电子设备唤醒语相同的情况下无法满足用户唤醒某一电子设备的需求的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供一种基于语音唤醒的控制方法,应用于第一电子设备和第二电子设备,所述第一电子设备和所述第二电子设备的唤醒语相同,且所述唤醒语为第一唤醒语;该方法包括:
第一电子设备确定采集到的用户语音与第一唤醒语匹配;第一电子设备确定用户语音的强度值为第一语音强度值;第一电子设备向控制器发送第一语音强度值;
第二电子设备确定采集到的用户语音与第一唤醒语匹配;第二电子设备确定用户语音的强度值为第二语音强度值;第二电子设备向控制器发送第二语音强度值;
控制器接收第一语音强度值和第二语音强度值;控制器确定第一语音强度值大于第二语音强度值;控制器向第一电子设备发送第一指示消息,该第一指示消息用于指示第一电子设备进行响应;
第一电子设备响应于第一指示消息,输出第一唤醒应答语进行响应。
通过本申请方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备的语音强度值最大,并指示具有最大语音强度值的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
在第一方面的一些实施例中,该基于语音唤醒的控制方法可以应用于多个电子设备,该多个电子设备包括第一电子设备、第二电子设备和第三电子设备,多个电子设备的唤醒语相同,且唤醒语为第一唤醒语。
在此情况下,该基于语音唤醒的控制方法还可以包括:
第三电子设备确定采集到的用户语音与第一唤醒语匹配;第三电子设备确定用户语音的强度值为第三语音强度值;第三电子设备向控制器发送第三语音强度值;
其中,上述控制器接收第一语音强度值和第二语音强度值,包括:控制器接收第一语音强度值、第二语音强度值和第三语音强度值;
其中,上述控制器确定第一语音强度值大于第二语音强度值,包括:控制器确定第一语音强度值、第二语音强度值和第三语音强度值中的最大语音强度值;
其中,上述控制器向第一电子设备发送第一指示消息,包括:控制器向多个电子设备中与最大语音强度值对应的目标电子设备发送第一指示消息;
其中,上述第一电子设备响应于第一指示消息,输出第一唤醒应答语进行响应,包括:目标电子设备响应于第一指示消息,输出第一唤醒应答语进行响应。
本申请提供的基于语音唤醒的控制方法,多个电子设备中的每个电子设备在采集到的用户语音与第一唤醒语匹配时,向控制器发送用户语音对应的语音强度值。控制器接收多个电子设备发送的多个语音强度值,并比较多个语音强度值的大小,该多个电子设备中的每个电子设备对应一个语音强度值。控制器向多个电子设备中与最大语音强度值对应的目标电子设备发送第一指示信息,用于指示目标电子设备输出第一唤醒应答语进行响应。目标电子设备根据控制器发送的所述第一指示消息,输出第一唤醒应答语进行响应。
通过本申请方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
在第一方面的一些实施例中,该基于语音唤醒的控制方法还包括:
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中目标电子设备具有最大语音强度值,且所述多个电子设备中所述目标电子设备的历史唤醒次数最多,则所述控制器向所述目标电子设备发送所述第一指示消息;
或者,当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中目标电子设备具有最大语音强度值,且所述多个电子设备中所述目标电子设备最近一次响应过,则所述控制器向所述目标电子设备发送所述第一指示消息。
在第一方面的一些实施例中,第一电子设备响应于第一指示消息,输出第一唤醒应答语进行响应,包括:第一电子设备响应于第一指示消息,启动语音引擎,输出第一唤醒应答语进行响应。
在第一方面的一些实施例中,该基于语音唤醒的控制方法还包括:控制器向第二电子设备发送第二指示信息,该第二指示信息用于指示第二电子设备不响应。
在第一方面的一些实施例中,控制器可以被设置于路由端。例如,该控制器可以为智能路由器。
在第一方面的一些实施例中,该基于语音唤醒的控制方法还包括:第一电子设备和第二电子设备分别与控制器建立无线连接(例如蓝牙连接,或者无线局域网连接)和/或分别与控制器建立有线连接。
例如,多个电子设备与智能路由器之间建立无线局域网连接。
在第一方面的一些实施例中,第一电子设备确定用户语音的强度值为第一强度值,包括:第一电子设备将采集到的用户语音转换为电信号,根据电信号得到第一语音强度值。
在第一方面的一些实施例中,第一电子设备向控制器发送第一语音强度值,包括:
第一电子设备确定第一语音强度值大于或等于预设强度阈值;
第一电子设备向控制器发送第一语音强度值。
在第一方面的一些实施例中,在第一电子设备向控制器发送第一语音强度值之前,方法还包括:第一电子设备根据采集到的用户语音和预设的声纹特征信息进行用户身份认证;
其中,第一电子设备向控制器发送第一语音强度值,包括:在第一电子设备根据采集到的用户语音确认用户身份认证成功,且所采集到的用户语音与第一唤醒语匹配的情况下,第一电子设备向控制器发送第一语音强度值。
在第一方面的一些实施例中,上述预设的声纹特征信息可以存储于多个电子设备中的每个电子设备,云服务器和/或控制器中。
在第一方面的一些实施例中,上述控制器向多个电子设备中与最大的语音强度值对应的目标电子设备发送第一指示消息,包括:
若多个电子设备中目标电子设备具有最大语音强度值,且多个电子设备中目标电子设备与用户之间的距离值最小,则控制器向目标电子设备发送第一指示消息。
在第一方面的一些实施例中,该基于语音唤醒的控制方法还包括:多个电子设备中的每个电子设备向控制器发送设备标识;控制器接收多个电子设备发送的设备标识,每个电子设备对应一个设备标识;
其中,上述控制器向多个电子设备中与最大的语音强度值对应的目标电子设备发送第一指示消息,包括:若多个电子设备中目标电子设备具有最大语音强度值,则控制器根据目标电子设备的设备标识,向目标电子设备发送第一指示消息。
第二方面,本申请提供一种基于语音唤醒的控制方法,应用于电子设备,该方法包括:
采集用户语音;
若用户语音与电子设备中预置的第一唤醒语匹配,则向控制器发送用户语音对应的目标语音强度值,以使得控制器基于目标语音强度值判断电子设备是否满足预设的唤醒响应条件;
当电子设备满足预设的唤醒响应条件时,接收控制器发送的第一指示消息;
响应于第一指示消息,输出第一唤醒应答语进行响应;
其中,上述预设的唤醒响应条件包括:当控制器接收到的多个电子设备发送的多个语音强度值中目标语音强度值最大时,控制器指示电子设备输出第一唤醒应答语进行响应;多个电子设备的唤醒语相同。
在第二方面的一些实施例中,电子设备可以响应于第一指示消息,启动语音引擎,并通过语音引擎输出第一唤醒应答语进行响应。
在第二方面的一些实施例中,上述预设的唤醒响应条件还包括:
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若多个电子设备中电子设备的历史唤醒次数最多时,则控制器指示电子设备输出唤醒响应语进行响应;
或者,当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若多个电子设备中电子设备最近一次响应过,则控制器指示电子设备输出唤醒响应语进行响应。
在第二方面的一些实施例中,控制器被设置于路由端。
在第二方面的一些实施例中,在电子设备采集用户语音之前,该基于语音唤醒的控制方法还包括:电子设备与控制器建立无线连接和/或有线连接。
在第二方面的一些实施例中,在电子设备采集用户语音之后,该基于语音唤醒的控制方法还包括:将用户语音转换为目标电信号,根据目标电信号得到目标语音强度值。
在第二方面的一些实施例中,上述向控制器发送用户语音对应的目标语音强度值,包括:在目标语音强度值大于或等于预设强度阈值的情况下,向控制器发送用户语音对应的目标语音强度值。
在第二方面的一些实施例中,上述向控制器发送用户语音对应的目标语音强度值,包括:当根据用户语音和预设的声纹特征信息确定用户身份认证成功,且用户语音与第一唤醒语匹配时,向控制器发送用户语音对应的目标语音强度值。
在第二方面的一些实施例中,上述根据用户语音和预设的声纹特征信息确定用户身份认证成功,且用户语音与第一唤醒语匹配,包括:
根据用户语音和预设的声纹特征信息进行用户身份认证;
若身份认证成功,则将用户语音与第一唤醒语进行比较;
若用户语音的文本信息包含第一唤醒语或者与第一唤醒语一致,则确定用户语音与第一唤醒语匹配。
在第二方面的一些实施例中,预设的声纹特征信息存储于多个电子设备中的每个电子设备,云服务器和/或控制器中。
在第二方面的一些实施例中,上述向控制器发送用户语音对应的目标语音强度值,包括:向控制器发送电子设备的设备标识和目标语音强度值,该目标语音强度值与设备标识具有对应关系。
第三方面,本申请提供一种基于语音唤醒的控制方法,应用于控制器,该方法包括:
若在预设时长内接收到多个电子设备发送的语音强度值,则比较语音强度值的大小,语音强度值为每个电子设备采集到的用户语音与预置的唤醒语匹配时对应的语音强度值,其中每个电子设备对应一个语音强度值,该多个电子设备预置的唤醒语相同;
向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,该第一指示消息用于指示目标电子设备输出第一唤醒应答语进行响应。
其中,该第一指示消息可以用于指示目标电子设备启动语音引擎,并输出第一唤醒应答语进行响应。
在第三方面的一些实施例中,该基于语音唤醒的控制方法还包括:
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若控制器判断出多个电子设备中电子设备的历史唤醒次数最多时,则指示电子设备输出第一唤醒应答语进行响应;
或者,当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若控制器判断出多个电子设备中电子设备最近一次响应过,则指示电子设备输出第一唤醒应答语进行响应。
在第三方面的一些实施例中,控制器被设置于路由端。
在第三方面的一些实施例中,该基于语音唤醒的控制方法还包括:控制器与多个电子设备分别建立无线连接和/或有线连接。
在第三方面的一些实施例中,该基于语音唤醒的控制方法还包括:控制器向多个电子设备中除目标电子设备之外的其他电子设备发送第二指示信息,第二指示信息用于指示其他电子设备不响应。
在第三方面的一些实施例中,上述向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:
若多个电子设备中目标电子设备具有最大语音强度值,且多个电子设备中目标电子设备与用户之间的距离值最小,则控制器向目标电子设备发送第一指示消息。
在第三方面的一些实施例中,上述在预设时长内接收到多个电子设备发送的语音强度值,包括:在预设时长内接收到多个电子设备发送的设备标识和语音强度值,该语音强度值与设备标识具有对应关系,每个电子设备对应一个设备标识;
其中,上述向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:若多个电子设备中目标电子设备具有最大语音强度值,则控制器根据目标电子设备的设备标识,向目标电子设备发送第一指示消息。
第四方面,本申请提供一种基于语音唤醒的用户装置,该装置包括用于执行上述第二方面中的方法的单元。该装置可对应于执行上述第二方面中描述的方法,该装置中的单元的相关描述请参照上述第二方面的描述,为了简洁,在此不再赘述。
其中,上述第二方面描述的方法可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块或单元。例如,语音采集模块或单元、处理模块或单元、收发模块或单元、语音输出模块或单元等。
第五方面,本申请提供一种基于语音唤醒的控制装置,该装置包括用于执行上述第三方面中的方法的单元。该装置可对应于执行上述第三方面中描述的方法,该装置中的单元的相关描述请参照上述第三方面的描述,为了简洁,在此不再赘述。
其中,上述第三方面描述的方法可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块或单元。例如,收发模块或单元、处理模块或单元等。
第六方面,本申请提供一种电子设备,该电子设备包括处理器,处理器与存储器耦合,存储器用于存储计算机程序或指令,处理器用于执行存储器存储的计算机程序或指令,使得第二方面中的方法被执行。
例如,处理器用于执行存储器存储的计算机程序或指令,使得该装置执行第二方面中的方法。
第七方面,本申请提供一种控制器,该电子设备包括处理器,处理器与存储器耦合,存储器用于存储计算机程序或指令,处理器用于执行存储器存储的计算机程序或指令,使得第三方面中的方法被执行。
例如,处理器用于执行存储器存储的计算机程序或指令,使得该装置执行第三方面中的方法。
第八方面,本申请提供一种通信***,该通信***包括上述第六方面中的电子设备以及上述第七方面中的控制器。
第九方面,本申请提供一种计算机可读存储介质,其上存储有用于实现第一方面中的方法的计算机程序(也可称为指令或代码)。
例如,该计算机程序被计算机执行时,使得该计算机可以执行第一方面中的方法。
第十方面,本申请提供一种芯片,包括处理器。处理器用于读取并执行存储器中存储的计算机程序,以执行第一方面及其任意可能的实现方式中的方法。
可选地,该芯片还包括存储器,存储器与处理器通过电路或电线连接。
第十一方面,本申请提供一种芯片***,包括处理器。处理器用于读取并执行存储器中存储的计算机程序,以执行第一方面及其任意可能的实现方式中的方法。
可选地,该芯片***还包括存储器,存储器与处理器通过电路或电线连接。
第十二方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机程序(也可称为指令或代码),所述计算机程序被计算机执行时使得所述计算机实现第一方面中的方法。
可以理解的是,上述第二方面至第十二方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
图1为本申请实施例提供的基于语音唤醒的控制方法应用的场景架构图;
图2为本申请实施例提供的基于语音唤醒的控制方法的流程示意图;
图3为本申请实施例提供的基于语音唤醒的控制方法应用的***架构示意图;
图4为本申请实施例提供的基于语音唤醒的控制方法的流程示意图之一;
图5为本申请实施例提供的基于语音唤醒的控制方法的流程示意图之二;
图6为本申请实施例提供的基于语音唤醒的控制方法的流程示意图之三;
图7为本申请实施例提供的基于语音唤醒的控制方法的流程示意图之四;
图8为本申请实施例提供的基于语音唤醒的控制方法的流程示意图之五;
图9为本申请实施例提供的一种基于语音唤醒的用户装置的结构示意图;
图10为本申请实施例提供的一种基于语音唤醒的控制装置的结构示意图;
图11为本申请实施例提供的电子设备的硬件示意图;
图12为本申请实施例提供的控制器的硬件示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文中术语“和/或”,是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中符号“/”表示关联对象是或者的关系,例如A/B表示A或者B。
本文中的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一语音强度值和第二语音强度值等是用于区别不同的语音强度值,而不是用于描述语音强度值的特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或者两个以上,例如,多个处理单元是指两个或者两个以上的处理单元等;多个元件是指两个或者两个以上的元件等。
目前,在家庭场景中通常有多个智能家居设备,例如智能音箱、智慧屏等,其中某些智能家居设备出厂预设的唤醒语可能是相同的,在此情况下,用户说出的语音唤醒语可能会同时唤醒家庭场景中的多个智能家居设备,导致多个电子设备均会输出应答语进行响应,与用户进行语音交互。
图1示出了本申请实施例提供的方案所应用的场景架构示意图。如图1所示,该场景架构1包括多个智能家居设备,例如智慧屏10,智能音箱11,智能音箱12等。在该场景架构中,这些智能家居设备出厂预设的唤醒语相同,例如均为“你好,悠悠”。当用户想要通过语音唤醒某一智能家居设备时,用户说出语音唤醒语“你好,悠悠”之后,可能会同时唤醒智慧屏10,智能音箱11和智能音箱12,导致这多个电子设备均会输出应答语(例如“在”)进行响应,与用户进行语音交互,这样无法满足用户唤醒某一智能家居设备的需求。
鉴于此,本申请实施例提供一种基于语音唤醒的控制方法、电子设备及控制器,通过本申请方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
第一实施例
在第一实施例中,具体从电子设备与控制器交互的角度来描述本申请实施例提供的通信***的具体实现方式。需要说明的是,本申请实施例提供的方案可以应用于具有相同预设唤醒语的多个电子设备(即两个或两个以上电子设备)的场景,为了便于描述,下面以电子设备1和电子设备2为例进行示例性描述。图2是本申请第一实施例提供的基于语音唤醒的控制方法的流程示意图。参照图2所示,该控制方法100包括下述的步骤S101-S113。
S101,电子设备1采集到用户语音。
其中,由于所采集到的用户语音可能包含唤醒语或唤醒关键字,因此下文中将包含唤醒语的用户语音也称为唤醒语音或者用户唤醒语音。
电子设备1可以设置有具有采集或者拾取声音功能的麦克风,该麦克风可以实时或者周期性地采集或者拾取外界环境的声音,例如实时采集用户唤醒语音,用于实时唤醒电子设备1。
S102,电子设备1根据用户语音和预设的第一声纹特征信息,进行用户身份认证。
示例性地,若用户语音中包含预设的声纹特征信息,则用户身份认证成功,即确认该用户是授权用户,因此电子设备1的相关应用功能允许使用,进而电子设备1继续执行下述的步骤S103。
另一方面,若用户语音中不包含预设的声纹特征信息,则用户身份认证失败,即确认该用户是非授权用户,因此电子设备1的相关应用功能被禁止使用,因此电子设备1可以不响应。
可选地,预设的第一声纹特征信息可以存储于电子设备1,云服务器和/或控制器中。电子设备1可以在采集到用户语音时,从电子设备1本地,云服务器和/或控制器中调用该预设的第一声纹特征信息。
S103,电子设备1将采集到的用户语音与第一唤醒语进行比较。
在本申请实施例中,电子设备1可以先对采集到的用户语音进行语音识别,得到用户语音的文本信息,进而将该用户语音的文本信息与第一唤醒语进行比较,以判断该用户语音是否为唤醒语音。
示例性地,一方面,若该用户语音的文本信息包含第一唤醒语或者与第一唤醒语一致,则确定用户语音与第一唤醒语匹配,即该用户语音为唤醒语音,进而电子设备1继续执行下述的步骤S104。
另一方面,若该用户语音的文本信息不包含第一唤醒语,或者与第一唤醒语不一致,则确定用户语音与第一唤醒语不匹配,即该用户语音不是唤醒语音,因此电子设备1可以不响应。
在本申请实施例中,电子设备1可以先根据用户语音和预设的声纹特征信息,进行用户身份认证。进一步地,若身份认证成功,再将用户语音与第一唤醒语进行比较,进而判断该用户语音是否为唤醒语音。如此,在身份认证成功后确认是授权用户的情况下,再判断该用户语音是否为唤醒语音,可以保证用户隐私安全。
需要说明的是,在实际实现时,本申请实施例并不限定电子设备1根据用户语音进行用户身份认证,以及根据用户语音判断是否为唤醒语音的执行顺序。例如,电子设备1可以在判断采集到的用户语音为唤醒语音之后,再根据用户语音进行用户身份认证;当然,电子设备1还可以同时执行这两个步骤,在根据用户语音与预设的声纹特征信息进行用户身份认证的同时,判断用户语音是否为唤醒语音,具体可以根据实际使用需求确定,本申请实施例不作限定。
S104,若匹配,则电子设备1向控制器发送该用户语音对应的第一语音强度值。
可选地,电子设备1可以与控制器建立无线连接和/或有线连接。
示例性地,电子设备1可以通过Wi-Fi无线方式向控制器发送唤醒请求消息,该唤醒请求消息中包括电子设备1采集到的用户语音对应的第一语音强度值。
需要说明的是,唤醒请求消息中还包括电子设备1的设备标识,该设备标识用于唯一指示电子设备1。该设备标识与第一语音强度值具有对应关系。这样,控制器可以根据该对应关系,获知第一语音强度值是由电子设备1发送的。
在本申请实施例中,当根据电子设备1采集到的用户语音和预设的第一声纹特征信息确定用户身份认证成功,且电子设备1采集到的用户语音与第一唤醒语匹配时,电子设备1向控制器发送用户语音对应的第一语音强度值。
在本申请实施例中,可以采用语音强度值的大小衡量用户和设备之间的距离远近。其中,语音强度值越大,则用户和设备之间的距离越近(即距离值越小);反之亦然,用户和设备之间的距离越近(即距离值越小),则语音强度值越大。这里,语音强度值可以是用户语音的音量值(例如采用分贝(dB)表示),也可以是电信号的量值(例如采用电压值表示,单位为毫伏(mV)或者伏(V)),本申请实施例对此不作限定。
在本申请实施例中,电子设备1可以将电子设备1采集到的用户语音转换为第一电信号,根据第一电信号得到第一语音强度值。其中,第一电信号的量值可以取电压值,即得到语音强度值。
可以理解,电信号的量值与用户语音的音量值的大小成正比。即,在用户与电子设备1距离一定的情况下,用户语音强度越大,则电子设备通过麦克风采集到的分贝值越大,进而转换为电信号的量值越大。
可选地,电子设备1可以根据所采集的语音强度值(例如用户语音的音量值或者电信号的量值)是否大于或等于第一预设强度阈值(也称为上报阈值),来确定是否将该第一语音强度值上报给控制器。
示例性地,在电子设备1得到的语音强度值大于或等于第一预设强度阈值的情况下,电子设备1可以向控制器发送该语音强度值。或者,如果电子设备1得到的语音电信号的量值低于上报阈值,那么电子设备1可以不向控制器进行上报。
其中,上述第一预设强度阈值为电子设备1中预设置的强度阈值,作为上报门限,该强度阈值可以根据实际使用需求设置。在实际实现时,该强度阈值即为触发阈值,高于或等于该上报门限的语音强度值可以上报给控制器,低于该上报门限的语音强度值则不上报,这样可以提升语音交互的准确性。
还需要说明的是,本申请实施例不限定将该用户语音转换为第一电信号,并根据第一电信号得到第一语音强度值的执行时机,例如,电子设备1可以在根据用户语音身份认证通过后,将该用户语音转换为第一电信号并得到第一语音强度值;或者,电子设备1可以在判断该用户语音为唤醒语音之后,将该用户语音转换为第一电信号并得到第一语音强度值。具体可以根据实际使用需求确定,本申请实施例不作限定。
S105,电子设备2采集到用户语音。
其中,电子设备2可以将电子设备2采集到的用户语音转换为第二电信号,根据第二电信号得到第二语音强度值。
S106,电子设备2根据用户语音和预设的第二声纹特征信息,进行用户身份认证。
其中,预设的第二声纹特征信息可以存储于电子设备2,云服务器和/或控制器中。需要说明的是,预设的第二声纹特征信息和上述预设的第一声纹特征信息可以完全相同,也可以部分相同。
S107,电子设备2将采集到的用户语音与第一唤醒语进行比较。
S108,若匹配,则电子设备2向控制器发送该用户语音对应的第二语音强度值。
其中,电子设备2可以与控制器建立无线连接(例如遵循Wi-Fi协议的无线连接)和/或有线连接。
在本申请实施例中,若电子设备2根据电子设备2采集到的用户语音,确定该用户语音为唤醒语音且用户为授权用户,则向控制器发送用户语音对应的第二语音强度值。
可选地,电子设备2可以在所采集的语音强度值(例如用户语音的音量值或者电信号的量值)大于或等于第二预设强度阈值的情况下,将该第二语音强度值上报给控制器。上述第二预设强度阈值为电子设备2中预设置的强度阈值,作为上报门限,该强度阈值可以根据实际使用需求设置。需要说明的是,上述第一预设强度阈值和第二预设强度阈值的取值可以相同,也可以不同,具体可以根据实际使用需求确定,本申请实施例不作限定。
对于上述步骤S105至S108中电子设备2的一系列操作步骤类似于上述步骤S101至S104中电子设备1的一系列操作步骤,具体可以参见相关描述,此处不再赘述。
需要说明的是,本申请实施例不限定步骤S105至S108,与步骤S101至S104的执行顺序,也就是说,可以先执行步骤S105至S108,再执行步骤S101至S104;或者,可以先执行步骤S101至S104,再执行步骤S105至S108;还可以同时执行步骤S101至S104以及步骤S105至S108。图2中是以先执行步骤S101至S104,再执行步骤S105至S108为例进行示例性说明的。
从上述步骤S101至S108可知,电子设备1和电子设备2中均预置有第一唤醒语,在采集到用户唤醒语音之后,分别将各自的语音强度值发送给控制器,由控制器基于接收到的语音强度值,判断电子设备1和电子设备2中哪一个设备满足唤醒响应条件,并且在确定出满足唤醒响应条件的电子设备后,指示该电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应,控制器具体处理过程参见下述步骤S109-S111。
S109,控制器在预设时长内接收到多个电子设备发送的多个语音强度值。
其中,多个语音强度值中包括电子设备1发送的第一语音强度值和电子设备2发送的第二语音强度值。
其中,上述控制器可以被设置于路由端,与电子设备1和电子设备2均已建立连接,不但可以为电子设备1或电子设备2的报文传输进行路由,而且可以作为智能语音控制中心,对用户唤醒语音进行算法判决,因此上述控制器也可以称为智能路由器。
在本申请实施例中,当用户说出唤醒语时,用户周围的各个电子设备均采集用户语音,并将接收到的语音强度值传递给智能路由端。智能路由端作为语音控制中心,基于各个电子设备发送的语音强度值进行算法判决,可判断各个电子设备中哪一个电子设备满足预设唤醒响应条件。
需要说明的是,控制器接收到多个语音强度值的时间差在预设时长范围内,即,控制器可以基于在预设时长内(例如在1秒内)接收到多个语音强度值执行下述步骤S110或S111或S112的相关判断,这样可以保证控制器根据语音强度值进行判断的准确性和有效性。具体预设时长范围可以根据实际使用需求确定,本申请实施例不作限定。
S110,当多个语音强度值中第一语音强度值最大时,控制器指示电子设备1启动语音引擎并响应。
在本申请实施例中,当多个语音强度值中第一语音强度值最大时,即电子设备1满足预设的唤醒响应条件,控制器可以判定电子设备1为用户期望唤醒的设备,指示电子设备1启动语音引擎并响应。
可选地,控制器可以指示多个电子设备中除电子设备1之外的其他电子设备不响应。
需要说明的是,控制器可以采用语音强度值的大小,可以衡量用户和设备之间的距离远近,进而可以根据用户和设备之间的距离,衡量或者判定用户期望唤醒的设备。若电子设备1对应的第一语音强度值大于电子设备2对应的第二语音强度值,则说明相比于电子设备2,电子设备1更靠近用户,以此可以判断用户倾向于唤醒电子设备1,而非电子设备2。
基于此,控制器可以基于多个电子设备反馈的电信号量值进行比较,这是因为具有最大语音强度值的电子设备距离用户最近,因此将具有最大电信号量值的电子设备确定为要做出响应的电子设备。
通过本申请实施例提供的方案,当用户通过语音唤醒多个电子设备中的某一电子设备时,可以由距离用户最近的电子设备进行响应,避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
可选地,在一些实施例中,当电子设备1的语音强度值大于电子设备2的语音强度值时,控制器可以不但指示电子设备1启动语音引擎并响应,而且还指示电子设备2不响应。
在本申请实施例中,如前文所述,在电子设备1向控制器发送设备标识和第一语音强度值之后,相应地,控制器可以接收电子设备1发送的设备标识和第一语音强度值,当控制器判断出第一语音强度值大于第二语音强度值时,控制器可以按照该设备标识,向该设备标识对应的电子设备1发送指示消息,指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
在一种示例性的方案中,控制器可以向多个电子设备中具有最大语音强度值且与用户之间的距离值最小的电子设备发送指示消息,指示其启动语音引擎并响应。
例如,在第一语音强度值大于第二语音强度值,且电子设备1与用户之间的距离值小于电子设备2与用户之间的距离值时,控制器指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。这样,可以更加准确地判断出哪一个电子设备进行响应,提升了用户体验。
需要说明的是,对于电子设备与用户之间的距离值,具体计算方式可以参见现有技术中公开的测距方案或者室内定位方案,例如接收信号强度指示(received signalstrength indication,RSSI)测距方案等,此处不予赘述。
S111,在多个语音强度值中存在至少两个最大值的情况下,当电子设备1具有最大语音强度值,且电子设备1的历史唤醒次数最多(例如电子设备1的历史唤醒次数大于电子设备2的历史唤醒次数)时,控制器指示电子设备1启动语音引擎并响应。
示例性地,在电子设备1的语音强度值等于电子设备2的语音强度值的情况下,当电子设备1的历史唤醒次数大于电子设备2的历史唤醒次数时,控制器指示电子设备1启动语音引擎并响应。
其中,与控制器连接的电子设备的历史唤醒次数可以由控制器进行记录并存储。
S112,在多个语音强度值中存在至少两个最大值的情况下,当电子设备1最近一次响应过时,指示电子设备1启动语音引擎并响应。
其中,最近一次响应过的电子设备的设备标识也可以由控制器进行记录并存储。
需要说明的是,上述步骤S110、S111和S112可以择一执行。
可选地,当电子设备1和电子设备2均具有最大语音强度值,且电子设备1的历史唤醒次数与电子设备2的历史唤醒次数相同,且电子设备1最近一次响应过时,控制器指示电子设备1输出唤醒应答语响应。
可选地,当电子设备1和电子设备2均具有最大语音强度值,且电子设备1的历史唤醒次数小于电子设备2的历史唤醒次数时,控制器指示电子设备2输出唤醒应答语进行响应。
可选地,当电子设备1和电子设备2均具有最大语音强度值,且电子设备2最近一次响应过时,控制器指示电子设备2输出唤醒应答语进行响应。
S113,电子设备1根据控制器发送的指示消息,启动语音引擎,并输出唤醒应答语进行响应。
这样,在控制器的指示下,电子设备1启动语音引擎,并通过语音引擎输出唤醒应答语进行响应,也就是说,电子设备1被用户通过语音唤醒,可支持与用户进行语音交互,为用户提供服务。
通过本申请实施例提供的方案,当用户通过语音唤醒多个电子设备中的某一电子设备时,可以由距离用户最近的电子设备进行响应,避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
需要说明的是,为了便于描述,本申请第一实施例中是以电子设备1和电子设备2为例进行示例性说明的,其中,电子设备1和电子设备2分别采集用户唤醒语音,并将采集到的用户唤醒语音转换成电信号,得到对应的语音强度值;然后电子设备1和电子设备2分别向控制器发送语音强度值;然后由控制器基于电子设备1和电子设备2各自发送的语音强度值,判断电子设备1和电子设备2中哪个电子设备满足唤醒响应条件,并指示满足唤醒响应条件的电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应。
可以理解,本申请第一实施例提供的基于语音唤醒的控制方法的应用场景中包括但不限于上述电子设备1和电子设备2,在实际实现时,本申请方案还可以应用于具有相同预设唤醒语的三个或三个以上电子设备的场景。其中,这些电子设备分别采集用户唤醒语音,并将采集到的用户唤醒语音转换成电信号,得到对应的语音强度值;然后这些电子设备分别向控制器发送相应的语音强度值;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件,并指示满足唤醒响应条件的一个电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应。
在实际实现时,对于多个家居组网设备,联网的方式可以是Wi-Fi(无线)方式,也可以是网线(有线)方式,由于这些家居组网设备在智能路由端通常设置有对应的媒体存取控制位址(media access control address,MAC)或者网际互连协议(Internet protocol,IP)地址,智能路由端的控制器可以根据MAC/IP地址,识别这些家居组网设备。这些家居组网设备可以与智能路由端的控制器进行交互,例如分别向控制器上报用户唤醒语音的强度值,由智能路由端的控制器进行算法判断,确定满足预设唤醒响应条件的家居设备,并根据家居组网设备的MAC/IP地址,指示满足预设唤醒响应条件的家居设备启动语音引擎并响应。也就是说,可以采用智能路由端作为语音控制中心,对用户唤醒语音进行算法判决。
下面结合图3,示例性地描述本申请实施例提供的方案所应用的***架构以及方案的具体实现方式。如图3中的(a)所示,该***架构2包括多个智能家居设备,例如智慧屏10,智能音箱11,智能音箱12等,以及设置于智能路由端的控制器20。其中,控制器20可以通过有线方式或者无线方式(例如Wi-Fi)连接至多个智能家居设备中的每个智能家居设备。
其中,这多个智能家居设备均具有语音采集功能,并且支持语音唤醒功能。假设这多个智能家居设备出厂预置的唤醒语相同,例如“你好,悠悠”。如图3中的(a)所示,当用户说出用户唤醒语音“你好,悠悠”时,智慧屏10采集到用户唤醒语音,并将用户唤醒语音转换为电信号,获得语音强度值1,然后将语音强度值1发送给控制器20;智慧音箱11采集到用户唤醒语音,并将用户唤醒语音转换为电信号,获得语音强度值2,然后将语音强度值2发送给控制器20;智慧音箱12采集到用户唤醒语音,并将用户唤醒语音转换为电信号,获得语音强度值3,然后将语音强度值3发送给控制器20。
其中,多个家庭智能设备具体谁将被唤醒并响应,由控制器20判决。控制器20作为智能语音控制中心,获取这多个智能家居设备发送的语音强度值:智慧屏10发送的语音强度值1,智慧音箱11发送的语音强度值2,以及智慧音箱12发送的语音强度值3。如图3中的(b)所示,当控制器20判断出语音强度值1、语音强度值2和语音强度值3中语音强度值2为最大值时,控制器20将发送语音强度值2的智慧音箱11确定为将要做出响应的设备,并且如图3的(b)中实线所示,控制器20指示智慧音箱11启动语音引擎并进行响应。
相应地,智慧音箱11在接收到控制器20的指示后,启动语音引擎,并通过语音引擎输出唤醒应答语“在”进行响应,实现语音唤醒,进而支持与用户进行语音交互,为用户提供服务。
此外,当控制器20判断出语音强度值1、语音强度值2和语音强度值3中语音强度值2为最大值时,如图3的(b)中虚线所示,控制器20指示智慧屏10和智慧音箱12不响应,可以理解,智慧屏10和智慧音箱12将不会启动语音引擎,也不会通过语音引擎输出唤醒应答语。
通过本申请实施例提供的方案,即时用户家居组网的多个智能设备采用统一的唤醒语,当用户有唤醒某一智能设备的需求时,只需用户靠近预期唤醒的智能设备并说出唤醒语,即可唤醒该智能设备,解决了目前在多个智能设备唤醒语相同的情况下无法满足用户唤醒某一电子设备的需求的问题。
通过本申请实施例提供的通信***,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
第二实施例
在第二实施例中,具体从电子设备的角度来描述本申请方案的具体实现方式。图4是本申请第二实施例提供的基于语音唤醒的控制方法的流程示意图。参照图4所示,该控制方法200包括下述的步骤S201-S204。
S201,电子设备采集用户语音。
S202,若用户语音与电子设备中预置的第一唤醒语匹配,则电子设备向控制器发送用户语音对应的目标语音强度值,以使得控制器基于目标语音强度值判断电子设备是否满足预设的唤醒响应条件。
假设控制器接收到M个语音强度值,这M个语音强度值包括目标语音强度值和其他语音强度值,其他语音强度值为除电子设备之外的其他电子设备在采集到的用户语音与第一唤醒语匹配时,向控制器发送的语音强度值。其中,M为正整数。
S203,当电子设备满足预设的唤醒响应条件时,电子设备接收控制器发送的指示消息。
其中,该指示消息用于指示电子设备启动语音引擎,并通过语音引擎输出唤醒应答语进行响应。
S204,电子设备根据指示消息,启动电子设备的语音引擎,并通过语音引擎输出唤醒应答语进行响应。
这样,当电子设备满足预设的唤醒响应条件时,在控制器的指示下,电子设备启动语音引擎,并通过语音引擎输出唤醒应答语进行响应,也就是说,电子设备被用户通过语音唤醒,可支持与用户进行语音交互,为用户提供服务。
在一种示例性的方案中,预设的唤醒响应条件可以包括:当控制器接收到的M个语音强度值中目标语音强度值最大时,控制器指示电子设备启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
在一种示例性的方案中,上述预设的唤醒响应条件还可以包括:若控制器检测到目标语音强度值最大,且电子设备与用户之间的距离值小于其他电子设备与用户之间的距离值,则控制器指示电子设备启动语音引擎并响应。这样,可以更加准确地判断出哪一个电子设备进行响应,提升了用户体验。
通过本申请实施例提供的方案,当用户通过语音唤醒多个电子设备中的某一电子设备时,可以由距离用户最近的电子设备进行响应,避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
在一种示例性的方案中,上述预设的唤醒响应条件还可以包括:当控制器接收到的M个语音强度值中目标语音强度值最大,且电子设备的历史唤醒次数最多时,控制器指示电子设备启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
其中,与控制器连接的电子设备的历史唤醒次数可以由控制器进行记录并存储。
在一种示例性的方案中,上述预设的唤醒响应条件还可以包括:当控制器接收到的M个语音强度值中目标语音强度值最大,且电子设备是最近一次响应过的设备时,控制器指示电子设备启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
其中,最近一次响应过的电子设备的设备标识也可以由控制器进行记录并存储。
需要说明的是,上述预设的唤醒响应条件均为示例性的列举,可以理解,在实际实现时,本申请实施例包括但不限于上述列举的唤醒响应条件,具体可以根据实际使用需求确定,本申请实施例不作限定。
可选地,在本申请实施例中,控制器可以被设置于路由端,与电子设备及其他电子设备建立无线连接和/或有线连接。控制器不但可以为电子设备及其他电子设备的报文传输进行路由,而且可以作为智能语音控制中心,对用户唤醒语音进行算法判决,因此上述控制器也可以称为智能路由器。
在一种示例性的方案中,结合图4,如图5所示,在电子设备采集用户语音(即步骤即S201)之后,该控制方法200还包括下述步骤S205。
S205,电子设备将用户语音转换为目标电信号,根据目标电信号得到目标语音强度值。
在一种示例性的方案中,结合图5,如图6所示,在上述步骤S205之后,上述步骤S202具体可以通过步骤S202A实现。
S202A,若用户语音与第一唤醒语匹配,且目标语音强度值大于或等于预设强度阈值,则电子设备向控制器上报目标语音强度值。
其中,上述预设强度阈值为电子设备中预设置的强度阈值,作为上报门限,即,高于或等于该上报门限的语音强度值可以上报给控制器,低于该上报门限的语音强度值则不向控制器进行上报,这样可以提升语音交互的准确性。
在一种示例性的方案中,结合图4,如图7所示,在电子设备采集用户语音(步骤即S201)之后,该控制方法200还包括下述步骤S206。
S206,电子设备根据用户语音和预设的声纹特征信息进行用户身份认证。
进一步地,如图7所示,在步骤S206之后,上述步骤S202具体可以通过步骤S202B实现。
S202B,若根据用户语音认证成功,且用户语音与第一唤醒语匹配,则电子设备向控制器发送用户语音对应的目标语音强度值。
可选地,在本申请实施例中,电子设备可以根据用户语音和预设的声纹特征信息进行用户身份认证。若身份认证成功,则将用户语音与第一唤醒语进行比较。若用户语音的文本信息包含第一唤醒语或者与第一唤醒语一致,则确定用户语音与第一唤醒语匹配。然后,在根据用户语音认证成功,且用户语音与第一唤醒语匹配的情况下,电子设备向控制器发送用户语音对应的目标语音强度值。
如此,在身份认证成功后确认是授权用户的情况下,再判断该用户语音是否为唤醒语音,可以保证用户隐私安全。
当然,电子设备还可以先将用户语音与第一唤醒语进行比较,若用户语音与第一唤醒语匹配,再进一步根据用户语音和预设的声纹特征信息进行用户身份认证。然后,在用户语音与第一唤醒语匹配,且根据用户语音认证成功的情况下,电子设备向控制器发送用户语音对应的目标语音强度值。
如此,在身份认证成功后确认是授权用户的情况下,再向控制器发送用户语音对应的目标语音强度值,可以保证用户隐私安全。
在一种示例性的方案中,上述预设的声纹特征信息可以存储于电子设备,云服务器和/或控制器中。
在一种示例性的方案中,电子设备可以向控制器发送电子设备的设备标识和目标语音强度值,目标语音强度值与设备标识具有对应关系。该设备标识唯一表示该电子设备。
这样,当电子设备满足预设的唤醒响应条件时,控制器可以按照设备标识,向设备标识对应的电子设备发送指示消息,指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
通过本申请实施例提供的方案,即时用户家居组网的多个智能设备采用统一的唤醒语,当用户有唤醒某一智能设备的需求时,只需用户靠近预期唤醒的智能设备并说出唤醒语,即可唤醒该智能设备,解决了目前在多个智能设备唤醒语相同的情况下无法满足用户唤醒某一电子设备的需求的问题。
本申请第二实施例提供的方法200可以用于执行上文第一实施例中电子设备侧所执行的动作。具体步骤描述以及有益效果可以参见上述第一实施例中的相关描述,为了简洁,在此不再赘述。
在本申请实施例提供的方法中,电子设备可以采集用户语音;若用户语音与电子设备中预置的第一唤醒语匹配,则电子设备向控制器发送用户语音对应的目标语音强度值,以使得控制器基于目标语音强度值判断所述电子设备是否满足预设的唤醒响应条件;当电子设备满足预设的唤醒响应条件时,电子设备接收控制器发送的指示消息;电子设备根据所述指示消息,启动所述电子设备的语音引擎,并通过所述语音引擎输出所述唤醒应答语进行响应。通过该方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
第三实施例
在第三实施例中,具体从控制器的角度来描述本申请方案的具体实现方式。图8是本申请第三实施例提供的基于语音唤醒的控制方法的流程示意图。参照图8所示,该控制方法300包括下述的步骤S301-S303。
S301,控制器在预设时长内获取第一语音强度值和第二语音强度值。
其中,第一语音强度值为当电子设备1采集到的用户语音与第一唤醒语匹配时对应的语音强度值,第二语音强度值为当电子设备2采集到的用户语音与第一唤醒语匹配时对应的语音强度值;
S302,控制器根据第一语音强度值和第二语音强度值,确定电子设备1和电子设备2是否满足预设的唤醒响应条件。
S303,当电子设备1满足预设的唤醒响应条件时,控制器指示电子设备1启动语音引擎并响应。
其中,对于预设的唤醒响应条件的描述具体可以参照上述第一实施例和第二实施例中对预设的唤醒响应条件的相关描述,此处不再赘述。
在本申请实施例中,该控制器可以被设置于路由端,与电子设备1和电子设备2建立无线连接和/或有线连接。
在本申请实施例中,当用户说出唤醒语时,用户周围的各个电子设备均采集用户语音,并将接收到的语音强度值传递给智能路由端。智能路由端作为语音控制中心,基于各个电子设备发送的语音强度值进行算法判决,可判断各个电子设备中哪一个电子设备满足预设唤醒响应条件。
在一种示例性的方案中,当控制器检测出第一语音强度值大于第二语音强度值时,控制器确定电子设备1满足预设的唤醒响应条件,并指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
在一种示例性的方案中,在控制器检测到第一语音强度值大于第二语音强度值,且电子设备1与用户之间的第一距离值小于电子设备2与用户之间的第二距离值时,控制器确定电子设备1满足预设的唤醒响应条件,并指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
通过本申请实施例提供的方案,当用户想要通过语音唤醒某一电子设备时,可以由距离用户最近的电子设备进行响应,避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
在一种示例性的方案中,在控制器检测到第一语音强度值等于第二语音强度值的情况下,当控制器检测到所述第一电子设备的历史唤醒次数大于第二电子设备的历史唤醒次数时,控制器确定电子设备1满足预设的唤醒响应条件,并指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
在一种示例性的方案中,在控制器检测到第一语音强度值等于第二语音强度值的情况下,当电子设备1是最近一次响应过的设备时,控制器确定电子设备1满足预设的唤醒响应条件,并指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
在一种示例性的方案中,该控制方法300还包括:当第一语音强度值大于第二语音强度值时,控制器确定电子设备2不满足预设的唤醒响应条件,并指示电子设备2不响应。
在一种示例性的方案中,该控制方法300还包括:在第一语音强度值等于第二语音强度值的情况下,当电子设备1的历史唤醒次数大于电子设备2的历史唤醒次数,或者最近一次响应过的设备是电子设备1时,控制器确定电子设备2不满足预设的唤醒响应条件,并指示电子设备2不响应。
在一种示例性的方案中,控制器可以接收电子设备1发送的设备标识1和第一语音强度值,第一语音强度值与设备标识具有对应关系。进一步地,当控制器检测到第一语音强度值大于第二语音强度值时,控制器确定电子设备1满足预设的唤醒响应条件,并按照设备标识1,向设备标识1对应的电子设备1发送指示消息,指示电子设备1启动语音引擎并通过语音引擎输出唤醒应答语进行响应。
需要说明的是,在本申请实施例中,控制器可以基于在预设时长内(例如在1秒内)接收到第一语音强度值和第二语音强度值判断哪个电子设备满足预设唤醒响应条件,这样可以保证控制器根据语音强度值进行判断的准确性和有效性。具体预设时长范围可以根据实际使用需求确定,本申请实施例不作限定。
这样,在控制器的指示下,电子设备1启动语音引擎,并通过语音引擎输出唤醒应答语进行响应,也就是说,电子设备1被用户通过语音唤醒,可支持与用户进行语音交互,为用户提供服务。
需要说明的是,为了便于描述,本申请第三实施例中是以电子设备1和电子设备2为例进行示例性说明的,其中,电子设备1和电子设备2分别采集用户唤醒语音,并将采集到的用户唤醒语音转换成电信号,得到对应的语音强度值;然后电子设备1和电子设备2分别向控制器发送语音强度值;然后由控制器基于电子设备1和电子设备2各自发送的语音强度值,判断电子设备1和电子设备2中哪个电子设备满足唤醒响应条件,并指示满足唤醒响应条件的电子设备启动语音引擎以及响应。
可以理解,本申请第三实施例提供的基于语音唤醒的控制方法的应用场景中包括但不限于上述电子设备1和电子设备2,在实际实现时,本申请方案还可以应用于具有相同预设唤醒语的三个或三个以上电子设备的场景,具体实现步骤类似于第三实施例中的实现步骤,此处不再赘述。
本申请第三实施例提供的方法300可以用于执行上文第一实施例中控制器侧所执行的动作。具体步骤描述以及有益效果可以参见上述第一实施例中的相关描述,为了简洁,在此不再赘述。
在本申请实施例提供的方法中,控制器在预设时长内获取第一语音强度值和第二语音强度值(第一语音强度值为当电子设备1采集到的用户语音与第一唤醒语匹配时对应的语音强度值,第二语音强度值为当电子设备2采集到的用户语音与第一唤醒语匹配时对应的语音强度值);控制器根据第一语音强度值和第二语音强度值,确定电子设备1和电子设备2是否满足预设的唤醒响应条件;当电子设备1满足预设的唤醒响应条件时,控制器指示电子设备1启动语音引擎并响应。通过该方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备启动语音引擎以及通过语音引擎输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
还需要说明的是,本申请上述实施例中均是以控制器接收到两个或两个以上语音强度值后进行判断为例说明的,在实际实现时,本申请实施例也同样支持控制器接收到一个语音强度值进行判断的场景,此时控制器可以确定:发送该语音强度值的电子设备满足预设的唤醒响应条件,并指示该电子设备启动语音引擎以及响应。
通过本申请实施例提供的方案,即时用户家居组网的多个智能设备采用统一的唤醒语,当用户有唤醒某一智能设备的需求时,只需用户靠近预期唤醒的智能设备并说出唤醒语,即可唤醒该智能设备,解决了目前在多个智能设备唤醒语相同的情况下无法满足用户唤醒某一电子设备的需求的问题。
在本申请实施例中,当基于已有多个设备的基础上新增设备时,通过本申请实施例可以实现无感知一体化家庭语音***。例如,对于书房、厨房、LOFT二层等复杂场景,通过本申请实施例可以实现全屋随时随地的“一体化智能语音唤醒”。也就是说,无需用户进行任何配置,家庭正常组网即可实现上述方案。
与现有技术相比不同的是,本申请实施例中,各个电子设备可以向智能路由器上传语音信号。该上报机制是现有技术没有的。其中,各个电子设备向智能路由器上传语音信号的上报机制,这可以通过软件代码、日志文件(log)等分析查看。
此外,与现有技术相比不同的是,本申请实施例中,智能路由器可以根据各个电子设备上报的语音信号的强度进行判决。该语音强度判决机制是现有技术没有的。其中,智能路由器的语音强度判决机制,可以通过软件代码、log等分析查看。
本申请实施例并未对本申请实施例提供的方法的执行主体的具体结构进行特别限定,只要能够通过运行记录有本申请实施例提供的方法的代码的程序,以根据本申请实施例提供的方法进行通信即可。例如,本申请实施例提供的方法的执行主体可以是电子设备或路由器设备,或者,是电子设备或路由器设备中能够调用程序并执行程序的功能模块。
还需要说明的是,在本申请实施例中,“大于”可以替换为“大于或等于”,“小于或等于”可以替换为“小于”,或者,“大于或等于”可以替换为“大于”,“小于”可以替换为“小于或等于”。
本文中描述的各个实施例可以为独立的方案,也可以根据内在逻辑进行组合,这些方案都落入本申请的保护范围中。
可以理解的是,上述各个方法实施例中由电子设备实现的方法和操作,也可以由可用于电子设备的部件(例如芯片或者电路)实现。
上文描述了本申请提供的方法实施例,下文将描述本申请提供的装置实施例。应理解,装置实施例的描述与方法实施例的描述相互对应,因此,未详细描述的内容可以参见上文方法实施例,为了简洁,这里不再赘述。
上文主要从方法步骤的角度对本申请实施例提供的方案进行了描述。可以理解的是,为了实现上述功能,实施该方法的电子设备包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的保护范围。
本申请实施例可以根据上述方法示例,对电子设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有其它可行的划分方式。下面以采用对应各个功能划分各个功能模块为例进行说明。
图9为本申请实施例提供的基于语音唤醒的用户装置400的示意性框图。该装置400用于执行以上图4至图7对应的实施例提供的基于语音唤醒的控制方法,该装置400可以用于执行上文方法实施例中电子设备所执行的动作。
本申请实施例可以根据上述图4至图7对应的实施例提供的基于语音唤醒的控制方法对电子设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,参照图9所示,提供一种电子设备进行功能模块划分的方式,包括:语音采集单元410,处理单元420、收发单元430以及语音输出单元440。本申请提供的各个单元模块所实现的功能具体如下:
语音采集单元410,用于采集用户语音;
处理单元420,用于判断用户语音与电子设备中预置的第一唤醒语是否匹配;
收发单元430,用于若用户语音与电子设备中预置的第一唤醒语匹配,则向控制器发送用户语音对应的目标语音强度值,以使得控制器基于目标语音强度值判断电子设备是否满足预设的唤醒响应条件;
收发单元430,还用于当电子设备满足预设的唤醒响应条件时,接收控制器发送的第一指示消息;
语音输出单元440,用于响应于第一指示消息,输出唤醒应答语进行响应;
其中,上述预设的唤醒响应条件可以包括:当控制器接收到的多个电子设备发送的多个语音强度值中目标语音强度值最大时,控制器指示电子设备输出唤醒应答语进行响应;多个电子设备的唤醒语相同。
在一些实施例中,语音输出单元440,具体用于响应于第一指示消息,启动语音引擎,并通过语音引擎输出唤醒应答语进行响应。
在一些实施例中,上述预设的唤醒响应条件还包括:
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若多个电子设备中电子设备的历史唤醒次数最多时,则控制器指示电子设备输出唤醒响应语进行响应;
或者,当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若多个电子设备中电子设备最近一次响应过,则控制器指示电子设备输出唤醒响应语进行响应。
在一些实施例中,控制器被设置于路由端。
在一些实施例中,在电子设备采集用户语音之前,电子设备与控制器建立无线连接和/或有线连接。
在一些实施例中,处理单元420还用于:在语音采集单元410采集用户语音之后,将用户语音转换为目标电信号,根据目标电信号得到目标语音强度值。
在一些实施例中,收发单元430,具体用于:在目标语音强度值大于或等于预设强度阈值的情况下,向控制器发送用户语音对应的目标语音强度值。
在一些实施例中,收发单元430,具体用于:在根据用户语音和预设的声纹特征信息确定用户身份认证成功,且用户语音与第一唤醒语匹配的情况下,向控制器发送用户语音对应的目标语音强度值。
在一些实施例中,上述根据用户语音和预设的声纹特征信息确定用户身份认证成功,且用户语音与第一唤醒语匹配,包括:
根据用户语音和预设的声纹特征信息进行用户身份认证;
若身份认证成功,则将用户语音与第一唤醒语进行比较;
若用户语音的文本信息包含第一唤醒语或者与第一唤醒语一致,则确定用户语音与第一唤醒语匹配。
在一些实施例中,预设的声纹特征信息可以存储于多个电子设备中的每个电子设备,云服务器和/或控制器中。
在一些实施例中,上述向控制器发送用户语音对应的目标语音强度值,包括:向控制器发送电子设备的设备标识和目标语音强度值,该目标语音强度值与设备标识具有对应关系。
当然,本申请实施例提供的电子设备包括但不限于上述单元,例如电子设备还可以包括存储单元。存储单元可以用于存储电子设备的程序代码。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请提供的基于语音唤醒的用户装置,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
根据本申请实施例的装置400可对应于执行本申请实施例中描述的方法,并且装置400中的单元的上述和其它操作和/或功能分别为了实现方法的相应流程,为了简洁,在此不再赘述。
图10为本申请实施例提供的基于语音唤醒的装置500的示意性框图。该装置500用于执行以上图8对应的实施例提供的基于语音唤醒的控制方法,该装置500可以用于执行上文方法实施例中控制器所执行的动作。
本申请实施例可以根据上述图8对应的实施例提供的基于语音唤醒的控制方法对装置500进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,参照图10所示,提供一种控制器进行功能模块划分的方式,包括:收发单元510和处理单元520。本申请提供的各个单元模块所实现的功能具体如下:
收发单元510,用于在预设时长内接收到多个电子设备发送的语音强度值;
处理单元520,用于比较语音强度值的大小,语音强度值为每个电子设备采集到的用户语音与预置的唤醒语匹配时对应的语音强度值,其中每个电子设备对应一个语音强度值,该多个电子设备预置的唤醒语相同;
收发单元510,还用于向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,该第一指示消息用于指示目标电子设备输出唤醒应答语进行响应。
其中,该第一指示消息可以用于指示目标电子设备启动语音引擎,并输出唤醒应答语进行响应。
在一些实施例中,处理单元520,还用于当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若判断出多个电子设备中电子设备的历史唤醒次数最多时,则指示电子设备输出唤醒应答语进行响应;
在一些实施例中,处理单元520,还用于当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若判断出多个电子设备中电子设备最近一次响应过,则指示电子设备输出唤醒应答语进行响应。
在一些实施例中,装置500可以被设置于路由端。
在一些实施例中,装置500与多个电子设备分别建立无线连接和/或有线连接。
在一些实施例中,收发单元510,还用于向多个电子设备中除目标电子设备之外的其他电子设备发送第二指示信息,该第二指示信息用于指示其他电子设备不响应。
在一些实施例中,上述向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:
若多个电子设备中目标电子设备具有最大语音强度值,且多个电子设备中目标电子设备与用户之间的距离值最小,则控制器向目标电子设备发送第一指示消息。
在一些实施例中,上述在预设时长内接收到多个电子设备发送的语音强度值,包括:在预设时长内接收到多个电子设备发送的设备标识和语音强度值,该语音强度值与设备标识具有对应关系,每个电子设备对应一个设备标识;
其中,上述向多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:若多个电子设备中目标电子设备具有最大语音强度值,则控制器根据目标电子设备的设备标识,向目标电子设备发送第一指示消息。
当然,本申请实施例提供的电子设备包括但不限于上述单元,例如电子设备还可以包括存储单元。存储单元可以用于存储电子设备的程序代码。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请提供的基于语音唤醒的用户装置,多个电子设备中的每个电子设备在采集到的用户语音与第一唤醒语匹配时,向控制器发送用户语音对应的语音强度值。控制器接收多个电子设备发送的多个语音强度值,并比较多个语音强度值的大小,该多个电子设备中的每个电子设备对应一个语音强度值。控制器向多个电子设备中与最大语音强度值对应的目标电子设备发送第一指示信息,用于指示目标电子设备输出第一唤醒应答语进行响应。目标电子设备根据控制器发送的所述第一指示消息,输出第一唤醒应答语进行响应。
通过本申请方案,在多个电子设备唤醒语相同的场景中,当用户通过语音唤醒某一设备时,多个电子设备分别采集用户唤醒语音,并将用户唤醒语音的语音强度值上报给智能路由端的控制器;然后由控制器基于这些电子设备各自发送的语音强度值,判断这些电子设备中哪个电子设备满足唤醒响应条件(例如语音强度值最大和/或历史唤醒次数最多和/或最近一次响应过),并指示满足唤醒响应条件的一个电子设备输出唤醒应答语进行响应,这样避免了多个电子设备同时响应的情况发生,从而提升用户使用体验。
根据本申请实施例的装置500可对应于执行本申请实施例中描述的方法,并且装置500中的单元的上述和其它操作和/或功能分别为了实现方法的相应流程,为了简洁,在此不再赘述。
图11是本申请实施例提供的电子设备600的硬件示意性图。如图11所示,电子设备600可以包括:处理器601、存储器602、无线通信模块603、音频模块604和电源模块605等,这些部件可通过一根或多根通信总线或信号线(图中未示出)进行通信。下面结合图11对电子设备的各个部件进行具体的介绍。
处理器601是电子设备的控制中心,利用各种接口和线路连接电子设备的各个部分,通过运行或执行存储在存储器602内的应用程序,以及调用存储在存储器602内的数据,执行电子设备的各种功能和处理数据。处理器601可以包括一个或多个处理单元,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器601中。处理器601具体可以是集成的控制芯片,也可以由包括各种有源和/或无源部件的电路组成,且该电路被配置为执行本申请实施例描述的属于处理器601的功能。
应理解,在本申请实施例中,该处理器601可以采用中央处理单元(centralprocessing unit,CPU)。该处理器还可以是其它通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。或者该处理器601采用一个或多个集成电路,用于执行相关程序,以实现本申请实施例所提供的技术方案。
存储器602用于存储应用程序以及数据,处理器601通过运行存储在存储器602的应用程序以及数据,执行电子设备的各种功能以及数据处理。存储器602主要包括存储程序区以及存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可以存储根据使用电子设备时所创建的数据。
此外,存储器602可以包括只读存储器,随机存取存储器,还可以包括非易失存储器,例如磁盘存储器件、闪存器件或其他易失性固态存储器件等,并向处理器601提供指令和数据。存储器602可以存储各种操作***。上述存储器602可以独立于处理器601,通过上述通信总线与处理器601相连接;或者,存储器602也可以和处理器601集成在一起。
无线通信模块603可以用于支持通过无线通信技术实现电子设备之间的无线连接和无线通信。在一些实施例中,该无线通信模块603可以为蓝牙芯片,或者Wi-Fi芯片。例如,电子设备600可以通过该Wi-Fi芯片,与智能路由端的Wi-Fi芯片之间建立无线连接,以通过该无线连接实现电子设备600和智能路由端之间的无线通信和业务处理。
另外,无线通信模块603还可以包括天线,无线通信模块603经由天线接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器601。无线通信模块603还可以从处理器601接收待发送的信号,对其进行调频,放大,经天线转为电磁波辐射出去。
音频模块604可以用于管理音频数据,实现电子设备输入和输出音频流。音频模块604可以包括用于输出音频流的扬声器6041(或称听筒、受话器)组件,麦克风6042(或称话筒,传声器),与麦克风相配合的麦克收音电路等。扬声器6041可以用于将音频电信号转换成声音信号并播放。麦克风6042可以用于将声音信号转换为音频电信号。
电源模块605可以向各个部件供电,比如电源模块605包括电池和电源管理芯片,电池可以通过电源管理芯片与处理器601逻辑相连,从而通过电源模块605实现管理充电、放电、以及功耗管理等功能。
在一些实施例中,电子设备还可以包含显示器(或显示屏),也可以不包含显示器。显示器可以用于显示APP的显示界面,比如当前播放的歌曲等。显示器包括显示面板,显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organiclight-emitting diode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode,AMOLED),柔性发光二极管(flexlight-emitting diode,FLED),量子点发光二极管(quantum dot light emittingdiodes,QLED)等。在一些实施例中,显示器中可以设置触摸传感器,形成触摸屏,本申请实施例不作限定。触摸传感器用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给处理器601,以确定触摸事件类型。处理器601可以通过显示器提供与触摸操作相关的视觉输出。
在一些实施例中,电子设备还可以包含更多的器件,例如USB接口、传感器等,本申请实施例不多赘述。图11示出的各种部件可以在包括一个或多个信号处理或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。可以理解的是,本申请实施例示意的结构并不构成对电子设备的具体限定。电子设备还可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。
可选的,电子设备600还可以包括总线。其中,存储器602、无线通信模块603可以通过总线与处理器601连接。总线可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,图11所示的电子设备600中的处理器601可以对应于图9中的装置400中的处理单元420,电子设备600中的麦克风6042可以对应于装置400中的语音采集单元410,扬声器6041可以对应于装置400中的语音输出单元440,无线通信模块603可以对应于装置400中的收发单元430。并且,电子设备600中的各个单元的上述和其它操作和/或功能分别为了实现方法的相应流程,为了简洁,在此不再赘述。
在电子设备600运行时,该电子设备600执行存储器602中的计算机执行指令以通过电子设备600执行上述图4至图7中任一项方法的操作步骤。
可选地,本申请实施例中的电子设备可以为支持语音唤醒功能的移动终端,也可以为支持语音唤醒功能的非移动终端。示例性的,移动终端可以为智能音箱、手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备(例如智能手表)、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digitalassistant,PDA)等支持语音唤醒功能的各种设备,非移动终端可以为个人计算机(personal computer,PC)、智慧屏、柜员机或者自助机等支持语音唤醒功能的各种设备,本申请实施例不作具体限定。
本申请的实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令;当其在电子设备上运行时,使得电子设备执行如上述的基于语音唤醒的控制方法。
本申请的实施例还提供一种包括指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行如上述基于语音唤醒的控制方法。
本申请的实施例还提供一种芯片***,该芯片***包括处理器,用于支持电子设备实现上述的基于语音唤醒的控制方法。在一种可能的设计中,该芯片***还包括存储器。该存储器,用于保存电子设备的程序指令和数据。当然,存储器也可以不在芯片***中。该芯片***,可以由芯片构成,也可以包含芯片和其他分立器件,本申请实施例对此不作具体限定。
图12是本申请实施例提供的控制器700的结构性示意性图。该控制器700包括:处理器710、存储器720、通信接口730、总线740。
其中,该处理器710可以与存储器720连接。该存储器720可以用于存储该程序代码和数据。因此,该存储器720可以是处理器710内部的存储单元,也可以是与处理器710独立的外部存储单元,例如独立的服务器或者云存储,还可以是包括处理器710内部的存储单元以及与处理器710独立的外部存储单元的部件。
可选地,控制器700还可以包括总线740。其中,存储器720、通信接口730可以通过总线740与处理器710连接。总线740可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。该总线740可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
应理解,在本申请实施例中,该处理器710可以采用中央处理单元(centralprocessing unit,CPU)。该处理器还可以是其它通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。或者该处理器710采用一个或多个集成电路,用于执行相关程序,以实现本申请实施例所提供的技术方案。
该存储器720可以包括只读存储器和随机存取存储器,并向处理器710提供指令和数据。处理器710的一部分还可以包括非易失性随机存取存储器。例如,处理器710还可以存储设备类型的信息。
在控制器700运行时,处理器710执行存储器720中的计算机执行指令以执行上述图8所示的方法的操作步骤。
在本申请实施例中,图12所示的控制器700中的处理器610可以对应于图10中的装置500中的处理单元520,控制器700中的通信接口730可以对应于装置500中的收发单元510。并且,控制器700中的各个单元的上述和其它操作和/或功能分别为了实现方法的相应流程,为了简洁,在此不再赘述。
可选地,控制器700可以为智能路由器,或者为其他任意可能的控制器,本申请实施例对控制器700的设备类型不予具体限定。
应理解,根据本申请实施例的控制器700可对应于本申请实施例中的装置500。装置500中的各个单元的上述和其它操作和/或功能分别用于实现上述方法的相应流程,为了简洁,在此不再赘述。
本申请的实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令;当其在控制器上运行时,使得控制器执行如上述的基于语音唤醒的控制方法。
本申请的实施例还提供一种包括指令的计算机程序产品,当其在控制器上运行时,使得控制器执行如上述的基于语音唤醒的控制方法。
本申请的实施例还提供一种芯片***,该芯片***包括处理器,用于支持控制器实现上述的基于语音唤醒的控制方法。在一种可能的设计中,该芯片***还包括存储器。该存储器,用于保存控制器的程序指令和数据。当然,存储器也可以不在芯片***中。该芯片***,可以由芯片构成,也可以包含芯片和其他分立器件,本申请实施例对此不作具体限定。
在上述实施例中,可以全部或部分的通过软件,硬件,固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式出现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据电子设备。该可用介质可以是磁性介质(例如,软盘,硬盘、磁带)、光介质(例如DVD)或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (32)
1.一种基于语音唤醒的控制方法,其特征在于,应用于第一电子设备和第二电子设备,所述第一电子设备和所述第二电子设备的唤醒语相同,且所述唤醒语为第一唤醒语;所述方法包括:
所述第一电子设备确定采集到的用户语音与所述第一唤醒语匹配;
所述第一电子设备确定所述用户语音的强度值为第一语音强度值;
所述第一电子设备向控制器发送所述第一语音强度值;
所述第二电子设备确定采集到的用户语音与所述第一唤醒语匹配;
所述第二电子设备确定所述用户语音的强度值为第二语音强度值;
所述第二电子设备向所述控制器发送所述第二语音强度值;
所述控制器接收所述第一语音强度值和所述第二语音强度值;
所述控制器确定所述第一语音强度值大于所述第二语音强度值;
所述控制器向所述第一电子设备发送第一指示消息,所述第一指示消息用于指示所述第一电子设备进行响应;
所述第一电子设备响应于所述第一指示消息,输出第一唤醒应答语进行响应。
2.根据权利要求1所述的方法,其特征在于,所述方法应用于多个电子设备,所述多个电子设备包括所述第一电子设备、所述第二电子设备和第三电子设备,所述多个电子设备的唤醒语相同,且所述唤醒语为所述第一唤醒语;
所述方法还包括:
所述第三电子设备确定采集到的用户语音与所述第一唤醒语匹配;
所述第三电子设备确定所述用户语音的强度值为第三语音强度值;
所述第三电子设备向所述控制器发送所述第三语音强度值;
其中,所述控制器接收所述第一语音强度值和所述第二语音强度值,包括:所述控制器接收所述第一语音强度值、所述第二语音强度值和所述第三语音强度值;
其中,所述控制器确定第一语音强度值大于第二语音强度值,包括:所述控制器确定所述第一语音强度值、所述第二语音强度值和所述第三语音强度值中的最大语音强度值;
其中,所述控制器向所述第一电子设备发送第一指示消息,包括:所述控制器向所述多个电子设备中与所述最大语音强度值对应的目标电子设备发送所述第一指示消息;
其中,所述第一电子设备响应于所述第一指示消息,输出第一唤醒应答语进行响应,包括:所述目标电子设备响应于所述第一指示消息,输出所述第一唤醒应答语进行响应。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中目标电子设备具有最大语音强度值,且所述多个电子设备中所述目标电子设备的历史唤醒次数最多,则所述控制器向所述目标电子设备发送所述第一指示消息;或者,
当多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中目标电子设备具有最大语音强度值,且所述多个电子设备中所述目标电子设备最近一次响应过,则所述控制器向所述目标电子设备发送所述第一指示消息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一电子设备响应于所述第一指示消息,输出第一唤醒应答语进行响应,包括:
所述第一电子设备响应于所述第一指示消息,启动语音引擎,输出所述第一唤醒应答语进行响应。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
所述控制器向所述第二电子设备发送第二指示信息,所述第二指示信息用于指示所述第二电子设备不响应。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述控制器被设置于路由端。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
所述第一电子设备和所述第二电子设备分别与所述控制器建立无线连接和/或有线连接。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述第一电子设备确定所述用户语音的强度值为第一强度值,包括:
所述第一电子设备将采集到的用户语音转换为电信号,根据所述电信号得到所述第一语音强度值。
9.根据权利要求1至5中任一项所述的方法,其特征在于,所述第一电子设备向控制器发送所述第一语音强度值,包括:
所述第一电子设备确定所述第一语音强度值大于或等于预设强度阈值;
所述第一电子设备向所述控制器发送所述第一语音强度值。
10.根据权利要求1至7中任一项所述的方法,其特征在于,在所述第一电子设备向控制器发送所述第一语音强度值之前,所述方法还包括:
所述第一电子设备根据采集到的用户语音和预设的声纹特征信息进行用户身份认证;
其中,所述第一电子设备向控制器发送所述第一语音强度值,包括:
在所述第一电子设备根据采集到的用户语音确认用户身份认证成功,且所采集到的用户语音与所述第一唤醒语匹配的情况下,所述第一电子设备向所述控制器发送所述第一语音强度值。
11.根据权利要求10所述的方法,其特征在于,
所述预设的声纹特征信息存储于多个电子设备中的每个电子设备,云服务器和/或所述控制器中。
12.一种基于语音唤醒的控制方法,应用于电子设备,其特征在于,所述方法包括:
采集用户语音;
若用户语音与所述电子设备中预置的第一唤醒语匹配,则向控制器发送所述用户语音对应的目标语音强度值,以使得所述控制器基于所述目标语音强度值判断所述电子设备是否满足预设的唤醒响应条件;
当所述电子设备满足预设的唤醒响应条件时,接收所述控制器发送的第一指示消息;
响应于所述第一指示消息,输出第一唤醒应答语进行响应;
其中,所述预设的唤醒响应条件包括:当所述控制器接收到的多个电子设备发送的多个语音强度值中所述目标语音强度值最大时,所述控制器指示所述电子设备输出所述第一唤醒应答语进行响应;所述多个电子设备的唤醒语相同。
13.根据权利要求12所述的方法,其特征在于,所述预设的唤醒响应条件还包括:
当所述多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中所述电子设备的历史唤醒次数最多时,则所述控制器指示所述电子设备启动语音引擎并响应;或者,
当所述多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述多个电子设备中所述电子设备最近一次响应过,则所述控制器指示所述电子设备启动语音引擎并响应。
14.根据权利要求12或13所述的方法,其特征在于,所述控制器被设置于路由端,所述控制器与所述电子设备建立无线连接和/或有线连接。
15.根据权利要求12至14中任一项所述的控制方法,其特征在于,所述响应于所述第一指示消息,输出第一唤醒应答语进行响应,包括:
响应于所述第一指示消息,启动语音引擎,输出所述第一唤醒应答语进行响应。
16.根据权利要求12至15中任一项所述的方法,其特征在于,在所述采集用户语音之后,所述方法还包括:
将所述用户语音转换为目标电信号,根据所述目标电信号得到所述目标语音强度值。
17.根据权利要求12至16中任一项所述的方法,其特征在于,所述向控制器发送所述用户语音对应的目标语音强度值,包括:
在所述目标语音强度值大于或等于预设强度阈值的情况下,向所述控制器发送所述用户语音对应的目标语音强度值。
18.根据权利要求12至17中任一项所述的方法,其特征在于,所述向控制器发送所述用户语音对应的目标语音强度值,包括:
当根据所述用户语音和预设的声纹特征信息确定用户身份认证成功,且所述用户语音与所述第一唤醒语匹配时,向所述控制器发送所述用户语音对应的目标语音强度值。
19.根据权利要求18所述的方法,其特征在于,所述根据所述用户语音和预设的声纹特征信息确定用户身份认证成功,且所述用户语音与所述第一唤醒语匹配,包括:
根据所述用户语音和预设的声纹特征信息进行用户身份认证;
若身份认证成功,则将所述用户语音与所述第一唤醒语进行比较;
若所述用户语音的文本信息包含所述第一唤醒语或者与所述第一唤醒语一致,则确定所述用户语音与所述第一唤醒语匹配。
20.根据权利要求18或19所述的方法,其特征在于,
所述预设的声纹特征信息存储于所述多个电子设备中的每个电子设备,云服务器和/或所述控制器中。
21.根据权利要求12至20中任一项所述的方法,其特征在于,所述向控制器发送所述用户语音对应的目标语音强度值,包括:
向所述控制器发送所述电子设备的设备标识和所述目标语音强度值,所述目标语音强度值与所述设备标识具有对应关系。
22.一种基于语音唤醒的控制方法,应用于控制器,其特征在于,所述方法包括:
若在预设时长内接收到多个电子设备发送的语音强度值,则比较所述语音强度值的大小,所述语音强度值为每个电子设备采集到的用户语音与预置的唤醒语匹配时对应的语音强度值,其中每个电子设备对应一个语音强度值,所述多个电子设备预置的唤醒语相同;
向所述多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,所述第一指示消息用于指示所述目标电子设备输出唤醒响应语进行响应。
23.根据权利要求22所述的方法,其特征在于,所述方法还包括:
当所述多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述控制器判断出所述多个电子设备中所述电子设备的历史唤醒次数最多时,则指示所述电子设备启动语音引擎并响应;或者,
当所述多个语音强度值中的至少两个语音强度值相等且均为最大值时,若所述控制器判断出所述多个电子设备中所述电子设备最近一次响应过,则指示所述电子设备启动语音引擎并响应。
24.根据权利要求22或23所述的方法,其特征在于,所述控制器被设置于路由端,所述控制器与所述多个电子设备分别建立无线连接和/或有线连接。
25.根据权利要求22至24中任一项所述的方法,其特征在于,所述方法还包括:
所述控制器向所述多个电子设备中除所述目标电子设备之外的其他电子设备发送第二指示信息,所述第二指示信息用于指示所述其他电子设备不响应。
26.根据权利要求22至25中任一项所述的方法,其特征在于,所述向所述多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:
若所述多个电子设备中所述目标电子设备具有最大语音强度值,且所述多个电子设备中所述目标电子设备与用户之间的距离值最小,则所述控制器向所述目标电子设备发送所述第一指示消息。
27.根据权利要求22至26中任一项所述的方法,其特征在于,所述在预设时长内接收到多个电子设备发送的语音强度值,包括:
在预设时长内接收到所述多个电子设备发送的设备标识和语音强度值,所述语音强度值与所述设备标识具有对应关系,每个电子设备对应一个设备标识;
其中,所述向所述多个电子设备中具有最大语音强度值的目标电子设备发送第一指示消息,包括:
若所述多个电子设备中所述目标电子设备具有最大语音强度值,则所述控制器根据所述目标电子设备的设备标识,向所述目标电子设备发送所述第一指示消息。
28.一种电子设备,其特征在于,包括处理器,所述处理器与存储器耦合,所述处理器用于执行所述存储器中存储的计算机程序或指令,以使得所述电子设备实现如权利要求12至21中任一项所述的方法。
29.一种控制器,其特征在于,包括处理器,所述处理器与存储器耦合,所述处理器用于执行所述存储器中存储的计算机程序或指令,以使得所述控制器实现如权利要求22至27中任一项所述的方法。
30.一种通信***,其特征在于,包括至少一个如权利要求28所述的电子设备,以及如权利要求29所述的控制器。
31.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序在电子设备上运行时,以实现如权利要求12至21中任一项所述的方法,和/或当所述计算机程序在控制器上运行时,以实现如权利要求22至27中任一项所述的方法。
32.一种芯片***,其特征在于,所述芯片***与存储器耦合,所述芯片***用于读取并执行所述存储器中存储的计算机程序,以实现如权利要求12至21中任一项所述的方法,和/或如权利要求22至27中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611312.6A CN113421559B (zh) | 2021-06-01 | 2021-06-01 | 基于语音唤醒的控制方法、电子设备及控制器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611312.6A CN113421559B (zh) | 2021-06-01 | 2021-06-01 | 基于语音唤醒的控制方法、电子设备及控制器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113421559A true CN113421559A (zh) | 2021-09-21 |
CN113421559B CN113421559B (zh) | 2023-04-07 |
Family
ID=77713650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110611312.6A Active CN113421559B (zh) | 2021-06-01 | 2021-06-01 | 基于语音唤醒的控制方法、电子设备及控制器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113421559B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023097524A1 (zh) * | 2021-11-30 | 2023-06-08 | 华为技术有限公司 | 设备的控制方法及装置 |
CN117437919A (zh) * | 2023-12-18 | 2024-01-23 | 美智纵横科技有限责任公司 | 语音交互方法、装置、电子设备和可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106356060A (zh) * | 2016-08-23 | 2017-01-25 | 北京小米移动软件有限公司 | 语音通信方法及装置 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及*** |
CN110459221A (zh) * | 2019-08-27 | 2019-11-15 | 苏州思必驰信息科技有限公司 | 多设备协同语音交互的方法和装置 |
CN111091828A (zh) * | 2019-12-31 | 2020-05-01 | 华为技术有限公司 | 语音唤醒方法、设备及*** |
CN111369988A (zh) * | 2018-12-26 | 2020-07-03 | 华为终端有限公司 | 一种语音唤醒方法及电子设备 |
-
2021
- 2021-06-01 CN CN202110611312.6A patent/CN113421559B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106356060A (zh) * | 2016-08-23 | 2017-01-25 | 北京小米移动软件有限公司 | 语音通信方法及装置 |
CN111369988A (zh) * | 2018-12-26 | 2020-07-03 | 华为终端有限公司 | 一种语音唤醒方法及电子设备 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及*** |
CN112289313A (zh) * | 2019-07-01 | 2021-01-29 | 华为技术有限公司 | 一种语音控制方法、电子设备及*** |
CN110459221A (zh) * | 2019-08-27 | 2019-11-15 | 苏州思必驰信息科技有限公司 | 多设备协同语音交互的方法和装置 |
CN111091828A (zh) * | 2019-12-31 | 2020-05-01 | 华为技术有限公司 | 语音唤醒方法、设备及*** |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023097524A1 (zh) * | 2021-11-30 | 2023-06-08 | 华为技术有限公司 | 设备的控制方法及装置 |
CN117437919A (zh) * | 2023-12-18 | 2024-01-23 | 美智纵横科技有限责任公司 | 语音交互方法、装置、电子设备和可读存储介质 |
CN117437919B (zh) * | 2023-12-18 | 2024-03-01 | 美智纵横科技有限责任公司 | 语音交互方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113421559B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112055024B (zh) | 权限校验方法及装置、存储介质和电子设备 | |
CN113421559B (zh) | 基于语音唤醒的控制方法、电子设备及控制器 | |
EP3580750A1 (en) | Method and apparatus for managing voice-based interaction in internet of things network system | |
CN107992728B (zh) | 人脸验证方法及装置 | |
CN106714081B (zh) | 网络连接方法及智能设备 | |
CN107346397B (zh) | 信息处理方法及相关产品 | |
CN103456306A (zh) | 用于在电子装置中执行语音命令的方法和设备 | |
EP3852102B1 (en) | Voice assistant proxy for voice assistant servers | |
CN109672775B (zh) | 调节唤醒灵敏度的方法、装置及终端 | |
CN108156537B (zh) | 一种移动终端的远程操作方法及移动终端 | |
CN110175016A (zh) | 启动语音助理的方法及具有语音助理的电子装置 | |
WO2020200096A1 (zh) | Ssb传输指示方法、装置、终端、设备和介质 | |
CN106604277B (zh) | 一种无线网络的接入方法及移动终端 | |
CN110418311B (zh) | 一种基于多个终端的互联方法、装置及终端 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
WO2019019837A1 (zh) | 生物识别方法及相关产品 | |
CN106095566B (zh) | 一种响应控制方法及移动终端 | |
CN115174418A (zh) | 一种通信环境安全预警方法、装置、电子设备和存储介质 | |
CN109151779B (zh) | 邻近感知网络nan接入方法及相关产品 | |
US20240056442A1 (en) | Apparatus and methods for continuous real-time authentication | |
CN106782498A (zh) | 语音信息播放方法、装置及终端 | |
CN111862965A (zh) | 唤醒处理方法、装置、智能音箱及电子设备 | |
CN116861198A (zh) | 数据处理方法、装置及存储介质 | |
CN107025389B (zh) | 一种指纹录入的方法及终端 | |
CN106572463B (zh) | 一种接入控制方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |