CN108231079B - 用于控制电子设备的方法、装置、设备以及计算机可读存储介质 - Google Patents

用于控制电子设备的方法、装置、设备以及计算机可读存储介质 Download PDF

Info

Publication number
CN108231079B
CN108231079B CN201810102160.5A CN201810102160A CN108231079B CN 108231079 B CN108231079 B CN 108231079B CN 201810102160 A CN201810102160 A CN 201810102160A CN 108231079 B CN108231079 B CN 108231079B
Authority
CN
China
Prior art keywords
electronic device
user
wake
command
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810102160.5A
Other languages
English (en)
Other versions
CN108231079A (zh
Inventor
耿雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810102160.5A priority Critical patent/CN108231079B/zh
Publication of CN108231079A publication Critical patent/CN108231079A/zh
Application granted granted Critical
Publication of CN108231079B publication Critical patent/CN108231079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

根据本公开的示例实施例,提供了用于控制电子设备的方法、装置、设备以及计算机可读存储介质。该方法包括基于从传感器接收到的感测信息,检测在电子设备所处的环境中是否存在用户。该方法还包括响应于检测到用户的存在,使得电子设备进入唤醒激活状态,电子设备在唤醒激活状态下能够识别用户对电子设备的唤醒命令。该方法进一步包括响应于识别出唤醒命令,使得电子设备进入控制激活状态,电子设备在控制激活状态下能够响应用户的语音控制命令。通过本公开的实施例,避免了电子设备在不可能接收到用户的命令的情况下执行不必要的处理操作,降低了功率消耗,并且进一步降低了设备的误唤醒率。

Description

用于控制电子设备的方法、装置、设备以及计算机可读存储 介质
技术领域
本公开的实施例主要涉及智能交互领域,并且更具体地,涉及用于控制电子设备的方法、装置、设备以及计算机可读存储介质。
背景技术
近年来,随着人工智能技术的快速发展,智能交互***、特别是远场语音交互***正成为重要的交互入口之一,目前已经较为普遍地应用于人们的日常生活、工作、甚至生产过程中。例如,具有语音交互功能的电子设备、例如智能家电设备由于其广泛的应用而极大地便利了人们的生活。如果家庭中布置有具有语音交互功能的各种家电设备、诸如智能音箱、智能电视、智能洗衣机、智能厨房电器等,用户只需对家电设备发出特定的唤醒命令,即可将家电设备唤醒。唤醒之后,用户可以开始与家电设备进行进一步语音交互,控制家电设备执行相应的操作。
由于用户的唤醒命令随时可能会发生,通常,电子设备将时刻处于工作状态,以防止错过用户的唤醒命令。这样的工作机制造成电子设备的计算开销较大、进而造成功耗增加。此外,由于环境中噪音、物体移动等因素影响,电子设备还可能被误唤醒,这也是不期望的。
发明内容
根据本公开的示例实施例,提供了一种用于控制电子设备的方案。
在本公开的第一方面中,提供了一种控制电子设备的方法。该方法包括基于从传感器接收到的感测信息,检测在电子设备所处的环境中是否存在用户。该方法还包括响应于检测到用户的存在,使得电子设备进入唤醒激活状态,电子设备在唤醒激活状态下能够识别用户对电子设备的唤醒命令。该方法进一步包括响应于识别出唤醒命令,使得电子设备进入控制激活状态,电子设备在控制激活状态下能够响应用户的语音控制命令。
在本公开的第二方面中,提供了一种用于控制电子设备的装置。该装置包括检测模块,被配置为基于从传感器接收到的感测信息,检测在电子设备所处的环境中是否存在用户。该装置还包括第一状态切换模块,被配置为响应于检测到用户的存在,使得电子设备进入唤醒激活状态,电子设备在唤醒激活状态下能够识别用户对电子设备的唤醒命令。该装置进一步包括第二状态切换模块,被配置为响应于识别出唤醒命令,使得电子设备进入控制激活状态,电子设备在控制激活状态下能够响应用户的语音控制命令。
在本公开的第三方面中,提供了一种设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序。当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现根据本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
图2示出了根据本公开的一些实施例的控制电子设备的过程的流程图;
图3示出了根据本公开的一些实施例的电子设备的示例结构的框图;
图4示出了根据本公开的一些实施例的电子设备的状态转换图;
图5示出了根据本公开的一些实施例的用于控制电子设备的装置的示意框图;以及
图6示出了能够实施本公开的多个实施例的计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。电子设备110被放置或者被安装在示例环境100中。示例环境100还包括用户120。用户120与电子设备110经由交互链路130进行交互。
电子设备110具有语音交互功能。也就是说,用户120可以通过发出语音命令来控制电子设备110执行相应的操作。因此,电子设备110也可以被称为语音交互设备。为了让电子设备110响应于语音控制命令,用户120可以首先通过语音,手部、头部或身体姿势,和/或其他手段唤醒电子设备110。相应地,电子设备110可以通过麦克风、图像捕获装置和/或其他接收装置、经由交互链路130来接收用户120的唤醒命令。唤醒命令可以是预先设置的特定命令。电子设备110在检测到该特定唤醒命令之后,可以与用户120进行一步的语音交互。
应当理解,具有语音交互功能的电子设备110也可能支持其他方式的交互,例如通过虚拟或实体按钮、通过遥控器等手段被激活、关闭、控制相应操作的执行。电子设备110可以包括各种智能家电设备、智能车载设备、机器人以及其他具备语音交互功能的固定或便携式电子设备,示例包括但不限于智能音箱、智能电视、智能冰箱、智能洗衣机、智能电饭煲、智能空调、智能电热水器、智能机顶盒、智能车载音箱、智能车载导航设备、扫地机器人、聊天机器人、护理机器人,等等。因此,环境100也可以是安装或者放置电子设备110的房间、建筑物、车厢或者任何其他空间。
如以上提及的,电子设备110的唤醒方式可以包括语音唤醒或姿势唤醒等,并且电子设备110的控制方式可以是语音控制。以下为了描述方便,以语音唤醒为例进行说明。然而,应当理解,通过姿势等其他方式唤醒的电子设备同样适用。
在常规交互场景中,为了防止错过用户的唤醒命令,电子设备、特别是负责语音交互的部分时刻处于工作(激活)状态。对于由语音唤醒和语音控制的电子设备而言,电子设备的麦克风不断采集环境中的声音,各类声音处理算法模块对采集到的音频信号进行处理,然后语音唤醒算法模块(也被称为语音唤醒引擎)识别音频信号中是否包含用户的唤醒命令。如果识别到唤醒命令,将麦克风采集到的音频信号传递给语音识别算法模块(也被称为语音识别引擎),用于从中识别出用户对电子设备的控制命令,以便于电子设备能够对控制命令进行正确响应。如果未识别出唤醒命令,麦克风、声音处理算法模块、语音唤醒引擎还将继续不断执行采集、处理和识别处理。
由此可见,由于电子设备持续处于工作状态,不断处理执行声音处理和唤醒命令识别,这将增加设备计算量,进而引起功耗增加。特别是在一些语音交互的电子设备中,前端降噪算法和语音唤醒引起对硬件运算能力有极大的需求,因此持续的处理操作将引起更大的功率损耗。此外,在噪声环境下,例如设备周围有其他音频源正在播放,这可能会增加电子设备的误唤醒率。这样的误唤醒是不期望。原因在于,在被唤醒后,电子设备还将进一步执行控制命令的识别以及与控制命令的识别相关的其他处理,诸如声源定位、波束成形、噪声抑制、去混响、非线性处理等声音处理操作,目的在于支持更准确的控制命令识别。所有这些处理都将带来不必要的计算和功率开销。
为了解决上述问题以及潜在的其他相关问题,本公开的实施例提供一种改进的语音交互过程。具体而言,本公开的实施例提出了一种控制电子设备的方案。在该方案中,借助传感器来检测电子设备所处的环境中是否存在用户。如果检测到不存在用户,电子设备继续处于待机状态。如果检测到存在用户,电子设备进入能够识别用户的唤醒命令的状态。如果识别出唤醒命令,电子设备进入能够对用户的控制命令进行响应的状态。通过传感器的使用,可以避免了电子设备在不可能接收到用户的命令的情况下执行不必要的处理操作,降低了功率消耗,并且进一步降低了设备的误唤醒率。此外,通过优先激活对唤醒命令的识别并且在识别到唤醒命令之后再进入对控制命令的响应,可以进一步降低功耗。
以下将参照附图来具体描述本公开的实施例。
图2示出了根据本公开的一些实施例的控制电子设备的过程200的流程图。过程200可以用于控制图1的电子设备110的语音交互过程。在一些实施例中,过程200可以由电子设备110实现。过程200也可以由与电子设备110通信耦合的其他计算设备实现。在下文中,为了便于说明,以过程200实现在电子设备110处为例进行讨论。
在210,电子设备110基于从传感器接收到的感测信息,检测在电子设备110所处的环境100中的用户120的存在。根据本公开的实施例,期望仅在环境100中存在用户120时才使得电子设备110执行语音交互相关的处理,并且在环境100中不存在用户120时使得电子设备110进入待机状态。为此,借助传感器来检测环境100中是否存在用户120。传感器可以实时感测环境100中的用户。
传感器可以被放置在环境100中并且与电子设备110通信耦合,以便传递与环境100相关的感测信息。在一些实施例中,传感器可以被集成到电子设备110中。可以选择低功耗传感器用于感测用户的存在。因此,虽然传感器实时感测环境100中的用户信息,也不会引起过多功率消耗。
该传感器可以被选择为任何能够检测环境中的特定对象(例如人体)的感应装置。在一些实施例中,传感器可以是人体红外传感器,例如红外对管和红外热释电传感器,以便于通过感测人体红外光谱的存在来确定是否存在人类用户。在一些实施例中,传感器还可以是多普勒传感器,用于检测人体与传感器的距离(在传感器与电子设备110集成时,是与电子设备110的距离)在预定范围内,并且由此确定用户的存在。在一些实施例中,电子设备110可以从传感器接收原始感测数据,并通过对感测数据的分析来确定用户120是否存在。在另外一些实施例中,电子设备110可以从传感器接收明确指示用户120存在与否的感应指示。
取决于传感器的类型,可以通过各种检测技术确定用户120是否存在。对用户120是否存在的判断准则可以是:用户120在环境100中突然出现,用户120在环境100中活动,或者用户120与电子设备110(或传感器)的距离在预定范围之内等等。这些判断依据取决于传感器的类型和/或精度要求,并且可以根据实际情况进行选择。在一些实施例中,可以利用多个传感器或者不同类型的传感器来感测与环境100相关的感应信息,以提供关于用户120的存在的更精确判断。应当理解,本公开的实施例的范围在此方面不受限制。
传感器实时检测与环境100有关的感测信息。通过基于感测信息的检测,电子设备110在220确定是否检测到用户的存在。如果没有检测到用户120的存在,电子设备110继续处于待机状态。在待机状态下,电子设备110不执行与语音交互相关的任何处理,直到检测到用户120的存在。电子设备110中与语音交互相关的硬件和软件模块均不工作,以便节省功耗和防止对电子设备110的误唤醒。
如果检测到用户120的存在,在230,电子设备110进入唤醒激活状态,电子设备110在唤醒激活状态下能够识别用户120对电子设备110的唤醒命令。如果过程200由电子设备110以外的计算设备来实现,在检测到用户120的存在,可以向电子设备110发送触发命令,使得电子设备110进入唤醒激活状态。
根据本公开的实施例,在唤醒激活状态下,电子设备110仅被部分激活。具体而言,在唤醒激活状态下,电子设备110仅能够识别用户120是否发出对电子设备110的唤醒命令。此时,电子设备110中负责唤醒命令识别的硬件和/或软件模块将被激活。例如,在通过语音命令激活电子设备110的情况中,电子设备110的麦克风阵列(或者麦克风阵列中的一个麦克风)将被激活以采集环境100中的音频信号,声音处理算法模块将被激活以处理采集到的音频信号(例如执行前端降噪、回声消除等),并且语音唤醒引擎将被激活以识别音频信号中是否存在唤醒命令。该唤醒命令可以是特定语句、单词、词组或者其他特定声音模式。
在唤醒激活状态下,电子设备110将不断工作以识别唤醒命令。在240,电子设备110确定是否识别出唤醒命令。如果未识别出唤醒命令,电子设备110将继续维持在唤醒激活状态中并且继续从用户120的音频信号中识别唤醒命令。如果识别出唤醒命令,在250,电子设备110进入控制激活状态,电子设备110在控制激活状态下能够响应用户120的语音控制命令。
根据本公开的实施例,在控制激活状态下,电子设备110完全被激活。电子设备110中与语音交互相关的硬件和/或软件模块均处于工作状态。例如,电子设备110的麦克风阵列将被激活以采集环境100中的音频信号,各个声音处理算法模块将被激活以处理采集到的音频信号(例如执行前端降噪、回声消除、声源定位、波束成形、噪声抑制、去混响以及非线性处理等),以便能够从来自用户120的音频信号中识别语音控制命令。此外,电子设备110还能够根据识别出的语音控制命令来执行相应的操作。例如,如果电子设备110是智能音箱,并且识别出的语音控制命令是“播放歌曲A”,那么电子设备110将通过扬声器播放歌曲A。
在一些实施例中,电子设备110还可以通过传感器的感测信息来确定是否从控制激活状态切换回到待机状态。具体地,电子设备110可以基于从传感器接收到的另外的感测信息,检测用户120是否不再处在环境100中(例如,用户120从环境100中消失)。如以上提及的,传感器实时感应与环境100相关的感测信息。如果在电子设备110进入唤醒激活状态或者控制激活状态之后,来自传感器的感应信息指示用户120不再处在环境100中,电子设备110进入待机状态。在待机状态中,电子设备110不能够识别唤醒命令或响应语音控制命令。因此,在待机状态中,电子设备110将不需要将功率消耗与语音交互相关的处理上,从而实现功耗降低和误唤醒率降低的目的。
在一些实施例中,电子设备110在检测到用户120不再处在环境100中达预定时间段的情况下才进入待机状态。通过这种方式,可以避免重复切换状态而导致的不必要的操作复杂性,并且可以避免由于断续的语音交互带来的用户体验降低。例如,如果用户120仅暂时离开环境100并且在较短时间内又继续回到环境100,电子设备110可以仍然处于控制激活状态或者唤醒激活状态,从而可以快速被用户120唤醒或者响应用户120的语音控制命令。预定时间段可以是预先设置或者由用户120配置的任何时长。
在一些实施例中,电子设备110在检测到用户120不再处在环境100中之后,可以维持运行电子设备110中响应于语音控制命令而启动的应用。例如,在控制激活状态期间,电子设备110响应于用户120的语音控制命令而启动某个应用来执行操作(例如,播放歌曲、视频、或者执行其他动作)。在检测到用户120不再处在环境100中之后,可以继续保持这些应用的运行。这可以避免由于用户120暂时离开环境100而导致的服务中断。因此,无需在用户120短暂离开又返回环境100的情况中再次重复上述过程200来启动应用,进一步提高服务连贯性和用户体验。
在一些实施例中,电子设备110可以在应用的特定操作完成之后,停止应用的运行。附加地或备选地,电子设备110可以在检测到用户120不再处在环境100中达预定时间段的情况下,停止应用的运行。该预定时间段可以与用于进入待机状态的预定时间段相同或不同,并且该预定时间段也可以是预先设置或者用户120配置的任何时长。在一个示例中,如果检测在一段时间内用户120不再处在环境100中,电子设备110可以进入待机状态并且保持已被启动的应用继续运行。如果在又一段时间内仍未检测到用户120的存在,电子设备110可以停止应用的运行。在另一示例中,电子设备110也可以在用户120不再处在环境100中达某个预定时间段之后,同时进入待机状态和停止应用的运行。在进入待机状态之前,特定应用维持运行。
以上描述了对电子设备110的控制过程。图3示出了根据本公开的实施例的具有语音交互功能的电子设备110的示例框图。在图3中,示出了电子设备110中与语音交互功能相关的硬件和软件模块。将结合图3的具体示例来说明根据本公开的实施例如何控制电子设备110的相应模块的工作。
如图3所示,电子设备110包括相连的麦克风阵列310,包括一个或多个麦克风,用于采集环境100中的声音,并且将声音转换成音频信号。电子设备110还包括语音唤醒引擎330,用于识别麦克风阵列310采集到的音频信号中是否存在特定唤醒命令。如果存在唤醒命令,则电子设备110被唤醒以执行进一步的语音交互。电子设备110还包括语音识别引擎350,用于在唤醒命令之后,从麦克风阵列310采集到的音频信号中识别语音唤醒命令,以便于电子设备110能够响应于语音唤醒命令而执行相应操作。
为了提高语音唤醒引擎330和语音识别引擎350对音频信号的识别性能,可选地,电子设备110还包括声音处理模块320,用于对来自麦克风阵列310的声音执行前端降噪、回声消除等。电子设备110还可以包括声音后处理模块340,用于执行进一步的声音处理,诸如回声消除、声源定位、波束成形、噪声抑制、去混响以及非线性处理等。语音唤醒引擎330可以从经由声音处理模块320处理后的音频信号中识别唤醒命令。在识别出唤醒命令后,语音唤醒引擎330指示声音后处理模块340执行声源定位和波束成形。语音识别引擎350可以从经由声音处理模块320和声音后处理模块340处理后的音频信号中识别语音控制命令,以对识别出的语音控制命令进行响应。
根据本公开的实施例,电子设备110还包括传感器302,用于实时感测环境100并且向电子设备110提供感应信息。电子设备110基于传感器302的感应信息来检测环境100中是否存在用户120。如果不存在用户120,电子设备110处于待机状态。在待机状态中,麦克风阵列310不采集声音,并且声音处理模块320和声音后处理模块340,语音唤醒引擎320和语音识别引擎350均不执行处理。当检测到用户120时,电子设备120进入唤醒激活状态,在该状态中,麦克风阵列310、语音唤醒引擎330以及声音处理模块320能够执行相应处理。在一些实施例中,可以仅启动麦克风阵列310中的一个麦克风。如果识别出唤醒命令,电子设备120进入控制激活状态,在该状态中,声音后处理模块340和语音识别引擎350也被启动以执行相应处理。
应当理解,图3仅示出了电子设备110中与语音交互相关的一些硬件和软件模块。电子设备110还可以包括用于支持其他功能的硬件和/或软件模块。在一些实施例中,取决于电子设备110的语音交互功能的设计,电子设备110还可以包括更多、更少或者不同的硬件和/或软件模块来实现语音交互功能。本公开的实施例在此方面的范围不受限制。
在图3的示例中,电子设备110支持通过用户120的语音发出的唤醒命令。在其他实施例中,如果电子设备110支持用户120通过其他方式来发出唤醒命令,那么电子设备110也可以包括相应的软件和/或硬件模块来实现这一功能。例如,如果电子设备110被设计为可以通过用户120的手部、面部或整个身体的姿势来发出唤醒命令,电子设备110还可以包括图像采集装置(例如相机)来捕获环境100的图像,并且语音唤醒引擎330可以通过从图像中识别特定姿势来确定用户120是否发出唤醒命令。
图4示出了根据本公开的一些实施例的电子设备110的状态转换图400。如图4所示,当环境100中不存在用户120时,电子设备110处于待机状态410。如果传感器的感测信息一直指示用户120不存在,则电子设备110将继续保持在待机状态410。当传感器的感测信息指示用户120存在时,电子设备110进入唤醒激活状态420。电子设备110在该状态420下能够识别用户120针对电子设备110的唤醒命令。如果未识别到唤醒命令,电子设备110保持处于唤醒激活状态420。如果未识别到唤醒命令,并且传感器的感测信息指示用户120不再处在环境100中,电子设备110将返回待机状态410。如果识别到唤醒命令,电子设备110从唤醒激活状态420进入控制激活状态430。电子设备110在状态430下能够对用户120的语音控制命令进行响应。电子设备110可以一直处于控制激活状态430,直到传感器检测到环境100中不再存在用户120。在此情况下,电子设备110进入待机状态410。
图5示出了根据本公开实施例的用于控制电子设备的装置500的示意性框图。装置500可以被实现在电子设备110内,或者可以独立于电子设备110而实现。如图5所示,装置500包括检测模块510,其被配置为基于从传感器接收到的感测信息,检测在电子设备所处的环境中是否存在用户。装置500还包括第一状态切换模块520,其被配置为响应于检测到用户的存在,使得电子设备进入唤醒激活状态,电子设备在唤醒激活状态下能够识别用户对电子设备的唤醒命令。装置500还包括第二状态切换模块530,其被配置为响应于识别出唤醒命令,使得电子设备进入控制激活状态,电子设备在控制激活状态下能够响应用户的语音控制命令。
在一些实施例中,传感器可以包括以下至少一个:多普勒传感器、红外对管和红外热释电传感器。
在一些实施例中,检测模块510可以进一步被配置为基于从传感器接收到的另外的感测信息,检测用户是否不再处在环境中。装置500可以进一步包括第三状态切换模块,被配置为响应于检测到用户不再处在环境中,使得电子设备进入待机状态,电子设备在待机状态中不能够识别唤醒命令或响应语音控制命令。
在一些实施例中,第三状态切换模块可以进一步被配置为响应于检测到用户不再处在环境中达第一预定时间段,使得电子设备进入待机状态。
在一些实施例中,装置500可以进一步包括应用维持模块,其被配置为响应于检测到用户不再处在环境中,维持运行电子设备中响应于语音控制命令而启动的应用。
在一些实施例中,装置500可以进一步包括应用停止模块,其被配置为响应于检测到用户不再处在环境中达第二预定时间段,停止应用的运行。
在一些实施例中,电子设备可以包括以下之一:智能家电、智能车载设备和机器人。
在一些实施例中,传感器可以被集成在电子设备中。
图6示出了可以用来实施本公开的实施例的示例设备600的示意性框图。设备600可以用于实现用于控制图1的电子设备110的装置,或者可以用于实现电子设备110。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元601执行上文所描述的各个方法和处理,例如过程200。例如,在一些实施例中,过程200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由CPU 601执行时,可以执行上文描述的过程200的一个或多个步骤。备选地,在其他实施例中,CPU 601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行过程200。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (18)

1.一种控制电子设备的方法,包括:
基于从传感器接收到的感测信息,检测在待机状态下的所述电子设备所处的环境中是否存在用户,在所述待机状态下所述电子设备中与语音交互相关的组件未被激活用于识别所述用户对所述电子设备的唤醒命令或响应语音控制命令;
响应于检测到所述用户的存在,使得所述电子设备从所述待机状态进入唤醒激活状态,在所述唤醒激活状态下所述语音交互相关的组件中用于唤醒命令识别的组件被激活以识别所述用户对所述电子设备的所述唤醒命令;以及
响应于在所述电子设备处于所述唤醒激活状态时识别出所述唤醒命令,使得所述电子设备从所述唤醒激活状态进入控制激活状态,在所述控制激活状态下所述语音交互相关的组件被完全激活以响应所述用户的所述语音控制命令。
2.根据权利要求1所述的方法,其中所述传感器包括以下至少一个:多普勒传感器、红外对管和红外热释电传感器。
3.根据权利要求1所述的方法,进一步包括:
基于从所述传感器接收到的另外的感测信息,检测所述用户是否不再处在所述环境中;以及
响应于检测到所述用户不再处在所述环境中,使得所述电子设备从所述唤醒激活状态或所述控制激活状态进入所述待机状态。
4.根据权利要求3所述的方法,其中使得所述电子设备进入所述待机状态包括:
响应于检测到所述用户不再处在所述环境中达第一预定时间段,使得所述电子设备进入所述待机状态。
5.根据权利要求3所述的方法,进一步包括:
响应于检测到所述用户不再处在所述环境中,维持运行所述电子设备中响应于所述语音控制命令而启动的应用。
6.根据权利要求5所述的方法,进一步包括:
响应于检测到所述用户不再处在所述环境中达第二预定时间段,停止所述应用的运行。
7.根据权利要求1所述的方法,其中所述电子设备包括以下之一:智能家电、智能车载设备和机器人。
8.根据权利要求1所述的方法,其中所述传感器被集成在所述电子设备中。
9.一种用于控制电子设备的装置,包括:
检测模块,被配置为基于从传感器接收到的感测信息,检测在待机状态下的所述电子设备所处的环境中是否存在用户,在所述待机状态下所述电子设备中与语音交互相关的组件未被激活用于识别所述用户对所述电子设备的唤醒命令或响应语音控制命令;
第一状态切换模块,被配置为响应于检测到所述用户的存在,使得所述电子设备从所述待机状态进入唤醒激活状态,在所述唤醒激活状态下所述语音交互相关的组件中用于唤醒命令识别的组件被激活以识别所述用户对所述电子设备的所述唤醒命令;以及
第二状态切换模块,被配置为响应于在所述电子设备处于所述唤醒激活状态时识别出所述唤醒命令,使得所述电子设备从所述唤醒激活状态进入控制激活状态,在所述控制激活状态下所述语音交互相关的组件被完全激活以响应所述用户的所述语音控制命令。
10.根据权利要求9所述的装置,其中所述传感器包括以下至少一个:多普勒传感器、红外对管和红外热释电传感器。
11.根据权利要求9所述的装置,其中所述检测模块进一步被配置为基于从所述传感器接收到的另外的感测信息,检测所述用户是否不再处在所述环境中,所述装置进一步包括:
第三状态切换模块,被配置为响应于检测到所述用户不再处在所述环境中,使得所述电子设备从所述唤醒激活状态或所述控制激活状态进入待机状态。
12.根据权利要求11所述的装置,其中所述第三状态切换模块进一步被配置为响应于检测到所述用户不再处在所述环境中达第一预定时间段,使得所述电子设备进入所述待机状态。
13.根据权利要求11所述的装置,进一步包括:
应用维持模块,被配置为响应于检测到所述用户不再处在所述环境中,维持运行所述电子设备中响应于所述语音控制命令而启动的应用。
14.根据权利要求13所述的装置,进一步包括:
应用停止模块,被配置为响应于检测到所述用户不再处在所述环境中达第二预定时间段,停止所述应用的运行。
15.根据权利要求9所述的装置,其中所述电子设备包括以下之一:智能家电、智能车载设备和机器人。
16.根据权利要求9所述的装置,其中所述传感器被集成在所述电子设备中。
17.一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的方法。
18.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的方法。
CN201810102160.5A 2018-02-01 2018-02-01 用于控制电子设备的方法、装置、设备以及计算机可读存储介质 Active CN108231079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810102160.5A CN108231079B (zh) 2018-02-01 2018-02-01 用于控制电子设备的方法、装置、设备以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810102160.5A CN108231079B (zh) 2018-02-01 2018-02-01 用于控制电子设备的方法、装置、设备以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108231079A CN108231079A (zh) 2018-06-29
CN108231079B true CN108231079B (zh) 2021-12-07

Family

ID=62670318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810102160.5A Active CN108231079B (zh) 2018-02-01 2018-02-01 用于控制电子设备的方法、装置、设备以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108231079B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110277094A (zh) * 2018-03-14 2019-09-24 阿里巴巴集团控股有限公司 设备的唤醒方法、装置及电子设备
CN109166575A (zh) * 2018-07-27 2019-01-08 百度在线网络技术(北京)有限公司 智能设备的交互方法、装置、智能设备和存储介质
CN108972592A (zh) * 2018-08-09 2018-12-11 北京云迹科技有限公司 用于机器人的智能唤醒方法及装置
CN109240107B (zh) * 2018-09-30 2022-07-19 深圳创维-Rgb电子有限公司 一种电器设备的控制方法、装置、电器设备和介质
CN109358751A (zh) * 2018-10-23 2019-02-19 北京猎户星空科技有限公司 一种机器人的唤醒控制方法、装置及设备
CN109451256A (zh) * 2018-10-29 2019-03-08 四川文轩教育科技有限公司 一种基于人工智能的网络智能电视
US11151993B2 (en) * 2018-12-28 2021-10-19 Baidu Usa Llc Activating voice commands of a smart display device based on a vision-based mechanism
CN109831700B (zh) * 2019-02-02 2021-08-17 深圳创维-Rgb电子有限公司 一种待机模式切换方法、装置、电子设备及存储介质
CN109920420A (zh) * 2019-03-08 2019-06-21 四川长虹电器股份有限公司 一种基于环境检测的语音唤醒***
CN110677899B (zh) * 2019-08-19 2024-03-29 深圳绿米联创科技有限公司 一种数据传输方法、装置、终端设备及存储介质
CN110660392A (zh) * 2019-10-10 2020-01-07 珠海格力电器股份有限公司 一种语音唤醒方法、存储介质和终端设备
CN111182385B (zh) * 2019-11-19 2021-08-20 广东小天才科技有限公司 一种语音交互控制方法及智能音箱
CN110933345B (zh) * 2019-11-26 2021-11-02 深圳创维-Rgb电子有限公司 一种降低电视待机功耗的方法、电视机及存储介质
CN113099354A (zh) * 2020-01-09 2021-07-09 上海博泰悦臻电子设备制造有限公司 用于信息处理的方法、设备和计算机存储介质
CN111312241A (zh) * 2020-02-10 2020-06-19 深圳创维-Rgb电子有限公司 一种无人导购方法、终端以及存储介质
CN111419130A (zh) * 2020-03-30 2020-07-17 珠海格力电器股份有限公司 一种洗碗机的控制方法、控制装置及洗碗机
CN113568497B (zh) * 2020-04-28 2023-11-14 无锡小天鹅电器有限公司 设备控制方法、装置、电子设备和计算机存储介质
CN111948964B (zh) * 2020-08-12 2024-04-02 深圳市月白电子科技有限公司 一种切换钢琴配套电子设备工作状态的方法及装置
CN112259128B (zh) * 2020-10-21 2023-07-28 恒玄科技(上海)股份有限公司 音频设备及语音识别方法
CN113064805A (zh) * 2021-03-29 2021-07-02 联想(北京)有限公司 一种电子设备的控制方法以及控制装置
CN114678016A (zh) * 2021-04-23 2022-06-28 美的集团(上海)有限公司 设备唤醒方法及***、电子设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102981491A (zh) * 2012-12-12 2013-03-20 四川长虹电器股份有限公司 基于云平台的智能家居***
CN103970441A (zh) * 2013-01-29 2014-08-06 三星电子株式会社 执行设备的功能的方法以及用于执行该方法的设备
CN104620314A (zh) * 2012-04-26 2015-05-13 纽昂斯通讯公司 用于具有用户可定义约束的小型语音识别的构造的嵌入式***
CN104991458A (zh) * 2015-06-30 2015-10-21 联想(北京)有限公司 控制方法及电子设备
CN106161755A (zh) * 2015-04-20 2016-11-23 钰太芯微电子科技(上海)有限公司 一种关键词语音唤醒***及唤醒方法及移动终端
CN106878118A (zh) * 2017-01-03 2017-06-20 美的集团股份有限公司 一种智能家电语音控制方法及***
CN107103906A (zh) * 2017-05-02 2017-08-29 网易(杭州)网络有限公司 一种唤醒智能设备进行语音识别的方法、智能设备和介质
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质
CN107643921A (zh) * 2016-07-22 2018-01-30 联想(新加坡)私人有限公司 用于激活语音助手的设备、方法和计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768712B1 (en) * 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
KR102179506B1 (ko) * 2013-12-23 2020-11-17 삼성전자 주식회사 전자장치 및 그 제어방법
CN106601250A (zh) * 2015-11-10 2017-04-26 刘芨可 一种语音控制方法及装置、设备
CN107464564B (zh) * 2017-08-21 2023-05-26 腾讯科技(深圳)有限公司 语音交互方法、装置及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620314A (zh) * 2012-04-26 2015-05-13 纽昂斯通讯公司 用于具有用户可定义约束的小型语音识别的构造的嵌入式***
CN102981491A (zh) * 2012-12-12 2013-03-20 四川长虹电器股份有限公司 基于云平台的智能家居***
CN103970441A (zh) * 2013-01-29 2014-08-06 三星电子株式会社 执行设备的功能的方法以及用于执行该方法的设备
CN106161755A (zh) * 2015-04-20 2016-11-23 钰太芯微电子科技(上海)有限公司 一种关键词语音唤醒***及唤醒方法及移动终端
CN104991458A (zh) * 2015-06-30 2015-10-21 联想(北京)有限公司 控制方法及电子设备
CN107643921A (zh) * 2016-07-22 2018-01-30 联想(新加坡)私人有限公司 用于激活语音助手的设备、方法和计算机可读存储介质
CN106878118A (zh) * 2017-01-03 2017-06-20 美的集团股份有限公司 一种智能家电语音控制方法及***
CN107103906A (zh) * 2017-05-02 2017-08-29 网易(杭州)网络有限公司 一种唤醒智能设备进行语音识别的方法、智能设备和介质
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN108231079A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN108231079B (zh) 用于控制电子设备的方法、装置、设备以及计算机可读存储介质
EP3517849B1 (en) Household appliance control method, device and system, and intelligent air conditioner
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
KR102335717B1 (ko) 음성 제어 시스템 및 그 웨이크업 방법, 웨이크업 장치 및 가전제품, 코프로세서
CN110060685B (zh) 语音唤醒方法和装置
EP3923273B1 (en) Voice recognition method and device, storage medium, and air conditioner
US8666751B2 (en) Audio pattern matching for device activation
CN108198553B (zh) 语音交互方法、装置、设备和计算机可读存储介质
JP2019159305A (ja) ファーフィールド音声機能の実現方法、設備、システム及び記憶媒体
CN108806673B (zh) 一种智能设备控制方法、装置及智能设备
CN109920419B (zh) 语音控制方法和装置、电子设备及计算机可读介质
JP2008009120A (ja) リモートコントローラ並びに家電機器
CN111599361A (zh) 一种唤醒方法、装置、计算机存储介质及空调器
US11620995B2 (en) Voice interaction processing method and apparatus
KR102395013B1 (ko) 인공지능 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법
CN112130918A (zh) 智能设备唤醒方法、装置、***及智能设备
CN112489413B (zh) 遥控器的控制方法及***、存储介质、电子设备
US20190130898A1 (en) Wake-up-word detection
CN110933345B (zh) 一种降低电视待机功耗的方法、电视机及存储介质
CN110602197A (zh) 物联网控制装置和方法、电子设备
CN101446812A (zh) 设备的状态控制方法、控制装置及设备
CN106817653B (zh) 音频设定方法及装置
WO2023155607A1 (zh) 终端设备和语音唤醒方法
CN116705033A (zh) 用于无线智能音频设备的片上***和无线处理方法
CN114694661A (zh) 一种第一终端设备、第二终端设备和语音唤醒方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant