CN110727821A - 防止设备被误唤醒的方法、装置、***和计算机存储介质 - Google Patents

防止设备被误唤醒的方法、装置、***和计算机存储介质 Download PDF

Info

Publication number
CN110727821A
CN110727821A CN201910967844.6A CN201910967844A CN110727821A CN 110727821 A CN110727821 A CN 110727821A CN 201910967844 A CN201910967844 A CN 201910967844A CN 110727821 A CN110727821 A CN 110727821A
Authority
CN
China
Prior art keywords
voice assistant
intelligent voice
word
audio information
wake
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910967844.6A
Other languages
English (en)
Inventor
金国阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hai Yi Zhi Xin Technology Co Ltd
Original Assignee
Shenzhen Hai Yi Zhi Xin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hai Yi Zhi Xin Technology Co Ltd filed Critical Shenzhen Hai Yi Zhi Xin Technology Co Ltd
Priority to CN201910967844.6A priority Critical patent/CN110727821A/zh
Publication of CN110727821A publication Critical patent/CN110727821A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种防止设备被误唤醒的方法、装置、***和计算机存储介质。防止设备被误唤醒的方法包括:对智能语音助手设备正在播放的音频信息进行唤醒词检测;确定所述唤醒词在所述音频信息中的位置;控制所述智能语音助手设备在所述位置处关闭被唤醒功能。这样,智能语音助手设备只有在检测到人声中包括唤醒词时才会被唤醒,从而避免其被误唤醒,保证了智能语音助手设备的功能运行,提升了用户体验。

Description

防止设备被误唤醒的方法、装置、***和计算机存储介质
技术领域
本申请涉及语音处理领域,特别涉及一种防止设备被误唤醒的方法、装置、***和计算机存储介质。
背景技术
随着科技的发展,支持语音控制的设备越来越多,逐渐带动越来越多的设备语音化、智能化,使语音真正成为人机交互的一个界面。而在语音交互设备中,语音唤醒技术越发显得重要,成为人与设备“沟通”的桥梁。
语音唤醒的应用领域比较广泛,例如机器人、手机、可穿戴设备、智能家居、车载等。很多带有语音功能的设备,都会需要语音唤醒技术作为人和机器互动的一个开始或入口。一般地,设备开启并自动加载好资源,这时它处于休眠状态。然后,当用户说出特定的唤醒词时,设备就会被唤醒,切换到工作状态等待用户接下来的指令。
随后,设备会对用户的指令进行识别,并根据识别的结果进行相应的操作。例如,识别成功后,设备会播出一段相应的音频与用户进行互动。但是,如果在该音频中也包括唤醒词,那么设备在侦听到唤醒词时,无法区分唤醒词是人声还是自己的音频声音,这样会导致设备自己的音频声音将自己唤醒,这样会导致设备会被误唤醒,从而会影响用户与设备之间的正常交互。
发明内容
考虑到上述问题而提出了本发明。
根据本发明一方面,提供了一种防止设备被误唤醒的方法,所述方法包括:
对智能语音助手设备正在播放的音频信息进行唤醒词检测;
确定所述唤醒词在所述音频信息中的位置;
控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
在一种实现方式中,所述音频信息由所述智能语音助手设备播放。
在一种实现方式中,所述音频信息由与所述智能语音助手设备直接或间接连接的外部设备播放。
在一种实现方式中,所述外部设备与所述智能语音助手设备之间通过蓝牙或无线网络进行连接。
在一种实现方式中,所述音频信息为从文本到语音TTS语音。
在一种实现方式中,所述位置包括所述唤醒词在所述音频信息中的起始位置和长度;或者,所述位置包括所述唤醒词在所述音频信息中的起始位置和结束位置。
在一种实现方式中,还包括:
控制所述智能语音助手设备在所述位置之后恢复被唤醒功能。
根据本发明另一方面,提供了一种防止设备被误唤醒的装置,所述装置用于执行所述方法的步骤,所述装置包括:
检测模块,用于对智能语音助手设备正在播放的音频信息进行唤醒词检测;
确定模块,用于确定所述唤醒词在所述音频信息中的位置;
控制模块,用于控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
在一种实现方式中,所述装置与所述智能语音助手设备通过有线或无线方式进行通信连接。
根据本发明另一方面,提供了一种防止设备被误唤醒的***,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
根据本发明另一方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机执行时实现上述方法的步骤。
根据本发明实施例提供的一种防止设备被误唤醒的方法,在语音设备播放语音信息时,检测唤醒词,并控制语音设备在唤醒词的位置处拒绝被唤醒。这样,智能语音助手设备只有在检测到人声中包括唤醒词时才会被唤醒,从而避免其被误唤醒,保证了智能语音助手设备的功能运行,提升了用户体验。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本发明实施例的防止设备被误唤醒的方法的示意流程图;
图2是本发明实施例的语音设备与外设的连接示意图;
图3是本发明实施例的防止设备被误唤醒的方法的示意交互图;
图4是本发明实施例的防止设备被误唤醒的装置的示意框图;
图5是本发明实施例的防止设备被误唤醒的***的示意框图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
为了彻底理解本发明,将在下列的描述中提出详细的结构,以便阐释本发明。显然,本发明的施行并不限定于该技术领域的技术人员所熟习的特殊细节。本发明的较佳实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式,不应当解释为局限于这里提出的实施例。
应当理解的是,在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制,单数形式的“一”、“一个”和“所述/该”也意图包括复数形式,除非上下文清楚指出另外的方式。当在本说明书中使用术语“包含”和/或“包括”时,其指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。本发明中所使用的术语“上”、“下”、“前”、“后”、“左”、“右”以及类似的表述只是为了说明的目的,并非限制。
本发明中所引用的诸如“第一”和“第二”的序数词仅仅是标识,而不具有任何其他含义,例如特定的顺序等。而且,例如,术语“第一部件”其本身不暗示“第二部件”的存在,术语“第二部件”本身不暗示“第一部件”的存在。
本发明实施例中,智能语音助手设备可以在侦听到唤醒词时被唤醒,并能够与用户进行交互。唤醒词可以是预先设置的,例如可以由厂商设定并预存在其存储器中;再例如,可以由用户自定义、修改后存储在其存储器中。
其中,唤醒词的设置通常与设备的名字有关,设备的名字通常是由设备的开发商定义好的,如唤醒词可以为如下任意一种:名字、名字+名字、名字+称谓、品牌+名字、嗨+名字、你好+名字、名字+你好、我的+名字、等等。当然,唤醒词也可以为上述罗列之外的任何其他形式之一,并且唤醒词也可以与设备的名字无关。其中,唤醒词可以由用户自定义设置,例如用户可以根据自己的喜好设置为儿时养的宠物的名字等等。
其中,智能语音助手设备可以被称为智能语音设备、智能助手设备、智能语音交互设备、语音设备等。另外,智能语音助手设备可以是互联网设备,并且可以与其他设备通信连接,这样,智能语音助手设备可以根据用户的指令控制与其通信连接的其他设备,例如,开/关空调、调亮/调暗灯光、播放/停止播放音乐、等等。
在使用过程中,设备上电后一般处于休眠状态(待机状态),并且设备侦听其接收到的声音中是否存在唤醒词;如果侦听到唤醒词,则设备从休眠状态切换至工作状态与用户进行交互。例如,设备可以播放一段预设语音,这样用户在听到预设语音之后可以说出指令以便设备执行。其中,预设语音可以是TTS(从文本到语音,Text To Speech)语音,例如可以是“我在”“主人,有什么吩咐”等等。在设备与用户交互的过程中,设备可以播放应答语音。例如,用户对设备说出“今天天气如何?”设备播放应答语音“今天天气晴,气温5到18度。”其中,应答语音也可以是TTS语音。
另外,用户在使用设备时,为了使用方便,还可能将设备直接或间接地连接到其他外部设备,例如设备可以直接连接到、或者通过移动终端(例如智能手机、穿戴设备等)连接到蓝牙音箱、车载收音机等等。此时,设备可以通过这些外部设备播放相应的语音,如预设语音、应答语音等TTS语音。
当设备或其连接的外部设备播放的语音中包括唤醒词时,设备会侦听到该唤醒词,但是设备无法区分该唤醒词是否为人声,此时设备会因为侦听到该唤醒词而被重新唤醒,这样会导致与用户之间的交互中断。举例来说,假设唤醒词是“小A”,用户说出“小A”将设备唤醒后,随后用户对设备说出“今天天气如何?”设备本应该播放应答语音“小A给主人查询到:今天天气晴,气温5到18度。”但由于该应答语音中包括“小A”,会导致设备误认为是唤醒词,使得设备在侦听到该应答语音中的“小A”时被重新唤醒,从而导致设备对用户的应答语音中断,例如用户听到的应答语音仅剩:“小A给主人”。用户不能获取期望的信息,从而用户体验很差。
目前通用的方案是使用单语音引擎,设备自身在播放时,将播放的内容作为参考音,从声学角度上抑制和过滤所播放内容中的唤醒词,但是当声音不从设备播出,而是从外设播出时,单语音引擎这样的方案将无能为力。
为了部分或全部解决上述技术问题,本发明实施例提供了一种防止设备被误唤醒的方法,使得无论是从设备自身播放的,还是从外设播放的包括唤醒词的语音,都能够很好的避免设备被唤醒,从而达到很好的自唤醒抑制效果。
以下,将参照附图对本发明的具体实施例进行更详细地说明,这些附图示出了本发明的代表实施例,并不是限定本发明。
本发明实施例提供了一种防止设备被误唤醒的方法。如图1所示,为该方法的一个示意性流程图,包括:
S110,对智能语音助手设备正在播放的音频信息进行唤醒词检测;
S120,确定所述唤醒词在所述音频信息中的位置;
S130,控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
为了方便描述,结合图1描述的实施例中,将智能语音助手设备简称为语音设备。
示例性地,S110中的音频信息可以是语音设备自己播放的,或者,可以是与语音设备连接的外设播放的。例如,用户可以与语音设备直接进行交互,即用户可以朝语音设备说话,由语音设备直接接收用户的指令。再例如,语音设备上可以连接有外部设备(简称外设),外设可以与语音设备直接或间接连接,诸如蓝牙音箱、收音机等。外设与语音设备之间的连接方式可以为蓝牙或无线网络等,例如无线网络为无线保真(Wireless Fidelity,WIFI)。可理解,外设与语音设备之间也可以是其它的连接方式,例如通过cable线连接,例如通过通用串行总线(Universal Serial Bus,USB)2.0线连接等,这里不再一一罗列。参照图2,蓝牙音箱20是与语音设备10采用蓝牙方式直接连接的外设,收音机30是与语音设备10通过智能手机40采用无线方式(例如WIFI)间接连接的外设。举例来说,蓝牙音箱20可以为真无线耳机(Ture Wireless Stereo,TWS)、主动降噪静音(Active Noise Cancelling,ANC)耳机、智能耳机中的一种,当然蓝牙音箱20并不局限于某一种,其也可以为其他类型的装置。
示例性地,音频信息可以是TTS语音。
S110中,可以实时地进行唤醒词检测,其中检测方法可以与现有技术中对侦听到的人声进行唤醒词检测的方法相同或类似,本发明对此不限定。
示例性地,S120中,可以在检测的同时确定唤醒词在音频信息中的位置,或者可以在检测到唤醒词之后再确定其位置。示例性地,该位置可以是唤醒词在音频信息中的起始位置和长度;或者,可以是唤醒词在音频信息中的起始位置和结束位置;或者,也可以是其它的位置形式。其中,位置可以以秒为单位或者更精确地以帧为单位。举例来说,可以用“0,10”表示唤醒词在音频信息中的位置,具体地,表示唤醒词在音频信息中的起始位置为第0帧,总长度为10帧。
示例性地,在S130中,在S120中所指示的位置处,该语音设备拒绝被唤醒。具体地,在S120所确定的位置区间,语音设备关闭其被唤醒功能,此时语音设备对侦听到的唤醒词不执行被唤醒的响应。
由此可见,对于智能语音助手设备自身所播放的音频信息(如TTS语音),即使该音频信息中包含唤醒词,语音设备也不会被唤醒。这样,能够避免被用户之外的语音误唤醒,提升了用户体验。
本发明实施例中,在S130之后,可以包括:控制所述智能语音助手设备在所述位置之后恢复被唤醒功能。从而,语音设备可以在S120所确定的位置区间之后,恢复被唤醒功能。也就是说,在该位置区间之后,语音设备对侦听到的唤醒词继续执行被唤醒的响应。
例如,针对上述示例,S120所确定的位置表示为“0,10”,表示唤醒词在音频信息中的起始位置为第0帧,总长度为10帧。那么语音设备在直接播放语音信息期间或由与语音设备连接的外设播放语音信息期间,从第0帧开始的10帧时间区间内,语音设备不被唤醒,在10帧之后恢复可以被唤醒。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
作为一个示例,可以在智能语音助手设备这个硬件设备上安装有用于执行本发明实施例的应用程序。作为另一个示例,可以在智能语音助手设备这个硬件设备上安装有用于执行语音播放等的应用程序,以及用于执行唤醒词检测的一个或多个应用程序。
作为一个示例,可以在智能语音助手设备这个硬件设备上安装有用于执行语音播放等的应用程序,并且另一设备上安装有执行唤醒词检测的一个或多个应用程序。智能语音助手设备与另一设备可以采用有线或无线方式连接并交互,以实现上述方法的步骤。
可以理解,上述方法的步骤可以由与智能语音助手设备连接的另一设备执行。示例性地如图3所示,例如,可以使用包括一个或多个独立的语音识别引擎的另一设备执行唤醒词检测,并在检测到唤醒词时通知智能语音助手设备,使得智能语音助手设备在唤醒词播放期间不被唤醒。示例性地,图3中所示的另一设备也可以称为独立唤醒词检测引擎,本发明对此不限定。
参照图3,智能语音助手设备开始播放语音信息,并将语音信息传输至另一设备。另一设备执行唤醒词检测,并确定唤醒词在语音信息中的位置,随后将唤醒词在语音信息中的位置发送给智能语音助手设备并指示智能语音助手设备在所确定的位置处关闭被唤醒功能。从而智能语音助手设备在对应的位置处拒绝被唤醒。
具体地,图3所示的实施例包括:
S21,智能语音助手设备开始播放语音信息。
示例性地,该语音信息可以是智能语音助手设备自己播放的、或者可以是通过其外设播放的音频信息。作为一例,其可以为TTS语音。
S22,智能语音助手设备将所播放的语音信息传输至另一设备。
示例性地,另一设备可以获取该语音信息以便进行唤醒词检测。
S23,另一设备进行唤醒词检测,并确定唤醒词在语音信息中的位置。
示例性地,可以实时地进行唤醒词检测,作为一种实现方式,可以使用基于神经网络的检测模型,当然也可以使用其他已有的检测方法,这里不再一一罗列。
示例性地,可以在检测的同时确定唤醒词在语音信息中的位置,或者可以在检测到唤醒词之后再确定其位置。
示例性地,位置可以采用任意可用的形式表示,例如,位置可以是唤醒词在语音信息中的起始位置和长度;或者,可以是唤醒词在语音信息中的起始位置和结束位置;或者,也可以是其它的位置形式,这里不再一一罗列。
S24,另一设备向智能语音助手设备发送控制命令,该控制命令包括唤醒词位置。该控制命令用于控制智能语音助手设备在该唤醒词位置处不被唤醒。
示例性地,可以在控制命令的特定字段处携带该唤醒词位置的信息。或者,唤醒词位置可以作为一条单独的信令与控制命令一起封装之后再发送。
S25,智能语音助手设备关闭被唤醒功能。
示例性地,智能语音助手设备根据接收到的控制命令,在唤醒词位置处拒绝被唤醒。示例性地,可以在唤醒词位置处关闭被唤醒功能,而在语音信息的除唤醒词位置的其他位置处保持被唤醒功能开启。
在这样的实施例中,智能语音助手设备自己执行唤醒词检测,其检测到的唤醒词可能是人声,也可能是其自己的语音;与智能语音助手设备连接的另一设备也执行唤醒词检测,其检测到的唤醒词是语音设备的语音。另一设备检测到唤醒词时,通知智能语音助手设备在对应位置处拒绝被唤醒。这样,智能语音助手设备只有在检测到人声中包括唤醒词时才会被唤醒,从而避免其被误唤醒,保证了智能语音助手设备的功能运行,提升了用户体验。
根据本发明的另一方面,提供一种防止设备被误唤醒的装置,如图4所示,可以执行前述方法的步骤,该装置包括:
检测模块410,用于对智能语音助手设备正在播放的音频信息进行唤醒词检测;
确定模块420,用于确定所述唤醒词在所述音频信息中的位置;
控制模块430,用于控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
示例性地,音频信息可以是智能语音助手设备自己播放的,或者,可以是与智能语音助手设备连接的外设播放的。例如,用户可以与智能语音助手设备直接进行交互,即用户可以朝智能语音助手设备说话,由智能语音助手设备直接接收用户的指令。再例如,智能语音助手设备上可以连接有外部设备(简称外设),外设可以与智能语音助手设备直接或间接连接,诸如蓝牙音箱、收音机等。外设与智能语音助手设备之间的连接方式可以为蓝牙或无线网络等,例如无线网络为无线保真(WIFI)。可理解,外设与智能语音助手设备之间也可以是其它的连接方式,例如通过cable线连接,例如通过USB2.0线连接等,这里不再一一罗列。
示例性地,音频信息可以是TTS语音。
检测模块410可以实时地进行唤醒词检测,其中检测方法可以与现有技术中对侦听到的人声进行唤醒词检测的方法相同或类似,本发明对此不限定。
示例性地,确定模块420可以在检测的同时确定唤醒词在音频信息中的位置,或者可以在检测到唤醒词之后再确定其位置。示例性地,该位置可以是唤醒词在音频信息中的起始位置和长度;或者,可以是唤醒词在音频信息中的起始位置和结束位置;或者,也可以是其它的位置形式。
示例性地,控制模块430可以控制智能语音助手设备在确定模块420所确定的位置处关闭被唤醒功能。具体地,控制模块430可以通知或指示智能语音助手设备在确定模块420所确定的位置区间拒绝被唤醒,此时智能语音助手设备对侦听到的唤醒词不执行被唤醒的响应。
另外,控制模块430还可以用于:控制智能语音助手设备在确定模块420所确定的位置之后恢复被唤醒功能。
根据本发明的另一方面,提供一种防止设备被误唤醒的***,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,当处理器执行所述计算机程序时实现上述所述方法的步骤。
在本发明的一个实施例中,如图5所示,防止设备被误唤醒的***包括一个或多个处理器510、一个或多个存储器520。可选地,***还可以包括输入装置530、输出装置540、通信接口550的至少一个,这些组件通过总线***560和/或其它形式的连接机构(未示出)互连。应当注意,图5所示的***的组件和结构只是示例性的,而非限制性的,根据需要,***也可以具有其他组件和结构。
处理器510可以是中央处理单元(Central Processing Unit,CPU)、图像处理单元(Graphics Processing Unit,GPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制***中的其它组件以执行期望的功能。处理器510,用于执行根据本发明实施例的防止设备被误唤醒的方法的相应步骤。例如,处理器510能够包括一个或多个嵌入式处理器、处理器核心、微型处理器、逻辑电路、硬件有限状态机(Finite State Automata,FSM)、数字信号处理器(DigitalSignal Processing,DSP)或它们的组合。
存储器520用于存储各种类型的数据以支持检测装置的操作。例如可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质。存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
输入装置530可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
输出装置540可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
通信接口550用于***和其他设备之间进行通信,包括有线或者无线方式的通信。***可以接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G或它们的组合。在一个示例性实施例中,通信接口310经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,通信接口550还包括近场通信(Near FieldCommunication,NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RadioFrequency Identification,RFID)技术,红外数据协会(Infrared Data Association,IrDA)技术,超宽带(Ultra Wide Band,UWB)技术,蓝牙(BlueTooth,BT)技术和其他技术来实现。
在一个实施例中,在程序代码被处理器运行时执行上述的防止设备被误唤醒的方法。
示例性地,信息的存储方式可以包括以下存储方式之一:本地(local)存储、数据库存储、分布式文件***存储以及远程存储,存储服务地址可以包括服务器IP和服务器端口。
示例性地,在上述对信息进行存取时,可以以流的形式进行。例如,可以采用二进制流的传输方式实现对信息的存取。
此外,根据本发明实施例,还提供了一种存储介质,在存储介质上存储了程序指令,在程序指令被计算机或处理器运行时用于执行本发明实施例的防止设备被误唤醒的方法的相应步骤,并且用于实现根据本发明实施例的如图4所示的防止设备被误唤醒的装置中的相应模块。存储介质,可以为计算机可读存储介质,例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合,例如一个计算机可读存储介质包含用于随机地生成动作指令序列的计算机可读的程序代码,另一个计算机可读存储介质包含用于进行防止设备被误唤醒的方法的计算机可读的程序代码。
在一个实施例中,计算机程序指令在被计算机运行时可以实现根据本发明实施例的如图4所示的防止设备被误唤醒的装置的各个功能模块,并且/或者可以执行根据本发明实施例的防止设备被误唤醒的方法。
此外,根据本发明实施例,还提供了一种计算机程序,该计算机程序在被计算机或处理器运行时用于执行本发明实施例的如图1或图3所示的防止设备被误唤醒的方法的相应步骤。
由此可见,本发明实施例中,在语音设备播放语音信息时,检测唤醒词,并控制语音设备在唤醒词的位置处拒绝被唤醒。这样,智能语音助手设备只有在检测到人声中包括唤醒词时才会被唤醒,从而避免其被误唤醒,保证了智能语音助手设备的功能运行,提升了用户体验。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种防止设备被误唤醒的方法,其特征在于,所述方法包括:
对智能语音助手设备正在播放的音频信息进行唤醒词检测;
确定所述唤醒词在所述音频信息中的位置;
控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
2.如权利要求1所述的方法,其特征在于,所述音频信息由所述智能语音助手设备播放。
3.如权利要求1所述的方法,其特征在于,所述音频信息由与所述智能语音助手设备直接或间接连接的外部设备播放。
4.如权利要求3所述的方法,其特征在于,所述外部设备与所述智能语音助手设备之间通过蓝牙或无线网络进行连接。
5.如权利要求1所述的方法,其特征在于,所述音频信息为从文本到语音TTS语音。
6.如权利要求1所述的方法,其特征在于,所述位置包括所述唤醒词在所述音频信息中的起始位置和长度;或者,所述位置包括所述唤醒词在所述音频信息中的起始位置和结束位置。
7.如权利要求1至5中任一项所述的方法,其特征在于,还包括:
控制所述智能语音助手设备在所述位置之后恢复被唤醒功能。
8.一种防止设备被误唤醒的装置,其特征在于,所述装置用于执行前述权利要求1至7中任一项所述方法的步骤,所述装置包括:
检测模块,用于对智能语音助手设备正在播放的音频信息进行唤醒词检测;
确定模块,用于确定所述唤醒词在所述音频信息中的位置;
控制模块,用于控制所述智能语音助手设备在所述位置处关闭被唤醒功能。
9.一种防止设备被误唤醒的***,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机执行时实现权利要求1至7中任一项所述方法的步骤。
CN201910967844.6A 2019-10-12 2019-10-12 防止设备被误唤醒的方法、装置、***和计算机存储介质 Pending CN110727821A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910967844.6A CN110727821A (zh) 2019-10-12 2019-10-12 防止设备被误唤醒的方法、装置、***和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910967844.6A CN110727821A (zh) 2019-10-12 2019-10-12 防止设备被误唤醒的方法、装置、***和计算机存储介质

Publications (1)

Publication Number Publication Date
CN110727821A true CN110727821A (zh) 2020-01-24

Family

ID=69220073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910967844.6A Pending CN110727821A (zh) 2019-10-12 2019-10-12 防止设备被误唤醒的方法、装置、***和计算机存储介质

Country Status (1)

Country Link
CN (1) CN110727821A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112542168A (zh) * 2020-12-08 2021-03-23 维沃移动通信有限公司 语音控制方法及装置
CN112634897A (zh) * 2020-12-31 2021-04-09 青岛海尔科技有限公司 设备唤醒方法、装置和存储介质及电子装置
CN112863545A (zh) * 2021-01-13 2021-05-28 北京字节跳动网络技术有限公司 性能测试方法、装置、电子设备及计算机可读存储介质
CN113450789A (zh) * 2020-03-27 2021-09-28 株式会社电装天 车载装置以及车载装置中的声音处理方法
WO2022068694A1 (zh) * 2020-09-30 2022-04-07 华为技术有限公司 电子设备及其唤醒方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103095911A (zh) * 2012-12-18 2013-05-08 苏州思必驰信息科技有限公司 一种通过语音唤醒寻找手机的方法及***
CN109358751A (zh) * 2018-10-23 2019-02-19 北京猎户星空科技有限公司 一种机器人的唤醒控制方法、装置及设备
US20190066678A1 (en) * 2017-08-24 2019-02-28 Toyota Jidosha Kabushiki Kaisha Information processing device, in-vehicle device, and storage medium
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及***
CN109461449A (zh) * 2018-12-29 2019-03-12 苏州思必驰信息科技有限公司 用于智能设备的语音唤醒方法及***
US20190139547A1 (en) * 2017-11-08 2019-05-09 Alibaba Group Holding Limited Interactive Method and Device
CN110033775A (zh) * 2019-05-07 2019-07-19 百度在线网络技术(北京)有限公司 多音区唤醒交互方法、装置及存储介质
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103095911A (zh) * 2012-12-18 2013-05-08 苏州思必驰信息科技有限公司 一种通过语音唤醒寻找手机的方法及***
US20190066678A1 (en) * 2017-08-24 2019-02-28 Toyota Jidosha Kabushiki Kaisha Information processing device, in-vehicle device, and storage medium
US20190139547A1 (en) * 2017-11-08 2019-05-09 Alibaba Group Holding Limited Interactive Method and Device
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备
CN109358751A (zh) * 2018-10-23 2019-02-19 北京猎户星空科技有限公司 一种机器人的唤醒控制方法、装置及设备
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及***
CN109461449A (zh) * 2018-12-29 2019-03-12 苏州思必驰信息科技有限公司 用于智能设备的语音唤醒方法及***
CN110033775A (zh) * 2019-05-07 2019-07-19 百度在线网络技术(北京)有限公司 多音区唤醒交互方法、装置及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450789A (zh) * 2020-03-27 2021-09-28 株式会社电装天 车载装置以及车载装置中的声音处理方法
WO2022068694A1 (zh) * 2020-09-30 2022-04-07 华为技术有限公司 电子设备及其唤醒方法
CN112542168A (zh) * 2020-12-08 2021-03-23 维沃移动通信有限公司 语音控制方法及装置
CN112542168B (zh) * 2020-12-08 2024-06-11 维沃移动通信有限公司 语音控制方法及装置
CN112634897A (zh) * 2020-12-31 2021-04-09 青岛海尔科技有限公司 设备唤醒方法、装置和存储介质及电子装置
CN112863545A (zh) * 2021-01-13 2021-05-28 北京字节跳动网络技术有限公司 性能测试方法、装置、电子设备及计算机可读存储介质
CN112863545B (zh) * 2021-01-13 2023-10-03 抖音视界有限公司 性能测试方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110727821A (zh) 防止设备被误唤醒的方法、装置、***和计算机存储介质
CN107112017B (zh) 操作语音识别功能的电子设备和方法
KR102363872B1 (ko) 오디오 워터 마킹을 이용한 키 구문 검출
CN107580113B (zh) 提示方法、装置、存储介质及终端
KR20190042903A (ko) 음성 신호를 제어하기 위한 전자 장치 및 방법
KR20190042918A (ko) 전자 장치 및 그의 동작 방법
JP2002534716A (ja) 注目期間を有する音声入力装置
CN108806673B (zh) 一种智能设备控制方法、装置及智能设备
CN108320751B (zh) 一种语音交互方法、装置、设备和服务器
KR20200015267A (ko) 음성 인식을 수행할 전자 장치를 결정하는 전자 장치 및 전자 장치의 동작 방법
JP2007135008A (ja) 携帯端末装置
CN112040442B (zh) 交互方法、移动终端、车载终端及计算机可读存储介质
CN111510814A (zh) 降噪模式控制方法、装置、电子设备及存储介质
WO2019174487A1 (zh) 设备的唤醒方法、装置及电子设备
CN111464992A (zh) 一种基于智能垃圾桶的节电控制方法、装置和***
KR20190009488A (ko) 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템
CN110968353A (zh) 中央处理器的唤醒方法、装置、语音处理器以及用户设备
CN108307271A (zh) 一种智能设备的音量调节方法、装置及智能设备
JP2020038709A (ja) 人工知能機器における連続会話機能
CN111739628B (zh) 可穿戴按摩仪的调节方法及相关装置
KR20210044509A (ko) 음성 인식의 향상을 지원하는 전자 장치
CN108093350B (zh) 麦克风的控制方法和麦克风
CN110543333A (zh) 针对处理器的休眠处理方法、装置、移动终端和存储介质
CN109511139B (zh) Wifi控制方法、装置、移动设备、计算机可读存储介质
CN111768794A (zh) 一种语音降噪方法、语音降噪***、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200124