CN111105796A

CN111105796A - 无线耳机控制装置及控制方法、语音控制设置方法和***

Info

Publication number: CN111105796A
Application number: CN201911310508.0A
Authority: CN
Inventors: 顾渝骢; 张钟宣; 朱夏宁
Original assignee: Hangzhou Zhixinke Microelectronics Technology Co Ltd
Current assignee: Hangzhou Zhixinke Microelectronics Technology Co Ltd
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2020-05-05

Abstract

本发明涉及一种无线耳机控制装置及控制方法、语音控制设备方法和***，无线耳机控制装置包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块，音频预处理模块与无线耳机的麦克风相连接，麦克风得到音频信号，音频预处理模块通过连接接口接收音频信号并进行预处理，从中提取音频信号相应的音频特征，语音智能识别模块从音频特征中获取语音声纹，并将其与预设声纹比较，在声纹匹配时，识别音频特征中是否包含语音命令，将识别结果发送至微处理器，微处理器可以输出相对应的控制指令，通过输出模块传输至与之相连接的无线耳机的主控芯片，执行控制指令，与预设声纹相匹配的声音才能对无线耳机进行控制，提高无线耳机控制的安全性。

Description

无线耳机控制装置及控制方法、语音控制设置方法和***

技术领域

本发明涉及音频信号处理技术领域，特别是涉及一种无线耳机控制装置及控制方法、语音控制设备方法和***。

背景技术

目前，市面上的无线耳机控制装置一般是用作采集语音信息的接口，将采集的语音信息转换成电信号，发送至后端的处理器进行数据处理。

现在对声控技术的要求越来越高，需要对无线耳机控制装置接收的语音信号进行实时响应，为了达到这一目的，无线耳机控制装置需要持续处于唤醒状态，如此就增加了无线耳机控制装置本身的功耗。而现有的大多数终端上配置的无线耳机控制装置都存在功耗高这一问题，还有少数的终端上配置有语音唤醒功能，终端的处理器通过无线耳机控制装置接收语音，通过语音唤醒算法对语音信号进行处理，进而对终端进行操作唤醒；而终端的处理器执行语音唤醒算法时的电流较大，增加终端处理器的功耗。

发明内容

基于此，有必要针对传统的无线耳机控制装置持续处于唤醒状态功耗较高，通过终端的处理器执行语音唤醒算法功耗较高的问题，提供一种无线耳机控制装置及控制方法、语音控制设备方法和***。

一种无线耳机控制装置，包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块；语音智能识别模块为模拟电路或模拟数字混合电路；

音频预处理模块还与无线耳机的麦克风连接，输出模块与无线耳机的主控芯片连接；

音频预处理模块用于获取麦克风接收并传输的音频信号，并从音频信号中提取音频特征；

语音智能识别模块用于获取音频特征，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令，并将识别结果发送至微处理器；

微处理器用于在识别结果表示音频特征中包含语音命令时，输出与语音命令相对应的控制指令；

输出模块用于将控制指令传输至主控芯片。

根据上述的无线耳机控制装置，其包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块，音频预处理模块与无线耳机的麦克风相连接，麦克风可以感受声音信号并对其进行采集，得到音频信号，音频预处理模块通过连接接口接收音频信号并进行预处理，从中提取音频信号相应的音频特征，语音智能识别模块从音频特征中获取语音声纹，并将其与预设声纹比较，在声纹匹配时，识别音频特征中是否包含语音命令，将识别结果发送至微处理器，微处理器可以输出与语音命令相对应的控制指令，通过输出模块传输至与之相连接的无线耳机的主控芯片，由主控芯片执行控制指令，实现相应的控制过程；本方案中，通过对声音信号的声纹识别，只有与预设声纹相匹配的声音才能对无线耳机进行控制，可以大幅降低相同语音但声纹不同的误触发几率，提高无线耳机控制的安全性，而且使用语音命令代替传统的物理按键，可以完全释放用户的双手和双眼，提高无线耳机使用的便利性，另外，无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路，与传统的使用数字电路执行语音识别算法相比，大幅降低了功耗，更易实现持续工作、快捷反应。

在其中一个实施例中，音频预处理模块包括相互连接的音频接口模块和特征提取模块；音频接口模块还与麦克风连接，特征提取模块还与语音智能识别模块连接；

音频接口模块用于获取音频信号，并对音频信号进行去噪处理，将去噪后的音频信号发送至特征提取模块；

特征提取模块用于从去噪后的音频信号中提取音频特征。

在其中一个实施例中，语音智能识别模块包括深度学习神经网络；

通过深度学习神经网络从音频特征中获取语音声纹，并对语音声纹进行识别；

若语音声纹与预设声纹相匹配，识别音频特征中是否包含语音命令。

在其中一个实施例中，通过深度学习神经网络识别音频特征中是否包含语音命令，并将识别结果发送至微处理器。

在其中一个实施例中，无线耳机控制装置还包括串行外设接口，串行外设接口分别与语音智能识别模块、微处理器连接；

串行外设接口用于为语音智能识别模块和微处理器连接外部存储设备。

一种应用上述的无线耳机控制装置的控制方法，包括以下步骤：

通过音频预处理模块获取麦克风接收并传输的音频信号，并从音频信号中提取音频特征；

通过语音智能识别模块获取音频特征，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令，并将识别结果发送至微处理器；

在识别结果表示音频特征中包含语音命令时，通过微处理器输出与语音命令相对应的控制指令；

通过输出模块将控制指令传输至主控芯片。

根据上述的应用无线耳机控制装置的控制方法，麦克风可以感受声音信号并对其进行采集，得到音频信号，通过音频预处理模块获取音频信号，进行预处理，从中提取音频信号相应的音频特征，通过语音智能识别模块从音频特征中获取语音声纹，并将其与预设声纹比较，在声纹匹配时，识别音频特征中是否包含语音命令，将识别结果发送至微处理器，通过微处理器可以输出与语音命令相对应的控制指令，通过输出模块将控制指令传输至与之相连接的无线耳机的主控芯片，由主控芯片执行控制指令，实现相应的控制过程；本方案中，通过对声音信号的声纹识别，只有与预设声纹相匹配的声音才能对无线耳机进行控制，可以大幅降低相同语音但声纹不同的误触发几率，提高无线耳机控制的安全性，而且使用语音命令代替传统的物理按键，可以完全释放用户的双手和双眼，提高无线耳机使用的便利性，另外，无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路，与传统的使用数字电路执行语音识别算法相比，大幅降低了功耗，更易实现持续工作、快捷反应。

在其中一个实施例中，在通过音频预处理模块获取麦克风接收并传输的音频信号之后，还包括以下步骤：

通过音频预处理模块对音频信号进行去噪处理。

在其中一个实施例中，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令的步骤包括以下步骤：

通过语音智能识别模块中的深度学习神经网络，从音频特征获取语音声纹，并对语音声纹进行识别；

若语音声纹与预设声纹相匹配，通过深度学习神经网络识别音频特征中是否包含语音命令。

在其中一个实施例中，语音命令包括语音唤醒命令和/或语音动作命令；

在识别结果表示音频特征中包含语音命令时，通过微处理器输出与语音命令相对应的控制指令的步骤包括以下步骤：

在识别结果表示音频特征中包含语音唤醒命令时，通过微处理器输出与语音唤醒命令相对应的唤醒控制指令，唤醒控制指令用于将处于休眠状态的主控芯片唤醒；

和/或；

在识别结果表示音频特征中包含语音动作命令时，通过微处理器输出与语音动作命令相对应的动作控制指令，动作控制指令用于指示主控芯片执行控制动作。

在其中一个实施例中，应用上述的无线耳机控制装置的控制方法还包括以下步骤：

通过音频预处理模块获取麦克风接收并传输的第一语音信号，并将从第一语音信号提取的第一语音特征传输至语音智能识别模块；

若通过语音智能识别模块判定第一语音特征与预设的声纹设置开启特征相匹配，通过音频预处理模块获取麦克风接收并传输的第二语音信号，并从第二语音信号中提取第二语音特征，通过语音智能识别模块将第二语音特征作为预设声纹；其中，第一语音信号和第二语音信号是用户根据声纹设置提示分别发出的语音对应的信号；

通过音频预处理模块获取麦克风接收并传输的第三语音信号，并将从第三语音信号提取的第三语音特征传输至语音智能识别模块；

若通过语音智能识别模块判定第三语音特征与预设的命令设置开启特征相匹配，通过音频预处理模块获取麦克风接收并传输的第四语音信号，并从第四语音信号中提取第四语音特征，通过语音智能识别模块将第四语音特征作为语音命令；其中，第三语音信号和第四语音信号是用户根据命令设置提示分别发出的语音对应的信号。

一种基于如上述的无线耳机控制装置的语音控制设置方法，输出模块为输入输出模块，语音控制设置方法包括以下步骤：

开启语音控制设置功能，并显示声纹参考信息；

接收用户依据声纹参考信息发出的语音作为第一语音样本，对第一语音样本进行语音格式预处理，获得预设格式的第一语音数据，从第一语音数据中提取第一语音特征，将第一语音特征通过无线方式发送至主控芯片，经输入输出模块和微处理器传输至语音智能识别模块，其中，语音智能识别模块将第一语音特征作为预设声纹；

显示命令参考信息；

接收用户依据命令参考信息发出的语音作为第二语音样本，对第二语音样本进行语音格式预处理，获得预设格式的第二语音数据，从第二语音数据中提取第二语音特征，将第二语音特征通过无线方式发送至主控芯片，经输入输出模块和微处理器传输至语音智能识别模块，其中，语音智能识别模块将第二语音特征作为语音命令。

根据上述的应用无线耳机控制装置的语音控制设置方法，可以应用在各种具备无线传输功能的终端中，实现预设声纹和语音命令的设置。语音控制设置方法可以开启语音控制设置功能，通过接收用户的参照显示的声纹参考信息发出的语音作为第一语音样本，经过语音格式预处理和特征提取后，得到第一语音特征并发送至无线耳机的主控芯片，再经输入输出模块和微处理器传输至语音智能识别模块，作为预设声纹保存；通过相似的方式，可以接收用户参照显示的命令参考信息，对语音命令进行设置，通过上述方式，可以对无线耳机控制装置的声纹和语音命令进行自定义设置，便于用户随时进行更改，以适应应用场景的变化。

一种基于如上述的无线耳机控制装置的语音控制设置***，输出模块为输入输出模块，语音控制设置***包括语音控制指示单元和语音控制录入单元；

语音控制指示单元用于开启语音控制设置功能，并显示声纹参考信息；

语音控制录入单元用于接收用户依据声纹参考信息发出的语音作为第一语音样本，对第一语音样本进行语音格式预处理，获得预设格式的第一语音数据，从第一语音数据中提取第一语音特征，将第一语音特征通过无线方式发送至主控芯片，经输入输出模块和微处理器传输至语音智能识别模块，其中，语音智能识别模块将第一语音特征作为预设声纹；

语音控制指示单元还用于显示命令参考信息；

语音控制录入单元还用于接收用户依据命令参考信息发出的语音作为第二语音样本，对第二语音样本进行语音格式预处理，获得预设格式的第二语音数据，从第二语音数据中提取第二语音特征，将第二语音特征通过无线方式发送至主控芯片，经输入输出模块和微处理器传输至语音智能识别模块，其中，语音智能识别模块将第二语音特征作为语音命令。

根据上述的应用无线耳机控制装置的语音控制设置***，可以应用在各种具备无线传输功能的终端中，实现预设声纹和语音命令的设置。语音控制指示单元可以开启语音控制设置功能，语音控制录入单元可以接收用户的参照显示的声纹参考信息发出的语音作为第一语音样本，经过语音格式预处理和特征提取后，得到第一语音特征并发送至无线耳机的主控芯片，再经输入输出模块和微处理器传输至语音智能识别模块，作为预设声纹保存；通过相似的方式，语音控制指示单元可以显示命令参考信息，语音控制录入单元可以接收用户参照显示的命令参考信息，对语音命令进行设置，通过上述方式，可以对无线耳机控制装置的声纹和语音命令进行自定义设置，便于用户随时进行更改，以适应应用场景的变化。

附图说明

图1为一个实施例中的无线耳机控制装置的结构示意图；

图2为一个实施例中的音频预处理模块的结构示意图；

图3为另一个实施例中的无线耳机控制装置的结构示意图；

图4为又一个实施例中的无线耳机控制装置的结构示意图；

图5为一个实施例中的应用无线耳机控制装置的控制方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

需要说明的是，本发明实施例所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换，以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

本发明实施例的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或(模块)单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本申请提供的无线耳机控制装置，可以应用于各种可实现无线传输的智能耳机设备中，用于对智能耳机进行控制，带有无线耳机控制装置的智能耳机设备可以通过声音控制执行各种命令和操作。

参见图1所示，为一个实施例的无线耳机控制装置的结构示意图。该实施例中的无线耳机控制装置包括依次连接的音频预处理模块100、语音智能识别模块200、微处理器300和输出模块400；语音智能识别模块200为模拟电路或模拟数字混合电路；

音频预处理模块100还与无线耳机的麦克风连接，输出模块400与无线耳机的主控芯片连接；

音频预处理模块100用于获取麦克风接收并传输的音频信号，并从音频信号中提取音频特征；

语音智能识别模块200用于获取音频特征，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令，并将识别结果发送至微处理器；

微处理器300用于在识别结果表示音频特征中包含语音命令时，输出与语音命令相对应的控制指令；

输出模块400用于将控制指令传输至主控芯片。

在本实施例中，无线耳机控制装置包括依次连接的音频预处理模块100、语音智能识别模块200、微处理器300和输出模块400，音频预处理模块100与无线耳机的麦克风相连接，麦克风可以感受声音信号并对其进行采集，得到音频信号，音频预处理模块100通过连接接口接收音频信号并进行预处理，从中提取音频信号相应的音频特征，语音智能识别模块200从音频特征中获取语音声纹，并将其与预设声纹比较，在声纹匹配时，识别音频特征中是否包含语音命令，将识别结果发送至微处理器300，微处理器300可以输出与语音命令相对应的控制指令，通过输出模块400传输至与之相连接的无线耳机的主控芯片，由主控芯片执行控制指令，实现相应的控制过程；本方案中，通过对声音信号的声纹识别，只有与预设声纹相匹配的声音才能对无线耳机进行控制，可以大幅降低相同语音但声纹不同的误触发几率，提高无线耳机控制的安全性，而且使用语音命令代替传统的物理按键，可以完全释放用户的双手和双眼，提高无线耳机使用的便利性，另外，无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路，与传统的使用数字电路执行语音识别算法相比，大幅降低了功耗，更易实现持续工作、快捷反应。

需要说明的是，无线耳机控制装置可以设置在无线耳机的麦克风和主控芯片之间，麦克风作为声音传感器，可以采集无线耳机所处环境中的声音，声音信号可以是语音信号，如用户发出的话语、歌声、旋律音等，也可以是其他播放设备播放的语音、音乐、旋律等；通过麦克风中的硬件电路可以将声音信号转换为以电信号形式存在的音频信号，音频预处理模块100上可以设置音频接口，用于接收音频信号。

需要说明的是，音频预处理模块100、微处理器300可以是数字电路，输出模块400可以是模拟电路或模拟数字混合电路，也可以是数字电路。

在一个实施例中，如图2所示，音频预处理模块100包括相互连接的音频接口模块110和特征提取模块120；音频接口模块110还与麦克风连接，特征提取模块120还与语音智能识别模块200连接；

音频接口模块110用于获取音频信号，并对音频信号进行去噪处理，将去噪后的音频信号发送至特征提取模块120；

特征提取模块120用于从去噪后的音频信号中提取音频特征。

在本实施例中，音频预处理模块100包括相互连接的音频接口模块110和特征提取模块120，音频接口模块110可以使用音频接口从麦克风处得到音频信号，并对音频信号做前期的去噪处理，滤除音频信号中的明显噪声信号，特征提取模块120主要用于去噪后的音频信号中的音频特征提取，经去噪可以提高后续音频特征的准确性。

进一步的，音频接口模块110还可以对音频信号进行格式转换，删除明显的静音段信号、白噪声等；特征提取模块120可以针对去噪后的音频信号的幅度、频率、变化连续性等各种参数，按照预先设置的规则来提取音频特征，音频特征本身实质上是音频信号的一部分，如将幅度大于预设值，频率处于预置的范围内，变化连续性满足一定时长的音频信号进行截取，作为音频特征。

在一个实施例中，语音智能识别模块200包括深度学习神经网络；

在本实施例中，深度学习神经网络是由大量类似于神经元的处理单元相互连结而成的非线性复杂网络***，它通过模拟大脑神经元网络处理、记忆信息的方式，完成人脑那样的信息处理功能，是非线性的并行结构，本方案中，当深度学习神经网络接收到音频特征时，能够作出迅速、准确地判断，从中获取语音声纹，深度学习神经网络中存有预设声纹，可以对语音声纹进行识别匹配，在语音声纹与预设声纹相匹配时，表明当前语音的声源是合法的用户，可以执行识别音频特征中是否包含语音命令的步骤，深度学习神经网络可以减小犯错的可能性，提高语音声纹获取和识别的准确性，而且深度学习神经网络的工作模式产生的功耗较低。

进一步的，若语音声纹与预设声纹不匹配，表明当前语音声纹的声源不是合法的用户，可以直接忽略当前的音频特征，不对其进行下一步的响应，在实际应用中，表现为非法用户发出的语音，即使语音中包括正确的语音命令，也无法对无线耳机进行控制，从而提高无线耳机控制的安全性。

音频特征可以是模拟特征，音频特征同时可以是语音信号所包含的一段语句，通过对语音信号的幅度、频率可以分析得到语音语调，作为语音声纹。

在一个实施例中，通过深度学习神经网络识别音频特征中是否包含语音命令，并将识别结果发送至微处理器300。

在本实施例中，音频特征中是否包含语音命令也可以通过深度学习神经网络进行识别，将识别结果发送至微处理器300进行进一步的处理，利用深度学习神经网络的特性可以大大提高语音命令识别的准确性。

需要说明的是，音频特征可以包含关键词或关键词组等，通过对关键词的或关键词组的识别，可以从中得到相应的语音命令，如关键词“开机”，在识别到这一关键词后，判断其属于控制类的命令时，将其作为语音命令，语音命令可以与各种不同的控制命令相对应，根据实际控制需要进行调整，并不局限于语音关键词的各种形式。

进一步的，音频特征中若包含语音命令，微处理器300可以对其进行语音命令进行响应处理，若不包含语音命令，微处理器300可以不作响应。

在一个实施例中，如图3所示，无线耳机控制装置还包括串行外设接口500，串行外设接口500分别与语音智能识别模块200、微处理器300连接；

串行外设接口500用于为语音智能识别模块200和微处理器300连接外部存储设备。

在本实施例中，无线耳机控制装置还包括串行外设接口500，其与语音智能识别模块200、微处理器300连接，可以为两者连接外部存储设备，用于扩展存储容量，便于提高语音智能识别模块200和微处理器300的数据处理速度。

在一个实施例中，如图4所示，无线耳机控制装置还包括与微处理器300连接的时钟管理电路600，时钟管理电路600包括晶振接口610、时间处理器620和时间寄存器630；

晶振接口610用于接收外部时钟信号；时间寄存器630用于在识别结果中包含时间信息时，保存时间信息；

时间处理器620用于在到达时间信息对应的晶振时间时，输出中断信号至微处理器300，中断信号用于指示微处理器300输出控制指令。

在本实施例中，无线耳机控制装置还包括与微处理器300连接的时钟管理电路600，时钟管理电路600包括晶振接口610、时间处理器620和时间寄存器630，晶振接口610用于接收外部时钟信号，实现时钟信号同步；微处理器300从语音智能识别模块200处接收的识别结果可以包含时间信息，通过时间管理电路600中的时间寄存器630对时间信息进行保存，在到达时间信息对应的晶振时间时，通过时间管理电路600中的时间处理器620输出中断信号至微处理器300，用于指示微处理器300输出控制指令，通过时间管理电路600的时间信息处理，可以实现对控制指令的定时输出控制。

进一步的，时间管理电路600可以包括RTC(实时时钟)电路，可以实现周期性中断输出，以及32KHz时钟输出。

根据上述无线耳机控制装置，本发明实施例还提供一种应用上述无线耳机控制装置的控制方法，以下就应用无线耳机控制装置的控制方法的实施例进行详细说明。

参见图5所示，为一个实施例的应用无线耳机控制装置的控制方法的流程示意图。该实施例中的应用无线耳机控制装置的控制方法包括以下步骤：

步骤S710：通过音频预处理模块获取麦克风接收并传输的音频信号，并从音频信号中提取音频特征；

步骤S720：通过语音智能识别模块获取音频特征，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令，并将识别结果发送至微处理器；

步骤S730：在识别结果表示音频特征中包含语音命令时，通过微处理器输出与语音命令相对应的控制指令；

步骤S740：通过输出模块将控制指令传输至主控芯片。

在本实施例中，麦克风可以感受声音信号并对其进行采集，得到音频信号，通过音频预处理模块获取音频信号，进行预处理，从中提取音频信号相应的音频特征，通过语音智能识别模块从音频特征中获取语音声纹，并将其与预设声纹比较，在声纹匹配时，识别音频特征中是否包含语音命令，将识别结果发送至微处理器，通过微处理器可以输出与语音命令相对应的控制指令，通过输出模块将控制指令传输至与之相连接的无线耳机的主控芯片，由主控芯片执行控制指令，实现相应的控制过程；本方案中，通过对声音信号的声纹识别，只有与预设声纹相匹配的声音才能对无线耳机进行控制，可以大幅降低相同语音但声纹不同的误触发几率，提高无线耳机控制的安全性，而且使用语音命令代替传统的物理按键，可以完全释放用户的双手和双眼，提高无线耳机使用的便利性，另外，无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路，与传统的使用数字电路执行语音识别算法相比，大幅降低了功耗，更易实现持续工作、快捷反应。

在一个实施例中，在通过音频预处理模块获取麦克风接收并传输的音频信号之后，还包括以下步骤：

通过音频预处理模块对音频信号进行去噪处理。

在一个实施例中，根据音频特征获取语音声纹，在语音声纹与预设声纹相匹配时，识别音频特征中是否包含语音命令的步骤包括以下步骤：

在一个实施例中，语音命令包括语音唤醒命令和/或语音动作命令；

和/或；

在本实施例中，语音命令可以是语音唤醒命令、语音动作命令中任一种或其组合，若是语音唤醒命令，微处理器可以输出与语音唤醒命令相对应的唤醒控制指令，通过输出模块输出至无线耳机的主控芯片后，可以将处于休眠状态的主控芯片唤醒，进入正常工作状态；若是语音动作命令，微处理器可以输出语音动作命令相对应的动作控制指令，通过输出模块输出至无线耳机的主控芯片后，可以使主控芯片执行相应的动作，如对无线耳机的播放项目进行切换，播放音量进行调整等。

进一步的，若无线耳机的主控芯片当前处于休眠状态，则对唤醒控制指令进行响应，在通过唤醒控制指令进行唤醒后，才对语音动作指令进行响应；若无线耳机的主控芯片当前已处于正常工作状态，则对动作控制指令进行响应，不对唤醒控制指令响应。

进一步的，语音命令还包括语音休眠指令，在识别结果表示音频特征中包含语音休眠命令时，通过微处理器输出与语音休眠命令相对应的休眠控制指令，休眠控制指令用于将处于正常工作状态的主控芯片休眠。

在一个实施例中，应用上述的无线耳机控制装置的控制方法还包括以下步骤：

在本实施例中，用户可以根据声纹设置提示发出语音，如“声纹设置”或与其意义相同的其他语音，音频预处理模块得到与其对应的第一语音信号，通过语音智能识别模块对其中的第一语音特征(如“声纹设置”的声纹)进行判断，若与预设的声纹设置开启特征相匹配(声纹和语音内容均相匹配)，此时可以通过麦克风再次接收用户根据声纹设置提示发出语音，可以录制最大程度体现声纹的语音，如用户说出的“无线耳机”等，可以通过音频预处理模块获取与其对应的第二语音信号，通过语音智能识别模块将其中的第二语音特征(如“无线耳机”的声纹)作为预设声纹，如此可以完成对预设声纹的自由配置，而且只有与原先的预设的声纹设置开启特征相匹配，才能进行预设声纹配置，提高配置安全性；同理，用户可以根据命令设置提示发出语音，如“命令设置”或与其意义相同的其他语音，音频预处理模块得到与其对应的第三语音信号，通过语音智能识别模块对其中的第三语音特征(如“命令设置”的声纹)进行判断，若与预设的命令设置开启特征相匹配(声纹和语音内容均相匹配)，此时可以通过麦克风再次接收用户根据命令设置提示发出语音，可以录制最大程度体现命令的语音，如用户说出的“调高音量”、“下一首”、“上一首”等，可以通过音频预处理模块获取与其对应的第四语音信号，通过语音智能识别模块将其中的第四语音特征(如在该声纹下的“调高音量”、“下一首”、“上一首”)作为语音命令，如此可以完成对语音命令的自由配置，而且只有原先的预设的命令设置开启特征相匹配，才能进行语音命令配置，提高配置安全性。

进一步的，上述第一语音信号和第二语音信号可以是不同用户发出的语音对应的信号，以对声纹进行修改，在命令设置过程中，第三语音信号和第四语音信号可以是预先设置声纹的用户发出的语音对应的信号，也可以是新录制声纹的用户发出的语音对应的信号。

本发明实施例的无线耳机控制装置的控制方法与上述无线耳机控制装置相对应，在上述无线耳机控制装置的实施例阐述的技术特征及其有益效果均适用于无线耳机控制装置的控制方法的实施例中。

在一个实施例中，基于上述的无线耳机控制装置的语音控制设置方法，输出模块为输入输出模块，语音控制设置方法包括以下步骤：

开启语音控制设置功能，并显示声纹参考信息；

显示命令参考信息；

在本实施例中，主要实现对语音控制的具体设置，而且是在其他终端上实现，并非直接在无线耳机上实现。如利用手机等移动终端实现对无线耳机的语音控制设置。以手机为例，可以在手机端打开与无线耳机相关联的语音控制软件，并开启语音控制设置功能，此时可以显示声纹参考信息，用于提示用户参照声纹参考信息发出语音，手机端通过自身的麦克风可以接收该语音，作为第一语音样本，语音控制软件对第一语音样本进行格式预处理，得到第一语音数据，其中格式预处理包括语音去噪、语义词划分等等，通过第一语音数据可以提取第一语音特征，并通过手机端的无线传输模块将第一语音特征发送至无线耳机的主控芯片，经输入输出模块和微处理器传输至语音智能识别模块，以保存该第一语音特征作为预设声纹；此后，在手机端还可以显示命令参考信息，通过相似的过程，提示用户发出语音，将其作为第二语音样本，经格式预处理后提取第二语音特征，将其发送至主控芯片，并传输至语音智能识别模块作为语音命令，如此可以实现通过移动终端(如手机等)对无线耳机控制装置的语音控制设置，提高设置操作的便利性。

需要说明的是，命令参考信息可以是语音命令的触发关键字，如命令参考信息是唤醒无线耳机，此时可以录制的用户的语音可以是任意的，也可以与命令参考信息相同，只需将该语音与“唤醒无线耳机”功能相关联即可，其他功能类型的命令参考信息和语音录制也是相似的。

在一个实施例中，无线耳机控制装置可以应用在蓝牙耳机中。目前市面上的蓝牙耳机大部分采用机械按键实现接收电话，调整音量的功能，操作不方便，不能释放双手，少部分蓝牙耳机可以接收语音控制，但由于采用传统的DSP(Digital Signal Processing，数字信号处理)电路，能耗高，不能实现长期实时待机，反应缓慢，另外由于任何人都能通过语音控制耳机，无私密安全性，误触发也很高。

本申请的方案是一种基于声纹识别，自定义语音词的语音控制方法和装置。以蓝牙耳机为例，蓝牙耳机控制装置放置于蓝牙耳机麦克风和蓝牙芯片之间，一直待机，通过蓝牙耳机麦克风实时监测语音关键唤醒字和语音命令，识别用户(讲话者)的声纹，解析语音命令，通过蓝牙主控芯片执行命令。

自定义语音词的语音控制装置可以采用一语音控制芯片，该芯片内置深度学习神经网络，可以对使用者的声纹识别，仅仅使用者的语音才能触发唤醒芯片，大幅降低误触发，提升安全，并且只有使用者的语音命令才能进行语音控制。

而且该芯片可以采用专用ASIC集成电路和模拟电路，代替传统的DSP电路，大幅降低功耗，可以实现一直开机等待语音信号，实时监测蓝牙耳机麦克风的关键唤醒词语音信号，当监测到关键词时，输出唤醒信号至蓝牙耳机主控芯片，使蓝牙耳机进入正常工作状态，在监测到命令词语音信号时，启动本地命令解析，反应快捷。该芯片使用语音命令代替传统的物理按键，完全释放用户的双手和双眼。另外，还可以设置配套的手机用户终端应用程序，通过应用程序接收待识别的语音数据并且对待识别的语音数据进行语音格式预处理，从经过语音格式预处理的音频数据提取语音特征，声纹信息，再进行语音命令触发关键字设置，例如接通电话，播放音乐，调低音量，调高音量等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种无线耳机控制装置，其特征在于，包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块；所述语音智能识别模块为模拟电路或模拟数字混合电路；

所述音频预处理模块还与无线耳机的麦克风连接，所述输出模块与所述无线耳机的主控芯片连接；

所述音频预处理模块用于获取所述麦克风接收并传输的音频信号，并从所述音频信号中提取音频特征；

所述语音智能识别模块用于获取所述音频特征，根据所述音频特征获取语音声纹，在所述语音声纹与预设声纹相匹配时，识别所述音频特征中是否包含语音命令，并将识别结果发送至所述微处理器；

所述微处理器用于在所述识别结果表示所述音频特征中包含语音命令时，输出与所述语音命令相对应的控制指令；

所述输出模块用于将所述控制指令传输至所述主控芯片。

2.根据权利要求1所述的无线耳机控制装置，其特征在于，所述音频预处理模块包括相互连接的音频接口模块和特征提取模块；所述音频接口模块还与所述麦克风连接，所述特征提取模块还与所述语音智能识别模块连接；

所述音频接口模块用于获取所述音频信号，并对所述音频信号进行去噪处理，将去噪后的音频信号发送至所述特征提取模块；

所述特征提取模块用于从所述去噪后的音频信号中提取音频特征。

3.根据权利要求1所述的无线耳机控制装置，其特征在于，所述语音智能识别模块包括深度学习神经网络；

通过所述深度学习神经网络从所述音频特征中获取语音声纹，并对所述语音声纹进行识别；

若所述语音声纹与预设声纹相匹配，识别所述音频特征中是否包含语音命令。

4.根据权利要求3所述的无线耳机控制装置，其特征在于，通过所述深度学习神经网络识别所述音频特征中是否包含语音命令，并将识别结果发送至所述微处理器。

5.根据权利要求1所述的无线耳机控制装置，其特征在于，还包括串行外设接口，所述串行外设接口分别与所述语音智能识别模块、所述微处理器连接；

所述串行外设接口用于为所述语音智能识别模块和所述微处理器连接外部存储设备。

6.一种应用如权利要求1至5中任意一项所述的无线耳机控制装置的控制方法，其特征在于，包括以下步骤：

通过所述音频预处理模块获取所述麦克风接收并传输的音频信号，并从所述音频信号中提取音频特征；

通过所述语音智能识别模块获取所述音频特征，根据所述音频特征获取语音声纹，在所述语音声纹与预设声纹相匹配时，识别所述音频特征中是否包含语音命令，并将识别结果发送至所述微处理器；

在所述识别结果表示所述音频特征中包含语音命令时，通过所述微处理器输出与所述语音命令相对应的控制指令；

通过所述输出模块将所述控制指令传输至所述主控芯片。

7.根据权利要求6所述的控制方法，其特征在于，在所述通过所述音频预处理模块获取所述麦克风接收并传输的音频信号之后，还包括以下步骤：

通过所述音频预处理模块对所述音频信号进行去噪处理。

8.根据权利要求6所述的控制方法，其特征在于，所述根据所述音频特征获取语音声纹，在所述语音声纹与预设声纹相匹配时，识别所述音频特征中是否包含语音命令的步骤包括以下步骤：

通过所述语音智能识别模块中的深度学习神经网络，从所述音频特征获取语音声纹，并对所述语音声纹进行识别；

若所述语音声纹与预设声纹相匹配，通过所述深度学习神经网络识别所述音频特征中是否包含语音命令。

9.根据权利要求6所述的控制方法，其特征在于，所述语音命令包括语音唤醒命令和/或语音动作命令；

所述在所述识别结果表示所述音频特征中包含语音命令时，通过所述微处理器输出与所述语音命令相对应的控制指令的步骤包括以下步骤：

在所述识别结果表示所述音频特征中包含语音唤醒命令时，通过所述微处理器输出与所述语音唤醒命令相对应的唤醒控制指令，所述唤醒控制指令用于将处于休眠状态的主控芯片唤醒；

和/或；

在所述识别结果表示所述音频特征中包含语音动作命令时，通过所述微处理器输出与所述语音动作命令相对应的动作控制指令，所述动作控制指令用于指示所述主控芯片执行控制动作。

10.根据权利要求6至9中任意一项所述的控制方法，其特征在于，还包括以下步骤：

通过所述音频预处理模块获取所述麦克风接收并传输的第一语音信号，并将从所述第一语音信号提取的第一语音特征传输至所述语音智能识别模块；

若通过所述语音智能识别模块判定所述第一语音特征与预设的声纹设置开启特征相匹配，通过所述音频预处理模块获取所述麦克风接收并传输的第二语音信号，并从所述第二语音信号中提取第二语音特征，通过所述语音智能识别模块将所述第二语音特征作为所述预设声纹；其中，所述第一语音信号和所述第二语音信号是用户根据声纹设置提示分别发出的语音对应的信号；

通过所述音频预处理模块获取所述麦克风接收并传输的第三语音信号，并将从所述第三语音信号提取的第三语音特征传输至所述语音智能识别模块；

若通过所述语音智能识别模块判定所述第三语音特征与预设的命令设置开启特征相匹配，通过所述音频预处理模块获取所述麦克风接收并传输的第四语音信号，并从所述第四语音信号中提取第四语音特征，通过所述语音智能识别模块将所述第四语音特征作为所述语音命令；其中，所述第三语音信号和所述第四语音信号是用户根据命令设置提示分别发出的语音对应的信号。

11.一种基于如权利要求1至5中任意一项所述的无线耳机控制装置的语音控制设置方法，其特征在于，所述输出模块为输入输出模块，所述语音控制设置方法包括以下步骤：

开启语音控制设置功能，并显示声纹参考信息；

接收用户依据所述声纹参考信息发出的语音作为第一语音样本，对所述第一语音样本进行语音格式预处理，获得预设格式的第一语音数据，从所述第一语音数据中提取第一语音特征，将所述第一语音特征通过无线方式发送至所述主控芯片，经所述输入输出模块和所述微处理器传输至所述语音智能识别模块，其中，所述语音智能识别模块将所述第一语音特征作为所述预设声纹；

显示命令参考信息；

接收用户依据所述命令参考信息发出的语音作为第二语音样本，对所述第二语音样本进行语音格式预处理，获得预设格式的第二语音数据，从所述第二语音数据中提取第二语音特征，将所述第二语音特征通过无线方式发送至所述主控芯片，经所述输入输出模块和所述微处理器传输至所述语音智能识别模块，其中，所述语音智能识别模块将所述第二语音特征作为所述语音命令。

12.一种基于如权利要求1至5中任意一项所述的无线耳机控制装置的语音控制设置***，其特征在于，所述输出模块为输入输出模块，所述语音控制设置***包括语音控制指示单元和语音控制录入单元；

所述语音控制指示单元用于开启语音控制设置功能，并显示声纹参考信息；

所述语音控制录入单元用于接收用户依据所述声纹参考信息发出的语音作为第一语音样本，对所述第一语音样本进行语音格式预处理，获得预设格式的第一语音数据，从所述第一语音数据中提取第一语音特征，将所述第一语音特征通过无线方式发送至所述主控芯片，经所述输入输出模块和所述微处理器传输至所述语音智能识别模块，其中，所述语音智能识别模块将所述第一语音特征作为所述预设声纹；

所述语音控制指示单元还用于显示命令参考信息；

所述语音控制录入单元还用于接收用户依据所述命令参考信息发出的语音作为第二语音样本，对所述第二语音样本进行语音格式预处理，获得预设格式的第二语音数据，从所述第二语音数据中提取第二语音特征，将所述第二语音特征通过无线方式发送至所述主控芯片，经所述输入输出模块和所述微处理器传输至所述语音智能识别模块，其中，所述语音智能识别模块将所述第二语音特征作为所述语音命令。