CN108022593A

CN108022593A - 一种高灵敏度语音识别***及其控制方法

Info

Publication number: CN108022593A
Application number: CN201810038698.4A
Authority: CN
Inventors: 张波
Original assignee: Chengdu Fu Lante Electronic Technology Ltd Co
Current assignee: Chengdu Fu Lante Electronic Technology Ltd Co
Priority date: 2018-01-16
Filing date: 2018-01-16
Publication date: 2018-05-11

Abstract

本发明公开了一种高灵敏度语音识别***及其控制方法，包括步骤：采集语音信号，并对语音信号进行预处理，获得预处理语音信号；将所述预处理语音信号进行多级词条分解，建立音频帧矩阵；根据所述音频帧矩阵在所述云端语音数据库中调取相应的语音识别模型匹配出相应的语音元素，获得语音识别数据；将语音识别数据进行多级词条组合，获得语音数据；语音数据通过转换和分配后，通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。本发明实现语音识别、语音合成和语音传输等功能一体化服务，能够支持多级词条识别功能，具备自动选择和切换功能；具有较高的识别精度和识别效率；使用范围广，能够与云端进行通讯。

Description

一种高灵敏度语音识别***及其控制方法

技术领域

本发明属于语音识别技术领域，特别是涉及一种高灵敏度语音识别***及其控制方法。

背景技术

语音识别技术主要是能够使人和计算机进行交流，将人类的语言转换成计算机能够识别的语言，从而实现人类语音控制计算机等应用功能，语音识别技术在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域都能够得到广泛的运用。

现有的语音识别***还有许多无法解决的问题，例如：无法同时具备语音识别、语音合成和语音传输等功能，不能支持多级词条识别；识别精度差，且识别效率低；通用性能差，且使用范围具有局限性。

发明内容

为了解决上述问题，本发明提出了一种高灵敏度语音识别***及其控制方法，能够实现语音识别、语音合成和语音传输等功能一体化服务，能够支持多级词条识别功能，具备自动选择和切换功能；具有较高的识别精度和识别效率；使用范围广，能够与云端进行通讯。

为达到上述目的，本发明采用的技术方案是：一种高灵敏度语音识别***及其控制方法：

所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路，所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连，所述语音识别电路和语音发送电路均连接至无线通信电路，所述无线通信电路与语音处理电路相互连接，所述语音发送电路上还连接有本地接口，所述语音处理电路还连接至语音采集电路；所述无线通信电路与云端无线连接，所述云端中包括语音数据库，所述无线通信电路还与外部语音接收客户端无线连接，所述本地接口与本地设备相连接；

预先通过人工神经网络算法学习训练建立语音识别模型，并将语音识别模型存储在云端的语音数据库中；所述高灵敏度语音识别***的控制方法，包括步骤：

S100，采集语音信号，并对语音信号进行预处理，获得预处理语音信号；

S200，将所述预处理语音信号进行多级词条分解，建立音频帧矩阵；

S300，根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的语音识别模型；

S400，根据所述音频帧矩阵在语音识别模型中匹配相应的语音元素，获得语音识别数据；

S500，将语音识别数据在语音处理电路中进行多级词条组合，获得语音数据；

S600，语音数据通过语音发送电路信号转换和分配后，通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。

进一步的是，所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元，所述接收接口、接收天线与麦芯并列连接至切换单元，所述切换单元连接至去噪单元，所述去噪单元连接至放大单元；通过接收接口接收本地语音信号，通过接收天线接收无线语音信号，通过麦芯接收实时语音信号；从而实现多端口接入和选择，提高***通用性。

进一步的是，实现多端口自动接入和选择，所述步骤S100中通过语音采集电路采集语音信号，并对语音信号进行预处理，获得预处理语音信号，包括步骤：

S101，初始化设置语音采集电路；

S102，检测接收接口是否有语音信号或是否有语音处理电路发出的接口接收指令，若有则控制切换单元连通接收接口和去噪单元，由接收接口接收语音信号，并跳转至步骤105；若否则进行下一步；

S103，检测接收天线是否有语音信号或是否有语音处理电路发出的天线接收指令，若有则控制切换单元连通接收天线和去噪单元，由接收天线接收语音信号，并跳转至步骤105；若否则进行下一步；

S104，检测麦芯是否有语音信号或是否有语音处理电路发出的麦芯接收指令，若有则控制切换单元连通麦芯和去噪单元，由麦芯接收语音信号，并跳转至步骤105；若否则循环步骤S102-S104；

S105，所述语音信号通过去噪单元进行去噪处理，然后通过放大单元进行放大处理，得到预处理语音信号；

其中，由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。

进一步的是，为了实现多级词条识别，提高识别精度，所述步骤S200中，将所述预处理语音信号进行多级词条分解，建立音频帧矩阵，包括步骤：

S201预处理语音信号，根据语音信号的音频帧依次进行分段处理、分句处理和分字处理，得到基于字段的音频帧数据；

S202利用所获得的音频帧数据建立音频帧矩阵。

进一步的是，为了提高识别精度和识别效率，步骤S300中，根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型，包括步骤：

S301在音频帧矩阵中提取特征值；

S302利用特征值在所述云端语音数据库中调取相应的识别语音识别模型。

进一步的是，步骤S400中，在语音识别模型中匹配相应的语音元素，获得语音识别数据，包括步骤：

S401计算音频帧矩阵的特征值和特征矩阵；

S402通过所述特征矩阵，在语音识别模型中匹配相应的文本元素；

S403将匹配通过的文本元素进行组合形成匹配矩阵，所述匹配矩阵即语音识别数据。

进一步的是，实现多级词条组合，将获取的零碎文本数据，进行语句和段落的整合，步骤S500中，将语音识别数据在语音处理电路中进行多级词条组合，获得语音数据；

S501，将多组语音识别数据，进行词语组合；

S502，将组合的词语，根据语法进行语句整合；

S502，将整合的语句进行集成获得语音数据。

进一步的是，为实现多端口多制式的切换和转换，增强***的通用性；所述语音发送电路包括相互连接的信号转换器和发送切换电路，通过信号转换器转换语音数据的制式，通过发送切换电路切换语音数据的分配方式。

进一步的是，步骤S600中，将语音数据通过语音发送电路进行数据转换和分配，包括步骤：

S601，通过语音处理电路的转换指令，选择语音发送电路的信号转换模式，确定语音数据的制式，并进行制式转换；

S602，通过语音处理电路的分配指令，选择语音发送电路的信号分配方式；若分配方式为本地方式，将语音数据通过本地接口传输给本地设备；若分配方式为远程方式，将语音数据通过无线通信电路传输给外部语音接收客户端或云端服务器；

进一步的是，所述语音识别电路为语音识别芯片，所述无线通信电路为3G4G电路或Wi-Fi电路，所述本地接口为USB接口、串行接口、并行接口或蓝牙模块，所述语音处理电路为嵌入式微处理器。

采用本技术方案的有益效果：

本发明具备语音识别、语音合成和语音传输等功能，支持多级词条识别，具备自动选择和切换功能，通用性能较高；

本发明通过建立人工神经网络模型，能够有效提高识别精度，提高识别效率，在混合语言环境下具有较高的识别率；

本发明扩大使用范围，具有云端语音识别平台具备开放接口，能够通过云端实现对语音识别***的调整和数据传输。

附图说明

图1为本发明实施例一中的一种高灵敏度语音识别***的结构示意图；

图2为本发明实施例一中的一种高灵敏度语音识别***的控制方法流程图；

图3为本发明实施例二中语音采集电路的结构示意图；

图4为本发明实施例二中步骤S100的流程图；

图5为本发明实施例三中语音发送电路的结构示意图；

图6为本发明实施例三中步骤S600的流程图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步阐述。

在本实施例一中，参见图1所示，本发明提出了一种高灵敏度语音识别***及其控制方法。

其中，所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路，所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连，所述语音识别电路和语音发送电路均连接至无线通信电路，所述无线通信电路与语音处理电路相互连接，所述语音发送电路上还连接有本地接口，所述语音处理电路还连接至语音采集电路；所述无线通信电路与云端无线连接，所述云端中包括语音数据库，所述无线通信电路还与外部语音接收客户端无线连接，所述本地接口与本地设备相连接。

其中，预先通过人工神经网络算法学习训练建立语音识别模型，并将语音识别模型存储在云端的语音数据库中；所述高灵敏度语音识别***的控制方法，如图2所示，包括步骤：

在实施例二中，在实施例一的基础上，如图3所示，所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元，所述接收接口、接收天线与麦芯并列连接至切换单元，所述切换单元连接至去噪单元，所述去噪单元连接至放大单元；通过接收接口接收本地语音信号，通过接收天线接收无线语音信号，通过麦芯接收实时语音信号；从而实现多端口接入和选择，提高***通用性。

其中，实现多端口自动接入和选择，所述步骤S100中通过语音采集电路采集语音信号，并对语音信号进行预处理，获得预处理语音信号，如图4所示，包括步骤：

S101，初始化设置语音采集电路；

其中，为了实现多级词条识别，提高识别精度，所述步骤S200中，将所述预处理语音信号进行多级词条分解，建立音频帧矩阵，包括步骤：

S202利用所获得的音频帧数据建立音频帧矩阵。

其中，为了提高识别精度和识别效率，步骤S300中，根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型，包括步骤：

S301在音频帧矩阵中提取特征值；

其中，步骤S400中，在语音识别模型中匹配相应的语音元素，获得语音识别数据，包括步骤：

S401计算音频帧矩阵的特征值和特征矩阵；

其中，实现多级词条组合，将获取的零碎文本数据，进行语句和段落的整合，步骤S500中，将语音识别数据在语音处理电路中进行多级词条组合，获得语音数据；

S501，将多组语音识别数据，进行词语组合；

S502，将组合的词语，根据语法进行语句整合；

S502，将整合的语句进行集成获得语音数据。

在实施例三中，在实施例二的基础上，如图5所示，为实现多端口多制式的切换和转换，增强***的通用性；所述语音发送电路包括相互连接的信号转换器和发送切换电路，通过信号转换器转换语音数据的制式，通过发送切换电路切换语音数据的分配方式。

其中，所述步骤S600中，如图6所示，将语音数据通过语音发送电路进行数据转换和分配，包括步骤：

作为上述实施例的优化方案，所述语音识别电路为语音识别芯片，所述无线通信电路为3G4G电路或Wi-Fi电路，所述本地接口为USB接口、串行接口、并行接口或蓝牙模块，所述语音处理电路为嵌入式微处理器。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种高灵敏度语音识别***及其控制方法，其特征在于，所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路，所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连，所述语音识别电路和语音发送电路均连接至无线通信电路，所述无线通信电路与语音处理电路相互连接，所述语音发送电路上还连接有本地接口，所述语音处理电路还连接至语音采集电路；所述无线通信电路与云端无线连接，所述云端中包括语音数据库，所述无线通信电路还与外部语音接收客户端无线连接，所述本地接口与本地设备相连接；

2.根据权利要求1所述的一种高灵敏度语音识别***及其控制方法，其特征在于，所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元，所述接收接口、接收天线与麦芯并列连接至切换单元，所述切换单元连接至去噪单元，所述去噪单元连接至放大单元；通过接收接口接收本地语音信号，通过接收天线接收无线语音信号，通过麦芯接收实时语音信号。

3.根据权利要求2所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S100中通过语音采集电路采集语音信号，并对语音信号进行预处理，获得预处理语音信号，包括步骤：

S101，初始化设置语音采集电路；

4.根据权利要求3所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S200中，将所述预处理语音信号进行多级词条分解，建立音频帧矩阵，包括步骤：

S201将预处理语音信号根据语音信号的音频帧依次进行分段处理、分句处理和分字处理，得到基于字段的音频帧数据；

S202利用所获得的音频帧数据建立音频帧矩阵。

5.根据权利要求4所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S300中，根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型，包括步骤：

S301在音频帧矩阵中提取特征值；

6.根据权利要求5所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S400中，在语音识别模型中匹配相应的语音元素，获得语音识别数据，包括步骤：

S401计算音频帧矩阵的特征值和特征矩阵；

7.根据权利要求6所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S500中，将语音识别数据在语音处理电路中进行多级词条组合，获得语音数据；

S501，将多组语音识别数据，进行词语组合；

S502，将组合的词语，根据语法进行语句整合；

S502，将整合的语句，进行集成获得语音数据。

8.根据权利要求7所述的一种高灵敏度语音识别***及其控制方法，其特征在于，所述语音发送电路包括相互连接的信号转换器和发送切换电路，通过信号转换器转换语音数据的制式，通过发送切换电路切换语音数据的分配方式。

9.根据权利要求8所述的一种高灵敏度语音识别***及其控制方法，其特征在于，步骤S600中，将语音数据通过语音发送电路进行数据转换和分配，包括步骤：

10.根据权利要求1-9中任意一项所述的一种高灵敏度语音识别***及其控制方法，其特征在于，所述语音识别电路为语音识别芯片，所述无线通信电路为3G4G电路或Wi-Fi电路，所述本地接口为USB接口、串行接口、并行接口或蓝牙模块，所述语音处理电路为嵌入式微处理器。