CN105719650A

CN105719650A - 一种语音识别的方法及***

Info

Publication number: CN105719650A
Application number: CN201610065010.2A
Authority: CN
Inventors: 谷树森
Original assignee: Shenzhen Erwu Technology Co Ltd
Current assignee: Shenzhen Erwu Technology Co Ltd
Priority date: 2016-01-30
Filing date: 2016-01-30
Publication date: 2016-06-29

Abstract

本发明公开一种语音识别的方法及***，目的在于解决语音识别***不能大规模应用于智能硬件的不足，其包括以下步骤：获取语音数据；通过命令词识别模块识别所述语音数据，若所述命令词识别模块识别出所述语音数据，则输出所述命令词识别模块识别的语音数据结果；若否，则输入至听写识别模块；通过听写识别模块识别所述输入至听写识别模块的语音数据,并获得最终的语音数据结果。该一种语音识别的方法及***通过在语音输入后首先进行命令词识别，如果命令词识别未识别出再进行听写识别，最后给出识别结果，在一定程度上扩大了语音识别***在智能硬件上应用规模。

Description

一种语音识别的方法及***

技术领域

本发明涉及语音识别领域，特别涉及一种语音识别的方法及***。

背景技术

语音识别技术就是让机器通过识别和理解过程将语音信号转变为相应的文字或命令的技术。目前现有的语音识别***包括听写识别和命令词识别，而这两种技术都存在缺陷。听写识别的不足在于对计算机硬件以及通信网络要求相对较高，响应时间比较长；命令词识别虽然不需要网络但是其识别内容受到限制，无法满足需要大量内容识别的需求，因此，在目前的智能硬件上还无法大规模应用语音识别。

发明内容

为了克服现有技术语音识别***不能大规模应用智能硬件的不足，本发明的目的在于提供一种便于语音识别***大规模应用的语音识别的方法及***。

为解决上述问题，本发明所采用的技术方案如下：提供一种语音识别的方法，包括以下步骤：

S101：获取语音数据；

S102：通过命令词识别模块识别所述语音数据，若所述命令词识别模块识别出所述语音数据，则输出所述命令词识别模块识别的语音数据结果；若否，则输入至听写识别模块；

S103：通过听写识别模块识别所述输入至听写识别模块的语音数据,并获得最终的语音数据结果。

优选地，步骤S102包括以下步骤：

根据命令词构建波纹库；

将获取的语音数据的波纹与波纹库内的波纹进行比对，若有，则输出命令词识别模块识别的语音数据结果；若无，则输入至听写识别模块。

优选地，步骤S103包括以下步骤：

从所述输入至听写识别模块的语音数据中提取特征信息；

利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。

优选地，所述特征信息为MFCC或PLP。

提供一种语音识别的***，其特征在于，包括获取模块、命令词识别模块以及听写识别模块，所述命令词识别模块连接所述获取模块，所述听写识别模块连接所述命令词识别模块；其中，

所述获取模块用于获取语音数据；

所述命令词识别模块用于识别所述语音数据，若所述命令词识别模块识别出所述语音数据，则输出所述命令词识别模块识别的语音数据结果；若否，则输入至所述听写识别模块；

所述听写识别模块用于识别所述命令词识别模块输入的语音数据,并获得最终的语音数据结果。

优选地，所述命令词识别模块包括构建模块和比对模块，所述构建模块用于根据命令词构建波纹库，所述比对模块用于将获取的语音数据的波纹与波纹库内的波纹进行比对，若有，则输出所述命令词识别模块识别的语音数据结果；若否，则输入至听写识别模块。

优选地，所述听写识别模块包括提取模块和模型模块，所述提取模块用于从所述输入至听写识别模块的语音数据中提取特征信息，所述模型模块用于利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。

优选地，所述听写识别模块为HTK语音识别模块。

相比现有技术，本发明的有益效果在于：

该一种语音识别的方法及***通过在语音输入后首先进行命令词识别，如果命令词识别出识别结果则识别完成，如果未识别出识别结果则进行听写识别，最后给出识别结果，使得语音识别技术能够在不需要过高的硬件配置不需要对网络依赖不受识别内容限制的情况下，仍能够拥有较高的识别精度，同时，在一定程度上还扩大了语音识别***在智能硬件上应用规模。

附图说明

图1是本发明实施例一种语音识别的方法的流程图；

图2是本发明实施例一种语音识别的***的模块结构图。

图中标识说明：

1001、获取模块；1002、命令词识别模块；1003、听写识别模块。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细说明。

请参阅图1，图1示出了本发明提供的实施例一种语音识别方法的流程图，该语音识别的方法包括以下步骤：

S101：获取语音数据；

具体地，步骤S102包括以下步骤：

根据命令词构建波纹库；

具体地，步骤S103包括以下步骤：

从所述输入至听写识别模块的语音数据中提取特征信息；

可选地，上述特征信息可以为MFCC(Mel-FrequencyCepstralCoefficients，Mel频率倒谱系数)或PLP(PerceptualLinearPrediction，感知线性预测系数)。

本发明一种提供的实施例一种识别***，其包括获取模块1001、命令词识别模块1002以及听写识别模块1003，所述命令词识别模块1002连接获取模块1001，所述听写识别模块1003连接所述命令词识别模块1002；其中，

所述获取模块1001用于获取语音数据；

所述命令词识别模块1002用于识别所述语音数据，若所述命令词识别模块1002识别出所述语音数据，则输出所述命令词识别模块1002识别的语音数据结果；若否，则输入至所述听写识别模块1003；

所述听写识别模块1003用于识别所述命令词识别模块1002输入的语音数据,并获得最终的语音数据结果。

命令词识别模块1002包括构建模块和比对模块，其中，构建模块用于根据命令词构建波纹库；比对模块用于将获取的语音数据的波纹与波纹库内的波纹进行比对，若有，则输出所述命令词识别模块1002识别的语音数据结果，若无，则输入至听写识别模块1003。

听写识别模块1003包括提取模块和模型模块，其中，提取模块用于从所述输入至听写识别模块1003的语音数据中提取特征信息；模型模块用于利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。

优选地，听写识别模块1003为HTK语音识别模块。

与现有技术相比，本发明具有以下有益效果：

该一种语音识别的方法及***通过在语音输入后首先进行命令词识别，如果命令词识别出结果则识别完成，如果未识别出识别结果则进行听写识别，最后给出识别结果，使得语音识别技术能够在不需要过高的硬件配置不需要对网络依赖不受识别内容限制的情况下，仍能够拥有较高的识别精度，同时，在一定程度上还扩大了语音识别***在智能硬件上应用规模。

上述实施方式仅为本发明的优选实施方式，不能以此来限定本发明保护的范围，本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims

1.一种语音识别的方法，其特征在于，包括以下步骤：

S101：获取语音数据；

2.如权利要求1所述的语音识别的方法，其特征在于，步骤S102包括以下步骤：

根据命令词构建波纹库；

3.如权利要求1所述的语音识别的方法，其特征在于，步骤S103包括以下步骤：

从所述输入至听写识别模块的语音数据中提取特征信息；

4.如权利要求3所述的语音识别的方法，其特征在于，所述特征信息为MFCC或PLP。

5.一种语音识别的***，其特征在于，包括获取模块、命令词识别模块以及听写识别模块，所述命令词识别模块连接所述获取模块，所述听写识别模块连接所述命令词识别模块；其中，

所述获取模块用于获取语音数据；

6.如权利要求5所述的语音识别的***，其特征在于，所述命令词识别模块包括构建模块和比对模块，所述构建模块用于根据命令词构建波纹库，所述比对模块用于将获取的语音数据的波纹与波纹库内的波纹进行比对，若有，则输出所述命令词识别模块识别的语音数据结果；若否，则输入至听写识别模块。

7.如权利要求5所述的语音识别的***，其特征在于，所述听写识别模块包括提取模块和模型模块，所述提取模块用于从所述输入至听写识别模块的语音数据中提取特征信息，所述模型模块用于利用隐马尔可夫模型处理特征信息获得最终的语音数据结果。

8.如权利要求5所述的语音识别的***，其特征在于，所述听写识别模块为HTK语音识别模块。