CN106782550A

CN106782550A - 一种基于dsp芯片的自动语音识别***

Info

Publication number: CN106782550A
Application number: CN201611064684.7A
Authority: CN
Inventors: 田丽
Original assignee: Heilongjiang Bayi Agricultural University
Current assignee: Heilongjiang Bayi Agricultural University
Priority date: 2016-11-28
Filing date: 2016-11-28
Publication date: 2017-05-31

Abstract

本发明公开了一种基于DSP芯片的自动语音识别***，包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片，所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接，且语音信号特征提取模块和模式匹配模块均与神经网络模块连接。本发明基于语音信号处理、小波以及神经网络理论与方法，研究了语音信号的动态识别，将小波与神经网络理论与方法应用于语音识别，能够自动对语音进行识别，结构简单，使用方便，成本低。

Description

一种基于DSP芯片的自动语音识别***

技术领域

本发明涉及语音识别技术领域，尤其涉及一种基于DSP芯片的自动语音识别***。

背景技术

自动语音识别一直是人类追求的理想，也是近50年来科研人员孜孜以求的方向；其最终目标是让机器听懂人类的语言，并执行相应的功能；尽管50年来，人在语音识别领域取得了长足的进展，但我们可以清楚的看到，距离理想的目标还有很大的差距；随着计算机的迅猛发展，日益深入的研究已将语音识别发展成为一门广泛较差的综合学科；它与声学、语言学、心理学、信号处理、人工智能、模式识别、信息论和计算机等诸多学科领域紧密相连；它已在许多领域显示了巨大的应用前景，并且许多高性能的语音识别***也相继问世；同时，通过自然语言的方式使人机交互，具有深远的意义、广泛的应用前景和应用领域；首先，基于模式识别技术的智能语音输入，可以给办公自动化带来革命性的影响；其次，语音识别技术在服务行业领域的广泛应用，将大大减少繁琐而单调的工作，节省大量的人力，提高工作效率；再次，语音识别在危险、恶劣的工作环境及战场上也能体现其强大的优势；因此，语音识别的研究工作对于提高人们生活水平，加强国防建设等各个方面都有着深远的意义。

发明内容

基于背景技术存在的技术问题，本发明提出了一种基于DSP芯片的自动语音识别***。

本发明提出的一种基于DSP芯片的自动语音识别***，包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片，所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接，且语音信号特征提取模块和模式匹配模块均与神经网络模块连接，所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接。

优选地，所述语音信号预处理模块包括预加重单元、加窗单元和端点检测单元，所述预加重单元、加窗单元和端点检测单元依次连接，预加重单元与小波滤波器连接，且端点检测单元与语音信号特征提取模块连接，预加重单元为预加重器。

优选地，所述神经网络模块包括训练单元、建模单元和推断单元，所述训练单元、建模单元和推断单元依次连接，训练单元与语音信号特征提取模块连接，且推断单元与模式匹配模块连接。

优选地，所述小波滤波器用于选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，语音信号预处理模块用于去除非语音段的语音信号，语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用。

本发明中，该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，通过语音信号预处理模块能够去除非语音段的语音信号，通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析，提取出有效的参数序列供神经网络模块和模式匹配模块使用，通过神经网络模块能够总结语音识别的规则，通过模式匹配模块能够将输入的语音信号根据规则进行匹配，达到识别的目的，本发明基于语音信号处理、小波以及神经网络理论与方法，研究了语音信号的动态识别，将小波与神经网络理论与方法应用于语音识别，能够自动对语音进行识别，结构简单，使用方便，成本低。

附图说明

图1为本发明提出的一种基于DSP芯片的自动语音识别***的结构示意图。

具体实施方式

下面结合具体实施例对本发明作进一步解说。

实施例

参考图1，本实施例提出了一种基于DSP芯片的自动语音识别***，包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片，语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接，且语音信号特征提取模块和模式匹配模块均与神经网络模块连接，语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接，该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，通过语音信号预处理模块能够去除非语音段的语音信号，通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析，提取出有效的参数序列供神经网络模块和模式匹配模块使用，通过神经网络模块能够总结语音识别的规则，通过模式匹配模块能够将输入的语音信号根据规则进行匹配，达到识别的目的，本发明基于语音信号处理、小波以及神经网络理论与方法，研究了语音信号的动态识别，将小波与神经网络理论与方法应用于语音识别，能够自动对语音进行识别，结构简单，使用方便，成本低。

本实施例中，语音信号预处理模块包括预加重单元、加窗单元和端点检测单元，预加重单元、加窗单元和端点检测单元依次连接，预加重单元与小波滤波器连接，且端点检测单元与语音信号特征提取模块连接，预加重单元为预加重器，神经网络模块包括训练单元、建模单元和推断单元，训练单元、建模单元和推断单元依次连接，训练单元与语音信号特征提取模块连接，且推断单元与模式匹配模块连接，小波滤波器用于选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，语音信号预处理模块用于去除非语音段的语音信号，语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用，该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，通过语音信号预处理模块能够去除非语音段的语音信号，通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析，提取出有效的参数序列供神经网络模块和模式匹配模块使用，通过神经网络模块能够总结语音识别的规则，通过模式匹配模块能够将输入的语音信号根据规则进行匹配，达到识别的目的，本发明基于语音信号处理、小波以及神经网络理论与方法，研究了语音信号的动态识别，将小波与神经网络理论与方法应用于语音识别，能够自动对语音进行识别，结构简单，使用方便，成本低。

本实施例中，语音信号获取装置获取语音信号，然后传输至小波滤波器，小波滤波器选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，然后将语音信号传输至语音信号预处理模块，预加重单元的作用是将高频提升，以弥补声音在唇部辐射时产生的高频损失；它将数字化的语音信号s(n)通过一个低阶数字***，这个数字***可以是固定的，也可以是缓慢自适应的；预加重器采用应用最广的固定的一阶***，其传递函数如下：

这里预加重的输出s′(n)通过下面的差分方程式与***的输入相关：

加窗单元常用的窗函数有矩形窗，汉明窗及汉宁窗等，在实际的应用中由于汉明窗的频率特性更加适合语音信号的分析，所以本***采用汉明窗对信号进行加权，汉明窗的函数公式如下：

其频率特性为：

端点检测单元：对采录的数秒语音必须作端点检测以区分有声段和无声段，能够实现端点判决的依据在于不同性质的语音的各种短时参数具有不同的概率密度函数以及相邻的若干帧语音应具有一致的语音特性；接着语音信号预处理模块将预处理后的语音信号传输至语音信号特征提取模块，语音信号特征提取模块通过线性预测系数和线性预测倒谱系数进行特征提取，线性预测系数是语音的线性预测，其基本思想是：语音信号的每个取样值，可以用它过去的若干个取样值的加权和线性组合来表示；各加权系数的确定原则是使预测误差的均方值最小。

如果利用过去p个取样值来进行预测，称为p阶线性预测；如果用过去p个取样值{x(n-1),x(n-2),…,x(n-p)}的加权来预测信号当前取样值，x(n)则预测值有：

其中，加权系数用-a_pl表示，称为预测系数；预测误差为：

要使预测系数最佳，即使

ε＝E[e²(n)]＝min

预测系数可由Durbin递推算法解得，具体步骤如下：迭代计算从零阶即从p＝0开始；零阶预测不做预测，这时预测多项式为

A₀(z)＝1

预测误差为

e₀(n)＝x(n)

预测误差功率为

这是迭代计算的初始条件；迭代步骤如下：

①初始化

②假设已知p阶预测器的参数,即已知A_P(z)和ε_p；

③计算p+1阶预测器的反射系数：

④计算p+1阶预测器的预测系数：

对应的p+1阶预测器的预测多项式为：

A_p+1(z)＝A_p(z)-γ_p+1z^-(p+1)A_p(z^-1)

⑤计算p+1阶预测误差功率：

⑥返回第②步。

计算结束后，得到以下三类结果：各阶预测器的预测系数；各阶预测器的反射系数；各阶预测误差功率。

线性预测倒谱系数：由于语音信号具有短时平稳性，因此语音特性还可用短时谱表示，倒谱是常用的一种；倒谱是信号经过傅立叶变换所得功率谱取对数后的逆傅立叶变换；它可将周期脉冲与声道相分离，即得到声道参数；倒谱系数可由倒谱的定义直接求得，也可由LPC系数递推得到；与直接计算倒谱系数相比，LPCCEP的计算量药效，故本***使用LPC倒谱系数；基于LPC分析的倒谱存在一种非常简单有效的递推算法：

式中，C_m为倒谱系数，a_p为预测系数，m为倒谱系数的阶数(m＝1-Q)，p为预测系数的阶数；提取的语音信号特征传输至神经网络模块进行语音识别规律总结，同时提取的语音信号特征传输至模式匹配模块，模式匹配模块根据神经网络模块总结的语音识别规律对输入的语音信号进行匹配识别。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于DSP芯片的自动语音识别***，包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片，其特征在于，所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接，且语音信号特征提取模块和模式匹配模块均与神经网络模块连接，所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接。

2.根据权利要求1所述的一种基于DSP芯片的自动语音识别***，其特征在于，所述语音信号预处理模块包括预加重单元、加窗单元和端点检测单元，所述预加重单元、加窗单元和端点检测单元依次连接，预加重单元与小波滤波器连接，且端点检测单元与语音信号特征提取模块连接，预加重单元为预加重器。

3.根据权利要求1所述的一种基于DSP芯片的自动语音识别***，其特征在于，所述神经网络模块包括训练单元、建模单元和推断单元，所述训练单元、建模单元和推断单元依次连接，训练单元与语音信号特征提取模块连接，且推断单元与模式匹配模块连接。

4.根据权利要求1所述的一种基于DSP芯片的自动语音识别***，其特征在于，所述小波滤波器用于选取语音信号的有用信息，并且抑制无关信息对识别所产生的干扰，语音信号预处理模块用于去除非语音段的语音信号，语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用。