CN106782550A - 一种基于dsp芯片的自动语音识别*** - Google Patents

一种基于dsp芯片的自动语音识别*** Download PDF

Info

Publication number
CN106782550A
CN106782550A CN201611064684.7A CN201611064684A CN106782550A CN 106782550 A CN106782550 A CN 106782550A CN 201611064684 A CN201611064684 A CN 201611064684A CN 106782550 A CN106782550 A CN 106782550A
Authority
CN
China
Prior art keywords
module
speech recognition
unit
voice signal
pattern matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611064684.7A
Other languages
English (en)
Inventor
田丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang Bayi Agricultural University
Original Assignee
Heilongjiang Bayi Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang Bayi Agricultural University filed Critical Heilongjiang Bayi Agricultural University
Priority to CN201611064684.7A priority Critical patent/CN106782550A/zh
Publication of CN106782550A publication Critical patent/CN106782550A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种基于DSP芯片的自动语音识别***,包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片,所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接,且语音信号特征提取模块和模式匹配模块均与神经网络模块连接。本发明基于语音信号处理、小波以及神经网络理论与方法,研究了语音信号的动态识别,将小波与神经网络理论与方法应用于语音识别,能够自动对语音进行识别,结构简单,使用方便,成本低。

Description

一种基于DSP芯片的自动语音识别***
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于DSP芯片的自动语音识别***。
背景技术
自动语音识别一直是人类追求的理想,也是近50年来科研人员孜孜以求的方向;其最终目标是让机器听懂人类的语言,并执行相应的功能;尽管50年来,人在语音识别领域取得了长足的进展,但我们可以清楚的看到,距离理想的目标还有很大的差距;随着计算机的迅猛发展,日益深入的研究已将语音识别发展成为一门广泛较差的综合学科;它与声学、语言学、心理学、信号处理、人工智能、模式识别、信息论和计算机等诸多学科领域紧密相连;它已在许多领域显示了巨大的应用前景,并且许多高性能的语音识别***也相继问世;同时,通过自然语言的方式使人机交互,具有深远的意义、广泛的应用前景和应用领域;首先,基于模式识别技术的智能语音输入,可以给办公自动化带来革命性的影响;其次,语音识别技术在服务行业领域的广泛应用,将大大减少繁琐而单调的工作,节省大量的人力,提高工作效率;再次,语音识别在危险、恶劣的工作环境及战场上也能体现其强大的优势;因此,语音识别的研究工作对于提高人们生活水平,加强国防建设等各个方面都有着深远的意义。
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于DSP芯片的自动语音识别***。
本发明提出的一种基于DSP芯片的自动语音识别***,包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片,所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接,且语音信号特征提取模块和模式匹配模块均与神经网络模块连接,所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接。
优选地,所述语音信号预处理模块包括预加重单元、加窗单元和端点检测单元,所述预加重单元、加窗单元和端点检测单元依次连接,预加重单元与小波滤波器连接,且端点检测单元与语音信号特征提取模块连接,预加重单元为预加重器。
优选地,所述神经网络模块包括训练单元、建模单元和推断单元,所述训练单元、建模单元和推断单元依次连接,训练单元与语音信号特征提取模块连接,且推断单元与模式匹配模块连接。
优选地,所述小波滤波器用于选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,语音信号预处理模块用于去除非语音段的语音信号,语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用。
本发明中,该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,通过语音信号预处理模块能够去除非语音段的语音信号,通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析,提取出有效的参数序列供神经网络模块和模式匹配模块使用,通过神经网络模块能够总结语音识别的规则,通过模式匹配模块能够将输入的语音信号根据规则进行匹配,达到识别的目的,本发明基于语音信号处理、小波以及神经网络理论与方法,研究了语音信号的动态识别,将小波与神经网络理论与方法应用于语音识别,能够自动对语音进行识别,结构简单,使用方便,成本低。
附图说明
图1为本发明提出的一种基于DSP芯片的自动语音识别***的结构示意图。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
实施例
参考图1,本实施例提出了一种基于DSP芯片的自动语音识别***,包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片,语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接,且语音信号特征提取模块和模式匹配模块均与神经网络模块连接,语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接,该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,通过语音信号预处理模块能够去除非语音段的语音信号,通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析,提取出有效的参数序列供神经网络模块和模式匹配模块使用,通过神经网络模块能够总结语音识别的规则,通过模式匹配模块能够将输入的语音信号根据规则进行匹配,达到识别的目的,本发明基于语音信号处理、小波以及神经网络理论与方法,研究了语音信号的动态识别,将小波与神经网络理论与方法应用于语音识别,能够自动对语音进行识别,结构简单,使用方便,成本低。
本实施例中,语音信号预处理模块包括预加重单元、加窗单元和端点检测单元,预加重单元、加窗单元和端点检测单元依次连接,预加重单元与小波滤波器连接,且端点检测单元与语音信号特征提取模块连接,预加重单元为预加重器,神经网络模块包括训练单元、建模单元和推断单元,训练单元、建模单元和推断单元依次连接,训练单元与语音信号特征提取模块连接,且推断单元与模式匹配模块连接,小波滤波器用于选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,语音信号预处理模块用于去除非语音段的语音信号,语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用,该基于DSP芯片的自动语音识别***通过小波滤波器能够选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,通过语音信号预处理模块能够去除非语音段的语音信号,通过语音信号特征提取模块能够对预处理后的语音信号经过时域和频域分析,提取出有效的参数序列供神经网络模块和模式匹配模块使用,通过神经网络模块能够总结语音识别的规则,通过模式匹配模块能够将输入的语音信号根据规则进行匹配,达到识别的目的,本发明基于语音信号处理、小波以及神经网络理论与方法,研究了语音信号的动态识别,将小波与神经网络理论与方法应用于语音识别,能够自动对语音进行识别,结构简单,使用方便,成本低。
本实施例中,语音信号获取装置获取语音信号,然后传输至小波滤波器,小波滤波器选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,然后将语音信号传输至语音信号预处理模块,预加重单元的作用是将高频提升,以弥补声音在唇部辐射时产生的高频损失;它将数字化的语音信号s(n)通过一个低阶数字***,这个数字***可以是固定的,也可以是缓慢自适应的;预加重器采用应用最广的固定的一阶***,其传递函数如下:
这里预加重的输出s′(n)通过下面的差分方程式与***的输入相关:
加窗单元常用的窗函数有矩形窗,汉明窗及汉宁窗等,在实际的应用中由于汉明窗的频率特性更加适合语音信号的分析,所以本***采用汉明窗对信号进行加权,汉明窗的函数公式如下:
其频率特性为:
端点检测单元:对采录的数秒语音必须作端点检测以区分有声段和无声段,能够实现端点判决的依据在于不同性质的语音的各种短时参数具有不同的概率密度函数以及相邻的若干帧语音应具有一致的语音特性;接着语音信号预处理模块将预处理后的语音信号传输至语音信号特征提取模块,语音信号特征提取模块通过线性预测系数和线性预测倒谱系数进行特征提取,线性预测系数是语音的线性预测,其基本思想是:语音信号的每个取样值,可以用它过去的若干个取样值的加权和线性组合来表示;各加权系数的确定原则是使预测误差的均方值最小。
如果利用过去p个取样值来进行预测,称为p阶线性预测;如果用过去p个取样值{x(n-1),x(n-2),…,x(n-p)}的加权来预测信号当前取样值,x(n)则预测值有:
其中,加权系数用-apl表示,称为预测系数;预测误差为:
要使预测系数最佳,即使
ε=E[e2(n)]=min
预测系数可由Durbin递推算法解得,具体步骤如下:迭代计算从零阶即从p=0开始;零阶预测不做预测,这时预测多项式为
A0(z)=1
预测误差为
e0(n)=x(n)
预测误差功率为
这是迭代计算的初始条件;迭代步骤如下:
①初始化
②假设已知p阶预测器的参数,即已知AP(z)和εp
③计算p+1阶预测器的反射系数:
④计算p+1阶预测器的预测系数:
对应的p+1阶预测器的预测多项式为:
Ap+1(z)=Ap(z)-γp+1z-(p+1)Ap(z-1)
⑤计算p+1阶预测误差功率:
⑥返回第②步。
计算结束后,得到以下三类结果:各阶预测器的预测系数;各阶预测器的反射系数;各阶预测误差功率。
线性预测倒谱系数:由于语音信号具有短时平稳性,因此语音特性还可用短时谱表示,倒谱是常用的一种;倒谱是信号经过傅立叶变换所得功率谱取对数后的逆傅立叶变换;它可将周期脉冲与声道相分离,即得到声道参数;倒谱系数可由倒谱的定义直接求得,也可由LPC系数递推得到;与直接计算倒谱系数相比,LPCCEP的计算量药效,故本***使用LPC倒谱系数;基于LPC分析的倒谱存在一种非常简单有效的递推算法:
式中,Cm为倒谱系数,ap为预测系数,m为倒谱系数的阶数(m=1-Q),p为预测系数的阶数;提取的语音信号特征传输至神经网络模块进行语音识别规律总结,同时提取的语音信号特征传输至模式匹配模块,模式匹配模块根据神经网络模块总结的语音识别规律对输入的语音信号进行匹配识别。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于DSP芯片的自动语音识别***,包括语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块、语音识别输出模块和DSP芯片,其特征在于,所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、模式匹配模块和语音识别输出模块依次连接,且语音信号特征提取模块和模式匹配模块均与神经网络模块连接,所述语音信号获取装置、小波滤波器、语音信号预处理模块、语音信号特征提取模块、神经网络模块、模式匹配模块和语音识别输出模块均与DSP芯片连接。
2.根据权利要求1所述的一种基于DSP芯片的自动语音识别***,其特征在于,所述语音信号预处理模块包括预加重单元、加窗单元和端点检测单元,所述预加重单元、加窗单元和端点检测单元依次连接,预加重单元与小波滤波器连接,且端点检测单元与语音信号特征提取模块连接,预加重单元为预加重器。
3.根据权利要求1所述的一种基于DSP芯片的自动语音识别***,其特征在于,所述神经网络模块包括训练单元、建模单元和推断单元,所述训练单元、建模单元和推断单元依次连接,训练单元与语音信号特征提取模块连接,且推断单元与模式匹配模块连接。
4.根据权利要求1所述的一种基于DSP芯片的自动语音识别***,其特征在于,所述小波滤波器用于选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰,语音信号预处理模块用于去除非语音段的语音信号,语音信号特征提取模块用于将预处理后的语音信号提取出有效的参数序列供神经网络模块和模式匹配模块使用。
CN201611064684.7A 2016-11-28 2016-11-28 一种基于dsp芯片的自动语音识别*** Pending CN106782550A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611064684.7A CN106782550A (zh) 2016-11-28 2016-11-28 一种基于dsp芯片的自动语音识别***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611064684.7A CN106782550A (zh) 2016-11-28 2016-11-28 一种基于dsp芯片的自动语音识别***

Publications (1)

Publication Number Publication Date
CN106782550A true CN106782550A (zh) 2017-05-31

Family

ID=58902279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611064684.7A Pending CN106782550A (zh) 2016-11-28 2016-11-28 一种基于dsp芯片的自动语音识别***

Country Status (1)

Country Link
CN (1) CN106782550A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108601180A (zh) * 2018-06-04 2018-09-28 长江大学 基于声纹识别技术的电灯声控开关、控制***及方法
CN110047480A (zh) * 2019-04-22 2019-07-23 哈尔滨理工大学 用于社区医院科室查询的辅助管理机器人头部装置及控制

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别***及其识别方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别***
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别***及其识别方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别***
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别***

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
关胜平: ""基于TMS320VC5509A的语音识别与控制***"", 《电子技术应用》 *
曹斌芳: ""一种采用小波变换的实时语音识别***设计"", 《INTERNATIONAL CONFERENCE ON POWER ELECTRONICS & INTELLIGENT TRANSPORTATION SYSTEM》 *
李子琳: ""语音信号识别技术及应用研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
李记昌: ""基于DSP的语音处理及识别算法研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
田丽: ""小波预处理在语音识别***中的应用"", 《科技创新导报》 *
闫文娟: ""基于TMS320C5409的语音识别***"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108601180A (zh) * 2018-06-04 2018-09-28 长江大学 基于声纹识别技术的电灯声控开关、控制***及方法
CN110047480A (zh) * 2019-04-22 2019-07-23 哈尔滨理工大学 用于社区医院科室查询的辅助管理机器人头部装置及控制

Similar Documents

Publication Publication Date Title
EP2695160B1 (en) Speech syllable/vowel/phone boundary detection using auditory attention cues
CN104008751A (zh) 一种基于bp神经网络的说话人识别方法
CN103117059A (zh) 一种基于张量分解的语音信号特征提取方法
CN109192200B (zh) 一种语音识别方法
CN113012720B (zh) 谱减法降噪下多语音特征融合的抑郁症检测方法
Ganapathy et al. Feature extraction using 2-d autoregressive models for speaker recognition.
Chaudhary et al. Gender identification based on voice signal characteristics
CN113077806B (zh) 音频处理方法及装置、模型训练方法及装置、介质和设备
CN112786059A (zh) 一种基于人工智能的声纹特征提取方法及装置
Mistry et al. Overview: Speech recognition technology, mel-frequency cepstral coefficients (mfcc), artificial neural network (ann)
CN110136726A (zh) 一种语音性别的估计方法、装置、***及存储介质
CN115510909A (zh) 一种dbscan进行异常声音特征的无监督算法
Labied et al. An overview of automatic speech recognition preprocessing techniques
CN112183582A (zh) 一种多特征融合的水下目标识别方法
Labied et al. Automatic speech recognition features extraction techniques: A multi-criteria comparison
Mu et al. Voice activity detection optimized by adaptive attention span transformer
CN106782550A (zh) 一种基于dsp芯片的自动语音识别***
CN112634880A (zh) 话者识别的方法、装置、设备、存储介质以及程序产品
Sundar et al. A mixture model approach for formant tracking and the robustness of student's-t distribution
CN114913859B (zh) 声纹识别方法、装置、电子设备和存储介质
Liu et al. Pitch-synchronous linear prediction analysis of high-pitched speech using weighted short-time energy function
Chazan et al. Efficient periodicity extraction based on sine-wave representation and its application to pitch determination of speech signals.
KR20180101057A (ko) 잡음에 강인한 음성 구간 검출 방법 및 장치
CN114550696A (zh) 一种通过语音识别实现情绪判断的方法和***
CN113742515A (zh) 一种音频分类方法及***及设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication