CN208538474U - 语音识别*** - Google Patents

语音识别*** Download PDF

Info

Publication number
CN208538474U
CN208538474U CN201820743323.3U CN201820743323U CN208538474U CN 208538474 U CN208538474 U CN 208538474U CN 201820743323 U CN201820743323 U CN 201820743323U CN 208538474 U CN208538474 U CN 208538474U
Authority
CN
China
Prior art keywords
capacitor
analog
digital converter
pin
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn - After Issue
Application number
CN201820743323.3U
Other languages
English (en)
Inventor
张治宇
钟景维
石庆
马保军
郑科
张龙
程文辉
韦振剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN YIDAO DIGITAL TECHNOLOGY CO LTD
Original Assignee
SHENZHEN YIDAO DIGITAL TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN YIDAO DIGITAL TECHNOLOGY CO LTD filed Critical SHENZHEN YIDAO DIGITAL TECHNOLOGY CO LTD
Priority to CN201820743323.3U priority Critical patent/CN208538474U/zh
Application granted granted Critical
Publication of CN208538474U publication Critical patent/CN208538474U/zh
Withdrawn - After Issue legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本实用新型涉及一种语音识别***,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。本实用新型采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。

Description

语音识别***
技术领域
本实用新型涉及语音识别技术领域,尤其涉及一种语音识别***。
背景技术
语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。 ASR技术在“能听会说”的智能计算机***中扮演着重要角色,相当于给计算机***安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术已在工业、家电、通信、汽车电子、医疗、家庭服务、消费类电子等各个领域上应用。曾经语音识别听写机在一些领域的应用,被美国新闻界评为计算机发展十件大事之一。
随着语音识别产品逐渐增加,许多语音识别和人机交互产品进入人们的生活需求,对语音识别技术质量要求越来越高。
现有多数方案采用双麦克风拾音或者6个麦克风阵列做语音识别。对于双麦克风,只能单纯软件上做算法降噪,同时并不能识别是本机中播放的音频,还是环境中噪音;对于语音识别误判或直接语意是不能识别的,或者译错语意,特别是当播放声音较大时,或说话者距离机器较远时特别明显。而采用6 个麦克风阵列的产品,占比空间大,产品外观要做很大,软件算法需要处理6 个麦克风的数据,耗CPU资源较大,对CPU性能要求很高,整体设计方案成本过高,普通消费类产品难以实现。
实用新型内容
本实用新型的主要目的在于提出一种语音识别***,旨在降低成本,提高语音识别准确率。
为实现上述目的,本实用新型提出一种语音识别***,该***包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;
所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风 U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本实用新型的进一步的技术方案是,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容 C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4 的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3 的另一端、所述电容C4的另一端接地;
所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
本实用新型的进一步的技术方案是,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容 C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚 21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容 C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
本实用新型的进一步的技术方案是,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容 C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
本实用新型的进一步的技术方案是,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容 C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27 脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
本实用新型的进一步的技术方案是,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18 的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28 的另一端接地。
本实用新型的进一步的技术方案是,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容 C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
本实用新型的进一步的技术方案是,所述模数转换器的引脚6和引脚14 接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
本实用新型的进一步的技术方案是,所述模数转换器采用IC85L40转换器。
本实用新型的有益效果是:本实用新型语音识别***通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
附图说明
图1是本实用新型语音识别***较佳实施例的结构示意图;
图2是本实用新型语音识别***较佳实施例中模数转换器的电路结构示意图;
图3是本实用新型语音识别***较佳实施例中第一供电电源滤波电路示意图;
图4是本实用新型语音识别***较佳实施例中第二供电电源滤波电路示意图;
图5是本实用新型语音识别***较佳实施例中BIAS1滤波电路示意图;
图6是本实用新型语音识别***较佳实施例中第一通道ADC MIC语音识别电路示意图;
图7是本实用新型语音识别***较佳实施例中第二通道ADC MIC语音识别电路示意图;
图8是本实用新型语音识别***较佳实施例中BIAS2滤波电路示意图;
图9是本实用新型语音识别***较佳实施例中第三通道ADC MIC语音识别电路示意图;
图10是本实用新型语音识别***较佳实施例中第四通道ADC MIC语音识别电路示意图;
图11是本实用新型语音识别***较佳实施例中基准电压滤波电路示意图。
本实用新型目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅是本实用新型一部分实施例,并不用于限定本实用新型。基于本实用新型中的实施例,未经创造性设计而所衍生的所有其他实施例,都属于本实用新型保护的范围。
请参照图1,图1是本实用新型语音识别***较佳实施例的结构示意图。
如图1所示,本实施例提出的语音识别***包括服务云端、主控制器、模数转换器ADC、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。
本实施例中,所述模数转换器可以采用IC85L40转换器。
可以理解的是,本实施例中,所述声音定位模块利用三个麦克风同时拾音,利用声达时间差(TDOA)的定位技术,先行进行声达时间差估计,并从中最先拾到声音信号的麦克风到最后获取麦克风阵列中阵之间的声延迟 (TDOA);再利用获取的声达时间差,确定声音来源的方向。
所述声源增强模块采用三个呈等边形布置的麦克风形成三个拾音波束,各自对应120°范围。当通过唤醒确定声源角度(算法内部自动确定声源方向的一个拾音波束进行拾音)或指定一个拾音波束进行拾音时,阵列算法会增强波束范围内的声音,削弱波束外的声音,以增强录音信噪比。如指定波束1进行拾音,由于每个波束的范围为120°,所以60°~180°范围内录音得到增强,波束1范围外的声音会被减弱。
所述回声消除模块,回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω进行参数辨识,根据扬声器PA信号与产生的多路回声的相关性为基础,建立远端信号模型,模拟回声路径,通过自适应算法调整,使其冲击响应和真实回声路径相逼近。然后将麦克风接收到的信号减去估计值,即可实现回声消除功能。
所述噪音抑制模块的核心是语音增强,语音增强的主要目标是从受噪声干扰的语音信号中提取尽可能纯净的原始语音,通过带噪语音进行处理,消除背景噪声改善语音质量,提高语音清晰度和可懂度,从而提高语音处理***性能。噪音抑制技术原理是将实时采样的数字信号进行频谱分析,这样我们就能分析背景噪声响应的强度和频谱分布,然后根据这个模型就能设计一个滤波器,当有人讲话的时候,同时做信号分析,根据分析,出讲话者的频谱,那么根据这些背景噪音和讲话者的频谱,这个滤波器根据两个信号的对比实时的改变,让讲话者声音频谱通过,对背景噪声的频谱进行抑制,降低其能量。
本实施例中,所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC 语音识别电路、第三通道ADCMIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3 传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风 U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号。
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
本实施例通过上述技术方案,采用由三个麦克风组成的麦克风阵列及4 个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
进一步的,如图2及图3所示,本实施例提出的语音识别***还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路。
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容 C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4 的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3 的另一端、所述电容C4的另一端接地。
如图2及图4所示,所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
更进一步的,如图2、图5及图6所示,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容 C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17 的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容 C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚 21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容 C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
如图2、图5及图7所示,所述第二麦克风U2与所述模数转换器通过 BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2 的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地。可以理解的是,所述模数转换器的引脚24与所述电容C14的一端连接,所述电容C14的另外一端接地,构成BIAS1滤波电路。
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容 C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
如图2、图8、及图9所示,所述第三麦克风U3与所述模数转换器通过 BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接。可以理解的是,所述模数转换器的引脚26与所述电容C13的一端连接,所述电容C13的另外一端接地,构成BIAS2滤波电路。
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容 C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27 脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
如图2及图10所示,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
进一步的,如图11所示,本实施例提出的语音识别***还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8 的一端连接,所述电容C7的另一端、电容C8的另一端接地。
进一步的,请再次参照图2,本实施例中所述模数转换器的引脚6和引脚 14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
下面再次结合图1至图11对本实用新型语音识别***的工作原理做进一步的详细阐述。
本实用新型语音识别***提出的语音识别***中***模块分为:供电电源滤波模块,模拟转数字信号IC 85L40模块,麦克风降列模块,主控单元供电模块,主控单元CPU,WIFI通讯模块,模拟输出L声道模块,7个部分组成。
供电电源滤波模块的功能是给模拟转数字信号IC 85L40模块提供稳定可靠的电源;模拟转数字信号IC 85L40模块功能是处理来自麦克风阵列模块的数据,并转发给主控单元CPU;麦克风阵列模块是把声音转换为电信号;主控单元CPU功能是处理模拟转数字信号IC 85L40模块传输出过来的数据并控制模拟转数字信号IC 85L40模块,还为模拟输出L声道模块提供音频信号;主控单元供电模块功能是给主控单元CPU提供稳定可靠的电压;WIFI通讯模块功能是接收和发射主控单元CPU的信息;模拟输出L声道模块是为主控单元CPU处理声音和传输给麦克风U4作为消噪回路的音源。
首先供电电源滤波模块供电给主控单元及滤波器,电源通过滤波后供给主控单元,使主控单元开机和模拟转数字信号IC开始工作,主控单元开始与模拟转数字信号IC85L40通讯连接,机器开始工作。
当麦克风U1,麦克风U2,麦克风U3,麦克风U4(虚拟麦克风),收到声音信号转换为电信号,电信号放大处理后转换为模拟信号输入到模拟转数字IC 85L40,模数IC 85L40经过内部转换及放大调节再输出数字信号,把数字信号发送到主控单元CPU。
主控单元CPU收到麦克风信号,通过软件算法,消回音,去混音,放大,提取声音,通过WIFI送至云端,经过云端意译返回信息到本机,实现语音识别功能。
工作原理如下:
1,供电部分原理
VIO18_PMU电压为1.8V,从PMU输过来,经过电容C3,C4滤波后,得到电压VDDA_1.8V,供给模数转换IC85L40内部数字模块的GPIO口工作使用,作为GPIO口工作电压。VCC_AF为一个3.3V电压模拟电压,从PMU 输过来,经过电容C9,C10滤波后,得到VDDB_3.3V电压,VDDB_3.3V输入到模数转换IC85L40内,作为模数转换IC85L40内部模拟内核供电使用。2,模数转换IC85L40工作原理要求
模数转换IC85L40第5,7,18接收到1.8V供电,上电后,输出一个VREF 基准电压,经C7与地滤波。第25脚接到3.3V供电,并输出MICREF基准电压,经C8与地滤波。此时模数转换IC85L40开始工作,并检查模数转换 IC85L40第14脚CSB电平高低,匹配IIC地址,检测17脚平电高低,确认工作模式,以上两个脚都为外部硬件预设参数。数转换IC85L40第14脚CSB脚默认接到GND,为低电平,第17脚经过电阻R1 10K接到VDDA_1.8V,为接高电平。模数转换IC85L40经过上面供电和检测后,开始工作。模数转换IC85L40第15脚为SCL,外接对地3PF滤波电容,第16脚为SDA外接 3PF滤波电容,两脚为IIC功能脚,工作后通过IIC与主控单元CPU通讯,读取寄存器。模数转换IC85L40接到收麦克风信号后,经内部调节,由模拟信号转换为数字TDM信号,TDM信号从模数转换IC85L40第9脚输出,第 11脚为BCK,第12脚为LRCK,配起来一起用,通过IIS的TDM输出到主控单元CPU,主控单元CPU接收到TDM信号后进行后台解析传输。
3,麦克风工作原理
模数转换IC85L40正常工作之后,从24,26脚输出一个模拟电压,此电压可以根据不同的麦克风配匹不同的电平,输出电压从1.5~3.3V内可调。两个电压分别经过电容C13,C14滤波后,得到模拟电压BIAS1,BIAS2。BIAS1,给麦克风U1和麦克风U2供电,BIAS2给麦克风U3供电。
麦克风U1,麦克风U1在收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C17滤波后,输入麦克风U1第4脚,麦克风U1开始工作。当麦克风U1接收到声波信号,经过麦克风U1内部处理放大后输出模拟正信号MIC1P_C,MIC1P_C输出到麦克风U1的第1脚,再经过C18去高频滤波,通过C15耦合,送到模数转换IC 85L40的第21脚模拟信号正MIC1P输入,送到IC内部。模拟信号负MIC1N经过耦合电容C16耦合到R10上0欧姆电阻,到GND形成回路。
麦克风U2,麦克风U2接收到模数转换IC85L40供过来的BIAS1麦克风供电电源,经过C32滤波后,输入麦克风U2第4脚,麦克风U2开始工作。当麦克风U2接收到声波信号,经过麦克风U2内部处理放大后输出模拟信号正MIC2P_C,MIC2P_C输出到麦克风U2的第1脚上,再经过C22去高频滤波,通过C19耦合送到模数转换IC 85L40第23脚模拟信号正MIC2P输入,送到IC内部模拟信号负MIC1N经过耦合电容C20耦合到R11上0欧姆电阻,到GND形成回路。麦克风U3,麦克风U3接收到模数转换IC85L40供过来的BIAS2麦克风供电电源,经过C33滤波后,输入麦克风U3第4脚,麦克风U3开始工作。当麦克风U3接收到声波信号,经过麦克风U3内部处理放大后输出模拟信号正MIC3P_C,MIC3P_C输出到麦克风U3的第1脚上,再经过C26去高频滤波,通过C23耦合,送到模数转换IC 85L40第27脚模拟信号正MIC3P输入,送到CPU内部,模拟信号负MIC3N经过耦合电容C24 耦合到R12上0欧姆电阻,到GND形成回路。第四路为接收本机播放的音频,是一个虚拟麦,它接收的是本机输出的左声道或右声道或左右声音的模拟音频信号。模拟信号从主控单元CPU输出,通过扬声器PA过来,经过电阻R14,R13分压后得到模拟信号正MIC4P_C,再通过C28滤波,输出到耦合电容C29, 经过C29后得到模拟信号正MIC4P,MIC4P送到模数转换IC 85L40第1脚模拟信号正MIC2P输入,送到主控单元CPU内部,模拟信号负MIC4N经过耦合电容C30耦合到R16上0欧姆电阻,到GND形成回路。以上四路信号通过模数转换IC 85L40转换成数字信号(TDM信号),送到主控单元CPU,主控单元收到到信号后,放大,通过软件算法,把第四路信号与麦克风U1、 U2、U3信号对比,通过对比,把麦克风U1、U2、U3信号中与第四路信号一样的声音信号去除,混音去除,把剩下的声音放大显示出来,并把显示出来的语句语意修正,通过WIFI模块,送到云端,根据云端语译做出判断,输出正确的信息,返回到本机上,并显示出结果。
综上所述,本实用新型语音识别***采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道 ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。
以上所述仅为本实用新型的优选实施例,并非因此限制本实用新型的专利范围,凡是利用本实用新型说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本实用新型的专利保护范围内。

Claims (9)

1.一种语音识别***,其特征在于,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;
所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;
所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。
2.根据权利要求1所述的语音识别***,其特征在于,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;
所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;
所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。
3.根据权利要求2所述的语音识别***,其特征在于,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;
所述第一通道ADC MIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。
4.根据权利要求2所述的语音识别***,其特征在于,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;
所述第二通道ADC MIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。
5.根据权利要求2所述的语音识别***,其特征在于,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;
所述第三通道ADC MIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13 的另一端、所述电容C26的另一端、所述电容C33的另一端接地。
6.根据权利要求2所述的语音识别***,其特征在于,所述第四通道ADC MIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。
7.根据权利要求2所述的语音识别***,其特征在于,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。
8.根据权利要求2-7任意一项所述的语音识别***,其特征在于,所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器将模拟信号转换为TDM信号后,由所述模数转换器的引脚9输出至所述主控单元CPU。
9.根据权利要求1所述的语音识别***,其特征在于,所述模数转换器采用IC85L40转换器。
CN201820743323.3U 2018-05-18 2018-05-18 语音识别*** Withdrawn - After Issue CN208538474U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201820743323.3U CN208538474U (zh) 2018-05-18 2018-05-18 语音识别***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201820743323.3U CN208538474U (zh) 2018-05-18 2018-05-18 语音识别***

Publications (1)

Publication Number Publication Date
CN208538474U true CN208538474U (zh) 2019-02-22

Family

ID=65393342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201820743323.3U Withdrawn - After Issue CN208538474U (zh) 2018-05-18 2018-05-18 语音识别***

Country Status (1)

Country Link
CN (1) CN208538474U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108447483A (zh) * 2018-05-18 2018-08-24 深圳市亿道数码技术有限公司 语音识别***
CN113038339A (zh) * 2019-12-09 2021-06-25 北京君正集成电路股份有限公司 一种消除回音提高音频质量的***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108447483A (zh) * 2018-05-18 2018-08-24 深圳市亿道数码技术有限公司 语音识别***
CN108447483B (zh) * 2018-05-18 2023-11-21 深圳市亿道数码技术有限公司 语音识别***
CN113038339A (zh) * 2019-12-09 2021-06-25 北京君正集成电路股份有限公司 一种消除回音提高音频质量的***
CN113038339B (zh) * 2019-12-09 2022-03-25 北京君正集成电路股份有限公司 一种消除回音提高音频质量的***

Similar Documents

Publication Publication Date Title
CN108447483A (zh) 语音识别***
CN106782591B (zh) 一种在背景噪音下提高语音识别率的装置及其方法
CN204390737U (zh) 一种家庭语音处理***
CN108681440A (zh) 一种智能设备音量控制方法及***
CN109346075A (zh) 通过人体振动识别用户语音以控制电子设备的方法和***
CN105704298A (zh) 声音唤醒侦测装置与方法
CN108597507A (zh) 远场语音功能实现方法、设备、***及存储介质
CN109272991B (zh) 语音交互的方法、装置、设备和计算机可读存储介质
CN106782519A (zh) 一种机器人
WO2019233228A1 (zh) 电子设备及设备控制方法
CN113630708B (zh) 耳机麦克风异常检测的方法、装置、耳机套件及存储介质
CN109412544B (zh) 一种智能穿戴设备的语音采集方法、装置及相关组件
WO2020048431A1 (zh) 一种语音处理方法、电子设备和显示设备
CN110248021A (zh) 一种智能设备音量控制方法及***
CN208538474U (zh) 语音识别***
CN103529726A (zh) 一种具有语音识别功能的智能开关
CN111145746A (zh) 一种基于人工智能语音的人机交互方法
CN110597147A (zh) 一种集成远场拾音及充电的装置
CN109545216A (zh) 一种语音识别方法和语音识别***
CN108064007A (zh) 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN110349582A (zh) 显示装置与远场语音处理电路
CN208724111U (zh) 基于电视设备的远场语音控制***
CN207783234U (zh) 用于灯具开关的语音识别控制装置
CN113259793B (zh) 智能麦克风及其信号处理方法
CN111128164B (zh) 一种语音采集和识别的控制***及其实现方法

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 518000 Meisheng Huigu Science Park, No. 83 Dabao Road, 33 District, Shanghe Street, Baoan District, Shenzhen City, Guangdong Province, 5 4th Floors of Meigu, 5 2nd Floors-2 of Meigu, 6 2nd Floors-2 of Meigu and 6 4th Floors of Meigu

Patentee after: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

Address before: 518000 Guangdong city of Shenzhen province Baoan District Xin'an Street Dabao Road No. 49-1 campoloy building 6 floor

Patentee before: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 901, building 1, No. 9, Jinxiu Middle Road, Laokeng community, Longtian street, Pingshan District, Shenzhen City, Guangdong Province

Patentee after: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

Address before: 518000 4th floor, building 5, building 2-2, building 6, building 2-2, building 6, building 4, Meisheng Huigu Science Park, 83 Dabao Road, Shanghe community, Xin'an street, Bao'an District, Shenzhen City, Guangdong Province

Patentee before: EMDOOR DIGITAL TECHNOLOGY Co.,Ltd.

AV01 Patent right actively abandoned
AV01 Patent right actively abandoned
AV01 Patent right actively abandoned

Granted publication date: 20190222

Effective date of abandoning: 20231121

AV01 Patent right actively abandoned

Granted publication date: 20190222

Effective date of abandoning: 20231121