CN108022593A - 一种高灵敏度语音识别***及其控制方法 - Google Patents
一种高灵敏度语音识别***及其控制方法 Download PDFInfo
- Publication number
- CN108022593A CN108022593A CN201810038698.4A CN201810038698A CN108022593A CN 108022593 A CN108022593 A CN 108022593A CN 201810038698 A CN201810038698 A CN 201810038698A CN 108022593 A CN108022593 A CN 108022593A
- Authority
- CN
- China
- Prior art keywords
- voice
- circuit
- speech
- speech recognition
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000035945 sensitivity Effects 0.000 title claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 31
- 238000006243 chemical reaction Methods 0.000 claims abstract description 13
- 238000012546 transfer Methods 0.000 claims abstract description 11
- 230000010354 integration Effects 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 49
- 241000209140 Triticum Species 0.000 claims description 15
- 235000021307 Triticum Nutrition 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 5
- 230000005611 electricity Effects 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000009434 installation Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 4
- 238000003786 synthesis reaction Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005728 strengthening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种高灵敏度语音识别***及其控制方法,包括步骤:采集语音信号,并对语音信号进行预处理,获得预处理语音信号;将所述预处理语音信号进行多级词条分解,建立音频帧矩阵;根据所述音频帧矩阵在所述云端语音数据库中调取相应的语音识别模型匹配出相应的语音元素,获得语音识别数据;将语音识别数据进行多级词条组合,获得语音数据;语音数据通过转换和分配后,通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。本发明实现语音识别、语音合成和语音传输等功能一体化服务,能够支持多级词条识别功能,具备自动选择和切换功能;具有较高的识别精度和识别效率;使用范围广,能够与云端进行通讯。
Description
技术领域
本发明属于语音识别技术领域,特别是涉及一种高灵敏度语音识别***及其控制方法。
背景技术
语音识别技术主要是能够使人和计算机进行交流,将人类的语言转换成计算机能够识别的语言,从而实现人类语音控制计算机等应用功能,语音识别技术在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域都能够得到广泛的运用。
现有的语音识别***还有许多无法解决的问题,例如:无法同时具备语音识别、语音合成和语音传输等功能,不能支持多级词条识别;识别精度差,且识别效率低;通用性能差,且使用范围具有局限性。
发明内容
为了解决上述问题,本发明提出了一种高灵敏度语音识别***及其控制方法,能够实现语音识别、语音合成和语音传输等功能一体化服务,能够支持多级词条识别功能,具备自动选择和切换功能;具有较高的识别精度和识别效率;使用范围广,能够与云端进行通讯。
为达到上述目的,本发明采用的技术方案是:一种高灵敏度语音识别***及其控制方法:
所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路,所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连,所述语音识别电路和语音发送电路均连接至无线通信电路,所述无线通信电路与语音处理电路相互连接,所述语音发送电路上还连接有本地接口,所述语音处理电路还连接至语音采集电路;所述无线通信电路与云端无线连接,所述云端中包括语音数据库,所述无线通信电路还与外部语音接收客户端无线连接,所述本地接口与本地设备相连接;
预先通过人工神经网络算法学习训练建立语音识别模型,并将语音识别模型存储在云端的语音数据库中;所述高灵敏度语音识别***的控制方法,包括步骤:
S100,采集语音信号,并对语音信号进行预处理,获得预处理语音信号;
S200,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵;
S300,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的语音识别模型;
S400,根据所述音频帧矩阵在语音识别模型中匹配相应的语音元素,获得语音识别数据;
S500,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S600,语音数据通过语音发送电路信号转换和分配后,通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。
进一步的是,所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元,所述接收接口、接收天线与麦芯并列连接至切换单元,所述切换单元连接至去噪单元,所述去噪单元连接至放大单元;通过接收接口接收本地语音信号,通过接收天线接收无线语音信号,通过麦芯接收实时语音信号;从而实现多端口接入和选择,提高***通用性。
进一步的是,实现多端口自动接入和选择,所述步骤S100中通过语音采集电路采集语音信号,并对语音信号进行预处理,获得预处理语音信号,包括步骤:
S101,初始化设置语音采集电路;
S102,检测接收接口是否有语音信号或是否有语音处理电路发出的接口接收指令,若有则控制切换单元连通接收接口和去噪单元,由接收接口接收语音信号,并跳转至步骤105;若否则进行下一步;
S103,检测接收天线是否有语音信号或是否有语音处理电路发出的天线接收指令,若有则控制切换单元连通接收天线和去噪单元,由接收天线接收语音信号,并跳转至步骤105;若否则进行下一步;
S104,检测麦芯是否有语音信号或是否有语音处理电路发出的麦芯接收指令,若有则控制切换单元连通麦芯和去噪单元,由麦芯接收语音信号,并跳转至步骤105;若否则循环步骤S102-S104;
S105,所述语音信号通过去噪单元进行去噪处理,然后通过放大单元进行放大处理,得到预处理语音信号;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
进一步的是,为了实现多级词条识别,提高识别精度,所述步骤S200中,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵,包括步骤:
S201预处理语音信号,根据语音信号的音频帧依次进行分段处理、分句处理和分字处理,得到基于字段的音频帧数据;
S202利用所获得的音频帧数据建立音频帧矩阵。
进一步的是,为了提高识别精度和识别效率,步骤S300中,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型,包括步骤:
S301在音频帧矩阵中提取特征值;
S302利用特征值在所述云端语音数据库中调取相应的识别语音识别模型。
进一步的是,步骤S400中,在语音识别模型中匹配相应的语音元素,获得语音识别数据,包括步骤:
S401计算音频帧矩阵的特征值和特征矩阵;
S402通过所述特征矩阵,在语音识别模型中匹配相应的文本元素;
S403将匹配通过的文本元素进行组合形成匹配矩阵,所述匹配矩阵即语音识别数据。
进一步的是,实现多级词条组合,将获取的零碎文本数据,进行语句和段落的整合,步骤S500中,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S501,将多组语音识别数据,进行词语组合;
S502,将组合的词语,根据语法进行语句整合;
S502,将整合的语句进行集成获得语音数据。
进一步的是,为实现多端口多制式的切换和转换,增强***的通用性;所述语音发送电路包括相互连接的信号转换器和发送切换电路,通过信号转换器转换语音数据的制式,通过发送切换电路切换语音数据的分配方式。
进一步的是,步骤S600中,将语音数据通过语音发送电路进行数据转换和分配,包括步骤:
S601,通过语音处理电路的转换指令,选择语音发送电路的信号转换模式,确定语音数据的制式,并进行制式转换;
S602,通过语音处理电路的分配指令,选择语音发送电路的信号分配方式;若分配方式为本地方式,将语音数据通过本地接口传输给本地设备;若分配方式为远程方式,将语音数据通过无线通信电路传输给外部语音接收客户端或云端服务器;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
进一步的是,所述语音识别电路为语音识别芯片,所述无线通信电路为3G4G电路或Wi-Fi电路,所述本地接口为USB接口、串行接口、并行接口或蓝牙模块,所述语音处理电路为嵌入式微处理器。
采用本技术方案的有益效果:
本发明具备语音识别、语音合成和语音传输等功能,支持多级词条识别,具备自动选择和切换功能,通用性能较高;
本发明通过建立人工神经网络模型,能够有效提高识别精度,提高识别效率,在混合语言环境下具有较高的识别率;
本发明扩大使用范围,具有云端语音识别平台具备开放接口,能够通过云端实现对语音识别***的调整和数据传输。
附图说明
图1为本发明实施例一中的一种高灵敏度语音识别***的结构示意图;
图2为本发明实施例一中的一种高灵敏度语音识别***的控制方法流程图;
图3为本发明实施例二中语音采集电路的结构示意图;
图4为本发明实施例二中步骤S100的流程图;
图5为本发明实施例三中语音发送电路的结构示意图;
图6为本发明实施例三中步骤S600的流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在本实施例一中,参见图1所示,本发明提出了一种高灵敏度语音识别***及其控制方法。
其中,所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路,所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连,所述语音识别电路和语音发送电路均连接至无线通信电路,所述无线通信电路与语音处理电路相互连接,所述语音发送电路上还连接有本地接口,所述语音处理电路还连接至语音采集电路;所述无线通信电路与云端无线连接,所述云端中包括语音数据库,所述无线通信电路还与外部语音接收客户端无线连接,所述本地接口与本地设备相连接。
其中,预先通过人工神经网络算法学习训练建立语音识别模型,并将语音识别模型存储在云端的语音数据库中;所述高灵敏度语音识别***的控制方法,如图2所示,包括步骤:
S100,采集语音信号,并对语音信号进行预处理,获得预处理语音信号;
S200,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵;
S300,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的语音识别模型;
S400,根据所述音频帧矩阵在语音识别模型中匹配相应的语音元素,获得语音识别数据;
S500,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S600,语音数据通过语音发送电路信号转换和分配后,通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。
在实施例二中,在实施例一的基础上,如图3所示,所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元,所述接收接口、接收天线与麦芯并列连接至切换单元,所述切换单元连接至去噪单元,所述去噪单元连接至放大单元;通过接收接口接收本地语音信号,通过接收天线接收无线语音信号,通过麦芯接收实时语音信号;从而实现多端口接入和选择,提高***通用性。
其中,实现多端口自动接入和选择,所述步骤S100中通过语音采集电路采集语音信号,并对语音信号进行预处理,获得预处理语音信号,如图4所示,包括步骤:
S101,初始化设置语音采集电路;
S102,检测接收接口是否有语音信号或是否有语音处理电路发出的接口接收指令,若有则控制切换单元连通接收接口和去噪单元,由接收接口接收语音信号,并跳转至步骤105;若否则进行下一步;
S103,检测接收天线是否有语音信号或是否有语音处理电路发出的天线接收指令,若有则控制切换单元连通接收天线和去噪单元,由接收天线接收语音信号,并跳转至步骤105;若否则进行下一步;
S104,检测麦芯是否有语音信号或是否有语音处理电路发出的麦芯接收指令,若有则控制切换单元连通麦芯和去噪单元,由麦芯接收语音信号,并跳转至步骤105;若否则循环步骤S102-S104;
S105,所述语音信号通过去噪单元进行去噪处理,然后通过放大单元进行放大处理,得到预处理语音信号;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
其中,为了实现多级词条识别,提高识别精度,所述步骤S200中,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵,包括步骤:
S201预处理语音信号,根据语音信号的音频帧依次进行分段处理、分句处理和分字处理,得到基于字段的音频帧数据;
S202利用所获得的音频帧数据建立音频帧矩阵。
其中,为了提高识别精度和识别效率,步骤S300中,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型,包括步骤:
S301在音频帧矩阵中提取特征值;
S302利用特征值在所述云端语音数据库中调取相应的识别语音识别模型。
其中,步骤S400中,在语音识别模型中匹配相应的语音元素,获得语音识别数据,包括步骤:
S401计算音频帧矩阵的特征值和特征矩阵;
S402通过所述特征矩阵,在语音识别模型中匹配相应的文本元素;
S403将匹配通过的文本元素进行组合形成匹配矩阵,所述匹配矩阵即语音识别数据。
其中,实现多级词条组合,将获取的零碎文本数据,进行语句和段落的整合,步骤S500中,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S501,将多组语音识别数据,进行词语组合;
S502,将组合的词语,根据语法进行语句整合;
S502,将整合的语句进行集成获得语音数据。
在实施例三中,在实施例二的基础上,如图5所示,为实现多端口多制式的切换和转换,增强***的通用性;所述语音发送电路包括相互连接的信号转换器和发送切换电路,通过信号转换器转换语音数据的制式,通过发送切换电路切换语音数据的分配方式。
其中,所述步骤S600中,如图6所示,将语音数据通过语音发送电路进行数据转换和分配,包括步骤:
S601,通过语音处理电路的转换指令,选择语音发送电路的信号转换模式,确定语音数据的制式,并进行制式转换;
S602,通过语音处理电路的分配指令,选择语音发送电路的信号分配方式;若分配方式为本地方式,将语音数据通过本地接口传输给本地设备;若分配方式为远程方式,将语音数据通过无线通信电路传输给外部语音接收客户端或云端服务器;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
作为上述实施例的优化方案,所述语音识别电路为语音识别芯片,所述无线通信电路为3G4G电路或Wi-Fi电路,所述本地接口为USB接口、串行接口、并行接口或蓝牙模块,所述语音处理电路为嵌入式微处理器。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种高灵敏度语音识别***及其控制方法,其特征在于,所述高灵敏度语音识别***包括语音采集电路、语音识别电路、无线通信电路、本地接口、语音处理电路和语音发送电路,所述语音采集电路、语音识别电路、语音处理电路和语音发送电路依次相连,所述语音识别电路和语音发送电路均连接至无线通信电路,所述无线通信电路与语音处理电路相互连接,所述语音发送电路上还连接有本地接口,所述语音处理电路还连接至语音采集电路;所述无线通信电路与云端无线连接,所述云端中包括语音数据库,所述无线通信电路还与外部语音接收客户端无线连接,所述本地接口与本地设备相连接;
预先通过人工神经网络算法学习训练建立语音识别模型,并将语音识别模型存储在云端的语音数据库中;所述高灵敏度语音识别***的控制方法,包括步骤:
S100,采集语音信号,并对语音信号进行预处理,获得预处理语音信号;
S200,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵;
S300,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的语音识别模型;
S400,根据所述音频帧矩阵在语音识别模型中匹配相应的语音元素,获得语音识别数据;
S500,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S600,语音数据通过语音发送电路信号转换和分配后,通过本地接口传输给本地设备或通过无线通信电路传输给外部语音接收客户端。
2.根据权利要求1所述的一种高灵敏度语音识别***及其控制方法,其特征在于,所述语音采集电路包括接收天线、接收接口、麦芯、切换单元、去噪单元和放大单元,所述接收接口、接收天线与麦芯并列连接至切换单元,所述切换单元连接至去噪单元,所述去噪单元连接至放大单元;通过接收接口接收本地语音信号,通过接收天线接收无线语音信号,通过麦芯接收实时语音信号。
3.根据权利要求2所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S100中通过语音采集电路采集语音信号,并对语音信号进行预处理,获得预处理语音信号,包括步骤:
S101,初始化设置语音采集电路;
S102,检测接收接口是否有语音信号或是否有语音处理电路发出的接口接收指令,若有则控制切换单元连通接收接口和去噪单元,由接收接口接收语音信号,并跳转至步骤105;若否则进行下一步;
S103,检测接收天线是否有语音信号或是否有语音处理电路发出的天线接收指令,若有则控制切换单元连通接收天线和去噪单元,由接收天线接收语音信号,并跳转至步骤105;若否则进行下一步;
S104,检测麦芯是否有语音信号或是否有语音处理电路发出的麦芯接收指令,若有则控制切换单元连通麦芯和去噪单元,由麦芯接收语音信号,并跳转至步骤105;若否则循环步骤S102-S104;
S105,所述语音信号通过去噪单元进行去噪处理,然后通过放大单元进行放大处理,得到预处理语音信号;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
4.根据权利要求3所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S200中,将所述预处理语音信号进行多级词条分解,建立音频帧矩阵,包括步骤:
S201将预处理语音信号根据语音信号的音频帧依次进行分段处理、分句处理和分字处理,得到基于字段的音频帧数据;
S202利用所获得的音频帧数据建立音频帧矩阵。
5.根据权利要求4所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S300中,根据所述音频帧矩阵的特征值在所述云端语音数据库中调取相应的识别语音识别模型,包括步骤:
S301在音频帧矩阵中提取特征值;
S302利用特征值在所述云端语音数据库中调取相应的识别语音识别模型。
6.根据权利要求5所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S400中,在语音识别模型中匹配相应的语音元素,获得语音识别数据,包括步骤:
S401计算音频帧矩阵的特征值和特征矩阵;
S402通过所述特征矩阵,在语音识别模型中匹配相应的文本元素;
S403将匹配通过的文本元素进行组合形成匹配矩阵,所述匹配矩阵即语音识别数据。
7.根据权利要求6所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S500中,将语音识别数据在语音处理电路中进行多级词条组合,获得语音数据;
S501,将多组语音识别数据,进行词语组合;
S502,将组合的词语,根据语法进行语句整合;
S502,将整合的语句,进行集成获得语音数据。
8.根据权利要求7所述的一种高灵敏度语音识别***及其控制方法,其特征在于,所述语音发送电路包括相互连接的信号转换器和发送切换电路,通过信号转换器转换语音数据的制式,通过发送切换电路切换语音数据的分配方式。
9.根据权利要求8所述的一种高灵敏度语音识别***及其控制方法,其特征在于,步骤S600中,将语音数据通过语音发送电路进行数据转换和分配,包括步骤:
S601,通过语音处理电路的转换指令,选择语音发送电路的信号转换模式,确定语音数据的制式,并进行制式转换;
S602,通过语音处理电路的分配指令,选择语音发送电路的信号分配方式;若分配方式为本地方式,将语音数据通过本地接口传输给本地设备;若分配方式为远程方式,将语音数据通过无线通信电路传输给外部语音接收客户端或云端服务器;
其中,由客户端或云端服务器通过无线通信电路向语音处理电路发送指令。
10.根据权利要求1-9中任意一项所述的一种高灵敏度语音识别***及其控制方法,其特征在于,所述语音识别电路为语音识别芯片,所述无线通信电路为3G4G电路或Wi-Fi电路,所述本地接口为USB接口、串行接口、并行接口或蓝牙模块,所述语音处理电路为嵌入式微处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810038698.4A CN108022593A (zh) | 2018-01-16 | 2018-01-16 | 一种高灵敏度语音识别***及其控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810038698.4A CN108022593A (zh) | 2018-01-16 | 2018-01-16 | 一种高灵敏度语音识别***及其控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108022593A true CN108022593A (zh) | 2018-05-11 |
Family
ID=62071572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810038698.4A Pending CN108022593A (zh) | 2018-01-16 | 2018-01-16 | 一种高灵敏度语音识别***及其控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108022593A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109036379A (zh) * | 2018-09-06 | 2018-12-18 | 百度时代网络技术(北京)有限公司 | 语音识别方法、设备及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4852180A (en) * | 1987-04-03 | 1989-07-25 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech recognition by acoustic/phonetic system and technique |
US6119086A (en) * | 1998-04-28 | 2000-09-12 | International Business Machines Corporation | Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens |
CN101281745A (zh) * | 2008-05-23 | 2008-10-08 | 深圳市北科瑞声科技有限公司 | 一种车载语音交互*** |
JP2012053858A (ja) * | 2010-09-03 | 2012-03-15 | Toshiba Corp | 機械翻訳装置及び機械翻訳プログラム |
CN102693725A (zh) * | 2011-03-25 | 2012-09-26 | 通用汽车有限责任公司 | 依赖于文本信息语境的语音识别 |
CN103236260A (zh) * | 2013-03-29 | 2013-08-07 | 京东方科技集团股份有限公司 | 语音识别*** |
CN104965551A (zh) * | 2015-07-01 | 2015-10-07 | 成都福兰特电子技术股份有限公司 | 新型lte无线通讯设备 |
US20160111089A1 (en) * | 2014-10-16 | 2016-04-21 | Hyundai Motor Company | Vehicle and control method thereof |
CN105551490A (zh) * | 2015-12-23 | 2016-05-04 | 中国电子科技集团公司第四十一研究所 | 一种电子测量仪器的智能语音交互***及方法 |
CN205247684U (zh) * | 2015-12-17 | 2016-05-18 | 郁栋 | 一种基于关键字的语音识别*** |
CN105681920A (zh) * | 2015-12-30 | 2016-06-15 | 深圳市鹰硕音频科技有限公司 | 一种具有语音识别功能的网络教学方法及*** |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与*** |
WO2017071183A1 (zh) * | 2015-10-29 | 2017-05-04 | 北京云知声信息技术有限公司 | 一种语音处理方法、装置及拾音电路 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN207690495U (zh) * | 2018-01-16 | 2018-08-03 | 成都福兰特电子技术股份有限公司 | 一种高灵敏度语音识别*** |
-
2018
- 2018-01-16 CN CN201810038698.4A patent/CN108022593A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4852180A (en) * | 1987-04-03 | 1989-07-25 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech recognition by acoustic/phonetic system and technique |
US6119086A (en) * | 1998-04-28 | 2000-09-12 | International Business Machines Corporation | Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens |
CN101281745A (zh) * | 2008-05-23 | 2008-10-08 | 深圳市北科瑞声科技有限公司 | 一种车载语音交互*** |
JP2012053858A (ja) * | 2010-09-03 | 2012-03-15 | Toshiba Corp | 機械翻訳装置及び機械翻訳プログラム |
CN102693725A (zh) * | 2011-03-25 | 2012-09-26 | 通用汽车有限责任公司 | 依赖于文本信息语境的语音识别 |
CN103236260A (zh) * | 2013-03-29 | 2013-08-07 | 京东方科技集团股份有限公司 | 语音识别*** |
US20160111089A1 (en) * | 2014-10-16 | 2016-04-21 | Hyundai Motor Company | Vehicle and control method thereof |
CN104965551A (zh) * | 2015-07-01 | 2015-10-07 | 成都福兰特电子技术股份有限公司 | 新型lte无线通讯设备 |
WO2017071183A1 (zh) * | 2015-10-29 | 2017-05-04 | 北京云知声信息技术有限公司 | 一种语音处理方法、装置及拾音电路 |
CN205247684U (zh) * | 2015-12-17 | 2016-05-18 | 郁栋 | 一种基于关键字的语音识别*** |
CN105551490A (zh) * | 2015-12-23 | 2016-05-04 | 中国电子科技集团公司第四十一研究所 | 一种电子测量仪器的智能语音交互***及方法 |
CN105681920A (zh) * | 2015-12-30 | 2016-06-15 | 深圳市鹰硕音频科技有限公司 | 一种具有语音识别功能的网络教学方法及*** |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与*** |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN207690495U (zh) * | 2018-01-16 | 2018-08-03 | 成都福兰特电子技术股份有限公司 | 一种高灵敏度语音识别*** |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109036379A (zh) * | 2018-09-06 | 2018-12-18 | 百度时代网络技术(北京)有限公司 | 语音识别方法、设备及存储介质 |
CN109036379B (zh) * | 2018-09-06 | 2021-06-11 | 百度时代网络技术(北京)有限公司 | 语音识别方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105451110A (zh) | 基于WiFi的家电控制语音耳机 | |
CN205987367U (zh) | 一种基于分布式麦克风的拾音装置 | |
CN105116751A (zh) | 一种基于公有云平台进行信息交互的智能控制***及控制方法 | |
CN108022593A (zh) | 一种高灵敏度语音识别***及其控制方法 | |
CN207690495U (zh) | 一种高灵敏度语音识别*** | |
CN105406883A (zh) | 一种无线通信装置 | |
CN110166892A (zh) | 一种带万能红外控制功能的智能音箱***及运作方法 | |
CN114500613A (zh) | 电网在线监测物联*** | |
CN204374961U (zh) | 医疗检验信息采集*** | |
CN101621533B (zh) | 用户端馈电以太网数据交换装置无线监控*** | |
Bi et al. | Research on beauty medical health monitoring system based on wireless sensor network | |
CN105897894A (zh) | 一种物联网通用采集设备集成器 | |
CN110417628A (zh) | 一种基于智能家居的语音遥控***及方法 | |
CN208781392U (zh) | 一种模块化数据采集器 | |
CN201467144U (zh) | 用户端馈电以太网数据交换装置无线监控*** | |
CN216351852U (zh) | 一种基于级联总线式分布式数据采集*** | |
CN202059422U (zh) | 分离式室外型信号处理单元 | |
CN212259342U (zh) | 一种变电站内电力无线专网*** | |
CN108900412A (zh) | 支持遥测多协议的智能网关设备及其工作方法 | |
CN108259061A (zh) | 一种可调式的物联网通讯微功耗芯片及其控制方法 | |
CN217159745U (zh) | 便携接入盒和通信*** | |
CN203870795U (zh) | 一种物联网数据处理设备 | |
CN213545528U (zh) | 一种可控负荷数据采集***的无线传输装置 | |
CN107347020A (zh) | 一种分布式***的智能网络安全验证控制*** | |
CN209731278U (zh) | 一种支持遥测多协议的智能网关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180511 |
|
RJ01 | Rejection of invention patent application after publication |