CN105976808B - 一种智能语音识别***及方法 - Google Patents

一种智能语音识别***及方法 Download PDF

Info

Publication number
CN105976808B
CN105976808B CN201610240242.7A CN201610240242A CN105976808B CN 105976808 B CN105976808 B CN 105976808B CN 201610240242 A CN201610240242 A CN 201610240242A CN 105976808 B CN105976808 B CN 105976808B
Authority
CN
China
Prior art keywords
unit
voice
storage management
digital signal
management unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610240242.7A
Other languages
English (en)
Other versions
CN105976808A (zh
Inventor
何云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN201610240242.7A priority Critical patent/CN105976808B/zh
Publication of CN105976808A publication Critical patent/CN105976808A/zh
Application granted granted Critical
Publication of CN105976808B publication Critical patent/CN105976808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及电子技术领域,特别涉及一种智能语音识别***,其包括信号接收转换单元、存储管理单元、语音检测单元、语音特征提取单元、深度神经网络单元和识别解码单元,本发明还公开了一种包含该智能语音识别***的智能语音识别方法,本发明在同等芯片面积条件下,相较于CPU或GPU大幅提升了芯片的计算性能,并且降低了功耗和成本。

Description

一种智能语音识别***及方法
技术领域
本发明涉及电子技术领域,特别涉及一种智能语音识别***及方法。
背景技术
随着人工智能算法的突破,深度神经网络(DNN)在语音智能识别中得到应用,从而大幅提升了语音识别的准确度,使得近两年来语音识别开始逐步在各领域推广应用。由于DNN模型计算量非常巨大,所以目前的语音识别计算主要通过云端服务器进行,云端服务器采用高性能的中央处理器(CPU)或图形处理器(GPU)阵列来进行计算,不仅需要消耗的计算资源巨大,而且功耗也超高,同时也需要消耗巨大的网络带宽,在没有网络或网络断线情况下则无法进行识别计算。如果本地采用集成单核或多核的高性能CPU或GPU及数字信号处理(DSP)核的***级芯片(SoC)来计算,则只能进行较小的DNN模型计算,或者是由于计算功耗和成本巨大,给终端产品的竞争力带来较大影响。
市面上也有个别芯片采用非DNN模型方式比如高斯混合模型方式,该方式虽然计算量小,从而采用普通CPU内核就可以承担,但识别性能相较基于DNN模型的语音识别方式差很多。
发明内容
本发明的目的在于:提供一种采用硬件化的逻辑电路,可进行并行计算,可极大提升本地语音识别计算能力,并降低对于CPU计算资源的需求消耗以及能耗的智能语音识别***及方法。
为了达到上述目的,本发明提供了如下技术方案:
一种智能语音识别***,其包括信号接收转换单元、存储管理单元、语音检测单元、语音特征提取单元、深度神经网络单元和识别解码单元,所述信号接收转换单元接收外部声音输入信号并将所述外部声音输入信号转换为***统一格式的数字信号,所述数字信号被存入所述存储管理单元,所述语音检测单元从所述存储单元中读取所述数字信号进行检测并将检测结果分别输送给所述语音特征提取单元、深度神经网络单元和识别解码单元,当所述检测结果包含活动语音信号时,所述语音特征提取单元、深度神经网络单元和识别解码单元被触发,处于工作状态,当所述检测结果不包含活动语音信号时,所述语音特征提取单元和深度神经网络单元不被触发,处于低功耗的不工作状态,所述识别解码单元处于不进行语音识别解码的模式或者低功耗休眠状态,所述语音特征提取单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述数字信号并从中提取语音特征,所述语音特征提取单元将提取到的所述语音特征存入所述存储管理单元,所述深度神经网络单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述语音特征进行计算,并将计算结果存入所述存储管理单元,所述识别解码单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述计算结果进行识别解码,并将识别解码后的信号输出。
作为本发明的优选方案,所述存储管理单元包含数字信号存储模块、语音特征存储模块和计算结果存储模块,所述数字信号存储模块存储所述数字信号供所述语音检测单元和所述语音特征提取单元读取,所述语音特征存储模块存储所述语音特征并供所述深度神经网络单元读取,所述计算结果存储模块存储所述计算结果并供所述识别解码单元读取进行识别解码,所述计算结果存储模块与所述深度神经网络单元之间的数据传输是单向或双向的,所述语音检测单元、语音特征提取单元、深度神经网络单元均采用固化的芯片逻辑电路,所述识别解码单元采用嵌入式软件或硬件,所述识别解码单元在读取所述计算结果的同时从所述存储管理单元读取预存的语言模型库,进行软件或固件识别解码计算,完成语音的智能识别。
作为本发明的优选方案,所述深度神经网络单元由输入层、隐含层和输出层构成,所述输入层可配置特征矢量大小,所述隐含层可配置层数和神经元节点个数,所述输出层可配置输出大小,所述深度神经网络单元将所述语音特征计算完成后的所述计算结果进行片内缓存或放入外部DRAM(动态随机存储器)中,供所述识别解码单元访问。
本发明还公开了一种包含如上述智能语音识别***的智能语音识别方法,其步骤如下:
A所述信号接收转换单元接收所述外部声音输入信号并将所述外部声音输入信号转化为***统一格式的数字信号,若所述外部声音输入信号为模拟信号,则需要先将所述外部声音输入信号转换为数字信号;
B 所述数字信号被存入所述存储管理单元供其他单元读取;
C 所述语音检测单元从所述存储管理单元读取所述数字信号并检测是否有语音信号,如果否则终止流程,如果是则进入下一个步骤,在检测到语音信号的同时,所述语音检测单元发送触发信号给所述语音特征提取单元、深度神经网络单元和识别解码单元,触发所述语音特征提取单元、深度神经网络单元和识别解码单元从非工作状态进入工作状态;
D 所述语音特征提取单元从所述存储管理单元读取所述数字信号并从中提取语音特征;
E 所述语音特征被存入所述存储管理单元;
F 所述深度神经网络单元从所述存储管理单元读取所述语音特征并进行计算得到计算结果;
G 所述计算结果被存入所述存储管理单元;
H 所述识别解码单元从所述存储管理单元读取所述计算结果进行识别解码。
只要持续有所述外部声音输入信号输入,则不断循环重复上述A-H的步骤。
与现有技术相比,本发明的有益效果:
本发明将语音特征提取和DNN计算采用硬件化的集成电路逻辑模块方式,通过分析该方式承担了语音识别近90%的计算需求,该方式在同等芯片面积条件下,相较于CPU/GPU大幅提升了芯片的计算性能,并且降低了功耗和成本,本发明还集成了活动语音自动检测的电路,只在识别到输入声音中有人说话的成分才开始进行识别计算,从而进一步大幅节省了计算需求,并降低芯片计算功耗。
附图说明
图1为本发明智能语音检测***的框图;
图2为本发明第一实施例框图;
图3为本发明第二实施例框图;
图4为本发明智能语音识别方法流程图;
图5为本发明第三实施例流程图;
图6为本发明第四实施例流程图。
具体实施方式
下面结合实施例及具体实施方式对本发明作进一步的详细描述,但不应将此理解为本发明上述主体的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明保护的范围。
第一实施例
如图2所示,一种智能语音识别***,包括信号接收转换单元101、INPUT RAM(输入缓存)1021、VAD(语音检测单元)103、FE(语音特征提取单元)104、Feature RAM(特征缓存)1022、DNN(深度神经网络单元)105、DNN RAM(深度神经网络缓存)1023、CPU(中央处理器)106和FLASH(闪存)107,信号接收转换单元101将外部声音输入信号转化为统一格式的数字信号,本实施例中的数字信号为PCM(脉冲编码调制)信号,被转化后的数字信号缓存入INPUT RAM1021,VAD103从INPUT RAM1021中读取数字信号进行语音检测,检测出数字信号中如果有语音信号,则VAD103会给FE104、DNN105和CPU106发出触发信号,使得FE104、DNN105和CPU106进入工作状态,FE104根据VAD103发出的触发信号从INPUT RAM1021中读取数字信号并从中提取语音特征,FE104将提取的语音特征存入Feature RAM1022供DNN105读取,DNN105从Feature RAM1022中读取语音特征进行计算并将计算结果缓存入DNN RAM1023供CPU106读取,CPU106从DNN RAM1023中读取计算结果同时从FLASH107中读取预存的语言库或者命令词模型库进行识别解码计算完成语音识别。
本实施例中,当VAD103检测到语音信号后,FE104和DNN105自动启动,在其他实施例中FE104和DNN105可以由CPU配置启动,FE104从INPUT RAM1021中读取含语音的数字信号,进行语音特征提取,FE104进行梅尔倒谱及基音提取,其结果输入Feature RAM1022中,Feature RAM1022中积累到一定待处理数据时,DNN105开始从Feature RAM1022中读取数据并进行DNN105计算,本实施例中,DNN105从供DNN105计算的DNN RAM1023中读取预存的DNN参数,并缓存DNN105计算结果到DNN RAM1023中,CPU106在进行语音识别解码时,从FLASH107中读取预存的语言库或命令词模型库,同时读取DNN计算结果进行识别解码计算完成语音识别,在其他实施例中CPU可以替换为GPU(图形处理器)、DSP(数字信号处理器)等其他的模块。
第二实施例
如图3所示,一种智能语音识别***,包括信号接收转换单元201、INPUT RAM(输入缓存)2021、VAD(语音检测单元)203、FE(语音特征提取单元)204、Feature RAM(特征缓存)2022、DNN(深度神经网络单元)205、DRAM控制器(动态随机存取存储器控制器)2023、CPU(中央处理器)206、FLASH(闪存)207和DRAM(动态随机存取存储器)208,开机时CPU206将外部存储器FLASH207预存的DNN参数、语音模型库等导入DRAM208中,信号接收转换单元201将外部声音输入信号转化为统一格式的数字信号,本实施例中的数字信号为PCM(脉冲编码调制)信号,被转化后的数字信号缓存入INPUT RAM2021,VAD203从INPUT RAM2021中读取数字信号进行语音检测,检测出数字信号中如果有语音信号,则VAD203会给FE204、DNN205和CPU206发出触发信号,使得FE204、DNN205和CPU206进入工作状态,FE204根据VAD203发出的触发信号从INPUT RAM2021中读取数字信号并从中提取语音特征,FE204将提取的语音特征存入Feature RAM2022供DNN205读取,DNN205从Feature RAM2022中读取语音特征进行计算并将计算结果通过DRAM 控制器2023缓存入DRAM208供CPU206读取,CPU206通过DRAM控制器2023从DRAM208中读取计算结果同时从DRAM208中读取预存的语言库或者命令词模型库进行解码完成语音识别。
在本实施例中使用了外部DRAM208,适用于对语音识别性能要求高,命令词条数较多的情况,在开机时,CPU206将外部存储器FLASH207预存的DNN参数、语音模型库等导入DRAM208中,在进行语音识别时,DNN205和CPU206从DRAM208中分别读取DNN参数和语言模型库,DNN205的计算结果输入到DRAM208中供CPU206访问,这样保证了较大的存储容量要求。
第三实施例
如图5所示,一种包含第一实施例所述的智能语音识别***的智能语音识别方法,其步骤如下:
步骤一301 信号接收转换单元接收外部声音输入信号并将外部声音输入信号转换为统一格式的数字信号,本实施例中外部声音输入信号为串行数字I2S(集成电路内置音频总线)信号,在其他实施例中外部声音输入信号还可以为PDM(脉冲密度调制)信号,或者是串行数字I2S信号和PDM信号的混合,被接收转换单元转换为PCM数字信号;
步骤二302 所述数字信号被存入INPUT RAM供其他单元读取;
步骤三303 VAD从INPUT RAM读取数字信号并检测是否有语音信号,如果否则终止流程,如果是则进入下一个步骤,在检测到语音信号的同时,VAD发送触发信号给FE、DNN和CPU,触发FE、DNN和CPU从非工作状态进入工作状态;
步骤四304 FE从INPUT RAM读取含语音的数字信号并从中提取语音特征;
步骤五305 所述语音特征被存入Feature RAM;
步骤六306 DNN从Feature RAM中读取所述语音特征并进行计算得到计算结果;
步骤七307 所述计算结果被存入DNN RAM;
步骤八308 CPU从DNN RAM读取所述计算结果同时从FLASH中读取预存的语言库或者命令词模型库进行识别解码。
CPU在开机时将预存在FLASH中的DNN参数导入DNN RAM中。
第四实施例
如图6所示,一种包含第二实施例所述的智能语音识别***的智能语音识别方法,其步骤如下:
步骤一401 信号接收转换单元接收外部声音输入信号并将外部声音输入信号转换为统一格式的数字信号,本实施例中外部声音输入信号为PDM信号,在其他实施例中外部声音输入信号还可以为串行数字I2S信号,或者是PDM信号和串行数字I2S信号的混合,被接收转换单元转换为PCM数字信号;
步骤二402 所述数字信号被存入INPUT RAM供其他单元读取;
步骤三403 VAD从INPUT RAM读取数字信号并检测是否有语音信号,如果否则终止流程,如果是则进入下一个步骤,在检测到语音信号的同时,VAD发送触发信号给FE、DNN和CPU,触发FE、DNN和CPU从非工作状态进入工作状态;
步骤四404 FE从INPUT RAM读取含语音的数字信号并从中提取语音特征;
步骤五405 所述语音特征被存入Feature RAM;
步骤六406 DNN从Feature RAM中读取所述语音特征并进行计算得到计算结果;
步骤七407 所述计算结果通过DRAM控制器被存入DRAM;
步骤八408 CPU通过DRAM控制器从DRAM读取所述计算结果和预存的语言库或者命令词模型库进行识别解码。
CPU在开机时将预存在FLASH中的DNN参数和语言模型库导入DRAM中。
以上是本发明的四个实施方式,对于本领域内的一般技术人员,不花费创造性的劳动,在上述实施例的基础上可以做多种变化,同样能够实现本发明的目的,但是,这种变化显然应该在本发明的权利要求书的保护范围内。

Claims (3)

1.一种智能语音识别***,其包括信号接收转换单元、存储管理单元、语音检测单元、语音特征提取单元、深度神经网络单元和识别解码单元,所述信号接收转换单元接收外部声音输入信号并将所述外部声音输入信号转换为统一格式的数字信号,所述数字信号被存入所述存储管理单元,所述语音检测单元从所述存储单元中读取所述数字信号进行检测获得检测结果并发送触发信号给所述语音特征提取单元、深度神经网络单元和识别解码单元,触发所述语音特征提取单元、深度神经网络单元和识别解码单元从非工作状态进入工作状态,所述语音特征提取单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述数字信号并从中提取语音特征,所述语音特征提取单元将语音特征存入所述存储管理单元,所述深度神经网络单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述语音特征进行计算,并将计算结果存入所述存储管理单元,所述识别解码单元根据所述语音检测单元的检测结果从所述存储管理单元读取所述计算结果进行解码完成语音识别;所述存储管理单元包含数字信号存储模块、语音特征存储模块和计算结果存储模块,所述数字信号存储模块存储所述数字信号供所述语音检测单元和所述语音特征提取单元读取,所述语音特征存储模块存储所述语音特征并供所述深度神经网络单元读取,所述计算结果存储模块存储所述计算结果并供所述识别解码单元读取进行解码,所述语音检测单元、语音特征提取单元、深度神经网络单元均采用固化的芯片逻辑电路,所述识别解码单元采用嵌入式软件或硬件。
2.根据权利要求1所述的智能语音识别***,其特征在于:所述深度神经网络单元由输入层、隐含层和输出层构成,所述输入层可配置特征矢量大小,所述隐含层可配置层数和神经元节点个数,所述输出层可配置输出大小。
3.一种包含如权利要求1所述的智能语音识别***的智能语音识别方法,其步骤如下:A所述信号接收转换单元接收所述外部声音输入信号并将所述外部声音输入信号转化为统一格式的数字信号;B 所述数字信号被存入所述存储管理单元;C 所述语音检测单元从所述存储管理单元读取所述数字信号并检测是否有语音信号,如果否则终止流程,如果是则进入下一个步骤;D 所述语音特征提取单元从所述存储管理单元读取所述数字信号并从中提取语音特征;E 所述语音特征被存入所述存储管理单元;F 所述深度神经网络单元从所述存储管理单元读取所述语音特征并进行计算得到计算结果;G 所述计算结果被存入所述存储管理单元;H 所述识别解码单元从所述存储管理单元读取所述计算结果进行识别解码。
CN201610240242.7A 2016-04-18 2016-04-18 一种智能语音识别***及方法 Active CN105976808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610240242.7A CN105976808B (zh) 2016-04-18 2016-04-18 一种智能语音识别***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610240242.7A CN105976808B (zh) 2016-04-18 2016-04-18 一种智能语音识别***及方法

Publications (2)

Publication Number Publication Date
CN105976808A CN105976808A (zh) 2016-09-28
CN105976808B true CN105976808B (zh) 2023-07-25

Family

ID=56993129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610240242.7A Active CN105976808B (zh) 2016-04-18 2016-04-18 一种智能语音识别***及方法

Country Status (1)

Country Link
CN (1) CN105976808B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147773B (zh) * 2017-06-16 2021-10-26 上海寒武纪信息科技有限公司 一种语音识别装置和方法
CN107360327B (zh) * 2017-07-19 2021-05-07 腾讯科技(深圳)有限公司 语音识别方法、装置和存储介质
CN109616115B (zh) * 2018-12-29 2022-02-15 北京知存科技有限公司 一种语音处理芯片、***与方法
CN110211592A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音数据处理装置及方法
CN110310635B (zh) * 2019-06-24 2022-03-22 Oppo广东移动通信有限公司 语音处理电路及电子设备
CN111933123A (zh) * 2020-09-15 2020-11-13 成都启英泰伦科技有限公司 一种基于门控循环单元的声学建模方法
CN114944155B (zh) * 2021-02-14 2024-06-04 成都启英泰伦科技有限公司 一种终端硬件和算法软件处理相结合的离线语音识别方法
CN113326918A (zh) * 2021-04-29 2021-08-31 杭州微纳核芯电子科技有限公司 特征提取电路、神经网络、***、集成电路、芯片及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543083A (zh) * 2012-03-16 2012-07-04 北京海尔集成电路设计有限公司 智能语音识别方法和芯片、云设备以及云服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119377A (ja) * 2004-10-21 2006-05-11 Canon Electronics Inc 音声入力装置及び方法、並びにプログラム及び記憶媒体
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543083A (zh) * 2012-03-16 2012-07-04 北京海尔集成电路设计有限公司 智能语音识别方法和芯片、云设备以及云服务器

Also Published As

Publication number Publication date
CN105976808A (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
CN105976808B (zh) 一种智能语音识别***及方法
JP6453917B2 (ja) 音声ウェイクアップ方法及び装置
US20160086603A1 (en) Power-Efficient Voice Activation
JP6801095B2 (ja) 音声制御システム及びそのウェイクアップ方法、ウェイクアップ装置、並びに家電製品、コプロセッサ
TWI802602B (zh) 用於語音喚醒(wov)關鍵詞註冊的處理器實現的方法和系統
US10325593B2 (en) Method and device for waking up via speech based on artificial intelligence
CN104143327B (zh) 一种声学模型训练方法和装置
Zheng et al. An ultra-low power binarized convolutional neural network-based speech recognition processor with on-chip self-learning
CN108010515A (zh) 一种语音端点检测和唤醒方法及装置
US10789941B2 (en) Acoustic event detector with reduced resource consumption
CN111192590B (zh) 语音唤醒方法、装置、设备及存储介质
CN111599371A (zh) 语音增加方法、***、装置及存储介质
JP2022028879A (ja) 音声データの処理方法、装置、機器及び記憶媒体
CN104850516B (zh) 一种ddr变频设计方法和装置
KR20150105847A (ko) 음성구간 검출 방법 및 장치
CN113012689B (zh) 一种电子设备和深度学习硬件加速方法
CN111276133A (zh) 音频识别方法、***、移动终端及存储介质
CN112669818B (zh) 语音唤醒方法及装置、可读存储介质、电子设备
He et al. Design and Implementation of Embedded Real‐Time English Speech Recognition System Based on Big Data Analysis
WO2019127926A1 (zh) 一种稀疏神经网络的计算方法及计算装置、电子装置、计算机可读存储介质以及计算机程序产品
CN112289311B (zh) 语音唤醒方法、装置、电子设备及存储介质
Zhu et al. AAD-KWS: a sub-$\mu\mathrm {W} $ keyword spotting chip with a zero-cost, acoustic activity detector from a 170nW MFCC feature extractor in 28nm CMOS
CN112735469B (zh) 低内存语音关键词检测方法、***、介质、设备及终端
CN114937449B (zh) 一种语音关键词识别方法及***
CN111325016B (zh) 一种文本处理方法、***、设备、介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant