CN110610710A - 一种自学习语音识别***的构建装置和构建方法 - Google Patents

一种自学习语音识别***的构建装置和构建方法 Download PDF

Info

Publication number
CN110610710A
CN110610710A CN201910838612.0A CN201910838612A CN110610710A CN 110610710 A CN110610710 A CN 110610710A CN 201910838612 A CN201910838612 A CN 201910838612A CN 110610710 A CN110610710 A CN 110610710A
Authority
CN
China
Prior art keywords
wave
output
speech recognition
recognition system
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910838612.0A
Other languages
English (en)
Other versions
CN110610710B (zh
Inventor
樊茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amlogic Shanghai Co Ltd
Amlogic Inc
Original Assignee
Amlogic Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amlogic Shanghai Co Ltd filed Critical Amlogic Shanghai Co Ltd
Priority to CN201910838612.0A priority Critical patent/CN110610710B/zh
Publication of CN110610710A publication Critical patent/CN110610710A/zh
Priority to PCT/CN2020/109393 priority patent/WO2021042969A1/zh
Application granted granted Critical
Publication of CN110610710B publication Critical patent/CN110610710B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/18Artificial neural networks; Connectionist approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种自学习语音识别***的构建装置和构建方法,其中构建装置应用于语音识别***中,语音识别***包括麦克风和应用有构建装置的语音识别模块,麦克风和语音识别模块连接,构建装置包括分析单元,用于将麦克风的输出信号进行分析以得到多个信号参数;识别单元,与分析单元连接,根据信号参数判断输出信号是否为预设的激活语音。本发明的有益效果在于,通过激活语音进行唤醒工作,从而实现在待机过程中的电源模块、ADC和CPU进行睡眠,以降低待机过程中的能源消耗。

Description

一种自学习语音识别***的构建装置和构建方法
技术领域
本发明涉及声音识别技术领域,尤其涉及一种自学习语音识别***的构建装置和构建方法。
背景技术
随着计算机应用技术的快速发展,语音或者其他类型声音识别技术的应用越来越广泛,对声音识别的需求也越来越多。目前的超高清智能电视,智能音箱在待机的期间,仍然需要保留语音唤醒功能,因此语音识别***仍然需要工作,即电源模块,ADC(Analog-to-Digital Converter,模数转换器),CPU(Central Processing Unit,中央处理器)都还在工作模式,使得待机过程中消耗大量能源。
发明内容
针对现有技术中存在的上述问题,现提供一种旨在降低待机过程中的能源消耗的自学习语音识别***的构建装置。
具体技术方案如下:
一种自学习语音识别***的构建装置,应用于语音识别***中,语音识别***包括麦克风和应用有构建装置的语音识别模块,麦克风和语音识别模块连接,其中,构建装置包括:
分析单元,用于将麦克风的输出信号进行分析以得到多个信号参数;
识别单元,与分析单元连接,根据信号参数判断输出信号是否为预设的激活语音。
优选的,自学习语音识别***的构建装置,其中,输出信号为波形信号。
优选的,自学习语音识别***的构建装置,其中,分析单元将每个类型的信号参数依次保存到对应的序列中,并将每个序列的信号参数输出到识别单元中。
优选的,自学习语音识别***的构建装置,其中,
识别单元为神经网络,神经网路包括:
第一计算单元,用于根据多个序列的信号参数输出第一输出参数;
第二计算单元,用于根据多个序列的信号参数输出第二输出参数;
第三计算单元,用于根据对应序列的信号参数输出第三输出参数;
第四计算单元,用于根据对应序列的信号参数输出第四输出参数;
隐层,包括多个第一节点,每个第一节点均与第一计算单元、第二计算单元、第三计算单元和第四计算单元连接,每个第一节点设置一个激活语音的一个特征信息,第一节点接收并判断第一输出参数、第二输出参数、第三输出参数和第四输出参数是否符合对应的特征信息,并将判断结果输出;
输出层,包括多个第二节点,每个第二节点与每个第一节点连接,每个第二节点设置对应的一个激活语音,根据判断结果判断输出信号是否符合激活语音。
优选的,自学习语音识别***的构建装置,其中,信号参数的类型包括波谷、波峰、以及相邻的波谷和波峰之间的间隔时间。
优选的,自学习语音识别***的构建装置,其中,第一输出参数为包络值;和/或
第二输出参数为相邻的波谷和波峰组成的波沿的数量;和/或
第三输出参数为相邻的两个波谷的差;和/或
第四输出参数为相邻的两个波峰的差。
优选的,自学习语音识别***的构建装置,其中,
第一计算单元通过波谷、波峰和间隔时间进行计算得到包络值;和/或
第二计算单元通过波谷和波峰进行计算得到相邻的波谷和波峰组成的波沿的数量;和/或
第三计算单元通过波谷进行计算得到相邻的两个波谷的差;和/或
第四计算单元通过波峰进行计算得到相邻的两个波峰的差。
还包括一种自学习语音识别***的构建方法,应用于语音识别***中,语音识别***包括麦克风和应用有构建装置的语音识别模块,麦克风和语音识别模块连接,其中,构建方法包括以下步骤:
步骤S1,将麦克风的输出信号进行分析以得到多个信号参数;
步骤S2,根据信号参数判断输出信号是否为预设的激活语音。
优选的,自学习语音识别***的构建装置,其中,
步骤S2中,提供一神经网络,通过神经网络判断输出信号是否为预设的激活语音。
优选的,自学习语音识别***的构建装置,其中,神经网路包括:
第一计算单元,用于根据波谷、波峰和间隔时间输出包络值;
第二计算单元,用于根据波谷和波峰输出相邻的波谷和波峰组成的波沿的数量;
第三计算单元,用于根据波谷输出相邻的两个波谷的差;
第四计算单元,用于根据波峰输出相邻的两个波峰的差;
隐层,包括多个第一节点,每个第一节点均与第一计算单元、第二计算单元、第三计算单元和第四计算单元连接,每个第一节点设置一个激活语音的一个特征信息,第一节点接收并判断包络值、波沿的数量、相邻的两个波谷的差和相邻的两个波峰的差是否符合对应的特征信息,并将判断结果输出;
输出层,包括多个第二节点,每个第二节点与每个第一节点连接,每个第二节点设置对应的激活语音,根据判断结果判断输出信号是否符合激活语音;
步骤S2包括以下步骤:
步骤S21,通过波谷、波峰和间隔时间进行计算得到包络值;和
通过波谷和波峰进行计算得到相邻的波谷和波峰组成的波沿的数量;和
通过波谷进行计算得到相邻的两个波谷的差;和
通过波峰进行计算得到相邻的两个波峰的差;
步骤S22,每个第一节点接收并将判断包络值、波沿的数量、相邻的两个波谷的差和相邻的两个波峰的差是否符合特征信息,并将判断结果输出;
步骤S23,每个第二节点根据判断结果判断输出信号是否符合激活语音,并输出判断结果。
上述技术方案具有如下优点或有益效果:通过激活语音进行唤醒工作,从而实现在待机过程中的电源模块、ADC和CPU进行睡眠,以降低待机过程中的能源消耗。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1为本发明自学习语音识别***的构建装置实施例的结构示意图;
图2为本发明自学习语音识别***的构建装置实施例的神经网络的结构示意图;
图3为本发明自学习语音识别***的构建方法实施例的流程图;
图4为本发明自学习语音识别***的构建方法实施例步骤S2的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明包括一种自学习语音识别***的构建装置,应用于语音识别***中,语音识别***包括麦克风和应用有构建装置的语音识别模块,麦克风和语音识别模块连接,如图1所示,构建装置包括:
分析单元,用于将麦克风的输出信号进行分析以得到多个信号参数;
识别单元,与分析单元连接,根据信号参数判断输出信号是否为预设的激活语音。
在上述实施例中,通过识别单元识别分析单元中的信号参数是否为预设的激活语音,通过激活语音进行唤醒工作,从而实现在待机过程中的电源模块、ADC和CPU进行睡眠,以降低待机过程中的能源消耗。
其中,预设的激活语音可以为预设数量,其中预设数量可以2个、3个、4个,由于预设的激活语音是根据隐层中的第一节点获得的,因此预设的激活语音不要太多,以降低能源消耗。
进一步地,在上述实施例中,输出信号为波形信号。从而可以在波形信号中获取多个信号参数,例如,上述信号参数的类型可以包括波谷、波峰、以及相邻的波谷和波峰之间的间隔时间。
进一步地,在上述实施例中,分析单元可以将每个类型的信号参数依次保存到对应的序列中,并将每个序列的信号参数输出到识别单元中。
例如,波谷所在的序列可以为{drop1,drop2,……dropn},其中,drop用于表示波谷;
波峰所在的序列可以为{rise1,rise2,……risen},其中,rise用于表示波峰;
间隔时间所在的序列可以为{T1,T2,……Tn},其中,T用于表示间隔时间。
进一步地,在上述实施例中,识别单元可以为神经网络,如图2所示,神经网路包括:
第一计算单元10,用于根据多个序列的信号参数输出第一输出参数;
第二计算单元20,用于根据多个序列的信号参数输出第二输出参数;
第三计算单元30,用于根据对应序列的信号参数输出第三输出参数;
第四计算单元40,用于根据对应序列的信号参数输出第四输出参数;
隐层,包括多个第一节点50,每个第一节点50均与第一计算单元10、第二计算单元20、第三计算单元30和第四计算单元40连接,每个第一节点50设置一个激活语音的一个特征信息,第一节点50接收并判断第一输出参数、第二输出参数、第三输出参数和第四输出参数是否符合对应的特征信息,并将判断结果输出;
输出层,包括多个第二节点60,每个第二节点60与每个第一节点50连接,每个第二节点60设置对应的一个激活语音,根据判断结果判断输出信号是否符合激活语音。
其中,上述隐层的数量可以根据用户的需求进行自设定。
在上述神经网络中,每一个节点都可以为滤波器。
进一步地,作为优选的实施方式,第一输出参数为包络值;
第二输出参数为相邻的波谷和波峰组成的波沿的数量;
第三输出参数为相邻的两个波谷的差;
第四输出参数为相邻的两个波峰的差。并且第一计算单元10通过波谷、波峰和间隔时间进行计算得到包络值;
第二计算单元20通过波谷和波峰进行计算得到相邻的波谷和波峰组成的波沿的数量;
第三计算单元30通过波谷进行计算得到相邻的两个波谷的差;
第四计算单元40通过波峰进行计算得到相邻的两个波峰的差。
其中,需要说明的是,上述相邻的两个波谷的差为波谷序列中的前一个波谷减去后一个波谷的差;上述相邻的两个波峰的差为波峰序列中的前一个波峰减去后一个波峰的差。
进一步地,神经网络可以设定多个预设的激活语音进行训练,将上述预设的激活语音对应的输出信号中的信号参数输入到神经网络中,神经网络中的第一计算单元10根据波谷、波峰和间隔时间进行计算得到包络值,第二计算单元20根据波谷和波峰进行计算得到相邻的波谷和波峰组成的波沿的数量,第三计算单元30根据波谷进行计算得到相邻的两个波谷的差,第四计算单元40根据波峰进行计算得到相邻的两个波峰的差,隐层中的每个第一节点50接收并将判断包络值、波沿的数量、相邻的两个波谷的差和相邻的两个波峰的差是否符合特征信息,并将判断结果输出,输出层中的每个第二节点60根据判断结果判断输出信号是否符合激活语音,并输出判断结果当输出信号为对应的激活语音时,重复输入预设的激活语音对应的输出信号中的信号参数进行训练;当输出信号不为对应的激活语音时,调整判断结果对应的第一节点50的权值,继续输入该输出信号中的信号参数进行训练,直至输出层判断该输出信号为对应的激活语音时,输入其他预设的激活语音对应的输出信号中的信号参数进行训练,从而实现预测得到输出信号对应的激活语音。
可以通过逻辑值来表示判断结果,例如,预设的激活语音在对应的第二节点60中的逻辑值为1010101010,在神经网络中输入上述预设的激活语音对应的输出信号中的信号参数,隐层中的每个第一节点50接收并将判断输出参数是否符合特征信息,当输出参数符合特征信息时,输出判断结果对应的逻辑值为1;当输出参数不符合特征信息时,输出判断结果对应的逻辑值为0;输出层的第二节点60根据接收到的判断结果判断输出信号是否符合预设的激活语音,当判断结果为对应的逻辑值1010101010时,第二节点60输出判断结果对应的逻辑值为1,以表示输出信号符合上述预设的激活语音;当判断结果不为对应的逻辑值1010101010时,第二节点60输出判断结果对应的逻辑值为0,以表示输出信号不符合上述预设的激活语音。
还包括一种自学习语音识别***的构建方法,应用于语音识别***中,语音识别***包括麦克风和应用有构建装置的语音识别模块,麦克风和语音识别模块连接,如图4所示,构建方法包括以下步骤:
步骤S1,将麦克风的输出信号进行分析以得到多个信号参数;
步骤S2,根据信号参数判断输出信号是否为预设的激活语音。
在上述实施例中,通过分析信号参数是否为预设的激活语音,通过激活语音进行唤醒工作,从而实现在待机过程中的电源模块、ADC和CPU进行睡眠,以降低待机过程中的能源消耗。
进一步地,在上述实施例中,步骤S2中,提供一神经网络,通过神经网络判断输出信号是否为预设的激活语音。
神经网路包括:
第一计算单元10,用于根据波谷、波峰和间隔时间输出包络值;
第二计算单元20,用于根据波谷和波峰输出相邻的波谷和波峰组成的波沿的数量;
第三计算单元30,用于根据波谷输出相邻的两个波谷的差;
第四计算单元40,用于根据波峰输出相邻的两个波峰的差;
隐层,包括多个第一节点50,每个第一节点50均与第一计算单元10、第二计算单元20、第三计算单元30和第四计算单元40连接,每个第一节点50设置一个激活语音的一个特征信息,第一节点50接收并判断包络值、波沿的数量、相邻的两个波谷的差和相邻的两个波峰的差是否符合对应的特征信息,并将判断结果输出;
输出层,包括多个第二节点60,每个第二节点60与每个第一节点50连接,每个第二节点60设置对应的激活语音,根据判断结果判断输出信号是否符合激活语音;
步骤S2包括以下步骤:
步骤S21,通过波谷、波峰和间隔时间进行计算得到包络值;和
通过波谷和波峰进行计算得到相邻的波谷和波峰组成的波沿的数量;和
通过波谷进行计算得到相邻的两个波谷的差;和
通过波峰进行计算得到相邻的两个波峰的差;
步骤S22,每个第一节点50接收并将判断包络值、波沿的数量、相邻的两个波谷的差和相邻的两个波峰的差是否符合特征信息,并将判断结果输出;
步骤S23,每个第二节点60根据判断结果判断输出信号是否符合激活语音,并输出判断结果。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (10)

1.一种自学习语音识别***的构建装置,应用于所述语音识别***中,所述语音识别***包括麦克风和应用有所述构建装置的语音识别模块,所述麦克风和所述语音识别模块连接,其特征在于,所述构建装置包括:
一分析单元,用于将所述麦克风的输出信号进行分析以得到多个信号参数;
一识别单元,与所述分析单元连接,根据所述信号参数判断所述输出信号是否为预设的激活语音。
2.如权利要求1所述的自学习语音识别***的构建装置,其特征在于,所述输出信号为波形信号。
3.如权利要求1所述的自学习语音识别***的构建装置,其特征在于,所述分析单元将每个类型的信号参数依次保存到对应的序列中,并将每个所述序列的所述信号参数输出到所述识别单元中。
4.如权利要求3所述的自学习语音识别***的构建装置,其特征在于,
所述识别单元为神经网络,所述神经网路包括:
第一计算单元,用于根据多个序列的信号参数输出第一输出参数;
第二计算单元,用于根据多个序列的信号参数输出第二输出参数;
第三计算单元,用于根据对应序列的信号参数输出第三输出参数;
第四计算单元,用于根据对应序列的信号参数输出第四输出参数;
隐层,包括多个第一节点,每个所述第一节点均与所述第一计算单元、所述第二计算单元、所述第三计算单元和所述第四计算单元连接,每个所述第一节点设置一个所述激活语音的一个特征信息,所述第一节点接收并判断所述第一输出参数、所述第二输出参数、所述第三输出参数和所述第四输出参数是否符合对应的所述特征信息,并将判断结果输出;
输出层,包括多个第二节点,每个所述第二节点与每个所述第一节点连接,每个所述第二节点设置对应的一个激活语音,根据所述判断结果判断所述输出信号是否符合所述激活语音。
5.如权利要求3所述的自学习语音识别***的构建装置,其特征在于,所述信号参数的类型包括波谷、波峰、以及相邻的所述波谷和所述波峰之间的间隔时间。
6.如权利要求5所述的自学习语音识别***的构建装置,其特征在于,
所述第一输出参数为包络值;和/或
所述第二输出参数为相邻的所述波谷和所述波峰组成的波沿的数量;和/或
所述第三输出参数为相邻的两个所述波谷的差;和/或
所述第四输出参数为相邻的两个所述波峰的差。
7.如权利要求6所述的自学习语音识别***的构建装置,其特征在于,
所述第一计算单元通过所述波谷、所述波峰和所述间隔时间进行计算得到所述包络值;和/或
所述第二计算单元通过所述波谷和所述波峰进行计算得到相邻的所述波谷和所述波峰组成的所述波沿的数量;和/或
所述第三计算单元通过所述波谷进行计算得到相邻的两个所述波谷的差;和/或
所述第四计算单元通过所述波峰进行计算得到相邻的两个所述波峰的差。
8.一种自学习语音识别***的构建方法,应用于所述语音识别***中,所述语音识别***包括麦克风和应用有所述构建装置的语音识别模块,所述麦克风和所述语音识别模块连接,其特征在于,所述构建方法包括以下步骤:
步骤S1,将所述麦克风的输出信号进行分析以得到多个信号参数;
步骤S2,根据所述信号参数判断所述输出信号是否为预设的激活语音。
9.如权利要求8所述的自学习语音识别***的构建方法,其特征在于,所述步骤S2中,提供一神经网络,通过所述神经网络判断所述输出信号是否为预设的激活语音。
10.如权利要求9所述的自学习语音识别***的构建方法,其特征在于,所述神经网路包括:
第一计算单元,用于根据波谷、波峰和间隔时间输出包络值;
第二计算单元,用于根据所述波谷和所述波峰输出相邻的所述波谷和所述波峰组成的波沿的数量;
第三计算单元,用于根据所述波谷输出相邻的两个所述波谷的差;
第四计算单元,用于根据所述波峰输出相邻的两个所述波峰的差;
隐层,包括多个第一节点,每个所述第一节点均与所述第一计算单元、所述第二计算单元、所述第三计算单元和所述第四计算单元连接,每个所述第一节点设置一个所述激活语音的一个特征信息,所述第一节点接收并判断所述包络值、所述波沿的数量、相邻的两个所述波谷的差和相邻的两个所述波峰的差是否符合对应的所述特征信息,并将判断结果输出;
输出层,包括多个第二节点,每个所述第二节点与每个所述第一节点连接,每个所述第二节点设置对应的激活语音,根据所述判断结果判断所述输出信号是否符合所述激活语音;
所述步骤S2包括以下步骤:
步骤S21,通过所述波谷、所述波峰和所述间隔时间进行计算得到所述包络值;和
通过所述波谷和所述波峰进行计算得到相邻的所述波谷和所述波峰组成的所述波沿的数量;和
通过所述波谷进行计算得到相邻的两个所述波谷的差;和
通过所述波峰进行计算得到相邻的两个所述波峰的差;
步骤S22,每个所述第一节点接收并将判断所述包络值、所述波沿的数量、相邻的两个所述波谷的差和相邻的两个所述波峰的差是否符合所述特征信息,并将判断结果输出;
步骤S23,每个所述第二节点根据所述判断结果判断所述输出信号是否符合所述激活语音,并输出判断结果。
CN201910838612.0A 2019-09-05 2019-09-05 一种自学习语音识别***的构建装置和构建方法 Active CN110610710B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910838612.0A CN110610710B (zh) 2019-09-05 2019-09-05 一种自学习语音识别***的构建装置和构建方法
PCT/CN2020/109393 WO2021042969A1 (zh) 2019-09-05 2020-08-14 一种自学习语音识别***的构建装置和构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910838612.0A CN110610710B (zh) 2019-09-05 2019-09-05 一种自学习语音识别***的构建装置和构建方法

Publications (2)

Publication Number Publication Date
CN110610710A true CN110610710A (zh) 2019-12-24
CN110610710B CN110610710B (zh) 2022-04-01

Family

ID=68892341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910838612.0A Active CN110610710B (zh) 2019-09-05 2019-09-05 一种自学习语音识别***的构建装置和构建方法

Country Status (2)

Country Link
CN (1) CN110610710B (zh)
WO (1) WO2021042969A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021042969A1 (zh) * 2019-09-05 2021-03-11 晶晨半导体(上海)股份有限公司 一种自学习语音识别***的构建装置和构建方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150301796A1 (en) * 2014-04-17 2015-10-22 Qualcomm Incorporated Speaker verification
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105741838A (zh) * 2016-01-20 2016-07-06 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
CN107102713A (zh) * 2016-02-19 2017-08-29 北京君正集成电路股份有限公司 一种降低功耗的方法及装置
US20180254041A1 (en) * 2016-04-11 2018-09-06 Sonde Health, Inc. System and method for activation of voice interactive services based on user state
CN108538305A (zh) * 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
CN108922553A (zh) * 2018-07-19 2018-11-30 苏州思必驰信息科技有限公司 用于音箱设备的波达方向估计方法及***
CN109166571A (zh) * 2018-08-06 2019-01-08 广东美的厨房电器制造有限公司 家电设备的唤醒词训练方法、装置及家电设备
CN109360585A (zh) * 2018-12-19 2019-02-19 晶晨半导体(上海)股份有限公司 一种语音激活检测方法
US20190214002A1 (en) * 2018-01-09 2019-07-11 Lg Electronics Inc. Electronic device and method of controlling the same

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11189273B2 (en) * 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
CN110610710B (zh) * 2019-09-05 2022-04-01 晶晨半导体(上海)股份有限公司 一种自学习语音识别***的构建装置和构建方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150301796A1 (en) * 2014-04-17 2015-10-22 Qualcomm Incorporated Speaker verification
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105741838A (zh) * 2016-01-20 2016-07-06 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
CN107102713A (zh) * 2016-02-19 2017-08-29 北京君正集成电路股份有限公司 一种降低功耗的方法及装置
US20180254041A1 (en) * 2016-04-11 2018-09-06 Sonde Health, Inc. System and method for activation of voice interactive services based on user state
US20190214002A1 (en) * 2018-01-09 2019-07-11 Lg Electronics Inc. Electronic device and method of controlling the same
CN108538305A (zh) * 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
CN108922553A (zh) * 2018-07-19 2018-11-30 苏州思必驰信息科技有限公司 用于音箱设备的波达方向估计方法及***
CN109166571A (zh) * 2018-08-06 2019-01-08 广东美的厨房电器制造有限公司 家电设备的唤醒词训练方法、装置及家电设备
CN109360585A (zh) * 2018-12-19 2019-02-19 晶晨半导体(上海)股份有限公司 一种语音激活检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JWU-SHENG HU,ET AL.: "Wake-up-word detection by estimating formants from spatial eigenspace information", 《2012 IEEE INTERNATIONAL CONFERENCE ON MECHATRONICS AND AUTOMATION》 *
李燕诚等: "基于似然比测试的语音激活检测算法", 《计算机工程 》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021042969A1 (zh) * 2019-09-05 2021-03-11 晶晨半导体(上海)股份有限公司 一种自学习语音识别***的构建装置和构建方法

Also Published As

Publication number Publication date
CN110610710B (zh) 2022-04-01
WO2021042969A1 (zh) 2021-03-11

Similar Documents

Publication Publication Date Title
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN110473536B (zh) 一种唤醒方法、装置和智能设备
CN106448663A (zh) 语音唤醒方法及语音交互装置
CN107767863A (zh) 语音唤醒方法、***及智能终端
CN105741838A (zh) 语音唤醒方法及装置
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
WO2021098153A1 (zh) 目标用户改变的检测方法、***、电子设备和存储介质
EP3739582A1 (en) Voice detection
CN110767231A (zh) 一种基于时延神经网络的声控设备唤醒词识别方法及装置
CN104282307A (zh) 唤醒语音控制***的方法、装置及终端
CN103956164A (zh) 一种声音唤醒方法及***
CN108509225B (zh) 一种信息处理方法及电子设备
CN110610710B (zh) 一种自学习语音识别***的构建装置和构建方法
CN111312222A (zh) 一种唤醒、语音识别模型训练方法及装置
CN104751227A (zh) 深度神经网络的构建方法及***
CN111429901A (zh) 一种面向IoT芯片的多级语音智能唤醒方法及***
CN111179944B (zh) 语音唤醒及年龄检测方法、装置及计算机可读存储介质
CN111508493A (zh) 语音唤醒方法、装置、电子设备及存储介质
CN111091819A (zh) 语音识别装置和方法、语音交互***和方法
CN113782009A (zh) 一种基于Savitzky-Golay滤波器平滑方法的语音唤醒***
CN111223489B (zh) 一种基于Attention注意力机制的特定关键词识别方法及***
WO2023010861A1 (zh) 一种唤醒处理方法、装置、设备和计算机存储介质
CN109961804B (zh) 智能设备满意度评估方法、装置及存储介质
CN111192590A (zh) 语音唤醒方法、装置、设备及存储介质
CN111192588A (zh) 一种***唤醒方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant