CN108039174A - 语音识别***、方法和装置 - Google Patents

语音识别***、方法和装置 Download PDF

Info

Publication number
CN108039174A
CN108039174A CN201810015848.XA CN201810015848A CN108039174A CN 108039174 A CN108039174 A CN 108039174A CN 201810015848 A CN201810015848 A CN 201810015848A CN 108039174 A CN108039174 A CN 108039174A
Authority
CN
China
Prior art keywords
voice
speech recognition
microphone array
plate
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810015848.XA
Other languages
English (en)
Inventor
毛跃辉
梁博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201810015848.XA priority Critical patent/CN108039174A/zh
Publication of CN108039174A publication Critical patent/CN108039174A/zh
Priority to PCT/CN2018/118962 priority patent/WO2019134473A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音识别***、方法和装置。其中,该***包括:麦克风阵列和语音识别设备,其中,麦克风阵列,用于采集语音;语音识别设备包括:语音板和扬声器,其中,语音板,与麦克风阵列通信,用于接收麦克风阵列采集的语音,并对接收到的语音进行识别,得到识别结果;扬声器,与语音板通信,用于对语音板识别出的识别结果进行播报;其中,麦克风阵列外置于语音识别设备。本发明解决了由于麦克风阵列和扬声器安装位置限制造成的声学回音消除AEC调试及所在电器结构设计困难的技术问题。

Description

语音识别***、方法和装置
技术领域
本发明涉及空调语音控制领域,具体而言,涉及一种语音识别***、方法和装置。
背景技术
在相关技术中,对空调进行控制时,控制的方式多种多样,例如,可以直接采用空调控制器进行控制,也可以依据手势进行控制,还可以依据语音进行控制。在空调语音控制中,语音识别***主要由麦克风阵列、语音模块、扬声器组成,相关技术中在产品上设计时,常把麦克风阵列设计在产品结构中,同时扬声器也内置在产品结构中,受两者安装位置的限制,麦克风阵列和扬声器距离比较近,容易造成语音识别***中的声学回音消除AEC(Acoustic Echo Chancellor)调试比较困难,同时结构设计与外观设计需求也比较难结合。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音识别***、方法和装置,以至少解决由于麦克风阵列和扬声器安装位置限制造成的声学回音消除AEC调试及所在电器结构设计困难的技术问题。
根据本发明实施例的一个方面,提供了一种语音识别***,包括:麦克风阵列和语音识别设备,其中,麦克风阵列,用于采集语音;所述语音识别设备包括:语音板和扬声器,其中,所述语音板,与所述麦克风阵列通信,用于接收所述麦克风阵列采集的语音,并对接收到的所述语音进行识别,得到识别结果;所述扬声器,与所述语音板通信,用于对所述语音板识别出的识别结果进行播报;其中,所述麦克风阵列外置于所述语音识别设备。
可选的,所述语音板为多个,所述多个语音板分别位于不同的地理位置。
根据本发明实施例的另一方面,还提供了一种语音识别方法,包括:接收麦克风阵列采集的语音;通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。
可选的,通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到所述识别结果包括:确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:语音和与该语音对应的识别结果;通过语音识别设备中的语音板采用确定的所述语音识别模型,识别出所述麦克风阵列采集的语音对应的识别结果。
可选的,确定用于语音识别的所述语音识别模型包括:采样不同年龄段,不同音色的用户的语音,以及与采样的语音对应的识别结果;对采样的语音以及与采样的语音对应的识别结果进行训练,得到所述语音识别模型。
可选的,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,还包括:在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;根据所述唤醒词唤醒将要进行语音识别的语音板。
可选的,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,还包括:从所述识别结果中解析出用于控制预定电器的控制指令;将所述控制指令发送给控制所述预定电器的电器主控。
根据本发明实施例的另一方面,还提供了一种语音识别装置,包括:第一接收模块,用于接收麦克风阵列采集的语音;得到模块,用于通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;播报模块,用于通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。
可选的,所述得到模块包括:确定单元,用于确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:语音和与该语音对应的识别结果;识别单元,用于通过语音识别设备中的语音板采用确定的所述语音识别模型,识别出所述麦克风阵列采集的语音对应的识别结果。
可选的,所述语音识别装置还包括:第二接收模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;唤醒模块,用于根据所述唤醒词唤醒将要进行语音识别的语音板。
可选的,所述语音识别装置还包括:解析模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,从所述识别结果中解析出用于控制预定电器的控制指令;发送模块,用于将所述控制指令发送给控制所述预定电器的电器主控。
在本发明实施例中,采用外置麦克风阵列的方式,提供了一种包括麦克风阵列和语音识别设备的语音识别***,其中,麦克风阵列,用于采集语音;语音识别设备包括:语音板和扬声器,其中,语音板,与麦克风阵列通信,用于接收麦克风阵列采集的语音,并对接收到的语音进行识别,得到识别结果;扬声器,与麦克风阵列通信,用于对语音板识别出的识别结果进行播报。通过本发明实施例的语音识别***,达到了实现麦克风阵列与扬声器自由组合的目的,从而实现了提高语音识别降噪性能及满足外观一致性要求的技术效果,进而解决了由于麦克风阵列和扬声器安装位置限制造成的声学回音消除AEC调试及所在电器结构设计困难的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种语音识别***10的结构框图;
图2是根据本发明实施例的语音识别方法的流程图;
图3是根据本发明优选实施方案的另一种语音识别***30的结构示意图;
图4是根据本发明优选实施方案的空调的单链路语音控制示意图;
图5是根据本发明优选实施方案的空调的多链路语音控制示意图;
图6是根据本发明实施例的语音识别装置的结构框图;
图7是根据本发明实施例的语音识别装置的得到模块64的结构框图;
图8是根据本发明实施例的语音识别装置的优选结构框图一;
图9是根据本发明实施例的语音识别装置的优选结构框图二。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明实施例中,提供了一种语音识别***,图1是根据本发明实施例的一种语音识别***10的结构框图,如图1所示,该***包括:麦克风阵列12和语音识别设备14,下面对该语音识别***10进行说明。
麦克风阵列12,用于采集语音;
语音识别设备14,包括:语音板142和扬声器144,其中,语音板142,与麦克风阵列12通信,用于接收麦克风阵列12采集的语音,并对接收到的语音进行识别,得到识别结果;扬声器144,与语音板142通信,用于对语音板142识别出的识别结果进行播报;
其中,麦克风阵列12外置于语音识别设备14。
同时,为了提高多空间中的语音控制便捷性,优选的,语音板142可以为多个,其中,多个语音板可以分别位于不同的地理位置,以使麦克风阵列12接收到的语音可以同时由多个位置的语音板处理识别,进而对各个语音板所处的电器进行语音控制。
在本发明实施例中,采用外置麦克风阵列12的方式,提供了一种包括麦克风阵列12和语音识别设备14的语音识别***10。通过本发明实施例的语音识别***,达到了实现麦克风阵列与语音识别设备自由组合的目的,从而实现了提高语音识别降噪性能及满足所在电器外观设计一致性要求的技术效果。
根据本发明实施例,还提供了一种语音识别的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本发明实施例的语音识别方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,接收麦克风阵列采集的语音;
步骤S204,通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果;
步骤S206,通过语音识别设备中的扬声器播报语音板识别出的识别结果进行播报,其中,麦克风阵列外置于语音识别设备。
通过上述步骤,可以实现在本发明实施例中,通过麦克风阵列外置于语音识别设备的方式,达到将麦克风阵列与扬声器自由组合的目的,从而实现了提高语音识别降噪性能及满足所在电器外观一致性要求的技术效果,进而解决了由于麦克风阵列和扬声器安装位置限制造成的声学回音消除AEC调试及所在电器结构设计困难的技术问题。
优选的,通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果可以包括:确定用于语音识别的语音识别模型,其中,语音识别模型为使用多组数据通过机器学习训练得出的,多组数据中的每组数据均包括:语音和与该语音对应的识别结果;通过语音识别设备中的语音板采用确定的语音识别模型,识别出麦克风阵列采集的语音对应的识别结果。通过上述语音识别模型的方式对采集的语音进行识别,即采用人工智能的方式对采集的语音进行识别,不仅智能快速而且准确,可以在一定程度上有效地提高用户体验。
需要说明的是,上述每组训练数据可以是通过实验得到的,也可以是大量应用该语音识别设备的电器在使用过程中不断采集积累上报的,通过对已经销售出去的电器进行追踪,从而得到大量的数据均可以用于训练。可选的,在应用该语音识别设备的电器中也可以预先设置通讯模块,多个电器可以将实时采集到的数据上传到服务器中,以供机器训练使用。其中,通讯模块可以包括但不限于:无线网卡、蓝牙等。
针对语音控制中存在的用户类型范围广,由于口音、年龄易发生误操作的问题,确定用于语音识别的语音识别模型可以包括:采样不同年龄段,不同音色的用户的语音,以及与采样的语音对应的识别结果;对采样的语音以及与采样的语音对应的识别结果进行训练,得到语音识别模型。通过上述方法,可以对不同年龄段,不同音色的语音均进行采样训练,使得训练出的语音识别模型更为全面,从而有效提高采用该语音识别模型识别出的识别结果,使其更为准确。
可选地,为对不同的人群实现不同的控制,或者实现对一些不能允许执行控制的人员限制控制电器,可以在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,确定采集的语音对应的用户的用户身份;在用户的用户身份为监护人的情况下,通过语音识别设备中的语音板识别麦克风阵列采集的语音。通过对采集的语音的用户的身份,确定该用户是否具备通过语音控制电器的权限。例如,如果采集的语音对应于儿童的情况下,设置不执行采集儿童的语音的控制指令,一方面可以有效避免操作的不安全性,而且在一定程度上有效避免儿童有意或无意的误操作。
需要说明的是,此处确定采集的语音对应的用户的用户身份可以采用多种方式,例如,可以根据采集的述语音的音色,确定采集的语音对应的用户的用户身份;也可以根据采集的述语音的音量,确定采集的语音对应的用户的用户身份;还可以根据采集的述语音的音调,确定采集的语音对应的用户的用户身份。
另外,为了提高多空间中的语音控制便捷性,语音识别设备中的语音板可以为多个,其中,多个语音板可以分别位于不同的地理位置,以使麦克风阵列接收到的语音可以同时由多个位置的语音板处理识别,进而对各个语音板所处的电器进行语音控制。为实现对多个语音板识别语音进行灵活准确控制,优选的,在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,还可以包括:在语音识别设备中的语音板为多个的情况下,接收到唤醒词;根据唤醒词唤醒将要进行语音识别的语音板。其中,唤醒词可以为该语音识别设备生产制造时固定设置的,也可以为用户使用时自行设置的。通过对不同的语音板识别语音设置不同的唤醒词,一方面不仅可以有效实现对多个不同位置的语音板的控制,而且可以有效提高控制的准确性,有效地提高用户智能化的体验。
优选的,在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之后,还可以包括:从识别结果中解析出用于控制预定电器的控制指令;将控制指令发送给控制预定电器的电器主控。通过从识别结果中解析出控制指令,以及发送给预定电器的电器主控,实现对电器的完整控制。需要说明的是,此处的电器的种类可以为多种,例如,可以为空调,可以为冰箱,可以为加湿器等。
上述对不同的语音板设置不同的唤醒词,以实现同一麦克风阵列接收到的语音对可以同时识别语音的多个语音板实现精准对接,进而避免发生对语音板所在电器的语音控制错误。
另外,在通过上述人工智能的方式识别出的控制指令对电器进行控制时,也可以兼容通过电器控制器对电器进行控制,例如,当通过人工智能的方式识别出对电器进行控制的控制指令的同时,也接收到电器控制器对电器的控制器指令,通过设置控制指令与控制器指令的优先级的方式来执行不同的控制。例如,当设置人工智能识别出的控制指令的优先级高于控制器指令的优先级的情况下,依据人工智能识别出的控制指令执行对电器的控制;当设置控制器指令的优先级高于人工智能识别出的控制指令的情况下,依据控制器指令执行对电器的控制。
在本发明实施例中,还提供了另一种语音识别***,图3是根据本发明优选实施方案的另一种语音识别***30的结构示意图,如图3所示,该***包括:麦克风阵列32,语音板34,扬声器36,下面对该语音识别***进行说明。
上述语音识别***30包括:麦克风阵列32(同上述麦克风阵列12)、语音板34(同上述语音板142)、扬声器36(同上述扬声器144)。其中,上述麦克风阵列32可以外置于语音板34和扬声器36。
该外置的麦克风阵列32中可以集成拾音用的麦克风、信号处理DSP(DigitalSignal Process)芯片和通信模块,其中,上述麦克风可以是驻极体或是硅麦,并可以包含两个、四个或更多的麦克风。上述通信模块用于与语音板34之间进行无线连接,可以是蓝牙、无线通讯Zigbee及WIFI(Wireless Fidelity)等。同时,麦克风阵列32中还内置有电源管理模块,可以通过外接电源供电或是内置充电电池供电。
扬声器36中内置通讯模块和发声单元体,同时还内置有电源管理模块,也可以外接电源供电或是内置充电电池供电。
上述麦克风阵列32通过无线方式与语音板34进行连接,扬声器36与语音板34进行无线连接,其中,语音板34可以被设计在该语音识别***所在电器中。
可选的,上述麦克风阵列32可以单独做成一个整体,放置在房间任何地方,可以是茶几、或是天花板顶部;扬声器36也可以放置在房间任何地方,可以是空调旁边,或是天花板顶部。
优选的,语音板34与该语音识别***30的电器主控连接,当用户进行语音识别时,麦克风阵列32接收到正确指令,通过语音板34进行语音指令的解析,解析命令词后发送指令给电器主控,主控接收到控制命令后进而去控制相应的电器负载工作。
通过上述麦克风阵列外置的语音识别***,拉开了麦克风阵列32与扬声器36的距离,有助于提升声学回音消除AEC的优化,进而解决了因麦克风阵列与扬声器近,导致降噪差的问题。
在本发明实施例中,还提供了一种包含上述语音识别***30的空调,图4是根据本发明优选实施方案的空调的单链路语音控制示意图,图5是根据本发明优选实施方案的空调的多链路语音控制示意图,如图4所示,上述语音识别***30可以包含1个语音板34,可选的,如图5所示,该语音识别***30还可以包含多个语音板34,其中,多个语音板34可以分别位于处在不同地理位置的空调中,一个麦克风阵列可以与多个语音板34进行无线通讯连接。例如,在客厅中设置一个麦克风阵列,同时卧室房间和客厅房间均设置带有语音板的空调,用户通过应用程序APP(Application)设置,把两个语音板同时与此麦克风阵列进行配对连接,并可以在APP设置界面中设置1号为卧室空调,同时在APP上自定义一个唤醒词,如“卧室卧室”,设置完成后并保存;同样设置2号为客厅空调,并在APP上自定义一个唤醒词,如“客厅客厅”,设置完成后并保存。
同时扬声器36可以共用一个配置,如图5所示,也可以与各个语音板34独立连接,此连接方式均可在APP上完成设置。当用户在客厅时,若要使用客厅的语音空调,只需说唤醒词“客厅客厅”,唤醒语音识别***后再进行相应空调控制命令的识别与控制,得到正确识别后,扬声器36会进行播报反馈,同样,要从客厅回去卧室,只要在客厅说唤醒词“卧室卧室”,唤醒语音识别***后,用相应的空调控制命令进行卧室空调控制即可,扬声器36可以用客厅的扬声器进行结果反馈播报。
需要说明的是,此种语音控制方式可以覆盖所有语音控制的家电类,且该语音识别功能可以包括离线识别、在线识别、离线和在线混合识别。
同时,上述语音识别***30的设计方式,可以实现麦克风阵列与扬声器的自由组合,进而有效解决提升声学回音消除AEC的效果,提高识别率,并实现语音识别***30所在电器的产品通用化设计,不因麦克风阵列开孔导致外观受影响,满足外观一致性要求。
在本发明实施例中,还提供了一种语音识别装置,图6是根据本发明实施例的语音识别装置的结构框图,如图6所示,该装置包括:第一接收模块62,得到模块64,播报模块66。下面对该语音识别装置进行说明。
第一接收模块62,用于接收麦克风阵列采集的语音;
得到模块64,连接于上述第一接收模块62,用于通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果;
播报模块66,连接于上述得到模块64,用于通过语音识别设备中的扬声器播报语音板识别出的识别结果进行播报,其中,麦克风阵列外置于语音识别设备。
图7是根据本发明实施例的语音识别装置的得到模块64的结构框图,如图7所示,该得到模块64包括:确定单元72,识别单元74。下面对该得到模块64进行说明。
确定单元72,用于确定用于语音识别的语音识别模型,其中,语音识别模型为使用多组数据通过机器学习训练得出的,多组数据中的每组数据均包括:语音和与该语音对应的识别结果;
识别单元74,连接于上述确定单元72,用于通过语音识别设备中的语音板采用确定的语音识别模型,识别出麦克风阵列采集的语音对应的识别结果。
图8是根据本发明实施例的语音识别装置的优选结构框图一,如图8所示,该语音识别装置除含图6中所有结构外,还包括:第二接收模块82,唤醒模块84。下面对该语音识别装置进行说明。
第二接收模块82,连接于上述第一接收模块62,用于在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,在语音识别设备中的语音板为多个的情况下,接收到唤醒词;
唤醒模块84,连接于上述第二接收模块82和得到模块64,用于根据唤醒词唤醒将要进行语音识别的语音板。
图9是根据本发明实施例的语音识别装置的优选结构框图二,如图9所示,该语音识别装置除含图6中所有结构外,还包括:解析模块92,发送模块94。下面对该语音识别装置进行说明。
解析模块92,连接于上述得到模块64,用于在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之后,从识别结果中解析出用于控制预定电器的控制指令;
发送模块94,连接于上述解析模块92,用于将控制指令发送给控制预定电器的电器主控。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的语音识别方法。
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述任意一项的语音识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种语音识别***,其特征在于,包括:麦克风阵列和语音识别设备,其中,
麦克风阵列,用于采集语音;
所述语音识别设备包括:语音板和扬声器,其中,
所述语音板,与所述麦克风阵列通信,用于接收所述麦克风阵列采集的语音,并对接收到的所述语音进行识别,得到识别结果;
所述扬声器,与所述语音板通信,用于对所述语音板识别出的识别结果进行播报;
其中,所述麦克风阵列外置于所述语音识别设备。
2.根据权利要求1所述的语音识别***,其特征在于,所述语音板为多个,多个语音板分别位于不同的地理位置。
3.一种语音识别方法,其特征在于,包括:
接收麦克风阵列采集的语音;
通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;
通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。
4.根据权利要求3所述的语音识别方法,其特征在于,通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到所述识别结果包括:
确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:语音和与该语音对应的识别结果;
通过语音识别设备中的语音板采用确定的所述语音识别模型,识别出所述麦克风阵列采集的语音对应的识别结果。
5.根据权利要求4所述的语音识别方法,其特征在于,确定用于语音识别的所述语音识别模型包括:
采样不同年龄段,不同音色的用户的语音,以及与采样的语音对应的识别结果;
对采样的语音以及与采样的语音对应的识别结果进行训练,得到所述语音识别模型。
6.根据权利要求3所述的语音识别方法,其特征在于,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,还包括:
在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;
根据所述唤醒词唤醒将要进行语音识别的语音板。
7.根据权利要求3至6中任一项所述的语音识别方法,其特征在于,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,还包括:
从所述识别结果中解析出用于控制预定电器的控制指令;
将所述控制指令发送给控制所述预定电器的电器主控。
8.一种语音识别装置,其特征在于,包括:
第一接收模块,用于接收麦克风阵列采集的语音;
得到模块,用于通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;
播报模块,用于通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。
9.根据权利要求8所述的语音识别装置,其特征在于,所述得到模块包括:
确定单元,用于确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:
语音和与该语音对应的识别结果;
识别单元,用于通过语音识别设备中的语音板采用确定的所述语音识别模型,
识别出所述麦克风阵列采集的语音对应的识别结果。
10.根据权利要求8所述的语音识别装置,其特征在于,还包括:
第二接收模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;
唤醒模块,用于根据所述唤醒词唤醒将要进行语音识别的语音板。
11.根据权利要求8至10中任一项所述的语音识别装置,其特征在于,还包括:
解析模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,从所述识别结果中解析出用于控制预定电器的控制指令;
发送模块,用于将所述控制指令发送给控制所述预定电器的电器主控。
CN201810015848.XA 2018-01-08 2018-01-08 语音识别***、方法和装置 Pending CN108039174A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810015848.XA CN108039174A (zh) 2018-01-08 2018-01-08 语音识别***、方法和装置
PCT/CN2018/118962 WO2019134473A1 (zh) 2018-01-08 2018-12-03 语音识别***、方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810015848.XA CN108039174A (zh) 2018-01-08 2018-01-08 语音识别***、方法和装置

Publications (1)

Publication Number Publication Date
CN108039174A true CN108039174A (zh) 2018-05-15

Family

ID=62099339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810015848.XA Pending CN108039174A (zh) 2018-01-08 2018-01-08 语音识别***、方法和装置

Country Status (2)

Country Link
CN (1) CN108039174A (zh)
WO (1) WO2019134473A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712704A (zh) * 2018-06-13 2018-10-26 腾讯科技(深圳)有限公司 音箱、音频数据的播放方法、装置、存储介质及电子装置
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
WO2019134473A1 (zh) * 2018-01-08 2019-07-11 珠海格力电器股份有限公司 语音识别***、方法和装置
CN110837234A (zh) * 2018-08-17 2020-02-25 阿里巴巴集团控股有限公司 智能语音控制面板及面板开关插座
CN110868648A (zh) * 2018-08-27 2020-03-06 杭州海康威视数字技术股份有限公司 室内对讲设备的智能语音实现方法和室内对讲设备
CN110986293A (zh) * 2019-12-12 2020-04-10 珠海格力电器股份有限公司 一种语音板组件及空调器
CN111128194A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种提高在线语音识别效果的***及方法
CN111182412A (zh) * 2019-12-31 2020-05-19 联想(北京)有限公司 一种电子设备、用于电子设备的数据处理方法及会议***设备
CN112731831A (zh) * 2020-12-18 2021-04-30 宁波向往智能科技有限公司 智能开关面板
CN113819585A (zh) * 2021-09-16 2021-12-21 青岛海尔空调器有限总公司 麦克装置、用于匹配语音空调麦克的方法及装置、空调

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186232A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音键盘装置
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制***与方法
CN105931633A (zh) * 2016-05-30 2016-09-07 深圳市鼎盛智能科技有限公司 语音识别的方法及***
CN106679326A (zh) * 2017-01-25 2017-05-17 北京通远科技有限公司 基于语音识别进行控制的智能冰箱

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123421A (zh) * 2017-04-11 2017-09-01 广东美的制冷设备有限公司 语音控制方法、装置及家电设备
CN108039174A (zh) * 2018-01-08 2018-05-15 珠海格力电器股份有限公司 语音识别***、方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186232A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音键盘装置
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制***与方法
CN105931633A (zh) * 2016-05-30 2016-09-07 深圳市鼎盛智能科技有限公司 语音识别的方法及***
CN106679326A (zh) * 2017-01-25 2017-05-17 北京通远科技有限公司 基于语音识别进行控制的智能冰箱

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019134473A1 (zh) * 2018-01-08 2019-07-11 珠海格力电器股份有限公司 语音识别***、方法和装置
CN108712704A (zh) * 2018-06-13 2018-10-26 腾讯科技(深圳)有限公司 音箱、音频数据的播放方法、装置、存储介质及电子装置
CN108712704B (zh) * 2018-06-13 2021-08-06 腾讯科技(深圳)有限公司 音箱、音频数据的播放方法、装置、存储介质及电子装置
CN110837234A (zh) * 2018-08-17 2020-02-25 阿里巴巴集团控股有限公司 智能语音控制面板及面板开关插座
CN110868648A (zh) * 2018-08-27 2020-03-06 杭州海康威视数字技术股份有限公司 室内对讲设备的智能语音实现方法和室内对讲设备
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
CN110986293A (zh) * 2019-12-12 2020-04-10 珠海格力电器股份有限公司 一种语音板组件及空调器
CN111128194A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种提高在线语音识别效果的***及方法
CN111182412A (zh) * 2019-12-31 2020-05-19 联想(北京)有限公司 一种电子设备、用于电子设备的数据处理方法及会议***设备
CN111182412B (zh) * 2019-12-31 2021-04-13 联想(北京)有限公司 一种电子设备、用于电子设备的数据处理方法及会议***设备
CN112731831A (zh) * 2020-12-18 2021-04-30 宁波向往智能科技有限公司 智能开关面板
CN113819585A (zh) * 2021-09-16 2021-12-21 青岛海尔空调器有限总公司 麦克装置、用于匹配语音空调麦克的方法及装置、空调

Also Published As

Publication number Publication date
WO2019134473A1 (zh) 2019-07-11

Similar Documents

Publication Publication Date Title
CN108039174A (zh) 语音识别***、方法和装置
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
CN108320753A (zh) 电器设备的控制方法、装置和***
CN107135443A (zh) 一种信号处理方法及电子设备
CN107388487B (zh) 控制空调的方法和装置
CN107682240A (zh) 一种用于智慧家居的分布式语音交互***
CN109493849A (zh) 语音唤醒方法、装置及电子设备
CN106921911B (zh) 语音采集方法及装置
CN105304081A (zh) 一种智能家居的语音播报***及语音播报方法
CN105276751B (zh) 语音播放方法及***
CN109741747B (zh) 语音场景识别方法和装置、语音控制方法和设备、空调
CN111798852A (zh) 语音唤醒识别性能测试方法、装置、***及终端设备
CN108592349A (zh) 一种空调控制***
CN109737521A (zh) 具有语音控制功能的空气净化器
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
CN109360564A (zh) 语言识别模式的选择方法及装置、家用电器
CN109003609A (zh) 语音设备、智能语音***、设备控制方法及装置
CN108989162A (zh) 一种家用智能机器人管家***
CN113470634A (zh) 语音交互设备的控制方法、服务器及语音交互设备
CN105323682B (zh) 一种数模混合麦克风及耳机
CN110767225A (zh) 一种语音交互方法、装置及***
CN108882103A (zh) 智能音箱、声音采集设备及智能音箱***
CN103645690A (zh) 一种语音控制数字家庭智能盒的方法
CN113096677B (zh) 一种智能降噪的方法及相关设备
CN106126182A (zh) 数据输出方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515