CN106971716A - 一种机器人噪声数据库更新及语音识别装置、方法 - Google Patents
一种机器人噪声数据库更新及语音识别装置、方法 Download PDFInfo
- Publication number
- CN106971716A CN106971716A CN201610024586.4A CN201610024586A CN106971716A CN 106971716 A CN106971716 A CN 106971716A CN 201610024586 A CN201610024586 A CN 201610024586A CN 106971716 A CN106971716 A CN 106971716A
- Authority
- CN
- China
- Prior art keywords
- noise
- robot
- unit
- recognition
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000009467 reduction Effects 0.000 claims abstract description 8
- 238000004891 communication Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Manipulator (AREA)
Abstract
本发明提供一种机器人噪声数据库更新及语音识别装置,麦克风、传送单元、机器人识别单元以及控制模块,用以对所述服务器识别结果和所述机器人识别结果进行处理,其中,所述控制模块包括:处理单元、启动单元、相似度获取单元、噪声判断单元、更新单元以及降噪单元;所述更新单元包括:噪声对比子单元,用以获取所有的噪声相似度;阈值比较子单元用以当所有所述噪声相似度小于所述噪声阈值时将所述目标语音信号存储至所述噪声数据库中。本发明通过从两种识别方法以及先进行去噪的方式获取最优结果,根据噪声信号对噪声数据库实时进行丰富,以提高去噪效率,从而进一步提高语音识别效率。
Description
技术领域
本发明涉及智能机器人领域,尤其涉及一种机器人噪声数据库更新及语音识别装置、方法。
背景技术
随着科技的发展,家用机器人因为其智能化越来越收到人们的欢迎。在对机器人进行操控的过程中,如果能运用语音与机器人进行交流,让机器人明白你在说什么,并根据你的语音指令完成相应的动作,这成为人们长期以来梦寐以求的事情。在现有技术中,通过语音识别技术就能够让机器人识别和理解用户的语音命令,并根据这些语音命令执行相应的动作。
但是,由于家用机器人的应用场所相对稳定,且每户家庭所处的环境又有所不同,所以如何提高对特定环境下语音中噪声的处理以提高识别效率,成为目前亟待解决的问题。
发明内容
鉴于上述问题,本申请记载了一种机器人噪声数据库更新及语音识别装置,包括:
麦克风,所述麦克风位于所述机器人底座上,用以接收用户发出的目标语音信号;
传送单元,与所述麦克风相连,用以将所述目标语音信号传送至服务器的服务器识别单元中,并将所述服务器识别单元对所述目标语音信号进行识别处理获取的服务器识别结果传送回所述机器人;
机器人识别单元,与所述麦克风相连,用以对所述目标语音信号进行识别处理以获取所述机器人识别结果;
其中,所述机器人还包括控制模块,用以对所述服务器识别结果和所述机器人识别结果进行处理,其中,所述控制模块包括:
处理单元,分别与所述传送模块以及所述机器人识别单元相连,用以基于所述服务器识别结果和/或所述机器人识别结果以获取最终识别结果;
启动单元,与所述处理单元相连,用以根据所述识别结果启动相应的功能模块;
相似度获取单元,分别与所述启动单元、所述传送模块以及所述机器人识别单元相连,用以获取所述服务器识别结果和所述机器人识别结果的语音相似度,并根据所述语音相似度从所述服务器识别结果或所述机器人识别结果中获取所述语音数据;
所述装置还包括:
噪声判断单元,分别与所述麦克风以及所述传送单元相连,用以判断所述目标语音信号中是否存在噪声;
更新单元,与所述噪声判断单元相连,用以根据所述目标语音信号更新噪声数据库并停止识别处理;
降噪单元,分别与所述噪声判断单元、传送单元以及所述机器人识别单元相连,用以在所述噪声数据库中选择对所述噪声进行降噪处理的噪声数据,并根据所述噪声数据对所述目标语音信号进行降噪处理;
其中,所述更新单元包括:
噪声对比子单元,与所述麦克风相连,用以将所述目标语音信号与所述噪声数据库中的所有噪声数据与所述目标语音信号进行比对以获取所有的噪声相似度;
阈值比较子单元,分别与所述噪声对比子单元以及噪声数据库相连,用以判断是否所有的噪声相似度均小于所述噪声阈值,并当所有所述噪声相似度小于所述噪声阈值时将所述目标语音信号存储至所述噪声数据库中。
较佳的,当所述功能模块不需要所述语音数据时,将所述服务器识别结果输入至所述功能模块以控制所述机器人完成相应的功能。
较佳的,所述处理单元获得所述服务器和所述机器人之间的网络通信状态,以及根据所述网络通信信息来忽略所述服务器识别结果。
较佳的,当根据所述网络通信信息忽略所述服务器识别结果时,所述处理单元根据所述机器人识别结果获取所述最终结果。
较佳的,所述控制模块从所述服务器识别结果或所述机器人识别结果中获取所述语音数据传送至所述功能模块中。
较佳的,所述机器人识别单元参考获取所述服务器识别单元识别所述目标语音信号的数据库以对所述目标语音信号进行识别处理。
本发明还提供了一种机器人噪声数据库更新及语音识别方法,所述方法适用于上述的机器人噪声数据库更新及语音识别装置
上述技术方案具有如下优点或有益效果:本发明提出的机器人噪声数据库更新及语音识别装置,在通过相互补充的服务器识别单元和机器人识别单元的共同处理下而获取最终识别结果的过程中,通过预定的算法选择和使用具有高可靠性的语音识别结果作为最终识别结果,从而增强机器人的语音识别率。除此之外,为了保证数据信息的安全性,当在语音识别后所启动的功能模块需要语音数据时,可以选择使用机器人识别单元获取的机器人识别结果,来防止与语音数据相关联的服务器识别结果在网络传输中泄漏。最后,在网络通信状态出现故障或信号不佳期间,能够自动忽略服务器识别结果,从而消除从处理单元接收服务器识别结果所需要的延迟,进而提高了识别效率。最后,在获取目标语音信号之后,首先进行去噪处理,以提高识别准确率。并且根据噪声信号对噪声数据库实时进行丰富,以提高去噪效率,从而进一步提高语音识别效率。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1A为本发明中机器人噪声数据库更新及语音识别装置的结构示意图;
图1B为本发明中机器人噪声数据库更新及语音识别装置的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1A是图示根据本公开的实施例的机器人噪声数据库更新及语音识别装置的结构示意图。参考图1A,机器人噪声数据库更新及语音识别装置可以包括与机器人通过网络相连接的服务器,通过机器人内部识别装置和服务器对语音共同进行识别处理。简言之,本实施例例提供的机器人噪声数据库更新及语音识别装置能够达到分布式语音识别技术。
服务器中包括相连的服务器识别单元13和服务器数据库。服务器识别单元13可以参考服务器数据库识别由机器人传送来的目标语音信号,在该服务器数据库中以一般信息指定信息域。值得指出的是,机器人通过麦克风11接收用户发出的目标语音信号。最终,服务器识别单元13可以获取服务器识别结果。服务器可以将由服务器识别单元13生成的服务器识别结果发送到机器人中。
机器人可以包括麦克风11、传送单元12、服务器识别单元13、机器人识别单元14、以及控制模块15。麦克风11可以接收用户的目标语音信号。机器人识别单元14可以参考机器人数据库识别麦克风11传送来的目标语音信号,在该机器人数据库中以语音数据指定信息域。结果,机器人识别单元14可以生成机器人识别结果。传送单元12可以通过麦克风11将接收到的目标语音信号发送到服务器中的服务器识别结果。另外,在本实施例中,显示单元可以显示与机器人识别单元14和服务器识别单元13进行语音识别过程中相关联的各种信息和控制菜单,用户通过语音数据控制菜单对相应的功能进行调控。另外,控制模块15可以对服务器识别结果和机器人识别结果进行处理,以控制机器人语音识别过程中的整体操作。
具体来说,控制模块15包括:
处理单元151,分别与传送模块以及机器人识别单元14相连,用以基于服务器识别结果和/或机器人识别结果以获取最终识别结果;
启动单元152,与处理单元151相连,用以根据识别结果启动相应的功能模块;
相似度获取单元153,分别与启动单元152、传送模块以及机器人识别单元14相连,用以获取服务器识别结果和机器人识别结果的语音相似度,并根据语音相似度从服务器识别结果或机器人识别结果中获取语音数据。
具体来说,先由处理单元151基于服务器识别结果和机器人识别结果中的至少一个来获取最终识别结果,然后启动单元152根据识别结果启动相应的功能模块。如果该功能模块需要语音数据,则相似度获取单元153还需要获取服务器识别结果和机器人识别结果的语音相似度,并根据语音相似度从服务器识别结果或机器人识别结果中获取语音数据。
下面,分别对服务器识别单元13和机器人识别单元14的语音识别处理过程进行详细描述。为了便于解释,服务器识别单元13和机器人识别单元14共同地称为语音识别单元,并且服务器识别单元13和机器人数据库共同地称为数据库,并且服务器识别结果和机器人识别结果共同地称为识别结果。
在语音识别单元中,通过语音识别算法将目标语音信号与数据库的信息域分析接收到目标语音信号的意义和上下文。因此,在本实施例中,首先使用语音至文本(STT)算法,将目标语音信号转换成文本形式的数据,并将其存储在数据库中。
另外,由于麦克风11获取到的目标语音信号可能存在噪声,而这些噪声会对识别结果造成影响,因此在将目标语音信号通过传送单元12传送至服务器识别单元13或直接送至机器人识别单元14中之前,控制模块15需要对目标语音信号进行去噪处理。因此,如图1B所示出的另一机器人噪声数据库更新及语音识别装置的结构示意图中,识别装置还包括噪声判断单元16、更新单元17以及降噪单元18。
在进行去噪的过程中,由分别与麦克风11以及传送单元12相连的噪声判断单元16对目标语音信号进行判断,以确认其是否包含噪声。若判断结果为该目标语音信号中全部为噪声,则说明该目标语音信号并不能对机器人进行相应的控制,所以无需再对其进行识别处理。但是,在该过程中,可以利用更新单元17对该噪声进行再次判断,若能符合要求,那么利用更新单元17将该噪声存储至噪声数据库中,以丰富噪声数据库中的噪声数据。
由于语音识别单元利用识别算法将目标语音信号转换成多个数据。所以,为了更高的提高识别率,在本实施例中,语音识别单元采用多个数据库,并从多个数据库中选择识别率最高的结果作为最终的识别结果。
具体来说,更新单元17包括噪声对比子单元171和阈值比较子单元172。噪声对比子单元171和麦克风11相连接,用以接收麦克风11传送来的目标语音信号,并将目标语音信号与噪声数据库中的所有噪声数据与目标语音信号进行比对以获取所有的相似度值,然后由语音阈值比较子单元172将所有的相似度值与语音阈值进行比较,并当所有相似度值小于语音阈值时将目标语音信号存储至噪声数据库中。这种设置方式,能够丰富噪声数据库的噪声数据,从而提供噪声处理的准确率。
在本实施例中,机器人识别单元14可以参考服务器数据库识别接收到的语音,在该服务器数据库中以语音数据指定信息域,并且机器人识别单元14可以将语音识别结果传输到控制模块15。控制模块15可以基于处理单元151的最终识别结果来估计和执行与用户的意图相对应的功能模块。例如,当麦克风11到从用户接收到的目标语音信号为“打开电视机”时,控制模块15可以执行相应的开启电视机的功能模块。
本实施例还提供了一种机器人噪声数据库更新及语音识别方法,所述方法适用于上述的机器人噪声数据库更新及语音识别装置。
本实施例提出的机器人噪声数据库更新及语音识别装置,在通过相互补充的服务器识别单元13和机器人识别单元14的共同处理下而获取最终识别结果的过程中,通过预定的算法选择和使用具有高可靠性的语音识别结果作为最终识别结果,从而增强机器人的语音识别率。
除此之外,为了保证数据信息的安全性,当在语音识别后所启动的功能模块需要语音数据时,可以选择使用机器人识别单元14获取的机器人识别结果,来防止与语音数据相关联的服务器识别结果在网络传输中泄漏。
最后,在网络通信状态出现故障或信号不佳期间,能够自动忽略服务器识别结果,从而消除从处理单元151接收服务器识别结果所需要的延迟,进而提高了识别效率。
根据上述实施例的配置和方法将不会以有限的方式应用于前述的机器人,并且每个实施例的全部或者部分可以被选择性地组合,并且被配置成对其进行各种修改。
对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。
Claims (7)
1.一种机器人噪声数据库更新及语音识别装置,包括:
麦克风,所述麦克风位于所述机器人底座上,用以接收用户发出的目标语音信号;
传送单元,与所述麦克风相连,用以将所述目标语音信号传送至服务器的服务器识别单元中,并将所述服务器识别单元对所述目标语音信号进行识别处理获取的服务器识别结果传送回所述机器人;
机器人识别单元,与所述麦克风相连,用以对所述目标语音信号进行识别处理以获取所述机器人识别结果;
其特征在于:
其中,所述装置还包括控制模块,用以对所述服务器识别结果和所述机器人识别结果进行处理,其中,所述控制模块包括:
处理单元,分别与所述传送模块以及所述机器人识别单元相连,用以基于所述服务器识别结果和/或所述机器人识别结果以获取最终识别结果;
启动单元,与所述处理单元相连,用以根据所述识别结果启动相应的功能模块;
相似度获取单元,分别与所述启动单元、所述传送模块以及所述机器人识别单元相连,用以获取所述服务器识别结果和所述机器人识别结果的语音相似度,并根据所述语音相似度从所述服务器识别结果或所述机器人识别结果中获取所述语音数据;
所述装置还包括:
噪声判断单元,分别与所述麦克风以及所述传送单元相连,用以判断所述目标语音信号中是否存在噪声;
更新单元,与所述噪声判断单元相连,用以根据所述目标语音信号更新噪声数据库并停止识别处理;
降噪单元,分别与所述噪声判断单元、传送单元以及所述机器人识别单元相连,用以在所述噪声数据库中选择对所述噪声进行降噪处理的噪声数据,并根据所述噪声数据对所述目标语音信号进行降噪处理;
其中,所述更新单元包括:
噪声对比子单元,与所述麦克风相连,用以将所述目标语音信号与所述噪声数据库中的所有噪声数据与所述目标语音信号进行比对以获取所有的噪声相似度;
阈值比较子单元,分别与所述噪声对比子单元以及噪声数据库相连,用以判断是否所有的噪声相似度均小于所述噪声阈值,并当所有所述噪声相似度小于所述噪声阈值时将所述目标语音信号存储至所述噪声数据库中。
2.根据权利要求1所述的机器人噪声数据库更新及语音识别装置,其特征在于,当所述功能模块不需要所述语音数据时,将所述服务器识别结果输入至所述功能模块以控制所述机器人完成相应的功能。
3.根据权利要求1所述的机器人噪声数据库更新及语音识别装置,其特征在于,所述处理单元获得所述服务器和所述机器人之间的网络通信状态,以及根据所述网络通信信息来忽略所述服务器识别结果。
4.根据权利要求3所述的机器人噪声数据库更新及语音识别装置,其特征在于,当根据所述网络通信信息忽略所述服务器识别结果时,所述处理单元根据所述机器人识别结果获取所述最终结果。
5.根据权利要求1所述的机器人噪声数据库更新及语音识别装置,其特征在于,所述控制模块从所述服务器识别结果或所述机器人识别结果中获取所述语音数据传送至所述功能模块中。
6.根据权利要求2所述的机器人噪声数据库更新及语音识别装置,其特征在于,所述机器人识别单元参考获取所述服务器识别单元识别所述目标语音信号的数据库以对所述目标语音信号进行识别处理。
7.一种机器人噪声数据库更新及语音识别方法,其特征在于,所述方法适用于权利要求1-6任一所述的机器人噪声数据库更新及语音识别装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610024586.4A CN106971716A (zh) | 2016-01-14 | 2016-01-14 | 一种机器人噪声数据库更新及语音识别装置、方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610024586.4A CN106971716A (zh) | 2016-01-14 | 2016-01-14 | 一种机器人噪声数据库更新及语音识别装置、方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106971716A true CN106971716A (zh) | 2017-07-21 |
Family
ID=59334438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610024586.4A Pending CN106971716A (zh) | 2016-01-14 | 2016-01-14 | 一种机器人噪声数据库更新及语音识别装置、方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106971716A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971720A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种更新噪声数据库的机器人语音识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120330651A1 (en) * | 2011-06-22 | 2012-12-27 | Clarion Co., Ltd. | Voice data transferring device, terminal device, voice data transferring method, and voice recognition system |
CN103177728A (zh) * | 2011-12-21 | 2013-06-26 | ***通信集团广西有限公司 | 语音信号降噪处理方法及装置 |
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
-
2016
- 2016-01-14 CN CN201610024586.4A patent/CN106971716A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120330651A1 (en) * | 2011-06-22 | 2012-12-27 | Clarion Co., Ltd. | Voice data transferring device, terminal device, voice data transferring method, and voice recognition system |
CN103177728A (zh) * | 2011-12-21 | 2013-06-26 | ***通信集团广西有限公司 | 语音信号降噪处理方法及装置 |
CN103533154A (zh) * | 2012-06-28 | 2014-01-22 | Lg电子株式会社 | 移动终端及其识别语音的方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971720A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种更新噪声数据库的机器人语音识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038220B (zh) | 用于生成备忘录的方法、智能机器人及*** | |
CN103440867B (zh) | 语音识别方法及*** | |
CN110335612A (zh) | 基于语音识别的会议记录生成方法、装置及存储介质 | |
CN106653008B (zh) | 一种语音控制方法、装置及*** | |
CN107316643A (zh) | 语音交互方法及装置 | |
US9601107B2 (en) | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus | |
CN103685613B (zh) | 一种基于语音识别的防电话诈骗***及其方法 | |
CN109584876A (zh) | 语音数据的处理方法、装置和语音空调 | |
CN104715752A (zh) | 语音识别方法、装置及*** | |
CN107644643A (zh) | 一种语音交互***及方法 | |
CN107655154A (zh) | 终端控制方法、空调器及计算机可读存储介质 | |
CN110265013A (zh) | 语音的识别方法及装置、计算机设备、存储介质 | |
CN106230689A (zh) | 一种语音信息交互的方法、装置及服务器 | |
CN105975063B (zh) | 一种控制智能终端的方法和装置 | |
CN103208285A (zh) | 基于移动通讯终端语音交互的家电控制方法及*** | |
CN103886861A (zh) | 一种控制电子设备的方法及电子设备 | |
CN2814830Y (zh) | 声控电视机及遥控器 | |
CN109389978B (zh) | 一种语音识别方法及装置 | |
CN110232924A (zh) | 车载语音管理方法、装置、车辆及存储介质 | |
CN106601242A (zh) | 操作事件的执行方法及装置、终端 | |
CN105227557A (zh) | 一种帐号处理方法及装置 | |
CN109830234A (zh) | 一种智能车载信息交互设备及交互方法 | |
CN102023644A (zh) | 一种基于语音识别技术的云台控制的方法 | |
CN1885930A (zh) | 声控电视机、遥控器以及电视机遥控方法 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170721 |
|
RJ01 | Rejection of invention patent application after publication |