CN114255749A - 扫地机器人 - Google Patents

扫地机器人 Download PDF

Info

Publication number
CN114255749A
CN114255749A CN202110367867.0A CN202110367867A CN114255749A CN 114255749 A CN114255749 A CN 114255749A CN 202110367867 A CN202110367867 A CN 202110367867A CN 114255749 A CN114255749 A CN 114255749A
Authority
CN
China
Prior art keywords
microphone
signal
information
determining
sweeping robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110367867.0A
Other languages
English (en)
Inventor
徐银海
刘益帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ancsonic Technology Co ltd
Original Assignee
Beijing Ancsonic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ancsonic Technology Co ltd filed Critical Beijing Ancsonic Technology Co ltd
Priority to CN202110367867.0A priority Critical patent/CN114255749A/zh
Publication of CN114255749A publication Critical patent/CN114255749A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L11/00Machines for cleaning floors, carpets, furniture, walls, or wall coverings
    • A47L11/40Parts or details of machines not provided for in groups A47L11/02 - A47L11/38, or not restricted to one of these groups, e.g. handles, arrangements of switches, skirts, buffers, levers
    • A47L11/4011Regulation of the cleaning machine by electric means; Control systems and remote control systems therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L2201/00Robotic cleaning machines, i.e. with automatic control of the travelling movement or the cleaning operation
    • A47L2201/06Control of the cleaning action for autonomous devices; Automatic detection of the surface condition before, during or after cleaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Manipulator (AREA)

Abstract

本申请提供了一种扫地机器人,该扫地机器人包括传声器阵列以及与传声器阵列连接的信号处理模块,其中,传声器阵列包括第一传声器和第二传声器,第一传声器和第二传声器用于采集包含目标声源发出的语音控制信号的声信号;信号处理模块用于:确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息;基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息;基于时间差信息对第一声信号和/或第二声信号进行延时补偿操作,得到第一传声器和第二传声器对应的拾音信号。本申请能够有效提高扫地机器人的语音识别功能的识别精准度和/或语音控制功能的控制精准度,进而有效提高用户体验好感度。

Description

扫地机器人
技术领域
本申请涉及电器技术领域,具体涉及扫地机器人。
背景技术
近年来,随着智能科技的迅速发展,具备语音控制功能的扫地机器人应运而生。然而,扫地机器人在运行时产生的工作噪声极其明显。不论是环境噪声还是工作噪声,都极有可能影响扫地机器人的语音控制功能的实现,进而降低用户体验好感度。
发明内容
为了解决上述技术问题,提出了本申请。本申请实施例提供了一种扫地机器人。
本申请一实施例提供一种扫地机器人,该扫地机器人包括传声器阵列以及与传声器阵列连接的信号处理模块,其中,传声器阵列包括第一传声器和第二传声器,第一传声器和第二传声器用于采集包含目标声源发出的语音控制信号的声信号;信号处理模块用于:确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息;基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息;基于时间差信息对第一声信号和/或第二声信号进行延时补偿操作,得到第一传声器和第二传声器对应的拾音信号,其中,延时补偿操作用以提高第一传声器和第二传声器所采集信号的信噪比。
在本申请一实施例中,在确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息之前,信号处理模块还用于:确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号;基于工作噪声信号对第一声信号和/或第二声信号进行降噪处理操作。其中,确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,包括:确定经降噪处理操作后的第一声信号和第二声信号对应的互相关信息。
在本申请一实施例中,确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号,包括:基于扫地机器人的电机转速信息确定工作噪声信号。
在本申请一实施例中,传声器阵列还包括位于预设拾噪区域的第三传声器,确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号,包括:基于第三传声器采集的第三声信号、第三传声器与第一传声器和/或第二传声器之间的声场传递函数信息,确定工作噪声信号。
在本申请一实施例中,预设拾噪区域位于扫地机器人的流道结构内,流道结构设置有主动降噪***,第三传声器为主动降噪***中的参考传声器。
在本申请一实施例中,该扫地机器人还包括与信号处理模块连接的语音识别模块,语音识别模块用于基于拾音信号确定与目标声源发出的语音控制信号匹配的控制指令。
在本申请一实施例中,语音识别模块包括语言单元和与语言单元连接的声学单元,语言单元用于基于拾音信号确定先验文字序列信息,声学单元用于基于先验文字序列信息对应的先验语音信号、拾音信号确定控制指令。
在本申请一实施例中,基于先验文字序列信息对应的先验语音信号、拾音信号确定控制指令,包括:比对先验文字序列信息对应的先验语音信号和拾音信号,以得到比对结果;基于比对结果和先验文字序列信息确定控制指令。
在本申请一实施例中,确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,包括:确定第一声信号和第二声信号对应的互功率谱信息;基于互功率谱信息确定第一声信号和第二声信号对应的加权谱函数信息;基于互功率谱信息和加权谱函数信息确定互相关信息。
在本申请一实施例中,互相关信息包括互相关函数信息,基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息,包括:基于互相关函数信息确定互相关函数的峰值信息;基于峰值信息确定时间差信息。
本申请实施例提供的扫地机器人,借助信号处理模块实现了确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,然后基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息,并基于时间差信息对第一声信号和/或第二声信号进行延时补偿操作,以得到第一传声器和第二传声器对应的拾音信号的目的,进而有效提高了第一传声器和第二传声器所采集信号的信噪比。换言之,本申请实施例能够有效提高扫地机器人的语音识别功能的识别精准度和/或语音控制功能的控制精准度,进而有效提高用户体验好感度。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本申请一实施例提供的扫地机器人的结构示意图。
图2所示为本申请一实施例提供的第一声信号和第二声信号的对齐示意图。
图3a至图3c所示为本申请另一实施例提供的扫地机器人的结构示意图。
图4所示为本申请一实施例提供的流道结构的结构示意图。
图5所示为本申请又一实施例提供的扫地机器人的结构示意图。
图6所示为本申请一实施例提供的语音识别模块的结构示意图。
具体实施方式
下面,将参考附图详细地描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
图1所示为本申请一实施例提供的扫地机器人的结构示意图。如图1所示,本申请实施例提供的扫地机器人100包括传声器阵列110以及与传声器阵列110连接的信号处理模块120。其中,传声器阵列110包括第一传声器和第二传声器。第一传声器和第二传声器用于采集包含目标声源发出的语音控制信号的声信号。举例说明,目标声源为使用扫地机器人的用户,目标声源发出的语音控制信号为用户针对扫地机器人发出的语音控制信号。
具体地,第一传声器采集的声信号为第一声信号,第二传声器采集的声信号为第二声信号。信号处理模块用于确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,然后基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息,并基于时间差信息对第一声信号和/或第二声信号进行延时补偿操作,得到第一传声器和第二传声器对应的拾音信号。
应当理解,第一声信号和第二声信号对应的互相关信息能够表征第一声信号和第二声信号之间的相关性。
举例说明,第一声信号表示为x1(t),第二声信号表示为x2(t),那么,可得到下述公式(1)和(2)。
x1(t)=s(t-τ1)+n1(t) (1)
x2(t)=s(t-τ2)+n2(t) (2)
在公式(1)和(2)中,τ1为目标声源发出的原始语音控制信号到达第一传声器的时间,τ2为目标声源发出的原始语音控制信号到达第二传声器的时间,s(t-τ1)和s(t-τ2)为目标声源发出的原始语音控制信号经相应的延迟后分别到达第一传声器和第二传声器的声信号(即为第一传声器和第二传声器各自采集的语音控制信号),n1(t)和n2(t)分别为第一传声器和第二传声器各自采集的噪声信号(比如环境噪声信号和/或扫地机器人的工作噪声信号等)。
那么,第一声信号和第二声信号之间的互相关函数
Figure BDA0003008139700000051
可基于下述公式(3)确定。
Figure BDA0003008139700000052
在公式(3)中,τ为目标声源发出的原始语音控制信号到达第一传声器和第二传声器的时间差。
示例性地,延时补偿操作用以提高第一传声器和第二传声器所采集信号的信噪比。具体地,延时补偿操作是为了将第一声信号中包含的目标声源发出的语音控制信号以及第二声信号中包含的目标声源发出的语音控制信号在双通道上时间“对齐”,进而将“对齐”后的信号进行叠加,以实现提高第一传声器和第二传声器所采集信号的信噪比(即提高第一传声器和第二传声器所采集信号对应的语音控制信号的信噪比)的目的。其中,叠加的具体方式包括但不限于为直接叠加、算术平均叠加、加权叠加等方式。
由于第一传声器和第二传声器各自接收语音控制信号的时间节点与目标声源的波达方向角相关,因此,对第一传声器和第二传声器各自接收的声信号之间的时间差信息进行估计,即可确定目标声源相对于第一传声器和第二传声器的方向信息,进而基于方向信息和时间差信息针对性地进行延时补偿操作。
需要说明的是,由于空间声场内的环境噪声信号等干扰信号到达第一传声器和第二传声器的时间差不同于目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差,因此,干扰信号不会被针对语音控制信号的延时补偿操作“对齐”。以直接叠加为例,即,干扰信号不会被增强。在语音控制信号被增强而干扰信号未被增强的情况下,第一传声器和第二传声器所采集信号的信噪比便得以显著提高。
下面结合图2展示语音控制信号被增强而干扰信号未被增强的情况。
具体地,图2所示为本申请一实施例提供的第一声信号和第二声信号的对齐示意图。如图2所示,第一声信号x1(t)和第二声信号x2(t)均可用正弦波形曲线表示,并且,第一声信号x1(t)和第二声信号x2(t)均存在干扰信号(即图2所示的凸起)。
那么,沿时间轴t将第一声信号x1(t)和第二声信号x2(t)直接对齐叠加后,便得到干扰信号未被增强而语音控制信号被增强的x1(t)+x2(t)。
本申请实施例提供的扫地机器人,借助信号处理模块实现了确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,然后基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息,并基于时间差信息对第一声信号和/或第二声信号进行延时补偿操作,以得到第一传声器和第二传声器对应的拾音信号的目的,进而有效提高了第一传声器和第二传声器所采集信号的信噪比。换言之,本申请实施例能够有效提高扫地机器人的语音识别功能的识别精准度和/或语音控制功能的控制精准度,进而有效提高用户体验好感度。
需要说明的是,上述实施例中提及的第一传声器和第二传声器,可以为一独立的传声器,即多个独立的传声器形成传声器阵列。此外,上述实施例中提及的第一传声器和第二传声器,亦可以为一独立的传声器子阵列,即多个独立的传声器子阵列形成传声器阵列。
然而,扫地机器人的工作基于内部机构高速旋转,其工作噪声是相对较大的。又由于第一声信号和第二声信号中包含的工作噪声信号也是彼此相关的,基于此,为进一步提高第一传声器和第二传声器所采集信号的信噪比,本申请在图1所示实施例基础上进一步扩展了下述实施例。
在本申请一实施例中,在确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息之前,信号处理模块还用于:确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号;基于工作噪声信号对第一声信号和/或第二声信号进行降噪处理操作。其中,确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,包括:确定经降噪处理操作后的第一声信号和第二声信号对应的互相关信息。
需要强调的是,上述提及的降噪处理操作,既可以单独对第一声信号或第二声信号执行,又可以共同对第一声信号和第二声信号执行。那么,当单独对第一声信号或第二声信号执行时,只需确定需要执行降噪处理操作的声信号中与扫地机器人对应的工作噪声信号即可,以便基于确定的工作噪声信号对相应的声信号执行降噪处理操作;当共同对第一声信号和第二声信号执行时,则需分别确定第一声信号和第二声信号中与扫地机器人对应的工作噪声信号,进而基于第一声信号和第二声信号各自对应的工作噪声信号分别对第一声信号和第二声信号执行降噪处理操作。
本申请实施例提供的扫地机器人,利用信号处理模块实现了确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号,进而基于工作噪声信号对第一声信号和/或第二声信号进行降噪处理操作的目的。由于经降噪处理操作后,第一声信号和/或第二声信号中的工作噪声信号被消减甚至滤除,避免了第一声信号和第二声信号中包括有彼此相关的工作噪声信号的情况,进而避免了彼此相关的工作噪声信号影响所确定的第一传声器和第二传声器的时间差信息的精准度的情况,同时进一步提高了第一传声器和第二传声器所采集信号的信噪比。
在本申请一实施例中,确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号,包括:基于扫地机器人的电机转速信息确定工作噪声信号。
举例说明,实时获取扫地机器人的电机转速信息,并基于实时获取的电机转速信息确定工作噪声信号,以便提高所确定的工作噪声信号的精准度。又比如,预先确定扫地机器人的电机转速与工况的映射关系、以及扫地机器人的电机转速与工作噪声信号的映射关系,进而实现直接根据扫地机器人的工况确定扫地机器人的工作噪声信号的目的,以便降低计算复杂度,提高确定工作噪声信号的效率。示例性地,可以利用扫地机器人的吸力档位表征扫地机器人的工况。
由于扫地机器人的工作噪声信号与电机转速信息强相关,而电机转速信息又是能够以简单、便捷的方式快速确定的,因此,本申请实施例能够借助扫地机器人的电机转速信息精准快速地确定扫地机器人的工作噪声信号,进而进一步提高第一传声器和第二传声器所采集信号的信噪比。
在本申请另一实施例中,传声器阵列还包括位于预设拾噪区域的第三传声器。对应地,确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号,包括:基于第三传声器采集的第三声信号、第三传声器与第一传声器和/或第二传声器之间的声场传递函数信息,确定工作噪声信号。
应当理解,根据第三传声器采集的第三声信号、以及第三传声器与第一传声器和/或第二传声器之间的声场传递函数信息,便可计算确定第一声信号和/或第二声信号中与扫地机器人对应的工作噪声信号。
需要说明的是,预设拾噪区域的具***置可根据实际情况确定,本申请实施例对此不进行统一限定。比如,预设拾噪区域位于扫地机器人的壳体的底盘中心区域,又比如,预设拾噪区域位于靠近旋转机构(工作噪声源)的预设区域。
本申请实施例提供的扫地机器人,能够进一步提高所确定的工作噪声信号的精准度,进而进一步提高第一传声器和第二传声器所采集信号的信噪比。
在本申请一实施例中,预设拾噪区域位于扫地机器人的流道结构内。其中,流道结构设置有主动降噪***,第三传声器为主动降噪***中的参考传声器。
本申请实施例通过借助主动降噪***中的参考传声器拾取工作噪声信号的方式,优化了扫地机器人的零部件利用率,节省了产品成本。
下面结合图3a至图3c、以及图4分别给出扫地机器人以及扫地机器人的流道结构的结构示例。
图3a至图3c所示为本申请另一实施例提供的扫地机器人的结构示意图。如图3a至图3c所示,本申请实施例提供的扫地机器人200包括壳体210以及位于壳体210内部的流道结构220。壳体210为类扁圆形的柱体结构。流道结构220为管状空腔结构,并且,流道结构220包括吸尘口221和出风口222,吸尘口221和出风口222分别位于管状空腔结构的相对的两端口。
需要说明的是,图3a至图3c所示的扫地机器人中的流道结构220的具体形状和类型可根据实际情况确定,具体可参见图4。图4所示为本申请一实施例提供的流道结构的结构示意图。如图4所示,流道结构的出风管段既可以为弯管道结构,亦可以为直管道结构。
在本申请一实施例中,确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息,包括:确定第一声信号和第二声信号对应的互功率谱信息;基于互功率谱信息确定第一声信号和第二声信号对应的加权谱函数信息;基于互功率谱信息和加权谱函数信息确定互相关信息。
举例说明,在申请实施例中,互相关信息
Figure BDA0003008139700000091
可基于下述公式(4)确定。
Figure BDA0003008139700000092
在公式(4)中,
Figure BDA0003008139700000093
表示第一声信号和第二声信号的互功率谱信息,φ12(f)表示加权谱函数信息。
示例性地,加权谱函数信息可基于下述公式(5)确定。
Figure BDA0003008139700000094
基于上述公式(5)记载的加权谱函数信息,互功率谱的幅值被归一化为常数1,对上述公式(4)进行推导则得到下述公式(6)。
Figure BDA0003008139700000095
由此可见,互相关函数转化为了延时脉冲,峰值得以显著地突出,进而能够在采集声信号的信噪比极低时保证时间差的估计精度。
本申请实施例通过确定第一声信号和第二声信号对应的互功率谱信息,基于互功率谱信息确定第一声信号和第二声信号对应的加权谱函数信息,然后基于互功率谱信息和加权谱函数信息确定互相关信息的方式,实现了确定第一传声器采集的第一声信号和第二传声器采集的第二声信号对应的互相关信息的目的。本申请实施例锐化了互相关信息的峰值,提高了所确定的时间差信息的精度,进而提高了延时补偿操作的精准度。
在本申请一实施例中,互相关信息包括互相关函数信息。基于互相关信息确定目标声源发出的语音控制信号到达第一传声器和第二传声器的时间差信息,包括:基于互相关函数信息确定互相关函数的峰值信息;基于峰值信息确定所述时间差信息。
在图1所示实施例的公式(3)基础上,假设第一传声器采集的语音控制信号s(t-τ1)与采集的噪声信号n1(t)不相关,第二传声器采集的语音控制信号s(t-τ2)与采集的噪声信号n2(t)不相关,并且,噪声信号n1(t)和噪声信号n2(t)也不相关,那么,公式(3)中记载的第一声信号和第二声信号之间的互相关函数
Figure BDA0003008139700000101
可简化为下述公式(7)。
Figure BDA0003008139700000102
基于上述公式(7)可知,当且仅当τ=τ12=τ12时,公式(7)记载的互相关函数取得峰值。由此可见,通过查找互相关函数的峰值信息,即可估计出目标声源发出的原始语音控制信号到达第一传声器和第二传声器的时间差信息。
本申请实施例通过基于互相关函数信息确定互相关函数的峰值信息,并基于峰值信息确定时间差信息的方式,实现了基于互相关信息确定目标声源发出的原始语音控制信号到达第一传声器和第二传声器的时间差信息的目的。
图5所示为本申请又一实施例提供的扫地机器人的结构示意图。在本申请图1所示实施例基础上延伸出本申请图5所示实施例,下面着重叙述图5所示实施例和图1所述实施例的不同之处,相同之处不再赘述。
如图5所示,本申请实施例提供的扫地机器人100还包括与信号处理模块120连接的语音识别模块130。语音识别模块130用于基于拾音信号确定与目标声源发出的语音控制信号匹配的控制指令。
示例性地,控制指令为用于控制扫地机器人的指令,包括“左转”、“45°”、“前进”、“加大功率”以及“暂停”中的至少一种。
本申请实施例提供的扫地机器人,能够实现基于传声器阵列对应的拾音信号生成匹配的控制指令的目的,进而实现基于目标声源发出的语音控制信号控制扫地机器人的目的,提高了用户体验好感度。
图6所示为本申请一实施例提供的语音识别模块的结构示意图。在本申请图5所示实施例基础上延伸出本申请图6所示实施例,下面着重叙述图6所示实施例和图5所述实施例的不同之处,相同之处不再赘述。
如图6所示,在本申请实施例中,语音识别模块130包括语言单元131和与语言单元131连接的声学单元132。语言单元131用于基于拾音信号确定先验文字序列信息,声学单元132用于基于先验文字序列信息对应的先验语音信号、拾音信号确定控制指令。
示例性地,先验文字序列信息指的是拾音信号对应的文字组合信息。比如,文字组合信息为“我想暂停”。
示例性地,先验文字序列信息对应的先验语音信号指的是文字组合信息对应的语音信号。比如,“我想暂停”的文字组合对应的语音信号(又称为标准语音信号)。
在本申请一实施例中,基于先验文字序列信息对应的先验语音信号、拾音信号确定控制指令,包括:比对先验文字序列信息对应的先验语音信号和拾音信号,以得到比对结果;基于比对结果和先验文字序列信息确定控制指令。
示例性地,当先验语音信号和拾音信号的特征相似度达到预设相似度阈值时,认为先验语音信号和拾音信号匹配,那么,先验语音信号对应的先验文字序列信息即可以确定为控制指令。
在本申请实施例中,语音识别操作是在扫地机器人本地执行的,因此能够极大保证语音识别的实时性。
需要说明的是,基于拾音信号确定的先验文字序列信息的数量不局限于一个,亦可以为多个。当先验文字序列信息的数量为多个时,可以分别将每个先验文字序列信息对应的先验语音信号与拾音信号比对,以得到多个先验文字序列信息各自对应的比对结果。
比如,针对多个先验文字序列信息中的每个先验文字序列信息,该先验文字序列信息自身构成语句的概率为P(W),该先验文字序列信息对应的先验语音信号与拾音信号的比对结果为P(X|W),那么,可将P(W)和P(X|W)二者乘积最大的先验文字序列信息作为语音识别结果W*,进而基于语音识别结果W*确定控制指令。其中,语音识别结果W*可利用下述公式(8)表示。
Figure BDA0003008139700000121
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置和设备中,各部件是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种扫地机器人,其特征在于,包括传声器阵列以及与所述传声器阵列连接的信号处理模块,其中,
所述传声器阵列包括第一传声器和第二传声器,所述第一传声器和所述第二传声器用于采集包含目标声源发出的语音控制信号的声信号;
所述信号处理模块用于:
确定所述第一传声器采集的第一声信号和所述第二传声器采集的第二声信号对应的互相关信息;
基于所述互相关信息确定所述目标声源发出的语音控制信号到达所述第一传声器和所述第二传声器的时间差信息;
基于所述时间差信息对所述第一声信号和/或所述第二声信号进行延时补偿操作,得到所述第一传声器和所述第二传声器对应的拾音信号,其中,所述延时补偿操作用以提高所述第一传声器和所述第二传声器所采集信号的信噪比。
2.根据权利要求1所述的扫地机器人,其特征在于,在所述确定所述第一传声器采集的第一声信号和所述第二传声器采集的第二声信号对应的互相关信息之前,所述信号处理模块还用于:
确定所述第一声信号和/或所述第二声信号中与所述扫地机器人对应的工作噪声信号;
基于所述工作噪声信号对所述第一声信号和/或所述第二声信号进行降噪处理操作;
其中,所述确定所述第一传声器采集的第一声信号和所述第二传声器采集的第二声信号对应的互相关信息,包括:
确定经所述降噪处理操作后的第一声信号和第二声信号对应的互相关信息。
3.根据权利要求2所述的扫地机器人,其特征在于,所述确定所述第一声信号和/或所述第二声信号中与所述扫地机器人对应的工作噪声信号,包括:
基于所述扫地机器人的电机转速信息确定所述工作噪声信号。
4.根据权利要求2所述的扫地机器人,其特征在于,所述传声器阵列还包括位于预设拾噪区域的第三传声器,所述确定所述第一声信号和/或所述第二声信号中与所述扫地机器人对应的工作噪声信号,包括:
基于所述第三传声器采集的第三声信号、所述第三传声器与所述第一传声器和/或所述第二传声器之间的声场传递函数信息,确定所述工作噪声信号。
5.根据权利要求4所述的扫地机器人,其特征在于,所述预设拾噪区域位于所述扫地机器人的流道结构内,所述流道结构设置有主动降噪***,所述第三传声器为所述主动降噪***中的参考传声器。
6.根据权利要求1至5任一项所述的扫地机器人,其特征在于,还包括与所述信号处理模块连接的语音识别模块,所述语音识别模块用于基于所述拾音信号确定与所述目标声源发出的语音控制信号匹配的控制指令。
7.根据权利要求6所述的扫地机器人,其特征在于,所述语音识别模块包括语言单元和与所述语言单元连接的声学单元,所述语言单元用于基于所述拾音信号确定先验文字序列信息,所述声学单元用于基于所述先验文字序列信息对应的先验语音信号、所述拾音信号确定所述控制指令。
8.根据权利要求7所述的扫地机器人,其特征在于,所述基于所述先验文字序列信息对应的先验语音信号、所述拾音信号确定所述控制指令,包括:
比对所述先验文字序列信息对应的先验语音信号和所述拾音信号,以得到比对结果;
基于所述比对结果和所述先验文字序列信息确定所述控制指令。
9.根据权利要求1至5任一项所述的扫地机器人,其特征在于,所述确定所述第一传声器采集的第一声信号和所述第二传声器采集的第二声信号对应的互相关信息,包括:
确定所述第一声信号和所述第二声信号对应的互功率谱信息;
基于所述互功率谱信息确定所述第一声信号和所述第二声信号对应的加权谱函数信息;
基于所述互功率谱信息和所述加权谱函数信息确定所述互相关信息。
10.根据权利要求1至5任一项所述的扫地机器人,其特征在于,所述互相关信息包括互相关函数信息,所述基于所述互相关信息确定所述目标声源发出的语音控制信号到达所述第一传声器和所述第二传声器的时间差信息,包括:
基于所述互相关函数信息确定互相关函数的峰值信息;
基于所述峰值信息确定所述时间差信息。
CN202110367867.0A 2021-04-06 2021-04-06 扫地机器人 Pending CN114255749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110367867.0A CN114255749A (zh) 2021-04-06 2021-04-06 扫地机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110367867.0A CN114255749A (zh) 2021-04-06 2021-04-06 扫地机器人

Publications (1)

Publication Number Publication Date
CN114255749A true CN114255749A (zh) 2022-03-29

Family

ID=80791022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110367867.0A Pending CN114255749A (zh) 2021-04-06 2021-04-06 扫地机器人

Country Status (1)

Country Link
CN (1) CN114255749A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980037008A (ko) * 1996-11-20 1998-08-05 양승택 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리방법
WO2000014731A1 (en) * 1998-09-09 2000-03-16 Ericsson Inc. Apparatus and method for transmitting an improved voice signal over a communications device located in a vehicle with adaptive vibration noise cancellation
EP1197950A2 (en) * 2000-10-12 2002-04-17 Pioneer Corporation Hierarchized dictionaries for speech recognition
US20020181723A1 (en) * 2001-05-28 2002-12-05 International Business Machines Corporation Robot and controlling method of the same
JP2003271196A (ja) * 2002-03-18 2003-09-25 Sony Corp ロボット装置及びその制御方法
EP2637073A2 (en) * 2012-03-09 2013-09-11 LG Electronics, Inc. Robot cleaner and method for controlling the same
CN108231075A (zh) * 2017-12-29 2018-06-29 北京视觉世界科技有限公司 清洁设备的控制方法、装置、设备和存储介质
KR101888058B1 (ko) * 2018-02-09 2018-08-13 주식회사 공훈 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
CN109448711A (zh) * 2018-10-23 2019-03-08 珠海格力电器股份有限公司 一种语音识别的方法、装置及计算机存储介质
US20190080690A1 (en) * 2017-09-14 2019-03-14 Kabushiki Kaisha Toshiba Voice recognition device
CN109509465A (zh) * 2017-09-15 2019-03-22 阿里巴巴集团控股有限公司 语音信号的处理方法、组件、设备及介质
CN109545238A (zh) * 2018-12-11 2019-03-29 珠海市微半导体有限公司 一种基于清洁机器人的语音去噪装置及机器人
CN111429939A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种双声源的声音信号分离方法和拾音器
CN111435598A (zh) * 2019-01-15 2020-07-21 北京地平线机器人技术研发有限公司 语音信号处理方法、装置、计算机可读介质及电子设备
CN112435648A (zh) * 2020-11-12 2021-03-02 北京安声浩朗科技有限公司 一种扫地机器人

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980037008A (ko) * 1996-11-20 1998-08-05 양승택 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리방법
WO2000014731A1 (en) * 1998-09-09 2000-03-16 Ericsson Inc. Apparatus and method for transmitting an improved voice signal over a communications device located in a vehicle with adaptive vibration noise cancellation
EP1197950A2 (en) * 2000-10-12 2002-04-17 Pioneer Corporation Hierarchized dictionaries for speech recognition
US20020181723A1 (en) * 2001-05-28 2002-12-05 International Business Machines Corporation Robot and controlling method of the same
JP2003271196A (ja) * 2002-03-18 2003-09-25 Sony Corp ロボット装置及びその制御方法
EP2637073A2 (en) * 2012-03-09 2013-09-11 LG Electronics, Inc. Robot cleaner and method for controlling the same
US20190080690A1 (en) * 2017-09-14 2019-03-14 Kabushiki Kaisha Toshiba Voice recognition device
CN109509465A (zh) * 2017-09-15 2019-03-22 阿里巴巴集团控股有限公司 语音信号的处理方法、组件、设备及介质
CN108231075A (zh) * 2017-12-29 2018-06-29 北京视觉世界科技有限公司 清洁设备的控制方法、装置、设备和存储介质
KR101888058B1 (ko) * 2018-02-09 2018-08-13 주식회사 공훈 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
CN109448711A (zh) * 2018-10-23 2019-03-08 珠海格力电器股份有限公司 一种语音识别的方法、装置及计算机存储介质
CN109545238A (zh) * 2018-12-11 2019-03-29 珠海市微半导体有限公司 一种基于清洁机器人的语音去噪装置及机器人
CN111435598A (zh) * 2019-01-15 2020-07-21 北京地平线机器人技术研发有限公司 语音信号处理方法、装置、计算机可读介质及电子设备
CN111429939A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种双声源的声音信号分离方法和拾音器
CN112435648A (zh) * 2020-11-12 2021-03-02 北京安声浩朗科技有限公司 一种扫地机器人

Similar Documents

Publication Publication Date Title
CN110491403B (zh) 音频信号的处理方法、装置、介质和音频交互设备
WO2020103703A1 (zh) 一种音频数据处理方法、装置、设备及存储介质
KR100499124B1 (ko) 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법
US10726861B2 (en) Semi-private communication in open environments
Ishi et al. Evaluation of a MUSIC-based real-time sound localization of multiple sound sources in real noisy environments
TWI711035B (zh) 方位角估計的方法、設備、語音交互系統及儲存介質
Wang et al. Robust TDOA Estimation Based on Time-Frequency Masking and Deep Neural Networks.
Potamitis et al. An integrated system for smart-home control of appliances based on remote speech interaction.
Liu et al. Continuous sound source localization based on microphone array for mobile robots
JP2020109498A (ja) システム、及び、方法
WO2020024816A1 (zh) 音频信号处理方法、装置、设备和存储介质
CN107017003A (zh) 一种麦克风阵列远场语音增强装置
CN103426440A (zh) 利用能量谱熵空间信息的语音端点检测装置及其检测方法
CN106872945B (zh) 声源定位方法、装置和电子设备
CN107202385B (zh) 声波驱蚊方法、装置及空调器
Taghizadeh et al. An integrated framework for multi-channel multi-source localization and voice activity detection
CN108389586A (zh) 一种远程集音装置、监控装置及远程集音方法
CN106992010A (zh) 无直达声条件下的麦克风阵列语音增强装置
Brutti et al. Localization of multiple speakers based on a two step acoustic map analysis
Marti et al. Real time speaker localization and detection system for camera steering in multiparticipant videoconferencing environments
Liu et al. Acoustic positioning using multiple microphone arrays
CN114255749A (zh) 扫地机器人
CN114255748A (zh) 扫地机器人
Ince et al. Whole body motion noise cancellation of a robot for improved automatic speech recognition
KR20120097296A (ko) 다중화자의 다채널 음성신호로부터 음원분리를 통한 로봇청각시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination