CN110610706A - 声音信号采集方法、装置、电器设备控制方法及电器设备 - Google Patents
声音信号采集方法、装置、电器设备控制方法及电器设备 Download PDFInfo
- Publication number
- CN110610706A CN110610706A CN201910900278.7A CN201910900278A CN110610706A CN 110610706 A CN110610706 A CN 110610706A CN 201910900278 A CN201910900278 A CN 201910900278A CN 110610706 A CN110610706 A CN 110610706A
- Authority
- CN
- China
- Prior art keywords
- sound signal
- target object
- sound
- acquiring
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 145
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000001815 facial effect Effects 0.000 claims abstract description 34
- 230000015654 memory Effects 0.000 claims description 21
- 238000010586 diagram Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/2847—Home automation networks characterised by the type of home appliance used
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种声音信号采集方法、装置、电器控制方法及电器设备,其中声音信号采集方法包括:获取目标对象的位置;获取目标对象的面部特征数据,根据面部特征数据判断目标对象是否发出声音;当目标对象发出声音时,根据目标对象的位置调整声音信号采集器的采集方向,并利用声音信号采集器获取目标对象发出的声音信号。上述技术方案,在获取声音信号之前,还包括对目标对象是否发出声音进行判断的步骤,只有在目标对象发出声音时,才获取声音信号,排除了因其他的设备发出的声音导致的误唤醒率。
Description
技术领域
本发明涉及电器设备技术领域,具体涉及一种声音信号采集方法、装置、电器设备控制方法及电器设备。
背景技术
现在越来越多的家电产品增加了声音信号控制功能,例如空调的制冷、制热等。语音***能控制空调,重要的一步是可以获取并识别控制者的语音命令。现在基本上通过麦克风收集空调周围环境声音,利用内部滤波电路和降噪算法从环境噪音中提取出控制者的控制语音,后续再通过其他算法和数据库识别对比其语音后得到具体的语音命令。
通常情况下,智能语音***都会设置特定的唤醒词,并且设定一定的唤醒阈值,当目标声源中包含该唤醒词,且声源音量大于所设定的阈值时,空调就会被唤醒。其设定初衷是为了降低周围环境中其他音源的误触发概率,即便周围音源中无意中有唤醒词时也要确保音源达到所设定的阈值时才能被唤醒。但在空调的使用过程中发现,当周围环境中有其他设备(例如电视机)发出该唤醒词时,只要音量达到唤醒阈值,空调也会被唤醒,仍然会导致一定的误唤醒率。
发明内容
有鉴于此,本发明实施例提供了一种声音信号采集方法、装置、电器控制方法及电器设备,以降低误唤醒率。
根据第一方面,本发明实施例提供了一种声音信号采集方法,包括:
获取目标对象的位置;
获取所述目标对象的面部特征数据,根据所述面部特征数据判断所述目标对象是否发出声音;
当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向,并利用所述声音信号采集器获取所述目标对象发出的声音信号。
本发明实施例提供的声音信号采集方法,首先获取目标对象的位置,其次获取目标对象的面部特征数据,当根据面部特征数据判定出目标对象发出声音时,才根据目标对象的位置调整声音信号采集器的采集方向,获取目标对象发出的声音信号。也就是说,在获取声音信号之前,还包括对目标对象是否发出声音进行判断的步骤,只有在目标对象发出声音时,才获取声音信号,排除了因其他的设备发出的声音导致的误唤醒率。同时,本发明根据目标对象的位置调整声音信号采集器的采集方向,从而可以引导声音信号采集器重点采集目标对象发出的声音。
结合第一方面,在第一方面第一实施方式中,当所述声音信号采集器为麦克风阵列时,所述根据所述目标对象的位置调整声音信号采集器的采集方向包括:根据所述目标对象的位置调整所述麦克风阵列的采集参数。
结合第一方面或第一方面第一实施方式,在第一方面第二实施方式中,在获取目标对象的位置之前,还包括:
获取声音信号;
识别所述声音信号中的目标声音信号,当未识别到所述目标声音信号时,触发获取目标对象位置的操作。
结合第一方面第二实施方式,在第一方面第三实施方式中,在获取声音信号之前,还包括:
获取音量信号;
判断所述音量信号是否超过预设阈值,当超过时,触发获取声音信号的操作。
根据第二方面,本发明实施例提供了一种电器设备控制方法,包括:
利用第一方面及第一方面任一实施方式所述的声音信号采集方法采集目标对象发出的声音信号;
根据所述声音信号对电器设备进行控制。
根据第三方面,本发明实施例提供了一种声音信号采集装置,包括:
位置获取模块,用于获取目标对象的位置;
面部特征数据获取模块,用于获取所述目标对象的面部特征数据;
判断模块,用于根据所述面部特征数据判断所述目标对象是否发出声音;
调整模块,用于当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向;
所述声音信号采集器,用于获取所述目标对象发出的声音信号。
根据第四方面,本发明实施例提供了一种电器设备,包括:
声音信号采集器,用于采取声音信号;
目标位置传感器,用于获取目标对象的位置;
面部特征传感器,用于获取所述目标对象的面部特征数据;
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第二方面所述的电器设备控制方法。
结合第四方面,在第四方面第一实施方式中,所述电器设备为空调。
结合第四方面及第四方面第一实施方式,在第四方面第二实施方式中,所述声音信号采集器为麦克风阵列。
结合第四方面及第四方面第一实施方式,在第四方面第三实施方式中,所述目标传感器为毫米波雷达。
根据第五方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面及第一方面任一实施方式所述的声音信号采集方法或第二方面所述的电器设备控制方法。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明实施例1中声音信号采集方法的流程示意图;
图2为本发明实施例1中探测区域的划分示意图;
图3为本发明实施例2中声音信号采集方法的流程示意图;
图4为本发明实施例3中电器设备控制方法的流程示意图;
图5为本发明实施例3中雷达扫描区域示意图;
图6为本发明实施例4中声音信号采集装置的结构示意图;
图7为本发明实施例5中毫米波雷达和麦克风阵列在空调中的布置示意图;
图8为本发明实施例5中麦克风阵列中各麦克风的布置示意图;
其中,1、毫米波雷达;2、麦克风阵列;3、麦克风A;4、麦克风B;5、麦克风C;6、麦克风D。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例1提供了一种声音信号采集方法,图1为本发明实施例1中声音信号采集方法的流程示意图,如图1所示,本发明实施例1的声音信号采集方法包括以下步骤:
S101:获取目标对象的位置。
在本发明实施例1中,可以利用位置传感器来探测目标对象的位置。作为一个具体的实施方式,采用毫米波雷达来获取目标对象的位置。雷达***发射的电磁波信号被其发射路径上的物体阻挡继而会发生反射。通过捕捉反射的信号,雷达***可以确定物体的距离、速度和角度,从而得到一个很具体的坐标信息(空间立体三维坐标)。而毫米波是一类使用短波长电磁波的特殊雷达技术,可实现一种称为调频连续波的特殊毫米波技术以测量距离以及角度和速度。
S102:获取所述目标对象的面部特征数据,根据所述面部特征数据判断所述目标对象是否发出声音。
在本发明实施例1中,毫米波雷达可以识别出目标对象的具***置,并且可以识别出人员的面部特征数据,判断人员是否说话。
S103:当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向,并利用所述声音信号采集器获取所述目标对象发出的声音信号。
作为一个具体的实施方式,所述声音信号采集器选用麦克风阵列。当所述声音信号采集器为麦克风阵列时,根据所述目标对象的位置调整声音信号采集器的采集方向为:根据所述目标对象的位置调整所述麦克风阵列的采集参数。主要调整拾音波束的指向、波束成型、阵列增益、噪音消除等参数。一般麦克风阵列算法的主要功能为完成特定人特定方向的语音拾取和增强。首先确定目标声源方向,抑制其他方向噪音、抵消回声和混响,使麦克风的拾音波束精准指向目标声源,然后根据目标源位置距离优化波束成型,确定信号增益幅值,最终将其波束信号进行模型匹配,从而完成识别。
麦克风阵列的主要参数包括:噪音抑制、混响消除、回声抵消、波束形成、阵列增益、模型匹配。准确的讲,麦克风采集的是环境中的所有声音,识别要做的就是将其一一抑制、消除、抵消等,最终将信号进行模型匹配工作。为提高精准度,就需要在抑制、消除、抵消、提取以及模型匹配上进行优化。不同声音、不同方向、不同位置的目标源所形成的波束都不同,通过将探测区域划分,以每一角度、每一距离划分探测区域(例如以30°一个方位、50cm一个距离为标尺进行划分得到各区域,例如图2中的a区域、b区域、c区域、d区域),每一区域进行大量模拟目标音源采集训练量化,通过大量数据对比优化确定不同位置情况下的拾音波束、波束成型、阵列增益。通过大量实验并优化算法,毫米波雷达精确识别目标源,麦克风阵列根据位置进行快速识别,提高识别的速度和精度。
本发明实施例1提供的声音信号采集方法,首先获取目标对象的位置,其次获取目标对象的面部特征数据,当根据面部特征数据判定出目标对象发出声音时,才根据目标对象的位置调整声音信号采集器的采集方向,获取目标对象发出的声音信号。也就是说,在获取声音信号之前,还包括对目标对象是否发出声音进行判断的步骤,只有在目标对象发出声音时,才获取声音信号,排除了因其他的设备发出的声音导致的误唤醒率。同时,本发明根据目标对象的位置调整声音信号采集器的采集方向,从而可以引导声音信号采集器重点采集目标对象发出的声音。
实施例2
通常情况下,智能语音***都会设置特定的唤醒词,并且设定一定的唤醒阈值,当目标声源中包含该唤醒词,且声源音量大于所设定的阈值时,空调会被唤醒。上述方式较好的避免了误唤醒的概率,但是有可能会导致空调在复杂噪音环境下很难唤醒,或者几乎无法唤醒。因为需要足够大的音量去盖过环境的噪音,麦克风采集的阀值才允许唤醒。这样就得靠得更近、或者更大声,把环境噪音压下去才行。但是无论是靠的近点或者更大声都有些不切实际,过于靠近就失去了产品中加入语音识别操作解决用户需要手动操作的初衷,且人唤醒的声音无法无限大。所以在这样的环境下时就需要采用新的方式来提高空调的唤醒概率。
本发明实施例2提供了一种声音信号采集方法,图3为本发明实施例2中声音信号采集方法的流程示意图,如图3所示,本发明实施例2的声音信号采集方法包括以下步骤:
S301:利用声音信号采集器采集声音信号。
在本发明实施例2中,声音信号采集器选取为麦克风阵列。
S302:识别所述声音信号中的目标声音信号。
利用麦克风阵列获取的声音信号包括环境声音信号和目标声音信号。当环境噪音较小时,在声音信号中识别出目标声音信号比较容易;当环境噪音较大时,在声音信号中识别目标声音信号比较困难,还有可能识别不出目标声音信号。
S303:当未识别到所述目标声音信号时,获取目标对象的位置。
在本发明实施例2中,采用毫米波雷达获取目标对象的位置。
采用单体麦克风时,波束形成的空域选择性差,当多麦克风构成麦克风阵列时,波束形成的空域选择性则较好,但是其波束3dB带宽较窄,如果估计的目标声源方向稍有偏差,带来的影响也更大,鲁棒性不好,识别效果也相对不好。在本发明实施例2中,采用麦克风阵列和毫米波雷达的组合互动使用,毫米波雷达先探测人员位置,然后根据毫米波雷达确定的人员位置确定麦克风阵列的采集方向,可以快速精准确的确定目标声源方向,做到更好的语音识别效果。
S304:获取所述目标对象的面部特征数据,根据所述面部特征数据判断所述目标对象是否发出声音。
在本发明实施例2中,采用毫米波雷达获取目标对象的面部特征数据。
S305:当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向,并利用所述声音信号采集器获取所述目标对象发出的声音信号。
本发明实施例2提供的声音信号采集方法,利用声音信号采集器采集声音信号,在声音信号中识别目标声音信号,当未识别到目标声音信号时,获取目标对象的位置、目标对象的面部特征数据,当目标对象发出声音时,根据目标对象的位置调整声音信号采集器的采集方向,可以在环境噪音比较大的情况下,快速精准确的确定目标声源方向,做到更好的语音识别效果,提高语音***的唤醒概率。
实施例3
本发明实施例3提供了一种电器设备控制方法,图4为本发明实施例3中电器设备控制方法的流程示意图。
在本发明实施例3中,声音信号采集器采集声音信号的触发条件为音量信号超过预设阈值。具体做法为获取音量信号;判断所述音量信号是否超过预设阈值,当超过时,触发声音信号采集器获取声音信号。
S1:利用声音信号采集器采集声音信号,识别声音信号中的目标声音信号,当识别到目标声音信号时,跳转至步骤S7。
S2:当未识别到目标声音信号时,开启雷达***。
雷达***发射的电磁波信号被其发射路径上的物体阻挡继而会发生反射。通过捕捉反射的信号,雷达***可以确定物体的距离、速度和角度。本发明实施例3将根据相对的距离和方位可将毫米波雷达探测划分若干区域,例如只根据方位可将探测区域分为A、B、C、D四个区域,如图4所示。
S3:确定每个区域是否人,当探测到人时,转至S4。
电器设备在进行S3步骤后可得出人员位置信息,可设定探测到人员时将该位置标记为1,无人则标记为0。例如人员位于A区域时A=1、B=0、C=0、D=0;若人员位于B区域时,则可得出A=0、B=1、C=0、D=0。
S4:针对人员位置进行更加详细的判断。获取所述目标对象的面部特征数据,根据所述面部特征数据判断所述目标对象是否发出声音,当探测到人处于说话状态时,转至步骤S5。
S5:将说话的人员位置进行标记。
S6:根据S5得到的说话的人员位置调整麦克风阵列参数。
S7:获取目标声音信号。
S8:在目标声音信号中识别出控制指令。
S9:根据控制指令对电器设备进行控制。
实施例4
本发明实施例4提供了一种声音信号采集装置,图6为本发明实施例4中声音信号采集装置的结构示意图,如图6所示,本发明实施例4的声音信号采集装置包括位置获取模块60、面部特征数据获取模块62、判断模块64、调整模块66及声音信号采集器68。
具体的,位置获取模块60,用于获取目标对象的位置。
面部特征数据获取模块62,用于获取所述目标对象的面部特征数据;
判断模块64,用于根据所述面部特征数据判断所述目标对象是否发出声音;
调整模块66,用于当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向;
声音信号采集器68,用于获取所述目标对象发出的声音信号。
作为一个具体的实施方式,当所述声音信号采集器为麦克风阵列时,所述调整模块66用于根据所述目标对象的位置调整所述麦克风阵列的采集参数。
作为一个具体的实施方式,所述声音信号采集装置还包括第三获取模块和识别模块。所述第三获取模块,用于获取声音信号;所述识别模块,用于识别所述声音信号中的目标声音信号,当未识别到所述目标声音信号时,触发获取目标对象位置的操作。
进一步的,在所述声音信号采集装置中,所述声音信号采集器还用于获取声音信号之前,获取音量信号。所述判断模块64,还用于判断所述音量信号是否超过预设阈值,当超过时,触发获取声音信号的操作。
实施例5
本发明实施例还提供了一种电器设备,该电器设备可以包括处理器和存储器,其中处理器和存储器可以通过总线或者其他方式连接。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的电器设备控制方法对应的程序指令/模块(例如,图6所示的获取模块50、面部特征数据获取模块62、判断模块64、调整模块66及声音信号采集器68)。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的电器设备控制方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述处理器执行时,执行电器设备控制方法。
在本发明实施例5中,所述电器设备可以为空调;所述声音信号采集器为麦克风阵列;所述目标传感器为毫米波雷达。图7为本发明实施例5中毫米波雷达和麦克风阵列在空调中的布置示意图;图8为本发明实施例5中麦克风阵列中各麦克风的布置示意图,如图8所示,在麦克风阵列中各麦克风为圆弧设计,采用此种麦克风阵列,可以具有较好的声音信号采集效果。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (11)
1.一种声音信号采集方法,其特征在于,包括:
获取目标对象的位置;
获取所述目标对象的面部特征数据,根据所述面部特征数据判断所述目标对象是否发出声音;
当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向,并利用所述声音信号采集器获取所述目标对象发出的声音信号。
2.根据权利要求1所述的声音信号采集方法,其特征在于,当所述声音信号采集器为麦克风阵列时,所述根据所述目标对象的位置调整声音信号采集器的采集方向包括:
根据所述目标对象的位置调整所述麦克风阵列的采集参数。
3.根据权利要求1或2所述的声音信号采集方法,其特征在于,在获取目标对象的位置之前,还包括:
获取声音信号;
识别所述声音信号中的目标声音信号,当未识别到所述目标声音信号时,触发获取目标对象位置的操作。
4.根据权利要求3所述的声音信号采集方法,其特征在于,在获取声音信号之前,还包括:
获取音量信号;
判断所述音量信号是否超过预设阈值,当超过时,触发获取声音信号的操作。
5.一种电器设备控制方法,其特征在于,包括:
利用权利要求1~4任一项所述的声音信号采集方法采集目标对象发出的声音信号;
根据所述声音信号对电器设备进行控制。
6.一种声音信号采集装置,其特征在于,包括:
位置获取模块,用于获取目标对象的位置;
面部特征数据获取模块,用于获取所述目标对象的面部特征数据;
判断模块,用于根据所述面部特征数据判断所述目标对象是否发出声音;
调整模块,用于当所述目标对象发出声音时,根据所述目标对象的位置调整声音信号采集器的采集方向;
所述声音信号采集器,用于获取所述目标对象发出的声音信号。
7.一种电器设备,其特征在于,包括:
声音信号采集器,用于采取声音信号;
目标位置传感器,用于获取目标对象的位置;
面部特征传感器,用于获取所述目标对象的面部特征数据;
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求6所述的电器设备控制方法。
8.根据权利要求7所述的电器设备,其特征在于,所述电器设备为空调。
9.根据权利要求7或8所述的电器设备,其特征在于,所述声音信号采集器为麦克风阵列。
10.根据权利要求7或8所述的电器设备,其特征在于,所述目标传感器为毫米波雷达。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的声音信号采集方法或权利要求5所述的电器设备控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910900278.7A CN110610706A (zh) | 2019-09-23 | 2019-09-23 | 声音信号采集方法、装置、电器设备控制方法及电器设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910900278.7A CN110610706A (zh) | 2019-09-23 | 2019-09-23 | 声音信号采集方法、装置、电器设备控制方法及电器设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110610706A true CN110610706A (zh) | 2019-12-24 |
Family
ID=68891874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910900278.7A Pending CN110610706A (zh) | 2019-09-23 | 2019-09-23 | 声音信号采集方法、装置、电器设备控制方法及电器设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110610706A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111641794A (zh) * | 2020-05-25 | 2020-09-08 | 维沃移动通信有限公司 | 声音信号采集方法和电子设备 |
CN113178198A (zh) * | 2021-04-16 | 2021-07-27 | 杭州环木信息科技有限责任公司 | 一种基于毫米波感知的非接触式声纹生物认证方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101320566A (zh) * | 2008-06-30 | 2008-12-10 | 中国人民解放军第四军医大学 | 基于多带谱减法的非空气传导语音增强方法 |
CN102819314A (zh) * | 2011-06-09 | 2012-12-12 | 索尼公司 | 声音控制设备、程序和控制方法 |
US20160189733A1 (en) * | 2011-07-18 | 2016-06-30 | At&T Intellectual Property I, Lp | System and method for enhancing speech activity detection using facial feature detection |
US20160293182A1 (en) * | 2015-03-31 | 2016-10-06 | Bose Corporation | Voice Band Detection and Implementation |
CN106572268A (zh) * | 2016-11-14 | 2017-04-19 | 北京小米移动软件有限公司 | 信息显示方法及装置 |
CN109212499A (zh) * | 2017-07-07 | 2019-01-15 | 英飞凌科技股份有限公司 | 使用雷达传感器识别目标的***和方法 |
CN109644303A (zh) * | 2016-08-29 | 2019-04-16 | Groove X 株式会社 | 识别声源方向的行为自主型机器人 |
CN109754814A (zh) * | 2017-11-08 | 2019-05-14 | 阿里巴巴集团控股有限公司 | 一种声音处理方法、交互设备 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、***及可读存储介质 |
CN110223711A (zh) * | 2019-06-03 | 2019-09-10 | 清华大学 | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 |
-
2019
- 2019-09-23 CN CN201910900278.7A patent/CN110610706A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101320566A (zh) * | 2008-06-30 | 2008-12-10 | 中国人民解放军第四军医大学 | 基于多带谱减法的非空气传导语音增强方法 |
CN102819314A (zh) * | 2011-06-09 | 2012-12-12 | 索尼公司 | 声音控制设备、程序和控制方法 |
CN102819314B (zh) * | 2011-06-09 | 2016-12-14 | 索尼公司 | 声音控制设备和控制方法 |
US20160189733A1 (en) * | 2011-07-18 | 2016-06-30 | At&T Intellectual Property I, Lp | System and method for enhancing speech activity detection using facial feature detection |
US20160293182A1 (en) * | 2015-03-31 | 2016-10-06 | Bose Corporation | Voice Band Detection and Implementation |
CN109644303A (zh) * | 2016-08-29 | 2019-04-16 | Groove X 株式会社 | 识别声源方向的行为自主型机器人 |
CN106572268A (zh) * | 2016-11-14 | 2017-04-19 | 北京小米移动软件有限公司 | 信息显示方法及装置 |
CN109212499A (zh) * | 2017-07-07 | 2019-01-15 | 英飞凌科技股份有限公司 | 使用雷达传感器识别目标的***和方法 |
CN109754814A (zh) * | 2017-11-08 | 2019-05-14 | 阿里巴巴集团控股有限公司 | 一种声音处理方法、交互设备 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、***及可读存储介质 |
CN110223711A (zh) * | 2019-06-03 | 2019-09-10 | 清华大学 | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111641794A (zh) * | 2020-05-25 | 2020-09-08 | 维沃移动通信有限公司 | 声音信号采集方法和电子设备 |
CN111641794B (zh) * | 2020-05-25 | 2023-03-28 | 维沃移动通信有限公司 | 声音信号采集方法和电子设备 |
CN113178198A (zh) * | 2021-04-16 | 2021-07-27 | 杭州环木信息科技有限责任公司 | 一种基于毫米波感知的非接触式声纹生物认证方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106910500B (zh) | 对带麦克风阵列的设备进行语音控制的方法及设备 | |
CN107577449B (zh) | 唤醒语音的拾取方法、装置、设备及存储介质 | |
CN109506568B (zh) | 一种基于图像识别和语音识别的声源定位方法及装置 | |
CN106898348B (zh) | 一种出声设备的去混响控制方法和装置 | |
TWI711035B (zh) | 方位角估計的方法、設備、語音交互系統及儲存介質 | |
CN109308908B (zh) | 一种语音交互方法及装置 | |
CN108831474B (zh) | 语音识别设备及其语音信号捕获方法、装置和存储介质 | |
CN107464565B (zh) | 一种远场语音唤醒方法及设备 | |
JP6450139B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
WO2020048431A1 (zh) | 一种语音处理方法、电子设备和显示设备 | |
CN110610706A (zh) | 声音信号采集方法、装置、电器设备控制方法及电器设备 | |
KR20220117282A (ko) | 오디오 디바이스 자동-로케이션 | |
US20230333205A1 (en) | Sound source positioning method and apparatus | |
TWI523006B (zh) | 利用聲紋識別進行語音辨識的方法及其電子裝置 | |
CN111090412B (zh) | 一种音量调节方法、装置及音频设备 | |
CN110767225A (zh) | 一种语音交互方法、装置及*** | |
US20220335937A1 (en) | Acoustic zoning with distributed microphones | |
CN111103807A (zh) | 一种家用终端设备的控制方法及装置 | |
CN113409800A (zh) | 一种监控音频的处理方法、装置、存储介质及电子设备 | |
CN111627456A (zh) | 噪音排除方法、装置、设备及可读存储介质 | |
CN113676593B (zh) | 视频录制方法、装置、电子设备及存储介质 | |
CN112466305B (zh) | 饮水机的语音控制方法及装置 | |
CN113223552B (zh) | 语音增强方法、装置、设备、存储介质及程序 | |
KR102407872B1 (ko) | 레이더 기반 음성 인식 서비스 장치 및 방법 | |
KR102333476B1 (ko) | 레이더 기반 음성 인식 서비스 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191224 |
|
RJ01 | Rejection of invention patent application after publication |