CN105163209A - 一种接收声音的处理方法及装置 - Google Patents

一种接收声音的处理方法及装置 Download PDF

Info

Publication number
CN105163209A
CN105163209A CN201510546558.4A CN201510546558A CN105163209A CN 105163209 A CN105163209 A CN 105163209A CN 201510546558 A CN201510546558 A CN 201510546558A CN 105163209 A CN105163209 A CN 105163209A
Authority
CN
China
Prior art keywords
equipment
sounding point
sound
point position
sounding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510546558.4A
Other languages
English (en)
Inventor
骆磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Cloudminds Technology Co Ltd
Original Assignee
Shenzhen Cloudminds Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Cloudminds Technology Co Ltd filed Critical Shenzhen Cloudminds Technology Co Ltd
Priority to CN201510546558.4A priority Critical patent/CN105163209A/zh
Publication of CN105163209A publication Critical patent/CN105163209A/zh
Priority to JP2017541853A priority patent/JP6681405B2/ja
Priority to PCT/CN2016/096361 priority patent/WO2017036323A1/zh
Priority to US15/631,687 priority patent/US10306360B2/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Manipulator (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本申请提供了一种接收声音的处理方法及装置,方法可以包括:利用设备的至少三个麦克风接收声音;根据接收到的声音计算三维空间内发声点位置;根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。由于本申请实施例采用设备上的至少三个麦克风来接收声音,可以准确确定出三维空间内的发声点位置,并在确定发声点的位置以后,根据三维空间内发声点的位置以及设备自身的最佳声音接收区域,调整设备的状态,以确保声音接收效果最优化。

Description

一种接收声音的处理方法及装置
技术领域
本申请涉及声音采集技术领域,尤其涉及一种接收声音的处理方法及装置。
背景技术
现有技术中,同一设备上可能具备一个或多个麦克风(或简称麦克)来接收声音。以手机为例,包括一个手持时的主麦克、一个扬声模式时的主麦克和一个负责降噪的麦克。其他设备中,麦克风个数不等。
目前,现有设备大多是以被动的接收声音为主,也即,静态的位于一定位置,当检测到有声音时即接收该声音。然而,采用这种方式接收到的声音效果并不是很好,如果声音来自于非理想情况的方向,那么接收到的声音也是不理想的,可能还会进一步导致后续声音的识别也会比较困难。
现有技术不足在于:
现有设备大多为静态的接收声音,导致接收到的声音并不理想。
发明内容
本申请实施例提出了一种接收声音的处理方法及装置,以解决现有技术中现有设备大多为静态的接收声音,导致接收到的声音并不理想的技术问题。
本申请实施例提供了一种接收声音的处理方法,包括如下步骤:
利用设备的至少三个麦克风接收声音;
根据接收到的声音计算三维空间内发声点位置;
根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
本申请实施例提供了一种接收声音的处理装置,包括:
接收模块,利用设备的至少三个麦克风接收声音;
发声点位置计算模块,用于根据接收到的声音计算三维空间内发声点位置;
位置调整模块,用于根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
有益效果如下:
本申请实施例所提供的接收声音的处理方法及装置,利用设备的至少三个麦克风接收声音,并根据接收到的声音计算三维空间内发声点位置;最终根据三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。由于本申请实施例采用至少三个麦克风来接收声音,可以准确确定出三维空间内发声点的位置,并在确定发声点位置后,根据三维空间内发声点位置和设备自身的最佳声音接收区域,调整设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置,以使声音接收效果最优化。
附图说明
下面将参照附图描述本申请的具体实施例,其中:
图1示出了本申请实施例中接收声音的处理方法实施的流程示意图;
图2示出了本申请实施例中设备上的麦克风摆放位置的示意图;
图3示出了本申请实施例中建立三维模型后的示意图;
图4示出了本申请实施例中接收声音的处理装置的结构示意图。
具体实施方式
为了使本申请的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本说明书中的实施例及实施例中的特征可以互相结合。
发明人在发明过程中注意到:
现有设备大多以静态的接收声音为主,并不会判定声音的方向并调整到最佳接收声音的方向。
而且,以手机为例,虽然包括一个手持时的主麦克、一个扬声模式时的主麦克和一个负责降噪的麦克,但同一时刻最多只有两个麦克风在工作。手机本身无法判断声音来自哪个方向,也无法调整自身方向以达到最佳效果。
基于此,本申请实施例提出了一种接收声音的处理方法及装置,下面进行说明。
图1示出了本申请实施例中接收声音的处理方法实施的流程示意图,如图所示,所述接收声音的处理方法可以包括如下步骤:
步骤101、利用设备的至少三个麦克风接收声音;
步骤102、根据接收到的声音计算三维空间内发声点位置;
步骤103、根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
在具体实施中,可以利用设备自身的3个、4个或更多麦克风来接收声音,麦克风的摆放位置可以根据实际需要进行设置。所述设备的最佳声音接收区域可以根据麦克风的摆放位置来确定,通常设备的硬件(如麦克风)位置确定后,设备的最佳声音接收区域即确定。本申请实施例中所述最佳声音接收区域为在所述设备的周围空间中所述设备的麦克风接收声音效果最好(或最佳)的区域,该区域与设备之间的位置关系相对固定。
一般情况下,声源对准麦克风中心轴线夹角为“0”的时候接收声音效果最佳,现有技术中,每种麦克风可能有不同的拾音范围,本申请实施例中,可以根据麦克风的摆放位置,确定这些麦克风的拾音范围的交集,即可确定设备的最佳声音接收区域。
本申请实施例中可以通过调整所述设备的物理位置,从而调整所述设备的最佳声音接收区域,来达到更好的声音接收效果。在具体实施中,可能存在以下两种情况:
一种情况是,所述设备的最佳声音接收区域包含所述发声点位置,这种情况也可以称为最佳声音接收状态。调整所述设备的物理位置,从而可以相应的调整所述设备的最佳声音接收区域,以使最佳声音接收区域包含发声点位置,由于发声点位置位于所述设备的最佳声音接收区域内,因此,可以确保所述设备接收声音的效果最佳。
设备最佳声音接收区域可以为一个具有优先级排序的点的集合,其中可以包括最佳声音接收点001、002...等。具体实施时,可以首先根据发声点位置和最佳声音接收点001来调整所述设备的物理位置,以使得所述最佳声音接收点001与所述发声点位置重合,如果设备由于各种原因无法满足最佳声音接收点001时,可以按照优先级排序选择002为最佳声音接收点,结合发声点位置调整所述设备的物理位置,以使得所述最佳声音接收点002与所述发声点位置重合。
另一种情况是,所述设备的最佳声音接收区域靠近所述发声点位置。
具体实施中,设备可能由于外界或自身原因无法调整至最佳声音接收状态,也即设备的最佳声音接收区域包含所述发声点位置的状态,例如:设备被其他事物所阻挡或者自身状态调整器件动力不足等。本申请实施例可以调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近所述发声点位置即可,来实现比调整前更佳的声音接收效果。在这种情况中,只需要将所述设备的最佳声音接收区域靠近所述发声点位置即可,并不需要将所述最佳声音接收区域完全包含所述发声点位置。
本申请实施例上述所提供的两种情况,也即,最佳声音接收区域包含所述发声点位置,或者,最佳声音接收区域靠近所述发声点位置,均可以实现比调整前更佳的声音接收效果。
本申请实施例中所述设备的物理位置,可以包括设备的空间位置和朝向,例如,可以调整所述设备的空间位置以使得最佳声音接收区域靠近或包含所述发声点位置,例如将设备向左移动30cm;也可以调整所述设备的朝向(即,空间位置可以不改变,仅改变设备自身的朝向)以使得最佳声音接收区域靠近或包含所述发声点位置,例如将设备的当前朝向顺时针改变90度;还可以既调整设备的空间位置、又调整设备的朝向以使得最佳声音接收区域靠近或包含所述发声点位置,例如将设备向左移动30cm并将设备的当前朝向顺时针改变90度)。
由于本申请实施例是采用至少三个麦克风来接收声音,因此,在后续计算发声点位置时可以计算出三维空间内的发声点位置,确保发声点位置的计算更加准确。
而且,本申请实施例中不仅是根据三维空间内发声点位置来调整设备状态,还将三维空间内发声点位置与设备最佳声音接收区域结合起来调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置,从而可以更加准确的将设备调整到声音接收效果更好的位置,确保声音接收效果更优。
实施中,所述根据接收到的声音计算三维空间内的发声点位置,具体可以为:
根据接收到声音的相位差计算发声点至每两个麦克风的距离差;
构建三维模型,计算至少三个三维曲面的交集;其中,所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合;
根据所述至少三个三维曲面确定发声点位置。
具体实施中,由于不同麦克风所在位置不同,接收到声音的相位之间有一定的差别,本申请实施例可以在麦克风接收到声音后,在缓存中判定接收到声音的相位差,从而计算得到发声点位置到每两个麦克风的距离差。
例如,假设有麦克风mic1、mic2、mic3、mic4,计算得到发声点到mic2和mic1的距离差为b-a、发声点到mic3和mic2的距离差为c-b、发声点到mic4和mic3的距离差为d-c、发声点到mic3和mic1的距离差为c-a、发声点到mic4和mic1的距离差为d-a、发声点到mic4和mic2的距离差为d-b。
构建三维模型,得到多个三维曲面,分别可以为:
所有到mic2和mic1的距离的差等于b-a的点的集合(三维曲面1);
所有到mic3和mic2的距离的差等于c-b的点的集合(三维曲面2);
所有到mic4和mic3的距离的差等于d-c的点的集合(三维曲面3);
所有到mic3和mic1的距离的差等于c-a的点的集合(三维曲面4);
所有到mic4和mic1的距离的差等于d-a的点的集合(三维曲面5);
所有到mic4和mic2的距离的差等于d-b的点的集合(三维曲面6)。
确定这些曲面的交集,即可确定发声点位置。
本申请实施例中根据至少三个麦克风接收的声音,通过构件三维模型,计算三维曲面的交集进行发声点位置的计算,进一步提高了发声点位置的计算精确度。
实施中,所述根据所述至少三个三维曲面的交集确定发声点位置,具体可以为:
当计算得到的交集为两个点时,可以根据麦克风收到的声音的强度,确定发声点所处的空间;所述空间包括设备的正面半空间和背面半空间;根据所述发声点所处的空间,确定两个点中的一个为发声点位置;
当计算得到的交集为一个点时,确定所述交集为发声点位置。
当曲面的交集为两个点时,可以知道这两个点一个为发声点、另一个为以麦克风平面的发声点的对称点。此时,需要进一步确定哪一个点才是发声点。考虑到麦克风一般不会朝向同一方向设置,因此,本申请实施例中,根据不同的麦克风收到的声音强度进行对比,即可知道发声点位置是位于设备的正面半空间还是背面半空间。
具体实施中,可以根据设备平面把空间划分为两个空间区域,将声音最强的麦克风的朝向作为发声点对应的空间区域。
本申请实施例在确定发声点位置时具体分为两种情况,一种为所述交集为一个点,那么该交集即为发声点位置,另一种则是所述交集为两个点,此时,通过将设备划分为正面半空间和背面半空间,来进一步确定发声点的位置,使得计算结果更加精确。
实施中,所述设备可以为机器人,所述调整设备状态,具体可以为:通过控制所述机器人的转向和行进,调整所述机器人的朝向和位置。
具体实施中,所述设备可以为机器人,可以利用机器人自身具备的麦克风来接收声音,并在计算出发声点位置后,根据三维空间内发声点位置和机器人自身最佳声音接收区域,控制机器人进行转向和行进等操作,从而调整机器人的朝向和位置,使得机器人可以更好的接收到声音。
在进行机器人语音交互的场景下,采用本申请实施例所提供的方案,可以确保机器人准确的接收到使用者所发出的声音,并在一定程度上提高了后续语音识别的准确度,从而提高机器人语音交互过程中的用户体验。
实施中,所述设备可以为移动终端,所述调整设备状态,具体可以为:根据震动马达的不同,震动所述移动终端在所处平面内转向。
具体实施中,所述设备可以为移动终端,如手机、平板电脑、笔记本电脑等设备,可以利用移动终端自身的至少三个麦克风接收声音,并计算三维空间为发声点位置,再根据移动终端上麦克风的摆放位置确定移动终端的最佳声音接收区域,最终根据发声点位置和最佳声音接收区域,控制震动器件进行震动,根据震动马达的不同,实现所述移动终端在所处平面内的转向。
采用本申请实施例所提供的方案,可以在通讯设备处于免提模式时,例如,用户在洗漱或吃饭时不方便手持电话时,开启免提模式接听来电,这时,手机就可以自行震动到最佳声音接收状态,让用户接收的声音效果更佳理想。
为了便于本申请的实施,下面以实例进行说明。
本申请实施例以具备三个麦克风的设备为例进行说明,图2示出了本申请实施例中设备上的麦克风摆放位置的示意图,设备上的三个麦克风如图所示,分别为mic1、mic2、mic3。假设声音来自A点,且A点到设备上三个麦克风的直线距离分别为a、b、c。
首先,设备可以控制三个麦克风同时接收声音,在缓存中判定接收到声音的相位差,从而计算得到发声点到两个麦克风的距离差。如图2所示,可以得到b-a、c-a和c-b的绝对数值。
由于设备自身知晓自身的麦克风的摆放位置(或称装配位置),因此,可以得到设备平面与三个麦克风的平面,然后可以构建三维模型。
图3示出了本申请实施例中建立三维模型后的示意图,如图所示,所有到mic2与mic1的差等于b-a的点的集合为三维曲面S1、所有到mic3与mic1的差等于c-a的点的集合为三维曲面S2、所有到mic3与mic2的差等于c-b的点的集合为三维曲面S3。
计算三个曲面的交集,得到以下两种情形:
如果发声点位置处于三个麦克风组成的同一平面,则三个曲面的交集只有一个点,即可确定该点即为发声点位置;
反之,三个曲面的交集可以得到两个点,一个为发声点A,一个为以三个麦克风为平面的A点的对称点A’。
通常情况下,从设计的角度可以知道,三个麦克风一般不会全部朝向同一个方向,因此,根据三个麦克风收到的声音强度对比,即可得知发声点位于设备的正面半空间还是背面半空间。将设备所在空间分为正反两个区域的话,可以将声音最强的麦克风的朝向作为发声点所在空间。
可以根据三个麦克风的摆放位置确定自身最佳的声音接收区域在三维空间哪个区域,次佳区域在哪个区域等。
一般情况下,一旦三个麦克风的摆放位置确定,则会有一个区域是接收声音效果最好的,可以通过用户使用场景进行调试来确定设备最佳声音接收区域。通常,设备最佳声音接收区域为设备正前方的一块区域。例如,在3GPP降噪测试方案中,可以选取设备正前方30cm作为扬声模式降噪的测试点,也即,设备正前方30cm的区域为设备自身的最佳声音接收区域,而在往两侧或上下到一定角度后,测试结果会有一定恶化。
现有技术中,降噪方案、设备调试情况可能会对设备最佳声音接收区域的确定有一定的影响,本领域技术人员可以根据实际需要采用不同的方式确定设备的最佳声音接收区域,本申请在此不做赘述。
在具体实施中,对设备进行调试一般会根据用户使用场景进行,因此,对于不同的使用场景(例如,手机的扬声模式、手持模式等),设备最佳声音接收区域可能也会有所不同。
本申请实施例中,设备可以根据三维空间内发声点和最佳声音接收区的位置,调整自身的朝向和位置,以实现最好的接收声音信号的目的。
在调整过程中,依然可以进行上述接收声音、计算发声点位置、确定最佳声音接收区域等步骤,以达到闭环运行,更精确、更快地完成调整。
本申请实施例可以通过在设备上三个或更多麦克风进行方向的识别并自动调整设备方向以使声音接收最优化。
基于同一发明构思,本申请实施例中还提供了一种接收声音的处理装置,由于这些设备解决问题的原理与一种接收声音的处理方法相似,因此这些设备的实施可以参见方法的实施,重复之处不再赘述。
图4示出了本申请实施例中接收声音的处理装置的结构示意图,如图所示,所述接收声音的处理装置可以包括:
接收模块401,利用设备的至少三个麦克风接收声音;
发声点位置计算模块402,用于根据接收到的声音计算三维空间内发声点位置;
位置调整模块403,用于根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
实施中,所述发声点位置计算模块具体可以包括:
第一计算单元,用于根据接收到声音的相位差计算发声点至每两个麦克风的距离差;
第二计算单元,用于构建三维模型,计算至少三个三维曲面的交集;其中,所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合;
确定单元,用于根据所述至少三个三维曲面的交集确定发声点位置。
实施中,所述确定单元可以具体用于当计算得到的交集为两个点时,根据麦克风收到的声音的强度,确定发声点所处的空间;所述空间包括设备的正面半空间和背面半空间;根据所述发声点所处的空间,确定两个点中的一个为发声点位置;当计算得到的交集为一个点时,确定所述交集为发声点位置。
实施中,所述位置调整模块可以进一步用于当所述设备状态无法调整至设备的最佳声音接收区域包含所述发声点位置时,从按照声音接收质量排序的设备声音接收区域中选择次佳声音接收区域,调整设备状态至所述设备的次佳声音接收区域包含所述发声点位置。
实施中,所述设备可以为机器人,所述位置调整模块具体可以用于通过控制所述机器人的转向和行进,调整所述机器人的朝向和位置。
实施中,所述设备可以为移动终端,所述位置调整模块具体可以用于根据震动马达的不同,震动所述移动终端在所处平面内转向。
上述实施例中,均可以采用现有的功能元器件模块来实施。例如,接收模块可以采用现有的声音接收元器件,至少,现有通讯设备中采用的听筒上便具备实现该功能元器件;至于发声点位置计算模块,进行的发声点位置计算可以采用现有的技术手段,本领域技术人员经过相应的设计开发即可实现;同时,位置调整模块则是任意一个具备调整设备状态功能的设备都具备的元器件。
为了描述的方便,以上所述装置的各部分以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

Claims (10)

1.一种接收声音的处理方法,其特征在于,包括如下步骤:
利用设备的至少三个麦克风接收声音;
根据接收到的声音计算三维空间内发声点位置;
根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
2.如权利要求1所述的方法,其特征在于,所述根据接收到的声音计算三维空间内发声点位置,具体为:
根据接收到声音的相位差计算发声点至每两个麦克风的距离差;
构建三维模型,计算至少三个三维曲面的交集;其中,所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合;
根据所述至少三个三维曲面的交集确定发声点位置。
3.如权利要求2所述的方法,其特征在于,所述根据所述至少三个三维曲面的交集确定发声点位置,具体为:
当计算得到的交集为两个点时,根据麦克风收到的声音的强度,确定发声点所处的空间;所述空间包括设备的正面半空间和背面半空间;根据所述发声点所处的空间,确定两个点中的一个为发声点位置;
当计算得到的交集为一个点时,确定所述交集为发声点位置。
4.如权利要求1所述的方法,其特征在于,所述设备为机器人,所述调整设备状态,具体为:通过控制所述机器人的转向和行进,调整所述机器人的朝向和位置。
5.如权利要求1所述的方法,其特征在于,所述设备为移动终端,所述调整设备状态,具体为:根据震动马达的不同,震动所述移动终端在所处平面内转向。
6.一种接收声音的处理装置,其特征在于,包括:
接收模块,利用设备的至少三个麦克风接收声音;
发声点位置计算模块,用于根据接收到的声音计算三维空间内发声点位置:
位置调整模块,用于根据所述三维空间内发声点位置和所述设备的最佳声音接收区域,调整所述设备的物理位置,以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。
7.如权利要求6所述的装置,其特征在于,所述发声点位置计算模块具体包括:
第一计算单元,用于根据接收到声音的相位差计算发声点至每两个麦克风的距离差;
第二计算单元,用于构建三维模型,计算至少三个三维曲面的交集;其中,所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合;
确定单元,用于根据所述至少三个三维曲面的交集确定发声点位置。
8.如权利要求7所述的装置,其特征在于,所述确定单元具体用于当计算得到的交集为两个点时,根据麦克风收到的声音的强度,确定发声点所处的空间;所述空间包括设备的正面半空间和背面半空间;根据所述发声点所处的空间,确定两个点中的一个为发声点位置;当计算得到的交集为一个点时,确定所述交集为发声点位置。
9.如权利要求6所述的装置,其特征在于,所述设备为机器人,所述位置调整模块具体用于通过控制所述机器人的转向和行进,调整所述机器人的朝向和位置。
10.如权利要求6所述的装置,其特征在于,所述设备为移动终端,所述位置调整模块具体用于根据震动马达的不同,震动所述移动终端在所处平面内转向。
CN201510546558.4A 2015-08-31 2015-08-31 一种接收声音的处理方法及装置 Pending CN105163209A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510546558.4A CN105163209A (zh) 2015-08-31 2015-08-31 一种接收声音的处理方法及装置
JP2017541853A JP6681405B2 (ja) 2015-08-31 2016-08-23 声を受信する処理方法、装置、記憶媒体、携帯端末及びロボット
PCT/CN2016/096361 WO2017036323A1 (zh) 2015-08-31 2016-08-23 一种接收声音的处理方法、装置、存储介质、移动终端及机器人
US15/631,687 US10306360B2 (en) 2015-08-31 2017-06-23 Method and device for processing received sound and memory medium, mobile terminal, robot having the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510546558.4A CN105163209A (zh) 2015-08-31 2015-08-31 一种接收声音的处理方法及装置

Publications (1)

Publication Number Publication Date
CN105163209A true CN105163209A (zh) 2015-12-16

Family

ID=54803948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510546558.4A Pending CN105163209A (zh) 2015-08-31 2015-08-31 一种接收声音的处理方法及装置

Country Status (4)

Country Link
US (1) US10306360B2 (zh)
JP (1) JP6681405B2 (zh)
CN (1) CN105163209A (zh)
WO (1) WO2017036323A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017036323A1 (zh) * 2015-08-31 2017-03-09 深圳前海达闼科技有限公司 一种接收声音的处理方法、装置、存储介质、移动终端及机器人
CN106954143A (zh) * 2017-03-02 2017-07-14 瑞声科技(南京)有限公司 手动调整音质的方法以及电子设备
CN110001541A (zh) * 2019-04-16 2019-07-12 爱驰汽车有限公司 车载智能语音***
CN112859001A (zh) * 2021-01-25 2021-05-28 恒大新能源汽车投资控股集团有限公司 车辆位置检测方法、装置、设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566660B (zh) * 2017-10-24 2020-06-09 Oppo广东移动通信有限公司 通话降噪方法、装置及终端
CN109121031B (zh) * 2018-10-29 2020-11-17 歌尔科技有限公司 一种音频设备定向显示方法、装置和音频设备
CN111383649B (zh) * 2018-12-28 2024-05-03 深圳市优必选科技有限公司 一种机器人及其音频处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029830A (ja) * 2001-07-12 2003-01-31 Amano Corp 音響信号を利用した清掃ロボット用誘導システム
CN101295016A (zh) * 2008-06-13 2008-10-29 河北工业大学 一种声源自主搜寻定位方法
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
CN103064061A (zh) * 2013-01-05 2013-04-24 河北工业大学 三维空间声源定位方法
CN103366756A (zh) * 2012-03-28 2013-10-23 联想(北京)有限公司 一种声音信号的接收方法及装置
CN103472434A (zh) * 2013-09-29 2013-12-25 哈尔滨工程大学 一种机器人声音定位方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3157769B2 (ja) * 1998-03-02 2001-04-16 静岡日本電気株式会社 Tv音声制御装置
DE10036815A1 (de) * 2000-07-28 2002-02-07 Diehl Munitionssysteme Gmbh Pyrotechnischer Aufschlagzünder
JP3771812B2 (ja) * 2001-05-28 2006-04-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ロボットおよびその制御方法
KR100493172B1 (ko) * 2003-03-06 2005-06-02 삼성전자주식회사 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
JP2005333211A (ja) * 2004-05-18 2005-12-02 Sony Corp 音響収録方法、音響収録再生方法、音響収録装置および音響再生装置
US20060014301A1 (en) * 2004-07-13 2006-01-19 Power3 Medical Products, Inc. Antibody-based system for detection of differential protein expression patterns
JP4204541B2 (ja) * 2004-12-24 2009-01-07 株式会社東芝 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム
KR20080111290A (ko) * 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
JP5206151B2 (ja) * 2008-06-25 2013-06-12 沖電気工業株式会社 音声入力ロボット、遠隔会議支援システム、遠隔会議支援方法
JP5663201B2 (ja) * 2009-06-04 2015-02-04 本田技研工業株式会社 音源方向推定装置及び音源方向推定方法
JP5340974B2 (ja) * 2010-01-26 2013-11-13 京セラ株式会社 携帯電子機器
US9274744B2 (en) * 2010-09-10 2016-03-01 Amazon Technologies, Inc. Relative position-inclusive device interfaces
US9030520B2 (en) * 2011-06-20 2015-05-12 Polycom, Inc. Automatic camera selection for videoconferencing
CN103716724B (zh) * 2012-09-28 2017-05-24 联想(北京)有限公司 一种声音采集方法及电子设备
US9239627B2 (en) * 2012-11-07 2016-01-19 Panasonic Intellectual Property Corporation Of America SmartLight interaction system
CN103856877B (zh) * 2012-11-28 2017-11-28 联想(北京)有限公司 一种声控信息检测方法及电子设备
CN104010251B (zh) * 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音***与相关方法
CN103176167B (zh) * 2013-03-21 2014-11-05 徐华中 一种基于锁相放大器的强干扰下声源定位方法
JP2014197771A (ja) * 2013-03-29 2014-10-16 株式会社Jvcケンウッド 放送システムの音声出力制御装置及び音声出力制御方法
US9640179B1 (en) * 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
US20150022636A1 (en) * 2013-07-19 2015-01-22 Nvidia Corporation Method and system for voice capture using face detection in noisy environments
US9338575B2 (en) * 2014-02-19 2016-05-10 Echostar Technologies L.L.C. Image steered microphone array
US9412354B1 (en) * 2015-01-20 2016-08-09 Apple Inc. Method and apparatus to use beams at one end-point to support multi-channel linear echo control at another end-point
CN105163209A (zh) * 2015-08-31 2015-12-16 深圳前海达闼科技有限公司 一种接收声音的处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029830A (ja) * 2001-07-12 2003-01-31 Amano Corp 音響信号を利用した清掃ロボット用誘導システム
CN101295016A (zh) * 2008-06-13 2008-10-29 河北工业大学 一种声源自主搜寻定位方法
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
CN103366756A (zh) * 2012-03-28 2013-10-23 联想(北京)有限公司 一种声音信号的接收方法及装置
CN103064061A (zh) * 2013-01-05 2013-04-24 河北工业大学 三维空间声源定位方法
CN103472434A (zh) * 2013-09-29 2013-12-25 哈尔滨工程大学 一种机器人声音定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田坦: "《声呐技术》", 31 January 2000 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017036323A1 (zh) * 2015-08-31 2017-03-09 深圳前海达闼科技有限公司 一种接收声音的处理方法、装置、存储介质、移动终端及机器人
US10306360B2 (en) 2015-08-31 2019-05-28 Cloudminds (Shenzhen) Technologies Co., Ltd. Method and device for processing received sound and memory medium, mobile terminal, robot having the same
CN106954143A (zh) * 2017-03-02 2017-07-14 瑞声科技(南京)有限公司 手动调整音质的方法以及电子设备
CN110001541A (zh) * 2019-04-16 2019-07-12 爱驰汽车有限公司 车载智能语音***
CN112859001A (zh) * 2021-01-25 2021-05-28 恒大新能源汽车投资控股集团有限公司 车辆位置检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP6681405B2 (ja) 2020-04-15
JP2018511962A (ja) 2018-04-26
US20170287468A1 (en) 2017-10-05
US10306360B2 (en) 2019-05-28
WO2017036323A1 (zh) 2017-03-09

Similar Documents

Publication Publication Date Title
CN105163209A (zh) 一种接收声音的处理方法及装置
US9532140B2 (en) Listen to people you recognize
WO2017164996A1 (en) Audio processing for an acoustical environment
CN110089131A (zh) 分布式音频捕获和混合控制
JP6400566B2 (ja) ユーザインターフェースを表示するためのシステムおよび方法
CN107621625B (zh) 基于双微麦克风阵的声源定位方法
CN105679328A (zh) 一种语音信号处理方法、装置及***
EP3794846A1 (en) Methods and apparatuses for implementing a head tracking headset
WO2015099896A1 (en) Performing automated voice operations based on sensor data reflecting sound vibration conditions and motion conditions
CN105611014A (zh) 移动终端通话语音降噪方法及装置
CN104412616A (zh) 基于麦克风阵列中的声音的相关性的噪声抑制
CN103986994A (zh) 一种调整立体声效果的方法及装置
CN107181845A (zh) 一种麦克风确定方法和终端
US20200329329A1 (en) Method and Terminal for Playing Audio File in Multi-Terminal Cooperative Manner
CN107278301A (zh) 一种辅助用户寻物的方法及装置
CN109472806A (zh) 无人飞行器的航区规划方法、装置和遥控器
CN105045385A (zh) 一种基于双麦克的终端手势识别方法
US20210092545A1 (en) Audio processing
US20180352363A1 (en) Intelligent Audio Rendering
WO2019063878A1 (en) AUDIO SIGNAL PROCESSING
WO2013084056A1 (en) Electronic devices, methods, and computer program products for determining position deviations in an electronic device and generating a binaural audio signal based on the position deviations
US9733714B2 (en) Computing system with command-sense mechanism and method of operation thereof
CN103634721A (zh) 一种数据处理方法以及一种电子设备
CN108605195B (zh) 智能音频呈现
CN109545217B (zh) 语音信号接收方法、装置、智能终端及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151216