CN105355213A - 一种定向录音的方法及装置 - Google Patents
一种定向录音的方法及装置 Download PDFInfo
- Publication number
- CN105355213A CN105355213A CN201510768323.XA CN201510768323A CN105355213A CN 105355213 A CN105355213 A CN 105355213A CN 201510768323 A CN201510768323 A CN 201510768323A CN 105355213 A CN105355213 A CN 105355213A
- Authority
- CN
- China
- Prior art keywords
- audio signals
- recorded audio
- microphones
- spectrum data
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims description 160
- 238000001228 spectrum Methods 0.000 claims description 90
- 238000012216 screening Methods 0.000 claims description 35
- 230000001737 promoting effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例公开了一种定向录音的方法及装置。该方法包括:获取至少三个麦克风的录音信号;根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;对所述目标录音信号进行处理,并生成录音文件。本发明实施例通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
Description
技术领域
本发明实施例涉及录音技术领域,尤其涉及一种定向录音的方法及装置。
背景技术
为了满足用户在生活以及工作中的录音需求,多数移动终端都具备录音功能,如手机、平板电脑、音乐播放器以及专业的录音笔等。
用户在使用移动终端的录音功能时,录音环境往往会存在多个人物说话的声音以及各种环境噪音,所以对于用于实现录音功能的麦克风来说,其四周存在多个声源,麦克风会将这些声源的声音都记录下来形成录音文件。然而,用户所感兴趣的往往只有一个方向上的声源的声音,在听取包含所有声源的声音的录音文件时,会由于其他声源的声音的干扰而无法听清自己感兴趣的声音。
现有技术中存在一种录音方式,选择一段本底噪音文件,并以该本底噪音文件为样本进行参考,将整个录音文件中符合该样本的频率去除,从而消除录音文件中的环境噪音,但此种方式仍然无法仅录取特定方向上的声音,依然无法满足用户需求。
发明内容
本发明实施例的目的是提供一种定向录音的方法及装置,以解决现有的录音方式缺乏针对性的问题。
一方面,本发明实施例提供了一种定向录音的方法,包括:
获取至少三个麦克风的录音信号;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
对所述目标录音信号进行处理,并生成录音文件。
另一方面,本发明实施例提供了一种定向录音的装置,包括:
录音信号获取模块,用于获取至少三个麦克风的录音信号;
目标录音信号确定模块,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
录音文件生成模块,用于对所述目标录音信号进行处理,并生成录音文件。
本发明实施例中提供的定向录音的方案,获取至少三个麦克风的录音信号,根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
附图说明
图1为本发明实施例一提供的一种定向录音的方法的流程示意图;
图2为本发明实施例二提供的一种定向录音的方法的流程示意图;
图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图;
图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图;
图5为本发明实施例四提供的一种定向录音的装置的结构框图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种定向录音的方法的流程示意图,该方法可以由定向录音的装置执行,其中该装置可由软件和/或硬件实现,一般可集成在移动终端中。如图1所示,该方法包括:
步骤101、获取至少三个麦克风的录音信号。
示例性的,本实施例中的移动终端具体可为手机、平板电脑和录音笔等终端设备。所述移动终端中配置有至少三个麦克风。
示例性的,当用户操作移动终端开始录音时,可自动开启移动终端中的全部或者部分麦克风(麦克风的开启数量不少于三个),并控制开启的麦克风录音,获取所开启的麦克风中的至少三个麦克风的录音信号。例如,移动终端中配置有6个麦克风,可自动开启其中的5个麦克风,并控制该5个麦克风开始录音,获取其中的4个麦克风的录音信号;又如,移动终端中配置有3个麦克风,可自动开启该3个麦克风,并控制该3个麦克风开始录音,获取该3个麦克风的录音信号。
步骤102、根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号。
示例性的,所述预设录音方向可由***默认设置,也可由用户自行设置。例如,***可默认将移动终端长度方向上指向移动终端顶部的方向设置为所述预设录音方向,用户在进行定向录音时,可直接将移动终端的顶部指向自己感兴趣的声源的所在方向;又如,移动终端可提供方向选取界面,根据用户的选择操作确定所述预设录音方向。
示例性的,移动终端上的所述至少三个麦克风的排布方式直接决定了每个麦克风在移动终端上的位置,以及每两个麦克风之间的相对位置关系。对于一个方向上声源来说,其发出的声音到达每个麦克风的时间会有所区别,麦克风所采集到的声音信号的强度也不同。当声源与麦克风的直线距离相对较近时,声音到达该麦克风的时间会相对较早,声音信号的强度也相对较强;当声源与麦克风的直线距离相对较远时,声音到达该麦克风的时间会相对较晚,声音信号的强度也相对较弱。因此,可根据上述原理对步骤101中所获取的至少三个麦克风的录音信号进行分析,将预设录音方向上的声源所对应的声音信号筛选出来,作为目标录音信号。
步骤103、对目标录音信号进行处理,并生成录音文件。
示例性的,所述目标录音信号对应于用户感兴趣的声源,所以对目标录音信号进行处理,并生成录音文件。这样,用户在收听录音文件时,便能够听清自己感兴趣的声源的声音。
本实施例中,对目标录音信号的处理方式以及生成录音文件的方式可以有多种,此处不作具体限定。以下提供几种可选的方式作为举例说明:
1、可对目标录音信号进行保留,去掉除目标录音信号以外的其他录音信号,并生成录音文件。
这样做可去掉除预设录音方向以外的其他录音方向上声源的声音,即相当于滤除了用户不感兴趣的声音,可保证用户能够清晰的听到自己感兴趣的声音。
2、可对目标录音信号进行保留,并提升目标录音信号的增益,去掉除目标录音信号以外的其他录音信号,并生成录音文件。
这样做的好处在于,在第一种方式的基础上,可提高录音文件中声音的声音强度以及响度等属性,进一步方便用户听清自己感兴趣的声音。
3、可提升目标录音信号的增益,得到第一录音信号;降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号;最后根据第一录音信号和第二录音信号生成录音文件。
其中,增益提升或降低的幅度可由***默认设置,也可由用户自行设置。例如,可设置提升系数和降低系数,通过对两个系数的配合调节,可实现根据具体情况保留除预设录音方向以外的其他录音方向上的声音的比重,进而避免一些失真声音的产生。
本发明实施例一提供的定向录音的方法,获取至少三个麦克风的录音信号,根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号,该目标录音信号对应于预设录音方向,通过对目标录音信号进行处理,可生成录音文件,从而实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
实施例二
图2为本发明实施例二提供的一种定向录音的方法的流程示意图,本实施例以上述实施例为基础进行优化,在本实施例中,将步骤“根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号”优化为:分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据;根据目标频谱数据确定录音信号中的目标录音信号。
相应的,本实施例的方法包括如下步骤:
步骤201、获取至少三个麦克风的录音信号。
步骤202、分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据。
示例性的,对录音信号进行傅立叶变换是为了将不同频率的声音进行分离,所得到的频谱数据中,每个不同的频率分别对应一个声源的频谱数据。
步骤203、根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据。
具体的,本步骤可包括:根据预设录音方向以及至少三个麦克风的排布方式确定幅值差筛选条件;针对每个频率,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
示例性的,当移动终端上的至少三个麦克风的排布方式确定之后,可在录音环境中的相对于移动终端的一个方向上放置一个固定声源,而其他方向上没有声源,通过移动终端上的至少三个麦克风获取固定声源的录音信号,分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换,得到相应的频谱数据,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。之后,沿该方向移动所述固定声源,再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。以此类推,可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差的规律或者所处范围,以该幅值差的规律或者所处范围作为幅值差筛选条件。
在本步骤中,可针对每个频率,计算每两个麦克风对应的频谱数据中对应的幅值的差,并判断计算出的幅值的差是否处于上述幅值的差的范围内(或者是否符合幅值的差的规律),若在该范围内(或者符合规律),则说明匹配成功,则确定当前频率对应的频谱数据为目标频谱数据,也相当于确定当前频率所对应的声源为预设录音方向上的声源。
作为另一种实现方式,本步骤可包括:根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
示例性的,同理,当移动终端上的至少三个麦克风的排布方式确定之后,可在录音环境中的相对于移动终端的一个方向上放置一个固定声源,而其他方向上没有声源,通过移动终端上的至少三个麦克风获取固定声源的录音信号,分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换,得到相应的频谱数据,计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。之后,沿该方向移动所述固定声源,再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。以此类推,可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差的规律或者所处范围,以该相位差的规律或者所处范围作为相位差筛选条件。
在本步骤中,可针对每个频率,计算每两个麦克风对应的频谱数据中对应的相位的差,并判断计算出的相位的差是否处于上述相位的差的范围内(或者是否符合幅值的差的规律),若在该范围内(或者符合规律),则说明匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
优选的,可将上述两种实现方式结合起来确定目标频谱数据。例如,当对定向录音性能要求较高时,可将既匹配幅值差筛选条件又匹配相位差范围的频率对应的频谱数据确定为目标频谱数据;当对定向录音性能要求较低时,可将匹配幅值差筛选条件或者匹配相位差筛选条件的频率对应的频谱数据均确定为目标频谱数据。
步骤204、根据目标频谱数据确定录音信号中的目标录音信号。
示例性的,对所有频率进行上述步骤的筛选后,根据匹配成功的频率所对应的频谱数据来确定录音信号中的目标录音信号。可以理解的是,在预设录音方向上可能存在多个用户感兴趣的声源,所以可能存在多个匹配成功的频率,可根据所有匹配成功的频率所对应的频谱数据的集合来确定录音信号中的目标录音信号。
步骤205、提升目标录音信号的增益,得到第一录音信号。
步骤206、降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号。
步骤207、根据第一录音信号和第二录音信号生成录音文件。
本发明实施例二在实施例一的基础上,对确定目标录音信号的步骤进行了优化,根据幅值差筛选条件或者相位差筛选条件将经过傅里叶变换后的声音信号进行筛选,得到用户感兴趣的目标录音信号,可提高筛选的准确度,从而提升定向录音性能。随后,通过提升目标录音信号的增益并降低其他录音信号的增益来生成录音文件,实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
实施例三
图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图,本实施例以移动终端中配置三个麦克风为例进行说明,具体的,该方法包括如下步骤:
步骤301、获取三个麦克风的录音信号。
示例性的,图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图,如图4所示,该移动终端上设置有三个麦克风,分别记为a、b、和c,为了描述方便,此处假设三个麦克风构成等腰三角形,a为等腰三角形的顶点。
步骤302、分别对三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到三组频谱数据。
步骤303、根据预设录音方向以及三个麦克风的排布方式确定频谱数据中的目标频谱数据。
具体的,本步骤可包括:根据预设录音方向以及三个麦克风的排布方式确定幅值差筛选条件和/或相位差筛选条件;针对每个频率,计算三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差和/或相位的差;将计算出的幅值的差和/或相位的差与幅值差筛选条件和/或相位差筛选条件进行匹配,根据匹配情况确定当前频率对应的频谱数据是否为目标频谱数据。
上述幅值差筛选条件和相位差筛选条件的确定方式可参照本发明实施例二中的相关描述。
示例性的,假设移动终端长度方向上指向移动终端顶部的麦克风a的方向为预设录音方向。在频谱数据中,针对某一频率,三组频谱数据中对应的幅值分别记为Aa,Ab和Ac,在预设录音方向上的声源距离a比较近,声音强度较高,所以对应的幅值Aa较大,在预设录音方向上的声源距离b和c比较远,且与b的距离和与c的距离近似相等,那么预设录音方向对应的幅值差筛选条件可为:(Aa-Ab)以及(Aa-Ac)为正值,且(Ab-Ac)或(Ac-Ab)的绝对值很小。如果当前频率满足上述幅值筛选条件,那么该频率对应的频谱数据即为目标频谱数据。如果计算得到的幅值差(Aa-Ab)或(Aa-Ac)为负值,或(Ab-Ac)的绝对值较大,则当前频率不满足幅值筛选条件。同理,在预设录音方向上的声源距离a比较近,声音会先传播到a,在预设录音方向上的声源距离b和c比较远,且与b的距离和与c的距离近似相等,声音会延后同时传播到b和c,由于时间与相位相对应,所以可根据相位差对频谱数据进行筛选。
步骤304、根据目标频谱数据确定录音信号中的目标录音信号。
步骤305、提升目标录音信号的增益,得到第一录音信号。
步骤306、降低录音信号中除目标录音信号以外的其他录音信号的增益,得到第二录音信号。
步骤307、根据第一录音信号和第二录音信号生成录音文件。
示例性的,执行步骤305-步骤307后,加强了移动终端中顶端a麦克风方向的录音效果,削弱了其他方向上的录音效果,从而实现定向录音。同理,也可将预设录音方向设定为上述方向的反方向,即移动终端的底端方向。
本发明实施例三在上述实施例的基础上进行优化,移动终端中配置有三个麦克风,这样可不必改变现有移动终端的硬件配置,还可简化筛选条件,提升运算速度,使用户能够更快的收听到定向录音文件中感兴趣的声音,提升用户体验。
实施例四
图5为本发明实施例四提供的一种定向录音的装置的结构框图,该装置可由软件和/或硬件实现,一般集成在移动终端中,可通过执行定向录音的方法来实现定向录音。如图5所示,该装置包括录音信号获取模块501、目标录音信号确定模块502和录音文件生成模块503。
其中,录音信号获取模块501,用于获取至少三个麦克风的录音信号;目标录音信号确定模块502,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;录音文件生成模块503,用于对所述目标录音信号进行处理,并生成录音文件。
本发明实施例四提供的定向录音的装置,录音信号获取模块501获取至少三个麦克风的录音信号,目标录音信号确定模块502根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号,最后由录音文件生成模块503对目标录音信号进行处理,并生成录音文件。通过采用上述技术方案,可实现预设录音方向上的定向录音,使用户在收听所生成的录音文件时,能够清楚地听到预设录音方向上的声源的声音,提升用户体验。
在上述实施例的基础上,所述目标录音信号确定模块可包括变换单元、目标频谱数据确定单元和目标录音信号确定单元。其中,变换单元,用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;目标频谱数据确定单元,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;目标录音信号确定单元,用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。
在上述实施例的基础上,所述目标频谱数据确定单元具体可用于:根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
在上述实施例的基础上,所述目标频谱数据确定单元具体用于:根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
在上述实施例的基础上,所述录音文件生成模块可包括增益提升单元、增益减低单元和录音文件生成单元。其中,增益提升单元,用于提升所述目标录音信号的增益,得到第一录音信号;增益减低单元,用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;录音文件生成单元,用于根据所述第一录音信号和所述第二录音信号生成录音文件。
上述实施例中提供的定向录音的装置可执行本发明任意实施例所提供的定向录音的方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的定向录音的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种定向录音的方法,其特征在于,包括:
获取至少三个麦克风的录音信号;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
对所述目标录音信号进行处理,并生成录音文件。
2.根据权利要求1所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号,包括:
分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;
根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;
根据所述目标频谱数据确定所述录音信号中的目标录音信号。
3.根据权利要求2所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据,包括:
根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
4.根据权利要求2所述的方法,其特征在于,根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据,包括:
根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
5.根据权利要求1-4中任一项所述的方法,其特征在于,对所述目标录音信号进行处理,并生成录音文件,包括:
提升所述目标录音信号的增益,得到第一录音信号;
降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;
根据所述第一录音信号和所述第二录音信号生成录音文件。
6.一种定向录音的装置,其特征在于,包括:
录音信号获取模块,用于获取至少三个麦克风的录音信号;
目标录音信号确定模块,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号;
录音文件生成模块,用于对所述目标录音信号进行处理,并生成录音文件。
7.根据权利要求6所述的装置,其特征在于,所述目标录音信号确定模块包括:
变换单元,用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换,得到相应的频谱数据;
目标频谱数据确定单元,用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据;
目标录音信号确定单元,用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。
8.根据权利要求7所述的装置,其特征在于,所述目标频谱数据确定单元具体用于:
根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差;将计算出的幅值的差与所述幅值差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
9.根据权利要求7所述的装置,其特征在于,所述目标频谱数据确定单元具体用于:
根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件;
针对每个频率,计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差;将计算出的相位的差与所述相位差筛选条件进行匹配,若匹配成功,则确定当前频率对应的频谱数据为目标频谱数据。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述录音文件生成模块包括:
增益提升单元,用于提升所述目标录音信号的增益,得到第一录音信号;
增益减低单元,用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益,得到第二录音信号;
录音文件生成单元,用于根据所述第一录音信号和所述第二录音信号生成录音文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510768323.XA CN105355213B (zh) | 2015-11-11 | 2015-11-11 | 一种定向录音的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510768323.XA CN105355213B (zh) | 2015-11-11 | 2015-11-11 | 一种定向录音的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105355213A true CN105355213A (zh) | 2016-02-24 |
CN105355213B CN105355213B (zh) | 2019-09-24 |
Family
ID=55331174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510768323.XA Active CN105355213B (zh) | 2015-11-11 | 2015-11-11 | 一种定向录音的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105355213B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106448693A (zh) * | 2016-09-05 | 2017-02-22 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
CN106960670A (zh) * | 2017-03-27 | 2017-07-18 | 联想(北京)有限公司 | 一种录音方法和电子设备 |
CN107360387A (zh) * | 2017-07-13 | 2017-11-17 | 广东小天才科技有限公司 | 一种视频录制的方法、装置及终端设备 |
WO2017197867A1 (zh) * | 2016-05-19 | 2017-11-23 | 华为技术有限公司 | 一种采集声音信号的方法和装置 |
CN107393579A (zh) * | 2017-08-02 | 2017-11-24 | 深圳传音控股有限公司 | 录音方法、录音设备 |
WO2018076387A1 (zh) * | 2016-10-31 | 2018-05-03 | 华为技术有限公司 | 一种定向录音方法及电子设备 |
CN108447497A (zh) * | 2018-03-07 | 2018-08-24 | 陈勇 | 一种在有干扰的环境中独立出自己发声的方法 |
CN109565629A (zh) * | 2016-06-20 | 2019-04-02 | 诺基亚技术有限公司 | 分布式音频捕获和混合控制 |
CN109817214A (zh) * | 2019-03-12 | 2019-05-28 | 百度在线网络技术(北京)有限公司 | 应用于车辆的交互方法和装置 |
CN111077496A (zh) * | 2019-12-06 | 2020-04-28 | 深圳市优必选科技股份有限公司 | 一种基于麦克风阵列的语音处理方法、装置及终端设备 |
CN111145793A (zh) * | 2018-11-02 | 2020-05-12 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
CN113014844A (zh) * | 2021-02-08 | 2021-06-22 | Oppo广东移动通信有限公司 | 一种音频处理方法、装置、存储介质及电子设备 |
CN115101102A (zh) * | 2022-06-23 | 2022-09-23 | 歌尔股份有限公司 | 一种录音设备、定向录音的方法、装置、智能手表及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090285423A1 (en) * | 2004-03-05 | 2009-11-19 | Eghart Fischer | Method and device for matching the phases of microphone signals of a directional microphone of a hearing aid |
CN103731768A (zh) * | 2013-12-25 | 2014-04-16 | 深圳Tcl新技术有限公司 | 一种声音拾取方法及装置 |
WO2014161309A1 (zh) * | 2013-08-19 | 2014-10-09 | 中兴通讯股份有限公司 | 一种移动终端实现声源定位的方法及装置 |
CN104378570A (zh) * | 2014-09-28 | 2015-02-25 | 小米科技有限责任公司 | 录音方法及装置 |
-
2015
- 2015-11-11 CN CN201510768323.XA patent/CN105355213B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090285423A1 (en) * | 2004-03-05 | 2009-11-19 | Eghart Fischer | Method and device for matching the phases of microphone signals of a directional microphone of a hearing aid |
WO2014161309A1 (zh) * | 2013-08-19 | 2014-10-09 | 中兴通讯股份有限公司 | 一种移动终端实现声源定位的方法及装置 |
CN103731768A (zh) * | 2013-12-25 | 2014-04-16 | 深圳Tcl新技术有限公司 | 一种声音拾取方法及装置 |
CN104378570A (zh) * | 2014-09-28 | 2015-02-25 | 小米科技有限责任公司 | 录音方法及装置 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017197867A1 (zh) * | 2016-05-19 | 2017-11-23 | 华为技术有限公司 | 一种采集声音信号的方法和装置 |
CN107404684A (zh) * | 2016-05-19 | 2017-11-28 | 华为终端(东莞)有限公司 | 一种采集声音信号的方法和装置 |
CN109565629A (zh) * | 2016-06-20 | 2019-04-02 | 诺基亚技术有限公司 | 分布式音频捕获和混合控制 |
US11812235B2 (en) | 2016-06-20 | 2023-11-07 | Nokia Technologies Oy | Distributed audio capture and mixing controlling |
CN106448693A (zh) * | 2016-09-05 | 2017-02-22 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
CN106448693B (zh) * | 2016-09-05 | 2019-11-29 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
WO2018076387A1 (zh) * | 2016-10-31 | 2018-05-03 | 华为技术有限公司 | 一种定向录音方法及电子设备 |
CN108604453A (zh) * | 2016-10-31 | 2018-09-28 | 华为技术有限公司 | 一种定向录音方法及电子设备 |
CN106960670A (zh) * | 2017-03-27 | 2017-07-18 | 联想(北京)有限公司 | 一种录音方法和电子设备 |
CN106960670B (zh) * | 2017-03-27 | 2020-06-23 | 联想(北京)有限公司 | 一种录音方法和电子设备 |
CN107360387A (zh) * | 2017-07-13 | 2017-11-17 | 广东小天才科技有限公司 | 一种视频录制的方法、装置及终端设备 |
CN107393579A (zh) * | 2017-08-02 | 2017-11-24 | 深圳传音控股有限公司 | 录音方法、录音设备 |
CN108447497A (zh) * | 2018-03-07 | 2018-08-24 | 陈勇 | 一种在有干扰的环境中独立出自己发声的方法 |
CN111145793B (zh) * | 2018-11-02 | 2022-04-26 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
CN111145793A (zh) * | 2018-11-02 | 2020-05-12 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
CN109817214A (zh) * | 2019-03-12 | 2019-05-28 | 百度在线网络技术(北京)有限公司 | 应用于车辆的交互方法和装置 |
CN111077496B (zh) * | 2019-12-06 | 2022-04-15 | 深圳市优必选科技股份有限公司 | 一种基于麦克风阵列的语音处理方法、装置及终端设备 |
CN111077496A (zh) * | 2019-12-06 | 2020-04-28 | 深圳市优必选科技股份有限公司 | 一种基于麦克风阵列的语音处理方法、装置及终端设备 |
CN113014844A (zh) * | 2021-02-08 | 2021-06-22 | Oppo广东移动通信有限公司 | 一种音频处理方法、装置、存储介质及电子设备 |
CN115101102A (zh) * | 2022-06-23 | 2022-09-23 | 歌尔股份有限公司 | 一种录音设备、定向录音的方法、装置、智能手表及介质 |
CN115101102B (zh) * | 2022-06-23 | 2024-07-16 | 歌尔股份有限公司 | 一种录音设备、定向录音的方法、装置、智能手表及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105355213B (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105355213A (zh) | 一种定向录音的方法及装置 | |
US10123140B2 (en) | Dynamic calibration of an audio system | |
US9913056B2 (en) | System and method to enhance speakers connected to devices with microphones | |
CN103440862B (zh) | 一种语音与音乐合成的方法、装置以及设备 | |
CN110970057B (zh) | 一种声音处理方法、装置与设备 | |
US20180269841A1 (en) | Method and apparatus for processing an audio signal based on an estimated loudness | |
CN105632508B (zh) | 音频处理方法及音频处理装置 | |
CN106465004B (zh) | 动态声音调节 | |
EP3085115B1 (en) | Adapting audio based upon detected environmental noise | |
US20160157013A1 (en) | Listen to people you recognize | |
JP6306713B2 (ja) | 再生ラウドネス調整方法及び装置 | |
US8848941B2 (en) | Information processing apparatus, information processing method, and program | |
CN103828232A (zh) | 动态范围控制 | |
US20220345817A1 (en) | Audio processing method and device, terminal, and computer-readable storage medium | |
CN109819375A (zh) | 调节音量的方法与装置、存储介质、电子设备 | |
CN110221944A (zh) | 利用待测音频设备本身进行自测的方法及*** | |
CN103677714A (zh) | 一种信息处理方法及电子设备 | |
JP5703807B2 (ja) | 信号処理装置 | |
CN113553022A (zh) | 设备调整方法、装置、移动终端及存储介质 | |
CN103987000A (zh) | 一种音频修正的方法及终端 | |
CN104899000A (zh) | 一种信息处理方法及电子设备 | |
WO2019200996A1 (zh) | 多声道音频处理方法、装置和计算机可读存储介质 | |
CN112738692B (zh) | 滤波器设计方法、装置、耳机、电子设备和存储介质 | |
US9438195B2 (en) | Variable equalization | |
WO2017223200A1 (en) | Device for detecting, monitoring, and cancelling ghost echoes in an audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant after: OPPO Guangdong Mobile Communications Co., Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant before: Guangdong OPPO Mobile Communications Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |