CN111048106A

CN111048106A - 基于双麦克风的拾音方法、装置和计算机设备

Info

Publication number: CN111048106A
Application number: CN202010171449.XA
Authority: CN
Inventors: 王维; 王广新; 杨汉丹
Original assignee: Shenzhen Youjie Zhixin Technology Co ltd
Current assignee: Shenzhen Youjie Zhixin Technology Co ltd
Priority date: 2020-03-12
Filing date: 2020-03-12
Publication date: 2020-04-21
Anticipated expiration: 2040-03-12
Also published as: CN111048106B

Abstract

本申请提供了一种基于双麦克风的拾音方法、装置、计算机设备和计算机可读存储介质，通过双麦克风接收声音信号，然后将声音信号转换为双通道频域信号，对双通道频域数据做固定波束，从而生成第一单通道频域信号。在按照预设算法对第一单通道频域信号进行降噪，得到第二单通道频域信号。最后，将第二单通道频域信号转换到时域，生成最终音频信号，完成双麦克风的整个拾音过程。本申请在实现拾音的过程中，只需要双麦克风就可以完成整个拾音过程，有效降低硬件生产成本。在降噪过程中，预设算法通过利用双麦相干函数进行语音存在概率的计算和噪声谱的更新，在计算量较小的情况下大幅度提高了对远场混响和噪声的鲁棒性，有效提高拾音效果。

Description

基于双麦克风的拾音方法、装置和计算机设备

技术领域

本申请涉及音频处理技术领域，特别涉及一种基于双麦克风的拾音方法、装置和计算机设备。

背景技术

随着智能语音的兴起，利用麦克风阵列技术实现远场语音拾音成为了当前热门的技术之一。现有的麦克风阵列拾音装置为了实现较好的远场交互效果，通常采用四个麦克风或六个麦克风。而由于麦克风数量较多，导致麦克风阵列拾音装置的***复杂，在进行拾音是需要声源位置信息等多种参数，计算量大，成本高，无法应用于翻译机等小型设备。

发明内容

本申请的主要目的为提供一种基于双麦克风的拾音方法、装置和计算机设备，旨在解决现有麦克风阵列拾音装置结构复杂、计算量大以及成本高的弊端。

为实现上述目的，本申请提供了一种基于双麦克风的拾音方法，包括：

获取声音信号，其中，所述声音信号为双通道时域信号；

将所述声音信号转换到频域，得到双通道频域信号；

对所述双通道频域信号做固定波束，生成第一单通道频域信号；

计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱；

根据所述第一单通道频域信号和所述语音存在概率对所述第一噪声功率谱进行更新计算，得到所述单通道频域信号的第二噪声功率谱；

根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号；

将所述第二单通道频域信号转换到时域，生成最终音频信号。

进一步的，所述根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号的步骤，包括：

根据所述第一单通道频域信号和所述第二噪声功率谱，计算所述第一单通道频域信号的先验信噪比；

根据所述先验信噪比计算得到所述第一单通道频域信号的频域滤波器系数；

根据所述频域滤波器系数将所述第一单通道频域信号进行滤波，得到第二单通道频域信号。

进一步的，所述计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱的步骤，包括：

分别计算所述双通道频域信号的自谱密度和互谱密度；

根据所述自谱密度和所述互谱密度，计算得到所述双通道频域信号的复相干函数；

根据所述复相干函数，分别计算得到所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱。

进一步的，所述根据所述复相干函数，计算得到所述第一单通道频域信号的语音存在概率的步骤，包括：

将所述复相干函数代入第一算法中，计算得到所述第一单通道频域信号的CDR比值；

对所述CDR比值做归一化处理，得到所述语音存在概率。

进一步的，所述根据所述自谱密度和所述互谱密度，计算得到所述双通道频域信号的复相干函数的步骤，包括：

将所述自谱密度和所述互谱密度代入预设公式中，计算得到初始复相干函数；

将所述初始复相干函数做时间维度一阶递归平滑，得到二次复相干函数；

将所述二次复相干函数做频率维度的5点中值滤波处理，得到所述复相干函数。

进一步的，所述根据所述第一单通道频域信号和所述第二噪声功率谱，计算所述第一单通道频域信号的先验信噪比的步骤，包括：

将所述第一单通道频域信号和所述第二噪声功率谱代入第二算法中，计算得到后验信噪比；

将所述后验信噪比代入第三算法中，计算得到所述先验信噪比。

进一步的，所述将所述声音信号转换到频域，得到双通道频域信号的步骤，包括：

将所述声音信号进行分帧加窗，得到若干帧声音子信号；

分别对各帧所述声音子信号做快速傅里叶变换，得到所述双通道频域信号，其中，所述双通道频域信号为各所述声音子信号分别对应的双通道频域子信号的集合。

本申请还提供了一种基于双麦克风的拾音装置，包括：

获取模块，用于获取声音信号，其中，所述声音信号为双通道时域信号；

第一转换模块，用于将所述声音信号转换到频域，得到双通道频域信号；

生成模块，用于对所述双通道频域数据做固定波束，生成第一单通道频域信号；

计算模块，用于计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱；

更新模块，用于根据所述第一单通道频域信号和所述语音存在概率对所述第一噪声功率谱进行更新计算，得到所述单通道频域信号的第二噪声功率谱；

降噪模块，用于根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号；

第二转换模块，用于将所述第二单通道频域信号转换到时域，生成最终音频信号。

进一步的，所述降噪模块，包括：

第一计算单元，用于根据所述第一单通道频域信号和所述第二噪声功率谱，计算所述第一单通道频域信号的先验信噪比；

第二计算单元，用于根据所述先验信噪比计算得到所述第一单通道频域信号的频域滤波器系数；

滤波单元，用于根据所述频域滤波器系数将所述第一单通道频域信号进行滤波，得到第二单通道频域信号。

进一步的，所述计算模块，包括：

第三计算单元，用于分别计算所述双通道频域信号的自谱密度和互谱密度；

第四计算单元，用于根据所述自谱密度和所述互谱密度，计算得到所述双通道频域信号的复相干函数；

第六计算单元，用于根据所述复相干函数，分别计算得到所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱。

进一步的，所述第六计算单元，包括：

第一计算子单元，用于将所述复相干函数代入第一算法中，计算得到所述第一单通道频域信号的CDR比值；

归一子单元，用于对所述CDR比值做归一化处理，得到所述语音存在概率。

进一步的，所述第四计算单元，包括：

第二计算子单元，用于将所述自谱密度和所述互谱密度代入预设公式中，计算得到初始复相干函数；

递归子单元，用于将所述初始复相干函数做时间维度一阶递归平滑，得到二次复相干函数；

滤波子单元，用于将所述二次复相干函数做频率维度的5点中值滤波处理，得到所述复相干函数。

进一步的，所述第一计算单元，包括：

第二计算子单元，用于将所述第一单通道频域信号和所述第二噪声功率谱代入第二算法中，计算得到后验信噪比；

第三计算子单元，用于将所述后验信噪比代入第三算法中，计算得到所述先验信噪比。

进一步的，所述第一转换模块，包括：

分帧单元，用于将所述声音信号进行分帧加窗，得到若干帧声音子信号；

第一转换单元，用于分别对各帧所述声音子信号做快速傅里叶变换，得到所述双通道频域信号，其中，所述双通道频域信号为各所述声音子信号分别对应的双通道频域子信号的集合。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请中提供的一种基于双麦克风的拾音方法、装置和计算机设备，通过双麦克风接收声音信号，然后将声音信号转换为双通道频域信号，对双通道频域数据做固定波束，从而生成第一单通道频域信号。在按照预设算法对第一单通道频域信号进行降噪，得到第二单通道频域信号。最后，将第二单通道频域信号转换到时域，生成最终音频信号，完成双麦克风的整个拾音过程。本申请在实现拾音的过程中，只需要双麦克风就可以完成整个拾音过程，有效降低硬件生产成本。在降噪过程中，预设算法通过利用双麦相干函数进行语音存在概率的计算和噪声谱的更新，在计算量较小的情况下大幅度提高了对远场混响和噪声的鲁棒性，有效提高拾音效果。

附图说明

图1是本申请一实施例中基于双麦克风的拾音方法的步骤示意图；

图2是本申请一实施例中基于双麦克风的拾音装置的整体结构框图；

图3是本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例中提供了一种基于双麦克风的拾音方法，包括：

S1:获取声音信号，其中，所述声音信号为双通道时域信号；

S2:将所述声音信号转换到频域，得到双通道频域信号；

S3:对所述双通道频域信号做固定波束，生成第一单通道频域信号；

S4:计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱；

S5:根据所述第一单通道频域信号和所述语音存在概率对所述第一噪声功率谱进行更新计算，得到所述单通道频域信号的第二噪声功率谱；

S6:根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号；

S7:将所述第二单通道频域信号转换到时域，生成最终音频信号。

本实施例中，拾音***通过双麦克风接收声音信号。其中，声音信号为双通道时域信号。***首先将双通道时域信号进行分帧加窗，得到若干帧双通道时域子信号。然后分别将各帧双通道时域子信号做快速傅里叶变换，将各帧双通道时域子信号变换到频域，得到各帧双通道时域子信号分别对应的双通道频域子信号，各帧双通道频域子信号的集合形成声音信号变换到频域后对应的双通道频域信号。接着，***对双通道频域信号做固定波束，即将各帧双通道频域子信号分别输入第一公式中进行相应的计算，从而生成第一单通道频域信号。具体地，第一公式为：

，其中，

、

分别为麦克风1和麦克风2在在

帧、k频率点处的短时谱，

为第一单通道频域信号。***在得到第一单通道频域信号后，按照预设算法对第一单通道频域信号进行降噪，从而得到第二单通道频域信号。具体过程为：***首先分别通过一阶递归平滑计算双通道频域信号，得到其对应的自谱密度和互谱密度。然后根据自谱密度和所述互谱密度，计算得到双通道频域信号的复相干函数，其中，复相干函数用于表征双通道信号之间各个频率之间的相关性。***根据复相干函数，分别计算得到第一单通道频域信号的语音存在概率和双通道频域信号的第一噪声功率谱。接着，根据第一单通道频域信号和语音存在概率对第一噪声功率谱进行更新计算，得到单通道频域信号的第二噪声功率谱。具体地，***利用语音存在概率作为平滑因子对第一噪声功率谱进行更新，将第一单通道频域信号和语音存在概率输入第四公式中，计算得到单通道频域信号的第二噪声功率谱。其中，第四公式为：

，

为更新后的第二噪声功率谱。具体地，第一噪声功率谱是基于双通道频域信号所计算得到的参数，第二噪声功率谱是基于单通道频域信号所计算得到的参数，双通道频域信号和单通道频域信号均为向量，比如单通道频域信号为256*1，而双通道就是256*2，第一噪声功率谱就是从256*2里面计算得到256*1，第二噪声功率谱就是从256*1得到256*1。***根据第一单通道频域信号和第二噪声功率谱，计算得到第一单通道频域信号的先验信噪比。再根据先验信噪比计算得到第一单通道频域信号的频域滤波器系数。最后，***根据频域滤波器系数将第一单通道频域信号进行滤波降噪，得到第二单通道频域信号。由于各帧双通道频域子信号的集合形成声音信号变换到频域后对应的双通道频域信号，因此降噪后的第二通道信号实际上是各双通道频域子信号降噪后各自对应的第二单通道频域子信号的集合。***分别对各第二单通道频域子信号做逆傅里叶变换，得到各第二单通道频域子信号分别对应的第二单通道时域子信号。然后将各第二单通道时域子信号做重叠相加，得到最终音频信号，完成整个拾音过程。

S601:根据所述第一单通道频域信号和所述第二噪声功率谱，计算所述第一单通道频域信号的先验信噪比；

S602:根据所述先验信噪比计算得到所述第一单通道频域信号的频域滤波器系数；

S603:根据所述频域滤波器系数将所述第一单通道频域信号进行滤波，得到第二单通道频域信号。

本实施例中，***将第一单通道频域信号和第二噪声功率谱输入第二算法中，计算得到后验信噪比，然后将后验信噪比输入第三算法中，从而计算得到第一单通道频域信号的先验信噪比。***将先验信噪比输入第五公式中，计算得到第一单通道频域信号的频域滤波器系数。其中，第五公式为：

，

为频域滤波器系数。

***根据频域滤波器系数对第一单通道频域信号进行滤波，从而得到第二单通道频域信号。其中，降噪后的第二单通道频域信号为：

。

S401:分别计算所述双通道频域信号的自谱密度和互谱密度；

S402:根据所述自谱密度和所述互谱密度，计算得到所述双通道频域信号的复相干函数；

S403:根据所述复相干函数，分别计算得到所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱。

本实施例中，***分别通过一阶递归平滑对双通道频域信号进行相应的计算，得到双通道频域信号的自谱密度和互谱密度，其中，自谱密度所对应的计算公式为：

；

互谱密度所对应的计算公式为：

；

表示功率谱密度函数，

为平滑系数，

为自谱密度，

为互谱密度。

然后，***将自谱密度和互谱密度代入第二公式中，计算得到双通道频域信号的复相干函数，用于表示双通道信号之间各个频率之间的相关性。其中，第二公式为：

，

为复相干函数。

***将复相干函数代入第一算法中，计算得到第一单通道频域信号的CDR比值，然后对CDR比值做归一化处理，得到第一单通道频域信号的语音存在概率。并且将复相干函数代入第三公式中，计算得到双通道频域信号的第一噪声功率谱。其中，第三公式为：

，

为第一噪声功率谱。

S4031:将所述复相干函数代入第一算法中，计算得到所述第一单通道频域信号的CDR比值；

S4032:对所述CDR比值做归一化处理，得到所述语音存在概率。

本实施例中，***先将复相干函数代入到第六公式中，从而计算得到CDR比值。其中，第六公式为：

，

，

为扩散噪声场的相干函数，f为信号频率，d为麦克风间距，c为声音在空气中的传播速度。在计算得到CDR比值后，***对其做归一化处理，将CDR比值代入第七公式，从而计算得到语音存在概率。其中，第七公式为：

，P为语音存在概率。

S4021:将所述自谱密度和所述互谱密度代入预设公式中，计算得到初始复相干函数；

S4022:将所述初始复相干函数做时间维度一阶递归平滑，得到二次复相干函数；

S4023:将所述二次复相干函数做频率维度的5点中值滤波处理，得到所述复相干函数。

本实施例中，***在根据自谱密度和互谱密度计算得到初始复相干函数后，此时的初始复相干函数可能会含有较多的噪音。为了能够得到更好的降噪效果，***可以对初始复相干函数做进一步的过滤处理。具体地，***先对初始复相干函数做时间维度一阶递归平滑，将其代入第八公式中，计算得到二次复相干函数。其中，第八公式为：

，

即为二次复相干函数。

然后，***将二次复相干函数做频率维度的5点中值滤波处理，按照第九公式进行相应的计算，从而得到过滤后的复相干函数，即复相干函数。其中，第九公式为：

，其中，中值滤波点数由工作人员通过相关实验确定后输入***中，

为过滤后的复相干函数，在后续的计算中，可以使用过滤后的复相干函数进行后续相应的计算。过滤后的复相干函数配合较小的平滑系数可以更快的跟踪环境噪声变化，从而有效提高降噪效果。

S6011:将所述第一单通道频域信号和所述第二噪声功率谱代入第二算法中，计算得到后验信噪比；

S6012:将所述后验信噪比代入第三算法中，计算得到所述先验信噪比。

本实施例中，***使用判决引导方法，首先将第一单通道频域信号和第二噪声功率谱代入第二算法中，从而计算得到后验信噪比。其中，第二算法为：

，

为后验信噪比。

接着，***将上一步骤中计算得到的后验信噪比代入第三算法中，从而计算得到先验信噪比。其中，第三算法为：

，

为上一时刻的权值。

S201:将所述声音信号进行分帧加窗，得到若干帧声音子信号；

S202:分别对各帧所述声音子信号做快速傅里叶变换，得到所述双通道频域信号，其中，所述双通道频域信号为各所述声音子信号分别对应的双通道频域子信号的集合。

本实施例中，***将双通道时域信号，即声音信号进行分帧加窗，从而得到若干帧双通道时域子信号，便于后续对各帧双通道时域子信号进行对应的降噪等处理，实现更好的拾音效果。***分别将各帧双通道时域子信号做快速傅里叶变换，将各帧双通道时域子信号变换到频域，从而得到各帧双通道时域子信号分别对应的双通道频域子信号，而各帧双通道频域子信号的集合形成声音信号变换到频域后对应的双通道频域信号。

进一步的，所述第二单通道频域信号为各所述双通道频域子信号降噪后各自对应的第二单通道频域子信号的集合，所述将所述第二单通道频域信号转换到时域，生成最终音频信号的步骤，包括：

S701:分别对各所述第二单通道频域子信号做逆傅里叶变换，得到各所述第二单通道频域子信号分别对应的第二单通道时域子信号；

S702:将各所述第二单通道时域子信号做重叠相加，得到所述最终音频信号。

本实施例中，由于各帧双通道频域子信号的集合形成声音信号变换到频域后对应的双通道频域信号，因此降噪后的第二通道信号实际上是各双通道频域子信号降噪后各自对应的第二单通道频域子信号的集合。***需要分别对各第二单通道频域子信号做逆傅里叶变换，将各个第二单通道频域子信号转换到时域，从而得到各第二单通道频域子信号分别对应的第二单通道时域子信号。然后，***将各第二单通道时域子信号做重叠相加，得到最终音频信号输出，完成整个拾音过程。

本实施例提供的一种基于双麦克风的拾音方法，通过双麦克风接收声音信号，然后将声音信号转换为双通道频域信号，对双通道频域数据做固定波束，从而生成第一单通道频域信号。在按照预设算法对第一单通道频域信号进行降噪，得到第二单通道频域信号。最后，将第二单通道频域信号转换到时域，生成最终音频信号，完成双麦克风的整个拾音过程。本申请在实现拾音的过程中，只需要双麦克风就可以完成整个拾音过程，有效降低硬件生产成本。在降噪过程中，预设算法通过利用双麦相干函数进行语音存在概率的计算和噪声谱的更新，在计算量较小的情况下大幅度提高了对远场混响和噪声的鲁棒性，有效提高拾音效果。

参照图2，本申请一实施例提供了一种基于双麦克风的拾音装置，包括：

获取模块1，用于获取声音信号，其中，所述声音信号为双通道时域信号；

第一转换模块2，用于将所述声音信号转换到频域，得到双通道频域信号；

生成模块3，用于对所述双通道频域数据做固定波束，生成第一单通道频域信号；

计算模块4，用于计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱；

更新模块5，用于根据所述第一单通道频域信号和所述语音存在概率对所述第一噪声功率谱进行更新计算，得到所述单通道频域信号的第二噪声功率谱；

降噪模块6，用于根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号；

第二转换模块7，用于将所述第二单通道频域信号转换到时域，生成最终音频信号。

，其中，

、

分别为麦克风1和麦克风2在在

帧、k频率点处的短时谱，

，

进一步的，所述降噪模块6，包括：

，

为频域滤波器系数。

。

进一步的，所述计算模块4，包括：

；

互谱密度所对应的计算公式为：

；

表示功率谱密度函数，

为平滑系数，

为自谱密度，

为互谱密度。

，

为复相干函数。

，

为第一噪声功率谱。

进一步的，所述第六计算单元，包括：

，

，

，P为语音存在概率。

进一步的，所述第四计算单元，包括：

，

即为二次复相干函数。

然后，***将二次复相干函数做频率维度的5点中值滤波处理，按照第九公式进行相应的计算，从而得到过滤后的复相干函数。其中，第九公式为：

进一步的，所述第一计算单元，包括：

，

为后验信噪比。

，

为上一时刻的权值。

进一步的，所述第一转换模块2，包括：

进一步的，所述第二单通道频域信号为各所述双通道频域子信号降噪后各自对应的第二单通道频域子信号的集合，所述第二转换模块7，包括：

第二转换单元，用于分别对各所述第二单通道频域子信号做逆傅里叶变换，得到各所述第二单通道频域子信号分别对应的第二单通道时域子信号；

叠加单元，用于将各所述第二单通道时域子信号做重叠相加，得到所述最终音频信号。

本申请中提供的一种基于双麦克风的拾音装置，通过双麦克风接收声音信号，然后将声音信号转换为双通道频域信号，对双通道频域数据做固定波束，从而生成第一单通道频域信号。在按照预设算法对第一单通道频域信号进行降噪，得到第二单通道频域信号。最后，将第二单通道频域信号转换到时域，生成最终音频信号，完成双麦克风的整个拾音过程。本申请在实现拾音的过程中，只需要双麦克风就可以完成整个拾音过程，有效降低硬件生产成本。在降噪过程中，预设算法通过利用双麦相干函数进行语音存在概率的计算和噪声谱的更新，在计算量较小的情况下大幅度提高了对远场混响和噪声的鲁棒性，有效提高拾音效果。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储平滑系数等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于双麦克风的拾音方法。

上述处理器执行上述基于双麦克风的拾音方法的步骤：

S1:获取声音信号，其中，所述声音信号为双通道时域信号；

S2:将所述声音信号转换到频域，得到双通道频域信号；

S401:分别计算所述双通道频域信号的自谱密度和互谱密度；

S4032:对所述CDR比值做归一化处理，得到所述语音存在概率。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种基于双麦克风的拾音方法，具体为：

S1:获取声音信号，其中，所述声音信号为双通道时域信号；

S2:将所述声音信号转换到频域，得到双通道频域信号；

S401:分别计算所述双通道频域信号的自谱密度和互谱密度；

S4032:对所述CDR比值做归一化处理，得到所述语音存在概率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储与一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM通过多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双速据率SDRAM（SSRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink）DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种基于双麦克风的拾音方法，其特征在于，包括：

获取声音信号，其中，所述声音信号为双通道时域信号；

将所述声音信号转换到频域，得到双通道频域信号；

2.根据权利要求1所述的基于双麦克风的拾音方法，其特征在于，所述根据所述第二噪声功率谱对所述第一单通道频域信号进行降噪处理，得到第二单通道频域信号的步骤，包括：

3.根据权利要求1所述的基于双麦克风的拾音方法，其特征在于，所述计算所述第一单通道频域信号的语音存在概率和所述双通道频域信号的第一噪声功率谱的步骤，包括：

分别计算所述双通道频域信号的自谱密度和互谱密度；

4.根据权利要求3所述的基于双麦克风的拾音方法，其特征在于，所述根据所述复相干函数，计算得到所述第一单通道频域信号的语音存在概率的步骤，包括：

对所述CDR比值做归一化处理，得到所述语音存在概率。

5.根据权利要求3所述的基于双麦克风的拾音方法，其特征在于，所述根据所述自谱密度和所述互谱密度，计算得到所述双通道频域信号的复相干函数的步骤，包括：

6.根据权利要求2所述的基于双麦克风的拾音方法，其特征在于，所述根据所述第一单通道频域信号和所述第二噪声功率谱，计算所述第一单通道频域信号的先验信噪比的步骤，包括：

7.根据权利要求1所述的基于双麦克风的拾音方法，其特征在于，所述将所述声音信号转换到频域，得到双通道频域信号的步骤，包括：

将所述声音信号进行分帧加窗，得到若干帧声音子信号；

8.一种基于双麦克风的拾音装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。