CN110265042B

CN110265042B - 声音信号处理方法、装置及设备

Info

Publication number: CN110265042B
Application number: CN201910471973.6A
Authority: CN
Inventors: 张晓红
Original assignee: Goertek Techology Co Ltd
Current assignee: Goertek Techology Co Ltd
Priority date: 2019-05-31
Filing date: 2019-05-31
Publication date: 2021-07-23
Anticipated expiration: 2039-05-31
Also published as: WO2020237954A1; US20220148605A1; CN110265042A; US11694700B2

Abstract

本发明公开了一种声音信号处理方法、装置及设备，该方法包括：获取上一个信号处理周期，通过扬声器发出的目标声音信号的发出信号频谱，和通过麦克风接收的目标声音信号的接收信号频谱；根据发出信号频谱以及接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段；在检测到存在信号失真频段时，在当前的信号处理周期，根据信号失真频段，对目标声音信号进行压缩处理，通过扬声器发出压缩处理后的目标声音信号。

Description

声音信号处理方法、装置及设备

技术领域

本发明涉及信号处理技术领域，更具体地，涉及一种声音信号处理方法、装置及设备。

背景技术

具有声音播放功能的声学产品(例如音箱、耳机、虚拟现实设备等)在使用过程中，通过扬声器以较大的功率播放声音时，通常会产生较大的非线性失真。这类非线性失真通常为二次或三次谐波失真，会极大影响扬声器播放声音的音质，甚至对扬声器造成损坏。

发明内容

本发明的一个目的是提供一种声音信号处理的新技术方案。

根据本发明的第一方面，提供了一种声音信号处理方法，其中，包括：

获取上一个信号处理周期，通过所述扬声器发出的目标声音信号的发出信号频谱，和通过所述麦克风接收的所述目标声音信号的接收信号频谱；

根据所述发出信号频谱以及所述接收信号频谱，检测所述目标声音信号中是否出现信号失真的信号失真频段；

在检测到存在所述信号失真频段时，在当前的信号处理周期，根据所述信号失真频段，对所述目标声音信号进行压缩处理，通过所述扬声器发出压缩处理后的所述目标声音信号。

根据本发明的第二方面，提供一种声音信号处理装置，其中，包括：

频谱获取单元，用于获取上一个信号处理周期，所述扬声器发出的目标声音信号的发出信号频谱，以及通过所述麦克风接收的所述目标声音信号的接收信号频谱；

失真检测单元，用于根据所述发出信号频谱以及所述接收信号频谱，检测所述目标声音信号中是否出现信号失真的信号失真频段；

压缩处理单元，用于在检测到存在所述信号失真频段时，在当前的信号处理周期，根据所述信号失真频段，对所述目标声音信号进行压缩处理，通过所述扬声器发出压缩处理后的所述目标声音信号。

根据本发明的第三方面，提供一种声音信号处理装置，其中，包括：

存储器，用于存储可执行的指令；

处理器，用于根据可执行的指令的控制，运行所述声音信号处理装置，执行如第一方面提供的任一项所述的声音信号处理方法。

根据本发明的第四方面，提供一种声音信号处理设备，其中，包括：

扬声器；

麦克风；

如第二方面或者第三方面所述的声音信号处理装置。

根据本公开的一个实施例，可以针对包括扬声器以及麦克风的设备，根据扬声器发出的目标声音信号的发出信号频谱、以及同一设备中麦克风接收到的目标声音信号的接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段，针对信号失真频段内的目标声音信号进行对应的信号压缩处理，实现自适应、动态地消除信号失真，提升扬声器发出的声音信号的音质，同时降低扬声器的损坏风险。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是显示可用于实现本发明的实施例的声音信号处理设备的硬件配置的例子的框图；

图2是根据本发明实施例的声音信号处理方法的流程示意图；

图3是根据本发明另一实施例的声音信号处理方法的流程示意图；

图4是根据本发明一个例子的声音信号处理方法的流程示意图；

图5是根据本发明实施例的声音信号处理装置的硬件结构示意图；

图6是根据本发明另一实施例的声音信号处理装置的硬件配置的例子的框图；

图7是根据本发明实施例的声音信号处理设备的硬件结构示意图；

图8是根据本发明另一实施例的声音信号处理设备的硬件结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

<硬件配置>

图1示出了可以用于实施本发明的实施例提供的声音信号处理方法的声音信号处理设备1000的框图。

声音信号处理设备1000可以是耳机、虚拟现实设备、音箱、电视盒子等其他智能设备，或者还可以是任意具有麦克风、扬声器的电子设备，例如手机、平板电脑等。

在一个例子中，根据图1所示，声音信号处理设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中，处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信，具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。

图1所示的声音信号处理设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中，声音信号处理设备1000的所述存储器1200用于存储指令，所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项声音信号处理方法。本领域技术人员应当理解，尽管在图1中对声音信号处理设备1000示出了多个装置，但是，本发明可以仅涉及其中的部分装置，例如，声音信号处理设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

<方法>

图2是根据一个实施例的声音信号处理方法的示意性流程图。

参照图2所示，本实施例的声音信号处理方法可以实施于任意包括扬声器以及麦克风的设备，例如，手机、平板电脑、智能耳机、智能音箱、虚拟现实设备等等。扬声器可以是任意具有声音播放、放大功能的装置，例如喇叭。

本实施例的声音信号处理方法可以包括如下步骤S2100-S2300。

步骤S2100，获取上一个信号处理周期，通过扬声器发出的目标声音信号的发出信号频谱，和通过麦克风接收的目标声音信号的接收信号频谱。

本实施例中提供的声音信号处理方法，是依据信号处理周期实现的。在每个当前的信号处理周期，获取上一个信号处理周期的信号相关信息，来实施这个信号处理周期里对声音信号的处理。信号处理周期可以根据具体的应用场景或者应用需求来设置，例如，设置为50毫秒。

在本实施例中，需要获取上一个信号处理周期的发出信号频谱和接收信号频谱。

发出信号频谱可以是扬声器发出的目标声音信号的信号频谱，具体可以是与目标声音信号对应的、进入扬声器前电信号的信号频谱，即扬声器的前端信号频谱。

接收信号频谱可以是麦克风接收到的目标声音信号转化为电信号的信号频谱。

在本实施例中，可以通过监测同一信号周期内，在同一设备中扬声器发出的目标声音信号以及麦克风接收到的目标声音信号的信号状态(包括信号频率、信号能量等)来获取发出信号频谱以及接收信号频谱。

在获取到上一个信号处理周期，扬声器的发出信号频谱和麦克风的接收信号频谱之后，进入：

步骤S2200，根据发出信号频谱以及接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段。

扬声器在以较大功率发出声音信号时，通常会产生较大的非线性失真。而在本实施例中，通过扬声器发出的目标声音信号的发出信号频谱、以及同一设备中麦克风接收到的目标声音信号的接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段，可以结合后续步骤，针对信号失真频段内的声音信号进行对应的信号压缩处理，避免继续出现信号失真，提升扬声器发出的声音信号的音质，同时降低扬声器的损坏风险。

在一个具体的例子中，根据发出信号频谱以及接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段的步骤S2200，可以包括如下步骤：S2210-S2230。

步骤S2210，获取声音信号经过扬声器传递到麦克风的信号传递函数。

在本例中，信号传递函数是以函数形式来表达的信号的频响曲线。频响曲线是根据不同频率下，与信号传递函数对应的信号传递环境或者信号传递***给予的响应绘制形成的曲线。通过信号传递函数，可以获取在对应的信号传输路径或者信号传输环境中，每个输入频率点对应的频域信号能量。

声音信号经过扬声器传递到麦克风的信号传递函数，是扬声器将电信号转化为声信号传输到麦克风，由麦克风再转化为电信号这一条传输路径对应的传递函数。

在本例中，可以通过在设备研发、出厂或者测试阶段，通过频谱仪等具有信号检测功能的仪器，检测设备中扬声器以不同频率工作发出声音信号、到麦克风接收到对应的声音信号的相关声音信号数据，分析得到声音信号经过扬声器传递到麦克风的信号传递函数，并将该信号传递函数保存在设备的本地存储中，以便在实施步骤S2120时可以被读取调用。

步骤S2220，根据信号传递函数、发出信号频谱以及接收信号频谱，获取信号差值频谱。

信号差值频谱可以表征在扬声器向麦克风传输信号的过程中，不同频率点对应的扬声器发出声音信号的频域信号能量，经过声音信号的传播路径，到麦克风接收对应声音信号的频域信号能量之间的变化。

在一个更具体的例子中，扬声器的发出信号频谱和麦克风的接收信号频谱之间的信号差值频谱D可以通过下述公式(1)获取：

D＝P₂-P₁*H (1)

其中，H为扬声器电信号转化为声信号传输到麦克风再转化为电信号的信号传递函数，P1为获取的扬声器发出的目标声音信号的发出信号频谱，P2为获取的麦克风接收的目标声音信号的接收信号频谱。

步骤S2230，检测到信号差值频谱中存在频谱幅度值大于预设的失真阈值的频段时，将频谱幅度值大于预设的失真阈值的频段，确定为信号失真频段。

在本例中，失真阈值是用于基于信号差值频谱的频谱幅度值判断是否出现信号失真的阈值。通过设置失真阈值，可以快速地基于信号差值频谱中的频谱幅度值检测到出现信号失真的频段。失真阈值可以根据工程经验或者试验仿真结果来设定，例如，失真阈值设定为0.4dB(分贝)。

信号差值频谱的频谱幅度值可以是dB形式，或者由非dB形式转换为dB形式后再与失真阈值进行比较。

通过设置失真阈值，可以判断检测到信号差值频谱中是否存在信号失真的频段，在信号差值频谱中存在信号失真的频段时，确定出信号失真频段，在结合后续步骤进行信号失真频段的压缩处理，避免信号失真影响输出声音信号的音质，同时降低扬声器可能的损坏风险。

在确定目标声音信号中的信号失真频段之后，进入：

步骤S2300，在检测到存在信号失真频段时，在当前的信号处理周期，根据信号失真频段，对目标声音信号进行压缩处理，通过扬声器发出压缩处理后的目标声音信号。

在检测到存在信号失真频段时，在当前的信号处理周期，根据信号失真频段，对目标声音信号进行压缩处理，可以实时消除或降低目标声音信号在对应的信号失真频段出现的信号失真，对应提升扬声器发出的声音信号的音质，同时降低扬声器的损坏风险。

在更具体的例子中，在检测到存在信号失真频段时，在当前的信号处理周期，根据信号失真频段，对目标声音信号进行压缩处理，通过扬声器发出压缩处理后的目标声音信号的步骤S2300，可以包括如下步骤：S2310-S2320。

步骤S2310，根据预设的压缩上限系数、压缩下限系数以及信号失真频段，确定对目标声音信号进行压缩处理的压缩处理频段。

压缩上限系数、压缩下限系数是分别针对压缩处理频段的频段上限、频段下限设置的系数，可以根据具体的应用场景或者应用需求设置。例如，压缩上限系数可以设定为1/2，压缩下限系数可以设定为1/3。

假设检测到上一个信号处理周期的信号失真频段为[F₁,F₂]，压缩上限系数设置为1/2，压缩下限系数设置为1/3，根据压缩上限系数与信号失真频段，确定压缩处理频段的上限值为F₂/2，根据压缩下限系数与信号失真频段，确定压缩处理频段的下限值为F₁/3，从而确定对目标声音信号进行压缩处理的压缩处理频段为Range＝[F₁/3,F₂/2]。

步骤S2320，在当前的信号处理周期中，对目标声音信号在压缩处理频段内，根据预设的压缩增益进行压缩处理，并对应更新目标声音信号在压缩处理频段的总压缩增益。

预设的压缩增益是用于对目标声音信号进行压缩处理所依据的信号增益，可以通过dB形式表达。具体的压缩增益的数值可以针对具体的应用场景中工程经验值选取，例如，选取为1dB，对应的，每次对声音信号进行压缩处理后，使得声音信号的频域信号能量减少1dB。

总压缩增益的更新形式可以根据具体的实现方式来实施，例如，假设当前的信号处理周期中，对于某个压缩处理频段，在实施压缩处理前，总压缩增益为N，在对该压缩处理频段内的目标声音信号进行压缩处理后，将总压缩增益更新为N-1或者N+1。

在对目标声音信号进行信号压缩处理后，对应更新目标声音信号在压缩处理频段的总压缩增益，可以通过总压缩增益来记录目标声音信号在对应的压缩处理频段内累积的信号压缩情况，在后续的信号处理周期中，可以针对每个压缩处理频段的总压缩增益，结合对应的声音信号的传输状态，动态调整目标声音信号的压缩处理过程，实现自适应地信号压缩处理，更精准地去除信号失真。

以上已经结合例子说明如图2所示的声音信号处理方法。本实施例中提供的声音信号处理方法，还可以包括如图3所示的步骤：S3100-S3200。

步骤S3100，在检测到不存在信号失真频段时，检测目标声音信号中是否存在压缩释放频段。

压缩释放频段是目标声音信号中是否存在进行信号压缩后需要释放恢复的频段。

检测到不存在信号失真频段，意味着上一个信号处理周期处理后的目标声音信号不存在信号失真，对应的无需针对信号失真进行处理，在此基础上，通过检测目标声音信号中是否存在压缩释放频段，可以结合后续步骤，对压缩释放频段内的目标声音信号，进行相应的压缩释放处理，使得实现针对当前的信号传输状态，实时、动态、自适应地调整对目标声音信号的压缩处理，精准消除信号失真的前提下，同时有效保证目标声音信号的声音传输性能。

在更具体的一个例子中，在检测到不存在信号失真频段时，检测目标声音信号中是否存在压缩释放频段的步骤S3100，可以包括如下步骤：S3110a-S3120a。

步骤S3110a，获取在之前的信号处理周期中，目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益。

总压缩增益是针对对应的信号压缩频段记录的累积压缩增益，可以反映此前的信号处理过程中在对应信号压缩频段中，目标声音信号的压缩处理状态。

步骤S3120a，当存在至少一个总压缩增益不为0的信号压缩频段时，在根据信号传递函数、发出信号频谱以及接收信号频谱获取的信号差值频谱中，检测到该信号压缩频段的频谱幅度值均小于预设的压缩释放阈值时，将该信号压缩频段确定为压缩释放频段。

信号传递函数是声音信号经过扬声器传递到麦克风的传递函数，具体含义如前文所述，在此不再赘述。

压缩释放阈值是用于根据信号差值频度中的频谱幅度值判断是否对目标声音信号实施压缩释放的阈值。压缩释放阈值可以根据工程经验或者试验仿真结果来设定。

在本例中，可以设定压缩释放阈值小于失真阈值，可以避免信号频谱中接近失真阈值的信号进入压缩处理和压缩释放处理交替进行的死循环。例如，失真阈值设置为0.4dB，压缩释放阈值可以设置为0.3dB。

信号差值频谱的相关描述在前文中已经描述，在此不再赘述。

本实施例中，通过设置压缩释放阈值，与最近的信号处理周期中的信号差值频谱比较，可以在对目标声音信号实施压缩处理后，针对目标声音信号对应的全部频段范围内的最近的信号传输状态，确定需进行压缩释放处理的压缩释放频段，以便结合后续步骤对压缩释放频段内的目标声音信号进行压缩释放处理，使得目标声音信号可以基于更大的信号能量进行传输，在精准消除信号失真的前提下，同时有效保证目标声音信号的传输性能。

在更具体的另一个例子中，在检测到不存在信号失真频段时，检测目标声音信号中是否存在压缩释放频段的步骤S3100，可以包括如下步骤：S3110b-S3120b。

步骤S3110b，获取在之前的信号处理周期中，目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益。

步骤S3110b可以同上述另一个例子中的步骤S3110a，在此不再赘述。

步骤S3120b，对每个总压缩增益不为0的信号压缩频段，在根据信号传递函数、发出信号频谱以及接收信号频谱，获取的信号压缩频段的压缩信号差值频谱中，检测到压缩信号差值频谱的频谱幅度值小于预设的压缩释放阈值时，将信号压缩频段确定为所述压缩释放频段。

信号传递函、压缩释放阈值在前文已经详细描述，在此不再赘述。

压缩信号差值频谱时针对对应的信号压缩频段，在根据信号传递函数、最近的信号处理周期的发出信号频谱以及接收信号频谱获取的，与信号差值频谱的获取方式类似，在此不再赘述。

本实施例中，通过设置压缩释放阈值，与最近的信号处理周期内、实施过信号压缩处理的信号压缩频段的压缩信号差值频谱比较，可以在对目标声音信号实施压缩处理后，针对压缩信号频段内的最新的信号传输状态，确定需进行压缩释放处理的压缩释放频段，以便结合后续步骤对压缩释放频段内的目标声音信号进行压缩释放处理，使得目标声音信号可以基于更大的信号能量进行传输，在精准消除信号失真的前提下，同时有效保证目标声音信号的传输性能。同时只针对特定的频段实施压缩释放的检测、处理，可以进一步提高压缩释放处理的效率。

在检测到目标声音信号中存在压缩释放频段之后，进入：

步骤S3200，在检测到存在压缩释放频段时，在当前的信号处理周期，根据信号释放频段，对目标声音信号进行压缩释放处理，通过扬声器发出压缩释放处理后的目标声音信号。

本实施例中，在目标声音信号中存在压缩释放频段，对压缩释放频段的压缩释放处理，可以避免压缩处理后的信号变小影响目标声音信号的音质。

在更具体的例子中，在检测到存在压缩释放频段时，在当前的信号处理周期，根据信号释放频段，对目标声音信号进行压缩释放处理，通过扬声器发出压缩释放处理后的目标声音信号的步骤S3200，可以包括步骤：S3210。

步骤S3210，在当前的信号处理周期中，对目标声音信号在压缩释放频段内，根据预设的压缩增益进行压缩释放处理，并对应更新目标声音信号在压缩释放频段的总压缩增益。

预设的压缩增益是用于对目标声音信号进行压缩释放处理所依据的信号增益，可以通过dB形式表达。该预设的压缩增益也可以应用于对声音信号的压缩处理。具体的压缩增益的数值可以针对具体的应用场景中工程经验值选取，例如，选取为1dB，对应的，每次对声音信号进行压缩释放处理后，使得声音信号的频域信号能量增加1dB。

总压缩增益的更新形式可以根据具体的实现方式来实施，例如，假设当前的信号处理周期中，对于某个压缩释放频段，在实施压缩释放前，总压缩增益为N，在对该压缩处理频段内的目标声音信号进行压缩释放后，将总压缩增益更新为N-1或者N+1，对应与压缩处理后的总压缩增益的更新对应即可，例如，压缩处理以及压缩释放过程中使用同样的压缩增益，都是1dB，在压缩处理后，总压缩增益更新为N+1，那么对应的，在实施压缩释放后，总压缩增益更新为N-1。

在对目标声音信号进行信号压缩释放处理后，对应更新目标声音信号在压缩释放频段的总压缩增益，可以通过总压缩增益来记录目标声音信号在对应的压缩释放频段内累积的信号压缩释放情况，在后续的信号处理周期中，可以针对每个压缩释放频段的总压缩增益，结合对应的声音信号的传输状态，实时调整目标声音信号的压缩释放处理，自适应地调整信号的压缩、释放，实现对目标声音信号的动态压缩处理，更精准地去除信号失真，并同时有效地保证目标声音信号的传输性能。

<例子>

以下将结合图4进一步说明本实施例中提供的声音信号处理方法。

本例子实施于包括扬声器以及麦克风的设备，假设压缩上限系数设定为1/2，压缩下限系数设定为1/3，预设的压缩增益设定为1dB，失真阈值设定为0.4dB，压缩释放阈值设定为0.3dB。

该声音信号处理方法可以包括如下步骤：

步骤S4010，获取上一个信号处理周期，扬声器发出的目标声音信号的发出信号频谱P₁，和通过麦克风接收的目标声音信号的接收信号频谱P₂。

步骤S4020，获取声音信号经过扬声器传递到麦克风的信号传递函数F。

步骤S4030，根据信号传递函数H、发出信号频谱P₁以及接收信号频谱P₂，获取信号差值频谱D。

步骤S4040，判断信号差值频谱中是否存在频谱幅度值大于预设的失真阈值的频段，如果信号差值频谱中存在频谱幅度值大于失真阈值的频段，执行步骤S4050，否则，执行步骤S4080。

步骤S4050，将频谱幅度值大于失真阈值的频段，确定为信号失真频段[F₁,F₂]。

步骤S4060，根据预设的压缩上限系数、压缩下限系数以及信号失真频段[F₁,F₂]，确定对目标声音信号进行压缩处理的压缩处理频段[F₁/3,F₂/2]。

步骤S4070，在当前的信号处理周期中，对目标声音信号在压缩处理频段[F₁/3,F₂/2]内的信号压缩1dB，并对应更新目标声音信号在压缩处理频段的总压缩增益，然后，转回步骤S4010，等待下一个信号处理周期，进行对目标声音信号进行处理。

例如，在压缩处理前总压缩增益是N，在进行压缩处理后，将总压缩增益更新为N-1。

步骤S4080，获取目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益N。

步骤S4090，判断是否存在至少一个总压缩增益不为0的信号压缩频段，如果存在至少一个总压缩增益不为0的信号压缩频段，执行步骤S4100否则，转回步骤S4010，等待下一个信号处理周期，进行对目标声音信号进行处理。

步骤S4100，判断信号差值频谱D中信号压缩频段的频谱幅度值是否存在小于预设的压缩释放阈值，如果压缩频段的频谱幅度值小于压缩释放阈值，执行步骤S4200，否则，转回步骤S4010，等待下一个信号处理周期，进行对目标声音信号进行处理。

步骤S4200，将信号压缩频段确定为压缩释放频段。

步骤S4300，在当前的信号处理周期中，在压缩释放频段内，对进行1dB压缩释放处理，并对应更新目标声音信号在压缩释放频段的总压缩增益，然后，转回步骤S4010，等待下一个信号处理周期，进行对目标声音信号进行处理。

例如，在压缩释放处理前总压缩增益是N，在进行压缩释放处理后，将总压缩增益更新为N+1。

在这个例子中，可以针对包括扬声器以及麦克风的设备，根据扬声器发出的目标声音信号的发出信号频谱、以及同一设备中麦克风接收到的目标声音信号的接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段，针对信号失真频段内的目标声音信号进行对应的信号压缩处理，而在不存在信号失真频段时，检测目标声音信号中是否存在需要进行压缩释放处理的压缩释放频段，针对压缩释放频段内的目标声音信号进行对应的压缩释放处理，实现结合当前的信号传输状态，自适应、动态地进行信号压缩处理，精准地消除信号失真，有效地保证声音信号的传输性能，提升扬声器发出的声音信号的音质，降低扬声器的损坏风险。

<声音信号处理装置>

在本实施例中，还提供一种声音信号处理装置5000，如图5所示。声音信号处理装置5000可以包括频谱获取单元5010、失真检测单元5020、压缩处理单元5030，用于实施本实施例中提供的声音信号处理方法，在此不再赘述。

该频谱获取单元5010可以用于获取上一个信号处理周期，扬声器发出的目标声音信号的发出信号频谱，以及通过麦克风接收的目标声音信号的接收信号频谱。

该失真检测单元5020可以用于根据发出信号频谱以及接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段。

在更具体的例子中，该失真检测单元5020可以包括信号传递函数获取子单元5021、信号差值频谱获取子单元5022、信号失真频段确定子单元5023。

该信号传递函数获取子单元5021可以用于获取声音信号经过扬声器传递到麦克风的信号传递函数。

该信号差值频谱获取子单元5022可以用于根据信号传递函数、发出信号频谱以及接收信号频谱，获取信号差值频谱。

该信号失真频段确定子单元5023可以用于检测到信号差值频谱中存在频谱幅度值大于预设的失真阈值的频段时，将频谱幅度值大于预设的失真阈值的频段，确定为信号失真频段。

该压缩处理单元5030可以用于在检测到存在信号失真频段时，在当前的信号处理周期，根据信号失真频段，对目标声音信号进行压缩处理，通过扬声器发出压缩处理后的目标声音信号。

在更具体的例子中，该压缩处理单元5030可以包括压缩处理频段确定子单元5031、总压缩增益更新子单元5032。

该压缩处理频段确定子单元5031可以用于根据预设的压缩上限系数、压缩下限系数以及信号失真频段，确定对目标声音信号进行压缩处理的压缩处理频段。

该总压缩增益更新子单元5032可以用于在当前的信号处理周期中，对目标声音信号在所述压缩处理频段内，根据预设的压缩增益进行压缩处理，并对应更新目标声音信号在压缩处理频段的总压缩增益。

在一个实施例中，该声音信号处理装置还可以包括压缩释放频段检测单元5100、输出单元5200。

该压缩释放频段检测单元5100可以用于在检测到不存在信号失真频段时，检测目标声音信号中是否存在压缩释放频段。

在更具体的一个例子中，该压缩释放频段检测单元5100可以包括总压缩增益获取子单元5110a、压缩释放频段确定子单元5120a。

该总压缩增益获取子单元5110a可以用于获取在之前的信号处理周期中，目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益。

该压缩释放频段确定子单元5120a可以用于当存在至少一个总压缩增益不为0的信号压缩频段时，在根据信号传递函数、所述发出信号频谱以及所述接收信号频谱获取的信号差值频谱中，检测到所述信号压缩频段的频谱幅度值均小于预设的压缩释放阈值时，将所述信号压缩频段确定为所述压缩释放频段。

在更具体的另一个例子中，该压缩释放频段检测单元5100可以包括总压缩增益获取子单元5110b、压缩释放频段确定子单元5120b。

该总压缩增益获取子单元5110b可以用于获取在之前的信号处理周期中，目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益。

该压缩释放频段确定子单元5120b可以用于对每个总压缩增益不为0的信号压缩频段，在根据信号传递函数、发出信号频谱以及接收信号频谱，获取的信号压缩频段的压缩信号差值频谱中，检测到压缩信号差值频谱的频谱幅度值小于预设的压缩释放阈值时，将信号压缩频段确定为压缩释放频段。

该输出单元5200可以用于在检测到存在压缩释放频段时，在当前的信号处理周期，根据信号释放频段，对目标声音信号进行压缩释放处理，通过扬声器发出压缩释放处理后的目标声音信号。

在更具体的例子中，输出单元5200可以包括在当前的信号处理周期中，对目标声音信号在压缩释放频段内，根据预设的压缩增益进行压缩释放处理，并对应更新目标声音信号在压缩释放频段的总压缩增益的子单元。

本领域技术人员应当明白，可以通过各种方式来实现声音信号处理装置5000。例如，可以通过指令配置处理器来实现声音信号处理装置5000。例如，可以将指令存储在ROM中，并且当启动设备时，将指令从ROM读取到可编程器件中来实现声音信号处理装置5000。例如，可以将声音信号处理装置5000固化到专用器件(例如ASIC)中。可以将声音信号处理装置5000分成相互独立的单元，或者可以将它们合并在一起实现。声音信号处理装置5000可以通过上述各种实现方式中的一种来实现，或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。

在本实施例中，还提供另一种声音信号处理装置6000，如图6所示，包括：

存储器6010，用于存储可执行指令；

处理器6020，用于根据所述可执行指令的控制，运行声音信号处理设备执行如本实施例中提供的声音信号处理方法。

在本实施例中，声音信号处理装置6000可以是耳机、虚拟现实设备、音箱、电视盒子等其他智能设备等中的具有声音信号处理功能的模块。

<声音信号处理设备>

在本实施例中，还提供一种声音信号处理设备7000，声音信号处理设备7000包括：

扬声器7010，用于发出的目标声音信号的发出信号频谱；

麦克风7020，用于接收的目标声音信号的接收信号频谱；

本实施例中提供的声音信号处理装置5000或者声音信号处理装置6000。

例如，可以如图7所示，声音信号处理设备7000包括声音信号处理装置5000，或者，可以如图8所示，声音信号处理设备7000包括声音信号处理装置6000。

本实施例中，声音信号处理设备可以是耳机、虚拟现实设备、音箱、电视盒子等其他智能设备。本实施例可以通过声音信号处理设备实施对应的声音信号处理方法，在此不再赘述。

以上已经结合附图和例子说明本实施例中提供的声音信号处理方法、装置及设备，可以针对包括扬声器以及麦克风的设备，根据扬声器发出的目标声音信号的发出信号频谱、以及同一设备中麦克风接收到的目标声音信号的接收信号频谱，检测目标声音信号中是否出现信号失真的信号失真频段，针对信号失真频段内的目标声音信号进行对应的信号压缩处理，实现自适应、动态地消除信号失真，提升扬声器发出的声音信号的音质，同时降低扬声器的损坏风险。

本发明可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims

1.一种声音信号处理方法，其特征在于，实施于包括扬声器以及麦克风的设备，包括：

在检测到存在所述信号失真频段时，在当前的信号处理周期，根据所述信号失真频段，对所述目标声音信号进行压缩处理，通过所述扬声器发出压缩处理后的所述目标声音信号；以及

在检测到不存在所述信号失真频段时，检测所述目标声音信号中是否存在压缩释放频段；在检测到存在压缩释放频段时，在当前的信号处理周期，根据所述压缩释放频段，对所述目标声音信号进行压缩释放处理，通过所述扬声器发出压缩释放处理后的所述目标声音信号。

2.根据权利要求1所述的方法，其特征在于，所述根据所述发出信号频谱以及所述接收信号频谱，检测所述目标声音信号是否存在信号失真的信号失真频段的步骤包括：

获取声音信号经过所述扬声器传递到所述麦克风的信号传递函数；

根据所述信号传递函数、所述发出信号频谱以及所述接收信号频谱，获取信号差值频谱；

检测到所述信号差值频谱中存在频谱幅度值大于预设的失真阈值的频段时，将所述频谱幅度值大于预设的失真阈值的频段，确定为所述信号失真频段。

3.根据权利要求1所述的方法，其特征在于，所述在检测到存在所述信号失真频段时，在当前的信号处理周期，根据所述信号失真频段，对所述目标声音信号进行压缩处理，包括：

根据预设的压缩上限系数、压缩下限系数以及所述信号失真频段，确定对所述目标声音信号进行压缩处理的压缩处理频段；

在当前的信号处理周期中，对所述目标声音信号在所述压缩处理频段内，根据预设的压缩增益进行压缩处理，并对应更新所述目标声音信号在所述压缩处理频段的总压缩增益。

4.根据权利要求1所述的方法，其特征在于，所述在检测到不存在所述信号失真频段时，检测所述目标声音信号中是否存在压缩释放频段，包括：

获取在之前的信号处理周期中，所述目标声音信号在进行信号压缩处理的每个信号压缩频段内的总压缩增益；

当存在至少一个总压缩增益不为0的所述信号压缩频段时，在根据信号传递函数、所述发出信号频谱以及所述接收信号频谱获取的信号差值频谱中，检测到所述信号压缩频段的频谱幅度值均小于预设的压缩释放阈值时，将所述信号压缩频段确定为所述压缩释放频段；

其中，所述信号传递函是声音信号经过所述扬声器传递到所述麦克风的传递函数。

5.根据权利要求1所述的方法，其特征在于，所述在检测到不存在所述信号失真频段时，检测所述目标声音信号中是否存在压缩释放频段，包括：

对每个所述总压缩增益不为0的信号压缩频段，在根据信号传递函数、所述发出信号频谱以及所述接收信号频谱，获取的所述信号压缩频段的压缩信号差值频谱中，检测到所述压缩信号差值频谱的频谱幅度值小于预设的压缩释放阈值时，将所述信号压缩频段确定为所述压缩释放频段；

6.根据权利要求1所述的方法，其特征在于，在检测到存在压缩释放频段时，在当前的信号处理周期，根据所述压缩释放频段，对所述目标声音信号进行压缩释放处理，包括：

在当前的信号处理周期中，对所述目标声音信号在所述压缩释放频段内，根据预设的压缩增益进行压缩释放处理，并对应更新所述目标声音信号在所述压缩释放频段的总压缩增益。

7.一种声音信号处理装置，其特征在于，包括：

频谱获取单元，用于获取上一个信号处理周期，扬声器发出的目标声音信号的发出信号频谱，以及通过麦克风接收的所述目标声音信号的接收信号频谱；

压缩处理单元，用于在检测到存在所述信号失真频段时，在当前的信号处理周期，根据所述信号失真频段，对所述目标声音信号进行压缩处理，通过所述扬声器发出压缩处理后的所述目标声音信号；以及在检测到不存在所述信号失真频段时，检测所述目标声音信号中是否存在压缩释放频段；在检测到存在压缩释放频段时，在当前的信号处理周期，根据所述压缩释放频段，对所述目标声音信号进行压缩释放处理，通过所述扬声器发出压缩释放处理后的所述目标声音信号。

8.一种声音信号处理装置，其特征在于，包括：

存储器，用于存储可执行的指令；

处理器，用于根据可执行的指令的控制，运行所述声音信号处理装置，执行如权利要求1-6任一项所述的声音信号处理方法。

9.一种声音信号处理设备，其特征在于，包括：

扬声器；

麦克风；以及，

如权利要求7或8所述的声音信号处理装置。