CN104269177B

CN104269177B - 一种语音处理方法及电子设备

Info

Publication number: CN104269177B
Application number: CN201410488490.4A
Authority: CN
Inventors: 齐峰岩
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2014-09-22
Filing date: 2014-09-22
Publication date: 2017-11-07
Anticipated expiration: 2034-09-22
Also published as: CN104269177A

Abstract

本发明公开了一种语音处理方法及电子设备，该方法包括：电子设备接收到下行语音数据后，提取所述下行语音数据的第一特征参数；对所述下行语音数据进行下行降噪处理，得到第一语音数据，并提取所述第一语音数据的第二特征参数；根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据；其中，所述第二语音数据的可懂度大于所述接收到的下行语音数据的可懂度；输出所述第二语音数据。本发明所提供的方法和装置解决现有技术语音噪声抑制方法的噪声抑制性能不稳定，语音会发生断续和音质下降的问题。

Description

一种语音处理方法及电子设备

技术领域

本发明涉及电子技术领域，尤其涉及一种语音处理方法及电子设备。

背景技术

随着电子技术的飞速发展，人们的生活和网络及各种功能各异的电子产品越加紧密的联系在一起，现今的智能手机用户对语音通话质量要求越来越高，各大平台厂商和第三方供应商都在提升通话质量方面推出很多解决方案，而手机通信厂商则最看重的是下行语音质量，这可以提升用户的品牌认知，而下行通话质量主要受到单通道语音降噪以及外放手机扬声器限制的影响。在单通道下行降噪一般没有其它的参考，需要通过声音活动侦查(voice activity detection，VAD)识别出噪声段，通过噪声估计算法形成降噪参考，在各种噪声环境中测试发现在降噪的同时很容易损伤语音，造成断续和降质，而放在移动设备上扬声器的尺寸很小，低频表现力较差。

本申请发明人在实现本申请实施例中技术方案的过程中，发现现有技术存在如下技术问题：

现有技术中的下行语音噪声抑制的方法为：电子设备接收到下行语音数据后，对语音数据进行解码；然后对解码数据进行增益放大处理，然后将放大处理的后语音数据通过高通滤波器；将高通滤波器输出的数据分两路进行处理：其中第一路通过声音活动侦查(voice activity detection，VAD)识别出噪声段，通过噪声估计算法形成降噪参考；第二路通过信噪比评估，确定降噪处理的幅度。然后根据降噪参考和信噪比评估之后的降噪幅度等参数进行噪声抑制处理得到最终的语音数据。

上述现有技术的语音噪声抑制方法在不同的非稳态噪声环境中，电子设备的噪声抑制性能不稳定，语音会发生断续和音质下降，尤其是在嘈杂人声的环境中，噪声抑制性能很差。

发明内容

本发明提供一种语音处理方法及电子设备，本发明所提供的方法和装置解决现有技术所提供的语音噪声抑制方法在不同的非稳态噪声环境中，电子设备的噪声抑制性能不稳定，语音会发生断续和音质下降的问题。

本发明提供一种语音处理方法，该方法应用于一电子设备中，该方法包括：

电子设备接收到下行语音数据后，提取所述下行语音数据的第一特征参数；

对所述下行语音数据进行下行降噪处理，得到第一语音数据，并提取所述第一语音数据的第二特征参数；

根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据；其中，所述第二语音数据的可懂度大于所述接收到的下行语音数据的可懂度；

输出所述第二语音数据。

可选的，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据包括：

根据所述第一特征参数和第二特征参数确定进行平滑处理的第三特征参数，利用所述第三特征参数对所述第一语音数据进行平滑处理，得到第二语音数据。

根据所述第一特征参数和第二特征参数对所述第一语音数据中的低频分量进行加强，得到所述第二语音数据。

可选的，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理之后，还进一步包括：

获取电子设备中扬声器的扬声器特性参数；

根据所述扬声器特性参数对第二语音数据进行增强处理。

可选的，根据所述扬声器特性参数对第二语音数据进行增强处理包括：

从所述扬声器特性参数中获取谐波失真THD，根据所述THD对所述第二语音数据中的设定频段进行增强处理。

可选的，所述第一特征参数和所述第二特征参数都至少包括语音数据的基音周期、线性预测系数和能量参数中的至少一项或多项的组合。

针对上述方法，本发明还提一种电子设备，该电子设备包括：

第一特征提取单元，用于在接收到下行语音数据后，提取所述下行语音数据的第一特征参数；

第二特征提取单元，用于对所述下行语音数据进行下行降噪处理，得到第一语音数据，并提取所述第一语音数据的第二特征参数；

第一增强单元，用于根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据；其中，所述第二语音数据的可懂度大于所述接收到的下行语音数据的可懂度；

输出单元，用于输出所述第二语音数据。

可选的，第一增强单元具体用于根据所述第一特征参数和第二特征参数确定进行平滑处理的第三特征参数，利用所述第三特征参数对所述第一语音数据进行平滑处理，得到第二语音数据。

可选的，第一增强单元具体用于根据所述第一特征参数和第二特征参数对所述第一语音数据中的低频分量进行加强，得到所述第二语音数据。

可选的，该设备还包括：

第二增强单元，用于获取电子设备中扬声器的扬声器特性参数；根据所述扬声器特性参数对第二语音数据进行增强处理。

可选的，所述第二增强单元根据所述扬声器特性参数对第二语音数据进行增强处理包括：

可选的，所述第一特征参数第一特征提取单元和第二特征提取单元所提供的第一特征参数和所述第二特征参数至少包括语音数据的基音周期、线性预测系数和能量参数中的至少一项或多项的组合。

上述技术方案中的一个或两个，至少具有如下技术效果：

本发明实施例提供的方法中，对最初接收到的下行语音数据以及降噪处理后的语音数据分别提取特征参数，然后用提取的两次特征参数对降噪处理后的语音数据进行增强处理，使得增强处理后的语音数据相对于最初接收到的下行语音数据具有更高的可懂度和/或舒适度。提升降噪后的语音质量；有效改善小扬声器在低频上的通话质量；

另外，因为本发明实施例中进行增强处理的增强算法可以是根据用户的需求以及电子设备的一些特性进行设置，增强算法的参数因人而异，所以最后输出的语音数据可以是有针对性的加强之后的数据。

附图说明

图1为本发明实施例一种语音处理方法的流程示意图；

图2为本发明实施例一种电子设备的结构示意图。

具体实施方式

现有技术所提供的语音噪声抑制方法在不同的非稳态噪声环境中，电子设备的噪声抑制性能不稳定，语音会发生断续和音质下降，尤其是在嘈杂人声的环境中，噪声抑制性能很差。针对现有技术中的这一问题，本发明实施例提供一种语音处理方法，该方法应用于一电子设备中，该方法包括：

输出所述第二语音数据。

本发明实施例提供的方法中，对最初接收到的下行语音数据以及降噪处理后的语音数据分别提取特征参数，然后用提取的两次特征参数对降噪处理后的语音数据进行增强处理，使得增强处理后的语音数据相对于最初接收到的下行语音数据具有更高的可懂度和/或舒适度。

下面将参照下述细节对本发明的各种实施例和各个方面进行说明，附图将图示各种实施例。下面的说明和附图是对本发明的示例性说明，而不应看作对本发明的限制。描述了大量具体细节以提供对本发明各种实施例的详尽理解。但是在某些情况下，将不对公知的或传统的细节进行描述，以对本发明的实施例提供简要的说明。

下文具体实施方式的某些部分是以算法的形式展现的，这些算法包括对于计算机存储器内储存的数据进行的操作。算法大体上是指造成所需结果的操作的自洽序列。这些操作通常需要或涉及到物理操纵或物理量。通常(但不是必然)，这些量采取电信号或磁信号的形式，这些信号能够被储存、传输、合并、比较和以其他方式受到操纵。业已证明，有时(主要是为了通常使用的原因)，将这些信号称为位、值、元素、符号、字符、项、数等等是方便的。

但是应当牢记，这些以及类似的所有术语是与适当的物理量相关联的，并且仅仅是应用于这些量的方便的标号。除非下文中明显地以其他形式另有说明外，整个说明书中使用诸如“处理”或“计算”或“判定”或“显示”等术语所进行的说明可以指数据处理***或类似电子装置进行的动作和处理，所述动作和处理操纵计算机的寄存器和存储器内以物理(电子)量表示的数据并将其转换成该***的存储器或寄存器(或其他这类信息存储、传输或显示的装置)内类似地以物理量的形式表示的其他数据。

本发明可以涉及用于执行本申请中所述操作中的一项或多项操作的设备。该设备可以为所需的目的而专门构造，或者也可以包括通用计算机，所述通用计算机由储存在该计算机中的计算机程序选择性地激活(activate)或重构(reconfigure)。这样的计算机程序可以被储存在机器(例如计算机)可读介质中或者存储在适于储存电子指令并分别耦联到总线的任何类型介质中，所述计算机可读介质包括但不限于任何类型的盘(包括软盘、光盘、CD-ROM、和磁光盘)、只读存储器(ROM)、随机存取存储器(RAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存、磁性卡片或光学卡片。

机器可读介质包括用于以由机器(例如计算机)可读的形式储存或传输信息的任何机构。例如，机器可读介质包括只读存储器(ROM)；随机存取存储器(RAM)、磁盘储存介质、光学储存介质、闪存装置、以电的、光的、声的或其他的形式传播的信号(例如载波、红外信号、数字信号等)等。

如图1所示，本发明实施例提供一种语音处理方法，该方法应用于一电子设备中，下面结合说明书附图对本发明的具体实施方式进行详细说明：

步骤101，电子设备接收到下行语音数据后，提取所述下行语音数据的第一特征参数；

步骤102，对所述下行语音数据进行下行降噪处理，得到第一语音数据，并提取所述第一语音数据的第二特征参数；

在本发明实施例中，所述第一特征参数和第二特征参数都可以是语音数据的基音周期、线性预测系数和能量参数中的至少一项或多项的组合。在该实施例中第一特征参数和第二特征参数选择的特征项相同，即第一特征参数为基音周期，则对应的第二特征参数也是基音周期；当第一特征参数的参数项变化时第二特征参数的参数项也对应的变化。

其中，所述基音周期为语音数据对应语音的基频；所述线性预测系数为语音数据对应语音的频谱包络；所述能量为语音数据对应声音的大小。

在本发明实施例中，第一特征参数和第二特征参数的提取没有先后关系的限制，在第一特征参数和第二特征参数可以在同一时间提取。

步骤103，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据；其中，所述第二语音数据的可懂度大于所述接收到的下行语音数据的可懂度；

在发明实施例中，因为第一特征参数和第二特征参数是针对降噪处理前后的语音数据进行提取的，所以第一特征参数和第二特征参数的比较能够反应出降噪处理对原始的下行语音数据的影响，所以本发明实施例所提供的方法就可以参考提取的两个特征参数和预设的增强算法对第一语音数据进行一定的增强处理，从而提高输出的语音数据的舒适度和可懂度。

在具体实现时，第二语音数据相对于所述下行语音数据而言不仅仅是可懂度有所提高，第二语音数据的舒适度也比原始的下行语音数据要高，其中舒适度可以通过MOS(Mean Opinion Score)值进行衡量。

步骤104，输出第二语音数据。

在本发明实施例中，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据的具体实现方式包括多种，以下通过几种可实现方式对本发明的方案作进一步的说明，具体实现包括：

一、利用第一特征参数和第二特征参数对第一语音数据做平滑处理，具体实现包括：

对所述第一语音数据进行平滑处理时，可以参照波形内插语音编码模型。在本发明实施例中进行平滑处理的具体实现步骤范式可以是：

获取下行语音数据的前一帧和后一帧语音数据，并分别提取前一帧和后一帧语音数据的特征参数(前一帧对应第三特征参数和后一帧对应第四特征参数)；

确定第一特征参数与第三特征参数和第四特征参数的第一差异值，第二特征参数与第三特征参数和第四特征参数的第二差异值；

利用所述第一差异值、第二差异值、第一特征参数和第二特征参数计算出第三特征参数；

然后用所述第三特征参数调整第一语音数据，得到第二语音数据；第二语音数据的各项特征参数介于所述第一语音数据的原始的下行语音数据之间。

二、为了使语音听得更清楚，语音的可懂度增加，可采用的实现方式增加语音低频的能量，所以本发明实施例中还可以对第一语音数据中部分频段的分量进行加强，具体实现包括：

在具体实现时候，在对低频分量进行加强的最优化方案是：加强低频的基频分量和第一共振峰。第一特征参数和第二特征参数确定对低频分量加强时的具体加强额度。

三、根据扬声器的参数确定增强处理的内容，具体实现包括：

获取电子设备中扬声器的扬声器特性参数；

根据所述扬声器特性参数对第二语音数据进行增强处理。

因为扬声器的各项参数直接影响语音数据的输出效果，所以为了提高语音数据的舒适度以及可懂度还要在输出语音数据之前，确定扬声器的特征从而有针对性的对待输出的语音数据进行增强处理。在具体实现的时候可以选择扬声器的多种参数，本实施例中以总谐波失真(total harmonic distortion，THD)对本发明实施例中的增强处理做进一步的说明，其中，总谐波失真是指用信号源输入时，输出信号(谐波及其倍频成分)比输入信号多出的额外谐波成分，通常用百分数来表示：

在具体的实现中，扬声器的各项参数在扬声器出厂时厂家都会给出，为了根据扬声器调整输出的语音数据，首先获取每个扬声器的特性参数，并根据获取到的特性参数进行对应处理：

因为THD用来衡量语音数据的失真程度，所以在进行具体的增强处理时，如果在某频段的THD值较高，则避免在此频段增加增益。

在本发明实施例中，上述三种语音增强的方式可以单独使用，也可以根据需求进行任一的组合，而且上述三种方式进行组合时没有前后关系的限制可以是以任一方式组合实现语音增强。

如图2所示，本发明实施例还提供一种电子设备，该电子设备包括：

第一特征提取单元201，用于在接收到下行语音数据后，提取所述下行语音数据的第一特征参数；

第二特征提取单元202，用于对所述下行语音数据进行下行降噪处理，得到第一语音数据，并提取所述第一语音数据的第二特征参数；

在该实施例中，第一特征参数第一特征提取单元和第二特征提取单元所提供的第一特征参数和所述第二特征参数至少包括语音数据的基音周期、线性预测系数和能量参数中的至少一项或多项的组合。

第一增强单元203，用于根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据；其中，所述第二语音数据的可懂度大于所述接收到的下行语音数据的可懂度；

输出单元204，用于输出所述第二语音数据。

可选的，该设备还包括：

在选择扬声器的特性参数时，可以选择特性参数中的总谐波失真THD，则对应的实现可以是：

所述第二增强单元根据所述扬声器特性参数对第二语音数据进行增强处理包括：

本申请实施例中的上述一个或多个技术方案，至少具有如下的技术效果：

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

具体来讲，本申请实施例中的两种信息处理方法对应的计算机程序指令可以被存储在光盘，硬盘，U盘等存储介质上。

对于本发明实施例提供的一种语音处理方法，当存储介质中的与所述信息处理方法对应的计算机程序指令被一电子设备读取或被执行时，包括如下步骤：

输出所述第二语音数据。

获取电子设备中扬声器的扬声器特性参数；

根据所述扬声器特性参数对第二语音数据进行增强处理。

本发明所述的方法并不限于具体实施方式中所述的实施例，本领域技术人员根据本发明的技术方案得出其它的实施方式，同样属于本发明的技术创新范围。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音处理方法，该方法应用于一电子设备中，其特征在于，该方法包括：

输出所述第二语音数据。

2.如权利要求1所述的方法，其特征在于，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据包括：

3.如权利要求1所述的方法，其特征在于，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理，得到第二语音数据包括：

4.如权利要求1～3任一所述的方法，其特征在于，根据所述第一特征参数、所述第二特征参数和预设的增强算法对所述第一语音数据进行增强处理之后，还进一步包括：

获取电子设备中扬声器的扬声器特性参数；

根据所述扬声器特性参数对第二语音数据进行增强处理。

5.如权利要求4所述的方法，其特征在于，根据所述扬声器特性参数对第二语音数据进行增强处理包括：

6.如权利要求1～3或5任一所述的方法，其特征在于，所述第一特征参数和所述第二特征参数都至少包括语音数据的基音周期、线性预测系数和能量参数中的至少一项或多项的组合。

7.一种电子设备，其特征在于，该电子设备包括：

输出单元，用于输出所述第二语音数据。

8.如权利要求7所述的电子设备，其特征在于，第一增强单元具体用于根据所述第一特征参数和第二特征参数确定进行平滑处理的第三特征参数，利用所述第三特征参数对所述第一语音数据进行平滑处理，得到第二语音数据。

9.如权利要求7所述的电子设备，其特征在于，第一增强单元具体用于根据所述第一特征参数和第二特征参数对所述第一语音数据中的低频分量进行加强，得到所述第二语音数据。

10.如权利要求7～9任一所述的电子设备，其特征在于，该设备还包括：

11.如权利要求10所述的电子设备，其特征在于，所述第二增强单元根据所述扬声器特性参数对第二语音数据进行增强处理包括：