CN110021305A

CN110021305A - 一种音频滤波方法、音频滤波装置及可穿戴设备

Info

Publication number: CN110021305A
Application number: CN201910042161.XA
Authority: CN
Inventors: 章军
Original assignee: Shanghai Harvest Information Technology Co Ltd
Current assignee: Shanghai Harvest Information Technology Co Ltd
Priority date: 2019-01-16
Filing date: 2019-01-16
Publication date: 2019-07-16
Anticipated expiration: 2039-01-16
Also published as: CN110021305B

Abstract

本发明提供了一种音频滤波方法、音频滤波装置及可穿戴设备，所述音频滤波方法用于处理可穿戴设备录制的原始音频文件，所述音频滤波方法包括以下步骤：S101：对所述原始音频文件进行快速傅里叶变换，得到频谱特征数据；S102：去除所述频谱特征数据中次声频率及超声频率对应的频谱特征；S103：确定有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据；S104：对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件。上述技术方案实施后，实现了在可穿戴设备上对原始录音文件进行滤波处理，去除噪声，提升音频音质效果。

Description

一种音频滤波方法、音频滤波装置及可穿戴设备

技术领域

本发明涉及音频处理技术领域，尤其涉及一种音频滤波方法、音频滤波装置及可穿戴设备，用于处理可穿戴设备录制的原始音频文件。

背景技术

可穿戴设备包括智能手表、佩戴式电话、智能手环、智能耳机等可穿戴于人体上的电子设备，能够实现服务于人体的各种功能。大部分可穿戴设备具备人机交互功能，例如对人的声音进行录音并记录。然而，在录音的过程中，不可避免地会受到外部环境或者电子电路上的噪声干扰，影响音频文件的记录效果。

因此，需要在可穿戴设备上实现对录制的原始音频文件进行滤波，降低噪声对录音效果的影响。

发明内容

为了克服现有技术缺陷，本发明的目的在于提供一种音频滤波方法、音频滤波装置及可穿戴设备，用于对可穿戴设备录制的原始音频文件进行滤波处理。

本发明公开了一种音频滤波方法，用于处理可穿戴设备录制的原始音频文件，所述音频滤波方法包括以下步骤：

S101：对所述原始音频文件进行快速傅里叶变换，得到频谱特征数据；

S102：去除所述频谱特征数据中次声频率及超声频率对应的频谱特征；

S103：确定有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据；

S104：对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件。

优选地，步骤S103进一步包括以下步骤：

S103-1：以一预设的起始频率开始，按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量，直至频带窗的数量达到一预设数量阈值；

S103-2：判断步骤S103-1中各频带窗内的频谱能量是否相等或近似相等；

S103-3：当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时，将起始频率累加一个频带窗的频带范围，得到新的起始频率，跳转至步骤S103-1；

S103-4：当步骤S103-1中各频带窗内的频谱能量相等或近似相等时，将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带；

S103-5：去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据。

优选地，步骤103-1中，起始频率为20Hz。

优选地，步骤S101之前，所述音频滤波方法还包括以下步骤：

S100：对所述原始音频文件进行分窗处理，得到一组音频文件片段；

步骤S104之后，所述音频滤波方法还包括以下步骤：

S105：重复步骤S101至步骤S104对每一音频文件片段进行处理，直至所有音频文件片段完成滤波，再对滤波后的所有音频文件片段进行组合，得到滤波后的音频文件。

优选地，步骤S103与步骤S104之间，所述音频滤波方法还包括以下步骤：

S103’：对去除噪声后的频谱特征数据增加均衡器处理。

优选地，步骤S103中，通过设置对应有效音频信号频带的带通滤波器来去除噪声。

本发明还公开了一种音频滤波装置，用于处理可穿戴设备录制的原始音频文件，所述滤波装置包括：

傅里叶变换模块，对所述原始音频文件进行快速傅里叶变换，得到频谱特征数据；

第一去噪模块，与所述傅里叶变换模块连接，去除所述频谱特征数据中次声频率及超声频率对应的频谱特征；

第二去噪模块，与所述第一去噪模块连接，确定有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据；

傅里叶反变换模块，与所述第二去噪模块连接，对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件。

本发明还公开了一种可穿戴设备，所述可穿戴设备包括处理器、存储器及录音装置，所述存储器内存储有计算机程序，所述录音装置用于录制原始音频文件，所述计算机程序被处理器执行时实现以下步骤：

S107：对所述原始音频文件进行快速傅里叶变换，得到频谱特征数据；

S108：去除所述频谱特征数据中次声频率及超声频率对应的频谱特征；

S109：确定有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据；

S110：对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件。

优选地，步骤S109进一步包括以下步骤：

S109-1：以一预设的起始频率开始，按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量，直至频带窗的数量达到一预设数量阈值；

S109-2：判断步骤S109-1中各频带窗内的频谱能量是否相等或近似相等；

S109-3：当步骤S109-1中各频带窗内的频谱能量不相等且不近似相等时，将起始频率累加一个频带窗的频带范围，得到新的起始频率，跳转至步骤S109-1；

S109-4：当步骤S109-1中各频带窗内的频谱能量相等或近似相等时，将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带；

S109-5：去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据。

优选地，步骤109-1中，起始频率为20Hz。

优选地，步骤S107之前，所述计算机程序还包括以下步骤：

S106：对所述原始音频文件进行分窗处理，得到一组音频文件片段；

步骤S110之后，所述计算机程序还包括以下步骤：

S111：重复步骤S107至步骤S110对每一音频文件片段进行处理，直至所有音频文件片段完成滤波，再对滤波后的所有音频文件片段进行组合，得到滤波后的音频文件。

优选地，步骤S109与步骤S110之间，所述计算机程序还包括以下步骤：

S109’：对去除噪声后的频谱特征数据增加均衡器处理。

优选地，步骤S109中，通过设置对应有效音频信号频带的带通滤波器来去除噪声。

采用了上述技术方案后，与现有技术相比，具有以下有益效果：

1.实现了在可穿戴设备上对原始录音文件进行滤波处理，去除噪声，提升音频音质效果；

2.采用数字滤波，节省硬件成本。

附图说明

图1为符合本发明一优选实施例中音频滤波方法的流程示意图；

图2为图1中步骤S103的具体流程示意图；

图3为符合本发明一优选实施例中音频滤波装置的结构框图；

图4为图1中步骤S101执行前后的时域及频域分析图；

图5为图4中低频部分的频域分析图；

图6为图2中步骤S103-1的效果示意图。

附图标记：

100-音频滤波装置、110-傅里叶变换模块、120-第一去噪模块、130-第二去噪模块、 140-傅里叶反变换模块。

具体实施方式

以下结合附图与具体实施例进一步阐述本发明的优点。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。因此，“模块”与“部件”可以混合地使用。

参阅图1，为符合本发明一优选实施例中音频滤波方法的流程示意图，所述音频滤波方法用于处理可穿戴设备录制的原始音频文件，包括以下步骤：

S100：对所述原始音频文件进行分窗处理，得到一组音频文件片段。

原始音频文件即一段录音的录音文件，往往会比较长，例如几十秒甚至是几分钟，因此需要对原始音频文件进行分窗处理，分割为多个窗口，即一组较短的音频文件片段，每次仅对一个音频文件片段进行处理。本实施例中，采用非矩形加窗，例如汉明窗，窗口长度一般为10毫秒至30毫秒，每个窗之间的帧移一般为二分之一的窗口时长。具体地，汉明窗的函数为：

其中，α＝0.46，N为采样序列长度。分窗处理后，能够减小计算量并提高时域分辨率。在其他实施例中，若原始音频文件较短，可直接进入步骤S101进行处理。

S101：对所述音频文件片段进行快速傅里叶变换，得到频谱特征数据。

傅里叶变换是通信领域的基础算法，能够将时域的信号转换到频域进行处理。为了便于计算机进行处理，常使用离散快速傅里叶变换(FFT)对音频文件片段进行处理，得到针对改音频文件片段的频谱特征数据，即本领域常见的频谱特性图。离散快速傅里叶变换的公式如下：

其中，N为采样序列长度，0≤k≤N-1。本实施例中，可选取一段儿歌作为原始音频文件，读取样本长度为N＝3741695，采样频率FS＝22050HZ，故经过FFT变换后可分析频率范围为(0-11025Hz)，即遵循了采样定理，采样频率至少为分析频率的2 倍。本步骤执行前后，音频文件的时域信号和频域信号详见图4。

S102：去除所述频谱特征数据中次声频率及超声频率对应的频谱特征。

人耳的听觉范围为20Hz-20KHz，即人仅能听到上述频率范围内的声音，低于上述频率范围下限20Hz的声音频率即为次声频率，高于上述频率范围上限20KHz的即为超声频率。本步骤对所述频谱特征数据中次声频率及超声频率对应的频谱特征进行去除操作，具体地，将上述频率对应的FFT系数置零即可。本实施例中，上述儿歌音频文件的分析频率范围为0-11025Hz，故仅需对次声频率进行FFT系数置零操作即可，即次声部分FFT系数置零后放大频谱图如图5。如果分析频域范围内包含>20KHz的超声频率信号，则处理方式为

S103：确定有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据。

本步骤为音频滤波的关键步骤，其理论基础在于人发出的声音主要集中在低频段，超过某个频率阈值后，更高频率的音频信号可确定为白噪声。白噪声(white noise)是指功率谱密度在整个频域内是常数的噪声，即所有频率具有相同能量密度的随机噪声称为白噪声。利用上述理论，只需找出频谱特征数据中区分音频信号和高频白噪声信号的临界点即可，人的声音的起始频率至该临界点之间的频带范围即为有效音频信号频带，本步骤只需去除有效音频信号频带以外的频带的频谱特征即可，例如令有效音频信号频带之外的频带的FFT系数为零。有效音频信号频带的确定可以根据多次实验的结果进行测定，也就是获取经验参数，例如以20Hz作为有效音频信号频带的下限频率，以10KHz 作为有效音频信号频带的上限频率。

还可以通过查找算法寻找有效音频信号频带的上限频率，详见图2，本步骤进一步包括以下步骤：

S103-1：以一预设的起始频率开始，按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量，直至频带窗的数量达到一预设数量阈值。

所述起始频率为开始查找算法的起始点，可以将有效音频信号频带的起始频点作为起始频率，例如20Hz。本步骤可设置一频带窗，频带窗的范围可以是100Hz，则频带窗内有约个点。本步骤中，须按照频率递增的方向选取多个频带范围相等的频带窗，而后统计每个频带窗内的频谱能量，详见图6。选取频带窗的数量须达到一预设的数量阈值，例如选取10个频带窗，则可覆盖1KHz的计算范围。频谱能量的计算则是本领域的公知技术，不再赘述。

S103-2：判断步骤S103-1中各频带窗内的频谱能量是否相等或近似相等。

本步骤执行判断操作，判断上述步骤S103-1中各频带窗内的频谱能量是否相等或近似相等。判断各频带窗内的频谱能量是否相等较为简单，只需判断各频谱能量的数值是否相等即可。考虑到白噪声的能量分布会存在误差，因此有近似相等的说法。具体地，可先求得各频带窗的频谱能量的平均值，而后判断是否每一个频带窗的频谱能量与平均值的偏差小于一偏差阈值，若满足均小于所述偏差阈值，则可视为各频带窗的频谱能量近似相等。也可采用方差来进行近似相等的判断，即计算各频带窗内频谱能量的方差，若该方差小于一方差阈值，则判定各频谱能量近似相等。

S103-3：当步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时，将起始频率累加一个频带窗的频带范围，得到新的起始频率，跳转至步骤S103-1。

当步骤S103-2判断不成立时，即步骤S103-1中各频带窗内的频谱能量不相等且不近似相等时，意味着各频带窗的频谱能量不符合白噪声的判定标准，起始频率的位置仍处于有效音频信号频带内，需要将各频带窗的位置向高频方向迁移，即本步骤的执行内容。本步骤将起始频率累加一个频带窗的频带范围，得到新的起始频率，而后跳转至步骤S103-1，重新进行各频带窗的频谱能量统计。考虑到有效音频信号频带与白噪声的临界频点会比较高频，步骤S103-1至S103-3可能会循环执行多次方能找到上述临界点。

S103-4：当步骤S103-1中各频带窗内的频谱能量相等或近似相等时，将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带。

当步骤S103-2判断不成立时，即步骤S103-1中各频带窗内的频谱能量相等或近似相等时，意味着各频带窗的频谱能量符合白噪声的判定标准，本步骤将最初的起始频率与当前的起始频率之间的频带作为有效音频信号频带。例如，经过步骤S103-1至S103-3 的迭代查找，当起始频率为10KHz时，计算得到各频带窗的频谱能量相等或近似相等，则表示10KHz为白噪声的频带临界点，那么20Hz与10KHz之间的频带范围即有效音频信号频带。

本步骤在步骤S103-4的基础上执行滤波操作，即去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据。例如，若有效音频信号频带为20Hz与10KHz，那么就须去除人耳听觉范围内除上述有效音频信号频带以外的其他频带的频谱特征，即10KHz与20KHz之间的频带的频谱特征，之后的频谱特征数据即去除噪声后洁净的音频信号数据。去除相关频带的频谱特征，可以选择将上述频带对应的FFT系数置零，也可考虑使用通过设置对应有效音频信号频带的带通滤波器来去除噪声，例如有效音频信号频带为20Hz与10KHz，则设置相应带宽的带通滤波器即可，而20Hz以内的频段也不是人耳的听觉范围，也可考虑采用10KHz的低通滤波器实现滤波。

S104：对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件片段。

去除噪声后的频谱特征数据还需转换为时域信号方能进行后续的音频播放操作，因此本步骤对去除噪声后的频谱特征数据进行离散快速傅里叶反变换，即可得到滤波后的音频文件片段。离散快速傅里叶反变换的公式如下：

由于原始的音频文件是一个完整的文件，因此进行滤波操作后还需要将各音频文件片段整合在一起。重复步骤S101至步骤S104时，需要进行移帧操作，也就是每个窗口都是一帧，每处理好一帧则移至下一帧进行处理。

进一步地，为了获得更好地音效，步骤S103与步骤S104之间，所述音频滤波方法还包括以下步骤：

S103’：对去除噪声后的频谱特征数据增加均衡器处理。

均衡器通过算法来实现，此方法和相机的美颜功能相似，需根据需求实施。例如调整低音部分强度(40-150Hz)，使声音丰满柔和；适当加强中低音(150-500Hz)，此部分是人所发出声音的主要频段，可避免人声软而无力，适当加强可使人声变得浑厚有力。均衡器的具体实现是本领域的公知技术，本领域技术人员能够将该技术应用于本步骤中。

参阅图3，为符合本发明一优选实施例中音频滤波装置的结构框图，所述音频滤波装置100用于处理可穿戴设备录制的原始音频文件，包括：

-傅里叶变换模块110

傅里叶变换模块110内封装有离散快速傅里叶变换算法(FFT)，能够将时域的原始音频文件数据转换为频域的频谱特征数据，即本领域常见的频谱特性图，以便在频域对音频数据进行分析处理。

-第一去噪模块120

所述第一去噪模块120与所述傅里叶变换模块110连接，去除所述频谱特征数据中次声频率及超声频率对应的频谱特征，减少音频信号中的次声噪声及超声噪声的干扰。具体地，将上述次声频率及超声频率对应的FFT系数置零即可。

-第二去噪模块130

所述第二去噪模块130与所述第一去噪模块120连接，确定频谱特征数据中的有效音频信号频带，去除所述频谱特征数据中有效音频信号频带以外的频带的频谱特征，得到去除噪声后的频谱特征数据。所述第二去噪模块130根据白噪声的原理来确定有效音频信号频带，以一预设的起始频率开始，按照频率递增的方向继续依次选取多个频带范围相等的频带窗并统计各频带窗内的频谱能量，若各频带窗内的频谱能量相等或近似相等，则起始频率即为有效音频信号频带的上限频率，否则，则向高频方向推移上述频带窗，重新统计各频带窗内的频谱能量，如此往复，直至各频带窗内的频谱能量相等或近似相等。

-傅里叶反变换模块140

所述傅里叶反变换模块140与所述第二去噪模块130连接，对所述去除噪声后的频谱特征数据进行傅里叶反变换，得到滤波后的音频文件。这样就能将频域的音频数据重新变换为时域，以便后续的播放操作。

进一步地，步骤S109进一步包括以下步骤：

进一步地，步骤109-1中，起始频率为20Hz。

进一步地，步骤S107之前，所述计算机程序还包括以下步骤：

步骤S110之后，所述计算机程序还包括以下步骤：

进一步地，步骤S109与步骤S110之间，所述计算机程序还包括以下步骤：

S109’：对去除噪声后的频谱特征数据增加均衡器处理。

可选地，步骤S109中，通过设置对应有效音频信号频带的带通滤波器来去除噪声。

上述计算机程序的方法步骤与本发明中的音频滤波方法的实现方式一致，不再赘述。

应当注意的是，本发明的实施例有较佳的实施性，且并非对本发明作任何形式的限制，任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例，但凡未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种音频滤波方法，用于处理可穿戴设备录制的原始音频文件，其特征在于，所述音频滤波方法包括以下步骤：

2.如权利要求1所述的音频滤波方法，其特征在于，

步骤S103进一步包括以下步骤：

3.如权利要求2所述的音频滤波方法，其特征在于，

步骤103-1中，起始频率为20Hz。

4.如权利要求1-3任一项所述的音频滤波方法，其特征在于，

步骤S101之前，所述音频滤波方法还包括以下步骤：

步骤S104之后，所述音频滤波方法还包括以下步骤：

5.如权利要求1-3任一项所述的音频滤波方法，其特征在于，

步骤S103与步骤S104之间，所述音频滤波方法还包括以下步骤：

S103’：对去除噪声后的频谱特征数据增加均衡器处理。

6.如权利要求1-3任一项所述的音频滤波方法，其特征在于，

步骤S103中，通过设置对应有效音频信号频带的带通滤波器来去除噪声。

7.一种音频滤波装置，用于处理可穿戴设备录制的原始音频文件，其特征在于，所述滤波装置包括：

8.一种可穿戴设备，所述可穿戴设备包括处理器、存储器及录音装置，所述存储器内存储有计算机程序，所述录音装置用于录制原始音频文件，其特征在于，所述计算机程序被处理器执行时实现以下步骤：

9.如权利要求8所述的可穿戴设备，其特征在于，

步骤S109进一步包括以下步骤：

10.如权利要求9所述的可穿戴设备，其特征在于，

步骤109-1中，起始频率为20Hz。

11.如权利要求8-10任一项所述的可穿戴设备，其特征在于，

步骤S107之前，所述计算机程序还包括以下步骤：

步骤S110之后，所述计算机程序还包括以下步骤：

12.如权利要求8-10任一项所述的可穿戴设备，其特征在于，

步骤S109与步骤S110之间，所述计算机程序还包括以下步骤：

S109’：对去除噪声后的频谱特征数据增加均衡器处理。

13.如权利要求8-10任一项所述的可穿戴设备，其特征在于，

步骤S109中，通过设置对应有效音频信号频带的带通滤波器来去除噪声。