CN104157287B

CN104157287B - 音频处理方法及装置

Info

Publication number: CN104157287B
Application number: CN201410367980.9A
Authority: CN
Inventors: 刘淦明
Original assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Current assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date: 2014-07-29
Filing date: 2014-07-29
Publication date: 2017-08-25
Anticipated expiration: 2034-07-29
Also published as: CN104157287A

Abstract

本发明公开了一种音频处理方法，该方法包括：按照取样频率对一段音频进行取样，获得一组音量取样值；判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值；当所述差值小于或等于所述音量差阈值时，保存所述音频；当所述差值大于所述音量差阈值时，从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较；当所述音量取样值小于或等于参照值时，删除所述音量取样值对应的音频；当所述音量取样值大于参照值时，保存所述音量取样值对应的音频。本发明还公开了一种音频处理装置。采用本发明实施例，可以节约存储空间、听者的回放时间及音频通过网络传输时的数据流量。

Description

音频处理方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种音频处理方法及装置。

背景技术

当今社会快速发展，人们常常需要记录并回放各种有用语音信息，也常常通过互联网进行语音沟通。比如，人们在参加会议时，需要录下发言人的讲话，以便掌握更详细的信息；人们使用互联网聊天工具进行沟通时会发送微信语音、QQ语音等语音信息。目前，常用的录音方法是从录音开始至结束，录音设备记录录音期间所有的音频信息。

在实现本发明的过程中，发明人发现现有技术至少存在如下问题：

现有的录音记录方法把无用音频也记录了起来。无用音频是指包含无用信息的音频，例如录音期间没有人讲话的无声音频，或者是声音很小的非正常讲话的音频。这种无用音频浪费存储空间，回放的时候也浪费听者的时间，如果在网络传输还会浪费流量。

发明内容

本发明实施例的多个方面提出一种音频处理方法及装置，能够自动识别并删除无用音频，保存有用音频，从而节约了存储空间、回放的时间及音频通过网络传输时的数据流量。

本发明实施例的一个方面提供了一种音频处理方法，包括：

按照取样频率f对一段音频进行取样，获得一组所述音频的音量取样值；

判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值；

当所述差值小于或等于所述音量差阈值时，保存所述音频；

当所述差值大于所述音量差阈值时，从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较；

当所述音量取样值小于或等于参照值时，删除所述音量取样值对应的音频；

当所述音量取样值大于参照值时，保存所述音量取样值对应的音频。

其中，所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。所述修正系数是一个比1大的数，并且可以修改。

相应地，本发明实施例的另一个方面还提供了一种音频处理装置，包括：

取样模块，用于按照取样频率f对一段音频进行取样，获得一组所述音频的音量取样值；

第一判断模块，用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值；

第一保存模块，用于当所述差值小于或等于所述音量差阈值时，保存所述音频；

第二判断模块，用于当所述差值大于所述音量差阈值时，从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较；

音频删除模块，用于当所述音量取样值小于或等于参照值时，删除所述音量取样值对应的音频；和，

第二保存模块，用于当所述音量取样值大于参照值时，保存所述音量取样值对应的音频。

其中，所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值，所述修正系数是一个比1大的数，并且可以修改。实施本发明实施例，具有如下有益效果：

本发明实施例提供的音频处理方法及装置，对音频的音量进行取样，获得一组所述音频的音量取样值，再用所述音量取样值去判断音频是否是有用音频。然后把无用音频删除，仅保存有用音频，从而节约了音频的存储空间和听者回放的时间，如果音频在网络上传输，就也节约了网络流量。

附图说明

图1是本发明提供的音频处理方法的一个实施例的流程示意图；

图2是本发明提供的音频处理装置的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明提供的音频处理方法的一个实施例的流程示意图，该方法包括步骤S101至S106，具体如下：

S101，按照取样频率f对一段音频进行取样，获得一组所述音频的音量取样值；

在一种实施方式中，所述音频可以是一段已经预先录制好的音频，假设所述音频的时长为10分钟，按取样频率f为20Hz对这段音频的音量进行取样，得到12000个所述音频的音量的取样值，即所述音频被平均分成了12000段音频单元，一个所述音量取样值对应一个所述音频单元。

S102，判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值；

具体的，通过比较获得所述一组音量取样值中每个音量取样值的大小，获得最大值与最小值，计算获得所述最大值与所述最小值之间的差值，再将所述差值与音量差阈值进行比较。

所述音量差阈值是预先设置好的数值，在具体实施当中，可以通过大量测试，在有人讲话时录音的音量取样值与无人讲话时录音的音量取样值的差值中，选取一个临界值作为所述音量差阈值。

S103，当所述差值小于或等于所述音量差阈值时，保存所述音频。

具体的，若音量取样值的最大值与最小值的差值较小，则说明这段音频里音量变化不大，都是有用音频，所以不需要删除，直接把整个音频保存，完成音频处理。

S104，当所述差值大于所述音量差阈值时，从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较；

具体的，若音量取样值的最大值与最小值的差值较大，则说明这段音频里音量变化较大，存在有用音频，也存在无用音频，此时，需要把无用音频选择出来，并删除。选择出无用音频的具体方法是：从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较。因为一般情况下，有用音频的音量比无用音频的音量大，所以，通过音量大小的区别就可以判断哪些是有用音频，哪些是无用音频。

优选的，所述参照值是由所述一组音量取样值的最小值乘以修正系数而得到的值。所述修正系数是一个比1大的数，并且可以修改。

S105，当所述音量取样值小于或等于参照值时，删除所述音量取样值对应的音频。

S106，当所述音量取样值大于参照值时，保存所述音量取样值对应的音频。

具体的，如果所述音量取样值小于或等于参照值时，则说明所述音量取样值对应的音频单元是无用音频，所以应当删除所述音频单元；如果所述音量取样值大于参照值时，则说明所述音量取样值对应的音频单元是有用音频，所以应当保存所述音频单元。

在另一个实施例中，上述步骤S101中的一段音频还可以是实时输入的音频，例如是实时的录音音频，在这种情况下，录音与音量取样同时进行，在具体实施当中，***会预先设定一段时间，如10分钟，在这10分钟内***把声音录制成录音音频，存放在临时存储空间里；***也同时按照取样频率f，如20Hz对声音音量进行取样；录音与取样结束后，获得录音音频以及12000个与所述录音音频对应的音量取样值，余下步骤便可按上述实施例的S102、S103、S104、S105、S106进行。

本发明的实施例还提供一种音频处理装置，能够实现上述实施例提供的音频处理方法的所有流程。

参见图2，是本发明提供的音频处理装置的一个实施例的结构示意图。

本发明实施例提供的一种音频处理装置，包括：

取样模块1，用于按照取样频率f对一段音频进行取样，获得一组所述音频的音量取样值；

第一判断模块2，用于判断所述一组音量取样值中的最大值与最小值之间的差值是否大于音量差阈值；

第一保存模块3，用于当所述差值小于或等于所述音量差阈值时，保存所述音频；

第二判断模块4，用于当所述差值大于所述音量差阈值时，从所述一组音量取样值的第一个音量取样值开始，直到最后一个音量取样值结束，依次把每个音量取样值与参照值进行比较；

音频删除模块5，用于当所述音量取样值小于或等于参照值时，删除所述音量取样值对应的音频；和，

第二保存模块6，用于当所述音量取样值大于参照值时，保存所述音量取样值对应的音频。

优选的，所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。所述修正系数是一个比1大的数，并且可以修改。

本发明提供的音频处理方法及装置，可以有效地删除音频中无人讲话时的音频，从而达到节省存储空间，节省听者回放的时间及节省音频的网络上传输时消耗的流量。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现，当然也可以全部通过硬件来实施。基于这样的理解，本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种音频处理方法，其特征在于，包括:

当所述差值小于或等于所述音量差阈值时，保存所述音频；

2.根据权利要求1所述音频处理方法，其特征在于，所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。

3.一种音频处理装置，其特征在于，包括：

4.根据权利要求3所述音频处理装置，其特征在于，所述参照值是所述一组音量取样值中的最小值与修正系数相乘而得到的值。