CN108389584B

CN108389584B - 声音分析方法及装置

Info

Publication number: CN108389584B
Application number: CN201810096118.7A
Authority: CN
Inventors: 袁晖
Original assignee: Shenzhen Ikmak Technology Co ltd
Current assignee: Shenzhen Ikmak Technology Co ltd
Priority date: 2018-01-31
Filing date: 2018-01-31
Publication date: 2021-03-19
Anticipated expiration: 2038-01-31
Also published as: CN108389584A; WO2019148737A1

Abstract

本发明提供了一种声音分析方法及装置，获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；确定每个所述音频信息的音频类别；根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层；本发明中提供的声音分析方法及装置，在声音地图中按照音源距离分层显示不同来源的声音，直观显示，且显示内容丰富。

Description

声音分析方法及装置

技术领域

本发明涉及声音识别技术领域，特别涉及一种声音分析方法及装置。

背景技术

视频监控是目前各行业进行安全管理、纠纷处理的重要信息来源，然而视频监控会出现盲区死角，有不良动机的人员会刻意躲避有监控的地方施行违法行为，对事情真相的发现造成很大困扰。

而声音的传播几乎没有盲区限制，小范围的遮挡也不会造成很大的遮蔽。因此，对声音的分析将起到很大的信息补充作用。

目前常见的声音地图一般是指城市或区域噪声地图，将各处噪声的大小使用不同视觉效果呈现在地图上，直观的呈现噪声分布情况。但这种声音地图呈现的信息较少，只能简单表现声音的分贝值，一般只能用于判断噪声的分布，无法对声音进行更多的分析及应用。

发明内容

本发明的主要目的为提供一种声音分析方法，将不同距离的音频分布在声音地图中。

本发明提出一种声音分析方法，包括以下步骤：

获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；

确定每个所述音频信息的音频类别；

根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；

根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层。

进一步地，所述根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内的步骤之后，包括：

在所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息。

若分层中分布有多种音频类别的音频信息时，则将多个音频类别分别对应的音频信息进行分离显示。

进一步地，所述确定每个所述音频信息的音频类别的步骤包括：

与数据库中预存的特征音频进行对比，以确定所述音频信息的音频类别。

进一步地，所述获取待分析音频信息的步骤之后，还包括：

获取所述音频信息的来源地点以及时间信息；

根据所述来源地点以及时间信息，选择第一音频类别；

所述确定每个所述音频信息的音频类别的步骤则包括：

将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并计算所述音频信息与特征音频的相似度；

当相似度达到预设值时，确定所述音频信息的音频类别。

本发明还提供了一种声音分析装置，包括：

第一获取单元，用于获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；

确定单元，用于确定所述音频信息的音频类别；

第二获取单元，用于根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；

分布单元，用于根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层。

进一步地，还包括：

播放单元，用于在所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息。

进一步地，还包括：

分离单元，用于若分层中分布有多种音频类别的音频信息时，则将多个音频类别分别对应的音频信息进行分离显示。

进一步地，所述确定单元具体用于：

进一步地，还包括：

第三获取单元，用于获取所述音频信息的来源地点以及时间信息；

选择单元，用于根据所述来源地点以及时间信息，选择第一音频类别；

所述确定单元则包括：

对比子单元，用于将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并计算所述音频信息与特征音频的相似度；

确定子单元，用于当所述相似度达到预设值时，确定所述音频信息的音频类别。

本发明中提供的声音分析方法及装置，具有以下有益效果：

本发明中提供的声音分析方法及装置，获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；确定每个所述音频信息的音频类别；根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层；在声音地图中按照音源距离分层显示不同来源的声音，直观显示，且显示内容丰富。

附图说明

图1是本发明一实施例中声音分析方法步骤示意图；

图2是本发明另一实施例中声音分析方法步骤示意图；

图3是本发明又一实施例中声音分析方法步骤示意图；

图4是本发明一实施例中声音分析装置结构框图；

图5是本发明另一实施例中声音分析装置结构框图；

图6是本发明一实施例中确定单元结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”“上述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件、单元、模块和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、单元、模块、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

参照图1，为本发明一实施例中的声音分析方法步骤示意图。

本发明一实施例中提出一种声音分析方法，应用于智能终端，包括以下步骤：

步骤S1，获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；

步骤S2，确定每个所述音频信息的音频类别；

步骤S3，根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；

步骤S4，根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层。

通常声音地图上只显示各种声音的分贝值，显示的信息较小。在本实施例中，获取到一段音频信息，该音频信息中包括有多种音频类别的音频信息。本实施例中的音频类别指的是根据音频的声源划定的音频类别，例如车辆行走发出的声音、风声、鸟叫声与行人说话的声音均为不同的音频类别。对上述待分析音频信息进行分析，确定出其中包含的每个音频信息的音频类别。

可以理解的是，有些音频可能不具有相应的音源距离，例如风声、雷电声等，本实施例中将此类音频的音源距离设置为无限远。因此，音频类别的不同，获取到的音源距离不同。本实施例中，根据音频类别的不同，按照不同的规则确定其音源距离。音源距离属于音频信息的一个特征信息，该特征信息还可以包括音频类别、分贝值、响度、清晰度等。具体地，可以通过声源定位确定音频信息的音源距离。

最后，本实施例中声音地图中按照音源距离设置有多个分层，每个分层代表不同音源距离的音频信息，将上述获取到音源距离的音频信息按照对应的音源距离分布在声音地图中；同时，还将音频信息对应的音频类别、分贝值等特征信息显示在声音地图内，以便可以直观查看音频的相关信息。

上述步骤S2之后还可以包括以下步骤：

根据音频类别，按照预设方式进行处理。在本实施例中，对于不同音频类别的音频信息，采取不同的处理程序进行处理；处理程序主要包括声源定位、声源去躁、音频优化。

例如，在本实施例中，预设有对多种不同音频类别的音频信息进行处理的方式：

(1)人声：判断人声来源数目，分别进行音源方位及距离判断，并将各人声在清晰度、声音响度方面进行优化呈现。

(2)交通声：交通声主要包括陆地、海面及天空三类；包括汽车、火车、船、飞机等各类交通噪声，以及轮子与地面/铁轨摩擦声、发动机声、排气声、鸣笛声等。针对交通声判断音频信息中的交通声类型，并进行优化后呈现。

(3)工地声：包括打桩机、推土机等施工设备的运行噪声。针对工地声主要判断音源距离及音频类别。

(4)音乐声：常规环境下音乐声的来源一般是商家或个人播放喇叭产生。针对音乐声主要判断音源距离及音频类别。

(5)自然声：包括气候引起的风雨声、雷电声、水流声等。当判断某一特征频率的声音为自然声时，无需判断声源距离，直接将其显示为无限远处的声音。

对音频信息的处理过程可以是在将音频信息分布在声音地图的分层之前，也可以是在分布之后；若处理过程在分布之前，在所述分层内接收到预设的触发信号时，则直接播放所述分层内的所述音频信息；若处理过程在分布之后，则参照图2，在一实施例中，所述根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内的步骤S4之后，包括：

步骤S5，在所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息。

在将音频信息分层分布在声音地图上之后，用户对智能终端进行操作，以触发预设的触发信号，智能终端通过分层所处区域接收到上述触发信号时，则自动播放该分层内分布的音频信息；上述预设的触发信号可以设置为单击触发，或者是双击触发等。优选地，在播放上述音频信息之前，对上述音频信息进行过滤、去噪、音频优化处理。

在另一实施例中，所述根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内的步骤S4之后，包括：

步骤S6，若分层中分布有多种音频类别的音频信息时，则将多个音频类别分别对应的音频信息进行分离显示。便于对相同音源距离的音频信息进行区分，当其分布在同一分层时，则将多个音频类别分别对应的音频信息进行分离显示，可以是使用不同的线条颜色进行区分。

具体地，在一实施例中，所述确定每个所述音频信息的音频类别的步骤S2包括：

在本实施例中，***的数据库中预存有诸如人声、交通声、工地声、音乐声、自然声等各类特征音频，在需要确定待分析音频信息的音频类别时，只需将其与数据库中预存的特征音频进行对比，判断是否相似，若相似度达到预设值，则判断其为该特征音频对应的音频类别。

参照图3，在另一实施例中，所述获取待分析音频信息的步骤S1之后，还包括：

步骤S1a，获取所述音频信息的来源地点以及时间信息；

步骤S1b，根据所述来源地点以及时间信息，选择第一音频类别；

所述确定每个所述音频信息的音频类别的步骤S2则包括：

步骤S2a，将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并计算所述音频信息与特征音频的相似度；

步骤S2b，当相似度达到预设值时，确定所述音频信息的音频类别。

若将音频信息与数据库中预存特征音频逐一进行对比，则计算量较大、在本实施例中，为了降低计算量，首先从待分析音频信息中获取到去采集音频时的地理信息(来源地点)以及时间信息，根据来源地点以及时间信息，选择在该地点出该时间段出现的主要音频类别(即第一音频类别)；例如地点位于城市交通道路时，其音频信息应当主要为交通、其次为人声，则可以将交通声作为第一音频类别。然后，将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并获取所述音频信息与特征音频的相似度，当相似度达到预设值时，确定所述音频信息的音频类别。如此，可以大量降低计算量，提升分析速度。

综上所述，为本发明实施例中提供的声音分析方法，获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；确定每个所述音频信息的音频类别；根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层；在声音地图中按照音源距离分层显示不同来源的声音，直观显示，且显示内容丰富。

参照图4，本发明一实施例中还提供了一种声音分析装置，应用于智能终端，包括：

第一获取单元10，用于获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；

确定单元20，用于确定所述音频信息的音频类别；

第二获取单元30，用于根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；

分布单元40，用于根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层。

通常声音地图上只显示各种声音的分贝值，显示的信息较小。在本实施例中，获取到一段音频信息，该音频信息中包括有多种音频类别的音频信息。本实施例中的音频类别指的是根据音频的声源划定的音频类别，例如车辆行走发出的声音、风声、鸟叫声与行人说话的声音均为不同的音频类别。对上述待分析音频信息进行分析，确定单元20确定出其中包含的每个音频信息的音频类别。

可以理解的是，有些音频可能不具有相应的音源距离，例如风声、雷电声等，本实施例中将此类音频的音源距离设置为无限远。因此，音频类别的不同，获取到的音源距离不同。本实施例中，第二获取单元30根据音频类别的不同，按照不同的规则确定其音源距离。音源距离属于音频信息的一个特征信息，该特征信息还可以包括音频类别、分贝值、响度、清晰度等。具体地，可以通过声源定位确定音频信息的音源距离。

最后，本实施例中声音地图中按照音源距离设置有多个分层，每个分层代表不同音源距离的音频信息，分布单元40将上述获取到音源距离的音频信息按照对应的音源距离分布在声音地图中；同时，还将音频信息对应的音频类别、分贝值等特征信息显示在声音地图内，以便可以直观查看音频的相关信息。

上述声音分析装置还可以包括：

处理单元，用于根据音频类别，按照预设方式进行处理。在本实施例中，对于不同音频类别的音频信息，采取不同的处理程序进行处理；处理程序主要包括声源定位、声源去躁、音频优化。

对音频信息的处理过程可以是在将音频信息分布在声音地图的分层之前，也可以是在分布之后；若处理过程在分布之前，在所述分层内接收到预设的触发信号时，则直接播放所述分层内的所述音频信息；若处理过程在分布之后，则在播放之前分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，再播放处理后的所述音频信息。

具体地，参照图5，在一实施例中，还包括：

播放单元50，用于在所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息。

在另一实施例中，上述装置还包括：

分离单元，用于若分层中分布有多种音频类别的音频信息时，则将多个音频类别分别对应的音频信息进行分离显示。便于对相同音源距离的音频信息进行区分，当其分布在同一分层时，则将多个音频类别分别对应的音频信息进行分离显示，可以是使用不同的线条颜色进行区分。

具体地，所述确定单元20具体用于：

进一步地，上述声音分析装置还包括：

参照图6，所述确定单元20则包括：

对比子单元201，用于将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并计算所述音频信息与特征音频的相似度；

确定子单元202，用于当所述相似度达到预设值时，确定所述音频信息的音频类别。

若将音频信息与数据库中预存特征音频逐一进行对比，则计算量较大、在本实施例中，为了降低计算量，首先第三获取单元从待分析音频信息中获取到去采集音频时的地理信息(来源地点)以及时间信息，选择单元根据来源地点以及时间信息，选择在该地点出该时间段出现的主要音频类别(即第一音频类别)；例如地点位于城市交通道路时，其音频信息应当主要为交通、其次为人声，则可以将交通声作为第一音频类别。然后，对比子单元201将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比，并获取所述音频信息与特征音频的相似度，当相似度达到预设值时，确定子单元202则确定所述音频信息的音频类别。如此，可以大量降低计算量，提升分析速度。

综上所述，为本发明实施例中提供的声音分析方法及装置，获取待分析音频信息，所述待分析音频信息中包括有多个不同音频类别的音频信息；确定每个所述音频信息的音频类别；根据所述音频类别，获取所述音频信息的特征信息；所述特征信息包括音源距离、分贝值；根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，其中所述声音地图按照距离进行分层；在声音地图中按照音源距离分层显示不同来源的声音，直观显示，且显示内容丰富。

本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解，可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现，从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。

本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种声音分析方法，其特征在于，包括以下步骤：

确定每个所述音频信息的音频类别；

根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内；当所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息；其中所述声音地图按照距离进行分层。

2.根据权利要求1所述的声音分析方法，其特征在于，所述根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内的步骤之后，包括：

3.根据权利要求1所述的声音分析方法，其特征在于，所述确定每个所述音频信息的音频类别的步骤包括：

4.根据权利要求1所述的声音分析方法，其特征在于，所述获取待分析音频信息的步骤之后，还包括：

获取所述音频信息的来源地点以及时间信息；

根据所述来源地点以及时间信息，选择第一音频类别；

所述确定每个所述音频信息的音频类别的步骤则包括：

当相似度达到预设值时，确定所述音频信息的音频类别。

5.一种声音分析装置，其特征在于，包括：

确定单元，用于确定所述音频信息的音频类别；

分布单元，用于根据所述音频信息的音源距离，将所述音频信息分布在声音地图的分层内，播放单元，用于在所述分层内接收到预设的触发信号时，对分层内的所述音频信息进行声源去噪、音频优化处理，并播放处理后的所述音频信息，其中所述声音地图按照距离进行分层。

6.根据权利要求5所述的声音分析装置，其特征在于，还包括：

7.根据权利要求5所述的声音分析装置，其特征在于，所述确定单元具体用于：

8.根据权利要求5所述的声音分析装置，其特征在于，还包括：

所述确定单元则包括：