CN106504762B

CN106504762B - 鸟类群落数量估计***及其方法

Info

Publication number: CN106504762B
Application number: CN201610969673.7A
Authority: CN
Inventors: 杨春勇; 吴迪; 刘恒; 彭焱; 陈彬
Original assignee: South Central University for Nationalities
Current assignee: South Central Minzu University
Priority date: 2016-11-04
Filing date: 2016-11-04
Publication date: 2023-04-14
Anticipated expiration: 2036-11-04
Also published as: CN106504762A

Abstract

本发明公开了一种鸟类群落数量估计***及其方法，涉及鸟类群落保护及语音降噪和分离技术领域。本***包括音频处理装置（10）、数据传输装置（20）、终端数据处理装置（30）和电源（40）；音频处理装置（10）、数据传输装置（20）和终端数据处理装置（30）依次连接；电源（40）分别与音频处理装置（10）和数据传输装置（20）连接。本方法是：①语音降噪；②语音分离。本发明适用于动物园、农林部门和野生动物保护部门更方便地观测估计鸟类的数量；还对环保部门对评测某地区环境等级提供重要参考依据。

Description

鸟类群落数量估计***及其方法

技术领域

本发明涉及鸟类群落保护及语音降噪和分离技术领域，特别是涉及一种鸟类群落数量估计***及其方法。

背景技术

当前，鸟类群落保护颇受关注，有效的群鸟数量统计方法对于鸟类群落保护至关重要。传统方法多采用标志重捕法来统计动物种群的数量，该方法易对影响动物的正常生命活动产生影响，且统计准确性不足。近年来，用于语音信号处理领域的语音分离估计算法在人声语音识别、降噪方面展现了很好的应用前景。

传统的语音降噪算法有自适应滤波算法、谱减法和维纳滤波法等，利用特征参数进行端点检测，判断语音信号的有话段和无话段，通过无话段估算噪声谱，达到语音增强的目的；语音分离方面，独立分量分析算法(Independent Component Analysis，ICA)包括极大似然估计方法、最大熵方法、最小互信息方法、高阶累积量方法等，利用分离后信号各个分量之间最大独立性来建立对比函数，通过最大或最小化对比函数得到分离矩阵，达到分离源信号的目的。文献指出ICA算法只能用于源信号的个数小于或等于传感器所接收到的混合信号的个数的情况中，不适用于鸟类群落数量的估计。

发明内容

本发明的目的是针对目前观测鸟类活动停留在人工利用观鸟仪的传统方法上，损耗人力而且效率又低的问题，提供一种鸟类群落数量估计***及其方法，从而实现利用对鸟类群落鸟类混合语音的采集和降噪，基于峰值估计的鸟类混合语音分离技术，分离混合语音即可预估鸟类个数。

本发明的设计思路：

由于真实情况中语音的采集存在噪音的干扰，鸟类语音信号可能存在误差。为了提高语音分离的准确性，首先对采集的混合语音进行降噪处理；类比于人类语音分离技术，结合鸟类语音特征，设计一种基于PDTA聚类的DUET语音分离算法；同时考虑到声音衰减，将采用高保真麦克风，增强语音信号。

针对语音分离的需要，首先建立语音信号采集和处理***，实现对鸟类语音采集，A/D转换；其次，设计语音信号处理的传输***，考虑到野外环境的真实性，我们采用无线通信技术，实现远距离数据传输；接下来在PC端进行对数据的预处理、端点检测等操作；预处理包括混叠滤波、模数变换、分帧加窗；端点检测采用抗噪性好的参数谱熵进行端点检测，区别有无话段，估计噪声谱，利用维纳滤波进行降噪；最后，对降噪语音进行语音分离，我们采用一种基于PDTA聚类的DUET语音分离算法，分离语音个数即为估计鸟类数量个数并且恢复源语音信号。

具体地说：

一、鸟类群落数量估计***(简称***)

本***包括音频处理装置、数据传输装置、终端数据处理装置和电源；

其连接关系是：

音频处理装置、数据传输装置和终端数据处理装置依次连接；

电源分别与音频处理装置和数据传输装置连接。

二、鸟类群落数量估计方法

本方法包括语音降噪和语音分离两个部分。

①语音降噪

利用麦克风阵列在野外环境下采集鸟类混合语音Y，对采集的语音进行分帧加窗预处理，提取抗噪性好的特征参数谱熵进行端点检测，判断有话帧与无话帧噪音，利用维纳滤波降噪算法对采集的语音进行降噪处理，得到纯净鸟类语音；

②语音分离

语音分离分为峰值估计和源语音恢复两个阶段：

峰值估计阶段，对纯净语音进行加窗、分帧、傅里叶变换，实现对采集语音的稀疏表示，再对稀疏化语音数据进行预处理，让语音数据点分布单位圆的上半圆周上，求每个点到(1，0)的弧度，对弧度值进行区域划分，计算每个区域的概率密度，利用局部最优解算法求出密度峰值，峰值的个数即为分离语音的个数；

源语音恢复阶段，寻找峰值对应的弧度值，计算出混合矩阵A，即需解Y＝AX非齐次方程组，利用DUET算法，把混合语音各数据点投影在混合矩阵A的各个方向上，根据投影距离判定各数据点属于哪一源语音类，即可恢复各个源语音X。

本发明具有以下优点和积极效果：

①提供了一种基于改进的维纳滤波算法的语音降噪的技术方案

对采集的语音进行分帧加窗预处理，提取抗噪性好的的特征参数谱熵进行端点检测，判断有话帧与无话帧噪音，利用维纳滤波降噪算法对采集的语音进行降噪处理，得到纯净鸟类语音。

②提供了一种组合DUET和PDTA聚类的语音分离算法的技术方案

语音分离分为峰值估计与源语音恢复两个阶段。峰值估计阶段，对纯净语音进行加窗、分帧、傅里叶变换，实现对采集语音的稀疏表示，再对稀疏化语音数据进行预处理，让语音数据点分布单位圆的上半圆周上，求每个点到(1，0)的弧度，对弧度值进行区域划分，计算每个区域的概率密度，利用局部最优解算法求出密度峰值，峰值的个数即为分离语音的个数。源语音恢复阶段，寻找峰值对应的弧度值，可计算出混合矩阵A，即需解y＝Ax非齐次方程组，利用DUET算法，把混合语音各数据点投影在混合矩阵A的各个方向上，根据投影距离判定各数据点属于哪一源语音类，即可恢复各个源语音。

③提供了一种基于语音分离的鸟类群落数目估计的技术方案

摆脱原有人工观察的鸟类群落的方法，利用对混合语音分离，估计源语音个数的方法达到对鸟类数量估计。

④适用于动物园、农林部门和野生动物保护部门更方便的观测估计鸟类的数量；还对环保部门对评测某地区环境等级提供重要参考依据。

附图说明

图1是本***的结构方框图；

图2是本发明的工作原理图；

图3是PC端语音降噪算法流程图；

图4是PC端语音分离算法流程图。

图中：

10—音频处理装置，

11—麦克风阵列，12—放大器，13—音频解码器；

20—数据传输装置，

21—通信接口，22—控制器，23—外部扩展接口，24—射频发射模块，25—放射天线，26—接收天线，27—射频接收模块；

30—终端数据处理装置，

31—通信接口，32—PC端；

40—电源。

具体实施方式

下面结合附图和实施例详细说明：

一、***

1、总体

如图1，本***包括音频处理装置10、数据传输装置20、终端数据处理装置30和电源40；

其连接关系是：

音频处理装置10、数据传输装置20和终端数据处理装置30依次连接；

电源40分别与音频处理装置10和数据传输装置20连接。

其工作机理是：

音频处理装置10受数据传输装置20的管理和控制，为数据传输装置20提供基础数据资料；

数据处理装置20对音频处理装置10进行管理和控制，为终端数据处理装置30提供待处理数据；

终端数据处理装置30处理数据传输装置传送的数据；

音频处理装置10、数据传送装置由电源40供电。

如图2，其***工作流程是：

先是采集鸟类语音信信号；

然后利用射频模块进行语音数据的传输；

最后在PC端对数据进行处理，先对采集的语音利用一种改进的维纳滤波算法降噪；接下来对纯净语音利用一种基于PDTA聚类的DUET语音分离算法分离混合语音，得到源语音个数即为鸟类数量估计个数。

2、功能部件

1)音频处理装置10

音频处理装置10包括依次连接的麦克风阵列11、放大器12和音频解码器13；

(1)麦克风阵列11

麦克风阵列11采用多个高保真型麦克风；

对鸟类语音进行采集，在将采集到的鸟类语音经过放大器12信号放大。

(2)放大器12

放大器12采用TI公司的型号OPA684的放大器；

对采集的语音信号进行放大，将放大信号的语音传送至音频解码器13进行解码。

(3)音频解码器13

音频解码器13采用TI公司生产的音频处理芯片TLV320AIC34；

对音频信号进行解码调制，将采集的信号传送至数据传输装置20。

2)数据传输装置

数据传输装置20包括依次连通的通信接口21、控制器22、外部扩展接口23、射频发射模块24、发射天线25、接收天线26、射频接收模块27。

(1)通信接口21

通信接口21是一种多功能的同步串行接口，具有很强的可编程能力，可以配置为多种同步串口标准，直接与各种器件高速接口；

负责外部音频处理装置10与控制器22间的通信。

(2)控制器22

控制器22采用TI公司的TMS320C6713(主频225MHz)型DSP芯片；

主要负责对音频处理装置10和射频发射模块24进行管理和控制。

(3)外部扩展接口23

外部扩展接口23是一种由控制器22提供的接口；

主要用于连接射频发射模块24，实现控制器22对射频通信的控制和管理。

(4)射频发射模块24

射频放射模块24采用型号为VS-5854的外置天线的无线微波设备，发射功率为28dBm，高接收灵敏度802.11a/n协议，工作频段在5.150-5.850GHz，传输距离可达30公里。

(5)发射天线25

发射天线25采用MIMO双天线模式，V+H极性，天线的增益为28Bi，波瓣角度：V：40度，H：60度。

(6)接收天线(26)

发射天线(26)采用MIMO双天线模式，V+H极性，天线的增益为28Bi，波瓣角度：V：40度，H：60度。

(7)射频接收模块27

射频接收模块27采用型号为VS-5854的外置天线的无线微波设备，工作方式是点对点，点对多点的方式，频段通道自动调整，免除了手动修改的麻烦。

3)终端数据处理装置30

终端数据处理装置30包括前后连接的通信接口31和PC端32；

由PC端32处理采集的数据，基于MATLAB平台处理混合语音，利用相应算法达到语音分离的目的。

(1)通信接口31

通信接口31是一种多功能的同步串行接口，具有很强的可编程能力，可以配置为多种同步串口标准，直接与各种器件高速接口；

负责射频接收模块27与PC端32间的通信。

(2)PC端32

PC端32即电脑，其内嵌有本方法的工作软件；

PC端32将传回来的数据进行处理，估计源语音的个数。

二、方法

1、语音降噪的工作流程

如图3，语音降噪的工作流程如下：

A、***初始化-301；

B、对采集的语音利用谱减法对噪声进行预去除，以提高输入语音信号的信噪比-302；

C、计算前5帧信号的噪声功率谱，作为动态估计的初始值-303；

D、使用子带谱熵对带噪语音信号进行端点检测，并记录下语音信号有声段的起始点与终止点-304；

E、判断该帧信号是否为有声段-305，是则进入步骤G，否则进入步骤F；

F、更新噪声功率谱-306；

G、维纳滤波降噪-307。

2、语音分离的工作流程

如图4，语音分离的工作流程如下：

a、对降噪后的纯净语音进行加窗和分帧预处理-401；

b、傅里叶变化，对语音信号进行稀疏表示-402；

c、归一化使语音数据点分布单位圆的上半圆周上，求每个点到(1，0)的弧度，对弧度值进行M个区域划分-403；

d、计算每个区域的概率密度-404；

e、利用局部最优解算法求出密度峰值-405；

f、寻找峰值对应的弧度值，可计算出混合矩阵A-406；

g、利用DUET算法，把混合语音各数据点投影在混合矩阵A的各个方向上，根据投影距离判定各数据点属于哪一源语音类，即可恢复各个源语音-407。

Claims

1.一种基于鸟类群落数量估计***的鸟类群落数量估计方法，

所述的鸟类群落数量估计***包括音频处理装置(10)、数据传输装置(20)、终端数据处理装置(30)和电源(40)；

音频处理装置(10)、数据传输装置(20)和终端数据处理装置(30)依次连接；

电源(40)分别与音频处理装置(10)和数据传输装置(20)连接；

所述的音频处理装置(10)包括依次连接的麦克风阵列(11)、放大器(12)和音频解码器(13)

所述的数据传输装置(20)包括依次连通的通信接口(21)、控制器(22)、外部扩展接口(23)、射频放射模块(24)、放射天线(25)、接收天线(26)和射频接收模块(27)

其特征在于：

①语音降噪

②语音分离

语音分离分为峰值估计和源语音恢复两个阶段：

2.按权利要求1所述的鸟类群落数量估计方法，其特征在于语音降噪的工作流程如下：

A、***初始化(301)；

B、对采集的语音利用谱减法对噪声进行预去除，以提高输入语音信号的信噪比(302)；

C、计算前5帧信号的噪声功率谱，作为动态估计的初始值(303)；

D、使用子带谱熵对带噪语音信号进行端点检测，并记录下语音信号有声段的起始点与终止点(304)；

E、判断该帧信号是否为有声段(305)，是则进入步骤G，否则进入步骤F；

F、更新噪声功率谱(306)；

G、维纳滤波降噪(307)。

3.按权利要求1所述的鸟类群落数量估计方法，其特征在语音分离的工作流程如下：

a、对降噪后的纯净语音进行加窗和分帧预处理(401)；

b、傅里叶变化，对语音信号进行稀疏表示(402)；

c、归一化使语音数据点分布单位圆的上半圆周上，求每个点到(1，0)的弧度，对弧度值进行M个区域划分(403)；

d、计算每个区域的概率密度(404)；

e、利用局部最优解算法求出密度峰值(405)；

f、寻找峰值对应的弧度值，可计算出混合矩阵A(406)；

g、利用DUET算法，把混合语音各数据点投影在混合矩阵A的各个方向上，根据投影距离判定各数据点属于哪一源语音类，即可恢复各个源语音(407)。