CN111968671A

CN111968671A - 基于多维特征空间的低空声目标综合识别方法及装置

Info

Publication number: CN111968671A
Application number: CN202010856355.6A
Authority: CN
Inventors: 杨立学; 王志峰; 周印龙; 袁彦
Original assignee: Third Research Institute Of China Electronics Technology Group Corp
Current assignee: Third Research Institute Of China Electronics Technology Group Corp
Priority date: 2020-08-24
Filing date: 2020-08-24
Publication date: 2020-11-20
Anticipated expiration: 2040-08-24
Also published as: CN111968671B

Abstract

本发明涉及一种基于多维特征空间的低空声目标综合识别方法及装置，通过多通道声音传感器阵列采集信号；对采集信号进行分析计算，获得包括时频特征、空间特征和谐波特征的多维特征向量；将所述多维特征向量输入至目标分类模型，进行目标识别。本发明能够有效提高目标识别率。

Description

基于多维特征空间的低空声目标综合识别方法及装置

技术领域

本发明涉及一种基于多维特征空间的低空声目标综合识别方法及装置。

背景技术

利用声传感器被动接收低空运动目标(如直升机、战斗机等)辐射噪声信号，并利用阵列信号处理和模式识别等方法，可得到目标的方位、属性、运动状态等信息。声探测具有不受电磁干扰、隐蔽性好、生存能力强；声波具有绕射特性，不受通视、能见度条件限制，在山地、丘陵等复杂地形条件下，以及夜间、雨雾等不良气象条件下，对低空隐蔽目标能够准确探测；利用目标噪声提取声纹特征，可实现目标类型、型号的精准识别。

声目标识别技术包括声信号特征提取和分类器设计两个阶段，其中前者是决定目标识别性能的关键。现有声音识别方法所采用的声信号特征主要包括时域特征(如短时能量、过零率、自相关系数等)、频域特征(如功率谱、AR谱、高阶谱等)、时频域特征(如小波包系数、短时幅度谱等)以及听觉感知类特征(如MFCC、Gammatone听觉谱特征等)。

上述几类特征从原理上均属于单通道信号特征，即基于单个传声器信号便可完成特征提取，所提取的特征通常只能涵盖目标信号的时频统计特性。然而，仅提取这些特征对描述目标特性是不完备的，因为目标与环境干扰间在时频特性上往往存在较大相似性，如直升机目标和某些类型的汽车具有相似的线谱特征，战斗机与卡车等干扰源具有宽谱特性，从而会产生较多虚警。

发明内容

本发明的发明目的在于提供一种基于多维特征空间的低空声目标综合识别方法及装置，能够有效提高目标识别率。

基于同一发明构思，本发明具有两个独立的技术方案：

1、一种基于多维特征空间的低空声目标综合识别方法，其特征在于，包括以下步骤：

步骤1：通过多通道声音传感器阵列采集信号；

步骤2：对采集信号进行分析计算，获得包括时频特征、空间特征和谐波特征的多维特征向量；

步骤3：将所述多维特征向量输入至目标分类模型，进行目标识别。

进一步地，步骤2中，时频特征、谐波特征通过对单通道信号的分析计算获得；空间特征通过对多通道信号的分析计算获得。

进一步地，步骤2中，信号的时频特征通过如下方法获得，

将信号通过傅里叶变换获得频谱，对频谱取模平方获得其功率谱；

通过Mel滤波器组对所述功率谱进行滤波，获得Mel谱；

对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。

进一步地，步骤2中，信号的谐波特征通过如下方法获得，

通过谐波检测获得谐波谱；

对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。

进一步地，基于如下公式进行谐波检测,

|frequency(k)/fm-i_mk|≤ε

式中frequency(k)表示各功率谱谱峰对应的频率，f_m是假定基频，i_mk对应谐波次数,ε是选定的阈值。

进一步地，步骤2中，信号的空间特征通过如下方法获得，

基于信号的时频谱，多通道计算每个时频单元的局部DOA估计，得到空间谱；

对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。

进一步地，步骤3中，目标分类模型采用GMM-HMM模型。

进一步地，步骤3中，针对每个目标类型建立一个GMM-HMM模型；目标类型包括直升机、战斗机、环境干扰。

进一步地，步骤3中，建立目标分类模型时，模型参数通过如下方法训练获得，

步骤3.1：设置最大训练次数，并设置归一化收敛阈值ε；给定初始参数λ；

步骤3.2：利用Baum-Welch重估算法对初始化参数λ进行参数重估，得到新的模型参数

步骤3.3：利用维特比算法求所有观察值序列的输出概率

步骤3.4：计算观察值序列的输出概率P的变化，如若

则令

并返回步骤3.2继续进行迭代，直到模型参数收敛；如果迭代次数大于最大训练次数，即使不收敛也停止运算。

2、一种基于多维特征空间的低空声目标综合识别装置，其特征在于，包括：

多通道声音传感器阵列，所述多通道声音传感器阵列用于采集声音信号；

声音信号分析计算单元，所述声音信号分析计算单元用于对采集信号进行分析计算，获得包括时频特征、空间特征和谐波特征的多维特征向量；

目标识别单元，所述目标识别单元包括目标分类模型，将所述多维特征向量输入至所述目标分类模型，进行目标识别；

显示单元，所述显示单元用于将目标识别结果进行显示。。

本发明具有的有益效果：

本发明对采集信号进行分析计算，获得包括时频特征、空间特征和谐波特征的多维特征向量，其中空间特征可有效区分具有不同运动速率的目标，如直升机、战斗机和环境干扰(如汽车)等。谐波特征可对有谐波噪声的目标进行有效区分，比如直升机、无人机等典型目标具有独特的螺旋桨动力结构，其运动会辐射出高强度的谐波噪声。本发明结合时频特征、空间特征和谐波特征对目标进行识别，可有效提高目标识别率。

本发明目标分类模型采用GMM-HMM模型；针对每个目标类型建立一个GMM-HMM模型；目标类型包括直升机、战斗机、环境干扰，进一步保证在复杂噪声环境下有效识别目标，剔除各类干扰引起的虚警，降低探测虚警率。

附图说明

图1是本发明方法流程图；

图2是GMM-HMM模型组成示意图；

图3是不同特征组合的平均识别率和混淆矩阵；

图4是本发明装置的原理框图。

具体实施方式

下面结合附图所示的实施方式对本发明进行详细说明，但应当说明的是，这些实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代，均属于本发明的保护范围之内。

实施例一：

基于多维特征空间的低空声目标综合识别方法

如图1所示，一种基于多维特征空间的低空声目标综合识别方法，包括如下步骤：

步骤1：通过多通道声音传感器阵列采集信号。

采样频率为1024Hz，对信号利用1s长重叠率为50％的短时窗进行分帧。

步骤2：对采集信号进行分析计算，获得包括时频特征、空间特征和谐波特征的多维特征向量。

时频特征、谐波特征通过对单通道信号的分析计算获得；空间特征通过对多通道信号的分析计算获得。

(一)时频特征

将信号通过傅里叶变换获得频谱，对频谱取模平方获得其功率谱；通过Mel滤波器组对所述功率谱进行滤波，获得Mel谱；对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。

Mel频率倒谱系数(MFCC)是声目标识别中常用的特征。人耳在各种嘈杂环境中具有出众的目标辨识能力，其中耳蜗起了关键作用。耳蜗实质上相当于一个滤波器组，耳蜗滤波作用是在对数频率尺度上进行的，因而其低频分辨率高，高频分辨率低。由于低空目标噪声在低频的信息较之高频更为丰富，因而这种频率尺度划分对于提取特征具有重要意义。根据人耳音调感知关系，可得到Mel频率尺度及对应的滤波器组。Mel频率尺度与普通频率尺度的关系为

MFCC的提取过程包括预加重、分帧、加窗、FFT、Mel频率滤波器组、对数计算、离散余弦变换(DCT)和时域差分运算。下面结合低空目标噪声特点，给出每个步骤的处理过程：

1)预加重：该阶段相当于一个高通滤波器，对于语音它可以有效地突出其共振峰部分；然而，对于低空目标噪声，由于其高频部分不重要，因而可将该阶段舍弃。

2)分帧：利用长度为1s、相互重叠(50％)的短时时间窗对信号x(t)进行分段，每段便称为一帧，并且假设信号在一帧内是平稳的。

3)加窗：为保证每帧的左右连续性，需要对信号加窗，一般选用汉明窗。

4)FFT：对各帧信号进行快速傅里叶变换获得每帧的频谱，并对频谱取模平方获得其功率谱。

5)Mel滤波器组：将功率谱通过一组Mel尺度的滤波器组，它由64个三角形滤波器构成，对于低空目标，中心频率范围可选为10～500Hz，其频率响应定义为

式中k为频率，f(m-1)、f(m+1)和f(m)分别代表第m个滤波器上下截止频率及中心频率。

6)对数计算：对滤波后的信号功率谱取对数模拟耳蜗内毛细胞压缩非线性：

7)离散余弦变换：对对数能量进行离散余弦变换(DCT)，保留前32阶系数，即为MFCC特征。DCT变换的定义为

(二)空间特征

基于信号的时频谱，多通道计算每个时频单元的局部DOA估计，得到空间谱；对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。

空间特征描述了目标空间分布统计特性。考虑到不同阵列形式传感器相对位置的差异，采用实际DOA估计及其变化描述目标的空间分布特性。在获得时频谱后，计算每个时频单元的局部DOA估计，得到目标空间谱。给定传声器阵列信号时频谱x(f,n)＝[x₁(f,n),x₂(f,n),Lx_M(f,n)]^T和传感器位置R，每个时频单元的局部DOA可通过广义互相关函数获得：

式中(·)^*表示复共轭，

表示实数部分。

表示通道m1和m2相对于θ方向远场声源信号时延，c为声速。(f,n)时频单元的局部DOA为

θ_TF(f,n)即为目标的空间谱。对空间谱进行离散余弦变换可获得32阶空间谱倒谱系数，记为SPCC。

(三)谐波特征

通过谐波检测获得谐波谱；对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。

由于具有螺旋桨动力结构，直升机、无人机低空目标辐射噪声信号中具备明显的谐波分量，因此谐波特征分析可描述目标声源物理特性。谐波特征分析的关键是谐波集特征提取。提取过程包括：首先根据目标特性选择合适的频带，如直升机能量主要集中在中低频带(0～300Hz)，后续可只选取该频带的功率谱进行处理。

在此频段内搜索所有谱峰，按峰值大小降序排列，用前几个谱峰来做谐波集检测。在这里谱峰需满足下列条件：

1)峰值首先必须是功率谱中的局部极大值local max，将某频点分别与左、右邻域内的值求一阶差分△左、△右，若满足△左>0且△右<0，则该点为此邻域内的极大值；

2)类似地在极大值两侧动态邻域内各寻找一个极小值local min1和local min2，如果比值

大过某个阈值，那么就认为谱峰是显著的，可以选择。这样的算法兼顾了谱峰的左右边界、峰宽和峰高等特征判据。

基于如下公式进行谐波检测,

|frequency(k)/fm-i_mk|≤ε

若检测到一些频率与某一特定频率具有明显的谐波关系，则认为检测到一个谐波集，特定频率就是谐波集的基频。

在实际处理中，由于事先不知道基频的值，故可将检测出的所有谱峰对应的频率依次作为假定基频，考察其他频率值和它的谐波关系。另外，对应某个基频，有时会出现不只一个谐波集符合所有条件，这时需要权函数来决定取舍。对每个谐波集内的所有频率的能量进行计算作为权值，选择最大能量的谐波集及对应的基频作为目标的特征频率。

经过谐波集检测便可获得信号的谐波谱，对谐波谱进行进一步离散余弦变换可获得32阶谐波谱倒谱系数，记为HPCC。

综上，对Mel谱、空间谱、和谐波谱分别进行离散余弦变换获得32阶Mel频率倒谱系数(MFCC)、32阶空间倒谱系数(SPCC)和32阶谐波谱倒谱系数(HPCC)，构成96维特征向量(MFCC+SPCC+HPCC)。

目标分类模型采用GMM-HMM模型。对每个目标类型进行建模，直升机、战斗机和环境干扰分别建立1个GMM-HMM模型。

目标声信号的产生是一个复杂的时间演变过程，而隐马尔可夫模型作为一种概率统计模型，不但可以精确地描述时序动态信号的变化规律，而且能分析声信号特征分布的概率问题。隐马尔可夫模型(Hidden Markov Models,简记为HMM)是一种用参数来描述随机过程统计特征的概率模型，它实际上是一个双重随机过程，其中马尔可夫链是基本的随机过程，用于描述状态的转移。另一个随机过程描述状态和观察值之间的统计关系。对于应用者来说，只能看到观察值，不能看到状态的转移，因此称之为“隐马尔可夫模型”。

图2给出了一个4状态HMM模型的示意图。一个HMM可以用M＝{A,B,π}来描述，π＝[π_i]_N×1为初始状态概率矢量，A为状态转移矩阵A＝[a_ij]_N×N；B为观察概率B＝[b_it]_N×T，b_it表示给定状态S_i下t时刻观测变量的条件概率。

形象的说，HMM是一个双内嵌式随机过程，一个是马尔科夫链，由π和A描述状态的转移，产生的输出为状态序列q₁,q₂,L,q_T，q_t∈{S₁,S₂,L S_N}，N为状态数目，状态转移概率满足p(q_t+1＝S_j|q_t＝S_i)＝a_ij。另一个随机过程由B描述观察值和状态之间的统计对应关系，O₁,O₂,LO_T为观测到的特征序列，T为时间长度(如果对信号进行分帧，并按照上述特征提取方法构造特征向量，便可形成特征向量序列O₁,O₂,LO_T，T对应分帧数目)；对于连续型特征向量，t时刻观测O_t在给定状态S_i下的条件概率b(O_t|q_t＝S_i)可使用高斯混合模型(GuassianMixture Models，简记为GMM)表示：

GMM通常表示为K个多维高斯分布的加权和，其中p_i,k表示S_i状态模型第k个高斯分量的加权系数或先验概率，且满足

μ_i,k和∑_i,k则表示对应的均值向量和协方差矩阵。

在使用GMM-HMM模型识别目标时，首先，需要在已有的训练数据下，训练得到基于最优化准则下模型参数；其次，在已知模型参数和一组待识别数据的特征向量序列下，对待测数据有效地分类识别。下面对训练和识别的两个问题进行阐述。

(一)模型参数训练

该阶段的目的是求出使得观测变量序列O＝{O₁,O₂,LO_T}的联合概率达到最大的一组模型参数λ：

式中λ＝{π_i,a_ij,p_i,k,μ_i,k,∑_i,k}，包含初始状态概率、状态转移矩阵以及每个状态GMM模型对应的先验概率、均值向量和协方差矩阵，为需要估计的参数。

模型参数估计使用Baum-Welch(简记为BW)算法获得，具体方法如下：

步骤3.3：利用维特比算法求所有观察值序列的输出概率

步骤3.4：计算观察值序列的输出概率P的变化，如若

则令

(二)GMM-HMM目标分类

对目标分类问题，可以用Viterbi算法求出特征向量序列在给定模型参数下的输出概率，进而计算出待观测数据的类别，其计算公式记为：

其中1≤c≤C，C为所有可能的目标类个数，λ_c为第c个目标类的HMM模型参数，c^*为识别出的类别。

对测试样本，将计算得到的多维特征向量分别输入到事先训练好的直升机、战斗机和环境干扰GMM-HMM模型，得到最终的目标类型。

实施例二：

基于多维特征空间的低空声目标综合识别装置

如图4所示，一种基于多维特征空间的低空声目标综合识别装置，包括：

显示单元，所述显示单元用于将目标识别结果进行显示。

实施例二中，识别装置的低空声目标综合识别原理(方法)同实施例一。

下面结合声目标识别试验进一步说明本发明的有益效果。

对提出的基于多维特征空间和GMM-HMM相结合的目标识别模型进行性能验证，考察复杂噪声背景下的目标识别和虚警抑制能力，着重对比不同特征组合的性能差异。

1)数据集

利用多通道声阵列，通过多次低空声目标采集试验构造包含直升机、战斗机和环境干扰三类目标的数据集，其中直升机目标包含国内外7种型号，战斗机目标包含国内外5种型号，环境干扰包含路边、海边、沙漠、夜晚等多种环境的背景噪声。

在划分训练集和测试集时，需充分考虑环境变化时目标识别模型的鲁棒性，因此训练集和测试集需包含不同的目标型号或不同的采集环境。表1显示了训练集和测试集所包含的直升机、战斗机和环境干扰样本个数，每个样本为5s长(当前1s和左右各2s)多通道声信号。

表1训练集和测试集不同类别目标的样本个数

	训练集	测试集
			直升机	3660	2683
战斗机	4268	3697
			环境干扰	7844	7081

2)识别结果

本节将对Mel谱特征向量(MFCC)、Mel谱-空间谱特征向量(MFCC+SPCC)、Mel谱-谐波谱特征向量(MFCC+HPCC)和全特征向量(MFCC+SPCC+HPCC)的识别效果进行对比，突出特征的全面性对提升识别率的重要性。

图3显示了不同特征组合的平均识别率和混淆矩阵。对于MFCC+HPCC和MFCC发现，加入谐波特征后直升机目标识别率提升，虚警率大幅度降低，但战斗机目标的识别性能下降明显；对于MFCC+SPCC和MFCC发现，加入空间谱特征后直升机和战斗机目标识别率均提升，但虚警率也没有改善；当使用MFCC+SPCC+HPCC特征时，直升机识别性能稍微提升，战斗机识别性能稍微下降，而虚警率大幅度改善。上述结果表明，当综合使用Mel谱特征、空间谱特征和谐波谱特征时，可在保证直升机、战斗机的识别效果的同时，大幅度降低虚警率。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

Claims

1.一种基于多维特征空间的低空声目标综合识别方法，其特征在于，包括以下步骤：

步骤1：通过多通道声音传感器阵列采集信号；

2.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤2中，时频特征、谐波特征通过对单通道信号的分析计算获得；空间特征通过对多通道信号的分析计算获得。

3.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤2中，信号的时频特征通过如下方法获得，

通过Mel滤波器组对所述功率谱进行滤波，获得Mel谱；

对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。

4.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤2中，信号的谐波特征通过如下方法获得，

通过谐波检测获得谐波谱；

对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。

5.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法，其特征在于:基于如下公式进行谐波检测,

|frequency(k)/fm-i_mk|≤ε

6.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤2中，信号的空间特征通过如下方法获得，

对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。

7.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤3中，目标分类模型采用GMM-HMM模型。

8.根据权利要求7所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤3中，针对每个目标类型建立一个GMM-HMM模型；目标类型包括直升机、战斗机、环境干扰。

9.根据权利要求7所述的基于多维特征空间的低空声目标综合识别方法，其特征在于：步骤3中，建立目标分类模型时，模型参数通过如下方法训练获得，

步骤3.3：利用维特比算法求所有观察值序列的输出概率

步骤3.4：计算观察值序列的输出概率P的变化，如若

则令

10.一种基于多维特征空间的低空声目标综合识别装置，其特征在于，包括：

显示单元，所述显示单元用于将目标识别结果进行显示。