CN111968671A - 基于多维特征空间的低空声目标综合识别方法及装置 - Google Patents
基于多维特征空间的低空声目标综合识别方法及装置 Download PDFInfo
- Publication number
- CN111968671A CN111968671A CN202010856355.6A CN202010856355A CN111968671A CN 111968671 A CN111968671 A CN 111968671A CN 202010856355 A CN202010856355 A CN 202010856355A CN 111968671 A CN111968671 A CN 111968671A
- Authority
- CN
- China
- Prior art keywords
- target
- frequency
- spectrum
- harmonic
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 29
- 238000013145 classification model Methods 0.000 claims abstract description 16
- 238000001228 spectrum Methods 0.000 claims description 73
- 238000012549 training Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 10
- 230000007613 environmental effect Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 238000005309 stochastic process Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000003477 cochlea Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于多维特征空间的低空声目标综合识别方法及装置,通过多通道声音传感器阵列采集信号;对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;将所述多维特征向量输入至目标分类模型,进行目标识别。本发明能够有效提高目标识别率。
Description
技术领域
本发明涉及一种基于多维特征空间的低空声目标综合识别方法及装置。
背景技术
利用声传感器被动接收低空运动目标(如直升机、战斗机等)辐射噪声信号,并利用阵列信号处理和模式识别等方法,可得到目标的方位、属性、运动状态等信息。声探测具有不受电磁干扰、隐蔽性好、生存能力强;声波具有绕射特性,不受通视、能见度条件限制,在山地、丘陵等复杂地形条件下,以及夜间、雨雾等不良气象条件下,对低空隐蔽目标能够准确探测;利用目标噪声提取声纹特征,可实现目标类型、型号的精准识别。
声目标识别技术包括声信号特征提取和分类器设计两个阶段,其中前者是决定目标识别性能的关键。现有声音识别方法所采用的声信号特征主要包括时域特征(如短时能量、过零率、自相关系数等)、频域特征(如功率谱、AR谱、高阶谱等)、时频域特征(如小波包系数、短时幅度谱等)以及听觉感知类特征(如MFCC、Gammatone听觉谱特征等)。
上述几类特征从原理上均属于单通道信号特征,即基于单个传声器信号便可完成特征提取,所提取的特征通常只能涵盖目标信号的时频统计特性。然而,仅提取这些特征对描述目标特性是不完备的,因为目标与环境干扰间在时频特性上往往存在较大相似性,如直升机目标和某些类型的汽车具有相似的线谱特征,战斗机与卡车等干扰源具有宽谱特性,从而会产生较多虚警。
发明内容
本发明的发明目的在于提供一种基于多维特征空间的低空声目标综合识别方法及装置,能够有效提高目标识别率。
基于同一发明构思,本发明具有两个独立的技术方案:
1、一种基于多维特征空间的低空声目标综合识别方法,其特征在于,包括以下步骤:
步骤1:通过多通道声音传感器阵列采集信号;
步骤2:对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;
步骤3:将所述多维特征向量输入至目标分类模型,进行目标识别。
进一步地,步骤2中,时频特征、谐波特征通过对单通道信号的分析计算获得;空间特征通过对多通道信号的分析计算获得。
进一步地,步骤2中,信号的时频特征通过如下方法获得,
将信号通过傅里叶变换获得频谱,对频谱取模平方获得其功率谱;
通过Mel滤波器组对所述功率谱进行滤波,获得Mel谱;
对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。
进一步地,步骤2中,信号的谐波特征通过如下方法获得,
通过谐波检测获得谐波谱;
对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。
进一步地,基于如下公式进行谐波检测,
|frequency(k)/fm-imk|≤ε
式中frequency(k)表示各功率谱谱峰对应的频率,fm是假定基频,imk对应谐波次数,ε是选定的阈值。
进一步地,步骤2中,信号的空间特征通过如下方法获得,
基于信号的时频谱,多通道计算每个时频单元的局部DOA估计,得到空间谱;
对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。
进一步地,步骤3中,目标分类模型采用GMM-HMM模型。
进一步地,步骤3中,针对每个目标类型建立一个GMM-HMM模型;目标类型包括直升机、战斗机、环境干扰。
进一步地,步骤3中,建立目标分类模型时,模型参数通过如下方法训练获得,
步骤3.1:设置最大训练次数,并设置归一化收敛阈值ε;给定初始参数λ;
步骤3.4:计算观察值序列的输出概率P的变化,如若
2、一种基于多维特征空间的低空声目标综合识别装置,其特征在于,包括:
多通道声音传感器阵列,所述多通道声音传感器阵列用于采集声音信号;
声音信号分析计算单元,所述声音信号分析计算单元用于对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;
目标识别单元,所述目标识别单元包括目标分类模型,将所述多维特征向量输入至所述目标分类模型,进行目标识别;
显示单元,所述显示单元用于将目标识别结果进行显示。。
本发明具有的有益效果:
本发明对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量,其中空间特征可有效区分具有不同运动速率的目标,如直升机、战斗机和环境干扰(如汽车)等。谐波特征可对有谐波噪声的目标进行有效区分,比如直升机、无人机等典型目标具有独特的螺旋桨动力结构,其运动会辐射出高强度的谐波噪声。本发明结合时频特征、空间特征和谐波特征对目标进行识别,可有效提高目标识别率。
本发明目标分类模型采用GMM-HMM模型;针对每个目标类型建立一个GMM-HMM模型;目标类型包括直升机、战斗机、环境干扰,进一步保证在复杂噪声环境下有效识别目标,剔除各类干扰引起的虚警,降低探测虚警率。
附图说明
图1是本发明方法流程图;
图2是GMM-HMM模型组成示意图;
图3是不同特征组合的平均识别率和混淆矩阵;
图4是本发明装置的原理框图。
具体实施方式
下面结合附图所示的实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
实施例一:
基于多维特征空间的低空声目标综合识别方法
如图1所示,一种基于多维特征空间的低空声目标综合识别方法,包括如下步骤:
步骤1:通过多通道声音传感器阵列采集信号。
采样频率为1024Hz,对信号利用1s长重叠率为50%的短时窗进行分帧。
步骤2:对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量。
时频特征、谐波特征通过对单通道信号的分析计算获得;空间特征通过对多通道信号的分析计算获得。
(一)时频特征
将信号通过傅里叶变换获得频谱,对频谱取模平方获得其功率谱;通过Mel滤波器组对所述功率谱进行滤波,获得Mel谱;对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。
Mel频率倒谱系数(MFCC)是声目标识别中常用的特征。人耳在各种嘈杂环境中具有出众的目标辨识能力,其中耳蜗起了关键作用。耳蜗实质上相当于一个滤波器组,耳蜗滤波作用是在对数频率尺度上进行的,因而其低频分辨率高,高频分辨率低。由于低空目标噪声在低频的信息较之高频更为丰富,因而这种频率尺度划分对于提取特征具有重要意义。根据人耳音调感知关系,可得到Mel频率尺度及对应的滤波器组。Mel频率尺度与普通频率尺度的关系为
MFCC的提取过程包括预加重、分帧、加窗、FFT、Mel频率滤波器组、对数计算、离散余弦变换(DCT)和时域差分运算。下面结合低空目标噪声特点,给出每个步骤的处理过程:
1)预加重:该阶段相当于一个高通滤波器,对于语音它可以有效地突出其共振峰部分;然而,对于低空目标噪声,由于其高频部分不重要,因而可将该阶段舍弃。
2)分帧:利用长度为1s、相互重叠(50%)的短时时间窗对信号x(t)进行分段,每段便称为一帧,并且假设信号在一帧内是平稳的。
3)加窗:为保证每帧的左右连续性,需要对信号加窗,一般选用汉明窗。
4)FFT:对各帧信号进行快速傅里叶变换获得每帧的频谱,并对频谱取模平方获得其功率谱。
5)Mel滤波器组:将功率谱通过一组Mel尺度的滤波器组,它由64个三角形滤波器构成,对于低空目标,中心频率范围可选为10~500Hz,其频率响应定义为
式中k为频率,f(m-1)、f(m+1)和f(m)分别代表第m个滤波器上下截止频率及中心频率。
6)对数计算:对滤波后的信号功率谱取对数模拟耳蜗内毛细胞压缩非线性:
7)离散余弦变换:对对数能量进行离散余弦变换(DCT),保留前32阶系数,即为MFCC特征。DCT变换的定义为
(二)空间特征
基于信号的时频谱,多通道计算每个时频单元的局部DOA估计,得到空间谱;对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。
空间特征描述了目标空间分布统计特性。考虑到不同阵列形式传感器相对位置的差异,采用实际DOA估计及其变化描述目标的空间分布特性。在获得时频谱后,计算每个时频单元的局部DOA估计,得到目标空间谱。给定传声器阵列信号时频谱x(f,n)=[x1(f,n),x2(f,n),LxM(f,n)]T和传感器位置R,每个时频单元的局部DOA可通过广义互相关函数获得:
θTF(f,n)即为目标的空间谱。对空间谱进行离散余弦变换可获得32阶空间谱倒谱系数,记为SPCC。
(三)谐波特征
通过谐波检测获得谐波谱;对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。
由于具有螺旋桨动力结构,直升机、无人机低空目标辐射噪声信号中具备明显的谐波分量,因此谐波特征分析可描述目标声源物理特性。谐波特征分析的关键是谐波集特征提取。提取过程包括:首先根据目标特性选择合适的频带,如直升机能量主要集中在中低频带(0~300Hz),后续可只选取该频带的功率谱进行处理。
在此频段内搜索所有谱峰,按峰值大小降序排列,用前几个谱峰来做谐波集检测。在这里谱峰需满足下列条件:
1)峰值首先必须是功率谱中的局部极大值local max,将某频点分别与左、右邻域内的值求一阶差分△左、△右,若满足△左>0且△右<0,则该点为此邻域内的极大值;
2)类似地在极大值两侧动态邻域内各寻找一个极小值local min1和local min2,如果比值大过某个阈值,那么就认为谱峰是显著的,可以选择。这样的算法兼顾了谱峰的左右边界、峰宽和峰高等特征判据。
基于如下公式进行谐波检测,
|frequency(k)/fm-imk|≤ε
式中frequency(k)表示各功率谱谱峰对应的频率,fm是假定基频,imk对应谐波次数,ε是选定的阈值。
若检测到一些频率与某一特定频率具有明显的谐波关系,则认为检测到一个谐波集,特定频率就是谐波集的基频。
在实际处理中,由于事先不知道基频的值,故可将检测出的所有谱峰对应的频率依次作为假定基频,考察其他频率值和它的谐波关系。另外,对应某个基频,有时会出现不只一个谐波集符合所有条件,这时需要权函数来决定取舍。对每个谐波集内的所有频率的能量进行计算作为权值,选择最大能量的谐波集及对应的基频作为目标的特征频率。
经过谐波集检测便可获得信号的谐波谱,对谐波谱进行进一步离散余弦变换可获得32阶谐波谱倒谱系数,记为HPCC。
综上,对Mel谱、空间谱、和谐波谱分别进行离散余弦变换获得32阶Mel频率倒谱系数(MFCC)、32阶空间倒谱系数(SPCC)和32阶谐波谱倒谱系数(HPCC),构成96维特征向量(MFCC+SPCC+HPCC)。
步骤3:将所述多维特征向量输入至目标分类模型,进行目标识别。
目标分类模型采用GMM-HMM模型。对每个目标类型进行建模,直升机、战斗机和环境干扰分别建立1个GMM-HMM模型。
目标声信号的产生是一个复杂的时间演变过程,而隐马尔可夫模型作为一种概率统计模型,不但可以精确地描述时序动态信号的变化规律,而且能分析声信号特征分布的概率问题。隐马尔可夫模型(Hidden Markov Models,简记为HMM)是一种用参数来描述随机过程统计特征的概率模型,它实际上是一个双重随机过程,其中马尔可夫链是基本的随机过程,用于描述状态的转移。另一个随机过程描述状态和观察值之间的统计关系。对于应用者来说,只能看到观察值,不能看到状态的转移,因此称之为“隐马尔可夫模型”。
图2给出了一个4状态HMM模型的示意图。一个HMM可以用M={A,B,π}来描述,π=[πi]N×1为初始状态概率矢量,A为状态转移矩阵A=[aij]N×N;B为观察概率B=[bit]N×T,bit表示给定状态Si下t时刻观测变量的条件概率。
形象的说,HMM是一个双内嵌式随机过程,一个是马尔科夫链,由π和A描述状态的转移,产生的输出为状态序列q1,q2,L,qT,qt∈{S1,S2,L SN},N为状态数目,状态转移概率满足p(qt+1=Sj|qt=Si)=aij。另一个随机过程由B描述观察值和状态之间的统计对应关系,O1,O2,LOT为观测到的特征序列,T为时间长度(如果对信号进行分帧,并按照上述特征提取方法构造特征向量,便可形成特征向量序列O1,O2,LOT,T对应分帧数目);对于连续型特征向量,t时刻观测Ot在给定状态Si下的条件概率b(Ot|qt=Si)可使用高斯混合模型(GuassianMixture Models,简记为GMM)表示:
在使用GMM-HMM模型识别目标时,首先,需要在已有的训练数据下,训练得到基于最优化准则下模型参数;其次,在已知模型参数和一组待识别数据的特征向量序列下,对待测数据有效地分类识别。下面对训练和识别的两个问题进行阐述。
(一)模型参数训练
该阶段的目的是求出使得观测变量序列O={O1,O2,LOT}的联合概率达到最大的一组模型参数λ:
式中λ={πi,aij,pi,k,μi,k,∑i,k},包含初始状态概率、状态转移矩阵以及每个状态GMM模型对应的先验概率、均值向量和协方差矩阵,为需要估计的参数。
模型参数估计使用Baum-Welch(简记为BW)算法获得,具体方法如下:
步骤3.1:设置最大训练次数,并设置归一化收敛阈值ε;给定初始参数λ;
步骤3.4:计算观察值序列的输出概率P的变化,如若
(二)GMM-HMM目标分类
对目标分类问题,可以用Viterbi算法求出特征向量序列在给定模型参数下的输出概率,进而计算出待观测数据的类别,其计算公式记为:
其中1≤c≤C,C为所有可能的目标类个数,λc为第c个目标类的HMM模型参数,c*为识别出的类别。
对测试样本,将计算得到的多维特征向量分别输入到事先训练好的直升机、战斗机和环境干扰GMM-HMM模型,得到最终的目标类型。
实施例二:
基于多维特征空间的低空声目标综合识别装置
如图4所示,一种基于多维特征空间的低空声目标综合识别装置,包括:
多通道声音传感器阵列,所述多通道声音传感器阵列用于采集声音信号;
声音信号分析计算单元,所述声音信号分析计算单元用于对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;
目标识别单元,所述目标识别单元包括目标分类模型,将所述多维特征向量输入至所述目标分类模型,进行目标识别;
显示单元,所述显示单元用于将目标识别结果进行显示。
实施例二中,识别装置的低空声目标综合识别原理(方法)同实施例一。
下面结合声目标识别试验进一步说明本发明的有益效果。
对提出的基于多维特征空间和GMM-HMM相结合的目标识别模型进行性能验证,考察复杂噪声背景下的目标识别和虚警抑制能力,着重对比不同特征组合的性能差异。
1)数据集
利用多通道声阵列,通过多次低空声目标采集试验构造包含直升机、战斗机和环境干扰三类目标的数据集,其中直升机目标包含国内外7种型号,战斗机目标包含国内外5种型号,环境干扰包含路边、海边、沙漠、夜晚等多种环境的背景噪声。
在划分训练集和测试集时,需充分考虑环境变化时目标识别模型的鲁棒性,因此训练集和测试集需包含不同的目标型号或不同的采集环境。表1显示了训练集和测试集所包含的直升机、战斗机和环境干扰样本个数,每个样本为5s长(当前1s和左右各2s)多通道声信号。
表1训练集和测试集不同类别目标的样本个数
训练集 | 测试集 | |
直升机 | 3660 | 2683 |
战斗机 | 4268 | 3697 |
环境干扰 | 7844 | 7081 |
2)识别结果
本节将对Mel谱特征向量(MFCC)、Mel谱-空间谱特征向量(MFCC+SPCC)、Mel谱-谐波谱特征向量(MFCC+HPCC)和全特征向量(MFCC+SPCC+HPCC)的识别效果进行对比,突出特征的全面性对提升识别率的重要性。
图3显示了不同特征组合的平均识别率和混淆矩阵。对于MFCC+HPCC和MFCC发现,加入谐波特征后直升机目标识别率提升,虚警率大幅度降低,但战斗机目标的识别性能下降明显;对于MFCC+SPCC和MFCC发现,加入空间谱特征后直升机和战斗机目标识别率均提升,但虚警率也没有改善;当使用MFCC+SPCC+HPCC特征时,直升机识别性能稍微提升,战斗机识别性能稍微下降,而虚警率大幅度改善。上述结果表明,当综合使用Mel谱特征、空间谱特征和谐波谱特征时,可在保证直升机、战斗机的识别效果的同时,大幅度降低虚警率。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
Claims (10)
1.一种基于多维特征空间的低空声目标综合识别方法,其特征在于,包括以下步骤:
步骤1:通过多通道声音传感器阵列采集信号;
步骤2:对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;
步骤3:将所述多维特征向量输入至目标分类模型,进行目标识别。
2.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤2中,时频特征、谐波特征通过对单通道信号的分析计算获得;空间特征通过对多通道信号的分析计算获得。
3.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤2中,信号的时频特征通过如下方法获得,
将信号通过傅里叶变换获得频谱,对频谱取模平方获得其功率谱;
通过Mel滤波器组对所述功率谱进行滤波,获得Mel谱;
对所述Mel谱进行离散余弦变换获得Mel频率倒谱系数MFCC。
4.根据权利要求1所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤2中,信号的谐波特征通过如下方法获得,
通过谐波检测获得谐波谱;
对所述谐波谱进行离散余弦变换获得谐波谱倒谱系数HPCC。
5.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:基于如下公式进行谐波检测,
|frequency(k)/fm-imk|≤ε
式中frequency(k)表示各功率谱谱峰对应的频率,fm是假定基频,imk对应谐波次数,ε是选定的阈值。
6.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤2中,信号的空间特征通过如下方法获得,
基于信号的时频谱,多通道计算每个时频单元的局部DOA估计,得到空间谱;
对所述空间谱进行离散余弦变换获得空间倒谱系数SPCC。
7.根据权利要求4所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤3中,目标分类模型采用GMM-HMM模型。
8.根据权利要求7所述的基于多维特征空间的低空声目标综合识别方法,其特征在于:步骤3中,针对每个目标类型建立一个GMM-HMM模型;目标类型包括直升机、战斗机、环境干扰。
10.一种基于多维特征空间的低空声目标综合识别装置,其特征在于,包括:
多通道声音传感器阵列,所述多通道声音传感器阵列用于采集声音信号;
声音信号分析计算单元,所述声音信号分析计算单元用于对采集信号进行分析计算,获得包括时频特征、空间特征和谐波特征的多维特征向量;
目标识别单元,所述目标识别单元包括目标分类模型,将所述多维特征向量输入至所述目标分类模型,进行目标识别;
显示单元,所述显示单元用于将目标识别结果进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856355.6A CN111968671B (zh) | 2020-08-24 | 2020-08-24 | 基于多维特征空间的低空声目标综合识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856355.6A CN111968671B (zh) | 2020-08-24 | 2020-08-24 | 基于多维特征空间的低空声目标综合识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111968671A true CN111968671A (zh) | 2020-11-20 |
CN111968671B CN111968671B (zh) | 2024-03-01 |
Family
ID=73390107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010856355.6A Active CN111968671B (zh) | 2020-08-24 | 2020-08-24 | 基于多维特征空间的低空声目标综合识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111968671B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114387975A (zh) * | 2021-12-28 | 2022-04-22 | 北京中电慧声科技有限公司 | 应用于混响环境声纹识别的基频信息提取方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1776807A (zh) * | 2004-11-15 | 2006-05-24 | 松下电器产业株式会社 | 声音辨识***及具有该***的安全装置 |
US20140072142A1 (en) * | 2012-09-13 | 2014-03-13 | Honda Motor Co., Ltd. | Sound direction estimation device, sound processing system, sound direction estimation method, and sound direction estimation program |
CN103994820A (zh) * | 2014-04-21 | 2014-08-20 | 中国科学院上海微***与信息技术研究所 | 一种基于微孔径麦克风阵列的运动目标识别方法 |
US20170061981A1 (en) * | 2015-08-27 | 2017-03-02 | Honda Motor Co., Ltd. | Sound source identification apparatus and sound source identification method |
CN106772227A (zh) * | 2017-01-12 | 2017-05-31 | 浙江大学 | 一种基于声纹多谐波识别的无人机方向估计方法 |
CN106772246A (zh) * | 2017-01-20 | 2017-05-31 | 浙江大学 | 基于声阵列的无人机实时检测和定位***及方法 |
EP3232219A1 (en) * | 2016-02-25 | 2017-10-18 | Panasonic Intellectual Property Corporation of America | Sound source detection apparatus, method for detecting sound source, and program |
CN107576387A (zh) * | 2017-08-18 | 2018-01-12 | 浙江大学 | 一种基于声纹多谐波识别的无人机检测方法 |
CN107993648A (zh) * | 2017-11-27 | 2018-05-04 | 北京邮电大学 | 一种无人机识别方法、装置及电子设备 |
CN109192200A (zh) * | 2018-05-25 | 2019-01-11 | 华侨大学 | 一种语音识别方法 |
KR20190019713A (ko) * | 2017-08-18 | 2019-02-27 | 인하대학교 산학협력단 | 무인 항공기 음향 식별을 위한 서포트 벡터 머신에 기반한 음향 특징 추출 및 분류 방법 그리고 시스템 |
CN111239680A (zh) * | 2020-01-19 | 2020-06-05 | 西北工业大学太仓长三角研究院 | 一种基于差分阵列的波达方向估计方法 |
-
2020
- 2020-08-24 CN CN202010856355.6A patent/CN111968671B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1776807A (zh) * | 2004-11-15 | 2006-05-24 | 松下电器产业株式会社 | 声音辨识***及具有该***的安全装置 |
US20140072142A1 (en) * | 2012-09-13 | 2014-03-13 | Honda Motor Co., Ltd. | Sound direction estimation device, sound processing system, sound direction estimation method, and sound direction estimation program |
CN103994820A (zh) * | 2014-04-21 | 2014-08-20 | 中国科学院上海微***与信息技术研究所 | 一种基于微孔径麦克风阵列的运动目标识别方法 |
US20170061981A1 (en) * | 2015-08-27 | 2017-03-02 | Honda Motor Co., Ltd. | Sound source identification apparatus and sound source identification method |
EP3232219A1 (en) * | 2016-02-25 | 2017-10-18 | Panasonic Intellectual Property Corporation of America | Sound source detection apparatus, method for detecting sound source, and program |
CN106772227A (zh) * | 2017-01-12 | 2017-05-31 | 浙江大学 | 一种基于声纹多谐波识别的无人机方向估计方法 |
CN106772246A (zh) * | 2017-01-20 | 2017-05-31 | 浙江大学 | 基于声阵列的无人机实时检测和定位***及方法 |
CN107576387A (zh) * | 2017-08-18 | 2018-01-12 | 浙江大学 | 一种基于声纹多谐波识别的无人机检测方法 |
KR20190019713A (ko) * | 2017-08-18 | 2019-02-27 | 인하대학교 산학협력단 | 무인 항공기 음향 식별을 위한 서포트 벡터 머신에 기반한 음향 특징 추출 및 분류 방법 그리고 시스템 |
CN107993648A (zh) * | 2017-11-27 | 2018-05-04 | 北京邮电大学 | 一种无人机识别方法、装置及电子设备 |
CN109192200A (zh) * | 2018-05-25 | 2019-01-11 | 华侨大学 | 一种语音识别方法 |
CN111239680A (zh) * | 2020-01-19 | 2020-06-05 | 西北工业大学太仓长三角研究院 | 一种基于差分阵列的波达方向估计方法 |
Non-Patent Citations (5)
Title |
---|
刘辉 等: "基于ICA和HMM的低空声目标识别方法", 声学技术, pages 879 - 883 * |
徐舒: "基于D SP 的战场声目标实时识别与定位技术研究与实现" * |
杨 博 等: "基于稀疏非负矩阵分解的低空声目标识别" * |
赵路: "复杂背景下的声源定位和识别", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 136 - 250 * |
魏丽萍 等: "谐波集(HS)检测算法在直升机目标声探测中的应用", 探测与控制学报, pages 14 - 16 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114387975A (zh) * | 2021-12-28 | 2022-04-22 | 北京中电慧声科技有限公司 | 应用于混响环境声纹识别的基频信息提取方法及装置 |
CN114387975B (zh) * | 2021-12-28 | 2024-07-19 | 北京中电慧声科技有限公司 | 应用于混响环境声纹识别的基频信息提取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111968671B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560822B (zh) | 一种基于卷积神经网络的道路声信号分类方法 | |
CN108520753B (zh) | 基于卷积双向长短时记忆网络的语音测谎方法 | |
CN111239680B (zh) | 一种基于差分阵列的波达方向估计方法 | |
CN109243429B (zh) | 一种语音建模方法及装置 | |
CN110942766A (zh) | 音频事件检测方法、***、移动终端及存储介质 | |
Hemavathi et al. | Voice conversion spoofing detection by exploring artifacts estimates | |
CN115510909A (zh) | 一种dbscan进行异常声音特征的无监督算法 | |
Gutierrez-Arriola et al. | Synthetic Sound Event Detection based on MFCC. | |
CN111968671B (zh) | 基于多维特征空间的低空声目标综合识别方法及装置 | |
CN114093385A (zh) | 一种无人机检测方法及装置 | |
CN111785262B (zh) | 一种基于残差网络及融合特征的说话人年龄性别分类方法 | |
Kamble et al. | Emotion recognition for instantaneous Marathi spoken words | |
CN115267672A (zh) | 声源检测和定位的方法 | |
CN115331678A (zh) | 利用Mel频率倒谱系数的广义回归神经网络声信号识别方法 | |
Estrebou et al. | Voice recognition based on probabilistic SOM | |
Youssef et al. | From monaural to binaural speaker recognition for humanoid robots | |
CN113488069A (zh) | 基于生成式对抗网络的语音高维特征快速提取方法和装置 | |
CN112820318A (zh) | 一种基于gmm-ubm的冲击声模型建立、冲击声检测方法及*** | |
Adiloglu et al. | An uncertainty estimation approach for the extraction of source features in multisource recordings | |
Tahliramani et al. | Performance Analysis of Speaker Identification System With and Without Spoofing Attack of Voice Conversion | |
CN111091816A (zh) | 一种基于语音评测的数据处理***及方法 | |
Therese et al. | A linear visual assessment tendency based clustering with power normalized cepstral coefficients for audio signal recognition system | |
Nosan et al. | Speech recognition approach using descend-delta-mean and MFCC algorithm | |
Firoozabadi et al. | Speakers counting by proposed nested microphone array in combination with limited space SRP | |
Huang et al. | A speaker recognition method based on GMM using non-negative matrix factorization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |