CN102760444B - 基于支撑向量机的基带时域音频信号分类方法 - Google Patents

基于支撑向量机的基带时域音频信号分类方法 Download PDF

Info

Publication number
CN102760444B
CN102760444B CN201210125085.7A CN201210125085A CN102760444B CN 102760444 B CN102760444 B CN 102760444B CN 201210125085 A CN201210125085 A CN 201210125085A CN 102760444 B CN102760444 B CN 102760444B
Authority
CN
China
Prior art keywords
signal
band time
sigma
subsequence
zero
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210125085.7A
Other languages
English (en)
Other versions
CN102760444A (zh
Inventor
刘一民
李元新
孟华东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201210125085.7A priority Critical patent/CN102760444B/zh
Publication of CN102760444A publication Critical patent/CN102760444A/zh
Application granted granted Critical
Publication of CN102760444B publication Critical patent/CN102760444B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

基于支撑向量机的基带时域音频信号分类方法,首先将基带时域音频信号序列分段,得到初始分段子序列,然后每个初始分段子序列分别减去各自的均值,得零均值分段子序列,接着对每个零均值分段子序列进行加窗处理,将结果分别进行傅里叶变换处理,得到分段子序列的频谱幅度,分别求出每个频谱幅度的标准差得到一个特征量,将各个零均值分段子序列按照次序依次组合成为一个长序列,然后计算出该序列的归一化自相关矩阵,对自相关矩阵进行奇异值分解,得到子空间的分界点,再计算出该基带时域音频信号序列的另一个特征量信噪比参量;最后将两个特征量构成输入向量送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。

Description

基于支撑向量机的基带时域音频信号分类方法
技术领域
本发明属于信号处理技术领域,具体涉及一种基于支撑向量机的基带时域音频信号分类方法。
背景技术
本发明应用于无线电侦测***中,所处理的信号是已经解调之后的基带时域音频信号,信号可能是被噪声不同程度污染的语音信号,也可能是纯噪声信号,其中噪声均以白噪声为主且混有少量有色噪声,利用SVM的原理构建一种分类器,对信号类型进行简单有效的鉴别分类。
以下的文章和专利文献,基本覆盖了该领域主要的背景技术。为了交待出技术的发展过程,让它们时间顺序排列,并逐个介绍文献的主要贡献。
1.S.Gokhun Tanyer,Hamza ozer,“Voice Activity Detection inNonstationary Gaussian Noise”,Proceedings of ICSP,1620-1623,1998.
语音端点检测(Voice Activity Detection,VAD)是指从噪声中甄别出语音的过程,文章提出了能量门限方法、过零率方法、最小二乘周期估计器和自适应能量门限的方法,其中能量门限方法和过零率方法多适用于信号信噪比(signal to noi se ratio,SNR)较高的情况下,在信噪比较低时虚警很高,而最小二乘周期估计器会由于噪声非平稳包含周期性而导致检测失败。同时文章还提出将多种方法融合进行语音信号检测的策略。
2.C.J.C.Burges,“A Tutorial on Support Vector Machines forPattern Recognition”,Data Mining and Knowledge Discovery,vol.2,no.2,pp.121-167,1998.
详细介绍了SVM的基本原理以及结论推导,SVM的方法是从线性可分情况下的最优分类超平面提出来的,其基本思想可以概括为首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优先性分类超平面。“最大间隔”和“将数据投影至更高维空间”是其核心概念,SVM构成通常意义上的二类模式分类器。但是该文章多是对SVM基本原理进行公式推导的证明,并没有给出在语音信号检测方面应用的提示和指导。
3.S.Gokhun Tanyer,Hamza ozer,“Voice Activity Detection inNonstationary Noise”,IEEE Trans.Speech AudioProcess.,vol.8,no.4,pp.478-481,Jul.2001
提出自适应能量门限的语音端点检测方法并给出实施策略,其中应用到几何方法计算信号SNR,减少了对噪声信号先验信息的依赖。但是该SNR的估计方法受信号累积分布的影响,不能对噪声信号信息进行充分学***稳的情况下SNR估计有偏差。
4.Quanwei Cai,Ping Wei,Xianci Xiao,“A Digital ModulationRecognition Method”,Proceedings of ICASSP,2004,pp 863–866
提出了基于SVD的信号SNR估计原理和方法,简单易行,没有对该方法的性能进行探讨,也没有给出计算参数的选取方法。
5.Cheol-Sun Park,Won Jang,Sun-Phil Nah.and Dae Young Kim,“Automatic Modulation Recognition using Support Vector Machine inSoftware Radio Applications”,in Proc.9th IEEE ICACT,Feb.2007,pp.9-12
提出基于SVM的信号调制方式识别的方法,以信号的归一化中心对称瞬时幅度的功率谱密度最大值γmax、信号强分量瞬时相位中的中心对称非线性分量绝对值的标准差σap、信号强分量瞬时相位中的中心对称非线性分量的标准差σdp、接收信号的归一化中心对称瞬时幅度绝对值的标准差σaa以及信号强分量中归一化瞬时频率绝对值的标准差σaf作为特征量输入获得结果,即使在信号低SNR的情况下也取得准确地分类结果。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提供了一种基于支撑向量机的基带时域音频信号分类方法,对基带时域音频信号进行处理,提取特征量作为分类器的输入以获取对信号类型的鉴别分类结果,从而将语音信号和噪声信号分类。
为了实现上述目的,本发明采用的技术方案是:
基于支撑向量机的基带时域音频信号分类方法,包括如下步骤:
步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值,可得零均值分段子序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x 2 ( K ) , . . . , x K ( L ) } , 其中 x i ( m ) = s i ( m ) - 1 L Σ j = 1 L s i ( j ) ;
步骤二:对每个零均值分段子序列进行加窗处理,得到结果为 x 1 ′ = x 1 w T x 2 ′ = x 2 w T . . . x K ′ = x K w T , 其中w为汉宁窗;
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 ′ ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 ′ ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K ′ ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , 其中M是频谱幅度序列的长度;
步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中 d ( i ) = 1 M - 1 Σ j = 1 M ( f i ( j ) - 1 M Σ l = 1 M f i ( l ) ) 2 , 然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差
Figure GDA00001853396400042
步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为其中 r i = 1 Σ j = 1 N x ( j ) 2 Σ l = 1 N - i x ( l ) x ( l + i ) , Q是自相关矩阵的维数,取值范围为[50,90];
步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中Λ=diag(λ12,…,λQ)Q×Q=diag(γ12,…,γp22,…,σ2)Q×Q,且γ1≥γ2≥…≥γp,从而得到子空间的分界点p;
步骤七:根据 σ 2 ^ = 1 Q - p Σ i = p + 1 Q λ i , SNR ^ = 10 log Σ i = 1 p λ i - p × σ 2 ^ Q × σ 2 ^ 计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量
Figure GDA00001853396400047
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量
Figure GDA00001853396400048
构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。
上述的子空间分界点p可由如下方法得到:由
Figure GDA00001853396400049
其中
Figure GDA000018533964000410
是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-T,λQ-T+1,...,λQ的均值,然后所有大于1.5Eλ的特征值中最大的下标为p,即p={i|λi>1.5Eλi+1<1.5Eλ}。
上述将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段所对应的时间应不大于20ms。
与现有技术相比,本发明通过训练的方式更多的获取待分类信号的先验信息,选取适当的输入特征量能够迅速有效的获得分类结果。为了反映语音信号和噪声信号的区别,选择信号SNR参量和信号频谱幅度标准差作为分类器的输入特征量,既方便计算又能够很好的实现信号的鉴别和分类。本发明能够有效地检测鉴别语音信号和噪声信号,选取的两个输入特征量信号信噪比参量和信号频谱幅度标准差计算简单又能有效的反映出两种信号的区别,即使在信噪比较低的情况下也能够保证较高的分类正确率。本发明适用于实时信号处理,易于实现,可很好地用于无线电应用中。
附图说明
图1是本发明流程图。
图2是输入特征量为信号信噪比参量时的概率密度分布图。
图3是输入特征量为频谱幅度标准差时的概率密度分布图。
图4是SVM分类器工作结果示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。
本发明基于SVM原理设计分类器,通过对基带时域音频信号序列处理提取特征量,将其作为输入送入训练完毕的分类器,从而鉴别出音频信号的类型,对语音信号和噪声信号进行正确分类。
如图1所示,实现步骤如下:
步骤一:由于要处理的是已经经过解调的基带时域音频信号序列,首先应对信号进行预处理,以便于提取充分反映信号特征的特征量。
将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}均匀分成K段,每段长度为L,每段所对应的时间应不大于20ms。
得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值以除去直流分量,从而可得零均值分段子序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x 2 ( K ) , . . . , x K ( L ) } , 其中 x i ( m ) = s i ( m ) - 1 L &Sigma; j = 1 L s i ( j ) .
步骤二:为了降低对分段子序列进行频域处理时旁瓣对结果的影响,选用汉宁窗对每个零均值分段子序列进行加窗处理。加窗后的结果为 x 1 &prime; = x 1 w T x 2 &prime; = x 2 w T . . . x K &prime; = x K w T , 其中w为汉宁窗序列。
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 &prime; ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 &prime; ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K &prime; ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } ,
其中FFT的点数应为大于子序列长度2~4倍的2的幂指数2a,M是频谱幅度序列的长度。
步骤四:利用标准差的无偏估计形式 d ( i ) = 1 M - 1 &Sigma; j = 1 M ( f i ( j ) - 1 M &Sigma; l = 1 M f i ( l ) ) 2 分别求出每个分段子序列的频谱幅度的标准差d={d(1),d(2),...,d(K)},然后求出所有标准差的平均值,就得到该时域音频信号序列的一个特征量,即频谱幅度标准差 D = 1 K &Sigma; i = 1 K d ( i ) .
信号信噪比参量如图2所示,其中横坐标是信号信噪比参量的取值范围,纵坐标是概率密度;频谱幅度标准差的概率密度函数如图3所示,其中横坐标是频谱幅度标准差的取值范围,纵坐标是概率密度。从图中可以看出噪声信号的特征量分布较为集中,因此单个特征量可以一定程度上反映语音信号和噪声信号的区别,但是不能将两类信号完全有效地区分开,所以需要联合两者作为分类器的输入量才能实现正确的信号分类,因此继续执行以下步骤。
步骤五:接着对音频信号序列进行处理已获得另外一个特征量。首先将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个信号长序列x,即得到x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为
Figure GDA00001853396400071
其中 r i = 1 &Sigma; j = 1 N x ( j ) 2 &Sigma; l = 1 N - i x ( l ) x ( l + i ) , 且Q是自相关矩阵的维数,取值范围为[50,90],本发明中取值为70。
步骤六:对自相关矩阵R进行SVD分解,得到R=VΛVH。假设语音信号和噪声信号是相互独立的,R=Rx+Rn=V(Λxn)VH=VΛVH,其中Rx、Rn分别是语音信号和噪声信号的自相关矩阵。
由SVD分解可知Λx=diag(γ12,…,γp,0,…,0)Q×Q,γ1≥γ2≥…≥γp
Λn=diag(σ22,…,σ2)Q×Q
Λ=diag(λ12,…,λQ)Q×Q=diag(γ12,…,γp22,…,σ2)Q×Q
通过
Figure GDA00001853396400073
其中
Figure GDA00001853396400074
是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-T,λQ-T+1,...,λQ的均值,然后搜寻所有大于1.5Eλ的特征值中最大的下标为分界点p,即p={i|λi>1.5Eλi+1<1.5Eλ}。
步骤七:根据 &sigma; 2 ^ = 1 Q - p &Sigma; i = p + 1 Q &lambda; i , SNR ^ = 10 log &Sigma; i = 1 p &lambda; i - p &times; &sigma; 2 ^ Q &times; &sigma; 2 ^ 计算出该基带时域音频信号序列的另一个特征量,即信噪比参量
Figure GDA00001853396400077
能够在一定程度上反映出信号的信噪比情况。
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量
Figure GDA00001853396400081
构成输入向量,送入训练完毕的SVM分类器中,就可以得到该基带时域音频信号的分类结果,区分出语音信号和噪声信号。
执行该步骤的分类器工作结果如图4所示,其中“+”是语音信号特征量,“*”是噪声信号特征量,在空间中两类特征量可以被正确隔离,由此证实该基于SVM的基带时域音频信号分类器能够有效地鉴别信号类型并且正确地分类。

Claims (2)

1.基于支撑向量机的基带时域音频信号分类方法,其特征在于,包括如下步骤:
步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } ,其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值,可得零均值分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } ,其中 x i ( m ) = s i ( m ) - 1 L &Sigma; j = 1 l s i ( j ) ;
步骤二:对每个零均值分段子序列进行加窗处理,得到结果为 x 1 &prime; = x 1 w T x 2 &prime; = x 2 w T . . . x K &prime; = x K w T ,其中w为汉宁窗;
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 &prime; ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 1 &prime; ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K &prime; ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , 其中M是频谱幅度序列的长度;
步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中
Figure FDA00003268392200016
,然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差
Figure FDA00003268392200017
步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为
Figure FDA00003268392200021
,其中 r i = 1 &Sigma; j = 1 N x ( j ) 2 &Sigma; l = 1 N - i x ( l ) x ( l + i ) ,Q是自相关矩阵的维数,取值范围为[50,90];
步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中Λ=diag(λ12,...,λQ)Q×Q=diag(γ12,...,γp22,...,σ2)Q×Q,且γ1≥γ2≥...≥γp,由
Figure FDA00003268392200023
,其中
Figure FDA00003268392200028
是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-TQ-T+1,...,λQ的均值,然后所有大于1.5Eλ的特征值中最大的下标为p,即p={i|λi>1.5Eλi+1<1.5Eλ},从而得到子空间的分界点p;
步骤七:根据 &sigma; 2 ^ 1 Q - p &Sigma; i = p + 1 Q &lambda; i , SNR ^ = 10 log &Sigma; i = 1 p &lambda; i - p &times; &sigma; 2 ^ Q &times; &sigma; 2 ^ 计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量
Figure FDA00003268392200026
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量
Figure FDA00003268392200027
,构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。
2.根据权利要求1所述信号分类方法,其特征在于,所述步骤一中分为K段,每段对应的时间不大于20ms。
CN201210125085.7A 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法 Expired - Fee Related CN102760444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210125085.7A CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210125085.7A CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Publications (2)

Publication Number Publication Date
CN102760444A CN102760444A (zh) 2012-10-31
CN102760444B true CN102760444B (zh) 2014-06-11

Family

ID=47054885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210125085.7A Expired - Fee Related CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Country Status (1)

Country Link
CN (1) CN102760444B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240697A (zh) * 2013-06-24 2014-12-24 浙江大华技术股份有限公司 一种音频数据的特征提取方法及装置
CN104732970B (zh) * 2013-12-20 2018-12-04 中国科学院声学研究所 一种基于综合特征的舰船辐射噪声识别方法
CN104751856B (zh) * 2013-12-31 2017-12-22 ***通信集团公司 一种语音语句识别方法及装置
CN104409073A (zh) * 2014-11-04 2015-03-11 贵阳供电局 一种变电设备声音与语音的识别方法
CN105743756B (zh) * 2016-01-20 2019-03-12 中科威发半导体(苏州)有限公司 WiFi***中基于adaboost算法的帧检测方法
CN105976822B (zh) * 2016-07-12 2019-12-03 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置
CN106789764B (zh) * 2016-11-18 2019-07-16 杭州电子科技大学 联合加权阈值去噪与均衡判决的变换域二次估计方法
CN107682109B (zh) * 2017-10-11 2019-07-30 北京航空航天大学 一种适用于无人机通信***的干扰信号分类识别方法
CN108877783B (zh) * 2018-07-05 2021-08-31 腾讯音乐娱乐科技(深圳)有限公司 确定音频数据的音频类型的方法和装置
CN109448389B (zh) * 2018-11-23 2021-09-10 西安联丰迅声信息科技有限责任公司 一种汽车鸣笛智能检测方法
CN112466322B (zh) * 2020-11-27 2023-06-20 华侨大学 一种机电设备噪声信号特征提取方法
CN113759208A (zh) * 2021-06-02 2021-12-07 青岛鼎信通讯股份有限公司 一种基于故障指示器的异常波形识别方法
CN117150224B (zh) * 2023-10-30 2024-01-26 宜兴启明星物联技术有限公司 基于物联网的用户行为数据存储分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
CN101529929A (zh) * 2006-09-05 2009-09-09 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器
JP2011034342A (ja) * 2009-07-31 2011-02-17 Fujifilm Corp 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136199B (zh) * 2006-08-30 2011-09-07 纽昂斯通讯公司 语音数据处理方法和设备
JP4488091B2 (ja) * 2008-06-24 2010-06-23 ソニー株式会社 電子機器、映像コンテンツ編集方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
CN101529929A (zh) * 2006-09-05 2009-09-09 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器
JP2011034342A (ja) * 2009-07-31 2011-02-17 Fujifilm Corp 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Automatic Modulation Recognition of Digital Signals using Wavelet Features and SVM;Jun-Ho Choi et al;《International Conference on Advanced Communication Technology, 2008. ICACT 2008. 10th》;20080220;387-390 *
Automatic Modulation Recognition using Support Vector Machine in Software Radio Applications;Cheol-Sun Park et al;《The 9th International Conference on Advanced Communication Technology》;20070214;9-12 *
Cheol-Sun Park et al.Automatic Modulation Recognition using Support Vector Machine in Software Radio Applications.《The 9th International Conference on Advanced Communication Technology》.2007,9-12.
Jun-Ho Choi et al.Automatic Modulation Recognition of Digital Signals using Wavelet Features and SVM.《International Conference on Advanced Communication Technology, 2008. ICACT 2008. 10th》.2008,387-390.

Also Published As

Publication number Publication date
CN102760444A (zh) 2012-10-31

Similar Documents

Publication Publication Date Title
CN102760444B (zh) 基于支撑向量机的基带时域音频信号分类方法
CN106330385B (zh) 一种干扰类型识别方法
CN102610227A (zh) 声音信号处理设备、声音信号处理方法和程序
CN108600135A (zh) 一种信号调制方式的识别方法
CN103646649A (zh) 一种高效的语音检测方法
CN105393305A (zh) 用于处理声音信号的方法
CN105261367A (zh) 一种说话人识别方法
Sun et al. Cluster guide particle swarm optimization (CGPSO) for underdetermined blind source separation with advanced conditions
Miao et al. Underwater acoustic signal classification based on sparse time–frequency representation and deep learning
CN106685478A (zh) 基于信号时频图像信息提取的跳频信号参数估计方法
CN102968990A (zh) 说话人识别方法和***
CN103985381A (zh) 一种基于参数融合优化决策的音频索引方法
CN111832462A (zh) 一种基于深度神经网络的跳频信号检测与参数估计方法
CN106098079A (zh) 音频信号的信号提取方法与装置
CN109884591A (zh) 一种基于麦克风阵列的多旋翼无人机声信号增强方法
CN103474072A (zh) 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法
Kong et al. Radar waveform recognition using Fourier-based synchrosqueezing transform and CNN
Yu et al. Discriminative training for multiple observation likelihood ratio based voice activity detection
CN102509548B (zh) 一种基于多距离声传感器的音频索引方法
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及***
CN111325143A (zh) 一种数据集不均衡条件下的水下目标识别方法
Wang et al. Binary neural networks for wireless interference identification
CN105743756B (zh) WiFi***中基于adaboost算法的帧检测方法
Malik et al. Automatic threshold optimization in nonlinear energy operator based spike detection
CN116992263A (zh) 一种基于多任务学习的水下航行器自噪声特征提取、识别与分离的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140611

Termination date: 20210425