CN102760444A - 基于支撑向量机的基带时域音频信号分类方法 - Google Patents

基于支撑向量机的基带时域音频信号分类方法 Download PDF

Info

Publication number
CN102760444A
CN102760444A CN2012101250857A CN201210125085A CN102760444A CN 102760444 A CN102760444 A CN 102760444A CN 2012101250857 A CN2012101250857 A CN 2012101250857A CN 201210125085 A CN201210125085 A CN 201210125085A CN 102760444 A CN102760444 A CN 102760444A
Authority
CN
China
Prior art keywords
signal
band time
subsequence
zero
mean
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101250857A
Other languages
English (en)
Other versions
CN102760444B (zh
Inventor
刘一民
李元新
孟华东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201210125085.7A priority Critical patent/CN102760444B/zh
Publication of CN102760444A publication Critical patent/CN102760444A/zh
Application granted granted Critical
Publication of CN102760444B publication Critical patent/CN102760444B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

基于支撑向量机的基带时域音频信号分类方法,首先将基带时域音频信号序列分段,得到初始分段子序列,然后每个初始分段子序列分别减去各自的均值,得零均值分段子序列,接着对每个零均值分段子序列进行加窗处理,将结果分别进行傅里叶变换处理,得到分段子序列的频谱幅度,分别求出每个频谱幅度的标准差得到一个特征量,将各个零均值分段子序列按照次序依次组合成为一个长序列,然后计算出该序列的归一化自相关矩阵,对自相关矩阵进行奇异值分解,得到子空间的分界点,再计算出该基带时域音频信号序列的另一个特征量信噪比参量;最后将两个特征量构成输入向量送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。

Description

基于支撑向量机的基带时域音频信号分类方法
技术领域
本发明属于信号处理技术领域,具体涉及一种基于支撑向量机的基带时域音频信号分类方法。 
背景技术
本发明应用于无线电侦测***中,所处理的信号是已经解调之后的基带时域音频信号,信号可能是被噪声不同程度污染的语音信号,也可能是纯噪声信号,其中噪声均以白噪声为主且混有少量有色噪声,利用SVM的原理构建一种分类器,对信号类型进行简单有效的鉴别分类。 
以下的文章和专利文献,基本覆盖了该领域主要的背景技术。为了交待出技术的发展过程,让它们时间顺序排列,并逐个介绍文献的主要贡献。 
1.S.Gokhun Tanyer,Hamza ozer,“Voice Activity Detection in Nonstationary Gaussian Noise”,Proceedings of ICSP,1620-1623,1998. 
语音端点检测(Voice Activity Detection,VAD)是指从噪声中甄别出语音的过程,文章提出了能量门限方法、过零率方法、最小二乘周期估计器和自适应能量门限的方法,其中能量门限方法和过零率方法多适用于信号信噪比(signal to noise ratio,SNR)较高的情况下,在信噪比较低时虚警很高,而最小二乘周期估计器会由于噪声非平稳包含周期性而导致检测失败。同时文章还提出将多种方法融合进行语音信号检测的策略。 
2.C.J.C.Burges,“A Tutorial on Support Vector Machines for Pattern Recognition”,Data Mining and Knowledge Discovery,vol.2,no.2,pp.121-167,1998. 
详细介绍了SVM的基本原理以及结论推导,SVM的方法是从线性可分情况下的最优分类超平面提出来的,其基本思想可以概括为首先通过非线性变 换将输入空间变换到一个高维空间,然后在这个新空间中求取最优先性分类超平面。“最大间隔”和“将数据投影至更高维空间”是其核心概念,SVM构成通常意义上的二类模式分类器。但是该文章多是对SVM基本原理进行公式推导的证明,并没有给出在语音信号检测方面应用的提示和指导。 
3.S.Gokhun Tanyer,Hamza ozer,“Voice Activity Detection in Nonstationary Noise”,IEEE Trans.Speech Audio Process.,vol.8,no.4,pp.478-481,Jul.2001 
提出自适应能量门限的语音端点检测方法并给出实施策略,其中应用到几何方法计算信号SNR,减少了对噪声信号先验信息的依赖。但是该SNR的估计方法受信号累积分布的影响,不能对噪声信号信息进行充分学***稳的情况下SNR估计有偏差。 
4.Quanwei Cai,Ping Wei,Xianci Xiao,“A Digital Modulation Recognition Method”,Proceedings of ICASSP,2004,pp 863–866 
提出了基于SVD的信号SNR估计原理和方法,简单易行,没有对该方法的性能进行探讨,也没有给出计算参数的选取方法。 
5.Cheol-Sun Park,Won Jang,Sun-Phil Nah.and Dae Young Kim,“Automatic Modulation Recognition using Support Vector Machine in Software Radio Applications”,in Proc.9th IEEE ICACT,Feb.2007,pp.9-12 
提出基于SVM的信号调制方式识别的方法,以信号的归一化中心对称瞬时幅度的功率谱密度最大值γmax、信号强分量瞬时相位中的中心对称非线性分量绝对值的标准差σap、信号强分量瞬时相位中的中心对称非线性分量的标准差σdp、接收信号的归一化中心对称瞬时幅度绝对值的标准差σaa以及信号强分量中归一化瞬时频率绝对值的标准差σaf作为特征量输入获得结果,即使在信号低SNR的情况下也取得准确地分类结果。 
发明内容
为了克服上述现有技术的不足,本发明的目的在于提供了一种基于支撑向量机的基带时域音频信号分类方法,对基带时域音频信号进行处理,提取特征量作为分类器的输入以获取对信号类型的鉴别分类结果,从而将语音信号和噪声信号分类。 
为了实现上述目的,本发明采用的技术方案是: 
基于支撑向量机的基带时域音频信号分类方法,包括如下步骤: 
步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值,可得零均值分段子序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x K ( 2 ) , . . . , x K ( L ) } , 其中  x i ( m ) = s i ( m ) - 1 L Σ j = 1 L s i ( j ) ;
步骤二:对每个零均值分段子序列进行加窗处理,得到结果为  x 1 ′ = x 1 w T x 2 ′ = x 2 w T . . . x K ′ = x K w T , 其中w为汉宁窗; 
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 ′ ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 ′ ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K ′ ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , 其中M是频谱幅度序列的长度; 
步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中 
Figure BDA0000157114150000041
然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差 
步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为 其中 
Figure BDA0000157114150000044
Q是自相关矩阵的维数,取值范围为[50,90]; 
步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中 
Λ=diag(λ1,λ2,…,λQ)Q×Q=diag(γ12,…,γp2,σ2,…,σ2)Q×Q,且γ1≥γ2≥…≥γp,从而得到子空间的分界点p; 
步骤七:根据 
Figure BDA0000157114150000045
Figure BDA0000157114150000046
计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量 
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量 构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。 
上述的子空间分界点p可由如下方法得到:由 
Figure BDA0000157114150000049
其中 
Figure BDA00001571141500000410
是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-T,λQ-T+1,...,λQ的均值,然后所有大于1.5Eλ的特征值中最大的下标为p,即p={i|λi>1.5Eλ,λi+1<1.5Eλ}。 
上述将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段所对应的时间应不大于20ms。 
与现有技术相比,本发明通过训练的方式更多的获取待分类信号的先验信息,选取适当的输入特征量能够迅速有效的获得分类结果。为了反映语音信号和噪声信号的区别,选择信号SNR参量和信号频谱幅度标准差作为分类器的输入特征量,既方便计算又能够很好的实现信号的鉴别和分类。本发明能够有效地检测鉴别语音信号和噪声信号,选取的两个输入特征量信号信噪比参量和信号频谱幅度标准差计算简单又能有效的反映出两种信号的区别,即使在信噪比较低的情况下也能够保证较高的分类正确率。本发明适用于实时信号处理,易于实现,可很好地用于无线电应用中。 
附图说明
图1是本发明流程图。 
图2是输入特征量为信号信噪比参量时的概率密度分布图。 
图3是输入特征量为频谱幅度标准差时的概率密度分布图。 
图4是SVM分类器工作结果示意图。 
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。 
本发明基于SVM原理设计分类器,通过对基带时域音频信号序列处理提取特征量,将其作为输入送入训练完毕的分类器,从而鉴别出音频信号的类型,对语音信号和噪声信号进行正确分类。 
如图1所示,实现步骤如下: 
步骤一:由于要处理的是已经经过解调的基带时域音频信号序列,首先应对信号进行预处理,以便于提取充分反映信号特征的特征量。 
将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}均匀分成K段,每段长度为L,每段所对应的时间应不大于20ms。 
得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值以除去直流分量,从而可得零均值分段子序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x K ( 2 ) , . . . , x K ( L ) } , 其中  x i ( m ) = s i ( m ) - 1 L Σ j = 1 L s i ( j ) .
步骤二:为了降低对分段子序列进行频域处理时旁瓣对结果的影响,选用汉宁窗对每个零均值分段子序列进行加窗处理。加窗后的结果为  x 1 ′ = x 1 w T x 2 ′ = x 2 w T . . . x K ′ = x K w T , 其中w为汉宁窗序列。 
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 ′ ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 ′ ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K ′ ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , 其中FFT的点数应为大于子序列长度2~4倍的2的幂指数2a,M是频谱幅度序列的长度。 
步骤四:利用标准差的无偏估计形式 
Figure BDA0000157114150000066
分别求出每个分段子序列的频谱幅度的标准差d={d(1),d(2),...,d(K)},然后求出所有标准差的平均值,就得到该时域音频信号序列的一个特征量,即频谱幅度标准差 D = 1 K Σ i = 1 K d ( i ) .
信号信噪比参量如图2所示,其中横坐标是信号信噪比参量的取值范围, 纵坐标是概率密度;频谱幅度标准差的概率密度函数如图3所示,其中横坐标是频谱幅度标准差的取值范围,纵坐标是概率密度。从图中可以看出噪声信号的特征量分布较为集中,因此单个特征量可以一定程度上反映语音信号和噪声信号的区别,但是不能将两类信号完全有效地区分开,所以需要联合两者作为分类器的输入量才能实现正确的信号分类,因此继续执行以下步骤。 
步骤五:接着对音频信号序列进行处理已获得另外一个特征量。首先将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个信号长序列x,即得到x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为 
Figure BDA0000157114150000071
其中 
Figure BDA0000157114150000072
且Q是自相关矩阵的维数,取值范围为[50,90],本发明中取值为70。 
步骤六:对自相关矩阵R进行SVD分解,得到R=VΛVH。假设语音信号和噪声信号是相互独立的,R=Rx+Rn=V(Λxn)VH=VΛVH,其中Rx、Rn分别是语音信号和噪声信号的自相关矩阵。 
由SVD分解可知Λx=diag(γ1,γ2,…,γp,0,…,0)Q×Q,γ1≥γ2≥…≥γp, 
Λn=diag(σ2,σ2,…,σ2)Q×Q, 
Λ=diag(λ1,λ2,…,λQ)Q×Q=diag(γ12,…,γp2,σ2,…,σ2)Q×Q。 
通过 其中 
Figure BDA0000157114150000074
是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-T,λQ-T+1,...,λQ的均值,然后搜寻所有大于1.5Eλ的特征值中最大的下标为分界点p,即p={i|λi>1.5Eλ,λi+1<1.5Eλ}。 
步骤七:根据 
Figure BDA0000157114150000075
Figure BDA0000157114150000076
计算出该基带时域音频信号序列的另一个特征量,即信噪比参量 
Figure BDA0000157114150000077
能够在一定程度上反映出信号的信噪比情况。 
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量 
Figure BDA0000157114150000081
构成输入向量,送入训练完毕的SVM分类器中,就可以得到该基带时域音频信号的分类结果,区分出语音信号和噪声信号。 
执行该步骤的分类器工作结果如图4所示,其中“+”是语音信号特征量,“*”是噪声信号特征量,在空间中两类特征量可以被正确隔离,由此证实该基于SVM的基带时域音频信号分类器能够有效地鉴别信号类型并且正确地分类。 

Claims (3)

1.基于支撑向量机的基带时域音频信号分类方法,其特征在于,包括如下步骤:
步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列 s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值,可得零均值分段子序列 x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x K ( 2 ) , . . . , x K ( L ) } , 其中
x i ( m ) = s i ( m ) - 1 L Σ j = 1 L s i ( j ) ;
步骤二:对每个零均值分段子序列进行加窗处理,得到结果为 x 1 ′ = x 1 w T x 2 ′ = x 2 w T . . . x K ′ = x K w T , 其中w为汉宁窗;
步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为 f 1 = | FFT ( x 1 ′ ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 ′ ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K ′ ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , 其中M是频谱幅度序列的长度;
步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中
Figure FDA0000157114140000016
然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差
Figure FDA0000157114140000017
步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为
Figure FDA0000157114140000021
其中
Figure FDA0000157114140000022
Q是自相关矩阵的维数,取值范围为[50,90];
步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中
Λ=diag(λ1,λ2,…,λQ)Q×Q=diag(γ12,…,γp2,σ2,…,σ2)Q×Q,且γ1≥γ2≥…≥γp,从而得到子空间的分界点p;
步骤七:根据
Figure FDA0000157114140000023
Figure FDA0000157114140000024
计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量
Figure FDA0000157114140000025
步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量
Figure FDA0000157114140000026
构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。
2.根据权利要求1所述信号分类方法,其特征在于,子空间分界点p可由如下方法得到:由
Figure FDA0000157114140000027
其中是对自相关矩阵维数处理结果的向下取整,计算出末T+1个特征值λQ-T,λQ-T+1,...,λQ的均值,然后所有大于1.5Eλ的特征值中最大的下标为p,即p={i|λi>1.5Eλ,λi+1<1.5Eλ}。
3.根据权利要求1所述信号分类方法,其特征在于,所述步骤一中分为K段,每段对应的时间不大于20ms。
CN201210125085.7A 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法 Expired - Fee Related CN102760444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210125085.7A CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210125085.7A CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Publications (2)

Publication Number Publication Date
CN102760444A true CN102760444A (zh) 2012-10-31
CN102760444B CN102760444B (zh) 2014-06-11

Family

ID=47054885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210125085.7A Expired - Fee Related CN102760444B (zh) 2012-04-25 2012-04-25 基于支撑向量机的基带时域音频信号分类方法

Country Status (1)

Country Link
CN (1) CN102760444B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240697A (zh) * 2013-06-24 2014-12-24 浙江大华技术股份有限公司 一种音频数据的特征提取方法及装置
CN104409073A (zh) * 2014-11-04 2015-03-11 贵阳供电局 一种变电设备声音与语音的识别方法
CN104732970A (zh) * 2013-12-20 2015-06-24 中国科学院声学研究所 一种基于综合特征的舰船辐射噪声识别方法
CN104751856A (zh) * 2013-12-31 2015-07-01 ***通信集团公司 一种语音语句识别方法及装置
CN105743756A (zh) * 2016-01-20 2016-07-06 灵芯微电子科技(苏州)有限公司 WiFi***中基于adaboost算法的帧检测方法
CN105976822A (zh) * 2016-07-12 2016-09-28 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置
CN106789764A (zh) * 2016-11-18 2017-05-31 杭州电子科技大学 联合加权阈值去噪与均衡判决的变换域二次估计方法
CN107682109A (zh) * 2017-10-11 2018-02-09 北京航空航天大学 一种适用于无人机通信***的干扰信号分类识别方法
CN108877783A (zh) * 2018-07-05 2018-11-23 腾讯音乐娱乐科技(深圳)有限公司 确定音频数据的音频类型的方法和装置
CN109448389A (zh) * 2018-11-23 2019-03-08 西安联丰迅声信息科技有限责任公司 一种汽车鸣笛智能检测方法
CN112466322A (zh) * 2020-11-27 2021-03-09 华侨大学 一种机电设备噪声信号特征提取方法
CN113759208A (zh) * 2021-06-02 2021-12-07 青岛鼎信通讯股份有限公司 一种基于故障指示器的异常波形识别方法
CN117150224A (zh) * 2023-10-30 2023-12-01 宜兴启明星物联技术有限公司 基于物联网的用户行为数据存储分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080059156A1 (en) * 2006-08-30 2008-03-06 International Business Machines Corporation Method and apparatus for processing speech data
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
CN101529929A (zh) * 2006-09-05 2009-09-09 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器
US20100008641A1 (en) * 2008-06-24 2010-01-14 Sony Corporation Electronic apparatus, video content editing method, and program
JP2011034342A (ja) * 2009-07-31 2011-02-17 Fujifilm Corp 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
US20080059156A1 (en) * 2006-08-30 2008-03-06 International Business Machines Corporation Method and apparatus for processing speech data
CN101529929A (zh) * 2006-09-05 2009-09-09 Gn瑞声达A/S 具有基于直方图的声环境分类的助听器
US20100008641A1 (en) * 2008-06-24 2010-01-14 Sony Corporation Electronic apparatus, video content editing method, and program
JP2011034342A (ja) * 2009-07-31 2011-02-17 Fujifilm Corp 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEOL-SUN PARK ET AL: "Automatic Modulation Recognition using Support Vector Machine in Software Radio Applications", 《THE 9TH INTERNATIONAL CONFERENCE ON ADVANCED COMMUNICATION TECHNOLOGY》 *
JUN-HO CHOI ET AL: "Automatic Modulation Recognition of Digital Signals using Wavelet Features and SVM", 《INTERNATIONAL CONFERENCE ON ADVANCED COMMUNICATION TECHNOLOGY, 2008. ICACT 2008. 10TH》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240697A (zh) * 2013-06-24 2014-12-24 浙江大华技术股份有限公司 一种音频数据的特征提取方法及装置
CN104732970B (zh) * 2013-12-20 2018-12-04 中国科学院声学研究所 一种基于综合特征的舰船辐射噪声识别方法
CN104732970A (zh) * 2013-12-20 2015-06-24 中国科学院声学研究所 一种基于综合特征的舰船辐射噪声识别方法
CN104751856A (zh) * 2013-12-31 2015-07-01 ***通信集团公司 一种语音语句识别方法及装置
CN104751856B (zh) * 2013-12-31 2017-12-22 ***通信集团公司 一种语音语句识别方法及装置
CN104409073A (zh) * 2014-11-04 2015-03-11 贵阳供电局 一种变电设备声音与语音的识别方法
CN105743756A (zh) * 2016-01-20 2016-07-06 灵芯微电子科技(苏州)有限公司 WiFi***中基于adaboost算法的帧检测方法
CN105743756B (zh) * 2016-01-20 2019-03-12 中科威发半导体(苏州)有限公司 WiFi***中基于adaboost算法的帧检测方法
CN105976822A (zh) * 2016-07-12 2016-09-28 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置
CN105976822B (zh) * 2016-07-12 2019-12-03 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置
CN106789764A (zh) * 2016-11-18 2017-05-31 杭州电子科技大学 联合加权阈值去噪与均衡判决的变换域二次估计方法
CN106789764B (zh) * 2016-11-18 2019-07-16 杭州电子科技大学 联合加权阈值去噪与均衡判决的变换域二次估计方法
CN107682109A (zh) * 2017-10-11 2018-02-09 北京航空航天大学 一种适用于无人机通信***的干扰信号分类识别方法
CN108877783A (zh) * 2018-07-05 2018-11-23 腾讯音乐娱乐科技(深圳)有限公司 确定音频数据的音频类型的方法和装置
CN109448389A (zh) * 2018-11-23 2019-03-08 西安联丰迅声信息科技有限责任公司 一种汽车鸣笛智能检测方法
CN112466322A (zh) * 2020-11-27 2021-03-09 华侨大学 一种机电设备噪声信号特征提取方法
CN112466322B (zh) * 2020-11-27 2023-06-20 华侨大学 一种机电设备噪声信号特征提取方法
CN113759208A (zh) * 2021-06-02 2021-12-07 青岛鼎信通讯股份有限公司 一种基于故障指示器的异常波形识别方法
CN117150224A (zh) * 2023-10-30 2023-12-01 宜兴启明星物联技术有限公司 基于物联网的用户行为数据存储分析方法
CN117150224B (zh) * 2023-10-30 2024-01-26 宜兴启明星物联技术有限公司 基于物联网的用户行为数据存储分析方法

Also Published As

Publication number Publication date
CN102760444B (zh) 2014-06-11

Similar Documents

Publication Publication Date Title
CN102760444B (zh) 基于支撑向量机的基带时域音频信号分类方法
CN108600135B (zh) 一种信号调制方式的识别方法
CN106330385B (zh) 一种干扰类型识别方法
CN108231067A (zh) 基于卷积神经网络与随机森林分类的声音场景识别方法
CN102610227A (zh) 声音信号处理设备、声音信号处理方法和程序
CN105261367B (zh) 一种说话人识别方法
Miao et al. Underwater acoustic signal classification based on sparse time–frequency representation and deep learning
WO2021008000A1 (zh) 语音唤醒方法、装置及电子设备、存储介质
CN105393305A (zh) 用于处理声音信号的方法
CN104135327A (zh) 基于支持向量机的频谱感知方法
CN102968990A (zh) 说话人识别方法和***
CN101764786A (zh) 基于聚类算法的mqam信号识别方法
CN106357575A (zh) 一种多参数联合估计的干扰类型识别方法
CN105118511A (zh) 一种雷声识别方法
CN106098079A (zh) 音频信号的信号提取方法与装置
CN111832462A (zh) 一种基于深度神经网络的跳频信号检测与参数估计方法
Kong et al. Radar waveform recognition using Fourier-based synchrosqueezing transform and CNN
Yu et al. Discriminative training for multiple observation likelihood ratio based voice activity detection
CN113472390A (zh) 一种基于深度学习的跳频信号参数估计方法
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及***
Wang et al. Binary neural networks for wireless interference identification
CN111325143A (zh) 一种数据集不均衡条件下的水下目标识别方法
CN105743756B (zh) WiFi***中基于adaboost算法的帧检测方法
Yin et al. Co-channel multi-signal modulation classification based on convolution neural network
Wang et al. A new method of automatic modulation recognition based on dimension reduction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140611

Termination date: 20210425

CF01 Termination of patent right due to non-payment of annual fee