CN110211596A - 一种基于Mel子带谱熵鲸目动物哨声信号检测方法 - Google Patents

一种基于Mel子带谱熵鲸目动物哨声信号检测方法 Download PDF

Info

Publication number
CN110211596A
CN110211596A CN201910455250.7A CN201910455250A CN110211596A CN 110211596 A CN110211596 A CN 110211596A CN 201910455250 A CN201910455250 A CN 201910455250A CN 110211596 A CN110211596 A CN 110211596A
Authority
CN
China
Prior art keywords
mel
signal
frame
whistle
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910455250.7A
Other languages
English (en)
Other versions
CN110211596B (zh
Inventor
乔钢
马天龙
刘凇佐
马璐
聂东虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910455250.7A priority Critical patent/CN110211596B/zh
Publication of CN110211596A publication Critical patent/CN110211596A/zh
Application granted granted Critical
Publication of CN110211596B publication Critical patent/CN110211596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明提供的是一种基于Mel子带谱熵鲸目动物哨声信号检测方法。本发明从谱熵的角度出发,结合Mel滤波器,通过计算Mel子带谱熵来实现海豚哨声信号的检测,并通过时长门限进一步降低虚警概率,提高检测的精度。本发明的方法简单易行,可实现哨声信号自动检测与提取,减少了人为提取的工作量。海豚哨声信号对于仿生伪装水声通信、海豚种群分类识别等研究具有重要的价值,因此,本发明的方法可助力于仿生伪装水声通信、海洋生物学等相关研究。

Description

一种基于Mel子带谱熵鲸目动物哨声信号检测方法
技术领域
本发明涉及的是一种水声通信方法,具体地说是一种动物哨声信号检测方法。
背景技术
海豚哨声信号是海豚进行交流时最主要的信号,对于海豚被动声学检测具有重要意义。但是实际采集到的一段声音信号中,有可能只包含几个哨声信号,且哨声信号出现的位置随机,因此如何检测声音信号中是否存在哨声信号并确定哨声信号位置,对海豚哨声信号的提取与研究十分重要。
公开号为CN104217722B的专利文件中公开了一种海豚哨声信号时频谱轮廓提取方法,该方法通过短时傅里叶变换提取海豚哨声时频谱轮廓曲线,然而该方法是基于已知的海豚哨声信号片段进行的,并未介绍如何从采集到的信号中检测并提取哨声信号片段;公开号为CN107527625A的专利文件中公开了一种基于仿生听觉***中耳蜗模型的海豚哨声信号听觉特征提取方法,该方法基于Gammatone滤波器和Meddis内毛细胞模型,获得海豚哨声信号听觉特征,但是该方法也是基于已知的海豚哨声信号片段进行的,并未介绍海豚哨声信号检测与提取方法;公开号为CN208257816U的专利文件中公开了基于鲸类叫声脉冲时间长度的通信装置,该装置利用鲸类叫声短时能量谱计算鲸类叫声脉冲时间长度,但是该装置主要用于通信,且短时能量谱容易受到噪声的影响而产生虚警,而该装置并未利用时长门限进一步降低虚警概率。
发明内容
本发明的目的在于提供一种检测精度高的基于Mel子带谱熵鲸目动物哨声信号检测方法。
本发明的目的是这样实现的:
步骤1:对采集到的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
步骤2:每第i帧信号表示为si(n),n=1,2,3,...,N,其傅里叶变换结果表示为Xi(k),k=1,2,3,...,N;
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2,k=1,2,3,...,N/2;
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k),k=1,2,3,...,N/2;
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,若HMel(i)<thH,则进入步骤11;
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,令哨声帧标志Iframe加1,即通过比较与哨声时长门限thT所对应的帧数大小,进行进一步判决:若则进行步骤10,否则令i=i+1,重复步骤2-8,判断下一帧信号;
步骤10:若第i帧信号同时满足HMel(i)≥thH这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤12,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,将HMel(i)的值到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
式中,为新门限值,α和β为给定的调节系数,D[Hnoise]是噪声谱熵向量Hnoise的方差,然后重复步骤2-8,判断下一帧信号;
步骤13:判定完所有信号帧后,哨声信号检测结束。
本发明还可以包括:
1.步骤4中的Mel滤波器个数M默认值为24个。
2.步骤6中的偏移系数K根据检测结果进行设定。
3.步骤8中的谱熵门限thH初始值为其中,为噪声信号帧谱熵均值。
4.步骤9中的哨声时长门限thT默认值为50ms。
为实现海豚哨声信号的检测,本发明从谱熵的角度出发,结合Mel滤波器,通过计算Mel子带谱熵来实现海豚哨声信号的检测,并通过时长门限进一步降低虚警概率,提高检测的精度。
本发明的基于Mel子带谱熵鲸目动物哨声信号检测方法,可从长时间的观测信号中检测哨声信号并确定哨声信号位置,进而可以提取出哨声信号。该方法简单易行,可实现哨声信号自动检测与提取,减少了人为提取的工作量。海豚哨声信号对于仿生伪装水声通信、海豚种群分类识别等研究具有重要的价值,因此,本方法可助力于仿生伪装水声通信、海洋生物学等相关研究。
附图说明
图1为基于Mel子带谱熵鲸目动物哨声信号检测原理图。
具体实施方式
下面举例对本发明做更详细的描述。
鲸目动物哨声信号是鲸目动物(海豚、鲸鱼)进行通信交流时的主要信号,其时长从几十毫秒到几秒不等,且频率随时间连续变化,是一种调频信号。不同种类鲸目动物的哨声信号时频特性不同,同种动物不同个体间哨声信号也存在差异,因此哨声信号是鲸目动物被动声学观测的重要参考信号。此外,由于鲸目动物哨声信号频率范围与通信声呐信号十分接近,因此鲸目动物哨声信号也是仿生伪装水声通信中主要的伪装声源。
但是由于实际采集到鲸目动物哨声观测信号中并不是每一时刻都含有哨声,因此需要一个合适的哨声信号检测方法,从观测信号中检测并确定哨声信号位置。检测过程如下:
步骤1:对采集到的可能含鲸目动物哨声的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
由于进行信号采集时,采集到的哨声信号信噪比往往比较低,且包含能量很强的低频噪声,因此在进行哨声信号检测前,应对观测信号进行滤波降噪处理,例如可以用一个高通滤波器消除低频强噪声,然后采用小波降噪方法降低其他频段的背景噪声干扰。
此外,实际采集到的观测信号往往时间长达几十分钟甚至几小时,而哨声信号可能只在某些时间段出现,因此需要对观测信号进行分帧,对每一帧信号进行检测。分帧不仅可以有助于确定哨声信号出现的时间段,也可减少计算复杂度,提高算法性能。
步骤2:若第i帧信号可表示为si(n)(n=1,2,3,...,N),则其傅里叶变换结果可表示为Xi(k)(k=1,2,3,...,N);
分帧后的第i帧信号si(n)为
si(n)=s((i-1)×L+n)×g(n)n=1,2,3,...,N (1)
其中,g(n)为窗函数。第i帧信号si(n)的傅里叶变换结果Xi(k)为:
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2(k=1,2,3,...,N/2);
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k)(k=1,2,3,...,N/2);
Mel频率是一种以美尔(Mel)为单位的感知频率,Mel频率FMel与线性频率f(单位:Hz)的关系为
Fmel=1125ln(1+f/700) (3)
Mel滤波器是一种在Mel频率范围内等带宽的带通滤波器,第m个Mel滤波器的频率响应Hm(k)为
而中心频率fm定义为:
式中,fl为滤波器Hm(k)下限频率,fh为滤波器Hm(k)的上限频率,Fmel的逆函数表示将Mel频率映射回实际频率,
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,即在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
其中,K是偏移系数,需根据检测结果进行人为设定,偏移系数K越大,抗噪声性能越好。
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
其中,wi(m)为第i帧信号第m个Mel谱概率密度pi(m)的权值,计算过程如下:
其中,D[·]表示计算方差,令表示第i帧信号Mel谱概率密度pi(m)的最小值,则的计算过程如下:
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,反之,若HMel(i)<thH,则进入步骤11;
其中,谱熵门限thH初始值需要根据噪声信号谱熵均值来进行设定。通常会选若干帧不含哨声的噪声信号,计算这些噪声帧信号的谱熵求出其谱熵均值然后设置谱熵门限的初始值
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,此时,令哨声帧标志Iframe加1,即通过比较与哨声时长门限thT所对应的帧数大小,进行进一步判决:若则进行步骤10,否则令i=i+1,重复步骤2-8,判断下一帧信号;
由于一些突发噪声,例如较强的脉冲噪声,也会令某一帧信号的Mel子带谱熵HMel(i)变大超过门限,因此当第i帧信号满足HMel(i)≥thH时,不一定是哨声信号导致,需要结合前后若干帧的判决结果进行综合考虑。通过设置一个哨声时长门限thT和一个哨声帧标志Iframe,可以解决这个问题。根据实际经验,哨声时长门限thT默认为50ms,在实际检测时也可根据目标哨声信号时长人为设置为其他值。Iframe用来标记满足HMel(i)≥thH的帧的个数,通过判断Iframe与哨声时长门限thT所对应的帧数大小,确定是否存在哨声。
步骤10:若第i帧信号同时满足HMel(i)≥thH这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
由于当Iframe满足Iframe≥thT×fs/L时,前面的Iframe已经满足了HMel(i)≥thH,因此哨声信号的起始点需要往前计算Iframe帧。
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,此时,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤13,反之,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,需要将HMel(i)的值保存到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
式中,为新门限值,α和β为给定的调节系数,然后重复步骤2-8,判断下一帧信号。
当第i帧信号判定为噪声时,需要对普熵门限thH进行更新,以更好的适应谱熵的变化,提高哨声信号的检测效果。其中,噪声谱熵向量Hnoise(j)(j=1,2,3...,Nnoise)是用于保存噪声谱熵的向量,每当一帧信号判定为不包含哨声时,都需要将该帧信号的谱熵值HMel(i)保存到Hnoise中,使Hnoise向量增加一个元素。而门限更新公式中的α和β则决定谱熵门限thH更新的速度:α越大,门限更新速度越快,β越大,则门限值越大。在进行哨声信号检测时,需根据噪声变化情况和哨声信噪比,对α和β进行设定。
步骤13:判定完所有信号帧后,哨声信号检测结束。
上述一种基于Mel子带谱熵鲸目动物哨声信号检测方法,步骤4中的Mel滤波器个数M默认为24个,也可根据需要人为设置;步骤6中的偏移系数K需根据检测结果进行人为设定,偏移系数K越大,抗噪声性能越好;步骤8中的谱熵门限thH初始值需要根据噪声信号谱熵均值来进行设定,通常设为而所需噪声信号帧可根据需要进行人为设置;步骤9中的哨声时长门限thT默认为50ms,是一个经验值,在实际检测时也可根据目标哨声信号时长进行人为设置;步骤12中的α和β决定了谱熵门限thH更新的速度,需根据检测结果进行人为设定。
本发明所述的鲸目动物哨声信号检测方法,通过对观测信号进行分帧,然后对每一帧信号进行判决,不仅可以有效减少计算复杂度,还可以检测并确定哨声信号位置,有助于下一步哨声信号提取和处理。该方法可为鲸目动物哨声信号研究、仿生伪装水声通信技术以及海洋生物观测提供帮助。

Claims (9)

1.一种基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:
步骤1:对采集到的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
步骤2:每第i帧信号表示为si(n),n=1,2,3,...,N,其傅里叶变换结果表示为Xi(k),k=1,2,3,...,N;
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2,k=1,2,3,...,N/2;
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k),k=1,2,3,...,N/2;
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,若HMel(i)<thH,则进入步骤11;
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,令哨声帧标志Iframe加1,即通过比较与哨声时长门限thT所对应的帧数大小,进行进一步判决:若则进行步骤10,否则令i=i+1,重复步骤2-8,判断下一帧信号;
步骤10:若第i帧信号同时满足HMel(i)≥thH这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤12,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,将HMel(i)的值到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
式中,为新门限值,α和β为给定的调节系数,D[Hnoise]是噪声谱熵向量Hnoise的方差,然后重复步骤2-8,判断下一帧信号;
步骤13:判定完所有信号帧后,哨声信号检测结束。
2.根据权利要求1所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤4中的Mel滤波器个数M默认值为24个。
3.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤6中的偏移系数K根据检测结果进行设定。
4.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤8中的谱熵门限thH初始值为其中,为噪声信号帧谱熵均值。
5.根据权利要求3所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤8中的谱熵门限thH初始值为其中,为噪声信号帧谱熵均值。
6.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
7.根据权利要求3所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
8.根据权利要求4所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
9.根据权利要求5所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
CN201910455250.7A 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法 Active CN110211596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910455250.7A CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910455250.7A CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Publications (2)

Publication Number Publication Date
CN110211596A true CN110211596A (zh) 2019-09-06
CN110211596B CN110211596B (zh) 2021-04-06

Family

ID=67789249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910455250.7A Active CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Country Status (1)

Country Link
CN (1) CN110211596B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414832A (zh) * 2020-03-16 2020-07-14 中国科学院水生生物研究所 一种基于鲸豚类低频水声信号的实时在线识别分类***
CN112669875A (zh) * 2020-12-18 2021-04-16 天津大学 一种基于FSK调制的仿鲸目whistle叫声的伪装通信信号识别方法
CN115050386A (zh) * 2022-05-17 2022-09-13 哈尔滨工程大学 一种中华白海豚哨叫声信号自动检测和提取方法
CN116132234A (zh) * 2023-01-09 2023-05-16 天津大学 利用鲸目动物哨声相位编码的水下隐蔽通信方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090120640A (ko) * 2008-05-20 2009-11-25 성균관대학교산학협력단 음성 신호의 스펙트럴 엔트로피를 이용한 감정 인식 방법및 장치
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090120640A (ko) * 2008-05-20 2009-11-25 성균관대학교산학협력단 음성 신호의 스펙트럴 엔트로피를 이용한 감정 인식 방법및 장치
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BING-FEI WU ET AL.: "《Robust Endpoint Detection Algorithm Based on the Adaptive Band-Partitioning Spectral Entropy in Adverse Environments》", 《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》 *
吴新忠等: "《基于谱熵梅尔积的语音端点检测方法》", 《北京邮电大学学报》 *
孙金涛: "《复杂环境下的海豚whistle信号检测与特征分析》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李乐等: "《一种改进的小波能量熵语音端点检测算法》", 《计算机工程》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414832A (zh) * 2020-03-16 2020-07-14 中国科学院水生生物研究所 一种基于鲸豚类低频水声信号的实时在线识别分类***
CN111414832B (zh) * 2020-03-16 2021-06-25 中国科学院水生生物研究所 一种基于鲸豚类低频水声信号的实时在线识别分类***
CN112669875A (zh) * 2020-12-18 2021-04-16 天津大学 一种基于FSK调制的仿鲸目whistle叫声的伪装通信信号识别方法
CN112669875B (zh) * 2020-12-18 2022-06-21 天津大学 一种基于FSK调制的仿鲸目whistle叫声的伪装通信信号识别方法
CN115050386A (zh) * 2022-05-17 2022-09-13 哈尔滨工程大学 一种中华白海豚哨叫声信号自动检测和提取方法
CN115050386B (zh) * 2022-05-17 2024-05-28 哈尔滨工程大学 一种中华白海豚哨叫声信号自动检测和提取方法
CN116132234A (zh) * 2023-01-09 2023-05-16 天津大学 利用鲸目动物哨声相位编码的水下隐蔽通信方法及装置
CN116132234B (zh) * 2023-01-09 2024-03-12 天津大学 利用鲸目动物哨声相位编码的水下隐蔽通信方法及装置

Also Published As

Publication number Publication date
CN110211596B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN110211596A (zh) 一种基于Mel子带谱熵鲸目动物哨声信号检测方法
CN106486131B (zh) 一种语音去噪的方法及装置
DE112017004548B4 (de) Verfahren und Vorrichtung zur robusten Geräuschschätzung für eine Sprachverbesserung in variablen Geräuschbedingungen
Scheifele et al. Indication of a Lombard vocal response in the St. Lawrence River beluga
US8428945B2 (en) Acoustic signal classification system
CN101593522B (zh) 一种全频域数字助听方法和设备
CN104157295B (zh) 用于检测及抑制瞬态噪声的方法
CN108597505A (zh) 语音识别方法、装置及终端设备
WO2016015461A1 (zh) 异常帧检测方法和装置
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN109243497A (zh) 语音唤醒的控制方法及装置
CN109741759B (zh) 一种面向特定鸟类物种的声学自动检测方法
CN102054480A (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN108630209A (zh) 一种基于特征融合与深度置信网络的海洋生物识别方法
CN106052852A (zh) 一种脉冲声信号的检测方法及装置
CN110189746A (zh) 一种应用于地空通信的话音识别方法
CN106356076B (zh) 基于人工智能的语音活动性检测方法和装置
CN105916090A (zh) 一种基于智能化语音识别技术的助听器***
CN112735468A (zh) 一种基于mfcc的汽车座椅电机异常噪声检测方法
CN116312561A (zh) 一种电力调度***人员声纹识别鉴权降噪和语音增强方法、***及装置
Lopatka et al. An attractive alternative for sperm whale click detection using the wavelet transform in comparison to the Fourier spectrogram
Mehta et al. Robust front-end and back-end processing for feature extraction for Hindi speech recognition
EP1489597A2 (en) Voice detection device
CN115376494B (zh) 一种语音检测方法、装置、设备及介质
Singh et al. A novel algorithm using MFCC and ERB gammatone filters in speech recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant