CN111540368A - 一种稳健的鸟声提取方法、装置及计算机可读存储介质 - Google Patents

一种稳健的鸟声提取方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111540368A
CN111540368A CN202010379824.XA CN202010379824A CN111540368A CN 111540368 A CN111540368 A CN 111540368A CN 202010379824 A CN202010379824 A CN 202010379824A CN 111540368 A CN111540368 A CN 111540368A
Authority
CN
China
Prior art keywords
sub
noise
signal
sound
power spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010379824.XA
Other languages
English (en)
Other versions
CN111540368B (zh
Inventor
张承云
郑泽鸿
陈庆春
凌嘉乐
肖波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202010379824.XA priority Critical patent/CN111540368B/zh
Publication of CN111540368A publication Critical patent/CN111540368A/zh
Application granted granted Critical
Publication of CN111540368B publication Critical patent/CN111540368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明公开了一种稳健的鸟声提取方法,包括:对音频信号进行预处理,得到带噪信号功率谱,通过最小值搜索法得到噪声功率谱估计;在预设的HBank滤波器组的基础上,将带噪信号功率谱和噪声功率谱估计转换到H域内进行分析,进而获得后验信噪比;根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比先进行平滑处理后求出其均值,进而得到有声帧的先验概率;再由设定的阈值判断当前帧是否为有声帧,并将连续的有声帧信号集合得到有声片段;通过线性预测法得到共振峰频率和共振峰宽度,进而判别有声段是否存在鸟声。本发明能够准确提取有声段,并自动剔除杂音,在低信噪比情况下也有良好效果,算法复杂度较低且实时性强。

Description

一种稳健的鸟声提取方法、装置及计算机可读存储介质
技术领域
本发明涉及生态监测及声信号识别技术领域,特别是涉及一种稳健的鸟声提取方法、装置及计算机可读存储介质。
背景技术
目前,中国作为拥有鸟类品种数目最多的国家,一直高度重视鸟类环境保护问题。通过鸟鸣声的研究,既可辨别物种,又能分析生物行为,在野生动物监测、农林驱赶害鸟、航空鸟撞等方面具有广阔的发展前景。鸟声研究的首要任务是将潜在鸟声片段从连续采集音频中分离出来。早期的鸟声提取工作都是采用人工检测的方法,由鸟声专家经过反复听音和谱图分析后,对存在鸟声的片段进行提取和标记。虽然人工提取能准确得到鸟声片段,但检测效率非常低,不利于处理海量的录音数据。
随着话音活动检测技术的成熟发展,出现了一些自动提取鸟声片段的方法,但仍存在很多问题,包括提取性能、复杂度、普适性、实时性等。
在现有技术下的提取鸟声方法中,存在着以下的缺点:
基于能量检测的提取方法运算量低,但在低信噪比情况下无法正确判决;基于先验概率的提取方法运算量适中,检测性能较好,但对于突变噪声仍会存在误判现象;基于谱图分析的提取方法能较完整地得到含有鸟声的片段,但需要连续多帧信号才能构建谱图信息,运算量偏大,仅适合离线处理;基于高斯混合模型的提取方法在低信噪比情况下具有稳健的检测性能,算法复杂度适中,但需要不断调节模型参数,对于突变噪声会存在误判现象;基于深度学习的提取算法在样本量充足的情况下效果极佳,但算法复杂度高,前期需要训练大量的样本数据,过拟合和欠拟合会影响分类结果。
发明内容
本发明的目的是:基于一种稳健的鸟声提取方法、装置及计算机可读存储介质,能够准确提取有声段,并自动剔除一些人声和其它动物声,在低信噪比情况下也能较准确地捡拾鸟声信号,算法复杂度较低且实时性强,可应用于鸟声采集***。
为了实现上述目的,本发明的提供了一种稳健的鸟声提取方法,适用于在计算机设备中执行,至少包括如下步骤:
对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;
根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;
当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;
根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
进一步地,根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类,并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声,若是,则对所述有鸟声的片段进行存储,包括:
所述共振峰频率大于1.5kHz时,所述子片判定为鸟声子片;
所述共振峰频率小于400Hz时,所述子片判定为噪声子片;
所述共振峰频率介于400Hz和1.5kHz之间,所述子片需要根据共振峰宽度进行分析;若所述共振峰宽度小于500Hz,所述子片判定为鸟声子片,反之判定为噪声子片;
统计所述有声段中的鸟声子片数量和噪声子片数量,若所述鸟声子片数量大于所述噪声子片数量,则所述有声段含有鸟声,并对所述有鸟声的片段进行存储。
进一步地,对所述HBank滤波器组进行参数设置:以频率FC为中心建立滤波器,在其左侧建立ML个滤波器,右侧建立MH个滤波器,共(ML+1+MH)个滤波器,所覆盖的线性频率范围为FL~FH
进一步地,所述HBank滤波器组的函数表达式为:
Figure BDA0002481329450000031
所述HBank滤波器的中心频率表达式为:
Figure BDA0002481329450000041
进一步地,所述平滑先验信噪比估计的表达式为:
ζH(λ,b)=αζ×ζH(λ-1,b)+(1-αζ)×ξH(λ,b)。
进一步地,所述有声帧的先验概率的计算公式为:
Figure BDA0002481329450000042
进一步地,对所述音频信号进行预处理,具体的:对所述音频信号进行子带分离、帧移、加窗和傅里叶变换,得到带噪信号功率谱。
本发明一个实施例还提供一种稳健的鸟声提取装置,包括:
预处理模块,用于对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
HBank滤波器组模块,用于对带噪信号功率谱和噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计;其中,所述HBank滤波器组的相关域为H域;
有声帧处理模块,用于根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计,并对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
鸟声片段筛选模块,用于:在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
进一步地,所述鸟声片段筛选模块,具体用于:在有声段期间,根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类,并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声,若是,则对所述有鸟声的片段进行存储,包括:
所述共振峰频率大于1.5kHz时,所述子片判定为鸟声子片;
所述共振峰频率小于400Hz时,所述子片判定为噪声子片;
所述共振峰频率介于400Hz和1.5kHz之间,所述子片需要根据共振峰宽度进行分析;若所述共振峰宽度小于500Hz,所述子片判定为鸟声子片,反之判定为噪声子片;
统计所述有声段中的鸟声子片数量和噪声子片数量,若所述鸟声子片数量大于噪声子片数量,则所述有声段含有鸟声,并对所述有鸟声的片段进行存储。
本发明的一个实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7任一项所述的一种稳健的鸟声提取装置。
本发明实施例一种稳健的鸟声提取方法、装置及计算机可读存储介质与现有技术相比,其有益效果在于:
本发明实施例提供的一种稳健的鸟声提取方法、装置及计算机可读存储介质,所述方法包括:对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。本发明能够准确提取有声段,并自动剔除一些人声和其它动物声,在低信噪比情况下也有良好效果,算法复杂度较低且实时性强,可应用于鸟声采集***。
附图说明
图1为本发明第一实施例提供的一种稳健的鸟声提取方法的流程示意图;
图2为本发明第一实施例提供的一种稳健的鸟声提取方法的详细流程示意图;
图3为本发明第一实施例提供的一种稳健的鸟声提取方法的中HBank滤波器的频域分布示意图;
图4为本发明第二实施例提供的一种稳健的鸟声提取装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一个实施例:
请参阅图1-3。
如图1所示,本发明实施例优选实施例的一种稳健的鸟声提取方法,适于在计算机设备中执行,至少包括如下步骤:
S101、对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
S102、将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;
S103、根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;
S104、根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
S105、在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;
S106、根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
对于步骤S101,对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计,具体为;
通过传声器对一定范围内的声音信号进行采集,32kHz采样率,16位量化精度,每帧信号时长为10ms,采样点数为320,记为yin(λ),其中λ为帧编号。
由于大部分鸟类鸣叫声的能量集中在8kHz以下,高频子带没有过多信息用于鸟声和噪声的辨别,通过正交镜像滤波器对信号yin(λ)进行子带分离,得到低频子带yl(λ)和高频子带yh(λ)。后续步骤只对低频子带yl(λ)进行分析即可,其采样频率FS=16000,采样点数Nl=160。
将低频子带的当前帧yl(λ,n)与上一帧y(λ-1,n),进行帧叠得到y(λ,n),见(1)式,其中NF为帧叠后的总长度,通常为2的整数次方,NF的默认值为256;n为采样点编号,n=0,1,…,NF-1。
Figure BDA0002481329450000081
采用(2)式的混合平顶汉宁窗函数w(n),对信号y(λ,n)加窗后执行NF点傅里叶变换,取其模值得到带噪信号幅度谱Y(λ,k),见(3)式,其中k为频点编号,k=0,1,…,NF-1。
Figure BDA0002481329450000091
Figure BDA0002481329450000092
由于傅里叶变换的对称性,只对频谱的前N个频点进行分析,其中N=NF/2+1,即N的默认值为129。
对带噪信号功率谱Y2(λ,k)进行帧内平滑得到S'(λ,k),见(4)式,其中W为归一化汉宁窗函数,窗长度为(2×NW+1),1≤NW≤5,NW的默认值为1,即W=[0.25,0.5,0.25]。
Figure BDA0002481329450000093
再对S'(λ,k)进行帧间平滑得到S(λ,k),见(5)式,其中αS为帧间平滑因子,0<αS<1,αS的默认值为0.8。
S(λ,k)=αS×S(λ-1,k)+(1-αS)×S′(λ,k)k=0,1,…,N-1 (5)
采用Rainer Martin提出的最小值搜索法,在得到平滑功率谱密度S(λ,k)的R个连续估计之后更新最小值Smin(λ,k),见(6)式,其中min{·}为最小值运算符。
Smin(λ,k)=min{S(λ′,k)|(λ′=(λ-R+1),…,λ)} (6)
根据(7)式平滑更新得到噪声功率谱估计D2(λ,k),其中[αm·Smin(λ,k)]为噪声判决阈值,2<αm<8,αm的默认值为5。αD为权重因子,αD=max{0.03,1/(λ+1)},随着帧数的增加,噪声功率谱D2(λ,k)的变化逐渐稳定。
Figure BDA0002481329450000101
对于步骤S102,所述预设的HBank滤波器组,具体预设过程如下:
针对实际鸟声的能量谱分布,建立如图3所示频域分布的HBank滤波器组,其相关域简称为H域,以频率FC为中心建立滤波器,在其左侧建立ML个滤波器,右侧建立MH个滤波器,共(ML+1+MH)个滤波器,所覆盖的线性频率范围为FL~FH。上述参数需要事先进行设定,对于无特定鸟类的声音采集,要求200≤FL<FC<FH≤8000,2<ML<12,2<MH<12,一般设置为FC=3500、FL=200、FH=8000、ML=8、MH=5;而对于特定鸟类的声音采集,则根据该鸟声的实际频谱分布规律调整参数,在复杂的噪声环境中具有更好的捡拾效果。滤波器的编号b与中心频率fC(b)的关系如(8)式所示,其中s用于调节相邻滤波器的离散程度,0.7<s<1.5,s的默认值为1.2,当s>1时,滤波器向中心频率靠拢,当s<1时,滤波器向两侧靠拢。
Figure BDA0002481329450000102
在HBank滤波器组中,滤波器b的上限频率fH(b)对应滤波器b+1的中心频率fC(b+1),见(9)式;滤波器b的下限频率fL(b)对应滤波器b-1的中心频率fC(b-1),见(10)式。
Figure BDA0002481329450000103
Figure BDA0002481329450000104
将滤波器b的下限频率fL(b)、中心频率fC(b)和上限频率fH(b)分别映射到相应的频点,得到kL(b)、kC(b)和kH(b),见(11)式,其中
Figure BDA0002481329450000105
为向上取整。
Figure BDA0002481329450000111
由于HBank滤波器呈现三角形,并且kC(b)=1,kL(b)=kH(b)=0,得到滤波器组的表达式H(b,k),见(12)式。
Figure BDA0002481329450000112
对于步骤S102,将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域,具体为:
将带噪信号功率谱Y2(λ,k)和噪声功率谱估计D2(λ,k)分别通过滤波器函数H(b,k)得到
Figure BDA0002481329450000113
Figure BDA0002481329450000114
见(13)式和(14)式。
Figure BDA0002481329450000115
Figure BDA0002481329450000116
在H域中,由
Figure BDA0002481329450000117
Figure BDA0002481329450000118
得到后验信噪比γH(λ,b),见(15)式。
Figure BDA0002481329450000119
对于步骤S103,根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;具体为:
在H域中,通过引导判决法得到H域的先验信噪比估计ξH(λ,b),见(16)式。
Figure BDA0002481329450000121
其中,
Figure BDA0002481329450000122
为上一帧纯净功率谱在H域中的估计,其幅度谱估计由(18)式得到。αH(λ,b)为权重调节因子,由(17)式得到。
Figure BDA0002481329450000123
其中,αh为一个常数,0<αh<1,αh的默认值为0.1。当瞬时信噪比越大,则增加当前信噪比估值的权重αH(λ,b),使ξH(λ,b)的估计更准确。
根据最小均方误差估计准则,得到纯净幅度谱的u次方估计器XH(λ,b),见(18)式。
Figure BDA0002481329450000124
其中,u为幅度谱估计的幂指数,0.1≤u≤2,u的默认值为0.5;Γ(·)为伽玛函数,计算式见(19)式;Φ(·)为合流超几何函数,计算式见(20)式。这两个函数的运算复杂度较高,在实际工程应用中可用近似函数简化运算。
Figure BDA0002481329450000125
Figure BDA0002481329450000126
对先验信噪比ξH(λ,b)进行帧间平滑得到平滑先验信噪比ζH(λ,b),见(21)式。其中αζ为帧间平滑因子,0<αζ<1,αζ的默认值为0.7。
ζH(λ,b)=αζ×ζH(λ-1,b)+(1-αζ)×ξH(λ,b) (21)
对于步骤S104,根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段,具体为:
求平滑先验信噪比ζH(λ,b)的均值并代入(22)式得到有声帧的先验概率pH(λ)。
Figure BDA0002481329450000131
当概率值pH(λ)大于设定阈值PH时判定为有声帧,反之判定为噪声帧。其中,阈值PH需要通过实验调节至最佳效果,0.2≤PH≤0.8,PH的默认值为0.5。对于连续r帧有声帧对应的输入yin(λ)集合得到有声段信号,记为V={yin(λ-r+1),yin(λ-r+2),…,yin(λ)}。
对于步骤S105,在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;具体为:
由于步骤S104的判决只是简单地将有声段和噪声段进行分离,并没有分析有声片段是否存在鸟声,还需要根据声音片段的共振峰信息做进一步筛选。采用线性预测法获取声音片段的共振峰信息,但对于持续时间较长(大于1秒)的声音片段,在计算线性预测系数时运算量较大,不利于实时处理。而鸟声在少量的采样点(6帧数据)中也能构建出共振峰,并且与整个鸟声片段的共振峰有一定相似性。通过切片的方法,降低预测系数的计算时间,在每帧进行鸟声检测的同时,计算对应子片的共振峰频率和共振峰宽度。
在步骤S104的判决过程中,若判定为有声帧,则将当前帧的低频子带信号yl(λ)与前续5帧进行合并,得到子片v(λ)={yl(λ-5),yl(λ-4),…,yl(λ)},子片长度为6×Nl=960,一个完整的有声片段V对应r个子片。为了便于表述,后续步骤省略帧编号λ。
对子片v进行预加重,见(23)式,提升声音信号的高频分量。其中αv为预加重系数,0.9<αv<1,αv的默认值为0.99,n'为有声段序列的采样点编号。
v′(n′)=v(n′)-αv·v(n′-1) (23)
通过p阶的线性预测模型对预加重子片v'进行简化,见(24)式,其中a1,a2,…,ap为线性预测系数,e(n')为线性预测误差。
Figure BDA0002481329450000141
根据(25)式,通过NT点的傅里叶变换快速求得线性预测模型的功率谱幅值响应T(k'),即有声段信号的频谱包络曲线。其中NT为傅里叶变换点数,通常为2的整数次方,NT的默认值为256。
Figure BDA0002481329450000142
对线性预测模型的功率谱幅值响应T(k')进行归一化得到T'(k'),见(26)式,其中max{·}为最大值运算符。
Figure BDA0002481329450000143
寻找归一化的功率谱幅值响应T'(k')中的最大值对应的频点kT,见(27)式,并通过(28)式转换得到共振峰频率值fT
Figure BDA0002481329450000144
Figure BDA0002481329450000145
在归一化的功率谱幅值响应T'(k')中,已知T'(kT)=1,以频点kT为中心,向左搜索频点kTL使其满足T'(kTL-1)≤0.2,向右搜索频点kTH使其满足T'(kTH+1)≤0.2,将频点kTL和频点kTH通过(29)式分别得到共振峰下限频率fTL和共振峰上限频率fTH,二者的差值即为共振峰宽度ΔfT,见(30)式。
Figure BDA0002481329450000146
ΔfT=fTH-fTL (30)
对于步骤S106,根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储,具体为:
设置分类计数器Cb和Cn,分别记录鸟声子片数量和噪声子片数量,在有声段的起始帧处,两个计数器值清零并开始计数,直到有声段的结束时计数停止。当子片v的共振峰频率fT大于1.5kHz时,判定为鸟声子片,鸟声子片计数器Cb加一;当fT小于400Hz时,判定为噪声子片,噪声子片计数器Cn加一。而若fT介于400Hz和1.5kHz之间,则需要结合共振峰宽度ΔfT进行判断。当共振峰宽度ΔfT小于500Hz时,判定为鸟声子片,鸟声子片计数器Cb加一;反之判定为噪声子片,噪声子片计数器Cn加一。
在当前的有声段结束时,总共获得r个子片的分类结果,此时计数器Cb+Cn=r。若鸟声子片数量Cb大于噪声子片数量Cn,则有声段V视为含有鸟声的片段,并加以保存,反之则该片段不含有鸟声信息,舍弃。
本发明实施例提供的一种稳健的鸟声提取方法,所述方法包括:对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计,并对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。本发明能够准确提取有声段,并自动剔除一些人声和其它动物声,在低信噪比情况下也有良好效果,算法复杂度较低且实时性强,可应用于鸟声采集***。
本发明第二实施例:
请参阅图4。
如图4所示,本实施例还提供一种稳健的鸟声提取装置,包括:
预处理模块201,用于对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
HBank滤波器组模块202,用于对带噪信号功率谱和噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计;其中,所述HBank滤波器组的相关域为H域;
有声帧处理模块203,用于根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计,并对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
鸟声片段筛选模块204,用于:在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
对于鸟声片段筛选模块204,具体用于:根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类,并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声,若是,则对所述有鸟声的片段进行存储,包括:
所述共振峰频率大于1.5kHz时,所述子片判定为鸟声子片;
所述共振峰频率小于400Hz时,所述子片判定为噪声子片;
所述共振峰频率介于400Hz和1.5kHz之间,所述子片需要根据共振峰宽度进行分析;若所述共振峰宽度小于500Hz,所述子片判定为鸟声子片,反之判定为噪声子片;
统计所述有声段中的鸟声子片数量和噪声子片数量,若所述鸟声子片数量大于所述噪声子片数量,则所述有声段含有鸟声,并对所述有鸟声的片段进行存储。
本发明实施例提供的一种稳健的鸟声提取装置,包括:对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计,并对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,并获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。本发明能够准确提取有声段,并自动剔除一些人声和其它动物声,在低信噪比情况下也有良好效果,算法复杂度较低且实时性强,可应用于鸟声采集***。
本发明的一个实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述的一种稳健的鸟声提取方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

Claims (10)

1.一种稳健的鸟声提取方法,其特征在于,包括:
对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
将所述带噪信号功率谱和所述噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计,并根据所述H域内带噪信号功率谱和所述H域内噪声功率谱估计,获得后验信噪比;其中,所述HBank滤波器组的相关域为H域;
根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计;对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到所述子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,继而获取到所述子片的共振峰频率和共振峰宽度;
根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
2.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类,并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声,若是,则对所述有鸟声的片段进行存储,包括:
所述共振峰频率大于1.5kHz时,所述子片判定为鸟声子片;
所述共振峰频率小于400Hz时,所述子片判定为噪声子片;
所述共振峰频率介于400Hz和1.5kHz之间,所述子片需要根据共振峰宽度进行分析;若所述共振峰宽度小于500Hz,所述子片判定为鸟声子片,反之判定为噪声子片;
统计所述有声段中的鸟声子片数量和噪声子片数量,若所述鸟声子片数量大于所述噪声子片数量,则所述有声段含有鸟声,并对所述有鸟声的片段进行存储。
3.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,对所述HBank滤波器组进行参数设置:以频率FC为中心建立滤波器,在其左侧建立ML个滤波器,右侧建立MH个滤波器,共(ML+1+MH)个滤波器,所覆盖的线性频率范围为FL~FH
4.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,所述HBank滤波器组的函数表达式为:
Figure FDA0002481329440000021
所述HBank滤波器的中心频率表达式为:
Figure FDA0002481329440000031
5.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,所述平滑先验信噪比的函数表达式为:
ζH(λ,b)=αζ×ζH(λ-1,b)+(1-αζ)×ξH(λ,b)。
6.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,所述有声帧的先验概率的计算公式为:
Figure FDA0002481329440000032
7.根据权利要求1所述的一种稳健的鸟声提取方法,其特征在于,对所述音频信号进行预处理,具体的:
对所述音频信号进行子带分离、帧移、加窗和傅里叶变换,得到带噪信号功率谱。
8.一种稳健的鸟声提取装置,其特征在于,包括:
预处理模块,用于对采集到的目标范围内的音频信号进行预处理,得到带噪信号功率谱,并对所述带噪信号功率谱进行平滑处理,通过最小值搜索法得到噪声功率谱估计;
HBank滤波器组模块,用于对带噪信号功率谱和噪声功率谱估计分别输入至预设的HBank滤波器组,得到H域内带噪信号功率谱和H域内噪声功率谱估计;其中,所述HBank滤波器组的相关域为H域;
有声帧处理模块,用于根据所述后验信噪比以及引导判决法,得到H域的先验信噪比估计,并对所述先验信噪比进行平滑处理,得到平滑先验信噪比估计;根据所述平滑先验信噪比的均值,得到有声帧的先验概率;当所述概率值大于设定阈值时,当前帧判定为有声帧,并将连续的有声帧信号集合得到有声片段;
鸟声片段筛选模块,用于:在所述有声段期间,将当前帧与前续5帧信号合并为一个子片,计算子片的线性预测系数;对所述线性预测系数进行傅里叶变换,得到子片的线性预测模型的功率谱幅值响应;对所述功率谱幅值响应进行归一化处理,寻找谱峰对应的频点,获取子片的共振峰频率和共振峰宽度;根据所述共振峰频率和所述共振峰宽度,对每个子片进行鸟声或噪声的分类,统计所述有声段中鸟声子片和噪声子片的数量;通过比较所述鸟声子片数量和所述噪声子片数量,判断所述有声段中是否存在鸟声,若是,则对所述有鸟声的片段进行存储。
9.根据权利要求8所述的一种稳健的鸟声提取装置,其特征在于,所述鸟声片段筛选模块,用于:根据所述共振峰频率和共振峰宽度对每个子片进行鸟声或噪声分类,并通过比较所述有声段中鸟声子片数量和噪声子片数量判断是否存在鸟声,若是,则对所述有鸟声的片段进行存储,包括:
所述共振峰频率大于1.5kHz时,所述子片判定为鸟声子片;
所述共振峰频率小于400Hz时,所述子片判定为噪声子片;
所述共振峰频率介于400Hz和1.5kHz之间,所述子片需要根据共振峰宽度进行分析;若所述共振峰宽度小于500Hz,所述子片判定为鸟声子片,反之判定为噪声子片;
统计所述有声段中的鸟声子片数量和噪声子片数量,若所述鸟声子片数量大于噪声子片数量,则所述有声段含有鸟声,并对所述有鸟声的片段进行存储。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7任一项所述的一种稳健的鸟声提取方法。
CN202010379824.XA 2020-05-07 2020-05-07 一种稳健的鸟声提取方法、装置及计算机可读存储介质 Active CN111540368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010379824.XA CN111540368B (zh) 2020-05-07 2020-05-07 一种稳健的鸟声提取方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010379824.XA CN111540368B (zh) 2020-05-07 2020-05-07 一种稳健的鸟声提取方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111540368A true CN111540368A (zh) 2020-08-14
CN111540368B CN111540368B (zh) 2023-03-14

Family

ID=71977496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010379824.XA Active CN111540368B (zh) 2020-05-07 2020-05-07 一种稳健的鸟声提取方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111540368B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908344A (zh) * 2021-01-22 2021-06-04 广州大学 一种鸟鸣声智能识别方法、装置、设备和介质
CN113314127A (zh) * 2021-04-23 2021-08-27 广州大学 基于空间方位的鸟鸣识别方法、***、计算机设备与介质
CN113486964A (zh) * 2021-07-13 2021-10-08 盛景智能科技(嘉兴)有限公司 语音活动检测方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060150920A1 (en) * 2005-01-11 2006-07-13 Patton Charles M Method and apparatus for the automatic identification of birds by their vocalizations
CN102708860A (zh) * 2012-06-27 2012-10-03 昆明信诺莱伯科技有限公司 一种基于声信号识别鸟类种类的判断标准建立方法
WO2016176887A1 (zh) * 2015-05-06 2016-11-10 福州大学 基于声谱图双特征的动物声音识别方法
CN108694953A (zh) * 2017-04-07 2018-10-23 南京理工大学 一种基于Mel子带参数化特征的鸟鸣自动识别方法
CN110047519A (zh) * 2019-04-16 2019-07-23 广州大学 一种语音端点检测方法、装置及设备
CN110246504A (zh) * 2019-05-20 2019-09-17 平安科技(深圳)有限公司 鸟类声音识别方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060150920A1 (en) * 2005-01-11 2006-07-13 Patton Charles M Method and apparatus for the automatic identification of birds by their vocalizations
CN102708860A (zh) * 2012-06-27 2012-10-03 昆明信诺莱伯科技有限公司 一种基于声信号识别鸟类种类的判断标准建立方法
WO2016176887A1 (zh) * 2015-05-06 2016-11-10 福州大学 基于声谱图双特征的动物声音识别方法
CN108694953A (zh) * 2017-04-07 2018-10-23 南京理工大学 一种基于Mel子带参数化特征的鸟鸣自动识别方法
CN110047519A (zh) * 2019-04-16 2019-07-23 广州大学 一种语音端点检测方法、装置及设备
CN110246504A (zh) * 2019-05-20 2019-09-17 平安科技(深圳)有限公司 鸟类声音识别方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘钊等: "随机森林和大规模声学特征的噪声环境鸟声识别仿真", 《***仿真技术》 *
徐淑正等: "基于MFCC和时频图等多种特征的综合鸟声识别分类器设计", 《实验室研究与探索》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908344A (zh) * 2021-01-22 2021-06-04 广州大学 一种鸟鸣声智能识别方法、装置、设备和介质
CN112908344B (zh) * 2021-01-22 2023-08-08 广州大学 一种鸟鸣声智能识别方法、装置、设备和介质
CN113314127A (zh) * 2021-04-23 2021-08-27 广州大学 基于空间方位的鸟鸣识别方法、***、计算机设备与介质
CN113314127B (zh) * 2021-04-23 2023-10-10 广州大学 基于空间方位的鸟鸣识别方法、***、计算机设备与介质
CN113486964A (zh) * 2021-07-13 2021-10-08 盛景智能科技(嘉兴)有限公司 语音活动检测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN111540368B (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
CN106935248B (zh) 一种语音相似度检测方法及装置
CN111540368B (zh) 一种稳健的鸟声提取方法、装置及计算机可读存储介质
US7756700B2 (en) Perceptual harmonic cepstral coefficients as the front-end for speech recognition
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
CN108447495B (zh) 一种基于综合特征集的深度学习语音增强方法
US9364669B2 (en) Automated method of classifying and suppressing noise in hearing devices
CN109034046B (zh) 一种基于声学检测的电能表内异物自动识别方法
CN102930870B (zh) 利用抗噪幂归一化倒谱系数的鸟类声音识别方法
CN103646649A (zh) 一种高效的语音检测方法
WO2014153800A1 (zh) 语音识别***
CN103280220A (zh) 一种实时的婴儿啼哭声识别方法
CN108305639B (zh) 语音情感识别方法、计算机可读存储介质、终端
CN108682432B (zh) 语音情感识别装置
CN112397074A (zh) 基于mfcc和向量元学习的声纹识别方法
Couvreur et al. Automatic noise recognition in urban environments based on artificial neural networks and hidden markov models
Katsir et al. Evaluation of a speech bandwidth extension algorithm based on vocal tract shape estimation
Kaminski et al. Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models
CN111755025B (zh) 一种基于音频特征的状态检测方法、装置及设备
KR101671305B1 (ko) 입력 신호의 특징 파라미터 추출 장치 및 그를 이용한 화자 인식 장치
Pham et al. Using artificial neural network for robust voice activity detection under adverse conditions
CN113744725B (zh) 一种语音端点检测模型的训练方法及语音降噪方法
CN107993666A (zh) 语音识别方法、装置、计算机设备及可读存储介质
CN115331678A (zh) 利用Mel频率倒谱系数的广义回归神经网络声信号识别方法
JP4537821B2 (ja) オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体
CN111968673A (zh) 一种音频事件检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant