CN106504762B - 鸟类群落数量估计***及其方法 - Google Patents
鸟类群落数量估计***及其方法 Download PDFInfo
- Publication number
- CN106504762B CN106504762B CN201610969673.7A CN201610969673A CN106504762B CN 106504762 B CN106504762 B CN 106504762B CN 201610969673 A CN201610969673 A CN 201610969673A CN 106504762 B CN106504762 B CN 106504762B
- Authority
- CN
- China
- Prior art keywords
- voice
- processing device
- speech
- bird
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000005540 biological transmission Effects 0.000 claims abstract description 26
- 238000000926 separation method Methods 0.000 claims abstract description 26
- 230000009467 reduction Effects 0.000 claims abstract description 23
- 238000004891 communication Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 241000271566 Aves Species 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 238000009432 framing Methods 0.000 claims description 6
- 238000011084 recovery Methods 0.000 claims description 6
- 230000036039 immunity Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 claims description 4
- 230000005855 radiation Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 241001465754 Metazoa Species 0.000 abstract description 4
- 230000007613 environmental effect Effects 0.000 abstract description 4
- XNCSCQSQSGDGES-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]propyl-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)C(C)CN(CC(O)=O)CC(O)=O XNCSCQSQSGDGES-UHFFFAOYSA-N 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 244000144980 herd Species 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种鸟类群落数量估计***及其方法,涉及鸟类群落保护及语音降噪和分离技术领域。本***包括音频处理装置(10)、数据传输装置(20)、终端数据处理装置(30)和电源(40);音频处理装置(10)、数据传输装置(20)和终端数据处理装置(30)依次连接;电源(40)分别与音频处理装置(10)和数据传输装置(20)连接。本方法是:①语音降噪;②语音分离。本发明适用于动物园、农林部门和野生动物保护部门更方便地观测估计鸟类的数量;还对环保部门对评测某地区环境等级提供重要参考依据。
Description
技术领域
本发明涉及鸟类群落保护及语音降噪和分离技术领域,特别是涉及一种鸟类群落数量估计***及其方法。
背景技术
当前,鸟类群落保护颇受关注,有效的群鸟数量统计方法对于鸟类群落保护至关重要。传统方法多采用标志重捕法来统计动物种群的数量,该方法易对影响动物的正常生命活动产生影响,且统计准确性不足。近年来,用于语音信号处理领域的语音分离估计算法在人声语音识别、降噪方面展现了很好的应用前景。
传统的语音降噪算法有自适应滤波算法、谱减法和维纳滤波法等,利用特征参数进行端点检测,判断语音信号的有话段和无话段,通过无话段估算噪声谱,达到语音增强的目的;语音分离方面,独立分量分析算法(Independent Component Analysis,ICA)包括极大似然估计方法、最大熵方法、最小互信息方法、高阶累积量方法等,利用分离后信号各个分量之间最大独立性来建立对比函数,通过最大或最小化对比函数得到分离矩阵,达到分离源信号的目的。文献指出ICA算法只能用于源信号的个数小于或等于传感器所接收到的混合信号的个数的情况中,不适用于鸟类群落数量的估计。
发明内容
本发明的目的是针对目前观测鸟类活动停留在人工利用观鸟仪的传统方法上,损耗人力而且效率又低的问题,提供一种鸟类群落数量估计***及其方法,从而实现利用对鸟类群落鸟类混合语音的采集和降噪,基于峰值估计的鸟类混合语音分离技术,分离混合语音即可预估鸟类个数。
本发明的设计思路:
由于真实情况中语音的采集存在噪音的干扰,鸟类语音信号可能存在误差。为了提高语音分离的准确性,首先对采集的混合语音进行降噪处理;类比于人类语音分离技术,结合鸟类语音特征,设计一种基于PDTA聚类的DUET语音分离算法;同时考虑到声音衰减,将采用高保真麦克风,增强语音信号。
针对语音分离的需要,首先建立语音信号采集和处理***,实现对鸟类语音采集,A/D转换;其次,设计语音信号处理的传输***,考虑到野外环境的真实性,我们采用无线通信技术,实现远距离数据传输;接下来在PC端进行对数据的预处理、端点检测等操作;预处理包括混叠滤波、模数变换、分帧加窗;端点检测采用抗噪性好的参数谱熵进行端点检测,区别有无话段,估计噪声谱,利用维纳滤波进行降噪;最后,对降噪语音进行语音分离,我们采用一种基于PDTA聚类的DUET语音分离算法,分离语音个数即为估计鸟类数量个数并且恢复源语音信号。
具体地说:
一、鸟类群落数量估计***(简称***)
本***包括音频处理装置、数据传输装置、终端数据处理装置和电源;
其连接关系是:
音频处理装置、数据传输装置和终端数据处理装置依次连接;
电源分别与音频处理装置和数据传输装置连接。
二、鸟类群落数量估计方法
本方法包括语音降噪和语音分离两个部分。
①语音降噪
利用麦克风阵列在野外环境下采集鸟类混合语音Y,对采集的语音进行分帧加窗预处理,提取抗噪性好的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音;
②语音分离
语音分离分为峰值估计和源语音恢复两个阶段:
峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数;
源语音恢复阶段,寻找峰值对应的弧度值,计算出混合矩阵A,即需解Y=AX非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音X。
本发明具有以下优点和积极效果:
①提供了一种基于改进的维纳滤波算法的语音降噪的技术方案
对采集的语音进行分帧加窗预处理,提取抗噪性好的的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音。
②提供了一种组合DUET和PDTA聚类的语音分离算法的技术方案
语音分离分为峰值估计与源语音恢复两个阶段。峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数。源语音恢复阶段,寻找峰值对应的弧度值,可计算出混合矩阵A,即需解y=Ax非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音。
③提供了一种基于语音分离的鸟类群落数目估计的技术方案
摆脱原有人工观察的鸟类群落的方法,利用对混合语音分离,估计源语音个数的方法达到对鸟类数量估计。
④适用于动物园、农林部门和野生动物保护部门更方便的观测估计鸟类的数量;还对环保部门对评测某地区环境等级提供重要参考依据。
附图说明
图1是本***的结构方框图;
图2是本发明的工作原理图;
图3是PC端语音降噪算法流程图;
图4是PC端语音分离算法流程图。
图中:
10—音频处理装置,
11—麦克风阵列,12—放大器,13—音频解码器;
20—数据传输装置,
21—通信接口,22—控制器,23—外部扩展接口,24—射频发射模块,25—放射天线,26—接收天线,27—射频接收模块;
30—终端数据处理装置,
31—通信接口,32—PC端;
40—电源。
具体实施方式
下面结合附图和实施例详细说明:
一、***
1、总体
如图1,本***包括音频处理装置10、数据传输装置20、终端数据处理装置30和电源40;
其连接关系是:
音频处理装置10、数据传输装置20和终端数据处理装置30依次连接;
电源40分别与音频处理装置10和数据传输装置20连接。
其工作机理是:
音频处理装置10受数据传输装置20的管理和控制,为数据传输装置20提供基础数据资料;
数据处理装置20对音频处理装置10进行管理和控制,为终端数据处理装置30提供待处理数据;
终端数据处理装置30处理数据传输装置传送的数据;
音频处理装置10、数据传送装置由电源40供电。
如图2,其***工作流程是:
先是采集鸟类语音信信号;
然后利用射频模块进行语音数据的传输;
最后在PC端对数据进行处理,先对采集的语音利用一种改进的维纳滤波算法降噪;接下来对纯净语音利用一种基于PDTA聚类的DUET语音分离算法分离混合语音,得到源语音个数即为鸟类数量估计个数。
2、功能部件
1)音频处理装置10
音频处理装置10包括依次连接的麦克风阵列11、放大器12和音频解码器13;
(1)麦克风阵列11
麦克风阵列11采用多个高保真型麦克风;
对鸟类语音进行采集,在将采集到的鸟类语音经过放大器12信号放大。
(2)放大器12
放大器12采用TI公司的型号OPA684的放大器;
对采集的语音信号进行放大,将放大信号的语音传送至音频解码器13进行解码。
(3)音频解码器13
音频解码器13采用TI公司生产的音频处理芯片TLV320AIC34;
对音频信号进行解码调制,将采集的信号传送至数据传输装置20。
2)数据传输装置
数据传输装置20包括依次连通的通信接口21、控制器22、外部扩展接口23、射频发射模块24、发射天线25、接收天线26、射频接收模块27。
(1)通信接口21
通信接口21是一种多功能的同步串行接口,具有很强的可编程能力,可以配置为多种同步串口标准,直接与各种器件高速接口;
负责外部音频处理装置10与控制器22间的通信。
(2)控制器22
控制器22采用TI公司的TMS320C6713(主频225MHz)型DSP芯片;
主要负责对音频处理装置10和射频发射模块24进行管理和控制。
(3)外部扩展接口23
外部扩展接口23是一种由控制器22提供的接口;
主要用于连接射频发射模块24,实现控制器22对射频通信的控制和管理。
(4)射频发射模块24
射频放射模块24采用型号为VS-5854的外置天线的无线微波设备,发射功率为28dBm,高接收灵敏度802.11a/n协议,工作频段在5.150-5.850GHz,传输距离可达30公里。
(5)发射天线25
发射天线25采用MIMO双天线模式,V+H极性,天线的增益为28Bi,波瓣角度:V:40度,H:60度。
(6)接收天线(26)
发射天线(26)采用MIMO双天线模式,V+H极性,天线的增益为28Bi,波瓣角度:V:40度,H:60度。
(7)射频接收模块27
射频接收模块27采用型号为VS-5854的外置天线的无线微波设备,工作方式是点对点,点对多点的方式,频段通道自动调整,免除了手动修改的麻烦。
3)终端数据处理装置30
终端数据处理装置30包括前后连接的通信接口31和PC端32;
由PC端32处理采集的数据,基于MATLAB平台处理混合语音,利用相应算法达到语音分离的目的。
(1)通信接口31
通信接口31是一种多功能的同步串行接口,具有很强的可编程能力,可以配置为多种同步串口标准,直接与各种器件高速接口;
负责射频接收模块27与PC端32间的通信。
(2)PC端32
PC端32即电脑,其内嵌有本方法的工作软件;
PC端32将传回来的数据进行处理,估计源语音的个数。
二、方法
1、语音降噪的工作流程
如图3,语音降噪的工作流程如下:
A、***初始化-301;
B、对采集的语音利用谱减法对噪声进行预去除,以提高输入语音信号的信噪比-302;
C、计算前5帧信号的噪声功率谱,作为动态估计的初始值-303;
D、使用子带谱熵对带噪语音信号进行端点检测,并记录下语音信号有声段的起始点与终止点-304;
E、判断该帧信号是否为有声段-305,是则进入步骤G,否则进入步骤F;
F、更新噪声功率谱-306;
G、维纳滤波降噪-307。
2、语音分离的工作流程
如图4,语音分离的工作流程如下:
a、对降噪后的纯净语音进行加窗和分帧预处理-401;
b、傅里叶变化,对语音信号进行稀疏表示-402;
c、归一化使语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行M个区域划分-403;
d、计算每个区域的概率密度-404;
e、利用局部最优解算法求出密度峰值-405;
f、寻找峰值对应的弧度值,可计算出混合矩阵A-406;
g、利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音-407。
Claims (3)
1.一种基于鸟类群落数量估计***的鸟类群落数量估计方法,
所述的鸟类群落数量估计***包括音频处理装置(10)、数据传输装置(20)、终端数据处理装置(30)和电源(40);
音频处理装置(10)、数据传输装置(20)和终端数据处理装置(30)依次连接;
电源(40)分别与音频处理装置(10)和数据传输装置(20)连接;
所述的音频处理装置(10)包括依次连接的麦克风阵列(11)、放大器(12)和音频解码器(13)
所述的数据传输装置(20)包括依次连通的通信接口(21)、控制器(22)、外部扩展接口(23)、射频放射模块(24)、放射天线(25)、接收天线(26)和射频接收模块(27)
其特征在于:
①语音降噪
利用麦克风阵列在野外环境下采集鸟类混合语音Y,对采集的语音进行分帧加窗预处理,提取抗噪性好的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音;
②语音分离
语音分离分为峰值估计和源语音恢复两个阶段:
峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数;
源语音恢复阶段,寻找峰值对应的弧度值,计算出混合矩阵A,即需解Y=AX非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音X。
2.按权利要求1所述的鸟类群落数量估计方法,其特征在于语音降噪的工作流程如下:
A、***初始化(301);
B、对采集的语音利用谱减法对噪声进行预去除,以提高输入语音信号的信噪比(302);
C、计算前5帧信号的噪声功率谱,作为动态估计的初始值(303);
D、使用子带谱熵对带噪语音信号进行端点检测,并记录下语音信号有声段的起始点与终止点(304);
E、判断该帧信号是否为有声段(305),是则进入步骤G,否则进入步骤F;
F、更新噪声功率谱(306);
G、维纳滤波降噪(307)。
3.按权利要求1所述的鸟类群落数量估计方法,其特征在语音分离的工作流程如下:
a、对降噪后的纯净语音进行加窗和分帧预处理(401);
b、傅里叶变化,对语音信号进行稀疏表示(402);
c、归一化使语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行M个区域划分(403);
d、计算每个区域的概率密度(404);
e、利用局部最优解算法求出密度峰值(405);
f、寻找峰值对应的弧度值,可计算出混合矩阵A(406);
g、利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音(407)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610969673.7A CN106504762B (zh) | 2016-11-04 | 2016-11-04 | 鸟类群落数量估计***及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610969673.7A CN106504762B (zh) | 2016-11-04 | 2016-11-04 | 鸟类群落数量估计***及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106504762A CN106504762A (zh) | 2017-03-15 |
CN106504762B true CN106504762B (zh) | 2023-04-14 |
Family
ID=58322033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610969673.7A Active CN106504762B (zh) | 2016-11-04 | 2016-11-04 | 鸟类群落数量估计***及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106504762B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107369451B (zh) * | 2017-07-18 | 2020-12-22 | 北京市计算中心 | 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法 |
CN109671439B (zh) * | 2018-12-19 | 2024-01-19 | 成都大学 | 一种智能化果林鸟害防治设备及其鸟类定位方法 |
CN109741759B (zh) * | 2018-12-21 | 2020-07-31 | 南京理工大学 | 一种面向特定鸟类物种的声学自动检测方法 |
CN111626093B (zh) * | 2020-03-27 | 2023-12-26 | 国网江西省电力有限公司电力科学研究院 | 一种基于鸣声功率谱密度的输电线路相关鸟种识别方法 |
CN112992172B (zh) * | 2021-01-28 | 2023-09-15 | 广州大学 | 一种基于注意力机制的单通道时域鸟鸣声分离方法 |
CN113225400A (zh) * | 2021-05-08 | 2021-08-06 | 南京林业大学 | 一种基于鸣禽鸣唱的鸟类种群密度监测***及方法 |
CN113303281B (zh) | 2021-06-01 | 2022-04-01 | 广东省科学院动物研究所 | 一种具有景观丰容作用的绿海龟人工繁育喂食装置及其方法 |
CN117809662B (zh) * | 2024-02-28 | 2024-05-10 | 江西师范大学 | 一种基于鸟类特征识别的栖息地环境调节方法和*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405441A (zh) * | 2015-10-20 | 2016-03-16 | 北京云知声信息技术有限公司 | 一种语音信息的反馈方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4496378B2 (ja) * | 2003-09-05 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 定常雑音下における音声区間検出に基づく目的音声の復元方法 |
CN101053161B (zh) * | 2004-11-02 | 2010-09-08 | 松下电器产业株式会社 | 噪声抑制装置 |
CN102065272A (zh) * | 2009-11-13 | 2011-05-18 | 中国科学院遥感应用研究所 | 基于声像一体化野生鸟类识别技术的远程无线监测*** |
CN202058443U (zh) * | 2011-05-09 | 2011-11-30 | 杨捷 | 一种鸟类语音识别*** |
CN202680336U (zh) * | 2012-05-22 | 2013-01-23 | 天津市畅悦电子科技有限公司 | 一种用于驱鸟兽的报警装置 |
US9460732B2 (en) * | 2013-02-13 | 2016-10-04 | Analog Devices, Inc. | Signal source separation |
CN104658538A (zh) * | 2013-11-18 | 2015-05-27 | 中国计量学院 | 一种基于鸟鸣声的移动式鸟类识别方法 |
-
2016
- 2016-11-04 CN CN201610969673.7A patent/CN106504762B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405441A (zh) * | 2015-10-20 | 2016-03-16 | 北京云知声信息技术有限公司 | 一种语音信息的反馈方法及装置 |
Non-Patent Citations (2)
Title |
---|
谭北海 ; 谢胜利 ; .基于源信号数目估计的欠定盲分离.电子与信息学报.2008,第30卷(第04期),第863-867页. * |
颜鑫 ; 李应 ; .利用抗噪幂归一化倒谱系数的鸟类声音识别.电子学报.2013,(第02期),第295-300页. * |
Also Published As
Publication number | Publication date |
---|---|
CN106504762A (zh) | 2017-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106504762B (zh) | 鸟类群落数量估计***及其方法 | |
CN203721183U (zh) | 一种语音唤醒装置 | |
CN203721182U (zh) | 一种车载语音处理*** | |
CN110992932B (zh) | 一种自学习的语音控制方法、***及存储介质 | |
CN105122843A (zh) | 向用户提供听力辅助的方法和*** | |
CN105376389B (zh) | 一种语音唤醒方法及设备 | |
AU2010204470A1 (en) | Automatic sound recognition based on binary time frequency units | |
CN105741849A (zh) | 数字助听器中融合相位估计与人耳听觉特性的语音增强方法 | |
CN205987367U (zh) | 一种基于分布式麦克风的拾音装置 | |
CN207603881U (zh) | 一种智能语音无线音箱 | |
CN111901737A (zh) | 一种基于智能终端的助听器参数自适应方法 | |
CN106328154B (zh) | 一种前端音频处理*** | |
CN111976924A (zh) | 一种用于潜水全面罩的实时信息交流装置 | |
CN206237414U (zh) | 语音发射装置、语音接收装置及无人机语音广播*** | |
CN107592600B (zh) | 一种基于分布式麦克风的拾音筛选方法及拾音装置 | |
CN106603669A (zh) | 分布式主从设备的控制方法及*** | |
CN105405447B (zh) | 一种送话呼吸噪声屏蔽方法 | |
CN102307271A (zh) | 网络数字一体对讲***及其传输方法 | |
CN112349291A (zh) | 基于ai降噪模型的扩声***及方法 | |
CN203165457U (zh) | 一种可用于强噪声环境的语音采集装置 | |
CN204244283U (zh) | 具有回音消除功能的对讲***及电梯物联网*** | |
CN208538474U (zh) | 语音识别*** | |
CN105979461A (zh) | 基于智能终端的助听耳机及其*** | |
CN207651168U (zh) | 一种超清晰语音传输和识别模块 | |
CN108735234A (zh) | 一种采用语音信息监测健康状况的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |