CN106504762B - 鸟类群落数量估计***及其方法 - Google Patents

鸟类群落数量估计***及其方法 Download PDF

Info

Publication number
CN106504762B
CN106504762B CN201610969673.7A CN201610969673A CN106504762B CN 106504762 B CN106504762 B CN 106504762B CN 201610969673 A CN201610969673 A CN 201610969673A CN 106504762 B CN106504762 B CN 106504762B
Authority
CN
China
Prior art keywords
voice
processing device
speech
bird
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610969673.7A
Other languages
English (en)
Other versions
CN106504762A (zh
Inventor
杨春勇
吴迪
刘恒
彭焱
陈彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South Central Minzu University
Original Assignee
South Central University for Nationalities
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South Central University for Nationalities filed Critical South Central University for Nationalities
Priority to CN201610969673.7A priority Critical patent/CN106504762B/zh
Publication of CN106504762A publication Critical patent/CN106504762A/zh
Application granted granted Critical
Publication of CN106504762B publication Critical patent/CN106504762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种鸟类群落数量估计***及其方法,涉及鸟类群落保护及语音降噪和分离技术领域。本***包括音频处理装置(10)、数据传输装置(20)、终端数据处理装置(30)和电源(40);音频处理装置(10)、数据传输装置(20)和终端数据处理装置(30)依次连接;电源(40)分别与音频处理装置(10)和数据传输装置(20)连接。本方法是:①语音降噪;②语音分离。本发明适用于动物园、农林部门和野生动物保护部门更方便地观测估计鸟类的数量;还对环保部门对评测某地区环境等级提供重要参考依据。

Description

鸟类群落数量估计***及其方法
技术领域
本发明涉及鸟类群落保护及语音降噪和分离技术领域,特别是涉及一种鸟类群落数量估计***及其方法。
背景技术
当前,鸟类群落保护颇受关注,有效的群鸟数量统计方法对于鸟类群落保护至关重要。传统方法多采用标志重捕法来统计动物种群的数量,该方法易对影响动物的正常生命活动产生影响,且统计准确性不足。近年来,用于语音信号处理领域的语音分离估计算法在人声语音识别、降噪方面展现了很好的应用前景。
传统的语音降噪算法有自适应滤波算法、谱减法和维纳滤波法等,利用特征参数进行端点检测,判断语音信号的有话段和无话段,通过无话段估算噪声谱,达到语音增强的目的;语音分离方面,独立分量分析算法(Independent Component Analysis,ICA)包括极大似然估计方法、最大熵方法、最小互信息方法、高阶累积量方法等,利用分离后信号各个分量之间最大独立性来建立对比函数,通过最大或最小化对比函数得到分离矩阵,达到分离源信号的目的。文献指出ICA算法只能用于源信号的个数小于或等于传感器所接收到的混合信号的个数的情况中,不适用于鸟类群落数量的估计。
发明内容
本发明的目的是针对目前观测鸟类活动停留在人工利用观鸟仪的传统方法上,损耗人力而且效率又低的问题,提供一种鸟类群落数量估计***及其方法,从而实现利用对鸟类群落鸟类混合语音的采集和降噪,基于峰值估计的鸟类混合语音分离技术,分离混合语音即可预估鸟类个数。
本发明的设计思路:
由于真实情况中语音的采集存在噪音的干扰,鸟类语音信号可能存在误差。为了提高语音分离的准确性,首先对采集的混合语音进行降噪处理;类比于人类语音分离技术,结合鸟类语音特征,设计一种基于PDTA聚类的DUET语音分离算法;同时考虑到声音衰减,将采用高保真麦克风,增强语音信号。
针对语音分离的需要,首先建立语音信号采集和处理***,实现对鸟类语音采集,A/D转换;其次,设计语音信号处理的传输***,考虑到野外环境的真实性,我们采用无线通信技术,实现远距离数据传输;接下来在PC端进行对数据的预处理、端点检测等操作;预处理包括混叠滤波、模数变换、分帧加窗;端点检测采用抗噪性好的参数谱熵进行端点检测,区别有无话段,估计噪声谱,利用维纳滤波进行降噪;最后,对降噪语音进行语音分离,我们采用一种基于PDTA聚类的DUET语音分离算法,分离语音个数即为估计鸟类数量个数并且恢复源语音信号。
具体地说:
一、鸟类群落数量估计***(简称***)
本***包括音频处理装置、数据传输装置、终端数据处理装置和电源;
其连接关系是:
音频处理装置、数据传输装置和终端数据处理装置依次连接;
电源分别与音频处理装置和数据传输装置连接。
二、鸟类群落数量估计方法
本方法包括语音降噪和语音分离两个部分。
①语音降噪
利用麦克风阵列在野外环境下采集鸟类混合语音Y,对采集的语音进行分帧加窗预处理,提取抗噪性好的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音;
②语音分离
语音分离分为峰值估计和源语音恢复两个阶段:
峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数;
源语音恢复阶段,寻找峰值对应的弧度值,计算出混合矩阵A,即需解Y=AX非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音X。
本发明具有以下优点和积极效果:
①提供了一种基于改进的维纳滤波算法的语音降噪的技术方案
对采集的语音进行分帧加窗预处理,提取抗噪性好的的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音。
②提供了一种组合DUET和PDTA聚类的语音分离算法的技术方案
语音分离分为峰值估计与源语音恢复两个阶段。峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数。源语音恢复阶段,寻找峰值对应的弧度值,可计算出混合矩阵A,即需解y=Ax非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音。
③提供了一种基于语音分离的鸟类群落数目估计的技术方案
摆脱原有人工观察的鸟类群落的方法,利用对混合语音分离,估计源语音个数的方法达到对鸟类数量估计。
④适用于动物园、农林部门和野生动物保护部门更方便的观测估计鸟类的数量;还对环保部门对评测某地区环境等级提供重要参考依据。
附图说明
图1是本***的结构方框图;
图2是本发明的工作原理图;
图3是PC端语音降噪算法流程图;
图4是PC端语音分离算法流程图。
图中:
10—音频处理装置,
11—麦克风阵列,12—放大器,13—音频解码器;
20—数据传输装置,
21—通信接口,22—控制器,23—外部扩展接口,24—射频发射模块,25—放射天线,26—接收天线,27—射频接收模块;
30—终端数据处理装置,
31—通信接口,32—PC端;
40—电源。
具体实施方式
下面结合附图和实施例详细说明:
一、***
1、总体
如图1,本***包括音频处理装置10、数据传输装置20、终端数据处理装置30和电源40;
其连接关系是:
音频处理装置10、数据传输装置20和终端数据处理装置30依次连接;
电源40分别与音频处理装置10和数据传输装置20连接。
其工作机理是:
音频处理装置10受数据传输装置20的管理和控制,为数据传输装置20提供基础数据资料;
数据处理装置20对音频处理装置10进行管理和控制,为终端数据处理装置30提供待处理数据;
终端数据处理装置30处理数据传输装置传送的数据;
音频处理装置10、数据传送装置由电源40供电。
如图2,其***工作流程是:
先是采集鸟类语音信信号;
然后利用射频模块进行语音数据的传输;
最后在PC端对数据进行处理,先对采集的语音利用一种改进的维纳滤波算法降噪;接下来对纯净语音利用一种基于PDTA聚类的DUET语音分离算法分离混合语音,得到源语音个数即为鸟类数量估计个数。
2、功能部件
1)音频处理装置10
音频处理装置10包括依次连接的麦克风阵列11、放大器12和音频解码器13;
(1)麦克风阵列11
麦克风阵列11采用多个高保真型麦克风;
对鸟类语音进行采集,在将采集到的鸟类语音经过放大器12信号放大。
(2)放大器12
放大器12采用TI公司的型号OPA684的放大器;
对采集的语音信号进行放大,将放大信号的语音传送至音频解码器13进行解码。
(3)音频解码器13
音频解码器13采用TI公司生产的音频处理芯片TLV320AIC34;
对音频信号进行解码调制,将采集的信号传送至数据传输装置20。
2)数据传输装置
数据传输装置20包括依次连通的通信接口21、控制器22、外部扩展接口23、射频发射模块24、发射天线25、接收天线26、射频接收模块27。
(1)通信接口21
通信接口21是一种多功能的同步串行接口,具有很强的可编程能力,可以配置为多种同步串口标准,直接与各种器件高速接口;
负责外部音频处理装置10与控制器22间的通信。
(2)控制器22
控制器22采用TI公司的TMS320C6713(主频225MHz)型DSP芯片;
主要负责对音频处理装置10和射频发射模块24进行管理和控制。
(3)外部扩展接口23
外部扩展接口23是一种由控制器22提供的接口;
主要用于连接射频发射模块24,实现控制器22对射频通信的控制和管理。
(4)射频发射模块24
射频放射模块24采用型号为VS-5854的外置天线的无线微波设备,发射功率为28dBm,高接收灵敏度802.11a/n协议,工作频段在5.150-5.850GHz,传输距离可达30公里。
(5)发射天线25
发射天线25采用MIMO双天线模式,V+H极性,天线的增益为28Bi,波瓣角度:V:40度,H:60度。
(6)接收天线(26)
发射天线(26)采用MIMO双天线模式,V+H极性,天线的增益为28Bi,波瓣角度:V:40度,H:60度。
(7)射频接收模块27
射频接收模块27采用型号为VS-5854的外置天线的无线微波设备,工作方式是点对点,点对多点的方式,频段通道自动调整,免除了手动修改的麻烦。
3)终端数据处理装置30
终端数据处理装置30包括前后连接的通信接口31和PC端32;
由PC端32处理采集的数据,基于MATLAB平台处理混合语音,利用相应算法达到语音分离的目的。
(1)通信接口31
通信接口31是一种多功能的同步串行接口,具有很强的可编程能力,可以配置为多种同步串口标准,直接与各种器件高速接口;
负责射频接收模块27与PC端32间的通信。
(2)PC端32
PC端32即电脑,其内嵌有本方法的工作软件;
PC端32将传回来的数据进行处理,估计源语音的个数。
二、方法
1、语音降噪的工作流程
如图3,语音降噪的工作流程如下:
A、***初始化-301;
B、对采集的语音利用谱减法对噪声进行预去除,以提高输入语音信号的信噪比-302;
C、计算前5帧信号的噪声功率谱,作为动态估计的初始值-303;
D、使用子带谱熵对带噪语音信号进行端点检测,并记录下语音信号有声段的起始点与终止点-304;
E、判断该帧信号是否为有声段-305,是则进入步骤G,否则进入步骤F;
F、更新噪声功率谱-306;
G、维纳滤波降噪-307。
2、语音分离的工作流程
如图4,语音分离的工作流程如下:
a、对降噪后的纯净语音进行加窗和分帧预处理-401;
b、傅里叶变化,对语音信号进行稀疏表示-402;
c、归一化使语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行M个区域划分-403;
d、计算每个区域的概率密度-404;
e、利用局部最优解算法求出密度峰值-405;
f、寻找峰值对应的弧度值,可计算出混合矩阵A-406;
g、利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音-407。

Claims (3)

1.一种基于鸟类群落数量估计***的鸟类群落数量估计方法,
所述的鸟类群落数量估计***包括音频处理装置(10)、数据传输装置(20)、终端数据处理装置(30)和电源(40);
音频处理装置(10)、数据传输装置(20)和终端数据处理装置(30)依次连接;
电源(40)分别与音频处理装置(10)和数据传输装置(20)连接;
所述的音频处理装置(10)包括依次连接的麦克风阵列(11)、放大器(12)和音频解码器(13)
所述的数据传输装置(20)包括依次连通的通信接口(21)、控制器(22)、外部扩展接口(23)、射频放射模块(24)、放射天线(25)、接收天线(26)和射频接收模块(27)
其特征在于:
①语音降噪
利用麦克风阵列在野外环境下采集鸟类混合语音Y,对采集的语音进行分帧加窗预处理,提取抗噪性好的特征参数谱熵进行端点检测,判断有话帧与无话帧噪音,利用维纳滤波降噪算法对采集的语音进行降噪处理,得到纯净鸟类语音;
②语音分离
语音分离分为峰值估计和源语音恢复两个阶段:
峰值估计阶段,对纯净语音进行加窗、分帧、傅里叶变换,实现对采集语音的稀疏表示,再对稀疏化语音数据进行预处理,让语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行区域划分,计算每个区域的概率密度,利用局部最优解算法求出密度峰值,峰值的个数即为分离语音的个数;
源语音恢复阶段,寻找峰值对应的弧度值,计算出混合矩阵A,即需解Y=AX非齐次方程组,利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音X。
2.按权利要求1所述的鸟类群落数量估计方法,其特征在于语音降噪的工作流程如下:
A、***初始化(301);
B、对采集的语音利用谱减法对噪声进行预去除,以提高输入语音信号的信噪比(302);
C、计算前5帧信号的噪声功率谱,作为动态估计的初始值(303);
D、使用子带谱熵对带噪语音信号进行端点检测,并记录下语音信号有声段的起始点与终止点(304);
E、判断该帧信号是否为有声段(305),是则进入步骤G,否则进入步骤F;
F、更新噪声功率谱(306);
G、维纳滤波降噪(307)。
3.按权利要求1所述的鸟类群落数量估计方法,其特征在语音分离的工作流程如下:
a、对降噪后的纯净语音进行加窗和分帧预处理(401);
b、傅里叶变化,对语音信号进行稀疏表示(402);
c、归一化使语音数据点分布单位圆的上半圆周上,求每个点到(1,0)的弧度,对弧度值进行M个区域划分(403);
d、计算每个区域的概率密度(404);
e、利用局部最优解算法求出密度峰值(405);
f、寻找峰值对应的弧度值,可计算出混合矩阵A(406);
g、利用DUET算法,把混合语音各数据点投影在混合矩阵A的各个方向上,根据投影距离判定各数据点属于哪一源语音类,即可恢复各个源语音(407)。
CN201610969673.7A 2016-11-04 2016-11-04 鸟类群落数量估计***及其方法 Active CN106504762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610969673.7A CN106504762B (zh) 2016-11-04 2016-11-04 鸟类群落数量估计***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610969673.7A CN106504762B (zh) 2016-11-04 2016-11-04 鸟类群落数量估计***及其方法

Publications (2)

Publication Number Publication Date
CN106504762A CN106504762A (zh) 2017-03-15
CN106504762B true CN106504762B (zh) 2023-04-14

Family

ID=58322033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610969673.7A Active CN106504762B (zh) 2016-11-04 2016-11-04 鸟类群落数量估计***及其方法

Country Status (1)

Country Link
CN (1) CN106504762B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107369451B (zh) * 2017-07-18 2020-12-22 北京市计算中心 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法
CN109671439B (zh) * 2018-12-19 2024-01-19 成都大学 一种智能化果林鸟害防治设备及其鸟类定位方法
CN109741759B (zh) * 2018-12-21 2020-07-31 南京理工大学 一种面向特定鸟类物种的声学自动检测方法
CN111626093B (zh) * 2020-03-27 2023-12-26 国网江西省电力有限公司电力科学研究院 一种基于鸣声功率谱密度的输电线路相关鸟种识别方法
CN112992172B (zh) * 2021-01-28 2023-09-15 广州大学 一种基于注意力机制的单通道时域鸟鸣声分离方法
CN113225400A (zh) * 2021-05-08 2021-08-06 南京林业大学 一种基于鸣禽鸣唱的鸟类种群密度监测***及方法
CN113303281B (zh) 2021-06-01 2022-04-01 广东省科学院动物研究所 一种具有景观丰容作用的绿海龟人工繁育喂食装置及其方法
CN117809662B (zh) * 2024-02-28 2024-05-10 江西师范大学 一种基于鸟类特征识别的栖息地环境调节方法和***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105405441A (zh) * 2015-10-20 2016-03-16 北京云知声信息技术有限公司 一种语音信息的反馈方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4496378B2 (ja) * 2003-09-05 2010-07-07 財団法人北九州産業学術推進機構 定常雑音下における音声区間検出に基づく目的音声の復元方法
CN101053161B (zh) * 2004-11-02 2010-09-08 松下电器产业株式会社 噪声抑制装置
CN102065272A (zh) * 2009-11-13 2011-05-18 中国科学院遥感应用研究所 基于声像一体化野生鸟类识别技术的远程无线监测***
CN202058443U (zh) * 2011-05-09 2011-11-30 杨捷 一种鸟类语音识别***
CN202680336U (zh) * 2012-05-22 2013-01-23 天津市畅悦电子科技有限公司 一种用于驱鸟兽的报警装置
US9460732B2 (en) * 2013-02-13 2016-10-04 Analog Devices, Inc. Signal source separation
CN104658538A (zh) * 2013-11-18 2015-05-27 中国计量学院 一种基于鸟鸣声的移动式鸟类识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105405441A (zh) * 2015-10-20 2016-03-16 北京云知声信息技术有限公司 一种语音信息的反馈方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
谭北海 ; 谢胜利 ; .基于源信号数目估计的欠定盲分离.电子与信息学报.2008,第30卷(第04期),第863-867页. *
颜鑫 ; 李应 ; .利用抗噪幂归一化倒谱系数的鸟类声音识别.电子学报.2013,(第02期),第295-300页. *

Also Published As

Publication number Publication date
CN106504762A (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN106504762B (zh) 鸟类群落数量估计***及其方法
CN203721183U (zh) 一种语音唤醒装置
CN203721182U (zh) 一种车载语音处理***
CN110992932B (zh) 一种自学习的语音控制方法、***及存储介质
CN105122843A (zh) 向用户提供听力辅助的方法和***
CN105376389B (zh) 一种语音唤醒方法及设备
AU2010204470A1 (en) Automatic sound recognition based on binary time frequency units
CN105741849A (zh) 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
CN205987367U (zh) 一种基于分布式麦克风的拾音装置
CN207603881U (zh) 一种智能语音无线音箱
CN111901737A (zh) 一种基于智能终端的助听器参数自适应方法
CN106328154B (zh) 一种前端音频处理***
CN111976924A (zh) 一种用于潜水全面罩的实时信息交流装置
CN206237414U (zh) 语音发射装置、语音接收装置及无人机语音广播***
CN107592600B (zh) 一种基于分布式麦克风的拾音筛选方法及拾音装置
CN106603669A (zh) 分布式主从设备的控制方法及***
CN105405447B (zh) 一种送话呼吸噪声屏蔽方法
CN102307271A (zh) 网络数字一体对讲***及其传输方法
CN112349291A (zh) 基于ai降噪模型的扩声***及方法
CN203165457U (zh) 一种可用于强噪声环境的语音采集装置
CN204244283U (zh) 具有回音消除功能的对讲***及电梯物联网***
CN208538474U (zh) 语音识别***
CN105979461A (zh) 基于智能终端的助听耳机及其***
CN207651168U (zh) 一种超清晰语音传输和识别模块
CN108735234A (zh) 一种采用语音信息监测健康状况的装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant