CN106504760A - 宽频带背景噪声与语音分离检测***及方法 - Google Patents

宽频带背景噪声与语音分离检测***及方法 Download PDF

Info

Publication number
CN106504760A
CN106504760A CN201610947596.5A CN201610947596A CN106504760A CN 106504760 A CN106504760 A CN 106504760A CN 201610947596 A CN201610947596 A CN 201610947596A CN 106504760 A CN106504760 A CN 106504760A
Authority
CN
China
Prior art keywords
speech
voice
energy
time
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610947596.5A
Other languages
English (en)
Other versions
CN106504760B (zh
Inventor
何云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Leader Technology Co Ltd
Chipintelli Technology Co Ltd
Original Assignee
Chengdu Leader Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Leader Technology Co Ltd filed Critical Chengdu Leader Technology Co Ltd
Priority to CN201610947596.5A priority Critical patent/CN106504760B/zh
Publication of CN106504760A publication Critical patent/CN106504760A/zh
Application granted granted Critical
Publication of CN106504760B publication Critical patent/CN106504760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及信息处理技术及传感信号处理领域,特别是涉及到一种宽频带背景噪声与语音分离检测***,该***包括当前帧时域能量计算电路、背景噪声计算电路、时域语音检测长短时平均能量比较电路、频域语音检测长短时频域能量比较电路、背景噪声比较电路、子带能量分布均匀性语音检测电路和语音帧数统计电路,本发明还公开了一种宽频带背景噪声与语音分离检测方法,本发明使用三级语音检测手段,对于高低频的背景噪声都有很好的检测效果,同时对于偶然断续行的噪声也有非常好的检测效果,大幅度提高了复杂噪声环境下语音检测的准确性。

Description

宽频带背景噪声与语音分离检测***及方法
技术领域
本发明涉及信息处理技术及传感信号处理领域,特别是涉及到一种宽频带背景噪声与语音分离检测***及方法。
背景技术
人工智能应用领域的一个热点就是语音识别,目前语音识别已经开始在各个领域开始广泛应用。语音检测实现是语音识别***实时实现的重要部分,其目的是在复杂的实际环境中区分语音段与非语音段,有文献表明,实际应用中识别率较低部分很大程度是由于未对语音进行正确处理,大量的非语音噪声严重影响语音识别***的准确率,特别是应用环境带有大量噪声的语音识别,正确的语音检测技术可有效地降低***运算量,缩短***处理时间,减少移动端发射功率并节省信道资源,提高语音识别准确率,尤其是在复杂背景噪声下,语音识别***性能的优劣在很大程度上取决于语音检测技术的优劣,因此稳健、精确、实时、自适应性强及鲁棒性好的语音检测技术是每个语音识别***所必需的。
当前自动语音端点检测的主流方法是依靠时域中短时能量大小,过零率大小,以及频域中频带能量均方差三种方法来检测,具体方法是求出短时能量、过零率或者频带能量均方差,然后与一个经验阈值进行比较,实验证明,这种单独比较短时能量大小或过零率大小的方法对于有噪声的环境适应性不好, 尤其是应用环境会发生变化,同一环境的背景噪声也会发生变化的时候,而频带能量均方差方法对于安静环境适应性不好。
也可以根据时域和频域声音平均能量的变化分别进行语音的检测,最后根据动态估计出的背景噪声大小,选择最优的结果,从而大幅提高语音识别的准确率以及对环境变化的适应性,由于大多数稳态背景噪声的能量集中于低频段,因此这种方法对于多数低频分布的噪声非常有效,而对于物体或动物发出的声音如鸟鸣,汽车喇叭,钢琴及其他乐器弹奏的声音,由于其频带分布较宽,处于同人的语音频带分布范围内, 对于这种类型的噪声采用上述方法则很容易将该类型噪声误判为语音, 区分该类型噪声对于语音检测,语音降噪,语音识别而言都非常重要,也是难点之一。
为解决上述问题,需要发明一种通过对宽频带非语音噪声的频域和时域特性进行大量实验分析及理论研究后提出的宽频带背景噪声与语音分离检测***及方法。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种能大幅提高各类背景噪声的适应性及自动语音检测的准确性的宽频带背景噪声与语音分离检测***及方法。
为了达到上述目的,本发明提供了如下技术方案。
宽频带背景噪声与语音分离检测***,其包括:当前帧时频域能量计算电路,与所述当前帧时频域能量计算电路连接的背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路,与所述背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接的背景噪声比较电路,与所述时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路分别连接的子带能量分布均匀性语音检测电路,与所述子带能量分布均匀性语音检测电路连接的语音帧数统计电路,所述背景噪声计算电路还分别与所述子带能量分布均匀性语音检测电路、语音帧数统计电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接。
作为本发明的优选方案,所述语音帧数统计电路由时宽滤波器构成,所述时宽滤波器用来统计语音的帧数,所述时宽滤波器的数量大于等于1。
本发明还公开了一种宽频带背景噪声与语音分离检测方法,其包括以下步骤:
步骤一 载入声音数据,所述声音数据按帧处理,所述声音数据是时域内语音数据,所述帧的时间大小可以配置,通常在10毫秒到50毫秒之间;
步骤二 计算时域短时能量和时域长时平均能量,所述时域短时能量是所述时域内语音数据当前帧的能量总和,将多帧所述时域短时能量累加并除以所述时域短时能量的帧数得到所述时域长时平均能量;
步骤三将所述时域内语音数据当前帧进行FFT(快速傅立叶)变换,将所述时域内语音数据当前帧变换成频域内子带语音数据;
步骤四 计算频域短时能量和频域长时平均能量,将所述频域内子带语音数据当前帧人声主要能量分布频率范围子带能量累加得到所述频域短时能量,将多帧所述频域短时能量累加并除以所述频域短时能量的帧数得到所述频域长时平均能量;
步骤五 背景噪声累加计算,将非语音帧的所述时域短时能量送入背景噪声估计单元进行累加,每累加到一定的帧数则输出一个新的所述背景噪声;
步骤六 将所述背景噪声与设定的阈值一进行比较,若大于所述阈值一则进行步骤七,若小于所述阈值一则进行步骤八;
步骤七 进行频域语音检测,是语音则进入步骤九,不是语音则进行步骤五和步骤十一;
步骤八 进行时域语音检测,是语音则进入所述步骤九,不是语音则进行所述步骤五和步骤十一;
步骤九 进行频域子带能量分布均匀性检测,是语音则进入步骤十,不是语音则进行步所述骤五和步骤十一;
步骤十 时宽滤波器统计所述步骤九产生的语音帧数,并与设定的阈值二进行比较,若所述帧数大于所述阈值二则直接进入所述步骤十一,若所述帧数小于所述阈值二则进入所述步骤五和步骤十一;
步骤十一 检测结果输出,检测结束。
作为本发明的优选方案,所述频域语音检测是将所述频域短时能量和频域长时平均能量进行比较,所述频域短时能量超过所述频域长时平均能量一定程度,则为语音,否则为非语音,当判断为非语音时输出结果,检测结束。
作为本发明的优选方案,所述时域语音检测是将所述时域短时能量和时域长时平均能量进行比较,所述时域短时能量超过所述时域长时平均能量一定程度,则为语音,否则为非语音,判断为非语音时输出结果,检测结束。
作为本发明的优选方案,在进行步骤八时,如果检测结果均匀性较高则为语音,如果检测结果均匀性较低则为非语音,判断为非语音时输出结果,检测结束。
作为本发明的优选方案,所述时宽滤波器统计所述声音数据连续为语音的帧数,如果所述帧数大于所述阈值二则为语音,如果所述帧数小于所述阈值二则判断为非语音,判断为非语音时输出结果,检测结束。
作为本发明的优选方案,在运行步骤七至步骤十时,当运行结果判定为非语音时,将所述非语音数据运行步骤五产生新的所述背景噪声。
本发明在检测所述时域内语音数据过程中,使用了三级语音检测,首先使用所述时域语音检测或频域语音检测,其次使用所述频域子带能量分布均匀性检测,最后使用时宽滤波器统计所述步骤八产生的语音帧数,并与设定的阈值二进行比较,逐层进行过滤,最终将真实有效的语音数据筛选出来。
与现有技术相比,本发明的有益效果:
本发明使用三级语音检测手段,对于高低频的背景噪声都有很好的检测效果,同时对于偶然断续行的噪声也有非常好的检测效果,大幅度提高了复杂噪声环境下语音检测的准确性。
附图说明
图1为本发明电路框架图;
图2为本发明流程图。
具体实施方式
下面结合实施例及具体实施方式对本发明作进一步的详细描述,但不应将此理解为本发明上述主体的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
如图1所示,一种宽频带背景噪声与语音分离检测***,该***当前帧时频域能量计算电路,与所述当前帧时频域能量计算电路连接的背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路,与所述背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接的背景噪声比较电路,与所述时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路分别连接的子带能量分布均匀性语音检测电路,与所述子带能量分布均匀性语音检测电路连接的语音帧数统计电路,所述背景噪声计算电路还分别与所述子带能量分布均匀性语音检测电路、语音帧数统计电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接,语音帧数统计电路由时宽滤波器构成,时宽滤波器用来统计语音的帧数,在本实施例中时宽滤波器的数量为1个,在本实施例中时宽滤波器是一个语音帧计数器。
如图2所示,一种宽频带背景噪声与语音分离检测方法,其包括以下十一个步骤:
步骤一 载入声音数据,所述声音数据按帧处理,所述声音数据是时域内语音数据,所述帧的时间大小可以配置,通常在10毫秒到50毫秒之间;
步骤二 计算时域短时能量和时域长时平均能量,所述时域短时能量是所述时域内语音数据当前帧的能量总和,将多帧所述时域短时能量累加并除以所述时域短时能量的帧数得到所述时域长时平均能量;
步骤三将所述时域内语音数据当前帧进行FFT(快速傅立叶)变换,将所述时域内语音数据当前帧变换成频域内子带语音数据;
步骤四 计算频域短时能量和频域长时平均能量,将所述频域内子带语音数据当前帧人声主要能量分布频率范围子带能量累加得到所述频域短时能量,将多帧所述频域短时能量累加并除以所述频域短时能量的帧数得到所述频域长时平均能量;
步骤五 背景噪声累加计算,将非语音帧的所述时域短时能量送入背景噪声估计单元进行累加,每累加到一定的帧数则输出一个新的所述背景噪声;
步骤六 将所述背景噪声与设定的阈值一进行比较,若大于所述阈值一则进行步骤七,若小于所述阈值一则进行步骤八;
步骤七 进行频域语音检测,所述频域语音检测是将所述频域短时能量和频域长时平均能量进行比较,所述频域短时能量超过所述频域长时平均能量一定程度,则为语音,否则为非语音,是语音则进入步骤九,不是语音则进行步骤五和步骤十一;
步骤八 进行时域语音检测,所述时域语音检测是将所述时域短时能量和时域长时平均能量进行比较,所述时域短时能量超过所述时域长时平均能量一定程度,则为语音,否则为非语音,是语音则进入所述步骤九,不是语音则进行所述步骤五和步骤十一;
步骤九 进行频域子带能量分布均匀性检测,如果检测结果均匀性较高则为语音,如果检测结果均匀性较低则为非语音,是语音则进入步骤十,不是语音则进行步所述骤五和步骤十一;
步骤十 时宽滤波器统计所述步骤九产生的语音帧数,所述时宽滤波器统计所述声音数据连续为语音的帧数,并与设定的阈值二进行比较,若所述帧数大于所述阈值二则则为语音直接进入所述步骤十一,若所述帧数小于所述阈值二则为非语音进入所述步骤五和步骤十一;
步骤十一 检测结果输出,检测结束。
在运行步骤七至步骤十时,当运行结果判定为非语音时,将所述非语音数据运行步骤五产生新的所述背景噪声。
本实施例中,步骤三的计算过程如下:
假设频域子带数目为N,则平均子带能量为 ,其中Eavg为平均子带能量, Etotal为所有子带能量总和,Ei 为第i子带能量, i = 1,2......N。在频域中,子带能量等于其实部的平方与虚部的平方求和得到。
在本实施例中,步骤九的计算过程如下:
采用均方差方法求非均匀性,设每个子带能量为Ei,则用均方差求非均匀性,公式为,其中nU为非均匀性,设阈值Th_nu为非均匀性的阈值,则当nU < Th_nu时,可暂时判为语音,否则为非语音。
在其他实施例中可以用以下两种方式进行计算:
一、采用求差的绝对值和求平均,公式为 ,其中nU为非均匀性, 设阈值Th_nu为非均匀性的阈值,则当nU < Th_nu时,可暂时判为语音,否则为非语音;
二、对子带能量离平均子带能量近的子带进行计数,若较多的子带能量分布在平均能量附近,则为语音,否则为非语音。具体公式如下,若:|Ei-Eavg|<k*Eavg时, U = U + 1,这儿k为一个介于0和1之间的配置参数,典型值可以配置为0.5,U表征为均匀性,设Th_u为阈值,若 U>Th_u, 则判为语音,否则为非语音。
在本实施例中步骤十的详细计算过程如下:
设一个语音帧计数器,该计数器一开始初始为0,遇到非语音帧时清零,遇到语音帧时加1,并将从非语音帧变到语音帧时,将第一个语音帧的序号更新为语音帧起始地址,当该语音帧计数器数值大于一个阈值二时,则从第一个语音帧开始,连续的语音帧都为语音帧,直到非语音帧出现,若从语音帧变到非语音帧时,该语音帧计数器值小于阈值,则此前的语音帧也判为非语音帧。

Claims (8)

1.宽频带背景噪声与语音分离检测***,其包括:当前帧时频域能量计算电路,与所述当前帧时频域能量计算电路连接的背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路,与所述背景噪声计算电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接的背景噪声比较电路,与所述时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路分别连接的子带能量分布均匀性语音检测电路,与所述子带能量分布均匀性语音检测电路连接的语音帧数统计电路,所述背景噪声计算电路还分别与所述子带能量分布均匀性语音检测电路、语音帧数统计电路、时域语音检测长短时平均能量比较电路和频域语音检测长短时频域能量比较电路连接。
2.根据权利要求1所述的宽频带背景噪声与语音分离检测***,其特征在于:所述语音帧数统计电路由时宽滤波器构成,所述时宽滤波器用来统计语音的帧数,所述时宽滤波器的数量大于等于1。
3.宽频带背景噪声与语音分离检测方法,其包括以下步骤:
步骤一 载入声音数据,所述声音数据按帧处理,所述声音数据是时域内语音数据;
步骤二 计算时域短时能量和时域长时平均能量,所述时域短时能量是所述时域内语音数据当前帧的能量总和,将多帧所述时域短时能量累加并除以所述时域短时能量的帧数得到所述时域长时平均能量;
步骤三将所述时域内语音数据当前帧进行FFT(快速傅立叶)变换,将所述时域内语音数据当前帧变换成频域内子带语音数据;
步骤四 计算频域短时能量和频域长时平均能量,将所述频域内子带语音数据当前帧人声主要能量分布频率范围子带能量累加得到所述频域短时能量,将多帧所述频域短时能量累加并除以所述频域短时能量的帧数得到所述频域长时平均能量;
步骤五 背景噪声累加计算;
步骤六 将所述背景噪声与设定的阈值一进行比较,若大于所述阈值一则进行步骤七,若小于所述阈值一则进行步骤八;
步骤七 进行频域语音检测,是语音则进入步骤九,不是语音则进行步骤五和步骤十一;
步骤八 进行时域语音检测,是语音则进入所述步骤九,不是语音则进行所述步骤五和步骤十一;
步骤九 进行频域子带能量分布均匀性检测,是语音则进入步骤十,不是语音则进行步所述骤五和步骤十一;
步骤十 时宽滤波器统计所述步骤九产生的语音帧数,并与设定的阈值二进行比较,若所述帧数大于所述阈值二则直接进入所述步骤十一,若所述帧数小于所述阈值二则进入所述步骤五和步骤十一;
步骤十一 检测结果输出,检测结束。
4.根据权利要求3所述的宽频带背景噪声与语音分离检测方法,其特征在于:所述频域语音检测是将所述频域短时能量和频域长时平均能量进行比较,所述频域短时能量超过所述频域长时平均能量一定程度,则为语音,否则为非语音,当判断为非语音时输出结果,检测结束。
5.根据权利要求3所述的宽频带背景噪声与语音分离检测方法,其特征在于:所述时域语音检测是将所述时域短时能量和时域长时平均能量进行比较,所述时域短时能量超过所述时域长时平均能量一定程度,则为语音,否则为非语音,判断为非语音时输出结果,检测结束。
6.根据权利要求3所述的宽频带背景噪声与语音分离检测方法,其特征在于:在进行步骤八时,如果检测结果均匀性较高则为语音,如果检测结果均匀性较低则为非语音,判断为非语音时输出结果,检测结束。
7.根据权利要求3所述的宽频带背景噪声与语音分离检测方法,其特征在于:所述时宽滤波器统计所述声音数据连续为语音的帧数,如果所述帧数大于所述阈值二则为语音,如果所述帧数小于所述阈值二则判断为非语音,判断为非语音时输出结果,检测结束。
8.根据权利要求3所述的宽频带背景噪声与语音分离检测方法,其特征在于:在运行步骤七至步骤十时,当运行结果判定为非语音时,将所述非语音数据运行步骤五产生新的所述背景噪声。
CN201610947596.5A 2016-10-26 2016-10-26 宽频带背景噪声与语音分离检测***及方法 Active CN106504760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610947596.5A CN106504760B (zh) 2016-10-26 2016-10-26 宽频带背景噪声与语音分离检测***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610947596.5A CN106504760B (zh) 2016-10-26 2016-10-26 宽频带背景噪声与语音分离检测***及方法

Publications (2)

Publication Number Publication Date
CN106504760A true CN106504760A (zh) 2017-03-15
CN106504760B CN106504760B (zh) 2019-04-26

Family

ID=58322976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610947596.5A Active CN106504760B (zh) 2016-10-26 2016-10-26 宽频带背景噪声与语音分离检测***及方法

Country Status (1)

Country Link
CN (1) CN106504760B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108064007A (zh) * 2017-11-07 2018-05-22 苏宁云商集团股份有限公司 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN109327633A (zh) * 2017-07-31 2019-02-12 上海谦问万答吧云计算科技有限公司 混音方法、装置、设备及存储介质
CN109639904A (zh) * 2019-01-25 2019-04-16 努比亚技术有限公司 一种手机模式调整方法、***及计算机存储介质
CN112992167A (zh) * 2021-02-08 2021-06-18 歌尔科技有限公司 音频信号的处理方法、装置及电子设备
CN113470623A (zh) * 2021-08-12 2021-10-01 成都启英泰伦科技有限公司 一种自适应语音端点检测方法及检测电路

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452698A (zh) * 2007-11-29 2009-06-10 中国科学院声学研究所 一种自动嗓音谐噪比分析方法
CN101631102A (zh) * 2009-04-10 2010-01-20 北京理工大学 一种跳频***干扰样式识别技术
CN101826327A (zh) * 2009-03-03 2010-09-08 中兴通讯股份有限公司 一种基于时域掩蔽的瞬态判决方法及设备
CN104575498A (zh) * 2015-01-30 2015-04-29 深圳市云之讯网络技术有限公司 有效语音识别方法及***
CN105118522A (zh) * 2015-08-27 2015-12-02 广州市百果园网络科技有限公司 噪声检测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452698A (zh) * 2007-11-29 2009-06-10 中国科学院声学研究所 一种自动嗓音谐噪比分析方法
CN101826327A (zh) * 2009-03-03 2010-09-08 中兴通讯股份有限公司 一种基于时域掩蔽的瞬态判决方法及设备
CN101631102A (zh) * 2009-04-10 2010-01-20 北京理工大学 一种跳频***干扰样式识别技术
CN104575498A (zh) * 2015-01-30 2015-04-29 深圳市云之讯网络技术有限公司 有效语音识别方法及***
CN105118522A (zh) * 2015-08-27 2015-12-02 广州市百果园网络科技有限公司 噪声检测方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109327633A (zh) * 2017-07-31 2019-02-12 上海谦问万答吧云计算科技有限公司 混音方法、装置、设备及存储介质
CN109327633B (zh) * 2017-07-31 2020-09-22 苏州谦问万答吧教育科技有限公司 混音方法、装置、设备及存储介质
CN108064007A (zh) * 2017-11-07 2018-05-22 苏宁云商集团股份有限公司 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN109639904A (zh) * 2019-01-25 2019-04-16 努比亚技术有限公司 一种手机模式调整方法、***及计算机存储介质
CN112992167A (zh) * 2021-02-08 2021-06-18 歌尔科技有限公司 音频信号的处理方法、装置及电子设备
CN113470623A (zh) * 2021-08-12 2021-10-01 成都启英泰伦科技有限公司 一种自适应语音端点检测方法及检测电路
CN113470623B (zh) * 2021-08-12 2023-05-16 成都启英泰伦科技有限公司 一种自适应语音端点检测方法及检测电路

Also Published As

Publication number Publication date
CN106504760B (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN106504760A (zh) 宽频带背景噪声与语音分离检测***及方法
CN103646649B (zh) 一种高效的语音检测方法
CN103854662B (zh) 基于多域联合估计的自适应语音检测方法
CN106098076B (zh) 一种基于动态噪声估计时频域自适应语音检测方法
WO2021114733A1 (zh) 一种分频段进行处理的噪声抑制方法及其***
CN104091603B (zh) 基于基频的端点检测***及其计算方法
CN106847270B (zh) 一种双门限地名语音端点检测方法
CN103886871A (zh) 语音端点的检测方法和装置
CN104464722A (zh) 基于时域和频域的语音活性检测方法和设备
CA2699316A1 (en) Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN105427859A (zh) 一种用于对说话人识别的前端语音增强方法
CN110706693A (zh) 语音端点的确定方法及装置、存储介质、电子装置
CN106303878A (zh) 一种啸叫检测和抑制方法
CN108962285B (zh) 一种基于人耳掩蔽效应划分子带的语音端点检测方法
CN105118522A (zh) 噪声检测方法及装置
WO2021248522A1 (zh) 气流杂音检测方法、装置、终端及存储介质
CN105810201A (zh) 语音活动检测方法及其***
CN103310800B (zh) 一种抗噪声干扰的浊语音检测方法及***
CN108986844B (zh) 一种基于说话人语音特征的语音端点检测方法
US10991377B2 (en) Method and system for speaker loudness control
CN104242849A (zh) 一种公交车载播放器音量自动调节方法及装置
CN112216285B (zh) 多人会话检测方法、***、移动终端及存储介质
CN110689905A (zh) 一种用于视频会议***的语音活动检测***
Pencak et al. The NP speech activity detection algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant