CN110944089A - 双讲检测方法及电子设备 - Google Patents
双讲检测方法及电子设备 Download PDFInfo
- Publication number
- CN110944089A CN110944089A CN201911064792.8A CN201911064792A CN110944089A CN 110944089 A CN110944089 A CN 110944089A CN 201911064792 A CN201911064792 A CN 201911064792A CN 110944089 A CN110944089 A CN 110944089A
- Authority
- CN
- China
- Prior art keywords
- signal
- double
- voice
- talk detection
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 85
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000013135 deep learning Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Telephone Function (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
本发明实施例涉及数据处理技术领域,公开了一种双讲检测方法及电子设备。本发明实施例中,双讲检测方法,包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。本发明实施例适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。
Description
技术领域
本发明实施例涉及数据处理技术领域,特别涉及一种双讲检测方法及电子设备。
背景技术
在因特网上进行语音的实时传输已经应用广泛,影响因特网语音质量的关键的因素之一是回声的影响,因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行回声处理。其中,检测回声消除算法的一个关键指标是双讲检测的准确率,如果在回声消除算法中双讲检测不准,那么就会出现语音断续、沟通不畅等情况,这将大大降低语音通话质量;因此,在回声消除处理中,双讲检测对于语音质量至关重要。
目前,双讲检测大多是基于传统时/频域计算来实现的,即通过远端语音与近端语音的互相关系数、频谱计算等思想来进行双讲检测计算的。然而,发明人发现现有技术中至少存在如下问题:由于网络电话(VOIP)语音通信中,回声产生的原因比较复杂,具有回声源复杂,回声路径延迟大,通话场景多变,通话设备类型多变等特点,而传统的双讲检测算法迭代的因子和采用的参数基本是固定的,因此具有局限性,无法随着说话语境/场景的变换进行有效的调整。
发明内容
本发明实施方式的目的在于提供一种双讲检测方法及电子设备,使得适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。
为解决上述技术问题,本发明的实施方式提供了一种双讲检测方法,包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的双讲检测方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的双讲检测方法。
本发明实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本发明实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本发明实施例适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。
另外,对初始语音信号进行预设信号处理得到语音处理信号,包括:对所述初始语音信号进行预处理得到第一语音处理信号;对所述第一语音处理信号进行时频转换得到第二语音处理信号;本实施例中,提供了对初始语音信号的一种预设信号处理方式。
另外,对所述初始语音信号进行预处理得到第一语音处理信号,包括:对所述初始语音信号进行分帧、加窗以及去直流操作得到所述第一语音处理信号。本实施例中,提供了预处理的一种具体实现方式。
另外,所述预设的双讲检测模型的生成方法包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;根据预设双讲检测方法搭建深度学习双讲检测模型;将所述特征参数输入所述深度学习双讲检测模型进行训练以得到经训练后所述深度学习双讲检测模型。本实施例中,提供了双讲检测模型的一种具体生成方法。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据第一实施方式的双讲检测方法的具体流程图;
图2是根据第二实施方式的双讲检测方法的具体流程图;
图3是根据第三实施方式的双讲检测方法的具体流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种双讲检测方法,如图1所示,双讲检测方法包括:
步骤101,从设备的回声模块中获取初始语音信号。
本实施方式中,初始语音信号包括近端语音信号与远端语音信号。例如A用户与B用户语音通话,从A用户的移动终端的角度来讲,A用户发出的语音信号即为近端语音信号,B用户发出的语音信号即为远端语音信号。
在一个例子中,电子设备以手机为例,当检测到A用户与B用户在即时通信类的应用程序例如微信上进行语音通话,那么A用户的手机就从微信的回声模块中获取A用户与B用户之间通话的语音信号,即为初始语音信号;然这里只是示例性说明,实际中不限于此。
步骤102,对初始语音信号进行预设信号处理得到语音处理信号。
步骤103,从语音处理信号中提取预设的特征参数。
本实施方式中,预设的特征参数至少包括近端语音信号与远端语音信号的互相关系数、远端语音的语音活动检测值、近端语音信号和线性回声处理后的回声残留信号的互相关系数;然实际中不限于此,本实施例对特征参数的类型不作任何限制。
步骤104,将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。
在一个例子中,双讲检测结果可以为表征单通或双通的双讲检测标志。例如当检测出来为单通时,以预先设定的表征单通的双讲检测标志0表示;当检测出来为双通时,以预先设定的表征双通的双讲检测标志1表示;然这里只是示例性说明,本实施例对双讲检测标志的类型不作任何限制。
本发明的实施例相对于现有技术而言,本发明实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本发明实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本发明实施例适用于各种语音通话环境,可大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高语音质量。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明的第二实施方式涉及一种双讲检测方法。第二实施方式在第一实施方式的基础上进行改进,主要改进之处在于:在本发明第二实施方式中,提供了对初始语音信号的一种预设信号处理方式。
本实施方式的双讲检测方法如图2所示,本实施方式的201、203-204与第一实施方式中的101、103-104对应相同,在此不再赘述,本实施例的202如下:
子步骤2021,对初始语音信号进行预处理得到第一语音处理信号。
在一个例子中,预处理包括:对初始语音信号进行分帧、加窗以及去直流操作得到第一语音处理信号;然这里只是示例性说明,实际中不限于此。
子步骤2022,对第一语音处理信号进行时频转换得到第二语音处理信号。
在一个例子中,对第一语音处理信号通过傅里叶变换进行时频转换得到第二语音处理信号;然实际中不限于此,本实施例还可以通过其他方式进行时域信号到频域信号的转换。
本发明的实施例相对于第一实施方式而言,提供了对初始语音信号的一种预设信号处理方式,即对初始语音信号进行预处理得到第一语音处理信号,对第一语音处理信号进行时频转换得到第二语音处理信号。
本发明的第三实施方式涉及一种双讲检测方法,第三实施方式在第二实施方式的基础上进行改进,主要改进之处在于:在本发明第三实施方式中,提供了预设的双讲检测模型的一种生成方法。
本实施方式中,预设的双讲检测模型的生成方法包括:
步骤301,从设备的回声模块中获取初始语音信号。
本实施方式中,初始语音信号包括近端语音信号与远端语音信号。例如A用户与B用户语音通话,从A用户的移动终端的角度来讲,A用户发出的语音信号即为近端语音信号,B用户发出的语音信号即为远端语音信号。
步骤302,对初始语音信号进行预设信号处理得到语音处理信号。
在一个例子中,预设信号处理的方式可以采用第二实施方式中的方式,在此不再赘述。
步骤303,从语音处理信号中提取预设的特征参数。
本实施方式中,预设的特征参数至少包括近端语音信号与远端语音信号的互相关系数、远端语音的语音活动检测值、近端语音信号和线性回声处理后的回声残留信号的互相关系数;然实际中不限于此,本实施例对特征参数的类型不作任何限制,可以根据实际需要设置。
步骤304,根据预设双讲检测方法搭建深度学习双讲检测模型。
在一个例子中,基于现有的近端语音信号与远端语音信号的互相关系数的双讲检测方法搭建深度学习双讲检测模型;具体而言,双讲检测的方法包括:近端信号input_near,远端信号input_far,(1)计算input_far的语音活动检测值vad_flag,vad_flag=1表示远端有语音,vad_flag=0表示远端无语音。(2)计算input_far和input_near的互相关值corr;corr数值小,代近端有语音的概率大;corr数值大,代表近端有语音的概率小。(3)根据(1)和(2)的计算结果,进行判断若vad_flag=1,且corr小,那么是双讲状态;若vad_flag=0,那么是只有近端通话的单通状态;若vad_flag=1,且corr大,那么是只有远端通话的单通状态。然这里只是示例性说明,实际中不限于此,还可以采用其他预设的双讲检测方法搭建深度学习双讲检测模型。
步骤305,将特征参数输入深度学习双讲检测模型进行训练以得到经训练后深度学习双讲检测模型。
实际上,本实施例也可以为在第一实施方式的基础上的改进方案。
本实施方式相对于第二实施方式而言,提供了双讲检测模型的一种生成方法,即从设备的回声模块中获取初始语音信号,对初始语音信号进行预设信号处理得到语音处理信号,从语音处理信号中提取预设的特征参数,根据预设双讲检测方法搭建深度学习双讲检测模型。
本发明第四实施方式涉及一种电子设备,包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一至第三实施方式中任一实施方式中的的双讲检测方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明的实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本发明实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本发明实施例适用于各种语音通话环境,可大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高语音质量。
本发明第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现第一至第三实施方式中任一实施方式中的的双讲检测方法。
本发明的实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本发明实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本发明实施例适用于各种语音通话环境,可大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高语音质量。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (9)
1.一种双讲检测方法,其特征在于,包括:
从设备的回声模块中获取初始语音信号;
对所述初始语音信号进行预设信号处理得到语音处理信号;
从所述语音处理信号中预设的特征参数;
将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。
2.根据权利要求1所述的双讲检测方法,其特征在于,所述对所述初始语音信号进行预设信号处理得到语音处理信号,包括:
对所述初始语音信号进行预处理得到第一语音处理信号;
对所述第一语音处理信号进行时频转换得到第二语音处理信号。
3.根据权利要求2所述的双讲检测方法,其特征在于,所述对所述初始语音信号进行预处理得到第一语音处理信号,包括:
对所述初始语音信号进行分帧、加窗以及去直流操作得到所述第一语音处理信号。
4.根据权利要求2所述的双讲检测方法,其特征在于,所述对所述第一语音处理信号进行时频转换得到第二语音处理信号,为:
对所述第一语音处理信号通过傅里叶变换进行时频转换得到第二语音处理信号。
5.根据权利要求1所述的双讲检测方法,其特征在于,所述初始语音信号包括近端语音信号和远端语音信号;所述特征参数至少包括近端语音信号与远端语音信号的互相关系数、远端语音的语音活动检测值、近端语音信号和线性回声处理后的回声残留信号的互相关系数。
6.根据权利要求1所述的双讲检测方法,其特征在于,所述预设的双讲检测模型的生成方法包括:
从设备的回声模块中获取初始语音信号;
对所述初始语音信号进行预设信号处理得到语音处理信号;
从所述语音处理信号中提取预设的特征参数;
根据预设双讲检测方法搭建深度学习双讲检测模型;
将所述特征参数输入所述深度学习双讲检测模型进行训练以得到经训练后所述深度学习双讲检测模型。
7.根据权利要求1所时述的双讲检测方法,其特征在于,所述双讲检测结果为表征单通或双通的双讲检测标志。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的双讲检测方法。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的双讲检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911064792.8A CN110944089A (zh) | 2019-11-04 | 2019-11-04 | 双讲检测方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911064792.8A CN110944089A (zh) | 2019-11-04 | 2019-11-04 | 双讲检测方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110944089A true CN110944089A (zh) | 2020-03-31 |
Family
ID=69906368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911064792.8A Pending CN110944089A (zh) | 2019-11-04 | 2019-11-04 | 双讲检测方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110944089A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111654572A (zh) * | 2020-05-27 | 2020-09-11 | 维沃移动通信有限公司 | 音频处理方法、装置、电子设备及存储介质 |
CN114650340A (zh) * | 2022-04-21 | 2022-06-21 | 深圳市中科蓝讯科技股份有限公司 | 一种回声消除方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558729B1 (en) * | 2004-07-16 | 2009-07-07 | Mindspeed Technologies, Inc. | Music detection for enhancing echo cancellation and speech coding |
CN105957520A (zh) * | 2016-07-04 | 2016-09-21 | 北京邮电大学 | 一种适用于回声消除***的语音状态检测方法 |
CN106486135A (zh) * | 2015-08-27 | 2017-03-08 | 想象技术有限公司 | 近端语音检测器 |
CN108429994A (zh) * | 2017-02-15 | 2018-08-21 | 阿里巴巴集团控股有限公司 | 音频识别、回声消除方法、装置及设备 |
CN109841206A (zh) * | 2018-08-31 | 2019-06-04 | 大象声科(深圳)科技有限公司 | 一种基于深度学习的回声消除方法 |
-
2019
- 2019-11-04 CN CN201911064792.8A patent/CN110944089A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558729B1 (en) * | 2004-07-16 | 2009-07-07 | Mindspeed Technologies, Inc. | Music detection for enhancing echo cancellation and speech coding |
CN106486135A (zh) * | 2015-08-27 | 2017-03-08 | 想象技术有限公司 | 近端语音检测器 |
CN105957520A (zh) * | 2016-07-04 | 2016-09-21 | 北京邮电大学 | 一种适用于回声消除***的语音状态检测方法 |
CN108429994A (zh) * | 2017-02-15 | 2018-08-21 | 阿里巴巴集团控股有限公司 | 音频识别、回声消除方法、装置及设备 |
CN109841206A (zh) * | 2018-08-31 | 2019-06-04 | 大象声科(深圳)科技有限公司 | 一种基于深度学习的回声消除方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111654572A (zh) * | 2020-05-27 | 2020-09-11 | 维沃移动通信有限公司 | 音频处理方法、装置、电子设备及存储介质 |
CN114650340A (zh) * | 2022-04-21 | 2022-06-21 | 深圳市中科蓝讯科技股份有限公司 | 一种回声消除方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110347863B (zh) | 话术推荐方法和装置及存储介质 | |
US10356249B2 (en) | Echo time delay detection method, echo elimination chip, and terminal equipment | |
EP3611725A1 (en) | Voice signal processing model training method, electronic device, and storage medium | |
CN101917527B (zh) | 回声消除的方法和装置 | |
US9246545B1 (en) | Adaptive estimation of delay in audio systems | |
CN108806713B (zh) | 一种双讲状态检测方法及装置 | |
CN106157964A (zh) | 一种确定回声消除中***延时的方法 | |
CN106157967A (zh) | 脉冲噪声抑制 | |
EP3796629A1 (en) | Double talk detection method, double talk detection device and echo cancellation system | |
CN110944089A (zh) | 双讲检测方法及电子设备 | |
CN103685795A (zh) | 网络语音通信中的数据对齐方法和*** | |
CN110913073A (zh) | 一种语音处理方法及相关设备 | |
CN107580155A (zh) | 网络电话质量确定方法、装置、计算机设备和存储介质 | |
US20240005940A1 (en) | Echo cancellation method and apparatus, device, and storage medium | |
EP3057241B1 (en) | Power adjustment device and method | |
CN114333912B (zh) | 语音激活检测方法、装置、电子设备和存储介质 | |
CN111081269B (zh) | 通话过程中的噪声检测方法及*** | |
CN105791602B (zh) | 音质测试方法及*** | |
CN114171043B (zh) | 回声的确定方法、装置、设备以及存储介质 | |
CN115083412A (zh) | 语音交互方法及相关装置、电子设备、存储介质 | |
CN113643706B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN106340310A (zh) | 语音检测方法及装置 | |
CN103533193B (zh) | 残留回波消除方法及装置 | |
CN112750469A (zh) | 语音中检测音乐的方法、语音通信优化方法及对应的装置 | |
RU148617U1 (ru) | Адаптивный инвариантный эхокомпенсатор |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200331 |
|
RJ01 | Rejection of invention patent application after publication |