CN107910013B - 一种语音信号的输出处理方法及装置 - Google Patents

一种语音信号的输出处理方法及装置 Download PDF

Info

Publication number
CN107910013B
CN107910013B CN201711104384.1A CN201711104384A CN107910013B CN 107910013 B CN107910013 B CN 107910013B CN 201711104384 A CN201711104384 A CN 201711104384A CN 107910013 B CN107910013 B CN 107910013B
Authority
CN
China
Prior art keywords
signal
voice
amplitude
noise
background noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711104384.1A
Other languages
English (en)
Other versions
CN107910013A (zh
Inventor
杨宗业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201711104384.1A priority Critical patent/CN107910013B/zh
Publication of CN107910013A publication Critical patent/CN107910013A/zh
Application granted granted Critical
Publication of CN107910013B publication Critical patent/CN107910013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明适用于信号处理技术领域,提供了一种语音信号的输出处理方法及装置,包括方法包括:从实时获取的声音信号中识别出语音信号和背景噪声信号;获取所述语音信号与所述背景噪声信号的幅度差值;基于所述幅度差值对所述声音信号进行降噪处理。使得对语音信号的处理更有针对性,避免了通过AGC对音量进行控制是仅基于语音信号的高低进行处理导致的信噪比不高的问题。

Description

一种语音信号的输出处理方法及装置
技术领域
本发明属于信号处理技术领域,尤其涉及一种语音信号的输出处理方法及装置。
背景技术
用户在开车时可以在免提通话模式下使用手机进行通话,现有技术中通过自动增益控制(Automatic Gain Gontrol,AGC)自适应调整增益对手机声音信号进行处理,在声音信号很大的情况下,可以自适应减小声音信号,在声音信号很小的情况下,可以自适应增大声音信号,从而自动保持输出的声音信号幅度在很小范围内变化。然而通过AGC的方式增大声音信号的同时也会把噪声放大,发送的语音性噪比较差,用户通话体验不好。
发明内容
有鉴于此,本发明实施例提供了一种语音信号的输出处理方法及装置,以解决现有技术中使用AGC对语音进行调整导致的信噪比较差的问题。
本发明实施例的第一方面提供了一种语音信号的输出处理方法,包括:
从实时获取的声音信号中识别出语音信号和背景噪声信号;
获取所述语音信号与所述背景噪声信号的幅度差值;
基于所述幅度差值对所述声音信号进行降噪处理。
本发明实施例的第二方面提供了一种语音信号的输出处理装置,包括:
音频信号获取单元,用于从实时获取的声音信号中识别出语音信号和背景噪声信号;
幅度差值计算单元,用于获取所述语音信号与所述背景噪声信号的幅度差值;
处理单元,用于基于所述幅度差值对所述声音信号进行降噪处理。
本申请的第三方面提供了一种终端设备,包括:
包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现本申请第一方面提供的所述语音信号的输出处理方法的步骤。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本申请第一方面提供的所述语音信号的输出处理方法的步骤。
本申请的第五方面提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被一个或多个处理器执行时实现本申请第一方面提供的所述语音信号的输出处理方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:本申请通过从实时获取的声音信号中识别出语音信号和背景噪声信号;获取所述语音信号与所述背景噪声信号的幅度差值;基于所述幅度差值对所述声音信号进行降噪处理。使得对语音信号的处理更有针对性,避免了通过AGC对音量进行控制是仅基于语音信号的高低进行处理导致的信噪比不高的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的语音信号的输出处理方法的实现流程示意图;
图2是本发明实施例二提供的语音信号的输出处理方法的实现流程示意图;
图3是本发明实施例三提供的语音信号的输出处理装置的示意图;
图4是本发明实施例四提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
图1是本发明实施例一提供的语音降噪的方法的实现流程示意图,本申请实施例提供的语音降噪方法可以应用于移动手机、笔记本、平板电脑、车载***、可穿戴的电子设备等带有语音接收元件的电子设备,如图所示该方法可以包括以下步骤:
步骤S101,从实时获取的声音信号中识别出语音信号和背景噪声信号。
在本实施例中,用户在开车过程中,可以开启免提模式通过手机进行通话,由于在免提模式下,手机一般放在汽车的手机座上,由于手机距离用户的距离较远,因此,手机在接收用户的语音信号的同时,还会接收到汽车在运行过程中产生的背景噪声,例如轮胎与路面磨擦所产生的胎噪,空调风机产生的空调噪声,以及车辆行驶过程中空气与车辆缝隙、边角摩擦产生的风噪。上述背景噪声属于信号幅度变化较小,且重复频率较高的稳态噪声。在用户通话的过程中,上述噪声一般都会持续存在,而语音装置在对声音信号进行AGC调整时,上述噪声会对声音信号的质量产生显著的影响。
本实施例中,首先需要根据语音信号和背景噪声信号的信号特点对信号进行识别。可以通过预先存储人声模型和噪声模型的方式来对上述语音和背景噪声进行识别。所述模型包含该声音的语音特征,比如频率、过零率、短时平均能量、短时平均幅度等。例如,在对声音信号采样之后,将所述声音信号与语音模型进行匹配,如果声音信号中包含了人声模型中的所有特征,即表明当前有人正在说话,如果所述声音信号无法匹配人声模型,则有可能是用户声音过小,或者背景噪声过大,表明从当前获取的声音中无法识别出人声,此时手机可以向用户发出错误提醒,例如手机可以发出“无法获取用户声音”的提示信息。同样的,可以根据预先存储的胎噪模型、空调噪声模型或者风噪模型对获取的声音信号进行识别,从而能够判断出当前声音信号中包含的噪声类型。
步骤S102,获取所述语音信号与所述背景噪声信号的幅度差值;
在本实施例中,根据步骤S101中的人声模型识别出声音信号中包含人声和背景噪声之后,可以针对上述模型的特征对所述人声和背景噪声进行提取,根据记录到的声音波形来计算一段时间内采集到的声音信号中的代表人声的语音信号平均幅度和背景噪声信号的平均幅度。
步骤S103,基于所述幅度差值对所述声音信号进行降噪处理。
在本实施例中,首先对步骤S102中获取的语音信号幅度和背景噪声信号幅度求绝对值,然后计算语音信号幅度的绝对值和背景噪声信号幅度的绝对值之间的差值。本实施例根据所述差值的不同,分别选择预设的处理方法,使得对语音信号的处理更有针对性,避免了通过AGC仅基于语音信号的高低进行处理导致的信噪比不高的问题。
可选的,在识别出语音信号和背景噪声信号之前,包括:对所述声音信号进行预滤波。
在本实施例中,考虑到声音信号可能会收到随机噪声的干扰,例如高斯噪声。如果对带有随机噪声的声音信号进行识别,可能由于随机噪声的干扰产生识别错误。因此,在本实施例中,在对声音信号进行识别之前先进行预滤波。由于环境中的随机噪声是互不相关的,在信号中表现为高频特性,因此可以首先将获取到的声音信号在频域中进行低通滤波,从而滤除掉声音信号中明显属于噪声信号的高频部分,以便提高后续对人声识别和噪声识别的准确性。
实施例二
本实施例以实施例一为基础,具体的,所述基于所述幅度差值对所述声音信号进行降噪处理,包括:若所述幅度差值为正值,且大于或等于第一阈值时,对所述声音信号进行降噪处理,且所述降噪处理的强度与所述幅度差值成正比。
在本实施例中,当用户的语音信号幅度大于噪声信号幅度时,判断所述差值与第一阈值的大小,本实施例通过将差值与第一阈值的大小进行比较,根据比较的结果分别采取相应的降噪方法。
当所述差值大于等与第一阈值时,即噪声信号的幅度显著小于语音信号的幅度。表明当前语音信号质量较好,受噪声影响不明显,可以采用常规的降噪算法对声音信号进行降噪处理,例如本领域中常用的幅度谱减法,谐波增强法,噪声对消法,在此不对降噪的处理算法作出限制。对于上述降噪算法的具体使用可以参考现有技术,在此不作赘述。在本实施例中,根据所述差值的大小来选择降噪处理的强度。一般来讲,降噪处理的强度越大则对噪声的去除效果越好,但是对正常的用户发出的语音信号也会产生严重的失真。因此,可选的,当所述差值较大时,表明语音信号受噪声影响较小,噪声与语音之间混叠不严重,因此可以加大降噪处理的强度,当所述差值较小时,表明噪声信号对语音信号存在一定的影响,即噪声和语音之间存在一定的混叠,因此,相应地减少降噪处理的强度。根据语音信号幅度和噪声信号幅度之间差值的大小动态调整降噪处理的强度,提高了降噪处理的声音质量。
可选的,如图2所示,若所述幅度差值为正值,且所述幅度差值小于或等于第二阈值,且所述语音信号的幅度大于第三阈值时,包括:
步骤S201,将所述声音信号放大预设增益,得到第一中间信号。
步骤S202,对所述第一中间信号进行降噪处理,得到第二中间信号。
步骤S203,按照所述预设增益衰减所述第二中间信号,得到降噪处理后的所述声音信号。
在本实施例中,当所述差值S为正值且小于第二阈值T时,表明当前噪声情况比较严重,其中,所属第二阈值T可以等于第一阈值,或者也可以小于第一阈值。如果直接对当前语音信号进行降噪处理,所得到的语音信号并不十分理想。因此,在本实施例中,首先将声音信号按照预设的增益A进行放大,即声音信号中的语音信号和噪声信号均按照增益A进行放大,得到第一中间信号。由此可见,第一中间信号中的语音信号幅度和噪声信号幅度之间的差值也按照增益A放大,因此,将声音信号按照增益A放大之后在进行降噪处理,可以显著降低对正常的用户语音信号的影响,所述增益A的值可以根据所述差值S和第二阈值T来计算。具体的:A≥T/S。通过计算到的增益A。可以使得信号增益调整后的差值S'大于第二阈值T,然后对所属第一中间信号进行降噪处理,得到第二中间信号。降噪处理后的第二中间信号再按照增益A进行衰减,衰减后即得到降噪处理后的声音信号。为了保证降噪的效果,在本实施例中,所述语音信号的幅度大于需要大于第三阈值。所属第三阈值可以根据手机的性能和所使用的降噪算法共同决定。所述增益A相应的不能超过一个最大阈值,使得增益后的声音信号的幅度值不会大于削波点。因为如果经增益后的信号超过了削波点,经增益放大后的信号将无法被记录,即便再经过相同增益进行衰减也无法获取原始信号。
在本实施例中,当所述幅度差值为正值,且所述幅度差值小于或等于第二阈值,且所述语音信号的幅度大于第三阈值时,将所述声音信号放大预设增益后对所述声音信号进行降噪处理,然后按照所述预设增益衰减所述降噪处理后的声音信号,不仅保证信号大小不变,而且提高了语音信号的信噪比,提高了用户的体验。
可选的,所述声音模型包括特定用户的声音模型,在开车过程中,可能除了用户在使用免提模式通话以外,可能还有其他乘客在讲话,因此,在使用声音模型识别语音信号时,首先根据特定用户的声音模型识别出特定用户的声音。然后根据声音模型识别是否包括除特定用户以外的人声。若还存在特定用户以外的人声,且特定用户以外的人声的信号幅度大于特定用户的声音信号幅度,则通过本实施例中的降噪方法可能无法实现对特定用户语音的增强。在这种情况下,可以向用户发出提醒,当前他人说话声音过大,可能影响通话效果。
可选的,可以将上述公开的降噪方法与传统的自动增益控制(AGC)结合,具体的,在识别出声音信号包括用户的语音信号和背景噪声之后,将获取到的语音信号先经过AGC处理,使得语音信号幅度在很小的范围内变化,然后获取声音信号中的语音信号幅度和背景噪声信号幅度;计算语音信号幅度和背景噪声信号幅度之间的差值,当所述差值为正值且大于等于第一阈值时,对所述声音信号进行降噪处理,且所述降噪处理的强度与所述差值成正比;当所述差值为正值且小于第一阈值时,将所述声音信号放大预设增益后对所述声音信号进行降噪处理,然后按照所述预设增益衰减所述降噪处理后的声音信号。通过将传统的AGC方法与本实施例中的降噪方法结合,可以进一步优化语音降噪的效果。
实施例三
本实施例以实施例一为基础,具体的,所述基于所述幅度差值对所述声音信号进行降噪处理,包括:若所述幅度差值为非正值,输出提示信息,所述提示信息用于提示用户靠近麦克风通话或者增大说话音量。
在本实施例中,当用户的语音信号幅度与噪声信号幅度的差值S为0,即语音信号和噪声信号相同;或者所述差值S为负值时,即语音信号的幅度小于噪声信号,由于背景噪声为加性噪声,当所述幅度差值为非正值的情况下,用户的语音会被噪声信号覆盖,在此种情况下对噪声信号进行降噪处理也会对正常的用户语音信号进行处理,从而导致用户的语音发生严重失真。因此,在本实施例中,当所述差值为非正值时,可以通过手机的音频输出单元向用户发出提醒,例如,提示用户声音过小,或者噪声过大,提示用户靠近手机说话或者大声说话。
可选的,可以结合检测用户与手机之间的距离来对手机提示内容进行调整。
在本实施例中,如实施例一中,根据声音模型识别出声音信号中包含人的语音信号,以及噪声信号。并具体识别出噪声信号为胎噪、风噪、空调噪声。若所述语音信号幅度与噪声信号幅度的差值为非正值,且用户与手机之间的距离小于预设值时,即表示用户当前已经离手机很近,无法靠接近手机说话来解决通话噪音的问题,因此在提示用户声音无法听清的同时,可以同时提示用户噪声的来源,以便用户有针对性的解决,例如通过语音识别发现是空调噪声幅度大于用户的语音信号幅度,则提醒用户空调噪声过大,并告知用户可以通过减小空调风速。若通过语音识别发现是风噪幅度大于用户的语音信号幅度,则提示用户风噪过大,并建议用户可以降低车速。本实施例通过识别出的噪声来源,在无法通过接近手机讲话来解决噪声问题的情况下,通过提醒用户当前噪声的主要来源,以便用户可以相应的采取解决方案,使用户能够方便、准确地解决降低语音的噪声,提高用户的体验。
实施例四
图3示出了本实施例提供的语音信号的输出处理装置的组成结构,为了便于说明,仅示出了与本实施例相关的部分。
在本实施例中,所述装置用于实现图1实施例所述的语音信号的输出处理方法,可以是内置于移动终端的软件单元、硬件单元或者软硬件结合的单元。所述移动终端包括但不限于智能手机、平板电脑、学习机或者智能车载设备等。
如图3所示,所述语音信号的输出处理装置3包括:
音频信号获取单元301,用于从实时获取的声音信号中识别出语音信号和背景噪声信号;
幅度差值计算单元302,用于获取所述语音信号与所述背景噪声信号的幅度差值;
处理单元303,用于基于所述幅度差值对所述声音信号进行降噪处理。
可选的,所述语音信号的输出处理装置还包括:
提示单元,用于若所述幅度差值为非正值,输出提示信息,所述提示信息用于提示用户靠近麦克风通话或者增大说话音量。
可选的,所述处理单元还包括:
第一处理子单元,用于若所述幅度差值为正值,且所述幅度差值的小于或等于第二阈值,且所述语音信号的幅度大于第三阈值时,将所述声音信号放大预设增益,得到第一中间信号;
对所述第一中间信号进行降噪处理,得到第二中间信号;
按照所述预设增益衰减所述第二中间信号,得到降噪处理后的所述声音信号。
可选的,所述处理单元还包括:
第二处理子单元,用于若所述幅度差值为正值,且大于或等于第一阈值时,对所述声音信号进行降噪处理,且所述降噪处理的强度与所述幅度差值成正比。
可选的,所述语音信号的输出处理装置,还包括:
预处理单元,用于在识别出语音信号和背景噪声信号之前对所述声音信号进行预滤波。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4是本发明一实施例提供的终端设备的示意图。如图4所示,该实施例的终端设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个语音信号的输出处理方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各单元的功能,例如图3所示单元301至303的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。例如,所述计算机程序42可以被分割成同步模块、汇总模块、获取模块、返回模块(虚拟装置中的模块),各模块具体功能如下:
所述终端设备4可以是笔记本、掌上电脑、手机、平板电脑及导航仪等具有语音输入输出功能的计算设备。所述终端设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种语音信号的输出处理方法,其特征在于,包括:
从实时获取的声音信号中识别出语音信号和背景噪声信号,包括:通过预先存储人声模型和噪声模型的方式来对所述语音和背景噪声进行识别,针对所述模型的特征对所述人声和背景噪声进行提取;其中,所述人声模型包含人声声音的语音特征,包括:频率、过零率、短时平均能量、短时平均幅度;
获取所述语音信号与所述背景噪声信号的幅度差值,包括:根据记录到的声音波形来计算一段时间内采集到的声音信号中的代表人声的语音信号平均幅度和背景噪声信号的平均幅度,对获取的语音信号平均幅度和背景噪声信号平均幅度求绝对值,然后计算语音信号平均幅度的绝对值和背景噪声信号平均幅度的绝对值之间的差值;
基于所述幅度差值对所述声音信号进行降噪处理,包括:
若所述幅度差值S为正值,且大于或等于第一阈值时,对所述声音信号进行降噪处理,且所述降噪处理的强度与所述幅度差值成正比;
若所述幅度差值为正值,且所述幅度差值小于或等于第二阈值T,且所述语音信号的幅度大于第三阈值时,
将所述声音信号放大预设增益A,得到第一中间信号;其中,A≥T/S;
对所述第一中间信号进行降噪处理,得到第二中间信号;
按照所述预设增益衰减所述第二中间信号,得到降噪处理后的所述声音信号。
2.如权利要求1所述的语音信号的输出处理方法,其特征在于,所述基于所述幅度差值对所述声音信号进行降噪处理,包括:
若所述幅度差值为非正值,输出提示信息,所述提示信息用于提示用户靠近麦克风通话或者增大说话音量。
3.如权利要求1所述的语音信号的输出处理方法,其特征在于,在识别出语音信号和背景噪声信号之前,包括:
对所述声音信号进行预滤波。
4.一种语音信号的输出处理装置,其特征在于,包括:
音频信号获取单元,用于从实时获取的声音信号中识别出语音信号和背景噪声信号,包括:通过预先存储人声模型和噪声模型的方式来对所述语音和背景噪声进行识别,针对所述模型的特征对所述人声和背景噪声进行提取;其中,所述人声模型包含人声声音的语音特征,包括:频率、过零率、短时平均能量、短时平均幅度;
幅度差值计算单元,用于获取所述语音信号与所述背景噪声信号的幅度差值,包括:根据记录到的声音波形来计算一段时间内采集到的声音信号中的代表人声的语音信号平均幅度和背景噪声信号的平均幅度,对获取的语音信号平均幅度和背景噪声信号平均幅度求绝对值,然后计算语音信号平均幅度的绝对值和背景噪声信号平均幅度的绝对值之间的差值;
处理单元,用于基于所述幅度差值对所述声音信号进行降噪处理,包括:
若所述幅度差值S为正值,且大于或等于第一阈值时,对所述声音信号进行降噪处理,且所述降噪处理的强度与所述幅度差值成正比;
若所述幅度差值为正值,且所述幅度差值小于或等于第二阈值T,且所述语音信号的幅度大于第三阈值时,
将所述声音信号放大预设增益A,得到第一中间信号;其中,A≥T/S;
对所述第一中间信号进行降噪处理,得到第二中间信号;
按照所述预设增益衰减所述第二中间信号,得到降噪处理后的所述声音信号。
5.如权利要求4所述的语音信号的输出处理装置,其特征在于,所述处理单元包括:
提示单元,用于若所述幅度差值为非正值,输出提示信息,所述提示信息用于提示用户靠近麦克风通话或者增大说话音量。
6.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述方法的步骤。
CN201711104384.1A 2017-11-10 2017-11-10 一种语音信号的输出处理方法及装置 Active CN107910013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711104384.1A CN107910013B (zh) 2017-11-10 2017-11-10 一种语音信号的输出处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711104384.1A CN107910013B (zh) 2017-11-10 2017-11-10 一种语音信号的输出处理方法及装置

Publications (2)

Publication Number Publication Date
CN107910013A CN107910013A (zh) 2018-04-13
CN107910013B true CN107910013B (zh) 2021-09-24

Family

ID=61844674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711104384.1A Active CN107910013B (zh) 2017-11-10 2017-11-10 一种语音信号的输出处理方法及装置

Country Status (1)

Country Link
CN (1) CN107910013B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831500B (zh) * 2018-05-29 2023-04-28 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN109102800A (zh) * 2018-07-26 2018-12-28 广州酷狗计算机科技有限公司 一种确定歌词显示数据的方法和装置
CN110164423B (zh) 2018-08-06 2023-01-20 腾讯科技(深圳)有限公司 一种方位角估计的方法、设备及存储介质
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN111383647B (zh) * 2018-12-28 2022-10-25 展讯通信(上海)有限公司 语音信号处理方法及装置、可读存储介质
CN109639904B (zh) * 2019-01-25 2021-02-02 努比亚技术有限公司 一种手机模式调整方法、***及计算机存储介质
CN111768794A (zh) * 2019-03-15 2020-10-13 上海博泰悦臻网络技术服务有限公司 一种语音降噪方法、语音降噪***、设备及存储介质
CN111796790B (zh) * 2019-04-09 2023-09-08 深圳市冠旭电子股份有限公司 一种音效调节方法、装置、可读存储介质及终端设备
CN110097884B (zh) * 2019-06-11 2022-05-17 大众问问(北京)信息科技有限公司 一种语音交互方法和装置
CN112911441A (zh) * 2021-01-18 2021-06-04 上海闻泰信息技术有限公司 降噪方法、装置、音频设备和计算机可读存储介质
CN116168719A (zh) * 2022-12-26 2023-05-26 杭州爱听科技有限公司 一种基于语境分析的声音增益调节方法及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101272131A (zh) * 2007-03-13 2008-09-24 瑞昱半导体股份有限公司 具噪声消除功能的可编程增益放大器
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
US8321215B2 (en) * 2009-11-23 2012-11-27 Cambridge Silicon Radio Limited Method and apparatus for improving intelligibility of audible speech represented by a speech signal
US8364477B2 (en) * 2005-05-25 2013-01-29 Motorola Mobility Llc Method and apparatus for increasing speech intelligibility in noisy environments
CN104064185A (zh) * 2013-03-18 2014-09-24 联想(北京)有限公司 信息处理方法及***、电子设备
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CN105845151A (zh) * 2016-05-30 2016-08-10 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN106782586A (zh) * 2016-11-14 2017-05-31 阔地教育科技有限公司 一种音频信号处理方法及装置
CN107092461A (zh) * 2017-06-01 2017-08-25 深圳天珑无线科技有限公司 录音方法、装置和计算机可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
CN104376848B (zh) * 2013-08-12 2018-03-23 展讯通信(上海)有限公司 语音信号处理方法和装置
CN104810024A (zh) * 2014-01-28 2015-07-29 上海力声特医学科技有限公司 一种双路麦克风语音降噪处理方法及***
CN106898360B (zh) * 2017-04-06 2023-08-08 北京地平线信息技术有限公司 音频信号处理方法、装置和电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8364477B2 (en) * 2005-05-25 2013-01-29 Motorola Mobility Llc Method and apparatus for increasing speech intelligibility in noisy environments
CN101272131A (zh) * 2007-03-13 2008-09-24 瑞昱半导体股份有限公司 具噪声消除功能的可编程增益放大器
US8321215B2 (en) * 2009-11-23 2012-11-27 Cambridge Silicon Radio Limited Method and apparatus for improving intelligibility of audible speech represented by a speech signal
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
CN104064185A (zh) * 2013-03-18 2014-09-24 联想(北京)有限公司 信息处理方法及***、电子设备
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
CN105845151A (zh) * 2016-05-30 2016-08-10 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN106782586A (zh) * 2016-11-14 2017-05-31 阔地教育科技有限公司 一种音频信号处理方法及装置
CN107092461A (zh) * 2017-06-01 2017-08-25 深圳天珑无线科技有限公司 录音方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN107910013A (zh) 2018-04-13

Similar Documents

Publication Publication Date Title
CN107910013B (zh) 一种语音信号的输出处理方法及装置
CN110459234B (zh) 用于车载的语音识别方法及***
US20190206415A1 (en) Method for processing voice in interior environment of vehicle and electronic device
EP3698360A1 (en) Noise reduction using machine learning
US20140114665A1 (en) Keyword voice activation in vehicles
CN108335694B (zh) 远场环境噪声处理方法、装置、设备和存储介质
US10553236B1 (en) Multichannel noise cancellation using frequency domain spectrum masking
CN108305637B (zh) 耳机语音处理方法、终端设备及存储介质
CN110970051A (zh) 语音数据采集方法、终端及可读存储介质
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN106251856A (zh) 一种基于移动终端的环境噪声消除***及方法
CN203219384U (zh) 一种处理通话环境噪声的装置及移动终端
US20140244245A1 (en) Method for soundproofing an audio signal by an algorithm with a variable spectral gain and a dynamically modulatable hardness
CN104505099A (zh) 去除语音信号中已知干扰的方法和设备
EP2752848A1 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
CN110503973B (zh) 音频信号瞬态噪音抑制方法、***以及存储介质
US20220301574A1 (en) Systems, methods, apparatus, and storage medium for processing a signal
CN103824563A (zh) 一种基于模块复用的助听器去噪装置和方法
CN109360578B (zh) 音频设备的回声消除方法、音频设备及可读存储介质
CN113362845A (zh) 声音数据降噪方法、装置、设备、存储介质及程序产品
CN104867498A (zh) 一种移动通讯终端及其语音增强方法和模块
CN108899041B (zh) 语音信号加噪方法、装置及存储介质
US20230320903A1 (en) Ear-worn device and reproduction method
CN114255779A (zh) 用于vr设备的音频降噪方法、电子设备和存储介质
CN114302286A (zh) 一种通话语音降噪方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant after: OPPO Guangdong Mobile Communications Co.,Ltd.

Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant