CN106409309A - 一种音质增强的方法和麦克风 - Google Patents
一种音质增强的方法和麦克风 Download PDFInfo
- Publication number
- CN106409309A CN106409309A CN201610921813.3A CN201610921813A CN106409309A CN 106409309 A CN106409309 A CN 106409309A CN 201610921813 A CN201610921813 A CN 201610921813A CN 106409309 A CN106409309 A CN 106409309A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- voice
- status
- tonequality
- carried out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims description 41
- 230000007704 transition Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 abstract description 11
- 230000005284 excitation Effects 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例提出了一种音质增强的方法和麦克风,其中该方法包括:对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。以此通过对声音信号进行处理,以获取到更优质的声音信号,提高用户的使用体验。
Description
技术领域
本发明涉及音频处理领域,特别涉及一种音质增强的方法和麦克风。
背景技术
在现有技术中,涉及到音频处理的场景,特别是在会议的场景下,由于存在有外界噪音的存在,且本身人声的处理不合理,在很多会议场所由于空间大且参会人员多会出现离麦克风远的说话声音小,说话断字或不清晰的现象,导致用户的体验不好。
发明内容
针对现有技术中的缺陷,本发明提出了一种音质增强的方法和麦克风,用以保证用户的使用体验。
具体的,本发明提出了以下具体的实施例:
本发明实施例提出了一种音质增强的方法,应用于内部嵌入浮点库的ARM架构的***,该方法包括:
对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。
在一个具体的实施例中,所述对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号,具体包括:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
在一个具体的实施例中,该方法还包括:
对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
在一个具体的实施例中,对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号,具体包括:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
在一个具体的实施例中,对音质增强后的声音信号进行自动增益处理,具体包括:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
本发明实施例还提出了一种麦克风,所述麦克风内部嵌入浮点库的ARM架构的***,该麦克风包括:
识别模块,用以对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
转换模块,用于对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
第一处理模块,用于对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;
第二处理模块,用于对音质增强后的声音信号进行自动增益处理。
在一个具体的实施例中,所述识别模块,具体用于:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
在一个具体的实施例中,该麦克风还包括:
过渡模块,用于对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
在一个具体的实施例中,所述第一处理模块,具体用于:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
在一个具体的实施例中,所述第二处理模块,具体用于:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
与现有技术相比,本发明实施例提出了一种音质增强的方法和麦克风,其中该方法包括:对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。以此通过对声音信号进行处理,以获取到更优质的声音信号,提高用户的使用体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提出的一种音质增强的方法的流程示意图;
图2为本发明实施例提出的一种音质增强的方法的示意图;
图3为本发明实施例提出的一种麦克风的结构示意图;
图4为本发明实施例提出的一种麦克风的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和出示的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下,根据实施例及附图对本发明作进一步的详细说明:
本发明公开了一种音质增强的方法,应用于内部嵌入浮点库的ARM架构的***,如图1所示,该方法包括:
步骤101、对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
步骤102、对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
步骤103、对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;
步骤104、对音质增强后的声音信号进行自动增益处理。
由于对音频的处理以及产生舒适噪音时需要使用大量的浮点运算。如果使用定点计算,会花费很长的时间,也耗费较多的资源,精度相对也会比较差,相比浮点运算也差一些;因此本发明提出了具体的处理的***为内部嵌入浮点库的ARM架构的***,以此可以提高处理的效率,消耗的资源相对较小,且精度更高。
步骤101的执行可以利用VAD(Voice Activity Detection,语音活动检测、又称语音端点检测、或语音边界检测)技术来实现;具体的,识别出的非语音状态下的声音信号即为噪音。
步骤102中的舒适噪音是一类特殊的噪音,由算法生成,起到使人放松或者引起警觉的作用;不同于一般噪音,不会使人产生烦躁或对人身体产生伤害。通过对非语音状态下的声音信号也即一般的噪音进行转换,转换为舒适噪音,以提高具体应用场景下,例如会议的语音质量。
而步骤103的执行可以利用带通滤波器来实现,特别是FIR滤波器,也即FiniteImpulse Response滤波器,或有限长单位冲激响应滤波器,以及非递归型滤波器来实现。
以此,一种具体的方法流程示意图可以如图2所示。
通过以上方式,兼顾了语音传输高速性和准确性,降低了硬件成本;提高了麦克风的音质;提高了麦克风的拾音距离;本发明采用的新型舒适噪音生成改善了会议环境,使得参会的人员获得舒适的听感。以此通过对音频信号进行处理,获取到更优质的声音信号,提高用户的使用体验。
实施例1
本发明实施例1公开了一种音质增强的方法,应用于内部嵌入浮点库的ARM架构的***,如图1所示,该方法包括:
步骤101、对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
步骤102、对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
步骤103、对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;
步骤104、对音质增强后的声音信号进行自动增益处理。
在一个具体的实施例中,步骤101,也即所述对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号,具体包括:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
具体的,语音状态识别是VAD判断来实现的,VAD判断又称语音端点检测,语音边界检测。目的是从声音信号流里识别和语音状态和非语音状态。本发明实施例主要使用了信号的能量阈值判别。基本的思路是当信号的能量低于某一经验门限并达到一定延时,判断该信号为噪音;当信号的能量高一某一门限值并达到一定延时,判断该信号为语音,也即语音状态的声音信号。
为了实现语音和非语音状态的声音信号的过渡带平稳,该方法还可以包括:
对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
在此以一个具体的实施例来进行说明,在该具体的实施例中,设置了多3个阈值区间(分别为三个阈值E1、E2、E3)和理想能量值,其中,理想能量值是开会时正常通话音量长时采样平均能量。3个阈值分别取标准能量值的0.2-0.4、0.08-0.2和0.05-0.08。也即E1>E2>E3。
以此,对于只达到了第一个阈值E1的声音做3db衰减;达到第二个阈值E2声音做6db衰减。
若达到最后一个阈值E3的声音,则会进行转换处理,替换成舒适噪音。
此外,以上每达到一个阈值时还需要做100毫秒的延时判断,必须在这100ms内的能量持续的低于阈值才能进行下一步计算。如此使得语音和非语音状态的声音信号的过渡带平稳,不会出现卡字和掉字的现象。
步骤102,也即对噪音进行转换,在一个具体的实施例中,可以采用"线性同余法",每次调用时需要输入不同的“seed”值,以此产生不同的“噪声”序列。
此外,本发明时实施例还会对噪音的高频部分进行衰减处理。具体的,可以采用FIR滤波器制作一个低通滤波对5000Hz以上的噪音进行过滤以及衰减处理,在实际的应该中,可以有效减小6000Hz以上对人耳刺激较大的频段。当然,具体的,还可以根据需要对其他的频段进行处理,以满足不同的需要。
在一个具体的实施例中,步骤103,也即对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号,具体包括:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
在此,一个具体的实施例来进行说明,在该实施例中,考虑到人声乐音的频谱分布以2500Hz为中点,因此对该频谱下的声音进行激励,具体的,可以进行3-6db的增强,所产生的效果比较自然舒适、对增加音源突出感的作用也比较明显。
而对人声鼻音频谱分布以500Hz为中点,对其进行激励处理,具体的,可以进行3-6db的增强,可以有效地增大人声的劲度感。
至于对人声3500-6800Hz范围内的频谱,不宜使用激励处理,因为它容易使音源产生令人不悦的嘈杂声响,可以适当衰减;例如,可以做了6db的衰减。
此外,在实际的应该中,对人声的齿音一般应避免使用激励处理,因为此频段的失真很容易被人察觉。当然如果是使用激励效果比较柔和的数字式激励器,也可以对齿音做轻微的激励处理,以用于加重齿音的清晰感。其处理的频谱应在7200Hz以上。
本实施例可以采用FIR滤波器(Finite Impulse Response滤波器:有限长单位冲激响应滤波器,又称为非递归型滤波器)来设计带通滤波器,对500Hz和3400Hz段进行增强过度带宽是200Hz。对6800Hz段的声音做了6db的衰减,过度带宽是500Hz。采用FIR滤波器,结构简单,只用了乘法加法,计算时间确定,没有迭代的过程,很适合计算机计算,也很容易地设计成特定相位的滤波器。只需要对一个乘加循环就可以完成FIR滤波计算。
在一个具体的实施例中,步骤104、也即对音质增强后的声音信号进行自动增益处理,具体包括:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
由于信号在经过滤波降噪等一系列的处理之后,信号的幅度会出现一定幅度的衰减,同时为了获得比较稳定响亮舒适的听觉效果,需要在话音激活检测之后,根据检测结果对语音信号进行自动增益调节。其数学模型为:
其中,Xi为当前输入信号,M为平均滤波器的长度。AGC_maxinum和AGC_minum是期望的音量范围。以此任何超过了这个范围的音量会被算法调整到这个范围附近。以此自动增益帮助下麦克风会根据人与会议电话之间的距离远近来调整收音的大小,人离的远一点讲话,会把声音放大传给对方,人离的近讲话,会议电话会把声音变小一点传给对方,使对方听上去声音大小差不多。本发明拾音距离可以达到5米,是市场同类产品的三倍。
本发明实施例提出了一种音质增强的方法和麦克风,其中该方法包括:对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。以此通过对声音信号进行处理,以获取到更优质的声音信号,提高用户的使用体验。
实施例2
本发明实施例2还公开了一种麦克风,所述麦克风内部嵌入浮点库的ARM架构的***,如图3所示,该麦克风包括:
识别模块201,用以对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
转换模块202,用于对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
第一处理模块203,用于对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;
第二处理模块204,用于对音质增强后的声音信号进行自动增益处理。
在一个具体的实施例中,所述识别模块201,具体用于:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
如图4所示,该麦克风还包括:
过渡模块205,用于对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
在一个具体的实施例中,所述第一处理模块203,具体用于:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
在一个具体的实施例中,所述第二处理模块204,具体用于:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
本发明实施例提出了一种音质增强的方法和麦克风,其中该方法包括:对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。以此通过对声音信号进行处理,以获取到更优质的声音信号,提高用户的使用体验。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本发明的几个具体实施场景,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (10)
1.一种音质增强的方法,其特征在于,应用于内部嵌入浮点库的ARM架构的***,该方法包括:
对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;并对音质增强后的声音信号进行自动增益处理。
2.如权利要求1所述的方法,其特征在于,所述对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号,具体包括:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
3.如权利要求2所述的方法,其特征在于,该方法还包括:
对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
4.如权利要求1所述的方法,其特征在于,对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号,具体包括:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
5.如权利要求1所述的方法,其特征在于,对音质增强后的声音信号进行自动增益处理,具体包括:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
6.一种麦克风,其特征在于,所述麦克风内部嵌入浮点库的ARM架构的***,该麦克风包括:
识别模块,用以对获取的声音信号进行语音状态识别,以识别出声音信号中的语音状态的声音信号和非语音状态下的声音信号;
转换模块,用于对非语音状态下的声音信号进行舒适噪音的转换,生成对应的舒适噪音;
第一处理模块,用于对语音状态下的声音信号进行按照频段的不同进行不同的衰减或激励处理,生成音质增强后的声音信号;
第二处理模块,用于对音质增强后的声音信号进行自动增益处理。
7.如权利要求6所述的麦克风,其特征在于,所述识别模块,具体用于:
对获取的声音信号进行能量检测,以获取声音信号的能量值;
若声音信号在一定延时范围内所保持的能量值都大于预设能量阈值,确定所述声音信号为语音状态的声音信号;
若声音信号在一定延时范围内所保持的能量值都小于预设能量阈值,确定所述声音信号为非语音状态的声音信号。
8.如权利要求7所述的麦克风,其特征在于,还包括:
过渡模块,用于对确定声音信号为语音状态的声音信号,确定在一定延时范围内所保持的能量值所处的范围;
基于不同的范围,对声音信号进行不同的衰减处理,以实现语音状态的声音信号与非语音状态的声音信号之间的平缓过渡。
9.如权利要求6所述的麦克风,其特征在于,所述第一处理模块,具体用于:
对语音状态下的声音信号进行按照频段的不同划分为多个不同的频段;
对于高频的频段进行衰减处理,同时对处于低频的频段进行激励处理,以生成音质增强后的声音信号。
10.如权利要求6所述的麦克风,其特征在于,所述第二处理模块,具体用于:
获取音质增强后的声音信号的音量信息;
利用平均滤波器将超过预设音量范围的音质增强后的声音信号的音量调整到预设音量范围内。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610921813.3A CN106409309A (zh) | 2016-10-21 | 2016-10-21 | 一种音质增强的方法和麦克风 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610921813.3A CN106409309A (zh) | 2016-10-21 | 2016-10-21 | 一种音质增强的方法和麦克风 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106409309A true CN106409309A (zh) | 2017-02-15 |
Family
ID=58012776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610921813.3A Pending CN106409309A (zh) | 2016-10-21 | 2016-10-21 | 一种音质增强的方法和麦克风 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106409309A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107230483A (zh) * | 2017-07-28 | 2017-10-03 | Tcl移动通信科技(宁波)有限公司 | 基于移动终端的语音音量处理方法、存储介质及移动终端 |
CN107316651A (zh) * | 2017-07-04 | 2017-11-03 | 北京中瑞智科技有限公司 | 基于麦克风的音频处理方法和装置 |
CN109410971A (zh) * | 2018-11-13 | 2019-03-01 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN110971769A (zh) * | 2019-11-19 | 2020-04-07 | 百度在线网络技术(北京)有限公司 | 通话信号的处理方法、装置、电子设备及存储介质 |
CN111147680A (zh) * | 2018-11-06 | 2020-05-12 | 成都鼎桥通信技术有限公司 | 小信号处理方法和装置 |
CN111654794A (zh) * | 2020-05-19 | 2020-09-11 | 歌尔智能科技有限公司 | Mems麦克风的信号处理方法、装置及mems麦克风 |
CN112185360A (zh) * | 2020-09-28 | 2021-01-05 | 苏州科达科技股份有限公司 | 语音数据识别方法、多人会议的语音激励方法及相关设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002006898A (ja) * | 2000-06-22 | 2002-01-11 | Asahi Kasei Corp | ノイズ低減方法及びノイズ低減装置 |
JP2005303574A (ja) * | 2004-04-09 | 2005-10-27 | Toshiba Corp | 音声認識ヘッドセット |
CN102436821A (zh) * | 2011-12-02 | 2012-05-02 | 海能达通信股份有限公司 | 一种自适应调节音效的方法和设备 |
CN103236263A (zh) * | 2013-03-27 | 2013-08-07 | 东莞宇龙通信科技有限公司 | 一种改善通话质量的方法、***及移动终端 |
CN104427068A (zh) * | 2013-09-06 | 2015-03-18 | 中兴通讯股份有限公司 | 一种语音通话方法及装置 |
CN104424033A (zh) * | 2013-09-02 | 2015-03-18 | 联想(北京)有限公司 | 一种电子设备及数据处理方法 |
CN104780259A (zh) * | 2014-01-14 | 2015-07-15 | 深圳富泰宏精密工业有限公司 | 通话语音质量自动调节***与方法 |
CN105278940A (zh) * | 2014-07-08 | 2016-01-27 | 北京航空航天大学 | 一种基于多核处理器架构的机器人混合***应用框架 |
-
2016
- 2016-10-21 CN CN201610921813.3A patent/CN106409309A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002006898A (ja) * | 2000-06-22 | 2002-01-11 | Asahi Kasei Corp | ノイズ低減方法及びノイズ低減装置 |
JP2005303574A (ja) * | 2004-04-09 | 2005-10-27 | Toshiba Corp | 音声認識ヘッドセット |
CN102436821A (zh) * | 2011-12-02 | 2012-05-02 | 海能达通信股份有限公司 | 一种自适应调节音效的方法和设备 |
CN103236263A (zh) * | 2013-03-27 | 2013-08-07 | 东莞宇龙通信科技有限公司 | 一种改善通话质量的方法、***及移动终端 |
CN104424033A (zh) * | 2013-09-02 | 2015-03-18 | 联想(北京)有限公司 | 一种电子设备及数据处理方法 |
CN104427068A (zh) * | 2013-09-06 | 2015-03-18 | 中兴通讯股份有限公司 | 一种语音通话方法及装置 |
CN104780259A (zh) * | 2014-01-14 | 2015-07-15 | 深圳富泰宏精密工业有限公司 | 通话语音质量自动调节***与方法 |
CN105278940A (zh) * | 2014-07-08 | 2016-01-27 | 北京航空航天大学 | 一种基于多核处理器架构的机器人混合***应用框架 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316651A (zh) * | 2017-07-04 | 2017-11-03 | 北京中瑞智科技有限公司 | 基于麦克风的音频处理方法和装置 |
CN107316651B (zh) * | 2017-07-04 | 2020-03-31 | 北京中瑞智科技有限公司 | 基于麦克风的音频处理方法和装置 |
CN107230483A (zh) * | 2017-07-28 | 2017-10-03 | Tcl移动通信科技(宁波)有限公司 | 基于移动终端的语音音量处理方法、存储介质及移动终端 |
CN111147680A (zh) * | 2018-11-06 | 2020-05-12 | 成都鼎桥通信技术有限公司 | 小信号处理方法和装置 |
CN109410971A (zh) * | 2018-11-13 | 2019-03-01 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN109410971B (zh) * | 2018-11-13 | 2021-08-31 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN110971769A (zh) * | 2019-11-19 | 2020-04-07 | 百度在线网络技术(北京)有限公司 | 通话信号的处理方法、装置、电子设备及存储介质 |
CN111654794A (zh) * | 2020-05-19 | 2020-09-11 | 歌尔智能科技有限公司 | Mems麦克风的信号处理方法、装置及mems麦克风 |
CN111654794B (zh) * | 2020-05-19 | 2021-05-18 | 歌尔智能科技有限公司 | Mems麦克风的信号处理方法、装置及mems麦克风 |
CN112185360A (zh) * | 2020-09-28 | 2021-01-05 | 苏州科达科技股份有限公司 | 语音数据识别方法、多人会议的语音激励方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106409309A (zh) | 一种音质增强的方法和麦克风 | |
CN103236263B (zh) | 一种改善通话质量的方法、***及移动终端 | |
CN103778920B (zh) | 数字助听器中语音增强和频响补偿相融合方法 | |
AU771444B2 (en) | Noise reduction apparatus and method | |
US5737719A (en) | Method and apparatus for enhancement of telephonic speech signals | |
CN101843119B (zh) | 助听器 | |
CN107547983B (zh) | 用于提高目标声音的可分离性的方法和听力装置 | |
CN105813688B (zh) | 用于听力植入物中的瞬态声音修改的装置 | |
US9640193B2 (en) | Systems and methods for enhancing place-of-articulation features in frequency-lowered speech | |
CN103761974B (zh) | 一种人工耳蜗 | |
CN109920451A (zh) | 语音活动检测方法、噪声抑制方法和噪声抑制*** | |
US9420382B2 (en) | Binaural source enhancement | |
CN103813251B (zh) | 一种可调节去噪程度的助听器去噪装置和方法 | |
WO2015085946A1 (zh) | 语音信号处理方法、装置及服务器 | |
CN110992967A (zh) | 一种语音信号处理方法、装置、助听器及存储介质 | |
CN107452394A (zh) | 一种基于频率特性降低噪音的方法和*** | |
WO2005013870A1 (ja) | 人工内耳の音声変換方法 | |
KR20110005669A (ko) | 디지털 보청기의 신호처리 방법 | |
CN116132875A (zh) | 一种辅听耳机的多模式智能控制方法、***及存储介质 | |
CN110010150A (zh) | 基于多分辨率的听觉感知语音特征参数提取方法 | |
CN103152686B (zh) | 一种可定制功能模式的数字助听器及其实现方法 | |
CN109874088A (zh) | 一种调整声压值的方法及设备 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
CN114866939A (zh) | 一种新型超强降噪的助听器语音处理*** | |
Sun et al. | An RNN-based speech enhancement method for a binaural hearing aid system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170215 |
|
RJ01 | Rejection of invention patent application after publication |