CN109493877B - 一种助听装置的语音增强方法和装置 - Google Patents

一种助听装置的语音增强方法和装置 Download PDF

Info

Publication number
CN109493877B
CN109493877B CN201710817728.7A CN201710817728A CN109493877B CN 109493877 B CN109493877 B CN 109493877B CN 201710817728 A CN201710817728 A CN 201710817728A CN 109493877 B CN109493877 B CN 109493877B
Authority
CN
China
Prior art keywords
audio data
sub
band
sound
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710817728.7A
Other languages
English (en)
Other versions
CN109493877A (zh
Inventor
王志华
孙卓异
姜汉钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201710817728.7A priority Critical patent/CN109493877B/zh
Publication of CN109493877A publication Critical patent/CN109493877A/zh
Application granted granted Critical
Publication of CN109493877B publication Critical patent/CN109493877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Prostheses (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种助听装置的语音增强方法和装置,涉及医学电子技术以及音频信号处理领域。本发明实施例中的方法包括:获取助听装置的四通道音频数据;将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;输出两路增强音频数据。终端将获取的音频数据在便携式终端上进行语音增强处理,最终输出两路实时音频数据。智能提高音质,大大提高了助听器佩戴的普遍程度,可以达到更好的助听效果以及增强方式,同时由于该音频数据处理不是固化在助听装置处理器上,而是基于便携式终端的通用处理器芯片,利于未来的***升级以及语音增强方法的完善。

Description

一种助听装置的语音增强方法和装置
技术领域
本发明涉及医学电子技术以及音频信号处理领域,尤指一种助听装置的语音增强方法和装置。
背景技术
当今我国已经进入加速老龄化社会时代,老年人预期寿命的提高、电子产品应用过多导致听力水平下降以及损伤的人数数量呈上涨趋势,近年来随着医疗保健水平的提高,佩戴助听器的老年人和听障患者的比例已越来越多。如今,助听器技术是基于先进的数字信号处理,无线通信和人工智能技术。随着技术的快速发展,助听器的尺寸越来越小,助听器的功能越来越全面,如多通道宽动态范围压缩,主动降噪,自适应指向性,声场分析和无线连接到其他音频或通信***。
助听器的一个重要方面是要确保在不进一步损失听力患者听觉前提下,帮助患者补偿听力损失,提高音频质量。已有的助听器内置算法是固化在处理器中,不能随着处理器变化而智能升级。
发明内容
为了解决上述技术问题,本发明实施例提供了一种助听装置的语音增强方法和装置,利用便携式智能终端(如手机)实现助听功能的相应语音增强功能。
第一方面,本发明提供一种助听装置的语音增强方法,包括:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据。
优选地,将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式。
优选地,根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强包括:
对所述音频数据进行预处理及分通道滤波;
将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
将所述音频数据的每个子带合并成时域语音信号。
优选地,对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
优选地,将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景之后还包括:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
优选地,根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:
根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行选通;
计算声音来源所在位置的角度。
优选地,对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
优选地,将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
第二方面,本发明还提供一种助听装置的语音增强装置,包括:
声音拾取模块,设置为获取助听装置的四通道音频数据;
声学环境监测模块,设置为将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
声音处理模块,设置为根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出模块,设置为输出两路增强音频数据。
优选地,所述声学环境监测模块将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式。
优选地,所述声音处理模块包括:
预处理单元,设置为对所述音频数据进行预处理及分通道滤波;
子带划分单元,设置为将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
声源定位单元,设置为根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
啸叫抑制与反馈消除单元,设置为根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
压缩与放大单元,设置为对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
声音补偿单元,设置为将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
声音综合单元,设置为将所述音频数据的每个子带合并成时域语音信号。
优选地,所述预处理模块对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
优选地,所述声学环境监测模块还设置为:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
优选地,所述声源定位单元根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:
根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行通选;
计算声音来源所在位置的角度。
优选地,所述啸叫抑制与反馈消除单元对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
优选地,所述声音补偿单元将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
第三方面,本发明还提供一种语音增强装置,包括:存储器和处理器;
所述存储器,用于保存可执行指令;
所述处理器,用于执行所述存储器保存的所述可执行指令,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,执行所述计算机可执行指令时,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据。
本发明实施例提供的助听装置的语音增强方法和装置,通过耳侧的助听装置获取四路音频数据,并传递到便携式终端上,将获取的音频数据在便携式终端上进行语音增强处理,最终输出两路实时音频数据。不同于普通助听装置中的助听***,本发明实施例充分考虑到便携式终端处理器的不同性能条件,提出了可用于不同便携式终端下的智能升级的语音助听增强的方法。智能提高音质,大大提高了助听器佩戴的普遍程度,可以达到更好的助听效果以及增强方式,同时由于该音频数据处理不是固化在助听装置处理器上,而是基于便携式终端的通用处理器芯片,利于未来的***升级以及语音增强方法的完善。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的一种助听装置的语音增强方法的流程图;
图2为本发明实施例提供的一种助听装置的语音增强装置的结构示意图;
图3为本发明实施例提供的声音处理模块的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在当今便携式智能终端(如手机)的普及率越来越高,而且便携式终端的通用处理器的运算能力也越来越强。然而,现在大多数助听器的并没有完好的可以实现助听功能的匹配便携式终端的相应语音增强实现方法,已有的助听器内置算法是固化在处理器中,不能随着处理器变化而智能升级。如图1所示,本发明实施例提供一种助听装置的语音增强方法,由便携式终端处理器实现,包括:
S101、获取助听装置的四通道音频数据;
S102、将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
S103、根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
S104、输出两路增强音频数据。
本发明实施例中的四通道音频数据指:便携式终端获取助听装置的左耳侧前置麦克风的声音输入和左耳侧后置麦克风的声音输入,以及右耳侧前置麦克风的声音输入和右耳侧后置麦克风的声音输入。
本发明实施例基于便携式终端的实现智能语音增强,不更新耳侧的助听装置的前提下,只利用便携式终端就可以实现补偿听障患者的听力损失,通过耳侧的助听装置获取四路音频数据,并传递到便携式终端上,将获取的音频数据在便携式终端上进行语音增强处理,最终输出两路实时音频数据。智能提高音质,大大提高了助听器佩戴的普遍程度。能在完成基础的语音助听功能的同时,实时进行智能语音增强,方便用户使用以及便于产品升级。
步骤S102将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式。
步骤S103根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强包括:
S1031、进行所述音频数据进行预处理及分通道滤波;
S1032、将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
S1033、根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
S1034、根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
S1035、对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
S1036、将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
S1037、将所述音频数据的每个子带合并成时域语音信号。
本实施例中的步骤S1031中分通道滤波,根据检测的语音端点判断出背景噪声,采用谱减法来进行首次滤波,得到初步去除杂音的四路语音信号。
其中,对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
本发明实施例中,预处理主要是指预加重的处理,对高频的分量进行一阶滤波器的高通滤波,增加语音的高频分辨率。
本发明实施例通过gammatone滤波器进行分通道滤波,过程如下:
根据人耳构造的特殊性,耳蜗基底膜在不同的位置上具有不同的频率特异性。这种特异性可以用n阶的非等宽Gammatone滤波器来表示,其时域表达式满足下式,即,
Figure BDA0001405503620000081
其中,
Figure BDA0001405503620000082
代表相位,fc代表中心频率,b代表带宽,N为滤波器的阶数,t代表时间,A代表幅值。
本发明实施例的步骤S1034中采取分通道的子带降噪技术进行降噪,不同于已有的分通道降噪技术,本发明实施例根据子带不同的频段结构采取不同的降噪方案,来进行语音质量的提高,进而达到语音增强的目的。来自四声道的音频数据中所包含的噪音信号通常存在于低频带中,使用谱减法以及可变噪声减法参数α,使得噪声得到衰减,此种方式语音失真程度可控。对于高频带的语音信号,使用互相关函数法来去除高频段的噪声谱分量,保留了定位所需的相关参数,并且没有衰减语音信号。其中可变噪声减法参数α的确定可根据下式获得:
Figure BDA0001405503620000091
其中,k代表子带的序列号,l代表子带帧数,
Figure BDA0001405503620000092
是代表α的随机初始值,SNRp代表后验的信噪比值,σ为正整数,用于控制子带噪声谱谱减的范围,β和αi(k)最值和先验SNR的估值有关,是评估参数,β是用于防止分母为零的(会存在后验信噪比趋于零的情况),β的计算是由语音段得出的α的最大最小值差的倒数得到。
高频段和低频段之间的划分通过各个子带输出信号的噪声功率谱来计算,通常选择的划分频率范围在800Hz~1000Hz左右。
步骤S102将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景之后还包括:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
其中,方向性控制参数包括:双耳时间差、双耳强度差、双耳相位差以及前后耳相位差等参数。
根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:
根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行选通;
计算声音来源所在位置的角度。
对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
本发明实施例中,调制幅度参数由环境决定,因为语音信号包络具有调制特性,根据频谱分析后,根据调制率的大小可以用来识别输入的声学信号是语音还是噪音。噪声抑制参数则是根据所处的环境,环境嘈杂和安静环境下的噪声谱不同,计算所得输入信噪比也不同,用于可变噪声减法参数α的计算。
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
压缩放大比例参数由患者的听力损失的状况决定,测听之后会有听力损失图,标注在不同频率下患者的听觉状况,根据这个数据来确定压缩放大比例参数,来放大到正常听力水平程度,在声音补偿时,不同环境下压缩放大比例系数不同,进行不同程度的补偿。
本发明实施例先通过预加重的滤波,再通过gammatone的分通道滤波,再通过谱减法的滤波,谱减法等后续处理后进行语音信号整合。可以达到更好的助听效果以及增强。
如图2所示,本发明实施例还提供一种助听装置的语音增强装置,设置在便携式终端侧,包括:
声音拾取模块11,设置为获取助听装置的四通道音频数据;
声学环境监测模块12,设置为将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
声音处理模块13,设置为根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出模块14,设置为输出两路增强音频数据。
所述声学环境监测模块12将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式。
所述声音处理模块13包括:
预处理单元131,设置为进行所述音频数据进行预处理及分通道滤波;
子带划分单元132,设置为将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
声源定位单元133,设置为根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
啸叫抑制与反馈消除单元134,设置为根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
压缩与放大单元135,设置为对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
声音补偿单元136,设置为将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
声音综合单元137,设置为将所述音频数据的每个子带合并成时域语音信号。
所述预处理模块对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
所述声学环境监测模块还设置为:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
所述声源定位单元133根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:
根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行通选;
计算声音来源所在位置的角度。
所述啸叫抑制与反馈消除单元对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
所述声音补偿单元将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
本发明实施例还提供一种语音增强装置,包括:存储器和处理器;
所述存储器,用于保存可执行指令;
所述处理器,用于执行所述存储器保存的所述可执行指令,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据。
本发明实施例还提供一种计算机可读存储介质所述计算机可读存储介质存储有计算机可执行指令,所述处理器执行所述计算机可执行指令时,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可以通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明实施例不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (14)

1.一种助听装置的语音增强方法,其特征在于,包括:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据;
其中,
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强包括:
对所述音频数据进行预处理及分通道滤波;
将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
将所述音频数据的每个子带合并成时域语音信号。
2.根据权利要求1所述的语音增强方法,其特征在于,对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
3.根据权利要求1所述的语音增强方法,其特征在于,将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景之后还包括:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
4.根据权利要求3所述的语音增强方法,其特征在于,根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:
根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行选通;
计算声音来源所在位置的角度。
5.根据权利要求3所述的语音增强方法,其特征在于,对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
6.根据权利要求3所述的语音增强方法,其特征在于,将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
7.一种助听装置的语音增强装置,其特征在于,包括:
声音拾取模块,设置为获取助听装置的四通道音频数据;
声学环境监测模块,设置为将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
声音处理模块,设置为根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出模块,设置为输出两路增强音频数据;
其中,所述声学环境监测模块将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式;
所述声音处理模块包括:
预处理单元,设置为对所述音频数据进行预处理及分通道滤波;
子带划分单元,设置为将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
声源定位单元,设置为根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
啸叫抑制与反馈消除单元,设置为根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
压缩与放大单元,设置为对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
声音补偿单元,设置为将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
声音综合单元,设置为将所述音频数据的每个子带合并成时域语音信号。
8.根据权利要求7所述的语音增强装置,其特征在于,所述预处理单元 对所述音频数据进行预处理包括:
对所述音频数据中频率大于预设值的分量进行一阶高通滤波。
9.根据权利要求7所述的语音增强装置,其特征在于,所述声学环境监测模块还设置为:
获得所述环境模式的以下至少之一的参数:
调制幅度参数、方向性控制参数、压缩放大比例参数以及噪声抑制参数。
10.根据权利要求9所述的语音增强装置,其特征在于,所述声源定位单元根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度包括:根据所述方向性控制参数对所述助听装置的全部方向的声音来源进行通选;
计算声音来源所在位置的角度。
11.根据权利要求9所述的语音增强装置,其特征在于,所述啸叫抑制与反馈消除单元对所述音频数据的每个子带进行降噪处理包括:
基于所述音频数据的包络调制特性和频谱分析结果,根据所述调制幅度参数识别所述音频数据是否为噪音;
根据确定的信噪比和所述噪声抑制参数,对所述噪音进行抑制处理。
12.根据权利要求9所述的语音增强装置,其特征在于,所述声音补偿单元将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿包括:
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换;
根据所述压缩放大比例系数,进行对应程度的相位补偿。
13.一种语音增强装置,其特征在于,包括:存储器和处理器;
所述存储器,用于保存可执行指令;
所述处理器,用于执行所述存储器保存的所述可执行指令,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据;
其中,
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强包括:
对所述音频数据进行预处理及分通道滤波;
将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
将所述音频数据的每个子带合并成时域语音信号。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,执行所述计算机可执行指令时,进行如下操作:
获取助听装置的四通道音频数据;
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强;
输出两路增强音频数据;
其中,
将获取到的音频数据提取声学环境特征,获得所述音频数据对应的声学场景包括:
提取所述音频数据的声学环境特征;
将提取的声学环境特征与预设的语音环境进行匹配,确定用户所处的环境模式;
根据所述声学场景对获取到的音频数据进行分通道声音补偿和语音增强包括:
对所述音频数据进行预处理及分通道滤波;
将分通道滤波后的音频数据进行子带划分;对每个音频数据的子带进行频谱分析,获得所述音频数据的子带的信噪比;
根据所确定的环境模式对所述音频数据对应的声音来源进行选通,计算声音来源所在位置的角度;
根据确定的声音来源所在位置的角度和子带的信噪比,对所述音频数据的每个子带进行降噪和消除啸叫处理;
对降噪后的所述音频数据的每个子带进行动态压缩和声音强度放大处理;
将压缩放大后的所述音频数据的每个子带对应的频域信号进行时频转换,并进行线性相位补偿;
将所述音频数据的每个子带合并成时域语音信号。
CN201710817728.7A 2017-09-12 2017-09-12 一种助听装置的语音增强方法和装置 Active CN109493877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710817728.7A CN109493877B (zh) 2017-09-12 2017-09-12 一种助听装置的语音增强方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710817728.7A CN109493877B (zh) 2017-09-12 2017-09-12 一种助听装置的语音增强方法和装置

Publications (2)

Publication Number Publication Date
CN109493877A CN109493877A (zh) 2019-03-19
CN109493877B true CN109493877B (zh) 2022-01-28

Family

ID=65688095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710817728.7A Active CN109493877B (zh) 2017-09-12 2017-09-12 一种助听装置的语音增强方法和装置

Country Status (1)

Country Link
CN (1) CN109493877B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110022514B (zh) * 2019-05-17 2021-08-13 深圳市湾区通信技术有限公司 音频信号的降噪方法、装置、***及计算机存储介质
DE102019213809B3 (de) * 2019-09-11 2020-11-26 Sivantos Pte. Ltd. Verfahren zum Betrieb eines Hörgeräts sowie Hörgerät
CN110728970B (zh) * 2019-09-29 2022-02-25 东莞市中光通信科技有限公司 一种数字辅助隔音处理的方法及装置
CN111402916B (zh) * 2020-03-24 2023-08-04 青岛罗博智慧教育技术有限公司 一种语音增强***、方法及手写板
CN113949955B (zh) * 2020-07-16 2024-04-09 Oppo广东移动通信有限公司 降噪处理方法、装置、电子设备、耳机及存储介质
CN113973248A (zh) * 2020-07-24 2022-01-25 华为技术有限公司 主动降噪方法和装置以及音频播放设备
CN112562265A (zh) * 2020-12-23 2021-03-26 江苏集萃智能集成电路设计技术研究所有限公司 一种基于助听器的智能监护***及监护方法
CN112954569B (zh) * 2021-02-20 2022-10-25 深圳市智听科技有限公司 多核助听芯片、助听方法及助听器
CN113825082B (zh) * 2021-09-19 2024-06-11 武汉左点科技有限公司 一种用于缓解助听延迟的方法及装置
CN115314824B (zh) * 2022-10-12 2022-12-27 深圳市婕妤达电子有限公司 用于助听器的信号处理方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333994A (zh) * 1998-11-16 2002-01-30 伊利诺伊大学评议会 双路立体声信号处理技术
CN1967659A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 用于助听器的语音增强方法
CN101447190A (zh) * 2008-06-25 2009-06-03 北京大学深圳研究生院 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
CN103686575A (zh) * 2013-11-28 2014-03-26 清华大学 助听装置
CN104038880A (zh) * 2014-06-26 2014-09-10 南京工程学院 一种双耳助听器语音增强方法
CN105741849A (zh) * 2016-03-06 2016-07-06 北京工业大学 数字助听器中融合相位估计与人耳听觉特性的语音增强方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060206320A1 (en) * 2005-03-14 2006-09-14 Li Qi P Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
AU2010365366B2 (en) * 2010-12-08 2014-10-02 Widex A/S Hearing aid and a method of enhancing speech reproduction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333994A (zh) * 1998-11-16 2002-01-30 伊利诺伊大学评议会 双路立体声信号处理技术
CN1967659A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 用于助听器的语音增强方法
CN101447190A (zh) * 2008-06-25 2009-06-03 北京大学深圳研究生院 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
CN103686575A (zh) * 2013-11-28 2014-03-26 清华大学 助听装置
CN104038880A (zh) * 2014-06-26 2014-09-10 南京工程学院 一种双耳助听器语音增强方法
CN105741849A (zh) * 2016-03-06 2016-07-06 北京工业大学 数字助听器中融合相位估计与人耳听觉特性的语音增强方法

Also Published As

Publication number Publication date
CN109493877A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109493877B (zh) 一种助听装置的语音增强方法和装置
US9343056B1 (en) Wind noise detection and suppression
JP6017825B2 (ja) 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット
US20230352038A1 (en) Voice activation detecting method of earphones, earphones and storage medium
CN109121057B (zh) 一种智能助听的方法及其***
US20060206320A1 (en) Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
JP4543014B2 (ja) 聴音装置
JP2013527493A (ja) 複数のマイクによるロバストな雑音抑制
CN112367600A (zh) 一种语音处理方法及基于移动终端的助听器***
EP2594090A1 (en) Method of signal processing in a hearing aid system and a hearing aid system
CN109195042A (zh) 低功耗的高效降噪耳机及降噪***
CN110992967A (zh) 一种语音信号处理方法、装置、助听器及存储介质
WO2022256577A1 (en) A method of speech enhancement and a mobile computing device implementing the method
CN115314823A (zh) 一种基于数字发声芯片的助听方法、***及设备
CN115348507A (zh) 脉冲噪声抑制方法、***、可读存储介质及计算机设备
CN113949955A (zh) 降噪处理方法、装置、电子设备、耳机及存储介质
CN106377279B (zh) 胎心音频信号处理方法和装置
US11445307B2 (en) Personal communication device as a hearing aid with real-time interactive user interface
Li et al. A smart binaural hearing aid architecture leveraging a smartphone APP with deep-learning speech enhancement
CN213462323U (zh) 一种基于移动终端的助听器***
CN114023352B (zh) 一种基于能量谱深度调制的语音增强方法及装置
WO2018083570A1 (en) Intelligent hearing aid
CN102341853B (zh) 用于分离信号路径的方法及用于改善电子喉语音的应用
WO2022140927A1 (zh) 音频降噪的方法和***
CN114093380B (zh) 一种语音增强方法、电子设备、芯片***及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant