CN103733259A - 用于运行听力设备的方法以及听力设备 - Google Patents

用于运行听力设备的方法以及听力设备 Download PDF

Info

Publication number
CN103733259A
CN103733259A CN201180071836.5A CN201180071836A CN103733259A CN 103733259 A CN103733259 A CN 103733259A CN 201180071836 A CN201180071836 A CN 201180071836A CN 103733259 A CN103733259 A CN 103733259A
Authority
CN
China
Prior art keywords
frequency
storehouse
source
source region
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180071836.5A
Other languages
English (en)
Other versions
CN103733259B (zh
Inventor
S·阿勒格罗-鲍曼
R·P·德尔莱斯
S·贾哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sonova Holding AG
Original Assignee
Phonak AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Phonak AG filed Critical Phonak AG
Publication of CN103733259A publication Critical patent/CN103733259A/zh
Application granted granted Critical
Publication of CN103733259B publication Critical patent/CN103733259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/48Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using constructional means for obtaining a desired frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/353Frequency, e.g. frequency shift or compression
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种通过对听力设备的输入信号应用频率换位方案来运行听力设备的方法,所述听力设备包括输入换能器、信号处理单元和输出换能器,所述方法包括如下步骤:通过应用变换函数将所述输入信号从时域变换到频域以获得输入频谱,所述输入频谱具有包括源区(20)和目的区(30)的频率范围;考虑到所述输入信号的瞬时特性来适应性地选择所述源区(20)的信号分量;将所选择的信号分量调换到所述目的区(30);以及将输出频谱或输出频谱的变换提供到所述输出换能器,所述输出频谱包括所述目的区(30)的信号分量。

Description

用于运行听力设备的方法以及听力设备
技术领域
本发明涉及用于运行听力设备的方法以及听力设备。
背景技术
已研究出多种用于频率降低的途径,使得具有高频听力损失的听力受损患者能够受益,特别是在原始高频声音的放大没有用(例如由于死区)或不可行(由于应用高增益时潜在的反馈问题,或由于所应用增益的有限带宽)的情况下。
例如,WO 2007/000161 A1、US-7 248 711 B2和EP-1 686 566 A2中公开了描述频率降低方案的已知教导。这些已知教导具有下列缺点中的一个或几个:
-对于1500Hz以下的截止频率,元音失真;
-已知的换位方案常常导致听力设备用户的混淆增加;
-谐波关系的失真引起了改变的音调感知并且降低了听音乐的愉悦。
因此,本发明的一个目的是克服上述缺点中的至少一个。
发明内容
在本发明的语境中,术语“换位(transposition)”或“调换(transpose)”被限定为具有下列含义中的至少一个:
-将目的频率分量替换成源频率分量;
-目的频率分量与对应的源频率分量的任何组合。
此外,术语“听力设备”不仅指向用来改善听力受损患者的听力的助听器,而且指向任何通信设备,无论是有线的还是无线的,或者指向听力保护设备,其中助听器也可以是可植入的。
本发明首先指向一种通过对听力设备的输入信号应用频率换位方案(frequency transposition scheme)来运行所述听力设备的方法。所述听力设备包括输入换能器、信号处理单元和输出换能器。根据本发明的所述方法包括如下步骤:
-通过应用变换函数将所述输入信号从时域变换到频域以获得输入频谱,所述输入频谱具有包括源区(source region)和目的区(destination region)的频率范围;
-考虑到所述输入信号的瞬时特性来适应性地选择所述源区的信号分量;
-将所选择的信号分量调换到所述目的区;以及
-将输出频谱或输出频谱的变换提供到所述输出换能器,所述输出频谱包括所述目的区的信号分量。
在本发明的一个更具体的实施方案中,所述瞬时特性是下列中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区中的瞬时能量分布,尤其是所述源区中的音位的瞬时能量分布;
-所述目的区中的瞬时能量分布;
-所述输入信号中存在的扰动信号。
在本发明的又一些实施方案中,所述源区包括下部源区和至少两个源堆栈(source stack),所述下部源区在截止频率以下,且所述至少两个源堆栈在所述截止频率以上,并且其中所述目的区包括下部目的区和目的堆栈(destination stack),所述下部目的区在所述截止频率以下,且所述目的堆栈在所述截止频率以上,所述截止频率尤其在1500Hz以下。
在本发明的又一些实施方案中,调换步骤包括下列步骤:
-确定落在所述源区内的中心频率格口(center frequency bin),频谱能量在所述中心频率格口处最大;以及
-将均等分布在所述中心频率格口周围的频率格口调换到所述目的区。
在本发明的再又一些实施方案中,在所述截止频率以上的所述源区被划分成均等大小的源堆栈,每个源堆栈具有的频率范围等于所述目的堆栈的频率范围。
在本发明的又一些实施方案中,调换步骤包括下列步骤之一:
-将所述源堆栈的频率格口调换到所述目的堆栈的对应的频率格口,被调换的频率格口在所述源堆栈的所有对应的频率格口之中具有最大能量;
-将所述源堆栈之一的所有频率格口调换到所述目的堆栈,所调换的源堆栈包括具有最大能量的频率格口;
-将所述源堆栈之一的所有频率格口调换到所述目的堆栈,所调换的源堆栈包括在其频率格口上的最大能量总和;
-将所述源堆栈之一的所有频率格口调换到所述目的堆栈,所调换的源堆栈保留最大的频谱对比度。
本发明的又一些实施方案包括在适应性地选择所述源区的信号分量的步骤之前,对所述源区的信号分量应用预加权函数的步骤。
在本发明的又一些实施方案中,所述预加权函数基于下列准则中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区中的瞬时能量分布;
-所述目的区中的瞬时能量分布;
-所述输入信号中存在的扰动信号。
本发明的又一些实施方案包括在将所选择的信号分量调换的步骤之后,对所述目的区应用后加权函数(post-weighting function)的步骤。
在本发明的又一些实施方案中,选择步骤和调换步骤包括根据下列方案的峰拾取:
i=argmax[w(n)·Fin(n),w(n+j)·Fin(n+j),w(n+j+1)·Fin(n+j+1),...,w(n+j+k)·Fin(n+j+k)]
Fout(n)=w"(i)·Fin(i)
其中
-Fout(n)是针对具有指数n的给定频率格口进行的峰选择方案的输出;
-w(n)是针对第n个频率格口的预加权函数的值;
-w”(i)是针对指数i的后加权函数的值,用于对目的区中的所调换的格口的值进行加权;
-argmax[…]表示[]内的表达式最大的格口指数;且
-Fin(n)是针对频率格口n的输入量值。
在本发明的又一些实施方案中,所述频率换位方案由下列公式限定:
F k = C R · FC - F HL C R - 1
其中
-CR是两个源堆栈之中的第二源堆栈中的压缩比;
-FC对应于在下部源区与第一源堆栈之间限定的截止频率的对数;
-FHL对应于作为所述第二源堆栈的最低频率的上部频率的对数;且
-Fk对应于如下的开始频率(start frequency)的对数,所述开始频率被限定为所述下部源区中的频率分量的一对一映射与所述第二源堆栈的压缩映射的延伸之间的交叉点。
此外,本发明还指向一种听力设备,所述听力设备包括:
-输入换能器;
-输出换能器;
-信号处理单元,操作性地连接至所述输入换能器以及所述输出换能器;
-用于通过应用变换函数将所述输入信号从时域变换到频域以获得如下输入频谱的装置,所述输入频谱具有包括源区和目的区的频率范围;
-用于考虑到所述输入信号的瞬时特性来适应性地选择所述源区的信号分量的装置;
-用于将所选择的信号分量调换到所述目的区的装置;以及
-用于将输出频谱或输出频谱的变换提供到所述输出换能器的装置,所述输出频谱包括所述目的区的信号分量。
在本发明的一个更具体的实施方案中,所述瞬时特性是下列中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区中的瞬时能量分布,尤其是所述源区中的音位的瞬时能量分布;
-所述目的区中的瞬时能量分布;
-所述输入信号中存在的扰动信号。
在本发明的又一些实施方案中,所述源区包括下部源区和至少两个源堆栈,所述下部源区在截止频率以下,且所述至少两个源堆栈在所述截止频率以上,并且其中所述目的区包括下部目的区和目的堆栈,所述下部目的区在所述截止频率以下,且所述目的堆栈在所述截止频率以上,所述截止频率尤其在1500Hz以下。
在本发明的再又一些实施方案中,用于调换的装置包括下列装置:
-用于确定落在所述源区内的中心频率格口的装置,频谱能量在所述中心频率格口处最大;以及
-用于将均等分布在所述中心频率格口周围的频率格口调换到所述目的区的装置。
在本发明的又一些实施方案中,在所述截止频率以上的所述源区被划分成均等大小的源堆栈,每个源堆栈具有的频率范围等于所述目的堆栈的频率范围。
在本发明的又一些实施方案中,用于调换的装置包括下列装置中的一个:
-用于将所述源堆栈的频率格口调换到所述目的堆栈的对应的频率格口的装置,被调换的频率格口在所述源堆栈的所有对应的频率格口之中具有最大能量;
-用于将所述源堆栈之一的所有频率格口调换到所述目的堆栈的装置,所调换的源堆栈包括具有最大能量的频率格口;
-用于将所述源堆栈之一的所有频率格口调换到所述目的堆栈的装置,所调换的源堆栈包括在其频率格口上的最大能量总和;
-用于将所述源堆栈之一的所有频率格口调换到所述目的堆栈的装置,所调换的源堆栈保留最大的频谱对比度。
本发明的又一些实施方案包括用于在适应性地选择所述源区的信号分量之前对所述源区的信号分量应用预加权函数的装置。
本发明的又一些实施方案包括在将所选择的信号分量调换之后对所述目的区应用后加权函数的装置。
明确指出,上述实施方案可以被任意组合。只有那些会导致矛盾的组合才被排除。
附图说明
本发明进一步通过在附图中示出且被详细描述的示例性实施方案被例示说明。应指出,这些实施方案仅是为了例示的目的,且不应局限本发明。
图1示出了一个听力设备的框图,带有该听力设备的主要部件;
图2示出了例示一个已知的换位方案的图表;
图3示出了例示本发明的频率换位方案的第一实施方案的图表;
图4示出了例示本发明的频率换位方案的第二实施方案的又一个图表;
图5示出了例示本发明的频率换位方案的第三实施方案的再又一个图表;
图6示出了例示本发明的频率换位方案的第四实施方案的另一个图表,该图表包括作为换位准则的频谱能量分布;
图7示出了例示本发明的频率换位方案的第五实施方案的图表,该图表也包括作为换位准则的频谱能量分布;
图8示出了例示本发明的频率换位方案的第六实施方案的另一个图表,该图表也包括作为换位准则的频谱能量分布;
图9示出了例示本发明的频率换位方案的第七实施方案的又一个图表,该图表也包括作为换位准则的频谱能量分布;
图10示出了在元音中含有低频信息的第一频谱轮廓(contour),该第一频谱轮廓在应用加权函数之后变得更重要;
图11示出了含有高频摩擦音(fricative)信息的第二频谱轮廓,该第二频谱轮廓被选择以用于甚至在应用了图10的加权函数之后进行频率换位;
图12示出了含有低频信息的第三频谱轮廓,该第三频谱轮廓被应用了与图10和图11中示出的相同的加权函数;
图13示出了被应用了这样一个加权函数的第三频谱轮廓,该加权函数缩放(scale)在低频段中以及中频段中的频率能量;
图14示出了被应用了图13的加权函数的第一频谱轮廓;
图15示出了也被应用了图13或图14的加权函数的第二频谱轮廓;
图16示出了与基于堆叠(stacking)的换位方案结合的第一频谱轮廓;
图17示出了与基于堆叠的换位方案结合的第二频谱轮廓;
图18示出了例示本发明的频率换位方案的第八实施方案的又一个图表,该图表包括两个源堆栈。
具体实施方式
在图1中,一个听力设备被描绘为包括输入换能器1(诸如麦克风)、模数转换器2、信号处理单元3、数模转换器4和输出换能器5(也被称为受话器或扬声器)。例如,由于声音信号被输入换能器1拾取并且被转换成输入信号i,听力设备被用来修复或改善听力受损人员的听力。在数字听力设备的情况下,模数转换器2生成对应的数字输入信号,该数字输入信号现在可以被信号处理单元3处理,在信号处理单元3中考虑到用户的听力受损状况来计算输出信号。该输出信号o被馈送到输出换能器5,在数字听力设备的情况下经由数模转换器4被馈送到输出换能器5。
在信号处理算法(其在信号处理单元3中实施)应用到频域的情况下,变换函数——诸如快速傅里叶变换(FFT)——被用来将输入信号i从时域变换到频域中。因此,必须应用逆变换函数,以在实施所述信号处理算法之后将输出频谱变换到时域中。代替傅里叶变换函数及其逆函数,可以实施任何其他变换函数,诸如哈达玛(Hadamard)、帕雷(Paley)或斜(Slant)变换。
尤其,本发明针对一种在信号处理单元3中实施的信号处理算法(也被称为频率换位方案)。通过该频率换位方案,所选择的频率范围(该频率范围对该听力设备的用户是重要的,但在该频率范围中,用户例如因完全听力损失而不能够感知到声信号)被调换到其中该听力设备的用户能够感知到声信号的另一个频率范围。
图2描绘了一个已知途径,其中针对由截止频率FC和压缩比CR限定的不同频谱区,具有输入频率fin与输出频率fout之间的映射。尽管在截止频率FC以下时信号没有变化,但是在截止频率FC以上通过压缩比CR发生非线性换位。这个非线性频率压缩算法的主要限制之一是,截止频率FC被限制在1500Hz的低侧(lower side)。这意味着,该听力设备的在1500Hz以上具有深度听力损失的用户不会受益于已知的频率换位算法。这是因为,将频率分量调换到比1500Hz的截止频率FC低的频率会导致在1500Hz以下的频率区中具有强共振峰结构(strong formant structure)的元音和非摩擦声音的失真。原本以未失真状态可提供给听力受损者的信息在将截止频率降低到1500Hz以下时会被已知的频率换位算法扭曲。这样的行为是不可接受的,因为它会妨碍听力受损的使用者对经处理的声音的初始接受,这些听力受损的使用者已习惯以“接近正常”方式听到元音。
此外,已知的频率换位算法使输入声音的谐波结构失真。因此,在已知的频率换位算法引入令人不愉快的音调失真的情况下,其对于音乐进行调换也没有太大用处。
关于已知的频率换位方案,已指出截止频率FC必须等于或大于1500Hz,以使在1500Hz以下的频率区中具有强共振峰结构的元音和非摩擦声音不失真。因此,在截止频率FC以下的信号分量不改变,即,x轴上的所谓的下部源区10被线性调换到y轴上的下部目标区12(一对一映射)。在截止频率FC以上,非线性换位被实施为(假如在x轴和y轴上使用了算法缩放),所谓的上部源区11的信号分量被调换到上部目标区13,上部目标区13具有比上部源区11小的带宽。该已知技术不能在提供可接受的声音品质以及元音和未调换声音的最小失真的同时,使听力受损人员受益于具有1500Hz以下的截止频率FC的频率降低算法,所述元音和未调换声音原本会是可听到的且没有太大失真。
本发明包括一种通过考虑到输入信号的瞬时特性来适应性地选择源区的信号分量的新的频率换位方案。
所述输入信号的瞬时特性可以是下列特性中的一个或几个:
-听力设备的用户的听觉期望;
-源区中的瞬时能量分布,尤其是所述源区中的音位的瞬时能量分布;
-目的区中的瞬时能量分布;
-所述输入信号中存在的扰动信号。
关于扰动信号的存在,应指出如果检测到扰动信号,则存在该扰动信号的频率范围可被排除,以免将其调换到目的区。于是,该目的区对于该听力设备的用户将含有较少的干扰信号分量。
在本发明的又一些实施方案中,所谓的频率堆叠算法(frequencystacking algorithm)被实施。
图3例示了该频率堆叠算法的一个基础概念。在图3中示出的图表的横轴上标示了输入频率fin,而输出频率fout被标示在该图表的纵轴上。在x轴上的源区20包括下部源区21和两个源堆栈22和23,下部源区21包括上至截止频率FC的频率,且这两个源堆栈22、23包括在截止频率FC以上的频率。如图3中描绘的,第一源堆栈22在截止频率FC开始,第二源堆栈23紧跟着第一源堆栈22。
在y轴上的目的区30包括下部目的区31和目的堆栈32,下部目的区31包括上至截止频率FC的频率,且目的堆栈32包括在截止频率FC以上的频率。
如从图3中可以看到的,该换位方案是这样的:具有处于下部源区21中的频率的信号分量以一对一映射(也被称为线性换位)被映射到下部目的区31。此外,具有处于第一源堆栈22以及第二源堆栈23中的频率的信号分量被调换到目的堆栈32。将结合更多具体实施方案进一步解释该换位方案如何被实施的方式(即,哪些信号分量和在什么频率)。
如果被调换的源区的频率范围等于目的区的频率范围,则被称为线性频率换位。另一方面,如果被调换的源区的频率范围大于目的区的频率范围,则被称为压缩频率换位。
这些限定的结果是,图3示出了针对第一源堆栈22到目的堆栈32的换位的压缩换位,以及针对第二源堆栈23到目的堆栈32的换位的压缩换位。
与此相对比,图4示出了一个换位方案的一个实施方案,该换位方案包括针对第一源堆栈22的信号分量到目的堆栈32的线性频率换位。如在图3中一样,第二源堆栈23也是压缩频率换位。
应指出,本发明的频率换位方案非常灵活,因为源堆栈22和23可以是任何大小,尤其是源堆栈23可以具有比源堆栈22之一大的频率范围。
图5示出了描绘本发明的又一个实施方案的图表。与图3和图4的实施方案相对比,图5的实施方案包括五个源堆栈22至26。所有源堆栈22至26都具有相同的频率范围,该频率范围等于目的堆栈32的频率范围。据此,如果发生或根据一个具体的换位方案,每个源堆栈22至26被线性地调换到目的堆栈32。
由于多于一个的源堆栈22至26被调换到同一目的堆栈32,因此必须应用一个尚待描述的频率换位方案,以对于该听力设备的用户在输出频率范围fout中(即,在目的区30中)获得好的结果。
在本发明的一个具体实施方案中,源堆栈22至26具有相同的大小。在本发明的另一些具体实施方案中,目的堆栈32和源堆栈22至26的大小等于下部目的区31的带宽,也就是由截止频率FC限定的。
根据本发明的一个实施方案,源堆栈22至26之一被选择,并且通过将目的堆栈32中的原始频率内容替换成所选择的源堆栈22至26的频率内容,被调换到目的堆栈32。
根据本发明的又一个实施方案,源堆栈22至26之一被选择,并且通过将目的堆栈32中的原始频率内容与所选择的源堆栈22至26的频率内容进行组合,被调换到目的堆栈32。
根据本发明的再又一个实施方案,一个从源堆栈22至26中形成的堆栈大小的频率区域(stack-sized frequency area)被选择,并且通过将目的堆栈32中的原始频率内容替换成新形成的堆栈大小的频率区域的频率内容,被调换到目的堆栈32。
根据本发明的再另一个实施方案,一个从源堆栈22至26中形成的堆栈大小的频率区域被选择,并且通过将目的堆栈32中的原始频率内容与新形成的堆栈大小的频率区域的频率内容进行组合,被调换到目的堆栈32。
关于上述实施方案一般地和特殊地,在截止频率FC以下的频率分量保持不变。
该频率堆叠算法可以被一般化,例如通过将源堆栈和目的堆栈的大小选为由截止频率FC限定的带宽的函数,而不是等于由截止频率FC限定的带宽。例如,源堆栈和目的堆栈的大小的带宽可以被限定为截止频率FC的0.7、1.5或2倍。
一个源堆栈或多个源堆栈22至26的频率内容与目的堆栈32中的频率内容的组合例如用峰拾取算法(peak picking algorithm)来进行。
该频率堆叠算法也提供了频率换位方案框架(framework),其中可以方便地实施智能的适应性频率换位,并且其中可以专门以最重要的频谱片段为目标进行换位。例如,结合图6至图9描述这样的框架。
结合图6,描述了一个静态频率堆叠算法。图6再一次示出了描绘输入频率fin与输出频率fout之间的关系的图表。另外,在图6中示出的图表的y轴上还给出了频谱能量SE的标示。
在该静态频率堆叠算法中,x是频率格口且x∈[1,...,堆栈大小],目的堆栈32的每一第x个频率格口被替换成所有预限定的源堆栈22至26的对应的第x个频率格口之中的最大值。注意,在这个频率堆叠算法中,目的堆栈32中的频率格口的量值顺序(magnitudeorder)不必与源堆栈20中的原始频率格口相同。然而,通过在换位步骤之前应用加权函数(尚待描述)连同峰拾取算法来在所述源堆栈的对应的频率格口之中进行挑选,上述的相同可以达到一定程度。
图6例示了这个堆叠算法,其中输出频率格口(即,目的堆栈频率格口)被标示为a’、b’、c’和d’。输出频率格口a’变成源堆栈22至26的所有输入频率格口之中最大的频谱能量SE。相应地,对于输出频率格口b’、c’和d’也同样成立。
在图6的实施例中,第二源堆栈23的输入频率格口a的频谱能量SE大于源堆栈22至26的输入频率格口a的每个频谱能量。因此,输出频率格口a’的频谱能量SE变成等于第二源堆栈23的输入频率格口a的频谱能量SE。这在图6中由箭头A’标示。
输出频率格口b’、c’和d’处的频谱能量SE的值被相似地计算。据此,输出频率b’处的频谱能量SE的值等于第四源堆栈25的输入频率格口b处的频谱能量SE的值(图6中的箭头B’)。此外,输出频率c’处的频谱能量SE的值等于第四源堆栈25的输入频率格口c处的频谱能量SE的值(图6中的箭头C’)。最后,输出频率d’处的频谱能量SE的值等于第三源堆栈24的输入频率格口d处的频谱能量SE的值(图6中的箭头D’)。
在图7至图9中,例示了几个动态频率堆叠算法。在一个动态频率堆叠算法中,待调换的源堆栈被选择或被动态地确定,即,在逐帧(frame per frame)基础上。
在一个实施方案中,源堆栈50被限定为围绕落在包括所有源堆栈22至26的堆栈频率范围内的最大频率格口(也被称为中心频率格口),例如具有最大频谱能量的中心频率。在图7中,箭头M指向该最大频率格口。围绕该中心频率均等分布的该堆栈频率范围的频率格口被调换到目的堆栈32,即,待调换的堆栈被动态地设计为围绕该堆栈频率范围内的(即,所有源堆栈22至26内的)最大能量频率格口,其中这个最大能量频率格口处于待调换的堆栈50的中心。应注意,尽管动态限定的待调换的源堆栈50的带宽是恒定的,但它的频率位置随时间而改变,并且不必然对应于预先限定的源堆栈22至26之一。这个途径的有利之处在于,对最高强度峰的搜索在宽频率范围中完成。
在又一个实施方案中,待调换的源堆栈等于预先限定的源堆栈22至26之一。该待调换的源堆栈包括具有最大频谱能量的频率格口。如从图8中可以看到的,具有最大频谱能量的频率格口(图8中的箭头N)落在源堆栈24内。因此,选择将源堆栈24换位到目的堆栈32。这个实施方案的一个优点是,所调换的信息在相继的帧之间更可靠的时间对准。
在再又一个实施方案中,所述源堆栈之一被选择并调换到目的堆栈。在那里,针对每个预先限定的源堆栈计算与同一源堆栈相关的频率格口的总能量。具有最高的能量总和的预先限定的源堆栈继而被调换到目的堆栈。这在图9中被进一步例示,其中源堆栈25具有最高的能量总和(在曲线下方最大的面积,并且由箭头X标示)。据此,源堆栈25整体被调换到目的堆栈32。
换位方案的再另一个可行的实施方案是选择具备最大的频谱对比度的源堆栈。
本发明提供了在频率换位方案中进行更智能的信号处理的机会,并且展现了进行更有针对性的频率换位的可能性。这允许降低频率换位边缘(edge),在该边缘以下用已知技术是可行的。这防止了在已知的换位方案中当使用非常低的截止频率FC时见到发生的元音失真。频域中的频率堆叠框架也允许通过降低在截止频率FC以上的对于感知重要的、毗邻的大量频谱片段或堆栈来进行适应性的频率换位。在这方面,这里描述的动态堆叠方法胜过所有已知的频率换位技术。
当峰拾取算法与加权函数(尚待描述)和频率堆叠方案联合使用时,峰拾取算法允许对可以被调换的对象进行方便的第二程度的控制,从而首次允许“偏置的(biased)”和“适应性的(adaptive)”频率换位。这样的可能性尤其在已知的非线性频率压缩方案中不存在。
加权函数(也被称为期望偏置(expectation bias))被用来适应性地挑选(或选择)输入频谱的不同部分以调换到目的区。频谱能量的量值被乘以该加权函数的权重,并且这个已加权的频谱被用来选择一个具体的源堆栈。所选择的源堆栈的未加权的信号分量继而被进一步处理,即,调换到对应的目的堆栈。
该加权函数或该期望偏置函数以如下方式对输入频谱进行加权:已经可用的低频信息被给予更多重要性。如果频率换位方案继而从待调换到目的区的给定源区中选择最重要的信息,则听觉期望更被重视,并且只有与该听力受损的用户在低频或目的区中已经可获得的相比相当重要的信息才被调换。
使用加权函数的一个优势是,能够在不对音位自身进行任何显式实时检测的情况下实现适应性降低(adaptive lowering)。这是通过仔细挑选权重以及通过利用摩擦音与元音相比在较高频率具有适当大得多的能量这个事实来实现的。这防止元音失真,同时仍降低摩擦音中的高频信息。
将参照示出了几个声学情形的图10至图15更详细地解释通过加权函数w的加权以及源区到目的区的换位。
人类的语音频谱能量分布在不同的频带上,分布的差别对应于不同音位:元音、辅音、摩擦音等等。对于一种给定的具有死区(即,具有不能产生声学感知的频带)的听力损失,属于这样的死区(此后也被称为源区)的高频分量被调换到或迁移到一个频率区(此后也被称为目的区),在该频率区中声学感知仍是可能的。根据本发明,该目的区是例如由听力损失本身确定的。然而,该源区(即,落在不可获得的高频范围内的重要声学信息)不是固定的,而是随着音位改变。
根据本发明,提出了一种适应性频率换位方案,其对于输入频谱中给定的频谱能量分布达成了决议。该决议涉及从其中能量需要被调换到目的区之处挑选最好的源频率范围,以及根据该目的区中的能量分布来决定是否调换任何频率。
于是,已确知新合成的声音尽可能接近听力受损者原本先前可获得的声音,或者换言之以最可能的方式重视听力受损用户的声学期望,同时仍使最大可能的新信息可提供,以增强语音理解。
于是,本发明帮助使听力设备用户的初始异议最小化,并且帮助缩短对新算法的适应。此外,本发明是能够例如由下文描述的频谱加权函数实施的简单的解决方案。
频率换位方案的目的区可以通过考虑到该听力设备的用户的给定听力损失来限定。源区被假定为根据能量/信息分布(尤其是由音位引起的)而可变。一旦源区和目的区或多个目的区被指定,则比较/选择方案(其自身是适应性算法)被用于出于感知益处而挑选和处理所调换的信号。一个选择性的处理可以是例如响度缩放(loudnessscaling),以保有已降低的语音相对于仅受频率换位方案少量影响的音位/元音的逼真度。
根据本发明的一个实施方案,提出了使用加权函数(也被称为期望偏置)来适应性地挑选或选择输入频谱的不同部分来调换到同一目的区。频谱能量的量值被乘以该加权函数w的权重,并且这个已加权的频谱被用来通过频率换位方案进一步处理。在本发明的又一个实施方案中,该加权函数w仅为了选择源区而被应用。调换所选择的源区的步骤被应用至未加权的频谱。
该加权函数w或该期望偏置函数以如下方式对输入频谱进行加权:已经可用的低频信息被给予更多重要性。如果频率换位方案继而从待调换到目的区的给定源区中选择最重要的信息,则听觉期望更被重视,并且只有与该听力受损的用户在低频或目的区中已经可获得的相比相当重要的信息才被调换。
使用加权函数w的一个优势是,能够在不对音位自身进行任何显式实时检测的情况下实现适应性降低。这是通过仔细挑选权重以及通过利用摩擦音与元音相比在较高频率具有成比例大得多的能量这个事实来实现的。这防止元音失真,同时仍降低摩擦音中的高频信息。
原则上,本发明也可以被扩展用于低频听力损失(尽管低频听力损失是罕见的但仍广为人知),其中听觉期望偏置或加权函数w偏离于可获得的高频。
在图10至图15中,用三种不同的音位描绘了三个不同的频谱轮廓,以进一步例示本发明。
如从图10至图15中可以看到的,为了例示,频率轴已经粗略地被划分成三段:低频段L、中频区M和高频区H。图10至图12旨在例示加权技术,从而这些区的边缘频率并没有被精确地标示。在一个实施方案中,例如,所述边缘与源堆栈22至26的边缘对准(图3至图9)。
图10的图示出了一个似元音的音位(vowel like phoneme)的频谱轮廓S1,其中x轴代表频率f。频谱轮廓S1被频谱加权函数w(也被称为期望偏置)覆盖。y轴代表频谱能量SE并且被假定为对数,以使得加权函数w与频谱轮廓S1的相乘根据如下广为人知的公式引起相加:
log(w*x)=log w+log x
从而,将加权函数w应用至第一频谱轮廓S1引起了选择将对应的频谱段(在图10的低频段L中)换位到y轴上。图10中的虚线代表通过第一频谱轮廓S1与加权函数w相乘获得的已加权的频谱轮廓WS1。在图10中,第一频谱轮廓S1的低频段L被加权,由此被向上迁移,然而中频段M和高频段H的加权为1(默认加权,log(1)=0),从而不被迁移。
图10的加权函数w被期待保护低频元音不受如下的频率换位方案的破坏,该频率换位方案将来自中频段M的频率分量调换到低频段L。在将作为输入频谱的中频段调换到低频段L之前不应用该加权函数w的情况下,中频段M的重要频率分量与头两个共振峰的重叠会导致不想要的中断,这会导致听力设备用户不舒适。
图11示出了代表摩擦音的第二频谱轮廓S2,与图10中示出的相同的加权函数w被应用至第二频谱轮廓S2。第二频谱轮廓S2在高频段H中包括大部分能量,而低频段L仅具有较少能量,使得即使在应用该加权函数w之后,高频段H仍是最重要的频谱段。该加权函数w可以被适当地选择,并且在所容忍的元音失真量与需要被调换或降低的新的高频摩擦音信息之间提供折衷。
该加权函数w的目的是基于听力受损人员的期望来改变频谱信息的重要性。
通过将加权函数w与频谱能量量值——由图10和11中的频谱轮廓S1和S2表示——相乘获得的这种重要性测量,则被所述频率换位方案用来对需要被调换的信息或频率分量作出决定。再一次,在一个实施方案中,该加权仅用于选择对应的频率范围,并且此后仅未加权的频率范围被调换。在另一个实施方案中,已加权的频谱被调换。
由于大多数听力受损患者在低频段L中仍具有一些有用的听力,所以根据本发明,加权函数w可以被挑选以使得给予低频信息许多重要性,以防止它们被频率换位方案更改(和失真)。根据本发明的方法提出对一个频率调换方案进行偏置,以更好地基于可用的听力来匹配听力受损用户的听觉期望,而仍保留对由高频能量主导的摩擦音进行调换的机会。与加权函数w一起,频率换位方案可以利用元音由较低频率中的较高能量主导、以及摩擦音由较高频率中的较高能量主导的事实,来有条件地降低摩擦音,同时几乎不改变元音。这降低了听力受损用户对频率换位方案的初始异议,同时使益处最大化。这对于听力受损用户对频率换位算法的接受可以是关键的,在此截止频率需要被降得足够低,以侵占带有重要元音信息的频率区域,即,低于1500Hz。该频率换位方案做出的假定是,音位的能量分布对于该音位的最重要的频谱段中的毗邻频率没有显著不同。这是一个前提,使得在应用该加权函数w之后突出的最重要的频谱段在感知上是连贯和有意义的。
图12示出了频谱轮廓S3的又一个实施例,频谱轮廓S3由低频段L、中频段M和高频段H中的能量主导。当对这个频谱轮廓S3应用了与图10和图11中示出的相同的加权函数w时,最重要的频谱段仍是高频段H,它具有比中频段M高的能量。然而,这分别对于音位感知或辨别可能不是最有用的频率段。图13中示出了一个稍微不同的加权函数w’,与高频段H中被应用的加权值相比,其给出了在中频段M中被应用的稍微更高的加权值。
在图13中可以看到,在应用了该加权函数w’之后,中频段M已经变得更重要,从而可以被频率换位方案选择。
图14和图15分别示出了该加权函数w’没有改变针对图10和11中示出的元音频谱轮廓S1和摩擦音频谱轮廓S2的频谱段的重要性顺序。容易认识到,如果像这样进一步改变加权函数w,则会陷入矛盾的要求,并且不同音位上的频谱能量分布对加权函数的设计灵活性施加了限制。存在一个依赖于听力损失以及所应用的频率换位方案的最佳加权函数w。本发明的优势是,借助于该加权函数w’,有可能在元音失真与对听力受损者可用的有用高频信息之间具有非常低水平的可参数化的折衷。这是在不需要显式检测音位自身(如音位样式识别算法的情形)的情况下,对用于有条件地处理语音的频率换位方案进行参数化的一种非常简单的方式。
这里描述的加权函数w、w’可以用于所有频率换位方案,只要它是针对语音或音乐的。然而,频率换位的成功将依赖于该频率换位方案自身。尤其,输入频谱的分段划分(至少划分成源区和目的区)对于有意义地选择优选用于换位的频率段是重要的。即使在使用线性频率换位的频率换位方案中,所提出的加权函数w、w’也可以被用来保护目的区中的重要频谱信息免受破坏。用这种加权函数w、w’获得的适应性降低的一个优势是,使得与频率换位方案自身的整合更容易。例如,图10和图11中示出的简单加权函数w可以通过针对该频率换位方案(例如已经结合图3至图9描述的以及将要结合图16和17进一步描述的频率堆叠)的单个附加参数来实施。
用于加权函数w、w’的实际值可以被用来更专门地以对一个给定的音位进行频率换位为目标,以达成声音品质与所调换的信息的益处之间的折衷。还应注意,这里描述的简单加权方案是近似的而非确切的,在于它仅提供频率换位语境中在那些可以被调换与仍可以被容忍的失真之间的一个可容易参数化的折衷,以达成针对给定听力损失的频率换位方案的最优配合。
图9和图10示出了可以利用加权函数w来有条件地降低高频能量同时保持低频失真最小的频率换位方案的一个实施例。对于能够成功利用这里描述的加权的频率换位方案,一个重要的要求是,它应将源区划分成感知上重要的信息的有意义的块,并且将源区和目的区分离以用于频率换位。
作为用于频率降低的一个可行实施方案来描述的频率换位方案被称为频率堆叠,并且已经结合图3至图9中描绘的实施方案进行了扩展性的描述。
结合图16描述的频率换位方案被称为静态频率堆叠,其特征在于划分源区20的截止频率FC。在截止频率FC以下,没有信息被改变。在截止频率FC以上,第一源堆栈22被限定为落在源区20内。其他源堆栈23至27被限定为落在第一源堆栈21上方。在本发明的一个实施方案中,如图16和图17中描绘的,源堆栈22至27具有相等的大小。
图16中例示的频率换位方案可以包括如下峰拾取方法,其挑选源堆栈22至27的对应的格口a、b、c、d之间的峰,以构建最终经处理的目的堆栈32。这里的一个重要因素是堆栈大小参数,其被假定为对于例示该频率换位方案的目的是最优的。当然,该堆栈大小参数可以在宽的范围内改变,以符合具体要求。
在图16和图17中,分别对应于元音(图16)和摩擦音(图17)的两个已加权的频谱轮廓WS被示出带有目的堆栈覆盖。从图16和图17中可以看到,元音信息如何被该频率换位方案和该加权函数保留,同时摩擦音信息被调换到目的堆栈32(图17中的虚线),第一源堆栈22中的在x轴上标示的所调换的信号分量具有与目的堆栈32相同的频率。
所呈现的加权函数w、w’可以被用在频率换位方案中,以与现有技术算法中可能的截止频率相比,将截止频率FC进一步向下推。它可以潜在地被用在使用频率压缩的所有听力设备中,以及用在为声音恢复特征提供更低截止频率有意义的场合,同时管理听力设备用户的适应时间和/或初始异议。
在图18中,描绘了例示根据本发明的换位方案的又一个实施方案的一个图表。
再一次,输入频率fin被示出在x轴上,而输出频率fout被示出在y轴上。该x轴以及该y轴具有对数标度。根据本发明的频率换位方案包括如下步骤:将下部源区21中的频谱能量复制到下部目的区31中,上至下部截止频率FC(一对一映射)。此外,第一源堆栈22(其在下部截止频率FC处开始并且在上部截止频率FHL处结束)的频谱能量在一个实施方案中也被复制到目的堆栈32(再一次是一对一映射)。当上部截止频率FHL理想地被设计为该听力设备用户的听力可辅助区(aid-able region)的边缘(注意,上部截止频率FHL也可以比听力可辅助区的边缘高或低),上至该上部截止频率FHL听力设备用户的听觉期望需要被重视,下部截止频率FC由下列等式确定:
F k = C R · FC - F HL C R - 1
其中
CR是这两个源堆栈22和23的第二源堆栈23中的压缩比;
FC对应于在下部源区21与第一源堆栈22之间限定的下部截止频率的对数;
FHL对应于作为第二源堆栈23的最低频率的上部截止频率的对数;且
Fk对应于如下的开始频率的对数,所述开始频率被限定为下部源区21中的频率分量的一对一映射与第二源堆栈23的压缩映射的延伸之间的交叉点。
对于给定听力损失,上面的等式中的参数的最优值的确定,可以基于例如如下出版物所描述的听力学经验,该出版物题为“ModifiedVerification Approaches for Frequency Lowering Devices”、作者为Danielle Glista和Susan Scollie(National Centre forAudiology,the University of Western Ontario,September 11,2009)。这个出版物可以获取自互联网网址http://www.audiologyonline.com/articles/article_detail.asp?article_id=2301。
在根据本发明的频率换位方案中,该压缩不在下部截止频率FC处开始,而是在上部截止频率FHL处开始。该压缩在上部频率Fu处结束,在上部频率Fu以上不期望有相关信息。第二源堆栈23——被限定在上部截止频率FHL与上部频率Fu之间——也被调换到目的堆栈32,在目的堆栈32进行第一源堆栈22和/或第二源堆栈23的频谱能量的替换和/或叠加(superposition)。例如,带有后续叠加的偏置的峰拾取算法或加权函数w被应用,以强调第二源堆栈23中或第一源堆栈22中的相关频谱信息。
该偏置的峰拾取方法被用来重视该听力设备的用户的听觉期望,并且通过使用适当的频谱加权函数来实现。
该加权函数w(再一次也被称为期望偏置)被用来适应性地选择输入频谱的不同部分,例如第一源堆栈22或第二源堆栈23(图18),以调换到目的堆栈32。该频谱能量的量值被乘以该加权函数w的权重,并且这个已加权的频谱可以被频率换位方案用于进一步处理。
该加权函数w或该期望偏置函数以如下方式对输入频谱进行加权:已经可用的低频信息被给予更多重要性。如果频率换位方案继而从待调换到目的区30的给定源区20中选择最重要的信息,则听觉期望更被重视,并且只有与该听力受损的用户在下部源区21或下部目的区31中已经可获得的相比相当重要的信息才被调换。
使用加权函数w的一个优势是,能够在不对音位自身进行任何显式实时检测的情况下实现适应性降低。这是通过仔细挑选权重以及通过利用摩擦音与元音相比在较高频率具有成比例大得多的能量这个事实来实现的。这防止元音失真,同时仍降低摩擦音中的高频信息。
根据本发明的这个实施方案的频率换位方案确保了两个从根本上不同于已知的频率压缩方案的事情:
首先,它在频率换位语境中将第二源堆栈23与第一源堆栈22分离。第二个区别是,使用在第一源堆栈22与第二源堆栈23的频谱能量之间具有偏置的峰拾取算法来选择目的堆栈32中的频率换位方案的最终输出。这引起了最终输入/输出曲线变得依赖于信号,与已知的频率换位方案不同,已知的频率换位方案实施了输入频率fin与输出频率fout之间的非线性单调关系,如图2中所示。
例如,该偏置的峰拾取算法可以用下列公式表示,其中对于给定的压缩比CR和下部截止频率FC,在(n+j),(n+j+1),...,(n+j+k)处的频率格口映射到同一频率格口n:
i=argmax[w(n)·Fin(n),w(n+j)·Fin(n+j),w(n+j+1)·Fin(n+j+1),...,w(n+j+k)·Fin(n+j+k)]
Fout(n)=w"(i)·Fin(i)
其中
Fout(n)是针对具有指数n的给定频率格口而言的峰选择方案的输出;
w(n)是针对第n个频率格口而言的期望偏置加权函数的值;
w”(i)是针对指数i而言的另一个加权函数的值,用于对目的堆栈32中的所调换的格口的值进行加权;
argmax[…]表示[]内的表达式最大的格口指数;
Fin(n)是针对频率格口n的输入量值。
根据本发明的频率换位方案的下部截止频率由FC表示,并且被应用在第二源堆栈23中的压缩比由CR表示。
图18中示出的不同参数之间的关系由例如下列等式给出:
F k = C R · FC - F HL C R - 1
下部截止频率FC和压缩比CR的参数化在已知的频率压缩算法中应理想地依赖于听力损失和语音的频谱能量分布。
第二源堆栈23和目的堆栈32在该压缩方案中的分离,连同偏置的峰拾取,仅当它们与第一源堆栈22中已经存在的相比是重要的时才允许调换能量。这使得元音的已经可听的谐波结构保持原样,同时仍调换由高频能量主导的摩擦音及其他音位。
由于西方器乐的音符的谐波关系与元音相似,所以根据本发明的频率换位方案与已知技术相比,使音乐失真的程度也较少。
本发明的所有实施方案通过更好地管理在原始频率压缩方案中的对于下部截止频率可听的元音失真,允许将频率换位方案扩展应用至具有深度听力损失和非常有限的可辅助听力带宽的听力受损者。
原则上,本发明也可以被扩展用于低频听力损失(尽管低频听力损失是罕见的但仍广为人知),其中听觉期望偏置或加权函数是从可获得的高频得出的。

Claims (19)

1.一种通过对听力设备的输入信号(i)应用频率换位方案来运行所述听力设备的方法,所述听力设备包括输入换能器(1)、信号处理单元(3)和输出换能器(5),所述方法包括如下步骤:
-通过应用变换函数将所述输入信号(i)从时域变换到频域以获得输入频谱,所述输入频谱具有包括源区(20)和目的区(30)的频率范围;
-考虑到所述输入信号(i)的瞬时特性来适应性地选择所述源区(20)的信号分量;
-将所选择的信号分量调换到所述目的区(30);以及
-将输出频谱或输出频谱的变换提供到所述输出换能器(5),所述输出频谱包括所述目的区(30)的信号分量。
2.根据权利要求1所述的方法,其中所述瞬时特性是下列中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区(20)中的瞬时能量分布,尤其是所述源区(20)中的音位的瞬时能量分布;
-所述目的区(30)中的瞬时能量分布;
-所述输入信号(i)中存在的扰动信号。
3.根据权利要求1或2所述的方法,其中所述源区(20)包括下部源区(21)和至少两个源堆栈(22,...,26),所述下部源区(21)在截止频率(FC)以下,且所述至少两个源堆栈(22,...,26)在所述截止频率(FC)以上,并且其中所述目的区(20)包括下部目的区(31)和目的堆栈(32),所述下部目的区(31)在所述截止频率(FC)以下,且所述目的堆栈(32)在所述截止频率(FC)以上,所述截止频率(FC)尤其在1500Hz以下。
4.根据权利要求1至3中的一个权利要求所述的方法,其中调换的步骤包括下列步骤:
-确定落在所述源区(20)内的中心频率格口,频谱能量在所述中心频率格口处最大;以及
-将均等分布在所述中心频率格口周围的频率格口调换到所述目的区(30)。
5.根据权利要求3所述的方法,其中在所述截止频率(FC)以上的所述源区(20)被划分成均等大小的源堆栈(22,...,26),每个源堆栈具有的频率范围等于所述目的堆栈(32)的频率范围。
6.根据权利要求5所述的方法,其中调换的步骤包括下列步骤之一:
-将所述源堆栈(22,...,26)的频率格口调换到所述目的堆栈(32)的对应的频率格口,被调换的频率格口在所述源堆栈(22,...,26)的所有对应的频率格口之中具有最大能量;
-将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32),所调换的源堆栈(22,...,26)包括具有最大能量的频率格口;
-将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32),所调换的源堆栈(22,...,26)包括在其频率格口上的最大能量总和;
-将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32),所调换的源堆栈(22,...,26)保留最大的频谱对比度。
7.根据权利要求1至6中的一个权利要求所述的方法,还包括在适应性地选择所述源区(20)的信号分量的步骤之前,对所述源区(20)的信号分量应用预加权函数(w,w’)的步骤。
8.根据权利要求7所述的方法,其中所述预加权函数(w,w’)基于下列准则中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区(20)中的瞬时能量分布;
-所述目的区(30)中的瞬时能量分布;
-所述输入信号(i)中存在的扰动信号。
9.根据权利要求1至8中的一个权利要求所述的方法,还包括在将所选择的信号分量调换的步骤之后,对所述目的区(30)应用后加权函数(w”)的步骤。
10.根据权利要求9所述的方法,其中选择步骤和调换步骤包括根据下列方案的峰拾取:
i=argmax[w(n)·Fin(n),w(n+j)·Fin(n+j),w(n+j+1)·Fin(n+j+1),...,w(n+j+k)·Fin(n+j+k)]
Fout(n)=w"(i)·Fin(i)
其中
-Fout(n)是针对具有指数n的给定频率格口而言的峰选择方案的输出;
-w(n)是针对第n个频率格口的预加权函数的值;
-w”(i)是针对指数i的后加权函数的值,用于对目的区中的所调换的格口的值进行加权;
-argmax[…]表示[]内的表达式最大的格口指数;且
-Fin(n)是针对频率格口n的输入量值。
11.根据权利要求1至10中的一个权利要求所述的方法,其中所述频率换位方案由下列公式限定:
F k = C R · FC - F HL C R - 1
其中
-CR是两个源堆栈(22,23)之中的第二源堆栈(23)中的压缩比;
-FC对应于在下部源区(21)与第一源堆栈(22)之间限定的截止频率的对数;
-FHL对应于作为所述第二源堆栈(23)的最低频率的上部频率的对数;且
-Fk对应于如下的开始频率的对数,所述开始频率被限定为所述下部源区(21)中的频率分量的一对一映射与所述第二源堆栈(23)的压缩映射的延伸之间的交叉点。
12.一种听力设备,包括:
-输入换能器(1);
-输出换能器(5);
-信号处理单元(3),操作性地连接至所述输入换能器(1)以及所述输出换能器(5);
-用于通过应用变换函数将所述输入信号(i)从时域变换到频域以获得如下输入频谱的装置,所述输入频谱具有包括源区(20)和目的区(30)的频率范围;
-用于考虑到所述输入信号(i)的瞬时特性来适应性地选择所述源区(20)的信号分量的装置;
-用于将所选择的信号分量调换到所述目的区(30)的装置;以及
-用于将输出频谱或输出频谱的变换提供到所述输出换能器(5)的装置,所述输出频谱包括所述目的区(30)的信号分量。
13.根据权利要求12所述的听力设备,其中所述瞬时特性是下列中的至少一个:
-所述听力设备的用户的听觉期望;
-所述源区(20)中的瞬时能量分布,尤其是所述源区(20)中的音位的瞬时能量分布;
-所述目的区(30)中的瞬时能量分布;
-所述输入信号(i)中存在的扰动信号。
14.根据权利要求12或13所述的听力设备,其中所述源区(20)包括下部源区(21)和至少两个源堆栈(22,...,26),所述下部源区(21)在截止频率(FC)以下,且所述至少两个源堆栈(22,...,26)在所述截止频率(FC)以上,并且其中所述目的区(20)包括下部目的区(31)和目的堆栈(32),所述下部目的区(31)在所述截止频率(FC)以下,且所述目的堆栈(32)在所述截止频率(FC)以上,所述截止频率(FC)尤其在1500Hz以下。
15.根据权利要求12至14中的一个权利要求所述的听力设备,其中用于调换的装置包括下列装置:
-用于确定落在所述源区(20)内的中心频率格口的装置,频谱能量在所述中心频率格口处最大;以及
-用于将均等分布在所述中心频率格口周围的频率格口调换到所述目的区(30)的装置。
16.根据权利要求14所述的听力设备,其中在所述截止频率(FC)以上的所述源区(20)被划分成均等大小的源堆栈(22,...,26),每个源堆栈具有的频率范围等于所述目的堆栈(32)的频率范围。
17.根据权利要求16所述的听力设备,其中用于调换的装置包括下列装置中的一个:
-用于将所述源堆栈(22,...,26)的频率格口调换到所述目的堆栈(32)的对应的频率格口的装置,被调换的频率格口在所述源堆栈(22,...,26)的所有对应的频率格口之中具有最大能量;
-用于将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32)的装置,所调换的源堆栈(22,...,26)包括具有最大能量的频率格口;
-用于将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32)的装置,所调换的源堆栈(22,...,26)包括在其频率格口上的最大能量总和;
-用于将所述源堆栈(22,...,26)之一的所有频率格口调换到所述目的堆栈(32)的装置,所调换的源堆栈(22,...,26)保留最大的频谱对比度。
18.根据权利要求12至17中的一个权利要求所述的听力设备,还包括用于在适应性地选择所述源区(20)的信号分量之前对所述源区(20)的信号分量应用预加权函数(w,w’)的装置。
19.根据权利要求12至18中的一个权利要求所述的听力设备,还包括在将所选择的信号分量调换之后对所述目的区(30)应用后加权函数(w”)的装置。
CN201180071836.5A 2011-06-23 2011-06-23 用于运行听力设备的方法以及听力设备 Active CN103733259B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2011/060541 WO2012175134A1 (en) 2011-06-23 2011-06-23 Method for operating a hearing device as well as a hearing device

Publications (2)

Publication Number Publication Date
CN103733259A true CN103733259A (zh) 2014-04-16
CN103733259B CN103733259B (zh) 2016-10-19

Family

ID=44627901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180071836.5A Active CN103733259B (zh) 2011-06-23 2011-06-23 用于运行听力设备的方法以及听力设备

Country Status (5)

Country Link
US (1) US9319804B2 (zh)
EP (1) EP2724341B1 (zh)
CN (1) CN103733259B (zh)
DK (1) DK2724341T3 (zh)
WO (1) WO2012175134A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111602197A (zh) * 2018-01-17 2020-08-28 日本电信电话株式会社 解码装置、编码装置、它们的方法以及程序

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9173041B2 (en) * 2012-05-31 2015-10-27 Purdue Research Foundation Enhancing perception of frequency-lowered speech
EP3014900B1 (en) 2013-06-28 2018-04-11 Sonova AG Method and apparatus for fitting a hearing device employing frequency transposition
WO2015090352A1 (en) 2013-12-16 2015-06-25 Phonak Ag Method and apparatus for fitting a hearing device
US10390147B2 (en) * 2015-02-24 2019-08-20 Gn Hearing A/S Frequency mapping for hearing devices
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
EP3174315A1 (en) * 2015-11-03 2017-05-31 Oticon A/s A hearing aid system and a method of programming a hearing aid device
US9980053B2 (en) 2015-11-03 2018-05-22 Oticon A/S Hearing aid system and a method of programming a hearing aid device
US10085099B2 (en) 2015-11-03 2018-09-25 Bernafon Ag Hearing aid system, a hearing aid device and a method of operating a hearing aid system
US11184715B1 (en) 2020-10-05 2021-11-23 Sonova Ag Hearing devices and methods for implementing an adaptively adjusted cut-off frequency

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5394475A (en) * 1991-11-13 1995-02-28 Ribic; Zlatan Method for shifting the frequency of signals
EP1686566A2 (en) * 2005-04-29 2006-08-02 Phonak AG Sound processing with frequency transposition
WO2007000161A1 (en) * 2005-06-27 2007-01-04 Widex A/S Hearing aid with enhanced high frequency reproduction and method for processing an audio signal
US7248711B2 (en) * 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
EP1333700A3 (en) * 2003-03-06 2003-09-17 Phonak Ag Method for frequency transposition in a hearing device and such a hearing device
DK2375782T3 (en) * 2010-04-09 2019-03-18 Oticon As Improvements in sound perception by using frequency transposing by moving the envelope

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5394475A (en) * 1991-11-13 1995-02-28 Ribic; Zlatan Method for shifting the frequency of signals
US7248711B2 (en) * 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
EP1686566A2 (en) * 2005-04-29 2006-08-02 Phonak AG Sound processing with frequency transposition
WO2007000161A1 (en) * 2005-06-27 2007-01-04 Widex A/S Hearing aid with enhanced high frequency reproduction and method for processing an audio signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111602197A (zh) * 2018-01-17 2020-08-28 日本电信电话株式会社 解码装置、编码装置、它们的方法以及程序
CN111602197B (zh) * 2018-01-17 2023-09-05 日本电信电话株式会社 解码装置、编码装置、它们的方法以及计算机可读记录介质

Also Published As

Publication number Publication date
WO2012175134A1 (en) 2012-12-27
CN103733259B (zh) 2016-10-19
EP2724341A1 (en) 2014-04-30
US9319804B2 (en) 2016-04-19
DK2724341T3 (en) 2018-12-03
EP2724341B1 (en) 2018-09-26
US20140105435A1 (en) 2014-04-17

Similar Documents

Publication Publication Date Title
CN103733259A (zh) 用于运行听力设备的方法以及听力设备
CN102016984B (zh) 用于动态声音传送的***和方法
CN101496420B (zh) 利用信号处理算法改善语音清晰度和听力舒适度的方法、设备和***
CN101208991B (zh) 具有加强的高频再现功能的助听器以及处理声频信号的方法
CN100397781C (zh) 声音增强***
Gilbert et al. The ability of listeners to use recovered envelope cues from speech fine structure
CN102264022B (zh) 助听器的稳定性改进
CN101505448B (zh) 适应于声环境中的特定类型话音的助听器及相应方法
CN1282156C (zh) 音频信号带宽扩展
US9369102B2 (en) Methods and apparatus for processing audio signals
CN102498482B (zh) 用于自适应话音可懂度处理的***
Gnansia et al. Effects of spectral smearing and temporal fine structure degradation on speech masking release
KR20070000995A (ko) 고조파 신호의 주파수 확장 방법 및 시스템
CN1565144A (zh) 使用过采样滤波器组的定向音频信号处理
Yang et al. Spectral contrast enhancement: Algorithms and comparisons
CN113299313B (zh) 音频处理方法、装置及电子设备
CN105845149A (zh) 声音信号中主音高的获取方法及***
Chabot-Leclerc et al. The role of auditory spectro-temporal modulation filtering and the decision metric for speech intelligibility prediction
CN103731780A (zh) 数字助听器信号处理方法
Gilbert et al. Effects of periodic interruptions on the intelligibility of speech based on temporal fine-structure or envelope cues
US8670582B2 (en) N band FM demodulation to aid cochlear hearing impaired persons
Clifford et al. Proximity effect detection for directional microphones
KR20020044416A (ko) 청각 보정 기능을 갖는 개인용 무선 통신 장치 및 방법
Ardoint et al. Importance of temporal-envelope speech cues in different spectral regions
CN102436817B (zh) 具有谐波校正的频率压缩的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Zurich, Switzerland

Applicant after: PHONAK AG

Address before: Zurich, Switzerland

Applicant before: Phonak AG

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant