CN1282156C - 音频信号带宽扩展 - Google Patents
音频信号带宽扩展 Download PDFInfo
- Publication number
- CN1282156C CN1282156C CNB028232801A CN02823280A CN1282156C CN 1282156 C CN1282156 C CN 1282156C CN B028232801 A CNB028232801 A CN B028232801A CN 02823280 A CN02823280 A CN 02823280A CN 1282156 C CN1282156 C CN 1282156C
- Authority
- CN
- China
- Prior art keywords
- signal
- audio signal
- bandwidth
- noise
- domain representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 106
- 239000004606 Fillers/Extenders Substances 0.000 claims abstract description 41
- 238000007493 shaping process Methods 0.000 claims abstract description 35
- 230000005540 biological transmission Effects 0.000 claims abstract description 16
- 238000001228 spectrum Methods 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims description 10
- 244000287680 Garcinia dulcis Species 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 238000002156 mixing Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 abstract description 9
- 238000005070 sampling Methods 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 239000004411 aluminium Substances 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Noise Elimination (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
描述了一种传输***,该传输***包括用于通过传输信道向接收机发送窄带音频信号的发射器。该接收机包括用于从窄带音频信号产生宽带音频信号的带宽扩展器(18)。带宽扩展器(18)包括频谱折叠装置(30),该频谱折叠装置(30)用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后音频信号(33)。本发明的传输***特征在于带宽扩展器(18)包括噪声整形器(32),该噪声整形器(32)用于通过根据频谱折叠后音频信号(33)的至少一部分对噪声信号(31)进行整形来产生整形后噪声信号(35),其中带宽扩展器(18)还包括一合并器(34),该合并器用于将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。这样就可以通过将整形后噪声信号(35)与频谱折叠后信号(33)合并来屏蔽由频谱折叠引入的金属声音。
Description
技术领域
本发明涉及一种用于从窄带音频信号产生宽带音频信号的带宽扩展器,其中窄带音频信号具有一第一带宽,宽带音频信号具有一第二带宽,其中第二带宽大于第一带宽,其中带宽扩展器包括用于接收窄带音频信号的输入端和用于提供宽带音频信号的输出端,其中带宽扩展器还包括与输入端耦合的频谱折叠(spectral folding)装置,其中频谱折叠装置用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号。
本发明还涉及一种接收器,用于通过传输信道来接收窄带音频信号,该接收器包括一用于从窄带音频信号产生宽带音频信号的带宽扩展器,还涉及一种接收窄带音频信号的方法,以及用于从窄带音频信号产生宽带信号的方法。
背景技术
2001年5月8-11日在尤他州盐湖城举行的2001 IEEE国际声学、语音学以及信号处理论坛纪要中,由S.Chennoukh,A.Gerrits,G.Miet以及R.Sluihter所作的论文“通过利用线频谱频率的频率带宽扩展来提高语音”描述了一种带宽扩展器,该带宽扩展器可以例如用于音频信号,该音频信号可以是从传输介质例如广播频道、同轴电缆或光纤中接收到的如语音信号或音乐信号等。其他可能的应用还有自动应答机、录音机、(移动)电话、MP3播放器和语音书。
在目前电话网络中使用的窄带语音的带宽为3100Hz(300-3400Hz)。如果带宽增加到大约7kHz(50-7000Hz),则语音声音会更加自然。具有这种带宽的语音被称为宽带语音,它具有附加的低带宽(50-300Hz)和高带宽(3400-7000Hz)。从该窄带语音信号,可以通过外插法产生一高带宽和一低带宽。所产生的语音信号被称为伪宽带语音信号。目前已知多种用于扩展窄带信号的带宽的技术,例如1999年6月20-23日于芬兰举行的IEEE语音编码专题研讨会中的论文“用于编码后窄带语音的带宽增加的新技术”。这些技术用于在不改变网络的前提下,提高窄带网络例如电话网络中的语音质量。在接收侧(例如移动电话或电话应答机),可以将窄带语音扩展为伪宽带语音。
图5示出了在公知传输***中使用的带宽扩展器18的方块图。首先利用上采样器60将输入的窄带语音信号成对地上采样(即,在输入的窄带语音信号的连续采样之间***零),该输入的窄带语音信号是以8kHz进行采样,且它被提供到带宽扩展器18的输入端20上。以16kHz对所获得的上采样后信号61进行采样。该上采样后信号61在低带宽即0-4kHz范围内的频谱与输入信号和它的折叠后变型在高带宽即4-8kHz范围内的频谱相同。然后为了恢复与输入信号相同但以16kHz采样的频谱特性,在低通滤波器62对信号61进行低通滤波,从而去除折叠后变型。将低通滤波后信号63提供到LPC综合型滤波器70以及下采样器64。
下采样器64对低通滤波后信号63成对地进行下采样。然后,利用LPC综合型滤波器66使用自回归LPC模型对产生的下采样后信号65(以8kHz进行采样)进行模仿(modeled)。该LPC综合型滤波器66从下采样后信号65得到LPC系数67。这些LPC系数67代表输入的窄带语音信号的频谱。然后,包络扩展器68使用窄带LPC系数67来扩展窄带信号的频谱包络并得到宽带LPC系数69。这种频谱包络的扩展是通过将低频带线性频谱频率(LSF)映射为宽带LSF而执行的。通过一组映射矩阵来执行这种映射。
然后,利用扩展后LPC综合型滤波器70根据宽带LPC系数69来分析该低通滤波器62的输出信号63。然后在频谱折叠装置30中对分析剩余量71成对地进行下采样和上采样(即每隔一个采样就置零),该分析剩余量具有平坦的频谱。连续的下采样和上采样可以实现频谱折叠。所产生的频谱折叠后信号73是稀疏的(sparse)信号,为了获得宽带语音信号,它可用于激励宽带综合型滤波器72,该宽带语音信号将被提供到宽带扩展器18的输出端22。宽带综合型滤波器72根据宽带LPC系数69来操作,它是综合型滤波器70的逆向滤波器。
现有宽带扩展器18的缺点是输入的窄带信号的频谱折叠将引入谐波位移(即高频带的谐波分量并不是精确的位于它们应当处于的频率上),这种谐波位移将导致再现时产生噪声或金属类声音。这些谐波位移的产生是由于当使用谐波采样时高频带的谐波分量是仅有的与低频带信号的谐波分量相关的谐波(通常不是这种情况)。
发明内容
本发明的一个目的是提供一种可以避免上述缺点的带宽扩展器。本发明目的的实现是通过使该带宽扩展器还包括一噪声整形器,它根据频谱折叠后音频信号的至少一部分对噪声信号整形从而产生整形后的噪声信号,其中带宽扩展器还包括一合并器,该合并器用于将整形后噪声信号和频谱折叠后音频信号合并为宽带音频信号。已经发现可以通过将频谱折叠后音频信号与整形后噪声信号合并,来有效地掩盖(masked)该频谱折叠后音频信号的谐波位移。随着谐波位移被掩盖,当再现宽带音频信号时,就不会再出现不希望的噪声/金属类声音。
可以通过根据(至少一部分)频谱折叠后音频信号的属性,例如根据频谱折叠后音频信号的幅度或相位来对(白)噪声信号进行整形,产生整形后噪声信号。最好地,按照频谱折叠后音频信号的至少一部分的包络(例如时间包络)的比例,来对噪声信号整形。监听试验已经表明这种整形后噪声信号和频谱折叠后音频信号的合并可以产生非常好质量的宽带音频信号。
这种根据频谱折叠后音频信号的包络而整形的整形后噪声最好通过噪声整形器来产生,该噪声整形器包括一包络分离器,该包络分离器(envelope extractor)用于从频谱折叠后音频信号中分离出一包络信号,其中噪声整形器还包括一混频器,用于通过将噪声信号与包络信号混频而产生该整形后噪声信号。
包络分离器最好包括一Hibert变换器,该Hibert变换器可包括级联的下述部分:傅立叶变换器,用于将频谱折叠后信号的时域表示转换为它的频域表示;用于将频域表示的负频率调零的装置;一逆傅立叶变换器,用于将调零后的频域表示变换为其时域表示;以及一整流器,用于通过对调零后的时域表示进行整流来产生包络信号。
根据本发明的第一方面,提供了一种用于从窄带音频信号产生宽带音频信号的带宽扩展器(18),该带宽扩展器包括:
用于接收具有第一带宽的窄带音频信号的输入端(20);
用于提供宽带音频信号的输出端(22),宽带音频信号具有第二带宽,第二带宽大于第一带宽;
与输入端(20)耦合的频谱折叠装置(30),用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33);
其特征在于:
噪声整形器(32),根据频谱折叠后音频信号(33)的至少一部分与频谱折叠后音频信号(33)的至少一部分的时间包络成比例地对噪声信号(31)整形从而产生整形后的噪声信号(35);
合并器(34),该合并器(34)用于将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
根据本发明的第二方面,提供了一种用于从窄带音频信号产生宽带音频信号的方法,其中窄带音频信号具有第一带宽,宽带音频信号具有第二带宽,第二带宽大于第一带宽,该方法包括:
通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33),其特征在于该方法还包括:
根据频谱折叠后音频信号(33)的至少一部分与频谱折叠后音频信号(33)的至少一部分的时间包络成比例地对噪声信号(31)整形,从而产生整形后噪声信号(35);
将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
本发明从属权利要求限定了最佳实施例。
附图说明
从下面参照附图的最佳实施例描述中可以更清楚地看到本发明的目的和特征,附图如下:
图1示出包括具有本发明带宽扩展器18的接收器14的传输***10的实施例的方块图;
图2示出根据本发明的带宽扩展器18的实施例的方块图;
图3示出根据本发明在传输***10中使用的噪声整形器32的实施例的方块图;
图4示出在根据本发明的传输***10中使用的包络分离器/Hilbert变换器40的实施例的方块图;
图5示出现有技术带宽扩展器18的方块图;
图6示出图5的带宽扩展器18的部分74的方块图,该部分74在本发明中被采用;
在这些附图中,相同的部分具有相同的附图标记。
具体实施方式
图1示出根据本发明的传输***10的一实施例的方块图。传输***10包括一发射器12,该发射器12用于通过传输信道16向接收器14发送窄带音频信号,例如窄带语音信号或窄带音乐信号。传输***10可以是一电话通信***,其中发射器可以是(移动)电话,接收器可以是(移动)电话或应答机。接收器14包括用于根据窄带音频信号产生宽带音频信号的带宽扩展器18。窄带音频信号的带宽小于宽带音频信号的带宽。带宽扩展器18包括一输入端20和一输出端22,该输入端20用于接收窄带音频信号,输出端22用于向接收器14的附加信号处理部分(未示出)提供宽带音频信号,该附加信号处理部分用于对宽带音频信号进行放大、再现和/或存储。
图2示出根据本发明的带宽扩展器18的一实施例的方块图,其中带宽扩展器18可用于本发明的传输***10中。带宽扩展器18包括输入端20、频谱折叠装置30、噪声整形器32、合并器34和输出端22。频谱折叠装置30设置成与输入端20耦合,从而可以将通过输入端20接收到的窄带音频信号提供到频谱折叠装置30。频谱折叠装置30用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后音频信号33。频谱折叠装置30将频谱扩展后音频信号33提供给噪声整形器32和合并器34。噪声整形器32设置成用于根据频谱折叠后音频信号33的至少一部分,通过对(白)噪声信号31进行整形来产生整形后噪声信号35。噪声整形器32向合并器34提供整形后噪声信号35。合并器34用于将整形后噪声信号35和频谱折叠后音频信号33合并为宽带音频信号。宽带音频信号的带宽大于窄带音频信号的带宽。最后,带宽音频信号被提供给输出端22。
最佳地,噪声整形器32用于按照频谱折叠后音频信号33的至少一部分的包络成比例地对噪声信号21进行整形,产生整形后噪声信号35。这种噪声整形器32如图3所示。图3示出在本发明传输***10中使用的噪声整形器32的实施例的方块图。噪声整形器32包括一包络分离器40和一混频器42。包络分离器40用于从频谱折叠后音频信号33中分离出包络信号41并向混频器42提供该包络信号41。该混频器42用于通过将该噪声信号31与包络信号41相乘来产生整形后噪声信号35。
图4示出在本发明接收器14中使用的包络分离器/Hilbert变换器40的一实施例的方块图。包络分离器40最好包括一Hilbert变换器40。该Hilbert变换器40包括级联的快速傅立叶变换器50、调零单元52、逆快速傅立叶变换器54和整流器56。快速傅立叶变换器50将频谱折叠后信号33的时域表示变换为它的频域表示51。该调零单元52用于将该频域表示51的负频率调零。逆傅立叶变换器54用于将调零后频域表示53变换为其时域表示55。整流器56用于通过对调零后时域表示55进行整流(即,取其绝对值)来产生包络信号41。
频谱折叠后音频信号33的频域表示51是复数信号。实部信号可以由具有不同相位、幅度和频率的正弦曲线的总和来表示。快速傅立叶变换(FFT)是多个复数e幂的总和。由于正弦可以被描述为两个e幂的和,其中一个e幂具有正频率,另一个具有负频率,FFT频谱相对于零(DC)对称。通过在调零装置52中去除负频率,可以产生复数信号(解析信号)的频谱,它是多个独立的e幂的总和。当从该解析信号的IFFT得到绝对值时(即通过整流器56),可以得到原始输入信号的时域包络(由于复数e幂的绝对值等于一)。
图5示出2001年5月8-11日在尤他州盐湖城举行的2001 IEEE国际声学、语音学以及信号处理论坛纪要中,由S.Chennoukh,A.Gerrits,G.Miet以及R.Sluihter所作的论文“通过利用线频谱频率的频率带宽扩展来提高语音”中描述的现有技术带宽扩展器18的方块图。首先利用上采样器60将输入的窄带语音信号成对地上采样(即,在连续采样之间***零),输入的窄带语音信号是以8kHz进行采样,且它被提供到带宽扩展器18的输入端20上。以16kHz对所获得的上采样后信号61进行采样。该上采样后信号61在低带宽即0-4kHz范围内的频谱与输入信号和它的折叠后变型在高带宽即4-8kHz范围内的频谱相同。然后为了恢复与输入信号相同但以16kHz采样的频谱特性,在低通滤波器62对信号61进行低通滤波,从而去除折叠后变型。将低通滤波后信号63提供到LPC综合型滤波器70以及下采样器64。
下采样器64对低通滤波后信号63成对地进行下采样。然后,利用LPC综合型滤波器66使用自回归LPC模型对产生的下采样后信号65(以8kHz进行采样)进行模仿(modeled)。该LPC综合型滤波器66从下采样后信号65得到LPC系数67。这些LPC系数67代表输入的窄带语音信号的频谱。然后,包络扩展器68使用窄带LPC系数67来扩展窄带信号的频谱包络并得到宽带LPC系数69。这种频谱包络的扩展是通过将低频带线性频谱频率(LSF)映射为宽带LSF而执行的。通过一组映射矩阵来执行这种映射。
然后,利用扩展后LPC综合型滤波器70根据宽带LPC系数69来分析该低通滤波器62的输出信号63。然后在频谱折叠装置30中对分析剩余量71成对地连续进行下采样和上采样(即每隔一个采样就置零),该分析剩余量具有平坦的频谱。连续的下采样和上采样可以实现频谱折叠。所产生的频谱折叠后信号73是稀疏的信号,为了获得宽带语音信号,它可用于激励宽带综合型滤波器72,该宽带语音信号将被提供到宽带扩展器18的输出端22。宽带综合型滤波器72根据宽带LPC系数69来操作,它是综合型滤波器70的逆向滤波器。
图6示出图5的带宽扩展器18的部分74的方块图,该部分74采用本发明的原理。除了如图5所示的部分74,图6所示的部分74包括噪声整形器32、合并器86、88和多个增益级80、82、84和92。该噪声整形器32包括一包络分离器40、一混频器42和一带通滤波器90。合并器86相当于图2中的合并器34。
如果增益级92的增益系数a被设为0,增益级84的增益系数b被设为2,增益级80的增益系数c被设为0,则可以由图6所示的部分74来描述图5所示的带宽扩展器18的部分74。请注意,在图5中没有示出增益级84。
频谱折叠后信号73包括低频带信号分量和高频带信号分量。当仅仅频谱折叠后信号73的高频带部分受到谐波位移是,不必分离低频带部分的包络。因此,可以利用增益级82和合并器88来从频谱折叠后信号73中去除低频带信号分量。频谱折叠后信号73的幅度等于分析剩余信号71的幅度的一半(由于频谱折叠器30的属性,该频谱折叠器30包括成对下采样器和成对上采样器的级联)。通过增益级82,分析剩余信号71被衰减并被反向,该增益级82向分析剩余信号71提供-0.5的增益系数。然后,利用合并器88使所产生的衰减后分析剩余信号73与频谱折叠后信号73相加,从而从频谱折叠后信号73中去除低频带信号部分。所产生的合并后信号85仅包括高频带信号部分,并被提供给包络分离器40(与图3中的信号33相似)。
包络分离器40从信号85中分离出包络信号87并将信号87提供给混频器42。混频器42通过将带宽滤波后噪声信号89与包络信号87相乘来产生整形后噪声信号91(与图3中的信号35相似)。通过利用带通滤波器90过滤(白)噪声信号31来获得带通滤波后噪声信号89,该带通滤波器90仅允许噪声信号31的高频带分量通过。
增益级92对整形后噪声信号91进行放大/衰减,所产生的信号93被提供给合并器86。增益级84对频谱折叠后信号73进行放大/衰减,所产生的信号95也被提供给合并器86。另外,增益级80对分析剩余信号71进行放大/衰减,所产生的信号也被提供给合并器86。合并器86通过将信号93、95和81相加为合成后信号97来合并这些信号,该合并后信号97被提供给宽带合成滤波器72。
为了使宽带合成滤波器72能够恢复低频带宽,增益铝b和c必须满足下述关系:0.5b+c=1(这些低频带信号100%相关,且幅度可以累计)。对于高频带宽,增益系数a和b必须满足下述关系:(a/2)2+(b/2)2=1即a2+b2=4(这是因为这些信号彼此不相关,因此只能累计能量)。当例如a=b=时,c=1-1/2≈0.3。但是可以进行调节从而提供比所计算出的结果更好的合并。利用下面的设定:a=1.2,b=1.1和c=0.45可以得到满意的结果。
可以通过数字硬件或由数字信号处理器或通用微处理器执行的软件来实现带宽扩展器18。
本发明的范围并不局限于示例性分开的实施例。本发明具体体现在每一新的特征和这些特征的组合。任何附图标记都不对权利要求的范围进行限定。词语“包括”并不排除除权利要求中所列之外的其他元件或步骤的存在。元件前使用的词汇“一个”并不排除多个这种元件出现的可能。可以利用包括多个分离元件的硬件或适当编程的计算机来实现本发明。在列举多个装置的装置权利要求中,这些装置中的多个都可以由一个或硬件相同项目来实现。
Claims (7)
1.一种用于从窄带音频信号产生宽带音频信号的带宽扩展器(18),该带宽扩展器包括:
用于接收具有第一带宽的窄带音频信号的输入端(20);
用于提供宽带音频信号的输出端(22),宽带音频信号具有第二带宽,第二带宽大于第一带宽;
与输入端(20)耦合的频谱折叠装置(30),用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33);
其特征在于:
噪声整形器(32),根据频谱折叠后音频信号(33)的至少一部分与频谱折叠后音频信号(33)的至少一部分的时间包络成比例地对噪声信号(31)整形从而产生整形后的噪声信号(35);
合并器(34),该合并器(34)用于将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
2.如权利要求1所述的带宽扩展器(18),其特征在于噪声整形器(32)包括:
包络分离器(40),该包络分离器(40)用于从频谱折叠后音频信号(33)中分离出时间包络信号(41);
混频器(42),该混频器(42)用于通过将噪声信号(31)与时间包络信号(41)混频而产生该整形后噪声信号(35)。
3.如权利要求2所述的带宽扩展器(18),其特征在于包络分离器(40)包括一Hibert变换器,该Hibert变换器包括级联的下述部分:
傅立叶变换器(50),用于将频谱折叠后音频信号(33)的时域表示转换为它的频域表示(51);
用于将频域表示(51)的负频率调零的装置(52);
逆傅立叶变换器(54),用于将调零后的频域表示(53)变换为其时域表示(55);
以及一整流器(56),用于通过对调零后的时域表示(55)进行整流来产生时间包络信号(41)。
4.一种用于从传输信道(16)接收窄带音频信号的接收器(14),其中接收器(14)包括如权利要求1所述的带宽扩展器(18)。
5.一种用于从窄带音频信号产生宽带音频信号的方法,其中窄带音频信号具有第一带宽,宽带音频信号具有第二带宽,第二带宽大于第一带宽,该方法包括:
通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33),其特征在于该方法还包括:
根据频谱折叠后音频信号(33)的至少一部分与频谱折叠后音频信号(33)的至少一部分的时间包络成比例地对噪声信号(31)整形,从而产生整形后噪声信号(35);
将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
6.如权利要求5的方法,其特征在于该方法还包括:
从频谱折叠后音频信号(33)中分离出时间包络信号(41),
通过将噪声信号(31)与时间包络信号(41)混频而产生该整形后噪声信号(35)。
7.如权利要求6的方法,其中所述的分离步骤包括:
将频谱折叠后音频信号(33)的时域表示转换为它的频域表示(51);
将频域表示(51)的负频率调零;
将调零后的频域表示(53)变换为其时域表示(55);以及
通过对调零后的时域表示(55)进行整流来产生时间包络信号(41)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01204498.8 | 2001-11-23 | ||
EP01204498 | 2001-11-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1589469A CN1589469A (zh) | 2005-03-02 |
CN1282156C true CN1282156C (zh) | 2006-10-25 |
Family
ID=8181279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028232801A Expired - Fee Related CN1282156C (zh) | 2001-11-23 | 2002-10-30 | 音频信号带宽扩展 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20050004803A1 (zh) |
EP (1) | EP1451812B1 (zh) |
JP (1) | JP2005509928A (zh) |
KR (1) | KR20040066835A (zh) |
CN (1) | CN1282156C (zh) |
AT (1) | ATE331280T1 (zh) |
AU (1) | AU2002348961A1 (zh) |
DE (1) | DE60212696T2 (zh) |
WO (1) | WO2003044777A1 (zh) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
EP1482482A1 (de) * | 2003-05-27 | 2004-12-01 | Siemens Aktiengesellschaft | Frequenzerweiterung für Synthesizer |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7450570B1 (en) | 2003-11-03 | 2008-11-11 | At&T Intellectual Property Ii, L.P. | System and method of providing a high-quality voice network architecture |
US20060034299A1 (en) * | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
US8019449B2 (en) * | 2003-11-03 | 2011-09-13 | At&T Intellectual Property Ii, Lp | Systems, methods, and devices for processing audio signals |
US20060034481A1 (en) * | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
WO2006030865A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 |
KR20070070174A (ko) * | 2004-10-13 | 2007-07-03 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법 |
JP4567412B2 (ja) * | 2004-10-25 | 2010-10-20 | アルパイン株式会社 | 音声再生機および音声再生方法 |
JP2006243041A (ja) * | 2005-02-28 | 2006-09-14 | Yutaka Yamamoto | 高域補間装置及び再生装置 |
AU2006232364B2 (en) | 2005-04-01 | 2010-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
TWI317933B (en) | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
US20070005351A1 (en) * | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
EP1783908A3 (en) | 2005-10-27 | 2009-03-18 | Realtek Semiconductor Corp. | Spectrally shaped pseudo-random noise sequence generator and method thereof |
US8223819B2 (en) | 2005-10-27 | 2012-07-17 | Realtek Semiconductor Corp. | Spectrally shaped pseudo-random noise sequence generator and method thereof |
US20070109977A1 (en) * | 2005-11-14 | 2007-05-17 | Udar Mittal | Method and apparatus for improving listener differentiation of talkers during a conference call |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
US8554349B2 (en) | 2007-10-23 | 2013-10-08 | Clarion Co., Ltd. | High-frequency interpolation device and high-frequency interpolation method |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
US20090201983A1 (en) | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
MY152376A (en) * | 2010-03-09 | 2014-09-15 | Fraunhofer Ges Forschung | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
CN102870156B (zh) * | 2010-04-12 | 2015-07-22 | 飞思卡尔半导体公司 | 音频通信设备、输出音频信号的方法和通信*** |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
KR102078865B1 (ko) * | 2011-06-30 | 2020-02-19 | 삼성전자주식회사 | 대역폭 확장신호 생성장치 및 방법 |
EP3089164A1 (en) * | 2011-11-02 | 2016-11-02 | Telefonaktiebolaget LM Ericsson (publ) | Generation of a high band extension of a bandwidth extended audio signal |
KR102003520B1 (ko) * | 2012-09-21 | 2019-07-24 | 삼성전자주식회사 | 신호 처리 장치 및 그 방법 |
US9258428B2 (en) | 2012-12-18 | 2016-02-09 | Cisco Technology, Inc. | Audio bandwidth extension for conferencing |
US10043535B2 (en) * | 2013-01-15 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US10045135B2 (en) | 2013-10-24 | 2018-08-07 | Staton Techiya, Llc | Method and device for recognition and arbitration of an input connection |
CN105706166B (zh) * | 2013-10-31 | 2020-07-14 | 弗劳恩霍夫应用研究促进协会 | 对比特流进行解码的音频解码器设备和方法 |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
DE102015118011A1 (de) * | 2015-10-22 | 2017-04-27 | Human Med Ag | Vorrichtung zur Transplantation von Körperfett |
WO2017116022A1 (ko) * | 2015-12-30 | 2017-07-06 | 주식회사 오르페오사운드웍스 | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 |
US10783904B2 (en) | 2016-05-06 | 2020-09-22 | Eers Global Technologies Inc. | Device and method for improving the quality of in-ear microphone signals in noisy environments |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
JP6693551B1 (ja) * | 2018-11-30 | 2020-05-13 | 株式会社ソシオネクスト | 信号処理装置および信号処理方法 |
CN113708863B (zh) * | 2021-09-10 | 2023-08-01 | 中国人民解放军63891部队 | 频谱感知训练数据集的构建方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP2000305599A (ja) * | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
-
2002
- 2002-10-30 JP JP2003546333A patent/JP2005509928A/ja not_active Withdrawn
- 2002-10-30 DE DE60212696T patent/DE60212696T2/de not_active Expired - Fee Related
- 2002-10-30 AU AU2002348961A patent/AU2002348961A1/en not_active Abandoned
- 2002-10-30 CN CNB028232801A patent/CN1282156C/zh not_active Expired - Fee Related
- 2002-10-30 WO PCT/IB2002/004606 patent/WO2003044777A1/en active IP Right Grant
- 2002-10-30 US US10/495,953 patent/US20050004803A1/en not_active Abandoned
- 2002-10-30 EP EP02781472A patent/EP1451812B1/en not_active Expired - Lifetime
- 2002-10-30 KR KR10-2004-7007755A patent/KR20040066835A/ko not_active Application Discontinuation
- 2002-10-30 AT AT02781472T patent/ATE331280T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20040066835A (ko) | 2004-07-27 |
DE60212696T2 (de) | 2007-02-22 |
EP1451812B1 (en) | 2006-06-21 |
CN1589469A (zh) | 2005-03-02 |
AU2002348961A1 (en) | 2003-06-10 |
JP2005509928A (ja) | 2005-04-14 |
US20050004803A1 (en) | 2005-01-06 |
DE60212696D1 (de) | 2006-08-03 |
EP1451812A1 (en) | 2004-09-01 |
ATE331280T1 (de) | 2006-07-15 |
WO2003044777A1 (en) | 2003-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1282156C (zh) | 音频信号带宽扩展 | |
CN1181467C (zh) | 利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和*** | |
EP1433359B1 (en) | Dynamic range compression using digital frequency warping | |
US7574313B2 (en) | Information signal processing by modification in the spectral/modulation spectral range representation | |
JP3992619B2 (ja) | 適応転置による情報源符号化システムの増強方法 | |
CN103871418B (zh) | 一种扩声***啸叫频点的检测方法及装置 | |
US9210506B1 (en) | FFT bin based signal limiting | |
CN102652336B (zh) | 声音信号复原装置以及声音信号复原方法 | |
CN1416564A (zh) | 减噪仪器及方法 | |
CN1893412A (zh) | 谐波信号的频率扩展 | |
CN1737906A (zh) | 利用中枢网络分离语音信号 | |
JP4660578B2 (ja) | 信号補正装置 | |
JP2008537174A (ja) | 音声の品質および了解度を改善するためのシステム | |
CN1264533A (zh) | 多声道低比特率编码解码方法和设备 | |
US6507820B1 (en) | Speech band sampling rate expansion | |
CN104981870B (zh) | 声音增强装置 | |
US8223979B2 (en) | Enhancement of speech intelligibility in a mobile communication device by controlling operation of a vibrator based on the background noise | |
CN103945291A (zh) | 一种应用双麦克风定向传声的方法及装置 | |
CN1369173A (zh) | 基于对称性的子带回声抵消 | |
CN1146861C (zh) | 语音处理装置中的音调提取方法 | |
CN112331225B (zh) | 一种高噪声环境下辅助听力的方法及装置 | |
EP0746115A3 (en) | Audio signal processing circuit for subband coding | |
US10825443B2 (en) | Method and system for implementing a modal processor | |
CN1123865C (zh) | 小波音频编码信号处理中块效应消除方法 | |
JP3185363B2 (ja) | 補聴器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |