CN102089806B - 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 - Google Patents
噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 Download PDFInfo
- Publication number
- CN102089806B CN102089806B CN2009801270908A CN200980127090A CN102089806B CN 102089806 B CN102089806 B CN 102089806B CN 2009801270908 A CN2009801270908 A CN 2009801270908A CN 200980127090 A CN200980127090 A CN 200980127090A CN 102089806 B CN102089806 B CN 102089806B
- Authority
- CN
- China
- Prior art keywords
- spectrum
- noise
- region
- frequency
- zero
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims description 44
- 230000003595 spectral effect Effects 0.000 title abstract description 32
- 239000000945 filler Substances 0.000 title abstract 2
- 238000013139 quantization Methods 0.000 claims abstract description 49
- 238000001228 spectrum Methods 0.000 claims description 465
- 238000011002 quantification Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 7
- 230000002146 bilateral effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 19
- 238000013461 design Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 8
- 239000000203 mixture Substances 0.000 description 5
- 230000008447 perception Effects 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000003340 mental effect Effects 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- VYMDGNCVAMGZFE-UHFFFAOYSA-N phenylbutazonum Chemical compound O=C1C(CCCC)C(=O)N(C=2C=CC=CC=2)N1C1=CC=CC=C1 VYMDGNCVAMGZFE-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
一种用于基于音频信号的输入频谱表示提供该音频信号的填充了噪声的频谱表示的噪声填充器,包括:频谱区识别器,被配置为识别与该输入频谱表示的非零频谱区间隔至少一个中间频谱区的输入频谱表示的频谱区而获得已识别的频谱区;以及噪声***器,被配置为将噪声选择性地引入该已识别的频谱区而获得该音频信号的填充了噪声的频谱表示。一种用于基于音频信号的已量化频谱表示提供噪声填充参数的噪声填充参数计算器,包括:如上所述的频谱区识别器;以及噪声值计算器,被配置为选择性地考虑该已识别的频谱区的量化误差用于该噪声填充参数的计算。相应地,可获得表示该音频信号的已编码音频信号表示。
Description
技术领域
根据本发明的实施例涉及一种用于基于音频信号的输入频谱表示提供该音频信号的填充了噪声的频谱表示的噪声填充器;一种用于基于音频信号的已量化频谱表示提供噪声填充参数的噪声填充参数计算器;一种表示音频信号的编码音频信号表示;一种用于提供音频信号的填充了噪声的频谱表示的方法;一种用于基于音频信号的已量化频谱表示提供噪声填充参数的方法;及用于实施所述方法的计算机程序。
背景技术
后文将说明若干情形,其中可有优势地应用根据本发明的实施例。许多频域音频信号编码器是基于下述构想:某些频率区或频谱区(例如由时域至频域变换所提供的频率线或频谱线)比其它频谱区更重要。相应地,典型地,与较低频谱声学相关的频谱区相比,以更高的精度对高心理声学相关的频谱区进行编码。不同频谱区的心理声学关可例如使用心理声学模型来计算,该模型考虑由相邻强频谱峰遮蔽较弱的频谱区。
若期望将已编码音频信号的比特率降低至低水平,以极低精度(例如只有一位精度或二位精度)量化某些频谱区。相应地,以低精度量化的多个频谱区被量化至零。如此,在低比特率下,基于变换的音频编码器容易出现不同的伪信号,特别是源自于零量化的频率线的伪信号。确实,在低比特率音频编码中对频谱值的粗糙量化可能导致在逆量化后极为稀疏的频谱,其原因在于许多频谱线可能被量化为零。这些重构信号中的频谱孔洞产生非期望的声音伪信号。当频谱中的频 谱孔洞在帧间移动时,可能造成重现的声音极为尖锐或不稳定(唧啾声)。
噪声填充是通过在解码器侧用随机噪声填充零量化系数或频带来遮蔽这些伪信号的手段。所***的噪声能量是由编码器计算及发送的参数。
已知不同的噪声填充构思。例如,如参考文献[1]中描述的,所谓的AMR-WB+组合了噪声填充及离散傅立叶变换(DFT)。此外,国际标准ITU-T G.729.1定义了组合噪声填充及修改型离散余弦变换(MDCT)的构思。具体细节说明于参考文献[2]。
有关噪声填充的额外方面说明于Koninklijke的国际专利申请PCT/IB2002/001388(飞利浦电子公司(Philips Electronics N.V.))(参考参考文献[3])。
虽然如此,传统的噪声填充构思导致听觉失真。
鉴于此讨论,期望创造一种可提供改良型听觉印象的噪声填充构思。
发明内容
根据本发明的实施例创造了一种用于基于音频信号的输入频谱表示提供该音频信号的填充了噪声的频谱表示的噪声填充器。该噪声填充器包含频谱区识别器,被配置为识别与输入频谱表示的非零频谱区(例如频谱线或频谱仓(spectral bins))间隔至少一个中间频谱区的该输入频谱表示的频谱区(例如频谱线或频谱仓)而获得已识别的频谱区。噪声填充器还包含噪声***器,被配置为选择性地将噪声引入已识别的频谱区(例如频谱线或频谱仓)而获得该音频信号的填充了噪声的频谱表示。
本发明的实施例基于以下发现:若噪声填充应用于音频信号的频谱表示的音调组分的紧邻,则就听觉印象而言,该音调组分典型地将会降级。相应地,发现若噪声填充只应用于与此种音调非零频谱区间隔开的频谱区,则可获得填充了噪声的音频信号的改良型听觉印象。相应地,音频信号频谱的音调组分(在输入该噪声填充器的已量化频谱 表示中非量化至零的组分)维持可听闻(亦即不会被紧邻的噪声所污染),而仍可有效避免大的频谱孔洞的存在。
在优选实施例中,频谱区识别器被配置为识别输入频谱表示的频谱线,所述频谱线被量化为零并且包含至少第一预定数目的量化为零的较低频邻近频谱线及至少第二预定数目的量化为零的较高频邻近频谱线作为已识别的频谱区,其中该第一预定数目大于或等于1,并且该第二预定数目大于或等于1。在本实施例中,噪声***器被配置为将噪声选择性地引入已识别的频谱线,同时使量化至非零值的频谱线及量化为零的频谱线(但不包含第一预定数目的量化为零的较低频邻近频谱线或第二预定数目的量化为零的较高频邻近频谱线)未受噪声填充影响。如此,噪声填充为选择性的,使得噪声只引入于被量化为零的频谱线,且沿向上的频谱方向及向下的频谱方向,与量化为非零值的频谱线例如间隔第一预定数目的量化为零的较低频邻近频谱线及第二预定数目的量化为零的较高频邻近频谱线。
在优选实施例中,第一预定数目等于第二预定数目,使得沿由量化为非零值的线向上的频率方向的最小间隔等于沿由量化为非零值的线向下的频率方向的最小间隔。
在优选实施例中,噪声填充器被配置为将噪声只引入音频信号的频谱表示的上部的频谱区,而使音频信号的频谱表示的下部不受噪声填充影响。此种构思是有用的,其原因在于通常较高频于感知重要性上次于低频。此外,零量化值大部分出现于频谱的第二半(亦即高频)。同时添加高频噪声较不易获得最终杂音回复。
在优选实施例中,频谱区识别器被配置为对给定频谱区的预定双边频谱邻近(亦即延展至较低频及较高频的频谱邻近)的频谱区的量化强度值(例如能量值或振幅值)求和来获得和值;以及评估该和值来判定该给定频谱区是否为已识别的频谱区。已发现,给定频谱区的双边频谱邻近上的已量化频谱的能量的和值为判定噪声填充是否应应用至该给定频谱区的有意义的量。
在另一个实施例中,该频谱区识别器被配置为扫描输入频谱表示的频谱区范围以检测量化为零的频谱区的连续序列,且辨识此种所检 测的连续序列的一个或多个中心频谱区(亦即非边界频谱区),作为已识别的频谱区。
已发现,对被量化为零的频谱区的特定“游程长度”的检测为可以特低运算复杂度实施的任务。为了识别此种频谱区的连续序列,可判定在此频谱区序列中的全部频谱区是否皆量化为零,这可使用相对简单的算法或电路来实施。若发现此种频谱区的连续序列被量化为零,则序列的内部频谱区中的一个或多个(距本频谱区序列外侧频谱区的间隔够远)被当作已识别的频谱区。如此,通过扫描频谱区范围(例如通过随后选择不同移位的频谱区序列),可以对频谱表示进行高效分析,来识别被量化为零且与量化为非零值的频谱区间隔预定最小距离的频谱区。
根据本发明的另一实施例创造了用于基于音频信号的已量化频谱表示,提供噪声填充参数的噪声填充参数计算器。该噪声填充参数计算器包含频谱区识别器,被配置为识别与该已量化频谱表示的非零频谱区间隔至少一个中间频谱区的该已量化频谱表示的频谱区,以获得已识别的频谱区。该噪声填充参数计算器还包含噪声值计算器,被配置为针对噪声填充参数的计算,选择性地考虑已识别的频谱区的量化误差。噪声填充参数计算器基于下述关键构思:期望将解码器侧的噪声填充限于与音调频谱区(量化至非零值)隔开的频谱区;以及结果,考虑此种构思,须在编码器侧计算噪声参数。相应地,获得特别适合前述解码器构思的噪声填充参数。还发现:被量化为零但极为接近量化为非零值的频谱区的频谱区通常并未反映真正类似噪声的音频内容,反而与相邻的音调(量化至非零值)频谱区强相关。相应地,已发现:对于噪声填充参数的计算,一般不期望考虑临近量化为非零值的频谱区的频谱区的量化误差,其原因在于如此典型地导致噪声的强烈超估,因而导致过多噪声的重构的频谱表示。
如此,此处所述的噪声填充参数计算构思可与前述噪声填充构思结合使用,甚至与传统噪声填充构思结合使用。
在优选实施例中,已经就噪声填充器讨论的频谱区识别构思还能够与噪声填充参数计算器结合应用。
在又一优选实施例中,噪声值计算器被配置为考虑已识别的频谱区的量化误差的实际能量,用于噪声填充参数的计算。已发现:考虑实际量化误差(而非考虑估计的量化误差或平均量化误差)典型地获得改良的结果,其原因在于实际量化误差典型地偏离统计上的期望量化误差。
在又一优选实施例中,噪声值计算器被配置为关于集中于单个频谱区的音调量化误差能量,强调分布在多个已识别频谱区上的非音调量化误差能量。此种构思基于以下发现:其平均能量低于量化阈值因而被量化为零的非音调宽带噪声与其强度低于量化阈值的单个音调音频组分相比,对于该噪声填充器在感知上远为相关得多,即使量化为零的非音调宽带噪声及量化为零的音调组分二者皆被量化为零亦如此。原因在于,通过在解码器处产生随机噪声的噪声填充器可以对遗漏该已量化频谱表示中的非音调宽带噪声但不遗漏音调组分进行建模。如此,相对于量化为零的音调组分,强调量化为零的非音调噪声组分获得更理想的声音重构。这还由于以下事实:与因不存在量化为零的小频谱尖峰,人类听觉印象因频谱孔洞的存在(例如,具有不存在量化为零的宽带噪声的形式)而造成的降级远远大得多。音调组分可集中于单个频谱线,或可扩展在数条连续的线(例如i-1、i、i+1)上。频谱区例如可以包含一条或多条频谱线。
在优选实施例中,噪声值计算器被配置为计算该已识别的频谱区的对数量化误差能量的和而获得噪声填充参数。通过计算该已识别的频谱区的对数量化误差能量的和,可以高效地方式获得如前文说明的相对于量化为零的音调区,相对强调量化为零的非音调频谱区。
根据本发明的另一实施例创造了用于表示音频信号的已编码音频信号表示。已编码音频信号表示包含该音频信号的已编码已量化的频谱域表示及已编码的噪声填充参数。该噪声填充参数表示量化为零且与量化至非零值的该频谱域表示的频谱区间隔至少预定数目的中间频谱区的该频谱域表示的频谱区的量化误差。前述已编码音频信号表示可由前文讨论的噪声填充器使用,并且可使用如前文讨论的噪声填充参数计算器获得。已编码音频信号表示允许以特佳音频质量重构该 音频信号,其原因在于该噪声填充参数选择性地反映出其中存在有意义的噪声信息的此种频谱区的已量化频谱域表示的量化误差,且该量化误差对于解码器侧的噪声填充也须选择性地加以考虑。
根据本发明的另一个实施例创造了一种用于提供音频信号的填充了噪声的表示的方法。
根据本发明的又一个实施例创造了一种基于音频信号的已量化频谱表示提供噪声填充参数的方法。
根据本发明的又一个实施例创造了用于实施前述方法的计算机程序。
附图说明
随后将参考附图说明根据本发明的实施例,附图中:
图1示出了根据本发明的实施例的噪声填充器的示意框图;
图2示出了包含根据本发明的噪声填充器的音频信号解码器的示意框图;
图3示出了用于实施图1的噪声填充器的功能的伪程序代码;
图4示出了可在根据图1的噪声填充器进行的频谱区识别的图形表示;
图5示出了根据本发明的实施例的噪声填充参数计算器的示意框图;
图6示出了用于实施根据图5的噪声填充参数计算器的功能的伪程序代码;
图7示出了用于基于音频信号的输入频谱表示,提供音频信号的填充了噪声的频谱表示的方法的流程图;
图8示出了用于基于音频信号的量化频谱表示提供噪声化填充参数的流程图;及
图9示出了根据本发明的实施例的音频信号表示的图形表示。
具体实施方式
根据图1-4的噪声填充器
图1示出了根据本发明的实施例的噪声填充器100的示意框图。噪声填充器100被配置为接收音频信号的输入频谱表示110,该表示例如具有已解码频谱系数(例如可以进行了量化或逆量化)的形式。噪声填充器100还被配置为基于输入频谱表示110提供该音频信号的填充了噪声的频谱表示112。
噪声填充器100包含频谱区识别器120,其被配置为识别与输入频谱表示110的非零频谱区间隔至少一个中间频谱区的该输入频谱表示110的频谱区,而获得指示该已识别的频谱区的信息122。噪声填充器100还包含噪声***器130,其被配置为将噪声选择性地引入已识别的频谱区(以信息122描述),而获得该音频信号的填充了噪声的频谱表示112。
有关噪声填充器100的功能,通常可以说噪声填充器100以噪声选择性地填充输入频谱表示110的频谱区(例如频谱线或频谱仓),例如通过描述噪声的置换频谱值来替换被量化为零的频谱线的频谱值。藉此方式,可填充输入频谱表示110内的频谱孔洞或频谱间隙,该孔洞或间隙可能是由输入频谱表示110的粗糙量化引起的。但噪声填充器100并未将噪声引入量化为零的全部频谱线(即,其频谱值被量化为零的频谱线)。相反,噪声填充器100只将噪声引入包含距量化为非零值的任何频谱线有足够距离的此种量化为零的频谱线。藉此方式,噪声填充并未完全填充频谱孔洞或频谱间隙,反而在其中引入噪声的那些频谱线与量化为非零值的频谱线间维持至少一个频谱区的频谱距离(或至少任何其他预定数目的频谱区的频谱距离)。如此,维持引入频谱表示的填充噪声与量化至非零值的频谱线间的频谱距离,使得(由于预定数目的一个或多个频谱区的频谱距离)可清晰区分心理声学相关频谱线(在音频信号的输入频谱表示中未量化为零)与由噪声填充器引入频谱的填充噪声。相应地,可清晰感知心理声学上最相关的音频内容(在输入频谱表示110中以非零频谱线值表示),同时避免大的频谱孔洞。其原因在于,在被量化为非零值的输入频谱表示的频谱线附近选择性地省去噪声填充,而在频谱孔洞或频谱间隙的中央区执行噪声填充。
后文将参考图2说明噪声填充器100的应用环境。图2示出了根据 本发明的实施例的音频信号解码器200的示意框图。音频信号解码器200包含噪声填充器100作为关键组件。音频信号解码器200还包含频谱系数解码器210,其被配置为接收已编码音频信号表示212及提供该已编码音频信号的频谱系数的已解码(选择性地经逆量化)的表示214。频谱系数解码器210例如可包含熵解码器(例如算术解码器或游程长度解码器)及选择性地包含逆量化器来由该已编码的音频信号表示212导出频谱系数的已解码表示214(例如具有逆量化系数的形式)。噪声填充器100被配置为接收频谱系数的已解码表示214(选择性地可经逆量化),作为该音频信号的输入频谱表示110。
音频信号解码器200还包含噪声因子提取器220,其被配置为由该已编码的音频信号表示212提取噪声因子信息222,且将该已提取的噪声因子信息222提供给噪声填充器100。音频信号解码器200还包含频谱整形器230,其被配置为从噪声填充器100接收已重构的频谱表示232。已重构的频谱表示232例如可以是等于由噪声填充器所提供的填充了噪声的频谱表示112。频谱整形器230可视为可选的,被配置为基于已重构的频谱表示232而提供频谱信息234。音频信号解码器200进一步包含频谱域至时域变换器240,其接收由频谱整形器230所提供的频谱表示234,或在不存在频谱整形器230的情况下,接收已重构的频谱表示232;以及基于此提供时域音频信号表示242。频谱域至时域变换器240例如可被配置为执行逆修改型离散余弦变换(IMDCT)。
在优选实施例中,解码器侧的噪声填充包括下列步骤(或遵循其次步骤):
1.解码本底噪声(noise floor);
2.解码频率线的已量化值;
3.在频谱的选定部分中检测频谱区,其中,零的游程长度高于最小游程长度大小;及
4.对于选定区内部的各条线,将随机产生的符号应用于已解码的本底噪声。
本底噪声解码如下:
nf_decoded=0.0625*(8-index)
所检测的频谱区例如是以与在编码器侧相同的方式选择的(容后详述)。
在MDCT域中的无记忆高斯噪声是由对全部线皆有相同振幅但具有随机符号的频谱产生的。如此,对选定区内部的各线,解码器产生随机符号(-1或+1)且将其应用至已解码的本底噪声。但其它提供噪声贡献的方法也适用。
后文中将参考第1、2、3及图4说明若干细节,其中图3示出了可由噪声填充器100执行的用于在解码器侧噪声填充的算法的伪程序代码,及其中图4示出了噪声填充的图形表示。
首先,由噪声因子提取器220执行本底噪声的解码,噪声因子提取器220例如接收噪声因子索引(也简写为(“索引”),基于此提供已解码噪声因子值222(也标示为“nf_decoded”)。噪声因子索引例如可使用三位或四位编码,例如可为0至7的范围的整数值或0至15的范围的整数值。
频率线(也称作为“频谱线”或“频谱仓”)的量化值可由频谱系数解码器210提供。相应地,获得已量化的(或选择性地,已逆量化的)频谱线值(也称作为“频谱系数”),标示为“已量化(x(i))”。此处i表示频谱线值的频率索引。
随后,由噪声填充器100检测在频谱的选定部分(例如始于预定频谱线频率索引i的频谱上部)中的频谱区,此处零的游程长度(亦即量化为零的已量化频谱线值)高于最小游程长度大小。此种频谱区的检测是由图3的算法300的第一部分310执行的。如由算法300的第一部分310可见,所检测的区域的集合R于算法起点被初始化空集(R={};)。
在图3的算法示例中,最小游程长度被设定为8的固定值,当然也可选用任何其它数值。
随后,对所考虑的多个频谱线(标示为游程变量“线索引”),确定所考虑的各条频谱线是否包含量化至零的频谱线的双边环境(及所考虑的频谱线是否本身量化为零)。举例而言,在频谱的第二半部分中的全部频谱线随后皆被看作所考虑的频谱线,其中目前正在考虑的线标示为频率索引“线索引”。对标示为“线索引”的所考虑的线,运算 由“线索引-(最小游程长度)/2”的频谱线频率索引至“线索引+最小游程长度)/2”的频谱线频率索引的范围环境中的已量化的频谱系数“量化(x(i))”的和。若发现在目前正在考虑的频谱线(具有频谱线频率索引“线索引”)的所述环境中的频谱线值的和为零,则目前正在考虑的频谱线(或更精确而言,其频谱线频率索引“线索引”)加至所检测的区域的集合R(或所检测的频谱线)。结果,若频谱线的频谱线频率索引加至集合R,表示具有“线索引-(最小游程长度)/2”至“线索引+(最小游程长度)/2”间的线索引的频谱线全部皆包含量化为零的频谱线值。
相应地,在伪程序代码310的第一部分310中,获得频谱线频率索引“线索引”的集合R,集合R枚举了所考虑的频谱部分的那些(且只有那些)与量化至非零值的任何频谱线“充分”隔开(亦即间隔至少最小游程长度/2条线)的频谱线。
此区的检测示意于于图4,图4示出了频谱的图形表示400。横坐标410以频谱线频率索引“线索引”描述频谱线的频率。纵坐标412描述频谱线的强度(亦即振幅或能量)。如此可见,图形表示400中示意的频谱的部分包含量化至非零值的四条频谱线420a、420b、420c、及420d。此外,频谱线420c与420d间有11条量化为零的频谱线422a-422k。进一步,假设:如果目前正在考虑的频谱线与量化至非零值的任何其它频谱线间有至少四条量化为零的频谱线(及当然,若目前正在考虑的频谱线本身被量化为零),该频谱线才被认为与量化为非零值的频谱线充分间隔。但当考虑频谱线422a时,将发现频谱线422a紧邻于未量化为零的频谱线422c,故频谱线422a的频谱线频率索引根据算法300的第一部分310将不会构成所运算的集合R的一部分。同理,将发现频谱线422b、422c及422d与量化至非零值的任何频谱线并未间隔得足够远,使得频谱线422b至422d的频谱线频率索引也非为集合R的一部分。相反地,将认识到频谱线422e与任何量化为非零值的频谱线间隔得足够远,这是由于频谱线422e为9条全部量化为零的连续频谱线的序列的中心线(或更通常为中线)。相应地,频谱线422e的频谱线频率索引将为在算法300的第一部分310中运算的集合R的一部分。频谱线422f及422g亦如此, 使得频谱线422f及422g的频谱线频率索引将成为在算法300的第一部分310中确定的集合R的一部分,这是由于频谱线422f、422g与量化为非零值的较低频频谱线420a、420b、及420c间隔得足够远,且与量化为非零值的任何较高频频谱线间隔得足够远。另一方面,频谱线422h、422i、422j、及422k将不属于集合R的一部分,这是由于就频率而言所述频谱线太过接近量化为非零值的频谱线420d。
相应地,集合R将不包含频谱线420a、420b、420c、420d的频谱线频率索引,这是由于所述频谱线被量化为非零值。此外,频谱线422a、422b、422c、422d、422h、422i、422j、及422k的频谱线频率索引将不构成集合R的一部分,这是由于所述频谱线太过接近频谱线420a、420b、420c、及420d。相反地,频谱线422e、422f、422g的频谱线频率索引将包括于集合R,这是由于所述频谱线本身被量化为零,且与任何相邻的非零频谱线间隔得足够远。
算法300还包含解码本底噪声的第二部分320,其中噪声值索引(程序代码部分320中的“索引”)被变换成已解码的噪声因数值(程序代码300中的“nf_decoded”)。
程序代码300还包含用噪声填充已识别的频谱线(亦即其频谱线频率索引i在集合R中的频谱线)的第三部分330。用于此项目的,已识别的频谱线的频谱值(例如以x(i)标示,其中游程变量i随后取集合R所包括的全部频谱线频率索引)被设定为噪声填充值。噪声填充值例如是通过将已解码的噪声填充值(nf_decoded)乘以随机数或伪随机数(标示为“random(-1,+1)”)获得的,其中随机数或伪随机数例如可随机或伪随机地取数-1及+1。但当然随机噪声或伪随机噪声不同供应也是可以的。
噪声填充也示意于图4。如图4可见,以噪声填充值替换(图4中以虚线表示)频谱线422e、422f、及422g的零频谱值。
根据图5及图6的噪声填充参数计算器
图5示出了噪声填充参数计算器500的示意框图。噪声填充参数计算器500被配置为获得音频信号的已量化频谱表示510,以及基于该表 示而提供噪声填充参数512。噪声填充参数计算器500包含频谱区识别器520,其被配置为接收音频信号的已量化频谱表示510,且识别与已量化频谱表示510的非零频谱区间隔至少一个中间频谱区(例如频谱线)的已量化频谱表示510的频谱区(例如频谱线),来获得描述已识别的频谱区(例如已识别的频谱线)的信息522。噪声填充参数计算器500进一步包含噪声值计算器530,被配置为接收量化误差信息532及提供噪声填充参数512。用于此项目的,噪声值计算器被配置为选择性地考虑由信息522描述的用于计算噪声填充参数512的已识别的频谱区的量化误差。
量化误差信息532例如可与描述已量化频谱表示510中被量化为零的那些频谱线的能量(或强度)的能量信息(或强度信息)相同。
噪声填充参数计算器500可以选择性地包含量化器540,被配置为接收音频信号的未经量化的频谱表示542,和提供音频信号的已量化频谱表示510。量化器540可具有可调整的量化分辨率,例如可以是每条频谱线个别调整或每个频带个别调整(例如取决于使用心理声学模型获得的频谱线或频谱带的心理声学相关)。可变分辨率量化器的功能可等于国际标准ISO/IEC 13818-7及ISO/IEC 14496-3中说明的功能。特定而言,量化器540可被调整为:音频信号的量化频谱表示510中有频谱间隙或频谱孔洞,亦即被量化为零的相邻频谱线的连续区。
此外,未经量化的频谱表示542可用作量化误差信息532,或量化误差信息532可由未经量化的频谱表示542导出。
后文将详细说明可由噪声填充参数计算器500执行的噪声填充参数运算功能。在编码器侧的噪声填充参数运算中,噪声填充优选地应用于量化域。藉此方式,随后由心理声学相关的逆滤波器成形所引入的噪声。于编码器侧,遵照下列步骤计算和编码由解码器所引入的噪声能量:
1.获得频率线的已量化值;
2.只选择部分频谱;
3.在频谱的选定部分中检测频谱区,其中,零的游程长度高于最小游程长度大小;
4.对先前检测的频谱区计算量化误差的几何平均;及
5.以3位均匀量化该几何平均。
有关第一步骤,频谱线的已量化值可使用量化器540来获得。因此,频谱线的已量化值是由已量化频谱表示510表示的。
有关第二步骤,第二步骤被视为可选的,须注意噪声填充的运算优选地是基于频谱的高频部分执行的。在优选实施例中,只对频谱的第二半部分亦即对高频(而非对低频)计算噪声能量(称作为本底噪声)。确实,通常高频(频谱上部)于感知重要性上次于低频,零量化值大部分出现于频谱的第二半部分。此外,添加高频噪声较不容易获得最终杂音回复。
有关第三步骤,通过限制在出现零量化值游程长度的频谱区上的噪声填充,避免噪声填充过度影响非零值。藉此方式,噪声填充并未应用于非零值邻近,这些线的原始音调得到更好地保留。在优选实施例中,最小游程长度大小固定为8。表示一个非零值附近的8条线不受噪声填充影响(因此,不考虑用于噪声值的计算)。
有关第四步骤,在已量化域中的量化误差位于[-0.5;0.5]的范围内,且假设为均匀分布。所检测的区域的量化误差能量为对数域中的平均值(亦即几何平均)。然后,本底噪声nf计算如下:
nf=power(10,sum(log10(E(x(i))))/(2*n))
上式中,sum()为所检测的区域内部个别线x(i)的对数能量log10(E())的和,n为这些区内的线数目。本底噪声nf为0至0.5。此种计算允许将零化值的原始频谱平坦度列入考虑,然后获得有关其音调/噪声特性的信息。
若零化值极为有调性,则本底噪声(于装置500运算)将朝向零而去,在解码器(例如于前述解码器100、200)处将加上低本底噪声。若零化值实际上有噪声,则本底噪声将高,噪声填充可视为零化频谱线的高度参数编码,类似PNS(感知噪声取代)(也参见参考文献[4])。
有关第五步骤,本底噪声的量化索引(“索引”)计算如下:
index=max(0,min(7,int(8-16*nf)))。
索引例如以3位传送。
后文中将参考第6图说明运算噪声填充参数的算法,图6示出了根据本发明的实施例,用于获得噪声填充参数的此种算法的伪程序代码600。算法600包含检测运算噪声填充参数须考虑的区的第一部分610。已识别区(例如频谱线)以集合R描述,例如可包含已识别频谱线的频谱线频率索引(“线索引”)。可识别本身被量化为零且与被量化为非零值的任何其它频谱线间隔得充分远的频谱线。
程序600的第一部分610可以与程序300的第一部分310相同。相应地,用于算法600的已量化频谱表示(“已量化(x(i))”)可与解码器侧用于算法300的已量化频谱表示(“已量化(x(i))”)相同。换言之,用于编码器侧的已量化频谱表示可以编码形式传送至包含编码器及解码器的传送***中的解码器。
算法600包含运算本底噪声的第二部分620。于本底噪声的运算中,只考虑由算法600的第一部分610中运算的集合R描述的那些频谱区(或频谱线)。可见,噪声填充值nf首先被初始化为零。所考虑的频谱线数目(n)也被初始化为零。随后,对线索引包括于集合R的全部频谱线的能量进行求和,其中在对频谱线的能量进行求和前进行对数化。例如可对频谱线能量(E(x(i)))的以10为底的对数(log10)进行求和。须注意,量化前频谱线的实际能量(以“E或能量(x(i))”表示)是以对数化形式求和的。还计算所考虑的频谱线的数目。如此,在执行算法600的第二部分620后,变量nf指示量化前已识别的频谱线的能量的对数和,变量n描述已识别的频谱线的数目。
算法600还包含量化值nf(亦即已识别的频谱线的对数和)的第三部分630。可使用如前文说明或如第6图所示的映射方程。
根据第7图的方法
图7示出了用于基于音频信号的输入频谱表示,提供音频信号的填充了噪声的频谱表示的方法的流程图。图7的方法700包含步骤710,识别与音频信号的输入频谱表示间隔至少一个中间频谱区的该输入频谱表示的频谱区,来获得已识别的频谱区。方法700还包含步骤720,将噪声选择性地引入已识别的频谱区,来获得音频信号的填充了噪声 的频谱表示。
方法700可由此处参考本发明的噪声填充器的任何特征及功能补充。
根据图8的方法
图8示出了用于基于音频信号的已量化频谱表示提供噪声填充参数的方法的流程图。方法800包含步骤810,识别与音频信号的量化频谱表示间隔至少一个中间频谱区的该量化频谱表示的频谱区,来获得已识别的频谱区。方法800还包含步骤820,选择性地考虑已识别的频谱区的量化误差用于填充参数的计算。
方法800可由此处关于噪声填充参数计算器的任何特征及功能补充。
根据图9的音频信号表示
图9示出了根据本发明的实施例的音频信号表示的图形表示。音频信号表示900例如可形成输入频谱表示110的基础。音频信号表示900也可以接管已编码音频信号表示212的功能。音频信号表示900可使用噪声填充参数计算器500来获得,其中音频信号表示900可以例如包含音频信号的已量化频谱表示510及噪声填充参数512,例如二者皆呈编码形式。
换言之,已编码的音频信号表示900可表示音频信号。已编码的音频信号表示900包含音频信号的已编码已量化的频谱域表示,也包含已编码的噪声填充参数。该噪声填充参数表示频谱域表示的量化为零的且与量化为非零的频谱域表示的频谱区间隔至少一个中间频谱区的频谱区的量化误差。
当然音频信号表示900可由前述任何信息补充。
可替换实施
依据某些实施要求,本发明的实施例可用硬件或软件实施。该实施可使用数字储存媒体来实现,例如软盘、DVD、CD、ROM、PROM、EPROM、 EEPROM或FLASH内存,其上存储有可电子式读取的控制信号,且与可编程计算机***协作(或能够与可编程计算机***协作)从而执行相应方法。
根据本发明的若干实施例包含具有可电子式读取的控制信号的数据载体,所述信号可与可编程计算机***协作,从而执行此处所述的方法之一。
通常,本发明的实施例可以被实施为具有程序代码的计算机程序产品,该程序代码可操作用于当该计算机程序产品运行于计算机上时执行所述方法之一。
该程序代码例如可储存于机器可读载体上。
其它实施例包含储存于机器可读载体上的用于执行此处所述方法之一的计算机程序。
换言之,因此,本发明方法的一实施例为计算机程序,其具有程序代码,当该计算机程序运行于计算机上时该程序代码用于执行此处所述的方法之一。
因此,本发明方法的又一实施例为数据载体(或数字储存介质)包含可用于执行此处所述方法之一的计算机程序。
因此,本发明方法的又一实施例为数据流或信号序列,表示用于执行此处所述方法之一的计算机程序。数据流或信号序列例如可配置为经由数据通信连接(例如因特网)传输。
又一实施例包含被配置为或适于执行此处所述方法之一的一种处理装置,例如计算机或可编程逻辑装置。
又一实施例包含计算机,其上安装有用于执行此处所述方法之一的计算机程序。
在若干实施例中,可编程逻辑装置(例如现场可编程门阵列)可用来执行此处所述方法的部分或全部功能。在若干实施例中,现场可编程门阵列可与微处理器协作来执行此处所述方法之一。
结论
综上所述,当在编码器侧运算噪声填充参数,及在解码器侧施加 噪声时,通过考虑输入信号特性及已解码信号特性,本发明强化了音频编码工具“噪声填充”。在本发明的实施例中,估计零量化频谱线的调性/噪声度,并将其用于估计本底噪声。然后,将此本底噪声传送至解码器,解码器将该噪声填充应用至出现于频谱的特定区的零量化值。这些区域是基于已解码频谱的特性选定的。
有关本发明的上下文,注意本发明应用于在MDCT上使用标量量化的基于转换的编码。MDCT系数先前是通过基于感知线索计算的曲线规格化的。通过如同于AMR-WB+的TCX模式(参考参考文献[1])下进行的对LPC系数进行加权,由先前的LPC(线性预测编码)分析阶段推断该曲线。由已加权系数,设计感知加权滤波器并于MDCT前应用该感知加权滤波器。还在逆MDCT后,在解码器侧应用逆滤波器。该逆感知加权滤波器对量化噪声进行成型,使得其最小化或遮蔽所感知的噪声。
在根据本发明的实施例中,克服了现有技术的缺陷。传统上,只考虑基于频谱包络的阈值、遮蔽阈值、或能量阈值,以***化性方式对零量化值应用噪声填充。现有技术既未考虑输入信号特性,也未考虑已解码信号特性。如此,传统装置可引入非期望的额外伪信号(特别地,噪声伪信号)而抵消此种工具的优点。
相反地,根据本发明的实施例允许如前文讨论的具有减少的伪信号的改良式噪声填充。
参考文献:
[1]“Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec”,3GPP TS 26.290 V6.3.0,2005-06,Technical Specification
[2]Ragot et al,“ITU-T G.729.1:AN 8-32Kbit/S Scalable Coder Interoperable with G.729 for Wideband Telephony and Voice Over IP”,Vol.4,ICASSP 07,15-20 April 2007
[3]“AUDIO CODING”,International Application No.:PCT/IB2002/001388,Applicant:KONINKLIJKE PHILIPS ELECTRONICS N.V.[NL/NL];Groenewoudseweg 1 NL-5621 BA Eindhoven(NL).Inventors:TAORI,Rakesh;Prof Holstlaan 6 NL-5656 AA Eindhoven(NL)and VAN DE PAR,Steven,L.,J.,D.,E.;Prof.Holstlaan 6 NL-5656 AA Eindhoven(NL).
[4]Generic Coding of Moving Pictures and Associated Audio:Advanced Audio Coding.International Standard 13818-7,ISO/IECJTC1/SC29/WG11 Moving Pictures Expert Group,1997.
Claims (13)
1.一种用于基于音频信号的输入频谱表示(110)提供该音频信号的填充了噪声的频谱表示(112)的噪声填充器(100),该噪声填充器包括:
频谱区识别器(120),被配置为识别量化为零并且与输入频谱表示(110)的非零频谱区(420a、420b、420c、420d)间隔至少一个中间频谱区(422a、422b、422c、422d、422h、422i、422j、422k)的输入频谱表示(110)的频谱区(422e、422f、422g),而获得已识别的频谱区(422e、422f、422g);以及
噪声***器(130),被配置为将噪声选择性地引入已识别的频谱区(422e、422f、422g),而获得音频信号的填充了噪声的频谱表示(112)。
2.根据权利要求1所述的噪声填充器(100),其中频谱区识别器(120)被配置为识别输入频谱表示(110)的频谱线(422e、422f、422g)作为已识别的频谱区,所述频谱线被量化为零,并且包含至少第一预定数目的量化为零的较低频邻近频谱线及至少第二预定数目的量化为零的较高频邻近频谱线作为已识别的频谱区;
其中第一预定数目大于或等于1,并且第二预定数目大于或等于1;以及
其中噪声***器(130)被配置为将噪声选择性地引入已识别的频谱线(422e、422f、422g),同时使量化为非零值的频谱线(420a、420b、420c、420d)及量化为零的但不包含第一预定数目的量化为零的较低频邻近频谱线或第二预定数目的量化为零的较高频邻近频谱线的频谱线,不受噪声填充影响。
3.根据权利要求2所述的噪声填充器(100),其中第一预定数目等于第二预定数目。
4.根据权利要求1所述的噪声填充器(100),其中该噪声填充器被配置为:将噪声只引入音频信号的输入频谱表示(110)高频部分中的频谱区,而使该音频信号的输入频谱表示(110)的低频部分不受噪声填充影响。
5.根据权利要求1所述的噪声填充器(100),其中频谱区识别器(120)被配置为:对给定频谱区(i)的预定双边频谱邻近中的频谱区的已量化强度值求和,以获得和值(E);以及评估该和值(E)以判定该给定频谱区(i)是否为已识别的频谱区。
6.根据权利要求1所述的噪声填充器(100),其中频谱区识别器(120)被配置为:扫描输入频谱表示(110)的频谱区范围,以检测量化为零的频谱区的连续序列;以及辨识所检测的连续序列的一个或多个中央频谱区(422e、422f、422g),作为已识别的频谱区。
7.一种用于基于音频信号的已量化频谱表示(510)提供噪声填充参数(512)的噪声填充参数计算器(500),该噪声填充参数计算器包括:
频谱区识别器(520),被配置为识别与已量化频谱表示(510)的非零频谱区(420a、420b、420c、420d)间隔至少一个中间频谱区(422a、422b、422c、422d、422h、422i、422j、422k)的已量化频谱表示(110)的频谱区(422e、422f、422g),而获得已识别的频谱区(422e、422f、422g);以及
噪声值计算器(530),被配置为选择性地考虑已识别的频谱区(i)的量化误差,用于噪声填充参数(512、nf)的计算。
8.根据权利要求7所述的噪声填充参数计算器(500),
其中频谱区识别器(520)被配置为识别输入频谱表示(510)的频谱线(422e、422f、422g),所述频谱线被量化为零,并且包含至少第一预定数目的量化为零的较低频邻近频谱线及至少第二预定数目的量化为零的较高频邻近频谱线作为已识别的频谱区;
其中第一预定数目大于或等于1,并且第二预定数目大于或等于1;以及
其中噪声值计算器(520)被配置为选择性地考虑已识别的频谱区的量化误差,用于噪声填充参数的计算,同时不考虑将量化为非零值的频谱线(420a、420b、420c、420d)及量化为零的但不包含第一预定数目的量化为零的较低频邻近频谱线或第二预定数目的量化为零的较高频邻近频谱线的频谱线用于噪声填充参数的计算。
9.根据权利要求7所述的噪声填充参数计算器(500),其中噪声值计算器(530)被配置为:考虑已识别的频谱区的量化误差的实际能量,用于噪声填充参数(512、nf、nf_index)的计算。
10.根据权利要求7所述的噪声填充参数计算器(500),其中噪声值计算器(530)被配置为:相对于集中于单个频谱区或集中于多个连续频谱线的音调量化误差能量,强调分布于多个已识别的频谱区的非音调量化误差能量。
11.根据权利要求7所述的噪声填充参数计算器(500),其中噪声值计算器(530)被配置为:计算已识别的频谱区(i)的对数量化误差能量的和,以获得噪声填充参数(512、nf、nf_index)。
12.一种用于基于音频信号的输入频谱表示提供音频信号的填充了噪声的频谱表示的方法(700),该方法包括:
识别(710)与输入频谱表示的非零频谱区间隔至少一个中间频谱区的输入频谱表示的频谱区,而获得已识别的频谱区;以及
将噪声选择性地引入(720)已识别的频谱区,而获得音频信号的填充了噪声的频谱表示。
13.一种用于基于音频信号的已量化频谱表示提供噪声填充参数的方法(800),该方法包括:
识别(810)与已量化频谱表示的非零频谱区间隔至少一个中间频谱区的已量化频谱表示的频谱区,而获得已识别的频谱区;以及
选择性地考虑(820)已识别的频谱区的量化误差,用于噪声填充参数的计算。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7987208P | 2008-07-11 | 2008-07-11 | |
US61/079,872 | 2008-07-11 | ||
US10382008P | 2008-10-08 | 2008-10-08 | |
US61/103,820 | 2008-10-08 | ||
PCT/EP2009/004653 WO2010003565A1 (en) | 2008-07-11 | 2009-06-26 | Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102089806A CN102089806A (zh) | 2011-06-08 |
CN102089806B true CN102089806B (zh) | 2012-12-05 |
Family
ID=40941986
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980127118.8A Active CN102089808B (zh) | 2008-07-11 | 2009-06-25 | 音频编码器、音频解码器、用于编码及解码音频信号的方法 |
CN2009801270908A Active CN102089806B (zh) | 2008-07-11 | 2009-06-26 | 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980127118.8A Active CN102089808B (zh) | 2008-07-11 | 2009-06-25 | 音频编码器、音频解码器、用于编码及解码音频信号的方法 |
Country Status (22)
Country | Link |
---|---|
US (9) | US8983851B2 (zh) |
EP (12) | EP4407614A1 (zh) |
JP (2) | JP5622726B2 (zh) |
KR (4) | KR101518532B1 (zh) |
CN (2) | CN102089808B (zh) |
AR (2) | AR072482A1 (zh) |
AT (1) | ATE535903T1 (zh) |
AU (2) | AU2009267459B2 (zh) |
BR (6) | BRPI0910811B1 (zh) |
CA (2) | CA2730361C (zh) |
CO (2) | CO6341671A2 (zh) |
EG (1) | EG26480A (zh) |
ES (5) | ES2642906T3 (zh) |
HK (2) | HK1157045A1 (zh) |
MX (2) | MX2011000382A (zh) |
MY (2) | MY178597A (zh) |
PL (3) | PL3246918T3 (zh) |
PT (1) | PT2304719T (zh) |
RU (2) | RU2519069C2 (zh) |
TW (2) | TWI417871B (zh) |
WO (2) | WO2010003556A1 (zh) |
ZA (2) | ZA201100091B (zh) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2642906T3 (es) | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
WO2010053287A2 (en) * | 2008-11-04 | 2010-05-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8553897B2 (en) | 2009-06-09 | 2013-10-08 | Dean Robert Gary Anderson | Method and apparatus for directional acoustic fitting of hearing aids |
US9101299B2 (en) * | 2009-07-23 | 2015-08-11 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Hearing aids configured for directional acoustic fitting |
US8879745B2 (en) * | 2009-07-23 | 2014-11-04 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Method of deriving individualized gain compensation curves for hearing aid fitting |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US9008811B2 (en) | 2010-09-17 | 2015-04-14 | Xiph.org Foundation | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5695074B2 (ja) * | 2010-10-18 | 2015-04-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声復号化装置 |
WO2012122303A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US9015042B2 (en) * | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
KR101767175B1 (ko) | 2011-03-18 | 2017-08-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩에서의 프레임 요소 길이 전송 |
US9530419B2 (en) * | 2011-05-04 | 2016-12-27 | Nokia Technologies Oy | Encoding of stereophonic signals |
BR112013033900B1 (pt) * | 2011-06-30 | 2022-03-15 | Samsung Electronics Co., Ltd | Método para gerar um sinal estendido de largura de banda para decodificação de áudio |
BR112014009647B1 (pt) * | 2011-10-24 | 2021-11-03 | Koninklijke Philips N.V. | Aparelho de atenuação do ruído e método de atenuação do ruído |
US8942397B2 (en) * | 2011-11-16 | 2015-01-27 | Dean Robert Gary Anderson | Method and apparatus for adding audible noise with time varying volume to audio devices |
JP5942463B2 (ja) * | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN103854653B (zh) | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
JP6148811B2 (ja) * | 2013-01-29 | 2017-06-14 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 周波数領域におけるlpc系符号化のための低周波数エンファシス |
KR101757341B1 (ko) * | 2013-01-29 | 2017-07-14 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 저-복잡도 음조-적응 오디오 신호 양자화 |
RU2660605C2 (ru) * | 2013-01-29 | 2018-07-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Концепция заполнения шумом |
CN114566183A (zh) * | 2013-04-05 | 2022-05-31 | 杜比实验室特许公司 | 使用高级频谱延拓降低量化噪声的压扩装置和方法 |
KR102072365B1 (ko) | 2013-04-05 | 2020-02-03 | 돌비 인터네셔널 에이비 | 고급 양자화기 |
CN108365827B (zh) * | 2013-04-29 | 2021-10-26 | 杜比实验室特许公司 | 具有动态阈值的频带压缩 |
EP3961622B1 (en) | 2013-05-24 | 2023-11-01 | Dolby International AB | Audio encoder |
CN105408956B (zh) | 2013-06-21 | 2020-03-27 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
EP3014609B1 (en) * | 2013-06-27 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
EP2830060A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
EP3053359B1 (en) | 2013-10-03 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Adaptive diffuse signal generation in an upmixer |
SG11201603116XA (en) * | 2013-10-22 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
ES2755166T3 (es) | 2013-10-31 | 2020-04-21 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo |
CA2984562C (en) | 2013-10-31 | 2020-01-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
JP6319753B2 (ja) | 2013-12-02 | 2018-05-09 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 符号化方法および装置 |
KR20230042410A (ko) | 2013-12-27 | 2023-03-28 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
EP3117432B1 (en) * | 2014-03-14 | 2019-05-08 | Telefonaktiebolaget LM Ericsson (publ) | Audio coding method and apparatus |
BR112016019838B1 (pt) * | 2014-03-31 | 2023-02-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
JPWO2016052191A1 (ja) * | 2014-09-30 | 2017-07-20 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US20160173808A1 (en) | 2014-12-16 | 2016-06-16 | Psyx Research, Inc. | System and method for level control at a receiver |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI771266B (zh) * | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
US9454343B1 (en) | 2015-07-20 | 2016-09-27 | Tls Corp. | Creating spectral wells for inserting watermarks in audio signals |
US9311924B1 (en) | 2015-07-20 | 2016-04-12 | Tls Corp. | Spectral wells for inserting watermarks in audio signals |
US9626977B2 (en) | 2015-07-24 | 2017-04-18 | Tls Corp. | Inserting watermarks into audio signals that have speech-like properties |
US10115404B2 (en) | 2015-07-24 | 2018-10-30 | Tls Corp. | Redundancy in watermarking audio signals that have speech-like properties |
CN116913291A (zh) | 2015-10-08 | 2023-10-20 | 杜比国际公司 | 声音或声场的压缩hoa表示的解码方法和装置 |
JP6797197B2 (ja) | 2015-10-08 | 2020-12-09 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
US10142743B2 (en) | 2016-01-01 | 2018-11-27 | Dean Robert Gary Anderson | Parametrically formulated noise and audio systems, devices, and methods thereof |
MY191093A (en) * | 2016-02-17 | 2022-05-30 | Fraunhofer Ges Forschung | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
EP3382702A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
CN111386568B (zh) * | 2017-10-27 | 2023-10-13 | 弗劳恩霍夫应用研究促进协会 | 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质 |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US11264014B1 (en) * | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
WO2020073148A1 (en) * | 2018-10-08 | 2020-04-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Transmission power determination for an antenna array |
EP4213147A1 (en) * | 2018-10-26 | 2023-07-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
WO2020164752A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
EP3939035A4 (en) * | 2019-03-10 | 2022-11-02 | Kardome Technology Ltd. | LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
US20200402522A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
US11361776B2 (en) | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
CN112037802B (zh) * | 2020-05-08 | 2022-04-01 | 珠海市杰理科技股份有限公司 | 基于语音端点检测的音频编码方法及装置、设备、介质 |
US11545172B1 (en) * | 2021-03-09 | 2023-01-03 | Amazon Technologies, Inc. | Sound source localization using reflection classification |
CN114900246B (zh) * | 2022-05-25 | 2023-06-13 | 中国电子科技集团公司第十研究所 | 噪声基底估计方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
CN1195932A (zh) * | 1997-04-02 | 1998-10-14 | 美国电报电话公司 | 通信***中的实时回声检测、跟踪、对消以及噪声填充 |
CN1662958A (zh) * | 2002-06-17 | 2005-08-31 | 杜比实验室特许公司 | 使用频谱孔填充的音频编码*** |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
JPH0934493A (ja) | 1995-07-20 | 1997-02-07 | Graphics Commun Lab:Kk | 音響信号符号化装置、音響信号復号装置および音響信号処理装置 |
US6092041A (en) | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
US5797120A (en) * | 1996-09-04 | 1998-08-18 | Advanced Micro Devices, Inc. | System and method for generating re-configurable band limited noise using modulation |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
JP3804902B2 (ja) | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
FI116643B (fi) | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
DE60233032D1 (de) * | 2001-03-02 | 2009-09-03 | Panasonic Corp | Audio-kodierer und audio-dekodierer |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
JP2004522198A (ja) * | 2001-05-08 | 2004-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化方法 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
JP4218271B2 (ja) * | 2002-07-19 | 2009-02-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
ES2305852T3 (es) * | 2003-10-10 | 2008-11-01 | Agency For Science, Technology And Research | Procedimiento de codificacion de una señal digital en un flujo binario escalable, procedimiento para la descodificacion de un flujo binario escalable. |
US7723474B2 (en) | 2003-10-21 | 2010-05-25 | The Regents Of The University Of California | Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies |
US7436786B2 (en) | 2003-12-09 | 2008-10-14 | International Business Machines Corporation | Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization |
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
WO2005081229A1 (ja) | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
WO2005112004A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding models |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7873515B2 (en) * | 2004-11-23 | 2011-01-18 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for error reconstruction of streaming audio information |
KR100707173B1 (ko) | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
DE602006018618D1 (de) * | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
JP4627737B2 (ja) * | 2006-03-08 | 2011-02-09 | シャープ株式会社 | デジタルデータ復号化装置 |
US7564418B2 (en) | 2006-04-21 | 2009-07-21 | Galtronics Ltd. | Twin ground antenna |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
US7275936B1 (en) * | 2006-09-22 | 2007-10-02 | Lotes Co., Ltd. | Electrical connector |
US8275611B2 (en) | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
EP2116997A4 (en) * | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO DECODING DEVICE AND AUDIO DECODING METHOD |
BRPI0815972B1 (pt) * | 2007-08-27 | 2020-02-04 | Ericsson Telefon Ab L M | método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador |
DK2186089T3 (en) * | 2007-08-27 | 2019-01-07 | Ericsson Telefon Ab L M | Method and apparatus for perceptual spectral decoding of an audio signal including filling in spectral holes |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
ES2642906T3 (es) * | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP5695074B2 (ja) | 2010-10-18 | 2015-04-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声復号化装置 |
-
2009
- 2009-06-25 ES ES09776839.4T patent/ES2642906T3/es active Active
- 2009-06-25 KR KR1020117000768A patent/KR101518532B1/ko active IP Right Grant
- 2009-06-25 KR KR1020147004791A patent/KR101582057B1/ko active IP Right Grant
- 2009-06-25 EP EP24167804.4A patent/EP4407614A1/en active Pending
- 2009-06-25 PT PT97768394T patent/PT2304719T/pt unknown
- 2009-06-25 BR BRPI0910811-4A patent/BRPI0910811B1/pt active IP Right Grant
- 2009-06-25 EP EP24167802.8A patent/EP4407613A1/en active Pending
- 2009-06-25 EP EP24167799.6A patent/EP4375998A1/en active Pending
- 2009-06-25 CN CN200980127118.8A patent/CN102089808B/zh active Active
- 2009-06-25 EP EP24167725.1A patent/EP4407610A1/en active Pending
- 2009-06-25 EP EP23178772.2A patent/EP4235660B1/en active Active
- 2009-06-25 EP EP24167801.0A patent/EP4407612A1/en active Pending
- 2009-06-25 KR KR1020157036527A patent/KR101706009B1/ko active IP Right Grant
- 2009-06-25 AU AU2009267459A patent/AU2009267459B2/en active Active
- 2009-06-25 RU RU2011104006/08A patent/RU2519069C2/ru active
- 2009-06-25 ES ES11157188T patent/ES2422412T3/es active Active
- 2009-06-25 BR BR122021003097-9A patent/BR122021003097B1/pt active IP Right Grant
- 2009-06-25 EP EP17175883.2A patent/EP3246918B1/en active Active
- 2009-06-25 PL PL17175883.2T patent/PL3246918T3/pl unknown
- 2009-06-25 EP EP09776839.4A patent/EP2304719B1/en active Active
- 2009-06-25 EP EP24167780.6A patent/EP4372745A1/en active Pending
- 2009-06-25 WO PCT/EP2009/004602 patent/WO2010003556A1/en active Application Filing
- 2009-06-25 BR BR122021003752-3A patent/BR122021003752B1/pt active IP Right Grant
- 2009-06-25 PL PL09776839T patent/PL2304719T3/pl unknown
- 2009-06-25 JP JP2011516991A patent/JP5622726B2/ja active Active
- 2009-06-25 MX MX2011000382A patent/MX2011000382A/es active IP Right Grant
- 2009-06-25 EP EP24167794.7A patent/EP4407611A1/en active Pending
- 2009-06-25 ES ES17175883T patent/ES2955669T3/es active Active
- 2009-06-25 EP EP24167758.2A patent/EP4372744A1/en active Pending
- 2009-06-25 BR BR122021003726-4A patent/BR122021003726B1/pt active IP Right Grant
- 2009-06-25 BR BR122021003142-8A patent/BR122021003142B1/pt active IP Right Grant
- 2009-06-25 ES ES11157204.6T patent/ES2526767T3/es active Active
- 2009-06-25 CA CA2730361A patent/CA2730361C/en active Active
- 2009-06-25 MY MYPI2011000098A patent/MY178597A/en unknown
- 2009-06-26 PL PL09776859T patent/PL2304720T3/pl unknown
- 2009-06-26 EP EP09776859A patent/EP2304720B1/en active Active
- 2009-06-26 MX MX2011000359A patent/MX2011000359A/es active IP Right Grant
- 2009-06-26 ES ES09776859T patent/ES2374640T3/es active Active
- 2009-06-26 MY MYPI2011000076A patent/MY155785A/en unknown
- 2009-06-26 KR KR1020117000435A patent/KR101251790B1/ko active IP Right Grant
- 2009-06-26 CA CA2730536A patent/CA2730536C/en active Active
- 2009-06-26 WO PCT/EP2009/004653 patent/WO2010003565A1/en active Application Filing
- 2009-06-26 BR BRPI0910522-0A patent/BRPI0910522A2/pt not_active Application Discontinuation
- 2009-06-26 AT AT09776859T patent/ATE535903T1/de active
- 2009-06-26 JP JP2011516997A patent/JP5307889B2/ja active Active
- 2009-06-26 CN CN2009801270908A patent/CN102089806B/zh active Active
- 2009-06-26 RU RU2011102410/08A patent/RU2512103C2/ru active
- 2009-06-26 AU AU2009267468A patent/AU2009267468B2/en active Active
- 2009-06-30 TW TW098122013A patent/TWI417871B/zh active
- 2009-07-02 TW TW098122400A patent/TWI492223B/zh active
- 2009-07-07 AR ARP090102551 patent/AR072482A1/es active IP Right Grant
- 2009-07-13 AR ARP090102626A patent/AR072497A1/es active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00091A patent/ZA201100091B/en unknown
- 2011-01-04 ZA ZA2011/00085A patent/ZA201100085B/en unknown
- 2011-01-07 CO CO11001536A patent/CO6341671A2/es active IP Right Grant
- 2011-01-10 EG EG2011010058A patent/EG26480A/en active
- 2011-01-11 US US13/004,493 patent/US8983851B2/en active Active
- 2011-01-11 US US13/004,508 patent/US9043203B2/en active Active
- 2011-01-13 CO CO11003109A patent/CO6280569A2/es active IP Right Grant
- 2011-10-03 HK HK11110436.8A patent/HK1157045A1/xx unknown
-
2012
- 2012-01-19 HK HK12100643.7A patent/HK1160285A1/zh unknown
-
2014
- 2014-01-16 US US14/157,185 patent/US9449606B2/en active Active
- 2014-12-24 US US14/582,828 patent/US9711157B2/en active Active
-
2016
- 2016-09-15 US US15/266,862 patent/US10629215B2/en active Active
-
2017
- 2017-07-07 US US15/643,908 patent/US11024323B2/en active Active
-
2021
- 2021-05-17 US US17/322,656 patent/US11869521B2/en active Active
-
2023
- 2023-11-29 US US18/522,732 patent/US20240096337A1/en active Pending
- 2023-11-29 US US18/522,762 patent/US20240096338A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
CN1195932A (zh) * | 1997-04-02 | 1998-10-14 | 美国电报电话公司 | 通信***中的实时回声检测、跟踪、对消以及噪声填充 |
CN1662958A (zh) * | 2002-06-17 | 2005-08-31 | 杜比实验室特许公司 | 使用频谱孔填充的音频编码*** |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102089806B (zh) | 噪声填充器、噪声填充参数计算器、用于提供噪声填充参数的方法/用于提供音频信号的填充了噪声的频谱表示的方法 | |
CN100587807C (zh) | 增强信源解码器的设备和增强信源解码方法的方法 | |
CN110197667B (zh) | 对音频信号的频谱执行噪声填充的装置 | |
US9546924B2 (en) | Transform audio codec and methods for encoding and decoding a time segment of an audio signal | |
JP7257975B2 (ja) | 密集性の過渡事象の検出及び符号化の複雑さの低減 | |
WO2019007969A1 (en) | DETECTION AND CODING OF LOW COMPLEXITY DENSED TRANSIENT EVENTS | |
Tavakoli et al. | A new method for using a psychoacoustic model with patchwork audio watermarking in dft domain | |
Boland et al. | A new hybrid LPC-DWT algorithm for high quality audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |