CN102947882A - 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法和计算机程序 - Google Patents
使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法和计算机程序 Download PDFInfo
- Publication number
- CN102947882A CN102947882A CN2011800299342A CN201180029934A CN102947882A CN 102947882 A CN102947882 A CN 102947882A CN 2011800299342 A CN2011800299342 A CN 2011800299342A CN 201180029934 A CN201180029934 A CN 201180029934A CN 102947882 A CN102947882 A CN 102947882A
- Authority
- CN
- China
- Prior art keywords
- parameter
- frequency
- group
- frequency component
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004590 computer program Methods 0.000 title claims abstract description 13
- 238000007493 shaping process Methods 0.000 claims description 32
- 230000008439 repair process Effects 0.000 claims description 29
- 238000001228 spectrum Methods 0.000 claims description 22
- 238000013213 extrapolation Methods 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 7
- 238000010008 shearing Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmitters (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Complex Calculations (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
使用窄带输入信号生成宽带信号的装置、方法和计算机程序,其包含使用传递参数执行制导带宽扩展操作和仅使用传递参数之外的导出参数执行盲带宽扩展操作的处理器(23)。为此,该处理器包含用于产生盲带宽扩展操作参数的参数发生器(24)。
Description
技术领域
本发明涉及音频处理,特别涉及针对组合的盲带宽和制导带宽扩展的装置、方法和计算机程序。
背景技术
音频信号的储存或传输往往受制于比特率的苛刻约束。过去,在只有极小比特率可用时,编码器被迫大大减小传输的音频带宽。如今,现代音频解码器可以使用带宽扩展(BWE)方法编码宽带信号。这些算法依赖于高频(HF)内容-的参数表示,高频内容是通过变换到HF频谱范围(“修补”)并应用一个参数驱动的后处理从解码信号的波形编码低频(LF)部分产生的。
后处理包括以原始信号能量分布为目标的能级调整(也称频谱整形),还包括借助波带选择性反向滤波(减小音调)的在HF带变换中的感知音调的调整、增加合成背景噪声(减小音调)或增加个别正弦曲线(增大音调)。
BWE利用LF与HF之间的关系,目的在于生成与原始HF内容尽可能相似的HF信息。这种BWE把该频率扩展到某最高频率Fmax。因此最高频率的确定取决于质量与比特率的折中。
美国专利号6,680,972B1披露了使用频段复制的信源编码增强方法。在编码器内或之前减小带宽,接着在解码器上完成频段复制。这是通过使用变换方法并结合频谱调整实现的。得到指定感知质量下的减小比特率,或指定比特率下提高的感知质量。
相关技术包含在MPEG-4标准(ISO/IEC14496-3:2005(E))中。特别是,该标准4.6.18小节包含频段复制(SBR)工具。此工具扩展带宽有限的解码音频信号的音频带宽。此过程以复制原先截短的谐波序列为基础,该原先截短是为了减少来自有效带宽有限信号的数据率并控制从编码器得到的数据。音色分量与类噪声分量之间的比率由自适应反向滤波以及增加噪声和正弦波维持。来自编码器的控制数据包含调节修补信号频谱的频谱调节数据,另外,设置音色分量与类噪声分量之间比率用的反向滤波数据要加到该修补信号上,有关遗漏谐波的信息要在生成宽带信号的SBR操作中加到该修补信号上。
这一标准化的程序仅执行制导带宽扩展,因为宽带信号要产生的最高频率也用属于低波段高分辨率信号的参数反映。这样,为了通过产生带宽更高的信号来提高音频信号的质量,还需要能额外增强传输数据的比特率的其他参数。另一方面,当出于传输信道容量的考虑而需要减小比特率时,可能会削减针对编码器上复制信号的最高或部分最高频段的参数。这会自动造成音频质量的下降,因为SBR解码器只能生成某频率(即某频段以下)以下的高频部分,该频段的参数包含在输入数据或位流中。因此,减小比特率将导致音频质量下降,换句话说,提高音频质量将导致比特率增大。
发明内容
本发明的宗旨是提出改进的、兼顾高品质和低比特率的带宽扩展概念。
这个目标是通过根据权利要求1的生成宽带信号的装置、根据权利要求14的生成宽带信号的方法或根据权利要求15的计算机程序实现的。
本发明的依据是,为了提高音频质量和/或减小比特率,将制导带宽扩展操作与盲导带宽扩展操作结合。盲带宽扩展操作是不传递其任何参数的带宽扩展操作。换句话说,盲带宽扩展操作将产生属于高于最大频率的信号频谱分量,其带宽扩展参数已经在位流中传递了。使用窄带输入信号和一组已经传递的参数生成扩展到第一频率以下的第一个频率分量以及执行制导带宽扩展操作的处理器也适合执行盲带宽扩展操作,这种操作使用低频带信号或第一个频率分量和第二组参数生成扩展到高于第一频率的第二频率以下的第二个频率分量。第二个参数不从带宽扩展解码器中传递,但由根据第一组参数生成第二组参数或仅根据带宽扩展解码器侧的第一个频率分量生成第二组参数的参数发生器产生。换句话说,盲带宽扩展操作的操作方式可能与制导带宽扩展操作的方式相似。但不同的是,带宽扩展操作使用的任何参数都是在解码器侧产生的并从编码器传递至解码器。而对于盲带宽扩展操作来说,任何参数都不在编码器侧产生,也不从编码器向解码器传递任何参数,但仅在解码器侧使用解码器上可以获得的信息产生,而不使用关于原始信号对应频率分量的任何信息。在解码器侧并非可以获得有关对应于盲带宽扩展操作生成的频率分量的原始音频信号的所有信息,因为针对第一个频率分量的窄带信号和已传递的参数都不包含有关第二个频率分量的任何信息。该信息仅在解码器侧上产生,未使用任何传递参数,也就是所谓的“盲”方式。
现有发明的一个优势是它通过制导带宽扩展(gBWE)与盲带宽扩展(bBWE)的结合进一步提高了带宽扩展信号的感知质量。现有发明依赖于利用高频分量与甚高频分量之间的关系,其中高频分量对应于上述现代带宽扩展方法中使用的传递参数所涵盖的频率带宽。
本发明的主题是通过组合制导BWE(gBWE)与盲BWE(bBWE)进一步提高BWE信号的感知质量。这是通过利用高频分量与甚高频分量的关系实现的。
现代带宽扩展方法,如频带复制(SBR)或谐波带宽扩展(HBE)首先要完成修补操作,以便生成HF分量。这种修补操作可以是任何类型的非线性处理,如剪切、取绝对值或相位声码器(phase vocoder);该操作还可以结合单边带调制,或插值。然后利用其他参数将生成的补丁改成原始HF分量。
除了gBWE之外,还有仅仅以扩展音频信号带宽为目标的bBWE方法。它可以通过***HF噪声、剪切等实现,但没有任何侧面信息。
运用现代BWE方法可产生频带有限的信号,没有充分利用信号HF分量中的冗余。因此,没有达到最大可能的带宽。硬低通滤波信号还可以理解成具有低通滤波器截止频率音高的音调,特别是,如果该信号类似噪声的话。此外,这种低通滤波器还会产生短暂失真。
本发明陈述了上述不足,其中盲带宽扩展操作应用在甚高频分量上,即扩展到高于第一频率的第二频率的第二频率分量。然而,为了保持传输速率较低,该第二频率分量的任何参数都没有从编码器传递至解码器,因此,该装置没有收到用于生成宽带信号的任何参数。
因此,提出的概念避免了与信号截止频率上滤波器坡度较陡有关的音调。此外,还减轻了与这些滤波器特性有关的短暂失真。此外,本发明还拓宽了信号的感知带宽而不需要或者只需要少量侧面信息。它可以作为任何底层带宽扩展方法之上的后处理器使用。
因此,这个独创概念适合使用参数驱动带宽扩展方法的所有音频应用,或也可用于通过解码器侧带宽扩展操作提高音频质量的任何音频或相位声码器。
附图说明
下面结合附带的图纸讨论本发明的优选实施例,其中:
图1a到1c表示制导和盲带宽扩展概念的不同应用;
图2a表示根据窄带信号生成的宽带信号的频率分量,其中使用制导带宽扩展生成第一频率分量,使用盲带宽扩展操作生成第二频率分量;
图2b表示宽带信号生成装置的一个优选实施例;
图3表示宽带信号生成装置或方法的另一个优选实施例;和
图4表示实现发明概念的一个优选实施例的流程图。
具体实施方式
图2b表示使用窄带输入信号20和第一组参数21生成宽带信号的装置。第一组参数描述了高于窄带输入信号最大频率而最高至第一频率的频率分量。描述第一频率以上频率分量的参数不包含在第一组参数21中。该数据输入到输入接口22中,它从参数21中分离出窄带信号20。该数据转发到处理器23,以便使用窄带输入信号20和第一组参数21执行制导带宽扩展操作(BWE),生成扩展到第一频率以下的第一频率分量。此外,处理器23配置成执行盲带宽扩展操作,从而使用窄带输入信号或第一频率分量和/或第二组参数生成扩展到第二频率(高于第一频率)以下的第二频率分量。为了生成第二组参数,该处理器包含用于根据第一组参数21或仅根据第一频率分量生成第二组参数的参数发生器24,当第二组参数仅根据第一频率分量生成时,第一组参数21不引入到该参数发生器。不过,当参数发生器24使用第一组参数21生成第二组参数时,情况如图2b所示,即输入接口22具有一个到参数发生器24的连接。
图2a表示频率图,以便说明频率情况。窄带输入信号只有窄带带宽25a。窄带带宽25a从最小频率(如20Hz左右)扩展,直到窄带最大频率25b,比如4kHz。传递参数涵盖的且由制导带宽扩展概念生成的第一频率分量25c扩展到第一频率25d。第一频率25d可以,比如是12kHz。第二频率分量25e扩展到第二频率25f,而对于在第一频率25d与第二频率25f之间扩展的第二频率分量25e,在编码器侧没有传递或生成任何参数。打个比方说,第二频率可以是16kHz。
如图2a所示,为生成第一频率分量而执行制导带宽扩展操作,为生成频率比第一频率分量更高的第二频率分量而执行盲带宽扩展操作。第一和第二频率分量可以不重叠。
第一频率分量25c与第二频率分量25d一起随窄带输入信号20传递给图2b中生成宽带信号的组合器26。根据具体应用,该组合器可以是综合滤波器组,也可以是时间域组合器。组合器26的具体实现与处理器23的实现有关,即窄带信号、第一频率分量和第二频率分量是否可作为具有对应频率分量的时间域信号使用,是否可作为子带信号或变换信号(即频率表示中可用的信号)使用。
图1a表示运用制导带宽扩展操作和盲带宽扩展操作实现处理器23的第一实现。窄带信号21输入修补器10,以便在修补器10的输出上产生修补信号。修补操作基本上使用低频部分并在较高频率的部分中产生一个信号。优选地修补操作包含,对于制导带宽扩展,把滤波器组信源波段中的相邻子带修补成该滤波器组目标波段中的相邻子带、以谐波(harmonically)修补信源波段中的子带到目标波段、剪切、取绝对值或使用相位声码器(phase vocoder)、单边带调制或插值。针对盲带宽扩展的修补操作包含在第二频率分量中***噪声或剪切包含第一频率分量或窄带的信号,从而生成更高的频谱分量。
修补信号输入整形器11,在整形器11的输出上得到整形的修补信号。然后,在组合器12中,窄带信号21和整形器11输出的整形修补信号组合在一起,在组合器的输出上得到宽带信号13。
图1b表示一个不同的实现,其中颠倒了修补器10和整形器11的顺序。整形器11为对窄带信号21整形而配置,使用第一组参数处理制导带宽扩展,使用第二组参数和/或有关第一频率分量的信息生成整形的窄带信号。整形器11的输出上的这个整形窄带信号具有与原始窄带信号相同的频率分量,但现在用修补器10修补成包含第一频率分量25a和第二频率分量25e的高频波段(如图2a所示)。接着,修补器的输出上的修补信号在组合器12中与窄带信号21结合,因为在修补前执行了整形操作,所述信号已经整形。
因此,图1b与图1a的差别在于整形器11和修补器10的顺序被颠倒了。
在另一个备选实现中,如图1a所示,修补器直接应用在窄带信号上。接着窄带信号21和已修补但尚未整形的信号结合,从而在功能块12的输出上得到一个组合信号。该组合信号具有图2a中的25a、25c、25e频率分量,但第一频率分量25c和第二频率分量25e尚未整形。然后通过连接在组合器12上的整形器11完成该组合信号高频分量的整形。
在图1a、图1b和图1c中的所有实现中,整形器使用第一组参数执行制导带宽扩展,使用第二组参数执行盲带宽扩展,其中第二组参数是通过参数发生器24,根据第一组参数和/或第一频率分量得出的,图2b中示出了该发生器,但图1a、图1b和图1c中没有表示。
图3表示本发明的另一个优选实施例。从编码器(图3中未表示)接收位流20。该位流被划分成图3中在“宽带侧信息”(sideinfo)上表示的低波段或低通(LP)输入信号20和第一组参数21。该低通输入信号20转发到带宽扩展I模块30,以便执行图1a、图1b或图1c中用修补器表示的修补。接着,由带宽扩展模块30产生的、用于实现制导带宽扩展操作的修补信号转发到频谱整形器11a,以便使用包含在该位流中的宽带侧信息21执行频谱整形。频谱整形模块11a的输出接着转发到音调校正模块21,从而得到制导带宽扩展的输出信号。包含第一频率分量25c的这个输出信号一方面转发到组合器12和盲带宽扩展II模块32。带宽扩展II模块32在该优选实施例中使用第一频率分量25c执行修补,尽管带宽扩展II模块32也可以使用窄带信号。然而,鉴于第一频率分量与第二频率分量之间的关系更理想,优选地在模块32中使用第一频率分量25c执行盲带宽扩展。然后,在模块11b中使用第二频率分量25e执行频谱整形,其中执行该频谱整形用的信息由参数发生器或sideinfo外推模块24转发,后者根据第一组参数计算第二组参数。然后,经频谱整形的第二频率分量25e与第一频率分量25c和组合器12中的窄带信号20结合,从而得到宽带信号13。
在本发明的优选实施例中,盲带宽扩展操作在制导带宽扩展操作的上方应用。在图3中,它使用模块11a和31中传递的第一组参数和没有通过模块库从编码器传递到解码器的第二组参数表示。制导带宽扩展操作的输出用于进一步扩展该信号的带宽,而不需要用转发第一频率分量25c到图3中模块32表示的任何附加侧面信息。由于音调和频谱形状已经针对该信号作了调整,且可以假设高频分量没有对甚高频而明显改变,在模块31上得到的经过处理的扩展信号被修补,以便进一步扩展它。优选为对盲带宽扩展部分使用上频率分量,即第一频率分量,但也可以使用该频谱的任意部分。
对于盲带宽扩展,正如参数发生器或sideinfo外推模块24所表示的那样,可以外推用于制导带宽扩展的侧面信息。盲带宽扩展部分的频谱整形,即按盲带宽扩展部分的频段的能量或功率参数的应用,对应于模块库中的频谱整形。为此,对于第二频率分量25e的频带,不得不计算能量参数,即成为衡量指标、与频带中能量有关的参数。这可以通过定义针对制导带宽扩展信号最高1-4kHz的能量对数的回归线来实现。该回归线在图2a中的29上给出。优选地该外推线的导数小于1。
另一种备选实现可以是测量图2a中在14上表示的第一频率分量最高频段的能量,然后第二频率分量25e的后续频段41、42、43和44的能量减小任意值,比如1.5或3dB。
于是,第二组参数至少包含针对第二频率分量41到44频段的能量值。这些能量值可以使用包含在第一组参数中的能量计算,但(如图2a所示)也可以不用第一组参数计算。因此,参数发生器24只能选择接收第一组参数并接收第一频率分量,从而确定回归线或确定第一频率分量最高频段40的能量。不过,当仅根据第一组参数计算频段41到44的能量值时,那么计算第二组参数时不需要第一频率分量。在其他实施例中,第二频率分量的能量值也可以使用第一频率分量和包含在第一组参数中的能量值组合计算。
对于盲带宽扩展,其他参数,如背景噪声和反向滤波,既可以外推,也可以忽略。如果在盲带宽扩展中没有考虑它们,用于制导带宽扩展的参数,即传递参数21,也可以用于控制由盲带宽扩展(BWEII)处理的频谱部分,如图3中的32所示。或者,可以省略不同于使用能量参数进行频谱整形的任何其他整形操作。
图4用流程图的形式表示该发明的概念的一个优选实现。在步骤50中,从传递信号(位流)中提取窄带信号和第一组参数,所述步骤50通过图2b中输入接口22实现。然后在步骤51中使用窄带信号20修补窄带信号,以便得到带宽扩展到第一频率以下的第一修补信号。然后,在步骤52中,使用第一组参数整形由步骤51产生的第一修补信号,以便得到第一整形信号,其对应于如图3中25c所示的由音调校正模块31输出的信号。步骤53表示使用第一组参数和/或第一整形信号计算第二组参数。步骤54表示修补第一整形信号,以便得到扩展到第二频率25f以下的第二修补信号,如图2a所示。如步骤55所示,然后对第二修补信号进行整形,从而得到第二整形信号,然后在步骤56中,窄带第一整形信号和第二整形信号结合,最终得到宽带信号13。
正如前面所讨论的那样,第二组参数可以用不同方式从第一组参数和/或第一频率分量中得到,其中对于有些实现来说,仅使用第一频率分量而不使用第一组参数,对于其他应用来说,仅使用第一组参数而不使用第一频率分量,而对再其他的实现来说,则使用第一组参数与第一频率分量的组合。此外,需要指出的是,对于除频谱(envelope)调整能量参数之外的参数,那些参数根本不能在盲带宽扩展操作中使用,或者可以根据第一组参数外推,其中一种非常直截了当的外推方法使用第二频率分量25e中由编码器为第一频率分量25c生成的相同参数。比如当考虑到第一频率分量由二十个频段组成时,且当第二频率分量由三十个频段组成时,那么针对第二频率分量前二十个频段的参数与第一频率分量的前二十个频段的参数相同,而针对第二频率分量最后十个频段剩下的十个参数将通过外推得出,或者根本不会在最后十个频段中应用音调校正。
虽然有些方面已经在一装置的上下文中描述过,显然这些方面也表示对应方法的描述,其中一个模块或设备相当于一方法步骤或方法步骤的一特征。类似地,方法步骤上下文中描述的方面也表示对应模块或对应装置的项或特征的描述。
本发明的传递信号可以保存在数字存储介质中,也可以在传输介质上传递,如无线传输介质或有线传输介质,比如互联网。
根据某些实现要求,本发明的实施例可以用软件或硬件实现。实现可以使用数字存储介质执行,如软盘、DVD、CD光盘、ROM、PROM、EPROM、EEPROM或闪存,这些介质上可存储电子可读控制信号,其配合(或能够配合)可编程计算机***执行相关方法。
部分符合本发明的实施例包含具有电子可读控制信号的非瞬时数据载体,能配合可编程计算机***执行本文所描述的方法之一。
一般来说,本发明的实施例可以用程序代码实现成计算机程序产品,当该计算机程序产品在计算机上运行时程序代码可执行所述方法之一。程序代码,例如,可以存储在机器可读的载体上。
其他实施例包含用于执行本文描述的方法之一、存储在机器可读载体上的计算机程序。
换句话说,因此,所述发明的方法的一个实施例是具有程序代码的计算机程序,当该计算机在计算机上运行时,程序代码可执行本文描述的方法之一。
因此,本发明的方法的另一个实施例是数据载体(或数字存储介质,或计算机可读介质),它包含其中记录的、用于执行本文描述的方法之一的计算机程序。
因此,本发明的方法的另一个实施例是代表计算机程序的数据流或信号序列,该程序用于执行本文描述的方法之一。数据流或信号序列,例如,可以配置成通过数据通讯连接传输,比如通过互联网。
另一个实施例包含处理装置,比如配置成或适合执行本文描述的方法之一的计算机或可编程逻辑设备。
另一个实施例包含处理安装了用于执行本文描述的方法之一的计算机程序的计算机。
有些实施例中,可使用可编程逻辑设备(如现场可编程门阵列)执行本文描述的方法的部分或全部功能。有些实施例中,现场可编程门阵列可配合微处理器执行本文描述的方法之一。一般来说,所述方法优选地由任何硬件装置执行。
以上描述的实施例仅仅是为了便于解释本发明的原理。可以理解的是,对于本领域技术人员来说,显然可以对本文所描述的机构和细节作出修改。因此,本文的意图仅仅在于限制待定专利的权利要求范围,而不是为了限制其中通过实施例的描述和解释方式所呈现的具体细节。
Claims (15)
1.一种使用窄带输入信号(20)和第一组参数(21)生成宽带信号(13)的装置,第一组参数(21)描述高于窄带输入信号(20)地最大频率(25b)而最高至第一频率(25d)的频率分量,其中描述高于第一频率(25d)的频率分量的参数不包括在第一组参数(21)中,所述装置包含:
处理器(23),其使用窄带输入信号和第一组参数执行制导带宽扩展操作,以生成扩展到最高至第一频率(25d)的第一频率分量(25c),同时使用窄带输入信号(20)或第一频率分量(25c)和第二组参数执行盲带宽扩展操作,以生成扩展到高于第一频率(25d)的最高至第二频率(25f)的第二频率分量(25e),
其中处理器(23)包含用于根据第一组参数(21)或根据第一频率分量(25c)生成第二组参数的参数发生器(24)。
2.根据权利要求1所述的装置,其中处理器(23)包含修补器(10),其生成修补信号,该修补信号具有扩展到最高至第一频率的第一频率分量和扩展到最高至第二频率的第二频率分量;
整形器(11),其在生成修补信号前使用整形操作对窄带输入信号进行整形、对修补信号进行整形或对组合信号进行整形;和
组合器(12),其在整形操作之前或之后组合窄带输入信号和修补信号,以得到组合信号,其中组合信号是宽带信号,或者宽带信号是通过整形操作从组合信号得到的,
其中整形器(11)配置成执行整形操作,从而使用第一组参数整形宽带信号的第一频率分量,且宽带信号的第二频率分量受第一频率分量或由参数发生器(23)从第一组参数得到的第二组参数影响。
3.根据权利要求1或2所述的装置,其中参数发生器(23)配置成通过从第一频率分量的成形频谱能量信息的低频外推到高频得到针对第二频率分量的第二组参数的频谱参数。
4.根据权利要求3所述的装置,其中参数发生器(24)配置成执行外推,方法是把相对于低频相邻频段中能量的第二频率分量一个频段的能量减小一个预定值,其中第一频率分量最高频段中的能量作为开始值使用。
5.根据权利要求3所述的装置,其中参数发生器(24)配置成执行外推,方法是使用第一频率分量的预定部分计算一回归线并将频率中的回归线外推到第二频率分量中,以得到针对第二频率分量中频段的能量值。
6.根据权利要求5所述的装置,其中参数发生器配置成执行外推,方法是计算一回归线,使回归线的导数小于1。
7.根据上述任一权利要求所述的装置,其中第一组参数包含一参数类型的一参数序列,该序列限定在第一频率分量中的一频率上,且
其中参数发生器(24)配置成把该序列外推到第二频率分量中,从而得到针对第二组参数的相同参数类型的一参数序列。
8.根据权利要求7所述的装置,其中第一组参数包含,作为参数类型,由频谱参数、噪声参数、音调参数或遗漏谐波参数组成的参数组的一个或几个成员。
9.根据上述任一权利要求所述的装置,其中处理器(23)配置成
从位流中提取(50)第一组参数(21)和窄带输入信号(20);
使用窄带输入信号的修补和第一组参数执行(51,52)制导带宽扩展,包括使用第一组参数进行整形,以得到第一整形信号,其中修补生成第一频率分量;和
使用第一整形信号的修补和第二组参数执行(54,55)盲带宽扩展,第二修补生成第二频率分量。
10.根据上述任一权利要求所述的装置,其中处理器(23)配置成使用第一组参数中的频谱参数、噪声参数和音调参数进行制导带宽扩展,且不在盲带宽扩展使用音调参数或噪声参数,其中盲带宽扩展基于制导带宽扩展的结果的修补。
11.根据上述任一权利要求所述的装置,其中窄带输入信号被编码,其中该装置还包含用于解码经过编码的窄带输入信号的解码器。
12.根据上述任一权利要求所述的装置,其中处理器(23)配置成使用,作为针对制导带宽扩展的修补方法,把滤波器组信源波段中的相邻子带修补成该滤波器组目标波段中的相邻子带、把信源波段中的子带以谐波修补到目标波段、剪切、取绝对值或使用相位声码器、单边带调制或插值。
13.根据权利要求1至11中任一项所述的装置,其中处理器(23)配置成使用,作为针对盲带宽扩展的修补方法,***HF噪声或剪切。
14.一种生成宽带信号(13)的方法,其使用窄带输入信号(20)和第一组参数(21),第一组参数(21)描述高于窄带输入信号(20)的最大频率(25b)并最高至第一频率(25d)的频率分量,其中描述高于第一频率(25d)的频率分量的参数不包括在第一组参数(21)中,所述方法包含:
使用窄带输入信号和第一组参数执行制导带宽扩展操作,以生成扩展到最高至第一频率(25d)的第一频率分量(25c);和
使用窄带输入信号(20)或第一频率分量(25c)和第二组参数执行盲带宽扩展操作,以生成扩展到高于第一频率(25d)的并最高至第二频率(25f)的第二频率分量(25e),
其中盲带宽扩展操作的执行包含根据第一组参数(21)或根据第一频率分量(25c)生成第二组参数。
15.一种计算机程序,其包含当在计算机上运行时执行如权利要求14描述的方法的程序代码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32496210P | 2010-04-16 | 2010-04-16 | |
US61/324,962 | 2010-04-16 | ||
PCT/EP2011/055889 WO2011128399A1 (en) | 2010-04-16 | 2011-04-14 | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102947882A true CN102947882A (zh) | 2013-02-27 |
CN102947882B CN102947882B (zh) | 2015-06-17 |
Family
ID=44146894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180029934.2A Active CN102947882B (zh) | 2010-04-16 | 2011-04-14 | 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US9805735B2 (zh) |
EP (1) | EP2559032B1 (zh) |
JP (1) | JP5554876B2 (zh) |
KR (1) | KR101430335B1 (zh) |
CN (1) | CN102947882B (zh) |
AU (1) | AU2011239995B2 (zh) |
BR (1) | BR112012026502B1 (zh) |
CA (1) | CA2800613C (zh) |
ES (1) | ES2719102T3 (zh) |
MX (1) | MX2012011828A (zh) |
RU (1) | RU2527735C2 (zh) |
TR (1) | TR201904117T4 (zh) |
WO (1) | WO2011128399A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
CN103413557B (zh) * | 2013-07-08 | 2017-03-15 | 深圳Tcl新技术有限公司 | 语音信号带宽扩展的方法和装置 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
RU2639952C2 (ru) * | 2013-08-28 | 2017-12-25 | Долби Лабораторис Лайсэнзин Корпорейшн | Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием |
US9293143B2 (en) * | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
RU2689181C2 (ru) * | 2014-03-31 | 2019-05-24 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер, декодер, способ кодирования, способ декодирования и программа |
KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
TWI771266B (zh) | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10129659B2 (en) | 2015-05-08 | 2018-11-13 | Doly International AB | Dialog enhancement complemented with frequency transposition |
US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101083076A (zh) * | 2006-06-03 | 2007-12-05 | 三星电子株式会社 | 使用带宽扩展技术对信号编码和解码的方法和设备 |
WO2010003557A1 (en) * | 2008-07-11 | 2010-01-14 | Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Apparatus and method for generating a bandwidth extended signal |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
DE10046774A1 (de) | 2000-09-21 | 2002-04-18 | Bayer Ag | Thermoplastische Formmassen mit speziellen Additivmischungen |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
AU2002352182A1 (en) * | 2001-11-29 | 2003-06-10 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
JP4966013B2 (ja) * | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US8484036B2 (en) * | 2005-04-01 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US20080004866A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Artificial Bandwidth Expansion Method For A Multichannel Signal |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090203395A1 (en) * | 2008-02-08 | 2009-08-13 | Sony Ericsson Mobile Communications Ab | Amplitude modulation radio transmission with extended bandwidth |
KR101345695B1 (ko) * | 2008-07-11 | 2013-12-30 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법 |
EP2365929A4 (en) * | 2008-09-17 | 2014-03-19 | Graphic Packaging Int Inc | DEVICE FOR GOLDING AND GIVE CROUSTILLANT TO FOOD IN MICROWAVE OVEN |
US8258849B2 (en) * | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
PL3291231T3 (pl) * | 2009-10-21 | 2020-09-21 | Dolby International Ab | Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji |
-
2011
- 2011-04-14 CN CN201180029934.2A patent/CN102947882B/zh active Active
- 2011-04-14 ES ES11714298T patent/ES2719102T3/es active Active
- 2011-04-14 JP JP2013504273A patent/JP5554876B2/ja active Active
- 2011-04-14 BR BR112012026502-4A patent/BR112012026502B1/pt active IP Right Grant
- 2011-04-14 AU AU2011239995A patent/AU2011239995B2/en active Active
- 2011-04-14 WO PCT/EP2011/055889 patent/WO2011128399A1/en active Application Filing
- 2011-04-14 KR KR1020127028959A patent/KR101430335B1/ko active IP Right Grant
- 2011-04-14 RU RU2012143970/08A patent/RU2527735C2/ru active
- 2011-04-14 TR TR2019/04117T patent/TR201904117T4/tr unknown
- 2011-04-14 CA CA2800613A patent/CA2800613C/en active Active
- 2011-04-14 MX MX2012011828A patent/MX2012011828A/es active IP Right Grant
- 2011-04-14 EP EP11714298.4A patent/EP2559032B1/en active Active
-
2012
- 2012-10-12 US US13/650,673 patent/US9805735B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101083076A (zh) * | 2006-06-03 | 2007-12-05 | 三星电子株式会社 | 使用带宽扩展技术对信号编码和解码的方法和设备 |
WO2010003557A1 (en) * | 2008-07-11 | 2010-01-14 | Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Apparatus and method for generating a bandwidth extended signal |
Non-Patent Citations (3)
Title |
---|
BERND GEISER ET AL: "Artificial bandwidth extension without side information for ITU-T G.729.1", 《INTERSPEECH 2007》, 31 August 2007 (2007-08-31) * |
BERND GEISER ET AL: "Beyond Wideband telephony-bandwidth extension for super-wideband speech", 《DAGA 2008》, 13 March 2008 (2008-03-13) * |
TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU: "《G.729-based embedded variable bit-rate coder:An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729》", 31 May 2006, article "G.729-based embedded variable bit-rate coder:An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729", pages: 5-85 * |
Also Published As
Publication number | Publication date |
---|---|
EP2559032B1 (en) | 2019-01-30 |
EP2559032A1 (en) | 2013-02-20 |
KR20130018847A (ko) | 2013-02-25 |
KR101430335B1 (ko) | 2014-08-13 |
CA2800613C (en) | 2016-05-03 |
BR112012026502B1 (pt) | 2022-10-18 |
BR112012026502A8 (pt) | 2018-07-03 |
US20130041673A1 (en) | 2013-02-14 |
CA2800613A1 (en) | 2011-10-20 |
AU2011239995B2 (en) | 2014-01-16 |
RU2012143970A (ru) | 2014-05-27 |
RU2527735C2 (ru) | 2014-09-10 |
ES2719102T3 (es) | 2019-07-08 |
MX2012011828A (es) | 2013-02-27 |
CN102947882B (zh) | 2015-06-17 |
BR112012026502A2 (pt) | 2017-12-12 |
JP2013525833A (ja) | 2013-06-20 |
JP5554876B2 (ja) | 2014-07-23 |
TR201904117T4 (tr) | 2019-05-21 |
WO2011128399A1 (en) | 2011-10-20 |
US9805735B2 (en) | 2017-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102947882B (zh) | 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法 | |
US10522168B2 (en) | Audio signal synthesizer and audio signal encoder | |
JP6076407B2 (ja) | オーディオエンコーダおよび帯域幅拡張デコーダ | |
CN102027537B (zh) | 利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法 | |
CN105706166B (zh) | 对比特流进行解码的音频解码器设备和方法 | |
CN104603872A (zh) | 用以再现音频信号的装置及方法、用以产生编码的音频信号的装置及方法、计算机程序及编码的音频信号 | |
AU2011239995A1 (en) | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension | |
TWI702594B (zh) | 用於音訊信號之高頻重建技術之回溯相容整合 | |
TWI697894B (zh) | 用以解碼經編碼多聲道信號之裝置、方法及電腦程式(二) | |
CN103377655A (zh) | 提高音质的设备和方法 | |
AU2014211527A1 (en) | Apparatus and method for generating a frequency enhanced signal using shaping of the enhancement signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |