ES2396686T3 - Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio - Google Patents

Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio Download PDF

Info

Publication number
ES2396686T3
ES2396686T3 ES10712944T ES10712944T ES2396686T3 ES 2396686 T3 ES2396686 T3 ES 2396686T3 ES 10712944 T ES10712944 T ES 10712944T ES 10712944 T ES10712944 T ES 10712944T ES 2396686 T3 ES2396686 T3 ES 2396686T3
Authority
ES
Spain
Prior art keywords
spectral
patch
frequency band
audio signal
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10712944T
Other languages
English (en)
Inventor
Frederik Nagel
Markus Multrus
Jérémie Lecomte
Stefan Bayer
Guillaume Fuchs
Johannes Hilpert
Julien Robilliard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2396686T3 publication Critical patent/ES2396686T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Complex Calculations (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Stored Programmes (AREA)

Abstract

Un aparato (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches ("patching") (119; 1155), donde el aparato (100; 200; 700; 800; 1100) comprende: un primer convertidor (110; 1130) para convertir una porción de tiempo (107-1; 107-2; 1125) de una señal de audio (105; 1101) en una representación espectral (115: 1135-1); un generador de parches en el dominio espectral (120; 1141) para ejecutar una pluralidad (117-1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parches genera una representación espectral modificada (125; 1149) que comprende componentes espectrales en una banda de frecuencia superior (220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101), y donde el generador de parches en el dominio espectral (120; 1141) está configurado para seleccionar un primer algoritmo de parches en el dominio espectral (117-2) de la pluralidad (117-1) de algoritmos de parches para una primera porción de tiempo (107-1) y un segundo algoritmo de parches en el dominio espectral (117-3) de la pluralidad (117-1) de algoritmos de parches para una segunda porción de tiempo diferente (119; 1155) para obtener la representación espectral modificada (125; 1149); un manipulador de reconstrucción de alta frecuencia (130) para manipular la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y un combinador (140) para combinar la señal de audio (105; 1101) que tiene componentes espectrales en la banda de frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145).

Description

Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una señal de audio
[0001] La presente invención se relaciona con el procesamiento de señales de audio y, en particular, con un aparato y un procedimiento para generar una señal de audio de síntesis, un aparato y un procedimiento para codificar una señal de audio y una señal de audio codificada.
[0002] El almacenamiento o transmisión de señales de audio con frecuencia es objeto de rigurosas restricciones de velocidad de transmisión de bits. Estas restricciones con frecuencia se superan mediante la codificación intermedia de la señal. En el pasado, se forzaba a los codificadores a reducir drásticamente el ancho de banda del audio transmitido cuando sólo se disponía de una velocidad de transmisión de bits muy baja. Los códecs (codificador– decodificador) de audio modernos pueden codificar las señales de banda ancha utilizando procedimientos de extensión del ancho de banda (BWE), de acuerdo con lo descripto por M Dietz, L. Liljeryd, K. Kjörling y O. Kunz, en
“Spectral Band Replication, a novel approach in audio coding” en la 112a Convención de AES, Munich, Mayo de 2002; S. Meltzer, R. Böhm y F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM),” en la 112a Convención de AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,” en la 112a Convención de AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496–3:2001/FPDAM 1, “Bandwidth Extension,” ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al. Patente de Estados Unidos 5.455.888; E. Larsen, R. M. Aarts, y M. Danessis. Efficient high–frequency bandwidth extension of music and speech. en la 112a Convención de AES, Munich, Alemania, Mayo de 2002; R.M. Aarts, E. Larsen, y O. Ouweltjes. A unified approach to low–and high frequency bandwidth extension. En la 115a Convención de AES, New York, Estados Unidos, Octubre de 2003; K. Käyhkö. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001; E. Larsen and R.M. Aarts. Audio Bandwidth Extension – Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004; E. Larsen, R.M. Aarts y M. Danessis. Efficient high–frequency bandwidth extension of music and speech. En la 112a Convención de AES, Munich, Alemania, Mayo de 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions of Audio and Electroacoustics, AU– 21(3), Junio de 1973; Solicitud de patente de los Estados Unidos 08/951,029, Ohmori, et al. Audio band width extending system and method; Patente de Estados Unidos 6895375, Malah, D & Cox, R.V.: System for bandwidth extension of Narrow–band speech y Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs,” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, Abril de 2009.
[0003] Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF). Esta representación se genera desde la parte de baja frecuencia (LF) de la señal decodificada por medio de la
transposición a la región espectral de HF (“patching”) y la aplicación de un post procesamiento impulsado por los
parámetros.
[0004] En la técnica, se utilizan procedimientos de extensión del ancho de banda tales como replicación de la banda espectral (SBR) como procedimiento eficiente para generar señales de alta frecuencia en un códec basado en HFR (reconstrucción de alta frecuencia).
[0005] La replicación de la banda espectral (SBR), según lo descripto por M Dietz, L. Liljeryd, K. Kjörling y O. Kunz,
“Spectral Band Replication, a novel approach in audio coding” en la 112a Convención de AES, Munich, mayo de
2002, utiliza un banco de filtros espejo en cuadratura (QMF) para generar la información de HF (alta frecuencia).
Con el denominado “patching”, las señales de banda QMF más altas se copian en bandas QMF más altas, lo que
lleva a la replicación de la información de la parte de LF en la parte de HF. La parte de HF generada se adapta posteriormente a la parte original de HF con la ayuda de parámetros que ajustan la envolvente espectral y la tonalidad.
[0006] En la SBR (replicación de la banda espectral), normalizada en HE–AAC, todas las operaciones, que incluyen la introducción de parches por medio de simple copiado, se llevan a cabo frecuentemente dentro del dominio de QMF. Sin embargo, se pueden ejecutar otros procedimientos diferentes de introducción de parches en diferentes dominios, tales como el dominio FFT o el dominio del tiempo. Uno se podría imaginar la habilitación de la SBR para elegir alternativamente un algoritmo de parches que funcione en el dominio FFT o en el dominio del tiempo y necesite una transformación adicional para alimentar el paso de análisis de QMF.
[0007] En la SBR básica, sólo se dispone de un algoritmo de emparche que no toma en cuenta ni las necesidades de hardware ni software especial ni las características de la señal. Por ende, la SBR no puede adaptar el algoritmo de parches. Uno se podría imaginar simplemente la elección entre dos algoritmos diferenciados de introducción de parches ("patching"). Dado que los dos procedimientos de introducción de parches ("patching") funcionan en diferentes dominios, las áreas de transición son proclives a producir artefactos de bloqueo, lo que prácticamente imposibilita la conmutación de grano fino entre ambos procedimientos.
[0008] WO 98/57436 describe procedimientos de transposición utilizados en la replicación de la banda espectral, que se combinan con el ajuste de la envoltura espectral.
[0009] WO 02/052545 plantea que las señales se pueden clasificar en forma de tren de pulsos o en forma no de tren de pulsos y basándose en esta clasificación se propone un transpositor. El transpositor de conmutación ejecuta dos algoritmos de introducción de parche en paralelo y la unidad mezcladora combina ambas señales emparchadas dependiendo de la clasificación (tren de pulsos o no tren de pulsos). La conmutación real entre los transpositores o su mezcla se ejecuta en un banco de filtros de ajuste de la envolvente en respuesta a los datos de envolvente y control. Más aun, en el caso de las señales en forma de tren de pulsos, la señal base se transforma en un dominio de banco de filtros, se ejecuta una operación de traslado de frecuencias y se ejecuta un ajuste a la envolvente del resultado de la traslación de frecuencias. Este es un procedimiento combinado de introducción de parche/procesamiento adicional. En el caso de las señales que no tienen forma de tren de pulsos, se incluye un transpositor de domino de la frecuencia (transpositor FD) y el resultado del transpositor al dominio de la frecuencia se transforma entonces en el dominio de bancos de filtro, en el cual se ejecuta el ajuste de la envolvente. Por consiguiente, la implementación y flexibilidad de este procedimiento, que, en una alternativa, presenta una estrategia de parche/procesamiento adicional y que, en la otra alternativa, incluye un transpositor del domino de la frecuencia que está situado fuera del banco de filtros en el cual tiene lugar el ajuste de la envolvente, son problemáticas con respecto a las posibilidades de flexibilidad e implementación.
[0010] En el estado de la técnica, los siguientes documentos describen soluciones para realizar un patching de componentes espectrales que faltan: WO 02/052545 A1, US 2002/016698 A1 y WO 03/107329 A1.
[0011] Es un objetivo de la presente invención dar a conocer un concepto para generar una señal de audio de síntesis que dé lugar a una calidad mejorada y permita una implementación eficiente.
[0012] Este objetivo se logra mediante un aparato para generar una señal de audio de síntesis de acuerdo con la reivindicación 1, un aparato para codificar una señal de audio de acuerdo con la reivindicación 10, un procedimiento para generar de acuerdo con la reivindicación 12, un procedimiento para codificar de acuerdo con la reivindicación 13, una señal de audio codificada de acuerdo con la reivindicación 14 o un programa de computación de acuerdo con la reivindicación 15.
[0013] La presente invención se basa en la idea básica de que se puede obtener la calidad mejorada recién mencionada y/o una implementación eficiente cuando una porción de tiempo de una señal de audio se convierte a una representación espectral antes de ejecutar una pluralidad de algoritmos diferentes de introducción de parche en el dominio espectral, donde cada algoritmo de parches genera una representación espectral modificada que comprende componentes espectrales en una banda de frecuencia superior derivada de los componentes espectrales correspondientes en una banda de frecuencia del núcleo de la señal de audio y seleccionando un primer algoritmo de parches en el dominio espectral de una pluralidad de algoritmos de introducción de parche para una primera porción de tiempo y un segundo algoritmo de parches en el dominio espectral de la pluralidad de algoritmos de introducción de parche para una segunda porción de tiempo diferente de acuerdo con una señal de control de introducción de parche para obtener la representación espectral modificada. Con esta medida, se puede prevenir la reducción de la calidad y/o flexibilidad debida a una conmutación entre dos algoritmos de introducción de parche en diferentes dominios y, por lo tanto, el procesamiento puede ser menos complejo y mantener al mismo tiempo la calidad perceptual.
[0014] De acuerdo con una realización de la presente invención, un aparato para generar una señal de audio de síntesis que utiliza una señal de control de parche comprende un primer convertidor, un generador de parches en el dominio espectral, un manipulador de reconstrucción de alta frecuencia y un combinador. El primer convertidor está configurado para convertir una porción de tiempo de una señal de audio en una representación espectral. El generador de parche en el dominio espectral está configurado para ejecutar una pluralidad de algoritmos diferentes en el domino espectral, donde cada algoritmo de parches genera una representación espectral modificada que comprende componentes espectrales en una banda de frecuencia superior derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo de la señal de audio. El generador de parche en el domino espectral está configurado además para seleccionar un primer algoritmo de parches en el dominio espectral entre la pluralidad de algoritmos de introducción de parche para una primera porción de tiempo y un segundo algoritmo de parches en el dominio espectral entre la pluralidad de algoritmos de introducción de parche para una segunda porción de tiempo diferente de acuerdo con la señal de control de parche para obtener la representación espectral modificada. El manipulador de reconstrucción de alta frecuencia está configurado para manipular la representación espectral modificada o una señal derivada de la representación espectral modificada de acuerdo con un parámetro de replicación de bandas espectrales para obtener una señal de extensión del ancho de banda. El combinador está configurado para combinar la señal de audio que consta de componentes espectrales en la banda de frecuencia del núcleo o una señal derivada de la señal de audio con la señal de extensión de ancho de banda para obtener la señal de audio de síntesis.
[0015] De acuerdo con otra realización de la presente invención, un aparato para codificar una señal de audio comprende un codificador del núcleo, un extractor de parámetros y una calculadora de parámetros. La señal de audio comprende una banda de frecuencia del núcleo y una banda de frecuencia superior. El codificador del núcleo está configurado para codificar la señal de audio dentro de la banda de frecuencia del núcleo. El extractor de parámetros está configurado para extraer una señal de control de parches de la señal de audio, donde la señal de control de parche indica un algoritmo de parches seleccionado entre una pluralidad de algoritmos de introducción de parche en el dominio espectral diferentes y donde el algoritmo de parche seleccionado se ha de ejecutar en un dominio espectral para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda. La calculadora de parámetros está configurada para calcular el parámetro de replicación de la banda espectral de la banda de frecuencia superior.
[0016] De acuerdo con otra realización, un flujo de datos de señal de audio codificada comprende una señal de audio codificada dentro de una banda de frecuencia del núcleo, una señal de control de introducción de parche, donde la señal de control de introducción de parche indica un algoritmo de parches seleccionado entre una pluralidad de algoritmos de introducción de parche en el dominio espectral diferentes y donde el algoritmo de parche seleccionado se ha de ejecutar en un dominio espectral para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda y un parámetro de replicación de la banda espectral calculado de una banda de frecuencia superior de la señal de audio.
[0017] Por lo tanto, las realizaciones de la presente invención se relacionan con un concepto para conmutar entre por lo menos por lo menos dos algoritmos diferentes de introducción de parche en el dominio espectral de un grupo de algoritmos de introducción de parche en el domino espectral. El grupo de algoritmos de introducción de parche puede comprender un primer algoritmo de parches que comprende una transposición armónica basada en un vocodificador de fase única y funcionalidades de SBR por copiado no armónica, un segundo algoritmo de parches que comprende una transposición armónica basada en un vocodificador de fases múltiples, un tercer algoritmo de parches que comprende funcionalidades de SBR por copiado no armónica y un cuarto algoritmo de parches que comprende una distorsión no lineal. Más aun, la extensión del ancho de banda se puede ejecutar de tal manera que la señal de extensión de ancho de banda comprende la banda de frecuencia superior que tiene una frecuencia máxima de por lo menos cuatro veces la frecuencia de cruce en la banda de frecuencia del núcleo.
[0018] Como resultado, al conmutar entre los por lo menos dos algoritmos de parches diferentes en el dominio espectral, se puede obtener una complejidad reducida en la misma calidad perceptual, como por ejemplo dentro de una situación de extensión del ancho de banda.
[0019] Otras realizaciones de la presente invención se relacionan con un aparato que no comprende un transformador de tiempo/ frecuencia para transformar una señal en el domino del tiempo derivada de de la representación espectral modificada al dominio espectral. Por lo tanto, las realizaciones dan lugar a que el manipulador de reconstrucción de frecuencia pueda ser operativo en la representación espectral modificada directamente sin requerir más transformación (por ejemplo, un análisis de QMF) del domino del tiempo al dominio espectral, como en el caso de una técnica de parche/procesamiento adicional que es operativa en diferentes dominios.
[0020] Otras realizaciones de la presente invención se relacionan con un extractor de parámetros que está configurado para determinar, de la pluralidad de diferentes algoritmos de parches en el dominio espectral, un algoritmo de parche seleccionado. En este caso, el algoritmo de parche seleccionado se basa en una comparación de la señal de audio, o una señal derivada de la señal de audio, con una pluralidad de señales de extensión de ancho de banda que fueran obtenidas mediante la ejecución de la pluralidad de algoritmos de parche en el dominio espectral y la manipulación de una representación modificada de una porción de tiempo de la señal de audio. Por lo tanto, las realizaciones presentan un procedimiento para seleccionar el algoritmo de parche óptimo para generar una señal de audio de síntesis en un decodificador de extensión del ancho de banda.
[0021] Se pueden utilizar parámetros de control para decidir qué parche es el más apropiado. Para obtenerlo, se puede emplear una etapa de análisis por síntesis; es decir, se pueden aplicar todos los parches y se elige el mejor de acuerdo con el objetivo. En la modalidad preferida de la invención, el objetivo consiste en obtener la mejor calidad perceptual de la restitución. En modalidades alternativas, se tiene que optimizar una función objetivo. Por ejemplo, la función objetivo puede ser conservar lo plano de las HF originales al máximo posible.
[0022] Por un lado, la selección del parche se puede realizar sólo en el codificador tomando en cuenta la señal original, la señal sintetizada o ambas. La decisión (señal de control de parches) es transmitida entonces al decodificador. Por otro lado, la selección se puede ejecutar de manera sincrónica en los lados del codificador y decodificador teniendo en cuenta sólo el ancho de banda del núcleo de la señal sintetizada. Este último procedimiento no necesita generar información secundaria adicional.
[0023] A continuación, se explican las realizaciones de la presente invención con referencia a los dibujos que las acompañan, en los cuales:
La Fig. 1a ilustra un diagrama de bloques de una realización de un aparato para generar una señal de audio de síntesis que utiliza una señal de control de parches;
La Fig. 1b ilustra un diagrama de bloques de una implementación de un generador de parches en el dominio espectral de la Fig. 1a;
La Fig. 2a ilustra un diagrama de bloques de otra realización de un aparato para generar una señal de audio de síntesis;
5 La Fig. 2b presenta una ilustración esquemática de un esquema de extensión de ancho de banda;
La Fig. 3 presenta una ilustración esquemática de un primer ejemplo de algoritmo de parches;
La Fig. 4 presenta una ilustración esquemática de un segundo ejemplo de algoritmo de parches;
La Fig. 5 presenta una ilustración esquemática de un tercer ejemplo de algoritmo de parches;
La Fig. 6 presenta una ilustración esquemática de un cuarto ejemplo de algoritmo de parches;
10 La Fig. 7 ilustra un diagrama de bloques de una realización de la Fig. 1a sin transformador de tiempo/ frecuencia colocado después del generador de parches en el dominio espectral;
La Fig. 8 ilustra un diagrama de bloques de una realización de Fig. 1a con un segundo convertidor (convertidor de frecuencia/ tiempo);
La Fig. 9 ilustra un diagrama de bloques de una realización de un aparato para codificar una señal de audio;
15 La Fig. 10 ilustra un diagrama de bloques de otra realización de un aparato para codificar una señal de audio y
La Fig. 11 ilustra una vista general de una realización correspondiente a un esquema de parches en el dominio de la frecuencia.
[0024] La Fig. 1a ilustra un diagrama de bloques de un aparato 100 para generar una señal de audio de síntesis 145 utilizando una señal de control de parches 119 de acuerdo con una realización de la presente invención. El aparato 20 100 comprende un primer convertidor 110, un generador de parches en el dominio espectral 120, un manipulador de reconstrucción de alta frecuencia 130 y un combinador 140. El primer convertidor 110 está configurado para convertir una porción de tiempo de una señal de audio 105 en una representación espectral 115. El generador de parches en el dominio espectral 120 está configurado para ejecutar una pluralidad 117–1 de diferentes algoritmos de parches en el dominio espectral, donde cada algoritmo de parche genera una representación espectral modificada 25 125 que comprende componentes espectrales en una banda de frecuencia superior derivada de los componentes espectrales correspondientes de una banda de frecuencia del núcleo de la señal de audio 105. Como se ilustra en la Fig. 1b, el generador de parches en el dominio espectral 120 puede estar configurado para seleccionar un primer algoritmo de parches en el dominio espectral 117–2 de la pluralidad 117–1 de algoritmos de parches correspondiente a una primera porción de tiempo 107–1 y un segundo algoritmo de parches en el dominio espectral
30 117–3 de la pluralidad 117–1 de algoritmos de parches correspondiente a una segunda porción de tiempo diferente 107–2 de acuerdo con la señal de control de parches 119 para obtener la representación espectral modificada 125.
[0025] El manipulador de reconstrucción de alta frecuencia 130 está configurado para manipular la representación espectral modificada 125 o una señal derivada de la representación espectral modificada 125 de acuerdo con un parámetro de replicación de la banda espectral 127 para obtener una señal de extensión del ancho de banda 135. 35 La señal derivada de la representación espectral modificada 125 puede ser, por ejemplo, una señal en el domino QMF obtenida después de aplicar un análisis de QMF a una señal modificada en el dominio del tiempo basado en la representación espectral modificada 125. El combinador 140 está configurado para combinar la señal de audio 105 que tiene componentes espectrales en la banda de la frecuencia del núcleo o una señal derivada de la señal de audio 105 con la señal de ancho de banda extendido 135 para obtener la señal de audio de síntesis 145. En este
40 caso, la señal derivada de la señal de audio 105 puede ser, por ejemplo, una señal de baja frecuencia decodificada que fuera obtenida después de decodificar una señal de audio codificada dentro de la banda de la frecuencia del núcleo.
[0026] Como se puede apreciar en la Fig. 1a, el generador de parches en el dominio espectral 120 del aparato 100 está implementado de manera que sea operativo en un dominio espectral y no en un dominio del tiempo.
45 [0027] La Fig. 2a ilustra un diagrama de bloques de otra realización de un aparato 200 para generar la señal de audio de síntesis 145. En este caso, se omiten los componentes del aparato 200 de la Fig. 2a, que son los mismos que en el aparato 100 de la Fig. 1a, y no se los ilustra ni describe nuevamente. En la realización ilustrada en la Fig. 2a, el generador de parches en el dominio espectral 120 del aparato 200 está configurado para ejecutar por lo menos dos algoritmos de parche diferentes en el dominio espectral de un grupo 203 de algoritmos de parche en el
50 dominio espectral. El grupo 203 de algoritmos de parches comprende un primer algoritmo de parche 205–1 que comprende una transposición armónica basada en un vocodificador de fase única y funcionalidades de SBR por copiado no armónico, un segundo algoritmo de parches 205–2 que comprende una transposición armónica basada en un vocodificador de fases múltiples, un tercer algoritmo de parches 205–3 que comprende funcionalidades de SBR por copiado no armónico y un cuarto algoritmo de parches 205–4 que comprende una distorsión no lineal.
[0028] Como se ilustra en la Fig. 2b, el aparato 200 puede estar adaptado para ejecutar una extensión del ancho de banda de manera tal que la señal de ancho de banda extendido 135 comprende la banda de frecuencia superior 220 que tiene una frecuencia máxima 225 de por lo menos cuatro veces la frecuencia de cruce 215 en la banda de la frecuencia del núcleo 210. En el contexto de la SBR, el valor típico de la frecuencia de cruce 215 que se define como la frecuencia más alta de la banda de la frecuencia del núcleo 210 puede estar, por ejemplo, en un rango inferior a 4 kHz, 5 kHz o 6 kHz. En consecuencia, la frecuencia máxima 225 de la banda de frecuencia superior 220 puede ser, por ejemplo, de aproximadamente 16 kHz, 20 kHz o 24 kHz.
[0029] La Fig. 3 presenta una ilustración esquemática de un primer ejemplo de algoritmo de parches 205–1. En particular, el generador de parches en el dominio espectral 120 está configurado para ejecutar un algoritmo de parches seleccionado entre por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parche seleccionado comprende el primer algoritmo de parches 205–1. El primer algoritmo de parches 205–1 comprende una transposición armónica basada en un vocodificador de fase única 305 que comprende un factor de extensión de ancho de banda (σ) de dos que controla una transformada de una banda de la frecuencia de origen 310 extraída de la banda de la frecuencia del núcleo 210 en una primera banda de frecuencia objetivo 310’. En este caso, las fases de los componentes espectrales en la banda de la frecuencia de origen 310 se multiplican por el factor de extensión del ancho de banda (σ) de manera tal que la primera banda de la frecuencia objetivo 310 tiene frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx). El primer algoritmo de parches 205–1 comprende además funcionalidades de SBR de copiado no harmónico 315 para transformar los componentes espectrales de la primera banda de frecuencia objetivo 310’ en una segunda banda de frecuencia objetivo 320’ mediante un primer copiado, de tal manera que la segunda banda de frecuencia objetivo 320’ tiene
frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) y para
transformar a su vez los componentes espectrales de la segunda banda de frecuencia objetivo 320’ en una tercera banda de frecuencia objetivo 330’ mediante una segunda copia, de tal manera que la tercera banda de frecuencia objetivo 330’ tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de
cruce (fx) incluida en la banda de frecuencia superior 220, donde la banda de frecuencia superior 220 comprende la
primera 310’, segunda 320’ y tercera 330’ bandas de frecuencia objetivo. En particular, como se ilustra en la Fig. 3,
la señal de ancho de banda extendido 135 comprende la banda de frecuencia superior 220 generada a partir de la banda de frecuencia del núcleo 210, donde la banda de frecuencia superior 220 tiene una frecuencia máxima de cuatro veces la frecuencia de cruce (fx).
[0030] La Fig. 4 presenta una ilustración esquemática de un segundo ejemplo de algoritmo de parches 205–2. En este caso in particular, el generador de parches en el dominio espectral 120 está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el segundo algoritmo de parches 205–2. El segundo algoritmo de parches 205–2 comprende una transposición armónica basada en un vocodificador de fases múltiples 405 que comprende un primer factor de extensión del ancho de banda (σ1) de 2 que controlan una transformada de una primera banda de frecuencia de origen 410 extraída de la banda de frecuencia del núcleo 210
en una primera banda de frecuencia objetivo 410’. En este caso, las fases de los componentes espectrales de la primera banda de frecuencia de origen 410 se multiplican por el primer factor de extensión del ancho de banda (σ1) por lo que la primera banda de frecuencia objetivo 410’ tiene frecuencias en el rango que va de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx). El segundo algoritmo de parches 205–2 comprende además un segundo factor de extensión del ancho de banda (σ2) de 3 que controlan una transformada de una segunda banda de frecuencia de origen 420–1, 420–2 extraída de la banda de frecuencia del núcleo 210 en una segunda banda de frecuencia objetivo 420’, 420’’. En este caso, las fases de los componentes espectrales de la segunda banda de frecuencia de origen 420–1, 420–2 se multiplican por el segundo factor de extensión del ancho de banda (σ2) por lo que la segunda banda de frecuencia objetivo 420’, 420’’ tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) o en el rango comprendido desde la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx), respectivamente. Por último, el segundo algoritmo de parches 205–2 comprende además un tercer factor de extensión del ancho de banda (σ3) de 4 que controlan una transformada de una tercera banda de frecuencia de origen 430–1, 430–2 extraída de la banda de frecuencia del núcleo 210 en una tercera banda de frecuencia objetivo 430’, 430’’. En este caso, las fases de los componentes espectrales de la tercera banda de frecuencia de origen 430–1, 430–2 se multiplican por el tercer factor de extensión del ancho de banda (σ3) de manera tal que la tercera banda de frecuencia objetivo 430’, 430’’ tiene frecuencias en el rango de tres veces la
frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) o en el rango de la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluida en la banda de frecuencia superior 220, respectivamente. Como en el caso del primer algoritmo de parches 205–1 expuesto en la Fig. 3, la banda de frecuencia superior 220 de la señal de ancho de banda extendido 135 comprende la primera 410’, segunda 420’, 420’’ y tercera 430’, 430’’ bandas de frecuencia objetivo con una frecuencia máxima de cuatro veces la frecuencia de cruce (fx).
[0031] La Fig. 5 presenta una ilustración esquemática de un tercer ejemplo de algoritmo de parches 205–3. En la realización de la Fig. 5, el generador de parches en el dominio espectral 120 está configurado para ejecutar un algoritmo de parches selecto de los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el tercer algoritmo de parches 205–3. El tercer algoritmo de parches 205–3 comprende funcionalidades de SBR de copiado no harmónico 505 para transformar los componentes espectrales de una banda de frecuencia de origen 510 que es la banda de frecuencia del núcleo 210 en una banda
de frecuencia objetivo 510’ mediante una primera copia, por lo que la primera banda de frecuencia objetivo 510’
tiene frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx). Los componentes
espectrales de la primera banda de frecuencia objetivo 510’ se transforman a su vez en una segunda banda de frecuencia objetivo 520’ mediante un segundo copiado, por lo que la segunda banda de frecuencia objetivo 520’
tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx). Por
último, los componentes espectrales de la segunda banda de frecuencia objetivo 520’ se transforman a su vez en una tercera banda de frecuencia objetivo 530’ mediante una tercera copia, por lo que la tercera banda de frecuencia objetivo 530’ tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de
cruce (fx) incluida en la banda de frecuencia superior 220. Una vez más, la banda de frecuencia superior 220 de la
señal de ancho de banda extendido 135 comprende la primera 510’, segunda 520’ y tercera 530’ bandas de
frecuencia objetivo que tienen una frecuencia máxima de cuatro veces la frecuencia de cruce (fx).
[0032] La Fig. 6 presenta una ilustración esquemática de un cuarto ejemplo de algoritmo de parches 205–4. En la realización de la Fig. 6, el generador de parches en el dominio espectral 120 está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el cuarto algoritmo de parches 205–4. En este caso, el cuarto algoritmo de parches 205–4 comprende una distorsión no lineal para generar los componentes espectrales de la banda de frecuencia superior 220 con frecuencias en el rango de la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx).
[0033] En general, en las realizaciones de las Figs. 3–6 antes descriptas, los algoritmos de parches en el dominio espectral 205–1; 205–2; 205–3; 205–4 se ejecutan con el generador de parches en el dominio espectral 120 configurado para transformar un componente espectral en una banda inicial 310, 310’, 320’; 410, 420–1, 420–2, 430–1, 430–2; 510, 510’, 520’ derivada de la banda de frecuencia del núcleo 210 o una banda de frecuencia superior no incluida en la banda de la frecuencia del núcleo 210 en un componente espectral objetivo de la banda de frecuencia superior 220 por lo que el componente espectral objetivo es diferente para cada algoritmo de parches en el dominio espectral.
[0034] En particular, el generador de parches en el dominio espectral 120 puede comprender un filtro paso banda para extraer la banda inicial de la banda de frecuencia del núcleo 210 o la banda de frecuencia superior 220, donde se puede seleccionar una característica de paso banda del filtro paso banda de tal manera que la banda inicial se transforme en una correspondiente banda de frecuencia objetivo 310’, 320’, 330’; 410’, 420’, 420’’, 430’, 430’’; 510’, 520’, 530’ como se ilustra en la Figs. 3–6.
[0035] Los diferentes algoritmos espectrales en el dominio espectral 205–1; 205–2; 205–3; 205–4 se pueden ejecutar de acuerdo con una eficiencia necesaria tal como siguiendo el esquema de ancho de banda de la Fig. 2b.
[0036] Específicamente, empleando un vocodificador de una o múltiples fases como se ilustra, por ejemplo en la Fig. 3 o la Fig. 4, respectivamente, la estructura de frecuencias se extiende de manera correctamente armónica al dominio de alta frecuencia, puesto que la banda base (por ej., la banda de frecuencia del núcleo 210) se propaga espectralmente en un múltiplo par (por ej. σ1 = 2, σ2 = 3, σ3 = 4), y porque los componentes espectrales de la banda base se combinan con componentes espectrales generados adicionales.
[0037] Un algoritmo de parches basado en un vocodificador de fases puede ser ventajoso si la banda base ya tiene un ancho de banda fuertemente limitado, por ejemplo, utilizando sólo una velocidad de transmisión de datos muy baja. Por ende, la reconstrucción de los componentes de frecuencia superior se inicia a una frecuencia relativamente baja. La frecuencia de cruce típica es, en este caso, inferior a aproximadamente 5 KHz (o incluso inferior a 4 KHz). En esta región, el oído humano es muy sensible a las disonancias debidas a los armónicos incorrectamente situados. Esto puede dar origen a la impresión de tonos “anormales”. Además, los tonos espectralmente espaciados a poca distancia (con la disonancia espectral de aproximadamente 30 Hz a 300 Hz) se perciben en forma de tonos ásperos. La continuación armónica de la estructura de frecuencias de la banda base evita estas impresiones auditivas incorrectas y desagradables.
[0038] Más aun, al emplear funcionalidades de SBR por copiado no armónico como se ilustra, por ejemplo en la Fig. 5, se pueden copiar las regiones espectrales en forma de subbandas a una región de frecuencia más alta o en la región de frecuencias a replicar. Además, el copiado se basa en la observación, como sucede con todos los procedimientos de introducción de parches, de que las propiedades espectrales de las señales de frecuencia más alta son similares, en muchos aspectos, a las propiedades de las señales de la banda base. Hay sólo muy pocas desviaciones entre sí. Además, el oído humano por lo general no es muy sensible a alta frecuencia (típicamente a partir de aproximadamente 5 KHz), especialmente con respecto a un mapeo espectral no preciso. De hecho, esta es una idea clave de la replicación de bandas espectrales en general. El copiado, en particular, tiene la ventaja de que es de fácil y rápida implementación. Este algoritmo de parches tiene además una gran flexibilidad con respecto a los bordes del parche, puesto que la copia del espectro se puede ejecutar en cualquier borde sub–banda.
[0039] Por último, el algoritmo de parches de distorsión no lineal (véase, por ej. la Fig. 6) puede comprender una generación de armónicos mediante corte, limitación, cuadratura, etc. Si, por ejemplo, una señal de difusión está ocupada espectralmente en forma muy rala (por ej. después de aplicar el algoritmo de parches de vocodificador antes mencionado) es posible que el espectro de difusión pueda estar suplementado aditivamente, opcionalmente, mediante una señal distorsionada a fin de evitar los desagradables huecos de frecuencia.
[0040] Se ha de notar que, además de los algoritmos de parches antes mencionados del grupo 203 de algoritmos de parches (ver Fig. 2a), se pueden ejecutar otros algoritmos de parches dentro del dominio espectral, tal como la producción de espejos espectrales.
[0041] En la realización de la Fig. 7, se ilustra un aparato 700 que no comprende un transformador de tiempo/ frecuencia, como se indica por el bloque de guiones 710 para transformar una señal en el dominio del tiempo 705 derivada de la representación espectral modificada 125 a una en el dominio espectral. Esto significa que, en este caso, el manipulador de reconstrucción de alta frecuencia 130 recibe como entrada la representación espectral modificada 125 y no una señal en el dominio de la frecuencia 715, presente a la salida de dicho transformador de tiempo/ frecuencia 710.
[0042] La configuración descripta puede ser ventajosa, puesto que, en este caso, el procesamiento adicional de la representación espectral modificada 125 ejecutado por el manipulador de reconstrucción de alta frecuencia 130 puede tener lugar fácilmente en el mismo dominio (por ej. el dominio FFT o QMF) en que opera que el algoritmo de parches ejecutado por el generador de parches en el dominio espectral 120. Por lo tanto, no es necesario otra transformación entre diferentes dominios, como por ejemplo la transformación del dominio del tiempo al dominio espectral (por ej. un análisis QMF), lo que permite una implementación más fácil.
[0043] En la realización de la Fig. 8, se ilustra un aparato 800 que además comprende un segundo convertidor 810 para convertir la representación espectral modificada 125 al dominio del tiempo. Una vez más, se omiten los componentes del aparato 800 de la Fig. 8, que pueden corresponder a los del aparato 100 de la Fig. 1a. Como se ilustra en la Fig. 8, el segundo convertidor 810 puede estar adaptado para aplicar una síntesis compatible con un análisis aplicado por el primer convertidor 110. En este caso, el primer convertidor 110 está configurado para ejecutar una conversión que tiene una primera longitud de conversión 111, en tanto que el segundo convertidor 810 está configurado para ejecutar una conversión que tiene una segunda longitud de conversión. En particular, la segunda longitud de conversión puede depender de una característica de extensión del ancho de banda por el hecho de que se tiene en cuenta la relación de la frecuencia máxima (Fmax) en la banda de frecuencia superior 220 y la frecuencia de cruce (fx) en la banda de la frecuencia del núcleo 210 y la primera longitud de conversión 111.
[0044] En realizaciones de la presente invención, el primer convertidor 110 puede ser implementado, por ejemplo, para ejecutar una transformada rápida de Fourier (FFT), una transformada corta de Fourier (STFT), una transformada discreta de Fourier (DFT) o un análisis QMF, en tanto que el segundo convertidor 810 puede estar implementado, por ejemplo, para ejecutar una transformada rápida de Fourier inversa (IFFT), una transformada corta de Fourier inversa (ISTFT), una transformada discreta de Fourier inversa (IDFT) o una síntesis por QMF.
[0045] Específicamente, la segunda longitud de conversión puede ser elegida de manera que sea igual a la relación fmax/fx multiplicada por la primera longitud de conversión 111. De esta manera, la segunda longitud de conversión o resolución de frecuencia aplicada por el segundo convertidor 810 se adapta fácilmente a la característica de extensión del ancho de banda del esquema de extensión de ancho de banda ilustrado en la Fig. 2b. Esto es porque la característica de extensión del ancho de banda está gobernada esencialmente por la relación antes expuesta (fmax/fx) que corresponde a una velocidad de muestreo efectivo más elevada de acuerdo con el principio de Nyquist.
[0046] La Fig. 9 ilustra un diagrama de bloques de una realización de un aparato 900 para codificar una señal de audio 105. La señal de audio 105 comprende una banda de frecuencia del núcleo 210 y una banda de frecuencia superior 220. En particular, el aparato 900 para codificar comprende un codificador de núcleo 910, un extractor de parámetros 920 y una calculadora de parámetros 930. El codificador de núcleo 910 está configurado para codificar la señal de audio 105 dentro de la banda de la frecuencia del núcleo 210 para obtener una señal de audio codificada 915 codificada dentro de la banda de la frecuencia del núcleo 210. Más aun, el extractor de parámetros 920 está configurado para extraer una señal de control de parches 119 de la señal de audio 105, donde la señal de control de parches 119 indica un algoritmo de parches seleccionado de una pluralidad 117–1 de algoritmos espectrales diferentes en el dominio espectral. Específicamente, el algoritmo de parches seleccionado se puede ejecutar en un dominio espectral para generar la señal de audio de síntesis en un decodificador de extensión de ancho de banda. Por último, la calculadora de parámetros 930 está configurada para calcular un parámetro de SBR 127 de la banda de frecuencia superior 220. El parámetro de SBR 127 calculado de la banda de frecuencia superior 220, donde la señal de control de parches 119 indica el algoritmo de parches seleccionado y la señal de audio codificada 915 codificada dentro de la banda de la frecuencia del núcleo 210 puede constituir una señal de audio codificada 935 que se ha de almacenar o transmitir dentro de un flujo de bits.
[0047] En la realización de la Fig. 9, el extractor de parámetros 920 puede estar configurado para analizar la señal de audio 105 o una señal derivada de la señal de audio 105 para determinar la señal de control de parches 119 sobre la base de una característica de señal de la señal analizada. Por ejemplo, la señal de control de parches 119 puede indicar un primer algoritmo de parches correspondiente a una primera porción de tiempo 107–1 de la señal
analizada que se caracteriza como “voz” y un segundo algoritmo de parches correspondiente a una segunda porción de tiempo 107–2 de la señal analizada, que se caracteriza como “música estacionaria”.
[0048] En consecuencia, en el caso de una señal de voz, se puede emplear un procesamiento basado en un modelo de origen de voz o un modelo de generación de información, como por ejemplo dentro de un dominio LPC (codificación predictiva lineal), en tanto que, en el caso de la música estacionaria, se puede utilizar un modelo de origen estacionario o un modelo de destino de la información. Mientras que en el caso anterior, se describe el sistema de generación de voz humana/sonido que genera sonido, en el último caso se describe el sistema auditivo humano que recibe sonido.
[0049] Además, se puede implementar un esquema de procesamiento dependiente de la señal conmutando entre una transposición armónica correspondiente a una porción de tiempo que comprende un evento transitorio y una operación por copiado no armónico correspondiente a una porción de tiempo que no comprende un evento transitorio.
[0050] El procedimiento citado que corresponde a un bucle abierto se basa en un análisis directo de la señal de audio 105 o una señal derivada de la señal de audio 105 con respecto a su característica de señal. Por otro lado, el extractor de parámetros 920 también puede ser operativo en un bucle cerrado correspondiente a una
implementación de “análisis por síntesis”.
[0051] En la realización de la Fig. 10, se ilustra un aparato 1000 para codificar una señal de audio 105 dentro de esa implementación de análisis por síntesis. Específicamente, el extractor de parámetros 920 del aparato 1000 para codificar puede estar configurado para determinar, de la pluralidad 117–1 de diferentes algoritmos de parches en el dominio espectral, el algoritmo de parches seleccionado. En este caso, el algoritmo de parches seleccionado se puede basar en una comparación de la señal de audio 105 o una señal derivada de la señal de audio 105 con la pluralidad 1005 de señales de ancho de banda extendido que se han obtenido al ejecutar la pluralidad 117–1 de algoritmos de parche en el dominio espectral y manipulando una representación espectral modificada 125 de una porción de tiempo de la señal de audio 105. La comparación se puede llevar a cabo, por ejemplo, por medio de una unidad de selección de parches 1010 calculando los parámetros (SFM1005)de medida de la suavidad (o lo plano) espectral (SFM) de la pluralidad 1005 de señales de ancho de banda extendido y la señal de audio 105 (SFMref), comparando los parámetros SFM calculados SFM1005 y SFMref y seleccionando, de la pluralidad 117–1 de algoritmos de parches, un algoritmo de parche específico (óptimo) por el cual la desviación de los parámetros SFM comparados sea mínima. Por último, el algoritmo de parche óptimo seleccionado puede estar indicado por la señal de control de parches 119 presente a la salida del extractor de parámetros 920.
[0052] La Fig. 11 ilustra una vista general de una realización correspondiente a un esquema de introducción de parches en un domino de la frecuencia. En particular, se ilustra un aparato 1100 para generar una señal de extensión del ancho de banda como el que corresponde al esquema de extensión de ancho de banda de la Fig. 2b. En la realización de la Fig. 11, la señal de audio 105 está representada por los datos de PCM (modulación por
pulsos codificados) 1101 que tiene una longitud de cuadro de 1024 muestras (‘cuadro: 1024’). Los datos de PCM
1101 pueden consistir, por ejemplo, en una señal de baja frecuencia decodificada que comprende una banda base derivada de la señal de audio codificada 935, señal de audio codificada 935 que ha sido transmitida desde un aparato para codificar tal como el codificador 900. A continuación se puede utilizar un decrementador (“downsampler”) 1110 para reducir el número de operaciones por muestra de los datos de PCM 1101 en un factor de 2, por ejemplo, para obtener una señal con número reducido de operaciones por muestra 1115. La señal decrementada 1115 es provista a su vez a un generador de ventanas de análisis 1120 indicado por un bloque titulado “ventana” que puede estar configurado para generar una pluralidad de bloques consecutivos de muestras de audio en ventanas superpuestas. En este caso, cada bloque de la pluralidad de bloques consecutivos puede comprender, por ejemplo, 512 muestras de audio. Además, se puede ajustar una primera distancia temporal entre dos bloques consecutivos de muestras de audio, por ejemplo, para que correspondan a las 64 muestras indicadas por “Inc = 64”. La superposición de los bloques consecutivos de muestras de audio puede ser controlada, a su vez, seleccionando una función de ventana de análisis adecuada (óptima) de una pluralidad de funciones de ventana de análisis diferentes aplicadas por el generador de ventanas 1120. Se aplica asimismo una porción de tiempo 1125 de la señal de audio 105, que puede corresponder a un bloque consecutivo de la pluralidad de bloques consecutivos de muestras de audio, al primer convertidor 110 que puede estar implementado, por ejemplo, en forma de procesador FFT 1130 que tiene la primera longitud de conversión 111 de N = 512. El procesador FFT 1130 puede estar configurado para convertir la porción de tiempo 1125 en la representación espectral 115, lo que se puede implementar, por ejemplo, en forma polar 1135–1. En particular, esta representación espectral 1135–1 comprende información de magnitud 1135–2 e información de fases 1135–3, que a su vez son procesadas por un generador de parches en el dominio espectral 1141, que puede corresponder al generador de parches en el dominio espectral 120 de la Fig. 2a. El generador de parches en el dominio espectral 1141 de la Fig. 11 puede comprender un primer algoritmo de parches 1141–1 indicado por “vocodificador de fases más copiado” correspondiente al primer algoritmo de parches 205–1, un segundo algoritmo de parches 1143–1 indicado por “vocodificador de fases” que corresponde al segundo algoritmo de parches 205–2, un tercer algoritmo de parches indicado por “función tipo SBR” que corresponde al tercer algoritmo de parches 205–3 y un cuarto algoritmo de parches 1147–1 indicado por “otra función, por ej. distorsión no lineal” que corresponde al cuarto algoritmo de parches 205–4 del grupo 203 de algoritmos de parches ilustrado en la Fig. 2a.
[0053] Como se describiera anteriormente con respecto al contexto de la Fig. 2a, el primer algoritmo de parches 1141–1 comprende un vocodificador de fase única 1141–2 y funcionalidades por copiado no armónico 1141–3, 1141–4. Más aun, el segundo algoritmo de parches 1143–1, que se basa en la operación de un vocodificador de fases múltiples comprende un vocodificador de primera fase 1143–2, un vocodificador de segunda fase 1143–3 y un tercer vocodificador 1143–4. Más aun, el tercer algoritmo de parches 1145–1 comprende funcionalidades de SBR por copiado no armónico que ejecuta una primera operación de copiado 1145–2, una segunda operación de copiado 1145–3 y una tercera operación de copiado 1145–4. Por último, el cuarto algoritmo de parches 1147–1 comprende una funcionalidad de distorsión no lineal.
[0054] Específicamente, en la realización de la Fig. 11, los subcomponentes de los bloques de algoritmos de parches 1141–1, 1143–1, 1145–1, 1147–1 pueden corresponder a los de los bloques 205–1, 205–2, 205–3, 205–4 de la Fig. 2a. Además, el símbolo z (‘banda de cruce’) puede corresponder a la frecuencia de cruce (fx).
[0055] Más aun, se puede utilizar un seleccionador de parches 1150 para producir una señal de control de parches 1155 correspondiente a la señal de control de parches 119 para controlar al generador de parches en el dominio espectral 1141 de tal manera que se ejecuten por lo menos dos algoritmos de parche diferentes en el dominio espectral del grupo 1141–1, 1143–1, 1145–1, 1147–1 de algoritmos de parches, llevando a una representación espectral modificada 1149 que corresponde a la representación espectral modificada 125.
[0056] La representación espectral modificada 1149 puede ser procesada (opcionalmente) por un interpolador subsiguiente 1160 para obtener una representación espectral modificada interpolada 1165. A continuación, se puede transferir la representación espectral modificada interpolada 1165 al segundo convertidor 810, que puede estar implementado, por ejemplo, en forma de procesador iFFT 1170 con una segunda longitud de conversión de N = 2048. En este caso, como se describe en lo que respecta a la Fig. 8, se ajusta la segunda longitud de conversión de N = 2048 de manera que sea exactamente cuatro veces más alta que la primera longitud de conversión de N = 512. De esa manera, se puede tomar en cuenta la característica de extensión del ancho de banda del esquema de extensión de ancho de banda ejecutado con los algoritmos espectrales diferentes en el dominio espectral, lo que se ha explicado anteriormente en forma detallada.
[0057] El procesador iFFT 1170 puede estar configurado para convertir la representación espectral modificada interpolada 1165 en una señal modificada en el dominio del tiempo 1175 que corresponde a la señal modificada en el dominio del tiempo 815 de la Fig. 8. Seguidamente, se puede transferir la señal modificada en el dominio del tiempo 1175 a un generador de ventanas de síntesis 1180 para aplicar una función de ventana de síntesis a la señal modificada en el dominio del tiempo 1175 para obtener una señal en el domino del tiempo en ventana modificada 1185. En este caso, se hace coincidir la función de ventana de síntesis con la función de ventana de análisis de manera que el efecto de la aplicación de la ventana de análisis se compense mediante la aplicación de la función de ventana de síntesis.
[0058] Dado que la señal modificada en el dominio del tiempo expuesta en ventana 1185 debe ser muestreada a una velocidad de muestreo efectivo más elevada (por ej. 32 KHz) en comparación con la velocidad de muestreo original (por ej. 8 KHz) debido a la extensión del ancho de banda, la señal modificada en el dominio del tiempo expuesta en ventana 1185 puede ser agregada de manera superpuesta, en última instancia, en un bloque 1190 indicado por “superposición y adición” por el hecho de que una relación de segunda distancia temporal de, por ejemplo 256 muestras, indicada por “Inc = 256” aplicada por el bloque 1190 y la primera distancia temporal de, por
ejemplo 64 muestras, aplicada por el generador de ventanas de análisis 1120 (por ej. relación = 4) ha de ser igual a la relación de la velocidad de muestreo efectivo más alta y la velocidad de muestreo original. De esta manera, se puede obtener una señal de salida 1195 que tenga la misma característica de superposición que la señal original (decrementada) 1115. La señal de salida 1195 provista por el aparato 1100 puede ser procesada a su vez a partir del manipulador de reconstrucción de alta frecuencia 130 como se ilustra en la Fig. 1a para obtener, en última instancia, una señal replicada con su ancho de banda extendido.
[0059] Se debe tener en cuenta que, en la realización de la Fig. 11, todos los diferentes algoritmos de parches se ejecutan en el mismo dominio, por ejemplo en el domino de la frecuencia. El dominio puede ser un dominio QMF y se realiza en la SBR o cualquier otro dominio, tal como por transposición de Fourier. La generación de datos del parche en sí se puede llevar a cabo en un dominio diferente. En ese caso, la totalidad de la introducción de parche se lleva a cabo en el mismo dominio.
[0060] Además, se pueden asociar diferentes modelos de origen con el parche considerado en la selección. Por ejemplo, se pueden asociar diferentes modelos de origen a la introducción del parche considerado en la selección. Por ejemplo, se puede elegir un modelo de origen de voz utilizado en la extensión de ancho de banda de voz, de
acuerdo con lo descripto por Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs,” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, abril de 2009, para las señales de voz, en tanto que se puede adoptar un modelo de origen estacionario para la música estacionaria. De la misma manera, como se describiera anteriormente, los transitorios pueden tener su propio modelo para la introducción de parches.
[0061] Más aun, por medio del análisis de superposición y ventanas de síntesis para la transposición de tiempo– frecuencia, se garantizan transiciones suaves entre diferentes esquemas de emparche. Por otro lado, se pueden utilizar ventanas especiales para el análisis y síntesis para posibilitar la menor superposición.
[0062] En síntesis, en la realización de la Fig. 11, se pueden seleccionar procedimientos para la introducción de parches entre una sencilla operación de copia de secciones de frecuencia lindantes, un esquema de transposición armónica basada en vocodificador de fases y que incluye el copiado de secciones de frecuencia vecinas.
[0063] Si bien se ha descripto la presente invención en el contexto de diagramas de bloques, donde los bloques representan los componentes de hardware reales o lógicos, también se puede implementar la presente invención mediante un procedimiento implementado por computadora. En este último caso, los bloques representan pasos correspondientes del procedimiento, donde estos pasos representan las funcionalidades ejecutar mediante bloques de hardware lógicos o físicos correspondientes.
[0063] Las realizaciones aquí descriptas son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descriptos en este documento han de ser evidentes para otras personas con capacitación en la técnica. Por lo tanto, se pretende restringirse sólo al alcance de las reivindicaciones de patente adjuntas y no a los detalles específicos presentados a manera de descripción y explicación de las realizaciones aquí presentadas.
[0065] Dependiendo de ciertos requisitos de implementación del procedimiento de la invención, el procedimiento de la invención puede ser implementado en hardware o en software. La implementación se puede ejecutar empleando un medio de almacenamiento digital, en un disco específico, un DVD o un CD con señales de control legibles en forma electrónica almacenadas en el mismo, que cooperan con sistemas de computación programables para posibilitar la ejecución de los procedimientos de la invención. En general, la presente invención puede ser implementada, por lo tanto, en forma de producto programa de computación, con un programa almacenado en un portador legible por una máquina, donde el código del programa cumple la función de poner en práctica los procedimientos de la invención al ejecutarse el programa de computación en una computadora. En otras palabras, los procedimientos de la invención consisten, por lo tanto, en un programa de computación que consta de un código de programa para poner en práctica por lo menos uno de los procedimientos de la invención al ejecutarse el programa de computación en una computadora. La señal de audio codificada de acuerdo con la invención puede ser almacenada en cualquier medio de almacenamiento legible por una máquina, como por ejemplo un medio de almacenamiento digital.
[0066] Las realizaciones de la presente invención permiten que la extensión del ancho de banda tome en cuenta las características de sonido, hardware y señales para el proceso de introducción de parches. La decisión del parche más adecuado se puede tomar dentro de bucles abiertos o cerrados. Por lo tanto, se puede controlar y mejorar la calidad de restitución.
[0067] El concepto presentado ofrece asimismo la ventaja de que se puede obtener fácilmente una transición suave entre los diferentes algoritmos de parches, dando así lugar a una adaptación rápida y precisa de la extensión del ancho de banda basada en la señal.
[0068] Las aplicaciones más prominentes son decodificadores de audio, que con frecuencia se implementan en dispositivos portátiles y, por consiguiente, funcionan con una fuente de abastecimiento de energía por baterías.

Claims (15)

  1. REIVINDICACIONES
    1. Un aparato (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches ("patching") (119; 1155), donde el aparato (100; 200; 700; 800; 1100) comprende:
    un primer convertidor (110; 1130) para convertir una porción de tiempo (107–1; 107–2; 1125) de una señal de audio (105; 1101) en una representación espectral (115: 1135–1);
    un generador de parches en el dominio espectral (120; 1141) para ejecutar una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parches genera una representación espectral modificada (125; 1149) que comprende componentes espectrales en una banda de frecuencia superior
    (220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101), y donde el generador de parches en el dominio espectral (120; 1141) está configurado para seleccionar un primer algoritmo de parches en el dominio espectral (117–2) de la pluralidad (117–1) de algoritmos de parches para una primera porción de tiempo (107–1) y un segundo algoritmo de parches en el dominio espectral (117–3) de la pluralidad (117–1) de algoritmos de parches para una segunda porción de tiempo diferente (119; 1155) para obtener la representación espectral modificada (125; 1149);
    un manipulador de reconstrucción de alta frecuencia (130) para manipular la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y
    un combinador (140) para combinar la señal de audio (105; 1101) que tiene componentes espectrales en la banda de frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145).
  2. 2.
    El aparato (100; 200; 700; 800; 1100) de acuerdo con la reivindicación 1, en el cual el generador de parches en el dominio espectral (120; 1141) es implementado de manera que sea operativo en un domino espectral y no en un dominio del tiempo.
  3. 3.
    El aparato (200) de acuerdo con la reivindicación 1 o 2, en el cual el generador de parches en el dominio espectral
    (120) está configurado para ejecutar por lo menos dos algoritmos de parche diferentes en el dominio espectral de un grupo (203) de algoritmos de parche en el dominio espectral, donde el grupo (203) de algoritmos de parches comprende un primer algoritmo de parches (205–1) que comprende una transposición armónica basada en un vocodificador de fase única y funcionalidades de replicación de la banda espectral con copiado no armónico, un segundo algoritmo de parches (205–2) que comprende una transposición armónica basada en un vocodificador de fases múltiples, un tercer algoritmo de parches (205–3) que comprende funcionalidades de replicación de la banda espectral con copiado no armónico y un cuarto algoritmo de parches (205–4) que comprende una distorsión no lineal, donde el aparato (200) está adaptado para ejecutar una extensión del ancho de banda, por lo que la señal de ancho de banda extendido (135) comprende la banda de frecuencia superior (220) que tiene una frecuencia máxima (225; fmax) de por lo menos cuatro veces la frecuencia de cruce (215; fx) en la frecuencia del núcleo (210).
  4. 4. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el primer algoritmo de parches (205–1), el primer algoritmo de parches (205–1) que comprende una transposición armónica basada en un vocodificador de fase única (305) que comprende un factor de extensión del ancho de banda (σ) de
    dos que controlan una transformación de una banda de frecuencia de origen (310) extraída de la banda de
    frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (310’), donde las fases de los componentes
    espectrales de la banda de frecuencia de origen (310) se multiplican por el factor de extensión del ancho de banda
    (σ) por lo que la primera banda de frecuencia objetivo (310) tiene frecuencias en el rango comprendido desde la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx), donde el primer algoritmo de parches (205–1) comprende además funcionalidades de replicación de la banda espectral por copiado no armónico (315) para
    transformar los componentes espectrales comprendidos en la primera banda de frecuencia objetivo (310’) en una segunda banda de frecuencia objetivo (320’) mediante un primer copiado, de manera tal que la segunda banda de frecuencia objetivo (320’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la
    frecuencia de cruce (fx) y para transformar además los componentes espectrales de la segunda banda de frecuencia
    objetivo (320’) en una tercera banda de frecuencia objetivo (330’) mediante un segundo copiado, por lo que la tercera banda de frecuencia objetivo (330’) tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluidas en la banda de frecuencia superior (220), donde la banda de frecuencia superior (220) comprende la primera (310’), segunda (320’) y tercera (330’) bandas de frecuencia objetivo.
  5. 5. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el segundo algoritmo de parches (205–2), segundo algoritmo de parches (205–2) que comprende una transposición armónica basada en un vocodificador de fases múltiples (405) que comprende un primer factor de extensión del ancho de
    banda (σ1) de dos que controlan una transformación de una primera banda de frecuencia (410) extraída de la banda de frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (410’), donde las fases de los componentes espectrales de la primera banda de frecuencia de origen (410) se multiplican por el primer factor de
    extensión del ancho de banda (σ1) de tal manera que la primera banda de frecuencia objetivo (410’) tiene
    frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx), donde el segundo algoritmo de parches (205–2) comprende además un segundo factor de extensión del ancho de banda (σ2) de los tres que controlan una transformación de una segunda banda de frecuencia de origen (420–1, 420–2) extraída de la banda de frecuencia del núcleo (210) en una segunda banda de frecuencia objetivo (420’, 420’’), donde las fases de los componentes espectrales de la segunda banda de frecuencia de origen (420–1, 420–2) se multiplican por el segundo factor de extensión del ancho de banda (σ2) por lo que la segunda banda de frecuencia objetivo (420’, 420’’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx) o
    en el rango de la frecuencia de cruce (fx) a tres veces la frecuencia de cruce (fx), donde el segundo algoritmo de parches (205–2) comprende además un tercer factor de extensión del ancho de banda (σ3) de cuatro que controlan una transformación de una tercera banda de frecuencia de origen (430–1, 430–2) extraída de la banda de frecuencia del núcleo (210) en una tercera banda de frecuencia objetivo (430’, 430’’), donde las fases de los componentes espectrales de la tercera banda de frecuencia de origen (430’, 430’’) se multiplican por el tercer factor de extensión del ancho de banda (σ3) por lo que la tercera banda de frecuencia objetivo (430’, 430’’) tiene frecuencias en el rango
    de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) o en el rango comprendido desde la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluida en la banda de frecuencia superior
    (220), donde la frecuencia superior (220) comprende la primera (410’), segunda (420’, 420’’) y tercera (430’, 430’’)
    bandas de frecuencia objetivo.
  6. 6. El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el tercer algoritmo de parches (205–3), donde el tercer algoritmo de parches (205–3) comprende funcionalidades de replicación de la banda espectral por copiado no armónico (505) para transformar los componentes espectrales de una banda de frecuencia de origen (510) que es la banda de frecuencia del núcleo (210) en una primera banda de frecuencia objetivo (510’) mediante un primer copiado, de tal manera que la primera banda de frecuencia objetivo (510’) tiene frecuencias en el rango de la frecuencia de cruce (fx) al doble de la frecuencia de cruce (fx), para transformar, a su vez, los componentes espectrales de la primera banda de frecuencia objetivo (510’) en una segunda banda de frecuencia objetivo (520’) mediante un segundo copiado, por lo que la segunda banda de frecuencia objetivo (520’) tiene frecuencias en el rango del doble de la frecuencia de cruce (fx) a tres veces la
    frecuencia de cruce (fx) y para transformar además los componentes espectrales de la segunda banda de frecuencia
    objetivo (520’) en una tercera banda de frecuencia objetivo (530’) mediante un tercer copiado, por lo que la tercera banda de frecuencia objetivo (530’) tiene frecuencias en el rango de tres veces la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx) incluida en la banda de frecuencia superior (220), donde la banda de frecuencia superior (220) comprende la primera (510’), segunda (520’) y tercera (530’) bandas de frecuencia objetivo.
  7. 7.
    El aparato de acuerdo con la reivindicación 3, en el cual el generador de parches en el dominio espectral (120) está configurado para ejecutar un algoritmo de parches seleccionado entre los por lo menos dos algoritmos de parche diferentes en el dominio espectral, donde el algoritmo de parches seleccionado comprende el cuarto algoritmo de parches (205–4), cuarto algoritmo de parches (205–4) que comprende una distorsión no lineal para generar los componentes espectrales de la banda de frecuencia superior (220) que tienen frecuencias en el rango comprendido desde la frecuencia de cruce (fx) a cuatro veces la frecuencia de cruce (fx).
  8. 8.
    El aparato (700) de acuerdo con una de las reivindicaciones anteriores, donde el aparato (700) no comprende un transformador de tiempo/ frecuencia (710) para transformar una señal en el dominio del tiempo (705) derivada de la representación espectral modificada (125) al dominio espectral.
  9. 9.
    El aparato (800) de acuerdo con una de las reivindicaciones anteriores, donde el aparato (800) comprende además un segundo convertidor (810) para convertir la representación espectral modificada (125) al dominio del tiempo, donde el segundo convertidor (810) está adaptado para aplicar una síntesis que coincide con un análisis aplicado por el primer convertidor (110), donde el primer convertidor (110) está configurado para ejecutar una conversión que tiene una primera longitud de conversión (111), y donde el segundo convertidor (810) está configurado para ejecutar una conversión que tiene una segunda longitud de conversión, donde la segunda longitud de conversión depende de una característica de extensión del ancho de banda por el hecho de que se toma en cuenta la relación de la frecuencia máxima (fmax) de la banda de frecuencia superior (220) y la frecuencia de cruce (fx) de la banda de la frecuencia del núcleo (210) y la primera longitud de conversión (111).
  10. 10.
    Un aparato (900; 1000) para codificar una señal de audio (105), donde la señal de audio (105) comprende una banda de frecuencia del núcleo (210) y una banda de frecuencia superior (220), donde el aparato (900; 1000) comprende:
    un codificador del núcleo (910) para codificar la señal de audio (105) dentro de la banda de la frecuencia del núcleo (210);
    un extractor de parámetros (920) para extraer una señal de control de parches (119) de la señal de audio (105), donde la señal de control de parches (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde el algoritmo de parches seleccionado se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda y
    una calculadora de parámetros (930) para calcular un parámetro de replicación de la banda espectral (127) de la banda de frecuencia superior (220).
  11. 11.
    El aparato (1000) para codificar de acuerdo con la reivindicación 10, en el cual el extractor de parámetros (920) está configurado para determinar, de la pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, el algoritmo de parches seleccionado, donde el algoritmo de parches seleccionado se basa en una comparación de la señal de audio (105) o una señal derivada de la señal de audio (105) con una pluralidad (1005) de señales de ancho de banda extendido que han sido obtenidas mediante la ejecución de la pluralidad (117–1) de algoritmos de parche en el dominio espectral y la manipulación de una representación espectral modificada (125) de una porción de tiempo de la señal de audio (105).
  12. 12.
    Un procedimiento (100; 200; 700; 800; 1100) para generar una señal de audio de síntesis (145) utilizando una señal de control de parches (190; 1155), procedimiento (100; 200; 700; 800; 1100) que comprende:
    convertir (110; 1130) una porción de tiempo (107–1; 107–2; 1125) de una señal de audio (105; 1101) en una representación espectral (115; 1135–1);
    ejecutar (120; 1141) una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde cada algoritmo de parche genera una representación espectral modificada (125; 1149) que comprende componentes espectrales de una banda de frecuencia superior (220) derivados de los correspondientes componentes espectrales de una banda de frecuencia del núcleo (210) de la señal de audio (105; 1101), y seleccionar (120; 1141) un primer algoritmo de parches en el dominio espectral (117–2) de la pluralidad (117–1) de algoritmos de parches para una primera porción de tiempo (107–1) y un segundo algoritmo de parches en el dominio espectral (117–3) de la pluralidad (117–1) de algoritmos de parches para una segunda porción de tiempo diferente (107–2) de acuerdo con la señal de control de parches (119; 1155) para obtener la representación espectral modificada (125; 1149);
    manipular (130) la representación espectral modificada (125; 1149) o una señal derivada de la representación espectral modificada (125; 1195) de acuerdo con un parámetro de replicación de la banda espectral (127) para obtener una señal de extensión del ancho de banda (135) y
    combinar (140) la señal de audio (105; 1101) que tiene componentes espectrales en la banda de la frecuencia del núcleo (210) o una señal derivada de la señal de audio (105; 1101) con la señal de ancho de banda extendido (135) para obtener la señal de audio de síntesis (145).
  13. 13. Un procedimiento (900; 1000) para codificar una señal de audio (105), donde la señal de audio (105) comprende una banda de frecuencia del núcleo (210) y una banda de frecuencia superior (220), procedimiento (900; 1000) que comprende:
    codificar (910) la señal de audio (105) dentro de la banda de la frecuencia del núcleo (210);
    extraer (920) una señal de control de parches (119) de la señal de audio (105), donde la señal de control de parches
    (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, donde el algoritmo de parches seleccionado se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis en un decodificador de extensión de ancho de banda y
    calcular (930) un parámetro de replicación de la banda espectral (127) de la banda de frecuencia superior (220).
  14. 14. Una señal de audio codificada (935) que comprende:
    una señal de audio codificada (915) codificada dentro de una banda de frecuencia del núcleo (210);
    una señal de control de parches (119), donde la señal de control de parches (119) indica un algoritmo de parches seleccionado de una pluralidad (117–1) de algoritmos espectrales diferentes en el dominio espectral, algoritmo de parches seleccionado que se ha de ejecutar sobre una representación espectral obtenida por la conversión de una porción de tiempo de una señal de audio para generar una representación espectral modificada para generar una señal de audio de síntesis (145) en un decodificador de extensión de ancho de banda y
    un parámetro de replicación de la banda espectral (127) calculado a partir de una banda de frecuencia superior (220) de la señal de audio (105).
  15. 15. Un programa de computación que consta de un código de programa para poner en práctica el procedimiento de acuerdo con la reivindicación 12 o 13, al ejecutarse el programa de computación en una computadora.
ES10712944T 2009-04-09 2010-04-01 Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio Active ES2396686T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16806809P 2009-04-09 2009-04-09
US168068P 2009-04-09
EP09181008 2009-12-30
EP09181008A EP2239732A1 (en) 2009-04-09 2009-12-30 Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
PCT/EP2010/054434 WO2010115845A1 (en) 2009-04-09 2010-04-01 Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Publications (1)

Publication Number Publication Date
ES2396686T3 true ES2396686T3 (es) 2013-02-25

Family

ID=42123165

Family Applications (2)

Application Number Title Priority Date Filing Date
ES10712944T Active ES2396686T3 (es) 2009-04-09 2010-04-01 Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio
ES10712439T Active ES2377551T3 (es) 2009-04-02 2010-04-01 Aparato, método y programa informático para generar una representación de una señal de ancho de banda ampliado basándose en una representación de señal de entrada usando una combinación de una ampliación de ancho de banda armónica y una ampliación de ancho de banda no armónica

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES10712439T Active ES2377551T3 (es) 2009-04-02 2010-04-01 Aparato, método y programa informático para generar una representación de una señal de ancho de banda ampliado basándose en una representación de señal de entrada usando una combinación de una ampliación de ancho de banda armónica y una ampliación de ancho de banda no armónica

Country Status (21)

Country Link
US (2) US9697838B2 (es)
EP (3) EP2239732A1 (es)
JP (2) JP5227459B2 (es)
KR (2) KR101248321B1 (es)
CN (2) CN102027537B (es)
AR (3) AR076199A1 (es)
AT (1) ATE534119T1 (es)
AU (2) AU2010230129B2 (es)
BR (1) BRPI1003636B1 (es)
CA (2) CA2721629C (es)
CO (1) CO6311123A2 (es)
EG (1) EG26400A (es)
ES (2) ES2396686T3 (es)
HK (1) HK1159842A1 (es)
MX (2) MX2011002419A (es)
MY (2) MY153798A (es)
PL (2) PL2351025T3 (es)
RU (1) RU2501097C2 (es)
SG (1) SG174113A1 (es)
TW (2) TWI492222B (es)
WO (2) WO2010115845A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
PL3564954T3 (pl) * 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
EP2581905B1 (en) * 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CA2827482C (en) * 2011-02-18 2018-01-02 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
AU2012276367B2 (en) * 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
KR101816506B1 (ko) 2012-02-23 2018-01-09 돌비 인터네셔널 에이비 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들
EP2682941A1 (de) 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
MY172752A (en) * 2013-01-29 2019-12-11 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
AU2014211479B2 (en) 2013-01-29 2017-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
JP6305694B2 (ja) 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
KR102306537B1 (ko) 2014-12-04 2021-09-29 삼성전자주식회사 소리 신호를 처리하는 방법 및 디바이스.
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
CN109036457B (zh) 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
TWI742486B (zh) * 2019-12-16 2021-10-11 宏正自動科技股份有限公司 輔助歌唱系統、輔助歌唱方法及其非暫態電腦可讀取記錄媒體
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
JP2002082685A (ja) 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
CN100395817C (zh) 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US20040138876A1 (en) 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
KR101220621B1 (ko) 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
JP2006243041A (ja) 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP1970900A1 (en) 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
CN101276587B (zh) * 2007-03-27 2012-02-01 北京天籁传音数字技术有限公司 声音编码装置及其方法和声音解码装置及其方法
DK3591650T3 (da) * 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
JP5098569B2 (ja) 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
EP2212884B1 (en) 2007-11-06 2013-01-02 Nokia Corporation An encoder
CN101896968A (zh) 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
RU2491658C2 (ru) 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
EP2211339B1 (en) 2009-01-23 2017-05-31 Oticon A/s Listening system
US8781844B2 (en) 2009-09-25 2014-07-15 Nokia Corporation Audio coding
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混

Also Published As

Publication number Publication date
TWI416507B (zh) 2013-11-21
KR101248321B1 (ko) 2013-03-27
JP2011520146A (ja) 2011-07-14
BR122021012290A2 (pt) 2023-01-03
CA2734973A1 (en) 2010-10-14
JP2012504781A (ja) 2012-02-23
US20130090934A1 (en) 2013-04-11
CN102027537A (zh) 2011-04-20
KR20110081292A (ko) 2011-07-13
TW201044378A (en) 2010-12-16
MY153798A (en) 2015-03-31
BR122021012125A2 (pt) 2023-01-03
PL2269189T3 (pl) 2012-04-30
BR122021012115A2 (pt) 2023-01-03
BRPI1001239A2 (pt) 2022-11-22
EP2351025B1 (en) 2012-11-14
KR20110005865A (ko) 2011-01-19
WO2010115845A1 (en) 2010-10-14
TW201044379A (en) 2010-12-16
ATE534119T1 (de) 2011-12-15
BR122021012145A2 (pt) 2023-01-03
AR097531A2 (es) 2016-03-23
MX2011002419A (es) 2011-04-05
KR101207120B1 (ko) 2012-12-03
BR122021012137A2 (pt) 2023-01-03
EP2239732A1 (en) 2010-10-13
AU2010230129A1 (en) 2010-10-07
EG26400A (en) 2013-10-09
AU2010230129B2 (en) 2011-09-29
ES2377551T3 (es) 2012-03-28
CA2721629A1 (en) 2010-10-07
AU2010233858A1 (en) 2010-10-14
BRPI1003636A2 (pt) 2019-07-02
CO6311123A2 (es) 2011-08-22
US9076433B2 (en) 2015-07-07
CA2721629C (en) 2015-10-13
SG174113A1 (en) 2011-10-28
AU2010233858B9 (en) 2013-05-30
CA2734973C (en) 2016-10-18
HK1159842A1 (en) 2012-08-03
MY151346A (en) 2014-05-15
EP2269189A1 (en) 2011-01-05
MX2010012343A (es) 2011-02-23
CN102027537B (zh) 2012-10-03
EP2351025A1 (en) 2011-08-03
JP5227459B2 (ja) 2013-07-03
AU2010233858B2 (en) 2013-05-16
BRPI1003636B1 (pt) 2020-11-24
RU2011109670A (ru) 2012-09-27
RU2501097C2 (ru) 2013-12-10
EP2269189B1 (en) 2011-11-16
AR076199A1 (es) 2011-05-26
US9697838B2 (en) 2017-07-04
WO2010112587A1 (en) 2010-10-07
PL2351025T3 (pl) 2013-04-30
JP5165106B2 (ja) 2013-03-21
CN102177545B (zh) 2013-03-27
TWI492222B (zh) 2015-07-11
US20120010880A1 (en) 2012-01-12
CN102177545A (zh) 2011-09-07
AR076237A1 (es) 2011-05-26

Similar Documents

Publication Publication Date Title
ES2396686T3 (es) Aparato y procedimiento para generar una señal de audio de síntesis y para codificar una sañal de audio
US8386268B2 (en) Apparatus and method for generating a synthesis audio signal using a patching control signal
CA2766573C (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
TWI546800B (zh) 從頻寬有限音訊中產生頻寬擴展訊號之裝置、方法及電腦程式
AU2013207549B2 (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
BR122021012115B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012125B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012290B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012145B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012137B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica