ES2683647T3 - Descodificación de audio con pos-filtración selectiva - Google Patents

Descodificación de audio con pos-filtración selectiva Download PDF

Info

Publication number
ES2683647T3
ES2683647T3 ES16166356.2T ES16166356T ES2683647T3 ES 2683647 T3 ES2683647 T3 ES 2683647T3 ES 16166356 T ES16166356 T ES 16166356T ES 2683647 T3 ES2683647 T3 ES 2683647T3
Authority
ES
Spain
Prior art keywords
post
filtering
signal
filter
filtering stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16166356.2T
Other languages
English (en)
Inventor
Barbara Resch
Kristofer Kjoerling
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44504387&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2683647(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2683647T3 publication Critical patent/ES2683647T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L19/00Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Lubrication Details And Ventilation Of Internal Combustion Engines (AREA)
  • Fats And Perfumes (AREA)
  • Filters For Electric Vacuum Cleaners (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Un método de descodificación de una señal de flujo de bits como una señal de tiempo de audio, en donde el método incluye las etapas de: decodificar una señal de tren de bits como una señal de tiempo de audio preliminar según un modo de codificación seleccionado de una pluralidad de modos de codificación, en donde la pluralidad de modos de codificación incluye al menos un primer modo de codificación que incluye una etapa de pos-filtrado y al menos un segundo modo de codificación que no incluye la etapa de pos-filtrado, en donde la etapa de pos-filtrado aplica un filtro de realce tonal a la señal de tiempo de audio preliminar, obteniendo así una señal de tiempo de audio, en donde la etapa de pos-filtrado se omite de forma selectiva en respuesta a la información de pos-filtrado codificada en la señal de tren de bits, siendo la información de pos-filtrado indicativa de una decisión del lado de codificador respecto de si se omite o no la etapa de pos-filtrado, mediante lo cual la etapa de pos-filtrado se omite de forma selectiva en el primer modo de codificación, y en donde la etapa de pos-filtrado además incluye atenuar ruidos ubicados en valles espectrales.

Description

5
10
15
20
25
30
35
40
45
50
DESCRIPCION
Descodificacion de audio con pos-filtracion selectiva Campo tecnico
La presente invencion se refiere, en general, a la codificacion de audio digital y, mas precisamente, a tecnicas de codificacion para senales de audio que contienen componentes de distintos caracteres.
Antecedentes
Una extendida clase de metodos de codificacion para senales de audio que contienen habla o canto incluye la prediccion lineal excitada por codigo (CELP) aplicada en la alternacion en el tiempo con distintos metodos de codificacion, que incluyen metodos de codificacion del dominio de la frecuencia, especialmente adaptados para la musica, o metodos de naturaleza general, para admitir variaciones en el caracter entre sucesivos periodos de tiempo de la senal de audio. Por ejemplo, un descodificador simplificado de Codificacion Unificada de Habla y Audio (USAC; vease la norma ISO / IEC 23003-3) del Grupo de Expertos en Imagenes en Movimiento (MPEG) es operable en al menos tres modalidades de descodificacion, la Codificacion Avanzada de Audio (AAC; vease la norma ISO / IEC 13818-7), la CELP algebraica (ACELP) y la excitacion codificada por transformacion (TCX), segun se muestra en la parte superior de la figura 2 adjunta.
Las diversas realizaciones de la CELP estan adaptadas a las propiedades de los organos humanos del habla y, posiblemente, al sentido humano del ofdo. Segun se usa en esta solicitud, la CELP se referira a todas las posibles realizaciones y variantes, incluyendo, pero sin limitarse a, la ACELP, la CELP de banda ancha y estrecha, la SB- CELP (CELP de sub-banda), la CELP de baja y alta velocidad, la RCELP (CELP relajada), la LD-CELP (CELP de bajo retardo), la CS-CELP (CELP de estructura conjugada), la CS-ACELP (ACELP de estructura conjugada), la PSI- CELP (CELP de innovacion sincronica en tono) y la VSELP (prediccion lineal excitada por suma vectorial). Los principios de la CELP son expuestos por R. Schroeder y S. Atal en los Anales de la Conferencia Internacional del IEEE sobre Acustica, Habla y Procesamiento de Senales (ICASSP), vol. 10, pags. 937 a 940, 1985, y algunas de sus aplicaciones estan descritas en las referencias 25 a 29 citadas en la publicacion de Chen y Gersho en las Transacciones del IEEE sobre Habla y Procesamiento de Audio, vol. 3, n° 1, de 1995. Segun lo adicionalmente detallado en el artfculo anterior, un descodificador de CELP (o, analogamente, un sintetizador de habla de CELP) puede incluir un predictor de tono, que restaura el componente periodico de una senal de habla codificada, y un libro de codigos de pulsos, desde el cual se anade una secuencia de innovacion. El predictor de tono puede incluir, a su vez, un predictor de retardo largo para restaurar el tono y un predictor de retardo corto para restaurar las regiones formantes por medio de la modelacion del envolvente espectral. En este contexto, el tono se concibe, en general, como la frecuencia fundamental del componente sonoro tonal producido por las cuerdas vocales, y adicionalmente realzado por las partes resonantes del conducto vocal. Esta frecuencia, junto con sus armonicos, dominara el habla o el canto. En terminos generales, los metodos de CELP son los mas adecuados para el procesamiento del canto solo o unipersonal, para el cual la frecuencia del tono esta bien definida y es relativamente facil de determinar.
Para mejorar la calidad percibida del habla codificada por CELP, es practica comun combinarla con el pos-filtrado (o realce tonal, en otras palabras). La Patente Estadounidense N° 4.969.192 y la seccion II del artfculo de Chen y Gersho revelan propiedades deseables de tales pos-filtros, esto es, su capacidad de suprimir los componentes de ruido situados entre los armonicos del tono vocal detectado (parte a largo plazo, vease la seccion IV). Se cree que una parte importante de este ruido emana del modelado del envolvente espectral. La parte a largo plazo de un pos- filtro sencillo puede ser disenada para que tenga la siguiente funcion de transferencia:
imagen1
donde T es un periodo tonal estimado en terminos del numero de muestras y a es una ganancia del pos-filtro, segun se muestra en las figuras 1 y 2. De manera similar a un filtro peine, un filtro de ese tipo atenua las frecuencias 1/(2T), 3/(2T), 5/(2T), ..., que estan situadas a mitad de camino entre los armonicos de la frecuencia tonal y las frecuencias adyacentes. La atenuacion depende del valor de la ganancia a. Los pos-filtros levemente mas sofisticados aplican esta atenuacion solamente a las frecuencias bajas - de aquf, el termino habitualmente usado de pos-filtro bajo - donde el ruido es mas perceptible. Esto puede ser expresado aplicando en cascada la funcion de transferencia HE descrita anteriormente y un filtro Hlp de paso bajo. Asf, el valor descodificado pos-procesado de Se proporcionado por el pos-filtro estara dado, en el dominio de transformacion, por
donde
imagen2
5
10
15
20
25
30
35
40
45
50
55
imagen3
y S es la senal descodificada que es suministrada como entrada al pos-filtro. La Figura 3 muestra una realizacion de un pos-filtro con estas caractensticas, que es adicionalmente expuesto en la seccion 6.1.3 de la Especificacion Tecnica ETSI TS 126 290, version 6.3.0, edicion 6. Como sugiere esta figura, la informacion tonal esta codificada como un parametro en la senal del flujo de bits y es extrafda por un modulo de rastreo tonal, conectado comunicativamente con el filtro de prediccion a largo plazo que lleva a cabo las operaciones expresadas por Plt.
La parte a largo plazo descrita en el parrafo anterior puede ser usada sola. Alternativamente, se dispone en serie con un filtro modelador del ruido que preserva los componentes en los intervalos de frecuencia correspondientes a las regiones formantes y que atenua el ruido en otras regiones espectrales (parte a corto plazo; vease la seccion III), es decir, en los ‘valles espectrales’ de la envolvente de region formante. Como otra posible variacion, este grupo de filtros esta adicionalmente suplementado por un filtro de tipo de paso alto, para reducir un deterioro percibido, debido al declive espectral de la parte a corto plazo.
El documento M. Neuendorf (ed.): WD7 de USAC, 92esima Reunion del MPEG, Dresde, N11299 y la Solicitud Internacional publicada como WO 99/38144 A1 revelan sistemas de procesamiento de audio con la aplicacion selectiva del pos-filtrado.
Las senales de audio que contienen una mezcla de componentes de distintos ongenes - por ejemplo, tonal, no tonal, vocal, instrumental, no musical - no siempre son reproducidas por las tecnologfas disponibles de codificacion digital de manera satisfactoria. Mas precisamente, ha sido observado que las tecnologfas disponibles son deficientes en la manipulacion de tal material de audio no homogeneo, favoreciendo generalmente a uno de los componentes en perjuicio del otro. En particular, la musica que contiene canto acompanado por uno o mas instrumentos o partes corales, que ha sido codificada por metodos de la naturaleza descrita anteriormente, sera a menudo descodificada con distorsiones perceptibles que arruinan parte de la experiencia auditiva.
Resumen de la invencion
A fin de mitigar al menos algunos de los inconvenientes esbozados en la seccion anterior, se proveen un metodo para decodificar, un producto de programa de ordenador y un sistema decodificador segun la invencion en las reivindicaciones 1, 5, y 6, respectivamente. Las reivindicaciones dependientes 2 a 4 definen realizaciones adicionales.
Los inventores han percibido que algunas distorsiones percibidas en las senales de audio descodificadas de origen no homogeneo provienen de una conmutacion inadecuada entre varias modalidades de codificacion, de las cuales al menos una incluye el pos-filtrado en el descodificador y al menos una no lo hace. Mas precisamente, los pos-filtros disponibles eliminan no solamente el ruido inter-armonico (y, donde corresponda, el ruido en los valles espectrales), sino tambien los componentes de senales que representan acompanamiento instrumental o vocal, y otro material de naturaleza ‘deseable’. El hecho de que la diferencia apenas perceptible en los valles espectrales puede ser tan grande como de 10 dB (segun lo observado por Ghitza y Goldstein, Trans. del IEEE sobre Acustica, Habla y Procesamiento de Senales, vol. ASSP-4, pags. 697 a 708, de 1986) puede haber sido tomado como justificacion por muchos disenadores para filtrar con severidad estas bandas de frecuencia. La degradacion de la calidad por la misma atenuacion inter-armonica (y de valle espectral) puede, sin embargo, ser menos importante que la de las ocasiones de conmutacion. Cuando el pos-filtro esta activado, el fondo de una voz cantante suena repentinamente atenuado y, cuando el filtro es desactivado, el fondo se hace instantaneamente mas sonoro. Si la conmutacion tiene lugar frecuentemente, debido a la naturaleza de la senal de audio o a la configuracion del dispositivo de codificacion, habra una distorsion de conmutacion. Como ejemplo, un descodificador de USAC puede ser operable tanto en una modalidad de ACELP combinada con el pos-filtrado como en una modalidad de tCx sin pos-filtrado. La modalidad de ACELP se usa en episodios donde esta presente un componente vocal dominante. De tal modo, la conmutacion a la modalidad de ACELP puede ser activada por el inicio del canto, tal como al principio de una nueva frase musical, al comienzo de un nuevo verso, o simplemente despues de un episodio donde se considera que el acompanamiento sofoca la voz cantante, en el sentido de que el componente vocal ya no es prominente. Los experimentos han confirmado que una solucion alternativa, o mas bien una elusion del problema, por la cual se usa la codificacion TCX en toda su extension (y la modalidad ACELP es inhabilitada), no remedia el problema, ya que aparecen distorsiones como de reverberacion.
En consecuencia, en un primer y un segundo aspecto, se proporciona un metodo de codificacion de audio (y un sistema de codificacion de audio con las caractensticas correspondientes) caracterizado por la toma de una decision en cuanto a si el dispositivo que descodificara el flujo de bits, que es emitido por el metodo de codificacion, debena o no aplicar el pos-filtrado, incluyendo la atenuacion del ruido inter-armonico. El resultado de la decision es codificado en el flujo de bits y es accesible para el dispositivo de descodificacion.
Por parte de la invencion, la decision en cuanto a usar o no el pos-filtro se toma por separado de la decision en cuanto a la modalidad de codificacion mas adecuada. Esto posibilita mantener un estado de pos-filtrado en toda la
5
10
15
20
25
30
35
40
45
50
extension de un periodo de longitud tal que la conmutacion no moleste al oyente. De tal modo, el metodo de codificacion puede prescribir que el pos-filtro se mantendra inactivo incluso aunque conmute a una modalidad de codificacion donde el filtro este convencionalmente activo.
Se hace notar que la decision en cuanto a aplicar o no el pos-filtrado se toma normalmente trama a trama. De tal modo, en primer lugar, el pos-filtrado no es aplicado para menos de una trama a la vez. En segundo lugar, la decision en cuanto a inhabilitar o no el pos-filtrado es solamente valida durante una trama actual, y puede ser mantenida, o bien re-evaluada, para la trama subsiguiente. En un formato de codificacion que habilite un formato de trama principal y un formato reducido, que es una fraccion del formato normal, por ejemplo, 1/8 de su longitud, puede no ser necesario tomar decisiones de pos-filtrado para tramas reducidas individuales. En cambio, puede ser considerado un cierto numero de tramas reducidas que se acumulan hasta formar una trama normal, y los parametros relevantes para la decision de filtrado pueden ser obtenidos calculando la media o la mediana de las tramas reducidas comprendidas en la misma.
Un metodo de descodificacion de acuerdo a la invencion esta bien adaptado para la codificacion de senales de audio de origen mixto, en virtud de su capacidad de desactivar el pos-filtro segun la informacion de pos-filtrado solamente y, por tanto, independientemente de factores tales como la modalidad actual de codificacion. Cuando se aplica a tecnicas de codificacion en las cuales la actividad de pos-filtro esta convencionalmente asociada a modalidades especificas de codificacion, la capacidad de inhabilitacion del pos-filtrado habilita una nueva modalidad operativa, a saber, la aplicacion no filtrada de una modalidad de descodificacion convencionalmente filtrada.
Se hace notar que los metodos y aparatos revelados en esta seccion pueden ser aplicados, despues de modificaciones adecuadas dentro de las capacidades del experto, que incluyen la experimentacion rutinaria, a la codificacion de senales con varios componentes, posiblemente correspondientes a distintos canales, tales como canales estereo. A lo largo de la presente solicitud, el realce tonal y el pos-filtrado son usados como sinonimos. Se hace notar ademas que la AAC esta expuesta como un ejemplo representativo de metodos de codificacion del dominio de la frecuencia. En efecto, la aplicacion de la invencion a un descodificador o codificador operable en una modalidad de codificacion del dominio de frecuencia, distinta a la AAC, solamente requerira pequenas modificaciones, si acaso, dentro de las capacidades del experto. De manera similar, TCX se menciona como un ejemplo de codificacion por transformacion de prediccion lineal ponderada y de codificacion por transformacion en general.
Las caracteristicas de dos o mas realizaciones descritas anteriormente en la presente memoria pueden ser combinadas, a menos que sean claramente complementarias, en realizaciones adicionales. El hecho de que dos caracteristicas sean mencionadas en distintas reivindicaciones no excluye que puedan ser combinadas con ventaja. Analogamente, tambien pueden ser proporcionadas realizaciones adicionales por la omision de ciertas caracteristicas que no sean necesarias o no sean esenciales para el proposito deseado.
Breve descripcion de los dibujos
A continuacion se describiran ejemplos utiles para comprender la presente invencion en referencia a los dibujos adjuntos, en los que:
la figura 1 es un diagrama de bloques que muestra un descodificador convencional con pos-filtro;
la figura 2 es un diagrama de bloques esquematico de un descodificador convencional operable en modalidad de AAC, ACELP y TCX, y que incluye un pos-filtro permanentemente conectado aguas abajo del modulo de ACELP;
la figura 3 es un diagrama de bloques que ilustra la estructura de un pos-filtro;
las figuras 4 y 5 son diagramas de bloques de dos descodificadores;
las figuras 6 y 7 son diagramas de bloques que ilustran diferencias entre un descodificador convencional (figura 6) y un descodificador (figura 7) utiles para comprender la invencion;
la figura 8 es un diagrama de bloques de un codificador;
las figuras 9 y 10 son unos diagramas de bloque que ilustran diferencias entre un decodificador convencional (figura 9) y un decodificador (figura 10) util para comprender la invencion; y
la figura 11 es un diagrama de bloques de un pos-filtro autonomo que puede ser activado y desactivado selectivamente.
Descripcion detallada de realizaciones
La figura 4 es un dibujo esquematico de un sistema descodificador 400, que tiene como su entrada una senal de flujo de bits y como su salida una senal de audio. Como en los descodificadores convencionales mostrados en la figura 1, un pos-filtro 440 esta dispuesto aguas abajo de un modulo descodificador 410, pero puede ser incorporado a, o apartado de, el trayecto de descodificacion, operando un conmutador 442. El pos-filtro esta habilitado en la
4
5
10
15
20
25
30
35
40
45
50
55
60
posicion de conmutacion mostrada en la figura. Seria inhabilitado si el conmutador se fijara en la posicion opuesta, por lo cual la senal del modulo descodificador 410, en cambio, seria conducida por la linea 444 de omision. El conmutador 442 es controlable por la informacion de pos-filtrado contenida en la senal del flujo de bits, de modo que el pos-filtrado pueda ser aplicado y eliminado, independientemente del estado actual del modulo descodificador 410. Debido a que un pos-filtro 440 funciona con algun retardo - por ejemplo, el pos-filtro mostrado en la figura 3 introducira un retardo equivalente al menos al periodo tonal T - un modulo 443 de retardo de compensacion esta dispuesto en la linea 444 de omision para mantener los modulos en una condicion sincronizada en la conmutacion. El modulo 443 de retardo retarda la senal en el mismo periodo que lo haria el pos-filtro 440, pero no procesa de otro modo la senal. Para minimizar el tiempo de traspaso, el modulo 443 de retardo de compensacion recibe la misma senal que el pos-filtro 440 en todo momento. En una realizacion alternativa, donde el pos-filtro 440 es reemplazado por un pos-filtro de retardo cero (por ejemplo, un filtro causal, tal como un filtro con dos tomas, independiente de futuros valores de senal), el modulo 443 de retardo de compensacion puede ser omitido.
La figura 5 ilustra un desarrollo adicional util para comprender la invencion del sistema descodificador 500 de triple modalidad de la figura 2. Un modulo descodificador 511 de ACELP esta dispuesto en paralelo con un modulo descodificador 512 de TCX y un modulo descodificador 513 de AAC. En serie con el modulo descodificador 511 de ACELP esta dispuesto un pos-filtro 540 para atenuar el ruido, en particular, el ruido situado entre armonicos de una frecuencia tonal, directamente o indirectamente obtenible de la senal del flujo de bits para el cual esta adaptado el sistema descodificador 500. La senal del flujo de bits tambien codifica informacion de pos-filtrado que gobierna las posiciones del conmutador superior 541 operable para conmutar el pos-filtro 540 fuera del trayecto de procesamiento y reemplazarlo por un retardo 543 de compensacion como en la figura 4. Un conmutador inferior 542 se usa para conmutar entre distintas modalidades de descodificacion. Con esta estructura, la posicion del conmutador superior 541 es irrelevante cuando se usa uno de los modulos 512, 513 de TCX o AAC; por tanto, la informacion de pos-filtrado no necesariamente indica esta posicion, excepto en la modalidad de ACELP. Cualquiera que sea la modalidad de descodificacion que se esta usando actualmente, la senal es suministrada desde el punto de conexion aguas abajo del conmutador inferior 542 hasta un modulo 550 de copia de banda espectral (SBR), que emite una senal de audio. El experto se dara cuenta de que el dibujo es de naturaleza conceptual, como queda notablemente claro a partir de los conmutadores, que se muestran esquematicamente como entidades fisicas distintas con medios moviles de contacto. En una posible implementacion realista del sistema descodificador, los conmutadores, asi como los otros modulos, estaran realizados por instrucciones legibles por ordenador.
Las figuras 6 y 7 tambien son diagramas de bloques de dos sistemas descodificadores de triple modalidad, operables en una modalidad de descodificacion ACELP, TCX o del dominio de frecuencia. Con referencia a la ultima figura, una senal del flujo de bits es suministrada a un punto 701 de entrada, que esta a su vez permanentemente conectado, mediante los ramales respectivos, con los tres modulos descodificadores 711, 712, 713. El punto 701 de entrada tambien tiene un ramal conector 702 (no presente en el sistema descodificador convencional de la figura 6) con un modulo 740 de realce tonal, que actua como un pos-filtro del tipo general descrito anteriormente. Como es practica comun en la tecnica, un primer modulo 703 de ventanas de transicion esta dispuesto aguas abajo de los modulos 711, 712 de ACELP y TCX, para llevar a cabo las transiciones entre los modulos descodificadores. Un segundo modulo 704 de transicion esta dispuesto aguas abajo del modulo descodificador 713 del dominio de frecuencia y del primer modulo 703 de ventanas de transicion, para llevar a cabo la transicion entre las dos super- modalidades. Ademas, un modulo 750 de SBR esta proporcionado inmediatamente aguas arriba del punto 705 de salida. Es claro que la senal de flujo de bits es suministrada directamente (o despues del demultiplexado, segun corresponda) a los tres modulos descodificadores 711, 712, 713 y al modulo 740 de realce tonal. La informacion contenida en el flujo de bits controla que modulo de descodificacion ha de estar activo. Por parte de la invencion, sin embargo, el modulo 740 de realce tonal realiza una analoga auto-activacion que, en respuesta a informacion de pos- filtrado en el flujo de bits, puede actuar como un pos-filtro o, simplemente, como un dispositivo de traspasamiento. Esto, por ejemplo, puede ser realizado mediante la provision de una seccion de control (no mostrada) en el modulo 740 de realce tonal, por medio del cual la accion de pos-filtrado puede ser activada o desactivada. El modulo 740 de realce tonal esta siempre en su modalidad de traspasamiento cuando el sistema descodificador funciona en el dominio de frecuencia o la modalidad de descodificacion TCX, en donde, en rigor, no es necesaria ninguna informacion de pos-filtrado. Se entiende que los modulos que no forman parte de la contribucion inventiva, y cuya presencia es obvia para el experto, por ejemplo, un demultiplexador, han sido omitidos de la figura 7 y de otros dibujos similares, para aumentar la claridad.
Como variacion, el sistema descodificador de la figura 7 puede estar equipado con un modulo de control (no mostrado) para decidir si ha de aplicarse o no el pos-filtrado, usando un enfoque de analisis por sintesis. Tal modulo de control esta comunicativamente conectado con el modulo 740 de realce tonal y con el modulo 711 de ACELP, desde el cual extrae una senal descodificada intermedia si_DEC(n) que representa una etapa intermedia en el proceso de descodificacion, preferiblemente, una correspondiente a la excitacion de la senal. El modulo de deteccion tiene la informacion necesaria para simular la accion del modulo 740 de realce tonal, segun lo definido por las funciones de transferencia Plt(z) y Hlp(z) (vease la seccion Antecedentes y la figura 3) o, equivalentemente, sus respuestas de impulso de filtro plt(z) y hLp(n). Como se desprende de la exposicion en la seccion Antecedentes, el componente a restar en el pos-filtrado puede ser estimado por una senal de diferencia aproximada sAD(n) que es proporcional a [(s_dec * Plt) * hLp](n), donde * indica la convolucion discreta. Esto es una aproximacion de la verdadera diferencia entre la senal de audio original y la senal descodificada pos-filtrada, a saber,
5
10
15
20
25
30
35
40
45
50
SoRiG(n) - S£(n) - SoRiG(n) - (SDEc(n) - o[sdec * Plt * hLp](n)),
donde a es la ganancia del pos-filtro. Estudiando la energfa total, la energfa de banda baja, la tonalidad, el espectro efectivo de magnitudes o los espectros de magnitudes pasadas de la senal, segun lo revelado en la seccion Resumen y las reivindicaciones, la seccion de control puede hallar una base para la decision de activar o desactivar el modulo 740 de realce tonal.
La figura 8 muestra un sistema codificador 800. El sistema codificador 800 esta adaptado para procesar senales de audio digital, que son generalmente obtenidas capturando una onda sonora por parte de un microfono, y transduciendo la onda hacia una senal electrica analogica. La senal electrica es luego muestreada en una senal digital susceptible de ser suministrada, en un formato adecuado, al sistema codificador 800. El sistema consiste, en general, en un modulo codificador 810, un modulo 820 de decision y un multiplexador 830. En virtud de los conmutadores 814, 815 (simbolicamente representados), el modulo codificador 810 es operable en una modalidad CELP, TCX o bien AAC, activando selectivamente los modulos 811, 812, 813. El modulo 820 de decision aplica uno o mas criterios predefinidos para decidir si se inhabilita o no el pos-filtrado durante la descodificacion de una senal de flujo de bits producida por el sistema codificador 800 para codificar una senal de audio. Con este fin, el modulo 820 de decision puede examinar la senal de audio directamente o puede recibir datos desde el modulo codificador 810 mediante una lfnea 816 de conexion. Una senal indicativa de la decision adoptada por el modulo 820 de decision es suministrada, junto con la senal de audio codificada proveniente del modulo codificador 810, a un multiplexador 830, que concatena las senales en un flujo de bits que constituye la salida del sistema codificador 800.
Preferiblemente, el modulo 820 de decision basa su decision sobre una senal de diferencia aproximada calculada a partir de una senal descodificada intermedia smdec, que puede ser restada del modulo codificador 810. La senal descodificada intermedia representa una etapa intermedia en el proceso de descodificacion, segun lo expuesto en los parrafos precedentes, pero puede ser extrafda desde una etapa correspondiente del proceso de codificacion. Sin embargo, en el sistema codificador 800 esta disponible la senal de audio original sorig, de modo que, ventajosamente, la senal de diferencia aproximada se forme como:
Sorig(h) - (Si_DEc(n) - a [(Si dec * Plt) * hLp](n)).
La aproximacion reside en el hecho de que la senal descodificada intermedia se usa en lugar de la senal descodificada final. Esto permite una valoracion de la naturaleza del componente que un pos-filtro eliminarfa en la descodificacion y, aplicando uno de los criterios expuestos en la seccion Resumen, el modulo 820 de decision podra adoptar una decision en cuanto a inhabilitar o no el pos-filtrado.
Como una variacion de esto, el modulo 820 de decision puede usar la senal original en lugar de una senal descodificada intermedia, de modo que la senal de diferencia aproximada sea [(sldec * plt) * hLp](n). Es probable que esto sea una aproximacion menos fiel pero, por otra parte, hace optativa la presencia de una lfnea 816 de conexion entre el modulo 820 de decision y el modulo codificador 810.
En otras variaciones de ese tipo de esta realizacion, donde el modulo 820 de decision estudia directamente la senal de audio, pueden aplicarse uno o mas de los siguientes criterios:
• ^Contiene la senal de audio tanto un componente con frecuencia fundamental dominante como un componente situado por debajo de la frecuencia fundamental? (La frecuencia fundamental puede ser suministrada como un sub- producto del modulo codificador 810).
• ^Contiene la senal de audio tanto un componente con frecuencia fundamental dominante como un componente situado entre los armonicos de la frecuencia fundamental?
• ^Contiene la senal de audio energfa significativa de senal por debajo de la frecuencia fundamental?
• ^Es (probable que sea) preferible la descodificacion pos-filtrada a la descodificacion no filtrada con respecto a la optimalidad de velocidad-distorsion?
En todas las variaciones descritas de la estructura codificadora mostrada en la figura 8 - es decir, independientemente de la base del criterio de deteccion - la seccion 820 de decision puede ser habilitada para decidir sobre un avance gradual o una elimination gradual del pos-filtrado, a fin de lograr transiciones suaves. El avance y la eliminacion graduales pueden ser controlados ajustando la ganancia de pos-filtro.
La figura 9 muestra un descodificador convencional operable en una modalidad de descodificacion de frecuencia y en una modalidad de descodificacion de CELP, segun la senal de flujo de bits suministrada al descodificador. El pos- filtrado se aplica toda vez que se selecciona la modalidad de descodificacion de CELP. Se ilustra una mejora de este decodificador en la Figura 10, que muestra un decodificador 1000 segun un ejemplo util para comprender la invention. Este descodificador es operable no solamente en una modalidad de descodificacion basada en el dominio de frecuencia, en la cual esta activo el modulo descodificador 1013 del dominio de frecuencia, y en una modalidad de descodificacion de CELP filtrada, en la cual estan activos el modulo descodificador 1011 de CELP y el pos-filtro
5
10
15
20
25
30
35
40
1040, sino tambien en una modalidad de CELP no filtrada, en la cual el modulo 1011 de CELP suministra su senal a un modulo 1043 de retardo de compensacion, mediante una lfnea 1044 de omision. Un conmutador 1042 controla que modalidad de descodificacion se usa actualmente, en respuesta a la informacion de pos-filtrado contenida en la senal del flujo de bits proporcionada al descodificador 1000. En este descodificador y en el de la figura 9, la ultima etapa de procesamiento es efectuada por un modulo 1050 de SBR, desde el cual es emitida la senal de audio final.
La figura 11 muestra un pos-filtro 1100 adecuado para ser dispuesto aguas abajo de un descodificador 1199. El filtro 1100 incluye un modulo 1140 de pos-filtrado, que es habilitado o inhabilitado por un modulo de control (no mostrado), notablemente, un controlador de ganancia binario o no binario, en respuesta a una senal de pos-filtrado recibida desde un modulo 1120 de decision dentro del pos-filtro 1100. El modulo de decision realiza una o mas pruebas sobre la senal obtenida desde el descodificador, para llegar a una decision en cuanto a si el modulo 1140 de pos-filtrado ha de estar activo o inactivo. La decision puede ser tomada segun la funcionalidad del modulo 820 de decision en la figura 8, que usa la senal original y/o una senal descodificada intermedia para predecir la accion del pos-filtro. La decision del modulo 1120 de decision tambien puede basarse en informacion similar a la que los modulos de decision usan en esas realizaciones donde se forma una senal descodificada intermedia. Como ejemplo, el modulo 1120 de decision puede estimar una frecuencia de tono (a menos que esto sea inmediatamente extrafble desde la senal del flujo de bits) y calcular el contenido de energfa en la senal por debajo de la frecuencia de tono y entre sus armonicos. Si este contenido de energfa es significativo, probablemente representa un componente de senal relevante, en lugar de ruido, lo que motiva una decision para inhabilitar el modulo 1140 de pos-filtrado.
Una prueba de escucha de 6 personas ha sido llevada a cabo, durante la cual muestras musicales codificadas y descodificadas de acuerdo a la invencion fueron comparadas con muestras de referencia que contenfan la misma musica codificada, aplicando el pos-filtrado de la manera convencional, pero manteniendo sin cambios todos los otros parametros. Los resultados confirman una mejora percibida de la calidad.
Realizaciones adicionales de la presente invencion devendran evidentes para una persona experta en la tecnica, despues de leer la descripcion anterior. Incluso aunque la presente descripcion y los dibujos revelan realizaciones y ejemplos, la invencion no esta restringida a estos ejemplos especfficos. Pueden hacerse numerosas modificaciones y variaciones sin apartarse del alcance de la presente invencion, que esta definido por las reivindicaciones adjuntas.
Los sistemas y metodos revelados anteriormente en la presente memoria pueden ser implementados como software, firmware, hardware o una combinacion de los mismos. Ciertos componentes, o todos los componentes, pueden ser implementados como software ejecutado por un procesador de senales digitales o un micro-procesador, o ser implementados como hardware, o como un circuito integrado especffico de la aplicacion. Tal software puede ser distribuido en medios legibles por ordenador, que pueden comprender medios de almacenamiento de ordenadores (o medios no transitorios) y medios de comunicacion (o medios transitorios). Como es bien sabido para una persona experta en la tecnica, los medios de almacenamiento de ordenadores incluyen medios tanto volatiles como no volatiles, extrafbles como no extrafbles, implementados en cualquier metodo o tecnologfa para el almacenamiento de informacion, tal como instrucciones legibles por ordenador, estructuras de datos, modulos de programa u otros datos. Los medios de almacenamiento de ordenadores incluyen, pero no se limitan a, las memorias RAM, ROM, EEPROM, la memoria flash u otra tecnologfa de memoria, CD-ROM, discos versatiles digitales (DVD) u otro almacenamiento de disco optico, casetes magneticos, cinta magnetica, almacenamiento de disco magnetico u otros dispositivos de almacenamiento magnetico, o cualquier otro medio que pueda ser usado para almacenar la informacion deseada y que pueda ser objeto de acceso por parte de un ordenador. Ademas, es bien sabido para el experto que los medios de comunicacion realizan habitualmente instrucciones legibles por ordenador, estructuras de datos, modulos de programa u otros datos en una senal de datos modulados, tal como una onda portadora u otro mecanismo de transporte, e incluyen cualquier medio de suministro de informacion.

Claims (5)

  1. REIVINDICACIONES
    1. Un metodo de descodificacion de una senal de flujo de bits como una senal de tiempo de audio, en donde el metodo incluye las etapas de:
    decodificar una senal de tren de bits como una senal de tiempo de audio preliminar segun un modo de codificacion 5 seleccionado de una pluralidad de modos de codificacion, en donde la pluralidad de modos de codificacion incluye al menos un primer modo de codificacion que incluye una etapa de pos-filtrado y al menos un segundo modo de codificacion que no incluye la etapa de pos-filtrado,
    en donde la etapa de pos-filtrado aplica un filtro de realce tonal a la senal de tiempo de audio preliminar, obteniendo asi una senal de tiempo de audio,
    10 en donde la etapa de pos-filtrado se omite de forma selectiva en respuesta a la informacion de pos-filtrado codificada en la senal de tren de bits, siendo la informacion de pos-filtrado indicativa de una decision del lado de codificador respecto de si se omite o no la etapa de pos-filtrado, mediante lo cual la etapa de pos-filtrado se omite de forma selectiva en el primer modo de codificacion, y
    en donde la etapa de pos-filtrado ademas incluye atenuar ruidos ubicados en valles espectrales.
    15 2. El metodo de la reivindicacion 1, en donde el filtro de realce tonal es un pos-filtro bajo.
  2. 3. El metodo de la reivindicacion 1, en donde la etapa de descodificacion incluye aplicar descodificacion de prediccion lineal excitada por codigo, CELP.
  3. 4. El metodo de la reivindicacion 1, en donde la senal de tren de bits esta segmentada en tramas de tiempo y la etapa de pos-filtrado se omite durante una trama de tiempo completa o durante una secuencia de tramas de tiempo
    20 completa.
  4. 5. Un producto de programa de ordenador que incluye una portadora de datos que almacena instrucciones que, cuando las ejecuta un procesador de senal digital, hacen que el procesador de senal digital lleve a cabo el metodo de la reivindicacion 1, 2, 3 o 4.
  5. 6. Un sistema decodificador configurado para realizar el metodo de la reivindicacion 1,2, 3 o 4.
ES16166356.2T 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva Active ES2683647T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36123710P 2010-07-02 2010-07-02
US361237P 2010-07-02

Publications (1)

Publication Number Publication Date
ES2683647T3 true ES2683647T3 (es) 2018-09-27

Family

ID=44504387

Family Applications (6)

Application Number Title Priority Date Filing Date
ES16166357.0T Active ES2691934T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES14164773.5T Active ES2666150T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES11743032.2T Active ES2484794T3 (es) 2010-07-02 2011-06-23 Pos-filtro selectivo
ES16166358.8T Active ES2683648T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES16166356.2T Active ES2683647T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES19196423T Active ES2902392T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva

Family Applications Before (4)

Application Number Title Priority Date Filing Date
ES16166357.0T Active ES2691934T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES14164773.5T Active ES2666150T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES11743032.2T Active ES2484794T3 (es) 2010-07-02 2011-06-23 Pos-filtro selectivo
ES16166358.8T Active ES2683648T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES19196423T Active ES2902392T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva

Country Status (18)

Country Link
US (14) US9224403B2 (es)
EP (8) EP2589046B1 (es)
JP (13) JP6178236B2 (es)
KR (12) KR101696632B1 (es)
CN (7) CN105261371B (es)
AU (1) AU2011273680B2 (es)
CA (14) CA3160488C (es)
DK (2) DK3079153T3 (es)
ES (6) ES2691934T3 (es)
HK (8) HK1183965A1 (es)
HU (2) HUE038985T2 (es)
IL (10) IL302557B1 (es)
MX (1) MX2012014525A (es)
MY (4) MY176188A (es)
PL (2) PL3079153T3 (es)
RU (6) RU2562422C2 (es)
SG (7) SG10201901308TA (es)
WO (1) WO2012000882A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
CA2898575C (en) * 2013-01-29 2018-09-11 Guillaume Fuchs Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal
US9514761B2 (en) * 2013-04-05 2016-12-06 Dolby International Ab Audio encoder and decoder for interleaved waveform coding
EP3011764B1 (en) 2013-06-18 2018-11-21 Dolby Laboratories Licensing Corporation Bass management for audio rendering
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN105957534B (zh) * 2016-06-28 2019-05-03 百度在线网络技术(北京)有限公司 自适应滤波方法和自适应滤波器
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10475456B1 (en) * 2018-06-04 2019-11-12 Qualcomm Incorporated Smart coding mode switching in audio rate adaptation
CN115428069A (zh) 2020-04-24 2022-12-02 瑞典爱立信有限公司 低音后置滤波器的低成本适配

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5434947A (en) * 1993-02-23 1995-07-18 Motorola Method for generating a spectral noise weighting filter for use in a speech coder
JPH06250697A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置
CA2094780A1 (en) 1993-04-23 1994-10-24 Claude Laflamme Transform coded excitation for speech and audio coding
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
CA2121667A1 (en) 1994-04-19 1995-10-20 Jean-Pierre Adoul Differential-transform-coded excitation for speech and audio coding
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5664055A (en) 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JPH0946268A (ja) 1995-07-26 1997-02-14 Toshiba Corp ディジタル音声通信装置
JPH0950298A (ja) * 1995-08-07 1997-02-18 Mitsubishi Electric Corp 音声符号化装置及び音声復号化装置
JP3483998B2 (ja) * 1995-09-14 2004-01-06 株式会社東芝 ピッチ強調方法および装置
US5864798A (en) 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
TW321810B (es) 1995-10-26 1997-12-01 Sony Co Ltd
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
EP0954851A1 (en) 1996-02-26 1999-11-10 AT&T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
JP2940464B2 (ja) * 1996-03-27 1999-08-25 日本電気株式会社 音声復号化装置
US5802109A (en) 1996-03-28 1998-09-01 Nec Corporation Speech encoding communication system
JPH09319397A (ja) * 1996-05-28 1997-12-12 Sony Corp ディジタル信号処理装置
JP3183826B2 (ja) * 1996-06-06 2001-07-09 三菱電機株式会社 音声符号化装置及び音声復号化装置
EP0814458B1 (en) * 1996-06-19 2004-09-22 Texas Instruments Incorporated Improvements in or relating to speech coding
JP2974059B2 (ja) * 1996-07-18 1999-11-08 日本電気株式会社 ピッチポストフィルタ装置
JPH10143195A (ja) * 1996-11-14 1998-05-29 Olympus Optical Co Ltd ポストフィルタ
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
JPH113099A (ja) * 1997-04-16 1999-01-06 Mitsubishi Electric Corp 音声符号化復号化システム、音声符号化装置及び音声復号化装置
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6114859A (en) 1997-07-14 2000-09-05 Nissin Electric Co., Ltd. Harmonic characteristic measuring method and harmonic characteristic measuring apparatus
US6385195B2 (en) 1997-07-21 2002-05-07 Telefonaktiebolaget L M Ericsson (Publ) Enhanced interworking function for interfacing digital cellular voice and fax protocols and internet protocols
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
JP3986150B2 (ja) 1998-01-27 2007-10-03 興和株式会社 一次元データへの電子透かし
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
JP3554566B2 (ja) 1998-05-27 2004-08-18 株式会社エヌ・ティ・ティ・ドコモ 音声復号器および音声復号方法
US6098036A (en) * 1998-07-13 2000-08-01 Lockheed Martin Corp. Speech coding system and method including spectral formant enhancer
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
JP2000206999A (ja) * 1999-01-19 2000-07-28 Nec Corp 音声符号伝送装置
DE60035453T2 (de) * 1999-05-11 2008-03-20 Nippon Telegraph And Telephone Corp. Auswahl des Synthesefilters für eine CELP Kodierung von breitbandigen Audiosignalen
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US7222070B1 (en) 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
JP3559485B2 (ja) 1999-11-22 2004-09-02 日本電信電話株式会社 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
US20020016161A1 (en) * 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
JP2001249700A (ja) * 2000-03-06 2001-09-14 Oki Electric Ind Co Ltd 音声符号化装置及び音声復号装置
DE60128677T2 (de) * 2000-04-24 2008-03-06 Qualcomm, Inc., San Diego Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP2002149200A (ja) 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7110942B2 (en) 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7353168B2 (en) * 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
AU2002348895A1 (en) 2001-11-30 2003-06-10 Koninklijke Philips Electronics N.V. Signal coding
JP3733588B2 (ja) * 2001-12-13 2006-01-11 日本電気株式会社 音声復号化装置、及び、音声復号化方法
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN1288557C (zh) * 2003-06-25 2006-12-06 英业达股份有限公司 多执行线程同时停止的方法
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CN1212608C (zh) * 2003-09-12 2005-07-27 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
US7478040B2 (en) 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
US20060116874A1 (en) * 2003-10-24 2006-06-01 Jonas Samuelsson Noise-dependent postfiltering
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
MXPA06012617A (es) 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
AU2004319555A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding models
US7739120B2 (en) 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
US7596486B2 (en) 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US20060047522A1 (en) 2004-08-26 2006-03-02 Nokia Corporation Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR100640468B1 (ko) * 2005-01-25 2006-10-31 삼성전자주식회사 디지털 통신 시스템에서 음성 패킷의 전송과 처리 장치 및방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2006091139A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
AU2006232364B2 (en) 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
BRPI0611430A2 (pt) * 2005-05-11 2010-11-23 Matsushita Electric Ind Co Ltd codificador, decodificador e seus métodos
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
JP5461835B2 (ja) 2005-05-26 2014-04-02 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
KR100718132B1 (ko) 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
RU2473062C2 (ru) 2005-08-30 2013-01-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
TW200737738A (en) * 2006-01-18 2007-10-01 Lg Electronics Inc Apparatus and method for encoding and decoding signal
CA2636494C (en) 2006-01-19 2014-02-18 Lg Electronics Inc. Method and apparatus for processing a media signal
KR20070077652A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
JP5394754B2 (ja) 2006-02-23 2014-01-22 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US7454335B2 (en) 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
DE602007013026D1 (de) 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
DE602006002739D1 (de) 2006-06-30 2008-10-23 Fraunhofer Ges Forschung Audiokodierer, Audiodekodierer und Audioprozessor mit einer dynamisch variablen Warp-Charakteristik
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
CN101145343B (zh) 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN100483509C (zh) 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
RU2444071C2 (ru) 2006-12-12 2012-02-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области
EP2099026A4 (en) 2006-12-13 2011-02-23 Panasonic Corp POST-FILTER AND FILTERING METHOD
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
EP1944761A1 (en) 2007-01-15 2008-07-16 Siemens Networks GmbH & Co. KG Disturbance reduction in digital signal processing
CN101231850B (zh) 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
CN101256771A (zh) 2007-03-02 2008-09-03 北京工业大学 嵌入式编码、解码方法、编码器、解码器及***
EP2116997A4 (en) * 2007-03-02 2011-11-23 Panasonic Corp AUDIO DECODING DEVICE AND AUDIO DECODING METHOD
KR101414359B1 (ko) 2007-03-02 2014-07-22 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치 및 부호화 방법
ATE548728T1 (de) * 2007-03-02 2012-03-15 Ericsson Telefon Ab L M Nichtkausales nachfilter
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
ES2533626T3 (es) * 2007-03-02 2015-04-13 Telefonaktiebolaget L M Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
JP5377287B2 (ja) * 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
DE102007025401B4 (de) 2007-05-31 2015-10-01 Siemens Aktiengesellschaft Verfahren zur Auswertung eines Tomographie-Datensatzes und Tomographie-Arbeitsstation
CN101321033B (zh) 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及***
RU2439721C2 (ru) 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
EP2015293A1 (en) 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
KR101531910B1 (ko) 2007-07-02 2015-06-29 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8571856B2 (en) * 2007-07-06 2013-10-29 France Telecom Limitation of distortion introduced by a post-processing step during digital signal decoding
ATE448649T1 (de) 2007-08-13 2009-11-15 Harman Becker Automotive Sys Rauschverringerung mittels kombination aus strahlformung und nachfilterung
WO2009022193A2 (en) 2007-08-15 2009-02-19 Nokia Corporation Devices, methods and computer program products for audio signal coding and decoding
CN101383151B (zh) * 2007-09-06 2011-07-13 中兴通讯股份有限公司 一种数字音频质量增强***和方法
KR101505831B1 (ko) 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
US8762141B2 (en) 2008-02-15 2014-06-24 Nokia Corporation Reduced-complexity vector indexing and de-indexing
KR101452722B1 (ko) 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
CN101971251B (zh) 2008-03-14 2012-08-08 杜比实验室特许公司 像言语的信号和不像言语的信号的多模式编解码方法及装置
US8296135B2 (en) 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
KR20090122143A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN101609684B (zh) * 2008-06-19 2012-06-06 展讯通信(上海)有限公司 解码语音信号的后处理滤波器
CA2729752C (en) * 2008-07-10 2018-06-05 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
CA2730355C (en) 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
MX2011003824A (es) 2008-10-08 2011-05-02 Fraunhofer Ges Forschung Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple.
RU2400832C2 (ru) 2008-11-24 2010-09-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR101622950B1 (ko) 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
WO2011026247A1 (en) 2009-09-04 2011-03-10 Svox Ag Speech enhancement techniques on the power spectrum
US8260220B2 (en) * 2009-09-28 2012-09-04 Broadcom Corporation Communication device with reduced noise speech coding
KR101411759B1 (ko) * 2009-10-20 2014-06-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법
CN102948144B (zh) * 2010-04-26 2018-09-21 太阳专利托管公司 用于从周围块的统计推断出针对帧内预测的滤波模式
WO2011142709A2 (en) 2010-05-11 2011-11-17 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for processing of audio signals
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
US11429505B2 (en) * 2018-08-03 2022-08-30 Dell Products L.P. System and method to provide optimal polling of devices for real time data

Also Published As

Publication number Publication date
KR20210107923A (ko) 2021-09-01
JP2021192121A (ja) 2021-12-16
IL243958A0 (en) 2016-04-21
CN105261372A (zh) 2016-01-20
ES2683648T3 (es) 2018-09-27
US9830923B2 (en) 2017-11-28
US20160225381A1 (en) 2016-08-04
RU2015117332A3 (es) 2018-12-10
US20130096912A1 (en) 2013-04-18
SG10201604866VA (en) 2016-08-30
US20210035592A1 (en) 2021-02-04
HK1183965A1 (en) 2014-01-10
EP3422346A1 (en) 2019-01-02
EP3079154B1 (en) 2018-06-06
KR101449979B1 (ko) 2014-10-14
JP2023134779A (ja) 2023-09-27
CA2801805C (en) 2018-01-02
CA3025108C (en) 2020-10-27
RU2616774C1 (ru) 2017-04-18
CA3025108A1 (en) 2012-01-05
KR20210040184A (ko) 2021-04-12
US10811024B2 (en) 2020-10-20
JP7319441B2 (ja) 2023-08-01
DK3079152T3 (en) 2018-08-13
US20220157327A1 (en) 2022-05-19
CA2976485A1 (en) 2012-01-05
CA3207181A1 (en) 2012-01-05
IL286405B2 (en) 2023-02-01
MY183707A (en) 2021-03-09
KR20220053032A (ko) 2022-04-28
HK1218462A1 (zh) 2017-02-17
CA3239015A1 (en) 2012-01-05
KR20160081986A (ko) 2016-07-08
CA2937672C (en) 2017-05-02
IL265661A (en) 2019-05-30
JP2021060601A (ja) 2021-04-15
KR102492622B1 (ko) 2023-01-30
US20160225384A1 (en) 2016-08-04
US9558754B2 (en) 2017-01-31
KR20230018539A (ko) 2023-02-07
CA2801805A1 (en) 2012-01-05
ES2691934T3 (es) 2018-11-29
JP6178236B2 (ja) 2017-08-09
JP2015158689A (ja) 2015-09-03
HK1218987A1 (zh) 2017-03-17
SG10201605650WA (en) 2016-08-30
EP3079152A1 (en) 2016-10-12
US10236010B2 (en) 2019-03-19
EP3422346B1 (en) 2020-04-22
IL286405B (en) 2022-10-01
CA3124114A1 (en) 2012-01-05
CN105244035B (zh) 2019-03-12
ES2902392T3 (es) 2022-03-28
JP2018045252A (ja) 2018-03-22
SG10201604880YA (en) 2016-08-30
CA2958360A1 (en) 2012-01-05
JP2017037328A (ja) 2017-02-16
EP3971893A1 (en) 2022-03-23
KR102388001B1 (ko) 2022-04-19
RU2707716C1 (ru) 2019-11-28
IL302557B1 (en) 2024-04-01
AU2011273680B2 (en) 2014-10-16
CA2929090A1 (en) 2012-01-05
JP6812585B2 (ja) 2021-01-13
JP2020109529A (ja) 2020-07-16
US11610595B2 (en) 2023-03-21
JP6556815B2 (ja) 2019-08-07
KR102296955B1 (ko) 2021-09-01
RU2019135620A (ru) 2021-05-06
MX2012014525A (es) 2013-08-27
KR20130019004A (ko) 2013-02-25
ES2666150T3 (es) 2018-05-03
MY176188A (en) 2020-07-24
EP2589046B1 (en) 2014-05-28
CN105390140B (zh) 2019-05-17
JP6279686B2 (ja) 2018-02-14
SG10201901308TA (en) 2019-03-28
CA2937672A1 (en) 2012-01-05
SG10201503004WA (en) 2015-06-29
CN103098129B (zh) 2015-11-25
CA2958360C (en) 2017-11-14
EP2757560A1 (en) 2014-07-23
CN105355209B (zh) 2020-02-14
RU2642553C2 (ru) 2018-01-25
HUE038985T2 (hu) 2018-12-28
IL243958A (en) 2016-11-30
RU2692416C2 (ru) 2019-06-24
CA3093517C (en) 2021-08-24
US9396736B2 (en) 2016-07-19
DK3079153T3 (en) 2018-11-05
EP3079154A1 (en) 2016-10-12
RU2016117277A (ru) 2017-11-13
CN105261371B (zh) 2019-12-03
JP2013533983A (ja) 2013-08-29
JP6258257B2 (ja) 2018-01-10
IL302557A (en) 2023-07-01
US9558753B2 (en) 2017-01-31
US9552824B2 (en) 2017-01-24
CA3093517A1 (en) 2012-01-05
CA2976490C (en) 2019-01-08
CA3160488A1 (en) 2012-01-05
CN105244035A (zh) 2016-01-13
CA2928180A1 (en) 2012-01-05
IL245591A0 (en) 2016-06-30
PL3079153T3 (pl) 2018-12-31
JP6682683B2 (ja) 2020-04-15
US20160240209A1 (en) 2016-08-18
US9858940B2 (en) 2018-01-02
US20160093312A1 (en) 2016-03-31
SG10202005270YA (en) 2020-07-29
CN105261370B (zh) 2018-12-04
KR101972762B1 (ko) 2019-04-29
MY176192A (en) 2020-07-24
US20230282222A1 (en) 2023-09-07
JP2016194711A (ja) 2016-11-17
US11996111B2 (en) 2024-05-28
HK1219168A1 (zh) 2017-03-24
SG186209A1 (en) 2013-01-30
ES2484794T3 (es) 2014-08-12
WO2012000882A1 (en) 2012-01-05
HK1220036A1 (zh) 2017-04-21
IL245591A (en) 2016-12-29
CN105390140A (zh) 2016-03-09
KR102079000B1 (ko) 2020-02-19
CN105261370A (zh) 2016-01-20
JP6944038B2 (ja) 2021-10-06
EP3079152B1 (en) 2018-06-06
CA2958350C (en) 2017-11-14
KR20190044692A (ko) 2019-04-30
CA2958350A1 (en) 2012-01-05
US20190214035A1 (en) 2019-07-11
EP2757560B1 (en) 2018-02-21
US11183200B2 (en) 2021-11-23
US9595270B2 (en) 2017-03-14
CA2976490A1 (en) 2012-01-05
JP7073565B2 (ja) 2022-05-23
EP3605534B1 (en) 2021-10-20
IL311020A (en) 2024-04-01
HK1221326A1 (zh) 2017-05-26
JP2019204102A (ja) 2019-11-28
HUE039862T2 (hu) 2019-02-28
HK1199135A1 (en) 2015-06-19
IL223319A0 (en) 2013-02-03
CA2928180C (en) 2017-03-28
US20180047405A1 (en) 2018-02-15
CN105261372B (zh) 2021-07-16
US20160210980A1 (en) 2016-07-21
KR20160075869A (ko) 2016-06-29
US20160086616A1 (en) 2016-03-24
KR101730356B1 (ko) 2017-04-27
CA2976485C (en) 2018-07-24
CN105355209A (zh) 2016-02-24
RU2599338C1 (ru) 2016-10-10
IL278805B (en) 2021-10-31
RU2013102794A (ru) 2014-08-10
KR20160086426A (ko) 2016-07-19
EP3079153A1 (en) 2016-10-12
IL295473B2 (en) 2023-10-01
EP3079153B1 (en) 2018-08-01
KR20200018720A (ko) 2020-02-19
AU2011273680A1 (en) 2012-12-20
MY176187A (en) 2020-07-24
EP3971893B1 (en) 2024-06-19
US20160118057A1 (en) 2016-04-28
IL278805A (en) 2021-01-31
IL295473A (en) 2022-10-01
KR102238082B1 (ko) 2021-04-09
IL286405A (en) 2021-10-31
KR101696634B1 (ko) 2017-01-16
PL3079152T3 (pl) 2018-10-31
EP3605534A1 (en) 2020-02-05
KR101696632B1 (ko) 2017-01-16
IL295473B1 (en) 2023-06-01
JP7147090B2 (ja) 2022-10-04
JP6679433B2 (ja) 2020-04-15
CA2929090C (en) 2017-03-14
RU2015117332A (ru) 2016-11-27
IL223319A (en) 2016-04-21
CN105261371A (zh) 2016-01-20
CA3124114C (en) 2022-07-05
CA3160488C (en) 2023-09-05
CN103098129A (zh) 2013-05-08
JP2022106963A (ja) 2022-07-20
US9224403B2 (en) 2015-12-29
JP2022177215A (ja) 2022-11-30
EP2589046A1 (en) 2013-05-08
KR20190116541A (ko) 2019-10-14
KR102030335B1 (ko) 2019-10-10
US20160163326A1 (en) 2016-06-09
HK1218803A1 (zh) 2017-03-10
JP2016186652A (ja) 2016-10-27
IL246684A0 (en) 2016-08-31
RU2562422C2 (ru) 2015-09-10
KR20140056394A (ko) 2014-05-09
US9343077B2 (en) 2016-05-17

Similar Documents

Publication Publication Date Title
ES2683647T3 (es) Descodificación de audio con pos-filtración selectiva