ES2713410T3 - Método de generación de secuencia de parámetros en el dominio de la frecuencia, método de codificación, método de descodificación, aparato de generación de secuencia de parámetros en el dominio de la frecuencia, aparato de codificación, aparato de descodificación, programa y soporte de grabación - Google Patents

Método de generación de secuencia de parámetros en el dominio de la frecuencia, método de codificación, método de descodificación, aparato de generación de secuencia de parámetros en el dominio de la frecuencia, aparato de codificación, aparato de descodificación, programa y soporte de grabación Download PDF

Info

Publication number
ES2713410T3
ES2713410T3 ES15783646T ES15783646T ES2713410T3 ES 2713410 T3 ES2713410 T3 ES 2713410T3 ES 15783646 T ES15783646 T ES 15783646T ES 15783646 T ES15783646 T ES 15783646T ES 2713410 T3 ES2713410 T3 ES 2713410T3
Authority
ES
Spain
Prior art keywords
sequence
parameters
linear prediction
frequency domain
lsp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15783646T
Other languages
English (en)
Inventor
Takehiro Moriya
Yutaka Kamamoto
Noboru Harada
Hirokazu Kameoka
Ryosuke Sugiura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=54332153&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2713410(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Application granted granted Critical
Publication of ES2713410T3 publication Critical patent/ES2713410T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método de generación de secuencia de parámetros en el dominio de la frecuencia, que comprende: cuando p es un número entero igual o mayor que 1, y una secuencia de coeficientes de predicción lineal obtenida mediante análisis de predicción lineal de señales de audio en un segmento de tiempo predeterminado está representada como a[1], a[2], ..., a[p]; ω[1], ω[2], ..., ω[p] es uno de una secuencia de parámetros de par de espectro de línea, LSP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de predicción lineal, una secuencia LSF de parámetros de frecuencias de LSP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de predicción lineal, y una secuencia de parámetros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de predicción lineal y en la que todos los ω[1], ω[2], ..., ω[p] están presentes desde 0 hasta π, y cuando todos los coeficientes de predicción lineal contenidos en la secuencia de coeficientes de predicción lineal son 0, ω[1], ω[2], ..., ω[p] están presentes desde 0 hasta π a intervalos iguales; y, cada uno de γ1 y γ2 es una constante positiva igual o menor que 1, se mantiene γ1 = γ2, y K es una matriz de banda pxp predeterminada en la que solamente los elementos de la diagonal y los elementos que son vecinos a los elementos de la diagonal en la dirección de fila, tienen valores distintos de cero, una etapa de conversión de secuencia de parámetros para la generación de una secuencia ~ω[1], ~ω[2], ..., ~ω[p] de parámetros en el dominio de la frecuencia convertidos, definida por la fórmula siguiente:**Fórmula**

Description

DESCRIPCION
Metodo de generacion de secuencia de parametros en el dominio de la frecuencia, metodo de codificacion, metodo de descodificacion, aparato de generacion de secuencia de parametros en el dominio de la frecuencia, aparato de codificacion, aparato de descodificacion, programa y soporte de grabacion
[CAMPO TECNICO]
La presente invencion se refiere a tecnicas de codificacion, y mas en particular a tecnicas para convertir equivalentes de parametros del dominio de la frecuencia a coeficientes de prediccion lineal.
[TECNICA ANTERIOR]
En la codificacion de habla o de senales sonoras, se emplean ampliamente esquemas que realizan codificacion usando coeficientes de prediccion lineal obtenidos por analisis de prediccion lineal de senales sonoras de entrada.
Por ejemplo, segun las Literaturas 1 y 2 de No Patentes, las senales sonoras de entrada en cada trama son codificadas ya sea por medio de un metodo de codificacion en el dominio de la frecuencia o ya sea por medio de un metodo de codificacion en el dominio del tiemplo. Si ha de usarse el metodo de codificacion en el dominio de la frecuencia o en el dominio del tiempo, se determina en concordancia con las caracterlsticas de las senales sonoras de entrada de cada trama.
En ambos metodos de codificacion en el dominio del tiempo o en el dominio de la frecuencia, los coeficientes de prediccion lineal obtenidos mediante analisis de prediccion lineal de la senal sonora de entrada se convierten a una secuencia de parametros de LSP, la cual se codifica a continuacion respecto a los codigos de LSP obtenidos, y tambien se genera una secuencia de parametros de LSP cuantificados correspondientes a los codigos de LSP. En el metodo de codificacion en el dominio del tiempo, la codificacion se lleva a cabo usando coeficientes de prediccion lineal determinados a partir de una secuencia de parametros de LSP cuantificados para la trama presente y de una secuencia de parametros de LSP cuantificados para la trama precedente como coeficientes de filtro para un filtro de slntesis que sirve como filtro en el dominio del tiempo, aplicando el filtro de slntesis a una senal generada mediante slntesis de las formas de onda contenidas en un libro de codigos adaptativos y las formas de onda contenidas en un libro de codigos fijos con el fin de determinar una senal sintetizada, y determinando Indices para los respectivos libros de codigos de tal modo que la distorsion entre la senal sintetizada determinada y la senal sonora de entrada, se minimice.
En el metodo de codificacion en el dominio de la frecuencia, una secuencia de parametros de LSP cuantificados se convierte a coeficientes de prediccion lineal para determinar una secuencia de coeficientes de prediccion lineal cuantificados; la secuencia de coeficientes de prediccion lineal cuantificados se alisa para determinar una secuencia de coeficientes de prediccion lineal cuantificados ajustados; se determina una senal de la que se ha eliminado el efecto de la envolvente espectral mediante normalizacion de cada valor en una serie de senales del dominio de la frecuencia mediante conversion de la senal sonora de entrada al dominio de la frecuencia usando cada valor en una serie de envolvente espectral de potencia, la cual es una serie en el dominio de la frecuencia correspondiente a los coeficientes de prediccion lineal cuantificados ajustados; y, la senal determinada se codifica mediante codificacion de longitud variable teniendo en cuenta la informacion de envolvente espectral.
Segun se ha descrito, los coeficientes de prediccion lineal determinados mediante analisis de prediccion lineal de la senal sonora de entrada, se emplean en comun en los metodos de codificacion en el dominio de la frecuencia y en el dominio del tiempo. Los coeficientes de prediccion lineal se convierten en una secuencia de parametros del dominio de la frecuencia equivalentes a los coeficientes de prediccion lineal tal como parametros de LSP (Par de Espectro de Llnea) o parametros de ISP (Par de Espectro de Inmitancia). A continuacion, los codigos de LSP (o los codigos de ISP) generados al codificar la secuencia de parametros de LSP (o la secuencia de parametros de ISP), son transmitidos a un aparato de descodificacion. Las frecuencias de 0 a n de los parametros de LSP usadas en cuantificacion o interpolacion, son a veces especlficamente mencionadas de manera distintiva como frecuencias de LSP (LSF) o como frecuencias de ISP (ISF) en el caso de frecuencias de ISP; sin embargo, tales parametros de frecuencia se mencionan como parametros de LSP o como parametros de ISP en la descripcion de la presente solicitud.
Con referencia a las Figuras 1 y 2, se va a describir de forma mas especlfica el procesamiento llevado a cabo por un aparato de codificacion convencional.
En lo que sigue de la descripcion, una secuencia de parametros de LSP consistente en p parametros de LSP, va a ser representada como 0[1], 0[2], ..., 0[p]. “p” representa el orden de prediccion, el cual es un numero entero igual o mayor que 1. El slmbolo entre corchetes ([]) representa el Indice. Por ejemplo, 0[i] representa el iesimo parametro de LSP en una secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP.
Un slmbolo escrito en la parte superior derecha de 0 entre parentesis, indica el numero de trama. Por ejemplo, una secuencia de parametros de LSP generada por las senales sonoras en la f sima trama, se representa como 0[f][1], 0[f][2], 0[f][p], Sin embargo, puesto que la mayor parte del procesamiento se realiza dentro de una trama de una manera cerrada, la indication del numero de trama superior derecha se omite para los parametros que correspondan a la presente trama (la fesima trama). La omision de un numero de trama pretende significar parametros generados para la presente trama. Es decir, se mantiene 0[i] = 0[f][i].
Un slmbolo escrito en la parte superior derecha sin parentesis representa la potenciacion. Es decir, 0k[i] significa la kesima potencia de 0[i].
Aunque los slmbolos usados en el texto, tales como “~”, “A” y ... deberlan ser originalmente indicados inmediatamente encima de la siguiente letra, estos de indican inmediatamente antes de la letra correspondiente debido a las limitaciones en la denotation del texto. En las expresiones matematicas, tales slmbolos se indican en la position apropiada, en particular inmediatamente encima de la letra correspondiente.
En la etapa S100, una senal digital sonora de habla (mencionada en adelante como senal sonora de entrada) en el dominio del tiempo por trama, que define un segmento de tiempo predeterminado, se introduce en un aparato 9 de codification convencional. El aparato 9 de codification realiza un procesamiento en las unidades de procesamiento descritas mas adelante sobre la senal sonora de entrada sobre la base de una por trama.
Una senal sonora de entrada por trama se introduce en una unidad 105 de analisis de prediction lineal, una unidad 120 de extraction de magnitud de caracterlstica, una unidad 150 de codificacion en el dominio de la frecuencia, y una unidad 170 de codificacion en el dominio del tiempo.
En la etapa S105, la unidad 105 de analisis de prediccion lineal realiza analisis de prediccion lineal sobre la senal sonora de entrada por trama, para determinar una secuencia a[1], a[2], ..., a[pj de coeficientes de prediccion lineal, y la presenta a la salida. Aqul, a[i] es un coeficiente de prediccion lineal de iesimo orden. Cada coeficiente a[i] en la secuencia de coeficientes de prediccion lineal es un coeficiente a[i] (i = 1, 2, ..., p) que se obtiene cuando la senal z sonora de entrada se modela con el modelo de prediccion lineal representado por la Formula (1):
Figure imgf000003_0001
La secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal presentada a la salida por la unidad 105 de prediccion lineal, se introduce en una unidad 110 de generation de LPS.
En la etapa S110, la unidad 110 de generacion de LSP determina y presenta a la salida una serie de parametros de LSP, 0[1], 0[2], ..., 0[p], correspondiente a la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal de salida desde la unidad 105 de analisis de prediccion lineal. En lo que sigue de la description, la serie de parametros de LSP, 0[1], 0[2], ..., 0[p], sera mencionada como secuencia de parametros de LSP. La secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP es una serie de parametros que se definen como la ralz del polinomio de suma definido por la Formula (2) y del polinomio de diferencia definido por la Formula (3):
Figure imgf000003_0003
La secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP es una serie en donde los valores estan dispuestos en orden ascendente. Es decir, satisface:
Figure imgf000003_0002
La secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP presentada a la salida por la unidad 110 de generacion de LSP, se introduce en una unidad 115 de codificacion de LSP.
En la etapa S115, la unidad 115 de codificacion de LSP codifica la secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP presentada a la salida por la unidad 110 de generacion de LSP, determina el codigo C1 de LSP y una serie A0[1 ], A0[2], ..., A0[p] de parametros de LSP cuantificados correspondientes al codigo C1 de LSP, y los presenta a la salida. En lo que sigue de la descripcion, la serie A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados sera mencionada como secuencia de parametros de LSP cuantificados.
La secuencia A9[1], A9[2], A9[p] de parametros de LSP cuantificados presente a la salida de la unidad 115 de codificacion de LSP, se introduce en una unidad 900 de generacion de coeficientes de prediccion lineal cuantificados, una unidad 165 de entrada de retardo, y una unidad 170 de codificacion en el dominio del tiempo. El codigo C1 de LSP presentado a la salida por la unidad 115 de codificacion de LSP, se introduce en una unidad 175 de salida.
En la etapa S120, la unidad 120 de extraccion de magnitud de caracterlstica extrae la magnitud de la variacion temporal en la senal sonora de entrada como magnitud de caracterlstica. Cuando la magnitud de caracterlstica extralda es mas pequena que un umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada es pequena), la unidad 120 de extraccion de magnitud de caracterlstica implementa un control de modo que la unidad 900 de generacion de coeficientes de prediccion lineal cuantificados realizara el consiguiente procesamiento. Al mismo tiempo, la unidad 120 de extraccion de magnitud de caracterlstica introduce informacion indicativa del metodo de codificacion en el dominio de la frecuencia en la unidad 175 de salida como codigo Cg de identification. Mientras tanto, cuando la magnitud de caracterlstica extralda es igual a, o mayor que, el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada es grande), la unidad 120 de extraccion de magnitud de caracterlstica implementa un control de modo que la unidad 170 de codificacion en el dominio del tiempo realizara el procesamiento consiguiente. Al mismo tiempo, la unidad 120 de extraccion de magnitud de caracterlstica introduce informacion indicativa del metodo de codificacion en el dominio del tiempo en la unidad 175 de salida como codigo Cg de identificacion.
Los procesos en la unidad 900 de generacion de coeficientes de prediccion lineal cuantificados, en una unidad 905 de ajuste de coeficientes de prediccion lineal cuantificados, en una unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada, y en la unidad 150 de codificacion en el dominio de la frecuencia, se ejecutan cuando la magnitud de caracterlstica extralda por la unidad 120 de extraccion de magnitud de caracterlstica es mas pequena que el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada es pequena) (etapa S121).
En la etapa S900, la unidad 900 de generacion de coeficientes de prediccion lineal cuantificados determina una serie de coeficientes de prediccion lineal, Aa[1], Aa[2], ..., Aa[p], a partir de la secuencia A9[1], a9[2], ..., A9[p] de parametros de LSP cuantificados, presentada a la salida por la unidad 115 de codificacion de LSP, y la presenta a la salida. En lo que sigue de la description, la serie Aa[1], Aa[2], ..., Aa[p] sera mencionada como secuencia de coeficientes de prediccion lineal cuantificados.
La secuencia Aa[1], Aa[2], ..., Aa[p] de coeficientes de prediccion lineal cuantificados presente a la salida de la unidad 900 de generacion de coeficientes de prediccion lineal cuantificados se introduce en la unidad 905 de ajuste de coeficientes de prediccion lineal cuantificados.
En la etapa S905, la unidad 905 de ajuste de coeficientes de prediccion lineal cuantificados determina y presenta a la salida una serie Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de valor Aa[i]X(gR)i, que es el producto del coeficiente Aa[i] (i=1, 2, ..., p) de orden iesimo en la secuencia Aa[1], Aa[2], ..., Aa[p] de coeficientes de prediccion lineal cuantificados presentada a la salida por la unidad 900 de generacion de coeficientes de prediccion lineal cuantificados y el iesimo factor gR de potencia de ajuste. Aqul, el factor gR de ajuste es un numero entero positivo predeterminado igual o menor que 1. En lo que sigue de la descripcion. La serie Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p sera mencionada como secuencia de coeficientes de prediccion lineal cuantificados ajustados.
La secuencia Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de coeficientes de prediccion lineal cuantificados ajustados presentada a la salida por la unidad 905 de ajuste de coeficientes de prediccion lineal cuantificados, se introduce en la unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada.
En la etapa S910, mediante el uso de cada coeficiente Aa[i]X(gR)i en la secuencia Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de coeficientes de prediccion lineal cuantificados ajustados presentada a la salida por la unidad 905 de ajuste de coeficientes de prediccion lineal cuantificados, la unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada genera una serie ~WgR[2], ..., ~Wyr[N] de envolvente espectral de potencia alisada aproximada mediante la Formula (4), y la presente a la salida. Aqul, exp() es una funcion exponencial cuya base es la constante de Napier, j es la unidad imaginaria, y a2 es la energla residual de prediccion.
Segun se define mediante la Formula (4), la serie ~W7r[1], ~Wyr[2], -Wg^N] de envolvente espectral de potencia alisada aproximadas es una serie del dominio de la frecuencia correspondiente a la secuencia Aa[1]X(yR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de coeficientes de prediccion lineal cuantificados ajustados.
La serie ~Wyr[1], ~Wyr[2], ..., ~Wyr[N] de envolvente espectral de potencia alisada aproximada presentada a la salida por la unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada, se introduce en la unidad 150 de codificacion en el dominio de la frecuencia.
En lo que sigue, se va a explicar el motivo de porque una serie de valores definidos por la Formula (4) se denomina serie de envolvente espectral de potencia alisada aproximada.
Con un proceso auto-regresivo de orden pesimo que es un modelo de todos los polos, la senal x[t] sonora de entrada en el instante t esta representada por la Formula (5) con sus propios valores en el pasado de vuelta al instante p, es decir, x[t-1], ..., x[t-p], un residuo e[t] de prediccion, y los coeficientes a[1], a[2], ..., a[p] de prediccion lineal. A continuacion, cada coeficiente W[n] (n = 1, ..., N) en una serie W[1], W[2], ..., W[N] de envolvente espectral de potencia en la senal sonora de entrada, se representa mediante la Formula (6):
Figure imgf000005_0001
Aqul, una serie W g^l], Wyr[2], ..., Wyr[N] definida por:
Figure imgf000005_0002
en la que a[i] en la Formula (6) se sustituye por a[i]X(gR)i, es equivalente a la serie W[1], W[2], ..., W[N] de envolvente espectral de potencia de la senal sonora de entrada definida por la Formula (6), pero con las ondas de la amplitud alisadas. En otras palabras, el procesamiento para ajustar un coeficiente de prediccion lineal multiplicando el coeficiente a[i] de prediccion lineal por la iiesima potencia del factor gR de ajuste, es equivalente al procesamiento que aplana las ondas de la amplitud de la envolvente espectral de potencia en el dominio de la frecuencia (procesamiento para alisar la envolvente espectral de potencia). Por consiguiente, la serie W g^l], WgR[2], ..., Wg^N] definida por la Formula (7) se denomina serie de envolvente espectral de potencia alisada.
La serie ~WgR[1], ~WyR[2], ..., ~WgR[N] definida por la Formula (4) es equivalente a una serie de aproximaciones de los valores individuales en la serie WgR[1], WyR[2], ..., WgR[N] de envolvente espectral de potencia alisada definida por la Formula (7). Por consiguiente, la serie ~WgR[1], ~WyR[2], ..., ~WgR[N] definida por la Formula (4) se denomina serie de envolvente espectral de potencia alisada aproximada.
En la etapa S150, la unidad 150 de codificacion en el dominio de la frecuencia normaliza cada valor X[n] (n = 1, ..., N) en una secuencia X[1], X[2], ..., X[N] de senal en el dominio de la frecuencia, generada por conversion de la senal sonora de entrada en el dominio de la frecuencia, con la ralz cuadrada de cada valor ~WgR[n] en la serie de envolvente espectral de potencia alisada aproximada, determinando con ello una secuencia Xn[1], Xn[2], ..., Xn[N] de senal en el dominio de la frecuencia normalizada. Es decir, se mantiene XN[n] = X[n]/sqrt (~WgR[n]). Aqul, sqrt(y) representa la ralz cuadrada de y. La unidad 150 de codificacion en el dominio de la frecuencia codifica a continuacion la secuencia Xn[1], Xn[2], Xn[N] de senal en el dominio de la frecuencia normalizada mediante codificacion de longitud variable, para generar codigos de senal en el dominio de la frecuencia.
Los codigos de senal en el dominio de la frecuencia presentados a la salida por la unidad 150 de codificacion en el dominio de la frecuencia, se introducen en la unidad 175 de salida.
La unidad 165 de introduccion de retardo y la unidad 170 de codificacion en el dominio del tiempo, se ejecutan cuando la magnitud de caracterlstica extralda por la unidad 120 de extraccion de magnitud de caracterlstica es igual o mayor que el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada es grande) (etapa S121).
En la etapa S165, la unidad 165 de entrada de retardo mantiene la secuencia a9[1], a9[2], ..., A9[p] de parametros de LSP cuantificados de entrada, y la presenta a la salida para la unidad 170 de codificacion en el dominio del tiempo con un retardo equivalente a la duracion de una trama. Por ejemplo, si la trama actual es la f sima trama, la secuencia de parametros de LSP cuantificados para la fesima trama, A9(f"1)[i], A9(f-1)[2], ..., A9(f-1)[p], se presenta a la salida para la unidad 170 de codificacion en el dominio del tiempo.
En la etapa S170, la unidad 170 de codificacion en el dominio del tiempo lleva a cabo la codificacion determinando una senal sintetizada por aplicacion del filtro de slntesis a una senal generada por slntesis de las formas de onda obtenidas en el libro de codigos adaptativos y las formas de onda contenidas en el libro de codigos fijos, y determinando los Indices para los respectivos libros de codigos de modo que la distorsion entre la senal sintetizada determinada y la senal sonora de entrada se minimice. Cuando se determinan los Indices para los libros de codigos de modo que la distorsion entre la senal sintetizada y la senal sonora de entrada se minimice, los Indices del libro de codigos se determinan de modo que se minimice el valor dado al aplicar un filtro de ponderacion auditiva a una senal que representa la diferencia de la senal sintetizada respecto a la senal sonora de entrada. El filtro de ponderacion auditiva es un filtro para la determinacion de la distorsion cuando se selecciona el libro de codigos adaptativos o el libro de codigos fijos.
Los coeficientes del filtro de slntesis y del filtro de ponderacion auditiva se generan mediante el uso de la secuencia de parametros de LSP cuantificados para la fesima trama, a9[1], a9[2], ..., A9[p], y la secuencia de parametros de LSP cuantificados para la (f-1)esima trama, a9(M)[1], A9a((ff--i|))[2], ..., A9(f- |)[p]
Especlficamente, una trama se divide en primer lugar en dos subtramas, y los coeficientes de filtro para el filtro de slntesis y el filtro de ponderacion auditiva se determinan como sigue.
En la ultima semi-subtrama, cada coeficiente Aa[i] de una secuencia Aa[1], Aa[2], ..., Aa[p] de coeficientes de prediction lineal cuantificados, que es una secuencia de coeficientes obtenida por conversion de la secuencia de parametros de LSP cuantificados para la fesima trama, a9[1], a9[2], ..., A9[p], a coeficientes de prediccion lineal, se emplea para los coeficientes de filtro del filtro de slntesis. Para los coeficientes de filtro del filtro de ponderacion auditiva, se emplea una serie de valores:
Figure imgf000006_0001
que se determina multiplicando cada coeficiente Aa[i] de la secuencia Aa[1], Aa[2], ..., Aa[p] de coeficientes de prediccion lineal cuantificados por la iesima potencia del factor gR de ajuste.
En la primera semi-subtrama, cada coeficiente ~a[i] en una secuencia ~a[1], ~a[2], ..., ~a[p] de coeficientes de prediccion lineal cuantificados interpolados, que es una secuencia de coeficientes obtenida por conversion de una secuencia ~9[1], ~9[2], ..., ~9[p] de parametros de LSP cuantificados interpolados a coeficientes de prediccion lineal, se emplea para los coeficientes de filtro del filtro de slntesis. La secuencia ~9[1], ~9[2], ..., ~9[p] de parametros de LSP cuantificados interpolados es una serie de valores intermedios entre cada valor a9[|1 de la secuencia de parametros de LSP cuantificados para la fesima trama a9[1], a9[2], ..., a9[p], y cada valor A9(f” [i] en la secuencia de parametros de LSP cuantificados para la (f-1)esima trama, A9(f>|)m , A9(f-1)[2]> ..., A9<f-1)[p], en particular una serie de valores obtenidos por interpolation entre los valores a9[|] y 9A(f-1)[i]. Para los coeficientes de filtro del filtro de ponderacion auditiva, se emplea una serie de valores:
Figure imgf000006_0002
que se determina multiplicando cada coeficiente ~a[i] de la secuencia ~a[1], ~a[2], ..., ~a[p] de coeficientes de prediccion lineal cuantificados interpolados, por la iesima potencia del factor gR de ajuste.
Esto tiene como efecto suavizar la transition entre una senal sonora descodificada y la senal sonora descodificada para la trama precedente generada en el aparato de descodificacion. Observese que el factor g de ajuste en la unidad 170 de codificacion en el dominio del tiempo es igual que el factor g de ajuste usado en la unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada.
En la etapa S175, el aparato 9 de codificacion transmite, por medio de la unidad 175 de salida, el codigo C1 de LSP presentado a la salida por la unidad 115 de codificacion de LSP, el codigo Cg de identificacion presentado a la salida por la unidad 120 de extraccion de magnitud de caracterlstica, y cualquiera de entre los codigos de senal en el dominio de la frecuencia presentados a la salida por la unidad 150 de codificacion en el dominio de la frecuencia o los codigos de senal en el dominio del tiempo presentados a la salida por la unidad 170 de codificacion en el dominio del tiempo, para el aparato de descodificacion.
[LITERATURA DE LA TECNICA ANTERIOR]
[LITERATURA DE PATENTES]
Varios esquemas de conversion LSP/LSF han sido descritos en los siguientes documentos:
Literatura de Patentes 1: US 2004/042622 A1;
Literatura de Patentes 2: US 5.864.796, y
Literatura de Patentes 3: US 5.822.732
[LITERATURA NO DE PATENTES]
Literatura No de Patentes 1: Proyecto Partnership de 3a Generacion (3GPP), “Extended Adaptive Multi-Rate -Wideband (AMR-WB+) codec; Transcoding functions”, Especificacion Tecnica (TS) 26.290, Version 10.0.0, 2011-03.
Literature No de Patentes 2: M. Neuendorf, et al., “MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types”, Audio Engineering Society Convention 132, 2012.
[COMPENDIO DE LA INVENCION]
La invencion se define en las reivindicaciones independientes. Todos los casos que siguen de expresiones tales como “realizacion(es) de la invencion” y/o “aspecto(s) de la invencion”, si se refieren a combinaciones de caracterlsticas diferentes de las definidas por las reivindicaciones independientes, se refieren a ejemplos que fueron presentados originalmente pero que no representan realizaciones de la invencion actualmente reivindicada; esos ejemplos se muestran aun con fines ilustrativos unicamente.
[PROBLEMAS A SER RESUELTOS POR LA INVENCION]
El factor gR de ajuste sirve para conseguir una codificacion con pequena distorsion que adopta el sentido de la audicion en un grado incrementado mediante aplanamiento de las ondas de la amplitud de una envolvente espectral de potencia, en mayor cantidad para una frecuencia mas alta, cuando se elimina la influencia de la envolvente espectral de potencia en la senal sonora de entrada.
Con el fin de que la unidad de codificacion en el dominio de la frecuencia consiga codificar con pequena distorsion teniendo en cuenta el sentido de la audicion, es necesario que la serie ~WgR[1], ~Wyr[2], ..., ~Wyr[N] de envolvente espectral de potencia alisada aproximada se aproxime a la WgR[1], WgR[2], ..., WgR[N] de envolvente espectral de potencia alisada con una alta precision. Dicho de otra manera, suponiendo que
Figure imgf000007_0001
resulta deseable que la secuencia Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de coeficientes de prediction lineal cuantificados ajustados sea una serie que se aproxime a la secuencia agR[1], agR[2], ..., agR[p] de coeficientes de prediccion lineal ajustados con alta precision.
Sin embargo, la unidad de codificacion de LSP de un aparato de codificacion convencional realiza el procesamiento de codificacion de modo que la distorsion entre la secuencia A0[1], aq[2], ..., Ag[p] de parametros de LSP cuantificados y la secuencia 0[1], 0[2], ..., 0[p] de parametros de lSp , se minimiza. Esto significa determinar la secuencia Ag[1], Ag[2], ..., Ag[p] de parametros de LSP cuantificados de modo que una envolvente espectral de potencia que no tiene en cuenta el sentido de la audicion (es decir, que no haya sido alisada con el factor gR de ajuste) se aproxime con alta precision. Por consiguiente, la distorsion entre la secuencia Aa[1]X(gR), Aa[2]X(gR)2, ..., Aa[p]X(gR)p de coeficientes de prediccion lineal cuantificados ajustados generada a partir de la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados y la secuencia agR[1], agR[2], ..., agR[p] de coeficientes de prediccion lineal ajustados no se minimiza, conduciendo a una gran distorsion de codificacion en la unidad de codificacion en el dominio de la frecuencia.
Un objeto de la presente invencion consiste en proporcionar tecnicas de codificacion que usen selectivamente codificacion en el dominio de la frecuencia y codificacion en el dominio del tiempo conforme a las caracterlsticas de la senal sonora de entrada, y que sean capaces de reducir la distorsion de codificacion en cuanto a codificacion en el dominio de la frecuencia en comparacion con las tecnicas convencionales, y que tambien generen parametros de LSP que correspondan a parametros de LSP cuantificados para la trama precedente y que van a ser usados en codificacion en el dominio del tiempo, a partir de coeficientes de prediccion lineal resultantes de la codificacion en el dominio de la frecuencia o de coeficientes equivalentes a coeficientes de prediccion lineal, tipificados mediante parametros de LSP. Otro objeto de la presente invention consiste en generar coeficientes equivalentes a coeficientes de prediccion lineal que tengan grados variables de efecto de alisamiento a partir de coeficientes equivalentes a coeficientes de prediction lineal usados, por ejemplo, en la tecnica de codificacion descrita con anterioridad.
[MEDIOS PARA RESOLVER LOS PROBLEMAS]
Con el fin de alcanzar los objetos, un metodo de generation de secuencia de parametros en el dominio de la frecuencia segun un primer aspecto de la invencion incluye, cuando p es un numero entero igual a, o mayor que 1, a[1], a[2], ..., a[p] son una secuencia de coeficientes de prediccion lineal que se obtiene mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado, y w[1], w[2], ..., w[p] son una secuencia de parametros en el dominio de la frecuencia deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, una etapa de conversion de conversion de secuencia de parametros para determinar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos usando la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada. La etapa de conversion de secuencia de parametros determina un valor de cada uno de los parametros ~w[i] (i = 1, 2, ..., p) en el dominio de la frecuencia convertidos, en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos por medio de transformation lineal que esta basada en una relation de valores entre w[i] y uno o mas parametros del dominio de la frecuencia adyacentes a w[i].
Un metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun un segundo aspecto de la invencion, incluye una etapa de conversion de secuencia de parametros para la generacion de una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros del dominio de la frecuencia convertidos, definida por:
Figure imgf000008_0001
donde p es un numero entero igual o mayor que 1, y a[1], a[2], ..., a[p] son una secuencia de coeficientes de prediccion lineal obtenida mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado; w[1], w[2], ..., w[p] es una de entre una secuencia de parametros de LSP deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes prediccion lineal, una secuencia de parametros de ISP deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, una secuencia de parametros de LSF deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y una secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en la que todos los w[1], w[2], ..., w[p-1] estan presentes desde 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, w[1], w[2], ..., w[p-1] estan presentes desde 0 a n a intervalos iguales; y g1 y g2 son, cada uno de ellos, un factor de ajuste que es una constante positiva igual o menor que 1, y K es una matriz de banda pxp predeterminada.
Un metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun un tercer aspecto de la invencion incluye que, cuando p es un numero entero igual o mayor que 1, a[1], a[2], ..., a[p] son una secuencia de coeficientes de prediccion lineal que se obtiene mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado, y w[1], w[2], ..., w[p] son una secuencia de parametros en el dominio de la frecuencia deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, una etapa de conversion de secuencia de parametros para determination de una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos que usa la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada. La etapa de conversion de secuencia de parametros determina cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ~w[p] de parametros del dominio de la frecuencia convertidos de tal modo que cuando w[i] esta mas cerca de w[i+1] con relacion a un punto medio entre w[i+1] y w[i-1], entonces ~w[i] se determina de modo que ~w[i] sea mas cercano a ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que un valor de ~w[i+1] - ~w[i] sea menor que w[i+1] - w[i], y cuando w[i] esta mas cerca de w[i-1] con relacion a un punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] - ~w[i-1] sea menor que w[i] - w[i-1].
Un metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun un cuarto aspecto de la invencion incluye que, cuando p es un numero entero igual o mayor que 1, a[1], a[2], ..., a[p] son una secuencia de coeficientes de prediccion lineal que se obtiene mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado, y w[1], w[2], ..., w[p] son una secuencia de parametros en el dominio de la frecuencia deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, una etapa de conversion de secuencia de parametros para determinacion de una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos que usa la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada. La etapa de conversion de la secuencia de parametros determina cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros del dominio de la frecuencia convertidos de tal modo que cuando w[i] esta mas cerca de w[i+1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que un valor de ~w[i+1] - ~w[i] sea mayor que w[i+1] - w[i], y cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] - ~w[i-1] sea mayor que w[i] - w[i-1].
Un metodo de codificacion segun un quinto aspecto de la invencion incluye, cuando g es un factor de ajuste que es una constante positiva igual o menor que 1, una etapa de ajuste de coeficientes de prediccion lineal para generacion de una secuencia ag[1], ag[2], ..., ag[p] de coeficientes de prediccion lineal ajustados mediante ajuste de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal usando el factor g de ajuste; una etapa de generacion de LSP ajustado para la generacion de una secuencia 0g[1], 0g[2], ..., 0g[p] de parametros de LSP ajustados usando la secuencia ag[1], ag[2], ..., ag[p] de coeficientes de prediccion lineal ajustados; una etapa de codificacion de LSP ajustado para la codificacion de la secuencia 0g[1], 0g[2], ..., 0g[p] de parametros de LSP ajustados para generar codigos de LSP ajustados, y una secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP cuantificados ajustados correspondiente a los codigos de LSP ajustados; una etapa de transformacion lineal de LSP para, con la secuencia w[1], w[2], ..., w[p] de parametros en el dominio de la frecuencia siendo la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP cuantificados ajustados, y g1 = g y g2 = 1, ejecutar la etapa de conversion de secuencia de parametros del metodo de generacion de secuencia de parametros en el dominio de la frecuencia que se ha descrito en uno cualquiera de los aspectos primero a cuarto, para generar con ello la secuencia ~w[1], ~w[2], ..., ~w[p]de parametros en el dominio de la frecuencia convertidos como una secuencia A0app[1], A0app[2], ..., A0w [p] de parametros de LSP cuantificados aproximados; una etapa de generacion de secuencia de coeficientes de prediccion lineal cuantificados para la generacion de una secuencia Aag[1], Aag[2], ..., Aag[p] de coeficientes de prediccion lineal cuantificados ajustados mediante conversion de la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP cuantificados ajustados a coeficientes de prediccion lineal; una etapa de calculo de serie de envolvente espectral de potencia alisada cuantificada para el calculo de una serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada cuantificada que es una serie en el dominio de la frecuencia correspondiente a la secuencia Aag[1], Aag[2], ..., Aag[p] de coeficientes de prediccion lineal cuantificados ajustados; una etapa de codificacion en el dominio de la frecuencia para la generacion de codigos de senal en el dominio de la frecuencia mediante codificacion de una secuencia X[1], X[2], ..., X[N] de muestra del dominio de la frecuencia correspondiente a las senales de audio usando la serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada cuantificada; una etapa de generacion de LSP para la generacion de una secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP usando la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal; una etapa de codificacion de LSP para la codificacion de la secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP para generar codigos de LSP y una secuencia A0[1 ], A0[2], ..., A0[p] de parametros de LSP cuantificados correspondientes a los codigos de LSP; y una etapa de codificacion en el dominio del tiempo para la codificacion de las senales de audio para generar codigos de senal en el dominio del tiempo usando cualquiera de entre una secuencia de parametros de LSP cuantificados obtenida en el etapa de codificacion de LSP para un segmento de tiempo precedente o una secuencia de parametros de LSP cuantificados aproximados obtenida en la etapa de transformacion lineal de LSP para el segmento de tiempo precedente, y la secuencia de parametros de LSP cuantificados para el segmento de tiempo predeterminado.
Un metodo de codificacion segun un sexto aspecto de la invencion incluye, cuando g es un factor de ajuste que es una constante positiva igual o menor que 1, una etapa de ajuste de coeficientes de prediccion lineal para generacion de una secuencia ag[1], ag[2], ..., ag[p] de coeficientes de prediccion lineal ajustados, mediante ajuste de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal usando el factor g de ajuste; una etapa de generacion de LSP ajustado para generacion de una secuencia 0g[1], 0g[2], ..., 0g[p] de parametros de LSP ajustados usando la secuencia ag[1], ag[2], ..., ag[p] de coeficientes de prediccion lineal ajustados; una etapa de codificacion de LSP ajustado para codificacion de la secuencia 0g[1], 0g[2], ..., 0g[p] de parametros de LSP ajustados parta generar codigos de LSP ajustados y una secuencia A9Y[1], A0y[2], A9y[p] de parametros de LSP cuantificados ajustados correspondientes a los codigos de LSP ajustados; una etapa de transformacion lineal de LSP, siendo la secuencia w[1], w[2], ..., w[p] de parametros en el dominio de la frecuencia, la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP cuantificados ajustados y g1 = g y g2 = 1, ejecutando la etapa de conversion de secuencia de parametros del metodo de generacion de secuencia de parametros en el dominio de la frecuencia descrito en uno cualquiera de los aspectos primero a cuarto para generar con ello la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos como secuencia A0app[1], A0app[2], ..., A0app[p] de parametros de LSP cuantificados aproximados; una etapa de calculo de serie de envolvente espectral de potencia alisada cuantificada para calcular una serie AWg[1], AWg[2], ..., awy[N] de envolvente espectral de potencia alisada cuantificada en base a la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP cuantificados ajustados; una etapa de codificacion en el dominio de la frecuencia para generacion de codigos de senal en el dominio de la frecuencia mediante codificacion de una secuencia X[1], X[2], ..., X[N] de muestra en el dominio de la frecuencia correspondiente a las senales de audio usando la serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada cuantificada; una etapa de generacion de LSP para la generacion de una secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP usando la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal; una etapa de codificacion de LSP para codificacion de la secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP para generar codigos de LSP y una secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados correspondientes a los codigos de LSP; y una etapa de codificacion en el dominio del tiempo para codificacion de las senales de audio, para generar codigos de senal en el dominio del tiempo usando cualquiera de entre una secuencia de parametros de LSP cuantificados obtenida en la etapa de codificacion de LSP para un segmento de tiempo precedente, o bien una secuencia de parametros de LSP cuantificados aproximados obtenida en la etapa de transformacion lineal de LSP para el segmento de tiempo precedente, y la secuencia de parametros de LSP cuantificados para el segmento de tiempo predeterminado.
Un metodo de descodificacion segun un septimo aspecto de la invencion, incluye: una etapa de descodificacion de codigos de LSP ajustados para descodificacion de codigos de LSP ajustados de entrada para obtener una secuencia A0g[1 ], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados; una etapa de transformacion lineal de LSP descodificado para, con la secuencia w[1], w[2], ..., w[p] de parametros en el dominio de la frecuencia siendo la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados, y g1 = g y g2 = 1, ejecutar la etapa de conversion de secuencia de parametros del metodo de generacion de de secuencia parametros en el dominio de la frecuencia descrito en uno cualquiera de los aspectos primero a cuarto, para generar con ello la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos como secuencia A0app[1], A0app[2], ..., A0app[p] de parametros de LSP aproximados descodificados; una etapa de generacion de secuencia de coeficientes de prediccion lineal descodificados para generacion de una secuencia Aag[1], Aag[2], ..., Aag[p] de coeficientes de prediccion lineal ajustados descodificados mediante conversion de la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados a coeficientes de prediccion lineal; una etapa de calculo de serie de envolvente espectral de potencia alisada descodificada para calcular una serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada descodificada que es una serie en el dominio de la frecuencia correspondiente a la secuencia Aag[1], Aag[2], ..., Aag[p] de coeficientes de prediccion lineal ajustados descodificados; una etapa de descodificacion en el dominio de la frecuencia para generacion de senales sonoras descodificadas usando una secuencia de senales en el dominio de la frecuencia resultante de la descodificacion de codigos de senal en el dominio de la frecuencia de entrada y la serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada descodificada; una etapa de descodificacion de codigos de LSP para la descodificacion de codigos de LSP de entrada para obtener una secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP descodificados; y una etapa de descodificacion en el dominio del tiempo, para la descodificacion de codigos de senal en el dominio del tiempo de entrada, y la generacion de senales sonoras descodificadas mediante sintetizacion de los codigos de senal en el dominio del tiempo usando ya sea la secuencia de parametros de LSP descodificados obtenida en la etapa de descodificacion de codigos de lSp para el segmento de tiempo precedente, o ya sea la secuencia de parametros de LSP aproximados descodificados obtenida en la etapa de transformacion lineal de LSP para el segmento de tiempo precedente, y la secuencia de parametros de LSP descodificados para el segmento de tiempo predeterminado.
Un metodo de descodificacion segun un octavo aspecto de la invencion, incluye: una etapa de descodificacion de codigos de LSP ajustados para la descodificacion de codigos de LSP ajustados de entrada para obtener una secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados; una etapa de transformacion lineal de LSP descodificado para, con la secuencia w[1], w[2], ..., w[p] de parametros en el dominio de la frecuencia que es la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados, y g1 = g y g2 = 1, ejecutar la etapa de conversion de secuencia de parametros del metodo de generacion de secuencia de parametros en el dominio de la frecuencia descrito en uno cualquiera de los aspectos primero a cuarto, para generar con ello la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos como secuencia A0app[1], A0app[2], ..., A0app[p] de parametros de LSP aproximados descodificados; una etapa de calculo de serie de envolvente espectral de potencia alisada descodificada para el calculo de una serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada descodificada basada en la secuencia A0g[1], A0g[2], ..., A0g[p] de parametros de LSP ajustados descodificados; una etapa de descodificacion en el dominio de la frecuencia para la generacion de senales sonoras descodificadas usando la secuencia de senales del dominio de la frecuencia procedente de la descodificacion de codigos de senal en el dominio de la frecuencia de entrada y la serie AWg[1], AWg[2], ..., AWg[N] de envolvente espectral de potencia alisada descodificada; una etapa de descodificacion en el dominio de la frecuencia para la generacion de senales sonoras descodificadas usando la secuencia de senales en el dominio de la frecuencia resultante de la descodificacion de los codigos de senal en el dominio de la frecuencia de entrada y la serie AWy[1], AWY[2], AWY[N] de envolvente espectral de potencia alisada descodificada; una etapa de descodificacion de codigos de LSP para la descodificacion de codigos de LSP de entrada para obtener una secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP descodificados; y una etapa de descodificacion en el dominio del tiempo para la descodificacion de codigos de senal en el dominio del tiempo de entrada, y la generacion de senales sonoras descodificadas sintetizando los codigos de senal en el dominio del tiempo usando cualquiera de entre la secuencia de parametros de LSP descodificados obtenida en la etapa de descodificacion de codigos de LSP para el segmento de tiempo precedente, o la secuencia de parametros de LSP aproximados descodificados obtenida en la etapa de transformacion lineal de LSP para el segmento de tiempo precedente, y la secuencia de parametros de LSP descodificados para el segmento de tiempo predeterminado.
[EFECTOS DE LA INVENCION]
Segun las tecnicas de codificacion de la presente invencion, es posible reducir la distorsion de codificacion en codificacion en el dominio de la frecuencia en comparacion con las tecnicas convencionales, y tambien obtener parametros de LSP que correspondan a parametros de LSP cuantificados para la trama precedente y que van a ser usados en codificacion en el dominio del tiempo a partir de coeficientes de prediccion lineal resultantes de la codificacion en el dominio de la frecuencia o coeficientes equivalentes a coeficientes de prediccion lineal, tipificados mediante parametros de LSP. Tambien es posible generar coeficientes equivalentes a coeficientes de prediccion lineal que tengan grados variables de efecto de alisamiento a partir de coeficientes equivalentes a los coeficientes de prediccion lineal usados, por ejemplo, en la tecnica de codificacion descrita con anterioridad.
[BREVE DESCRIPCION DE LOS DIBUJOS]
La Figura 1 es un diagrama que ilustra la configuracion funcional de un aparato de codificacion convencional; La Figura 2 es un diagrama que ilustra el flujo de proceso de un metodo de codificacion convencional;
La Figura 3 es un diagrama que ilustra la relacion entre un aparato de codificacion y un aparato de descodificacion;
La Figura 4 es un diagrama que ilustra la configuracion funcional de un aparato de codificacion en una primera realizacion;
La Figuras 5 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la primera realizacion;
La Figura 6 es un diagrama que ilustra la configuracion funcional de un aparato de descodificacion en la primera realizacion;
La Figura 7 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la primera realizacion;
La Figura 8 es un diagrama que ilustra la configuracion funcional del aparato de codificacion en una segunda realizacion;
La Figura 9 es un diagrama para describir la naturaleza de los parametros de LSP;
La Figura 10 es un diagrama para describir la naturaleza de los parametros de LSP;
La Figura 11 es un diagrama para describir la naturaleza de los parametros de LSP;
La Figura 12 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la segunda realizacion;
La Figura 13 es un diagrama que ilustra la configuracion funcional del aparato de descodificacion en la segunda realizacion;
La Figura 14 es un diagrama que ilustra el flujo de proceso del metodo de descodificacion en la segunda realizacion;
La Figura 15 es un diagrama que ilustra la configuracion funcional de un aparato de codificacion en una modificacion de la segunda realizacion;
La Figura 16 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la modificacion de la segunda realizacion;
La Figura 17 es un diagrama que ilustra la configuracion funcional del aparato de codificacion en una tercera realizacion;
La Figura 18 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la tercera realizacion;
La Figura 19 es un diagrama que ilustra la configuracion funcional del aparato de descodificacion en la tercera realizacion;
La Figura 20 es un diagrama que ilustra el flujo de proceso del metodo de descodificacion en la tercera realizacion;
La Figura 21 es un diagrama que ilustra la configuracion funcional del aparato de codificacion en una cuarta realizacion;
La Figura 22 es un diagrama que ilustra el flujo de proceso del metodo de codificacion en la cuarta realizacion;
La Figura 23 es un diagrama que ilustra la configuracion funcional de un aparato de generacion de secuencia de parametros en el dominio de la frecuencia en una quinta realizacion.
[DESCRIPCION DETALLADA DE LAS REALIZACIONES]
Las realizaciones de la presente invention van a ser descritas a continuation. En los dibujos usados en la description que sigue, los componentes que tengan la misma funcion o las etapas que realizan el mismo procesamiento, se han senalado con los mismos caracteres de referencia y se omiten las descripciones repetidas.
[Primera realization]
Un aparato de codification segun una primera realizacion obtiene, en una trama para la que se realiza codification en el dominio del tiempo, codigos de LSP mediante codificacion de parametros de LSP que han sido convertidos a partir de coeficientes de prediction lineal. En una trama para la que se realiza codificacion en el dominio de la frecuencia, el aparato de codificacion obtiene codigos de LSP ajustados codificando parametros de LSP ajustados que han sido convertidos a partir de coeficientes de prediccion lineal ajustados. Cuando se ha de realizar codificacion en el dominio del tiempo en una trama que sigue a una trama para la que se realizo codificacion en el dominio de la frecuencia, los coeficientes de prediccion lineal generados por ajuste inverso de los coeficientes de prediccion lineal que corresponden a parametros de LSP correspondientes a codigos de LSP ajustados, se convierten a LSPs, los cuales son usados a continuacion como parametros de LSP en la codificacion en el dominio del tiempo para la siguiente trama.
Un aparato de descodificacion segun la primera realizacion obtiene, en una trama para la que se realiza descodificacion en el dominio del tiempo, coeficientes de prediccion lineal que han sido convertidos a partir de parametros de LSP resultantes de la descodificacion de codigos de LSP y los usa para descodificacion en el dominio del tiempo. En una trama para la que se realiza descodificacion en el dominio de la frecuencia, el aparato de descodificacion usa parametros de lSp ajustados, generados por descodificacion de codigos de LSP ajustados para la descodificacion en el dominio de la frecuencia. Cuando se ha de realizar descodificacion en el dominio del tiempo en una trama siguiente a una trama para la que se ha realizado descodificacion en el dominio de la frecuencia, los coeficientes de prediccion lineal generados por ajuste inverso de coeficientes de prediccion lineal que corresponden a parametros de LSP correspondientes a los codigos de LSP ajustados, se convierten a LSPs, los cuales son usados a continuacion como parametros de LSP en la descodificacion en el dominio del tiempo para la siguiente trama.
En los aparatos de codificacion y de descodificacion segun la primera realizacion, segun se ha ilustrado en la Figura 3, senales sonoras de entrada que se introducen en un aparato 1 de codificacion son codificadas segun una secuencia de codigos, la cual se envla a continuacion desde el aparato 1 de codificacion al aparato 2 de descodificacion, en el que la secuencia de codigos se descodifica en senales sonoras descodificadas y se presentan a la salida.
<Aparato de codificacion>
Segun se ha mostrado en la Figura 4, el aparato 1 de codificacion incluye, al igual que en el caso del aparato 9 de codificacion convencional, una unidad 100 de entrada, una unidad 105 de analisis de prediccion lineal, una unidad 110 de generation de LSP, una unidad 115 de codificacion de LSP, una unidad 120 de extraction de magnitud de caracterlstica, una unidad 150 de codificacion en el dominio de la frecuencia, una unidad 165 de entrada de retardo, una unidad 170 de codificacion en el dominio del tiempo, y una unidad 175 de salida, por ejemplo. El aparato 1 de codificacion incluye ademas una unidad 125 de ajuste de coeficiente de prediccion lineal, una unidad 130 de generacion de LSP ajustado, una unidad 135 de codificacion de LSP ajustado, una unidad 140 de generacion de coeficientes de prediccion lineal cuantificados, una primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada, una unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados, y una unidad 160 de generacion de LSP ajustado inverso, por ejemplo.
El aparato 1 de codificacion es un dispositivo especializado construido mediante incorporation de programas espaciales en un ordenador conocido o dedicado que tiene una unidad central de procesamiento (CPU), memoria principal (memoria de acceso aleatorio o RAM), y similares, por ejemplo. El aparato 1 de codificacion realiza varias clases de procesamiento bajo el control de la unidad central de procesamiento, por ejemplo. La entrada de datos en el aparato 1 de codificacion o los datos resultantes de las diversas clases de procesamiento, se almacenan en la memoria principal, por ejemplo, y los datos almacenados en la memoria principal se recuperan para su uso en otro procesamiento, segun sea necesario. Al menos algunos de los componentes de procesamiento del aparato 1 de codificacion pueden ser implementados mediante hardware, tal como un circuito integrado.
Segun se ha mostrado en la Figura 4, el aparato 1 de codificacion en la primera realizacion difiere del aparato 9 de codificacion convencional en que, cuando la magnitud de caracterlstica extralda por la unidad 120 de extraccion de magnitud de caracterlstica es menor que un umbral predeterminado (es decir, cuando la variation temporal en la senal sonora de entrada es pequena), el aparato 1 de codificacion realiza la codificacion de una secuencia 0yR[1], 9yR[2], ..., 0yR[p] de parametros de LSP ajustados, la cual es una serie generada por conversion de una secuencia agR[1], ayR[2], ..., ayR[p] de coeficientes de prediccion lineal ajustados, a parametros de LSP, y presenta a la salida el codigo Cy de LSP ajustado, en vez de codificar una secuencia 9[1], 9[2], ..., 9[p] de parametros de LSP que es una serie generada por conversion de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, a parametros de LSP y presentar a la salida el codigo C1 de LSP.
Con la configuracion de la primera realizacion, cuando la magnitud de caracteristica e x t^d a por la unidad 120 de extraccion de magnitud de caracteristica en la trama precedente sea menor que el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada sea pequena), no se genera la secuencia A9[1], A9[2], ..., A9[p] de parametros de LSP cuantificados y por lo tanto no puede ser introducida en la unidad 165 de entrada de retardo. La unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados y la unidad 160 de generacion de LSP ajustado inverso, son componentes de procesamiento anadidos para este direccionamiento: cuando la magnitud de caracteristica extraida por la unidad 120 de extraccion de magnitud de caracteristica en la trama precedente haya sido mas pequena que el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada haya sido pequena), estos generan una serie de aproximaciones de la secuencia A9[1], A9[2], ..., A9[p] de parametros de LSP cuantificados para la trama precedente, para que sea usada en la unidad 170 de codificacion en el dominio del tiempo, a partir de la secuencia AagR[1], AagR[2], ..., AagR[p] de coeficientes de prediccion lineal cuantificados ajustados. En este caso, una secuencia a9'[1], A9'[2], ..., A9'[p] de parametros de LSF de ajuste inverso es la serie de aproximaciones de la secuencia A9[1], a9[2], ..., A9[p] de parametros de LSP cuantificados.
<Metodo de codificacion>
Con referencia a la Figura 5, se va a describir el metodo de codificacion segun la primera realizacion. La descripcion que sigue esta enfocada principalmente a las diferencias frente a la tecnica convencional descrita con anterioridad.
En la etapa S125, la unidad 125 de ajuste de coeficientes de prediccion lineal determina una serie de coeficientes, agR[i] = a[1]DDgRi, que es el producto de cada coeficiente a[i] (i = 1, ..., p) en la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal presentada a la salida por la unidad 105 de analisis de prediccion lineal, y la iesima potencia del factor gR de ajuste, y la presenta a la salida. En la descripcion que sigue, la serie agR[1], agR[2], ..., agR[p] determinada se denominara secuencia de coeficientes de prediccion lineal ajustados.
La secuencia agR[1], agR[2], ..., agR[p] de coeficientes de prediccion lineal ajustados presentada a la salida por la unidad 125 de ajuste de coeficientes de prediccion lineal, se introduce en la unidad 130 de generacion de LSP ajustado.
En la etapa S130, la unidad 130 de generacion de LSP ajustado determina y presenta a la salida una secuencia 9yr[1], 97r[2], ..., 9gR[p] de parametros de LSP ajustados, la cual es una serie de parametros de LSP correspondiente a la secuencia agR[1], agR[2], ..., agR[p] de coeficientes de prediccion lineal ajustados, presentada a la salida por la unidad 125 de ajuste de coeficientes de prediccion lineal. La secuencia 9gR[1], 97r[2], ..., 9gR[p] de parametros de LSP ajustados es una serie en donde los valores estan dispuestos en orden ascendente. Es decir, esta satisface
Figure imgf000013_0001
La secuencia 9gR[1], 9gR[2], ..., 9gR[p] de parametros de LSP ajustados presentada a la salida por la unidad 130 de generacion de LSP ajustado, se introduce en la unidad 135 de codificacion de LSP ajustado.
En la etapa S135, la unidad 135 de codificacion de LSP ajustado codifica la secuencia 97r[1], 97r[2], ..., 9gR[p] de parametros de LSP ajustados presentada a la salida por la unidad 130 de generacion de LSP ajustado, y genera el codigo Cg de LSP ajustado y una serie de parametros de LSP ajustados cuantificados, A9gR[1], A9gR[2], ..., A9gR[p], correspondiente al codigo Cg de LSP ajustado, y los presenta a la salida. En la descripcion que sigue, la serie A9gR[1], A9gR[2], ..., A9gR[p] se denominara secuencia de parametros de LSP cuantificados ajustados.
La secuencia A9gR[1], A9gR[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados presentada a la salida por la unidad 135 de codificacion de lSp ajustado, se introduce en la unidad 140 de generacion de coeficientes de prediccion lineal cuantificados. El codigo Cg de LSP ajustado presentado a la salida por la unidad 135 de codificacion de LSP ajustado, se introduce en la unidad 175 de salida.
En la etapa 140, la unidad 140 de generacion de coeficientes de prediccion lineal cuantificados genera y presenta a la salida una serie de coeficientes de prediccion lineal, AagR[1], AagR[2], ..., AagR[p], a partir de la secuencia A9gR[1], A9gR[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados, presentada a la salida por la unidad 135 de codificacion de LSP ajustado. En la descripcion que sigue, la serie AagR[1], AagR[2], ..., AagR[p] se denominara secuencia de coeficientes de prediccion lineal cuantificados ajustados.
La secuencia Aag[1], Aag[2], ..., Aag[p] de coeficientes de prediccion lineal cuantificados ajustados presentada a la salida por la unidad 140 de generacion de coeficientes de prediccion lineal cuantificados, se introduce en la primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada y en la unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados.
En la etapa S145, la primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada genera y presenta a la salida una serie aWyr[1], aWyr[2], ..., aWyr[N] de envolvente espectral de potencia alisada cuantificada segun la Formula (8), usando cada coeficiente Aa^i] en la secuencia A a ^ l], AagR[2], ..., Aa^p] de coeficientes de prediccion lineal cuantificados ajustados presentada a la salida por la unidad 140 de generation de coeficientes de prediccion lineal cuantificados.
Figure imgf000014_0001
La serie awyR[1], awyR[2], ..., awyR[N] de envolvente espectral de potencia alisada cuantificada, presentada a la salida por la unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada, se introduce en la unidad 150 de codification en el dominio de la frecuencia.
El procesamiento en la unidad 150 de codificacion en el dominio de la frecuencia, es el mismo que el realizado por la unidad 150 de codificacion en el dominio de la frecuencia del aparato 9 de codificacion convencional salvo en que usa la serie aw7r[1], aw7r[2], ..., awyr[N] de envolvente espectral de potencia alisada cuantificada en lugar de la serie ~Wyr[1], ~Wyr[2], ..., ~Wyr[N] de envolvente espectral de potencia alisada aproximada.
En la etapa S155, la unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados determina una serie AaY[1]/(gR), AaY[2]/(gR)2, ..., AaY[p]/(gR)p de valor aY[i]/(gR)i determinado al dividir el valor AagR[i] en la secuencia AaYR[1], AaYR[2], ..., AaYR[p] de coeficientes de prediccion lineal cuantificados ajustados presentada a la salida por la unidad 140 de generacion de coeficientes de prediccion lineal cuantificados, por la iesima potencia del factor gR de ajuste, y la presenta a la salida. En la description que sigue, la serie AaY[1]/(gR), AaY[2]/(gR)2, ..., AaY[p]/(gR)p se denominara secuencia de coeficientes de prediccion lineal de ajuste inverso. El factor gR de ajuste se establece en el mismo valor que el factor gR de ajuste usado en la unidad 125 de ajuste de coeficientes de prediccion lineal.
La secuencia AaY[1]/(gR), AaY[2]/(gR)2, ..., AaY[p]/(gR)p de coeficientes de prediccion lineal de ajuste inverso presentada a la salida por la unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados, se introduce en la unidad 160 de generacion de LSP de ajuste inverso.
En la etapa S160, la unidad 160 de generacion de LSP ajustado inverso determina y presenta a la salida una serie de parametros de LSP, a0'[1], aq'[2], ..., A0'[p], a partir de la secuencia AaY[1]/(gR), AaY[2]/(gR)2, ..., AaY[p]/(gR)p de coeficientes de prediccion lineal de ajuste inverso presentada a la salida por la unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados. En la descripcion que sigue, la serie a0'[1], a0'[2], ..., A0'[p] de parametros de lSp se denominara secuencia de parametros de LSP de ajuste inverso. La secuencia a0'[1], a0'[2], ..., A0'[p] de parametros de LSP de ajuste inverso es una serie en donde los valores estan dispuestos en orden ascendente. Es decir, es una serie que satisface:
Figure imgf000014_0002
Los parametros a0'[1], a0'[2], ..., A0'[p] de LSP de ajuste inverso presentados a la salida por la unidad 160 de generacion de LSP de ajuste inverso, se introducen en la unidad 165 de entrada de retardo como secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados. Es decir, se usan los parametros a0'[1], a0'[2], ..., A0'[p] de LSP de ajuste inverso en vez de la secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados.
En la etapa S175, el aparato 1 de codificacion envla, por medio de la unidad 175 de salida, el codigo C1 de LSP presentado a la salida por la unidad 115 de codificacion de LSP, el codigo Cg de identification presentado a la salida por la unidad 120 de extraction de magnitud de caracterlstica, el codigo Cg de LSP ajustado presentado a la salida por la unidad 135 de codificacion de LSP ajustado, y cualesquiera de los codigos de senal en el dominio de la frecuencia presentados a la salida por la unidad 150 de codificacion en el dominio de la frecuencia, o los codigos de senal en el dominio del tiempo presentados a la salida por la unidad 170 de codificacion en el dominio del tiempo, para el aparato 2 de descodificacion.
<Aparato de descodificacion>
Segun se ha ilustrado en la Figura 6, el aparato 2 de descodificacion incluye una unidad 200 de entrada, una unidad 205 de descodificacion de codigos de identificacion, una unidad 210 de descodificacion de codigos de LSP, una unidad 215 de descodificacion de codigos de LSP ajustados, una unidad 220 de generacion de coeficientes de prediction lineal descodificados, una primera unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada, una unidad 230 de descodificacion en el dominio de la frecuencia, una unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados, una unidad 240 de generacion de LSP de ajuste inverso descodificado, una unidad 245 de entrada de retardo, una unidad 250 de descodificacion en el dominio del tiempo, y una unidad 255 de salida, por ejemplo.
El aparato 2 de descodificacion es un dispositivo especializado construido mediante incorporation de programas especiales en un ordenador conocido o dedicado que tiene una unidad central de procesamiento (CPU), memoria principal (memoria de acceso aleatorio o RAM), y similares, por ejemplo. El aparato 2 de descodificacion realiza varias clases de procesamiento bajo el control de la unidad central de procesamiento, por ejemplo. La entrada de datos al aparato 2 de descodificacion o los datos resultantes de varias clases de procesamiento, se almacenan en la memoria principal, por ejemplo, y los datos almacenados en la memoria principal se recuperan para su uso en otro procesamiento segun sea necesario. Al menos algunos de los componentes de procesamiento del aparato 2 de descodificacion pueden ser implementados mediante hardware tal como un circuito integrado.
<Metodo de descodificacion>
Con referencia a la Figura 7, se va a describir el metodo de descodificacion en la primera realization.
En la etapa S200, una secuencia de codigos, generada en el aparato 1 de codification, se introduce en el aparato 2 de descodificacion. La secuencia de codigos contiene el codigo C1 de LSP, el codigo Cg de identification, el codigo Cg de LSP ajustado, y cualesquiera otros codigos de senal en el dominio de la frecuencia o codigos de senal en el dominio del tiempo.
En la etapa S205, la unidad 205 de descodificacion de codigos de identificacion implementa un control de modo que la unidad 215 de descodificacion de codigos de LSP ajustados ejecutara el procesamiento consiguiente si el codigo Cg de identificacion contenido en la secuencia de codigos de entrada corresponde a information indicativa del metodo de codificacion en el dominio de la frecuencia, y de modo que la unidad 210 de descodificacion de codigos de LSP ejecutara el procesamiento consiguiente si el codigo Cg de identificacion corresponde a informacion indicativa del metodo de codificacion de en el dominio del tiempo.
La unidad 215 de descodificacion de codigos de LSP ajustados, la unidad 220 de generacion de coeficientes de prediccion lineal descodificados, la unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada, la unidad 230 de descodificacion en el dominio de la frecuencia, la unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados, y la unidad 240 de generacion de LSP ajustado inverso descodificado, se ejecutan cuando el codigo Cg de identificacion contenido en la secuencia de codigos de entrada corresponde a informacion indicativa del metodo de codificacion en el dominio de la frecuencia (etapa S206).
En la etapa S215, la unidad 215 de descodificacion de codigos de LSP ajustados obtiene una secuencia a9yr[1], A9yR[2j, ..., A9gR[p] de parametros de LSP ajustados descodificados mediante descodificacion del codigo Cg de LSP ajustado contenido en la secuencia de codigos de entrada, y la presenta a la salida. Es decir, obtiene y presenta a la salida una secuencia A9gR[1], A9gR[2], ..., A9gR[p] de parametros de LSP ajustados descodificados que es una secuencia de parametros de LSP correspondiente al codigo Cg de LSP ajustado. Se usan los mismos slmbolos debido a que la secuencia A9gR[1], a9yR[2], ..., A9gR[p] de parametros de LSP ajustados descodificados obtenida en este caso, es identica a la secuencia A9gR[1], a9yR[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados generada por el aparato 1 de codificacion si el codigo Cg de lSp ajustado presentado a la salida por el aparato 1 de codificacion se introduce de manera precisa en el aparato 2 de descodificacion sin que se vea afectado por errores de codigo o similares.
La secuencia A9gR[1], A9gR[2], ..., A9gR[p] de parametros de LSP ajustados descodificados presentada a la salida por la unidad 215 de descodificacion de codigos de LSP ajustados, se introduce en la unidad 220 de generacion de coeficientes de prediccion lineal descodificados.
En la etapa S220, la unidad 220 de generacion de coeficientes de prediccion lineal descodificados genera y presenta a la salida una serie de coeficientes de prediccion lineal, AagR[1], AagR[2], ..., AagR[p], a partir de la secuencia A9gR[1], A9gR[2], ..., A9gR[p] de parametros de LSP ajustados descodificados presentada a la salida por la unidad 215 de descodificacion de codigos de LSP ajustados. En la description que sigue, la serie AagR[1], AagR[2], ..., AagR[p] se denominara secuencia de coeficientes de prediccion lineal ajustados descodificados.
La secuencia AagR[1], AagR[2], ..., AagR[p] de coeficientes de prediccion lineal descodificados presentada a la salida por la unidad 220 de generacion de coeficientes de prediccion lineal descodificados se introduce en la primera unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada y en la unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados.
En la etapa S225, la primera unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada genera y presenta a la salida una serie aWyr[1], aWyr[2], ..., aWyr[N] de envolvente espectral de potencia alisada descodificada segun la Formula (8), usando cada coeficiente AaYR[i] en la secuencia AagR[1], AaYR[2], ..., AagR[p] de coeficientes de prediccion lineal ajustados descodificados presentada a la salida por la unidad 220 de generacion de coeficientes de prediccion lineal descodificados.
La serie awyr[1], awyr[2], ..., awyr[N] de envolvente espectral de potencia alisada descodificada presentada a la salida por la primera unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada, se introduce en la unidad 230 de descodificacion en el dominio de la frecuencia.
En la etapa S230, la unidad 230 de descodificacion en el dominio de la frecuencia descodifica los codigos de senal del dominio de la frecuencia contenidos en la secuencia de codigos de entrada, para determinar una secuencia XN[1], XN[2], ..., XN[N] de senales del dominio de la frecuencia normalizada descodificada. A continuacion, la unidad 230 de descodificacion en el dominio de la frecuencia obtiene una secuencia X[1], X[2], ..., X[N] de senales en el dominio de la frecuencia descodificadas, multiplicando cada valor XN[n] (n = 1, ..., N) de la secuencia XN[1], XN[2], ..., Xn[N] de senales del dominio de la frecuencia normalizadas descodificadas por la ralz cuadrada de cada valor AWgR[n] de la serie awyR[1], aw yR[2], ..., awyR[N] de envolvente espectral de potencia alisada descodificada, y la presenta la salida. Es decir, calcula X[n] = XN[n]DDsqrt(AWYR[n]). A continuacion convierte la secuencia X[1], X[2], ..., X[N] de senales del dominio de la frecuencia descodificadas, al dominio del tiempo, para obtener y presentar a la salida senales sonoras descodificadas.
En la etapa S235, la unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados determina y presenta a la salida una serie, AaYR[1]/(gR), AaYR[2]/(gR)2, ..., AaYR[p]/(gR)p, de valor AaY[i]/(gR)i dividiendo cada valor AagR[i] en la secuencia AagR[1], AagR[2], ..., AagR[p] de coeficientes de prediccion lineal ajustados descodificados presentada a la salida por la unidad 220 de generacion de coeficientes de prediccion lineal descodificados, por la iesima potencia del factor gR de ajuste. En la descripcion que sigue, la serie AagR[1]/(gR), AagR[2]/(gR)2, ..., AagR[p]/(gR)p se denominara secuencia de coeficientes de prediccion lineal de ajuste inverso descodificados. El factor gR de ajuste se establece como el mismo valor que el factor gR de ajuste usado en la unidad 125 de ajuste de coeficientes de prediccion lineal del aparato 1 de codificacion.
La secuencia AagR[1]/(gR), AagR[2]/(gR)2, ..., AagR[p]/(gR)p de coeficientes de prediccion lineal de ajuste inverso descodificados, presentada a la salida por la unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados, se introduce en la unidad 240 de generacion de LSP ajustado inverso descodificado.
En la etapa S240, la unidad 240 de generacion de LSP de ajuste inverso descodificado determina una serie a0'[1], a0'[2], ..., A0'[p] de parametros de LSP a partir de la secuencia AaYR[1]/(gR), AaYR[2]/(gR)2, ..., AaYR[p]/(gR)p de coeficientes de prediccion lineal de ajuste inverso descodificados, y la presenta a la salida. En la descripcion que sigue, la serie a0'[1], a0'[2], ..., A0'[p] de parametros de LSP se denominara secuencia de parametros de LSP de ajuste inverso descodificados.
Los parametros a0'[1], a0'[2], ..., A0'[p] de LSP de ajuste inverso descodificados presentada a la salida por la unidad 240 de generacion de LSP ajustado inverso descodificado, se introducen en la unidad 245 de entrada de retardo como secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP descodificados.
La unidad 210 de descodificacion de codigos de LSP, la unidad 245 de entrada de retardo y la unidad 250 de descodificacion en el dominio de la frecuencia, se ejecutan cuando el codigo Cg de identificacion contenido en la secuencia de codigos de entrada corresponde a informacion indicativa del metodo de codificacion en el dominio del tiempo (etapa S206).
En la etapa S210, la unidad 210 de descodificacion de codigos de LSP descodifica el codigo C l de LSP contenido en la secuencia de codigos de entrada, para obtener una secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP descodificados, y la presenta a la salida. Es decir, obtiene y presenta a la salida una secuencia a0[1], a0[2], ..., A0[p] de parametros de lSp descodificados, la cual es una secuencia de parametros de LSP correspondiente al codigo C l de LSP.
La secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP descodificados presentada a la salida por la unidad 210 de descodificacion de codigos de LSP, se introduce en la unidad 245 de entrada de retardo y en la unidad 250 de descodificacion en el dominio del tiempo.
En la etapa S245, la unidad 245 de entrada de retardo mantiene la secuencia a0[1], a0[2], ..., A0[p] de parametros de LSP descodificados de entrada y la presenta a la salida para la unidad 250 de descodificacion en el dominio del tiempo con un retardo equivalente a la duracion de una trama. Por ejemplo, si la trama actual es la fesima trama, la secuencia de parametros de LSP descodificados para la (f-1)esima trama, a0(M)[1], a0(m >[2], ..., A0f-1)[p], se presenta a la salida para la unidad 250 de descodificacion en el dominio del tiempo.
Cuando el codigo Cg de identificacion contenido en los codigos de entrada corresponde a informacion indicativa del metodo de codificacion en el dominio de la frecuencia, la secuencia A9’[1], A9’[2], A9'[p] de parametros de LSP de ajuste inverso descodificados, presentada a la salida por la unidad 240 de generacion de LSP de ajuste inverso descodificado, se introduce en la unidad 245 de entrada de retardo como secuencia A9[1], a9[2], ..., A9[p] de parametros de LSP descodificados.
En la etapa S250, la unidad 250 de descodificacion en el dominio del tiempo identifica las formas de onda contenidas en el libro de codigos adaptativos y las formas de onda en el libro de codigos fijos, a partir de los codigos de senal en el dominio del tiempo contenidos en la secuencia de codigos de entrada. Aplicando el filtro de slntesis a una senal generada por slntesis de las formas de onda en el libro de codigos adaptativos y las formas de onda en el libro de codigos fijos que han sido identificados, se determina una senal sintetizada a partir de la cual se ha eliminado el efecto de la envolvente espectral, y la senal sintetizada determinada se presenta a la salida como senal sonora descodificada.
Los coeficientes de filtro para el filtro de slntesis se generan usando la secuencia de parametros de LSP descodificados para la fesima trama, A9[1] a9[2] ..., A9[p], y la secuencia de parametros de LSP descodificados para la (f-1 )esima trama, A9(f-1)[1], A9(f-1)[2], ..., A9(f-1)[p].
Especlficamente, una trama se divide primero en dos subtramas, y los coeficientes de filtro para el filtro de slntesis se determinan como sigue.
En la ultima semi-subtrama, se usa una serie de valores
Figure imgf000017_0001
como coeficientes de filtro para el filtro de slntesis. Esta se obtiene multiplicando cada coeficiente Aa[i] de los coeficientes Aa[1], Aa[2], ..., Aa[p] de prediccion lineal descodificados, la cual es una secuencia de coeficientes generada por conversion de la secuencia de parametros de LSP descodificados para la f sima trama, A9[1], A9[2], ..., A9[p], a coeficientes de prediccion lineal, por la iesima potencia del factor gR de ajuste.
En la primera semi-subtrama, una serie de valores
Figure imgf000017_0002
que se obtiene al multiplicar cada coeficiente ~a[i] de los coeficientes ~a[1], ~a[2], ..., ~a[p] de prediccion lineal interpolados descodificados por la iesima potencia del factor gR de ajuste, se usa como coeficientes de filtro para el filtro de slntesis. Los coeficientes ~a[1], ~a[2], ..., ~a[p] de prediccion lineal interpolados descodificados son una secuencia de coeficientes generada al convertir, a coeficientes de prediccion lineal, la secuencia ~9[1], ~9[2], ..., ~9[p] de parametros de LSP interpolados descodificados, la cual es una serie de valores intermedios entre cada valor A9[i] en la secuencia de parametros de LSP descodificados para la f sima trama, A9[1] a9[2], ...., A9[p], y cada valor A9(f-1)[i] en la secuencia de parametros de LSP descodificados para la (f-1)e ‘ trama, 9ff-1)[1], 0(f-1)[2],
Es decir,
Figure imgf000017_0003
<Efectos de la primera realizacion>
La unidad 135 de codificacion de LSP ajustado del aparato 1 de codificacion, determina una secuencia a9yr[1], a9yr[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados tal que minimiza la distorsion de la cuantificacion entre la secuencia 9yr[1], 9yr[2], ..., 9gR[p] de parametros de LSP ajustados y la secuencia a9yr[1], a9yr[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados. Esta puede determinar la secuencia a9yr[1], a9yr[2], ..., a9yr[p] de parametros de LSP cuantificados ajustados de modo que una serie de envolvente espectral de potencia que tiene en cuenta el sentido de la audicion (es decir, que ha sido alisada con el factor gR de ajuste) se aproxime con una alta precision. La serie awyr[1], aw yr[2], ..., awyr[N] de envolvente espectral de potencia alisada cuantificada, la cual es una serie de envolvente espectral de potencia obtenida por expansion de la secuencia A9gR[1], a9yR[2], ..., A9gR[p] de parametros de LSP cuantificados ajustados en el dominio de la frecuencia, puede aproximarse a la serie WgR[1], Wyr[2], ..., Wyr[N] de envolvente espectral de potencia alisada con alta precision. Cuando la magnitud de codigo del codigo C1 de LSP es la misma que la del codigo Cy de LSP ajustado, la primera realizacion produce una distorsion de codificacion mas pequena en codificacion en el dominio de la frecuencia que la tecnica convencional. Adicionalmente, suponiendo una distorsion de codificacion igual a la del metodo de codificacion convencional, el codigo Cg de LSP ajustado consigue una magnitud de codigo bastante mas pequena, en comparacion con el metodo convencional, que el codigo C1 de LSP. De ese modo, con una distorsion de codificacion igual a la del metodo convencional, la magnitud de codigo puede reducirse en comparacion con el metodo convencional, mientras que con la misma magnitud de codigo que el metodo convencional, se puede reducir la distorsion de codificacion en comparacion con el metodo convencional.
<Segunda realizacion>
El aparato 1 de codificacion y el aparato 2 de descodificacion de la primera realizacion, son caros en terminos de calculo en la unidad 160 de generacion de LSP de ajuste inverso, y en particular la unidad 240 de generacion de LSP ajustado inverso descodificado. Para direccionar todo esto, un aparato 3 de codificacion en una segunda realizacion genera directamente una secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados, la cual es una serie de aproximaciones de los valores de la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados, a partir de la secuencia A0gR[l], A0gR[2], ..., A0gR[p] de parametros de LSP cuantificados ajustados sin la intermediacion de coeficientes de prediccion lineal. De forma similar, un aparato 4 de descodificacion en la segunda realizacion genera directamente una secuencia A0[1]app, A0[2]app , ..., A0[p]w de parametros de LSP aproximados descodificados que es una serie de aproximaciones de los valores de la secuencia A0[1 ], A0[2], ..., A0[p] de parametros de LSP descodificados, a partir de la secuencia A0gR[1], A0gR[2], ..., A0gR[p] de parametros de LSP ajustados descodificados sin la intermediacion de coeficientes de prediccion lineal.
<Aparato de codificacion>
La Figura 8 muestra la configuracion funcional del aparato 3 de codificacion de la segunda realizacion.
El aparato 3 de codificacion difiere del aparato 1 de codificacion de la primera realizacion en que no incluye la unidad 155 de ajuste inverso de coeficientes de prediccion lineal cuantificados, ni la unidad 160 de generacion de LSP ajustado inverso, pero incluye en cambio una unidad 300 de transformacion lineal de LSP.
Utilizando la naturaleza de los parametros de LSP, la unidad 300 de transformacion lineal de LSP aplica transformacion lineal aproximada a una secuencia a0yr [1], a0yr[2], ..., A0gR[p] de parametros de LSP cuantificados ajustados, para generar una secuencia A0[1]app, A0[2]app , ..., A0[p]w de parametros de LSP cuantificados aproximados.
En primer lugar, se va a describir la naturaleza de los parametros de LSP.
Aunque la unidad 300 de transformacion lineal de LSP aplica t5ransformacion aproximada a una serie de parametros de LSP cuantificados, se va a discutir en primer lugar la naturaleza de una secuencia de parametros de LSP sin cuantificar debido a que la naturaleza de una serie de parametros de LSP cuantificados es basicamente igual que la naturaleza de una secuencia de parametros de LSP sin cuantificar.
Una secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP es una secuencia de parametros en el dominio de la frecuencia que esta correlacionada con la envolvente espectral de potencia de la senal sonora de entrada. Cada valor en la secuencia de parametros de LSP esta correlacionado con la posicion en frecuencia del extremo de la envolvente espectral de potencia de la senal sonora de entrada. El extremo de la envolvente espectral de potencia esta presente en una posicion de frecuencia entre 0[i] y 0[i+1]; y con una pendiente mas pronunciada de una tangente alrededor del extremo, el intervalo entre 0[i] y 0[i+1] (es decir, el valor de 0[i+1] - 0[i]) se hace mas pequeno. En otras palabras, cuanto mas grande sea la diferencia de altura en las ondas de la amplitud de la envolvente espectral de potencia, el intervalo entre 0[i] y 0[i+1] resulta ser menor incluso para cada i (i = 1, 2, ..., p­ 1). A la inversa, cuando no existe apenas diferencia de altura en las ondas de la envolvente espectral de potencia, el intervalo entre 0[i] y 0[i+1] esta cerca de ser un intervalo igual para cada valor de i.
Segun se haga el factor g de ajuste mas pequeno, la diferencia de altura en las ondas de la amplitud de la serie Wg[1], Wy[2], ..., Wy[N] de envolvente espectral de potencia alisada, definida por la Formula (7), se hace mas pequena que la diferencia de altura en las ondas de la amplitud de la serie W[1], W[2], ..., W[N] de envolvente espectral de potencia definida por la Formula (6). Se puede decir por consiguiente que un valor mas pequeno del factor g de ajuste hace que el intervalo entre 0[i] y 0[i+1] este mas cerca de ser un intervalo igual. Cuando g no tiene ninguna influencia (es decir, g = 0), esto corresponde al caso de una envolvente espectral de potencia plana.
Cuando el factor de ajuste g = 0, los parametros 0g=o[1], 0g=o[2], ..., 0g=o[p] de LSP ajustados son:
Figure imgf000018_0001
en cuyo caso el intervalo entre 0[i] y 0[i+1] es igual para todo i = 1, ..., p-1. Cuando g = 1, la secuencia 0g=1[1], 0g=1[2], 9y=i[p] de parametros de LSP ajustados y la secuencia 9[1], 9[2], 0[p] de parametros de LSP, son equivalentes. Los parametros de LSP ajustados satisfacen la propiedad:
Figure imgf000019_0001
La Figura 9 es una ejemplo de la relacion entre el factor g de ajuste y el parametro 9g[i] (i = 1, 2, ..., p) de LSP ajustado. El eje horizontal representa el valor del factor g de ajuste y el eje vertical representa el valor del parametro de LSP ajustado. El punteado ilustra los valores de 9g[1], 9g[2], ..., 9g[16] por orden desde la parte inferior suponiendo el orden de prediccion p = 16. El valor de cada 9g[i] se deduce determinando una secuencia ag[1], ag[2], ..., a^p] de coeficientes de prediccion lineal ajustados para cada valor de g mediante un procesamiento similar al de la unidad 125 de ajuste de coeficientes de prediccion lineal mediante el uso de una secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal que ha sido obtenida por analisis de prediccion lineal sobre una determinada senal sonora de habla, y a continuacion convirtiendo la secuencia ag[1], ag[2], ..., a^p] de coeficientes de prediccion lineal ajustados en parametros de LSP mediante un procesamiento similar al de la unidad 130 de generacion de LSP ajustado. Cuando g = 1, 9g=1[i] es equivalente a 9[i].
Segun se ha mostrado en la Figura 9, dado 0<g<1, el parametro de LSP 9g[1] es un punto de division interna entre 9g=o[i] y 9g=1[i]. En un plano de dos dimensiones, donde el eje horizontal representa el valor del factor g de ajuste y el eje vertical representa el valor del parametro de LSP, cada parametro 9g[i] de LSP, cuando se ve localmente, esta en una relacion lineal con el incremento o el decremento de g. Dados dos factores g1 y g2 (0 < g1 < g2 < 1) de ajuste diferentes, la magnitud de la pendiente de una llnea recta que conecta un punto (g1, 9g1[1]) y un punto (g2, 9g2[1]) en el plano de dos dimensiones, esta correlacionada con el intervalo relativo entre los parametros de LSP que preceden y singuen a 9g1 [i] en la secuencia de parametros de LSP, 9g1[1], 9g1[2], ..., 9g1 [p] (es decir, 9g1[i-1] y 9g1[i+1], y 9g1 [i]. Especlficamente, cuando
Figure imgf000019_0002
entonces se conservan las siguientes propiedades:
Figure imgf000019_0005
y
Figure imgf000019_0006
Cuando
Figure imgf000019_0003
entonces se conservan las siguientes propiedades:
Figure imgf000019_0004
Las Formulas 9 y 10 indican que cuando 9g1 [i] esta mas cerca de 9g1[i+1] con respecto al punto medio entre 9g1 [i+1] y 9g1[i-1], 9g2[i] asumira un valor que es bastante mas cercano a 9g2[i+1] (Vease la Figura 10). Esto significa que en un plano de dos dimensiones, donde el eje horizontal es el valor g y donde el eje vertical es el valor del parametro de LSP, la pendiente de la llnea recta L2 que conecta el punto (g1, 9g1[1]) y el punto (g2, 9g2[i]) es mayor que la pendiente de la llnea recta L1 que conecta un punto (0, 9g=0[1]) y un punto (g1, 9g1 [1]) (vease la Figura 11).
Las Formulas (11) y (12) indican que cuando 9g1 [ 1 ] esta mas cerca de 9g1 [i-1 ] con respecto al punto medio entre 9g1 [i+1] y 9g1[i-1], 9g2[i] asumira un valor que esta bastante mas cerca de 9g2[i-1]. Esto significa que en un plano de dos dimensiones donde el eje horizontal es el valor g y el eje vertical es el valor del parametro de LSP, la pendiente de una linea recta que conecta el punto (g1, 0g1[i]) y el punto (g2, 0g2[i]) es mas pequena que la pendiente de una linea recta que conecta el punto (0, 0g=o[i]) y el punto (g1, 0gi[i]).
En base a las propiedades anteriores, la relacion entre 0gi[1], 0gi[2], ..., 0gi[p] y 0g2[1], 0g2[2], ..., 0g2[p] puede ser modelada con la Formula (13), donde Qg1 = (0g1 [1], 0g1[2], ..., 0g1[p]) y 0 g2 = (0g2[1], 0g2[2], ..., 0g2[p])T.
Figure imgf000020_0005
donde K es una matriz pxp definida por la Formula (14):
Figure imgf000020_0001
En este caso, se mantiene que 0<g1, g2<1, y g1^y2. Aunque las Formulas (9) a (12) describen las relaciones en la suposicion de que g1<g2, el modelo de la Formula (13) no tiene ninguna limitacion en cuanto a la relacion de magnitud entre g1 y g2; estas pueden ser cualquiera de g1<g2 o g1>g2.
La matriz K es una matriz de banda que tiene valores distintos de cero solamente en los componentes de la diagonal y en los elementos adyacentes a los mismos, y es una matriz que representa las correlaciones descritas con anterioridad que se mantienen entre los parametros de LSP correspondientes a los componentes de la diagonal y los parametros de LSP vecinos. Observese que aunque la Formula (14) ilustra una matriz de banda con un ancho de banda de tres, el ancho de banda no se limita a tres.
Suponiendo que
Figure imgf000020_0002
entonces:
Figure imgf000020_0003
es una aproximacion de 0 g2.
La Formula de expansion (13a) proporciona la Formula (15) que sigue:
Figure imgf000020_0004
donde i= 2, ..., p-1.
En un plano de dos dimensiones donde el eje horizontal representa el valor de g y el eje vertical representa el valor del parametro de LSP, se supone 0g2[i] indica el valor sobre el eje vertical correspondiente a g2 sobre una extension de linea recta L1 que conecta entre el punto (g1, 0g1 [i]) y el punto (0, 0g=o[i]), en particular el valor sobre el eje vertical correspondiente a g2 como aproximado mediante una aproximacion en ilnea recta desde la pendiente de la llnea recta L1 que conecta 9yi[i] y 9y=o[i].(vease la Figura 11). Entonces, se mantiene
Figure imgf000021_0001
Cuando y1>y2, esto significa interpolacion de llnea recta, mientras que cuando y1<y2, significa extrapolacion de llnea recta.
En la formula (14), dado que:
Figure imgf000021_0002
entonces ~9y2[i] = "9y2[i], y ~9y2[i] obtenido con el modelo de la Formula (13a) se empareja con la estimacion '9y2[i] del valor del parametro de LSP correspondiente a y2 como aproximado por aproximacion de llnea recta con una llnea recta que conecta el punto (y1, 9y1[i]) y el punto (o, 9y=o[i]) sobre el plano de dos dimensiones.
Dado que u y Vi son valores positivos iguales a, o menores que 1, suponiendo
Figure imgf000021_0003
en la Formula (14) anterior, la Formula (15) se puede reescribir como:
Figure imgf000021_0004
La Formula (17) significa ajustar el valor de -9y2[i] ponderando la diferencia entre el iesimo parametro 9y1 [i] de LSP en la secuencia 9y1[1], 9y1[2], ..., 9y1 [p] de parametros de LSP, y sus valores de parametro de LSP precedente y siguiente (es decir, 9y1 [i] - 9y1 [i-1] y 9y1 [i+1] - 9yi[1]) para obtener ~9y2[i]. Es decir, las correlaciones tales como las mostradas en las Formulas (9) a (12) anteriores se reflejan en los elementos de la porcion de banda (elementos distintos de cero) de la matriz K en la Formula (13a).
Los valores ~9y2[1], ~9y2[2], ..., ~9y2[p] dados por la Formula (13a), son valores aproximados (valores estimados) de los valores 9y2[1], 9y2[2], ..., 9y2[p] de parametros de LSP cuando la secuencia a[1]DD(T2), ..., a[p]DD(Y2)p de coeficientes de prediccion lineal se convierte a parametros de LSP.
Especialmente cuando y2>y1, la matriz de la Formula (14) tiende a tener valores positivos en los componentes de la diagonal y valores negativos en los elementos de las proximidades a la misma, segun se indicado mediante las Formulas (16) y (17).
La matriz K es una matriz preestablecida, la cual se aprende previamente usando datos de aprendizaje, por ejemplo. La manera de aprender la matriz K se va a discutir mas adelante.
Propiedades similares se aplican tambien a parametros de LSP cuantificados. Es decir, los vectores 0 Y10 y2 en la secuencia de parametros de LSP de la Formula (13), pueden ser sustituidos por vectores A0 yi A0 y2 en la secuencia de parametros de LSP cuantificados, respectivamente. Especlficamente, A0y1 = (A0y1[i], A0y1[2], ..., A0y1[p])T y AQy2 = (A0y2[1j, A0y2[2], ..., A0y2[p])T, entonces se cumple la siguiente formula:
Figure imgf000022_0001
Puesto que la matriz K es una matriz de banda, el coste de calculo requerido para calcular las Formulas (13), (13a) y (13b) es muy pequeno.
La unidad 300 de transformacion lineal de LSP incluida en el aparato 3 de codificacion de la segunda realizacion genera una secuencia A0[1]app, A0[2]app , ..., A0[p]w de parametros de LSP cuantificados aproximados a partir de la secuencia A0yR[1], A0yR[2], ..., A0yR[p] de parametros de LSP cuantificados ajustados basada en la Formula (13b). Observese que el factor yR de ajuste usado en la generacion de la secuencia a0yr[1], a0yr[2], ..., A0yR[p] de parametros de LSP cuantificados ajustados es igual que el factor yR de ajuste usado en la unidad 125 de ajuste de coeficientes de prediccion lineal.
Metodo de codificacion
Con referencia a la Figura 12, se va a describir el metodo de codificacion en la segunda realizacion. La descripcion que sigue se enfoca principalmente sobre las diferencias con la realizacion anterior.
El procesamiento realizado en la unidad 135 de codificacion de LSP ajustado es el mismo que en la primera realizacion. Sin embargo, la secuencia A0yR[1], A0yR[2], ..., A0yR[p] de parametros de LSP cuantificados ajustados presentada a la salida por la unidad 135 de codificacion de LSP ajustado, se introduce tambien en la unidad 300 de transformacion lineal de LSP ademas de en la unidad 140 de generacion de coeficientes de prediccion lineal cuantificados.
La unidad 300 de transformacion lineal de LSP, dado que A0y1 = (A0yR[1], a0yr[2], ..., A0yR[p])T, determina y presenta a la salida una secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados conforme a:
Figure imgf000022_0002
Es decir, usando la Formula (13b), la unidad 300 de transformacion lineal de LSP determina una serie de aproximaciones, A0[1]app, A0[2]app , ..., A0[p]app de la secuencia de parametros de LSP cuantificados. Puesto que y1 y y2 son constantes, la matriz K' que se genera al multiplicar los elementos individuales de la matriz K por (y2-y1) puede ser usada en lugar de la matriz K de la Formula (18), y la secuencia A0[1]app, A0[2]w , ..., A0[p]w de parametros de LSP cuantificados aproximados puede ser determinada tambien mediante:
Figure imgf000022_0003
La secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados presentada a la salida por la unidad 300 de transformacion lineal de LSP, se introduce en la unidad 165 de entrada de retardo como secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados. Es decir, en la unidad 170 de codificacion en el dominio del tiempo, cuando la magnitud de caracterlstica extralda por la unidad 120 de extraccion de magnitud de caracterlstica para la trama precedente es mas pequena que el umbral predeterminado (es decir, cuando la variacion temporal en la senal sonora de entrada sea pequena, es decir, cuando se haya realizado la codificacion en el dominio de la frecuencia), se usa la secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados para la trama precedente en lugar de la secuencia A9[1], A0[2], A9[p] de parametros de LSP cuantificados para la trama precedente.
<Aparato de descodificacion>
La Figura 13 muestra la configuracion funcional del aparato 4 de descodificacion en la segunda realizacion.
El aparato 4 de descodificacion difiere del aparato 2 de descodificacion de la primera realizacion en que no incluye la unidad 235 de ajuste inverso de coeficientes de prediccion lineal descodificados, ni la unidad 240 de generacion de LSP de ajuste inverso descodificado, sino que incluye en cambio una unidad 400 de transformacion lineal de LSP descodificado.
<Metodo de descodificacion>
Con referencia a la Figura 14, se va a describir el metodo de descodificacion de la segunda realizacion. La descripcion que sigue se enfoca principalmente a las diferencias con la realizacion anterior.
El procesamiento en la unidad 215 de descodificacion de codigos de LSP ajustados es el mismo que en la primera realizacion. Sin embargo, la secuencia A0yR[1], A0gR[2], ..., A0gR[p] de parametros de LSP ajustados descodificados presentada a la salida por la unidad 215 de descodificacion de codigos de LSP ajustados, se introduce tambien en la unidad 400 de transformacion lineal de LSP descodificado ademas de en la unidad 220 de generacion de coeficientes de prediccion lineal descodificados.
La unidad 400 de transformacion lineal de LSP descodificado determina una secuencia A0[1]app, A0[2]app , ..., A0[pLpp de parametros de LSP aproximados descodificados segun la Formula (18) con aqY1 = (A0yr[1], a0yr[2], ..., A0gR[p]) y la presenta a la salida. Es decir, se usa la Formula (13b) para determinar una serie de aproximaciones, A0[1]app, A0[2]app , ..., A0[p]app, de la secuencia de parametros de lSp descodificados. Al igual que con la unidad 300 de transformacion lineal de LSP, la secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP aproximados descodificados puede ser determinada mediante el uso de la Formula (18a).
La secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP aproximados descodificados presentada a la salida por la unidad 400 de transformacion lineal de LSP descodificado, se introduce en la unidad 245 de entrada de retardo como secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP descodificados. Esto significa que en la unidad 250 de descodificacion en el dominio del tiemplo, cuando el codigo Cg de identification para la trama precedente corresponde a information indicativa del metodo de codification en el dominio de la frecuencia, la secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados para la trama precedente se usa en lugar de la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP descodificados para la trama precedente.
<Proceso de aprendizaje para la matriz K de transformacion>
La matriz K de transformacion usada en la unidad 300 de transformacion lineal de LSP y en la unidad 400 de transformacion de LSP descodificado, se determina por adelantado mediante el proceso siguiente, y se prealmacena en almacenes (no representados) del aparato 3 de codificacion y del aparato 4 de descodificacion.
(Etapa 1). Para datos de muestra preparados para senales sonoras de habla correspondientes a M tramas, cada dato de muestra se somete a analisis de prediccion lineal para obtener coeficientes de prediccion lineal. Una secuencia de coeficientes de prediccion lineal producida por analisis de prediccion lineal del mesimo (1 < m < M) dato de muestra, se representa como a(m)[1], a(m)[2], ..., a(m)[p], y se menciona como secuencia a(m)[1], a(m)[2], ..., a(m)[p] de coeficientes de prediccion lineal correspondiente al mesimo dato de muestra.
(Etapa 2) Para cada m, se determinan parametros 0Y=i(m)[1], 0Y=i(m)[2], ..., 0Y=i(m)[p] de LSP a partir de la secuencia a(m)[1], a(m)[2], ..., a(m)[p] de coeficientes de prediccion lineal. Los parametros 0Y=i(m)[1], 0Y=1(m)[2], ..., 0Y=1(m)[p] de LSP se codifican de una manera similar a la unidad 115 de codificacion de LSP, generando con ello una secuencia A0Y=i (m)[1], A0Y=1(m)[2], ..., A0Y=1<m)[p] de parametros de LSP cuantificados. Aqul,
Figure imgf000023_0002
(Etapa 3) para cada m, estableciendo gL como una constante positiva predeterminada menor que 1 (por ejemplo, gL = 0,92), se calcula un coeficiente de prediccion lineal ajustado
Figure imgf000023_0001
(Etapa 4) Para cada m, se determina una secuencia 0YL(m)[1], ..., 0YL(m)[p] de parametros de LSP ajustados, a partir de la secuencia aYL(m)[1], ..., aYL(m)[p] de coeficientes de prediccion lineal ajustados. La secuencia 0YL(m)[1], ..., 0YL(m)[p] de parametros de LSP ajustados se codifica de una manera similar a la unidad 135 de codificacion de LSP ajustado, generando con ello una secuencia A9YL(m)[1], A9YL(m)[p] de parametros de LSP cuantificados. Aqul,
Figure imgf000024_0001
Mediante las Etapas 1 a 4, se obtienen M pares de secuencias (A0(m)yi, A0(m)g2) de parametros de LSP cuantificados. Esta configuracion se usa como conjunto Q de datos de aprendizaje, donde Q = {(A0(m)yi, A0(m)g2) | m = 1, ..., M}. Observese que todos los valores del factor gL de ajuste usados en la generacion del conjunto Q de datos de aprendizaje, son valores fijos comunes.
(Etapa 5) Cada par de secuencia (A0(m)gi, A0(m)g2) de parametros de LSP contenidas en los datos Q de aprendizaje, se sustituye por el modelo de la Formula (13b), donde g1 = gL, g2 = 1, y A0(m)gi = AQ(m)g2, y aq^ = AQ(m)g2, y los coeficientes para la matriz K se aprenden con el criterio de error cuadratico. Es decir, un vector en el que los componentes en la porcion de banda de la matriz K estan dispuestos por orden desde la parte superior, se define como:
Figure imgf000024_0002
y se obtiene B mediante:
Figure imgf000024_0003
Aqul,
Figure imgf000024_0004
Figure imgf000025_0001
El aprendizaje de la matriz K se realiza con el valor de gL fijado. Sin embargo, la matriz K usada en la unidad 300 de transformacion lineal de LSP no tiene que ser una que haya sido aprendida usando el mismo valor que el factor gR de ajuste usado en el aparato 3 de codificacion.
A tltulo de ejemplo, los valores obtenidos multiplicando (g2-g1) y los elementos de la porcion de banda de la matriz K generada por medio del metodo descrito con anterioridad dado que p = 15 y gL = 0,92, en particular los valores de los elementos de la porcion de banda de la matriz K, se muestran a continuacion. Es decir, los productos de los valores x1, x2, ..., x15, y1, y2, ..., y14, z2, z3, ..., z15 en la Formula (14) y g2-g1, son xx1, xx2, ..., xx15, yy1, yy2, ..., yy14, zz2, zz3, ..., zz15 que siguen:
xx1 = 1,11499, yy1 = -0,54272,
zz2 = -083414f, xx2 = 1,59810f, yy2 = -0,70966,
zz3 = -0,49432, xx3 = 1,38370, yy3 = -0,78076,
zz4 = -039319, xx4 = 1,23032, yy4 = -0,67921,
zz5 = -0,39166, xx5 = 1,18521, yy5 = -0,69088,
zz6 = -0,34784, xx6 = 1,04839, yy6 = -0,60619,
zz7 = -0,41279, xx7 = 1,13305, yy7 = -0,63247,
zz8 = -0,36450, xx8 = 0,95694, yy8 = -0,53039,
zz9 = -0,43984, xx9 = 1,01910, yy9 = -0,51707,
zz10 = -0,40120, xx10 = 0,90395, yy10 = -0,44594,
zz11 = -0,49262, xx11 = 1,07345, yy11 = -0,51892,
zz12 = -0,41695, xx12 = 0,96596, yy12 = -0,49247,
zz13 = -0,45002, xx13 = 1,00336, yy13 = -0,48790,
zz14 = -0,46854. Xx14 = 0,93258, yy14 = -0,41927,
zz15 = -0,45020, xx15 = 0,88783.
Cuando g2 > g1, como en el ejemplo anterior, en el que g1 = gL = 0,92 y g2 = 1, los componentes de la diagonal de la matriz K' asumen valores proximos a 1 como en el ejemplo anterior, mientras que los componentes vecinos a los componentes de la diagonal asumen valores negativos.
A la inversa, cuando g1 > g2, los componentes de la diagonal de la matriz K' asumen valores negativos como en el ejemplo que se muestra a continuacion, mientras que los componentes vecinos a los componentes de la diagonal asumen valores positivos. Los valores obtenidos al multiplicar (g2 - g1) y los elementos de la porcion de banda de la matriz K con p = 15, g1 = 1 y g2 = gL = 0,92, principalmente los valores de los elementos de la porcion de banda de la matriz K' pueden ser como se indica a continuacion, por ejemplo:
xx1 = -0,557012055, yy1 =m0,2138533042,
zz2 = 0,110112745, xx2 = -0,534830085, yy2 = 0,2440903,
zz3 = 0,149879603, xx3 = -0,522734808, yy3 = 0,23494022,
zz4 = 0,144479327, xx4 = -0533013231, yy4 = 0,259021145,
zz5 = 0,136523255, xx5 = -0,502606738, yy5 = 0,248139539,
zz6 = 0,138005088, xx6 = -0,478327709, yy6 = 0,244219107,
zz7 = 0,133771751, xx7 = -0,467186849, yy7 = 0,243988642,
zz8 = 0,13667916, xx8 = -0,408737408, yy6 = 0,192803054,
zz9 = 0,160602461, xx9 = -0,427436157, yy9 = 0,190554547,
zz10 = 0,147621742, xx10 = -0,383087812, yy10 = 0,165954888,
zz11 = 0,18358465, xx11 = -0,0434034351, yy11 = 0,183004742,
zz12 = 0,166249458, xx12 = -0,0409482196, yy12 = 0,170107295,
zz13 = 0,162343147, xx13 = -0,0409804718, yy13 = 0,165221097,
zz14 = 0,178158258, xx14 = -0,0400889431, yy14 = 0,123020055,
zz15 = 0,171958144, xx15 = -0,0447472325.
Cuando g1 > g2, esto corresponde a un caso en que A0 (m)g1 se establece como:
Figure imgf000025_0002
En la Etapa 2 de <Proceso de Aprendizaje para la Matriz K de Transformaci6n>, A0 (m)Y2 se establece como:
Figure imgf000026_0001
en la etapa 4, y cada par de secuencias (A0(m)y1, A©(m)g2) de parametros de LSP contenidas en los datos Q de aprendizaje, se sustituye por el modelo de la F6rmula (13b) con g1 = 1, g2 = gL, A0y1 = A©(m)g1 y a©^ = A©(m)g2, en la Etapa 5 y los coeficientes para la matriz K son aprendidos con el criterio de error cuadratico.
<Efectos de la segunda realizaci6n>
El aparato 3 de codificaci6n segun la segunda realizaci6n proporciona efectos similares a los del aparato 1 de codificaci6n de la primera realizaci6n debido a que, al igual que en la primera realizaci6n, tiene una configuraci6n en donde la unidad 900 de generaci6n de coeficientes de predicci6n lineal cuantificados, la unidad 905 de ajuste de coeficientes de predicci6n lineal cuantificados, y la unidad 910 de calculo de serie de envolvente espectral de potencia alisada aproximada del aparato 9 de codificaci6n convencional, se sustituyen por la unidad 125 de ajuste de coeficientes de predicci6n lineal, la unidad 130 de generaci6n de LSP ajustado, la unidad 135 de codificaci6n de LSP ajustado, la unidad 140 de generaci6n de coeficientes de predicci6n lineal cuantificados, y la primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada. Es decir, cuando la distorsi6n de codificaci6n es igual a la de un metodo convencional, la magnitud de c6digo puede ser reducida en comparaci6n con el metodo convencional, mientras que cuando la magnitud de c6digo es igual que en el metodo convencional, la distorsi6n de codificaci6n puede ser reducida en comparaci6n con el metodo convencional.
Adicionalmente, el costo de calculo del aparato 3 de codificaci6n en la segunda realizaci6n es bajo debido a que K es una matriz de banda en el calculo de la F6rmula (18). Sustituyendo la unidad 155 de ajuste inverso de coeficientes de predicci6n lineal cuantificados y la unidad 160 de generaci6n de LSP ajustado inverso en la primera realizaci6n por la unidad 300 de transformaci6n lineal de LSP, se puede generar una serie de aproximaciones de la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados con una cantidad mas pequena de calculo que en la primera realizaci6n.
<Modificaci6n de la segunda realizaci6n>
El aparato 3 de codificaci6n en la segunda realizaci6n decide si ha de codificar en el dominio del tiempo o en el dominio de la frecuencia en base a la magnitud de la variaci6n temporal en la senal sonora de entrada para cada trama. Sin embargo, incluso para una trama en la que la variaci6n temporal en la senal sonora de entrada sea grande y se haya seleccionado codificaci6n en el dominio de la frecuencia, es posible que realmente una senal sonora reproducida por codificaci6n en el dominio del tiempo conduzca a una distorsi6n mas pequena con relaci6n a la senal sonora de entrada que una senal reproducida por codificaci6n en el dominio de la frecuencia. De igual modo, incluso para una trama en la que la variaci6n temporal en la senal sonora de entrada sea pequena y se haya seleccionado codificaci6n en el dominio del tiempo, es posible que realmente una senal sonora reproducida por codificaci6n en el dominio de la frecuencia conduzca a una distorsi6n mas pequena en relaci6n con la senal sonora de entrada que una senal sonora reproducida por codificaci6n en el dominio del tiempo. Es decir, el aparato 3 de codificaci6n en la segunda realizaci6n no puede seleccionar siempre uno de los metodos de codificaci6n en el dominio del tiempo o en el dominio de la frecuencia, que proporcione una distorsi6n mas pequena en relaci6n con la senal sonora de entrada. Para direccionar todo esto, un aparato 8 de codificaci6n, en una modificaci6n de la segunda realizaci6n, realiza codificaci6n tanto codificaci6n en el dominio del tiempo como en el dominio de la frecuencia sobre cada trama y selecciona cualquiera de ellas que produzca una distorsi6n mas pequena en relaci6n con la senal sonora de entrada.
<Aparato de codificaci6n>
La Figura 15 muestra la configuraci6n funcional del aparato 8 de codificaci6n segun una modificaci6n de la segunda realizaci6n.
El aparato 8 de codificaci6n difiere del aparato 3 de codificaci6n de la segunda realizaci6n en que no incluye la unidad 120 de extracci6n de magnitud de caracterlstica e incluye una unidad 375 de selecci6n y salida de c6digos, en lugar de la unidad 175 de salida.
<Metodo de codificaci6n>
Con referencia a la Figura 16, se va a describir el metodo de codificaci6n en la modificaci6n de la segunda realizaci6n. La descripci6n que sigue se enfoca principalmente a las diferentes respecto a la segunda realizaci6n.
En el metodo de codificaci6n segun la modificaci6n de la segunda realizaci6n, la unidad 110 de generaci6n de LSP, la unidad 115 de codificaci6n de LSP, la unidad 125 de ajuste de coeficientes de predicci6n lineal, la unidad 130 de generaci6n de LSP ajustado, la unidad 135 de codificaci6n de LSP ajustado, la unidad 140 de generaci6n de coeficientes de predicci6n lineal cuantificados, la primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada, la unidad 165 de entrada de retardo y la unidad 300 de transformaci6n lineal de LSP, son tambien ejecutadas ademas de la unidad 100 de entrada y la unidad 105 de analisis de prediccion lineal para todas las tramas con independencia de si la variacion temporal en la senal sonora de entrada es grande o pequena. Las operaciones de esos componentes son las mismas que en la segunda realization. Sin embargo, la secuencia A9[1]app, A9[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados generada por la unidad 300 de transformation lineal de LSP, se introduce en la unidad 165 de entrada de retardo.
La unidad 165 de entrada de retardo mantiene la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados introducida desde la unidad 115 de codification de LSP, y la secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados introducida desde la unidad 300 de transformacion lineal de LSP al menos durante la duration de una trama. Cuando el metodo de codificacion en el dominio de la frecuencia ha sido seleccionado por la unidad 375 de selection y salida de codigos para la trama precedente (es decir, cuando el codigo Cg de identification presentado a la salida por la unidad 375 de seleccion y salida de codigo para la trama precedente es information indicativa del metodo de codificacion en el dominio de la frecuencia), la unidad 165 de entrada de retardo presenta a la salida la secuencia A0[1]app, A0[2]app , ..., A0[p]app de parametros de LSP cuantificados aproximados para la trama precedente introducida desde la unidad 300 de transformacion lineal de LSP para la unidad 170 de codificacion en el dominio del tiempo como secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados para la trama precedente. Cuando se ha seleccionado el metodo de codificacion en el dominio del tiempo por parte de la unidad 375 de seleccion y salida de codigo para la trama precedente (es decir, cuando el codigo Cg de identificacion presentado a la salida por la unidad 375 de seleccion y salida de codigo para la trama precedente es informacion indicativa del metodo de codificacion en el dominio del tiempo), la unidad 165 de entrada de retardo presenta a la salida la secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados para la trama precedente introducida desde la unidad 115 de codificacion de LSP para la unidad 170 de codificacion en el dominio del tiempo (etapa S165).
Al igual que con la unidad 150 de codificacion en el dominio de la frecuencia en la segunda realizacion, la unidad 150 de codificacion en el dominio de la frecuencia genera y presenta a la salida codigos de senal en el dominio de la frecuencia, y tambien determina y presenta a la salida la distorsion o un valor estimado de la distorsion de la senal sonora correspondiente a los codigos de senal en el dominio de la frecuencia con relation a la senal sonora de entrada. La distorsion, o una estimation de la misma, puede ser determinada ya sea o en dominio del tiempo o ya sea en el dominio de la frecuencia. Esto significa que la unidad 150 de codificacion en el dominio de la frecuencia puede determinar la distorsion o un valor estimado de la distorsion de una serie de senales sonoras en el dominio de la frecuencia correspondientes a codigos de senal en el dominio de la frecuencia con relacion a la serie de senales sonoras en el dominio de la frecuencia que se obtiene mediante conversion de la senal sonora de entrada al dominio de la frecuencia.
La unidad 170 de codificacion en el dominio del tiempo, al igual que la unidad 170 de codificacion en el dominio del tiempo en la segunda realizacion, genera y presenta a la salida codigos de senal en el dominio del tiempo, y tambien determina la distorsion, o un valor estimado de la distorsion, de la senal sonora correspondiente a los codigos de senal en el dominio del tiempo con relacion a la senal sonora de entrada.
La entrada a la unidad 375 de seleccion y salida de codigos la constituyen los codigos de senal en el dominio de la frecuencia generados por la unidad 150 de codificacion en el dominio de la frecuencia, la distorsion o un valor estimado de la distorsion determinada por la unidad 150 de codificacion en el dominio de la frecuencia, los codigos de senal en el dominio de tiempo generados por la unidad 170 de codificacion en el dominio del tiempo, y la distorsion o un valor estimado de la distorsion determinada por la unidad 170 de codificacion en el dominio del tiempo.
Cuando la distorsion o el valor estimado de la distorsion introducido desde la unidad 150 de codificacion en el dominio de la frecuencia es mas pequena que la distorsion o el valor estimado de la distorsion introducido desde la unidad 170 de codificacion en el dominio del tiempo, la unidad 375 de seleccion y salida de codigo presenta a la salida los codigos de senal en el dominio de la frecuencia y el codigo Cg de identificacion que es informacion indicativa del metodo de codificacion en el dominio de la frecuencia. Cuando la distorsion o el valor estimado de la distorsion introducido desde la unidad 150 de codificacion en el dominio de la frecuencia es mayor que la distorsion o un valor estimado de la distorsion introducido desde la unidad 170 de codificacion en el dominio del tiempo, la unidad 375 de seleccion y salida de codigo presenta a la salida los codigos de senal en el dominio del tiempo y el codigo Cg de identificacion que es informacion indicativa del metodo de codificacion en el dominio del tiempo. Cuando la distorsion o un valor estimado de la distorsion introducido desde la unidad 150 de codificacion en el dominio de la frecuencia es igual a la distorsion o un valor estimado de la distorsion introducido desde la unidad 170 de codificacion en el dominio del tiempo, la unidad 375 de seleccion y salida de codigo presenta a la salida ya sea los codigos de senal en el dominio del tiempo o ya sea los codigos de senal en el dominio de la frecuencia conforme a reglas predeterminadas, as! como el codigo Cg de identificacion que es informacion indicativa del metodo de codificacion correspondiente a los codigos que estan en la salida. Es decir, de los codigos de senal en el dominio de la frecuencia introducidos desde la unidad 150 de codificacion en el dominio de la frecuencia y de los codigos de senal en el dominio del tiempo introducidos desde la unidad 170 de codificacion en el dominio del tiempo, la unidad 375 de seleccion y salida de codigo presenta a la salida uno cualquiera que conduce a una distorsion mas pequena de la senal sonora reproducida a partir de los codigos relativos a la senal sonora de entrada, y tambien presenta a la salida informacion indicativa del metodo de codificacion que produce una distorsion mas pequena como codigo Cg de identification (etapa S375).
La unidad 375 de selection y salida de codigo puede estar configurada tambien para seleccionar una cualquiera de las senales sonoras reproducidas a partir de los codigos respectivos que tenga una distorsion mas pequena con relation a la senal sonora de entrada. En una configuration de ese tipo, la unidad 150 de codificacion en el dominio de la frecuencia y la unidad 170 de codificacion en el dominio del tiempo, reproducen senales sonoras a partir de los codigos y las presentan a la salida en vez de la distorsion o un valor estimado de la distorsion. La unidad 375 de seleccion y salida de codigo presenta a la salida ya sea la senal sonora reproducida por la unidad 150 en el dominio de la frecuencia o ya sea la senal sonora reproducida por la unidad 170 de codificacion en el dominio del tiempo, respectivamente, a partir de los codigos de senal en el dominio de la frecuencia y de los codigos de senal en el dominio del tiempo, que tenga una distorsion mas pequena con relacion a la senal sonora de entrada, y tambien presenta a la salida informacion indicativa del metodo de codificacion que produce una distorsion mas pequena como codigo Cg de identificacion.
Alternativamente, la unidad 375 de seleccion y salida de codigo puede estar configurada para la seleccion de uno cualquiera que tenga una magnitud de codigo mas pequena. En una configuracion de ese tipo, la unidad 150 de codificacion en el dominio de la frecuencia presenta a la salida codigos de senal en el dominio de la frecuencia como en la segunda realization. La unidad 170 de codificacion en el dominio del tiempo presentas a la salida codigos de senal en el dominio del tiempo como en la segunda realizacion. La unidad 375 de seleccion y salida de codigo presenta a la salida ya sea los codigos de senal en el dominio de la frecuencia o ya sea los codigos de senal en el dominio del tiempo, que tienen una magnitud de codigo mas pequena, y tambien presenta a la salida informacion indicativa del metodo de codificacion que produce una magnitud de codigo mas pequena como codigo Cg de identificacion.
<Aparato de descodificacion>
Una secuencia de codigos presentada a la salida por el aparato 8 de codificacion en la modification de la segunda realizacion, puede ser descodificada por el aparato 4 de descodificacion de la segunda realizacion al igual que en el caso de una secuencia de codigos presentada a la salida por el aparato 3 de codificacion de la segunda realizacion.
<Efectos de modificacion de la segunda realizacion>
El aparato 8 de codificacion en la modificacion de la segunda realizacion proporciona efectos similares a los del aparato 3 de codificacion de la segunda realizacion, y ademas tiene el efecto de reducir la magnitud de codigo a la salida en comparacion con el aparato 3 de codificacion de la segunda realizacion.
[Tercera realizacion]
El aparato 1 de codificacion de la primera realizacion y el aparato 3 de codificacion de la segunda realizacion, convierten una vez la secuencia a9yr[1], A9yR[2], ..., A9yR[p] de parametros de LSP cuantificados ajustados a coeficientes de prediction lineal y a continuation calculan la serie awyr[1], awyr[2], ..., awyr[N] de envolvente espectral de potencia alisada cuantificada. Un aparato 5 de codificacion en la tercera realizacion calcula directamente la serie awyR[1], aw yR[2], ..., awyR[N] de envolvente espectral de potencia alisada cuantificada a partir de la secuencia a9yr[1], a9yr[2], ..., a9yr[p] de parametros de LSP cuantificados ajustados sin convertir la secuencia de parametros de LSP cuantificados ajustados a coeficientes de prediccion lineal. De forma similar, un aparato 6 de descodificacion en la tercera realizacion, calcula directamente la serie awyr[1], awyr[2], ..., awyr[N] de envolvente espectral de potencia alisada descodificada a partir de la secuencia a9yR[1], a9yR[2], ..., A9gR[p] de parametros de LSP ajustados descodificados sin convertir la secuencia de parametros de LSP ajustados descodificados a coeficientes de prediccion lineal.
<Aparato de codificacion>
La Figura 17 muestra la configuracion funcional del aparato 5 de codificacion segun la tercera realizacion.
El aparato 5 de codificacion difiere del aparato 3 de codificacion de la segunda realizacion en que no incluye la unidad 140 de generation de coeficientes de prediccion lineal cuantificados, ni la primera unidad 145 de calculo de serie de envolvente espectral de potencia alisada cuantificada, sino que incluye en cambio una segunda unidad 146 de calculo de serie de envolvente espectral de potencia alisada cuantificada.
<Metodo de codificacion>
Con referencia a la Figura 18, se va a describir el metodo de codificacion de la tercera realizacion. La description que sigue se enfoca principalmente a las diferencias respecto a las realizaciones anteriores.
En la etapa S146, la segunda unidad 146 de calculo de serie de envolvente espectral de potencia alisada cuantificada usa los parametros a9yr[1], a9yr[2], ..., a9yr[p] de LSP cuantificados ajustados presentados a la salida por la unidad 135 de codificacion de lSp ajustado, para determinar una serie awyr[1], awyr[2], ..., awyr[N] de envolvente espectral de potencia alisada cuantificada segun la Formula (19), y la presenta a la salida.
Figure imgf000029_0001
<Aparato de descodificacion>
La Figura 19 muestra la configuracion funcional del aparato 6 de descodificacion de la tercera realizacion.
El aparato 6 de descodificacion difiere del aparato 4 de descodificacion de la segunda realizacion en que no incluye la unidad 220 de generacion de coeficientes de prediccion lineal descodificados, ni la primera unidad 225 de calculo de serie de envolvente espectral de potencia alisada descodificada, sino que incluye en cambio una segunda unidad 226 de calculo de serie de envolvente espectral de potencia alisada descodificada.
<Metodo de descodificacion>
Con referencia a la Figura 20, se va a describir el metodo de descodificacion de la tercera realizacion. La description que sigue se enfoca principalmente a las diferencias respecto a las realizaciones anteriores.
En la etapa S226, al igual que con la segunda unidad 146 de calculo de serie de envolvente espectral de potencia alisada cuantificada, la segunda unidad 226 de calculo de serie de envolvente espectral de potencia alisada descodificada usa la secuencia a9yr[1], A9yR[2], ..., a9yr[p] de parametros de LSP ajustados descodificados para determinar una serie awyr[1], awyr[2], ..., awyr[N] de envolvente espectral de potencia alisada descodificada segun la Formula (19) que antecede, y la presenta a la salida.
[Cuarta realizacion]
La secuencia a9[1], a9[2], ..., A9[p] de parametros de LSP cuantificados es una serie que satisface
Figure imgf000029_0002
Es decir, es una serie en la que los parametros estan dispuestos en orden ascendente. Mientras tanto, la secuencia a9[1 ]app, A9[2]app , ..., A9[p]app de parametros de LSP cuantificados aproximados generada por la unidad 300 de transformation lineal de LSP, se produce mediante transformation aproximada, de modo que no podrla estar en orden ascendente. Para direccionar todo esto, la cuarta realizacion anade procesamiento para reordenar la secuencia A9[1]app, A9[2]app , ..., A9[p]app de parametros de LSP cuantificados aproximados presentada a la salida por la unidad 300 de transformacion lineal de LSP en orden ascendente.
<Aparato de codificacion>
La Figura 21 muestra la configuracion funcional de un aparato 7 de codification en la cuarta realizacion.
El aparato 7 de codificacion difiere del aparato 5 de codificacion de la segunda realizacion en que incluye ademas una unidad 700 de modification de serie de LSP aproximado.
<Metodo de codificacion>
Con referencia a la Figura 22, se va a describir el metodo de codificacion de la cuarta realizacion. La descripcion que sigue se enfoca principalmente a las diferencias con las realizaciones anteriores.
La unidad 700 de modificacion de serie de LSP aproximada presenta a la salida una serie en la que los valores A9[i]app en la secuencia A9[1]app, A9[2]app , ..., A9[p]app de parametros de LSP cuantificados aproximados presentada a la salida por la unidad 300 de transformacion lineal de LSP, han sido reordenados en orden ascendente a modo de secuencia A9'[1]app, A9'[2]app , ..., A9'[p]app de parametros de LSP cuantificados aproximados modificados. La primera secuencia A9'[1]app, A9'[2]app , ..., A9'[p]app de parametros de LSP cuantificados aproximados modificada, presentada a la salida por la unidad 700 de modificacion de serie de LSP aproximada, se introduce en la unidad 165 de entrada de retardo como secuencia a9[1], a9[2], ..., A9[p] de parametros de LSP cuantificados.
Adicionalmente a la mera reordenacion de los valores en la secuencia de parametros de LSP cuantificados aproximados, cada valor A9[i]app puede ser ajustado como A9'[i]app de tal modo que |A9[i+1]app - A9[i]app| sea igual a, o mayor que, un umbral predeterminado para cada valor de i = 1, ..., p-1.
[Modification]
Mientras que las realizaciones anteriores han sido descritas suponiendo el uso de parametros de LSP, se puede emplear una secuencia de parametros de ISP en vez de una secuencia de parametros de LSP. Una secuencia ISP[1], ..., ISP[p] de parametros de ISP es equivalente a una ^serie consistente en una secuencia de parametros de LSP de orden (p-1)esim° y coeficientes kp PARCOR de orden pesim° (el orden mayor). Es decir,
y
Figure imgf000030_0001
El procesamiento especlfico va a ser ilustrado para un caso en que la entrada a la unidad 300 de transformation lineal de LSP es una secuencia de parametros de ISP en la segunda realization.
Supongase que la entrada a la unidad 300 de transformation lineal de LSP es una secuencia AISPyR[1], AISPyR[2], ..., AISPyR[p] de parametros de ISP cuantificados ajustados. Aqul,
Figure imgf000030_0002
y
Figure imgf000030_0005
El valor Akp es el valor de kp cuantificado.
La unidad 300 de transformation lineal de LSP determina una secuencia AISP[1]app, ..., AISP[p]app de parametros de ISP cuantificados aproximados mediante el proceso que sigue, y la presenta a la salida.
(Etapa 1) Dado aqy1 = (aispyr[1], ..., aispyr[p-1])t , p se sustituye por p-1, y A0[1]app, ..., A0[p-1]app se determinan calculando la Formula (18). Aqul,
Figure imgf000030_0003
(Etapa 2) Se determina AISP[p]app definido por la formula que sigue:
Figure imgf000030_0004
[Quinta realization]
La unidad 300 de transformation lineal de LSP incluida en los aparatos 3, 5, 7, 8 de codification y la unidad 400 de transformation lineal de LSP descodificado incluida en los aparatos 4, 6 de descodificacion, pueden ser tambien implementadas como aparatos separados de generation de secuencia de parametros en el dominio de la frecuencia.
La description que sigue ilustra un caso en que la unidad 300 de transformation lineal de LSP incluida en los aparatos 3, 5, 7, 8 de codificacion y la unidad 400 de transformacion lineal de LSP descodificado incluida en los aparatos 4, 6 de descodificacion, se implementan como aparatos separados de generacion de secuencia de parametros en el dominio de la frecuencia.
<Aparato de generation de secuencia de parametros en el dominio de la frecuencia>
Un aparato 10 de generation de secuencia de parametros en el dominio de la frecuencia conforme a la quinta realization, incluye una unidad 20 de conversion de secuencia de parametros por ejemplo, segun se muestra en la Figura 23, y recibe parametros w[1], w[2], ..., w[p] del dominio de la frecuencia como entrada, y presenta a la salida parametros ~w[1], ~w[2], ..., ~w[p] en el dominio de la frecuencia convertidos.
Los parametros w[1], w[2], ..., w[p] del dominio de la frecuencia que van a ser introducidos, son una secuencia de parametros en el dominio de la frecuencia deducida a partir de coeficientes de prediction lineal, a[1], a[2], ..., a[p], los cuales se obtienen mediante analisis de prediction lineal de senales sonoras en un segmento de tiempo predeterminado. Los parametros w[1], w[2], ..., w[p] del dominio de la frecuencia pueden ser una secuencia 0[1], 0[2], ..., 0[p] de parametros de LSP usada en metodos de codification convencionales, o una secuencia A0[1], a0[2], ..., A0[p] de parametros de LSP cuantificados, por ejemplo. Alternativamente, estos pueden ser la secuencia 0 ^1 ], 0yr[2], ..., 0yR[p] de parametros de LSP ajustados o la secuencia a0yr[1], a0yr[2], ..., A0gR[p] de parametros de LSP cuantificados ajustados, usada en las realizaciones mencionadas con anterioridad, por ejemplo. Ademas, estos pueden ser parametros del dominio de la frecuencia equivalentes a parametros de lSp , tal como la secuencia de parametros de ISP descrita en la modificacion anterior, por ejemplo. Una secuencia de parametros en el dominio de la frecuencia deducida a partir de los coeficientes a[1], a[2], ..., a[p] de prediccion lineal, son una serie en el dominio de la frecuencia deducida a partir de una secuencia de coeficientes de prediccion lineal y representada por el mismo numero de elementos que el orden de prediccion, tipificada mediante una secuencia de parametros de LSP, una secuencia de parametros de ISP, una secuencia de parametros de LSF, o una secuencia de parametros de ISF, cada una de ellas deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, o una secuencia de parametros en el dominio de la frecuencia en la que todos los parametros w[1], w[2], ..., w[p-1] del dominio de la frecuencia estan presentes desde 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, los parametros w[1], w[2], ..., w[p-1] del dominio de la frecuencia estan presentes desde 0 a n a intervalos iguales.
La unidad 20 de conversion de secuencia de parametros, de forma similar a la unidad 300 de transformacion lineal de LSP y a la unidad 400 de transformacion lineal de LSP descodificado, aplica transformacion lineal aproximada a la secuencia w[1], w[2], ..., w[p-1] de parametros del dominio de la frecuencia haciendo uso de la naturaleza de los parametros de LSP para generar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos. La unidad 20 de conversion de secuencia de parametros determina el valor del parametro ~w[i] en el dominio de la frecuencia convertido segun uno de los metodos que se muestran a continuacion para cada i = 1,2, ..., p, por ejemplo:
1. El valor del parametro ~w[i] en el dominio de la frecuencia convertido, se determina mediante transformacion lineal que se basa en la relacion de valores entre w[i] y uno o mas parametros del dominio de la frecuencia adyacentes a w[i]. Por ejemplo, la transformacion lineal se realiza de modo que los intervalos entre valores de parametros sean mas uniformes o menos uniformes en la secuencia ~w[i] de parametros en el dominio de la frecuencia convertidos que en la secuencia w[i] de parametros en el dominio de la frecuencia. La transformacion lineal que hace que el intervalo de parametro sea mas uniforme, corresponde al procesamiento que aplana las ondas de la amplitud de la envolvente espectral de potencia en el dominio de la frecuencia (procesamiento para alisar la envolvente espectral de potencia). La transformacion lineal que hace que el intervalo de parametro sea menos uniforme, corresponde al procesamiento que enfatiza la alta diferencia en las ondas de la amplitud de la envolvente espectral de potencia en el dominio de la frecuencia (procesamiento para quitar la envolvente espectral de potencia).
2. Cuando w[i] esta mas cerca de w[i+1] con relacion al punto medio entre w[i+1] y w[i-1], entonces ~w[i] se determina de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor ~w[i+1] - ~w[i] sea mas pequeno que w[i+1] - w[i]. Cuando w[i esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces ~w[i] se determina de modo que ~w[i] este mas cerca de ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] - ~w[i-1] sea menor que w[i] - w[i-1]. Esto corresponde al procesamiento que enfatiza la diferencia de altura en las ondas de la amplitud de la envolvente espectral de potencia en el dominio de la frecuencia (procesamiento para quitar la envolvente espectral de potencia).
3. Cuando w[i] esta mas cerca de w[i+1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor ~w[i+1] - ~w[i] sea mayor que w[i+1] - w[i]. Cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces ~w[i] se determina de modo que ~w[i] este mas cerca de ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1] y que el valor de ~w[i] - ~w[i-1] sea mayor que w[i] - w[i-1]. Esto corresponde al procesamiento que aplana las ondas de la amplitud de la envolvente espectral de potencia en el dominio de la frecuencia (procesamiento para alisar la envolvente espectral de potencia).
Por ejemplo, la unidad 20 de conversion de secuencia de parametros determina los parametros ~w[1], ~w[2], ..., ~w[p] del dominio de la frecuencia convertidos conforme a la Formula (20) que sigue, y la presenta a la salida.
Figure imgf000032_0001
Aqul, g1 y g2 son coeficientes positivos iguales o menores que 1. La Formula (20) puede ser deducida estableciendo 0 Y1 = (w[1], w[2], ..., w[p])T y 0 y2 = (~w[1], ~w[2], ..., ~w[p])T en la Formula (13), la cual modela parametros de LSP y que define
Figure imgf000032_0002
En este caso, los parametros w[1], w[2], ..., w[p] en el dominio de la frecuencia son una secuencia de parametros en el dominio de la frecuencia o los valores cuantificados de los mismos equivalentes a:
Figure imgf000032_0003
que es una secuencia de coeficientes que han sido ajustados multiplicando cada coeficiente a[i] de los coeficientes a[1], a[2], ..., a[p] de prediccion lineal, por la iesima potencia del factor g1. Los parametros ~w[1], ~w[2], ..., ~w[p] en el dominio de la frecuencia convertidos, son una serie que se aproxima a una secuencia de parametros en el dominio de la frecuencia equivalente a:
Figure imgf000032_0004
que es una secuencia de coeficientes que ha sido ajustada multiplicando cada coeficiente a[i] de los coeficientes a[1], a[2], ..., a[p] de prediccion lineal por la iesima potencia del factor g2.
<Efectos de la quinta realizacion>
Al igual que con los aparatos 3, 5, 7, 8 de codificacion o los aparatos 4, 6 de descodificacion, el aparato de generacion de secuencia de parametros en el dominio de la frecuencia en la quinta realization esta capacitado paras determinar parametros en el dominio de la frecuencia convertidos, a partir de parametros en el dominio en el dominio de la frecuencia con una cantidad de calculo mas pequena que cuando se determinan parametros en el dominio de la frecuencia convertidos a partir de parametros en el dominio de la frecuencia por medio de coeficientes de prediccion lineal como en el aparato 1 de codificacion y en el aparato 2 de descodificacion.
La presente invention no se limita a las realizaciones descritas con anterioridad y no hace falta decir que pueden hacerse modificaciones, segun sea necesario, sin apartarse del alcance de la invencion. Las diversas clases de procesamiento ilustradas en las realizaciones anteriores podrlan ser tambien llevadas a cabo en paralelo o por separado conforme a la capacidad de procesamiento del dispositivo que las ejecuta o de una necesidad determinada ademas de ser llevadas a cabo cronologicamente en los ordenes descritos en la presente memoria.
<Programa y soporte de grabacion>
Cuando las diversas funciones de procesamiento de los aparatos descritos en las realizaciones se implementan mediante un ordenador, los detalles de procesamiento de las funciones que se supone que van a ser proporcionadas en los aparatos se describen mediante un programa. El programa se ejecuta a continuacion mediante el ordenador de modo que se implementan varias funciones de procesamiento de los aparatos individuales o del ordenador.
Un programa que describe los detalles de procesamiento puede estar grabado en soporte de grabacion legible con ordenador. El soporte de grabacion legible con ordenador puede ser cualquier clase de medio, tal como un dispositivo de grabacion magnetica, un disco optico, un soporte de grabacion magneto-optico, y memoria semiconductora, por ejemplo.
Un programa de ese tipo puede ser distribuido mediante venta, concesion o prestamo de un soporte de grabacion portable, tal como un DVD o un CD-ROM, por ejemplo, que tenga el programa grabado en el mismo. Alternativamente, el programa puede estar almacenado en un dispositivo de almacenaje en un ordenador de un servidor y transferido a otros ordenadores a partir del ordenador del servidor a traves de una red con el fin de distribuir el programa.
Cuando un ordenador debe ejecutar un programa de ese tipo, el ordenador almacena en primer lugar el programa grabado en un soporte de grabacion portable o el programa se transfiere desde el ordenador del servidor una vez en su propio dispositivo de almacenaje, por ejemplo. A continuacion, cuando lleva a cabo el procesamiento, el ordenador lee el programa almacenado en su soporte de grabacion y realiza el procesamiento conforme al programa que haya sido leldo. Como forma alternativa de ejecucion del programa, el ordenador puede leer directamente el programa desde un soporte de grabacion portable y realizar el procesamiento conforme al programa, o el ordenador puede realizar un procesamiento secuencialmente conforme a un programa que haya recibido cada vez que se transfiere un programa desde el ordenador del servidor hasta el ordenador. El procesamiento descrito con anterioridad puede tambien ser implementado como lo que se conoce como servicio de un proveedor de servicio de aplicacion (ASP), el cual implementa funciones de procesamiento solamente mediante peticiones de ejecucion y adquisicion de resultados sin transferencia de programas desde el ordenador de un servidor hasta un ordenador. Los programas en las realizaciones descritas en la presente memoria estan destinados a contener informacion que se usa en procesamiento mediante un ordenador electronico y subordinados a programas (tal como datos que no sean una instruccion directa en un ordenador sino que tengan propiedades que controlen el procesamiento del ordenador).
Adicionalmente, mientras que los aparatos de la presente invencion han sido descritos como que estan implementados a traves de la ejecucion de programas predeterminados en un ordenador en tales realizaciones, al menos parte de esos detalles de procesamiento pueden tambien ser implementados mediante hardware.

Claims (19)

REIVINDICACIONES
1. Un metodo de generacion de secuencia de parametros en el dominio de la frecuencia, que comprende:
cuando p es un numero entero igual o mayor que 1, y una secuencia de coeficientes de prediccion lineal obtenida mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado esta representada como a[1], a[2], ..., a[p];
w[1], w[2], ..., w[p] es uno de una secuencia de parametros de par de espectro de llnea, LSP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal,
una secuencia LSF de parametros de frecuencias de LSP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
una secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en la que todos los w[1], w[2], ..., w[p] estan presentes desde 0 hasta n, y cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, w[1], w[2], ..., w[p] estan presentes desde 0 hasta n a intervalos iguales; y,
cada uno de g1 y g2 es una constante positiva igual o menor que 1, se mantiene g1 = g2, y K es una matriz de banda pxp predeterminada en la que solamente los elementos de la diagonal y los elementos que son vecinos a los elementos de la diagonal en la direccion de fila, tienen valores distintos de cero,
una etapa de conversion de secuencia de parametros para la generacion de una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos, definida por la formula siguiente:
Figure imgf000034_0001
2. Un metodo de generacion de secuencia de parametros en el dominio de la frecuencia, que comprende:
cuando p es un numero entero igual o mayor que 1, y una secuencia de coeficientes de prediccion lineal obtenida mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado esta representada como a[1], a[2], ..., a[p];
w[1], w[2], ..., w[p] es uno de:
una secuencia ISP de parametros de pares de espectro de inmitancia, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
una secuencia ISF de parametros de frecuencias de ISP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
cada uno de g1 y g2 es una constante positiva igual o menor que 1, se mantiene g1 = g2, y K es una matriz de banda (p-1)x(p-1) predeterminada en la que solamente los elementos de la diagonal y los elementos que son vecinos de los elementos de la diagonal en la direccion de fila, tienen valores distintos de cero,
una etapa de conversion de secuencia de parametros para la generacion de una secuencia ~w[1], ~w[2], ..., ~w[p-1] de parametros en el dominio de la frecuencia convertidos, definida por la formula siguiente:
Figure imgf000035_0001
3. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 1 o 2, en donde,
la matriz K de banda tiene valores positivos en los elementos de la diagonal y valores negativos en los elementos que son vecinos a los elementos de la diagonal en la direccion de fila.
4. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 1 o 2, en donde,
la matriz K de banda tiene valores negativos en los elementos de la diagonal y valores positivos en elementos que son vecinos a los elementos de la diagonal en la direccion de fila.
5. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 1, donde w[1], w[2], ..., w[p] es la secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en el que todos los w[1], w[2], ..., w[p] estan presentes de 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, estan presentes w[1], w[2], ..., w[p] desde 0 a n a intervalos iguales, la etapa de conversion de secuencia de parametros para determinar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos usa la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada, y en donde la etapa de conversion de secuencia de parametros determina cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos de tal modo que, cuando w[i] esta mas cerca de w[i+1] con relacion a un punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i+1] - ~w[i] sea mas pequeno que w[i+1] - w[i], y
cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] -~w[i-1] sea mas pequeno que w[i] - w[i-1].
6. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 5, en donde,
la matriz K de banda tiene valores positivos en los elementos de la diagonal y valores negativos en los elementos que son vecinos de los elementos de la diagonal en la direccion de fila.
7. El metodo de generacion de secuencia de parametros en el dominio de la frecuencias segun la reivindicacion 1, donde w[1], w[2], ..., w[p] es la secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en el que todos los w[1], w[2], ..., w[p] estan presentes de 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, estan presentes w[1], w[2], ..., w[p] desde 0 a n a intervalos iguales, la etapa de conversion de secuencia de parametros para determinar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos usa la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada, en donde la etapa de conversion de secuencia de parametros determina cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos de tal modo que, cuando w[i] esta mas cerca de w[i+1] con relacion a un punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i+1] - ~w[i] sea mayor que w[i+1] - w[i], y
cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] -~w[i-1] sea mayor que w[i] - w[i-1].
8. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 7, en donde,
la matriz K de banda tiene valores negativos en los elementos de la diagonal y valores positivos en los elementos que son vecinos de los elementos de la diagonal en la direccion de fila.
9. El metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun una cualquiera de las reivindicaciones 1 a 8, en donde g1 es una constante positiva igual o menor que 1, y
cada w[i] (i = 1, 2, ..., p) en la secuencia w[1], w[2], ..., w[p] de parametros en el dominio de la frecuencia es un parametro en el dominio de la frecuencia equivalente a agi[1], agi[2], ..., agi[p], o un valor cuantificado de dicho parametro en el dominio de la frecuencia, donde agi[i] = a[i]X(g1)i.
10. Un aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencia, que comprende:
cuando p es un numero entero igual o mayor que 1, y una secuencia de coeficientes de prediccion lineal obtenida mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado esta representada como a[1], a[2], ..., a[p];
w[1], w[2], ..., w[p] es uno de un par de espectro de llnea, LSP, una secuencia de parametros deducida a parti r de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal,
una secuencia de parametros de frecuencias de LSP, o LSF, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
una secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en la que todos los w[1], w[2], ..., w[p] estan presentes desde 0 hasta n, y cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, w[1], w[2], ..., w[p] estan presentes desde 0 hasta n a intervalos iguales; y,
cada uno de g1 y g2 es una constante positiva igual o menor que 1, se mantiene g1 = g2, y K es una matriz de banda pxp predeterminada en la que solamente los elementos de la diagonal y los elementos que son vecinos a los elementos de la diagonal en la direccion de fila tienen valores distintos de cero, una unidad (20) de conversion de secuencia de parametros que esta configurada para generar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos, definida por la formula siguiente:
Figure imgf000036_0001
11. Un aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencia, que comprende:
cuando p es un numero entero igual o mayor que 1, y una secuencia de coeficientes de prediccion lineal obtenida mediante analisis de prediccion lineal de senales de audio en un segmento de tiempo predeterminado esta representada como a[1], a[2], ..., a[p];
w[1], w[2], ..., w[p] es uno de:
una secuencia de parametros de pares de espectro de inmitancia, ISP, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
una secuencia de parametros de frecuencias de ISP, o ISF, deducida a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal, y
cada uno de g1 y g2 es una constante positiva igual o menor que 1, se mantiene g1 = g2, y K es una matriz de banda (p-1)x(p-1) predeterminada en la que solamente los elementos de la diagonal y los elementos que son vecinos a los elementos de la diagonal en la direccion de fila tienen valores distintos de cero,
una unidad (20) de conversion de secuencia de parametros que esta configurada para generar una secuencia ~w[1], ~w[2], ..., ~w[p-1] de parametros en el dominio de la frecuencia convertidos, definida por la formula siguiente:
Figure imgf000037_0001
12. El aparato (10) de generation de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 10 u 11, en donde,
la matriz K de banda tiene valores positivos en los elementos de la diagonal y valores negativos en elementos que son vecinos de los elementos de la diagonal en la direction de fila.
13. El aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 10 u 11, en donde,
la matriz K de banda tiene valores negativos en los elementos de la diagonal y valores positivos en elementos que son vecinos de los elementos de la diagonal en la direccion de fila.
14. El aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencias segun la reivindicacion 10, donde w[1], w[2], ..., w[p] es la secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediction lineal y en el que todos los w[1], w[2], ..., w[p] estan presentes de 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, estan presentes w[1], w[2], ..., w[p] desde 0 a n a intervalos iguales, y donde la unidad (20) de conversion de secuencia de parametros esta configurada para determinar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos usando la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada, en donde la unidad (20) de conversion de secuencia de parametros determina cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos de tal modo que,
cuando w[i] esta mas cerca de w[i+1] con relation a un punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que un valor de ~w[i+1] - ~w[i] sea menor que w[i+1] - w[i], y
cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] -~w[i-1] sea menor que w[i] - w[i-1].
15. El aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 14, en donde,
la matriz K de banda tiene valores positivos en los elementos de la diagonal y valores negativos en elementos que son vecinos de los elementos de la diagonal en la direccion de fila.
16. El aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencias segun la reivindicacion 10, donde w[1], w[2], ..., w[p] es la secuencia de parametros en el dominio de la frecuencia que se deduce a partir de la secuencia a[1], a[2], ..., a[p] de coeficientes de prediccion lineal y en el que todos los w[1], w[2], ..., w[p] estan presentes de 0 a n y, cuando todos los coeficientes de prediccion lineal contenidos en la secuencia de coeficientes de prediccion lineal son 0, estan presentes w[1], w[2], ..., w[p] desde 0 a n a intervalos iguales, en donde la unidad (20) de conversion de secuencia de parametros esta configurada para determinar una secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos usando la secuencia w[1], w[2], ..., w[p] de parametros del dominio de la frecuencia como entrada, y en donde la unidad (20) de conversion de secuencia de parametros esta configurada para determinar cada ~w[i] (i = 1, 2, ..., p) en la secuencia ~w[1], ~w[2], ..., ~w[p] de parametros en el dominio de la frecuencia convertidos de tal modo que,
cuando w[i] esta mas cerca de w[i+1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca de ~w[i+1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que un valor de ~w[i+1] - ~w[i] sea mayor que w[i+1] - w[i], y
cuando w[i] esta mas cerca de w[i-1] con relacion al punto medio entre w[i+1] y w[i-1], entonces se determina ~w[i] de modo que ~w[i] este mas cerca ~w[i-1] con relacion al punto medio entre ~w[i+1] y ~w[i-1], y que el valor de ~w[i] -~w[i-1] sea mayor que w[i] - w[i-1].
17. El aparato (10) de generacion de secuencia de parametros en el dominio de la frecuencia segun la reivindicacion 16, en donde,
la matriz K de banda tiene valores negativos en los elementos de la diagonal y valores positivos en elementos que son vecinos de los elementos de la diagonal en la direccion de fila.
18. Un programa que comprende instrucciones que, cuando se ejecuta el programa mediante un ordenador, provocan que el ordenador lleve a cabo las etapas del metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun una cualquiera de las reivindicaciones 1 a 9.
19. Un soporte de grabacion legible con ordenador que tiene un programa grabado en el mismo que comprende instrucciones que, cuando el programa se ejecuta por medio de un ordenador, provocan que el ordenador lleve a cabo las etapas del metodo de generacion de secuencia de parametros en el dominio de la frecuencia segun una cualquiera de las reivindicaciones 1 a 9.
ES15783646T 2014-04-24 2015-02-16 Método de generación de secuencia de parámetros en el dominio de la frecuencia, método de codificación, método de descodificación, aparato de generación de secuencia de parámetros en el dominio de la frecuencia, aparato de codificación, aparato de descodificación, programa y soporte de grabación Active ES2713410T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014089895 2014-04-24
PCT/JP2015/054135 WO2015162979A1 (ja) 2014-04-24 2015-02-16 周波数領域パラメータ列生成方法、符号化方法、復号方法、周波数領域パラメータ列生成装置、符号化装置、復号装置、プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
ES2713410T3 true ES2713410T3 (es) 2019-05-21

Family

ID=54332153

Family Applications (3)

Application Number Title Priority Date Filing Date
ES19216781T Active ES2901749T3 (es) 2014-04-24 2015-02-16 Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes
ES18200102T Active ES2795198T3 (es) 2014-04-24 2015-02-16 Método de codificación, aparato de codificación, programa y soporte de grabación correspondientes
ES15783646T Active ES2713410T3 (es) 2014-04-24 2015-02-16 Método de generación de secuencia de parámetros en el dominio de la frecuencia, método de codificación, método de descodificación, aparato de generación de secuencia de parámetros en el dominio de la frecuencia, aparato de codificación, aparato de descodificación, programa y soporte de grabación

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES19216781T Active ES2901749T3 (es) 2014-04-24 2015-02-16 Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes
ES18200102T Active ES2795198T3 (es) 2014-04-24 2015-02-16 Método de codificación, aparato de codificación, programa y soporte de grabación correspondientes

Country Status (9)

Country Link
US (3) US10332533B2 (es)
EP (3) EP3447766B1 (es)
JP (4) JP6270992B2 (es)
KR (3) KR101872905B1 (es)
CN (3) CN106233383B (es)
ES (3) ES2901749T3 (es)
PL (3) PL3447766T3 (es)
TR (1) TR201900472T4 (es)
WO (1) WO2015162979A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2901749T3 (es) * 2014-04-24 2022-03-23 Nippon Telegraph & Telephone Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes
WO2016167215A1 (ja) * 2015-04-13 2016-10-20 日本電信電話株式会社 線形予測符号化装置、線形予測復号装置、これらの方法、プログラム及び記録媒体
JP7395901B2 (ja) * 2019-09-19 2023-12-12 ヤマハ株式会社 コンテンツ制御装置、コンテンツ制御方法およびプログラム
CN116151130B (zh) * 2023-04-19 2023-08-15 国网浙江新兴科技有限公司 风电场最大频率阻尼系数计算方法、装置、设备及介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58181096A (ja) * 1982-04-19 1983-10-22 株式会社日立製作所 音声分析合成方式
US5003604A (en) * 1988-03-14 1991-03-26 Fujitsu Limited Voice coding apparatus
JP2659605B2 (ja) * 1990-04-23 1997-09-30 三菱電機株式会社 音声復号化装置及び音声符号化・復号化装置
US5327518A (en) * 1991-08-22 1994-07-05 Georgia Tech Research Corporation Audio analysis/synthesis system
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications
JP2993396B2 (ja) * 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP2000250597A (ja) * 1999-02-24 2000-09-14 Mitsubishi Electric Corp Lsp補正装置,音声符号化装置及び音声復号化装置
JP2000242298A (ja) * 1999-02-24 2000-09-08 Mitsubishi Electric Corp Lsp補正装置,音声符号化装置及び音声復号化装置
WO2001082293A1 (en) * 2000-04-24 2001-11-01 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
KR100872538B1 (ko) * 2000-11-30 2008-12-08 파나소닉 주식회사 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
JP4413480B2 (ja) 2002-08-29 2010-02-10 富士通株式会社 音声処理装置及び移動通信端末装置
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
CN101656073B (zh) * 2004-05-14 2012-05-23 松下电器产业株式会社 解码装置、解码方法以及通信终端和基站装置
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8688437B2 (en) * 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
JP5006774B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
WO2009093714A1 (ja) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体
JP5486597B2 (ja) * 2009-06-03 2014-05-07 日本電信電話株式会社 符号化方法、符号化装置、符号化プログラム及びこの記録媒体
JP5223786B2 (ja) * 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
CN102812512B (zh) * 2010-03-23 2014-06-25 Lg电子株式会社 处理音频信号的方法和装置
KR101437896B1 (ko) * 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
ES2937066T3 (es) * 2010-07-20 2023-03-23 Fraunhofer Ges Forschung Decodificador de audio, procedimiento y programa informático para decodificación de audio
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US9711158B2 (en) * 2011-01-25 2017-07-18 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
KR101542370B1 (ko) * 2011-02-16 2015-08-12 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램, 및 기록 매체
WO2012137617A1 (ja) * 2011-04-05 2012-10-11 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
MY185091A (en) * 2011-04-21 2021-04-30 Samsung Electronics Co Ltd Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
WO2014144579A1 (en) * 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
ES2901749T3 (es) * 2014-04-24 2022-03-23 Nippon Telegraph & Telephone Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes
US20170154188A1 (en) * 2015-03-31 2017-06-01 Philipp MEIER Context-sensitive copy and paste block
US20160292445A1 (en) * 2015-03-31 2016-10-06 Secude Ag Context-based data classification
US10542961B2 (en) * 2015-06-15 2020-01-28 The Research Foundation For The State University Of New York System and method for infrasonic cardiac monitoring
US10839302B2 (en) * 2015-11-24 2020-11-17 The Research Foundation For The State University Of New York Approximate value iteration with complex returns by bounding
US11205103B2 (en) * 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11568236B2 (en) * 2018-01-25 2023-01-31 The Research Foundation For The State University Of New York Framework and methods of diverse exploration for fast and safe policy improvement

Also Published As

Publication number Publication date
KR101972007B1 (ko) 2019-04-24
PL3136387T3 (pl) 2019-05-31
WO2015162979A1 (ja) 2015-10-29
US20170249947A1 (en) 2017-08-31
JP2018067010A (ja) 2018-04-26
US10643631B2 (en) 2020-05-05
EP3136387A4 (en) 2017-09-13
US20190259403A1 (en) 2019-08-22
EP3136387B1 (en) 2018-12-12
TR201900472T4 (tr) 2019-02-21
CN106233383A (zh) 2016-12-14
CN110503964B (zh) 2022-10-04
EP3447766B1 (en) 2020-04-08
EP3136387A1 (en) 2017-03-01
KR101972087B1 (ko) 2019-04-24
JP2019091075A (ja) 2019-06-13
ES2795198T3 (es) 2020-11-23
US10332533B2 (en) 2019-06-25
JP6270992B2 (ja) 2018-01-31
KR20180074811A (ko) 2018-07-03
EP3648103B1 (en) 2021-10-20
JP6484325B2 (ja) 2019-03-13
CN110503963A (zh) 2019-11-26
CN110503964A (zh) 2019-11-26
CN110503963B (zh) 2022-10-04
EP3447766A1 (en) 2019-02-27
JP2018077501A (ja) 2018-05-17
US10504533B2 (en) 2019-12-10
KR20160135328A (ko) 2016-11-25
PL3648103T3 (pl) 2022-02-07
CN106233383B (zh) 2019-11-01
US20200043506A1 (en) 2020-02-06
PL3447766T3 (pl) 2020-08-24
KR101872905B1 (ko) 2018-08-03
KR20180074810A (ko) 2018-07-03
JP6486450B2 (ja) 2019-03-20
JP6650540B2 (ja) 2020-02-19
ES2901749T3 (es) 2022-03-23
JPWO2015162979A1 (ja) 2017-04-13
EP3648103A1 (en) 2020-05-06

Similar Documents

Publication Publication Date Title
ES2713410T3 (es) Método de generación de secuencia de parámetros en el dominio de la frecuencia, método de codificación, método de descodificación, aparato de generación de secuencia de parámetros en el dominio de la frecuencia, aparato de codificación, aparato de descodificación, programa y soporte de grabación
ES2266003T3 (es) Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
WO2012137617A1 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN107408390B (zh) 线性预测编码装置、线性预测解码装置、它们的方法以及记录介质
CN107430869B (zh) 参数决定装置、方法及记录介质
ES2624668T3 (es) Codificación y descodificación de objetos de audio
JP7258936B2 (ja) 快適雑音生成モード選択のための装置および方法