ES2205892T3

ES2205892T3 - Aumento de la periodicidad al descodificar señales de banda ancha.

Info

Publication number: ES2205892T3
Application number: ES99952200T
Authority: ES
Inventors: Bruno Bessette; Redwan Salami; Roch Lefebre
Original assignee: VoiceAge Corp
Current assignee: VoiceAge Corp
Priority date: 1998-10-27
Filing date: 1999-10-27
Publication date: 2004-05-01
Anticipated expiration: 2019-10-27
Also published as: PT1125285E; NO20012066D0; ES2207968T3; DE69913724D1; AU6456999A; EP1125284A1; JP3869211B2; CA2347668C; CA2347735A1; WO2000025298A1; CA2347735C; DK1125285T3; NO20012067D0; JP2002528777A; CN1328683A; HK1043234A1; ZA200103367B; MXPA01004137A; CN1165891C; EP1125285A1

Abstract

Un dispositivo para aumentar la periodicidad de una señal de excitación generada en relación con un vector de código de tono y un vector de código innovador para suministrar un filtro de síntesis de señal en una señal de banda ancha, comprendiendo dicho dispositivo de aumento de la periodicidad: a) un generador (204) de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha; y b) un filtro 205 de innovación para filtrar el vector de código innovador en relación con dicho factor de periodicidad para reducir así la energía de la parte de baja frecuencia del vector de código innovador y aumentar la periodicidad de una parte de baja frecuencia de la señal de excitación.

Description

Aumento de la periodicidad al descodificar señales de banda ancha.

Antecedentes de la invención 1. Campo de la invención

La presente invención está relacionada con un método y un dispositivo para aumentar la periodicidad de la excitación de un filtro de síntesis de señales con el fin de producir una señal sintetizada de banda ancha.

2. Breve descripción de la técnica anterior

La demanda de técnicas de codificación eficientes de habla/audio digitales de banda ancha, con un buen equilibrio subjetivo de calidad/velocidad de bits, está aumentando en numerosas aplicaciones tales como las teleconferencias de audio/vídeo, multimedia y aplicaciones inalámbricas, así como en aplicaciones de Internet y redes de paquetes. Hasta muy recientemente, las anchuras de banda de telefonía filtradas en la gama de 200-3400 Hz fueron utilizadas principalmente en aplicaciones de codificación del habla. Sin embargo, hay una demanda creciente de aplicaciones del habla en banda ancha con el fin de aumentar la inteligibilidad y la naturalidad de las señales del habla. Se ha averiguado que una anchura de banda en la gama de 50-7000 Hz fue suficiente para entregar una calidad del habla de presencia real. Para las señales de audio, esta gama ofrece una calidad de audio aceptable, pero todavía inferior a la calidad de CD que funciona en la gama de 20-20000 Hz.

Un codificador del habla convierte una señal del habla en una cadena digital de bits que es transmitida por un canal de comunicaciones (o almacenado en un medio de almacenamiento). La señal del habla es digitalizada (muestreada y cuantificada con 16 bits por muestra usualmente) y el codificador del habla tiene el papel de representar estas muestras digitales con un número menor de bits al tiempo que mantiene una buena calidad subjetiva del habla. El descodificador del habla o sintetizador opera con la cadena de bits transmitida o almacenada y la vuelve a convertir en una señal de sonido.

Una de las mejores técnicas anteriores capaces de conseguir un buen equilibrio de la relación calidad/bits es la denominada técnica de Predicción Lineal Excitada por Código (CELP). De acuerdo con esta técnica, la señal del habla muestreada es procesada en bloques sucesivos de L muestras usualmente denominadas tramas, donde L es algún número predeterminado (correspondiente a 10-30 ms del habla). En CELP, se calcula y se transmite en cada trama un filtro de síntesis de predicción lineal (LP). La trama de L muestras es dividida después en bloques más pequeños denominados subtramas de un tamaño de N muestras, donde L=kN y k es el número de subtramas en una trama (N corresponde usualmente a 4-10 ms del habla). En cada subtrama se determina una señal del habla, que consiste usualmente en dos componentes: uno de la excitación pasada (denominada también contribución de tono, o libro de código adaptativo, o libro de código de tono), y el otro de un libro de código innovador (denominado también libro de código fijo). Esta señal de excitación es transmitida y utilizada en el descodificador como entrada del filtro de síntesis de LP con el fin de obtener el habla sintetizada.

Un libro de código innovador en el contexto del CELP, es un conjunto indexado de secuencias de N muestras de largo que será denominadas vectores de código N-dimensionales. Cada secuencia de libro de código está indexada por un entero k que va desde 1 a M donde M representa el tamaño del libro de código que se expresa a menudo como un número de bits b, donde M=2^{b}.

Para sintetizar el habla de acuerdo con la técnica CELP, cada bloque de N muestras es sintetizado filtrando un vector de código apropiado de un libro de código a través de filtros que varían en el tiempo que efectúan un modelo de las características espectrales de la señal del habla. En el extremo del codificador, se calcula la salida de la síntesis para todos, o para un subconjunto, de los vectores de código del libro de códigos (búsqueda del libro de código). El vector de código retenido es el que produce la salida de la síntesis más cercana a la señal del habla original, de acuerdo con una medida perceptual de distorsión ponderada. Esta ponderación perceptual se realiza utilizando el denominado filtro de ponderación perceptual, que se obtiene usualmente del filtro de síntesis de LP.

En el documento EP-A-0788091 se describe un codificador conocido basado en CELP.

El modelo CELP ha tenido mucho éxito para codificar las señales de sonido de la banda telefónica, y existen varios estándares basados en CELP en una amplia gama de aplicaciones, especialmente en las aplicaciones celulares digitales. En la banda telefónica, la señal de sonido está limitada a la banda de 200-3400 Hz y es muestreada a 8000 muestras/segundo. En aplicaciones de banda ancha del habla/audio, la señal de sonido está limitada a la banda de 50-7000 Hz y es muestreada a 16000 muestras por segundo.

Cuando se aplica el modelo CELP optimizado de banda telefónica a señales de banda ancha, surgen algunas dificultades, y es necesario añadir características adicionales al modelo con el fin de obtener señales de banda ancha de alta calidad.

\newpage

Al aumentar la periodicidad de la señal de excitación se mejora la calidad en el caso de segmentos de voz. Esto se hizo en el pasado filtrando el vector de código innovador del libro de código fijo a través de un filtro que tiene una función de transferencia de la forma 1/(1-\varepsilonbz^{-T}) donde \varepsilon es un factor por debajo de 0,5 que controla la cantidad de periodicidad introducida. Esta solución es menos eficiente en el caso de señales de banda ancha, ya que introduce la periodicidad en todo el espectro.

Objeto de la invención

Un objeto de la presente invención es proponer una nueva solución alternativa por medio de la cual se consigue el aumento de periodicidad a través del filtrado del vector de código innovador por medio de un filtro de innovación que reduce el contenido de baja frecuencia del vector de código innovador, por lo que la contribución innovadora se reduce principalmente a bajas frecuencias para aumentar la periodicidad de la señal de excitación a bajas frecuencias más que a altas frecuencias.

Sumario de la invención

Más específicamente, de acuerdo con la presente invención, se proporciona un método para aumentar la periodicidad de una señal de excitación producida en relación con un vector de código de tono y un vector de código innovador para suministrar un filtro de síntesis de señales con el fin de sintetizar una señal de banda ancha. En este método de aumento de la periodicidad, se calcula un factor de periodicidad relacionado con la señal de banda ancha. Después, se filtra el vector de código innovador en relación con el factor de periodicidad para reducir así la energía de la parte de baja frecuencia del vector de código innovador y aumentar la periodicidad de una parte de baja frecuencia de la señal de excitación.

El dispositivo de la invención, para aumentar la periodicidad de una señal de excitación producida en relación con vectores de código adaptativos e innovadores para suministrar un filtro de síntesis de señales con el fin de sintetizar una señal de banda ancha comprende:

a) un generador de factores para calcular un factor de periodicidad relacionado con dicha señal de banda ancha; y

b) un filtro innovador para filtrar el vector de código innovador en relación con el factor de periodicidad para reducir así la energía de la parte de baja frecuencia del vector de código innovador y aumentar la periodicidad de una parte de baja frecuencia de la señal de excitación.

De acuerdo con un primer modo de realización preferido:

- el vector de código innovador es filtrado con una función de transferencia de la forma:

F(z) = - \alpha z + 1 - \alpha z^{-1}

donde \alpha es el factor de periodicidad obtenido desde un nivel de periodicidad de la señal de excitación; y

- el factor de periodicidad \alpha se calcula utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento fijado por ejemplo a 0,25, y donde

R_{p} = \frac{b^{2}v_{T}{}^{t}v_{T}}{u^{t}u} = \frac{b^{2}\sum\limits^{N-1}_{n=0}v^{2}_{T}(n)}{\sum\limits^{N-1}_{n=0}u^{2}(n)}

donde v_{T} es el vector de código de tono, b es la ganancia de tono, N es la longitud de una subtrama y u es la señal de excitación, o

la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

donde E_{v} es la energía del vector de código de tono y E_{c} es la energía del vector de código innovador.

De acuerdo con un segundo modo de realización preferido:

F(z) = 1 - \sigma z^{-1}

Donde \sigma es un factor de periodicidad obtenido a partir de un nivel de periodicidad de la señal de excitación; y

- el factor de periodicidad \sigma se calcula utilizando la relación:

\sigma = 2QR_{P} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento fijado por ejemplo en 0,25, y donde

R_{p} = \frac{b^{2}v_{T}{}^{t}v_{T}}{u^{t}u} = \frac{b^{2} \sum\limits^{N-1}_{n=0}v^{2}_{T}(n)}{\sum\limits^{N-1}_{n=0}u^{2}(n)}

la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

donde E_{v} es la energía del vector de código de tono y E_{c} es la energía del vector de código innovador.

La presente invención está relacionada también con un descodificador para generar una señal de banda ancha sintetizada, que comprende:

a) un dispositivo de fragmentación de la señal para recibir una señal codificada de banda ancha y extraer de esta señal codificada de banda ancha al menos unos parámetros de libro de código de tono, parámetros del libro de código innovador y coeficientes del filtro de síntesis;

b) un libro de código de tono que responde a los parámetros de libro de código de tono para generar un vector de código de tono;

c) un libro de código innovador que responde a parámetros del libro de código innovador para generar un vector de código innovador;

d) un dispositivo de aumento de la periodicidad como se ha descrito anteriormente, que comprende el generador de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha; y el filtro de innovación para filtrar el vector de código innovador en relación con el factor de periodicidad;

e) un circuito combinador para combinar el vector de código de tono y el vector de código innovador filtrado por el filtro de innovación para generar así una señal de excitación de periodicidad aumentada; y

f) un filtro de síntesis de señales para filtrar esa señal de excitación de periodicidad aumentada en relación con los coeficientes del filtro de síntesis para generar así la señal de banda ancha sintetizada.

De acuerdo con la presente invención, en un descodificador para generar una señal de banda ancha sintetizada, que comprende: un dispositivo de fragmentación de la señal para recibir una señal de banda ancha codificada y extraer de esta señal de banda ancha codificada al menos los parámetros del libro de código del tono, los parámetros del libro de código innovador, y los coeficientes del filtro de síntesis; un libro de código del tono que responde a los parámetros del libro de código del tono para generar un vector de código de tono; un libro de código innovador que responde a los parámetros del libro de código innovador para generar un vector de código innovador; un circuito combinador para combinar el vector de código del tono y el vector de código innovador, para generar así una señal de excitación; y un filtro de síntesis de señales para filtrar esa señal de excitación en relación con los coeficientes del filtro de síntesis para generar así la señal de banda ancha sintetizada;

comprendiendo la mejora del mismo un dispositivo de aumento de la periodicidad como se ha descrito anteriormente, que comprende el generador de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha; y el filtro de innovación para filtrar el vector de código innovador en relación con el factor de periodicidad antes de suministrar este vector de código innovador al circuito combinador.

La presente invención está relacionada también con un sistema de comunicación celular, una unidad celular móvil transmisora/receptora, un elemento de red celular, y un subsistema bidireccional de comunicaciones inalámbricas que comprende el descodificador descrito anteriormente.

Los objetos, ventajas y otras características de la presente invención quedarán más claros con la lectura de la siguiente descripción no restrictiva de un modo de realización preferido de la misma, ofrecido a modo de ejemplo solamente, con referencia a los dibujos que se acompañan.

Breve descripción de los dibujos

En los dibujos anexos:

La figura 1 es un diagrama esquemático de bloques de un modo de realización preferido del dispositivo de codificación de banda ancha;

La figura 2 es un diagrama esquemático de bloques de un modo de realización preferido del dispositivo de descodificación de banda ancha;

La figura 3 es un diagrama esquemático de bloques de un modo de realización preferido de un dispositivo de análisis de tono; y

La figura 4 es un diagrama esquemático simplificado de un sistema de comunicación celular en el cual puede utilizarse el dispositivo de codificación de banda ancha de la figura 1 y el dispositivo de codificación de banda ancha de la figura 2.

Descripción detallada del modo de realización preferido

Como es bien sabido por los expertos ordinarios en la técnica, un sistema de comunicación celular, tal como el 401 (véase la figura 4), proporciona un servicio de telecomunicaciones en un área geográfica grande, dividiendo esa área geográfica grande en cierto número C de células más pequeñas. Las C células más pequeñas son servidas por las respectivas estaciones base celulares 402_{1}, 402_{2}, ...402_{C} para proporcionar a cada célula los canales de señalización de radio, de audio y de datos.

Los canales de señalización de radio se utilizan para hacer radiobúsquedas a radioteléfonos móviles (unidades móviles transmisoras/receptoras) tales como 403, dentro de los límites de la zona de cobertura (célula) de la estación base celular 402, y para hacer llamadas a otros radioteléfonos 403 situados dentro o fuera de la célula de la estación base o a otra red tal como la Red Telefónica Pública Conmutada (RTPC) 404.

Una vez que un radioteléfono 403 ha hecho o ha recibido con éxito una llamada, se establece un canal de datos entre este radioteléfono 403 y la estación base celular 402 correspondiente a la célula en la cual está situado el radioteléfono 403, y la comunicación entre la estación base 402 y el radioteléfono 403 se realiza por el canal de audio o de datos. El radioteléfono 403 puede recibir también información de control o de tiempos por un canal de señalización cuando la llamada está en curso.

Si un radioteléfono 403 abandona una célula y se introduce en otra célula contigua cuando hay una llamada en curso, el radioteléfono 403 conmuta la llamada a un canal disponible de audio o de datos de la estación base 402 de la nueva célula. Si un radioteléfono 403 abandona una célula y entra en otra célula contigua cuando no hay una llamada en curso, el radioteléfono 403 envía un mensaje de control por el canal de señalización para registrarse en la estación base 402 de la nueva célula. De esta manera, es posible la comunicación móvil por un área geográfica amplia.

El sistema 401 de comunicación celular comprende además un terminal 405 de control para controlar la comunicación entre las estaciones base celulares 402 y la RTPC 404, por ejemplo durante una comunicación entre un radioteléfono 403 y la RTPC 404, o entre un radioteléfono 403 situado en una primera célula y un radioteléfono 403 situado en una segunda célula.

Naturalmente, se requiere un subsistema bidireccional de comunicaciones inalámbricas por radio para establecer un canal de audio o de datos entre una estación base 402 de una célula y un radioteléfono 403 situado en esa célula. Como se ilustra de una manera muy simplificada en la figura 4, tal subsistema bidireccional de comunicaciones inalámbricas por radio comprende típicamente en el radioteléfono 403:

-: un transmisor 406 que incluye:

-: un codificador 407 para codificar la señal de voz; y

-: un circuito 408 de transmisión para transmitir la señal de voz codificada desde el codificador 407 a través de una antena tal como 409; y

-: un receptor 410 que incluye:

-: un circuito receptor 411 para recibir una voz codificada transmitida normalmente a través de la misma antena 409; y

-: un descodificador 412 para descodificar la señal de voz codificada recibida desde el circuito 411 de recepción.

El radioteléfono comprende además otros circuitos convencionales 413 de radioteléfono a los cuales están conectados el codificador 407 y el descodificador 412 y para procesar señales de ellos, siendo estos circuitos 413 bien conocidos por los expertos ordinarios en la técnica y, consecuentemente, no serán descritos con más detalle en la presente memoria.

Además, tal subsistema bidireccional de comunicación inalámbrica por radio comprende típicamente en la estación base 402:

-: un transmisor 414 que incluye:

-: un codificador 415 para codificar la señal de voz; y

-: un circuito 416 de transmisión para transmitir la señal de voz codificada desde el codificador 415 a través de una antena tal como la 417; y

-: un receptor 418 que incluye:

-: un circuito receptor 419 para recibir una señal de voz codificada transmitida a través de la misma antena 417 ó a través de otra antena (no ilustrada); y

-: un descodificador 420 para descodificar la señal de voz codificada recibida desde el circuito 419 de recepción.

La estación base 402 incluye además, típicamente, un controlador 421 de estación base, junto con su base de datos asociada 422, para controlar la comunicación entre el terminal 405 de control y el transmisor 414 y el receptor 418.

Como es bien sabido por los expertos ordinarios en la técnica, se requiere la codificación de voz con el fin de reducir la anchura de banda necesaria para transmitir la señal de sonido, por ejemplo la señal de voz tal como el habla, a través del subsistema bidireccional de comunicación inalámbrica por radio, es decir, entre un radioteléfono 403 y una estación base 402.

Los codificadores LP de voz (tales como el 415 y el 407), que funcionan típicamente a 13 kbits/segundo y por debajo, tal como los codificadores de Predicción Lineal Excitados por Código (CELP), utilizan típicamente un filtro de síntesis LP para hacer un modelo de la envolvente espectral de corta duración de la señal de voz. La información LP se transmite, típicamente, cada 10 ó 20 ms al descodificador (tal como el 420 y 412) y es extraída en el extremo del descodificador.

Las nuevas técnicas descritas en la presente memoria pueden ser aplicadas a distintos sistemas de codificación basados en LP. Sin embargo, se utiliza un sistema de codificación del tipo CELP en el modo de realización preferido con el propósito de presentar una ilustración no limitativa de estas técnicas. De la misma manera, tales técnicas pueden ser utilizadas con señales de sonido distintas a la de voz y del habla así como con otros tipos de señales de banda ancha.

La figura 1 muestra un diagrama general de bloques de un dispositivo 100 de codificación del habla de tipo CELP, modificado para acomodar mejor las señales de banda ancha.

La señal muestreada 114 del habla de entrada es dividida en bloques sucesivos de L muestras denominados "tramas". En cada trama, se calculan, codifican y transmiten distintos parámetros que representan la señal del habla en la trama. Los parámetros LP que representan el filtro de síntesis LP son calculados usualmente una vez por trama. La trama se divide además en bloques más pequeños de N muestras (bloques de longitud N), en los cuales se determinan los parámetros de excitación (tono e innovación). En la literatura del CELP, estos bloques de longitud N son denominados "subtramas" y las señales de N muestras de las subtramas son denominadas vectores N-dimensionales. En este modo de realización preferido, la longitud N corresponde a 5 ms, mientras que la longitud L corresponde a 20 ms, lo cual significa que una trama contiene cuatro subtramas (N=80 a la velocidad de muestreo de 16 kHz y 64 al hacer un muestreo hacia debajo a 12,8 kHz). En el procedimiento de codificación tienen lugar varios vectores N-dimensionales. A continuación se ofrece una lista de vectores que aparecen en las figuras 1 y 2, así como una lista de parámetros transmitidos:

Lista de los principales vectores N-dimensionales

s	vector de habla de entrada de la señal de banda ancha (tras un muestreo reducido, un preproceso y un pre-
	énfasis);
s_{w}	vector de habla ponderado;
s_{0}	respuesta de entrada cero del filtro de síntesis ponderado;
s_{P}	Señal pre-procesada con muestreo reducido; señal de habla sintetizada sobre-muestreada;
s'	Señal de síntesis antes del de-énfasis;
s_{d}	Señal de síntesis desenfatizada;
s_{h}	Señal de síntesis tras el de-énfasis y el post-proceso;
x	Vector objetivo para la búsqueda de tono;
x'	Vector objetivo para búsqueda de innovación;
h	Respuesta de impulso del filtro de síntesis ponderado;
v_{T}	Vector de libro de código adaptativo (tono) con retardo T;
y_{T}	Vector de libro de código de tono filtrado (convolución de v_{T} con h);
c_{k}	Vector de código innovador en el índice k (entrada de orden k en el libro de código de innovación);
c_{f}	Vector de código innovador con modificación de escala aumentada;
u	Señal de excitación (vectores de código de innovación y de tono con modificación de escala);
u'	Excitación aumentada;
z	Secuencia de ruido de paso de banda;
w'	Secuencia de ruido blanco; y
w	Secuencia de ruido con escala modificada.

Lista de parámetros transmitidos

STP	Parámetros de predicción de corta duración (que definen A(z));
T	Retardo de tono (o índice de libro de código de tono);
b	Ganancia de tono (o ganancia de libro de código de tonos);
j	Índice del filtro paso-bajo utilizado en el vector de código de tono;
k	Índice del vector de código (entrada del libro de código de innovación); y
g	Ganancia del libro de código de innovación

En este modo de realización preferido, los parámetros STP son transmitidos una vez por trama y el resto de los parámetros son transmitidos cuatro veces por trama (cada subtrama).

Lado del codificador

La señal del habla muestreada es codificada en base a bloques por medio del dispositivo 100 de codificación de la figura 1, que es dividido en once módulos numerados del 101 al 111.

El habla de entrada es procesada en los bloques de L muestras mencionados anteriormente, llamados tramas.

Haciendo referencia a la figura 1, la señal 114 de habla de entrada muestreada es de muestreo reducido en un módulo 101 de muestreo reducido. Por ejemplo, la señal se muestrea hacia abajo desde 16 Khz. a 12,8 Khz., utilizando técnicas bien conocidas para los expertos ordinarios en la técnica. Naturalmente, se puede concebir el muestreo reducido a otra frecuencia. El muestreo reducido aumenta la eficiencia de la codificación, ya que se codifica una menor anchura de banda de frecuencias. Esto reduce también la complejidad algorítmica, ya que el número de muestras en una trama disminuye. El uso del muestreo reducido se hace significativo cuando la tasa de bits se reduce por debajo de 16 kbits/segundo, aunque el muestreo reducido no es esencial por encima de 16 kbits/s.

Tras el muestreo reducido, la trama de 320 muestras de 20 ms se reduce a una trama de 256 muestras (la relación de muestreo reducido es de 4/5).

La trama de entrada es suministrada después al bloque opcional 102 de pre-proceso. El bloque 102 de pre-proceso puede consistir en un filtro paso-alto con un frecuencia de corte de 50 Hz. El filtro 102 de paso-alto elimina las componentes de sonido no deseadas por debajo de 50 Hz.

\newpage

La señal pre-procesada de muestreo reducido se denota como S_{p}(n), n=0, 1, 2, ...L-1, donde L es la longitud de la trama (256 a una frecuencia de muestreo de 12,8 kHz). En un modo de realización preferido del filtro 103 de pre-énfasis la señal S_{p}(n) es pre-enfatizada utilizando un filtro que tiene la siguiente función de transferencia:

P(z) = 1 - \mu z^{-1}

donde \mu es un factor de pre-énfasis con un valor situado entre 0 y 1 (un valor típico es \mu = 0,7). También puede usarse un filtro de orden superior. Debe indicarse que pueden intercambiarse un filtro 102 de paso-alto y un filtro 103 de pre-énfasis para obtener unas realizaciones de coma fija más eficientes.

La función del filtro 103 de pre-énfasis es aumentar el contenido de alta frecuencia de la señal de entrada. También reduce la gama dinámica de la señal de habla de entrada, que la hace más adecuada para la realización de coma fija. Sin el pre-énfasis, el análisis de LP en coma fija utilizando la aritmética de simple precisión es difícil de llevar a cabo.

El pre-énfasis juega también un papel importante para conseguir una ponderación global perceptual apropiada del error de cuantificación, lo cual contribuye a una calidad de sonido mejorada. Esto será explicado con más detalle a continuación.

La salida del filtro 103 de pre-énfasis se denota como s(n). Esta señal se utiliza para efectuar el análisis en el módulo calculador 104. El análisis LP es una técnica bien conocida por los expertos ordinarios en la técnica. En este modo de realización preferido, se utiliza la solución de la autocorrelación. En la solución de la autocorrelación, se toman ventanas de la señal s(n) utilizando una ventana de Hamming (que tiene usualmente una longitud del orden de 30-40 ms). Las autocorrelaciones son calculadas a partir de la señal con ventanas, y se utiliza la acción recurrente (recursión) de Levinson-Durbin para calcular los coeficientes del filtro LP, a_{j}, donde j=1, ...p, y donde p es el orden de LP, que es típicamente 16 en la codificación de banda ancha. Los parámetros a_{j} son los coeficientes de la función de transferencia del filtro LP, que viene dada por la relación siguiente:

A(z) = 1 + \sum\limits^{p}_{j=1}a_{j}z^{-1}

El análisis LP se efectúa en el módulo calculador 104, que realiza también la cuantificación e interpolación de los coeficientes del filtro LP. Los coeficientes del filtro LP son transformados primero en otro dominio equivalente más adecuado para fines de cuantificación e interpolación. Los dominios de la pareja espectral de línea (LSP) y la pareja espectral de inmitancia (ISP) son dos dominios en los cuales puede realizarse eficientemente la cuantificación y la interpolación. Los 16 coeficientes del filtro LP, a_{j}, pueden ser cuantificados en el orden de 30 a 50 bits utilizando la cuantificación repartida o de etapas múltiples, o una combinación de las mismas. El propósito de la interpolación es permitir la actualización de los coeficientes del filtro LP en cada subtrama al tiempo que se transmiten una vez por trama, lo cual mejora el rendimiento del codificador sin aumentar la tasa de bits. Se cree que la cuantificación e interpolación de los coeficientes del filtro LP es por otra parte bien conocida por los expertos ordinarios en la técnica y, consecuentemente, no será descrita con más detalle en la presente memoria.

Los párrafos siguientes describirán el resto de las operaciones de codificación realizadas en base a subtramas. En la descripción siguiente, el filtro A(z) denota el filtro LP interpolado sin cuantificar de la subtrama, y el filtro Â(z) indica el filtro LP interpolado cuantificado de la subtrama.

Ponderación perceptual

En los codificadores de análisis por síntesis, los parámetros óptimos de tono e innovación se buscan minimizando el error cuadrático medio entre el habla de entrada y el habla sintetizada en un dominio perceptual ponderado. Esto es equivalente a hacer mínimo el error entre el habla de entrada ponderada y el habla de síntesis ponderada.

La señal ponderada s_{w}(n) se calcula en un filtro 105 de ponderación perceptual. Tradicionalmente, la señal ponderada s_{w}(n) se calculaba por medio de un filtro de ponderación que tenía una función de transferencia W(z) de la forma:

W(z)=A(z/\gamma _{1}) / A(z/\gamma _{2}) \ donde \ 0 < \gamma _{2} < \gamma _{1} \leq 1

Como es bien sabido por los expertos ordinarios en la técnica, en los codificadores de análisis por síntesis (AbS) de la técnica anterior, el análisis demuestra que el error de cuantificación es ponderado por una función de transferencia W^{-1}(z), que es la inversa de la función de transferencia del filtro 105 de ponderación perceptual. Este resultado está bien descrito por B.S. Atal y M.R. Schroeder en "Codificación predecible del habla y criterios subjetivos de error", en IEEE Transaction ASSP, vol. 27. núm. 3, páginas 247-254 de Junio de 1979. La función de transferencia

\hbox{ W ^{-1} (z) }

presenta algo de la estructura que forma la señal del habla de entrada. Así, la propiedad de enmascaramiento del oído humano es explotada conformando el error de cuantificación de manera que tenga más energía en las regiones que lo forman donde estará enmascarado por la fuerte energía de la señal presente en estas regiones. La cantidad de ponderación está controlada por los factores \gamma_{1} y \gamma_{2}.

El filtro 105 de ponderación perceptual tradicional anterior funciona bien con señales en la banda de telefonía. Sin embargo, se ha averiguado que este filtro 105 de ponderación perceptual tradicional no es adecuado para una ponderación perceptual eficiente de las señales de banda ancha. También se ha averiguado que el filtro 105 de ponderación perceptual tradicional tiene limitaciones inherentes para efectuar un modelo de la estructura de formación y de la inclinación espectral requerida concurrentemente. La inclinación espectral es más pronunciada en señales de banda ancha debido a la amplia gama dinámica entre las bajas y las altas frecuencias. La técnica anterior sugería añadir un filtro de inclinación en W(z) con el fin de controlar la inclinación y la ponderación que forma la señal de entrada de banda ancha separadamente.

Una solución nueva para este problema es, de acuerdo con la presente invención, introducir el filtro 103 de pre-énfasis en la entrada, calcular la A(z) del filtro LP basándose en el habla pre-enfatizada s(n), y utilizar una W(z) de filtro modificado fijando su denominador.

El análisis LP se efectúa en el módulo 104 sobre la señal pre-enfatizada s(n) para obtener la A(z) del filtro LP. Además, se utiliza un nuevo filtro 105 de ponderación perceptual con denominador fijo. Un ejemplo de la función de transferencia para el filtro 104 de ponderación perceptual viene dado por la relación siguiente:

W(z) = A (z/\gamma _{1}) / (1-\gamma _{2}z^{-1}) \ donde \ 0 < \gamma _{2} < \gamma _{1} \leq 1

En el denominador se puede utilizar un orden superior. Esta estructura desacopla sustancialmente la ponderación de formación de la inclinación.

Obsérvese que debido a que A(z) se calcula basándose en la señal s(n) del habla pre-enfatizada, la inclinación del filtro 1/A(z/\gamma_{1}) es menos pronunciada en comparación con el caso en que A(z) es calculada basándose en el habla original. Como el de-énfasis se efectúa en el extremo del descodificador utilizando un filtro que tiene la función de transferencia:

P^{-1} (z) = 1/(1-\mu z^{-1}),

el espectro de error de cuantificación toma la forma que le da un filtro con una función de transferencia W^{-1}(z)P^{-1}(z). Cuando \gamma_{2} es fijada igual a \mu, que es el caso típico, el espectro del error de cuantificación adopta la forma que le da un filtro cuya función de transferencia es 1/A(z/\gamma_{1}), siendo calculada A(z) en base a la señal del habla pre-enfatizada. La escucha subjetiva demostró que esta estructura para conseguir la conformación del error por combinación del pre-énfasis y el filtrado de ponderación modificada es muy eficiente para codificar señales de banda ancha, además de las ventajas de la facilidad de implantación algorítmica de coma fija.

Análisis del tono

Con el fin de simplificar el análisis del tono, se estima primero un retardo T_{OL} de tono en bucle abierto en el módulo 106 de búsqueda de tono en bucle abierto, utilizando la señal s_{W}(n) del habla ponderada. Después, el análisis de tono en bucle cerrado, que es realizado en el módulo 107 de búsqueda de tono en bucle cerrado en base a subtramas, queda restringido alrededor del retardo T_{OL} de tono en bucle abierto que reduce significativamente la complejidad de la búsqueda de los parámetros LTP, T y b (retardo de tono y ganancia de tono). El análisis de tono en bucle abierto se realiza usualmente en el módulo 106 una vez cada 10 ms (dos subtramas) utilizando técnicas bien conocidas por los expertos ordinarios en la técnica.

Se calcula primero el vector objetivo x para el análisis LTP (Predicción a largo plazo). Esto se hace usualmente restando la respuesta s_{0} de entrada cero del filtro W(z)/Â(z) de síntesis ponderado a partir de la señal s_{W}(n) del habla ponderada. Esta respuesta s_{0} de entrada cero se calcula por medio de un calculador 108 de respuestas de entrada cero. Más específicamente, el vector objetivo x se calcula utilizando la relación siguiente:

x = s_{W} - s_{0}

donde x es el vector objetivo N-dimensional, s_{W} es el vector del habla ponderado en la subtrama, y s_{0} es la respuesta de entrada cero del filtro W(z)/Â(z), que es la salida del filtro combinado W(z)/Â(z) debido a sus estados iniciales. El calculador 108 de respuestas de entrada cero origina respuestas al filtro LP interpolado cuantificado Â(z) a partir del análisis LP, del calculador 104 de cuantificación e interpolación y a los estados iniciales del filtro W(z)/Â(z) de síntesis ponderado almacenado en el módulo 111 de memoria, para calcular la respuesta s_{0} de entrada cero (que es la parte de la respuesta debida a los estados iniciales según se determinan al fijar las entradas igual a cero) del filtro W(z)/Â(z). Esta operación es bien conocida por los expertos ordinarios en la técnica y, consecuentemente, no será descrito con más detalle.

Naturalmente, pueden utilizarse enfoques matemáticamente equivalentes para calcular el vector objetivo x.

En el generador 109 de respuestas de impulsos se calcula un vector N-dimensional h de respuesta de impulsos del filtro de síntesis ponderado W(z)/Â(z), utilizando los coeficientes A(z) y Â(z) del filtro LP a partir del módulo 104. Nuevamente, esta operación es bien conocida por los expertos ordinarios en la técnica y, consecuentemente, no será descrita con más detalles en la presente memoria.

Los parámetros b, T y j del tono de bucle cerrado (o libro de código del tono) son calculados en el módulo 107 de búsqueda de tono en bucle cerrado, que utiliza el vector objetivo x, el vector h de respuesta de impulsos y el retardo T_{OL} de tono en bucle abierto como entradas. Tradicionalmente, la predicción del tono ha sido representada por un filtro de tonos que tiene la siguiente función de transferencia:

1 / (1-bz^{-T})

donde b es la ganancia de tono y T es el retardo o retraso del tono. En este caso, la contribución del tono a la señal

\hbox{ u(n) }

de excitación viene dada por bu(n-T), donde la excitación total viene dada por

u(n) = bu(n-T) + gc_{k}(n)

siendo g la ganancia del libro de código innovador y c_{k}(n) el vector de código innovador en el índice k.

Esta representación tiene limitaciones si el retardo T del tono es más corto que la longitud N de la subtrama. En otra representación, la contribución de la ganancia puede ser vista como un libro de código de tono que contiene la señal de excitación anterior. Generalmente, cada vector del libro de código de tono es una versión desplazada en uno del vector anterior (descartando una muestra y añadiendo una nueva muestra). Para retardos de tono T>N, el libro de código de tono es equivalente a la estructura de filtro (1/(1-bz^{-T}), y un vector v_{T}(n) del libro de código de tono con el retardo de tono T viene dado por

v_{T}(n)= u(n-T), \hskip1cm n=0, ...N-1

Para retardos T de tono más cortos que N, se construye un vector v_{T}(n) repitiendo las muestras disponibles a partir de la excitación anterior hasta que se completa el vector (esto no es equivalente a la estructura del filtro).

En codificadores recientes, se utiliza una resolución de tono más alta que mejora significativamente la calidad de los segmentos de sonidos de voz. Esto se consigue haciendo un sobre-muestreo de la señal de excitación anterior utilizando filtros de interpolación de varias fases. En este caso, el vector v_{T}(n) corresponde usualmente a una versión interpolada de la excitación anterior, siendo el retardo T de tono un retardo no entero (por ejemplo, 50,25).

La búsqueda de tono consiste en encontrar el mejor retardo T de tono y la mejor ganancia b que hagan mínimo el error cuadrático medio ponderado E entre el vector objetivo x y la excitación filtrada anterior con escala modificada. El error E viene expresado por:

E = ||x-by_{T}||^{2}

donde y_{T} es el vector de código de tono filtrado con el retardo de tono T:

y_{T}(n) = v_{T}(n)*h(n) = \sum\limits^{n}_{i=0}v_{T}(i)h(n-i) \ , \hskip1cm n = 0,...,N-1

Puede demostrarse que el error E se hace mínimo haciendo máximo el criterio de búsqueda

C = \frac{x^{t}y_{T}}{\sqrt{y^{t}_{T}y_{T}}}

donde t indica la transposición del vector.

\newpage

En el modo de realización preferido de la presente invención, se utiliza una resolución de tono de 1/3 de sub-muestra, y la búsqueda de tono (libro de código de tono) está compuesta por tres etapas.

En la primera etapa, se estima el retardo T_{OL} de tono en bucle abierto en el módulo 106 de búsqueda de tono en bucle abierto, como respuesta a la señal s_{w}(n) del habla ponderada. Como se ha indicado en la descripción precedente, este análisis del tono en bucle abierto se realiza usualmente una vez cada 10 ms (dos subtramas) utilizando técnicas bien conocidas para los expertos ordinarios en la técnica.

En la segunda etapa, se busca el criterio C de búsqueda en el módulo 107 de búsqueda de tono de bucle abierto para retardos de tono enteros alrededor del retardo estimado T_{OL} de tono en bucle abierto (usualmente \pm5), que simplifica significativamente el procedimiento de búsqueda. Se utiliza un procedimiento sencillo para actualizar el vector de código filtrado y_{T} sin necesidad de calcular le convolución para cada retardo de tono.

Una vez encontrado un retardo entero óptimo en la segunda etapa, una tercera etapa de la búsqueda (módulo 107) comprueba las fracciones alrededor de ese retardo de tono entero óptimo.

Cuando el predictor de tono está representado por un filtro de la forma 1/(1-bz^{-T}), que es una suposición válida para retardos de tono T>N, el espectro del filtro de tono presenta una estructura armónica en toda la gama de frecuencias, con una frecuencia armónica relacionada con 1/T. En el caso de señales de banda ancha, esta estructura no es muy eficiente ya que la estructura armónica en las señales de banda ancha no cubre todo el espectro ampliado. La estructura armónica existe solamente hasta una cierta frecuencia, dependiendo del segmento del habla. Así, con el fin de conseguir una representación eficiente de la contribución del tono en los segmentos de voz del habla de banda ancha, el filtro de predicción de tono necesita tener la flexibilidad de variar la cantidad de periodicidad en todo el espectro de banda ancha.

En la presente memoria se describe un nuevo método que consigue un modelo eficaz de estructura armónica del espectro del habla en las señales de banda ancha, por el cual se aplican varias formas de filtros de paso-bajo a la excitación anterior y se selecciona el filtro con ganancia de predicción más alta.

Cuando se utiliza la resolución de tono de una sub-muestra, pueden incorporarse los filtros de paso-bajo en los filtros de interpolación utilizados para obtener la resolución de tono más alta. En este caso, la tercera etapa de la búsqueda de tono, en la cual se comprueban las fracciones alrededor del retardo de tono entero elegido, se repite para los distintos filtros de interpolación que tienen características diferentes de paso-bajo y se selecciona la fracción y el índice del filtro que hace máximo el criterio C de búsqueda.

Un enfoque más sencillo es completar la búsqueda en las tres etapas descritas anteriormente para determinar el retardo fraccionario óptimo de tono utilizando solamente un filtro de interpolación con una cierta respuesta de frecuencias, y seleccionar la forma óptima del filtro paso-bajo al final, aplicando los distintos filtros paso-bajo predeterminados al vector v_{T} del libro de código de tono elegido y seleccionando el filtro de paso-bajo que hace mínimo el error de predicción de tono. Este enfoque se describe en detalle a continuación.

La figura 3 ilustra un diagrama esquemático de bloques de un modo de realización preferido del enfoque propuesto.

En el módulo 303 de memoria, se almacena la señal u(n), n<0, de la excitación anterior. El módulo 301 de búsqueda del libro de código de tono origina respuestas al vector objetivo x, al retardo T_{OL} de tono en bucle abierto y a la señal u(n), n<0, de la excitación anterior, procedente del módulo 303 de memoria para llevar a cabo una búsqueda del libro de código de tono (libro de código de tono) que haga mínimo el criterio C de búsqueda definido anteriormente. A partir del resultado de la búsqueda llevada a cabo en el módulo 301, el módulo 302 genera el vector óptimo v_{T} del libro de código de tono. Obsérvese que como se utiliza una resolución de tono de sub-muestra (tono fraccionario), la señal de excitación anterior u(n), n<0, es interpolada y el vector v_{T} del libro de código de tono corresponde a la señal de excitación anterior interpolada. En este modo de realización preferido, el filtro de interpolación (en el módulo 301, pero no ilustrado), tiene una característica de filtro de paso-bajo que elimina el contenido de frecuencias por encima de 7000 Hz.

En un modo de realización preferido, se utilizan las características del filtro K; estas características de filtro podrían ser características de filtro de paso-bajo o de paso-banda. Una vez determinado el vector de código óptimo v_{T} y suministrado al generador 302 de vectores de código de tono, se calculan K versiones filtradas de v_{T}, respectivamente, utilizando K filtros de conformación de frecuencias diferentes tales como 305^{(j)}, donde j=1, 2, ..., K. Estas versiones filtradas se denotan como v_{f}^{(j)}, donde j=1, 2, ..., K. Los diferentes vectores v_{f}^{(j)} sufren una convolución en los respectivos módulos 304^{(j)}, donde j=1, 2, .., K, con la respuesta h de impulsos para obtener los vectores y^{(j)} donde j=1,2,...,K. Para calcular el error cuadrático medio de predicción de tono para cada vector y^{(j)}, el valor y^{(j)} es multiplicado por la ganancia b por medio de un amplificador correspondiente 307^{(j)} y el valor by^{(j)} es restado del vector objetivo x por medio de un restador correspondiente 308^{(j)}. El selector 309 selecciona el filtro 305^{(j)} de conformación de frecuencia que hace mínimo el error cuadrático medio de predicción de tono.

e^{(j)} = ||x-b^{(j)} y^{(j)}||^{2} \ , \hskip1cm j= 1, 2, ..., K

Para calcular el error cuadrático medio e^{(j)} de predicción de tono para cada valor de y^{(j)}, el valor de y^{(j)} es multiplicado por la ganancia b por medio de un correspondiente amplificador 307^{(j)} y el valor b^{(j)}y^{(j)} es restado del vector objetivo x por medio de los restadores 308^{(j)}. Cada ganancia b^{(j)} es calculada en un correspondiente calculador 306^{(j)} de ganancia en asociación con el filtro de conformación de frecuencia en el índice j, utilizando la relación siguiente:

b^{(j)} = x^{t}y^{(j)}/||y^{(j)}||^{2}

En el selector 309, se eligen los parámetros b, T y j basándose en el v_{T} o v_{f}^{(j)} que hace mínimo el error cuadrático medio e de predicción del tono.

Volviendo a hacer referencia a la figura 1, el índice T del libro de código de tono es codificado y transmitido al multiplexor 112. La ganancia b del tono es cuantificada y transmitida al multiplexor 112. Con este nuevo enfoque, se necesita información adicional para codificar el índice j del filtro de conformación de frecuencia seleccionado en el multiplexor 112. Por ejemplo, si se utilizan tres filtros, (j=0, 1, 2, 3), se necesitan dos bits para representar esta información. La información j del índice del filtro puede ser codificada también conjuntamente con la ganancia b del tono.

Búsqueda del libro de código innovador

Una vez que el tono, o los parámetros LTP (Predicción a largo plazo) b, T y j están determinados, el paso siguiente es buscar la excitación innovadora óptima por medio del módulo 110 de búsqueda de la figura 1. En primer lugar, se actualiza el vector objetivo x restando la contribución LTP:

x{'} = x - by_{T}

donde b es la ganancia de tono e y_{T} es el vector del libro de código de tono filtrado (la excitación anterior con retardo T filtrada con el filtro paso-bajo seleccionado y en convolución con la respuesta h de impulsos descrita con referencia a la figura 3).

El procedimiento de búsqueda en CELP se realiza buscando el vector de código c_{k} de excitación óptimo y la ganancia g que hacen mínimo el error cuadrático medio entre el vector objetivo y el vector filtrado con escala modificada

E = ||x{'}-gHc_{k}||^{2}

donde H es la matriz de convolución triangular inferior obtenida del vector h de respuesta de impulsos.

En el modo de realización preferido de la presente invención, la búsqueda del libro de código innovador se realiza en el módulo 110 por medio de un libro de código algebraico según se describe en las patentes de Estados Unidos núms. 5.444.816 (Adoul y otros) publicada el 22 de Agosto de 1995; 5.699.482, concedida a Adoul y otros el 17 de Diciembre de 1997; 5.754.976 concedida a Adoul y otros el 19 de Mayo de 1998 y 5.701.392 (Adoul y otros) con fecha 23 de Diciembre de 1997.

Una vez el vector de código c_{k} de excitación óptimo y su ganancia g son elegidas por el módulo 110, el índice k del libro de código y la ganancia g son codificadas y transmitidas al multiplexor 112.

Haciendo referencia a la figura 1, los parámetros b, T, j, Â(z), k y g son multiplexados a través del multiplexor 112 antes de ser transmitidos a través de un canal de comunicaciones.

Actualización de memoria

En el módulo 111 de memoria (figura 1), los estados del filtro de síntesis ponderado W(z)/Â(z) son actualizados filtrando la señal de excitación u = gc_{k} + bv_{T} a través del filtro de síntesis ponderado. Tras este filtrado, los estados del filtro son memorizados y utilizados en la siguiente subtrama como estados iniciales para calcular la respuesta de entrada cero en el módulo calculador 108.

Como en el caso del vector objetivo x, pueden utilizarse otras alternativas matemáticamente equivalentes bien conocidas por los expertos ordinarios en la técnica para actualizar los estados del filtro.

Lado del descodificador

El dispositivo 200 de descodificación del habla de la figura 2 ilustra los diversos pasos llevados a cabo entre la entrada digital 222 (cadena de entrada al desmultiplexor 217) y el habla muestreada de salida 223 (salida del sumador 221).

El desmultiplexor 217 extrae los parámetros del modelo de síntesis de la información binaria recibida desde un canal de entrada digital. De cada trama binaria recibida, los parámetros extraídos son:

- los parámetros de predicción de corta duración (STP) Â(z) (una vez por trama);

- los parámetros de predicción a largo plazo (LTP) T, b y j (para cada subtrama); y

- el índice k del libro de código de innovación y la ganancia g (para cada subtrama).

La señal del habla en curso es sintetizada basándose en estos parámetros como será explicado a continuación.

El libro de código innovador 218 origina respuestas al índice k para generar el vector de código innovador c_{k}, cuya escala se modifica por el factor de ganancia g descodificado a través de un amplificador 224. En el modo de realización preferido, se utiliza un libro de código innovador 218 como se describe en las patentes de Estados Unidos antes mencionadas 5.444.816, 5.699.482, 5.754.976 y 5.701.392, para representar el vector de código innovador c_{k}.

El vector de código innovador gc_{k} generado, en la salida del amplificador 224, es procesado a través del filtro de innovación 205.

Aumento de la periodicidad

El vector de código con escala modificada generado en la salida del amplificador 224 es procesado a través del aumentador 205 de tono dependiente de la frecuencia.

Al aumentar la periodicidad de la señal u de excitación se mejora la calidad en el caso de segmentos de voz. Esto se hizo en el pasado filtrando el vector de innovación del libro de código innovador (libro de código fijo) 218 a través de un filtro de la forma 1/(1-\varepsilonbz^{-T}) donde \varepsilon es un factor por debajo de 0,5 que controla la cantidad de periodicidad introducida. Esta solución es menos eficaz en el caso de señales de banda ancha ya que introduce periodicidad en todo el espectro. Se divulga una nueva solución alternativa, que es parte de la presente invención, por la que el aumento de la periodicidad se consigue filtrando el vector de código innovador c_{k} del libro de código innovador (fijo) a través de un filtro 205 de innovación (F(z)) cuya respuesta de frecuencias enfatiza las frecuencias más altas más que las frecuencias más bajas. Los coeficientes de F(z) están relacionados con la cantidad de periodicidad de la señal u de excitación.

Hay disponibles muchos métodos conocidos para los expertos ordinarios en la técnica para obtener coeficientes de periodicidad válidos. Por ejemplo, el valor de la ganancia b proporciona una indicación de la periodicidad. Es decir, si la ganancia b está próxima a 1, la periodicidad de la señal u de excitación es alta, y si la ganancia b es menor que 0,5, la periodicidad es baja.

Otra forma eficaz de obtener los coeficientes del filtro F(z) utilizados en un modo de realización preferido, es relacionarlos con la cantidad de contribución del tono en la señal total u de excitación. Esto da como resultado una respuesta de frecuencias que depende de la periodicidad de la subtrama, donde las frecuencias más altas son enfatizadas con mayor fuerza (pendiente global más fuerte) para ganancias de tono más altas. El filtro 205 de innovación tiene el efecto de disminuir la energía del vector de código innovador c_{k} a frecuencias bajas cuando la señal u de excitación es más periódica, lo cual aumenta la periodicidad de la señal u de excitación a frecuencias más bajas más que a las frecuencias más altas. Las formas sugeridas del filtro 205 de innovación son

(1)F(z) = 1 - \sigma z^{-1},

o bien

(2)F(z) = -\alpha z + 1- \alpha z^{-1}

donde \sigma y \alpha son factores de periodicidad obtenidos a partir del nivel de periodicidad de la señal u de excitación.

La segunda forma de tres términos de F(z) se utiliza en un modo de realización preferido. El factor \alpha de periodicidad es calculado en el generador 204 de factores de voz. Pueden utilizarse varios métodos para obtener el factor á de periodicidad de la señal u de excitación. A continuación se presentan dos métodos.

Método 1

Se calcula primero la relación de la contribución del tono a la señal u de excitación total en el generador 204 de factores de voz por medio de

donde v_{T} es el vector de código de tono, b es la ganancia de tono y u es la señal de excitación entregada en la salida del sumador 219 por

u = gc_{k} + bv_{T}

Obsérvese que el término bv_{T} tiene su fuente en el libro de código del tono (libro de código del tono) 201 como respuesta al retardo T del tono y el valor anterior de u almacenado en la memoria 203. El vector de código de tono v_{T} del libro de código 201 de tono es procesado después a través de un filtro de paso-bajo 202 cuya frecuencia de corte es ajustada por medio del índice j del multiplexor 217. El vector de código v_{T} resultante es multiplicado después por la ganancia b del desmultiplexor 217 a través de un amplificador 226 para obtener la señal bv_{T}.

El factor \alpha se calcula en el generador 204 de factores de voz por medio de

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor que controla la cantidad de aumento (q es fijado en 0,25 en este modo de realización preferido).

Método 2

A continuación se describe otro método utilizado en un modo de realización preferido de la invención para calcular el factor \alpha de periodicidad.

En primer lugar, se calcula un factor r_{v} en el generador 204 de factores de voz por medio de

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

donde E_{v} es la energía del vector de código bv_{T} de tono con escala modificada y E_{c} es la energía del vector de código innovador gc_{k} con escala modificada. Es decir

E_{v} = b^{2}v_{T}^{t}v_{T} = b^{2}\sum\limits^{N-1}_{n=0}v_{T}{}^{2}(n)

y

E_{c} = g^{2}c_{k}{}^{t}c_{k} = g^{2} \sum\limits^{N-1}_{n=0}c_{k}{}^{2}(n)

Obsérvese que el valor de r_{v} cae entre -1 y 1 (1 corresponde a señales puras de voz y -1 corresponde a señales puras sin voz).

En este modo de realización preferido, el factor \alpha se calcula después en el generador 204 de factores de voz por medio de

\alpha = 0,125 (1 + r_{v})

que corresponde a un valor de 0 para señales puras no de voz y a 0,25 para señales puras de voz.

En la primera forma de dos términos de F(z), el factor \sigma de periodicidad puede ser aproximado utilizando \sigma = 2\alpha en los métodos 1 y 2 anteriores. En tal caso, el factor \sigma de periodicidad se calcula como sigue en el método 1 anterior:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q.

En el método 2, el factor \sigma de periodicidad se calcula como sigue:

\sigma = 0,25 (1 + r_{v}).

La señal aumentada c_{f} se calcula por tanto filtrando el vector de código innovador gc_{k} a través del filtro 205 de innovación (F(z)).

La señal u' de excitación aumentada es calculada por el sumador 220 como:

u{'} = c_{f} + bv_{T}

Obsérvese que este proceso no se realiza en el codificador 100. Por tanto, es esencial actualizar el contenido del libro de código 201 de tono utilizando la señal u de excitación sin aumentar para mantener el sincronismo entre el codificador 100 y el descodificador 200. Por tanto, la señal u de excitación se utiliza para actualizar la memoria 203 del libro de código 201 de tono y la señal u' de excitación aumentada se utiliza en la entrada del filtro de síntesis 206 de LP.

Síntesis y de-énfasis

La señal sintetizada s' se calcula filtrando la señal u' de excitación aumentada a través del filtro de síntesis 206 de LP que tiene la forma 1/Â(z), donde Â(z) es el filtro LP interpolado en la subtrama en curso. Como puede verse en la figura 2, los coeficientes de LP cuantificados Â(z) en la línea 225 del multiplexor 217 son suministrados al filtro de síntesis 206 de LP para ajustar consecuentemente los parámetros del filtro de síntesis 206 de LP. El filtro 207 de de-énfasis es la inversa del filtro 103 de pre-énfasis de la figura 1. La función de transferencia del filtro 207 de de-énfasis viene dada por

D(z) = 1 / (1 - \mu z^{-1})

donde \mu es un factor de pre-énfasis con un valor situado entre 0 y 1 (un valor típico es \mu=0,7). También podría usarse un filtro de orden superior.

El vector s' se filtra a través del filtro D(z) de de-énfasis (módulo 207) para obtener el vector s_{d}, que se hace pasar a través del filtro 208 de paso-alto para eliminar las frecuencias no deseadas por debajo de 50 Hz y obtener así s_{h}.

Sobre-muestreo y regeneración de alta frecuencia

El módulo 209 de sobre-muestreo lleva a cabo el proceso inverso del módulo 101 de muestreo reducido de la figura 1. En este modo de realización preferido, el sobre-muestreo convierte la tasa de muestreo de 12,8 kHz a la tasa de muestreo original de 16 kHz, utilizando técnicas bien conocidas para los expertos ordinarios en la técnica. La señal de síntesis sobre-muestreada se denota como \hat{s}. La señal \hat{s} es denominada también señal intermedia de banda ancha sintetizada.

La señal \hat{s} de síntesis sobre-muestreada no contiene los componentes de frecuencias más altas que se perdieron en el proceso de muestreo reducido (módulo 101 de la figura 1) en el codificador 100. Esto confiere una percepción de paso-bajo a la señal del habla sintetizada. Para restaurar la banda completa de la señal original, se divulga un procedimiento de generación de alta frecuencia. Este procedimiento se efectúa en los módulos 210 a 216, y en el sumador 221, y requiere la entrada del generador 204 de factores de voz (figura 2).

En este nuevo enfoque, el contenido de alta frecuencia es generado rellenando la parte superior del espectro con un ruido blanco con modificación de escala apropiada en el dominio de la excitación, convertido después al dominio del habla, preferiblemente conformándolo con el mismo filtro de síntesis LP utilizado para sintetizar la señal de muestreo reducido \hat{s}.

Se describe a continuación el procedimiento de generación de alta frecuencia de acuerdo con la invención.

El generador 213 de ruido aleatorio genera una secuencia w' de ruido blanco con un espectro plano en toda la anchura de banda de frecuencias, utilizando técnicas bien conocidas por los expertos ordinarios en la técnica. La secuencia generada es de longitud N' que es la longitud de la subtrama en el dominio original. Obsérvese que N es la longitud de la subtrama en el dominio del muestreo reducido. En este modo de realización preferido, N=64 y N'=80, lo cual corresponde a 5 ms.

La escala de la secuencia de ruido blanco se modifica apropiadamente en el módulo 214 de ajuste de ganancia. El ajuste de ganancia comprende los pasos siguientes. En primer lugar se fija la energía de la secuencia w' de ruido generado igual a la energía de la señal u' de excitación aumentada calculada por un módulo 210 de cálculo de energía, y la secuencia de ruido resultante con escala modificada viene dada por

w(n) = w{'}(n)\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N{'}-1}_{n=0}w{'}^{2}(n)}}, \hskip1cm n = 0, ..., N{'}-1

El segundo paso en la modificación de escala de la ganancia es tener en cuenta el contenido de altas frecuencias de la señal sintetizada en la salida del generador 204 de factores de voz, de manera que se reduce la energía del ruido generado en el caso de segmentos de voz (donde hay presente menos energía en altas frecuencias en comparación con los segmentos sin voz). En este modo de realización preferido, la medición del contenido de alta frecuencia se realiza midiendo la inclinación de la señal de síntesis a través de un calculador espectral 212 de inclinación y reduciendo la energía de manera consecuente. Pueden utilizarse igualmente otras medidas tales como las medidas del cruce con cero. Cuando la inclinación es muy fuerte, lo cual corresponde a segmentos de voz, la energía del ruido se reduce aún más. El factor de inclinación se calcula en el módulo 212 como el primer coeficiente de correlación de la señal s_{h} de síntesis y viene dada por:

inclinación = \frac{\sum\limits^{N-1}_{n=1}s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},

\hskip0.5cm

condicionada por inclinación \geq 0 e inclinación \geq r_{v},

donde el factor de voz r_{v} viene dado por

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

donde E_{v} es la energía del vector de código bv_{T} de tono con escala modificada y E_{c} es la energía del vector de código innovador gc_{k} con escala modificada, como se ha descrito anteriormente. El factor de voz r_{v} es muy frecuentemente menor que la inclinación pero esta condición fue introducida por precaución contra los tonos de alta frecuencia donde el valor de la inclinación es negativo y el valor de r_{v} es alto. Por tanto, esta condición reduce la energía del ruido para tales señales de tono.

El valor de la inclinación es 0 en el caso de espectro plano y 1 en el caso de señales con contenido fuerte de voz, y es negativo en el caso de señales sin voz donde hay más energía presente a altas frecuencias.

Pueden utilizarse distintos métodos para obtener el factor de modificación de escala g_{t} a partir de la cantidad de contenido de altas frecuencias. En esta invención, se ofrecen dos métodos basándose en la inclinación de la señal descrita anteriormente.

Método 1

El factor de modificación de escala g_{t} se obtiene de la inclinación por medio de

g_{t} = 1 - inclinación \hskip0.5cm limitado \ por \ 0,2 \leq g_{t} \leq 1,0

Para señales con fuerte contenido de voz donde la inclinación se aproxima a 1, g_{t} es 0,2 y para señales sin un fuerte contenido de voz, g_{t} toma el valor 1,0.

Método 2

Se restringe primero el factor g_{t} de inclinación para que sea mayor o igual que cero, después se obtiene el factor de modificación de escala a partir de la inclinación por medio de:

g_{t} = 10^{-0,6 \ inclinación}

La secuencia w_{g} de ruido con escala modificada generada en el módulo 214 de ajuste de ganancia viene dada por tanto por:

w_{g} = g_{t} w.

\newpage

Cuando la inclinación está próxima a cero, el factor g_{t} de modificación de escala está próximo a 1, lo cual no da como resultado una reducción de la energía. Cuando el valor de la inclinación es 1, el factor g_{t} de modificación de escala da como resultado una reducción de 12dB en la energía del ruido generado.

Una vez que la escala del ruido se ha modificado apropiadamente (w_{gç}), se lleva al dominio del habla utilizando el conformador espectral 215. En el modo de realización preferido, esto se consigue filtrando el ruido w_{g} a través de una versión ampliada de anchura de banda del mismo filtro de síntesis de LP utilizado en el dominio de muestreo reducido (1/Â(z/0,8)). Los correspondientes coeficientes del filtro de LP de anchura de banda ampliada son calculados en el conformador espectral 215.

La secuencia filtrada w_{f} de ruido con escala modificada es filtrada después en banda de paso para la gama de frecuencias requerida que ha de restaurarse utilizando el filtro 216 de paso-banda. En el modo de realización preferido, el filtro 216 de paso-banda restringe la secuencia de ruido a la gama de frecuencias de 5,6 - 7,2 kHz. La secuencia resultante z de ruido filtrado de paso-banda es sumada en el sumador 221 con la señal \hat{s} de habla sintetizada con sobre-muestreo para obtener la señal final reconstruida s_{out} en la salida 223.

Aunque la presente invención ha sido descrita en lo que antecede a manera de modo de realización preferido de la misma, este modo de realización puede modificarse a voluntad, dentro del alcance de las reivindicaciones anexas. Aún cuando el modo de realización preferido describe el uso de señales de habla de banda ancha, será obvio para los expertos en la técnica que la invención del objeto está dirigida también a otros modos de realización que utilizan señales de banda ancha en general y que no está necesariamente limitada a aplicaciones del habla.

Claims

1. Un dispositivo para aumentar la periodicidad de una señal de excitación generada en relación con un vector de código de tono y un vector de código innovador para suministrar un filtro de síntesis de señal en una señal de banda ancha, comprendiendo dicho dispositivo de aumento de la periodicidad:

a) un generador (204) de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha; y

b) un filtro 205 de innovación para filtrar el vector de código innovador en relación con dicho factor de periodicidad para reducir así la energía de la parte de baja frecuencia del vector de código innovador y aumentar la periodicidad de una parte de baja frecuencia de la señal de excitación.

2. Un dispositivo de aumento de la periodicidad, como se define en la reivindicación 1, en el que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

3. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 1, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

donde \alpha es un factor de periodicidad obtenido de un nivel de periodicidad de la señal de excitación.

4. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 3, donde dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0.5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

donde v_{T} es el vector de código de tono, b es la ganancia de tono, N es la longitud de una subtrama y u es la señal de excitación.

5. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 4, en el que el factor q está fijado en 0,25.

6. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 3, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

7. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 1, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

donde \sigma es un factor de periodicidad obtenido desde un nivel de periodicidad de la señal de excitación.

8. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 7, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0.5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

9. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 8, donde dicho factor q de aumento está fijado en 0,25.

10. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 7, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

11. Un método para aumentar la periodicidad de una señal de excitación generada en relación con un vector de código de tono y un vector de código innovador para suministrar un filtro de síntesis de señales para sintetizar una señal de banda ancha, comprendiendo dicho método de aumento de la periodicidad los pasos de:

a) calcular un factor de periodicidad relacionada con la señal de banda ancha; y

b) filtrar el vector de código innovador en relación con dicho factor de periodicidad para reducir así la energía de una parte de baja frecuencia del vector de código innovador y aumentar la periodicidad de una parte de baja frecuencia de la señal de excitación.

12. Un método para aumentar la periodicidad como se define en la reivindicación 10, en el que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

13. Un método para aumentar la periodicidad como se define en la reivindicación 10, en el que dicho filtrado comprende el proceso del vector de innovación a través de un filtro de innovación que tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

14. Un método para aumentar la periodicidad como se define en la reivindicación 13, en el que dicho cálculo del factor de periodicidad comprende el cálculo de dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0.5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

15. Un método de aumento de la periodicidad como se define en la reivindicación 14, en el que el factor q de aumento está fijado en 0,25.

16. Un método de aumento de la periodicidad como se define en la reivindicación 13, en el que dicho cálculo del factor de periodicidad comprende el cálculo de dicho factor de periodicidad á utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

17. Un método de aumento de la periodicidad como se define en la reivindicación 11, en el que dicho filtrado comprende el proceso del vector de innovación a través de un filtro de innovación que tiene una función de transferencia de la forma:

F(z) = 1 -\sigma z^{-1}

18. Un método de aumento de la periodicidad como se define en la reivindicación 17, en el que dicho cálculo del factor de periodicidad comprende el cálculo de dicho factor de periodicidad ó utilizando la relación:

\sigma = 2qR_{p} \hskip0.5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

19. Un método de aumento de la periodicidad como se define en la reivindicación 18, donde dicho factor q de aumento está fijado en 0,25.

20. Un método de aumento de la periodicidad como se define en la reivindicación 17, en el que dicho cálculo del factor de periodicidad comprende el cálculo de dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

21. Un descodificador para generar una señal sintetizada de banda ancha, que comprende:

a) un dispositivo de fragmentación de la señal para recibir una señal codificada de banda ancha y extraer de dicha señal codificada de banda ancha al menos unos parámetros de libro de código de tono, parámetros del libro de código innovador y coeficientes del filtro de síntesis;

b) un libro de código de tono que responde a dichos parámetros de libro de código de tono para generar un vector de código de tono;

c) un libro de código innovador que responde a dichos parámetros del libro de código innovador para generar un vector de código innovador;

d) un dispositivo de aumento de la periodicidad como se ha descrito en la reivindicación 1, que comprende el generador de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha; y dicho filtro de innovación para filtrar el vector de código innovador;

e) un circuito combinador para combinar dicho vector de código de tono y dicho vector de código innovador filtrado por dicho filtro de innovación para generar así dicha señal de excitación de periodicidad aumentada; y

f) un filtro de síntesis de señales para filtrar dicha señal de excitación de periodicidad aumentada en relación con dichos coeficientes del filtro de síntesis para generar así dicha señal de banda ancha sintetizada.

22. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 21, en el que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

23. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 21, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

24. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 23, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

25. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 24, donde dicho factor q de aumento está fijado en 0,25.

26. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 23, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

27. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 21, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

28. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 27, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0.5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

29. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 28, donde dicho factor q de aumento está fijado en 0,25.

30. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 27, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

31. Un descodificador para generar una señal sintetizada de banda ancha, que comprende:

d) un circuito combinador para combinar dicho vector de código de tono y dicho vector de código innovador para generar así una señal de excitación; y

e) un filtro de síntesis de señales para filtrar dicha señal de excitación en relación con dichos coeficientes del filtro de síntesis para generar así dicha señal sintetizada de banda ancha;

comprendiendo además el descodificador un dispositivo de aumento de la periodicidad como se describe en la reivindicación 1, que comprende un generador de factores para calcular un factor de periodicidad relacionado con la señal de banda ancha, y dicho filtro de innovación para filtrar el vector de código innovador.

32. Un descodificador para generar una señal de banda ancha sintetizada como se define en la reivindicación 31, en el que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

33. Un descodificador para generar una señal de banda ancha sintetizada como se define en la reivindicación 31, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

34. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 33, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0.5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

35. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 34, donde dicho factor q de aumento está fijado en 0,25.

36. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 33, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

37. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 31, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

38. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 37, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

39. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 38, donde dicho factor q de aumento está fijado en 0,25.

40. Un descodificador para generar una señal sintetizada de banda ancha como se define en la reivindicación 37, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

41. Un sistema de comunicación celular para dar servicio a un área geográfica grande dividida en una pluralidad de células, que comprende:

a) unidades móviles transmisoras/receptoras;

b) estaciones base celulares situadas respectivamente en dichas células;

c) un terminal de control para controlar la comunicación entre las estaciones base celulares;

d) un subsistema bidireccional de comunicaciones inalámbricas entre cada unidad móvil situada en una célula y la estación base celular de dicha célula, comprendiendo dicho subsistema bidireccional de comunicaciones inalámbricas, tanto en la unidad móvil como en la estación base celular:

i): un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal de banda ancha codificada; y

ii): un receptor que incluye un circuito de recepción para recibir una señal de banda ancha transmitida codificada y un descodificador como se describe en la reivindicación 21 para descodificar la señal de banda ancha recibida codificada.

42. Un sistema de comunicaciones celulares como se define en la reivindicación 41, en el que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

43. Un sistema de comunicaciones celulares como se define en la reivindicación 41, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

44. Un sistema de comunicaciones celulares como se define en la reivindicación 43, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

45. Un sistema de comunicaciones celulares como se define en la reivindicación 44, donde dicho factor q de aumento está fijado en 0,25.

46. Un sistema de comunicaciones celulares como se define en la reivindicación 43, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad á utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

47. Un sistema de comunicaciones celulares como se define en la reivindicación 41, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

48. Un sistema de comunicaciones celulares como se define en la reivindicación 47, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

49. Un sistema de comunicaciones celulares como se define en la reivindicación 48, donde dicho factor q de aumento está fijado en 0,25.

50. Un sistema de comunicaciones celulares como se define en la reivindicación 47, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

51. Una unidad móvil celular transmisora/receptora que comprende:

a) un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal de banda ancha codificada; y

b) un receptor que incluye un circuito de recepción para recibir una señal de banda ancha codificada transmitida y un descodificador como se describe en la reivindicación 21, para descodificar la señal de banda ancha recibida codificada.

52. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 51, en la que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

53. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 51, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

54. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 53, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

55. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 54, en la que dicho factor de aumento q está fijado en 0,25.

56. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 53, en la que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

57. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 51, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

58. Un dispositivo de aumento de la periodicidad como se define en la reivindicación 57, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

59. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 58, donde dicho factor q de aumento está fijado en 0,25.

60. Una unidad móvil celular transmisora/receptora como se define en la reivindicación 57, en la que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

61. Un elemento de red celular que comprende:

62. Un elemento de red celular como se define en la reivindicación 61, en la que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

63. Un elemento de red celular como se define en la reivindicación 61, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

64. Un elemento de red celular como se define en la reivindicación 63, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

65. Un elemento de red celular como se define en la reivindicación 64, en la que dicho factor de aumento q está fijado en 0,25.

66. Un elemento de red celular como se define en la reivindicación 63, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad á utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

67. Un elemento de red celular como se define en la reivindicación 61, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

68. Un elemento de red celular como se define en la reivindicación 67, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

69. Un elemento de red celular como se define en la reivindicación 68, donde dicho factor q de aumento está fijado en 0,25.

70. Un elemento de red celular como se define en la reivindicación 67, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

71. Un subsistema bidireccional de comunicaciones inalámbricas con un sistema de comunicaciones celulares para dar servicio a un área geográfica grande dividida en una pluralidad de células que comprende: unidades móviles transmisoras/receptoras; estaciones base celulares, situadas respectivamente en dichas células; y un terminal de control para controlar las comunicaciones entre las estaciones base celulares:

estando dicho subsistema bidireccional de comunicaciones inalámbricas entre cada una de las unidades móviles situadas en una célula y la estación base celular de dicha célula, comprendiendo dicho subsistema bidireccional de comunicaciones inalámbricas, tanto en la unidad móvil como en la estación base celular:

72. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 71, en la que dicho generador de factores comprende medios para calcular un factor de periodicidad como respuesta al vector de código de tono y al vector de código innovador.

73. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 71, en el que dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = -\alpha z + 1 - \alpha z^{-1}

74. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 73, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \alpha utilizando la relación:

\alpha = qR_{p} \hskip0,5cm limitado \ por \ \alpha < q

donde q es un factor de aumento y donde

75. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 74, en el que dicho factor de aumento q está fijado en 0,25.

76. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 73, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad á utilizando la relación:

\alpha = 0,125 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

77. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 71, donde dicho filtro de innovación tiene una función de transferencia de la forma:

F(z) = 1 - \sigma z^{-1}

78. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 77, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad \sigma utilizando la relación:

\sigma = 2qR_{p} \hskip0,5cm limitado \ por \ \sigma < 2q

donde q es un factor de aumento, y donde

79. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 78, donde dicho factor q de aumento está fijado en 0,25.

80. Un subsistema bidireccional de comunicaciones inalámbricas como se define en la reivindicación 77, en el que dicho generador de factores comprende medios para calcular dicho factor de periodicidad ó utilizando la relación:

\sigma = 0,25 (1 + r_{v}), \ donde

r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})

\vskip1.000000\baselineskip