ES2240602T3 - Procedimiento y aparato para la seleccion de una velocidad de codificacion en un vocodificador de velocidad variable. - Google Patents
Procedimiento y aparato para la seleccion de una velocidad de codificacion en un vocodificador de velocidad variable.Info
- Publication number
- ES2240602T3 ES2240602T3 ES02009467T ES02009467T ES2240602T3 ES 2240602 T3 ES2240602 T3 ES 2240602T3 ES 02009467 T ES02009467 T ES 02009467T ES 02009467 T ES02009467 T ES 02009467T ES 2240602 T3 ES2240602 T3 ES 2240602T3
- Authority
- ES
- Spain
- Prior art keywords
- speed
- frames
- successive
- encoded
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000000903 blocking effect Effects 0.000 claims description 14
- 230000006978 adaptation Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 11
- 206010019133 Hangover Diseases 0.000 abstract 2
- 230000001419 dependent effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 20
- 230000000694 effects Effects 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 8
- 238000005311 autocorrelation function Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Dc Digital Transmission (AREA)
Abstract
Procedimiento para la adición de tramas de bloqueo a una pluralidad de tramas codificadas mediante un vocodificador, comprendiendo el procedimiento: detectar que un número predefinido de sucesivas tramas ha sido codificado a una primera velocidad; determinar que una próxima trama sucesiva debería ser codificada a una segunda velocidad inferior a la primera velocidad; y seleccionar un número de tramas de bloqueo sucesivas que se inician con dicha próxima trama sucesiva para ser codificada a la segunda velocidad, siendo el número una función de una relación señal-ruido determinada a partir de la señal de entrada (S(n)) que debe codificarse.
Description
Procedimiento y aparato para la selección de una
velocidad de codificación en un vocodificador de velocidad
variable.
La presente invención se refiere a los
vocodificadores. Más particularmente, la presente invención se
refiere a un procedimiento nuevo y mejorado para determinar la
velocidad de codificación de la voz en un vocodificador de velocidad
variable.
Los sistemas de compresión de voz de velocidad
variable suelen utilizar alguna forma de algoritmo de determinación
de velocidad antes de que empiece la codificación. El algoritmo de
determinación de velocidad asigna un sistema de codificación de
velocidad binaria más alta a los segmentos de la señal de audio en
los que está presente la voz y un sistema de codificación de
velocidad más baja a los segmentos de silencio. De esta forma, se
obtiene una velocidad binaria media inferior, mientras que la
calidad de la voz reconstruida sigue siendo alta. Por lo tanto, para
utilizar con eficacia un codificador de voz de velocidad variable se
requiere un algoritmo de determinación de velocidad sólido que pueda
diferenciar entre voz y silencio en una diversidad de entornos de
ruido de fondo.
Uno de dichos sistemas de compresión de voz de
velocidad variable o vocodificadores de velocidad variable se da a
conocer en la patente US n.º 5.414.796 en trámite, titulada
"Variable Rate Vocoder" y transferida al cesionario de la
presente invención. En esta ejecución particular de vocodificador de
velocidad variable, la voz de entrada se codifica utilizando
técnicas de predicción lineal con excitación por código (CELP) a una
de las diversas velocidades determinada por el nivel de actividad
oral. El nivel de actividad oral se determina a partir de la energía
de las muestras de audio de entrada, que pueden contener ruido de
fondo además de voz. Para que el vocodificador pueda efectuar una
codificación de voz de alta calidad con niveles variables de ruido
de fondo, es necesario emplear una técnica de ajuste de umbral para
compensar el efecto del ruido de fondo sobre el algoritmo de
decisión de velocidad.
Los vocodificadores se suelen utilizar en
dispositivos de comunicación como, por ejemplo, teléfonos celulares
o dispositivos de comunicación personal, para efectuar la compresión
digital de una señal de audio analógica, que se convierte en una
señal digital para ser transmitida. En un entorno móvil en el que se
puede utilizar un teléfono celular o un dispositivo de comunicación
personal, los niveles altos de energía de ruido de fondo dificultan
la diferenciación mediante el algoritmo de determinación de
velocidad entre los sonidos sordos de baja energía y el silencio con
ruido de fondo, utilizando un algoritmo de determinación de
velocidad basado en la energía de la señal. Por lo tanto, los
sonidos sordos a menudo se codifican a velocidades binarias más
bajas, lo que determina una degradación de la calidad de la voz, ya
que las consonantes como "s", "x", "ch", "sh",
"t", etc. se pierden en la voz reconstruida.
Los vocodificadores que basan sus decisiones de
velocidad únicamente en la energía del ruido de fondo fracasan en su
intento de tener en cuenta la intensidad de la señal en relación con
el ruido de fondo cuando se establecen los valores umbral. Los
vocodificadores que basen sus niveles umbral únicamente en el ruido
de fondo tienden a comprimir entre sí los niveles umbral cuando el
ruido de fondo aumenta. Si se desea que el nivel de la señal se
mantenga fijo, ésta será la forma correcta de establecer los niveles
umbral; no obstante, si se desea que el nivel de la señal aumente
con el nivel de ruido de fondo, la compresión de los niveles
umbrales no resulta la mejor solución. Por lo tanto, se plantea la
necesidad de disponer de un procedimiento alternativo para
establecer niveles umbral en los vocodificadores de velocidad
variable, que tenga en cuenta la intensidad de la señal.
Finalmente, queda por resolver el problema
relacionado con la reproducción de música mediante vocodificadores
de decisión de velocidad basada en la energía del ruido de fondo. Al
hablar, las personas deben efectuar pausas para respirar, lo que
permite que los niveles umbral se restablezcan en el nivel de ruido
de fondo adecuado. Sin embargo, en la transmisión de música a través
de un vocodificador (como sucede en el caso de la música en espera),
no se produce ninguna pausa y los niveles umbral continúan
aumentando hasta que la música empieza a codificarse a una velocidad
inferior a la velocidad completa y, en tales circunstancias, el
codificador de velocidad variable proporciona música confusa con
ruido de fondo.
Merece especial atención el documento K.
Srinivasan and A. Gersho: "Voice activity detection for
cellular networks", Proceedings: IEEE Workshop on speech
coding for telecommunications, 13-15 octubre de
1993, páginas 85-86, XP002204645, University of
California. El documento hace referencia a algoritmos para la
detección de la actividad de la voz en presencia de ruido vehicular
y de ruido de mezcla. En particular, da a conocer un algoritmo de
detección de la actividad de la voz en el que se introduce un
periodo de bloqueo adaptable comprendido entre 40 ms y 180 ms. El
periodo de bloqueo real está basado en la relación, r, entre la
capacidad de salida del filtro de supresión de ruido y el umbral
adaptable correspondiente.
Merece especial atención el documento Paksoy E
et al: "Variable rate speech coding for multiple access
wireless networks", Electrotechnical Conference, 1994,
Proceedings., 7^{th} Mediterranean Antalya, Turkey
12-14 abril de 1994, New York, NY, USA, IEEE, 12 de
abril de 1994, páginas 47-50, XP10130866
ISBN:0-7803-1772-6
que hace referencia a la codificación de la voz de velocidad
variable para redes inalámbricas de acceso múltiple, que menciona
particularmente una detección de actividad de voz con una adaptación
del periodo de bloqueo a los niveles de señal detectados.
Según la presente invención, se proporcionan un
procedimiento y un aparato para la adición de tramas de bloqueo a
una pluralidad de tramas codificadas por un codificador vocal, tal
como se establece en las reivindicaciones 1 y 8. Las formas de
realización preferidas de la presente invención se reivindican en
las reivindicaciones subordinadas.
La presente invención consiste en un
procedimiento y un aparato nuevos y mejorados para determinar una
velocidad de codificación en un vocodificador de velocidad variable.
El primer objetivo de la presente invención es proporcionar un
procedimiento mediante el cual se pueda reducir la probabilidad de
codificar sonidos sordos de baja energía como ruido de fondo. En la
presente invención, la señal de entrada se filtra para obtener un
componente de alta frecuencia y un componente de baja frecuencia.
Los componentes filtrados de la señal de entrada se analizan a
continuación por separado para detectar la presencia de voz. Debido
a que los sonidos sonoros tienen un componente de alta frecuencia,
resulta más fácil diferenciar la intensidad de éstos del ruido de
fondo en una banda de frecuencias altas que en toda la banda de
frecuencias.
El segundo objetivo de la presente invención es
proporcionar medios para establecer los niveles umbral que tengan en
cuenta tanto la energía de la señal como la energía del ruido de
fondo. En la presente invención, el establecimiento de umbrales de
detección de voz se basa en una estimación de la relación
señal-ruido (SNR) de la señal de entrada. En el
ejemplo de forma de realización, la energía de la señal se estima
como la energía máxima de la señal durante períodos de actividad
oral y la energía de ruido de fondo se estima como la energía mínima
de la señal durante períodos de silencio.
El tercer objetivo de la presente invención es
proporcionar un procedimiento para codificar música mediante un
vocodificador de velocidad variable. En el ejemplo de forma de
realización, el aparato de selección de velocidad detecta un grupo
de tramas consecutivas durante las cuales los niveles umbral han
aumentado y comprueba la periodicidad relativa a dicho grupo de
tramas. La presencia de música viene indicada por el carácter
periódico de la señal de entrada. Si se detecta la presencia de
música, se establecen umbrales a niveles que permiten la
codificación de la señal a velocidad completa.
Las características, los objetivos y las ventajas
de la presente invención resultarán más evidentes a partir de la
descripción detallada proporcionada a continuación e ilustrada
mediante los dibujos, en los que se emplean los mismos números de
referencia para las partes equivalentes, y en los que:
la Figura 1 es un diagrama de bloques de la
presente invención.
En relación con la Figura 1, la señal de entrada,
S(n), se proporciona a los elementos de cálculo de energía de
subbandas 4 y 6. La señal de entrada S(n) consiste en una
señal de audio y ruido de fondo. La señal de audio suele ser voz,
pero también puede tratarse de música. En el ejemplo de forma de
realización, S(n) se proporciona en tramas de veinte
milisegundos de 160 muestras cada una. En el ejemplo de forma de
realización, la señal de entrada S(n) tiene componentes de
frecuencia entre 0 kHz y 4 kHz, que es aproximadamente el ancho de
banda de una señal de voz humana.
En el ejemplo de forma de realización, la señal
de entrada de 4 kHz, S(n), se filtra para obtener dos
subbandas separadas. Las dos subbandas separadas se hallan entre 0 y
2 kHz y 2 kHz y 4 kHz, respectivamente. En un ejemplo de forma de
realización, la señal de entrada puede dividirse en subbandas
mediante filtros de subbandas, cuyo diseño es ampliamente conocido
dentro de la técnica y descrito en la patente US n.º 5.644.596,
titulada "Frequency Selective Adaptive Filtering", y concedida
al cesionario de la presente invención.
Las respuestas impulsivas de los filtros de
subbandas se indican por h_{L}(n) y h_{H}(n) para
el filtro pasa banda y el filtro pasa alta, respectivamente. Para
calcular la energía de los componentes de subbandas resultantes de
la señal y obtener los valores R_{L}(0) y
R_{H}(0), basta con sumar los cuadrados de las muestras de
salida del filtro de subbandas, de una forma bien conocida en el
ámbito de la técnica.
En una forma de realización preferida, cuando la
señal de entrada S(n) se proporciona al elemento de cálculo
de energía de subbandas 4, el valor de energía del componente de
baja frecuencia de la trama de entrada, R_{L}(0), se
calcula como:
(1)R_{L}(0) \
= R_{S}(0) \ \cdot \ R_{h_{L}}(0) \ + \ 2 \ \cdot \
\sum\limits^{L-1}_{i=1} \ R_{S}(i) \ \cdot \
R_{h_{L}}(i),
en la que L es el número de tomas
del filtro pasa banda con respuesta impulsiva h_{L}(n) y
R_{S}(i) es la función de autocorrelación de la señal de
entrada, S(n), proporcionada por la
ecuación:
(2)R_{S}(i) \
= \ \sum\limits^{N}_{n=1} \ S(n) \ \cdot \
S(n-i),
\hskip1cmpara i \in [0, L-1]
en la que N es el número de
muestras de la trama y R_{h}L es la función de autocorrelación del
filtro pasa banda h_{L}(n) proporcionada
por:
(3)R_{h_{L}}(i) \ = \
\sum\limits^{L-1}_{n=0} \ h_{L}(n) \ \cdot \
h_{L}(n-i).
\hskip1cmpara i \in [0, L-1]
\hskip4.8cm= 0 en los demás casos
La energía de alta frecuencia, R_{H}(0),
se calcula de forma similar en el elemento de cálculo de energía de
subbandas 6.
Los valores de la función de autocorrelación de
los filtros de subbandas pueden calcularse por adelantado para
reducir la cantidad de cálculos. Además, algunos de los valores
calculados de R_{S}(i) se utilizan en otros cálculos de la
codificación de la señal de entrada, S(n), lo que todavía
reduce más la carga de cálculo neta del procedimiento de selección
de velocidad de codificación de la presente invención. Por ejemplo,
la obtención de los valores de tomas del filtro LPC requiere el
cálculo de un grupo de coeficientes de autocorrelación de la señal
de entrada.
El cálculo de los valores de tomas del filtro LPC
es muy conocido en la técnica y se describe con detalle en la
patente US n.º 5.414.796 mencionada anteriormente. Si se va a
codificar la voz con un procedimiento que requiere un filtro LPC de
diez tomas, sólo es necesario calcular los valores de
R_{S}(i) para los valores de i comprendidos entre 11 y
L-1, además de los que se utilizan en la
codificación de la señal, porque en el cálculo de los valores de
tomas del filtro LPC, se utiliza R_{S}(i) para valores de i
entre 0 y 10. En el ejemplo de forma de realización, los filtros de
subbandas tienen 17 tomas (es decir, L = 17).
El elemento de cálculo de energía de subbandas 4
proporciona el valor calculado de R_{L}(0) al elemento de
decisión de velocidad de subbandas 12 y el elemento de cálculo de
energía de subbandas 6 proporciona el valor calculado de
R_{H}(0) al elemento de decisión de velocidad de subbandas 14. El elemento de decisión de velocidad 12 compara el valor de R_{L}(0) con dos valores umbral predeterminados T_{L1/2} y T_{Lfull} y asigna una velocidad de codificación recomendada, RATE_{L}, según el resultado de la comparación. La asignación de velocidad se lleva a cabo de la siguiente
forma:
R_{H}(0) al elemento de decisión de velocidad de subbandas 14. El elemento de decisión de velocidad 12 compara el valor de R_{L}(0) con dos valores umbral predeterminados T_{L1/2} y T_{Lfull} y asigna una velocidad de codificación recomendada, RATE_{L}, según el resultado de la comparación. La asignación de velocidad se lleva a cabo de la siguiente
forma:
\vskip1.000000\baselineskip
- RATE_{L} =
octavo de velocidad
\hskip2cm
R_{L}(0) \leq T_{L1/2}\hskip5.8cm
(4)
- RATE_{L} =
media velocidad
\hskip2.5cm
T_{L1/2} < R_{L}(0) \leq T_{Lfull}\hskip4.7cm
(5)
- RATE_{L} =
velocidad completa
\hskip2.1cm
R_{L}(0) > T_{Lfull}\hskip5.73cm
(6)
\vskip1.000000\baselineskip
El elemento de decisión de velocidad de subbandas
14 funciona de forma similar y selecciona una velocidad de
codificación recomendada, RATE_{H}, según el valor de energía de
alta frecuencia R_{H}(0) y basándose en un grupo diferente
de valores umbral T_{H1/2} y T_{Hfull}. El elemento de decisión
de velocidad de subbandas 12 proporciona la velocidad de
codificación recomendada, RATE_{L}, al elemento de selección de
velocidad de codificación 16, y el elemento de decisión de velocidad
de subbandas 14 proporciona la velocidad de codificación
recomendada, RATE_{H}, al elemento de selección de velocidad de
codificación 16. En el ejemplo de forma de realización, el elemento
de selección de velocidad de codificación 16 selecciona la más alta
de las dos velocidades recomendadas y proporciona la velocidad más
alta como la velocidad de codificación seleccionada.
El elemento de cálculo de energía de subbandas 4
también proporciona el valor de energía de baja frecuencia,
R_{L}(0), al elemento de adaptación de umbral 8, donde se calculan los valores umbral T_{L1/2} y T_{Lfull} para la siguiente trama de entrada. De modo similar, el elemento de cálculo de energía de subbandas 6 proporciona el valor de energía de alta frecuencia, R_{H}(0), al elemento de adaptación de umbral 10, donde se calculan los valores umbral T_{H1/2} y T_{Hfull} de la siguiente trama de entrada.
R_{L}(0), al elemento de adaptación de umbral 8, donde se calculan los valores umbral T_{L1/2} y T_{Lfull} para la siguiente trama de entrada. De modo similar, el elemento de cálculo de energía de subbandas 6 proporciona el valor de energía de alta frecuencia, R_{H}(0), al elemento de adaptación de umbral 10, donde se calculan los valores umbral T_{H1/2} y T_{Hfull} de la siguiente trama de entrada.
El elemento de adaptación de umbral 8 recibe el
valor de energía de baja frecuencia, R_{L}(0), y determina
si
S(n) contiene ruido de fondo o una señal de audio. En un ejemplo de ejecución, el procedimiento mediante el cual el elemento de adaptación de umbral 8 determina si está presente o no una señal de audio consiste en examinar la función de autocorrelación normalizada NACF, que viene dada por la ecuación siguiente:
S(n) contiene ruido de fondo o una señal de audio. En un ejemplo de ejecución, el procedimiento mediante el cual el elemento de adaptación de umbral 8 determina si está presente o no una señal de audio consiste en examinar la función de autocorrelación normalizada NACF, que viene dada por la ecuación siguiente:
siendo e(n) la señal
residual formante obtenida tras el filtrado de la señal de entrada,
S(n), mediante un filtro
LPC.
El diseño y la filtración de una señal mediante
un filtro LPC son bien conocidos en la técnica y se describen con
detalle en la patente US nº 5.414.796 mencionada anteriormente. La
señal de entrada, S(n), se filtra mediante el filtro LPC para
eliminar la interacción de los formantes. La función NACF se compara
con un valor umbral para determinar la presencia o no de una señal
de audio. Si la función NACF es superior a un valor umbral
predeterminado, significa que la trama de entrada tiene una
característica periódica que indica la presencia de una señal de
audio (de voz o de música). Debe observarse que, aunque las partes
de voz y música no son periódicas y presentan valores bajos de la
función NACF, el ruido de fondo no suele presentar ninguna
periodicidad y casi siempre presenta valores bajos de la función
NACF.
Si se determina que S(n) contiene ruido de
fondo, el valor de la función NACF es inferior al valor umbral TH1 y
entonces se utiliza el valor R_{L}(0) para actualizar el
valor de la estimación de ruido de fondo actual BGN_{L}. En el
ejemplo de forma de realización, TH1 es 0,35. R_{L}(0) se
compara con el valor actual de la estimación de ruido de fondo
BGN_{L}. Si R_{L}(0) es inferior a BGN_{L}, entonces la
estimación de ruido de fondo BGN_{L} se establece en
R_{L}(0), independientemente del valor de la función
NACF.
La estimación de ruido de fondo BGN_{L} sólo
aumenta cuando la función NACF es inferior al valor umbral TH1. Si
R_{L}(0) es superior a BGN_{L} y la función NACF es
inferior a TH1, entonces la energía de ruido de fondo BGN_{L} se
establece en \alpha_{1}. BGN_{L}, siendo \alpha_{1} un
número mayor que 1. En el ejemplo de forma de realización,
\alpha_{1} es igual a 1,03. BGN_{L} continua aumentando,
mientras la función NACF es inferior al valor umbral TH1 y
R_{L}(0) es superior al valor actual de BGN_{L}, hasta
que BGN_{L} llega a un valor máximo predeterminado BGN_{max},
momento en el cual la estimación de ruido de fondo BGN_{L} se
establece en BGN_{max}.
Si se detecta una señal de audio (hecho que
sucede cuando el valor de la función NACF sobrepasa un segundo valor
umbral TH2), la estimación de la energía de la señal, S_{L}, se
actualiza. En el ejemplo de forma de realización, TH2 se establece
en 0,5. El valor de R_{L}(0) se compara con la estimación
actual de la energía de la señal de pasa banda, S_{L}. Si
R_{L}(0) es superior al valor actual de S_{L}, entonces
S_{L} se establece en R_{L}(0). Si R_{L}(0) es
inferior al valor actual de S_{L}, entonces S_{L} se establece
en \alpha_{2}.S_{L}, también esta vez sólo si la función NACF
es superior a TH2. En el ejemplo de forma de realización,
\alpha_{2} se establece en 0,96.
A continuación, el elemento de adaptación de
umbral 8 efectúa la estimación de la relación
señal-ruido según la ecuación 8 siguiente:
(8)SNR_{L} \ =
\ 10 \ \cdot \ log \ \left[ \ \frac{S_{L}}{BGN_{L}}
\right].
Entonces, el elemento de adaptación de umbral 8
determina el índice de la relación señal-ruido
cuantificada I_{SNRL}, según las ecuaciones 9 a 12 siguientes:
- I_{SNRL} = nint
\left[\frac{SNR_{L} - 20}{5} \right],
\hskip3.5cm
para 20< SNRL<55,\hskip3.7cm
(9)
\hskip1.7cm= 0,
\hskip5.9cmpara SNRL\leq20,
\hskip4.3cm(10)
\hskip1.7cm= 7
\hskip5.99cmpara SNRL\geq55
siendo nint una función que
redondea el valor fraccional al entero más
cercano.
A continuación, el elemento de adaptación de
umbral 8 selecciona o calcula dos factores de escala, k_{L1/2} y
k_{Lfull}, según el índice de la relación
señal-ruido, I_{SNRL}. La tabla 1 siguiente, es un
ejemplo de tabla de consulta de valores de escala:
I_{SNRL} | K_{L1/2} | K_{Lfull} |
0 | 7,0 | 9,0 |
1 | 7,0 | 12,6 |
2 | 8,0 | 17,0 |
3 | 8,6 | 18,5 |
4 | 8,9 | 19,4 |
5 | 9,4 | 20,9 |
6 | 11,0 | 25,5 |
7 | 15,8 | 39,8 |
Estos dos valores se utilizan para calcular los
valores umbral para la selección de velocidad según las ecuaciones
siguientes:
(11)T_{L1/2}=
K_{L1/2} BGNL,
\hskip0.5cmy
(12)
\hskip-10mmT_{Lfull}= K_{Lfull} BGNL,
siendo T_{L1/2} el valor umbral
de media velocidad y baja frecuencia y T_{Lfull} el valor umbral
de velocidad completa y baja
frecuencia.
El elemento de adaptación de umbral 8 proporciona
los valores umbral adaptados T_{L1/2} y T_{Lfull} al elemento de
decisión de velocidad 12. El elemento de adaptación de umbral 10
funciona de forma similar y proporciona los valores umbral
T_{H1/2} y T_{Hfull} al elemento de decisión de velocidad de
subbandas 14.
El valor inicial de la estimación de la energía
de la señal de audio S (que puede ser S_{L} o S_{H}) se
establece de la siguiente forma. La estimación de energía de señal
inicial, S_{INIT}, se establece en -18,0 dBm0, siendo 3,17 dBm0
la intensidad de la señal de una onda sinusoidal completa que, en el
ejemplo de forma de realización, es una onda sinusoidal digital con
un rango de amplitudes entre -8031 y 8031. S_{INIT} se utiliza
mientras no se determina la presencia de ninguna señal acústica.
El procedimiento mediante el cual se detecta en
un principio una señal acústica consiste en comparar el valor de
función NACF con un umbral. Cuando la función NACF sobrepasa el
umbral durante un número predeterminado de tramas consecutivas,
entonces se determina la presencia de una señal acústica. En el
ejemplo de forma de realización, la función NACF debe sobrepasar el
umbral durante diez tramas consecutivas. Cuando se satisface esta
condición, la estimación de la energía de la señal, S, se establece
en la energía máxima de la señal en las diez tramas precedentes.
El valor inicial de la estimación de ruido de
fondo BGN_{L} se establece en un principio en BGN_{max}. En
cuanto se recibe una energía de trama de subbanda que es menor que
BGN_{max}, la estimación de ruido de fondo se restablece en el
valor del nivel de energía de subbanda recibido, y se genera la
estimación del ruido de fondo BGN_{L} de la forma descrita
anteriormente.
En una forma de realización preferida, se pasa a
un estado de bloqueo cuando se detecta una trama de velocidad baja
después de una serie de tramas de voz de velocidad completa. En el
ejemplo de forma de realización, cuando se codifican a velocidad
completa cuatro tramas de voz consecutivas que vienen seguidas de
una trama en la que la velocidad de codificación se establece en una
velocidad inferior a la velocidad completa y las relaciones
señal-ruido calculadas son inferiores a una SNR
mínima predeterminada, la velocidad de codificación para dicha trama
se establece en la velocidad completa. En el ejemplo de forma de
realización, la SNR mínima predeterminada es 27,5 dB como se define
en la ecuación 8.
En la forma de realización preferida, el número
de tramas del período de bloqueo está en función de la relación
señal-ruido. En el ejemplo de forma de realización,
el número de tramas del período de bloqueo se determina de la
siguiente forma:
\newpage
- nº de tramas de
período de bloqueo = 1
\hskip3cm
22,5 < SNR < 27,5,\hskip2.4cm
(13)
- nº de tramas de
período de bloqueo = 2
\hskip4cm
SNR \leq 22,5,\hskip2.4cm
(14)
- nº de tramas de
período de bloqueo = 0
\hskip4cm
SNR \geq 27,5,\hskip2.4cm
(15)
La presente invención también proporciona un
procedimiento con el cual se detecta la presencia de música y que,
como se ha descrito anteriormente, carece de las pausas que permiten
restablecer las medidas de ruido de fondo. El procedimiento para
detectar la presencia de música presupone que no hay música al
principio de la llamada. Esto permite al aparato de selección de
velocidad de codificación de la presente invención estimar
correctamente la energía de ruido de fondo inicial, BGN_{INIT}.
Debido a que la música, a diferencia del ruido de fondo, tiene una
característica periódica, la presente invención examina el valor de
la función NACF para diferenciar la música del ruido de fondo. El
procedimiento de detección de música de la presente invención
calcula una función NACF media según la ecuación siguiente:
(16)NACF_{AVE}
\ = \ \frac{1}{T} \ \sum\limits^{T}_{i=1} \
NACF(i),
en la que la función NACF es la
definida en la ecuación 7,
y
T es el número de tramas consecutivas en las que
el valor estimado del ruido de fondo ha ido aumentando a partir de
la estimación de ruido de fondo inicial BGN_{INIT}.
Si el ruido de fondo BGN ha ido aumentando
durante un número de tramas T consecutivas y la función NACF_{AVE}
sobrepasa un umbral predeterminado, entonces se detecta música y el
ruido de fondo BGN se restablece en BGN_{init}. Debe observarse
que, para ser eficaz, el valor T debe ser suficientemente bajo para
que la velocidad de codificación no descienda por debajo de la
velocidad completa. Por consiguiente, el valor de T debe
establecerse como una función de la señal acústica y de
BGN_{init}.
La descripción anterior de las formas de
realización preferidas se proporciona para permitir que todos los
expertos en la materia puedan crear o utilizar la presente
invención. Las diversas modificaciones posibles de estas formas de
realización resultarán evidentes para los expertos en la materia,
pudiéndose aplicar los principios genéricos definidos en la presente
memoria a otras formas de realización sin necesidad de utilizar la
actividad inventiva. Por lo tanto, la presente invención no debe
limitarse a las formas de realización descritas, sino que su alcance
vendrá determinado por las reivindicaciones adjuntas.
Claims (21)
1. Procedimiento para la adición de tramas de
bloqueo a una pluralidad de tramas codificadas mediante un
vocodificador, comprendiendo el procedimiento:
detectar que un número predefinido de sucesivas
tramas ha sido codificado a una primera velocidad;
determinar que una próxima trama sucesiva debería
ser codificada a una segunda velocidad inferior a la primera
velocidad; y
seleccionar un número de tramas de bloqueo
sucesivas que se inician con dicha próxima trama sucesiva para ser
codificada a la segunda velocidad, siendo el número una función de
una relación señal-ruido determinada a partir de la
señal de entrada (S(n)) que debe codificarse.
2. Procedimiento según la reivindicación 1, en el
que la detección comprende detectar que un número predefinido de
tramas sucesivas ha sido codificado a una velocidad viable
máxima.
3. Procedimiento según la reivindicación 1, en el
que la detección comprende detectar que un número predefinido de
tramas sucesivas ha sido codificado a una velocidad prevista para
codificar tramas clasificadas como tramas que contienen
sustancialmente voz activa.
4. Procedimiento según la reivindicación 1, en el
que la determinación comprende determinar que una próxima trama
sucesiva debería codificarse a una velocidad viable mínima.
5. Procedimiento según la reivindicación 1, en el
que la determinación comprende determinar que una próxima trama
sucesiva debería codificarse a una velocidad prevista para codificar
tramas clasificadas como tramas que contienen sustancialmente ruido
de fondo o silencio.
6. Procedimiento según la reivindicación 1, que
comprende además generar la estimación de un nivel de ruido de
fondo.
7. Procedimiento según la reivindicación 6, que
comprende además calcular dicha relación señal-ruido
sobre la base de la estimación de un nivel de ruido de fondo.
8. Aparato para la adición de tramas de bloqueo
a una pluralidad de tramas codificadas por un vocodificador,
comprendiendo el aparato:
unos medios para detectar que un número
predefinido de tramas sucesivas ha sido codificado a una primera
velocidad;
unos medios para determinar que una trama
sucesiva siguiente debería ser codificada a una segunda velocidad
que es inferior a la primera velocidad; y
unos medios para seleccionar un número de tramas
de bloqueo sucesivas que se inician con dicha trama sucesiva
siguiente que debe codificarse a una segunda velocidad, siendo el
número una función de una relación señal-ruido
determinada a partir de la señal de entrada (s(n)) que debe
codificarse.
9. Aparato según la reivindicación 8, en el que
los medios de detección comprenden unos medios para detectar que un
número predefinido de tramas sucesivas ha sido codificado a una
velocidad máxima viable.
10. Aparato según la reivindicación 8, en el que
los medios de detección comprenden unos medios para detectar que un
número predefinido de tramas sucesivas ha sido codificado a una
velocidad destinada a la codificación de tramas clasificadas como
tramas que contienen sustancialmente voz activa.
11. Aparato según la reivindicación 8, en el que
los medios de determinación comprenden unos medios para determinar
que una trama sucesiva siguiente debería ser codificada a una
velocidad viable mínima.
12. Aparato según la reivindicación 8, en el que
los medios de determinación comprenden unos medios para determinar
que una trama sucesiva siguiente debería ser codificada a una
velocidad destinada a codificar tramas clasificadas como tramas que
contienen sustancialmente ruido de fondo o silencio.
13. Aparato según la reivindicación 8, que
comprende además unos medios para generar la estimación de un nivel
de ruido de fondo.
14. Aparato según la reivindicación 13, que
comprende además unos medios para el cálculo de dicha relación
señal-ruido sobre la base de la estimación de un
nivel de ruido de fondo.
15. Aparato según la reivindicación 8, para la
adición de tramas de bloqueo a una pluralidad de tramas codificadas
por un vocodificador, comprendiendo el aparato además:
un elemento selector de velocidad de codificación
que a su vez comprende dichos medios de detección, dichos medios de
determinación y dichos medios de selección.
16. Aparato según la reivindicación 15, en el que
el elemento selector de velocidad de codificación (16) está
configurado además para detectar que un número predefinido de tramas
sucesivas ha sido codificado a una velocidad viable máxima.
17. Aparato según la reivindicación 15, en el que
el elemento selector de velocidad de codificación (16) está
configurado además para detectar que un número predefinido de tramas
sucesivas ha sido codificado a una velocidad destinada a la
codificación de tramas clasificadas como tramas que contienen
sustancialmente voz activa.
18. Aparato según la reivindicación 15, en el que
el elemento selector de velocidad de codificación (16) está
configurado además para determinar que una trama sucesiva siguiente
debería ser codificada a una velocidad viable mínima.
19. Aparato según la reivindicación 15, en el que
el elemento selector de velocidad de codificación (16) está
configurado además para determinar que una trama sucesiva siguiente
debería ser codificada a una velocidad destinada a la codificación
de tramas clasificadas como tramas que contienen sustancialmente
ruido de fondo o silencio.
20. Aparato según la reivindicación 15, que
comprende además un elemento de adaptación de umbral (8) acoplado al
elemento selector de velocidad de codificación (16) y configurado
para generar la estimación de un nivel de ruido de fondo.
21. Aparato según la reivindicación 20, que
comprende además un elemento de cálculo de energía (4, 6) acoplado
al elemento de adaptación de umbral y configurado para generar una
estimación de un nivel energético de la trama, estando además el
elemento de adaptación de umbral (8) configurado para recibir la
estimación de un nivel energético de la trama desde el elemento de
cálculo de energía (4, 6) y calcular dicha relación
señal-ruido sobre la base de la estimación de un
nivel de energía de la trama y la estimación de un nivel de ruido de
fondo.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US288413 | 1994-08-10 | ||
US08/288,413 US5742734A (en) | 1994-08-10 | 1994-08-10 | Encoding rate selection in a variable rate vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
ES2240602T3 true ES2240602T3 (es) | 2005-10-16 |
ES2240602T5 ES2240602T5 (es) | 2010-06-04 |
Family
ID=23106989
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06013824T Expired - Lifetime ES2299122T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
ES95929372T Expired - Lifetime ES2194921T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
ES02009467T Expired - Lifetime ES2240602T5 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para la seleccion de una velocidad de codificacion en un vocodificador de velocidad variable. |
ES05001938T Expired - Lifetime ES2281854T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
ES02009465T Expired - Lifetime ES2233739T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06013824T Expired - Lifetime ES2299122T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
ES95929372T Expired - Lifetime ES2194921T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05001938T Expired - Lifetime ES2281854T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
ES02009465T Expired - Lifetime ES2233739T3 (es) | 1994-08-10 | 1995-08-01 | Procedimiento y aparato para seleccionar una velocidad de codificacion en un vocodificador de velocidad variable. |
Country Status (20)
Country | Link |
---|---|
US (1) | US5742734A (es) |
EP (6) | EP1703493B1 (es) |
JP (8) | JP3502101B2 (es) |
KR (3) | KR100455826B1 (es) |
CN (5) | CN1512488A (es) |
AT (5) | ATE235734T1 (es) |
AU (1) | AU711401B2 (es) |
BR (2) | BR9510780B1 (es) |
CA (3) | CA2171009C (es) |
DE (5) | DE69533881T2 (es) |
DK (3) | DK1233408T3 (es) |
ES (5) | ES2299122T3 (es) |
FI (5) | FI117993B (es) |
HK (2) | HK1015185A1 (es) |
IL (1) | IL114874A (es) |
MX (1) | MX9600920A (es) |
PT (3) | PT1239465E (es) |
TW (1) | TW277189B (es) |
WO (1) | WO1996005592A1 (es) |
ZA (1) | ZA956081B (es) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6389010B1 (en) | 1995-10-05 | 2002-05-14 | Intermec Ip Corp. | Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones |
US7924783B1 (en) | 1994-05-06 | 2011-04-12 | Broadcom Corporation | Hierarchical communications system |
TW271524B (es) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6292476B1 (en) * | 1997-04-16 | 2001-09-18 | Qualcomm Inc. | Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels |
JPH09162837A (ja) * | 1995-11-22 | 1997-06-20 | Internatl Business Mach Corp <Ibm> | 圧縮方式を動的に変更する通信方法及び装置 |
JPH09185397A (ja) * | 1995-12-28 | 1997-07-15 | Olympus Optical Co Ltd | 音声情報記録装置 |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
JPH10210139A (ja) * | 1997-01-20 | 1998-08-07 | Sony Corp | 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法 |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
DE19742944B4 (de) * | 1997-09-29 | 2008-03-27 | Infineon Technologies Ag | Verfahren zum Aufzeichnen eines digitalisierten Audiosignals |
US6240386B1 (en) | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6463407B2 (en) * | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6393074B1 (en) | 1998-12-31 | 2002-05-21 | Texas Instruments Incorporated | Decoding system for variable-rate convolutionally-coded data sequence |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
US7330902B1 (en) * | 1999-05-10 | 2008-02-12 | Nokia Corporation | Header compression |
US7127390B1 (en) | 2000-02-08 | 2006-10-24 | Mindspeed Technologies, Inc. | Rate determination coding |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
US6745012B1 (en) * | 2000-11-17 | 2004-06-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive data compression in a wireless telecommunications system |
US7120134B2 (en) | 2001-02-15 | 2006-10-10 | Qualcomm, Incorporated | Reverse link channel architecture for a wireless communication system |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US7602722B2 (en) * | 2002-12-04 | 2009-10-13 | Nortel Networks Limited | Mobile assisted fast scheduling for the reverse link |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN1295678C (zh) * | 2004-05-18 | 2007-01-17 | 中国科学院声学研究所 | 子带自适应谷点降噪***和方法 |
KR100657916B1 (ko) | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
KR100757858B1 (ko) * | 2005-09-30 | 2007-09-11 | 와이더댄 주식회사 | 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
CN101213589B (zh) * | 2006-01-12 | 2011-04-27 | 松下电器产业株式会社 | 对象声音分析装置和对象声音分析方法 |
EP1984911A4 (en) * | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR SIGNAL CODING AND DECODING |
CN101379548B (zh) | 2006-02-10 | 2012-07-04 | 艾利森电话股份有限公司 | 语音检测器和用于其中抑制子频带的方法 |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
CN100483509C (zh) * | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
CN101217037B (zh) * | 2007-01-05 | 2011-09-14 | 华为技术有限公司 | 对音频信号的编码速率进行源控的方法和*** |
JPWO2009038170A1 (ja) * | 2007-09-21 | 2011-01-06 | 日本電気株式会社 | 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム |
WO2009038115A1 (ja) * | 2007-09-21 | 2009-03-26 | Nec Corporation | 音声符号化装置、音声符号化方法及びプログラム |
US20090099851A1 (en) * | 2007-10-11 | 2009-04-16 | Broadcom Corporation | Adaptive bit pool allocation in sub-band coding |
US8554550B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN102396024A (zh) * | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
CN104485118A (zh) | 2009-10-19 | 2015-04-01 | 瑞典爱立信有限公司 | 用于语音活动检测的检测器和方法 |
US9047878B2 (en) * | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
CN102985969B (zh) * | 2010-12-14 | 2014-12-10 | 松下电器(美国)知识产权公司 | 编码装置、解码装置和编码方法、解码方法 |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US8666753B2 (en) * | 2011-12-12 | 2014-03-04 | Motorola Mobility Llc | Apparatus and method for audio encoding |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
CN110265059B (zh) | 2013-12-19 | 2023-03-31 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
US9564136B2 (en) | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
ES2754706T3 (es) * | 2014-03-24 | 2020-04-20 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
ES2838006T3 (es) * | 2014-07-28 | 2021-07-01 | Nippon Telegraph & Telephone | Codificación de señal de sonido |
RU2713852C2 (ru) * | 2014-07-29 | 2020-02-07 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
KR101619293B1 (ko) | 2014-11-12 | 2016-05-11 | 현대오트론 주식회사 | 전원 반도체의 제어 방법 및 제어 장치 |
CN107742521B (zh) | 2016-08-10 | 2021-08-13 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
EP3751567B1 (en) | 2019-06-10 | 2022-01-26 | Axis AB | A method, a computer program, an encoder and a monitoring device |
CN110992963B (zh) * | 2019-12-10 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 网络通话方法、装置、计算机设备及存储介质 |
WO2021253235A1 (zh) * | 2020-06-16 | 2021-12-23 | 华为技术有限公司 | 语音活动检测方法和装置 |
CN113611325B (zh) * | 2021-04-26 | 2023-07-04 | 珠海市杰理科技股份有限公司 | 基于清浊音实现的语音信号变速方法、装置和音频设备 |
Family Cites Families (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3633107A (en) * | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (es) * | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) * | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (es) * | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) * | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) * | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
EP0111612B1 (fr) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4672670A (en) * | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
DE3412430A1 (de) * | 1984-04-03 | 1985-10-03 | Nixdorf Computer Ag, 4790 Paderborn | Schalteranordnung |
EP0167364A1 (en) * | 1984-07-06 | 1986-01-08 | AT&T Corp. | Speech-silence detection with subband coding |
FR2577084B1 (fr) * | 1985-02-01 | 1987-03-20 | Trt Telecom Radio Electr | Systeme de bancs de filtres d'analyse et de synthese d'un signal |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) * | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
JPS6491200A (en) * | 1987-10-02 | 1989-04-10 | Fujitsu Ltd | Voice analysis system and voice synthesization system |
US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4897832A (en) † | 1988-01-18 | 1990-01-30 | Oki Electric Industry Co., Ltd. | Digital speech interpolation system and speech detector |
DE3883519T2 (de) * | 1988-03-08 | 1994-03-17 | Ibm | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. |
EP0331857B1 (en) * | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
CA1335003C (en) * | 1988-03-11 | 1995-03-28 | Daniel Kenneth Freeman | Voice activity detection |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) * | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
CA1321645C (en) * | 1988-09-28 | 1993-08-24 | Akira Ichikawa | Method and system for voice coding based on vector quantization |
JP3033060B2 (ja) * | 1988-12-22 | 2000-04-17 | 国際電信電話株式会社 | 音声予測符号化・復号化方式 |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
EP0392126B1 (en) * | 1989-04-11 | 1994-07-20 | International Business Machines Corporation | Fast pitch tracking process for LTP-based speech coders |
JPH0754434B2 (ja) * | 1989-05-08 | 1995-06-07 | 松下電器産業株式会社 | 音声認識装置 |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5307441A (en) † | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP3004664B2 (ja) * | 1989-12-21 | 2000-01-31 | 株式会社東芝 | 可変レート符号化方法 |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
US5103459B1 (en) * | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
JPH04100099A (ja) * | 1990-08-20 | 1992-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声検出装置 |
JPH04157817A (ja) * | 1990-10-20 | 1992-05-29 | Fujitsu Ltd | 可変レート符号化装置 |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
ATE294441T1 (de) * | 1991-06-11 | 2005-05-15 | Qualcomm Inc | Vocoder mit veränderlicher bitrate |
JP2705377B2 (ja) * | 1991-07-31 | 1998-01-28 | 松下電器産業株式会社 | 帯域分割符号化方法 |
EP0525774B1 (en) * | 1991-07-31 | 1997-02-26 | Matsushita Electric Industrial Co., Ltd. | Digital audio signal coding system and method therefor |
US5410632A (en) † | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
JP3088838B2 (ja) * | 1992-04-09 | 2000-09-18 | シャープ株式会社 | 音楽検出回路及び該回路を用いた音声信号入力装置 |
JP2976701B2 (ja) * | 1992-06-24 | 1999-11-10 | 日本電気株式会社 | 量子化ビット数割当方法 |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5644596A (en) † | 1994-02-01 | 1997-07-01 | Qualcomm Incorporated | Method and apparatus for frequency selective adaptive filtering |
US5742734A (en) † | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US6134215A (en) | 1996-04-02 | 2000-10-17 | Qualcomm Incorpoated | Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel |
-
1994
- 1994-08-10 US US08/288,413 patent/US5742734A/en not_active Expired - Lifetime
-
1995
- 1995-07-08 TW TW084107075A patent/TW277189B/zh not_active IP Right Cessation
- 1995-07-20 ZA ZA956081A patent/ZA956081B/xx unknown
- 1995-08-01 AT AT95929372T patent/ATE235734T1/de active
- 1995-08-01 MX MX9600920A patent/MX9600920A/es unknown
- 1995-08-01 CN CNA2004100016646A patent/CN1512488A/zh active Pending
- 1995-08-01 AT AT06013824T patent/ATE386321T1/de not_active IP Right Cessation
- 1995-08-01 CN CNA2006101003869A patent/CN1945696A/zh active Pending
- 1995-08-01 ES ES06013824T patent/ES2299122T3/es not_active Expired - Lifetime
- 1995-08-01 DE DE69533881T patent/DE69533881T2/de not_active Expired - Lifetime
- 1995-08-01 EP EP06013824A patent/EP1703493B1/en not_active Expired - Lifetime
- 1995-08-01 ES ES95929372T patent/ES2194921T3/es not_active Expired - Lifetime
- 1995-08-01 EP EP95929372A patent/EP0728350B1/en not_active Expired - Lifetime
- 1995-08-01 DE DE69534285T patent/DE69534285T3/de not_active Expired - Lifetime
- 1995-08-01 CN CNB951907174A patent/CN1168071C/zh not_active Expired - Lifetime
- 1995-08-01 DK DK02009465T patent/DK1233408T3/da active
- 1995-08-01 ES ES02009467T patent/ES2240602T5/es not_active Expired - Lifetime
- 1995-08-01 BR BRPI9510780-0A patent/BR9510780B1/pt not_active IP Right Cessation
- 1995-08-01 CN CNB2004100016650A patent/CN1320521C/zh not_active Expired - Lifetime
- 1995-08-01 DK DK02009467.8T patent/DK1239465T4/da active
- 1995-08-01 EP EP05001938A patent/EP1530201B1/en not_active Expired - Lifetime
- 1995-08-01 AT AT02009465T patent/ATE285620T1/de active
- 1995-08-01 KR KR1019960701839A patent/KR100455826B1/ko not_active IP Right Cessation
- 1995-08-01 WO PCT/US1995/009830 patent/WO1996005592A1/en active IP Right Grant
- 1995-08-01 JP JP50740496A patent/JP3502101B2/ja not_active Expired - Lifetime
- 1995-08-01 AU AU32751/95A patent/AU711401B2/en not_active Expired
- 1995-08-01 ES ES05001938T patent/ES2281854T3/es not_active Expired - Lifetime
- 1995-08-01 DE DE69530066T patent/DE69530066T2/de not_active Expired - Lifetime
- 1995-08-01 EP EP02009465A patent/EP1233408B1/en not_active Expired - Lifetime
- 1995-08-01 KR KR10-2003-7005883A patent/KR20040004420A/ko not_active Application Discontinuation
- 1995-08-01 AT AT05001938T patent/ATE358871T1/de not_active IP Right Cessation
- 1995-08-01 DE DE69535709T patent/DE69535709T2/de not_active Expired - Lifetime
- 1995-08-01 PT PT02009467T patent/PT1239465E/pt unknown
- 1995-08-01 BR BR9506036A patent/BR9506036A/pt not_active Application Discontinuation
- 1995-08-01 PT PT95929372T patent/PT728350E/pt unknown
- 1995-08-01 DK DK95929372T patent/DK0728350T3/da active
- 1995-08-01 KR KR10-2003-7005884A patent/KR100455225B1/ko not_active IP Right Cessation
- 1995-08-01 CA CA002171009A patent/CA2171009C/en not_active Expired - Lifetime
- 1995-08-01 EP EP02009467A patent/EP1239465B2/en not_active Expired - Lifetime
- 1995-08-01 AT AT02009467T patent/ATE298124T1/de active
- 1995-08-01 CA CA2488918A patent/CA2488918C/en not_active Expired - Lifetime
- 1995-08-01 ES ES02009465T patent/ES2233739T3/es not_active Expired - Lifetime
- 1995-08-01 CN CNB2004100016631A patent/CN100508028C/zh not_active Expired - Lifetime
- 1995-08-01 EP EP04003180A patent/EP1424686A3/en not_active Ceased
- 1995-08-01 PT PT02009465T patent/PT1233408E/pt unknown
- 1995-08-01 CA CA2488921A patent/CA2488921C/en not_active Expired - Lifetime
- 1995-08-01 DE DE69535452T patent/DE69535452T2/de not_active Expired - Lifetime
- 1995-08-08 IL IL11487495A patent/IL114874A/xx not_active IP Right Cessation
-
1996
- 1996-03-08 FI FI961112A patent/FI117993B/fi not_active IP Right Cessation
-
1998
- 1998-12-28 HK HK98116184A patent/HK1015185A1/xx not_active IP Right Cessation
-
2003
- 2003-08-21 JP JP2003297412A patent/JP2004004971A/ja not_active Withdrawn
- 2003-08-21 JP JP2003297413A patent/JP3927159B2/ja not_active Expired - Lifetime
-
2005
- 2005-07-01 FI FI20050703A patent/FI123708B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050704A patent/FI122272B/fi not_active IP Right Cessation
- 2005-07-01 FI FI20050702A patent/FI122273B/fi not_active IP Right Cessation
- 2005-10-31 HK HK05109679A patent/HK1077911A1/xx not_active IP Right Cessation
-
2006
- 2006-12-07 FI FI20061084A patent/FI119085B/fi not_active IP Right Cessation
-
2007
- 2007-05-31 JP JP2007145736A patent/JP2007293355A/ja not_active Withdrawn
- 2007-05-31 JP JP2007145738A patent/JP4680958B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145735A patent/JP4680956B2/ja not_active Expired - Lifetime
- 2007-05-31 JP JP2007145737A patent/JP4680957B2/ja not_active Expired - Lifetime
-
2011
- 2011-04-21 JP JP2011095137A patent/JP4870846B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2240602T3 (es) | Procedimiento y aparato para la seleccion de una velocidad de codificacion en un vocodificador de velocidad variable. | |
ES2299175T3 (es) | Procedimiento y aparato para realizar vocodificacion con tasa reducida y tasa variable. | |
ES2625895T3 (es) | Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal | |
ES2733099T3 (es) | Sistemas, procedimientos y aparatos para la detección de cambio de señal | |
Soong et al. | Subband coding of speech using backward adaptive prediction and bit allocation |