ES2650747T3 - Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada - Google Patents

Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada Download PDF

Info

Publication number
ES2650747T3
ES2650747T3 ES14738865.6T ES14738865T ES2650747T3 ES 2650747 T3 ES2650747 T3 ES 2650747T3 ES 14738865 T ES14738865 T ES 14738865T ES 2650747 T3 ES2650747 T3 ES 2650747T3
Authority
ES
Spain
Prior art keywords
transform
frequency domain
signaling
frames
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14738865.6T
Other languages
English (en)
Inventor
Sascha Dick
Christian Helmrich
Andreas HÖLZER
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2650747T3 publication Critical patent/ES2650747T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mathematical Physics (AREA)

Abstract

Decodificador de audio de dominio de frecuencia que soporta conmutación de longitud de transformada, que comprende un extractor de coeficiente de dominio de frecuencia (12) configurado para extraer coeficientes de dominio de frecuencia (24) de tramas de una señal de audio a partir de una corriente de datos; un extractor de factor de escala (14) configurado para extraer los factores de escala de la corriente de datos; un transformador inverso (16) configurado para someter los coeficientes de dominio de frecuencia de las tramas, escaladas según los factores de escala, a la transformación inversa para obtener porciones de dominio de tiempo de la señal de audio; un combinador (18) configurado para combinar las porciones de dominio de tiempo para obtener la señal de audio, en la que el transformador inverso responde a una señalización dentro de las tramas de la señal de audio de modo que, dependiendo de la señalización, forma una transformada al disponer secuencialmente los coeficientes de dominio de frecuencia de una trama respectiva, escalados según los factores de escala, de una manera no desentrelazada y someter la transformada única a una transformación inversa de una primera longitud de transformada o formar más de una transformada al desentrelazar los coeficientes de dominio de frecuencia de la trama respectiva, escalados según los factores de escala, y someter cada una de más de una transformada a una transformación inversa de una segunda longitud de transformada, más corta que la primera longitud de transformada,

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
[0032] La Figura 2 muestra entonces que el desentrelazador activable 38 responde a la señalización 34 para la trama actual a efectos de, si la trama actual está señalizada por la señalización 34 como una trama de transformada dividida, desentrelazar los coeficientes de dominio de frecuencia de entrada, para obtener dos 5 transformadas, a saber una transformada delantera 50 y una transformada trasera 52, y dejar los coeficientes de dominio de frecuencia entrelazados para dar como resultado una única transformada 54 en caso de que la señalización 34 indique que la trama actual es una trama de transformada larga. En el caso de un desentrelazado, el desentrelazador 38 forma una transformada única a partir de 50 y 52, una primera transformada corta a partir de los coeficientes de dominio de frecuencia que tienen índices pares, y la otra transformada corta a partir de los 10 coeficientes de dominio de frecuencia en posiciones de índices impares. Por ejemplo, los coeficientes de dominio de frecuencia de índice par podrían formar la transformada delantera (cuando se empieza con el índice 0), mientras que los otros forman la transformada trasera. Las transformadas 50 y 52 están sometidas a transformación inversa de longitud de transformada más corta, resultando en porciones del dominio de tiempo 56 y 58, respectivamente. El combinador 18 de la Figura 1 posiciona correctamente las porciones del dominio de tiempo 56 y 58 en el tiempo, 15 particularmente la porción de dominio de tiempo 56 resultante de la transformada delantera 50 situada en frente de la porción del dominio de tiempo 58 resultante de la porción trasera 52, y lleva a cabo el proceso de superposición y adición entre las mismas y con porciones de dominio de tiempo que resultan de tramas anteriores y sucesivas de la señal de audio. En el caso de no desentrelazado, los coeficientes de dominio de frecuencia que llegan al entrelazador 38 constituyen la transformada larga 54 tal como son, y la fase de transformación inversa 40 lleva a
20 cabo una transformada inversa sobre la misma para resultar en una porción de dominio de tiempo 60 que abarca, y se extiende más allá del intervalo de tiempo completo de la trama actual 26. El combinador 18 combina la porción de dominio de tiempo 60 con respectivas porciones de dominio de tiempo resultantes de tramas anteriores y sucesivas de la señal de audio.
25 [0033] El decodificador de audio de dominio de frecuencia descrito hasta aquí permite la conmutación de longitud de transformada de una manera que es compatible con los decodificadores de audio de dominio de frecuencia que no responden a la señalización 34. En particular, tales decodificadores “anticuados” supondrían erróneamente que las tramas que son actualmente señaladas por la señalización 34 como del tipo de transformada dividida, serían de un tipo de transformada larga. Es decir, erróneamente dejarían los coeficientes de dominio de
30 frecuencia de tipo dividido entrelazados y llevarían a cabo una transformación inversa de la longitud de transformada larga. Sin embargo, la calidad resultante de las tramas afectadas de la señal de audio reconstruida seguiría siendo bastante razonable.
[0034] A su vez, la penalización en cuanto a la eficiencia de codificación es también bastante razonable. La
35 penalización de la eficiencia de codificación resulta de no tener en cuenta la señalización 34 como los coeficientes de dominio de frecuencia y los factores de escala se codifican sin tomar en cuenta el significado variante de los coeficientes y explotar esta variación para incrementar la eficiencia de codificación. Sin embargo, esta última penalización es comparativamente pequeña en comparación con la ventaja de permitir una retro-compatibilidad. Esta última afirmación también es cierta con respecto a la restricción para activar y desactivar el llenado de ruido 40,
40 la predicción de estéreo compleja 42 y la decodificación de MS 46 meramente con porciones espectrales continuas (bandas de factor de escala) en el estado desentrelazado definido por los índices 0 a N– 1 en la Figura 2. La oportunidad de renderizar el control de estas herramientas de codificación específicamente para el tipo de trama (por ejemplo, que tiene dos niveles de ruido) posiblemente podría proporcionar ventajas, pero las ventajas están sobrecompensadas por la ventaja de tener una retro-compatibilidad.
45 [0035] La Figura 2 muestra que el decodificador de la Figura 1 podría estar configurado incluso para soportar la codificación TNS mientras que, sin embargo, mantener la retro-compatibilidad con decodificadores que son insensibles con respecto a la señalización 34. En particular, la Figura 2 ilustra la posibilidad de llevar a cabo el filtrado inverso de TNS después de cualquier predicción de estéreo compleja 42 y de decodificación de MS 46, en
50 caso de haberlas. Con el fin de mantener la retro-compatibilidad, el transformador inverso 16 está configurado para llevar a cabo el filtrado TNS 62 sobre una secuencia de N coeficientes independientemente de la señalización 34 mediante la utilización de respectivos coeficientes TNS 64. Mediante esa medida, la corriente de datos 20 codifica los coeficientes de TNS 64 equitativamente, de manera independiente de la señalización 34. Es decir, el número de coeficientes de TNS y la manera de codificarlos son los mismos. Sin embargo, el transformador inverso 16 está
55 configurado para aplicar los coeficientes TNS 64 de manera diferente. En el caso de que la trama actual sea una trama de transformada larga, el filtrado inverso de TNS se lleva a cabo sobre la transformada larga 54, es decir, estando los coeficientes de dominio de frecuencia en secuencia en el estado entrelazado, y en el caso de que la trama actual esté señalizada por la señalización 34 como trama de transformada dividida, el transformador inverso 16 invierte los filtros de TNS 62 una concatenación de transformada delantera 50 y de transformada trasera 52, es
8
imagen7
imagen8
coeficientes de la MDCT de primera vez colocados en índices pares y con los coeficientes de la MDCT de segunda vez colocados en índices impares (en donde la indexación comienza en cero), pero un decodificador que no es capaz de gestionar transformadas de parada–arranque no haría sido capaz de analizar correctamente la corriente de datos. Es decir, debido a los diferentes contextos utilizados para la codificación por entropía, los coeficientes de
5 dominio de frecuencia sirven para tal transformada de parada–arranque, una sintaxis variada racionalizada sobre las transformadas a la mitad, cualquier decodificador incapaz de soportar ventanas de parada–arranque habría tenido que pasar por alto las respectivas tramas de ventana de parada–arranque.
[0046] Volviendo brevemente a la realización anteriormente descrita, esto significa que el decodificador de la
10 Figura 1 podría ser, más allá de la descripción anticipada hasta el momento, capaz de soportar alternativamente mayor longitud de transformada, es decir, una subdivisión de determinadas tramas 26 en incluso más de dos transformadas mediante una señalización que extiende la señalización 34. Sin embargo, en cuanto a la yuxtaposición de subdivisiones de transformada de tramas 26, aparte de la transformada dividida activada mediante la señalización 34, el extractor de coeficiente de FD 12 y el extractor de factor de escala 14 serían sensibles a esta
15 señalización por el hecho de que su modo de operación cambiaría en dependencia de dicha señalización adicional, además de la señalización 34. Además, una transmisión racionalizada de los coeficientes de TNS, los parámetros de MS y los parámetros de predicción complejos, adaptados al tipo de transformada señalizada distinto del tipo de transformada dividida según 56 y 59, necesitaría que cada decodificador tuviera que ser capaz de responder, es decir, entender, la selección de señalización entre estos “tipos de transformada conocida” o tramas que incluyen el
20 tipo de transformada larga según 60, y otros tipos de transformada tales como uno que subdivide las tramas en ocho transformadas cortas como en el caso de AAC, por ejemplo. En este caso, esta “señalización conocida” identificaría las tramas para las que la señalización 34 señala el tipo de transformada dividida, como tramas del tipo de transformada larga de tal manera que los decodificadores no capaces de entender la señalización 34 tratarían estas tramas como tramas de transformada larga en lugar de tramas de otros tipos, tales como tramas de tipo 8
25 transformadas cortas.
[0047] Volviendo a la descripción de una posible extensión de XHE–AAC, ciertas restricciones operativas podrían proporcionarse para incorporar una herramienta de TS en esta infraestructura de codificación. Por ejemplo, se podría permitir el uso de TS solamente en una ventana de largo–arranque o de parada–arranque de FD. Es decir, 30 se podría requerir que la secuencia de ventana de elemento de sintaxis subyacente sea igual a 1. Además, debido a la señalización semi-retro-compatible, puede ser un requisito que la TS pueda aplicarse solamente cuando el noiseFilling (llenado de ruido) del elemento de sintaxis sea uno en el contenedor de sintaxis UsacCoreConfig(). Cuando se señala que la TS está activa, todas las herramientas de FD excepto TNS y MDCT inversa operan en el conjunto entrelazado (largo) de coeficientes de TS. Esto permite la reutilización de la compensación de banda de
35 factor de escala y tablas del codificador aritmético de transformada larga así como también de las formas de ventanas y las longitudes de solapamiento.
[0048] En lo que sigue, se presentan los términos y definiciones que se utilizan seguidamente a efectos de explicar cómo podría ampliarse el estándar USAC descrito en [4] para ofrecer la funcionalidad de TS retro
40 compatible, en el que a veces se hace referencia a secciones dentro de ese estándar para el lector interesado.
[0049] Un nuevo elemento de datos podría ser:
split_transform bandera binaria que indica si se utiliza TS en la trama y canal actuales
45 [0050] Nuevos elementos de ayuda podrían ser:
window_sequence tipo de secuencia de ventana de FD para la trama y canal actuales (sección 6.2.9) noise_offset compensación de llenado de ruido para modificar factores de escala de bandas
50 cuantificadas en cero (sección 7.2) noise_level nivel de llenado de ruido que representa amplitud de ruido de espectro añadido (sección 7.2) half_transform_length una mitad de coreCoderFrameLength (ccfl, la longitud de transformada, sección 6.1.1) half_lowpass_line una mitad del número de líneas de MDCT transmitidas para el canal actual.
55 [0051] La decodificación de una transformada de arranque (parada) de FD utilizando división de transformada (TS) en la infraestructura de USAC podría llevarse a cabo en etapas puramente secuenciales, del siguiente modo:
Primero, podría llevarse a cabo una decodificación de split_transform y half_lowpass_line.
11
imagen9
imagen10
imagen11
imagen12
}
[0082] El pseudo-espectro resultante se utiliza para la decodificación estéreo (ISO/IEC 23003–3:2012 sección 7.7) y para actualizar dmx_re_prev[ ] (ISO/IEC 23003–3:2012 sección 7.7.2) y en el caso en que tns_on_lr == 0, los
5 espectros de longitud completa decodificados en estéreo son desentrelazados de nuevo mediante la repetición del proceso de la sección. Finalmente, se calculan las dos MDCT inversas con ccfl y la window_shape del canal de la trama actual y la última.
[0083] El procesamiento para TS sigue la descripción dada en ISO/IEC 23003–3:2012 sección “7.9 Filterbank 10 and block switching”. Deben tomarse en cuenta las siguientes adiciones.
[0084] Los coeficientes de TS en spec[ ] son desentrelazados mediante un búfer auxiliar (helper buffer[ ]) con N, la longitud de ventana basada en el valor de window_sequence:
15 para(i=0,i2=0;i<N/2;i+=1,i2+=2){ spec[0][i] = spec[i2]; /* aislar 1ra ventana */ buffer[i] = spec[i2+1]; /* aislar 2da ventana */ } para (i= 0;i < N/2; i+= 1){
20 spec[1][i] = buffer[i]; /* copiar 2da ventana */ }
[0085] La IMDCT para el espectro de TS de media longitud se define entonces como:
N
imagen13−1
4
2
1
para
0
n
<
N
2
⎜
k
+
( 0 )
spec [(0,1)][ ]cos
k
+
=
x
imagen14
n n
imagen15
⎟
⎜
⎟
(0,1),
n
2
N
N
k =0
[0086] Las etapas subsiguientes de formación de ventanas y de conmutación de bloques se definen en las siguientes subsecciones.
30 [0087] La división de transformada con STOP_START_SEQUENCE sería similar a la siguiente descripción:
[0088] Una STOP_START_SEQUENCE en combinación con división de transformada se representó en la Figura 2. Comprende dos ventanas de media longitud sobrepuestas y añadidas 56, 58 con una longitud de N_l/2 que es de 1024 (960, 768). N_s se establece en 256 (240, 192) respectivamente.
35 [0089] Las ventanas (0,1) para las dos IMDCT de media longitud se dan del siguiente modo:
_ /2 −N
Nl _s
0.0, para0 ≤n<
4 _ /2 −N_s _ /2 −N_s Nl /2
Nl Nl _ +N_s
W (n− ), para ≤n<
(0,1), LEFT N ,_s
4 44 _ /2 +N_s 3 _/2 −N_s
Nl Nl
1.0, para ≤n<
     ⎪⎪  
W () n
(0,1)
=
44 3 _/2 −N_s 3 _/2 +N_s
Nl Nl
N
Ns 3_
Nl /2
<
s para
n
⎪⎪
W
(0,1), RIGHT N ,_s
(n
+
),
_
_
4 4
24
3 _/2 +N_
Nl s
n<Nl /2
⎪⎪
0.0,
para
_
4
16
imagen16
N _l /2 − N _ s
0.0, para 0 ≤ n <
4 N _l /2 − N _ sN _l /2 − N _ sN _ l /2 + N _ s
W (n − ), para ≤ n <
1, LEFT N ,_ s
4 44 N _l /2 + N _ s 3N _l /2 − N _ s
1.0, para ≤ n <
     ⎪⎪  
W1( )
n
=
44 3N _l /2 − N _ s 3N _l /2 + N _ s
N
Ns 3N _l /2
<
s para
n
W
1, RIGHT N ,_ s
⎪⎪
(
n
),
_
+
_
44
24
3N _l /2 + N _ s
n
⎪⎪
0.0,
< Nl /2
para
_
4
[0093] Las mitades de ventana izquierda/derecha vienen dadas por:
( ), si windown _shape == 1
W W ( ), si window_
n shape == 0
SIN LEFT N s
⎧⎨
KBD LEFT N s
,
W ()
n
1, LEFT N s
_
_
=
,
_
,
_
_
⎧W ( ), si window_shape == 1
n
KBD RIGHT N , s
W ()
n
(0,1), , s
RIGHT N
⎨
=
W ( ), si window_shape == 0
n
SIN RIGHT N , s
_
[0094] La tercera ventana es igual a la mitad izquierda de una LONG_START_WINDOW:
10
W ( n ), para 0 ≤ n < N _ l /2
LEFT N l
=
⎧⎨
W ()
,
_
n
2
1.0, para N _ l /2 ≤ n < N _ l
con
( ), si windown _shape_previous_block == 1
W W ( ), si window__== 0
n shape_previousblock
SIN LEFT N l
⎧⎨
KBD LEFT N , l
W ()
n
LEFT N l
=
,
_
,
_
_
[0095] El solapamiento y adición entre las dos ventanas de media longitud que resultan en valores
%
Z
,
intermedios de dominio de tiempo puestos en ventanas in se describen del siguiente modo. En este caso, N_l se establece en 2048 (1920, 1536), N_s se establece en 256 (240, 192) respectivamente.
20
18
imagen17
imagen18
imagen19
imagen20
imagen21

Claims (1)

  1. imagen1
    imagen2
ES14738865.6T 2013-07-22 2014-07-15 Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada Active ES2650747T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13177373 2013-07-22
EP13177373 2013-07-22
EP13189334 2013-10-18
EP13189334.9A EP2830058A1 (en) 2013-07-22 2013-10-18 Frequency-domain audio coding supporting transform length switching
PCT/EP2014/065169 WO2015010965A1 (en) 2013-07-22 2014-07-15 Frequency-domain audio coding supporting transform length switching

Publications (1)

Publication Number Publication Date
ES2650747T3 true ES2650747T3 (es) 2018-01-22

Family

ID=48808222

Family Applications (3)

Application Number Title Priority Date Filing Date
ES21203208T Active ES2940897T3 (es) 2013-07-22 2014-07-15 Codificación de audio en el dominio de la frecuencia que soporta la conmutación de longitud de transformada
ES17189418T Active ES2902949T3 (es) 2013-07-22 2014-07-15 Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada
ES14738865.6T Active ES2650747T3 (es) 2013-07-22 2014-07-15 Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES21203208T Active ES2940897T3 (es) 2013-07-22 2014-07-15 Codificación de audio en el dominio de la frecuencia que soporta la conmutación de longitud de transformada
ES17189418T Active ES2902949T3 (es) 2013-07-22 2014-07-15 Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada

Country Status (20)

Country Link
US (4) US10242682B2 (es)
EP (6) EP2830058A1 (es)
JP (5) JP6247759B2 (es)
KR (1) KR101819401B1 (es)
CN (2) CN105593934B (es)
AR (1) AR097005A1 (es)
AU (1) AU2014295313B2 (es)
CA (1) CA2918849C (es)
ES (3) ES2940897T3 (es)
FI (1) FI3961621T3 (es)
HK (1) HK1254315A1 (es)
MX (1) MX357694B (es)
MY (1) MY184665A (es)
PL (3) PL3312836T3 (es)
PT (3) PT3961621T (es)
RU (1) RU2654139C2 (es)
SG (1) SG11201600369UA (es)
TW (1) TWI559294B (es)
WO (1) WO2015010965A1 (es)
ZA (1) ZA201601115B (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9313359B1 (en) 2011-04-26 2016-04-12 Gracenote, Inc. Media content identification on mobile devices
US20190373312A1 (en) 2012-02-21 2019-12-05 Gracenote, Inc. Media Content Identification on Mobile Devices
US10986154B2 (en) 2016-05-16 2021-04-20 Glide Talk Ltd. System and method for interleaved media communication and conversion
US20210210108A1 (en) * 2018-06-21 2021-07-08 Sony Corporation Coding device, coding method, decoding device, decoding method, and program

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
KR100548891B1 (ko) 1998-06-15 2006-02-02 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
US6223162B1 (en) * 1998-12-14 2001-04-24 Microsoft Corporation Multi-level run length coding for frequency-domain audio coding
US7315815B1 (en) 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CN2482427Y (zh) 2001-05-24 2002-03-20 张沛远 甘露醇药液静滴自动加压装置
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7272566B2 (en) 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
US6965859B2 (en) * 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7325023B2 (en) 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP1747554B1 (en) * 2004-05-17 2010-02-10 Nokia Corporation Audio encoding with different coding frame lengths
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
KR101087588B1 (ko) * 2004-07-02 2011-11-29 닐슨 미디어 리서치 인코퍼레이티드 압축 디지털 비트스트림을 믹싱하는 방법 및 장치
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US8326606B2 (en) 2004-10-26 2012-12-04 Panasonic Corporation Sound encoding device and sound encoding method
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7991272B2 (en) 2005-07-11 2011-08-02 Lg Electronics Inc. Apparatus and method of processing an audio signal
CN101501761B (zh) 2006-08-15 2012-02-08 杜比实验室特许公司 无需边信息对时域噪声包络的任意整形
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
JP2008129250A (ja) 2006-11-20 2008-06-05 National Chiao Tung Univ Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
AU2009220321B2 (en) * 2008-03-03 2011-09-22 Intellectual Discovery Co., Ltd. Method and apparatus for processing audio signal
US9037454B2 (en) * 2008-06-20 2015-05-19 Microsoft Technology Licensing, Llc Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT)
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
AU2009267459B2 (en) 2008-07-11 2014-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
JP5555707B2 (ja) 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
EP2374211B1 (en) * 2008-12-24 2012-04-04 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
CN101494054B (zh) * 2009-02-09 2012-02-15 华为终端有限公司 一种音频码率控制方法及***
US8311843B2 (en) * 2009-08-24 2012-11-13 Sling Media Pvt. Ltd. Frequency band scale factor determination in audio encoding based upon frequency band signal energy
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
WO2011147950A1 (en) * 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
TWI480860B (zh) * 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
EP2710589A1 (en) * 2011-05-20 2014-03-26 Google, Inc. Redundant coding unit for audio codec
WO2013075753A1 (en) * 2011-11-25 2013-05-30 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal
JP6069341B2 (ja) * 2011-11-30 2017-02-01 ドルビー・インターナショナル・アーベー オーディオ・コーデックからの向上したクロマ抽出のための方法、エンコーダ、デコーダ、ソフトウェア・プログラム、記憶媒体
ES2634621T3 (es) * 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple

Also Published As

Publication number Publication date
RU2016105704A (ru) 2017-08-23
HK1254315A1 (zh) 2019-07-19
CA2918849A1 (en) 2015-01-29
AU2014295313B2 (en) 2017-08-03
ZA201601115B (en) 2017-11-29
US20190189138A1 (en) 2019-06-20
JP7311940B2 (ja) 2023-07-20
JP6560320B2 (ja) 2019-08-14
US20210233545A1 (en) 2021-07-29
JP2018055117A (ja) 2018-04-05
MX2016000913A (es) 2016-06-21
AU2014295313A1 (en) 2016-03-10
EP3961621B1 (en) 2023-01-04
EP4191581B1 (en) 2024-03-27
EP3961621A1 (en) 2022-03-02
CN105593934A (zh) 2016-05-18
PT3961621T (pt) 2023-03-31
CN105593934B (zh) 2019-11-12
CN110739001B (zh) 2024-02-27
CN110739001A (zh) 2020-01-31
EP2830058A1 (en) 2015-01-28
US20240127836A1 (en) 2024-04-18
KR101819401B1 (ko) 2018-01-16
KR20160033755A (ko) 2016-03-28
TWI559294B (zh) 2016-11-21
PT3025339T (pt) 2017-12-20
JP2016532894A (ja) 2016-10-20
US10984809B2 (en) 2021-04-20
EP4191581C0 (en) 2024-03-27
JP2021170127A (ja) 2021-10-28
PL3312836T3 (pl) 2022-03-28
EP3025339A1 (en) 2016-06-01
SG11201600369UA (en) 2016-02-26
MY184665A (en) 2021-04-15
MX357694B (es) 2018-07-19
PL3961621T3 (pl) 2023-05-02
JP6247759B2 (ja) 2017-12-13
ES2902949T3 (es) 2022-03-30
RU2654139C2 (ru) 2018-05-16
ES2940897T3 (es) 2023-05-12
PL3025339T3 (pl) 2018-02-28
AR097005A1 (es) 2016-02-10
EP3312836A1 (en) 2018-04-25
US11862182B2 (en) 2024-01-02
EP4369337A2 (en) 2024-05-15
CA2918849C (en) 2019-05-21
PT3312836T (pt) 2021-12-30
JP6911080B2 (ja) 2021-07-28
TW201519219A (zh) 2015-05-16
EP3025339B1 (en) 2017-09-13
EP4191581A1 (en) 2023-06-07
FI3961621T3 (fi) 2023-03-31
JP2023126886A (ja) 2023-09-12
WO2015010965A1 (en) 2015-01-29
EP3312836B1 (en) 2021-10-27
EP4369337A3 (en) 2024-06-26
US10242682B2 (en) 2019-03-26
US20160140972A1 (en) 2016-05-19
JP2019207419A (ja) 2019-12-05

Similar Documents

Publication Publication Date Title
ES2706061T3 (es) Decodificación de audio con cancelación directa de distorsión por repliegue espectral en el dominio del tiempo usando filtrado predictivo lineal
ES2959970T3 (es) Codificador de audio para la codificación de una señal de múltiples canales y un decodificador de audio para la decodificación de una señal de audio codificada
ES2658942T3 (es) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
ES2773795T3 (es) Aparato y método para llenado estéreo en codificación multicanal
ES2657393T3 (es) Codificador y descodificador de audio para codificar y descodificar muestras de audio
ES2650747T3 (es) Codificación de audio de dominio de frecuencia que soporta conmutación de longitud de transformada
RU2009118384A (ru) Кодирование информационного сигнала
BR112012009447A2 (pt) codificador de sinal de áudio, decodificador de sinal de áudio, método para codificar ou decodificar um sinal de áudio usando um cancelamento de aliasing
ES2540215T3 (es) Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
US20110087494A1 (en) Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
CA2956010A1 (en) Processor and method for processing and audio signal using truncated analysis or synthesis window overlap portions