ES2952212T3 - Procedimiento y aparato de reproducción de sonido estereofónico - Google Patents

Procedimiento y aparato de reproducción de sonido estereofónico Download PDF

Info

Publication number
ES2952212T3
ES2952212T3 ES21154301T ES21154301T ES2952212T3 ES 2952212 T3 ES2952212 T3 ES 2952212T3 ES 21154301 T ES21154301 T ES 21154301T ES 21154301 T ES21154301 T ES 21154301T ES 2952212 T3 ES2952212 T3 ES 2952212T3
Authority
ES
Spain
Prior art keywords
signal
channel
rendering
sound
rendered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21154301T
Other languages
English (en)
Inventor
Sang-Bae Chon
Sun-Min Kim
Hyun Jo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2952212T3 publication Critical patent/ES2952212T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

Un método de reproducción de sonido tridimensional incluye: adquirir una señal de audio multicanal; transmitir señales a un canal a reproducir según la información del canal y una frecuencia de la señal de audio multicanal; y mezclar las señales renderizadas. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procedimiento y aparato de reproducción de sonido estereofónico
Campo técnico
Una o más realizaciones ejemplares se refieren a un procedimiento y aparato de reproducción de sonido tridimensional (3D), y más particularmente, a un aparato y procedimiento de reproducción de señal de audio multicanal.
Técnica antecedente
Con el avance de las tecnologías de procesamiento de vídeo y audio, ha aumentado la producción de contenido de alta definición y calidad. Los usuarios, que en el pasado exigían contenido de alta definición y calidad, desean imágenes y sonido realistas, y, por lo tanto, se ha llevado a cabo una amplia investigación para proporcionar imágenes y sonido 3D.
Una tecnología de sonido 3D permite a un usuario percibir el espacio disponiendo una pluralidad de altavoces en diferentes posiciones sobre un plano horizontal y emitiendo la misma señal de sonido o diferentes señales de sonido a través de los altavoces. Sin embargo, un sonido real se puede generar a partir de diferentes posiciones en un plano horizontal y también se puede generar en diferentes elevaciones. Por lo tanto, se necesita una tecnología que reproduzca señales de sonido generadas a diferentes elevaciones a través de altavoces dispuestos en un plano horizontal. El documento WO2010066271 divulga un aparato y un procedimiento para generar una señal de audio multicanal en base a una señal de audio de entrada.
Descripción detallada de la invención
Solución técnica
La invención se establece en el conjunto de reivindicaciones adjuntas.
Efectos ventajosos
De acuerdo con una o más de las realizaciones ejemplares anteriores, el aparato de reproducción de sonido 3D puede reproducir el componente de elevación de la señal de sonido a través de altavoces dispuestos en el plano horizontal, de modo que un usuario sea capaz de percibir la elevación.
De acuerdo con una o más de las realizaciones ejemplares anteriores, cuando la señal de audio multicanal se reproduce en un entorno en el cual el número de canales es pequeño, el aparato de reproducción de sonido 3D puede evitar que cambie un tono o que desaparezca un sonido.
Descripción de los dibujos
Estos y/u otros aspectos serán evidentes y se apreciarán más fácilmente a partir de la siguiente descripción de las realizaciones ejemplares, tomada en conjunto con los dibujos adjuntos en los cuales:
Las Figuras 1 y 2 son diagramas de bloques de aparatos de reproducción de sonido 3D de acuerdo con la realización ejemplar;
La Figura 3 es un diagrama de flujo de un procedimiento de reproducción de sonido 3D de acuerdo con una realización ejemplar;
La Figura 4 es un diagrama de flujo de un procedimiento de reproducción de sonido 3D para una señal de audio que incluye una señal de aplauso, de acuerdo con una realización ejemplar;
La Figura 5 es un diagrama de bloques de un renderizador 3D de acuerdo con una realización ejemplar; La Figura 6 es un diagrama de flujo de un procedimiento de mezcla de señales de audio renderizadas, de acuerdo con una realización ejemplar;
La Figura 7 es un diagrama de flujo de un procedimiento de mezcla de señales de audio renderizadas de acuerdo con la frecuencia, de acuerdo con una realización ejemplar;
La Figura 8 es un gráfico de un ejemplo de mezcla de señales de audio renderizadas de acuerdo con la frecuencia, de acuerdo con una realización ejemplar; y
Las Figuras 9 y 10 son diagramas de bloques de aparatos de reproducción de sonido 3D de acuerdo con la realización ejemplar.
Mejor modo
La invención está definida en las reivindicaciones. Se definen realizaciones preferentes en las reivindicaciones dependientes.
Los aspectos adicionales serán expuestos en parte en la descripción la cual sigue y, en parte, serán evidentes a partir de la descripción, o pueden ser aprendidos mediante la práctica de las realizaciones ejemplares presentadas.
[Modo de la invención]
Ahora se hará referencia en detalle a las realizaciones ejemplares, cuyos ejemplos se ilustran en los dibujos adjuntos, en los que los números de referencia similares se refieren a elementos similares a lo largo de todo. En este sentido, las presentes realizaciones ejemplares pueden tener diferentes formas y no se deben interpretar como limitadas a las descripciones expuestas en la presente memoria. En consecuencia, las realizaciones ejemplares se describen simplemente más adelante, con referencia a las figuras, para explicar aspectos de la presente descripción.
En cuanto a los términos utilizados en la presente memoria, en la medida de lo posible, se seleccionan los términos más utilizados en consideración de las funciones en las realizaciones ejemplares; sin embargo, estos términos pueden variar de acuerdo con las intenciones de los expertos en la técnica, los precedentes, o la aparición de una nueva tecnología. Algunos términos utilizados en la presente memoria pueden ser elegidos arbitrariamente por el presente solicitante. En este caso, estos términos se definirán detalladamente más adelante. En consecuencia, los términos específicos utilizados en la presente memoria deben entenderse en base a sus significados únicos y del contexto total del concepto inventivo.
También se entenderá que los términos “comprende”, “ incluye”, y “tiene”, cuando se utilizan en la presente memoria, especifican la presencia de los elementos indicados, pero no excluyen la presencia o adición de otros elementos, a menos que se defina lo contrario. Además, los términos “unidad”, “módulo” utilizados en la presente memoria representan una unidad para el procesamiento de al menos una función o una operación, las cuales pueden estar implementadas mediante hardware, software, o una combinación de hardware y software.
A continuación, se describirán en detalle realizaciones ejemplares con referencia a los dibujos adjuntos, de modo que los expertos en la técnica puedan implementar fácilmente el concepto inventivo. Sin embargo, el concepto inventivo puede incorporarse de muchas formas diferentes y no debe interpretarse como limitado a las realizaciones ejemplares expuestas. en la presente memoria. Además, las porciones irrelevantes para la descripción de las realizaciones ejemplares se omitirán en los dibujos para una descripción clara de las realizaciones ejemplares, y los números de referencia similares denotarán elementos similares a lo largo de toda la memoria descriptiva.
La Figuras 1 y 2 son diagramas de aparatos 100 y 200 de reproducción de sonido 3D de acuerdo con realizaciones ejemplares.
El aparato 100 de reproducción de sonido 3D de acuerdo con una realización ejemplar puede emitir una señal de audio multicanal de mezcla descendente a través de un canal por reproducir.
Un sonido 3D se refiere a un sonido que permite a un oyente percibir el ambiente mediante la reproducción de un sentido de dirección o distancia, así como un tono y un timbre, y tiene información de espacio que permite a un oyente, que no está situado en un espacio donde se genera una fuente de sonido, percibir la dirección, percibir la distancia, y percibir el espacio.
En la siguiente descripción, un canal de una señal de audio puede ser el número de altavoces a través de los cuales se emite un sonido. A medida que aumenta el número de canales, puede aumentar el número de altavoces. El aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede renderizar una señal de audio multicanal en canales para ser reproducidos y mezclar las señales renderizadas, de tal manera que una señal de audio multicanal que tiene un gran número de canales se emite y reproduce en un entorno en el cual el número de canales es pequeño. En este momento, la señal de audio multicanal puede incluir un canal capaz de emitir un sonido de elevación.
El canal capaz de emitir el sonido de elevación puede ser un canal capaz de emitir una señal de sonido a través de un altavoz situado sobre la cabeza de un oyente, de modo que el oyente pueda percibir la elevación. Un canal horizontal puede ser un canal capaz de emitir una señal de sonido a través de un altavoz situado en un plano paralelo al oyente.
El entorno en el cual el número de canales es pequeño puede ser un entorno que no incluye un canal capaz de emitir un sonido de elevación y puede emitir un sonido a través de altavoces dispuestos en un plano horizontal de acuerdo con un canal horizontal.
Además, en la siguiente descripción, el canal horizontal puede ser un canal que incluye una señal de audio que puede emitirse a través de un altavoz dispuesto en un plano horizontal. Un canal aéreo puede ser un canal que incluye una señal de audio que puede emitirse a través de un altavoz que está dispuesto en una elevación, pero no en un plano horizontal y es capaz de emitir un sonido de elevación.
Con referencia a la Figura 1, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede incluir un renderizador 110 y un mezclador 120.
El aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede renderizar y mezclar una señal de audio multicanal y emitir la señal de audio multicanal renderizada a través de un canal que se va que se va a reproducir. Por ejemplo, la señal de audio multicanal es una señal de 22.2 canales, y el canal que se va a reproducir puede ser un canal 5.1 o 7.1. El aparato 100 de reproducción de sonido 3D puede realizar la renderización determinando los canales correspondientes a los respectivos canales de la señal de audio multicanal, combinar las señales de los respectivos canales correspondientes al canal que se va a reproducir, mezclar las señales de audio renderizadas, y emitir una señal final.
El renderizador 110 puede renderizar la señal de audio multicanal de acuerdo con un canal y una frecuencia. El renderizador 110 puede realizar la renderización 3D y la renderización 2D en una señal de canal aéreo y una señal de canal horizontal de la señal de audio multicanal.
El renderizador 110 puede renderizar el canal aéreo que pasa a través de un filtro de transferencia relacionado con la cabeza (HRTF) utilizando diferentes procedimientos de acuerdo con la frecuencia, para renderizar en 3D el canal aéreo. El filtro HRTF puede permitir que un oyente reconozca un sonido 3D mediante un fenómeno en el que las características de un trayecto complicado cambian de acuerdo con la dirección de llegada del sonido. Las características del trayecto complicado incluyen la difracción a partir de la superficie de cabeza y la reflexión a partir de los pabellones auriculares, así como una simple diferencia de trayecto, tal como una diferencia de nivel entre ambos oídos y una diferencia de tiempo de llegada de una señal de sonido entre ambos αdos. El filtro HRTF puede procesar señales de audio incluidas en el canal aéreo cambiando la calidad del sonido de las señales de audio, de modo que permita que un oyente reconozca un sonido 3D.
El renderizador 110 puede renderizar señales de baja frecuencia entre las señales de canal aéreo utilizando un procedimiento de adición al canal más cercano, y puede renderizar señales de alta frecuencia utilizando un procedimiento de panoramización multicanal. De acuerdo con el procedimiento de panoramización multicanal, al menos un canal horizontal se puede renderizar aplicando valores de ganancia que se ajustan de manera diferente a las señales de canal de una señal de audio multicanal cuando se renderizan las señales de canal. Las señales de canal, a las cuales se aplican los valores de ganancia, pueden mezclarse y emitirse como una señal final.
La señal de baja frecuencia tiene una fuerte característica difractiva. En consecuencia, se puede proporcionar una calidad de sonido similar a un oyente incluso cuando se realiza la renderización en un solo canal, en lugar de realizar la renderización después de dividir los canales de la señal de audio multicanal en una pluralidad de canales de acuerdo con el procedimiento de panoramización multicanal. Por lo tanto, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede renderizar la señal de baja frecuencia utilizando el procedimiento de adición al canal más cercano, evitando así que se degrade la calidad del sonido cuando una pluralidad de canales se mezcla en un canal de salida. Es decir, si una pluralidad de canales se mezcla en un canal de salida, se puede amplificar o disminuir la calidad del sonido de acuerdo con las interferencias entre las señales de canal, lo que resulta en una degradación en la calidad del sonido. Por lo tanto, la degradación en la calidad del sonido puede evitarse mezclando un canal con un canal de salida.
De acuerdo con el procedimiento de adición al canal más cercano, los canales de la señal de audio multicanal pueden ser renderizados al canal más cercano entre los canales que se van a reproducir, en lugar de ser renderizados a una pluralidad de canales.
Además, mediante la realización de la renderización en diferentes procedimientos de acuerdo con la frecuencia, el aparato 100 de reproducción de sonido 3D puede ampliar un punto óptimo sin degradar la calidad del sonido. Es decir, mediante la renderización de una señal de baja frecuencia que tiene una fuerte característica difractiva de acuerdo con el procedimiento de adición al canal más cercano, es posible evitar que la calidad del sonido se degrade cuando una pluralidad de canales se mezcla con un canal de salida. El punto óptimo puede ser un intervalo predeterminado que permite a un oyente escuchar de manera óptima un sonido 3D sin distorsión. Como el punto óptimo es más amplio, un oyente puede escuchar de manera óptima un sonido 3D sin distorsión. Cuando un oyente no está situado en un punto óptimo, puede escuchar un sonido con una calidad de sonido o imagen de sonido distorsionados.
La renderización utilizada en diferentes procedimientos de panoramización de acuerdo con la frecuencia se describirá en detalle con referencia a las Figuras 4 o 5.
El mezclador 120 puede emitir una señal final mediante la combinación de señales de los canales correspondientes al canal horizontal por el renderizador 110. El mezclador 120 puede mezclar las señales de los canal con respecto a cada sección predeterminada. Por ejemplo, el mezclador 120 puede mezclar las señales de los canales con respecto a cada trama.
El mezclador 120 de acuerdo con la realización ejemplar puede mezclar las señales en base a los valores de potencia de las señales renderizadas a los canales que se van a reproducir. En otras palabras, el mezclador 120 puede determinar una amplitud de la señal final o una ganancia por aplicar a la señal final, en base a los valores de potencia de las señales renderizadas a los canales que se van a reproducir.
Con referencia a la Figura 2, el aparato 200 de reproducción de sonido 3D de acuerdo con una realización ejemplar puede incluir una unidad 210 de análisis de sonido, un renderizador 220, un mezclador 230, y una unidad 240 de salida. El aparato 200 de reproducción de sonido 3D, el renderizador 220 y el mezclador 230 en la Figura 2 corresponden al aparato 100 de reproducción de sonido 3D, al renderizador 110, y al mezclador 120 en la Figura 1 y, por lo tanto, se omiten descripciones redundantes en la misma.
La unidad 210 de análisis de sonido puede seleccionar un modo de renderización analizando una señal de audio multicanal y separar algunas señales de la señal de audio multicanal. La unidad 210 de análisis de sonido puede incluir una unidad 211 de selección de modo de renderización y una unidad 212 de separación de señal de renderización.
La unidad 211 de selección de modo de renderización puede determinar si están presentes muchas señales transitorias en la señal de audio multicanal, con respecto a cada sección predeterminada. Los ejemplos de las señales transitorias pueden incluir un sonido de aplauso, un sonido de lluvia, y similares. En la siguiente descripción, una señal de audio, la cual incluye muchas señales transitorias tales como el sonido de aplauso o el sonido de lluvia, se denominará una señal de aplauso.
El aparato 200 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede separar la señal de aplauso y realizar la renderización y mezcla de canales de acuerdo con la característica de la señal de aplauso.
La unidad 211 de selección de modo de renderización puede seleccionar uno de un modo general y un modo de aplauso de acuerdo con si la señal de aplauso está incluida en la señal de audio multicanal. El renderizador 220 puede realizar la renderización de acuerdo con el modo seleccionado por la unidad 211 de selección de modo de renderización. Es decir, el renderizador 220 puede renderizar la señal de aplauso de acuerdo con el modo seleccionado.
La unidad 211 de selección de modo de renderización puede seleccionar el modo general cuando no se incluye ninguna señal de aplauso en la señal de audio multicanal. En el modo general, la señal de canal aéreo puede ser renderizada por un renderizador 221 3D y la señal de canal horizontal puede ser renderizada por un renderizador 222 2D. Es decir, la renderización puede realizarse sin tener en cuenta la señal de aplauso.
La unidad 211 de selección de modo de renderización puede seleccionar el modo de aplauso cuando la señal de aplauso está incluida en la señal de audio multicanal. En el modo de aplauso, la señal de aplauso puede separarse y la renderización puede realizarse sobre la señal de aplauso separada.
La unidad 211 de selección de modo de renderización puede determinar si la señal de aplauso está incluida en la señal de audio multicanal, con respecto a cada sección predeterminada, utilizando información de bits de aplauso que está incluida en la señal de audio multicanal o que se recibe de manera separada a partir de otro dispositivo. De acuerdo con un códec basado en MPEG, la información de bits de aplauso incluye información de bandera bsTsEnable o bsTempShapeEnableChannel, y la unidad 211 de selección de modo de renderización selecciona el modo de renderización de acuerdo con la información de bandera descrita anteriormente.
Además, la unidad 211 de selección de modo de renderización puede seleccionar el modo de renderización en base a la característica de la señal de audio multicanal en una sección predeterminada por determinar. Es decir, la unidad 211 de selección de modo de renderización puede seleccionar el modo de renderización de acuerdo con si la característica de la señal de audio multicanal en la sección predeterminada tiene la característica de la señal de audio que incluye la señal de aplauso.
La unidad 211 de selección de modo de renderización puede determinar si la señal de aplauso se incluye en la señal de audio multicanal, en base a al menos una condición entre si las señales de banda ancha que no son tonales para una pluralidad de canales de entrada están presentes en la señal de audio multicanal y los niveles de las señales de banda ancha son similares con respecto a cada canal, si se repite un impulso de una sección corta, y si la correlación entre canales es baja.
La unidad 211 de selección de modo de renderización puede seleccionar el modo de aplauso cuando se determina que la señal de aplauso está incluida en la señal de audio multicanal en la sección actual.
Cuando la unidad 211 de selección de modo de renderización selecciona el modo de aplauso, la unidad 212 de separación de señal de renderización puede separar la señal de aplauso incluida en la señal de audio multicanal de una señal de sonido general.
Cuando se utiliza una bandera bsTsdEnable en base a MPEG USAC, la renderización 2D se realiza de acuerdo con la información de bandera, independientemente de la elevación del canal correspondiente, como en la señal de canal horizontal. Además, se puede suponer que la señal aérea es la señal de canal horizontal y se mezcla de acuerdo con la información de bandera. Es decir, la unidad 212 de separación de señal de renderización puede separar la señal de aplauso de la señal de audio multicanal de la sección predeterminada de acuerdo con la información de bandera, y puede renderizar en 2D la señal de aplauso separada como en la señal de canal horizontal.
En un caso en el que no se utiliza ninguna bandera, la unidad 212 de separación de señal de renderización puede analizar una señal entre los canales y separar un componente de señal de aplauso. La señal de aplauso separada de la señal aérea se puede renderizar en 2D, y las señales distintas de la señal de aplauso se pueden renderizar en 3D.
El renderizador 220 puede incluir el renderizador 221 3D que renderiza la señal aérea de acuerdo con un procedimiento de renderización 3D, y el renderizador 222 2D que renderiza la señal de canal horizontal o la señal de aplauso de acuerdo con el procedimiento de renderización 2D.
El renderizador 221 3D puede renderizar la señal aérea en diferentes procedimientos de acuerdo con la frecuencia. El renderizador 221 3D puede renderizar una señal de baja frecuencia utilizando un procedimiento de adición al canal más cercano y puede renderizar una señal de alta frecuencia utilizando el procedimiento de renderización 3D. De aquí en adelante, el procedimiento de renderización 3D puede ser un procedimiento de renderización de la señal aérea y puede incluir un procedimiento de panoramización multicanal.
El renderizador 222 2D puede realizar la renderización utilizando al menos uno seleccionado entre un procedimiento de renderización 2D de una señal de canal horizontal o una señal de aplauso, un procedimiento de adición al canal más cercano, y un procedimiento de aumento de energía. De aquí en adelante, el procedimiento de renderización 2D puede ser el procedimiento de renderización de la señal de canal horizontal y puede incluir una ecuación de mezcla descendente o un procedimiento de panoramización de amplitud de base vectorial (VBAP).
El renderizador 221 3D y el renderizador 222 2D pueden simplificarse mediante transformación de matriz. El renderizador 221 3D puede realizar la mezcla descendente a través de una matriz de mezcla descendente 3D definida por una función de un canal de entrada, un canal de salida, y una frecuencia. El renderizador 221 2D puede realizar la mezcla descendente a través de una matriz de mezcla descendente 3D definida por una función de un canal de entrada, un canal de salida, y una frecuencia. Es decir, la matriz de mezcla descendente 3D o 2D puede mezclar de manera descendente una señal de audio multicanal de entrada incluyendo coeficientes que se pueden determinar de acuerdo con el canal de entrada, el canal de salida, o la frecuencia.
Cuando se realiza la renderización, una parte de amplitud de la señal de sonido para cada frecuencia es más importante que una parte de fase de la señal de sonido. Por lo tanto, el renderizador 221 3D y el renderizador 2222D pueden realizar la renderización utilizando la matriz de mezcla descendente que incluye los coeficientes que pueden determinarse de acuerdo con cada valor de frecuencia, reduciendo así la cantidad de cálculos de renderización. Las señales, las cuales se renderizan a través de la matriz de mezcla descendente, pueden mezclarse de acuerdo con un módulo de preservación de potencia del mezclador 230 y emitirse como una señal final.
El mezclador 230 puede calcular las señales renderizadas con respecto a cada canal y emitir la señal final. El mezclador 230 de acuerdo con la realización ejemplar puede mezclar las señales renderizadas en base a los valores de potencia de las señales incluidas en los canales respectivos. Por lo tanto, el aparato 200 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede reducir la distorsión de tono mezclando las señales renderizadas en base a los valores de potencia de las señales renderizadas. La distorsión de tono puede ser causada por un refuerzo o desplazamiento de frecuencia.
La unidad 240 de salida puede finalmente emitir la señal de salida del mezclador 230 a través del altavoz. En este momento, la unidad 240 de salida puede emitir la señal de sonido a través de diferentes altavoces de acuerdo con el canal de la señal mezclada.
La Figura 3 es un diagrama de flujo de un procedimiento de reproducción de sonido 3D de acuerdo con una realización ejemplar.
Con referencia a la Figura 3, en la operación S301, el aparato 100 de reproducción de sonido 3D puede renderizar una señal de audio multicanal de acuerdo con la información de canal y una frecuencia. El aparato 100 de reproducción de sonido 3D puede realizar una renderización 3D o 2D de acuerdo con la información de canal y puede renderizar una señal de baja frecuencia, teniendo en cuenta la característica de la señal de baja frecuencia.
En la operación S303, el aparato 100 de reproducción de sonido 3D puede generar una señal final mezclando las señales renderizadas en la operación S301. El aparato 100 de reproducción de sonido 3D puede realizar la renderización determinando los canales para emitir señales de los respectivos canales de la señal de audio multicanal, realizar la mezcla sumando o realizando una operación aritmética en las señales renderizadas, y generar la señal final.
La Figura 4 es un diagrama de flujo de un procedimiento de reproducción de sonido 3D para una señal de audio que incluye una señal de aplauso, de acuerdo con una realización ejemplar.
Con referencia a la Figura 4, en la operación S401, el aparato 200 de reproducción de sonido 3D puede analizar una señal de audio multicanal con respecto a cada sección predeterminada de modo que determine si se incluye una señal de aplauso en la señal de audio multicanal.
En la operación S403, el aparato 200 de reproducción de sonido 3D puede determinar si la señal de aplauso está incluida en la señal de audio multicanal de entrada, con respecto a cada sección predeterminada, por ejemplo, una trama. El aparato 200 de reproducción de sonido 3D puede determinar si la señal de aplauso está incluida en la señal de audio multicanal de entrada, con respecto a cada sección predeterminada, analizando la información de bandera o la señal de audio multicanal de la sección predeterminada que se va a determinar. Dado que el aparato 200 de reproducción de sonido 3D procesa la señal de aplauso separadamente de la señal aérea o de la señal de canal horizontal, es posible reducir la distorsión de tono cuando se mezcla la señal de aplauso.
En la operación S405, cuando se determina que la señal de aplauso está incluida en la señal de audio multicanal de entrada, el aparato 200 de reproducción de sonido 3D puede separar la señal de aplauso. En la operación S407, el aparato 200 de reproducción de sonido 3D puede renderizar en 2D la señal de aplauso y la señal de canal horizontal.
La señal de canal horizontal se puede renderizar en 2D de acuerdo con una ecuación de mezcla descendente o un procedimiento VBAP.
La señal de aplauso puede ser renderizada al canal más cercano cuando el canal que incluye el sonido de elevación es proyectado en el plano horizontal de acuerdo con el procedimiento de adición al canal más cercano, o puede ser renderizada de acuerdo con el procedimiento de renderización 2D y ser luego mezclada de acuerdo con el procedimiento de aumento de energía.
En un caso en el que la señal de aplauso se mezcla después de la renderización de acuerdo con el procedimiento de renderización 2D o 3D, puede producirse un fenómeno de blanqueamiento debido a un aumento del número de componentes transitorios en la señal mezclada, o una imagen de sonido puede estrecharse debido a un aumento de una correlación cruzada entre canales. Por lo tanto, con el fin de evitar que se produzca el fenómeno de blanqueamiento o el estrechamiento de la imagen de sonido, el aparato 200 de reproducción de sonido 3D puede renderizar y mezclar la señal de aplauso de acuerdo con el procedimiento de adición al canal más cercano o el procedimiento de aumento de energía, el cual se utiliza para renderizar en 3D la señal de baja frecuencia.
El procedimiento de aumento de energía es un procedimiento de mezcla que, cuando las señales de audio de los canales se mezclan en un único canal, aumentar la energía de la señal de canal horizontal de modo que evite que el tono se blanquee debido al cambio de un periodo transitorio. El procedimiento de aumento de energía se refiere a un procedimiento de mezcla de la señal de aplauso renderizada.
El procedimiento de mezcla de la señal de aplauso de acuerdo con el procedimiento de refuerzo de energía puede realizarse en base a la siguiente Ecuación 1.
Figure imgf000008_0001
(Procesamiento en el dominio de frecuencia)
Wentrada,saiida es una ganancia de mezcla descendente. Los canales respectivos de las señales de audio multicanal son renderizados en un canal que se va a reproducir. Cuando se mezcla la señal de aplauso, la ganancia de mezcla descendente puede aplicarse a la señal de aplauso con respecto a cada canal. La ganancia de mezcla descendente puede determinarse previamente como un valor predeterminado de acuerdo con el canal en el cual se renderizan los canales respectivos. xentrada=salida [l,k] representa una señal de aplauso renderizada correspondiente a un esquema de salida y significa cualquier señal de aplauso. I es un valor para identificar una sección predeterminada de una señal de sonido, y k es una frecuencia. xentrada=salida[l,k]/|lxentrada=salida[l,k]| es un valor de fase de una señal de aplauso de entrada, y los valores dentro de la raíz de la ecuación 1 pueden ser potencias de señales de aplauso correspondientes al mismo canal de salida, es decir, la suma de valores de energía.
Con referencia a la Ecuación 1, la ganancia de cada canal que se va a reproducir puede modificarse tanto como el valor de potencia de los valores en los cuales la ganancia de mezcla descendente se aplica a una pluralidad de señales de aplauso renderizadas a un canal del esquema de salida. Por lo tanto, la amplitud de la señal de aplauso puede aumentarse mediante la suma de los valores de energía, y puede evitarse el fenómeno de blanqueamiento causado por una diferencia de fase.
En la operación S409, cuando se determina que la señal de aplauso no está incluida en la señal de audio multicanal de entrada, el aparato 200 de reproducción de sonido 3D puede renderizar en 2D la señal de canal horizontal.
En la operación S411, el aparato 200 de reproducción de sonido 3D puede filtrar la señal de canal aéreo utilizando un filtro HRTF de modo que proporcione la señal de sonido 3D. Cuando la señal de canal aéreo es una señal en el dominio de la frecuencia o una muestra de un banco de filtros, el filtrado HRTF puede realizarse mediante una simple multiplicación, ya que el filtro HRTF es un filtro que sólo proporciona una ponderación relativa de un espectro.
En la operación S413, el aparato 200 de reproducción de sonido 3D puede separar la señal de canal aéreo en una señal de alta frecuencia y una señal de baja frecuencia. Por ejemplo, el aparato 200 de reproducción de sonido 3D puede separar la señal de sonido en una señal de baja frecuencia cuando la señal de sonido tiene una frecuencia de 1 kHz o menos. Dado que la difracción del componente de baja frecuencia es fuerte en términos de características acústicas, el componente de baja frecuencia se puede renderizar utilizando el procedimiento de adición al canal más cercano.
En la operación S415, el aparato 200 de reproducción de sonido 3D puede renderizar la señal de alta frecuencia utilizando el procedimiento de renderización 3D. El procedimiento de renderización 3D puede incluir un procedimiento de panoramización multicanal. La panoramización multicanal puede significar que las señales de canal de la señal de audio multicanal se distribuyen a los canales que se van a reproducir. En este momento, las señales de canal, a las cuales se aplican coeficientes de panoramización, pueden distribuirse a los canales que se van a reproducir. En el caso de la señal de alta frecuencia, las señales pueden distribuirse a los canales de sonido envolvente de modo que proporcione una característica de que la diferencia de nivel interaural (ILD) se reduce a medida que aumenta la percepción de elevación. Además, una dirección de la señal de sonido puede ser localizada por el número de canales panoramizados con un canal frontal.
En la operación S417, el aparato 200 de reproducción de sonido 3D puede renderizar la señal de baja frecuencia utilizando el procedimiento de adición al canal más cercano. Si muchas señales, es decir, una pluralidad de señales de canal de la señal de audio multicanal, se mezclan con un canal, la calidad del sonido puede degradarse ya que la calidad del sonido se compensa o amplifica por diferentes fases. De acuerdo con el procedimiento de adición al canal más cercano, el aparato 200 de reproducción de sonido 3D puede asignar los canales al canal más cercano cuando los canales se proyectan en los planos horizontales del canal de modo que evite que se produzca la degradación en la calidad del sonido, como se muestra a continuación en la Tabla 1.
[Tabla 1]
Figure imgf000008_0002
Figure imgf000009_0001
Con referencia a la Tabla 1, los canales, tales como TBC y VOG, en los cuales existe una pluralidad de canales cercanos entre los canales aéreos pueden ser distribuidos a un canal 5.1 mediante un coeficiente de panoramización para la localización de la imagen de sonido.
La relación de asignación que se muestra en la Tabla 1 es simplemente ejemplar y no se limita al ejemplo anterior. Los canales pueden estar asignados de manera diferente.
Cuando la señal de audio multicanal es una señal de frecuencia o una señal de banco de filtros, una bandeja o una banda correspondiente a una frecuencia baja puede ser renderizada de acuerdo con el procedimiento de adición al canal más cercano, y una bandeja o una banda correspondiente a una frecuencia alta ser renderizada de acuerdo con el procedimiento de panoramización multicanal. La bandeja o la banda pueden referirse a una sección de señal en base a una unidad predeterminada en un dominio de frecuencia.
En la operación S419, el aparato 100 de reproducción de sonido 3D puede renderizar las señales renderizadas a los canales respectivos en base a los valores de potencia. En este momento, el aparato 100 de reproducción de sonido 3D puede renderizar las señales en un dominio de frecuencia. El procedimiento de mezcla de las señales renderizadas a los respectivos canales en base a los valores de potencia se describirá en más detalle con referencia a las Figuras 6 y 7.
En la operación S421, el aparato 100 de reproducción de sonido 3D puede emitir una señal mezclada como una señal final.
La Figura 5 es un diagrama de bloques de un renderizador 500 3D de acuerdo con una realización ejemplar. El renderizador 500 3D de la Figura 5 corresponde al renderizador 221 3D de la Figura 2 y, por lo tanto, se omiten descripciones redundantes en la misma.
Con referencia a la Figura 5, el renderizador 5003D puede incluir un filtro 510 HRTF, un filtro 520 de paso bajo (LPF), un filtro 530 de paso alto (HPF), una adición al canal 540 más cercano, y una panoramización 550 multicanal.
El filtro 510 HRTF puede realizar el filtrado HRTF en la señal de canal aéreo entre las señales de audio multicanal. El LPF 520 puede separar un componente de baja frecuencia de canal aéreo de filtrado HRTF.
El HPF 530 puede separar un componente de alta frecuencia de canal aéreo de filtrado HRTF.
La adición al canal 540 más cercano puede ser renderizada al canal más cercano cuando los componentes de baja frecuencia de las señales de canal aéreo son proyectados en los planos horizontales del canal.
La panoramización 550 multicanal puede renderizar los componentes de alta frecuencia de las señales de canal aéreo de acuerdo con el procedimiento de panoramización multicanal.
La Figura 6 es un diagrama de flujo de un procedimiento para mezclar señales de audio renderizadas, de acuerdo con una realización ejemplar. Las operaciones S601 a S605 de la Figura 6 corresponden a la operación S419 de la Figura 4 y, por lo tanto, se omiten descripciones redundantes en la misma.
Con referencia a la Figura 6, en la operación S601, el aparato 100 de reproducción de sonido 3D puede adquirir señales de audio renderizadas.
En la operación S603, el aparato 100 de reproducción de sonido 3D puede adquirir valores de potencia de señales de audio renderizadas con respecto a cada canal. En la operación S605, el aparato 100 de reproducción de sonido 3D puede mezclar las señales de audio renderizadas en base a los valores de potencia adquiridos con respecto a cada canal y generar una señal final.
La Figura 7 es un diagrama de flujo de un procedimiento de mezcla de señales de audio renderizadas de acuerdo con la frecuencia, de acuerdo con una realización ejemplar. Dado que las operaciones S701 y S703 de la Figura 7 corresponden a las operaciones S601 y S603 de la Figura 6, respectivamente, se omiten descripciones redundantes en la misma.
Con referencia a la Figura 7, en la operación S701, el aparato 100 de reproducción de sonido 3D puede adquirir señales de audio renderizadas.
En la operación S703, el aparato 100 de reproducción de sonido 3D puede adquirir valores de potencia de señales de audio renderizadas con respecto a cada canal de acuerdo con un módulo de preservación de potencia. En la operación S705, el aparato 100 de reproducción de sonido 3D puede mezclar las señales de audio renderizadas en base a los valores de potencia adquiridos. Los valores de potencia de las señales renderizadas con respecto a cada canal pueden adquirirse obteniendo la suma de los cuadrados de las señales renderizadas con respecto a cada canal.
Figure imgf000010_0001
(Procesamiento en el dominio de frecuencia)
xentrada,salida son señales de audio renderizadas para cualquier canal. xsalida es la suma total de las señales renderizadas para cualquier canal. I es una sección actual de la señal de audio multicanal. k es una frecuencia. ysalida es una señal mezclada de acuerdo con el módulo de preservación de potencia.
De acuerdo con el módulo de preservación de potencia, la mezcla puede ser realizada de tal manera que la potencia de la señal finalmente mezclada en base a los valores de potencia de las señales renderizadas para los respectivos canales sea preservada a la potencia previa a la mezcla. Por lo tanto, de acuerdo con el módulo de preservación de potencia, es posible evitar que la señal de sonido se distorsione por interferencia constructiva o interferencia destructiva cuando la señal mezclada se adiciona a las señales renderizadas.
Con referencia a la Ecuación 2, el aparato 100 de reproducción de sonido 3D puede mezclar las señales renderizadas aplicando los valores de potencia de las señales renderizadas a los respectivos canales a una fase de la suma total de las señales renderizadas a los respectivos canales.
Cuando la señal adquirida en la operación S701 es un dominio de tiempo, la señal adquirida puede convertirse en una señal de dominio de tiempo y luego mezclarse de acuerdo con la Ecuación 2. En este momento, la señal de sonido de dominio de tiempo puede convertirse en una señal de dominio de frecuencia de acuerdo con un esquema de frecuencia o banco de filtros.
Sin embargo, cuando el aparato 100 de reproducción de sonido 3D aplica el módulo de preservación de potencia con respecto a cada sección predeterminada, los valores de potencia de las señales respectivas se estiman con respecto a cada sección predeterminada. En el caso de una señal de baja frecuencia, la sección capaz de estimar los valores de potencia es insuficiente, en comparación con una longitud de onda. Por lo tanto, los valores de potencia estimados con respecto a cada sección predeterminada pueden cambiar, y puede producirse una parte discontinua en una interfaz entre las secciones a las cuales se aplica el módulo de preservación de potencia. por otro lado, en el caso de una señal de alta frecuencia, la sección capaz de estimar los valores de potencia es suficiente, en comparación con una longitud de onda. Por lo tanto, es menos probable que se produzca una parte discontinua en una interfaz entre las secciones. Es decir, el suavizado de un polo, el cual se describirá más adelante, puede aplicarse de acuerdo con si la sección capaz de estimar los valores de potencia es suficiente, en comparación con la longitud de onda.
En la operación S707, el aparato 100 de reproducción de sonido 3D puede determinar si existe una parte correspondiente a la señal de baja frecuencia en la señal mezclada en la operación S705. En las operaciones S709 a S711, cuando se determina que la parte correspondiente a la señal de baja frecuencia existe en la señal mezclada, el aparato 100 de reproducción de sonido 3D puede eliminar la parte discontinua que se produce en la interfaz entre las secciones, a las cuales se aplica el módulo de preservación de potencia, utilizando el suavizado de un polo de la siguiente Ecuación 3.
[Ecuación 3]
Figure imgf000011_0001
(Procesamiento en el dominio de frecuencia)
donde
Figure imgf000011_0002
Psaiida puede adquirirse en base a Psaiida de la sección anterior y la suma total de los valores de potencia de las señales mixtas de la sección actual.
Pentrada puede adquirirse en base a Pentrada de la sección anterior y la suma total de los valores de potencia de las señales renderizadas de la sección actual.
El valor de potencia de la sección anterior puede aplicarse a la Ecuación 3 de acuerdo con y que es aplicable a Psalida o Pentrada de la sección anterior. puede determinarse que y tiene un valor más pequeño a medida que la longitud de onda de la señal de baja frecuencia es mayor o la frecuencia de la señal de baja frecuencia es menor.
Con el fin de eliminar la parte discontinua, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede ajustar la ganancia de la señal mezclada en base al valor de potencia de las señales renderizadas en la sección anterior o en la señal obtenida sumando las señales renderizadas.
Además, de forma similar a la Ecuación 3, la parte discontinua puede eliminarse realizando el procesamiento de la Ecuación 4 de tal manera que la ganancia de la señal de salida se adquiera en base a la ganancia de la señal de salida de la sección anterior.
[Ecuación 4]
Figure imgf000011_0003
(Procesamiento en el dominio de frecuencia)
donde
Figure imgf000011_0004
Con el fin de eliminar la parte discontinua, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede ajustar la ganancia de la señal mezclada en base a la ganancia aplicada a las señales renderizadas en la sección anterior o en la señal obtenida sumando las señales renderizadas.
La Figura 8 es un gráfico de un ejemplo de mezcla de señales de audio renderizadas de acuerdo con la frecuencia, de acuerdo con una realización ejemplar.
Con referencia a la Figura 8, en una señal 803, en la cual las señales 801 y 802 de audio renderizadas se adicionan durante un procedimiento de mezcla, las señales 801 y 802 de audio renderizadas pueden sonar fuertes ya que la amplitud de la señal 803 se amplifica debido a la diferencia de fase entre las señales 801 y 802 de audio renderizadas.
Por lo tanto, utilizando el módulo de preservación de potencia, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede determinar la ganancia de la señal 803 en base a los valores de potencia de las señales 801 y 802 de audio renderizadas.
Una señal 804, la cual es una señal mixta de acuerdo con el módulo de preservación de potencia, se ajusta para tener una amplitud similar a la de las señales 801 y 802 de audio renderizadas, pero puede incluirse una parte discontinua en cada sección cuando se utiliza el módulo de preservación de potencia con respecto a cada sección predeterminada.
Por lo tanto, el aparato 100 de reproducción de sonido 3D de acuerdo con la realización ejemplar puede obtener una señal 805 final realizando un procedimiento de suavizado en la señal mezclada de acuerdo con el procedimiento de suavizado de un polo con referencia al valor de potencia de la sección anterior.
La Figuras 9 y 10 son diagramas de bloques de aparatos 900 y 1000 de reproducción de sonido 3D de acuerdo con realizaciones ejemplares.
Con referencia a la Figura 9, el aparato 900 de reproducción de sonido 3D puede incluir un renderizador 910 3D, un renderizador 920 2D, una unidad 930 de aplicación de ponderación, y un mezclador 940. El renderizador 910 3D, el renderizador 9202D, y el mezclador 940 de la Figura 9 corresponden al renderizador 221 3D, al renderizador 2222D, y al mezclador 230 de la Figura 2, respectivamente, y, por lo tanto, se omiten las descripciones redundantes de los mismos.
El renderizador 910 3D puede renderizar las señales de canal aéreo entre las señales de audio multicanal.
El renderizador 9202D puede renderizar las señales de canal horizontal entre las señales de audio multicanal.
La unidad 930 de aplicación de ponderación es un elemento para emitir la señal de audio multicanal de acuerdo con el esquema del canal que se va a reproducir, cuando el esquema del canal no coincide con el esquema del canal de la señal que se va a reproducir entre los esquemas capaces de ser renderizados por el renderizador 910 3D. El esquema del canal que se va a reproducir puede significar información de disposición de altavoces para emitir una señal de canal que se va a reproducir.
Cuando el renderizador 9202D realiza la renderización de acuerdo con el procedimiento VBAP, es posible renderizar la señal de canal horizontal incluso en un entorno de canal de esquema arbitrario. De acuerdo con el procedimiento VBAP, el aparato 900 de reproducción de sonido 3D puede obtener el coeficiente de panoramización en un entorno de altavoces arbitrario simplemente usando un cálculo basado en vectores y renderizando la señal de audio multicanal. Por lo tanto, la ponderación puede determinarse de acuerdo con el grado de similitud con el esquema en el cual el renderizador 9103D renderiza un esquema de canal de reproducción arbitrario. Por ejemplo, cuando el renderizador 910 3D renderiza la señal de audio multicanal en un entorno de reproducción de canal 5.1, la ponderación puede determinarse de acuerdo con cuánto difiere en esquema el entorno de canal de esquema arbitrario que se va a renderizar del entorno de reproducción de canal 5.1.
La unidad 930 de aplicación de ponderación 3D puede aplicar la ponderación determinada a las señales renderizadas por el renderizador 9103D y el renderizador 9202D.
Con referencia a la Figura 10, el aparato 1000 de reproducción de sonido 3D puede incluir un renderizador 10103D, un renderizador 10202D, y un mezclador 1030. El renderizador 9103D, el renderizador 9202D, y el mezclador 1030 de la Figura 9 corresponden al renderizador 221 3D, al renderizador 222 2D, y al mezclador 230 de la Figura 2, respectivamente, y, por lo tanto, se omiten las descripciones redundantes de los mismos.
El renderizador 10103D puede realizar la renderización utilizando un esquema que es lo más similar al esquema de un canal que se va a renderizar entre los esquemas que se pueden renderizar. El renderizador 1020 2D puede renderizar la señal renderizada por el renderizador 10103D volviendo a panoramizar el esquema de canal de la señal que se va a emitir con respecto a cada canal.
Por ejemplo, cuando el renderizador 1010 3D renderiza la señal de audio multicanal en un entorno de reproducción de canal 5.1, el renderizador 1020 2D puede renderizar la señal renderizada en 3D volviendo a panoramizar de acuerdo con un entorno de canal de esquema arbitrario que se va a renderizar utilizando el procedimiento VBAP.
Como se ha descrito anteriormente, de acuerdo con una o más de las realizaciones ejemplares anteriores, el aparato de reproducción de sonido 3D puede reproducir el componente de elevación de la señal de sonido a través de altavoces dispuestos en el plano horizontal, de modo que un usuario pueda percibir la elevación.
De acuerdo con una o más de las realizaciones ejemplares anteriores, cuando la señal de audio multicanal se reproduce en un entorno en el cual el número de canales es pequeño, el aparato de reproducción de sonido 3D puede evitar que cambie un tono o que desaparezca un sonido.
Además, otras realizaciones ejemplares también pueden implementarse a través de código/instrucciones legibles por ordenador en/sobre un medio, por ejemplo, un medio legible por ordenador, para controlar al menos un elemento de procesamiento para implementar cualquier realización ejemplar descrita anteriormente. El medio puede corresponder a cualquier medio/soporte que permita el almacenamiento y/o la transmisión del código legible por ordenador.
El código legible por ordenador puede grabarse/transferirse en un medio en una variedad de maneras, con ejemplos del medio que incluyen medios de grabación, tales como medios de almacenamiento magnético (por ejemplo, ROM, disquetes, discos duros, etc.) y medios de grabación óptica (por ejemplo, CD-ROMs, o DVDs), y medios de transmisión tales como medios de transmisión por Internet. Por lo tanto, el medio puede ser una tal estructura definida y medible que incluya o transporte una señal o información, tal como un dispositivo que transporte un flujo de bits de acuerdo con una o más realizaciones ejemplares. El medio también puede ser una red distribuida, de modo que el código legible por ordenador se almacena/transfiere y ejecuta de forma distribuida. Además, el elemento de procesamiento podría incluir un procesador o un procesador de ordenador, y los elementos de procesamiento podrían estar distribuidos y/o incluidos en un único dispositivo.
Se debe entender que las realizaciones ejemplares descritas en el mismo deben considerarse en un sentido descriptivo únicamente y no con fines de limitación. Las descripciones de características o aspectos dentro de cada realización ejemplar deben considerarse típicamente como disponibles para otras características o aspectos similares en otras realizaciones ejemplares.
A la vez que una o más realizaciones ejemplares se describen con referencia a las figuras, se entenderá por aquellos expertos en la técnica que se pueden realizar diversos cambios en la forma y los detalles en el mismo sin apartarse del ámbito como se define mediante las reivindicaciones adjuntas.

Claims (7)

REIVINDICACIONES
1. Un procedimiento de renderización de señales de audio que comprende:
recibir información de bandera, y señales de multicanal que incluyen una señal de canal de entrada de altura y una señal de canal de entrada horizontal;
obtener una primera matriz de mezcla descendente para la renderización tridimensional, 3D, sobre un esquema de salida;
obtener una segunda matriz de mezcla descendente para la renderización bidimensional, 2D, sobre el esquema de salida; y
seleccionar una matriz de mezcla descendente entre la primera matriz de mezcla descendente y la segunda matriz de mezcla descendente en base a la información de bandera;
renderizar las señales de multicanal que incluyen la señal de canal de entrada de altura y la señal de canal de entrada horizontal, utilizando la matriz de mezcla descendente seleccionada, de modo que proporcione una imagen de sonido que tiene una percepción de elevación a través de una pluralidad de señales de canal de salida de acuerdo con el esquema de salida,
en el que el esquema de salida es el formato de canal 5.1,
en el que la primera matriz de mezcla descendente y la segunda matriz de mezcla descendente son para diferentes renderizados de elevación para la señal de canal de entrada de altura, y las señales de multicanal incluyen una primera trama la cual tiene una característica de sonido de aplauso o una segunda trama la cual tiene una característica de sonido general,
en el que la información de bandera se recibe por trama,
en el que la primera trama se renderiza en 2D utilizando la segunda matriz de mezcla descendente en caso de que la información de bandera de la primera trama indique la característica de sonido de aplauso, y en el que la segunda trama se renderiza en 3D utilizando la primera matriz de mezcla descendente en caso de que la información de bandera de la segunda trama indique la característica de sonido general.
2. El procedimiento de renderización de la señal de audio de la reivindicación 1, en el que la renderización de las señales de multicanal comprende la panoramización de las señales de multicanal mediante diferentes procedimientos de panoramización de acuerdo con un intervalo de frecuencia.
3. El procedimiento de renderización de la señal de audio de la reivindicación 2, en el que los diferentes procedimientos de panoramización incluyen un procedimiento de adición al canal más cercano.
4. Un medio de grabación no transitorio legible por ordenador que tenga almacenado en el mismo un programa para realizar el procedimiento de una cualquiera de las reivindicaciones 1 a 3.
5. Un aparato de renderización de la señal de audio que comprende:
un receptor que recibe información de bandera, y señales de multicanal que incluyen una señal de canal de entrada de altura y una señal de canal de entrada horizontal; y
un renderizador (110) que obtiene una primera matriz de mezcla descendente para la renderización tridimensional, 3D, sobre un esquema de salida, obtiene una segunda matriz de mezcla descendente para la renderización bidimensional, 2D, sobre el esquema de salida, selecciona una matriz de mezcla descendente entre la primera matriz de mezcla descendente y la segunda matriz de mezcla descendente en base la información de bandera, y renderiza las señales de multicanal que incluyen la señal de canal de entrada de altura y la señal de canal de entrada horizontal, utilizando la matriz de mezcla descendente seleccionada, de modo que proporcione una imagen de sonido que tiene una percepción de elevación a través de una pluralidad de señales de canal de salida de acuerdo con el esquema de salida,
en el que el esquema de salida es el formato de canal 5.1,
en el que la primera matriz de mezcla descendente y la segunda matriz de mezcla descendente son para diferentes renderizados de elevación para la señal de canal de entrada de altura, y las señales de multicanal incluyen una primera trama la cual tiene una característica de sonido de aplauso o una segunda trama la cual tiene una característica de sonido general,
en el que la información de bandera se recibe por trama,
en el que la primera trama se renderiza en 2D utilizando la segunda matriz de mezcla descendente en caso de que la información de bandera de la primera trama indique las características de sonido de aplauso, y la segunda trama se renderiza en 3D utilizando la primera matriz de mezcla descendente en caso de que la información de bandera de la segunda trama indique la característica de sonido general.
6. El aparato de renderización de la señal de audio de la reivindicación 5, en el que el renderizador (110) panoramiza las señales de multicanal mediante diferentes procedimientos de panoramización de acuerdo con un intervalo de frecuencia.
7. El aparato de renderización de la señal de audio de la reivindicación 6, en el que los diferentes procedimientos de panoramización incluyen un procedimiento de adición al canal más cercano.
ES21154301T 2013-10-25 2014-10-27 Procedimiento y aparato de reproducción de sonido estereofónico Active ES2952212T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130128038A KR102231755B1 (ko) 2013-10-25 2013-10-25 입체 음향 재생 방법 및 장치

Publications (1)

Publication Number Publication Date
ES2952212T3 true ES2952212T3 (es) 2023-10-30

Family

ID=52993205

Family Applications (1)

Application Number Title Priority Date Filing Date
ES21154301T Active ES2952212T3 (es) 2013-10-25 2014-10-27 Procedimiento y aparato de reproducción de sonido estereofónico

Country Status (10)

Country Link
US (3) US10091600B2 (es)
EP (4) EP4221261B1 (es)
JP (2) JP6382965B2 (es)
KR (1) KR102231755B1 (es)
CN (2) CN105684466B (es)
ES (1) ES2952212T3 (es)
MX (1) MX355499B (es)
PL (2) PL3833054T3 (es)
SI (1) SI3833054T1 (es)
WO (1) WO2015060696A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2015234454B2 (en) 2014-03-24 2017-11-02 Samsung Electronics Co., Ltd. Method and apparatus for rendering acoustic signal, and computer-readable recording medium
JP6866679B2 (ja) * 2017-02-20 2021-04-28 株式会社Jvcケンウッド 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
JP6868093B2 (ja) * 2017-03-24 2021-05-12 シャープ株式会社 音声信号処理装置及び音声信号処理システム
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
CN114710740A (zh) 2017-12-12 2022-07-05 索尼公司 信号处理装置和方法以及计算机可读存储介质

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4306029B2 (ja) 1999-06-28 2009-07-29 ソニー株式会社 音場再生システム
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
DE102004057500B3 (de) * 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
WO2007083739A1 (ja) 2006-01-19 2007-07-26 Nippon Hoso Kyokai 3次元音響パンニング装置
JP5010185B2 (ja) * 2006-06-08 2012-08-29 日本放送協会 3次元音響パンニング装置
BRPI0708047A2 (pt) * 2006-02-09 2011-05-17 Lg Eletronics Inc método para codificar e decodificar sinal de áudio com base em objeto e equipamento para o mesmo
WO2007136166A1 (en) 2006-05-23 2007-11-29 Lg Electronics Inc. Digital broadcasting system and method of processing data
KR101297300B1 (ko) * 2007-01-31 2013-08-16 삼성전자주식회사 스피커 어레이를 이용한 프론트 서라운드 재생 시스템 및그 신호 재생 방법
KR100943215B1 (ko) * 2007-11-27 2010-02-18 한국전자통신연구원 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
JP5237463B2 (ja) 2008-12-11 2013-07-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネルオーディオ信号を生成するための装置
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
RU2559713C2 (ru) 2010-02-02 2015-08-10 Конинклейке Филипс Электроникс Н.В. Пространственное воспроизведение звука
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
KR20120004909A (ko) 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
CN103053180B (zh) 2010-07-22 2016-03-23 皇家飞利浦电子股份有限公司 用于声音再现的***和方法
CN103460282B (zh) * 2010-08-25 2015-08-19 弗兰霍菲尔运输应用研究公司 用于利用传送的相位信息产生去相关信号的装置
US9094771B2 (en) 2011-04-18 2015-07-28 Dolby Laboratories Licensing Corporation Method and system for upmixing audio to generate 3D audio
KR101783962B1 (ko) * 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR102185941B1 (ko) * 2011-07-01 2020-12-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법
EP2645749B1 (en) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
CN102664017B (zh) * 2012-04-25 2013-05-08 武汉大学 一种3d音频质量客观评价方法
US9622014B2 (en) * 2012-06-19 2017-04-11 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
AU2014244722C1 (en) 2013-03-29 2017-03-02 Samsung Electronics Co., Ltd. Audio apparatus and audio providing method thereof
CN110636415B (zh) * 2014-08-29 2021-07-23 杜比实验室特许公司 用于处理音频的方法、***和存储介质

Also Published As

Publication number Publication date
CN105684466B (zh) 2017-11-28
US20200260204A1 (en) 2020-08-13
JP2018201224A (ja) 2018-12-20
JP6382965B2 (ja) 2018-08-29
US20180367933A1 (en) 2018-12-20
EP3035711A4 (en) 2017-04-12
US10091600B2 (en) 2018-10-02
CN107734445A (zh) 2018-02-23
CN107734445B (zh) 2019-10-15
EP3035711A1 (en) 2016-06-22
EP4221261B1 (en) 2024-07-03
EP4221261A1 (en) 2023-08-02
KR20150047943A (ko) 2015-05-06
KR102231755B1 (ko) 2021-03-24
EP3035711B1 (en) 2020-06-03
CN105684466A (zh) 2016-06-15
WO2015060696A1 (ko) 2015-04-30
US20160269845A1 (en) 2016-09-15
JP6660982B2 (ja) 2020-03-11
SI3833054T1 (sl) 2023-08-31
MX355499B (es) 2018-04-20
PL3664475T3 (pl) 2021-07-05
JP2016537864A (ja) 2016-12-01
EP3833054B1 (en) 2023-06-28
PL3833054T3 (pl) 2023-08-21
EP3664475B1 (en) 2021-03-31
EP3833054A1 (en) 2021-06-09
MX2016004750A (es) 2016-07-22
US10645513B2 (en) 2020-05-05
US11051119B2 (en) 2021-06-29
EP3664475A1 (en) 2020-06-10

Similar Documents

Publication Publication Date Title
CN111316354B (zh) 目标空间音频参数和相关联的空间音频播放的确定
US11785407B2 (en) Method and apparatus for rendering sound signal, and computer-readable recording medium
KR102160254B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
KR102149216B1 (ko) 오디오 신호 처리 방법 및 장치
JP2023078432A (ja) 2dセットアップを使用したオーディオ再生のためのアンビソニックス・オーディオ音場表現を復号する方法および装置
ES2952212T3 (es) Procedimiento y aparato de reproducción de sonido estereofónico
JP6161962B2 (ja) 音声信号再生装置及び方法
KR102380232B1 (ko) 입체 음향 재생 방법 및 장치
KR102443055B1 (ko) 입체 음향 재생 방법 및 장치
KR20210006465A (ko) 오디오 신호 처리 방법 및 장치