ES2934801T3 - Procesador de audio, sistema, procedimiento y programa informático para renderización de audio - Google Patents

Procesador de audio, sistema, procedimiento y programa informático para renderización de audio Download PDF

Info

Publication number
ES2934801T3
ES2934801T3 ES18714682T ES18714682T ES2934801T3 ES 2934801 T3 ES2934801 T3 ES 2934801T3 ES 18714682 T ES18714682 T ES 18714682T ES 18714682 T ES18714682 T ES 18714682T ES 2934801 T3 ES2934801 T3 ES 2934801T3
Authority
ES
Spain
Prior art keywords
speaker
audio processor
speakers
listener
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18714682T
Other languages
English (en)
Inventor
Andreas Walther
Jurgen Herre
Christof Faller
Julian Klapp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2934801T3 publication Critical patent/ES2934801T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Un procesador de audio configurado para generar, para cada conjunto de uno o más altavoces, un conjunto de uno o más parámetros, que determinan la derivación de una señal de altavoz para ser reproducida por el respectivo altavoz a partir de una señal de audio, en base a un oyente. posición y posición del altavoz del conjunto de uno o más altavoces. El procesador de audio está configurado para basar la generación del conjunto de uno o más parámetros para el conjunto de uno o más altavoces en una característica de altavoz de al menos uno del conjunto de uno o más altavoces. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procesador de audio, sistema, procedimiento y programa informático para renderización de audio
CAMPO TÉCNICO
[0001] Las realizaciones según la invención se refieren a un procesador de audio, un sistema, un procedimiento y programa informático para la renderización de audio.
ANTECEDENTES DE LA INVENCIÓN
[0002] Un problema general en la reproducción de audio con altavoces es que generalmente la reproducción es óptima solamente dentro de uno o un pequeño intervalo de posiciones del oyente. Peor aún, cuando un oyente cambia de posición o está en movimiento, entonces la calidad de la reproducción de audio varía mucho. La imagen auditiva espacial evocada es inestable para los cambios de la posición de escucha desde el lugar óptimo. La imagen estereofónica se colapsa en el altavoz más cercano.
[0003] Este problema ha sido abordado por publicaciones previas, incluyendo [1] al hacer seguimiento de la posición de un oyente y ajustar la ganancia y retraso para compensar las desviaciones desde la posición de escucha óptima. El seguimiento del oyente también se ha utilizado con cancelación de diafonía (XTC, Cross Talk Cancellation), véase, por ejemplo, [2]. XTC requiere posicionamiento extremadamente preciso de un oyente, lo cual hace el seguimiento del oyente casi indispensable.
[0004] Procedimientos anteriores no consideran el patrón de directividad de los altavoces y el potencial asociado para la calidad del proceso de compensación. Un altavoz emite sonido en diferentes direcciones y, por lo tanto, llega a los oyentes en diferentes posiciones, resultando en diferente percepción de audio para los oyentes en diferentes posiciones. Generalmente los altavoces tienen diferentes respuestas de frecuencia para diferentes direcciones. Por lo tanto, diferentes posiciones de oyente son servidas por un altavoz con diferentes respuestas de frecuencia.
[0005] El documento US6798889B1 describe un sistema de calibración para calibrar sistemas de sonido multi-canal. El sistema de calibración incluye un procedimiento que incluye la modificación de una representación del sistema de altavoces virtual para incluir un indicador de calibración virtual que indica una característica de una señal de calibración y el ajuste del indicador de calibración virtual en función de una entrada del usuario, en el que cuando se ajusta el indicador de calibración virtual, se hace el ajuste correspondiente a la característica de la señal de calibración hasta que se logra un sonido de calibración seleccionado.
[0006] El documento US2011/081032A1 describe un sistema de audio de compensación multicanal que incluye un primer y un segundo canal de compensación para minimizar psicoacústicamente las desviaciones, tales como un efecto de filtrado de peine, en una respuesta objetivo, para mover psicoacústicamente la posición física de un hablante y/o proporcionar psicoacústicamente una magnitud sustancialmente igual de sonido procedente de una pluralidad de altavoces en una pluralidad de posiciones de escucha diferentes.
[0007] El documento US2017/034642A1 describe un dispositivo de procesamiento de información que incluye una unidad de salida de señal de audio que hace que la medición de audio en una banda inaudible se emita desde un altavoz; y una unidad de cálculo de posición de visualización que calcula una posición de visualización de un usuario basándose en la medición de audio captada por un micrófono.
[0008] El documento US2010/226499A1 describe un dispositivo para el procesamiento de datos. El dispositivo comprende una unidad de detección adaptada para detectar modos de reproducción individuales indicativos de una manera de reproducir los datos por separado para cada uno de una pluralidad de usuarios humanos, y una unidad de procesamiento adaptada para procesar los datos para así generar datos reproducibles por separado para cada uno de la pluralidad de usuarios humanos de acuerdo con los modos de reproducción individuales detectados.
[0009] El documento US2012/148075A1 describe un procedimiento para optimizar la reproducción de señales de audio desde un aparato para reproducción de audio teniendo el aparato para reproducción de audio un número variable de altavoces. El procedimiento incluye determinar las características de rendimiento de cada uno del número variable de altavoces; comparar las características de rendimiento de cada uno del número variable de altavoces entre sí; y designar un altavoz principal de entre el número variable de altavoces con o sin intervención manual.
[0010] El documento US2008/273713A1 describe un sistema de audio para un vehículo que tiene una pluralidad de posiciones de asiento. El sistema incluye, en cada posición de asiento, un primer y un segundo conjunto de altavoces direccionales. Cada conjunto es impulsado por señales de audio para irradiar mayor energía acústica correspondiente a las señales de audio a la posición esperada de la cabeza de un oyente en una primera posición de asiento que a una posición esperada de la cabeza del oyente en una segunda posición de asiento.
[0011] Por lo tanto, se desea obtener un concepto que involucre una compensación de una respuesta de frecuencia no deseada de un altavoz para el propósito de optimizar la calidad de la señal de audio de salida de un altavoz para un oyente en diferentes posiciones de escucha.
RESUMEN DE LA INVENCIÓN
[0012] La invención se expone en las reivindicaciones adjuntas.
[0013] Una realización según esta invención se refiere a un procesador de audio configurado para generar, para cada conjunto de uno o más altavoces, un conjunto de uno o más parámetros (estos pueden ser, por ejemplo, parámetros, que pueden influir en el retraso, nivel o respuesta de frecuencia de una o más señales de audio), que determinan que se reproduzca una derivación de una señal de altavoz por el altavoz respectivo de una señal de audio, con base en la posición de un oyente (la posición del oyente puede ser, por ejemplo, la posición de todo el cuerpo del oyente en la misma habitación que el conjunto de uno o más altavoces, o, por ejemplo, solamente la posición de la cabeza del oyente o también, por ejemplo, la posición de las orejas del oyente. La posición del oyente no tiene que ser una posición de pie solo en una habitación, también puede ser, por ejemplo, una posición en referencia al conjunto de uno o más altavoces, (por ejemplo, una distancia de la cabeza del oyente al conjunto de uno o más altavoces) y posición de altavoz del conjunto de uno o más altavoces. El procesador de audio está configurado para basar la generación del conjunto de uno o más parámetros para el conjunto de uno o más altavoces en una característica de altavoz. La característica de altavoz puede ser, por ejemplo, una respuesta de frecuencia dependiente del ángulo de emisión de una característica de emisión de dicho al menos uno del conjunto de uno o más altavoces, esto significa que el procesador de audio puede llevar a cabo la generación dependiente de la respuesta de frecuencia dependiente del ángulo de emisión de la característica de emisión de dicho al menos uno del conjunto de uno o más altavoces. Alternativamente, esto se puede hacer para más de uno (o incluso todos los altavoces) del conjunto de uno o más altavoces. Además, el procesador de audio está configurado para definir cada conjunto de uno o más parámetros por separado dependiendo del ángulo en el que reside la posición del oyente en relación con una dirección hacia delante sobre el eje del altavoz respectivo del conjunto de uno o más altavoces, y para ajustar el conjunto de uno o más parámetros para el al menos un altavoz de modo que la señal del altavoz del al menos un altavoz se derive de la señal de audio que se va a reproducir filtrando espectralmente con una función de transferencia que compensa una desviación de una respuesta de frecuencia de una característica de emisión del altavoz respectivo en una dirección que apunta desde la posición del altavoz del altavoz respectivo a la posición del oyente desde la respuesta de frecuencia de la característica de emisión del altavoz respectivo en la dirección hacia delante sobre el eje.
[0014] Una idea en la cual se basa la solicitud es que la respuesta de frecuencia del altavoz cambia en diferentes direcciones (con relación a la dirección hacia delante sobre el eje) de tal manera que la calidad de renderización se ve afectada por esta dependencia direccional, pero esta disminución de calidad se puede reducir teniendo en cuenta la característica de altavoz en el proceso de reproducción. La respuesta de frecuencia de dichos uno o más altavoces hacia la posición del oyente se puede ecualizar, por ejemplo, para coincidir con la respuesta de frecuencia de dichos uno o más altavoces como sería en una posición de escucha ideal o predeterminada. Esto se puede realizar con el procesador de audio. El procesador de audio obtiene, por ejemplo, información acerca del posicionamiento de oyente, el posicionamiento de altavoz y las características de radiación del altavoz, tales como, por ejemplo, la respuesta de frecuencia del altavoz. El procesador de audio puede calcular a partir de esta información un conjunto de uno o más parámetros. Con el conjunto de uno o más parámetros, se puede modificar el audio de entrada, hablando alternativamente de la señal de audio entrante. Con esta modificación de la señal de audio, el oyente recibe en su posición una señal de audio optimizada. Con esta señal optimizada, el oyente puede tener, por ejemplo, en su posición casi o completamente la misma sensación auditiva que tendría en la posición de escucha ideal del oyente. La posición del oyente ideal es, por ejemplo, la posición en la cual el oyente experimenta una percepción de audio óptima sin ninguna modificación de la señal de audio. Esto significa, por ejemplo, que el oyente puede percibir en esta posición la escena de audio de una manera pretendida por el sitio de producción. La posición del oyente ideal puede corresponder a una posición igualmente distante desde todos los altavoces (uno o más altavoces) utilizada para la reproducción.
[0015] Por lo tanto, el procesador de audio según la presente invención permite que el oyente cambie su posición a diferentes posiciones del oyente y tenga en cada una, al menos en algunas, de las posiciones la misma, o al menos parcialmente la misma, sensación de escucha que tendría el oyente en su posición de escucha ideal.
[0016] En resumen, se debe observar que el procesador de audio es capaz de ajustar al menos uno de retraso, nivel de respuesta de frecuencia de una o más señales de audio, con base en el posicionamiento de oyente, posicionamiento de altavoz y/o la característica de altavoz, con el propósito de lograr una reproducción de audio optimizada para al menos un oyente.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0017] Los dibujos no están necesariamente a escala, más bien se pone énfasis generalmente en ilustrar los principios de la invención. En la siguiente descripción, se describen diferentes realizaciones de la invención con referencia a los siguientes dibujos, en los cuales:
La Figura 1 muestra una vista esquemática de un procesador de audio según una realización de la presente invención.
La Figura 2 muestra una vista esquemática de un procesador de audio según otra realización de la presente invención.
La Figura 3 muestra un diagrama de las características de altavoz de acuerdo con otra realización de la presente invención.
La Figura 4 muestra una vista esquemática de la percepción de audio de un oyente en diferentes posiciones del oyente sin el concepto de renderización consciente de característica de altavoz de las realizaciones descritas en esta invención.
DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES
[0018] La Figura 1 muestra una vista esquemática de un procesador de audio 100 según una realización de la presente invención.
[0019] El procesador de audio 100 está configurado para generar, para cada conjunto 110 de altavoces, un conjunto de uno o más parámetros. Esto significa, por ejemplo, que el procesador de audio 100 genera un primer conjunto de uno o más parámetros 120 para un primer altavoz 112 y un segundo conjunto de uno o más parámetros 122 para un segundo altavoz 114. El conjunto de uno o más parámetros determina una derivación de una señal de altavoz (por ejemplo, una primera señal de altavoz 164 transferida desde el primer modificador 140 al primer altavoz 112 y una segunda señal de altavoz 166 transferida desde el segundo modificador 142 al segundo altavoz 114) para que se reproduzca por el altavoz respectivo a partir de una señal de audio 130. Esto significa, por ejemplo, que la señal de audio 130 es modificada por el primer modificador 140, con base en el primer conjunto de uno o más parámetros 120, al primer altavoz 112 y modificada por el segundo modificador 142, con base en el segundo conjunto de uno o más parámetros 122, al segundo altavoz 114. La señal de audio 130 tiene, por ejemplo, más de un canal, es decir, puede ser una señal estéreo o señal multicanal tal como una señal envolvente de MPEG. El procesador de audio 100 basa la generación del primer conjunto de uno o más parámetros 120 y el segundo conjunto de uno o más parámetros 122 en información entrante 150. La información entrante 150 puede ser, por ejemplo, el posicionamiento de oyente 152, el posicionamiento de altavoz 154 y/o las características de radiación de altavoz 156. El procesador de audio 100 necesita saber, por ejemplo, el posicionamiento de altavoz 154, el cual se puede definir, por ejemplo, como la posición y orientación de los altavoces. Las características de altavoz 156 pueden ser, por ejemplo, respuestas de frecuencia en diferentes direcciones o patrones de directividad de altavoz. Se pueden medir, por ejemplo, o tomar de bases de datos o aproximar por medio de modelos simplificados. De manera opcional, se puede incluir el efecto de una habitación con las características de altavoz (cuando los datos se miden en una habitación, este es automáticamente el caso). Con base en las tres entradas anteriores (posicionamiento de oyente 152, posicionamiento de altavoz 154, y características de altavoz 156 (características de radiación de altavoz)), se derivan las modificaciones para las señales de entrada (señal de audio 130).
[0020] En una realización, el conjunto de uno o más parámetros (120, 122) define un filtro limitador. El conjunto de uno o más parámetros (120, 122) se puede alimentar a un modelo para derivar la señal de altavoz (164, 166) por una corrección deseada de la señal de audio 130. El tipo de modificación (o corrección) puede ser, por ejemplo, una compensación absoluta o una compensación relativa. En la compensación absoluta, la función de transferencia, entre el posicionamiento de altavoz 154 y el posicionamiento de oyente 152 se compensa, por ejemplo, por altavoz con relación a una función de transferencia de referencia que puede ser, por ejemplo, la función de transferencia desde un altavoz respectivo hasta una posición de oyente en su eje de altavoz en una cierta distancia (por ejemplo, la dirección sobre el eje definida como igualmente distante desde todos los altavoces). Esto es, cualquiera que sea la posición de oyente 172 que se escoja - dentro de una cierta región de posicionamiento permitida - por el posicionamiento de oyente 152, la función de transferencia efectiva evocará, por ejemplo, la misma o casi la misma percepción de audio para el oyente, como sería la función de transferencia de referencia en la posición de oyente ideal 174. En otras palabras, el primer modificador 140 y el segundo modificador 142 pre-forman espectralmente la señal de audio 130 entrante utilizando una función de transferencia respectiva que se establece dependiendo de, respectivamente, el conjunto de uno o más parámetros 120 y 122, respectivamente, y los últimos parámetros se ajustan por el procesador de audio 100 para ajustar el pre-formado espectral para compensar la desviación de altavoz respectiva de su función de transferencia a su posición de oyente 172 de su función de transferencia de referencia. Por ejemplo, el procesador de audio 100 puede llevar a cabo el ajuste de los parámetros 120 y 122 por separado dependiendo de un ángulo absoluto en el cual reside la posición de oyente 172 con relación al eje de altavoz respectivo, es decir, parámetros 120 dependiendo del ángulo absoluto 161a del primer altavoz 112 y el segundo conjunto 122 de uno o más parámetros dependiendo del ángulo absoluto 161b del segundo altavoz 114. El ajuste se puede llevar a cabo por medio de búsqueda en tablas utilizando el ángulo absoluto respectivo o analíticamente. En la compensación relativa, por ejemplo, se compensan las diferencias entre las funciones de transferencia de diferentes altavoces a una posición de oyente 172 actual, o las diferencias de las funciones de transferencia entre diferentes altavoces y las orejas izquierda y derecha del oyente. La Figura 1, por ejemplo, ilustra un posicionamiento simétrico de altavoces 112 y 114, donde la salida de audio 160 del primer altavoz 112 y la salida de audio 162 del segundo altavoz 114 no tienen, por ejemplo, diferencia de función de transferencia en la posición de oyente simétricamente entre el altavoz 112 y 114 tal como la posición 174. Esto es, en estas posiciones, la función de transferencia desde el altavoz 112 a la posición respectiva es igual a la función de transferencia desde el altavoz 114 a la posición respectiva. Sin embargo, surge una diferencia de función de transferencia para cualquier posición de oyente 172 ubicada desfasada del eje de simetría. En la compensación relativa, por ejemplo, el modificador para un altavoz (por ejemplo, cualquiera del primer altavoz 112 o el segundo altavoz 114) del conjunto 110 de altavoces compensa la diferencia de la función de transferencia de un altavoz a la posición de oyente 172 con relación a la función de transferencia del(los) otro(s) altavoz(ces) a la posición de oyente 172. Por lo tanto, según la compensación relativa, el procesador de audio 100 ajusta los conjuntos de parámetros 120/122 de una manera que para al menos un altavoz, la señal de audio se pre-forme espectralmente de una manera que su función de transferencia efectiva a la posición de oyente 172 se acerque a la otra función de transferencia de altavoz. El ajuste se puede hacer, por ejemplo, utilizando una diferencia entre los ángulos absolutos en los cuales reside la posición de oyente con relación a los altavoces 112 y 114. La diferencia se puede utilizar para búsqueda en tablas del conjunto de parámetros 120 y/o 122, o como un parámetro para calcular analíticamente el conjunto 120/122. Por lo tanto, la salida de audio 160 del primer altavoz 112 se modifica, por ejemplo, con respecto a la salida de audio 162 del segundo altavoz 114 de tal manera que el oyente 170 perciba en la posición de oyente 172 la misma o casi la misma percepción de audio que alguna posición correspondiente a lo largo del eje de simetría antes mencionado (por ejemplo, la posición de oyente ideal). Naturalmente, la compensación relativa no se limita a disposiciones de altavoz simétricas.
[0021] Por lo tanto, la generación del conjunto de uno o más parámetros por medio del procesador de audio 100 tiene el efecto, de que la señal de audio 130 es modificada por el primer modificador 140 y el segundo modificador 142 de tal manera que la salida de audio 160 del primer altavoz 112 y la salida de audio 162 del segundo altavoz 114 den al oyente 170 en su posición de oyente 172 completamente (al menos parcialmente) la misma percepción de sonido que si el oyente 170 estuviera ubicado en la posición de oyente ideal 174. Según esta realización, el oyente 170 no tiene que estar en la posición de oyente ideal 174 para recibir una salida de audio, que genere una imagen auditiva para el oyente 170 que se asemeje a la percepción en la posición de oyente ideal 174. Así, por ejemplo, la percepción auditiva del oyente 170 no cambia o difícilmente lo hace con un cambio de la posición de oyente 172, solamente cambia la señal eléctrica, por ejemplo, la primera señal de altavoz 164 y/o la segunda señal de altavoz 166. La imagen auditiva percibida por el oyente en cada posición de oyente 172 es similar a la imagen auditiva original como se pretende por el productor de la señal de audio 130. Por lo tanto, la presente invención optimiza la percepción del oyente 170 de la señal de audio de salida del conjunto 110 de altavoces en diferentes posiciones de oyente 172. Esto tiene la consecuencia de que el oyente 170 puede tomar diferentes posiciones en la misma habitación que el conjunto 110 de altavoces y percibir casi la misma calidad de la señal de audio de salida.
[0022] En una realización, para cada altavoz del conjunto 110 de altavoces, el conjunto de uno o más parámetros determina la derivación de la señal de altavoz, de la señal de audio entrante 130. Por ejemplo, la primera señal de altavoz 164 y/o la segunda señal de altavoz 166 por reproducir se deriva al modificar la señal de audio 130 por modificación de retraso, modificación de amplitud y/o un filtrado espectral. La modificación de la señal de audio 130 se puede lograr, por ejemplo, por el primer modificador 140 y el segundo modificador 142. Es posible, por ejemplo, que solamente un modificador lleve a cabo la modificación de la señal de audio 130 para el conjunto 110 de altavoces o que más de dos modificadores lleven a cabo la modificación. Si está presente más de un modificador, los modificadores podrían, por ejemplo, intercambiar datos entre sí y/o un modificador es la base y los otros modificadores (al menos un modificador adicional) llevan a cabo la modificación con relación a la modificación de la base (por ejemplo, por resta, suma, multiplicación y/o división). El primer modificador 140 no necesariamente tiene que utilizar la misma modificación que el segundo modificador 142. Para diferente posicionamiento de oyente 152, posicionamiento de altavoz 154 y/o características de radiación de altavoz 156, la modificación de la señal de audio 130 puede diferir.
[0023] Como se describe más adelante, la respuesta de frecuencia del altavoz hacia la dirección de la posición de oyente 172 se toma en cuenta para procesos de renderización. La respuesta de frecuencia del altavoz hacia la posición de oyente 172 se ecualiza, por ejemplo, para coincidir con la respuesta de frecuencia del altavoz que sería en la posición de escucha ideal 174. Para altavoces convencionales con transductores que apuntan hacia delante, está ecualización sería relativa a la respuesta sobre el eje (cero grados hacia delante) del primer altavoz 112 y/o el segundo altavoz 114. Para otros sistemas (por ejemplo altavoces incorporados en televisores, que apuntan hacia los lados), esta ecualización sería relativa a la respuesta de frecuencia como medida en la posición de escucha ideal 174. Esta ecualización de la respuesta de frecuencia se puede lograr, por ejemplo, por medio de filtrado espectral.
[0024] Por completitud, se debe mencionar que la característica de frecuencia en el lugar óptimo (por ejemplo, en la posición de oyente ideal 174) no tiene que ser la característica de fábrica por defecto de los altavoces (el primer altavoz 112 y el segundo altavoz 114) del conjunto 110 de altavoces, pero ya puede ser una versión ecualizada (p. ej., ecualización específica para la habitación de reproducción actual). Esto es, los altavoces 112 y 114 pueden tener, internamente, ecualizadores integrados, por ejemplo.
[0025] Puede ser favorable corregir solo parcialmente la respuesta de frecuencia de altavoz, por ejemplo, si la respuesta de frecuencia hacia la posición de oyente 172 es de 6 dB menor que sobre el eje, uno puede decidir si no se corrigen todos de los 6 dB, sino solamente parte de los mismos, por ejemplo, 3 dB (denotado como corrección parcial en lo sucesivo). La modificación por medio del primer modificador 140 y el segundo modificador 142 se basa en el conjunto de uno o más parámetros que son generados por el procesador de audio 100. El primer modificador obtiene un primer conjunto de uno o más parámetros 120 y el segundo modificador 142 obtiene el segundo conjunto de uno o más parámetros 122 del procesador de audio 100. El primer conjunto de uno o más parámetros 120 y/o el segundo conjunto de uno o más parámetros 122 definen cómo se debe modificar, por ejemplo, la señal de audio 130 por modificación de retraso, modificación de amplitud y/o un filtrado espectral. El cálculo del conjunto de uno o más parámetros por medio del procesador de audio se basa en la información entrante 150 que puede ser, por ejemplo un posicionamiento de oyente 152, el posicionamiento de altavoz 154, las características de radiación de altavoz 156, adicionalmente también puede ser la acústica de la habitación en la cual está instalado el conjunto 110 de altavoces.
[0026] Por lo tanto, el primer modificador 140 y el segundo modificador 142 son capaces de modificar la señal de audio 130 de tal manera que la señal de audio de salida por medio del primer altavoz 112 y el segundo altavoz 114 se optimice con base en la información entrante 150.
[0027] El procesador de audio 100 está configurado para llevar a cabo la generación del conjunto de uno o más parámetros para el conjunto 110 de altavoces, por ejemplo para modificar las señales de entrada de tal manera que, por ejemplo, las respuestas de frecuencia del conjunto 110 de altavoces se ajusten para compensar las variaciones de respuesta de frecuencia debido a diferentes ángulos en los cuales emiten sonido los diferentes altavoces hacia la posición de oyente 172. Además de la respuesta de frecuencia del altavoz en el ángulo hacia la posición de oyente 172, la respuesta de frecuencia en la cual el sonido alcanza el oyente 170 también depende de la acústica de la habitación. Dos soluciones pueden tratar esta complejidad adicional. Una primera solución puede ser, por ejemplo, la corrección parcial mencionada anteriormente, ya que la respuesta de frecuencia en un oyente sólo se determina parcialmente en el altavoz. Por lo tanto, una corrección parcial tiene sentido. Una segunda solución puede ser, por ejemplo, una corrección por medio del primer modificador 140 y/o el segundo modificador 142 que no solamente considera las respuestas de frecuencia de altavoz (características de radiación de altavoz 156) sino también las respuestas de la habitación. El procesador de audio 100 también se puede configurar, por ejemplo, para llevar a cabo la generación del conjunto de uno o más parámetros para el conjunto 110 de altavoces de tal manera que se ajuste en los niveles para compensar las diferencias de nivel debido a las diferencias de distancia entre los diferentes altavoces y las posiciones de oyente 172. El procesador de audio 100 también está configurado, por ejemplo, para llevar a cabo la generación del conjunto de uno o más parámetros para el conjunto de altavoces de tal manera que se ajusten los retrasos para compensar las diferencias de retraso debido a las diferencias de distancia entre los diferentes altavoces y la posición de oyente 172 y/o para llevar a cabo la generación del conjunto de uno o más parámetros para el conjunto de altavoces de tal manera que se aplique un reposicionamiento de elementos en la mezcla de sonido para reproducir una imagen de sonido en un posicionamiento deseado. La renderización de la imagen de sonido se puede lograr fácilmente con representaciones de audio basadas en objetos del estado de la técnica (para representaciones de versiones anteriores (basadas en canal), se tienen que aplicar procedimientos de descomposición de señal). Por lo tanto, con la presente invención no solamente es posible optimizar la sensación de escucha para el oyente 170 en cada posición, sino también es posible reorganizar la imagen de sonido de tal forma que, por ejemplo, se puedan percibir instrumentos individuales desde diferentes direcciones.
[0028] En una realización, el procesador de audio 100 también puede estar configurado, por ejemplo, de tal manera que el conjunto de uno o más parámetros para dicho al menos un altavoz (por ejemplo, el primer altavoz 112 y el segundo altavoz 114) se ajusten de tal manera que la señal de altavoz (por ejemplo, la primera señal de altavoz 164 y/o la segunda señal de altavoz 166) de dicho al menos un altavoz se derive de la señal de audio 130 para que se reproduzca por medio de filtrado espectral con una función de transferencia que compense una desviación de una respuesta de frecuencia de una característica de emisión (características de radiación de altavoz 156) de dicho al menos un altavoz a una dirección que apunta desde la posición de altavoz de dicho al menos un altavoz a la posición de oyente 172 de la respuesta de frecuencia de la característica de emisión (características de radiación de altavoz 156) de dicho al menos un altavoz a una dirección predeterminada. Por lo tanto, el procesador de audio 100 utiliza la información entrante 150 de las características de radiación de altavoz 156 para generar un primer conjunto de uno o más parámetros 120 y/o un segundo conjunto de uno o más parámetros 122. Esto puede significar, por ejemplo, que el posicionamiento de oyente 152 y el posicionamiento de altavoz 154 son tales que las características de radiación de altavoz 156 muestran una respuesta de frecuencia donde, por ejemplo, las altas frecuencias tienen un nivel más bajo del que tendrían en la posición de escucha ideal 174. En este caso, el procesador de audio puede generar a partir de esta información entrante 150 un primer conjunto de uno o más parámetros 120 y un segundo conjunto de uno o más parámetros 122 con los cuales, por ejemplo, el primer modificador 140 y/o el segundo modificador 142 pueden modificar la señal de audio 130 con una función de transferencia que compensa una desviación de una respuesta de frecuencia. Por lo tanto, la función de transferencia se puede definir, por ejemplo, por una modificación de nivel, donde el nivel de las frecuencias altas se ajusta al nivel de las frecuencias altas en la posición de oyente 172 óptima. Por lo tanto, el oyente 170 recibe una señal de audio de salida optimizada. Las características de altavoz (características de radiación de altavoz 156) pueden ser respuestas de frecuencia en diferentes direcciones o patrones de directividad de altavoz, por ejemplo. Esos se pueden proporcionar o aproximar por medio de un modelo, medir, tomar de bases de datos proporcionados por un hardware, nube o red o se pueden calcular analíticamente. La información entrante 150, como las características de radiación de altavoz 156, se puede transferir al procesador de audio a través de una conexión o inalámbricamente. De manera óptima, se puede incluir el efecto de una habitación con las características de altavoz (cuando los datos se miden en una habitación, este es automáticamente el caso). Por ejemplo, no es necesario tener las características de radiación de altavoz 156 exactas, en su lugar también son suficientes aproximaciones parametrizadas.
[0029] El procesador de audio 100 también necesita saber la posición del oyente (posicionamiento de oyente 152).
[0030] En una realización, el posicionamiento de oyente 152 define una posición horizontal del oyente. Esto significa, por ejemplo, que el oyente 170 está recostado mientras escucha la salida de audio. La salida de audio tiene que ser modificada de manera diferente por medio de, por ejemplo, el primer modificador 140 y el segundo modificador 142, cuando el oyente 170 está en una posición horizontal en lugar de una posición vertical, o si el oyente 170 cambia la posición de escucha 172 en una dirección horizontal en lugar de una dirección vertical. La posición horizontal 172 cambia, por ejemplo, si el oyente 170 camina desde un lado de una habitación, con el conjunto 110 de altavoces, al otro lado. También es posible, por ejemplo, que esté presente más de un oyente 170 en la habitación. Por lo tanto, por ejemplo, si están presentes dos oyentes 170 en la habitación, ellos tienen diferentes posiciones horizontales pero no necesariamente diferentes posiciones verticales (por ejemplo, cuando ambos oyentes 170 tienen casi la misma altura). Por lo tanto, si el posicionamiento de oyente 152 define una posición horizontal de oyente, el posicionamiento de oyente 152 se simplifica, por ejemplo, y la primera señal de altavoz 164 y/o la segunda señal de altavoz 166 para optimizar una imagen de audio del oyente 170 se pueden calcular muy rápido por medio de, por ejemplo, el primer modificador 140 y el segundo modificador 142.
[0031] En otra realización, la posición de oyente 172 (posicionamiento de oyente 152) define la posición de cabeza de un oyente 170 en tres dimensiones. Con esta definición del posicionamiento de oyente 152, se define con precisión la posición 172 del oyente 170. El procesador de audio siempre sabe, por ejemplo, a dónde se debe dirigir la salida de audio óptima. El oyente 170 puede cambiar, por ejemplo, su posición de oyente 172 en una dirección horizontal y vertical al mismo tiempo. Por lo tanto, con una posición de oyente definida en tres dimensiones, por ejemplo, no solamente se hace seguimiento de una posición horizontal, sino también de una posición vertical. Puede ocurrir un cambio en la posición vertical de un oyente 170, cuando el oyente 170, por ejemplo, cambia de una posición de pie a una posición sentada o posición recostada. La posición vertical de diferentes oyentes 170 también puede depender de su altura, por ejemplo, un niño tiene una altura mucho más pequeña que un oyente adulto. Por lo tanto, con una posición de oyente 172 tridimensional, se optimiza una imagen de audio producida por los altavoces 112 y 114 para el oyente 170.
[0032] En otra realización, la posición de oyente 172 define la posición de cabeza y orientación de cabeza de un oyente. Para mejorar el desempeño del procesamiento para escenarios de casos de uso específicos, adicionalmente se puede utilizar la orientación (“mirar directamente”) del oyente para tomar en cuenta cambios en la respuesta de frecuencia debido a las HRTFs/BRIRs cuando la cabeza del oyente gira.
[0033] También se puede hacer seguimiento de la posición de oyente 172, por ejemplo, en tiempo real. En una realización, el procesador de audio puede estar configurado, por ejemplo, para recibir la posición de oyente 172 en tiempo real, y ajustar el retraso, nivel y respuestas de frecuencia en tiempo real. Con esta implementación, el oyente no tiene que estar estático en la habitación, en su lugar, puede caminar y escuchar en cada una de las posiciones una salida de audio optimizada como si el oyente 170 estuviera en la posición de escucha ideal 174.
[0034] En otra realización según la presente invención, el procesador de audio 100 soporta múltiples posiciones predefinidas (posicionamiento de oyente 152), donde el procesador de audio 100 está configurado para llevar a cabo la generación del conjunto de uno o más parámetros para el conjunto 110 de altavoces por medio del cálculo previo del conjunto de uno o más parámetros para el conjunto 110 de altavoces para cada una de las múltiples posiciones predefinidas (posicionamiento de oyente 152). Por lo tanto, por ejemplo, se pueden predefinir múltiples posiciones de oyente 172 diferentes y el oyente puede seleccionar entre ellas dependiendo de dónde está actualmente el oyente 170. La posición de oyente 172 (posicionamiento de oyente 152) también se puede leer una vez como un parámetro o medición. Las posiciones predefinidas mejoran el desempeño para oyentes estáticos que no están posicionados en el lugar óptimo (posición de oyente óptima/ideal 174).
[0035] En otra realización según la presente invención, el posicionamiento de oyente 152 comprende o define los datos de posición de dos o más oyentes 170 o define más de una posición de oyente 172 con respecto a la cual se llevará a cabo la compensación. El procesador de audio, en tal caso, calcula, por ejemplo, una reproducción promedio (mejor esfuerzo) para todas de tales posiciones de oyente 172. Este es el caso, por ejemplo, cuando hay más de un oyente 170 en la habitación del conjunto 110 de altavoces, o el oyente 170 tendrá la oportunidad de moverse en un área a través de la cual se distribuyen las posiciones de oyente 172. Por lo tanto, la modificación de la señal de audio 130 se haría con el propósito de lograr la experiencia auditiva casi óptima en varias posiciones 172 o un área dentro de la cual se distribuyen tales posiciones. Esto se logra, por ejemplo, mediante la optimización de los conjuntos 120/122 según alguna función de coste promedio que promedia las diferencias de función de transferencia mencionadas anteriormente a través de las diferentes posiciones de oyente 172.
[0036] En otra realización, el procesador de audio 100 está configurado para recibir la información entrante 150 (por ejemplo, el posicionamiento de oyente 152) desde un sensor configurado para adquirir el posicionamiento de oyente 152 (opcionalmente la orientación) por medio de una cámara (por ejemplo, un vídeo), un girómetro, un acelerómetro, sensores acústicos, etc., y/o una combinación de los anteriores. Con la implementación de este sensor, se simplifica el uso del sistema de audio para el oyente 170. El oyente 170 no necesita hacer ningún ajuste al sistema de audio para escuchar en su posición de oyente 172 con al menos parcialmente la misma calidad que si el oyente estuviera en la posición de escucha ideal 174. El procesador de audio 100, por ejemplo, siempre (o al menos en algunos puntos de tiempo) obtiene la información entrante 150 necesaria desde un sensor y por lo tanto puede generar, con base en la información entrante, el conjunto de uno o más parámetros.
[0037] En una realización, el conjunto de uno o más parámetros, generados por el procesador de audio 100, define un filtro limitador. El uso de filtros limitadores (o un número reducido de EQs pico) es una implementación de baja complejidad del sistema para aproximar la ecualización exacta que se necesitaría. También es posible utilizar retrasos fraccionales. Los filtros limitadores y/o filtros de retraso fraccional se pueden implementar, por ejemplo, en el primer modificador 140 y/o el segundo modificador 142.
[0038] Otra realización es un sistema que comprende el procesador de audio 100, el conjunto 110 de altavoces y para cada conjunto 110 de altavoces (por ejemplo, para el primer altavoz 112 y/o el segundo altavoz 114), un modificador de señal (por ejemplo, el primer modificador de señal 140 y/o el segundo modificador de señal 142) para derivar la señal de altavoz (por ejemplo, la primera señal de altavoz 164 y/o la segunda señal de altavoz 166) para que se reproduzca por el altavoz respectivo a partir de una señal de audio 130 utilizando un conjunto de uno o más parámetros (por ejemplo, el primer conjunto de uno o más parámetros 120 y/o el segundo conjunto de uno o más parámetros 122) generados para los altavoces respectivos por el procesador de audio 100. Todo el sistema trabaja conjuntamente para optimizar la percepción de escucha del oyente 170.
[0039] En otra realización, el conjunto 110 de altavoces comprende una configuración de altavoz 3D, una configuración de altavoz de versiones anteriores (solamente horizontal), una configuración de altavoz envolvente, altavoces incorporados en dispositivos o alojamientos específicos (p. ej., portátiles, monitores de ordenador, estaciones de conexión, altavoces inteligentes, televisores, proyectores, reproductores portátiles, etc.), un conjunto de altavoces y/o conjuntos de altavoces específicos conocidos como barras de sonido. También es posible, por ejemplo, utilizar altavoces virtuales (por ejemplo, si las reflexiones se utilizan para generar posiciones de altavoces virtuales). Además, los altavoces individuales, el primer altavoz 112 y el segundo altavoz 114, en el conjunto 110 de altavoces son representativos de diseños alternativos como conjuntos de altavoces o altavoces multidireccionales. En la Figura 1, el primer altavoz 112 y el segundo altavoz 114 se muestran como un ejemplo para el conjunto 110 de altavoces, pero también es posible, que solamente esté presente un altavoz en el conjunto 110 de altavoces, o que estén presentes más de dos altavoces, como 3, 4, 5, 6, 10, 20 o incluso más en el conjunto 110 de altavoces. Por lo tanto, el sistema de audio con el procesador de audio 100 es compatible para diferentes configuraciones de altavoces. El procesador de audio 100 es flexible para generar el conjunto de uno o más parámetros para diferente información entrante 150.
[0040] En otra realización, el conjunto de uno o más parámetros para el conjunto 110 de altavoces se puede calcular con base en una respuesta de frecuencia de una característica de emisión (características de radiación de altavoz 156) de cada uno del conjunto 110 de altavoces para una dirección de emisión predeterminada para derivar un estado preliminar del conjunto de uno o más parámetros para el conjunto 110 de altavoces y el conjunto de uno o más parámetros para dicho al menos un altavoz (por ejemplo, el primer altavoz 112 y/o el segundo altavoz 114) se puede modificar de tal manera que la señal de altavoz (por ejemplo, la primera señal de altavoz 164 y/o la segunda señal de altavoz 166) de dicho al menos un altavoz (por ejemplo, el primer altavoz 112 y/o el segundo altavoz 114) se derive de la señal de audio 130 para ser reproducida por, además de una modificación provocada por el estado preliminar, filtrado espectral con una función de transferencia que compensa una desviación de una respuesta de frecuencia de la característica de emisión (características de radiación de altavoz 156) de dicho al menos un altavoz (por ejemplo, el primer altavoz 112 y/o el segundo altavoz 114) a una dirección que apunta desde la posición de altavoz 154 de dicho al menos un altavoz al posicionamiento de oyente 152 a partir de una respuesta de frecuencia de la característica de emisión de dicho al menos un altavoz a una dirección de emisión predeterminada.
[0041] La Figura 2 muestra una vista esquemática de un procesador de audio 200 según una realización de la presente invención.
[0042] La Figura 2 muestra una implementación básica del procesamiento de audio propuesto. El procesador de audio 200 recibe una entrada de audio 210. La entrada de audio 210 puede ser, por ejemplo, uno o más canales de audio. El procesador de audio 200 procesa la entrada de audio y proporciona la entrada de audio como una salida de audio 220. El procesamiento del procesador de audio 200 se determina por el posicionamiento de oyente 230 y características de altavoz (por ejemplo, el posicionamiento de altavoz 240 y las características de radiación de altavoz 250). Según esta realización, el procesador de audio 200 recibe, como información entrante, el posicionamiento de oyente 230, el posicionamiento de altavoz 240 y las características de radiación de altavoz 250 y basa el procesamiento de la entrada de audio 210 en esta información para obtener la salida de audio 220. En el procesamiento, el procesador de audio 200, por ejemplo, genera un conjunto de uno o más parámetros y modifica la entrada de audio 210 con este conjunto de uno o más parámetros para generar una nueva salida de audio 220 optimizada.
[0043] Por lo tanto, el procesador de audio 200 optimiza la entrada de audio 210 con base en el posicionamiento de oyente 230, el posicionamiento de altavoz 240 y las características de radiación de altavoz 250.
[0044] La Figura 3 muestra un diagrama de la respuesta de frecuencia del altavoz. La Figura 3 muestra en la abscisa la frecuencia en kHz y en la ordenada la ganancia dB. La Figura 3 muestra un ejemplo de respuestas de frecuencia de un altavoz en diferentes direcciones (con relación a la dirección hacia delante sobre el eje). Mientras más se desvía la dirección del eje, más se atenúan las frecuencias altas. Las respuestas de frecuencia se muestran para diferentes ángulos.
[0045] La Figura 4 muestra que sin el procesamiento propuesto, la calidad de reproducción de audio varía mucho con el cambio de posición de un oyente, por ejemplo, cuando el oyente se está moviendo. La imagen auditiva espacial evocada es inestable para los cambios de la posición de escucha desde el lugar óptimo. La imagen estereofónica se colapsa en el altavoz más cercano. La Figura 4 ejemplifica este colapso utilizando el ejemplo de una sola fuente fantasma (disco gris) que se reproduce utilizando una configuración de reproducción estereofónica estándar de dos canales. Cuando el oyente se mueve hacia la derecha, la imagen espacial se colapsa y el sonido se percibe como viniendo principalmente/solamente desde el altavoz derecho. Esto no es deseable. Con la presente invención (descrita en esta invención), se puede hacer seguimiento de la posición del oyente y por lo tanto, por ejemplo, se puede ajustar la ganancia y retraso para compensar las desviaciones de la posición de escucha óptima.
En consecuencia, se puede observar que la presente invención supera claramente las soluciones convencionales.
[0046] Aunque algunos aspectos se han descrito en el contexto de un aparato, es claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloqueo o dispositivo corresponde a una etapa de procedimiento o una característica de una etapa de procedimiento. Análogamente, los aspectos descritos en el contexto de una etapa de procedimiento también representan una descripción de un bloque o artículo o característica correspondiente de un aparato correspondiente. Algunas o todas las etapas de procedimiento se pueden ejecutar por medio de (o utilizando) un aparato de hardware como, por ejemplo, un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una o más de las etapas de procedimiento más importantes se pueden ejecutar por medio de tal aparato.
[0047] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo, un disco flexible (floppy), un DVD, un Blu-ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tenga señales de control legibles electrónicamente almacenadas en el mismo, que cooperen (o sean capaces de cooperar) con un sistema informático programable de tal manera que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0048] Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, las cuales son capaces de cooperar con un sistema informático programable, de tal manera que se lleve a cabo uno de los procedimientos descritos en esta invención.
[0049] Generalmente, las realizaciones de la presente invención se pueden implementar como un producto de programa informático con un código de programa, siendo el código de programa operativo para llevar a cabo uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa se puede almacenar, por ejemplo, en un soporte legible por máquina.
[0050] Otras realizaciones comprenden el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.
[0051] En otras palabras, una realización del procedimiento inventivo es por lo tanto un programa informático que tiene un código de programa para llevar a cabo uno de los procedimientos descritos en esta invención, cuando el programa informático se ejecuta en un ordenador.
[0052] Una realización adicional de los procedimientos inventivos es por lo tanto un soporte de datos (o un medio de almacenamiento digital o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital, o el medio grabado son generalmente tangibles, y/o no transitorios.
[0053] Una realización adicional del procedimiento inventivo es por lo tanto un flujo de datos o una secuencia de señales que representa el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales puede configurarse, por ejemplo, para transmitirse a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0054] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en esta invención.
[0055] Una realización adicional comprende un ordenador que tiene instalado en sí el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención.
[0056] Una realización adicional según la invención comprende un aparato o sistema configurado para transferir (por ejemplo, electrónicamente u ópticamente) un programa informático para llevar a cabo uno de los procedimientos descritos en esta invención a un receptor. El receptor puede ser, ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir el programa informático al receptor.
[0057] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de compuertas programable en campo) para llevar a cabo algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de compuertas programables en campo puede cooperar con un microprocesador con el fin de llevar a cabo uno de los procedimientos descritos en esta invención. Generalmente, los procedimientos se llevan a cabo preferiblemente por medio de cualquier aparato de hardware.
[0058] El aparato descrito en esta invención se puede implementar utilizando un aparato de hardware, o utilizando un ordenador, o utilizando una combinación de un aparato de hardware y un ordenador.
[0059] El aparato descrito en esta invención, o cualquiera de los componentes del aparato descrito en esta invención se pueden implementar, al menos parcialmente, en hardware y/o en software.
[0060] Los procedimientos descritos en esta invención se pueden llevar a cabo utilizando un aparato de hardware, o utilizando un ordenador, o utilizando una combinación de un aparato de hardware y un ordenador.
[0061] Los procedimientos descritos en esta invención o cualquiera de los componentes del aparato descrito en esta invención se pueden llevar a cabo, al menos parcialmente, por medio de hardware y/o por medio de software.
[0062] Las realizaciones descritas anteriormente son solamente ilustrativas para los principios de la presente invención. Se entiende que modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención serán aparentes para otros expertos en la materia. Por lo tanto, la intención es estar limitados solamente por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en esta invención.
Referencias
[1] “Adaptively Adjusting the Stereophonic Sweet Spot to the Listener's Position”, (Ajuste Adaptativo del Lugar Óptimo Estereofónico a la Posición del Oyente), Sebastian Merchel y Stephan Groth, J. Audio Eng. Soc., Vol. 58, No.
10, octubre de 2010.
[2] https://www.princeton.edu/3D3A/PureStereo/Pure Stereo.html

Claims (15)

REIVINDICACIONES
1. Un procesador de audio (100, 200) configurado para generar, para cada conjunto (110) de uno o más altavoces (112, 114), un conjunto de uno o más parámetros (120, 122), los cuales determinan una derivación de una señal de altavoz (164, 166) para que se reproduzca por el altavoz (112, 114) respectivo a partir de una señal de audio (130, 210), con base en una posición de oyente (152, 172, 230) y posicionamiento de altavoz (154, 240) del conjunto (110) de uno o más altavoces (112, 114), donde el posicionamiento de altavoz (154, 240) define la posición y orientación de los altavoces (112, 114);
donde el procesador de audio (100, 200) está configurado para basar la generación del conjunto de uno o más parámetros (120, 122) para el altavoz (112, 114) respectivo del conjunto (110) de uno o más altavoces (112, 114) en una característica de altavoz (156, 250) de, al menos, uno del conjunto (110) de uno o más altavoces (112, 114), donde la característica de altavoz (156, 250) representa una respuesta de frecuencia dependiente del ángulo de emisión de una característica de emisión de, al menos, uno del conjunto de uno o más altavoces, y donde el procesador de audio (100, 200) está configurado para establecer cada conjunto de uno o más parámetros (120, 122) por separado dependiendo de un ángulo en el cual reside la posición de oyente (152, 172, 230) con respecto a una dirección hacia delante sobre el eje del altavoz respectivo (112, 114) del conjunto (110) de uno o más altavoces (112, 114),
en el que el procesador de audio (100, 200) está configurado de manera que el conjunto de uno o más parámetros (120, 122) para el respectivo altavoz (110, 112, 114) se ajusta para que la señal del altavoz (164, 166) del altavoz respectivo (112, 114) se derive de la señal de audio (130, 210) para ser reproducida por filtrado espectral con una función de transferencia que compensa una desviación de una respuesta de frecuencia de una característica de emisión (156, 250) del altavoz respectivo (110, 112, 114) en una dirección que apunta desde la posición del altavoz (154, 240) del respectivo altavoz (110, 112, 114) a la posición del oyente (152, 172, 230) desde la respuesta de frecuencia de la característica de emisión (156, 250) del respectivo altavoz (110, 112, 114) en la dirección hacia delante sobre el eje.
2. Un procesador de audio (100, 200) según la reivindicación 1, en el que, para cada conjunto (110) de uno o más altavoces (112, 114), el conjunto de uno o más parámetros (120, 122) determina la derivación de la señal de altavoz (164, 166) que se reproducirá al modificar la señal de audio (130, 210) por modificación de retraso, modificación de amplitud, y/o un filtrado espectral.
3. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 2, en el que el procesador de audio (100, 200) está configurado para llevar a cabo la generación del conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114), para modificar la señal de altavoz (164, 166), de tal manera que se ajusten las respuestas de frecuencia para compensar las variaciones de respuesta de frecuencia debido a diferentes ángulos en los cuales los diferentes altavoces (112, 114) emiten sonido (160, 162, 220) hacia la posición de oyente (152, 172, 230).
4. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 3, en el que el procesador de audio (100, 200) está configurado, además, para llevar a cabo la generación del conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114), de tal manera que se ajusten los niveles para compensar las diferencias de nivel debido a las diferencias de distancia entre los diferentes altavoces (112, 114) y la posición de oyente (152, 172, 230), para llevar a cabo la generación del conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114), de tal manera que se ajusten los retrasos para compensar las diferencias de retraso debido a las diferencias de distancia entre los diferentes altavoces (112, 114) y la posición de oyente (152, 172, 230), y/o para llevar a cabo la generación del conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114) de tal manera que se aplique un reposicionamiento de elementos en la mezcla de sonido para renderizar una imagen de sonido en un posicionamiento deseado.
5. Un procesador de audio (100, 200) según la reivindicación 1 o la reivindicación 4, en el que la posición del oyente (152, 172, 230) define la posición horizontal del oyente; y/o
la posición de la cabeza de un oyente en tres dimensiones; y/o
la posición y la orientación de la cabeza de un oyente.
6. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 5, configurado para recibir la posición del oyente (152, 172, 230) en tiempo real y ajustar las respuestas de retardo, nivel y frecuencia en tiempo real.
7. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 6, en el que el procesador de audio (100, 200) soporta múltiples posiciones de oyente predefinidas (152, 172, 230), en el que el procesador de audio (100, 200) está configurado para realizar la generación del conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114) precalculando el conjunto de uno o más parámetros (120, 122) para el conjunto (110) de uno o más altavoces (112, 114) para cada una de las múltiples posiciones de oyente predefinidas (152, 172, 230).
8. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 7, configurado para realizar la generación en base a un conjunto de más de una posición de oyente.
9. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 8, en el que el conjunto de uno o más parámetros (120, 122) define un filtro limitador.
10. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 9, configurado para realizar la generación
para cada altavoz por separado dependiendo de la posición del oyente en relación con el altavoz respectivo o dependiendo de las diferencias de una ubicación relativa de la posición del oyente con respecto a los altavoces.
11. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 10, en el que el conjunto (110) de uno o más altavoces (112, 114) comprende una configuración de altavoces 3D, una configuración de altavoces heredada, una matriz de altavoces, una barra de sonido y/o altavoces virtuales.
12. Un procesador de audio (100, 200) según una de las reivindicaciones 1 a 11, en las que las características del altavoz se miden o se toman de bases de datos o se aproximan mediante modelos simplificados.
13. Un sistema que comprende el procesador de audio (100, 200) según una de las reivindicaciones 1 a 12, el conjunto (110) de uno o más altavoces (112, 114) y, para cada conjunto (110) de uno o más altavoces (112, 114), un modificador de señal (140, 142) para derivar la señal de altavoz (164, 166) que va a ser reproducida por el altavoz respectivo (112, 114) de una señal de audio (130, 210), por medio de un conjunto de uno o más parámetros (120, 122) generados para el respectivo altavoz (112, 114) por el procesador de audio (100, 200).
14. Un procedimiento para operar un procesador de audio (100, 200), en el que
se genera un conjunto de uno o más parámetros (120, 122), para cada conjunto (110) de uno o más altavoces (112, 114), los cuales determinan una derivación de una señal de altavoz (164, 166) que se va a reproducir por un altavoz respectivo (112, 114) a partir de una señal de audio (130, 210), en función de una posición del oyente (152, 172, 230) y posicionamiento del altavoz (154, 240) del conjunto (110) de uno o más altavoces (112, 114), en el que el posicionamiento de los altavoces (154, 240) está definido por la posición y orientación de los altavoces (112, 114);
en el que el procesador de audio (100, 200) basa la generación del conjunto de uno o más parámetros (120, 122) del respectivo altavoz (112, 114) del conjunto (110) de uno o más altavoces (112, 114) en una característica de altavoz (156, 250) de al menos uno del conjunto (110) de uno o más altavoces (112, 114), en el que la característica de altavoz (156, 250) representa una respuesta de frecuencia dependiente del ángulo de emisión de una emisión característica de al menos uno del conjunto de uno o más altavoces, y
en el que el procesador de audio (100, 200) establece cada conjunto de uno o más parámetros (120, 122) por separado dependiendo de un ángulo en el que reside la posición del oyente (152, 172, 230) con respecto a una dirección hacia delante sobre el eje del altavoz respectivo (112, 114) del conjunto (110) de uno o más altavoces (112, 114),
en el que el conjunto de uno o más parámetros (120, 122) para el altavoz respectivo (110, 112, 114) se ajusta, de modo que la señal del altavoz (164, 166) del altavoz respectivo (112, 114) se derive de la señal de audio (130, 210) que se va a reproducir mediante filtrado espectral con una función de transferencia que compensa una desviación de una respuesta de frecuencia de una característica de emisión (156, 250) del respectivo altavoz (110, 112, 114) en una dirección que apunta desde la posición del altavoz (154, 240) del respectivo altavoz (110, 112, 114) a la posición del oyente (152, 172, 230) de la respuesta de frecuencia de la característica de emisión (156, 250) del respectivo altavoz (110, 112 , 114) en la dirección hacia delante sobre el eje.
15. Un programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un procedimiento según la reivindicación 14 utilizando un procesador de audio según la reivindicación 1.
ES18714682T 2017-05-03 2018-03-23 Procesador de audio, sistema, procedimiento y programa informático para renderización de audio Active ES2934801T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17169333 2017-05-03
PCT/EP2018/000114 WO2018202324A1 (en) 2017-05-03 2018-03-23 Audio processor, system, method and computer program for audio rendering

Publications (1)

Publication Number Publication Date
ES2934801T3 true ES2934801T3 (es) 2023-02-27

Family

ID=58709221

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18714682T Active ES2934801T3 (es) 2017-05-03 2018-03-23 Procesador de audio, sistema, procedimiento y programa informático para renderización de audio

Country Status (14)

Country Link
US (1) US11032646B2 (es)
EP (1) EP3619921B1 (es)
JP (1) JP7019723B2 (es)
KR (1) KR102320279B1 (es)
CN (1) CN110771182B (es)
BR (1) BR112019023170A2 (es)
CA (1) CA3061809C (es)
ES (1) ES2934801T3 (es)
FI (1) FI3619921T3 (es)
MX (1) MX2019013056A (es)
PL (1) PL3619921T3 (es)
PT (1) PT3619921T (es)
RU (1) RU2734231C1 (es)
WO (1) WO2018202324A1 (es)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020030303A1 (en) 2018-08-09 2020-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An audio processor and a method for providing loudspeaker signals
CN118102179A (zh) * 2019-07-30 2024-05-28 杜比实验室特许公司 音频处理方法和***及相关非暂时性介质
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
EP4005235A1 (en) 2019-07-30 2022-06-01 Dolby Laboratories Licensing Corporation Dynamics processing across devices with differing playback capabilities
WO2021021857A1 (en) 2019-07-30 2021-02-04 Dolby Laboratories Licensing Corporation Acoustic echo cancellation control for distributed audio devices
US11659332B2 (en) 2019-07-30 2023-05-23 Dolby Laboratories Licensing Corporation Estimating user location in a system including smart audio devices
WO2021021460A1 (en) 2019-07-30 2021-02-04 Dolby Laboratories Licensing Corporation Adaptable spatial audio playback
US11140509B2 (en) * 2019-08-27 2021-10-05 Daniel P. Anagnos Head-tracking methodology for headphones and headsets
TWI757763B (zh) * 2020-06-10 2022-03-11 宏碁股份有限公司 電子裝置及其雙聲道音場平衡方法
CN113923561A (zh) * 2020-07-08 2022-01-11 阿里巴巴集团控股有限公司 一种智能音箱音效调整方法和装置
CN114582356A (zh) * 2020-11-30 2022-06-03 华为技术有限公司 一种音频编解码方法和装置
US12003955B2 (en) 2020-12-01 2024-06-04 Samsung Electronics Co., Ltd. Display apparatus and control method thereof
WO2022119988A1 (en) * 2020-12-03 2022-06-09 Dolby Laboratories Licensing Corporation Frequency domain multiplexing of spatial audio for multiple listener sweet spots
US20240114308A1 (en) * 2020-12-03 2024-04-04 Dolby Laboratories Licensing Corporation Frequency domain multiplexing of spatial audio for multiple listener sweet spots
US20220345844A1 (en) * 2021-04-23 2022-10-27 Samsung Electronics Co., Ltd. Electronic apparatus for audio signal processing and operating method thereof
KR20220146165A (ko) * 2021-04-23 2022-11-01 삼성전자주식회사 오디오 신호 처리를 위한 전자 장치 및 그 동작 방법
US20240015459A1 (en) * 2022-07-07 2024-01-11 Harman International Industries, Incorporated Motion detection of speaker units
CN117651238B (zh) * 2024-01-30 2024-05-31 科大讯飞(苏州)科技有限公司 音频播放方法、音频补偿系数的确定方法和汽车

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0185021B1 (ko) 1996-11-20 1999-04-15 한국전기통신공사 다채널 음향시스템의 자동 조절장치 및 그 방법
US6798889B1 (en) * 1999-11-12 2004-09-28 Creative Technology Ltd. Method and apparatus for multi-channel sound system calibration
JP4264686B2 (ja) 2000-09-14 2009-05-20 ソニー株式会社 車載用音響再生装置
US20060088174A1 (en) 2004-10-26 2006-04-27 Deleeuw William C System and method for optimizing media center audio through microphones embedded in a remote control
TWI279782B (en) 2005-09-26 2007-04-21 Sunplus Technology Co Ltd Block code error correction system
CN101416235B (zh) * 2006-03-31 2012-05-30 皇家飞利浦电子股份有限公司 用于处理数据的设备和方法
US8483413B2 (en) * 2007-05-04 2013-07-09 Bose Corporation System and method for directionally radiating sound
US8477970B2 (en) * 2009-04-14 2013-07-02 Strubwerks Llc Systems, methods, and apparatus for controlling sounds in a three-dimensional listening environment
CA2941646C (en) * 2009-10-05 2019-09-10 Harman International Industries, Incorporated Multichannel audio system having audio channel compensation
KR101387195B1 (ko) 2009-10-05 2014-04-21 하만인터내셔날인더스트리스인코포레이티드 오디오 신호의 공간 추출 시스템
US9036841B2 (en) 2010-03-18 2015-05-19 Koninklijke Philips N.V. Speaker system and method of operation therefor
US20120148075A1 (en) * 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
CN104041081B (zh) * 2012-01-11 2017-05-17 索尼公司 声场控制装置、声场控制方法、程序、声场控制***和服务器
US10725726B2 (en) 2012-12-20 2020-07-28 Strubwerks, LLC Systems, methods, and apparatus for assigning three-dimensional spatial data to sounds and audio files
EP2830332A3 (en) * 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2930957B1 (en) * 2014-04-07 2021-02-17 Harman Becker Automotive Systems GmbH Sound wave field generation
JP2015206989A (ja) * 2014-04-23 2015-11-19 ソニー株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP7019723B2 (ja) 2022-02-15
CA3061809A1 (en) 2018-11-08
CN110771182B (zh) 2021-11-05
PL3619921T3 (pl) 2023-03-06
PT3619921T (pt) 2022-12-27
RU2734231C1 (ru) 2020-10-13
KR20200003159A (ko) 2020-01-08
EP3619921B1 (en) 2022-11-02
CA3061809C (en) 2022-05-03
CN110771182A (zh) 2020-02-07
EP3619921A1 (en) 2020-03-11
JP2020519175A (ja) 2020-06-25
WO2018202324A1 (en) 2018-11-08
BR112019023170A2 (pt) 2020-06-02
US11032646B2 (en) 2021-06-08
US20200059724A1 (en) 2020-02-20
FI3619921T3 (fi) 2023-02-22
KR102320279B1 (ko) 2021-11-03
MX2019013056A (es) 2020-02-07

Similar Documents

Publication Publication Date Title
ES2934801T3 (es) Procesador de audio, sistema, procedimiento y programa informático para renderización de audio
US9569073B2 (en) Method for outputting a modified audio signal and graphical user interfaces produced by an application program
RU2589377C2 (ru) Система и способ для воспроизведения звука
JP5499513B2 (ja) 音響処理装置、音像定位処理方法および音像定位処理プログラム
US20120213391A1 (en) Audio reproduction apparatus and audio reproduction method
US20200366990A1 (en) Multi-channel sound implementation device using open-ear headphones and method therefor
JP2013535894A5 (es)
JP2019033472A (ja) ソリッドな映画スクリーン上で音像を知覚する高さを調節すること
JP2008227804A (ja) アレイスピーカ装置
JP2013247477A (ja) 音響再生装置、音響再生方法
US9226091B2 (en) Acoustic surround immersion control system and method
US6990210B2 (en) System for headphone-like rear channel speaker and the method of the same
CN107852539B (zh) 耳机装置及控制耳机装置的方法
US7050596B2 (en) System and headphone-like rear channel speaker and the method of the same
US6983054B2 (en) Means for compensating rear sound effect
JP2008011099A (ja) ヘッドフォン音響再生システム、ヘッドフォン装置
KR101754307B1 (ko) 3차원 사운드 컨트롤 시스템 및 방법
KR101754306B1 (ko) 에어 파이프들을 이용한 3차원 사운드 출력 의자 및 방법
EP3726858A1 (en) Lower layer reproduction
KR20230154069A (ko) 헤드폰들의 세트
JP2020086143A (ja) 情報処理システム、情報処理方法、測定システム、及びプログラム