BR112013017070B1 - Sistema de áudio e método de operação para um sistema de áudio - Google Patents

Sistema de áudio e método de operação para um sistema de áudio Download PDF

Info

Publication number
BR112013017070B1
BR112013017070B1 BR112013017070-0A BR112013017070A BR112013017070B1 BR 112013017070 B1 BR112013017070 B1 BR 112013017070B1 BR 112013017070 A BR112013017070 A BR 112013017070A BR 112013017070 B1 BR112013017070 B1 BR 112013017070B1
Authority
BR
Brazil
Prior art keywords
transfer function
binaural
signal
acoustic environment
binaural transfer
Prior art date
Application number
BR112013017070-0A
Other languages
English (en)
Other versions
BR112013017070A2 (pt
Inventor
Arnoldus Werner Johannes Oomen
Dirk Jeroen Breebaart
Jeroen Gerardus Henricus Koppens
Erik Gosuinus Petrus Schuijers
Original Assignee
Koninklijke Philips N.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips N.V filed Critical Koninklijke Philips N.V
Publication of BR112013017070A2 publication Critical patent/BR112013017070A2/pt
Publication of BR112013017070B1 publication Critical patent/BR112013017070B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

SISTEMA DE ÁUDIO E MÉTODO DE OPERAÇÃO PARA UM SISTEMA DE ÁUDIO Um sistema de áudio compreende um receptor (301) para receber um sinal de áudio, como um objeto de áudio ou um sinal de um canal de um sinal de múltiplos canais espacial. Um circuito biauricular (303) gera um sinal de saída biauricular ao processar o sinal de áudio. O processamento é representativo de uma função de transferência biauricular que prove uma posição de origem de som virtual para o sinal de áudio. Um circuito de medição (307) que gera dados de medição indicativos de uma característica do ambiente acústico e um circuito de determinação (311) determina um parâmetro de ambiente acústico em resposta aos dados de medição. O parâmetro de ambiente acústico pode ser tipicamente um parâmetro de reverberação, como um tempo de reverberação. Um circuito de adaptação (313) adapta a função de transferência biauricular dinamicamente em resposta ao parâmetro de ambiente acústico. Por exemplo, a adaptação pode modificar um parâmetro de reverberação para se assemelhar mais proximamente às características de reverberação do ambiente acústico.

Description

CAMPO DA INVENÇÃO
A invenção se refere a um sistema de áudio e um 5 método de operação, portanto e em particular, à interpretação espacial virtual de sinais de áudio.
HISTÓRICO DA INVENÇÃO
A reprodução de som espacial além do estéreo simples se tornou um lugar comum de aplicações, como sistemas 10 de home theater. Tipicamente, esses sistemas utilizam alto falantes posicionados em posições espaciais especificas. Além disso, têm sido desenvolvidos sistemas que provêem uma percepção de som espacial de fones de ouvido. A reprodução de estéreo convencional tende a prover sons que são percebidos 15 por originar de dentro da cabeça do usuário. Entretanto, têm sido desenvolvidos sistemas que provêem uma percepção de som espacial completa com base em sinais biauriculares providos diretamente aos ouvidos do usuário por fones de ouvido. Esses sistemas são geralmente mencionados como sistemas de som 20 virtual, uma vez que eles provêem uma percepção de fontes de som virtuais em posições onde não existe fonte de som real.
O som surround virtual é uma tecnologia que tenta criar a percepção de que há fontes de som que circundam o ouvinte, que não estão fisicamente presentes. Nesses sistemas, o som não parece originar de dentro da cabeça do usuário, conforme é conhecido de sistemas de reprodução de fone de ouvido convencional. Preferivelmente, o som pode ser percebido por originar de fora da cabeça do usuário, conforme é o caso na audição natural na ausência de fones de ouvido.
Além de uma experiência mais realística, o áudio surround virtual também tende a ter um efeito positivo na fadiga do ouvinte e inteligibilidade da fala.
A fim de alcançar essa percepção, é necessário empregar algum meio de copiar o sistema auditivo humano para pensar que o som está vindo das posições desejadas. Uma abordagem bem conhecida para prover a experiência de som surround virtual é o uso de gravação biauricular. Nessas 5 abordagens, a gravação do som utiliza uma disposição de microfone dedicada e é destinada para reprodução utilizando fones de ouvido. A gravação é feita ou ao colocar microfones no canal do ouvido de um indivíduo ou uma cabeça artificial, que é um busto que inclui aurículas (ouvidos externos). 0 uso 10 dessa cabeça artificial incluindo aurículas provê uma impressão espacial muito semelhante à impressão que a pessoa que ouve às gravações teria se estivesse presente durante a gravação. Entretanto, devido a cada uma das aurículas das pessoas serem exclusivas e a filtração que elas impõem no som 15 depende da incidência direcional da onda sonora de chegada é, da mesma forma, também exclusiva, a localização de fontes é dependente do indivíduo. Certamente, os aspectos específicos utilizados para localizar fontes são aprendidos para cada pessoa no início da infância. Portanto, qualquer 20 incompatibilidade entre aurículas utilizadas durante a gravação e as do ouvinte pode levar a uma percepção degradada e impressões espaciais errôneas.
Ao medir a resposta de impulso de uma fonte de som em uma localização específica no espaço tridimensional aos 25 microfones nos ouvidos da cabeça artificial para cada indivíduo, as denominadas Respostas de Impulso Relacionadas à Cabeça (HRIR) podem ser determinadas. As HRIRs podem ser utilizadas para criar uma gravação biauricular que simula múltiplas fontes em diversas localizações. Isso pode ser 30 realizado ao envolver cada fonte de som com o par de HRIRs o que corresponde à posição da fonte de som. A HRIR também pode ser mencionada como Função de Transferência Relacionada à Cabeça (HRTF). Portanto, a HRTF e a HRIR são equivalentes. No caso em que a HRIR também inclui um efeito ambiente, elas são mencionadas como Respostas de Impulso Ambiente Biauriculares (BRIRs). As BRIRs consistem em uma parte anecoica que depende somente dos atributos antroprométricos do individuo (como o 5 tamanho da cabeça, forma do ouvido etc.),, seguida por uma parte reverberante que caracteriza a combinação das propriedades ambiente e antropométricas.
A parte reverberante contém duas regiões temporais, que geralmente se sobrepõem. A primeira região contém as 10 denominadas reflexões antecipadas, que são reflexões isoladas da fonte de som nas paredes ou obstáculos dentro do ambiente, antes de atingir o timpano (ou microfone de medição). Conforme o intervalo de tempo aumenta, o número de reflexões presentes em um intervalo de tempo fixo aumenta, agora, 15 também contendo reflexões de ordem maior.
A segunda região da parte reverberante é a parte onde essas reflexões não são mais isoladas. Essa região é chamada de extremidade de reverberação difusa ou tardia.
A parte reverberante contém indicadores que dão ao 20 sistema auditivo informações sobre a distância da fonte e as propriedades de tamanho e acústicas do ambiente. Além disso, isso é dependente do sujeito devido à filtração das reflexões com as HRIRs. A energia da parte reverberante em relação àquela parte anecoica amplamente determina A distância 25 percebida da fonte de som. A densidade das reflexões (antecipadas) contribui ao tamanho do ambiente percebido. O tempo de reverberação T50 é definido como o tempo que leva para as reflexões cairem 60 dB no nivel de energia. O tempo de reverberação dá informações sobre propriedades acústicas 30 do ambiente; se suas paredes são muito reflexivas (por exemplo, banheiro) ou se há muita absorção de som (por exemplo, quarto com mobilia, carpete e cortinas), assim como o volume (tamanho) do ambiente.
Além do uso de repostas de impulso medidas que incorporam um determinado ambiente acústico, os algoritmos de reverberação sintéticos são geralmente empregados, devido à capacidade de modificar determinadas propriedades da 5 simulação acústica e devido à sua complexidade computacional relativamente baixa.
Um exemplo de um sistema que utiliza técnicas de surround virtual é MPEG Surround, que é um dos maiores avanços na codificação de áudio de múltiplos canais, recentemente padronizada em MPEG (ISO/IEC 23003-1:2007., MPEG Surround).MPEG Surround é uma ferramenta de codificação de áudio de múltiplos canais que permite que codificadores mo ou estéreo existentes sejam estendidos a múltiplos canais. A 15 FIGURA 1 ilustra um diagrama de blocos de um codificador central estéreo estendido com MPEG Surround. Primeiro, o codificador MPEG Surround cria um downmix estéreo do sinal de entrada de múltiplos canais. O downmix estéreo é codificado em um fluxo de bits utilizando um codificador central, por 20 exemplo, HE-AAC. Depois, parâmetros espaciais são estimados do sinal de entrada de múltiplos canais. Esses parâmetros são codificados em um fluxo de bits espacial. O fluxo de bits de codificador central resultante e o fluxo de bits espacial são misturados para criar o fluxo de bits de MPEG Surround geral.
Tipicamente, o fluxo de bits espacial é contido na parte de dados auxiliar do fluxo de bits de codificador central. No lado do decodificador, o fluxo de bits central e o espacial são, primeiro, separados. O fluxo de bits central estéreo é decodificado a fim de reproduzir o downmix estéreo. Esse 30 downmix junto ao fluxo de bits espacial é inserido ao decodificador MPEG Surround. O fluxo de bits espacial é decodificado, resultando nos parâmetros espaciais. Os parâmetros espaciais são, então, utilizados para fazer upmix do downmix estéreo, a fim de obter o sinal de saida de múltiplos canais que é uma aproximação do sinal de entrada de múltiplos canais original.
Uma vez que a imagem espacial do sinal de entrada de múltiplos canais é parametrizado, MPEG Surround também permite a decodificação do mesmo fluxo de bits de múltiplos canais em dispositivos de interpretação diferentes de uma configuração de alto falante de múltiplos canais. Um exemplo é a reprodução virtual em fones de ouvido, que é mencionada como o processo de decodificação biauricular MPEG Surround. Nesse modo, uma experiência surround realística pode ser provida utilizando fones de ouvido regulares.
A FIGURA 2 ilustra um diagrama de blocos do codec central estéreo estendido com MPEG Surround, onde a saída é decodificada de maneira biauricular. O processo de codificador é idêntico ao da FIGURA 1. Após decodificar o fluxo de bits estéreo, os parâmetros espaciais são combinados aos dados de HRTF/HRIR para produzir a denominada saída biauricular.
Baseando-se no conceito de MPEG Surround, MPEG padronizou uma 'Codificação de Objeto de Áudio Espacial' (SAOC) (ISO/IEC 23003-2:2010, Spatial Audio Objeto Coding).
De uma perspectiva de alto nível, em SAOC, ao invés de canais, os objetos de som são eficientemente codificados. Embora em MPEG Surround, cada canal de alto falante pode ser considerado por originar de uma mistura diferente de objetos de som, em SAOC, esses objetos de som individuais são, em alguma medida, disponíveis no decodificador para manipulação interativa. Semelhantemente ao MPEG Surround, um downmix mono, ou estéreo também é criado em SAOC onde o downmix é codificado utilizando um codificador downmix padrão, como HE- AAC. Os parâmetros de objeto são codificados e incorporados nas partes de dados auxiliares do fluxo de bits codificado de downmix. No lado do decodificador, pela manipulação desses parâmetros, o usuário pode controlar diversos aspectos dos objetos individuais, como posição, amplificação/atenuação, equalização, e ainda aplica efeitos como distorção e reverberação.
A qualidade da interpretação de surround virtual de conteúdo estéreo ou de múltiplos canais pode ser significativamente aprimorada pela denominada materialização de fantasma, conforme descrito em Breebaart, J., Schuijers, E. (2008.) . "Phantom materialization: A novel method to enhance stereo audio reproduction on headphones." IEEE Trans. On Audio, Speech e Language processing 16, 1503-1511.
Ao invés de construir um sinal estéreo virtual ao presumir duas fontes de som que originam das posições de alto falante virtual, a abordagem de materialização de fantasma decompõe o sinal sonoro em um componente de sinal direcional e um componente de sinal indireto/descorrelacionado. O componente direto é sintetizado ao simular um alto falante virtual na posição fantasma. 0 componente indireto é sintetizado ao simular alto falantes virtuais na(s) direção(ões) virtual(is) do campo de som difuso.O processo de materialização de fantasma tem a vantagem de que não impõem as limitações de uma configuração de alto falante no cenário de interpretação virtual.
Descobriu-se que a reprodução de som espacial virtual provê experiências especiais muito atrativas em muitos cenários. Entretanto, também foi descoberto que a abordagem pode, em alguns cenários, resultar em experiências que não correspondem completamente à experiência espacial que resultaria em um cenário mundial real com fontes de som reais em posições simuladas no espaço tridimensional.
Foi sugerido que a percepção espacial da interpretação de áudio virtual pode ser afetada por interferência no cérebro entre os indicadores de posição providos pelos indicadores de áudio e de posição providos pela visão do usuário.
No dia-a-dia, indicadores visuais são (tipicamente subconscientemente) combinados a indicadores audiveis para aprimorar a percepção espacial. Um exemplo é a inteligibilidade de uma pessoa aumenta quando o movimento de seus lábios também puder ser observado. Em outro exemplo, descobriu-se que uma pessoa pode ser enganada ao prover um indicador visual para suportar uma fonte de som virtual, por exemplo, ao colocar um alto falante artificial em uma localização onde uma fonte de som virtual é gerada. O indicador visual, portanto, aprimorará ou modificará a virtualização. Um indicador visual pode, em uma determinada medida, alterar ainda a localização percebida de uma fonte de som como no caso de um ventriloquista. De maneira contrária, o cérebro humano tem problema em localizar fontes de som que não têm um indicador visual de suporte (por exemplo, na síntese de campo de onda), o que é, de fato, contraditório à natureza humana.
Outro exemplo é o vazamento de fontes de som externas do ambiente do ouvinte que são misturadas com as fontes de som virtuais geradas por um sistema de áudio com base em fone de ouvido. Dependendo do conteúdo de áudio e uma localização de usuário, as propriedades acústicas dos ambientes físicos e 'virtuais podem diferir de maneira considerável, resultando em ambiguidade em relação ao ambiente do ouvinte. Essas misturas de ambientes acústicos podem causar reprodução de som não natural e não realística.
Ainda, há muitos aspectos relacionados à interação com indicadores visuais que não são bem entendidos e, de fato, o efeito de indicadores visuais em relação à reprodução de com espacial virtual não é completamente entendido.
Com isso, um sistema de áudio aprimorado seria vantajoso e, em particular, uma abordagem que permite flexibilidade aumentada, implementação facilitada, operação facilitada, experiência espacial do usuário aprimorada, geração de som especial virtual aprimorado e/ou desempenho aprimorado seria vantajosa.
SUMÁRIO DA INVENÇÃO
Da mesma forma, a Invenção visa preferencialmente diminuir, aliviar ou eliminar uma ou mais das desvantagens mencionadas acima isoladamente ou em combinação.
De acordo com um aspecto invenção, é provido o sistema de áudio,de acordo com reivindicação 1.
A invenção pode prover uma experiência espacial aprimorada. Em muitas realizações, uma experiência especial mais natural pode ser percebida e a reprodução do som pode parecer menos artificial. De fato, as características de som virtual podem ser adaptadas para estarem mais alinhadas a outros indicadores de posição, como indicadores visuais. Uma percepção de som espacial mais realística pode ser, portanto, alcançada com o usuário sendo provido de uma reprodução de som virtual que parece mais natural e com uma externalização aprimorada.
O sinal de áudio pode corresponder a uma única fonte de som e o processamento do sinal de áudio pode ser de modo que o áudio representado pelo sinal de áudio seja interpretado de uma posição virtual desejada para a fonte de som. O sinal de áudio pode, por exemplo, corresponder a um único canal de áudio (como um canal de som de um sistema de som surround) ou pode, por exemplo, corresponder a um único objeto de áudio. 0 sinal de áudio pode ser especificamente um sinal de áudio de único canal de um sinal de múltiplos canais espacial. Cada sinal espacial pode ser processado para ser interpretado de modo que seja percebido por originar de uma determinada posição virtual.
O sinal de áudio pode ser representado por um sinal de dominio de tempo, um sinal de dominio de frequência e/ou um sinal parametrizado (como um sinal codificado). Como um 5 exemplo especifico, o sinal de áudio pode ser representado por valores de dados em um formato de recortes de tempo e frequência. Em algumas realizações, o sinal de áudio pode ter informações de posição associadas. Por exemplo, um objeto de áudio pode ser provido de informações de posição que indicam 10 uma posição de fonte de som pretendida para o sinal de áudio.
Em alguns cenários, as informações de posição podem ser providas como parâmetros de upmix espaciais. O sistema pode ser disposto para ainda adaptar a função de transferência biauricular em resposta às informações de posição para o 15 sinal de áudio. Por exemplo, o sistema pode selecionar a função de transferência biauricular para prover um indicador de posição de som correspondente à posição indicada.
O sinal de salda biauricular pode compreender componentes de sinal de uma pluralidade de sinais de áudio, 20 cada um dos quais pode ter sido processado de acordo com uma função de transferência biauricular, onde a função de transferência biauricular para cada sinal de áudio pode corresponder à posição desejada para aquele sinal de áudio. Cada uma das funções de transferência biauricular pode, em 25 muitas realizações, ser adaptada em resposta ao parâmetro de ambiente acústico.
O processamento pode aplicar especificamente a função de transferência biauricular ao sinal de áudio ou um sinal derivado dele (por exemplo, por amplificação, 30 processamento etc.j. A relação entre o sinal de saida biauricular e o sinal de áudio é dependente da/refletida pela função de transferência biauricular. O sinal de áudio pode gerar especificamente um componente de sinal para o sinal de saída biauricular que corresponde à aplicação de uma função de transferência biauricular ao sinal de áudio. A função de transferência biauricular pode, portanto, corresponder à função de transferência aplicada ao sinal de áudio para gerar 5 um sinal de saida biauricular que provê uma percepção da fonte de áudio estando em uma posição desejada. A função de transferência biauricular pode incluir uma contribuição de ou corresponder a uma HRTF, HRIR ou BRIR.
A função de transferência biauricular pode ser 10 aplicada ao sinal de áudio (ou um sinal derivado dele) ao aplicar a função de transferência biauricular no domínio de tempo, no domínio de frequência ou como uma combinação de ambos. Por exemplo, a função de transferência biauricular pode ser aplicada a recortes de frequência e tempo, por 15 exemplo, ao aplicar um valor de função de transferência biauricular complexo a cada recorte de frequência e tempo. Em outros exemplos, o sinal de áudio pode ser filtrado por um filtro que implementa a função de transferência biauricular.
De acordo com um aspecto opcional da invenção, o 20 parâmetro de ambiente acústico compreende um parâmetro de reverberação para o ambiente acústico.
Isso pode permitir uma adaptação particularmente vantajosa do som virtual para prover uma experiência aprimorada e tipicamente mais natural do usuário de um 25 sistema sonoro que utiliza o posicionamento de origem de som virtual.
De acordo com um aspecto opcional da invenção, o parâmetro de ambiente acústico compreende pelo menos um dentre: um tempo de reverberação; uma energia de reverberação 30 relativa a uma energia de trajeto direto; um espectro de frequência de pelo menos parte de uma resposta de impulso ambiente; uma densidade modal de pelo menos parte de uma resposta de impulso ambiente; uma densidade de eco de pelo menos parte de uma resposta de impulso ambiente; uma coerência ou correlação interauricular; um nivel de reflexões antecipadas; e uma estimativa de tamanho de ambiente.
Esses parâmetros podem permitir uma adaptação particularmente vantajosa do som virtual para prover uma experiência aprimorada e tipicamente mais natural do usuário de um sistema sonoro que utiliza posicionamento de origem de som virtual. Além disso, os parâmetros podem facilitar a implementação e/ou operação.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é disposto para adaptar uma característica de reverberação da função de transferência biauricular.
Isso pode permitir uma adaptação particularmente vantajosa do som virtual para prover uma experiência aprimorada e tipicamente mais natural do usuário de um sistema sonoro que utiliza posicionamento de origem de som virtual. A abordagem pode permitir operação e/ou implementação facilitada, uma vez que as caracteristicas de reverberação são particularmente adequadas para adaptação. A modificação pode ser de modo que o processamento seja modificado para corresponder a uma função de transferência biauricular com diferentes características de reverberação.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é disposto para adaptar pelo menos uma das seguintes características da função de transferência biauricular: um tempo de reverberação; uma energia de reverberação relativa a uma energia de som direto; um espectro de frequência de pelo menos parte do função de transferência biauricular; uma densidade modal de pelo menos parte da função de transferência biauricular; uma densidade de eco de pelo menos parte da função de transferência biauricular; uma coerência ou correlação interauricular; e um nível de reflexões antecipadas de pelo menos parte da função de transferência biauricular.
Esses parâmetros podem permitir uma adaptação particularmente vantajosa do som virtual para prover uma experiência aprimorada e tipicamente mais natural do usuário de um sistema sonoro que utiliza posicionamento de origem de som virtual. Além disso, os parâmetros podem facilitar a implementação e/ou operação.
De acordo com um aspecto opcional da invenção, o processamento compreende uma combinação de uma função de transferência biauricular predeterminada e uma função de transferência biauricular variável adaptada em resposta ao parâmetro de ambiente acústico.
Isso pode, em muitos cenários, prover uma implementação e/ou operação facilitada e/ou aprimorada. A função de transferência biauricular predeterminada e a função de transferência biauricular variável podem ser combinadas. Por exemplo, as funções de transferência podem ser aplicadas ao sinal de áudio em série ou podem ser aplicadas ao sinal de áudio em paralelo com os sinais resultantes sendo combinados.
A função de transferência biauricular predeterminada pode ser fixa e pode ser independente do parâmetro de ambiente acústico. A função de transferência biauricular variável pode ser uma função de transferência de simulação de ambiente acústico.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é disposto para atualizar dinamicamente a função de transferência biauricular.
A atualização dinâmica pode ser em tempo real. A invenção pode permitir que um sistema que adapta automática e continuamente a provisão de som ao ambiente seja utilizado. Por exemplo, conforme um usuário que carrega o sistema de áudio se move, o som pode adaptar automaticamente o áudio interpretado para corresponder ao ambiente acústico especifico, por exemplo, para corresponder ao ambiente especifico. 0 circuito de medição pode medir continuamente a característica de ambiente e o processamento pode ser 5 atualizado continuamente em resposta a isso.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é disposto para modificar a função de transferência biauricular somente quando a característica de ambiente atender a um critério.
Isso pode prover uma experiência do usuário aprimorada em muitos cenários. Em particular, pode, em muitas realizações, prover uma experiência mais estável. O circuito de adaptação pode, por exemplo, somente modificar uma característica da função de transferência biauricular quando 15 o parâmetro de ambiente de áudio atender a um critério. O critério pode, por exemplo, ser que uma diferença entre o valor do parâmetro de ambiente acústico e o valor anterior utilizado para adaptar a função de transferência biauricular excede um limite.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é disposto para restringir uma velocidade de transição para a função de transferência biauricular.
Isso pode prover uma experiência de usuário 25 aprimorada e pode fazer a adaptação às condições específicas do ambiente menos notáveis. Modificações da função de transferência biauricular podem ser feitas, sujeitas a um efeito de filtração de baixa passagem com atenuação de alterações geralmente acima, de maneira vantajosa, de 1 Hz.
Por exemplo, as alterações de etapa para a função de transferência biauricular podem ser restritas para serem transições graduais com durações de cerca de 1-5 segundos.
De acordo com um aspecto opcional da invenção, o sistema de áudio ainda compreende: um armazenamento de dados para armazenar dados de função de transferência biauricular; um circuito para recuperar dados de função de transferência biauricular do armazenamento de dados em resposta ao parâmetro de ambiente acústico; e em que o circuito de adaptação é disposto para adaptar a função de transferência biauricular em resposta aos dados de função de transferência biauricular recuperados.
Isso pode prover uma implementação particularmente eficiente em muitos cenários. A abordagem pode reduzir especificamente os requisitos de recurso computacional.
Em algumas realizações, o sistema de áudio pode ainda compreender um circuito para detectar que nenhum dado de função de transferência biauricular armazenado no armazenamento de dados é associado ao ambiente acústico características correspondente ao parâmetro de ambiente acústico, e em resposta, para gerar e armazenar dados de função de transferência biauricular no armazenamento de dados junto aos dados que caracterizam o ambiente acústico associado.
De acordo com um aspecto opcional da invenção, o sistema de áudio ainda compreende: um circuito de sinal de teste disposto para radiar um sinal de teste de som no ambiente acústico; e em que o circuito de medição é disposto para capturar a sinal sonoro recebido no ambiente, o sinal de áudio recebido compreendendo um componente de sinal que se origina do sinal de teste de som radiado; e o circuito de determinação é disposto para determinar o parâmetro de ambiente acústico em resposta ao sinal de teste de som.
Isso pode prover uma maneira de baixa complexidade, ainda precisa e prática de determinação do parâmetro de ambiente acústico. A determinação do parâmetro de ambiente acústico pode ser especificamente em resposta a uma correlação entre o sinal de teste recebido e o sinal de teste de áudio. Por exemplo, características de frequência e de tempo podem ser comparadas e utilizadas para determinar o parâmetro de ambiente acústico.
De acordo com um aspecto opcional da invenção, o- circuito de determinação é disposto para determinar uma resposta de impulso ambiente em resposta ao sinal sonoro recebido e para determinar o parâmetro de ambiente acústico em resposta à resposta de impulso ambiente.
Isso pode prover uma abordagem particularmente robusta, de baixa complexidade e/ou precisa para determinar o parâmetro de ambiente acústico.
De acordo com um aspecto opcional da invenção, o circuito de adaptação é ainda disposto para atualizar a 15 função de transferência biauricular em resposta a uma posição do usuário.
Isso pode prover uma experiência de usuário particularmente atrativa. Por exemplo, a interpretação de som virtual pode ser atualizada continuamente conforme o usuário 20 se movimenta, provendo, com isso, uma adaptação contínua não somente, por exemplo, ao ambiente, mas também à posição do usuário no ambiente.
Em algumas realizações, o parâmetro de ambiente acústico é dependente de um posição do usuário.
Isso pode prover uma experiência de usuário particularmente atrativa. Por exemplo, a interpretação de som virtual pode ser atualizada continuamente conforme o usuário se move, provendo, com isso uma adaptação continua não somente, por exemplo, ao ambiente, mas também à posição do 30 usuário no ambiente. Como um exemplo, o parâmetro de ambiente acústico pode ser determinado de uma resposta de impulso medida que pode mudar dinamicamente conforme o usuário se move dentro de um ambiente. A posição do usuário pode ser uma orientação ou localização do usuário.
De acordo com um aspecto opcional da invenção, o circuito biauricular compreende um reverberador; e o circuito de adaptação é disposto para adaptar um processamento de 5 reverberação do reverberador em resposta ao parâmetro de ambiente acústico.
Isso pode prover uma abordagem particularmente prática para modificar o processamento para refletir as funções de transferência biauricular modificadas. 0 reverberador pode prover uma abordagem particularmente eficiente para a adaptação da características ainda ser suficientemente simples de controlar. O reverberador pode, por exemplo, se um reverberador Jot, como, por exemplo, descrito em J.-M. Jot e A. Chaigne, "Digital delay networks 15 for designing artificial reverberators", Audio Engineering Society Convention, Feb. 1991.
De acordo com um aspecto da invenção é provido método de operação para um sistema de áudio, de acordo com reivindicação 14.
Esses e outros aspectos, característica e vantagens da invenção serão aparentes a partir e elucidados com referência à(s) realização(s) doravante descrita(s).
BREVE DESCRIÇÃO DOS DESENHOS
As realizações da invenção serão descritas, somente 25 a título de exemplo, com referência aos desenhos, nos quais
A Figura 1 ilustra um diagrama de blocos de um codec central estéreo estendido com MPEG Surround;
A Figura 2 ilustra um. diagrama de blocos de um codec central estéreo estendido com MPEG Surround e provendo 30 um sinal de saída biauricular;
A Figura 3 ilustra um exemplo de elementos de um sistema de áudio, de acordo com algumas realizações da invenção;
A Figura 4 ilustra um exemplo de elementos de um processador biauricular, de acordo com algumas realizações da invenção;
A Figura 5 ilustra um exemplo de elementos de um processador de sinal biauricular, de acordo com algumas realizações da invenção;
A Figura 6 ilustra um exemplo de elementos de um processador de sinal biauricular, de acordo com algumas realizações da invenção; e
A Figura 7 ilustra um exemplo de elementos de um reverberador Jot.
DESCRIÇÃO DETALHADA DE ALGUMAS REALIZAÇÕES DA INVENÇÃO
A Figura 3 ilustra um exemplo de um sistema de áudio, de acordo com algumas realizações da invenção. O sistema de áudio é um sistema de som virtual que emula posições de fonte de som espaciais ao gerar um sinal biauricular que compreende um sinal para cada ouvido de um usuário. Tipicamente, o áudio biauricular é provido ao usuário por meio de um par de fones de ouvido, ou similar.
O sistema de áudio compreende um receptor 301 que recebe um sinal de áudio que deve ser interpretado pelo sistema de áudio. O sinal de áudio é destinado para ser interpretado como uma fonte de som com uma posição virtual desejada. Assim, o sistema de áudio interpreta o sinal de áudio, de modo que o usuário (pelo menos aproximadamente) percebe o sinal por originar da posição desejada ou pelo menos direção.
No exemplo, o sinal de áudio é portanto considerado por corresponder a uma única fonte de áudio. Como tal, o sinal de áudio é associado a uma posição desejada. O sinal de áudio pode corresponder, por exemplo, a um sinal de canal espacial e especificamente o sinal de áudio pode ser um único sinal de um sinal de múltiplos canais espacial. Esse um sinal pode ter implicitamente uma posição associada desejada. Por exemplo, um sinal de canal central é associado a uma posição diretamente em frente ao ouvinte, um canal frontal esquerdo é 5 associado a uma posição para frente e à esquerda do ouvinte, um sinal esquerdo traseiro é associado a uma posição além e à esquerda do ouvinte etc. 0 sistema de áudio pode, portanto, interpretar o sinal para parecer que chega dessa posição.
Como outro exemplo, o sinal de áudio pode ser um. 10 objeto de áudio e pode, por exemplo, se um objeto de áudio que o usuário pode posicionar livremente no espaço (virtual). Assim, em alguns exemplos, a posição desejada pode ser localmente gerada ou selecionada, por exemplo, pelo usuário.
O sinal de áudio pode, por exemplo, ser 15 representado provido e/ou processado como um sinal de domínio de tempo. Alternativa ou adicionalmente, o sinal de áudio pode ser provido e/ou processado como um sinal de domínio de frequência. De fato, em muitos sistemas, o sistema de áudio pode ser capaz de alternar entre essas representações e 20 aplicar o processamento no domínio que é mais eficiente para a operação específica.
Em algumas realizações, o sinal de áudio pode ser representado como um sinal de recorte de frequência e tempo. Assim, o sinal pode ser dividido em dois recortes onde cada 25 recorte corresponde a um intervalo de tempo e um intervalo de frequência. Para cada um desses recortes, o sinal pode ser representado como um conjunto de valores. Tipicamente, um único valor de sinal complexo é provido para cada recorte de tempo e frequência.
Na descrição, um único sinal de áudio é descrito e processado para ser interpretado de uma posição virtual. Entretanto, será apreciado que, na maioria dos exemplos, o som interpretado ao ouvinte compreende sons de muitas fontes de som diferentes. Assim, em realizações típicas, uma pluralidade de sinais de áudio é recebida e interpretada, tipicamente de diferentes posições virtuais. Por exemplo, para um sistema de som surround virtual, tipicamente, um 5 sinal de múltiplos canais espacial é recebido. Nesses cenários, cada sinal é tipicamente processado individualmente, conforme descrito a seguir para o único sinal de áudio e são, então, combinados. De fato, os diferentes sinais são tipicamente interpretados de diferentes 10 posições e, portanto, diferentes posições de transferência biauricular podem ser aplicadas.
Semelhantemente, em muitas realizações, um amplo número de objetos de áudio pode ser recebido e cada um deles (ou uma combinação deles) pode ser individualmente processado, conforme descrito.
Por exemplo, é possível interpretar uma combinação de objetos ou sinais com uma combinação de funções de transferência biauricular, de modo que cada objeto na combinação de objetos seja interpretado de maneira diferente, 20 por exemplo, em diferentes localizações. Em alguns cenários, uma combinação de objetos de áudio ou sinais pode ser processada como uma entidade combinada. Por exemplo, o downmix dos canais frontais e esquerdo surround pode ser interpretado com uma função de transferência biauricular que 25 consiste em uma mistura ponderada das duas funções de transferência biauricular correspondentes.
Os sinais de saída podem ser, então, simplesmente gerados ao combinar (por exemplo, adicionar) os sinais biauriculares gerados para cada um dos diferentes sinais de 30 áudio.
Assim, embora a seguinte descrição foque em um único sinal de áudio, isso pode ser meramente considerado o componente de sinal de um sinal de áudio que corresponde a uma fonte de som de uma pluralidade de sinais de áudio.
O receptor 301 é acoplado a um processador biauricular 303 que recebe o sinal de áudio e que gera a sinal de saida biauricular ao processar o sinal de áudio. O 5 processador biauricular 303 é acoplado a um par de fones de ouvido 305 que é alimentado com o sinal biauricular. Assim, o sinal biauricular compreende um sinal para o ouvido esquerdo e um sinal para o ouvido direito.
Será apreciado que, embora o uso de fones de ouvido 10 possa ser tipico para muitas aplicações, a invenção descrita e os principios não são limitados a isso. Por exemplo, em algumas situações, o som pode ser interpretado por meio de alto falantes na frente do usuário ou nos lados do usuário (por exemplo, utilizando um dispositivo de montagem de 15 ressalto). Em alguns cenários, o processamento biauricular pode, nesses casos, ser aprimorado com processamento adicional que compensa a difonia entre os dois alto falantes (por exemplo, pode compensar o sinal do alto falante direito em relação a componentes de som do alto falantes esquerdo que 20 também são ouvidos pelo ouvido direito).
O processador biauricular 303 é disposto para processar o processamento de sinal de áudio, de modo que o processamento seja representativo de uma função de transferência biauricular que provê uma posição de origem de 25 som virtual para o sinal de áudio no sinal de saida biauricular. No sistema da FIGURA 3, a função de transferência biauricular é a função de transferência aplicada ao sinal de áudio para gerar o sinal de saida biauricular. Isso, portanto, reflete o efeito combinado do processamento de processador biauricular 303 e pode, em algumas realizações, incluir efeitos não lineares, efeitos de feedback etc.
Como parte do processamento, o processador biauricular 303 pode aplicar uma posição que virtualiza a função de transferência biauricular ao sinal sendo processado. Especificamente, como parte do trajeto do sinal do sinal de áudio ao sinal de saida biauricular, uma posição 5 que virtualiza a função de transferência biauricular é aplicada ao sinal.
A função de transferência biauricular especificamente inclui uma Função de Transferência Relacionada à Cabeça (HRTF), uma Resposta de Impulso Relacionada à Cabeça (HRIR) e/ou Respostas de Impulso
Ambiente Biauriculares (BRIRs). Os termos resposta de impulso e função de transferência são considerados equivalente. Assim, o sinal de saida biauricular é gerado para refletir o condicionamento de áudio introduzido pela cabeça dos ouvintes 15 e tipicamente o ambiente, de modo que o sinal de áudio pareça originar na posição desejada.
A Figura 4 ilustra um exemplo do processador biauricular 303 em mais detalhes. No exemplo específico, o sinal de áudio é alimentado em um processador de sinal 20 biauricular 401 que procede para filtrar o sinal de áudio, de acordo com a função de transferência biauricular. O processador de sinal biauricular 401 compreende dois subfiltros, a saber, um para gerar o sinal para o canal de ouvido esquerdo e um para gerar o sinal para o canal de 25 ouvido direito. No exemplo da Figura 4, o sinal biauricular gerado é alimentado em um amplificador 403 que amplifica os sinais esquerdo e direito independentemente e, então, alimenta-os aos alto falantes esquerdo e direito dos fones de ouvido 305 respectivamente.
As características de filtro para o processador de sinal biauricular 401 dependem da posição virtual desejada para o sinal de áudio. No exemplo, o processador biauricular 303 compreende um processador de coeficiente 405 que determina as características de filtro e as alimenta ao processador de sinal biauricular 401, O processador de coeficiente 405 pode receber especificamente uma indicação de posição e selecionar os componentes de filtro adequados da 5 mesma forma.
Em algumas realizações, o sinal de áudio pode, por exemplo, ser um sinal de domínio de tempo e o processador de sinal biauricular 401 pode ser um filtro de domínio de tempo, como um filtro IIR ou FIR. Nesse cenário, o processador de 10 coeficiente 405 pode, por exemplo, prover os coeficientes de filtro. Como outro exemplo, o sinal de áudio pode ser convertido para o domínio de frequência e a filtração pode ser aplicada no domínio de frequência, por exemplo, ao multiplicar cada componente de frequência por um valor 15 complexo correspondente à função de transferência de frequência do filtro. Em algumas realizações, o processamento pode ser inteiramente realizado nos recortes de tempo e frequência.
Será apreciado que, em algumas realizações, também 20 pode ser aplicado outro processamento ao sinal de áudio, por exemplo, uma filtração de alta passagem ou filtração de baixa passagem pode ser aplicada. Também será apreciado que o processamento biauricular de posicionamento de som virtual pode ser combinado a outro processamento. Por exemplo, uma 25 operação de upmixagem do sinal de áudio em resposta aos parâmetros espaciais pode ser combinada ao processamento biauricular. Por exemplo, para um sinal MPEG Surround, um sinal de entrada representado por recortes de frequência e tempo pode ser convertido para cima para diferentes sinais 30 espaciais ao aplicar diferentes parâmetros espaciais. Assim, para um determinado sinal upmixado, cada recorte de tempo e frequência pode ser sujeito a uma multiplicação por um valor complexo correspondente ao parâmetro espacial/upmixagem, 0 sinal resultante pode ser, então, sujeito ao processamento biauricular ao multiplicar cada recorte de tempo e frequência por um valor complexo correspondente à função de transferência biauricular. De fato, em algumas realizações, essas operações podem ser combinadas, de modo que cada recorte de tempo e frequência possa ser multiplicado por um único valor complexo que representa tanto a upmixagem como o processamento biauricular (especificamente, isso pode corresponder à multiplicação dos dois valores complexos separados).
Em áudio espacial virtual biauricular convencional, o processamento biauricular tem base nas funções de transferência biauricular predeterminadas que forma derivadas por medições, tipicamente, utilizando microfones posicionados nos ouvidos de um simulador. Para HRTFs e HRIRs, somente o impacto do usuário, e não o ambiente, é levado em consideração. Entretanto, quando BRIRs são utilizadas, as características de ambiente no ambiente no qual a medição foi obtida também são incluídas. Isso pode prover uma experiência de usuário aprimorada em muitos cenários. De fato, foi descoberto que quando o áudio de surround virtual em fones de ouvido é reproduzido no ambiente onde as medições foram feitas, uma externalização convincente pode ser obtida. Entretanto, em outros ambientes e, em particular, em ambientes nos quais as características acústicas são muito diferentes (ou seja, quando houver uma incompatibilidade clara entre o ambiente de reprodução e o de medição), a externalização percebida pode degradar significativamente.
No sistema da Figura 3, essa degradação é significativamente mitigada e reduzida ao adaptar o processamento biauricular.
Especificamente, o sistema de áudio da Figura 3 ainda compreende um circuito de medição 307 que medição global real que é dependente ou reflete o ambiente acústico no qual o sistema é utilizado. Assim, o circuito de medição 307 gera dados de medição que são indicativos de uma característica do ambiente acústico.
No exemplo, o sistema é acoplado a um microfone 309 que captura sinais de áudio, mas será apreciado que, em outras realizações, outros sensores e outras modalidades podem adicional ou alternativamente serem utilizados.
O circuito de medição 307 é acoplado a um 10 processador de parâmetro 311 que recebe os dados de medição e que procede para gerar um parâmetro de ambiente acústico em resposta a isso. Assim, um parâmetro é gerado, que é indicativo do ambiente acústico específico no qual o som virtual é interpretado. Por exemplo, o parâmetro pode indicar 15 quão ecóico ou reverberante o ambiente é.
O processador de parâmetro 311 é acoplado a um processador de adaptação 313 que é disposto para adaptar a função de transferência biauricular utilizada pelo processador biauricular 303 dependente do parâmetro de 20 ambiente acústico determinado. Por exemplo, Se o parâmetro for indicativo de um ambiente muito reverberante, a função de transferência biauricular pode ser modificada para refletir um grau maior de reverberação do que o medido pela BRIR.
Assim, o sistema da Figura 3 é capaz de adaptar o 25 som virtual interpretado para refletir mais proximamente o ambiente de áudio no qual ele é utilizado. Isso pode prover uma provisão virtual de som mais consistente e que parece ser mais natural. Em particular, pode-se permitir que indicadores de posição visuais se alinhem mais proximamente aos 30 indicadores de posição áudio providos.
O sistema pode atualizar dinamicamente a função de transferência biauricular e essa atualização dinâmica pode, em algumas realizações, ser realizada em tempo real. Por exemplo, o processador de medição 307 pode realizar continuamente medições e gerar dados de medição atuais. Isso pode ser refletido em um parâmetro de ambiente acústico continuamente atualizado e uma adaptação continuamente 5 atualizada da função de transferência biauricular. Assim, a função de transferência biauricular pode ser continuamente modificada para refletir o atual ambiente de áudio.
Isso pode prover uma experiência de usuário muito atrativa. Como um exemplo especifico, um banheiro tende a ser dominado por superficies muito duras e acusticamente muito refletivas com pouca atenuação. Ao contrário, um quarto tende a ser dominado por superfícies macias e atenuantes, em particular, para frequências maiores. Assim, uma pessoa que usa um par de fones de ouvido provendo som surround virtual, com o sistema da Figura 3, será capaz de ser provido de um s som virtual que se ajusta automaticamente quando o usuário andar do banheiro para o quarto ou vice-versa. Assim, quando o usuário sair do banheiro e entrar no quarto, o som pode se tornar automaticamente menos reverberante e ecóico para refletir o novo ambiente acústico.
Será apreciado que o parâmetro de ambiente acústico exato utilizado pode depender das preferências e necessidades da realização individual. Entretanto, em muitas realizações, pode ser particularmente vantajoso que o parâmetro de 25 ambiente acústico compreenda um parâmetro de reverberação para o ambiente acústico.
De fato, a reverberação não é somente uma característica que pode ser medida de maneira relativamente precisa utilizando abordagens de complexidade relativamente 30 baixa, mas também é uma característica que tem um impacto particularmente significativo na percepção de áudio do usuário e, em particular, na percepção espacial do usuário. Assim, em algumas realizações, a função de transferência biauricular é adaptada em resposta a um parâmetro de reverberação para o ambiente de áudio.
Será apreciado que a medição especifica e os parâmetros medidos também dependerão das necessidades ou preferências especificas da realização individual. Nos diversos exemplos vantajosos a seguir do parâmetro de ambiente acústico e métodos de geração deles serão descritos.
Em algumas realizações, o parâmetro de ambiente acústico pode compreender um parâmetro indicativo de um tempo de reverberação para o ambiente acústico. 0 tempo de reverberação pode ser definido como o tempo que ele leva para que as reflexões sejam reduzidas a um nível específico. Por exemplo, o tempo de reverberação pode ser determinado como o tempo que se leva para o nível de reflexões de energia caia para 60 dB. Esse valor é tipicamente denotado por T6o-
O tempo de reverberação T'6Q pode ser, por exemplo, determinado por:
Figure img0001
onde V é o volume do ambiente e a é uma estimativa da área de absorção equivalente.
Em algumas realizações, características predeterminadas do ambiente (como V e a) podem ser conhecidas para diversos ambientes diferentes. O sistema de áudio pode ter diversos desses parâmetros armazenados (por exemplo, após um usuário inserir manualmente os valores). O sistema pode, então, proceder para realizar medições que determinam simplesmente em qual ambiente o usuário está atualmente localizado. Os dados correspondentes podem ser, então, recuperados e utilizados para calcular o tempo de reverberação. A determinação do ambiente pode ser por comparação de características de áudio às características de áudio medidas e armazenadas em cada ambiente. Como outro exemplo, uma câmera pode capturar uma imagem do ambiente e utilizar isso para selecionar os dados que devem ser recuperados. Ainda como outro exemplo, a medição pode incluir uma estimativa de posição e os dados adequados para o ambiente correspondente àquela posição pode ser recuperado. Ainda, em outro exemplo, os parâmetros de interpretação acústica preferidos ao usuário são associados às informações de localização derivadas de células de GPS, proximidade de pontos de acesso de WiFi específicos, ou um sensor de luz que discrimina entre luz artificial ou natural para determinar se o usuário está dentro ou fora de um edifício.
Como outro exemplo, o tempo de reverberação pode 15 ser determinado pelo processamento específico de dois sinais de microfone, conforme descrito em mais detalhes em Vesa, S., Harma, A. (2005). Automatic estimation of reverberation time from bianural signals. ICASSP 2005, p. iii/281-iii/284 March 18-23.
Em algumas realizações, o sistema pode determiner uma resposta de impulso para o ambiente acústico. A resposta de impulso pode ser, então, utilizada para determinar o parâmetro de ambiente acústico. Por exemplo, o impulso pode ser avaliado para determinar a duração antes de o nível da 25 resposta de impulso ser reduzido a um determinado nível, por exemplo, o valor de T60 é determinado como a duração da resposta de impulso até que a resposta caia para 60 dB.
Será apreciado que qualquer abordagem adequada para determinar a resposta de impulso pode ser utilizada.
Por exemplo, o sistema pode incluir um circuito que gera um sinal de teste de som que é radiado ao ambiente acústico. Por exemplo, os fones de ouvido podem conter um alto falante externo ou outra unidade de alto falante pode ser, por exemplo, utilizada.
O microfone 309 pode,então, monitorar o ambiente de áudio e a resposta de impulso é gerada do sinal de microfone capturado. Por exemplo, um pulso muito curto pode ser radiado. Esse sinal será refletido para gerar ecos e reverberação. Assim, o sinal de teste pode aproximar um impulso de Dirac, e o sinal capturado pelo microfone pode, da mesma forma, em alguns cenários, refletir diretamente a resposta de impulso. Essa abordagem pode ser particularmente adequada para ambientes muito quietos onde não está presente interferência de outras fontes de áudio. Em outros cenários, o sinal de teste pode ser um sinal conhecido (como um sinal de pseudo ruido) e o sinal de microfone pode ser correlacionado ao sinal de teste para gerar a resposta de impulso.
Em algumas realizações, o parâmetro de ambiente acústico pode compreender uma indicação de uma energia de reverberação relativa a uma energia de trajeto direto. Por exemplo, para uma BRIRh[n] medida (amostrada discretamente), a energia de som direto para reverberar a proporção de energia R pode ser determinada como:
Figure img0002
onde T é um limite adequado para discriminar entre som direto e reverberante (tipicamente 5-50 ms).
Em algumas realizações, o parâmetro de ambiente acústico pode refletir o espectro de frequência de pelo menos parte de uma resposta de impulso ambiente. Por exemplo, a resposta de impulso pode ser transformada no dominio de frequência, por exemplo, utilizando uma FFT, e o espectro de frequência resultante pode ser analisado.
Por exemplo, uma densidade modal pode ser determinada. Um modo corresponde a um efeito de ressonância ou de onda estacionária para áudio no ambiente. As densidades modais podem da mesma forma ser detectadas de picos no dominio de frequência. A presença dessas densidade modais pode ter impacto nos sons do ambiente, e, assim, a detecção da densidade modal pode ser utilizada para prover um impacto correspondente no som virtual interpretado.
Será apreciado que em outros cenários, uma densidade modal pode, por exemplo, ser calculada a partir das características do ambiente e utilizando fórmulas bem conhecidas. Por exemplo, densidades modais podem ser calculadas do conhecimento do tamanho do ambiente.
Especificamente, a densidade modal pode ser calculada como:
Figure img0003
onde c é a velocidade do som e f a frequência.
Em algumas realizações, uma densidade de eco pode ser calculada. A densidade de eco reflete quanto e quão proximamente juntos estão os ecos no ambiente. Por exemplo, em um pequeno banheiro, ele tende a ter um número relativamente alto de ecos relativamente próximos, enquanto, em um quarto grande, tende a ser um número menor de ecos que não estão unidos proximamente (e não como potente). Essa densidade de eco parâmetros pode ser, portanto, vantajosamente utilizada para adaptar a interpretação de som virtual e pode ser calculada da resposta de impulso medida.
A densidade de eco pode ser determinada da resposta de impulso ou pode, por exemplo, ser calculada das características de ambiente utilizando fórmulas bem conhecidas. Por exemplo, a densidade de eco temporal pode ser calculada como:
Figure img0004
onde t é o intervalo de tempo.
Em. algumas realizações, pode ser vantajoso 5 simplesmente avaliar o nível de reflexões antecipadas. Por exemplo, um sinal de teste de curto impulso pode ser radiado e o sistema pode determinar o nível de sinal combinado do sinal de microfone em um determinado intervalo de tempo, como, por exemplo, os 50 mseg. após a transmissão do impulso.
A energia recebida nesse intervalo de tempo provê uma medida muito útil, ainda de baixa complexidade da significância de ecos antecipados.
Em algumas realizações, o parâmetro de ambiente acústico pode ser determinado para refletir uma coerência/correlação interauricular. A coerência/correlação entre os dois ouvidos pode, por exemplo, ser determinada de sinais dos dois microfones posicionados na aurícula esquerda e direita respectivamente. A correlação entre os ouvidos pode refletir a difusão e pode prover uma base particularmente vantajosa para alterar o som virtual interpretado, uma vez que a difusão dá uma indicação de quão reverberante o ambiente é. Um ambiente reverberante será mais difuso que um ambiente com pouca ou nenhuma reverberação.
Em algumas realizações, o parâmetro de ambiente 25 acústico pode ser ou compreender simplesmente uma estimativa de tamanho de ambiente. De fato, conforme pode ser claramente visto dos exemplos anteriores, o tamanho do ambiente tem efeito significativo nas características do ambiente de som. Em particular, os ecos e a reverberação dependem fortemente 30 disso. Portanto, em alguns cenários, a adaptação do som interpretado pode ter simplesmente base em uma determinação de um tamanho de ambiente com base em uma medição.
Será apreciado que outras abordagens que não a determinação da resposta de impulso ambiente podem ser utilizadas. Por exemplo, o sistema de medição pode alternativa ou adicionalmente utilizar outras modalidades, 5 como visão, luz., radar, ultrassom, laser, câmera ou outras medições sensoriais. Essas modalidades podem ser particularmente adequadas para estimar o tamanho de ambiente do qual as características de reverberação podem ser determinadas. Como outro exemplo, elas podem ser adequadas 10 ara estimar as características de reflexão (por exemplo, a resposta de frequência das reflexões de parede). Por exemplo, uma câmera pode determinar que o ambiente corresponde a um ambiente de banheiro e pode, da mesma forma, presumir características de reflexão correspondentes a superficies 15 recortadas típicas. Como outro exemplo, informações de localizações absolutas e relativas podem ser utilizadas.
Ainda, como outro exemplo, uma determinação de variação de ultrassom com base em sensores ultrassónicos e radiação de um sinal de teste ultrassónico pode ser utilizado 20 para estimar o tamanho do ambiente. Em outras realizações, sensores de luz podem ser utilizados para obter uma estimativa com base em espectro de luz (por exemplo, avaliando se detecta luz natural ou artificial, permitindo, com isso, uma diferenciação entre um ambiente interno ou 25 externo). Também, informações de localização poderiam ser úteis com base em GPS. Como outro exemplo, a detecção e reconhecimento de determinados pontos de acesso de WiFi ou identificadores de célula GSM poderiam ser utilizados para identificar qual função de transferência biauricular 30 utilizar.
Também, será apreciado que, embora medições de áudio possam, em muitas realizações, ter base, de maneira vantajosa, na radiação de um sinal de teste de áudio, algumas realizações podem não utilizar um sinal de teste. Por exemplo, em algumas realizações, a determinação das características de áudio, como reverberação, resposta de frequência ou uma resposta de impulso, pode ser feita 5 passivamente ao analisar sons que são produzidos por outras fontes no atual ambiente fisico (por exemplo, passos, rádio etc) .
No sistema da FIGURA 3, o processamento do processador biauricular 303 é, então, modificado em resposta ao parâmetro de ambiente acústico. Especificamente, o processador de sinal biauricular 401 processa o sinal de áudio, de acordo com a função de transferência biauricular, onde a função de transferência biauricular é dependente do parâmetro de ambiente acústico.
Em algumas realizações, o processador de sinal biauricular 401 pode compreender um armazenamento de dados que armazena dados de função de transferência biauricular correspondentes a uma pluralidade de diferentes ambientes acústicos. Por exemplo, uma ou mais BRIRs podem ser 20 armazenadas para diversos tipos diferentes de ambiente, como um banheiro típico, quarto, sala de estar, cozinha, salão, carro, trem etc. Para cada tipo, uma pluralidade de BRIRs pode ser armazenada correspondente a diferentes tamanhos de ambiente. As características do ambiente no qual a BRIR foi medida são ainda armazenadas para cada BRIR.
O processador de sinal biauricular 401 pode ainda compreender um processador que é disposto para receber parâmetro de ambiente acústico e, em resposta, para recuperar dados de função de transferência biauricular adequados do 30 armazenamento. Por exemplo, o parâmetro de ambiente acústico pode ser um parâmetro composto compreendendo uma indicação de tamanho de ambiente, uma indicação da proporção entre energia antecipada e tardia e um tempo de reverberação. O processador pode, então, buscar ao longo dos dados armazenados para encontrar a BRIR para a qual as características de ambiente armazenadas se assemelham mais proximamente às características de ambiente medidas.
O processador, então, recupera a BRIR de melhor correspondência e a aplica ao sinal de áudio para gerar o sinal biauricular que, após a amplificação, é alimentado aos fones de ouvido.
Em algumas realizações, o armazenamento de dados pode ser dinamicamente atualizado e/ou desenvolvido. Por exemplo, quando um usuário estiver em um novo ambiente, o parâmetro de ambiente acústico pode ser determinado e utilizado para gerar uma BRIR que corresponde àquele ambiente. A BRIR pode ser, então, utilizada para gerar o sinal de saída biauricular. Entretanto, além disso, a BRIR pode ser armazenada no armazenamento de dados junto às caracter!sticas do ambiente determinadas adequadas, como o parâmetro de ambiente acústico, possivelmente uma posição etc. Dessa forma, o armazenamento de dados pode ser dinamicamente incorporado e aprimorado com novos dados como e quando eles são gerados. A BRIR pode ser, então, utilizada subsequentemente sem ter de determinar isso dos primeiros princípios. Por exemplo, quando um usuário retornar a um ambiente no qual ele anteriormente utilizou o dispositivo, isso será automaticamente detectado e a BRIR armazenada é recuperada e utilizada para gerar o sinal de saída biauricular. Somente se não houver BRIR adequada disponível, será necessário gerar uma nova (que pode ser, então, armazenada). Essa abordagem pode reduzir a complexidade e o recurso de processamento.
Em algumas realizações, o processador de sinal biauricular 401 compreende dois blocos de processamento de sinal. Um primeiro bloco pode realizar o processamento correspondente a uma função de transferência biauricular de posição virtual predeterminada/fixa. Assim, esse bloco pode processar sinal de entrada, de acordo com uma BRIR, HRIR ou HRTF de referência que podem ser geradas com base nas 5 medições de referência, por exemplo, durante o projeto do sistema. 0 segundo bloco de processamento de sinal pode ser disposto para realizar simulação de ambiente em resposta ao parâmetro de ambiente acústico. Assim, nesse exemplo, a função de transferência biauricular geral inclui uma contribuição de BRIR, HRIR ou HRTF fixas ou predeterminadas e para um processo de simulação de ambiente adaptativo. A abordagem pode reduzir a complexidade e facilitar o projeto. Por exemplo, em muitas realizações, é possivel gerar adaptação de ambiente precisa sem o processamento de simulação de ambiente considerar o posicionamento virtual desejado especifico. Assim, o posicionamento virtual e adaptação de ambiente podem ser separados com cada bloco de processamento de sinal individual tendo de considerar somente esses aspectos.
Por exemplo, a BRIR, HRIR ou HRTF pode ser selecionada para corresponder à posição virtual desejada. O sinal biauricular resultante pode ser, então, modificado para ter uma característica de reverberação que corresponde a do ambiente. Entretanto, esse modificação pode ser considerada 25 independente da posição especifica das fontes de áudio, de modo que somente o parâmetro de ambiente acústico precisa ser considerado. Essa abordagem pode facilitar significativamente a simulação e adaptação de ambiente.
O processamento individual pode ser realizado em 30 paralelo ou em série. A FIGURA 5 ilustra um exemplo onde um processamento de HRTF fixo 501 e um processamento de simulação de ambiente adaptativo variável 503 são aplicados ao sinal de áudio em paralelo. Os sinais resultantes são, então, combinados por uma simulação simples 505. A FIGURA 6 ilustra um exemplo onde um processamento de HRTF fixo 601 e um processamento de simulação de ambiente adaptativo variável 603 são realizados em série, de modo que o processamento de simulação de ambiente adaptativo seja aplicado ao sinal biauricular gerado pelo processamento de HRTF. Será apreciado que, em outras realizações, a ordem do processamento pode ser reversa.
Em algumas realizações, pode ser vantajoso aplicar o processamento de HRTF fixo individualmente a cada canal e aplicar o processamento de simulação de ambiente adaptativo variável uma vez, em uma mistura de todos os canais em paralelo.
O processador de sinal biauricular 401 pode especificamente tentar modificar a função de transferência biauricular, de modo que o sinal biauricular de saida do sistema de áudio tenha características que se assemelha mais proximamente à(s) característica(s) refletidas pelo parâmetro de ambiente acústico. Por exemplo, para um parâmetro de ambiente acústico que indica um alto tempo de reverberação, o tempo de reverberação do sinal biauricular de saida gerado é aumentado. Na maioria das realizações, uma característica de reverberação é um parâmetro particularmente adequado de adaptar para prover uma correlação mais próxima entre o som virtual gerado e o ambiente acústico.
Isso pode ser alcançado ao modificar o processamento de sinal de simulação de ambiente 503, 603 do processador de sinal biauricular 401.
Em particular, o processamento de sinal de simulação de ambiente 503, 603 pode, em muitas realizações, compreender um reverberador que é adaptado em resposta ao parâmetro de ambiente acústico.
O nivel de reflexões antecipadas pode ser controlado ao ajustar o nível de pelo menos parte da resposta de impulso da parte reverberante que inclui as reflexões antecipadas relativas ao nível da HRIR, HRTF ou BRIR.
Assim, um algoritmo de reverberação sintético pode ser controlado com base nos parâmetros de ambiente estimados.
Diversos reverberadores sintéticos são conhecidos e será apreciado que qualquer reverberador assim adequado pode ser utilizado.
A FIGURA 7 apresenta um exemplo especifico do bloco de processamento de sinal de simulação de ambiente sendo implementado como um reverberador de rede de feedback unitário e, especificamente, como um reverberador Jot.
O processamento de sinal de simulação de ambiente 503, 603 pode proceder para adaptar os parâmetros do reverberador Jot para modificar as características do sinal de saida biauricular. Especificamente, pode modifica uma ou mais das características anteriormente descritas para o parâmetro de ambiente acústico.
De fato, no exemplo do reverberador Jot da FIGURA 7, as densidades modais e de eco podem ser modificadas ao alterar os valores relativos e absolutos dos atrasos (mi). Ao adaptar o valor de ganhos nos loops de feedback, o tempo de reverberação pode ser controlado. Ainda, um Tgo dependente de frequência pode ser controlado ao substituir os ganhos por filtros adequados (hi(z)).
Para reverberações biauriculares, as saídas das N ramificações podem ser combinadas de diferentes formas (ai, βi), tornando possível gerar duas extremidades de reverberação com uma correlação de 0. Um par de filtros projetados unidamente (cl(z), c2(z)) pode ser consequentemente empregado para controlar o ICC das duas saídas de reverberação.
Outro filtro (tL(z), tR(z)) na rede, pode ser utilizado para controlar a equalização espectral da reverberação. Também, o ganho geral da reverberação pode ser incorporada nesse filtro, permitindo, com isso, o controle sobre a proporção entre a parte direta e aparte de 5 reverberação, ou seja, de energia de reverberação relativa a uma energia de som direto.
Os detalhes adicionais sobre o uso de um reverberador Jot, especificamente na relação entre densidade de tempo e frequência e parâmetros de reverberador, e a 10 tradução de um Teo dependente da frequência desejada aos parâmetros de reverberador, pode ser encontrada em Jean-Marc Jot and Antoine Chaigne (1991) Digital delay networks for designing artificial reverberations, proc. 90th AES convention.
Os detalhes adicionais sobre o uso de um reverberador biauricular Jot e especificamente sobre como traduzir a coerência/correlação interauricular desejada e a coloração aos parâmetros de reverberador podem ser encontrados em Fritz Menzer and Christof Faller (2009) Binaural reverberation using a modified Jot reverberator with frequency-dependent interaural coherence matching, proc. 12 6th AES convention.
Em algumas realizações, o parâmetro de ambiente acústico e a função de transferência biauricular podem ser 25 dinamicamente modificados para adaptar continuamente o som interpretado ao ambiente acústico. Entretanto, em outras realizações, a função de transferência biauricular pode ser somente modificada quando o parâmetro de ambiente acústico atender a um critério. Especificamente, a necessidade pode 30 ser de que o parâmetro de ambiente acústico deve diferir em mais de um determinado limite do parâmetro de ambiente acústico que foi utilizado para ajustar os parâmetros de processamento atuais. Assim, em algumas realizações, a função de transferência biauricular é somente atualizada se a alteração na(s) característica(s) de ambiente exceder um determinado nível. Isso pode, em muitos cenários, prover uma experiência de ouvinte aprimorada com uma interpretação de 5 som mais estática.
Em algumas realizações, a modificação da função de transferência biauricular pode ser instantânea. Por exemplo, se um. tempo de reverberação diferente for subitamente medido (por exemplo, devido ao usuário ter se movimentado para um 10 ambiente diferente), o sistema pode alterar imediatamente o tempo de reverberação para a interpretação de som para corresponder a isso. Entretanto, em outras realizações, o sistema pode ser disposto para restringir a velocidade de alteração e, portanto, para modificar gradualmente a função 15 de transferência biauricular. Por exemplo, a transição pode ser gradualmente implementada por um intervalo de tempo de, digamos, 1-5 segundos. A transição pode, por exemplo, ser alcançado por uma interpolação dos valores alvo para a função de transferência biauricular ou pode, por exemplo, ser 20 alcançado por uma transição gradual do valor de parâmetro de ambiente acústico utilizado para adaptar o processamento.
Em algumas realizações, o parâmetro de ambiente acústico medido e/ou os parâmetros de processamento correspondentes podem ser armazenados pelo usuário posteriormente. Por exemplo, o usuário pode selecionar subsequentemente de valores anteriormente determinados. Essa seleção também poderia ser realizada automaticamente, por exemplo, pelo sistema que detecta que as características do atual ambiente refletem proximamente as características 30 medidas anteriormente. Essa abordagem pode ser prática para cenários em que um usuário se movimenta frequentemente para dentro e para fora de um ambiente.
Em algumas realizações, a função de transferência biauricular é adaptada por ambiente. De fato, o parâmetro de ambiente acústico pode refletir características do ambiente como um todo. A função de transferência biauricular é, portanto, atualizada para simular o ambiente e prover a 5 interpretação espacial virtual ao levar em consideração as características de ambiente.
Em algumas realizações, o parâmetro de ambiente acústico pode, entretanto, não somente refletir as características acústicas para o ambiente, mas também pode 10 refletir a posição do usuário dentro do ambiente. Por exemplo, se um usuário estiver próximo a uma parede, a proporção entre as reflexões antecipadas e reverberação tardia pode mudar e o parâmetro de ambiente acústico pode refletir isso. Isso pode fazer com que a função de 15 transferência biauricular seja modificada para prover uma proporção semelhante entre reflexões antecipadas e reverberação tardia. Assim, conforme o usuário se movimenta em direção a uma parede, os ecos antecipados diretos se tornam mais significativos no som interpretado e a 20 extremidade de reverberação é reduzida. Quando o usuário se movimenta para longe da parede, acontece o oposto.
Em algumas realizações, o sistema pode ser disposto para atualizar a função de transferência biauricular em resposta a uma posição do usuário. Isso pode ser feito 25 indiretamente, conforme descrito no exemplo acima.
Especificamente, a adaptação pode ocorrer indiretamente ao determinar um parâmetro de ambiente acústico que é dependente da posição do usuário e, especificamente, que é dependente da posição do usuário dentro de um ambiente.
Em algumas realizações, um parâmetro deposição indicativo de uma posição do usuário pode ser gerado e utilizado para adaptar a função de transferência biauricular. Por exemplo, uma câmera pode ser instalada e utilizar técnicas de detecção visual para localizar um usuário no ambiente. A estimativa de posição correspondente pode ser, então, transmitida ao sistema de áudio (por exemplo, utilizando comunicações sem fio) e pode ser utilizada para adaptar a função de transferência biauricular.
Será apreciado que a descrição acima, para clareza, descreveu realizações da invenção com referência a diferentes circuitos funcionais, unidades e processadores. Entretanto, será aparente que qualquer distribuição adequada de funcionalidade entre diferentes circuitos funcionais, unidades ou processadores podem ser utilizados sem depreciar a invenção. Por exemplo, a funcionalidade ilustrada a ser realizada por processadores ou controladores separados pode ser realizada pelo mesmo processador ou controladores. Com isso, referências a unidades ou circuitos funcionais específicos devem ser somente vistas como referências a meios adequados para provisão da funcionalidade descrita, ao invés de serem indicativas de uma estrutura ou organização lógica ou fisica estrita.
A invenção pode ser implementada em qualquer forma adequada, incluindo hardware, software, firmware ou qualquer combinação desses. Ã invenção pode ser opcionalmente implementada, pelo menos de maneira parcial, como software de computador que executa um ou mais processadores de dados e/ou processadores de sinal digital. Os elementos e componentes de uma realização da invenção podem ser fisica, funcional e logicamente implementados de qualquer forma adequada. De fato, a funcionalidade pode ser implementada em uma única unidade, em uma pluralidade de unidades ou como partes de outras unidades funcionais. Como tal, a invenção pode ser implementada em uma única unidade ou pode ser fisica e funcionalmente distribuída entre diferentes unidades, circuitos e processadores.
Embora a presente invenção tenha sido descrita em conexão com algumas realizações, ela não é destinada a ser limitada à forma especifica aqui estabelecida. Ao contrário, o escopo da presente invenção é limitado somente pelas 5 reivindicações anexas. Adicionalmente, embora um aspecto possa parecer ser descrito em conexão com as realizações particulares, um técnico no assunto reconhecerá que diversos aspectos das realizações descritas podem ser combinados de acordo com a invenção. Nas reivindicações, o termo 10 compreendendo não exclui a presença de outros elementos ou etapas.
Além disso, embora listados individualmente, uma pluralidade de meios, elementos, circuitos ou etapas de método podem ser implementados, por exemplo, por um único 15 circuito, unidade ou processador. Adicionalmente, embora os aspectos individuais possam ser incluídos em diferentes reivindicações, eles podem ser possivelmente combinados de maneira vantajosa e a inclusão em diferentes reivindicações não implica que uma combinação de aspectos não seja viável 20 e/ou vantajosa. Também, a inclusão de um aspecto em uma categoria de reivindicações não implica em uma limitação a essa categoria, mas, ao contrário, indica que o aspecto é igualmente aplicável a outras categorias de reivindicação, conforme apropriado. Além disso, a ordem dos aspectos nas 25 reivindicações não implica qualquer ordem especifica na qual os aspectos devem ser trabalhados e, em particular, a ordem das etapas individuais em uma reivindicação do método não implica que as etapas devam ser realizadas nessa ordem, ao contrário, as etapas podem ser realizadas em qualquer ordem 30 adequada. Além disso, as referências em singular não excluem uma pluralidade. Assim, as referências a "um", "uma", "primeiro(a)", "segundo(a)" etc não impedem uma pluralidade. Os sinais de referência nas reivindicações são providos meramente como um exemplo de esclarecimento e não devem ser construídos como limitantes do escopo das reivindicações de forma alguma.

Claims (14)

1. SISTEMA DE ÁUDIO, caracterizado por compreender: um receptor (301) para receber um sinal de áudio; um circuito biauricular (303) para gerar um sinal de saída biauricular ao processar o sinal de áudio, o processamento sendo representativo de uma função de transferência biauricular que provê uma posição de origem de som virtual para o sinal de áudio, em que a dita função de transferência biauricular corresponde a uma Resposta de Impulso Ambiente Biauriculares; um circuito de medição (307) para gerar dados de medição indicativos de uma característica de um ambiente acústico; um circuito de determinação (311) para determinar um parâmetro de ambiente acústico em resposta aos dados de medição; e um circuito de adaptação (313) para adaptar a função de transferência biauricular em resposta ao parâmetro de ambiente acústico, em que o circuito de adaptação (313) é disposto para atualizar dinamicamente a função de transferência biauricular para corresponder ao ambiente acústico.
2. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, em que o parâmetro de ambiente acústico é caracterizado por compreender um parâmetro de reverberação para o ambiente acústico.
3. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, em que o parâmetro de ambiente acústico é caracterizado por compreender pelo menos um dentre: - um tempo de reverberação; - uma energia de reverberação relativa a uma energia de trajeto direto; - um espectro de frequência de pelo menos parte de uma resposta de impulso ambiente; - uma densidade modal de pelo menos parte de uma resposta de impulso ambiente; - uma densidade de eco de pelo menos parte de uma resposta de impulso ambiente; - uma coerência ou correlação interauricular; - um nível de reflexões antecipadas; e - uma estimativa de tamanho de ambiente.
4. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado pelo circuito de adaptação (313) ser disposto para adaptar uma característica de reverberação da função de transferência biauricular.
5. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado pelo circuito de adaptação (313) ser disposto para adaptar pelo menos uma das seguintes características da função de transferência biauricular: - um tempo de reverberação; - uma energia de reverberação relativa a uma energia de som direto; - um espectro de frequência de pelo menos parte da função de transferência biauricular; - uma densidade modal de pelo menos parte da função de transferência biauricular; - uma densidade de eco de pelo menos parte da função de transferência biauricular; - uma coerência ou correlação interauricular; e - um nível de reflexões antecipadas de pelo menos parte da função de transferência biauricular.
6. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, em que o processamento é caracterizado por compreender uma combinação de uma função de transferência biauricular predeterminada e uma função de transferência biauricular variável adaptada em resposta ao parâmetro de ambiente acústico.
7. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado pelo circuito de adaptação (313) ser disposto para modificar a função de transferência biauricular somente quando a característica de ambiente atender a um critério.
8. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado pelo circuito de adaptação ser disposto para modificar gradualmente ao longo de um intervalo de tempo a função de transferência biauricular.
9. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado por ainda compreender: um armazenamento de dados para armazenar dados de função de transferência biauricular; um circuito para recuperar dados de função de transferência biauricular do armazenamento de dados em resposta ao parâmetro de ambiente acústico; e em que o circuito de adaptação é disposto para adaptar a função de transferência biauricular em resposta aos dados de função de transferência biauricular recuperados.
10. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado por ainda compreender: um circuito de sinal de teste disposto para radiar um sinal de teste de som no ambiente acústico; e em que o circuito de medição (307) é disposto para capturar um sinal sonoro recebido no ambiente, o sinal de áudio recebido compreendendo um componente de sinal que se origina do sinal de teste de som radiado; e o circuito de determinação (311) é disposto para determinar o parâmetro de ambiente acústico em resposta ao sinal de teste de som.
11. SISTEMA DE ÁUDIO, de acordo com a reivindicação 10, caracterizado pelo circuito de determinação (311) ser disposto para determinar uma resposta de impulso ambiente em resposta ao sinal sonoro recebido e para determinar o parâmetro de ambiente acústico em resposta a resposta de impulso ambiente.
12. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, caracterizado pelo circuito de adaptação (313) ser ainda disposto para atualizar a função de transferência biauricular em resposta a uma posição do usuário.
13. SISTEMA DE ÁUDIO, de acordo com a reivindicação 1, em que o circuito biauricular (303) é caracterizado por compreender um reverberador; e o circuito de adaptação (313) é disposto para adaptar um processamento de reverberação do reverberador em resposta ao parâmetro de ambiente acústico.
14. MÉTODO DE OPERAÇÃO PARA UM SISTEMA DE ÁUDIO, sendo o método é caracterizado por compreender: recepção de um sinal de áudio; geração de um sinal de saída biauricular ao processar o sinal de áudio, o processamento sendo representativo de uma função de transferência biauricular que provê uma posição de origem de som virtual para o sinal de áudio, em que a dita função de transferência biauricular corresponde a uma Resposta de Impulso Ambiente Biauriculares; geração de dados de medição indicativos de uma característica de um ambiente acústico; determinação de um parâmetro de ambiente acústico em resposta aos dados de medição; e adaptação da função de transferência biauricular em resposta ao parâmetro de ambiente acústico, a dita adaptação sendo disposta para atualizar dinamicamente a função de transferência biauricular para corresponder ao ambiente acústico.
BR112013017070-0A 2011-01-05 2012-01-03 Sistema de áudio e método de operação para um sistema de áudio BR112013017070B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11150155 2011-01-05
EP11150155.7 2011-01-05
PCT/IB2012/050023 WO2012093352A1 (en) 2011-01-05 2012-01-03 An audio system and method of operation therefor

Publications (2)

Publication Number Publication Date
BR112013017070A2 BR112013017070A2 (pt) 2019-04-30
BR112013017070B1 true BR112013017070B1 (pt) 2021-03-09

Family

ID=45470627

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112013017070-0A BR112013017070B1 (pt) 2011-01-05 2012-01-03 Sistema de áudio e método de operação para um sistema de áudio

Country Status (8)

Country Link
US (1) US9462387B2 (pt)
EP (1) EP2661912B1 (pt)
JP (1) JP5857071B2 (pt)
CN (1) CN103329576B (pt)
BR (1) BR112013017070B1 (pt)
RU (1) RU2595943C2 (pt)
TR (1) TR201815799T4 (pt)
WO (1) WO2012093352A1 (pt)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
TWI481892B (zh) * 2012-12-13 2015-04-21 Ind Tech Res Inst 脈波雷達測距裝置及其測距演算法
WO2014146668A2 (en) * 2013-03-18 2014-09-25 Aalborg Universitet Method and device for modelling room acoustic based on measured geometrical data
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
KR102150955B1 (ko) 2013-04-19 2020-09-02 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
EP2997327B1 (en) * 2013-05-16 2016-12-07 Koninklijke Philips N.V. Apparatus and method for determining a room dimension estimate
EP2830043A3 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for Processing an Audio Signal in accordance with a Room Impulse Response, Signal Processing Unit, Audio Encoder, Audio Decoder, and Binaural Renderer
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
EP3767970B1 (en) 2013-09-17 2022-09-28 Wilus Institute of Standards and Technology Inc. Method and apparatus for processing multimedia signals
CN103607669B (zh) * 2013-10-12 2016-07-13 公安部第三研究所 一种楼宇对讲***音频传输特性检测方法及检测***
CN108347689B (zh) 2013-10-22 2021-01-01 延世大学工业学术合作社 用于处理音频信号的方法和设备
CN104661169B (zh) * 2013-11-25 2018-11-06 深圳中电长城信息安全***有限公司 一种音频测试方法和装置
CN106416302B (zh) 2013-12-23 2018-07-24 韦勒斯标准与技术协会公司 生成用于音频信号的滤波器的方法及其参数化装置
US10382880B2 (en) 2014-01-03 2019-08-13 Dolby Laboratories Licensing Corporation Methods and systems for designing and applying numerically optimized binaural room impulse responses
WO2015102920A1 (en) * 2014-01-03 2015-07-09 Dolby Laboratories Licensing Corporation Generating binaural audio in response to multi-channel audio using at least one feedback delay network
ES2837864T3 (es) 2014-01-03 2021-07-01 Dolby Laboratories Licensing Corp Generación de audio binaural en respuesta a un audio multicanal que usa al menos una red de retardo de retroalimentación
CN104768121A (zh) * 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
EP3122073B1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
US9860668B2 (en) 2014-04-02 2018-01-02 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
DE102014210215A1 (de) * 2014-05-28 2015-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Ermittlung und Nutzung hörraumoptimierter Übertragungsfunktionen
US20150376931A1 (en) * 2014-06-30 2015-12-31 Uri El Zur Systems and methods for adaptive opening management
US9892721B2 (en) * 2014-06-30 2018-02-13 Sony Corporation Information-processing device, information processing method, and program
US20170142178A1 (en) * 2014-07-18 2017-05-18 Sony Semiconductor Solutions Corporation Server device, information processing method for server device, and program
WO2016024847A1 (ko) 2014-08-13 2016-02-18 삼성전자 주식회사 음향 신호를 생성하고 재생하는 방법 및 장치
EP3550859B1 (en) 2015-02-12 2021-09-15 Dolby Laboratories Licensing Corporation Headphone virtualization
CN112492501B (zh) 2015-08-25 2022-10-14 杜比国际公司 使用呈现变换参数的音频编码和解码
US9734686B2 (en) * 2015-11-06 2017-08-15 Blackberry Limited System and method for enhancing a proximity warning sound
KR102640940B1 (ko) 2016-01-27 2024-02-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 음향 환경 시뮬레이션
US10038967B2 (en) 2016-02-02 2018-07-31 Dts, Inc. Augmented reality headphone environment rendering
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US10142755B2 (en) * 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
US9591427B1 (en) * 2016-02-20 2017-03-07 Philip Scott Lyren Capturing audio impulse responses of a person with a smartphone
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9881619B2 (en) 2016-03-25 2018-01-30 Qualcomm Incorporated Audio processing for an acoustical environment
US9906851B2 (en) 2016-05-20 2018-02-27 Evolved Audio LLC Wireless earbud charging and communication systems and methods
GB201609089D0 (en) 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
US9584946B1 (en) * 2016-06-10 2017-02-28 Philip Scott Lyren Audio diarization system that segments audio input
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US10028071B2 (en) * 2016-09-23 2018-07-17 Apple Inc. Binaural sound reproduction system having dynamically adjusted audio output
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US10242449B2 (en) * 2017-01-04 2019-03-26 Cisco Technology, Inc. Automated generation of pre-labeled training data
EP3569000B1 (en) 2017-01-13 2023-03-29 Dolby Laboratories Licensing Corporation Dynamic equalization for cross-talk cancellation
JP6791001B2 (ja) * 2017-05-10 2020-11-25 株式会社Jvcケンウッド 頭外定位フィルタ決定システム、頭外定位フィルタ決定装置、頭外定位決定方法、及びプログラム
EP3410747B1 (en) * 2017-06-02 2023-12-27 Nokia Technologies Oy Switching rendering mode based on location data
CN109286889A (zh) * 2017-07-21 2019-01-29 华为技术有限公司 一种音频处理方法及装置、终端设备
US10939222B2 (en) * 2017-08-10 2021-03-02 Lg Electronics Inc. Three-dimensional audio playing method and playing apparatus
CA3078420A1 (en) * 2017-10-17 2019-04-25 Magic Leap, Inc. Mixed reality spatial audio
CN108269578B (zh) * 2018-02-05 2019-10-18 百度在线网络技术(北京)有限公司 用于处理信息的方法和装置
CN111713091A (zh) 2018-02-15 2020-09-25 奇跃公司 混合现实虚拟混响
US10863300B2 (en) * 2018-06-18 2020-12-08 Magic Leap, Inc. Spatial audio for interactive audio environments
CN110677802B (zh) * 2018-07-03 2022-05-13 百度在线网络技术(北京)有限公司 用于处理音频的方法和装置
CN113115175B (zh) * 2018-09-25 2022-05-10 Oppo广东移动通信有限公司 3d音效处理方法及相关产品
TW202041053A (zh) * 2018-12-28 2020-11-01 日商索尼股份有限公司 資訊處理裝置、資訊處理方法及資訊處理程式
WO2020231883A1 (en) * 2019-05-15 2020-11-19 Ocelot Laboratories Llc Separating and rendering voice and ambience signals
US10645520B1 (en) * 2019-06-24 2020-05-05 Facebook Technologies, Llc Audio system for artificial reality environment
WO2021002862A1 (en) 2019-07-03 2021-01-07 Hewlett-Packard Development Company, L.P. Acoustic echo cancellation
JP7362320B2 (ja) * 2019-07-04 2023-10-17 フォルシアクラリオン・エレクトロニクス株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
EP4011099A1 (de) * 2019-08-06 2022-06-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System und verfahren zur unterstützung von selektivem hören
GB2588171A (en) * 2019-10-11 2021-04-21 Nokia Technologies Oy Spatial audio representation and rendering
GB2593419A (en) 2019-10-11 2021-09-29 Nokia Technologies Oy Spatial audio representation and rendering
JP7446420B2 (ja) 2019-10-25 2024-03-08 マジック リープ, インコーポレイテッド 反響フィンガプリント推定
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
JP7409121B2 (ja) * 2020-01-31 2024-01-09 ヤマハ株式会社 管理サーバー、音響チェック方法、プログラム、音響クライアントおよび音響チェックシステム
JP7447533B2 (ja) * 2020-02-19 2024-03-12 ヤマハ株式会社 音信号処理方法および音信号処理装置
JP2021131434A (ja) * 2020-02-19 2021-09-09 ヤマハ株式会社 音信号処理方法および音信号処理装置
US11456006B2 (en) * 2020-05-14 2022-09-27 Apple Inc. System and method for determining audio output device type

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4188504A (en) * 1977-04-25 1980-02-12 Victor Company Of Japan, Limited Signal processing circuit for binaural signals
DE4328620C1 (de) 1993-08-26 1995-01-19 Akg Akustische Kino Geraete Verfahren zur Simulation eines Raum- und/oder Klangeindrucks
JPH0787599A (ja) 1993-09-10 1995-03-31 Matsushita Electric Ind Co Ltd 音像移動装置
US5485514A (en) * 1994-03-31 1996-01-16 Northern Telecom Limited Telephone instrument and method for altering audible characteristics
JPH07288900A (ja) * 1994-04-19 1995-10-31 Matsushita Electric Ind Co Ltd 音場再生装置
US6222927B1 (en) * 1996-06-19 2001-04-24 The University Of Illinois Binaural signal processing system and method
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
AUPQ941600A0 (en) * 2000-08-14 2000-09-07 Lake Technology Limited Audio frequency response processing sytem
JP2003009296A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
JP4171675B2 (ja) * 2003-07-15 2008-10-22 パイオニア株式会社 音場制御システム、および音場制御方法
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN100421152C (zh) 2004-07-30 2008-09-24 英业达股份有限公司 声音控制***以及方法
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
KR20060022968A (ko) * 2004-09-08 2006-03-13 삼성전자주식회사 음향재생장치 및 음향재생방법
JP2008513845A (ja) 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
WO2006126161A2 (en) * 2005-05-26 2006-11-30 Bang & Olufsen A/S Recording, synthesis and reproduction of sound fields in an enclosure
EP1974587B1 (en) * 2006-01-03 2010-06-02 SL Audio A/S Me thod and system for equalizing a loudspeaker in a room
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080212A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Controlling the decoding of binaural audio signals
FR2899424A1 (fr) 2006-03-28 2007-10-05 France Telecom Procede de synthese binaurale prenant en compte un effet de salle
US7957548B2 (en) * 2006-05-16 2011-06-07 Phonak Ag Hearing device with transfer function adjusted according to predetermined acoustic environments
US7876903B2 (en) * 2006-07-07 2011-01-25 Harris Corporation Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system
US20080147411A1 (en) * 2006-12-19 2008-06-19 International Business Machines Corporation Adaptation of a speech processing system from external input that is not directly related to sounds in an operational acoustic environment
WO2009046909A1 (en) * 2007-10-09 2009-04-16 Koninklijke Philips Electronics N.V. Method and apparatus for generating a binaural audio signal
CN101184349A (zh) * 2007-10-10 2008-05-21 昊迪移通(北京)技术有限公司 针对双声道耳机设备的三维环响音效技术
JP2009206691A (ja) * 2008-02-27 2009-09-10 Sony Corp 頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
US8885834B2 (en) 2008-03-07 2014-11-11 Sennheiser Electronic Gmbh & Co. Kg Methods and devices for reproducing surround audio signals
JP2008233920A (ja) * 2008-03-28 2008-10-02 Sony Corp 音響再生装置及び音響再生方法
JP5092974B2 (ja) 2008-07-30 2012-12-05 富士通株式会社 伝達特性推定装置、雑音抑圧装置、伝達特性推定方法及びコンピュータプログラム
CA2820208C (en) * 2008-07-31 2015-10-27 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Signal generation for binaural signals
EP2337375B1 (en) * 2009-12-17 2013-09-11 Nxp B.V. Automatic environmental acoustics identification

Also Published As

Publication number Publication date
JP5857071B2 (ja) 2016-02-10
EP2661912B1 (en) 2018-08-22
WO2012093352A1 (en) 2012-07-12
CN103329576B (zh) 2016-12-07
CN103329576A (zh) 2013-09-25
US20130272527A1 (en) 2013-10-17
EP2661912A1 (en) 2013-11-13
RU2013136390A (ru) 2015-02-10
BR112013017070A2 (pt) 2019-04-30
JP2014505420A (ja) 2014-02-27
RU2595943C2 (ru) 2016-08-27
US9462387B2 (en) 2016-10-04
TR201815799T4 (tr) 2018-11-21

Similar Documents

Publication Publication Date Title
BR112013017070B1 (pt) Sistema de áudio e método de operação para um sistema de áudio
US10334380B2 (en) Binaural audio processing
CN106576203B (zh) 确定和使用房间优化传输函数
JP4850948B2 (ja) 空間効果を考慮に入れたバイノーラル合成のための方法
AU2001239516B2 (en) System and method for optimization of three-dimensional audio
JP6433918B2 (ja) バイノーラルのオーディオ処理
US10341799B2 (en) Impedance matching filters and equalization for headphone surround rendering
US20120201405A1 (en) Virtual surround for headphones and earbuds headphone externalization system
US20060056638A1 (en) Sound reproduction system, program and data carrier
AU2001239516A1 (en) System and method for optimization of three-dimensional audio
CN112005559B (zh) 改进环绕声的定位的方法
BR122020013603B1 (pt) Método e sistema para gerar um sinal binaural em resposta a um conjunto de canais de um sinal de entrada de áudio multicanal
WO2014091375A1 (en) Reverberation processing in an audio signal
KR20210059758A (ko) 실제 실내에 가상 3d 오디오를 적용하는 장치 및 방법
US20160044432A1 (en) Audio signal processing apparatus

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS N.V. (NL)

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS N.V. (NL)

B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 03/01/2012, OBSERVADAS AS CONDICOES LEGAIS.