PT1141948E - Processo e dispositivo para suprimir ruido de modo adaptativo. - Google Patents

Processo e dispositivo para suprimir ruido de modo adaptativo. Download PDF

Info

Publication number
PT1141948E
PT1141948E PT00902355T PT00902355T PT1141948E PT 1141948 E PT1141948 E PT 1141948E PT 00902355 T PT00902355 T PT 00902355T PT 00902355 T PT00902355 T PT 00902355T PT 1141948 E PT1141948 E PT 1141948E
Authority
PT
Portugal
Prior art keywords
signal
power
signals
frequency band
noise
Prior art date
Application number
PT00902355T
Other languages
English (en)
Inventor
Ravi Chandran
Bruce E Dunne
Daniel J Marchok
Original Assignee
Tellabs Operations Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tellabs Operations Inc filed Critical Tellabs Operations Inc
Publication of PT1141948E publication Critical patent/PT1141948E/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

Descrição "Processo e dispositivo para suprimir ruido de modo adaptativo" A presente invenção refere-se à supressão de ruído em sistemas de telecomunicações. Em particular, a presente invenção refere-se à supressão de ruído em sistemas de um só canal ou canais simples em sistemas de canais múltiplos. 0 melhoramento na qualidade da voz é uma característica importante nos sistemas de comunicação de voz. Os telefones celulares, por exemplo, são frequentemente utilizados na presença de elevados níveis de ruído de fundo ambiental presentes nos veículos em movimento. 0 ruído de fundo provoca a degradação significativa da qualidade da voz no receptor da extremidade afastada, tornando a voz pouco audível. Em tais circunstâncias, podem ser empregues as técnicas de melhoramento de voz para melhorar a qualidade da voz recebida, aumentando deste modo a satisfação do cliente e encorajando tempos de conversação maiores.
Os sistemas anteriores da supressão de ruído utilizavam tipicamente alguma variação da subtracção espectral. A figura 1 apresenta um exemplo de um sistema de supressão de ruído 100 que utiliza a subtracção espectral. Uma decomposição espectral do sinal 102 de entrada com ruído que contém a voz é primeiro executada utilizando o banco de filtros 104. O banco de filtros 104 pode ser um banco de filtros passa-banda tais como, por exemplo, os filtros passa-banda descritos em R. J. McAulay e M. L. Malpass, "Spéech Enhancement Using S oft-Decision Noise Suppression Filter" IEEE Trans. Acoust., Speech, Signal Processing, Vol. ASSP-28, número 2 (Abril de 1980), páginas 137 a 145. Neste contexto, ruído refere-se a qualquer sinal indesejável presente no sinal de voz incluindo: 1) ruido de fundo ambiental; 2) eco tal como devido a reflexões acústicas ou reflexões eléctricas em híbridos; 3) ruído mecânico e/ou eléctrico adicionado devido a harware específico tal como sopro de fita num sistema de leitura de voz; e 3) não linearidades devido a, por exemplo, micro-corte e ou quantização do sinal por compressão de voz. O banco de filtros 104 decompõe o sinal em bandas de frequência separadas. Para cada banda, são executadas medições de potência e continuamente atualizadas no tempo no avaliador 106 de potência de sinal com ruído e potência de sinal. Estas medições de potência são utilizadas para determinar o rácio de sinal para ruído (RSR) em cada banda. O detector de actividade de voz 108 é utilizado para distinguir períodos de actividade de voz de períodos de silêncio. A potência de ruído em cada banda de frequência é acualizada somente durante o silêncio enquanto que a potência do sinal com ruído é rastreado a todo o momento. Para cada banda de frequência, é calculado um factor de ganho (atenuação) no computador de ganho 110 com base no RSR da banda para atenuar o sinal no multiplicador de ganho 112. Deste modo, cada banda de frequência do sinal de voz de entrada com ruído é atenuada com base no seu RSR. Neste contexto, o sinal de voz refere-se a um sinal de áudio que pode conter voz, música ou outra informação que transporta sinais de áudio (por exemplo tons de sinalização multi-frequência, pausas de silêncios, e ruído).
Uma abordagem mais sofisticada pode também utilizar um nível global de RSR adicionalmente aos valores RSR individuais para calcular os factores de ganho para cada banda. 0 RSR global é estimado no avaliador 114 RSR global. Os cálculos do factor de ganho para cada banda são executados no computador de ganho 110. A atenuação dos sinais em diferentes bandas é obtida multiplicando o sinal em cada banda pelo factor de ganho correspondente no multiplicador de ganho. Bandas com baixo RSR são atenuadas mais do que bandas de elevado RSR. A quantidade de atenuação é também maior se o RSR global for baixo. 0 âmbito dinâmico possível do RSR do sinal de entrada é alargado. Como tal, o sistema de melhoramento de voz tem que ser passível de processar os sinais de voz muito limpos de telefones de linha física assim como voz com muito ruído de telefones celulares. Após o processo de atenuação, os sinais nas diferentes bandas são recombinados num sinal de saída 116 limpo, único. O sinal de saída resultante 116 irá apresentar uma qualidade perceptível global melhorada.
Neste contexto, o sistema de melhoramento de voz refere-se a um aparelho ou dispositivo que melhora a qualidade de um sinal de voz em termos de percepção humana ou em termos de outro critério tal como precisão do reconhecimento por um dispositivo de reconhecimento de voz, suprimindo, mascarando, cancelando ou retirando ruido ou reduzindo de outro modo os efeitos adversos do ruido. Os sistemas de melhoramento de voz compreendem aparelhos ou dispositivos que modificam um sinal de entrada de modo a, por exemplo: 1) gerar um sinal de voz de largura de banda mais larga de um sinal de voz de largura de banda mais estreita; 2) separar um sinal de entrada em vários sinais de saída com base em certos critérios, por exemplo, separação de voz de diferentes alto-falantes onde um sinal contém uma combinação dos sinais de voz dos alto-falantes; 3) e processar (por exemplo por graduação) diferentes "troços" de um sinal de entrada separadamente e/ou diferentemente, onde um "troço" pode ser um troço do sinal de entrada no tempo (por exemplo nos sistemas de telefone por alta voz) ou pode compreender bandas de frequência particulares (por exemplo em sistemas de audio que amplificam a base), ou ambos. A decomposição do sinal de entrada que contém a voz com ruído pode também ser executada utilizando técnicas de transformação Fourier ou técnicas de transformação de ondas pequenas. A figura 2 apresenta a utilização de técnicas de transformação discretas Fourier (apresentadas como o bloco de gestão de janelas e TFR 202). Aqui, um bloco de amostras de entrada é transformado para o domínio da frequência. A magnitude dos elementos de domínio de frequência complexos são atenuados na unidade de atenuação 108 com base nos princípios da subtracção espectrais descritos acima. A fase dos elementos de domínio de frequência complexos são deixadas sem alteração. Os elementos do domínio de frequência complexo são depois transformados de volta para o domínio do tempo através de uma transformação Fourier discreta inversa no bloco TFRI 204, produzindo o sinal de saída 206. Em vez das técnicas de transformação Fourier, podem ser utilizadas técnicas de transformação de ondas pequenas para decompor o sinal de entrada.
Pode ser utilizado um detector da actividade de voz com sistemas de supressão de ruído. Um tal detector da actividade de voz encontra-se presente, por exemplo, na patente US 4.351.983 atribuída a Crouse et al. Em tais detectores, a potência do sinal de entrada é comparada com um nível limite variável. Se o limite for excedido, o sistema assume que a voz se encontra presente. De outro modo, assume-se que o sinal contem somente ruído de fundo.
Para a maioria das implementações de melhoramento de voz, é desejável minimizar o atraso do processamento. Como tal, a utilização de técnicas de transformação Fourier ou de ondas pequenas para decomposição espectral é indesejável porque estas técnicas introduzem grandes atrasos quando acumulam um bloco de amostras para processamento. É também desejável baixa complexidade de cálculo dado que o sistema de supressão de ruído da rede pode processar vários canais de voz independentes múltiplos simultaneamente. Além disso, limitar os tipos de cálculos para adição, subtracção e multiplicação é preferido para facilitar uma implementação de hardware digital directa assim como para minimizar o processamento numa implementação do ponto fixo do sinal digital a base de processador. A divisão é intensiva em termos de cálculo em processadores de sinais digitais e é também incómodo para implementação directa de hardware digital. Finalmente, as exigências de armazenamento de memória para cada canal devem ser minimizadas devido a necessidade de processar simultaneamente vários canais independentes de voz.
As técnicas de melhoramento de voz têm também gue assinalar tons de informação tal como tons de sinalização multi-frequência (multi-frequência de dupla tonalidade). Os tons de sinalização multi-frequência são tipicamente gerados por telefones de teclas/marcação por multi-frequência quando qualquer das teclas é premida. 0 teclado expandido do telefone de marcação por multi-frequência apresenta 16 teclas: (1, 2, 3, 4, 5, 6, 7, 8, 9, 0, *, #, A, B, C, D). As teclas encontram-se proporcionadas numa matriz de quatro por quatro. Pressionar uma das teclas faz com que um circuito electrônico gere dois tons. Tal como apresentado no quadro 1, existe um tom de baixa frequência para cada fila e um tom de alta frequência para cada coluna. Deste modo, as frequência das filas são designadas como grupo baixo e as frequências da coluna como de grupo alto. Deste modo, podem ser gerados dezasseis combinações únicas de tons utilizando somente oito tons únicos. 0 quadro 1 apresenta as teclas e as frequências nominais correspondentes. (Embora descrito em relação aos tons de sinalização multi-frequência, os princípios descritos em relação a presente invenção são aplicáveis a todos os sinais dentro da banda. Neste contexto, um sinal dentro da banda refere-se a qualquer gênero de sinal de tonalidade dentro da largura de banda normalmente utilizada para transmissão de voz tal como, por exemplo, tons de fax, tons de marcação, tons de sinal ocupado, e tons de sinalização multi-frequência).
Quadro 1: Frequências da fila do teclado de marcação por
multi-frequência (grupo baixo) e da co. .una (grupo alto) Baixo/Alto (Hz) 1209 1336 1477 1633 697 1 2 3 A 770 4 5 6 B 852 7 8 9 C 941 * 0 # D
Os tons de sinalização multi-frequência duram tipicamente menos de lOOm milissegundos (ms) e podem ser tão curtos quanto 45 milissegundos. Estes tons podem ser transmitidos durante as chamadas telefónicas para sistemas de resposta automática de vários géneros. Estes tons são gerados por um circuito sinalização multi-frequência separado cuja saída é adicionada ao sinal de voz processado antes da transmissão.
Em geral, os sinais sinalização multi-frequência podem ser transmitidos a uma velocidade máxima de dez dígitos/segundo. A esta velocidade máxima, para cada fenda de tempo de 100 milissegundos, o gerador de tons duplos tem que gerar sinais de marcação por multi-frequência de duração de pelo menos 45 milissegundos e não mais do que 55 ms, e depois permanecer em silêncio durante o resto da fenda do tempo. Quando não transmitido à velocidade máxima, um par de tons pode durar qualquer período de tempo, mas cada par de tons tem de estar separado do próximo por pelo menos 40 ms.
Nos sistemas de melhoramento de voz do passado, contudo, os tons de sinalização multi-frequência eram frequentemente parcialmente suprimidos. A supressão dos tons de sinalização multi-frequência ocorria porque os detectores da actividade de voz e/ou detectores de tons de sinalização multi-frequência exigiam algum atraso antes de serem passíveis de determinar a presença de um sinal. Assim que a presença de um sinal fosse detectada, existia ainda um período de atraso dos factores de ganho para as bandas de frequência apropriadas alcançarem os seus valores correctos (elevados). Este tempo de reacção fazia frequentemente com que a parte inicial dos tons fosse fortemente suprimida. Por isoo os tons de sinalização multi-frequência de duração curta podem ser encurtados ainda mais pelo sistema de melhoramento de voz. A figura 7 apresenta um sinal de entrada 702 que contém um tom 704 de 697 Hz com uma duração de 45 ms (360 amostras) . O sinal de saída 706 é fortemente suprimido inicialmente, até que o detector de actividade de voz detecte a presença do sinal. Depois, o factor de ganho 708 aumenta gradualmente para impedir a atenuação. Deste modo, a saída é uma versão encurtada do tom de entrada, o que neste exemplo, não corresponde as exigências de duração mínima gerais de tons de sinalização multi-frequência.
Como resultado do encurtamento dos tons de sinalização multi-frequência, o receptor pode não detectar os tons de sinalização multi-frequência correctamente devido aos tons não conseguirem corresponder às exigências mínimas de duração. Tal como pode ser visto na figura 7, o factor de ganho 708 nunca alcança o valor máximo de unidade porque é dependente do RSR da banda. Isto faz com que o sinal de saída 706 seja sempre ligeiramente atenuado, o que pode ser suficiente para impedir que a potência do sinal alcance o limite do detector de sinalização multi-frequência do receptor. Além disso, os factores de ganho para diferentes bandas de frequência podem ser suficientemente diferentes de modo a aumentar a diferença nas amplitudes dos tons duplos. Isto aumenta adicionalmente a possibilidade do receptor não detectar correctamente os tons de sinalização multi-frequência .
As desvantagens descritas acima encontravam-se presentes nos sistemas de supressão de ruído do passado. O sistema descrito, por exemplo, na patente US 4.628.529, 4.630.304, e 4.630.305 atribuídas a Borth et al. foi concebido para operar em ambientes de elevado ruído de fundo. Contudo, é preferida a operação sobre um limite alargado de condições RSR. Além disso, é utilizada a divisão de software nos processos Borth. São também utilizadas operações de divisão intensivas em termos de processamento na patente US 4.454.609 atribuída a
Kates. A utilização de avaliadores da amplitude mínima espectral média quadratica do resgisto de erros tal como descrito na patente US 5.012.519 atribuída a Adlersberg et al. são também intensivos em termos de cálculo. Além disso, o sistema descrito em Adlersberg utiliza transformações Fourier para a decomposição espectral que introduzem um atraso indesejável. Além disso, embora esteja presente um gerador de tom de sinalização multi-frequência no relatório do pedido da Texas Instruments, "DTMF Tone Generation and Detection: an Implementation Using ΤΜ&'ΜϋϋΜΜΙ*" 1997, páginas 5 a 12, 20, A-l, A-2, B-l, B-2, não existem quaisquer sistemas que estendam e/ou regenerem tons de sinalização multi-frequência suprimidos. Há muito que existe uma necessidade da indústria de um sistema de supressão da ruído que apresente baixa complexidade de cálculo. Além disso, sempre existiu uma necessidade na indústria de um sistema de supressão de ruído passível de estender e/ou regenerar tons de sinalização multi-frequência parcialmente suprimidos. A presente invenção, tal como definido pelas reivindicações independentes anexas, propõe um dispositivo para melhorar a qualidade de um sinal de comunicação num sistema de comunicações. Compreende um processador adaptado para executar os passos de, dividir o sinal de comunicação em vários sinais de banda de frequência; gerar o primeiro sinal de potência para um primeiro sinal de banda de frequência, cujo primeiro sinal de potência é baseado na estimativa durante um primeiro periodo de tempo da potência do primeiro sinal de banda de frequência; gerar um segundo sinal de potência para o primeiro sinal da banda de frequência, cujo segundo sinal de potência é baseado na estimativa durante um segundo periodo de tempo menor do que o primeiro periodo de tempo da potência do primeiro sinal da banda de frequência; gerar um sinal de condição que representa uma condição do primeiro sinal da banda de frequência em resposta a relacionamentos predeterminados entre o primeiro e segundo sinais de potência; ajustar o ganho do sinal da banda de frequência em resposta ao sinal da condição para gerar um sinal de banda de frequência ajustado; e combinar o sinal da banda de frequência ajustado com pelo menos um sinal de banda de frequência adicional para gerar um sinal de comunicação ajustado. 0 sinal de condição é um rácio de ruido para o sinal (RSR) gerado em resposta a um relacionamento aritmético predeterminado que compreende pelo menos uma adição, subtração e multiplicação mas sem divisão, entre valores derivados do primeiro e segundo sinais de potência. A invenção refere-se também a um dispositivo para melhorar um sinal de comunicação num sistema de comunicações, compreendendo um processador adaptado para executar o processo acima. Dispositivos e processos da invenção podem ser adaptados para processar tons de informação tal como tons de sinalização multi-frequência; para tons de sinalização multi-frequência parcialmente suprimidos; e para regenerar tons de sinalização multi-frequência parcialmente suprimidos.
Os dispositivos de acordo com a presente invenção podem utilizar um banco de filtros, de filtros passa-banda, para dividir o sinal de entrada com ruido que contém a voz em bandas de frequência separadas. Para determinar se o sinal de entrada contém voz, os tons de sinalização multi-frequência ou silêncio, pode ser utilizado um detector conjunto da actividade de voz e de actividade da sinalização multi-frequência (DCAVAM).
Na prática da invenção, é normalmente calculado um rácio médio qlobal de sinal pata ruido (RRS) do sinal de entrada de estimativa da potência média do sinal com ruido no sinal de entrada durante a actividade da voz e a potência média de ruido durante o silêncio. Em vez da medição directa do sinal com ruido e medições de potência de ruido para cada banda de frequência tal como é geralmente executado em sistemas de supressão de ruido, são executadas duas medições indirectas de potência para cada banda. Estas medições de potência são denominadas de potência a longo prazo e potência a curto prazo. Estas medições são executadas no avaliador de potência a longo prazo e curto prazo. A potência a longo prazo Θ uma versão escalada da potência do ruido na banda. A potência a curto prazo é uma versão escalada da potência do sinal com ruido na banda. Estas medições à escala da potência podem ser utilizadas para minimizar o âmbito dinâmico necessário para uma implementação de ponto fixo. Isto resulta num rendimento da supressão de ruido superior que se aproxima de uma implementação de ponto flutuante. Os processos de estimativa da potência são adaptados com base na actividade do sinal indicado pelo DCAVAM. 0 número de cálculos necessários para a medição de potência é significativamente reduzido ao subamostrar os sinais em cada banda de frequência antes da medição da potência.
Um adaptador RRS pode ser utilizado para adaptar o RRS para cada banda de frequência com base nas medições de potência a longo prazo e curto prazo, o RRS global e a actividade do sinal indicados pelo DCAVAM. A adaptação RRS é executada sem divisão utilizando um erro de previsão calculado como uma função das medições RRS a longo prazo, a curto prazo e global. Um computador de ganho utiliza estes valores RRS para determinar os factores de ganho para cada banda de frequência. 0 multiplicador de ganho pode depois executar a atenuação de cada banda de frequência. Finalmente, os sinais processados nas bandas de frequência separadas são adicionados no combinador para produzir o sinal de saída limpo. 0 processo acima mencionado de adaptar os valores RRS na presença de voz é diferente daquele utilizado na presença de tons de sinalização multi-frequência. Para os tons de sinalização multi-frequência, o ajuste rápido dos valores RRS para as bandas de frequência apropriadas que contêm os tons de sinalização multi-frequência maximiza a quantidade de tons de sinalização multi-frequência que são passados de modo transparente. No caso de voz, os valores RRS são de preferência mais lentamente adaptados para corresponderem a natureza dos sinais de voz.
As caracteristicas e vantagens adicionais da invenção serão visíveis da seguinte descrição pormenorizada, na gual será feita referência aos desenhos anexos. As figuras representam:
Figura 1 diagrama em bloco de um sistema de supressão de
Figura 2 ruído típico. diagrama em bloco de outro sistema de supressão de ruído típico. Figura 3 diagrama em bloco de um dispositivo de supressão de ruído de acordo com uma forma de realização da presente invenção. Figura 4 diagrama em bloco de um dispositivo para determinar o RSR em dispositivos de acordo com a presente invenção. Figura 5 fluxograma ilustrando um processo para estender os tons de sinalização multi-frequência em dispositivos de acordo com a presente invenção. Figura 6 fluxograma ilustrando um processo para regenerar tons de sinalização multi-frequência em dispositivos de acordo com a presente invenção. F igura7 gráficos ilustrando a supressão de tons de sinalização multi-frequência em sistemas de melhoramento de voz. Figura 8 gráficos ilustrando a extensão em tempo real de tons de sinalização multi-frequência.
Figura 9 diagrama em bloco de uma actividade de voz conjunta e detector de actividade da sinalização multi-frequência em um dispositivo de acordo com a presente invenção.
Em relação agora a figura 3, esta figura apresenta um diagrama em bloco de um dispositivo de supressão de ruído 300. São apresentados um banco de filtros 302, um detector de actividade de voz 304, um contador remanescente 305, e um avaliador global 306 de RRS (rácio de ruído para sinal) encontram-se também presentes. Um avaliador de potência 308, adaptador RRS 310, computador de ganho 312, multiplicador de ganho 314 e um combinador 315. A forma de realização ilustrada na figura 3 apresenta também um sinal de entrada x(n) 316 e sinais de saída Κκ(η) 318, um sinal 320 conjunto de detecção de actividade de voz e de detecção de actividade da sinalização multi-frequência. A figura 3 apresenta também um gerador de tons de sinalização multi-frequência 321. A saída do avaliador 306 de RRS global é o RRS global 322 f (&} '*1 * As estimativas de potência 323 são emitidas do avaliador de potência 308. Os valores RRS 324 adaptados são retirados do adaptador RRS 310. Os factores de ganho 326 são emitidos do computador de ganho 312. Os sinais atenuados 328 são emitidos do multiplicador de ganho 314. Os tons de sinalização multi-frequência 329 regenerados são retirados do gerador de tons de sinalização multi-frequência 321. A figura 3 ilustra também que o avaliador de potência 308 pode opcionalmente compreender um circuito de sub-amostragem 330 e que o avaliador de potência 308 pode opcionalmente emitir as estimativas de potência 323 para o computador de ganho 312.
Na forma de realização ilustrada na figura 3, o banco de filtros 302 acolhe o sinal de entrada 316. A velocidade da amostragem do sinal de voz em, por exemplo, aplicações de telefonia é de normalmente 8 KHz com uma largura de banda Nyquist de 4 KHz. Dado que o canal de transmissão tipicamente apresenta uma largura de 300 a 3400 Hz, o banco de filtros 302 pode ser concebido para somente deixar passar sinais dentro deste limite. Como exemplo, o banco de filtros 302 pode utilizar um banco de filtros passa-banda. Pode ser utilizado um banco de filtros 302 de várias classes ou de uma só classe. Uma implementação do banco de filtros 302 de uma só velocidade utiliza a estrutura do filtro de amostragem de frequência (FAF). A forma de realização preferida utiliza um banco ressoador que consiste numa série de filtros de baixa ordem de resposta por impulsos infinitos ("IIR") Este banco de ressoadores pode ser considerado uma versão modificada da estrutura FAF e apresenta várias vantagens em relação à estrutura FAF. O banco ressoador não exige o filtro de combinação intensivo quanto a memória da estrutura FAF e como resultado exige menos cálculos. A utilização de sinais alternos na estrutura FAF é também eliminada resultando numa complexidade de cálculo reduzida. A função da transferência do k° ressoador pode ser dada por, por exemplo:
Na equação (1) a frequência média de cada ressoador é especificada através de θ*. A largura de banda do ressoador é especificada através de r*. 0 valor de g* é utilizado para ajustar o ganho CC de cada ressoador. Para um banco de ressoadores que compreende quarenta ressoadores que abarcam aproximadamente 300 a 3.400 Hz, as seguintes especificações são apropriadas para as funções de transferência do ressoador com K=3, 4,... 42:
«s 0(2c) A entrada para o banco de ressoadores é assinalada com X(n) enquanto que a saída do ressoador K é assinalada com Xk(n)r em que n é o período da amostra. O factor de ganho 326 para a banda de frequência K pode ser calculado uma vez a cada T amostras como:
Quando o factor de ganho 326 para cada banda de frequência é calculado a cada T amostras, o ganho é "sub-amostrado" dado que não é calculado para cada amostra. (Tal como assinalado pelas linhas a ponteado nas figuras 1-4, vários artigos diferentes de dados, por exemplo factores de ganho 326, podem ser emitidos do dispositivo pertinente. As várias saldas correspondem de preferência a várias bandas secundárias nas guais o sinal de entrada 316 é dividido. 0 factor de ganho irá situar-se entre um valor positivo pegueno, e, e 1 porgue os valores RRS se encontram limitados para se situarem nos limites [0,1-ε]. Colocar o limite inferior do ganho para r reduz os efeitos do "ruído musical" e permite transparência limitada do sinal de fundo. A atenuação do sinal Xk(n) da banda de freguência k° é alcançada multiplicando Xk(n) pelo seu factor de ganho correspondente, Gk(n) em todas as amostras. A soma dos sinais atenuados resultantes y(n) é o sinal de saída limpo 328. A soma dos sinais atenuados 328 pode ser expressa matemáticamente como:
k
Os sinais atenuados 322 podem também ser a escala, por exemplo intensificados ou ampliados, para transmissão adicional. A potência, P(n) na mostra n, de um sinal u (n) de tempo discreto, é estimada aproximadamente por filtrando em passa-baixo o sinal rectifiçado de onda completa. Pode ser utilizado um filtro de primeira ordem IIR para o filtro passa baixo, tal como, por exemplo:
Este filtro IIR apresenta a seguinte função de transferência:
a 0 ganho CC do filtro é H{ 1) = ι~.·β coeficiente β é designado como uma constante de queda. 0 valor da constante de queda determina quanto tempo é que leva para que o valor actual (não zero) da potência caia para uma pequena fracção do valor actual se a entrada for zero, isto é u(n) = 0. Se a constante de queda, β, estiver próxima da unidade, então irá demorar um período relativamente longo até que o valor da potência caia. Se β estiver próximo do zero, então irá demorar um período de tempo relativamente curto até que o valor da potência caia. Deste modo, a constante de queda representa também com que rapidez é que o valor de potência antigo é esquecido e com que rapidez a potência das amostras mais novas de entrada é incorporada. Deste modo, valores grandes de resultam numa janela de estabelecimento de uma média efectiva maior. Neste contexto, a estimativa da potência 323 utilizando uma janela de estabelecimento de uma média relativamente longa, são estimativas de potência a longo prazo, enquanto que as estimativas de potência utilizando uma janela de estabelecimento de uma média efectiva relativamente curta são estimativas de potência a curto prazo.
Dependendo do sinal de interesse, o estabelecimento de uma média mais longa ou mais curta pode ser apropriado para avaliação da potência. A potência da voz, que apresenta um perfil que se altera rapidamente, seria estimada apropriadamente utilizando umo β menor. 0 ruído pode ser considerado estacionário por períodos de tempo mais longos do que a voz. A potência do ruído é por isso de preferência estimada com precisão utilizando uma janela maior para o estabelecimento de uma média (β grande). A forma de realização preferida para avaliação da potência reduz significativamente a complexidade de cálculo sub-amostrando o sinal de entrada para efeitos de estimativa de potência. Isto guer dizer que somente uma amostra de várias amostras T é utilizada para actualizar a potência P(n) . Entre estas atualizações, a avaliação da potência é mantida constante. Este procedimento pode ser expresso matemáticamente como
Este filtro IIR passa-abaixo da primeira ordem é de preferência utilizado para estimar a potência de ruído de fundo média global, e uma medição de potência a longo prazo e a curto prazo para cada banda de frequência. É também de preferência utilizado para medições de potência no DAV 304. A sub-amostragem pode ser obtida através da utilização de, por exemplo, um circuito 330 de sub-amostragem ligado ao avaliador de potência 308. O RSR global (fni na amostra n é definida como:
em que Psie(n) e $m{&) são a potência de sinal média com ruído na presença de voz e potência média do ruído de fundo durante o silêncio, respectivamente. O RSR global é utilizado para influenciar a quantidade de sobre-supressão do sinal em cada banda de frequência. A sobre-supressão melhora a qualidade da voz percepcionada, em especial sob baixas condições globais RSR. A sobre-supressão do sinal é alcançada utilizando o valor RSR global para influenciar o adaptador RRS 310. Além disso, a sobre-supressão no caso de condições elevadas globais de RSR pode ser utilizada para impedir a atenuação desnecessária do sinal. Isto impede a distorção da voz sob elevadas condições de RSR em que o ruído de baixo nível é efectivamente mascarado pela voz. Os pormenores da sobre-supressão e sub-supressão são descritos a seguir. A potência média do sinal com ruído é de preferência estimada durante a actividade da conversação, tal como indicado por DAV 304, de acordo com a fórmula: em que x(n) é o sinal de entrada com ruído que contém voz. A potência média com ruído de fundo é de preferência estimada de acordo com a fórmula:
Em que a PmW) não é permitido exceder PWf (&?'*
Durante o silêncio ou actividade de tons de sinalização multi-frequência como indicado por DAV 304, a medição de potência média do sinal com ruído é de preferência mantida constante, isto é:
P,
Durante a conversação ou actividade de tons de sinalização multi-frequência tal como indicado pelo DAV, a medição de potência média com ruído de fundo é de preferência mantida constante, isto é:
Se o âmbito das amostras de entrada se encontrarem normalizados para +/-1, os valores apropriados para os parâmetros constantes utilizados na forma de realização preferida são
Em que T = 10 é um período possível de sub-amostragem. O nível de potência médio do ruído de fundo é de preferência limitada a Pm,max por duas razões. Primeiro, PBNrmax representa o cenário típico pior do ruído em telefonia celular. Segundo, serão utilizados no adaptador RRS 310 PsiGr(n) e PBN,(n) para influenciar o ajuste do RRS para cada banda de frequência. Limitar Ρβν(λ) proporcionam um meio para controlar a quantidade de influência que o RSR global apresenta no valor RRS para cada banda.
Na forma de realização preferida, é calculado o RRS 322 global em vez do RSR global. 0 RRS global 322 é mais apropriado para a adaptação dos valores RRS da banda de frequência individual. Como um cálculo directo do RRS 322 global envolve uma divisão intensiva quanto ao cálculo de FsgfM} por PSiG, (n), a forma de realização preferida utiliza um processo que proporciona uma aproximação apropriada do RRS 322 global. Além disso, a definição do RR estende-se para ser negativa para indicar níveis globais RRS 322 muito elevados tal como se segue:
Uma forma de realização da invenção utiliza Vi = 2,9127, v* = 1, 45635, ^3 = 0,128, κ.·ι = 14, & = 14 e & = 20. Neste caso, os limites de RRSgl0bai(n) 322 são: O limite superior em RRSglot,al (n) 322 nesta forma de realização é provocado limitando para ser no máximo f&) * O limite inferior surge do facto de Wmlvú - (**)
£ - 1. (Dado que se assumiu que o limite do sinal de entrada se encontra normalizado para +/- 1, ambos e IWftU situam-se sempre entre 0 e 1.) A medição de potência a longo prazo na amostra n, para a Ka banda de frequência é proporcional ao nivel de potência de ruído nessa banda. E uma versão amplificada do nível de potência de ruído actual. A quantidade de amplificação é predeterminada de modo a impedir ou minimizar o transbordo negativo numa implementação do ponto fixo do filtro IIR utilizado para fazer uma estimativa da potência. O transbordo negativo pode ocorrer por o limite dinâmico do sinal de entrada numa banda de frequência durante o silêncio ser baixo. A potência a longo prazo para a Ka banda de frequência é de preferência estimada somente durante o silêncio tal como indicado pelo DAV 304 utilizando o seguinte filtro IIR passa-abaixo de primeira ordem:
Neste caso, a potência a longo prazo não seria actualizada durante a actividade de tons de sinalização multi-frequência ou actividade de voz. Contudo, ao contrário da voz, a actividade de tons de sinalização multi-frequência afecta somente poucas bandas de frequência. Deste modo, numa forma de realização alternativa, as estimativas da potência a longo prazo que correspondem as bandas de frequência que não contêm os tons de sinalização multi-frequência são actualizadas durante a actividade dos tons de sinalização multi-frequência. Nesta forma de realização, as estimativas da potência a longo prazo para bandas de frequência que contêm os tons de sinalização multi-frequência são mantidas constantes, isto é:
Note que a medição da potência a longo prazo encontra-se de preferência sub-amostrada com um período T. Um período de sub-amostragem apropriado é de T = 10 amostras. Um conjunto apropriado de coeficientes de filtro para a equação (13) é:
Nesta forma de realização, o ganho CC do filtro de medição de potência a longo prazo é HLT( 1) = 100. O grande ganho CC proporciona a amplificação necessária para impedir ou minimizar a possibilidade de transbordo negativo da medição da potência a longo prazo. A estimativa de potência a curto prazo utiliza uma janela de estabelecimento de uma média mais curta do que a estimativa de potência a longo prazo. Se a estimativa de potência a curto prazo tiver sido executada utilizando um filtro IIR com coeficientes fixos tal como na equação (7), provavelmente a potência irá variar rápidamente para rastrear as variações de potência do sinal na presença de voz. Durante o silêncio, as variações serão menores mas ainda serão mais do que aquelas da medição da potência a longo prazo. Deste modo, os limites dinâmicos exigidos desta medição de potência serão elevados se forem utilizados coeficientes fixos. Contudo, ao tornar o coeficiente do numerador do filtro IIR proporcional ao RRS da banda de frequência, a medição de potência é realizada em vez disso para rastrear o nível de potência de ruído na banda. A possibilidade de ultrapassagem da capacidade é reduzida ou eliminada, resultando numa medição de potência mais precisa. A forma de realização preferida utiliza um filtro IIR de primeira ordem adaptivo para estimar a potência a curto prazo, na K banda de frequência, uma vez a cada T amostras.
Em que RRSK(n) é o rácio do ruído para sinal (RRS) da ka banda de frequência na amostra n. Este filtro IIR é adaptativo dado que o coeficiente numerador na função de transferência deste filtro é proporcional ao RRSK(n) que depende do tempo e se encontra adaptado ao adaptador RRS 310. Esta estimativa da potência é de preferência executada de todas as vezes independentemente da actividade do sinal indicada pelo DAV 304.
Um período de sub-amostragem apropriado para a medição da potência pode ser, por exemplo, T = 10 amostras. Os coeficientes de filtro apropriados podem ser, por exemplo:
%
Nesta forma de realização, o ganho CC do filtro IIR utilizado para a estimativa da potência a curto prazo é S «*· i ·& y v
Será agora descrito o processo de adaptação dos valores RRS quando os tons de sinalização multi-frequência se encontram ausentes. O RRS de uma banda de frequência encontra-se de preferência adaptado com base na potência a longo prazo, f e a potência a curto prazo, , que corresponde àquela banda assim como ao RRS global, RRSgi0bai (n) A figura 4 ilustra o processo da adaptação RRS para uma única banda de frequência. A figura 4 apresenta o adaptador do factor de compensação 404, o avaliador da potência a longo prazo 308a, o avaliador de potência a curto prazo 308b, e o compensador de potência 404. São também apresentados o factor de compensação 406, avaliador de potência a longo prazo 323a, e o avaliador de potência a curto prazo 323. É também apresentado o erro de previsão 408. O avaliador RRS global 306 θ comum a todas as bandas de frequência. Na forma de realização preferida, o adaptador de factor de compensação 402 é também comum a todas as bandas de frequência para eficiência de cálculo. Contudo, em geral, o adaptador de factor de compensação 402 pode ser concebido para ser diferente para diferentes bandas de frequência. Durante o silêncio, o avaliador da potência a curto prazo 323 numa banda de frequência Θ uma medição do nível de potência de ruído. Na presença de voz, a potência a curto prazo 323b prevê o nível de potência de ruído. Dado que o ruído de fundo é quase estacionário durante curtos períodos de tempo, a potência a longo prazo 323a, que é mantida constante durante os pacotes de voz, proporciona uma boa avaliação da verdadeira potência do ruído de preferência após a compensão por uma graduação. A compensação da graduação é benéfica porque a potência a longo prazo 323a é uma versão amplificada do nível de potência de ruído actual. Deste modo, a diferença entre a potência a curto prazo 323 e a potência a longo prazo compensada proporciona um meio para ajustar o RRS. Esta diferença é denominada de erro de previsão 408. O sinal do erro de previsão 408 pode ser utilizado para aumentar ou diminuir o RRS sem executar uma divisão. A adaptação do RRS para a Ka banda de frequência pode ser executada no adaptador RRS 310 tal como se segue na presença de voz e silêncio (mas de preferência não durante a actividade de tons de sinalização multi-frequência):
ί^ΡΡΐ*(η-1)-Δ] ^ Pn{n)-C{n)Pu(n)>0 min[l (n -1) + A] outro modo (18)
Em que o factor de compensação (o qual é adaptado no adaptador de factor de compensação) para a potência a longo prazo é dado por:
Na equação (18), o sinal do erro de previsão 408, AHilJ - C (n) PlT(n), é utilizado para determinar a direcção do ajuste do RRSK(n) . Nesta forma de realização, a quantidade de ajuste é determinada com base na actividade do sinal indicada pelo DAV. A forma de realização preferida utiliza um grande A na presença de voz e um pequeno A durante o silêncio. A potência da conversação varia rapidamente e um A maior é apropriado para rastrear rapidamente as variações. Durante o silêncio, o ruído de fundo é geralmente variado lentamente e deste modo é suficiente um pequeno valor de A. Além disso, a utilização do pequeno valor A impede que picos de ruído repentinos de curta duração façam com que o RRS aumente demasiado, o que iria permitir que o pico de ruído verta através do sistema de supressão de ruído. É dado a seguir um conjunto apropriado de parâmetros para utilização na equação (18) quando T = 10:
Na forma de realização preferida, o adaptador RRS adapta o RRS de acordo com o estado DAV e a diferença entre a potência do ruído e do sinal. Embora esta forma de realização preferida utilize somente o sinal da diferença entre a potência do ruído e do sinal, a magnitude desta diferença
pode também ser utilizada para variar o RRS. Além disso, o adaptador RRS pode variar o RRS de acordo com um ou mais do seguinte: 1) o estado DAV (por exemplo, uma marca DAV indicando conversação ou ruído); 2) a diferença entre a potência de ruído e a potência do sinal; 3) um rácio da potência do ruído para o sinal (RSR instantâneo); e 4) a diferença entre um RSR instantâneo e um RSR anterior. Por exemplo, A pode variar com base em um ou mais destes quatro factores. Ao adaptar A com base no RRS instantâneo, é proporcionado um efeito de "alinhamento" ou de "estabelecimento de uma média" ao avaliador RRS adaptado.
Numa forma de realização, â pode ser variado de acordo com o seguinte quadro (quadro 1.1):
Quadro 1.1: Quadro de consulta para valores possíveis de Δ utilizados para variar o RRS adaptado_
Grandeza da diferença entre um RRS anterior e um RRS instantâneo na presença de voz Δ Durante a |diferençai < 0,025 0 conversação 0,025 « |diferençai á 0,3 0,025 iidifersmçai > 0,3 títb Durante o Idiferençai « 0,00625 0 silêncio 0,00625 « |diferençai á 0,3 0, 00625 |diferença] * 0,3 0,01 0 RRS global, RRSglobal (n) 322, também pode ser um factor na adaptação do RRS através do factor de compensação C(n)406, dado pela equação (19). Um nível RRS global maior resulta na sobre-acentuação da potência a longo prazo 323a para todas as bandas de frequência. Isto faz com que todos os valores RRS sejam adaptados para níveis mais elevados. Sendo assim, isto irá fazer com que o factor de ganho 326 seja mais baixo para níveis RRS globais mais elevados. A qualidade percepcionada da voz é melhorada por esta sobre-supressão sob níveis de ruído de fundo mais elevados.
Quando o RRSglobal(n) 322 é negativo, o que acontece sob condições de RSR globais muito elevados, o valor RRS para cada banda de frequência nesta forma de realização é colocado a zero. Deste modo, a sub-supressão de níveis muito baixos de ruído é alcançada por tais níveis baixos de ruído serem efectivamente mascarados pela conversação. A relação entre o RRS global 322 e o RRS adaptado 324 nas várias bandas de frequência pode ser descrita como um relacionamento proporcional porque conforme o RRS global 322 aumenta, o RRS adaptado 324 para cada banda aumenta.
Na forma de realização preferida, HLT{1) = 100 e ífsr(l) = 12,8 de modo que / flWCl} = 0,128 na equação (19). Dado que 0,128 £ MS^mésí®) -· 0,064, o limite do factor de compensação é: SSJ92 (21)
Deste modo, nesta forma de realização, a potência a longo prazo é sobre-acentuada em 1,5 vezes o seu valor actual sob condições RSR baixas. Sob condições RSR elevadas, a potência a longo prazo é desacentuada em que C(n) 50,128.
Durante a actividade dos tons de sinalização multi-frequência tal como indicado pelo DAV 304, o processo de adaptar os valores RRS utilizando equações (18) e (19) para as bandas de frequência que contêm os tons não é apropriado. Para as bandas que não contêm os tons de sinalização multi-frequência activos, (18) e (19) continuam de preferência a ser utilizados durante a actividade dos tons de sinalização multi-frequência.
Assim que a actividade da sinalização multi-frequência é detectada, os valores RRS para as bandas de frequência que contêm tons de sinalização multi-frequência são de preferência colocados a zero até que a actividade da sinalização multi-frequência não seja mais detectada. Após o fim da actividade da sinalização multi-frequência, aos valores RRS pode ser permitido serem adaptados tal como descrito acima. 0 detector de actividade de voz ("DAV") 304 determina se o sinal de entrada contém voz ou silêncio. De preferência, o DAV 304 é um detector conjunto de actividade de voz e actividade da sinalização multi-frequência ("DCAVAM"). A detecção de actividade de voz e actividade da sinalização multi-frequência pode continuar independentemente, sendo as decisões dos dois detectores são depois combinadas para formar uma decisão final. Por exemplo, tal como apresentado na figura 9, o DCAVAM 304 pode compreender um detector de actividade de voz 304a, um detector de actividade da sinalização multi-frequência 304b, e um circuito de determinação 304c. Numa forma de realização, o DAV 304a emite um sinal de detecção de voz 902 para o circuito de determinação 304c e o detector de actividade da sinalização multi-frequência emite um sinal da detecção da sinalização multi-frequência 904 para o circuito de determinação 304c. O circuito de determinação 304c determina depois, com base no sinal de detecção de voz 902 e sinal de detecção da sinalização multi-frequência 904, se se encontra actividade de voz ou sinalização multi-frequência ou silêncio no sinal de entrada 316. O circuito de determinação 304c pode determinar o conteúdo do sinal de entrada 316, por exemplo, com base na lógica apresentada no quadro 2 (a seguir). Neste contexto, silêncio refere-se a ausência de conversação ou actividade da sinalização multi-frequência, e pode compreender ruído. 0 detector de actividade de voz pode emitir uma única marca, DAV 320, a qual se encontra colocada, por exemplo, em um, se a conversação for considerada activa e zero se for considerada do outro modo. O detector de actividade da sinalização multi-frequência coloca uma marca, por exemplo sinalização multi-frequência =1, se a actividade da sinalização multi-frequência for detectada e coloca sinalização multi-frequência = 0 se não for detectada. O seguinte quadro (quadro 2) apresenta a lógica que pode ser utilizada para determinar se a actividade da sinalização multi-frequência ou actividade de conversação se encontra presente:
Quadro 2: Lógica para utilização com DCAVAM
Sinalização multi-frequência DAV Decisão 0 0 Silêncio 0 1 Conversação 1 0 Actividade MF presente 1 1 Actividade MF presente
Quando uma tecla de um telefone de marcação por multi-frequência é pressionada, é gerado um par de tons. Um dos tons irá pertencer ao seguinte conjunto de frequências: (697, 770, 852, 941) em Hz, e um será do conjunto (1209, 1336, 1477, 1633) em Hz, tal como indicado acima no quadro 1. Estes conjuntos de frequências são denominadas de frequências do qrupo baixo e do qrupo alto, respectivamente. Deste modo, são possíveis dezasseis pares de tons que correspondem a dezasseis teclas de um teclado de telefone expandido. Os tons deverão ser acolhidos dentro de +/- 2% destes valores nominais. Note que estas frequências foram seleccionadas com cuidado de modo a minimizar a quantidade de interacção harmónica. Além disso, para uma detecção apropriada de um par de tons, a diferença em amplitude entre os tons (denominada 't w i s tr ) tem que se situar dentro de 6dB. O alqoritmo de detecção da sinalização multi-frequência apropriado para detecção de tons de sinalização multi-frequência no DCAVAM 304 é uma versão modificada do algoritmo Goertzel. O algoritmo Goertzel é um processo recursivo de executar a transformação Fourier discreta (TFD) e é mais eficiente do que a TFD ou TFF para um número pequeno de tons. A detecção de tons de sinalização multi-frequência e a regeneração e extensão de tons de sinalização multi-frequência será descrita em maior pormenor a seguir. A detecção da actividade de voz é de preferência executada utilizando as medições de potência na primeira zona do sinal de entrada x(n). No contexto do sinal de voz de telefonia, a primeira zona formante é definida para ser o limite de aproximadamente 300-850Hz. Uma medição de potência a longo prazo e a curto prazo na primeira zona formante é utilizada com equações de diferença dadas por:
¥ If {«). â. {«)
em que F representa o conjunto de bandas de frequência dentro da primeira zona formante. A primeira zona formante é preferida porque contém uma proporção grande da energia da voz e proporciona um meio apropriado para a detecção atempada do inicio do pacote da voz. A medição da potência a longo prazo rastreia o nivel do ruído de fundo no primeiro formante do sinal. A medição da potência a curto prazo rastreia o nivel de sinal da conversação no primeiro formante do sinal. Os parâmetros apropriados para as medições de potência do primeiro formante a longo prazo e curto prazo são:
4 ^
MM
0 DAV 304 pode também utilizar um contador permanente 0 contador permanente é utilizado para manter permanente o estado da saida 320 DAV durante períodos curtos quando a potência no primeiro formante cai para níveis baixos. A primeira potência do formante pode cair para níveis baixos durante paragens curtas e também durante sons consonantes na voz. A saída de DAV 320 é mantida permanente para impedir a conversação seja suprimida inadvertidamente. 0 contador permanente 305 pode ser actualizado do seguinte modo:
Em que os valores apropriados para os parâmetros (quando o limite de x(n) se encontra normalizado para mais ou menos 1) são, por exemplo:
0 valor de il&sAs&is corresponde de preferência a cerca de 150 - 150 ms, isto é E [1200, 20001. A voz é considerada activa (DAV = 1) quando a seguinte condição for satisfeita: (28) h >0
De outro modo a voz é considerada como não estando presente no sinal de entrada (DAV = 0). O dispositivo e processo preferido para detecção de tons de sinalização multi-frequência, por exemplo no DCAVAM, será agora descrito. Embora a forma de realização preferida utilize um dispositivo e processo para detectar tons de sinalização multi-frequência, os princípios descritos em relação aos tons de sinalização multi-frequência são aplicáveis a todos os sinais dentro da banda. Neste contexto, um sinal dentro da banda é qualquer género de sinal de tonalidade dentro da largura de banda normalmente utilizada para transmissão de voz. Os sinais dentro da banda exemplares compreendem tons de fax, tons de sinalização multi-frequência, tons de marcação, e tons de sinal de ocupado.
Dado um bloco de N amostras (em que N é escolhido apropriadamente) do sinal de entrada, u (n), n = 0, 1, 2, ... Λ7— 1, o dispositivo pode ensaiar procurando pela presença de tons próximos de uma frequência particular, ωο, pela correlação das amostras de entrada com um par de tons na quadratura na frequência de ensaio ωο. Os resultados da correlação podem ser utilizados para estimar a potência do sinal de entrada 316 em redor da frequência de ensaio. Este procedimento pode ser expresso pelas seguintes equações:
A equação (3) proporciona a avaliação da potência, p^* em redor da frequência de ensaio A complexidade de cálculo do procedimento referido em (29)-(31) pode ser reduzida a cerca de metade utilizando o algoritmo Goertzel modificado. Tal é indicado a seguir:
(32)
w(N) = 2 cos m$w{N -1) - w(N - 2) +W- p ~ j! a»:
Note que as condições iniciais para a recorrência em (32) são w(-l)=w(-2)=0. 0 procedimento acima nas equações (32)-(34) é de preferência executado para cada uma das oito frequências sinalização multi-frequência e as suas segundas harmónicas para um dado bloco de N amostras. As segundas harmónicas são as frequência que são duas vezes os valores das frequências sinalização multi-frequência. Estas frequência são ensaiadas para assegurar gue os sinais de conversação (que apresentam uma estrutura harmónica), não são confundidos com tons de sinalização multi-frequência. 0 algoritmo Goertzel analisa de preferência os blocos de comprimento N = 102 amostras. Numa velocidade de amostragem preferida de 8 KHz, cada bloco contém sinais de 12,75 ms de duração. Os seguintes ensaios de validação são de preferência conduzidos para detectar a presença de um par de tons de sinalização multi-frequência válido pare num bloco de amostras N: (1) A potência de frequência mais forte do grupo baixo e a frequência do grupo alto mais forte têm que estar ambos acima de um certo limite. (2) A potência da frequência mais forte no grupo baixo tem que ser mais elevada do que os outros três valores de potência no grupo baixo por um certo rácio limite. (3) A potência da frequência mais forte no grupo alto tem de ser mais elevada do que os outros três valores de potência no grupo alto por um certo rácio limite. (4) 0 rácio da potência da frequência mais forte do grupo baixo e a potência da frequência mais forte do grupo alto tem que estar dentro de certos limites superiores e inferiores. (5) 0 rácio dos valores da potência da frequência mais forte do grupo baixo e a sua segunda harmónica tem que exceder um certo rácio limite. (6) 0 rácio dos valores de potência da frequência mais forte do grupo mais elevado e a sua segunda harmónica tem que exceder um certo rácio limite.
Se se conseguir passar os ensaios de validade acima mencionados, pode ser executado um ensaio adicional de confirmação para assegurar que o par do tons de sinalização multi-frequência detectado é estável durante um período de tempo suficientemente longo. Para confirmar a presença de um par de tons de sinalização multi-frequência, o mesmo par de tons de sinalização multi-frequência tem de ser detectado para confirmar que um par de tons de sinalização multi-frequência válido se encontra presente durante um período de tempo suficiente a sequir a um bloqueio do silêncio de acordo com as especificações utilizadas, por exemplo, para três blocos sequidos (de aproximadamente 12,75 ms).
Para proporcionar uma detecção melhorada de tons de sinalização multi-frequência, é utilizado de preferência o algoritmo de detecção modificado Goertzel. Isto é alcançado tirando vantagem do banco de filtros 302 e no dispositivo de supressão de ruído 300 o qual já possuí o sinal de entrada dividido em bandas de frequência separadas. Quando é utilizado o algoritmo Goertzel para estimar a potência próxima de uma frequência de teste, §5$ sofre de pouca rejeição da potência fora das proximidades de ωο. No dispositivo melhorado 300, de modo a estimar a potência próxima de uma frequência de ensaio =¾ o dispositivo 300 utiliza a saída do filtro passa-banda cuja passa-banda contém coo. Ao aplicar o algoritmo Goertzel aos sinais que passaram na banda, é alcançada excelente rejeição da potência nas frequência fora das proximidades de ωο·
Note que o dispositivo 300 utiliza de preferência os ensaios de validade tal como descritos acima em, por exemplo, o DCAVAM 304. O dispositivo 300 pode ou não utilizar o ensaio de confirmação tal como descrito acima. Na forma de realização preferida, é utilizado um processo mais sofisticado (do que o ensaio de confirmação) apropriado para o efeito da extensão de tons de sinalização multi-frequência ou regeneração. Os ensaios de validade são de preferência conduzidos no troço de detecção de actividade da sinalização multi-frequência no detector conjunto de actividade de voz e de sinalização multi-frequência 304. 0 processo e dispositivo para a extensão em tempo real de tons de sinalização multi-frequência será agora descrito em ligação com as figuras 108. Embora a forma de realização preferida utilize um dispositivo e processo para estender tons de sinalização multi-frequência, os princípios descritos em relação aos tons de sinalização multi-frequência são aplicáveis a todos os sinais dentro da banda. Neste contexto, um sinal dentro da banda é qualquer género de sinal de tonalidade dentro da largura da banda normalmente utilizada para a transmissão de voz. Os sinais exemplares dentro da banda compreendem os tons de fax, tons de sinalização multi-frequência, tons de marcação, e tons de sinal ocupado.
Em relação à figura 8, que ilustra o conceito de estender um tom em tempo real, o tom de sinal de entrada 802 tem início aproximadamente na amostra 100 e termina aproximadamente na amostra 460, durando cerca de 45 ms. A marca 804 de actividade sonora, apresentada no gráfico central, indica se um tom foi detectado no último bloco de, por exemplo, N = 102 amostras. Esta marca é o zero até que a amostra 250 em cujo ponto se eleva a um. Isto quer dizer que o bloco da amostra 149 para a amostra 250 foi ensaiado, tendo-se verificado que contém actividade sonora. Note que o bloco anterior da amostra 47 para a amostra 148 foi ensaiado e verificou-se que não contém actividade sonora que contém o tom de entrada (a percentagem de um bloco que tem que conter um tons de sinalização multi-frequência para a marca de actividade sonora para detectar um tom pode por exemplo ser ajustada para um limite predeterminado) . Este bloco é considerado como contendo uma pausa. Os próximos dois blocos de amostras mostraram conter também actividade sonora na mesma frequência. Deste modo, três blocos seguidos de amostras contêm actividade sonora seguida de uma pausa que confirma a presença de um tom da frequência que está a ser ensaiada, (note que na forma de realização preferida, a presença de um tom de grupo baixo e um tom de grupo alto tem que ser simultaneamente confirmada para confirmar a actividade da sinalização multi-frequência). 0 sinal de saída 806 mostra como o tom de entrada é estendido mesmo após o tom de entrada desaparecer aproximadamente na amostra 460. Esta extensão de tom é executada em tempo real, apresentando um tom estendido de preferência a mesma fase, frequência e amplitude que o tom de entrada original. O processo preferido estende um tom de um modo contínuo da fase tal como descrito a seguir. Na forma de realização preferida, o tom estendido irá continuar a manter a amplitude do tom de entrada. O processo preferido tira vantagem da informação obtida guando o algoritmo Goertzel é utilizado para detecção de tom de sinalização multi-frequência. Por exemplo, dado como tom de entrada:
As equações (32) e (33) do algoritmo Goertzel podem ser utilizadas para obter os dois estados w[N-1) e w{N) . Para valores suficientemente grandes de N, pode ser mostrado que são válidas as seguintes expressões:
Verifica-se que w (iV— 1) e w(N) contêm duas amostras consecutivas de um sinosóide com frequência α>ο. A fase e amplitude deste sinosóide apresenta de preferência um relacionamento deterministico para a fase e amplitude do sinosóide de entrada u(n). Deste modo, o gerador do tom de sinalização multi-frequência 321 pode gerar um sinosóide utilizando um oscilador recursivo que corresponde à fase e amplitude do sinosóide de entrada u(n) para periodos de amostra maiores do que N utilizando o seguinte procedimento: (a) Calcular a próxima amostra consecutiva do sinosóide com amplitude Bo-
+ = (2cos%)w(jV)- νν(Ν-1) (b) (b) Gerar duas amostras consecutivas de um sinosóide, W- (n), com a amplitude Ao e fase Φ utilizando w(N - 1) e w{N) , e w{N + 1):
cos con 1 w'(N+l)=-°-w(N)----w(N-l) sm sm w'(N+2) = ÇOSésm í w(N+l)-
Sin<2>n w(N) (c) Utilizar um oscilador recursivo para gerar todas as amostras consecutivas do sinosóide para j = 3, 4, 5,...: w'(N + j) = (2cosa)0)w'(N + j-l)~ w'(N + j - 2) (4¾ A sequência w' (N + j), j = 3, 4, 5, ... pode ser utilizada para estender o sinosóide de entrada u(n) para lá da amostra N.
Assim que as duas frequências de tom de sinalização multi-frequência tiverem sido determinadas pelo detector de actividade da sinalização multi-frequência, por exemplo, o procedimento nas equações (39)-(42) pode ser utilizado para estender cada um dos dois tons. A extensão dos tons será executada por uma combinação ponderada do sinal de entrada com os tons gerados. Uma combinação ponderada é de preferência utilizada para impedir as alterações bruscas na amplitude do sinal, devido a amplitude ligeira e/ou desadaptação da frequência entre os tons de entrada e os tons gerados, que produz ruído impulsivo. A combinação ponderada é de preferência executada do seguinte modo: , (43) j em que u(n) é o sinal de entrada, (fú é o tom gerado pelo grupo baixo, é o tom gerado pelo grupo alto, e p(n) é um parâmetro de ganho que aumenta linearmente de 0 a 1 durante curto período de tempo, de preferência 5 ms ou menos.
No sistema de supressão de ruído, x(n) é a amostra de entrada no momento n para o banco ressoador 302. O banco ressoador 302 divide este sinal num conjunto de sinais de passa-banda {Xk(n)} voltando à equação (4) acima:
Tal como descrito acima, Gk(n) e Xk(n) são factores de ganho e sinal passa-banda da Ka banda de frequência, respectivamente, Y(pn) é a saída do dispositivo de supressão de ruído 300. O conjunto de sinais passa-banda {Xk(n)} pode ser designado colectivamente como sinal de entrada para o processo de extensão do tom de sinalização multi-frequência.
Note que não existe qualquer atraso do bloco introduzido pelo dispositivo de supressão de ruído 300 quando é utilizada a extensão de tom de sinalização multi-frequência porque a amostra de entrada actual para o dispositivo de supressão de ruído 300 é processada e emitida assim que for recebida. Dado que o processo de detecção da sinalização multi-frequência trabalha em blocos de N amostras, nós iremos definir o bloco actual de N amostras como as últimas N amostras recebidas, isto é, {X(n-N) , X(n-N+1), X(n 1) i, 0 bloco anterior irá compreender as amostras {X(n-2N), X(n-2N+1), X(n-N-l)} .
Voltando agora a figura 5, esta figura apresenta um processo exemplar 500 para estender tons de sinalização multi-frequência. Para determinar se os tons de sinalização multi-frequência se encontram presentes, os ensaios de validade do processo de detecção da sinalização multi-frequência são de preferência aplicados a cada bloco. Se for detectado um par de tons de sinalização multi-frequência válido, o digito correspondente é descodificado com base no quadro 1. Na forma de realização preferida, são utilizados os dígitos descodificados que são emitidos do detector de actividade da sinalização multi-frequência (por exemplo o DCAVAM) para os blocos actuais e três blocos de saída anteriores. Neste contexto, a ia saída do detector de actividade da sinalização multi-frequência Θ Di, com o i maior correspondendo a uma saída mais recente. Deste modo, os quatro blocos de saída serão assinalados como Di (isto é, Dl, D2, D3 e D4). Na forma de realização preferida, cada bloco de saída pode apresentar dezassete valores possíveis: os desasseis valores possíveis do teclado ampliado e um valor que indica que nenhum tom de sinalização multi-frequência se encontra presente. Os blocos de saída Di podem ser transmitidos para o gerador de tom de sinalização multi- frequência 321 na detecção de actividade de voz e sinal de detecção da actividade da sinalização multi-frequência 320. 0 quadro de decisão seguinte (quadro 3) é de preferência utilizado para implementar o processo 500 de extensão do tom de sinalização multi-frequência:
Quadro 3: Extensão dos tons de sinalização multi-frequência_
Condição Acção e (D3, D2, Dl valido) e (D4 não válido) ou (D4 # D3) Suprimir os proximos três blocos consecutivos (D4 válido) e (D3, D2, Dl não válido e/ou desigual) Colocar GL(n) = 1 e GH(n) =1 (D4=D3) e (D4, D3 válido) e (D3 # D2) e (D2, Dl não válido e/ou desigual) Substituir o proximo bloco gradualmente com os tons de sinalização multi-frequência gerados utilizando a equação (46) (D4 = D3 = D2) Gerar tons de sinalização multi-frequência psr& substituir tons tmtimsitíâos Todos os outros casos A todos os factores de ganho é permitido variar tal esmo determinado pelo dispositivo de supressão de ruído
Quando o primeiro bloco que contém um par do tons de sinalização multi-frequência válido é detectado, dois factores de ganho do sistema de supressão de ruído, d;. ín> = 1 e Gn(n) que correspondem as bandas de frequência L e H . que contêm os tons do grupo baixo e grupo alto, respectivamente, são colocados em um, por exemplo, na equação (4), isto é
Isto corresponde aos passos 504 e 506 da figura 5. Colocar estes factores de ganho em um assegura que o dispositivo de supressão de ruído 300 não suprima os tons de sinalização multi-frequência após este ponto. Após este bloco, se o próximo ou os dois blocos próximos não resultarem no mesmo dígito descodificado, aos factores de ganho é permitido variar novamente tal como determinado pelo sistema de supressão de ruído, tal como indicado pelo passo 508 da figura 5.
Quando os primeiros dois blocos consecutivos que contêm os dígitos válidos idênticos são descodificados seguido de um bloco que não contém tom de sinalização multi-frequência, o par apropriado de tons que corresponde ao dígito é gerado, por exemplo utilizando equações (39)-(42), e são utilizados para gradualmente substituir os tons de entrada. Isto corresponde aos passos 510 e 512 da figura 5. Os tons de sinalização multi-frequência 329 são de preferência gerados no gerador de tons de sinalização multi-frequência 321. A reduzindo a substituição é de preferência executada contribuição do sinal de entrada, x(n), e aumentando a contribuição dos tons gerados, w'L(n) e w'H(n), para o sinal de saída, y(n), nas próximas amostras M (j = 1, 2, 3, ... M), do seguinte modo: β
Mp*ãmÍíM im)
Note gue não é necessária qualquer divisão na equação (47). A começar com p(n) = 0, a relação p(n + j + 1) = p(n + j) + 1/M pode ser utilizada para actualizar o valor de ganho de cada amostra. Um valor exemplar de M é 40.
Deste modo, numa forma de realização preferida, após receber os primeiros dois blocos consecutivos com dígitos válidos idênticos, as primeiras amostras M do próximo bloco são gradualmente substituídas por tons de sinalização multi-frequência 329 gerados de modo que após as amostras M, a saída y(n) = {n} + w'H(n). Após amostras M, os tons gerados são mantidos até que um par de tons de sinalização multi-frequência não seja mais detectado num bloco. Num tal caso, o atraso na detecção do sinal de tom de sinalização multi-frequência (devido, por exemplo ao comprimento do bloco) é deslocado pelo atraso na detecção do fim do sinal de tom de sinalização multi-frequência. Como resultado, o tom de sinalização multi-frequência é estendido através da utilização de tons de sinalização multi-frequência gerados 329.
Numa forma de realização alternativa, os tons gerados continuam após um tom de sinalização multi-frequência não ser mais detectado, por exemplo durante aproximadamente meio bloco, após um par de tons de sinalização multi-frequência não ser detectado num bloco. Nesta forma de realização, dado que o DCAVAM pode demorar aproximadamente um bloco a detectar um par de tons de sinalização multi-frequência, o gerador de tons de sinalização multi-frequência estende o tom de sinalização multi-frequência aproximadamente um bloco para lá do par de tons de sinalização multi-frequência actual. Deste modo, no evento pouco provável que um par de tons de sinalização multi-frequência seja o cumprimento mínimo detectável, a saída de tom de sinalização multi-frequência deve ser pelo menos o cumprimento do tom de entrada mínima. Seja que forma de realização seja utilizada, o comprimento do período que leva para que o par de tons de sinalização multi-frequência a ser detectado, pode variar com base no processo de detecção DCAVAM e o comprimento do bloco utilizado. Sendo assim, o período de extensão apropriado pode também variar.
Quando três ou mais blocos consecutivos contêm dígitos válidos, o gerador de tons 321 de sinalização multi-frequência gera tons de sinalização multi-frequência 329 para substituir os tons de entrada da sinalização multi-frequência. Isto corresponde aos passos 503 e 514 da figura 5. Uma vez que o gerador de tons de sinalização multi-frequência tiver estendido o par de tons de sinalização multi-frequência, o sinal de entrada é atenuado durante um período apropriado, por exemplo durante aproximadamente três blocos consecutivos de 12,75 ms, para assegurar que existe pausa suficiente a seguir ao sinal de sinalização multi-frequência de saída. Isto corresponde aos passos 515 e 506 da figura 5. Durante o período de atenuação, a saída é dada por
em que p(n) = 0,02 é uma escolha apropriada. Após os três blocos p(n) =1, e o dispositivo de supressão de ruído é permitido determinar os factores de ganho até que a actividade da sinalização multi-frequência seja novamente detectada (tal como indicado pelos passos 508 da figura 5) .
Note que é possível ao bloco actual conter a actividade da sinalização multi-frequência embora o bloco actual esteja agendado para ser suprimido tal como na equação (48) . Isto pode acontecer, por exemplo, quando os pares de tons de sinalização multi-frequência se encontram espaçados pelo período de tempo mínimo permitido. Se o sinal de entrada 316 contiver tons de sinalização multi-frequência legítimos, então os dígitos estarão novamente espaçados por pelo menos três blocos consecutivos de silêncio. Deste modo, somente o primeiro bloco de amostras num par de tom de sinalização multi-frequência válido irá sofrer geralmente de supressão. Isto irá, contudo, ser compensado pela extensão de tom de sinalização multi-frequência.
Voltando agora a figura 6, esta figura apresenta um processo para regenerar tons de sinalização multi-frequência 329. A regeneração de tons de sinalização multi-frequência é uma alternativa à extensão de tons de sinalização multi-frequência. Embora a forma de realização preferida utilize um dispositivo e regenere tons de sinalização multi-frequência, os princípios descritos em relação aos tons de sinalização multi-frequência são aplicáveis a todos os sinais dentro da banda. Neste contexto, um sinal dentro da banda é qualquer género de sinal de tonalidade dentro da largura de banda normalmente utilizada para transmissão de voz. Os sinais exemplares dentro da banda compreendem tons de fax, tons de sinalização multi-frequência, tons de marcação, e tons de sinal ocupado. A regeneração dos tons de sinalização multi-frequência pode ser executada, por exemplo, no gerador do tons de sinalização multi-frequência 321. 0 processo de extensão introduz muito pouco atraso (aproximadamente um bloco na forma de realização ilustrada) mas é ligeiramente mais complicado porque as fases dos tons correspondem para detecção apropriada dos tons de sinalização multi-frequência. 0 processo de regeneração introduz um atraso maior (poucos blocos na forma de realização ilustrada) mas é mais simples dado que não exige que os tons gerados correspondam à fase dos tons de entrada. 0 atraso introduzido em qualquer dos casos é temporário e acontece somente para os tons de sinalização multi-frequência. 0 atraso que faz com que uma pequena quantidade do sinal que segue os tons de sinalização multi-frequência seja suprimido, assegura pausas suficientes a seguir a um par de tons de sinalização multi-frequência. A regeneração da sinalização multi-frequência pode fazer com que um único bloco de sinal de conversação siga dentro de um segundo par de tons de sinalização multi-frequência a ser suprimido. Dado que isto é um evento altamente improvável e somente as primeiras amostras N de conversação sofrem de supressão, Θ contudo pouco provável que tenha lugar qualquer perda de informação útil.
Tal como quando se executa a extensão da sinalização multi-frequência, contudo, o conjunto de sinais {Χκ(η)} pode ser denominado como entrada do processo de regeneração da sinalização multi-frequência. Quando os tons de sinalização multi-frequência 329 são gerados, o sinal de saída do combinador 315 é:
em que é a saída do multiplicador de ganho, W'L (n) e W'H(n) são os tons de grupo baixo e alto gerados (se algum), e (n) e ρ%ίΆ) são factores de ganho adicionais. Quando nenhum sinal de sinalização multi-frequência se encontrar presente no sinal de entrada, Pi(n) = 1 e P2(n) = 0. Durante a regeneração do par de tons de sinalização multi-frequência, P2(n) =1. Se o sinal de entrada tiver que ser suprimido (seja para assegurar silêncio seguido do fim de um par de tons de sinalização multi-frequência regenerado ou durante a regeneração do par de tons de sinalização multi-frequência), então Pi(n) é colocado num valor pequeno, por exemplo pi(n) = 0,02. De preferência são utilizados dois osciladores recursivos 332 para regenerarem os tons de grupo baixo e alto apropriados gue correspondem ao digito descodificado.
Continuando a tomar como referência a figura 6, numa forma de realização exemplar, a regeneração dos tons de sinalização multi-freguência utiliza os blocos actuais e os cinco blocos de saida anteriores do detector de actividade sonora de sinalização multi-frequência (por exemplo no DCAVAM), duas marcas, e dois contadores. Os cinco blocos anteriores e o bloco de saída actual podem ser denominados Dl, D2, D3, D4, D5, e D6, respectivamente. As marcas, a marca SUPPRESS e a marca GENTONES são descritas a seguir em ligação com a acção a desempenhar que eles provocam no gerador de tons de sinalização multi-frequência 321, combinador 315, e/ou o multiplicador de ganho 314. SUPRRESS Acção 1 Reprimir a saída do dispositivo de supressão de ruído colocando Pi(n) para un pequeno valor, por exemplo pi(n)= 0,02 na equação (49) 0 Colocar pi(n) = 1 GENTONES Acção 1 Gerar tons de sinalização multi-frequência e emitir os mesmos colocando p2 (n)= 1 0 Parar de gerar tons de sinalização
multi-frequência e colocar pz(n)=Q
Contador Objectivo wait-count Contagem decresente do número de blocos a serem suprimidos a partir do ponto em que o par de tons de sinalização multi-frequência foi primeiro detectado Sup-count Contagem decrescente do número de blocos a serem suprimidos do fim da regeneração do par de tons de sinalização multi-frequência
Na inicialização, todas as marcas e contadores encontram-se de preferência colocadas a zero. 0 seguinte quadro (quadro 4) ilustra uma forma de realização exemplar do processo de regeneração de tom de sinalização multi-frequência 600:
Quadro 4: Regeneração de tom de sinalização multi-frequência__
Condição Acção (D6 é válido) e (D5, D4, D3, D2, Dl são SUPPRESS = 1 inválidos e/ou desiguais) wait-count = 40 (D6 = D5 = D4) e (D6, D5, D4 são válidos) e GENTONES = 1 (D3, D2, Dl são inválidos e/ou desiguais) sup-count = 4 (D3 = D2 = Dl) e (D3, D2, Dl são válidos) e GENTONES = 0 (D6, D5, D4 são inválidos e/ou desiauais) wait-count = 0 (VAD =1) e (sup count = 0) SUPPRESS = 0 (GENTONES = 0) e (Wait-count = 0)' Decrescer wait-count (GENTONES = 0) e (Wait-count = 0) Decrescer sup-count sup-count > 0
Note que as condições no quadro 4 não são necessariamente mutuamente exclusivas. Deste modo, na forma de realização preferida, cada condição é verificada na ordem apresentada no quadro 4 no fim de um bloco (com excepção das condições 1-3, que são mutuamente exclusivas). A acção correspondente é depois lavada para o próximo bloco se a condição for verdadeira. Por isso, podem ser tomadas várias acções no inicio de um bloco. Tal como com a extensão de tom de sinalização multi-frequência, é utilizado N = 102 para a detecção de tom de sinalização multi-frequência para utilização com o dispositivo e processo de geração de tom de sinalização multi-frequência. w'L (n)
Será agora apresentada uma descrição do processo preferido de regeneração de tom. Quando for primeiro detectado um par válido de sinalização multi-frequência num bloco de amostras N, a saída do sistema de supressão de ruído é suprimida ajustando pi(n) para um valor pequeno, por exemplo Pi(n) = 0,02. Isto é indicado pela satisfação da primeira condição no quadro 4, sendo a marca SUPPRESS colocada em um valor de 1, correspondendo aos passos 602 e 604 da figura 6. Após terem sido encontrados três blocos consecutivos para conter o mesmo dígito válido, os tons de sinalização multi-frequência, w'i(n) © correspondem ao dígito recebido são gerados e são alimentados para a saída, isto é Pi(n) = 0,02 e = 1. Isto corresponde à segunda condição do quadro 4 ter que ser satisfeita e a marca GENTONES ser colocada em 1, e aos passos 606 e 608 da figura 6. A regeneração do tom de sinalização multi-frequência continua de preferência até que o par de entradas de sinalização multi-frequência não seja detectado no bloco actual. Os tons de sinalização multi-frequência gerados 329 podem ser emitidos continuamente durante um período suficiente (após o par de sinalização multi-frequência não ser mais detectado no bloco actual), por exemplo para três ou quatro blocos adicionais (para assegurar que uma duração suficiente de tons de sinalização multi-frequência são enviados).
Tal como com o processo de extensão de tom de sinalização multi-frequência, a regeneração do tom de sinalização multi-frequência pode ter lugar por um período adicional de tempo, por exemplo metade de um bloco ou um bloco de N amostras, para assegurar que os tons de sinalização multi-frequência correspondem às normas de duração mínimas. Na forma de realização ilustrada no quadro 4, os tons de sinalização multi-frequência 329 são gerados para três blocos após os tons de sinalização multi-frequência não serem mais detectados. Isto corresponde à condição 3 do quadro 4 ser satisfeita, e os passos 610 e 612 da figura 6. Note que embora sup-count esteja colocado para 4 quando 3 blocos de sinalização multi-frequência não consecutivos seguem 3 blocos de sinalização multi-frequência idênticos válidos consecutivos, sup-count é decrementado nos passos 614 e 616 antes de quaisquer blocos serem suprimidos (sendo deste modo suprimidos três blocos e não quatro). Após isto, é transmitido um período de silêncio de duração suficiente, isto é pi(n) - 0,02 e pt (n) = 0. Isto pode ser, por exemplo quatro blocos com 12,75 ms comprimento.
Entretanto, o detector de actividade da sinalização multi-frequência (de preferência como parte do DCAVAM) continua a operar durante a transmissão dos tons regenerados e o silêncio. Se for recebido um dígito válido enquanto que o último bloco dos tons de sinalização multi-frequência 329 regenerados e/ou do silêncio está a ser transmitido, os tons de sinalização multi-frequência apropriados que correspondem a este dígito são gerados e transmitidos após se ter completo 0 período de silêncio. Se não forem recebidos quaisquer dígitos válidos durante este período, a saída continua a ser suprimida durante um período de espera. Durante este período de espera, se tanto as marcas do DCAVAM forem um, isto é DAV=1 ou sinalização multi-frequência = 1, então o período de espera é imediatamente terminado. Se o período de espera for terminado devido a actividade da conversação (DAV=1), a saída é determinada pelo sistema de supressão de ruído com pi(n) = 1 e P2(n) = 0, por exemplo ajustando a marca SUPPRESS igual a 0 (tal como indicado se a condição 4 do quadro 4 for satisfeita). Se o período de espera for determinado pela actividade da sinalização multi-frequência (sinalização multi-frequência = 1), então continua a supressão do sinal de entrada, por exemplo ajustando a marca SUPPRESS igual a 1 (tal como indicado se a condição 1 do quadro 4 for satisfeita). Uma condição de DAV = 1 corresponde aos passos 618 e 620 da figura 6 enquanto que uma condição de sinalização multi-frequência = 1 corresponde aos passos 602 e 604 da figura 6. Períodos de espera exemplares são de cerca de metade a um segundo (cerca de 40 a 80 blocos) . O período de espera é utilizado para impedir a fuga de quantidades pequenas de tons de sinalização multi-frequência de sinal de entrada. A utilização de wait-count facilita a contagem decrescente do número de blocos a serem suprimidos do ponto onde um par de tons de sinalização multi-frequência é primeiro detectado. Isto corresponde aos passos 622 e 624 da figura 6.
Quando não se encontrarem presentes quaisquer sinais de sinalização multi-frequência, pi(n) = 1 e p2(n) = 0. Na forma de realização actual, assim que for detectado um par de tons de sinalização multi-frequência num bloco, a saída do sistema de supressão de ruído é suprimida, ajustando por exemplo pi(n) para um valor pequeno, por exemplo pi(n) = 0,02. Na forma de realização descrita no quadro 4, pi(n) é ajustado para um valor pequeno colocando SUPPRESS igual a 1. No fim de cada bloco de N amostras, se SUPPRESS for igual a 1, então para as próximas amostras N, 0$(m) = 0,02. No fim de cada bloco, se for determinado que os tons de sinalização multi-frequência devem ser regenerados durante o próximo bloco (por exemplo se GENTONES = I!f então =1. 0 gerador de tons 321 utiliza wait- count e as marcas do DCAVAM para determinar se continua a supressão do sinal de entrada durante o período de espera. Se não for detectado voz ou tom de sinalização multi-frequência durante o período de espera, então wait-count é eventualmente decrescido para 0, então a condição por defeito de pi(n) = 1 e = 0 é de preferência ajustada (correspondente aos passos 626 e 628 da figura 6).
Os processos de extensão de tom de sinalização multi-frequência e geração de tom de sinalização multi-frequência são descritos separadamente. Contudo, é possível combinar a extensão de tom de sinalização multi-frequência e regeneração de tom de sinalização multi-frequência num processo e/ou dispositivo.
Embora os processos de extensão de tom de sinalização multi-frequência e a regeneração descritos na presente sejam com um sistema de supressão de ruído, estes processos podem também ser utilizados com outros sistemas de melhoramento de conversação tais como sistemas de controlo de ganho adaptativos, cancelamento do eco, e sistema de supressão de eco. Além disso, a extensão e regeneração de tom de sinalização multi-frequência descritos são especialmente úteis quando não podem ser tolerados atrasos. Contudo, se o atraso for tolerável, por exemplo se for tolerável um atraso de 20 ms no sistema de melhoramento de conversação (o que pode ser o caso se o sistema de melhoramento de conversação operar em conjunção com um dispositivo de compressão de conversação), então a extensão e/ou regeneração de tons pode não ser necessária. Contudo, um sistema de melhoramento de conversação que não apresenta um detector de sinalização multi-frequência pode graduar os tons inapropriadamente. Com um detector de sinalização multi-frequência presente, o dispositivo e processo de supressão de ruído pode detectar a presença de tons e colocar os factores de escalonamento para as bandas secundárias apropriadas numa unidade.
Agora, em relação no geral as figuras 3 e 4, o banco de filtros 302, DCAVAM 304, contador permanente 305, avaliador RRS 306, avaliador de potência 308, adaptador RSR 310, computador de ganho 312, multiplicador de ganho 314, adaptador de factor de compressão 402, avaliador de potência a longo prazo 308a, avaliador de potência a curto prazo 308b, compensador de potência 404, gerador de tom de sinalização multi-frequência 321, osciladores 332, circuito de sub-amostragem 330, e combinador 315, podem ser implementados utilizando lógica combinatória e sequêncial, um ASIC, através de software implementado por um CPU, um chip DSP, ou semelhante. Os elementos de hardware anteriores podem fazer parte de hardware que é utilizado para executar outras funções operacionais. Os sinais de entrada, bandas de frequência, medições de potência e avaliação, de factores de ganho, RRSs e RRSs adaptados, marcas, erros de previsão, factores compensadores, contadores, e constantes podem ser armazenados em registos, RAM, ROM ou semelhantes, e podem ser gerados através software, através de uma estrutura de dados localizada num dispositivo de memória tal como RAM ou ROM etc.
Lisboa, 2 de Julho de 2007

Claims (13)

  1. Reivindicações Dispositivo para melhorar a qualidade do sinal de comunicação num sistema de comunicações, compreendendo: meios para dividir o sinal de comunicação em vários sinais de banda de frequência; meios para gerar um primeiro sinal de potência para um primeiro sinal de banda de frequência, cujo primeiro sinal de potência é baseado na avaliação durante um primeiro período de tempo da potência do primeiro sinal da banda de frequência; meios para gerar um segundo sinal de potência para o primeiro sinal de banda de frequência, cujo segundo sinal de potência é baseado na avaliação, durante um segundo período de tempo menor do que o primeiro período de tempo, da potência do primeiro sinal da banda de frequência; meios para gerar um rácio de ruído para sinal (RRS) que representa uma condição do primeiro sinal de banda de frequência em resposta ao relacionamento aritmético predeterminado que compreende pelo menos uma adição, subtracção e multiplicação mas sem divisão, entre valores que derivam do primeiro e segundo sinais de potência; meios para ajustar o ganho dos sinais da banda de frequência em resposta ao RRS para gerar um primeiro sinal de banda de frequência ajustado; e meios para combinar o sinal da banda de frequência ajustado com pelo menos um sinal de banda de frequência adicional para gerar um sinal de comunicação ajustado. Dispositivo de acordo com a reivindicação 1, caracterizado por os primeiros sinais de potência, segundo sinais de potência e sinais de condição serem gerados por uma implementação do ponto fixo. Dispositivo de acordo com as reivindicações 1 ou 2, caracterizado por o RRS compreender uma potência de sinal de ruído média durante a referida conversação e potência de sinal de fundo média durante a ausência da referida conversação de um dos sinais da banda de frequência. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por o relacionamento aritmético compreender ajustar os valores dos sinais de condição por incrementos predeterminados. Dispositivo de acordo com a reivindicação 4, caracterizado por os valores do RRS serem aumentados em resposta a um primeiro dos relacionamentos predeterminados em que os valores dos sinais de condição são diminuídos em resposta a um segundo dos relacionamentos predeterminados. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por o relacionamento aritmético compreender o ajuste de um sinal do grupo que compreende um dos primeiros sinais de potência e um dos segundos sinais de potência por factor de compensação. Dispositivo de acordo com a reivindicação 6, caracterizado por ser gerado o sinal de ruído global que representa um relacionamento entre o sinal dos componentes de ruído do sinal de comunicação e em que o factor de compensação é gerado em resposta ao sinal do ruído global. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por ser gerado um sinal de detecção de voz em resposta a detecção do componente de voz do sinal de comunicação e em que os incrementos variam em valores, em resposta ao sinal de detecção de voz. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por compreender o processador seleccionado do grupo que compreende lógica combinatória sequêncial, o circuito integrado específico da aplicação, uma unidade de processamento central que executa o software e um processador de sinal digital que executa software.
  2. 10. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por os primeiros sinais de potência serem gerados durante a ausência da referida voz.
  3. 11. Dispositivo de acordo com qualquer das reivindicações anteriores, caracterizado por os segundos sinais de potência serem gerados durante a referida conversação e ruido.
  4. 12. Processo para melhorar a qualidade de um sinal de comunicação num sistema de comunicações, caracterizado por compreender os passos de: dividir o sinal de comunicação em vários sinais de banda de frequência; gerar um primeiro sinal de potência para um primeiro sinal de banda de frequência, cujo primeiro sinal de potência é baseado na avaliação durante um pré-periodo de tempo da potência dos primeiros sinais da banda de frequência; gerar um segundo sinal de potência para os primeiros sinais da banda de frequência, cujo segundo sinal de potência é baseado na avaliação durante um segundo período de tempo menor do que o primeiro período de tempo, da potência dos primeiros sinais da banda de frequência; gerar um rácio de ruido para sinal (RRS) representando uma condição do primeiro sinal da banda de frequência em resposta a um relacionamento aritmético predeterminado que compreende pelo menos a adição, subtração e multiplicação mas sem divisão, entre valores derivados do primeiro e segundo sinais de potência; ajustar o ganho do sinal da banda de frequência em resposta ao RRS para gerar um sinal da banda de frequência ajustado; e combinar o sinal da banda de frequência ajustado com pelo menos um sinal de banda de frequência adicional para gerar um sinal de comunicação ajustado.
  5. 13. Processo de acordo com a reivindicação 12, caracterizado por a geração dos primeiros sinais de potência, segundos sinais de potência e sinais de condição, compreender gerar por uma implementação de ponto fixo.
  6. 14. Processo de acordo com as reivindicações 12 ou 13, caracterizado por o relacionamento entre os componentes de sinal e ruido compreender uma avaliação de um rácio que compreende a potência de sinal para ruido média durante a referida conversação e potência de ruído de fundo média durante a ausência da referida conversação de um dos sinais da banda de frequência.
  7. 15. Processo de acordo com qualquer das reivindicações 12 a 14, caracterizado por o relacionamento aritmético compreender ajustar os valores para os sinais de condição por incrementos predeterminados.
  8. 16. Processo de acordo com a reivindicação 15, caracterizado por valores do RRS serem aumentados em resposta a um primeiro dos relacionamentos predeterminados em que os valores dos sinais de condição são diminuídos em resposta a um sequndo dos relacionamentos predeterminados.
  9. 17. Processo de acordo com qualquer das reivindicações 12 a 16, caracterizado por o relacionamento aritmético compreender ajuste de um dos sinais do grupo que compreende um dos primeiros sinais de potência e um dos segundos sinais de potência por um factor de compensação.
  10. 18. Processo de acordo com a reivindicação 17, caracterizado por compreender o passo de gerar um sinal de ruído global que representa o relacionamento entre o sinal e componentes de ruído do sinal de comunicação e em que o factor de compensação é gerado em resposta ao sinal de ruído global.
  11. 19. Processo de acordo com qualquer das reivindicações 12 a 18, caracterizado por compreender o passo de gerar um sinal de detecção de voz em resposta a detecção do componente de voz do sinal de comunicação e em que os incrementos variam em valor em resposta ao sinal de detecção de voz.
  12. 20. Processo de acordo com qualquer das reivindicações 12 a 19, caracterizado por a geração dos primeiros sinais de potência, compreender gerar primeiros sinais de potência durante a ausência da referida voz.
  13. 21. Processo de acordo com qualquer das reivindicações 12 a 20, caracterizado por a geração dos segundos sinais de potência compreender gerar segundos sinais de potência durante a referida conversação e ruído. Lisboa, 2 de Julho de 2007
PT00902355T 1999-01-07 2000-01-07 Processo e dispositivo para suprimir ruido de modo adaptativo. PT1141948E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11524599P 1999-01-07 1999-01-07

Publications (1)

Publication Number Publication Date
PT1141948E true PT1141948E (pt) 2007-07-12

Family

ID=22360151

Family Applications (1)

Application Number Title Priority Date Filing Date
PT00902355T PT1141948E (pt) 1999-01-07 2000-01-07 Processo e dispositivo para suprimir ruido de modo adaptativo.

Country Status (10)

Country Link
US (3) US6591234B1 (pt)
EP (1) EP1141948B1 (pt)
AT (1) ATE358872T1 (pt)
AU (1) AU2408500A (pt)
CA (1) CA2358203A1 (pt)
DE (1) DE60034212T2 (pt)
DK (1) DK1141948T3 (pt)
ES (1) ES2284475T3 (pt)
PT (1) PT1141948E (pt)
WO (1) WO2000041169A1 (pt)

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
US6771590B1 (en) 1996-08-22 2004-08-03 Tellabs Operations, Inc. Communication system clock synchronization techniques
US6118758A (en) 1996-08-22 2000-09-12 Tellabs Operations, Inc. Multi-point OFDM/DMT digital communications system including remote service unit with improved transmitter architecture
DK1068704T3 (da) 1998-04-03 2012-09-17 Tellabs Operations Inc Filter til impulssvarforkortning, med yderligere spektrale begrænsninger, til multibærebølgeoverførsel
US7440498B2 (en) 2002-12-17 2008-10-21 Tellabs Operations, Inc. Time domain equalization for discrete multi-tone systems
US6795424B1 (en) 1998-06-30 2004-09-21 Tellabs Operations, Inc. Method and apparatus for interference suppression in orthogonal frequency division multiplexed (OFDM) wireless communication systems
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
GB2351624B (en) * 1999-06-30 2003-12-03 Wireless Systems Int Ltd Reducing distortion of signals
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
US7117149B1 (en) 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
ATE262263T1 (de) * 1999-10-07 2004-04-15 Widex As Verfahren und signalprozessor zur verstärkung von sprachsignal-komponenten in einem hörhilfegerät
JP2001218238A (ja) * 1999-11-24 2001-08-10 Toshiba Corp トーン信号受信装置、トーン信号送信装置及びトーン信号送受信装置
US6473733B1 (en) * 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
US6760435B1 (en) * 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
HUP0003010A2 (en) * 2000-07-31 2002-08-28 Herterkom Gmbh Signal purification method for the discrimination of a signal from background noise
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7035293B2 (en) * 2001-04-18 2006-04-25 Broadcom Corporation Tone relay
US6721411B2 (en) * 2001-04-30 2004-04-13 Voyant Technologies, Inc. Audio conference platform with dynamic speech detection threshold
FR2831717A1 (fr) * 2001-10-25 2003-05-02 France Telecom Methode et systeme d'elimination d'interference pour antenne multicapteur
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
AUPS102902A0 (en) * 2002-03-13 2002-04-11 Hearworks Pty Ltd A method and system for reducing potentially harmful noise in a signal arranged to convey speech
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
JP4282317B2 (ja) * 2002-12-05 2009-06-17 アルパイン株式会社 音声通信装置
US7191127B2 (en) * 2002-12-23 2007-03-13 Motorola, Inc. System and method for speech enhancement
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7260209B2 (en) * 2003-03-27 2007-08-21 Tellabs Operations, Inc. Methods and apparatus for improving voice quality in an environment with noise
US7128901B2 (en) 2003-06-04 2006-10-31 Colgate-Palmolive Company Extruded stick product and method for making same
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US20050288923A1 (en) * 2004-06-25 2005-12-29 The Hong Kong University Of Science And Technology Speech enhancement by noise masking
US7433463B2 (en) * 2004-08-10 2008-10-07 Clarity Technologies, Inc. Echo cancellation and noise reduction method
US7382825B1 (en) * 2004-08-31 2008-06-03 Synopsys, Inc. Method and apparatus for integrated channel characterization
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8306821B2 (en) 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
JP4862262B2 (ja) * 2005-02-14 2012-01-25 日本電気株式会社 Dtmf信号処理方法、処理装置、中継装置、及び通信端末装置
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus
US7826682B2 (en) * 2005-04-14 2010-11-02 Agfa Healthcare Method of suppressing a periodical pattern in an image
US7912231B2 (en) * 2005-04-21 2011-03-22 Srs Labs, Inc. Systems and methods for reducing audio noise
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
JP4551817B2 (ja) * 2005-05-20 2010-09-29 Okiセミコンダクタ株式会社 ノイズレベル推定方法及びその装置
US8311819B2 (en) 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
FR2889347B1 (fr) * 2005-09-20 2007-09-21 Jean Daniel Pages Systeme de diffusion sonore
US20070100611A1 (en) * 2005-10-27 2007-05-03 Intel Corporation Speech codec apparatus with spike reduction
US20070189505A1 (en) * 2006-01-31 2007-08-16 Freescale Semiconductor, Inc. Detecting reflections in a communication channel
GB2437559B (en) * 2006-04-26 2010-12-22 Zarlink Semiconductor Inc Low complexity noise reduction method
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8050397B1 (en) * 2006-12-22 2011-11-01 Cisco Technology, Inc. Multi-tone signal discriminator
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
US11217237B2 (en) * 2008-04-14 2022-01-04 Staton Techiya, Llc Method and device for voice operated control
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
CA2706717A1 (en) * 2007-11-27 2009-06-04 Arjae Spectral Enterprises, Inc. Noise reduction by means of spectral parallelism
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
US20100054486A1 (en) * 2008-08-26 2010-03-04 Nelson Sollenberger Method and system for output device protection in an audio codec
US8532269B2 (en) * 2009-01-16 2013-09-10 Microsoft Corporation In-band signaling in interactive communications
WO2010104299A2 (en) * 2009-03-08 2010-09-16 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
ATE515020T1 (de) * 2009-03-20 2011-07-15 Harman Becker Automotive Sys Verfahren und vorrichtung zur dämpfung von rauschen in einem eingangssignal
US8606569B2 (en) * 2009-07-02 2013-12-10 Alon Konchitsky Automatic determination of multimedia and voice signals
JP5489778B2 (ja) * 2010-02-25 2014-05-14 キヤノン株式会社 情報処理装置およびその処理方法
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
JP5606764B2 (ja) * 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム
TWI413112B (zh) * 2010-09-06 2013-10-21 Byd Co Ltd Method and apparatus for eliminating noise background noise (1)
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
CN102629470B (zh) * 2011-02-02 2015-05-20 Jvc建伍株式会社 辅音区间检测装置及辅音区间检测方法
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US9312826B2 (en) * 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US10020008B2 (en) 2013-05-23 2018-07-10 Knowles Electronics, Llc Microphone and corresponding digital interface
US9711166B2 (en) 2013-05-23 2017-07-18 Knowles Electronics, Llc Decimation synchronization in a microphone
CN105379308B (zh) 2013-05-23 2019-06-25 美商楼氏电子有限公司 麦克风、麦克风***及操作麦克风的方法
US9502028B2 (en) 2013-10-18 2016-11-22 Knowles Electronics, Llc Acoustic activity detection apparatus and method
US9147397B2 (en) 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
TW201640322A (zh) 2015-01-21 2016-11-16 諾爾斯電子公司 用於聲音設備之低功率語音觸發及方法
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US9478234B1 (en) 2015-07-13 2016-10-25 Knowles Electronics, Llc Microphone apparatus and method with catch-up buffer
US11631421B2 (en) 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
GB2547459B (en) * 2016-02-19 2019-01-09 Imagination Tech Ltd Dynamic gain controller
KR102623514B1 (ko) * 2017-10-23 2024-01-11 삼성전자주식회사 음성신호 처리장치 및 그 동작방법
CN110677744B (zh) * 2019-10-22 2021-07-06 深圳震有科技股份有限公司 一种fxs端口的控制方法、存储介质及接入网设备
US11490198B1 (en) * 2021-07-26 2022-11-01 Cirrus Logic, Inc. Single-microphone wind detection for audio device

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4351983A (en) 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
US4423289A (en) 1979-06-28 1983-12-27 National Research Development Corporation Signal processing systems
US4351982A (en) 1980-12-15 1982-09-28 Racal-Milgo, Inc. RSA Public-key data encryption system having large random prime number generating microprocessor or the like
US4454609A (en) 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4658435A (en) * 1984-09-17 1987-04-14 General Electric Company Radio trunking system with transceivers and repeaters using special channel acquisition protocol
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4658426A (en) 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
CA1293693C (en) 1985-10-30 1991-12-31 Tetsu Taguchi Noise canceling apparatus
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5285165A (en) 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
FR2685486B1 (fr) * 1991-12-19 1994-07-29 Inst Francais Du Petrole Methode et dispositif pour mesurer les niveaux d'amplitude successifs de signaux recus sur une voie de transmission.
FI97758C (fi) 1992-11-20 1997-02-10 Nokia Deutschland Gmbh Järjestelmä audiosignaalin käsittelemiseksi
US5400409A (en) 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5432859A (en) 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
US5425105A (en) 1993-04-27 1995-06-13 Hughes Aircraft Company Multiple adaptive filter active noise canceller
DE69331732T2 (de) 1993-04-29 2003-02-06 Ibm Anordnung und Verfahren zur Feststellung der Anwesenheit eines Sprechsignals
US5632003A (en) 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
SG49334A1 (en) 1993-12-06 1998-05-18 Koninkl Philips Electronics Nv A noise reduction system and device and a mobile radio station
JPH07202998A (ja) 1993-12-29 1995-08-04 Nec Corp 周囲ノイズ除去機能を備えた電話機
US5619524A (en) 1994-10-04 1997-04-08 Motorola, Inc. Method and apparatus for coherent communication reception in a spread-spectrum communication system
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6377919B1 (en) * 1996-02-06 2002-04-23 The Regents Of The University Of California System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech
US5806025A (en) 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
JP2874679B2 (ja) * 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置

Also Published As

Publication number Publication date
EP1141948A1 (en) 2001-10-10
US8031861B2 (en) 2011-10-04
ATE358872T1 (de) 2007-04-15
AU2408500A (en) 2000-07-24
US20050131678A1 (en) 2005-06-16
DE60034212T2 (de) 2008-01-17
WO2000041169A9 (en) 2002-04-11
ES2284475T3 (es) 2007-11-16
DE60034212D1 (de) 2007-05-16
EP1141948B1 (en) 2007-04-04
US20090129582A1 (en) 2009-05-21
DK1141948T3 (da) 2007-08-13
WO2000041169A1 (en) 2000-07-13
US6591234B1 (en) 2003-07-08
CA2358203A1 (en) 2000-07-13
US7366294B2 (en) 2008-04-29

Similar Documents

Publication Publication Date Title
PT1141948E (pt) Processo e dispositivo para suprimir ruido de modo adaptativo.
Allen et al. Multimicrophone signal‐processing technique to remove room reverberation from speech signals
KR101250124B1 (ko) 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법
US5432859A (en) Noise-reduction system
US6263307B1 (en) Adaptive weiner filtering using line spectral frequencies
EP0154381B1 (en) Digital speech coder with baseband residual coding
KR100594563B1 (ko) 선형 컨벌루션 및 인과 필터링을 사용하는 스펙트럼 감산에 의한 신호 잡음 감소
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
Felder et al. Efficient dual-tone multifrequency detection using the nonuniform discrete Fourier transform
KR20020005674A (ko) 스펙트럼 감산을 사용하는 이중 마이크로폰 신호 잡음감소용 시스템 및 방법
US8290141B2 (en) Techniques for comfort noise generation in a communication system
US3784747A (en) Speech suppression by predictive filtering
KR20010043833A (ko) 스펙트럼 종속 지수 이득 함수 평균화를 이용한 스펙트럼공제에 의한 신호 잡음 저감
US5136531A (en) Method and apparatus for detecting a wideband tone
US6199036B1 (en) Tone detection using pitch period
EP1141950B1 (en) Noise suppression in a mobile communications system
EP1729287A1 (en) Method and apparatus for adaptively suppressing noise
US20020097860A1 (en) Frequency error detection methods and systems using the same
WO2000007177A1 (en) Communication terminal
JPH06334457A (ja) 自動音量制御装置
Beard et al. A Discrete Fourier Transform based Digital DTMF Detection Algorithm
Lu Implementation of acoustic echo cancellation for pc applications using matlab
Walker SPEECH IMPROVEMENT BY NOISE REDUCTION BASED ON A CONTINUOUS FOURIER TRANSFORMATION (CFT)
JPH0918389A (ja) 非調和的周波数分析法を用いた拡声通話系の ハウリング防止方式
Yektaeian et al. Comparison between noise reduction algorithms for speech signals using auditory masking effects