BR112020024257A2 - método de codificação de sinal estéreo, aparelho, meio de armazenamento legível por computador e chip - Google Patents

método de codificação de sinal estéreo, aparelho, meio de armazenamento legível por computador e chip Download PDF

Info

Publication number
BR112020024257A2
BR112020024257A2 BR112020024257-8A BR112020024257A BR112020024257A2 BR 112020024257 A2 BR112020024257 A2 BR 112020024257A2 BR 112020024257 A BR112020024257 A BR 112020024257A BR 112020024257 A2 BR112020024257 A2 BR 112020024257A2
Authority
BR
Brazil
Prior art keywords
parameter
energy
sub
bands
res
Prior art date
Application number
BR112020024257-8A
Other languages
English (en)
Inventor
Bin Wang
Zexin LIU
Haiting Li
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of BR112020024257A2 publication Critical patent/BR112020024257A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/756Media network packet handling adapting media to device capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Este pedido fornece um método de codificação de sinal estéreo, um aparelho, um meio de armazenamento legível por computador e um chip. O método de codificação inclui: determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M = N, e M é um número inteiro positivo (301); e determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual (302). De acordo com o método de codificação, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.

Description

MÉTODO DE CODIFICAÇÃO DE SINAL ESTÉREO, APARELHO, MEIO DE ARMAZENAMENTO LEGÍVEL POR COMPUTADOR E CHIP
[0001] Este pedido reivindica a prioridade do Pedido de Patente Chinês nº 201810549237.3, depositado no Escritório de Patentes Chinês em 31 de maio de 2018 e intitulado "MÉTODO E APARELHO DE CODIFICAÇÃO DE SINAL ESTÉREO", que é incorporado neste documento por referência em sua totalidade.
CAMPO TÉCNICO
[0002] Este pedido se refere ao campo de áudio, e mais especificamente, a um método e aparelho de codificação de sinal estéreo.
ANTECEDENTES
[0003] Um processo geral de codificação de um sinal estéreo usando uma tecnologia de codificação estéreo de domínio de tempo ou de domínio tempo-frequência é o seguinte: realizar pré-processamento de domínio de tempo em um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito; realizar análise de domínio de tempo em um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito que são obtidos por meio de pré- processamento de domínio de tempo; realizar transformação de domínio de tempo-frequência no sinal de domínio de tempo de canal esquerdo e no sinal de domínio de tempo de canal direito que são obtidos por meio de pré-processamento de domínio de tempo, para obter um sinal de domínio de frequência de canal esquerdo e um sinal de domínio de frequência de canal direito; determinar um parâmetro de diferença de tempo entre canais (Inter-channel Time Difference, ITD) no domínio de tempo; realizar ajuste de deslocamento de tempo no sinal de domínio de frequência esquerdo e no sinal de domínio de frequência de canal direito com base no parâmetro ITD; e calcular um parâmetro estéreo, um sinal reduzido, e um sinal residual com base em um sinal de domínio de frequência de canal esquerdo e um sinal de domínio de frequência de canal direito que são obtidos por meio de ajuste de deslocamento de tempo, e codificar o parâmetro estéreo, o sinal reduzido, e o sinal residual.
[0004] É conhecido que no estado da técnica, quando uma taxa de codificação é comparativamente baixa, apenas um parâmetro estéreo e um sinal reduzido são geralmente codificados, e alguns ou todos os sinais residuais são codificados apenas quando uma taxa de codificação é comparativamente alta. Neste caso, um sentido espacial de um sinal estéreo decodificado é comparativamente pobre e a estabilidade de imagem-som do sinal estéreo decodificado é comparativamente pobre.
[0005] É conhecido que em outro documento do estado da técnica, quando uma taxa de codificação é comparativamente baixa, além de um sinal reduzido, um sinal residual de uma sub-banda que atende a uma faixa de largura de banda predefinida também é codificado. Embora este método de codificação possa melhorar o sentido espacial e a estabilidade de imagem-som de um sinal estéreo decodificado, porque uma quantidade total de bits de codificação usados para codificar o sinal residual e codificar o sinal reduzido é fixa, e as informações de baixa frequência são preferencialmente codificadas durante a codificação de sinal reduzido, quando o sinal reduzido deve ser codificado, pode não haver bits suficientes para codificar alguns sinais com informações de alta frequência mais ricos no sinal reduzido. Portanto, a distorção de alta frequência de um sinal estéreo decodificado é comparativamente grande, afetando assim a qualidade de codificação.
SUMÁRIO
[0006] Este pedido fornece um método de codificação de sinal estéreo, de modo que a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0007] De acordo com um primeiro aspecto, um método de codificação de sinal estéreo é fornecido. O método inclui: determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N, e M é um número inteiro positivo; e determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual.
[0008] O parâmetro de codificação de sinal residual é determinado com base na energia de sinal reduzido e na energia de sinal residual de M sub-bandas que estão nas N sub-bandas e que atendem a uma faixa de largura de banda predefinida, e se codifica um sinal residual de cada uma das M sub-bandas é determinado com base no parâmetro de codificação de sinal residual. Isso evita a codificação de apenas um sinal reduzido quando uma taxa de codificação é comparativamente baixa. Alternativamente, se codifica todos os sinais residuais de sub-bandas que atendem a uma faixa de largura de banda predefinida é determinado com base no parâmetro de codificação de sinal residual. Portanto, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0009] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, as M sub-bandas são M sub-bandas cujos números de índice de sub-banda são menores ou iguais a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0010] Opcionalmente, em uma implementação, as M sub- bandas são M sub-bandas cujos números de índice de sub-banda são maiores ou iguais a um número de índice de sub-banda mínimo predefinido e menor ou igual a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0011] O número de índice de sub-banda mínimo e/ou o número de índice de sub-banda máximo é/são definidos com base em diferentes taxas de codificação. O parâmetro de codificação de sinal residual é determinado com base nas diferentes taxas de codificação, e na energia de sinal reduzido e na energia de sinal residual de uma pluralidade de sub-bandas específicas nas N sub-bandas, e se deve codificar um sinal residual de cada uma das M sub-bandas é determinado com base no parâmetro de codificação de sinal residual. Isso evita a codificação de apenas um sinal reduzido quando uma taxa de codificação é comparativamente baixa. Alternativamente, se codifica todos os sinais residuais de sub-bandas que atendem à faixa de largura de banda predefinida é determinado com base no parâmetro de codificação de sinal residual. Portanto, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0012] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica o sinal residual de cada uma das M sub-bandas inclui: comparar o parâmetro de codificação de sinal residual do quadro atual com um primeiro limite predefinido, em que o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual do quadro atual for menor ou igual ao primeiro limite, determinar não codificar o sinal residual de cada uma das M sub-bandas; ou quando o parâmetro de codificação de sinal residual do quadro atual for maior do que o primeiro limite, determinar a codificação do sinal residual de cada uma das M sub-bandas.
[0013] O primeiro limite é definido, e o parâmetro de codificação de sinal residual determinado é comparado com o primeiro limite. A codificação do sinal residual de cada uma das M sub-bandas é determinada com base em um resultado de comparação entre o parâmetro de codificação de sinal residual e o primeiro limite. Isso evita a codificação de apenas um sinal reduzido quando uma taxa de codificação é comparativamente baixa. Alternativamente, se codifica todos os sinais residuais de sub-bandas que atendem a faixa de largura de banda predefinida é determinado com base em um resultado de comparação entre o parâmetro de codificação de sinal residual e o primeiro limite. Portanto, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0014] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação de um parâmetro de codificação de sinal residual de um quadro atual com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas inclui: determinar o parâmetro de codificação de sinal residual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
[0015] O parâmetro de codificação de sinal residual é determinado com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub- bandas, e se codifica um sinal residual de cada uma das M sub-bandas é determinado com base no parâmetro de codificação de sinal residual. Isso evita a codificação de apenas um sinal reduzido quando uma taxa de codificação é comparativamente baixa. Alternativamente, se codifica todos os sinais residuais de sub-bandas que atendem à faixa de largura de banda predefinida é determinado com base no parâmetro de codificação de sinal residual. Portanto, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0016] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação do parâmetro de codificação de sinal residual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas inclui: determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub- bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0017] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação de um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas inclui: determinar M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub- bandas, em que os M parâmetros de energia indicam cada um a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
[0018] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res _ dmx _ ratio b   res _ cod _ NRG _ S b  / ( res _ cod _ NRG _ S b   1  g  b    1  g  b   , onde res _ cod _ NRG _ M b   1) res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b, e g(b) representa uma função de a ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
[0019] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação de um parâmetro de codificação de sinal residual de um quadro atual com base na energia de sinal reduzido, e na energia de sinal residual de cada uma das M sub-bandas inclui: determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0020] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, a determinação de um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas inclui: determinar M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que os M parâmetros de energia indicam cada um a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
[0021] Opcionalmente, em uma implementação, uma soma dos M parâmetros de energia é determinada como o primeiro parâmetro (a ser corrigido) res_dmx_ratio1, res_dmx_ratio1 é corrigido com base em um valor máximo res_dmx_ratio_max nos M parâmetros de energia e na energia de sinal reduzido res_cod_NRG_M [b] de cada uma das M sub-bandas, e res_dmx_ratio2 obtido através da correção é determinado.
[0022] Por exemplo, um lado de codificador corrige res_dmx_ratio1 de acordo com a seguinte fórmula, onde M = 5; e res_dmx_ratio2 obtido através da correção atende:  res _ cod _ NRG _ M 0  res _ cod _ NRG _ M 1  res _ dmx _ ratio2  (res _ dmx _ ratio _ max  0.32 ||      res _ cod _ NRG _ M  2  .  
512.0   res _ cod _ NRG _ M 3  res _ cod _ NRG _ M  4 )?res _ dmx _ ratio _ max : res _ dmx _ ratio  0.2
[0023] Opcionalmente, em uma implementação, res_dmx_ratio2 obtido por meio de correção pode ser corrigido posteriormente.
[0024] Por exemplo, res_dmx_ratio3 finalmente obtido por meio de correção atende: res _ dmx _ ratio3  pow( res _ dmx _ ratio2 ,1.2) , onde uma função pow() representa uma função exponencial, e pow(res _ dmx _ ratio2 ,1.2) representa a energia de 1,2 de res_dmx_ratio2.
[0025] Opcionalmente, em uma implementação, o lado de codificador determina o primeiro parâmetro com base em uma soma da energia de sinal residual das M sub-bandas e uma soma da energia de sinal reduzido das M sub-bandas.
[0026] Especificamente, o lado de codificador determina separadamente a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas e a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas, e determina o primeiro parâmetro com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0027] Opcionalmente, em uma implementação, a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub- bandas atende: b  M 1   1  res _ cod _ NRG _ M b  1   1   dmx _ nrg _ all _ curr     , onde b 0  res _ cod _ NRG _ M _ prev b  res_cod_NRG_M_prev[b] representa a energia de sinal reduzido de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  1 representa um fator de suavização, e  1 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  1  0.1 .
[0028] Opcionalmente, em uma implementação, a soma res_nrg_all_curr da energia de sinal residual das M sub- bandas atende: b  M 1   2  res _ cod _ NRG _ S b   1   2   res _ nrg _ all _ curr    res _ cod _ NRG _ S _ prev  b   , onde b0   res _ cod _ NRG _ S _ prev b  representa a energia de sinal residual de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  2 representa um fator de suavização, e  2 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  2  0.1 .
[0029] O lado de codificador determina o primeiro parâmetro res_dmx_ratio com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0030] Por exemplo, o primeiro parâmetro res_dmx_ratio finalmente determinado pelo lado de codificador atende: res_dmx_ratio = res_nrg_all_curr/dmx_nrg_all_curr .
[0031] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b], onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b.
[0032] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, o parâmetro de codificação de sinal residual do quadro atual é um parâmetro de suavização de longo prazo do quadro atual, e o parâmetro de suavização de longo prazo do quadro atual atende um fórmula: res_dmx_ratio_lt = res_dmx_ratio∙α + res_dmx_ratio_lt_prev∙(1 – α), onde res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1; e quando o segundo parâmetro é maior que um terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor ou igual a um terceiro limite predefinido, um valor de α é menor que um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido e o segundo parâmetro é maior que o terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
[0033] Com referência ao primeiro aspecto, em uma possível implementação do primeiro aspecto, o método inclui ainda: quando é determinado codificar os sinais residuais das M sub-bandas, a codificação de sinais reduzidos e dos sinais residuais das M sub-bandas; ou quando é determinado que não codifica os sinais residuais das M sub-bandas, codificar os sinais reduzidos das M sub-bandas.
[0034] De acordo com um segundo aspecto, um aparelho de codificação é fornecido. O aparelho inclui: um primeiro módulo de determinação, configurado para determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N, e M é um número inteiro positivo; e um segundo módulo de determinação, configurado para determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas.
[0035] De acordo com um terceiro aspecto, um aparelho de codificação é fornecido. O aparelho inclui uma memória e um processador, onde a memória é configurada para armazenar um programa, o processador é configurado para executar o programa, e quando o programa é executado, o processador realiza o método de acordo com qualquer um do primeiro aspecto ou possíveis implementações do primeiro aspecto.
[0036] De acordo com um quarto aspecto, um meio de armazenamento legível por computador é fornecido. O meio legível por computador armazena o código do programa a ser executado por um dispositivo, e o código do programa inclui uma instrução usada para realizar o método de acordo com o primeiro aspecto ou as várias implementações do primeiro aspecto.
[0037] De acordo com um quinto aspecto, um chip é fornecido. O chip inclui um processador e uma interface de comunicação. A interface de comunicação está configurada para se comunicar com um dispositivo externo. O processador é configurado para realizar o método de acordo com qualquer um do primeiro aspecto ou as possíveis implementações do primeiro aspecto.
[0038] Opcionalmente, em uma implementação, o chip pode incluir ainda uma memória. A memória armazena uma instrução, e o processador é configurado para executar a instrução armazenada na memória. Quando a instrução é executada, o processador é configurado para realizar o método de acordo com qualquer um do primeiro aspecto ou as possíveis implementações do primeiro aspecto.
[0039] Opcionalmente, em uma implementação, o chip é integrado em um dispositivo terminal ou um dispositivo de rede.
BREVE DESCRIÇÃO DOS DESENHOS
[0040] A FIG. 1 é um diagrama estrutural esquemático de um sistema de codificação e decodificação estéreo no domínio de tempo de acordo com uma modalidade deste pedido; a FIG. 2 é um diagrama esquemático de um terminal móvel de acordo com uma modalidade deste pedido; a FIG. 3 é um diagrama esquemático de um elemento de rede de acordo com uma modalidade deste pedido; a FIG. 4 é um fluxograma esquemático de um método de codificação de sinal estéreo de domínio de frequência; a FIG. 5 é um fluxograma esquemático de um método de codificação de sinal estéreo de domínio tempo-frequência;
a FIG. 6 é um fluxograma esquemático de um método de codificação de sinal estéreo de acordo com uma modalidade deste pedido; a FIG. 7 é outro fluxograma esquemático de um método de codificação de sinal estéreo de acordo com uma modalidade deste pedido; a FIG. 8 é um diagrama de blocos esquemático de um aparelho de codificação de sinal estéreo de acordo com uma modalidade deste pedido; e a FIG. 9 é outro diagrama de blocos esquemático de um aparelho de codificação de sinal estéreo de acordo com uma modalidade deste pedido.
DESCRIÇÃO DAS MODALIDADES
[0041] A seguir, são descritas as soluções técnicas deste pedido com referência aos desenhos anexos.
[0042] A FIG. 1 é um diagrama estrutural esquemático de um sistema de codificação e decodificação estéreo no domínio de tempo de acordo com uma modalidade de exemplo deste pedido. O sistema de codificação e decodificação estéreo inclui um componente de codificação 110 e um componente de decodificação 120.
[0043] O componente de codificação 110 é configurado para codificar um sinal estéreo no domínio de tempo. Opcionalmente, o componente de codificação 110 pode ser implementado usando software, ou pode ser implementado usando hardware, ou pode ser implementado na forma de uma combinação de software e hardware. Isto não está limitado nesta modalidade.
[0044] O componente de codificação 110 codifica o sinal estéreo no domínio de tempo, incluindo as seguintes várias etapas.
[0045] (1) Realizar o pré-processamento de domínio de tempo em um sinal estéreo obtido para obter um sinal de canal esquerdo que é obtido através do pré-processamento de domínio de tempo e um sinal de canal direito que é obtido através do pré-processamento de domínio de tempo.
[0046] O sinal estéreo é coletado por um componente de coleta e é enviado para o componente de codificação 110. Opcionalmente, o componente de coleta e o componente de codificação 110 podem ser dispostos em um mesmo dispositivo. Alternativamente, o componente de coleta e o componente de codificação 110 podem ser dispostos em dispositivos diferentes.
[0047] O sinal de canal esquerdo obtido através do pré- processamento e o sinal de canal direito obtido através do pré-processamento são dois canais de sinais no sinal estéreo obtido através do pré-processamento.
[0048] Opcionalmente, o pré-processamento inclui pelo menos um de processamento de filtragem passa-alta, processamento de pré-ênfase, conversão de taxa de amostragem e conversão de canal. Isto não está limitado nesta modalidade.
[0049] (2) Realizar estimativa de atraso com base no sinal de canal esquerdo que é obtido por meio do pré- processamento e o sinal de canal direito que é obtido por meio do pré-processamento, para obter uma diferença de tempo entre canais entre o sinal de canal esquerdo que é obtido por meio de pré-processamento e o sinal de canal direito obtido por meio do pré-processamento.
[0050] (3) Realizar, com base na diferença de tempo entre canais, o processamento de alinhamento de atraso no sinal de canal esquerdo que é obtido por meio do pré- processamento e o sinal de canal direito que é obtido por meio do pré-processamento, para obter um sinal de canal esquerdo que é obtido por meio do processamento de alinhamento de atraso e um sinal de canal direito que é obtido por meio do processamento de alinhamento de atraso.
[0051] (4) Codificar a diferença de tempo entre canais para obter um índice de codificação da diferença de tempo entre canais.
[0052] (5) Calcular um parâmetro estéreo usado para processamento de redução de domínio de tempo, e codificar o parâmetro estéreo usado para processamento de redução de domínio de tempo, para obter um índice de codificação do parâmetro estéreo usado para processamento de redução de domínio de tempo.
[0053] O parâmetro estéreo usado para processamento de redução de domínio de tempo é usado para realizar o processamento de redução de domínio de tempo no sinal de canal esquerdo que é obtido por meio do processamento de alinhamento de atraso e o sinal de canal direito que é obtido por meio do processamento de alinhamento de atraso.
[0054] (6) Realizar, com base no parâmetro estéreo usado para processamento de redução de domínio de tempo, processamento de redução de domínio de tempo no sinal de canal esquerdo que é obtido por meio do processamento de alinhamento de atraso e o sinal de canal direito que é obtido por meio do processamento de alinhamento de atraso, para obter um sinal de canal primário e um sinal de canal secundário.
[0055] O sinal de canal primário é usado para representar informações sobre uma correlação entre os canais. O sinal de canal secundário é usado para informações sobre a diferença entre os canais. Quando o sinal de canal esquerdo obtido por meio do processamento de alinhamento de atraso e o sinal de canal direito obtido por meio do processamento de alinhamento de atraso estão alinhados no domínio de tempo, o sinal de canal secundário é o menor. Nesse caso, o sinal estéreo tem o melhor efeito.
[0056] (7) Codificar o sinal de canal primário e o sinal de canal secundário separadamente, para obter um primeiro fluxo de bits codificado mono correspondendo ao sinal de canal primário e um segundo fluxo de bits codificado mono correspondendo ao sinal de canal secundário.
[0057] (8) Escrever o índice de codificação da diferença de tempo entre canais, o índice de codificação do parâmetro estéreo, o primeiro fluxo de bits codificado mono e o segundo fluxo de bits codificado mono em um fluxo de bits codificado estéreo.
[0058] O componente de decodificação 120 é configurado para decodificar o fluxo de bits codificado estéreo gerado pelo componente de codificação 110, para obter o sinal estéreo.
[0059] Opcionalmente, o componente de codificação 110 é conectado ao componente de decodificação 120 de uma maneira com ou sem fio, e o componente de decodificação 120 obtém, através desta conexão, o fluxo de bits codificado estéreo gerado pelo componente de codificação 110. Alternativamente, o componente de codificação 110 armazena o fluxo de bits codificado estéreo gerado em uma memória e o componente de decodificação 120 lê o fluxo de bits codificado estéreo na memória.
[0060] Opcionalmente, o componente de decodificação 120 pode ser implementado usando software, ou pode ser implementado usando hardware, ou pode ser implementado na forma de uma combinação de software e hardware. Isto não está limitado nesta modalidade.
[0061] O componente de decodificação 120 decodifica o fluxo de bits codificado estéreo para obter o sinal estéreo, incluindo as várias etapas a seguir: (1) Decodificar o primeiro fluxo de bits codificado mono e o segundo fluxo de bits codificado mono no fluxo de bits codificado estéreo para obter o sinal de canal primário e o sinal de canal secundário.
[0062] (2) Obter, com base no fluxo de bits codificado estéreo, um índice de codificação de um parâmetro estéreo usado para processamento de aumento de domínio de tempo, e realizar o processamento de aumento de domínio de tempo no sinal de canal primário e no sinal de canal secundário para obter um sinal de canal esquerdo que é obtido por meio do processamento de aumento de domínio de tempo e um sinal de canal direito que é obtido por meio do processamento de aumento de domínio de tempo.
[0063] (3) Obter o índice de codificação da diferença de tempo entre canais com base no fluxo de bits codificado estéreo, e realizar o ajuste de atraso no sinal de canal esquerdo que é obtido através do processamento de aumento de domínio de tempo e do sinal de canal direito que é obtido através do processamento de aumento de domínio de tempo, para obter o sinal estéreo.
[0064] Opcionalmente, o componente de codificação 110 e o componente de decodificação 120 podem ser dispostos em um mesmo dispositivo ou podem ser dispostos em dispositivos diferentes. O dispositivo pode ser um terminal móvel com uma função de processamento de sinal de áudio, como um telefone móvel, um tablet, um computador portátil, um computador desktop, um alto-falante Bluetooth, um gravador de caneta ou um dispositivo vestível; ou pode ser um elemento de rede com capacidade de processamento de sinal de áudio em uma rede principal ou sem fio. Isto não está limitado nesta modalidade.
[0065] Por exemplo, como mostrado na FIG. 2, nesta modalidade, uma descrição é fornecida usando um exemplo em que o componente de codificação 110 está disposto em um terminal móvel 130, e o componente de decodificação 120 está disposto em um terminal móvel 140, o terminal móvel 130 e o terminal móvel 140 são dispositivos eletrônicos mutuamente independentes com uma capacidade de processamento de sinal de áudio, por exemplo, podem ser um telefone móvel, um dispositivo vestível, um dispositivo de realidade virtual (VR, virtual reality), um dispositivo de realidade aumentada (AR, augmented reality) ou semelhantes, e o terminal móvel 130 é conectado ao terminal móvel 140 usando uma rede sem fio ou com fio.
[0066] Opcionalmente, o terminal móvel 130 inclui um componente de coleta 131, o componente de codificação 110, e um componente de codificação de canal 132. O componente de coleta 131 é conectado ao componente de codificação 110, e o componente de codificação 110 é conectado ao componente de codificação de canal 132.
[0067] Opcionalmente, o terminal móvel 140 inclui um componente de reprodução de áudio 141, o componente de decodificação 120, e um componente de decodificação de canal
142. O componente de reprodução de áudio 141 está conectado ao componente de decodificação 120, e o componente de decodificação 120 está conectado ao componente de decodificação de canal 142.
[0068] Depois de coletar um sinal estéreo usando o componente de coleta 131, o terminal móvel 130 codifica o sinal estéreo usando o componente de codificação 110, para obter um fluxo de bits codificado estéreo; e, em seguida, codifica o fluxo de bits codificado estéreo usando o componente de codificação de canal 132, para obter um sinal de transmissão.
[0069] O terminal móvel 130 envia o sinal de transmissão para o terminal móvel 140 usando a rede sem fio ou com fio.
[0070] Depois de receber o sinal de transmissão, o terminal móvel 140 decodifica o sinal de transmissão usando o componente de decodificação de canal 142, para obter o fluxo de bits codificado estéreo; decodifica o fluxo de bits codificado estéreo usando o componente de decodificação 120, para obter o sinal estéreo; e reproduz o sinal estéreo usando o componente de reprodução de áudio 141.
[0071] Por exemplo, como mostrado na FIG. 3, nesta modalidade, uma descrição é fornecida usando um exemplo em que o componente de codificação 110 e o componente de decodificação 120 estão dispostos em um elemento de rede 150 tendo uma capacidade de processamento de sinal de áudio em uma mesma rede principal ou rede sem fio.
[0072] Opcionalmente, o elemento de rede 150 inclui um componente de decodificação de canal 151, o componente de decodificação 120, o componente de codificação 110, e um componente de codificação de canal 152. O componente de decodificação de canal 151 está conectado ao componente de decodificação 120, o componente de decodificação 120 está conectado ao componente de codificação 110, e o componente de codificação 110 está conectado ao componente de codificação de canal 152.
[0073] Depois de receber um sinal de transmissão enviado por outro dispositivo, o componente de decodificação de canal 151 decodifica o sinal de transmissão para obter um primeiro fluxo de bits codificado estéreo; o componente de decodificação 120 decodifica o primeiro fluxo de bits codificado estéreo para obter um sinal estéreo; o componente de codificação 110 codifica o sinal estéreo para obter um segundo fluxo de bits codificado estéreo; e o componente de codificação de canal 152 codifica o segundo fluxo de bits codificado estéreo para obter o sinal de transmissão.
[0074] O outro dispositivo pode ser um terminal móvel com capacidade de processamento de sinal de áudio, ou pode ser outro elemento de rede com capacidade de processamento de sinal de áudio. Isto não está limitado nesta modalidade.
[0075] Opcionalmente, o componente de codificação 110 e o componente de decodificação 120 no elemento de rede podem transcodificar um fluxo de bits codificado estéreo enviado pelo terminal móvel.
[0076] Opcionalmente, nesta modalidade, um dispositivo no qual o componente de codificação 110 está instalado é referido como um dispositivo de codificação de áudio. Na implementação real, o dispositivo de codificação de áudio também pode ter uma função de decodificação de áudio. Isto não está limitado nesta modalidade.
[0077] Opcionalmente, esta modalidade é descrita usando apenas o sinal estéreo como exemplo. Neste pedido, o dispositivo de codificação de áudio pode ainda processar um sinal multicanal, e o sinal multicanal inclui pelo menos dois canais de sinais.
[0078] Para facilitar a compreensão de um método de codificação de sinal estéreo nas modalidades deste pedido, o seguinte primeiro descreve geralmente um processo de codificação inteiro de um método de codificação estéreo de domínio de frequência e um método de codificação estéreo de domínio de tempo-frequência, respectivamente, com referência às FIG. 4 e FIG. 5.
[0079] A FIG. 4 é um fluxograma esquemático de um método de codificação de sinal estéreo de domínio de frequência. O método de codificação inclui especificamente 101 a 107.
[0080] 101: Converter um sinal estéreo de domínio de tempo em um sinal estéreo de domínio de frequência.
[0081] 102: Extrair um parâmetro estéreo de domínio de frequência no domínio de frequência.
[0082] 103: Realizar o processamento de redução no sinal estéreo de domínio de frequência para obter um sinal reduzido e um sinal residual.
[0083] O sinal reduzido também pode ser referido como um sinal de canal central ou um sinal de canal primário, e o sinal residual pode ser referido como um sinal de canal lateral ou um sinal de canal secundário.
[0084] 104: Codificar o sinal reduzido para obter um parâmetro de codificação correspondente ao sinal reduzido, e gravar o parâmetro de codificação em um fluxo de bits codificado.
[0085] 106: Codificar o parâmetro estéreo de domínio de frequência para obter um parâmetro de codificação correspondente ao parâmetro estéreo de domínio de frequência, e gravar o parâmetro de codificação em um fluxo de bits codificado.
[0086] Em uma implementação opcional, o método pode incluir ainda 105: Codificar o sinal residual para obter um parâmetro de codificação correspondente ao sinal residual, e gravar o parâmetro de codificação em um fluxo de bits codificado.
[0087] 107: Multiplexar o fluxo de bits.
[0088] A FIG. 5 é um fluxograma esquemático de um método de codificação de sinal estéreo de domínio tempo-frequência. O método de codificação inclui especificamente 201 a 208.
[0089] 201: Realizar a análise de domínio de tempo em um sinal estéreo, e extrair um parâmetro estéreo de domínio de tempo.
[0090] 202: Converter um sinal estéreo de domínio de tempo em um sinal estéreo de domínio de frequência.
[091] 203: Extrair um parâmetro estéreo de domínio de frequência no domínio de frequência.
[092] 204: Realizar o processamento de redução no sinal estéreo de domínio de frequência para obter um sinal reduzido e um sinal residual.
[093] 205: Codificar o sinal reduzido para obter um parâmetro de codificação correspondente ao sinal reduzido, e gravar o parâmetro de codificação em um fluxo de bits codificado.
[094] 207: Codificar o parâmetro estéreo de domínio de tempo e o parâmetro estéreo de domínio de frequência para obter um parâmetro de codificação correspondente ao parâmetro estéreo de domínio de tempo e um parâmetro de codificação correspondente ao parâmetro estéreo de domínio de frequência, e gravar os parâmetros de codificação em um fluxo de bits codificado.
[095] Opcionalmente, o método inclui ainda 206: Codificar o sinal residual para obter um parâmetro de codificação correspondente ao sinal residual, e gravar o parâmetro de codificação em um fluxo de bits codificado.
[096] 208: Multiplexar o fluxo de bits.
[097] Quando uma taxa de codificação é comparativamente baixa, por exemplo, quando uma largura de banda de codificação é de banda larga (Wideband), se a taxa de codificação é comparativamente baixa, como 26 kilo-bytes por segundo (Kilo-bytes per second, kbps), 16,4 kbps, 24,4 kbps, ou 32 kbps, para melhorar um sentido espacial e estabilidade durante a reprodução do sinal estéreo e reduzir a distorção de alta frequência do sinal estéreo, e quando um sinal reduzido de cada quadro do sinal estéreo é codificado, todos os sinais residuais de sub-bandas que atendem a uma faixa de largura de banda predefinida são codificados. Alternativamente, quando uma taxa de codificação é comparativamente baixa, apenas um parâmetro estéreo e um sinal reduzido são codificados. Alguns ou todos os sinais residuais são codificados apenas quando a taxa de codificação é comparativamente alta, como 48 kbps, 64 kbps ou 96 kbps. Este pedido fornece um método de codificação de sinal estéreo. Neste método, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação geral.
[098] A FIG. 6 é um fluxograma esquemático de um método de codificação de sinal estéreo 300 de acordo com uma modalidade deste pedido. O método 300 pode ser executado por um lado de codificador, e o lado de codificador pode ser um codificador ou um dispositivo com uma função de codificação de sinal estéreo. O método 300 inclui pelo menos as seguintes etapas.
[099] O método de codificação de sinal estéreo neste pedido pode ser um método de codificação estéreo que pode ser aplicado de forma independente, ou pode ser um método de codificação estéreo aplicado à codificação de sinal multicanal. O lado de codificador processa um sinal estéreo por quadro. O seguinte usa um sinal estéreo de banda larga com um comprimento de sinal de cada quadro sendo 20 ms como exemplo, e usa um quadro (por exemplo, um quadro atual) que está sendo processado pelo lado de codificador como um exemplo para descrever em detalhes um método de codificação de sinal estéreo no método 300.
[0100] 301: Determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub- bandas, as M sub-bandas são pelo menos algumas das N sub- bandas, N é um número inteiro positivo maior que 1, M ≤ N e M é um número inteiro positivo.
[0101] Especificamente, o lado de codificador divide os coeficientes espectrais do quadro atual do sinal estéreo para obter N sub-bandas, e determina o parâmetro de codificação de sinal residual do quadro atual com base na energia de sinal reduzido e na energia de sinal residual de cada um de pelo menos algumas das N sub-bandas (por exemplo, M sub-bandas nas N sub-bandas, M ≤ N), onde o parâmetro de codificação de sinal residual do quadro atual pode ser usado pelo lado de codificador para determinar se deve codificar um sinal residual de cada uma das M sub-bandas.
[0102] 302: Determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual.
[0103] Especificamente, o lado de codificador determina, com base no parâmetro de codificação de sinal residual, determinado na etapa 301, do quadro atual, se deve codificar o sinal residual de cada uma das M sub-bandas do quadro atual.
[0104] Quando é determinado que codifica o sinal residual de cada uma das M sub-bandas, um sinal reduzido e o sinal residual de cada uma das M sub-bandas são codificados.
[0105] Quando é determinado que não codifica o sinal residual de cada uma das M sub-bandas, um sinal reduzido de cada uma das M sub-bandas é codificado.
[0106] Em uma implementação, como um exemplo em vez de uma limitação, as M sub-bandas são M sub-bandas cujos números de índice de sub-banda são menores do que um número de índice de sub-banda máximo predefinido nas N sub-bandas. Em outras palavras, as M sub-bandas são sub-bandas com frequências comparativamente baixas nas N sub-bandas, para ser específico, as frequências das M sub-bandas são mais baixas do que as frequências de N - M sub-bandas nas N sub-bandas diferentes das M sub-bandas.
[0107] Especificamente, diferentes números de índice de sub-banda máximos são predefinidos com base em diferentes taxas de codificação, de modo que M sub-bandas cujos números de índice de sub-banda são menores ou iguais ao número de índice de sub-banda máximo predefinido são selecionadas a partir de N sub-bandas com base no número de índice de sub- banda máximo predefinido, e o parâmetro de codificação de sinal residual do quadro atual é determinado com base nas M sub-bandas.
[0108] Por exemplo, quando a taxa de codificação é de 26 kbps, N = 10, M = 5 e o número de índice de sub-banda máximo predefinido é definido como 4, isso indica que o parâmetro de codificação de sinal residual do quadro atual é determinado com base em cinco sub-bandas cujos números de índice de sub-banda são 0 a 4 nas 10 sub-bandas.
[0109] Para outro exemplo, quando a taxa de codificação é de 44 kbps, N = 12, M = 6, e o número de índice de sub- banda máximo predefinido é definido como 5, isso indica que o parâmetro de codificação de sinal residual do quadro atual é determinado com base em seis sub-bandas cujos números de índice de sub-banda são de 0 a 5 nas 12 sub-bandas.
[0110] Para outro exemplo, quando a taxa de codificação é 56 kbps, N = 12, M = 7, e o número de índice de sub-banda máximo predefinido é definido como 6, isso indica que o parâmetro de codificação de sinal residual do quadro atual é determinado com base em sete sub-bandas cujos números de índice de sub-banda são 0 a 6 nas 12 sub-bandas.
[0111] Em outra implementação, para diferentes taxas de codificação, os números de índice de sub-banda máximos e os números de índice de sub-banda mínimos de M sub-bandas em diferentes taxas de codificação podem ser predefinidos, de modo que M sub-bandas cujos números de índice de sub-banda são maiores que ou igual ao número de índice de sub-banda mínimo predefinido e menor ou igual ao número de índice de sub-banda máximo predefinido são selecionados a partir de N sub-bandas com base no número de índice de sub-banda máximo predefinido e o número de índice de sub-banda mínimo predefinido, e o parâmetro de codificação de sinal residual do quadro atual é determinado com base nas M sub-bandas.
[0112] Por exemplo, quando a taxa de codificação é 26 kbps, N = 10, M = 4, o número de índice de sub-banda mínimo predefinido é definido como 4, e o número de índice de sub- banda máximo predefinido é definido como 7, isso indica que o parâmetro de codificação de sinal residual do quadro atual é determinado com base em quatro sub-bandas cujos números de índice de sub-banda são 4 a 7 nas 10 sub-bandas.
[0113] Como um exemplo, em vez de uma limitação, determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica o sinal residual de cada uma das M sub-bandas inclui: determinar, com base em um resultado de comparação entre o sinal residual parâmetro de codificação do quadro atual e um primeiro limite predefinido, se codifica o sinal residual de cada uma das M sub-bandas, em que o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual do quadro atual é menor ou igual ao primeiro limite, determinar não codificar o sinal residual de cada uma das M sub-bandas; ou quando o parâmetro de codificação de sinal residual é maior do que o primeiro limite, determinar a codificação do sinal residual de cada uma das M sub-bandas.
[0114] Especificamente, o lado de codificador compara o parâmetro de codificação de sinal residual do quadro atual com o primeiro limite predefinido e, quando o parâmetro de codificação de sinal residual do quadro atual é maior do que o primeiro limite, determina a codificação do sinal residual de cada um dos M sub-bandas, ou quando o parâmetro de codificação de sinal residual do quadro atual é menor ou igual ao primeiro limite, determina não codificar o sinal residual de cada uma das M sub-bandas.
[0115] Por exemplo, em uma implementação, o primeiro limite é 0,075. Se um valor do parâmetro de codificação de sinal residual do quadro atual for 0,06, o lado de codificador não codifica o sinal residual de cada uma das M sub-bandas.
[0116] Deve ser entendido que o valor do primeiro limite é meramente um exemplo e o primeiro limite pode, alternativamente, ser outro valor maior que 0 e menor que 1,0. Por exemplo, o primeiro limite é 0,55, 0,46, 0,86 ou 0,9.
[0117] Em outra implementação opcional, o lado de codificador pode indicar ainda o resultado da comparação entre o parâmetro de codificação de sinal residual do quadro atual e o primeiro limite usando 0 ou 1. Por exemplo, 0 é usado para indicar que o sinal residual de cada uma das M sub-bandas não deve ser codificado, e 1 é usado para indicar que o sinal residual de cada uma das M sub-bandas deve ser codificado. Certamente, 1 pode ser usado alternativamente para indicar que o sinal residual de cada uma das M sub- bandas não deve ser codificado, e 0 pode, alternativamente,
ser usado para indicar que o sinal residual de cada uma das M sub-bandas deve ser codificado.
[0118] O seguinte usa um exemplo em que as M sub-bandas são sub-bandas cujos números de índice de sub-banda são menores ou iguais ao número de índice de sub-banda máximo predefinido (por exemplo, o número de índice de sub-banda máximo é M - 1) para descrever em detalhes um método no qual o lado de codificador determina o parâmetro de codificação de sinal residual do quadro atual. Método 1
[0119] O lado de codificador determina o parâmetro de codificação de sinal residual do quadro atual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
[0120] Em uma implementação possível, o lado de codificador determina um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determina um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e finalmente determina o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0121] Especificamente, ao determinar o primeiro parâmetro, o lado de codificador determina os M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub- bandas, onde os M parâmetros de energia indicam, cada um, uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de uma das M sub-bandas, respectivamente, e os M parâmetros de energia um a um correspondem às M sub-bandas; e o lado de codificador finalmente determina um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0122] Opcionalmente, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia pode ser determinado usando a seguinte função: res_dmx_ratio[b] = f(g(b), res_cod_NRG_M[b], res_cod_NRG_S[b]) (1), onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b,
res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-banda é b, e g(b) representa uma função de a ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
[0123] Especificamente, em uma implementação, o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res _ dmx _ ratio b  res _ cod _ NRG _ S b / ( res _ cod _ NRG _ S b  1  g  b    1  g  b   (2). res _ cod _ NRG _ M b  1)
[0124] O primeiro parâmetro é denotado como res_dmx_ratio, e res_dmx_ratio atende a: res_dmx_ratio = max (res_dmx_ratio[0], res_dmx_ratio[1],..., res_dmx_ratio[M – 1]) (3).
[0125] Ao determinar o segundo parâmetro, o lado de codificador primeiro determina separadamente uma soma da energia de sinal residual das M sub-bandas e uma soma da energia de sinal reduzido das M sub-bandas, e denota a soma da energia de sinal reduzido das M sub-bandas como dmx_nrg_all_curr e a soma da energia de sinal residual das M sub-bandas como res_nrg_all_curr.
[0126] Opcionalmente, a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas atende: b  M 1    res _ cod _ NRG _ M  b   1     dmx _ nrg _ all _ curr    1 1   (4), onde b  0  res _ cod _ NRG _ M _ prev  b   representa a energia de sinal reduzido de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  1 representa um fator de suavização, e  1 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  1  0.1 .
[0127] Deve ser entendido que o valor de  1 é apenas um exemplo, e o valor de  1 pode, alternativamente, ser outro valor maior ou igual a 0 e menor ou igual a 1. Por exemplo,  1 é 0,3, 0,5, 0,6 ou 0,8.
[0128] Opcionalmente, a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas atende: b  M 1    res _ cod _ NRG _ S  b   1     res _ nrg _ all _ curr    2 2   (5), onde b  0  res _ cod _ NRG _ S _ prev  b   res _ cod _ NRG _ S _ prev b  representa a energia de sinal residual de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  2 representa um fator de suavização, e  2 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  2  0.1 .
[0129] Deve ser entendido que o valor de  2 é apenas um exemplo, e o valor de  2 pode, alternativamente, ser outro valor maior ou igual a 0 e menor ou igual a 1. Por exemplo,  2 é 0,2, 0,5, 0,7 ou 0,9.
[0130] O lado de codificador determina a soma (ou seja, a primeira soma de energia) da energia de sinal reduzido e a energia de sinal residual das M sub-bandas do quadro atual com base em dmx_nrg_all_curr e res_nrg_all_curr. A primeira soma de energia é denotada como dmx_res_all.
[0131] Opcionalmente, dmx_res_all atende: dmx_res_all = res_nrg_all_curr + dmx_nrg_all_curr (6).
[0132] O lado de codificador pode ainda determinar a soma (ou seja, a segunda soma de energia) da energia de sinal residual e a energia de sinal reduzido das M sub-bandas no sinal de domínio de frequência do quadro anterior do quadro atual, onde M sub-bandas do quadro anterior do quadro atual têm os mesmos números de índice de sub-banda que as M sub- bandas do quadro atual. A segunda soma de energia é denotada como dmx_res_all_prev.
[0133] Para a determinação da segunda soma de energia dmx_res_all_prev, consulte o método anterior para determinar a primeira soma de energia dmx_res_all. Por uma questão de brevidade, os detalhes não são descritos aqui novamente.
[0134] Depois de determinar a primeira soma de energia e a segunda soma de energia, o lado de codificador pode determinar o segundo parâmetro com base na primeira soma de energia e na segunda soma de energia.
[0135] Opcionalmente, o segundo parâmetro é uma razão de flutuação de energia entre quadros e a razão de flutuação de energia entre quadros é denotada como frame_nrg_ratio.
[0136] Opcionalmente, em uma implementação, a taxa de flutuação de energia entre quadros frame_nrg_ratio atende a: frame_nrg_ratio = dmx_res_all/dmx_res_all_prev (7).
[0137] Opcionalmente, em outra implementação, a taxa de flutuação de energia entre quadros frame_nrg_ratio atende: frame_nrg_ratio = min(5,0, max (0,2, dmx_res_all/dmx_res_all_prev)) (8).
[0138] A função max é usada para retornar um valor maior em um determinado parâmetro (0,2, frame_nrg_ratio_prev), e a função min é usada para retornar um valor mínimo em um dado parâmetro (5,0, max (0,2, frame_nrg_ratio_prev)). Comparada com a fórmula (7), a fórmula (8) tem ainda uma operação de correção, de modo que frame_nrg_ratio determinado pelo uso da fórmula (8) pode refletir melhor uma flutuação de energia entre os frames atual e o anterior.
[0139] Depois de determinar o primeiro parâmetro e o segundo parâmetro, o lado de codificador pode determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e no parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0140] Como um exemplo, em vez de uma limitação, o parâmetro de codificação de sinal residual do quadro atual pode ser um parâmetro de suavização de longo prazo do quadro atual. Em outras palavras, o lado de codificador pode determinar o parâmetro de suavização de longo prazo do quadro atual com base no primeiro parâmetro, no segundo parâmetro e no parâmetro de suavização de longo prazo do quadro anterior do quadro atual e, em seguida, comparar o parâmetro de suavização de longo prazo do quadro atual com o primeiro limite predefinido, de modo a determinar se deve codificar o sinal residual de cada uma das M sub-bandas.
[0141] Por exemplo, o parâmetro de suavização de longo prazo do quadro atual atende a uma fórmula: res_dmx_ratio_lt = res_dmx_ratio α + res_dmx_ratio_lt_prev∙(1 – α) (9), onde res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1.
[0142] Quando res_dmx_ratio_lt é calculado de acordo com a fórmula (9), quando um valor do primeiro parâmetro e/ou um valor do segundo parâmetro mudam/muda, um valor do parâmetro α na fórmula (9) também pode mudar de acordo. Em outras palavras, conforme o valor do primeiro parâmetro e/ou o valor do segundo parâmetro mudam/muda, um peso do parâmetro de suavização de longo prazo do quadro anterior do quadro atual na fórmula (9) também pode mudar adequadamente.
[0143] Por exemplo, quando o segundo parâmetro é maior que um terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou um valor de α quando o primeiro parâmetro é menor do que um segundo limite predefinido e o segundo parâmetro é maior do que um terceiro limite predefinido é maior do que um valor de α quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor que ou igual ao terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
[0144] Por exemplo, um valor do segundo limite pode ser 0,1, e um valor do terceiro limite pode ser 3,2, para ser específico, quando o segundo parâmetro frame_nrg_ratio for maior que 3,2, um valor de α quando o primeiro parâmetro res_dmx_ratio for menor que 0,1 é maior que um valor de α quando res_dmx_ratio é maior ou igual a 0,1; ou um valor do quarto limite pode ser 0,4, e um valor do quinto limite pode ser 0,21, para ser específico, quando frame_nrg_ratio é menor que 0,21, um valor de α quando res_dmx_ratio é maior que 0,4 é maior que um valor de α quando res_dmx_ratio é menor ou igual a 0,4; ou um valor do segundo limite pode ser 0,1, um valor do terceiro limite pode ser 3,2, e um valor do quinto limite pode ser 0,21, para ser específico, um valor de α quando res_dmx_ratio é menor que 0,1 e frame_nrg_ratio é maior que 3,2 é maior que um valor de α quando frame_nrg_ratio é maior ou igual a 0,21 e menor ou igual a 3,2; ou um valor do quarto limite pode ser 0,4 e um valor do quinto limite pode ser 0,21, para ser específico, um valor de α quando res_dmx_ratio é maior que 0,4 e frame_nrg_ratio é menor que 0,21 é maior que um valor de α quando frame_nrg_ratio é maior ou igual a 0,21 e menor ou igual a 3,2.
[0145] Além disso, por exemplo, quando res_dmx_ratio é menor que 0,1 e frame_nrg_ratio é maior que 3,2, um valor de α é 0,5; ou quando frame_nrg_ratio é maior ou igual a 0,21 e menor ou igual a 3,2, um valor de α é 0,1.
[0146] Deve-se notar que os valores listados do segundo limite ao quinto limite e o valor de α são meramente exemplos para descrição e não constituem qualquer limitação para este pedido. Os valores do segundo limite ao quinto limite e o valor de α podem, alternativamente, ser outros valores em um determinado intervalo.
[0147] Deve-se ainda notar que, quando o quadro atual é o primeiro quadro processado pelo lado de codificador, o quadro atual não possui um quadro anterior. Neste caso,
quando o parâmetro de suavização de longo prazo do quadro atual é determinado, o parâmetro de suavização de longo prazo do quadro anterior do quadro atual na fórmula anterior é um parâmetro de suavização de longo prazo predefinido. Como um exemplo, em vez de uma limitação, um valor do parâmetro de suavização de longo prazo predefinido pode ser 1,0 ou, certamente, pode ser outro valor, como 0,9 ou 1,1. Método 2
[0148] Um método para determinar o parâmetro de codificação de sinal residual no Método 2 é semelhante ao do Método 1, e uma diferença reside em que um método para determinar o primeiro parâmetro difere. Portanto, pode ser feita referência à descrição relacionada de determinação do parâmetro de codificação de sinal residual no Método 1. Por brevidade, apenas o método para determinar o primeiro parâmetro no Método 2 é descrito neste documento.
[0149] Como um exemplo em vez de uma limitação, o lado de codificador determina o primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas.
[0150] Especificamente, ao determinar o primeiro parâmetro, o lado de codificador determina os M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde os M parâmetros de energia indicam, cada um, uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de uma das M sub-bandas, respectivamente, e os M parâmetros de energia um a um correspondem às M sub-bandas;
e o lado de codificador finalmente determina um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0151] Opcionalmente, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo lado de codificador pode ser determinado usando a seguinte função: res_dmx_ratio[b] = f(res_cod_NRG_M[b], res_cod_NRG_S[b]) (10), onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-banda é b.
[0152] Por exemplo, o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b] (11).
[0153] O primeiro parâmetro é denotado como res_dmx_ratio, e res_dmx_ratio atende a: res_dmx_ratio = max (res_dmx_ratio[0], res_dmx_ratio[1],..., res_dmx_ratio[M – 1]) (12).
[0154] Depois de determinar o primeiro parâmetro, o lado de codificador pode determinar um segundo parâmetro de acordo com o método descrito no Método 1, finalmente determinar o parâmetro de codificação de sinal residual de acordo com o método descrito no Método 1, e determinar, com base no parâmetro de codificação de sinal residual, se deve codificar o sinal residual de cada uma das M sub-bandas. Método 3
[0155] Um método para determinar o parâmetro de codificação de sinal residual no Método 3 é semelhante ao do Método 1, e uma diferença reside em que um método para determinar o primeiro parâmetro difere. Portanto, pode ser feita referência à descrição relacionada de determinação do parâmetro de codificação de sinal residual no Método 1. Por brevidade, apenas o método para determinar o primeiro parâmetro no Método 3 é descrito neste documento.
[0156] Como um exemplo em vez de uma limitação, o lado de codificador determina o primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, corrige o primeiro parâmetro, e determina, como um primeiro parâmetro final, um primeiro parâmetro obtido por meio de correção, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas.
[0157] Especificamente, ao determinar o primeiro parâmetro, o lado de codificador determina os M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde os M parâmetros de energia indicam, cada um, uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de uma das M sub-bandas, respectivamente, e os M parâmetros de energia um a um correspondem às M sub-bandas; e o lado de codificador determina uma soma dos M parâmetros de energia como o primeiro parâmetro.
[0158] Opcionalmente, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo lado de codificador pode ser determinado usando a função (1).
[0159] Por exemplo, o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a fórmula (2).
[0160] Opcionalmente, o parâmetro de energia da sub- banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo lado de codificador pode ser determinado usando a função (11).
[0161] Por exemplo, o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a fórmula (11).
[0162] Por exemplo, o primeiro parâmetro res_dmx_ratio1 determinado pelo lado de codificador com base nos M parâmetros de energia atende: M 1 res _ dmx _ ratio1   res _ dmx _ ratio[b] (13). b0
[0163] Além disso, o lado de codificador pode ainda determinar um valor máximo res_dmx_ratio_max nos M parâmetros de energia, e res_dmx_ratio_max atende à fórmula (12).
[0164] O lado de codificador corrige res_dmx_ratio1 com base em res_dmx_ratio_max e a energia de sinal reduzido res_cod_NRG_M[b] de cada uma das M sub-bandas e determina res_dmx_ratio2 obtido por meio de correção.
[0165] Por exemplo, o lado de codificador corrige res_dmx_ratio1 de acordo com a seguinte fórmula, onde M = 5;
e res_dmx_ratio2 obtido através da correção atende:  res _ cod _ NRG _ M  0  res _ cod _ NRG _ M 1  res _ dmx _ ratio2  (res _ dmx _ ratio _ max  0.32 ||      res _ cod _ NRG _ M  2   
512.0   res _ cod _ NRG _ M 3  res _ cod _ NRG _ M  4)?res _ dmx _ ratio _ max:res _ dmx _ ratio  0.2 (14).
[0166] Opcionalmente, res_dmx_ratio2 obtido por meio de correção pode ser corrigido posteriormente.
[0167] Por exemplo, res_dmx_ratio3 finalmente obtido por meio de correção atende: res _ dmx _ ratio3  pow( res _ dmx _ ratio2 ,1.2) (15), onde uma função pow() representa uma função exponencial, e pow(res _ dmx _ ratio2 ,1.2) representa a energia de 1,2 de res_dmx_ratio2.
[0168] Depois de determinar o primeiro parâmetro obtido por meio da correção (res_dmx_ratio3 obtido por meio da correção), o lado de codificador pode determinar um segundo parâmetro de acordo com o método descrito no Método 1, finalmente determinar o parâmetro de codificação de sinal residual de acordo com o método descrito no Método 1, e determinar, com base no parâmetro de codificação de sinal residual, se deve codificar o sinal residual de cada uma das M sub-bandas. Método 4
[0169] Um método para determinar o parâmetro de codificação de sinal residual no Método 4 é semelhante ao do Método 1, e uma diferença reside em que um método para determinar o primeiro parâmetro difere. Portanto, pode ser feita referência à descrição relacionada de determinação do parâmetro de codificação de sinal residual no Método 1. Por brevidade, apenas o método para determinar o primeiro parâmetro no Método 4 é descrito neste documento.
[0170] Como um exemplo, em vez de uma limitação, o lado de codificador determina o primeiro parâmetro com base em uma soma da energia de sinal residual das M sub-bandas e uma soma da energia de sinal reduzido das M sub-bandas.
[0171] Especificamente, o lado de codificador determina separadamente a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas e a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas, e determina o primeiro parâmetro com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0172] Opcionalmente, a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas atende a fórmula (4).
[0173] Opcionalmente, a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas atende a fórmula (5).
[0174] O lado de codificador determina o primeiro parâmetro res_dmx_ratio com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0175] Por exemplo, o primeiro parâmetro res_dmx_ratio finalmente determinado pelo lado de codificador atende: res_dmx_ratio = res_nrg_all_curr/dmx_nrg_all_curr (16).
[0176] Depois de determinar o primeiro parâmetro, o lado de codificador pode determinar um segundo parâmetro de acordo com o método descrito no Método 1, finalmente determinar o parâmetro de codificação de sinal residual de acordo com o método descrito no Método 1, e determinar, com base no parâmetro de codificação de sinal residual, se deve codificar o sinal residual de cada uma das M sub-bandas.
[0177] Para entender melhor todo o processo de codificação de um sinal estéreo, o seguinte também usa um sinal estéreo de banda larga com um comprimento de sinal de cada quadro sendo 20 ms como exemplo e usa um quadro (por exemplo, um quadro atual) que está sendo processado por um lado de codificador como um exemplo, e o método de codificação de sinal estéreo 300 nesta modalidade deste pedido é descrito com referência à FIG. 7. O método de codificação de sinal estéreo mostrado na FIG. 7 inclui pelo menos as seguintes etapas.
[0178] 401: Realizar o pré-processamento de domínio de tempo em um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito, para obter um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito que são obtidos através de pré-processamento de domínio de tempo.
[0179] Especificamente, o comprimento do sinal de um quadro atual é de 20 ms. Se uma frequência de amostragem for 16 kHz (kHz), após a amostragem, um comprimento de quadro do quadro atual H = 320, em outras palavras, o quadro atual inclui 320 pontos de amostragem.
[0180] Um sinal estéreo do quadro atual inclui um sinal de domínio de tempo de canal esquerdo do quadro atual e um sinal de domínio de tempo de canal direito do quadro atual. O sinal de domínio de tempo de canal esquerdo do quadro atual é denotado como xL  n , e o sinal de domínio de tempo de canal direito do quadro atual é denotado como xR  n . n representa um número de sequência de ponto de amostragem, onde n  0,1,, H 1 . O sinal de domínio de tempo de canal esquerdo e o sinal de domínio de tempo de canal direito podem ser referidos como sinais de domínio de tempo de canal esquerdo e direito.
[0181] A realização de pré-processamento de domínio de tempo em um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito do quadro atual pode incluir: respectivamente realizar processamento de filtragem passa-alta no sinal de domínio de tempo de canal esquerdo e sinal de domínio de tempo de canal direito do quadro atual para obter um sinal de domínio de tempo de canal esquerdo e um sinal de domínio de tempo de canal direito do quadro atual que são obtidos por meio de pré-processamento de domínio de tempo. O sinal de domínio de tempo de canal esquerdo do quadro atual que é obtido por meio de pré- processamento é denotado como xL _ HP n  , e o sinal de domínio de tempo de canal direito do quadro atual que é obtido por meio de pré-processamento é indicado como xR _ HP n  . n representa um número de sequência de ponto de amostragem, onde n  0,1,, H 1 . O sinal de domínio de tempo de canal esquerdo do quadro atual que é obtido através do pré- processamento de domínio de tempo e o sinal de domínio de tempo de canal direito do quadro atual que é obtido através do pré-processamento de domínio de tempo pode ser referido como sinais de domínio de tempo de canal direito e esquerdo do quadro atual que são obtidos por meio do pré-processamento de domínio de tempo. Durante o processamento da filtragem passa-alta, pode ser usado um filtro digital de resposta de impulso infinita (Infinite Impulse Response, IIR) cuja frequência de corte é de 20 Hz (Hz), ou pode ser usado um filtro de outro tipo.
[0182] Por exemplo, quando uma taxa de amostragem do sinal estéreo é 16 kHz, uma função de transferência correspondente do filtro passa-alta cuja frequência de corte é 20 Hz pode ser: b  b z 1  b2 z 2 H 20 Hz ( z )  0 1 1 (17) 1  a1 z  a2 z 2 b0 = 0,994461788958195, b1 = –1,988923577916390, b2 = 0,994461788958195, a1 = 1,98892905899653, a2 = – 0,988954249933127, e z representa um fator de transformação da transformada Z. Um filtro de domínio de tempo correspondente é: xL _ HP  n   b0  xL  n   b1  xL  n  1  b2  xL  n  2   a1  xL _ HP  n  1  a2  xL _ HP  n  2  (18).
[0183] 402: Realizar análise de domínio de tempo no sinal de domínio de tempo de canal esquerdo e no sinal de domínio de tempo de canal direito que são obtidos por meio de pré-processamento de domínio de tempo.
[0184] Especificamente, a análise de domínio de tempo pode incluir detecção transitória e similar. A detecção transitória pode realizar separadamente a detecção de energia no sinal de domínio de tempo de canal esquerdo e no sinal de domínio de tempo de canal direito do quadro atual que são obtidos por meio de pré-processamento, de modo a detectar se uma rajada de energia ocorre no quadro atual.
[0185] Por exemplo, energia Ecur _ L do sinal de domínio de tempo de canal esquerdo do quadro atual que é obtido por meio de pré-processamento é calculada. A detecção transitória é realizada com base em um valor absoluto de uma diferença entre a energia Epre _ L de um sinal de domínio de tempo de canal esquerdo de um quadro anterior do quadro atual que é obtido através do pré-processamento e da energia Ecur _ L do sinal de domínio de tempo de canal esquerdo do quadro atual que é obtido por meio de pré-processamento, para obter um resultado de detecção transiente do sinal de domínio de tempo de canal esquerdo do quadro atual que é obtido por meio de pré-processamento. A detecção transitória pode ser realizada, usando o mesmo método, no sinal de domínio de tempo de canal direito do quadro atual que é obtido por meio do pré-processamento.
[0186] A análise de domínio de tempo pode incluir outra análise de domínio de tempo no estado da técnica, além da detecção transiente. Por exemplo, a análise de domínio de tempo pode incluir determinação de parâmetro de diferença de tempo entre canais (Inter-channel Time Difference, ITD) de domínio de tempo, processamento de alinhamento de atraso de domínio de tempo, e pré-processamento de espalhamento de banda.
[0187] 403: Realizar transformação de tempo-frequência no sinal de domínio de tempo de canal esquerdo e no sinal de domínio de tempo de canal direito que são obtidos por meio de pré-processamento de domínio de tempo, para obter um sinal de domínio de frequência de canal esquerdo e um sinal de domínio de frequência de canal direito.
[0188] Especificamente, a transformada discreta de Fourier pode ser realizada no sinal de domínio de tempo de canal esquerdo que é obtido através do pré-processamento de domínio de tempo, para obter o sinal de domínio de frequência de canal esquerdo; e a transformada discreta de Fourier é realizada no sinal de domínio de tempo de canal direito que é obtido por meio de pré-processamento de domínio de tempo, para obter o sinal de domínio de frequência de canal direito.
[0189] Para superar um problema de aliasing espectral,
um método de sobreposição-adição pode ser usado para processamento entre duas vezes consecutivas de transformada discreta de Fourier e, às vezes, zero pode ser adicionado a um sinal de entrada de transformada discreta de Fourier.
[0190] A transformada discreta de Fourier pode ser realizada uma vez para cada quadro, ou cada quadro de sinal pode ser dividido em P (P é um número inteiro positivo maior ou igual a 2) subquadros, e a transformação discreta de Fourier é realizada uma vez para cada subquadro.
[0191] Por exemplo, a transformada discreta de Fourier é realizada uma vez para o quadro atual, um sinal de domínio de frequência de canal esquerdo do quadro atual para o qual a transformada discreta de Fourier é realizada é denotado como L(k) , e um sinal de domínio de frequência de canal direito do quadro atual para o qual a transformada discreta de Fourier é realizada é denotado como R(k ) ; k representa um número de índice de bin de frequência, onde k  0,1,, L 1 , e L representa um comprimento de quadro do quadro atual para o qual a transformada discreta de Fourier é realizada, em outras palavras, o quadro atual para o qual a transformada discreta de Fourier é realizada inclui L bins de frequência.
[0192] Para outro exemplo, um quadro atual é dividido em P subquadros, onde P é um número inteiro positivo maior ou igual a 2. Um sinal de domínio de frequência de canal esquerdo de um subquadro cujo número de índice é i e para o qual a transformada discreta de Fourier é realizada é denotado como Li (k ) , um sinal de domínio de frequência de canal direito do subquadro cujo número de índice é i e para o qual a transformada discreta de Fourier é realizada é denotado como Ri ( k ) ; i representa um número de índice de subquadro, onde i  0,1,, P 1, k representa um número de índice de bin de frequência, onde k  0,1,, L 1 , e L representa um comprimento de quadro de cada subquadro para o qual a transformada discreta de Fourier é realizada, em outras palavras, cada subquadro para o qual a transformada discreta de Fourier é realizada inclui L bins de frequência.
[0193] 404: Determinar um parâmetro ITD, e codificar o parâmetro ITD determinado.
[0194] Especificamente, há uma pluralidade de métodos para determinar o parâmetro ITD. O parâmetro ITD pode ser determinado apenas no domínio de frequência, ou pode ser determinado apenas no domínio de tempo, ou pode ser determinado no domínio de tempo-frequência. Isto não é limitado neste pedido.
[0195] O parâmetro ITD pode ser extraído no domínio de tempo usando um coeficiente de correlação cruzada. Por H 1i exemplo, em uma faixa de 0  i  Tmax , cn  i   x j 0 R _ HP  j   xL _ HP  j  i  e H 1i cp i    j 0 xL _ HP  j   xR _ HP  j  i  são calculados.
max (cn (i ))  max (c p (i ))
[0196] E se 0i T max 0i T max , um Valor do parâmetro ITD é um número oposto de um número de índice correspondente max  cn  i   max ( cn (i ))  max ( c p (i )) 0i T max 0i T max a . E se , um valor de parâmetro max  c p  i   ITD é um número de índice correspondente a ; i representa um número de índice para calcular o coeficiente de correlação cruzada, j representa um número de índice de um ponto de amostragem, Tmax corresponde a um valor máximo de valores de parâmetro ITD em diferentes taxas de amostragem, e H representa o comprimento do quadro atual.
[0197] O parâmetro ITD pode, alternativamente, ser determinado no domínio de frequência com base no sinal de domínio de frequência de canal esquerdo e no sinal do domínio de frequência de canal direito. Por exemplo, tecnologias de transformação de tempo-frequência, como transformada discreta de Fourier (Discrete Fourier Transform, DFT), transformada rápida de Fourier (Fast Fourier Transformation, FFT) e transformada discreta de cosseno modificada (Modified Discrete Cosine Transform, MDCT) podem ser usadas para transformar um sinal de domínio de tempo em um sinal de domínio de frequência.
[0198] Nesta modalidade deste pedido, o sinal de domínio de frequência de canal esquerdo do subquadro cujo número de índice é i e para a qual a transformada discreta de Fourier é realizada é denotada como Li (k ) , onde k  0,1,, L 2  1 , e o sinal de domínio de frequência de canal direito do subquadro cujo número de índice é i e para o qual a transformação é realizada é denotado como Ri ( k ) , onde k  0,1,, L 2  1 e i  0,1, , P  1 . Um coeficiente de correlação cruzada de domínio de frequência do subquadro cujo número de índice é i é calculado de acordo com XCORRi  k   Li  k   Ri  k  , onde R * i (k ) representa uma conjugação de um sinal de domínio de frequência de canal direito de um i ésimo subquadro para o qual a transformação é realizada.
[0199] O coeficiente de correlação cruzada de domínio de frequência é convertido no domínio de tempo xcorri (n ) , onde n  0,1,, L  1 , e um valor máximo de xcorri (n) é pesquisado em uma faixa L / 2  Tmax  n  L / 2  Tmax , para obter que um valor de parâmetro ITD do subquadro cujo número de índice é i é Ti  arg max L 2  Tmax  n  L 2  Tmax  xcorr  n    L2 . i
[0200] Além disso, um valor de amplitude pode ainda ser
1 L 2 1  2  k  j  calculado de acordo com mag  j     L  k   R  k   exp  i i  em i 0 k 0 L  um intervalo de pesquisa  Tmax  j  Tmax com base no sinal de domínio de frequência de canal esquerdo e no sinal de domínio de frequência de canal direito do subquadro cujo número de índice é i e para o qual a transformação DFT é realizada, e o valor do parâmetro ITD é T  arg T max  j T (mag ( j )) , para ser mais max max específico, o valor do parâmetro ITD é um número de índice correspondente a um valor de amplitude máxima.
[0201] Após o parâmetro ITD ser determinado, o parâmetro ITD pode ser codificado para obter um parâmetro de codificação, e o parâmetro de codificação é gravado em um fluxo de bits codificado estéreo.
[0202] 405: Realizar ajuste de deslocamento de tempo no sinal de domínio de frequência esquerdo e no sinal de domínio de frequência de canal direito com base no parâmetro ITD.
[0203] Especificamente, o ajuste de deslocamento de tempo pode ser realizado no sinal de domínio de frequência de canal esquerdo e no sinal de domínio de frequência de canal direito de acordo com qualquer tecnologia. No entanto isto não está limitado nesta modalidade deste pedido.
[0204] Por exemplo, um quadro atual de sinal é dividido em P subquadros, onde P é um número inteiro positivo maior ou igual a 2. Um sinal de domínio de frequência de canal esquerdo, obtido por meio de ajuste de deslocamento de tempo, de um subquadro cujo número de índice é i pode ser denotado como L'i (k ) , onde k  0,1,, L 2  1 , e um sinal de domínio de frequência de canal direito, obtido por meio de ajuste de deslocamento de tempo, do subquadro cujo número de índice é i pode ser denotado como Ri' (k ) , k representa um número de índice de bin de frequência, onde k  0,1,, L 2  1 e i representa um número de índice de subquadro, onde i  0,1, , P  1 Tj  j 2 L ( k )  Li ( k )  e ' i
L Tj (19).  j 2 Ri' ( k )  Ri ( k )  e L
[0205] Ti representa um valor de parâmetro ITD do subquadro cujo número de índice é i, L representa um comprimento de um subquadro para a qual a transformada discreta de Fourier é realizada, Li (k ) representa um sinal de domínio de frequência de canal esquerdo de um i ésimo subquadro cujo número de índice é i e para o qual a transformação é realizada, e Ri (k ) representa um sinal de domínio de frequência de canal direito do subquadro cujo número de índice é i e para o qual a transformação é realizada, e i representa um número de índice de subquadro, onde i  0,1, , P  1 .
[0206] 406: Calcular outro parâmetro estéreo de domínio de frequência com base em um sinal de domínio de frequência de canal esquerdo e um sinal de domínio de frequência de canal direito que são obtidos por meio de ajuste de deslocamento de tempo, e codificar o outro parâmetro estéreo de domínio de frequência.
[0207] Especificamente, o outro parâmetro estéreo de domínio de frequência pode incluir, mas não está limitado a, um parâmetro de diferença de fase entre canais (Inter-channel Phase Difference, IPD), e/ou um parâmetro de diferença de nível entre canais (Inter-channel Level Difference, ILD), e/ou um ganho lateral de sub-banda, e/ou semelhantes. O ILD também pode ser referido como uma diferença de amplitude entre canais.
[0208] Após o outro parâmetro estéreo de domínio de frequência ser obtido por meio de cálculo, o outro parâmetro estéreo de domínio de frequência pode ser codificado para obter um parâmetro de codificação, e o parâmetro de codificação é gravado no fluxo de bits codificado estéreo.
[0209] 407: Determinar, a partir de N sub-bandas incluídas em um sinal de domínio de frequência do quadro atual, M sub-bandas que atendem a uma condição predefinida.
[0210] Especificamente, um sinal de domínio de frequência, obtido por meio de ajuste de deslocamento de tempo, do quadro atual é dividido em sub-bandas. Por exemplo, o sinal de domínio de frequência do quadro atual é dividido em N (N é um número inteiro positivo maior ou igual a 2) sub-bandas e um bin de frequência incluído em uma sub-banda cujo número de índice de sub-banda b é k [band _ limits(b),band _limits(b  1)  1] , onde representa um número de índice mínimo de bins de frequência incluídos na sub-banda cujo número de índice de sub-banda é b , e band _ limits(b  1) representa um número de índice mínimo de bins de frequência incluídos em uma sub-banda cujo número de índice de sub-banda é b + 1. De acordo com uma condição predefinida, as M sub-bandas que atendem à condição predefinida são determinadas a partir das N sub-bandas.
[0211] Por exemplo, a condição predefinida pode ser que um número de índice de sub-banda seja menor ou igual a um número de índice de sub-banda máximo predefinido, ou seja, b  res _ cod _ band_max , onde res _ cod _ band_max representa o número de índice de sub-banda máximo predefinido.
[0212] A condição predefinida pode ser, alternativamente, que um número de índice de sub-banda seja menor ou igual a um número de índice de sub-banda máximo predefinido e seja maior ou igual a um número de índice de sub-banda mínimo predefinido, isto é, res _ cod _ band_min  b  res _ cod _ band_max , onde res _ cod _ band_max representa o número de índice de sub-banda máximo predefinido, e res _ cod _ band_min representa o número de índice de sub-banda mínimo predefinido.
[0213] Além disso, para um sinal estéreo de banda larga, diferentes condições predefinidas podem ser definidas com base em diferentes taxas de codificação. Por exemplo, quando a taxa de codificação é de 26 kbps, a condição predefinida pode ser um número de índice de sub-banda b  5 , em outras palavras, o número de índice de sub-banda máximo predefinido é 5. Quando a taxa de codificação é de 44 kbps, a condição predefinida pode ser um número de índice de sub-banda b  6 , em outras palavras, o número de índice de sub-banda máximo predefinido é 6. Quando a taxa de codificação é de 56 kbps, a condição predefinida pode ser um número de índice de sub- banda b  7 , em outras palavras, o número de índice de sub- banda máximo predefinido é 7.
[0214] Por exemplo, se a condição predefinida for um número de índice de sub-banda b  4 , cinco sub-bandas cujos números de índice são 0 a 4 podem ser determinadas a partir das N sub-bandas do quadro atual como sub-bandas que atendem à condição predefinida.
[0215] Além disso, se o quadro atual for dividido em P subquadros (P é um número inteiro positivo maior ou igual a 2), cada subquadro obtido por meio do ajuste de deslocamento de tempo é dividido em sub-bandas. Por exemplo, um subquadro cujo número de índice é i ( i  0,1,, P 1) é dividido em N sub- bandas, uma categoria de frequência incluída em uma sub-
banda cujo número de índice é b no subquadro cujo número de índice é i é ki  [band _ limits(b ), band _ limits(b  1)  1] , onde representa um número de índice mínimo de bins de frequência incluídos na sub-banda cujo número de índice é b no subquadro cujo número de índice é i, e band _ limits(b  1) representa um número de índice mínimo de bins de frequência incluídos em uma sub-banda cujo número de índice é b + 1 no subquadro cujo número de índice é i.
[0216] De acordo com uma condição predefinida, as M sub- bandas que atendem à condição predefinida são determinadas a partir de N sub-bandas incluídas em cada quadro.
[0217] A condição predefinida pode ser que um número de índice de uma sub-banda seja maior ou igual ao número de índice de sub-banda mínimo predefinido e seja menor ou igual ao número de índice de sub-banda máximo predefinido, isto é, res _ cod _ band_min  b  res _ cod _ band_max .
[0218] Por exemplo, se a condição predefinida for 4  b  8 , cinco sub-bandas cujos números de índice são 4 a 8 são determinadas, a partir das N sub-bandas em cada subquadro, como sub-bandas que atendem à condição predefinida.
[0219] 408: Calcular, com base no sinal de domínio de frequência de canal esquerdo e no sinal de domínio de frequência de canal direito que são obtidos por meio de ajuste de deslocamento de tempo, sinais reduzidos e sinais residuais das sub-bandas que atendem à condição predefinida.
[0220] Especificamente, um método para calcular os sinais reduzidos e os sinais residuais das sub-bandas que atendem à condição predefinida é descrito usando um exemplo em que o quadro atual é dividido em P subquadros (P é um número inteiro positivo maior ou igual a 2) (por exemplo, o quadro atual pode ser dividido em dois subquadros ou quatro subquadros).
[0221] Por exemplo, se a condição predefinida é que o número de índice de sub-banda b for menor ou igual a 5, sinais reduzidos e sinais residuais de sub-bandas cujos números de índice são de 0 a 5 em cada subquadro são calculados.
[0222] Um sinal reduzido de uma sub-banda cujo número de índice é b (b ≤ 5) em um subquadro cujo número de índice é i é denotado como DMX i ( k ) , e um sinal residual da sub- banda cujo número de índice é b no subquadro, cujo número de índice i é denotado como RESi ' (k ) , onde DMX i ( k ) e RESi ' (k ) atendem: L''i ( k )  Ri'' ( k ) DMX i ( k )  (20); 2 RESi ' (k )  RESi (k )  g _ ILDi  DMX i (k ) (21); L (k )  R (k ) '' '' RESi ( k )  i i (22); 2  j  Li ( k )  Li ( k )  e '' '  ''  j ( IPD ( b )   ) (23);  Ri ( k )  Ri (k )  e '   arctan(sin( IPDi (b)), cos( IPDi (b))  2  c ) (24); e 1  g _ ILDi c (25). 1  g _ ILDi
[0223] representa um parâmetro IPD da sub-banda cujo número de índice b está no subquadro, cujo número de índice é i , e representa um ganho lateral da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i , representa um sinal de domínio de frequência de canal esquerdo, obtido por meio de ajuste de deslocamento de tempo, da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i, representa um sinal de domínio de frequência de canal direito, obtido por meio de ajuste de deslocamento de tempo, da sub-banda cujo número de índice b está no subquadro, cujo número de índice é i , representa um sinal de domínio de frequência de canal esquerdo, obtido através do ajuste de uma pluralidade de parâmetros estéreo, da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i , representa um sinal de domínio de frequência de canal direito, obtido através do ajuste de uma pluralidade de parâmetros estéreo, da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i , i representa um número de índice de subquadro, onde i  0,1, , P  1 , k representa um número de índice de bin de frequência, onde k [band _ limits(b),band _limits(b  1)  1] , representa um número de índice mínimo de bins de frequência incluídos na sub-banda cujo número de índice é b no subquadro cujo número de índice é i, e band _ limits(b  1) representa um número de índice mínimo de bins de frequência incluídos em uma sub-banda cujo número de índice é b + 1 na sub-banda cujo número de índice é i.
[0224] Para outro exemplo, o sinal reduzido DMX i ( k ) da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i pode, alternativamente, ser calculado de acordo com o seguinte método: DMX i (k )  [L'' (k )  R'' (k )]  c (26); e 1 L'' ( k ) 2  R '' ( k ) 2 c  (27). 2 ( L'' ( k )  R '' ( k )) 2
[0225] L''i (k ) representa um sinal de domínio de frequência de canal esquerdo, obtido através do ajuste da pluralidade de parâmetros estéreo, da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i , e Ri'' (k ) representa um sinal de domínio de frequência de canal direito, obtido através do ajuste da pluralidade de parâmetros estéreo, da sub-banda cujo número de índice é b no subquadro, cujo número de índice é i , i representa um número de índice de subquadro, onde i  0,1, , P  1 , k representa um número de índice de bin de frequência, onde k [band _ limits(b),band _limits(b  1)  1] , band _ limits(b) representa o número de índice mínimo dos bins de frequência incluídos na sub-banda cujo número de índice de sub-banda é b , e band _ limits(b  1) representa o número de índice mínimo das bins de frequência incluídos na sub-banda cujo número de índice é b + 1 na sub-banda cujo número de índice é i. Um método para calcular a energia de sinal reduzido e a energia de sinal residual não é limitado nesta modalidade deste pedido.
[0226] 409: Determinar um parâmetro de codificação de sinal residual com base na energia de sinal reduzido e na energia de sinal residual das sub-bandas que atendem à condição predefinida.
[0227] 410: Determinar, com base no parâmetro de codificação de sinal residual, se um sinal residual de cada uma das M sub-bandas do quadro atual precisa ser codificado. Se for determinado que o sinal residual precisa ser codificado, 412 é realizado. Se for determinado que o sinal residual não precisa ser codificado, 411 é realizado.
[0228] 411: Codificar um sinal reduzido de cada uma das M sub-bandas do quadro atual com base no parâmetro de codificação de sinal residual. Nesse caso, o sinal residual não precisa ser codificado.
[0229] 412: Codificar um sinal reduzido e o sinal residual de cada uma das M sub-bandas do quadro atual com base no parâmetro de codificação de sinal residual.
[0230] Para a implementação específica das etapas 409 a 411, consulte as descrições relacionadas no método 300. Por uma questão de brevidade, os detalhes não são descritos aqui novamente.
[0231] Deve-se notar que, no método 300, quando o lado de codificador divide o quadro atual em P subquadros, onde P é um número inteiro positivo maior ou igual a 2, e divide os coeficientes espectrais de cada um dos P subquadros em N sub-bandas, e quando o parâmetro de codificação de sinal residual é determinado com base na energia de sinal reduzido e na energia de sinal residual das M sub-bandas (as M sub- bandas são pelo menos algumas das N sub-bandas) que atendem à condição predefinida e que estão em cada subquadro, consequentemente, no método 300, a energia de sinal residual res_cod_NRG_S[b] da sub-banda cujo número de índice é b no quadro atual é uma soma da energia de sinal residual da sub- banda cujo número de índice é b em todos os P subquadros, e a energia de sinal reduzido res_cod_NRG_M[b] da sub-banda cujo número de índice é b no quadro atual é uma soma da energia de sinal reduzido da sub-banda cujo número de índice é b em todos dos P subquadros.
[0232] Por exemplo, o quadro atual é dividido em dois subquadros, e os coeficientes espectrais de cada um dos dois subquadros são divididos em N sub-bandas. Por conseguinte, no método 300, a energia de sinal reduzido res_cod_NRG_M[b] da sub-banda cujo número de índice é b no quadro atual é uma soma da energia de sinal reduzido de uma sub-banda cujo número de índice é b em uma sub-banda 1 e energia de sinal reduzido de uma sub-banda cujo número de índice é b em um subquadro 2, e a energia de sinal residual res_cod_NRG_ S[b]
da sub-banda cujo número de índice é b na estrutura atual é uma soma da energia de sinal residual da sub-banda cujo número de índice é b no subquadro 1 e a energia de sinal residual da sub-banda cujo número de índice é b no subquadro
2.
[0233] O anterior descreve em detalhes o método de codificação de sinal estéreo nas modalidades deste pedido com as FIG. 1 à FIG. 7. O seguinte descreve um aparelho de codificação de sinal estéreo nas modalidades deste pedido com referência às FIG. 8 e FIG. 9. Deve ser entendido que o aparelho em qualquer uma das FIG. 8 e FIG. 9 corresponde ao método de codificação de sinal estéreo nas modalidades deste pedido. Além disso, o aparelho em qualquer uma das FIG. 8 e FIG. 9 pode realizar o método de codificação de sinal estéreo nas modalidades deste pedido. Por questões de brevidade, as descrições repetidas são apropriadamente omitidas abaixo.
[0234] A FIG. 8 é um diagrama de blocos esquemático de um aparelho de codificação de sinal estéreo de acordo com uma modalidade deste pedido. Um aparelho 500 na FIG. 8 inclui: um primeiro módulo de determinação 501, configurado para determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N e M é um número inteiro positivo; e um segundo módulo de determinação 502, configurado para determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual.
[0235] Neste pedido, o parâmetro de codificação de sinal residual é determinado com base na energia de sinal reduzido e na energia de sinal residual de M sub-bandas que estão nas N sub-bandas e que atendem a uma faixa de largura de banda predefinida, e se codifica um sinal residual de cada uma das M sub-bandas é determinado com base no parâmetro de codificação de sinal residual. Isso evita a codificação de apenas um sinal reduzido quando uma taxa de codificação é comparativamente baixa. Alternativamente, se codifica todos os sinais residuais de sub-bandas que atendem a uma faixa de largura de banda predefinida é determinado com base no parâmetro de codificação de sinal residual. Portanto, a distorção de alta frequência de um sinal estéreo decodificado pode ser reduzida tanto quanto possível, enquanto um sentido espacial e estabilidade de imagem-som do sinal estéreo decodificado são melhorados, melhorando assim a qualidade de codificação.
[0236] Opcionalmente, em uma implementação, as M sub- bandas são M sub-bandas cujos números de índice de sub-banda são menores ou iguais a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0237] Opcionalmente, em uma implementação, as M sub- bandas são M sub-bandas cujos números de índice de sub-banda são maiores ou iguais a um número de índice de sub-banda mínimo predefinido e menor ou igual a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0238] Opcionalmente, em uma implementação, o segundo módulo de determinação 502 é ainda configurado para comparar o parâmetro de codificação de sinal residual com um primeiro limite predefinido, onde o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual é menor ou igual ao primeiro limite, determinar não codificar os sinais residuais das M sub-bandas; ou quando o parâmetro de codificação de sinal residual é maior do que o primeiro limite, determinar a codificação do sinal residual de cada uma das M sub-bandas.
[0239] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar o parâmetro de codificação de sinal residual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
[0240] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub- bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0241] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde os M parâmetros de energia indicam, cada um, uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de uma das M sub-bandas, respectivamente, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0242] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo primeiro módulo de determinação 501 atende a uma fórmula: res _ dmx _ ratio b   res _ cod _ NRG _ S b  / ( res _ cod _ NRG _ S b   1  g  b    1  g  b   , onde res _ cod _ NRG _ M b   1) res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-
banda é b, e g(b) representa uma função de a ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
[0243] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0244] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde os M parâmetros de energia indicam,
cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas,, e os M parâmetros de energia um a um correspondem às M sub- bandas; e determinar um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0245] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo primeiro módulo de determinação 501 atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/ res_cod_NRG_M[b], onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b.
[0246] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar uma soma dos M parâmetros de energia como o primeiro parâmetro (a ser corrigido) res_dmx_ratio1, corrigir res_dmx_ratio1 com base em um valor máximo res_dmx_ratio_max nos M parâmetros de energia e a energia de sinal reduzido res_cod_NRG_M[b] de cada uma das M sub-bandas, e determinar res_dmx_ratio2 obtido por meio de correção.
[0247] Por exemplo, um lado de codificador corrige res_dmx_ratio1 de acordo com a seguinte fórmula, onde M = 5; e res_dmx_ratio2 obtido através da correção atende:  res _ cod _ NRG _ M  0  res _ cod _ NRG _ M 1  res _ dmx _ ratio2  (res _ dmx _ ratio _ max  0.32 ||      res _ cod _ NRG _ M  2  .  
512.0   res _ cod _ NRG _ M 3  res _ cod _ NRG _ M  4)?res _ dmx _ ratio _ max:res _ dmx _ ratio  0.2
[0248] Opcionalmente, em uma implementação, res_dmx_ratio2 obtido por meio de correção pode ser corrigido posteriormente.
[0249] Por exemplo, res_dmx_ratio3 finalmente obtido por meio de correção atende: res _ dmx _ ratio3  pow( res _ dmx _ ratio2 ,1.2) , onde uma função pow() representa uma função exponencial, e pow(res _ dmx _ ratio2 ,1.2) representa a energia de 1,2 de res_dmx_ratio2.
[0250] Opcionalmente, em uma implementação, o primeiro módulo de determinação 501 é ainda configurado para determinar o primeiro parâmetro com base em uma soma da energia de sinal residual das M sub-bandas e uma soma da energia de sinal reduzido das M sub-bandas.
[0251] Especificamente, o lado de codificador determina separadamente a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas e a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas, e determina o primeiro parâmetro com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0252] Opcionalmente, em uma implementação, a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub- bandas atende: b  M 1   1  res _ cod _ NRG _ M  b  1   1   dmx _ nrg _ all _ curr    res _ cod _ NRG _ M _ prev  b   , onde b 0   res_cod_NRG_M_prev[b] representa a energia de sinal reduzido de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  1 representa um fator de suavização, e  1 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  1  0.1 .
[0253] Opcionalmente, em uma implementação, a soma res_nrg_all_curr da energia de sinal residual das M sub- bandas atende: b  M 1   2  res _ cod _ NRG _ S b   1   2   res _ nrg _ all _ curr    res _ cod _ NRG _ S _ prev  b   , onde b0   res _ cod _ NRG _ S _ prev b  representa a energia de sinal residual de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  2 representa um fator de suavização, e  2 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  2  0.1 .
[0254] O lado de codificador determina o primeiro parâmetro res_dmx_ratio com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0255] Por exemplo, o primeiro parâmetro res_dmx_ratio finalmente determinado pelo lado de codificador atende: res_dmx_ratio = res_nrg_all_curr/ dmx_nrg_all_curr .
[0256] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo primeiro módulo de determinação 501 atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b], onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-banda é b.
[0257] Opcionalmente, em uma modalidade, o parâmetro de codificação de sinal residual, determinado pelo primeiro módulo de determinação 501, do quadro atual é um parâmetro de suavização de longo prazo do quadro atual, e o parâmetro de suavização de longo prazo do quadro atual atende uma fórmula: res_dmx_ratio_lt = res_dmx_ratio∙α + res_dmx_ratio_lt_prev∙(1 – α), onde res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1; e quando o segundo parâmetro é maior que um terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou um valor de α quando o primeiro parâmetro é menor do que um segundo limite predefinido e o segundo parâmetro é maior do que um terceiro limite predefinido é maior do que um valor de α quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor que ou igual ao terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
[0258] Opcionalmente, em uma modalidade, o segundo módulo de determinação 502 é ainda configurado para: quando for determinado codificar os sinais residuais das M sub- bandas, codificar sinais reduzidos e os sinais residuais das M sub-bandas; ou quando for determinado não codificar os sinais residuais das M sub-bandas, codificar os sinais reduzidos das M sub-bandas.
[0259] A FIG. 9 é um diagrama de blocos esquemático de um aparelho de codificação de sinal estéreo de acordo com uma modalidade deste pedido. Um aparelho 600 na FIG. 9 inclui: uma memória 601, configurada para armazenar um programa; e um processador 602, configurado para executar o programa armazenado na memória 601, onde quando o programa na memória é executado, o processador 602 é especificamente configurado para: determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, onde o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas,
as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N, e M é um número inteiro positivo; e determinar, com base no parâmetro de codificação de sinal residual, se codifica os sinais residuais das M sub-bandas do quadro atual.
[0260] Opcionalmente, em uma implementação, as M sub- bandas são M sub-bandas cujos números de índice de sub-banda são menores ou iguais a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0261] Opcionalmente, em uma implementação, as M sub- bandas são M sub-bandas cujos números de índice de sub-banda são maiores ou iguais a um número de índice de sub-banda mínimo predefinido e menor ou igual a um número de índice de sub-banda máximo predefinido nas N sub-bandas.
[0262] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para comparar o parâmetro de codificação de sinal residual com um primeiro limite predefinido, onde o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual é menor que o primeiro limite, determinar não codificar os sinais residuais das M sub-bandas; ou quando o parâmetro de codificação de sinal residual é maior do que o primeiro limite, determinar a codificação do sinal residual de cada uma das M sub-bandas.
[0263] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar o parâmetro de codificação de sinal residual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
[0264] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0265] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, onde os M parâmetros de energia indicam, cada um, uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de uma das M sub- bandas, respectivamente, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0266] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo processador 602 atende a uma fórmula: res _ dmx _ ratio b   res _ cod _ NRG _ S b  / ( res _ cod _ NRG _ S b   1  g  b    1  g  b   , res _ cod _ NRG _ M b   1) onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b, e g(b) representa uma função de ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
[0267] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub-bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
[0268] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, onde os M parâmetros de energia indicam, cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um valor maior nos M parâmetros de energia como o primeiro parâmetro.
[0269] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo processador 602 atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b], onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub- banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b.
[0270] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar uma soma dos M parâmetros de energia como o primeiro parâmetro (a ser corrigido) res_dmx_ratio1, corrigir res_dmx_ratio1 com base em um valor máximo res_dmx_ratio_max nos M parâmetros de energia e a energia de sinal reduzido res_cod_NRG_M[b] de cada uma das M sub-bandas, e determinar res_dmx_ratio2 obtido por meio de correção.
[0271] Por exemplo, um lado de codificador corrige res_dmx_ratio1 de acordo com a seguinte fórmula, onde M = 5; e res_dmx_ratio2 obtido através da correção atende:  res _ cod _ NRG _ M  0  res _ cod _ NRG _ M 1  res _ dmx _ ratio2  (res _ dmx _ ratio _ max  0.32 ||      res _ cod _ NRG _ M  2  .  
512.0   res _ cod _ NRG _ M 3  res _ cod _ NRG _ M  4)?res _ dmx _ ratio _ max:res _ dmx _ ratio  0.2
[0272] Opcionalmente, em uma implementação, res_dmx_ratio2 obtido por meio de correção pode ser corrigido posteriormente.
[0273] Por exemplo, res_dmx_ratio3 finalmente obtido por meio de correção atende: res _ dmx _ ratio3  pow( res _ dmx _ ratio2 ,1.2) , onde uma função pow() representa uma função exponencial, e pow(res _ dmx _ ratio2 ,1.2) representa a energia de 1,2 de res_dmx_ratio2.
[0274] Opcionalmente, em uma implementação, o processador 602 é ainda configurado para determinar o primeiro parâmetro com base em uma soma da energia de sinal residual das M sub-bandas e uma soma da energia de sinal reduzido das M sub-bandas.
[0275] Especificamente, o lado de codificador determina separadamente a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub-bandas e a soma res_nrg_all_curr da energia de sinal residual das M sub-bandas, e determina o primeiro parâmetro com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0276] Opcionalmente, em uma implementação, a soma dmx_nrg_all_curr da energia de sinal reduzido das M sub- bandas atende: b  M 1   1  res _ cod _ NRG _ M  b  1   1   dmx _ nrg _ all _ curr    res _ cod _ NRG _ M _ prev  b   , onde b 0   res_cod_NRG_M_prev[b] representa a energia de sinal reduzido de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  1 representa um fator de suavização, e  1 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  1  0.1 .
[0277] Opcionalmente, em uma implementação, a soma res_nrg_all_curr da energia de sinal residual das M sub- bandas atende: b  M 1   2  res _ cod _ NRG _ S b   1   2   res _ nrg _ all _ curr     , onde b0  res _ cod _ NRG _ S _ prev b   res _ cod _ NRG _ S _ prev b  representa a energia de sinal residual de uma sub-banda cujo número de índice de sub-banda é b no quadro anterior do quadro atual,  2 representa um fator de suavização, e  2 é um número real maior ou igual a 0 e menor ou igual a 1, por exemplo,  2  0.1 .
[0278] O lado de codificador determina o primeiro parâmetro res_dmx_ratio com base em dmx_nrg_all_curr e res_nrg_all_curr.
[0279] Por exemplo, o primeiro parâmetro res_dmx_ratio finalmente determinado pelo lado de codificador atende: res_dmx_ratio = res_nrg_all_curr/ dmx_nrg_all_curr .
[0280] Opcionalmente, em uma implementação, um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo processador 602 atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/ res_cod_NRG_M[b], onde res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia, b é maior ou igual a 0 e é menor ou igual ao número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-banda é b.
[0281] Opcionalmente, em uma implementação, quando o primeiro parâmetro é menor que um segundo limite predefinido e o segundo parâmetro é maior que um terceiro limite predefinido, o parâmetro de codificação de sinal residual, determinado pelo processador 602, do quadro atual é o parâmetro de suavização de longo prazo do quadro atual, e o parâmetro de suavização de longo prazo do quadro atual atende a uma fórmula: res_dmx_ratio_lt = res_dmx_ratio∙α + res_dmx_ratio_lt_prev∙(1 – α), onde res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1; e quando o segundo parâmetro é maior que o terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que o segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou um valor de α quando o primeiro parâmetro é menor do que o segundo limite predefinido e o segundo parâmetro é maior do que o terceiro limite predefinido é maior do que um valor de α quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor que ou igual ao terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
[0282] Opcionalmente, em uma modalidade, o processador 602 é ainda configurado para: quando for determinado codificar os sinais residuais das M sub-bandas, codificar sinais reduzidos e os sinais residuais das M sub-bandas; ou quando for determinado não codificar os sinais residuais das M sub-bandas, codificar os sinais reduzidos das M sub-bandas.
[0283] Este pedido fornece ainda um chip. O chip inclui um processador e uma interface de comunicação. A interface de comunicação é configurada para se comunicar com um dispositivo externo, e o processador é configurado para realizar o método de codificação de sinal estéreo nas modalidades deste pedido.
[0284] Opcionalmente, em uma implementação, o chip pode incluir ainda uma memória. A memória armazena uma instrução, e o processador é configurado para executar a instrução armazenada na memória. Quando a instrução é executada, o processador é configurado para realizar o método de codificação de sinal estéreo nas modalidades deste pedido.
[0285] Opcionalmente, em uma implementação, o chip é integrado em um dispositivo terminal ou um dispositivo de rede.
[0286] Este pedido fornece um meio de armazenamento legível por computador. O meio de armazenamento legível por computador armazena o código do programa a ser executado por um dispositivo. O código do programa inclui uma instrução para realizar o método de codificação de sinal estéreo nas modalidades deste pedido.
[0287] Deve-se entender que, o processador mencionado nas modalidades da presente invenção pode ser uma unidade central de processamento (central processing unit, CPU) ou outro processador de uso geral, um processador de sinal digital (digital signal processor, DSP), um circuito integrado de aplicação específico (application specific integrated circuit, ASIC), uma matriz de portas programáveis em campo (field programmable gate array, FPGA) ou outro dispositivo lógico programável, uma porta discreta ou dispositivo lógico de transistor, um componente de hardware discreto ou semelhante. O processador de uso geral pode ser um microprocessador ou o processador pode ser qualquer processador convencional ou semelhante.
[0288] Pode ser entendido que a memória mencionada nas modalidades da presente invenção pode ser uma memória volátil ou uma memória não volátil, ou pode incluir uma memória volátil e uma memória não volátil. A memória não volátil pode ser uma memória somente leitura (read-only memory, ROM), uma memória somente leitura programável (programmable ROM, PROM), uma memória somente leitura programável apagável (erasable PROM, EPROM), uma memória somente leitura programável eletricamente apagável (electrically EPROM, EEPROM) ou uma memória flash. A memória volátil pode ser uma memória de acesso aleatório (random access memory, RAM), usada como um cache externo. Por meio de um exemplo, mas não de descrição limitativa, muitas formas de RAM podem ser usadas, por exemplo, uma memória estática de acesso aleatório (static RAM, SRAM), uma memória dinâmica de acesso aleatório (dynamic RAM, DRAM), uma memória de acesso aleatório dinâmico síncrono (synchronous DRAM, SDRAM), uma memória de acesso aleatório dinâmico síncrono com taxa de dados dupla (Double Data Rate SDRAM, DDR SDRAM), uma memória de acesso aleatório dinâmico síncrono aprimorada (enhanced SDRAM, ESDRAM), uma memória de acesso aleatório dinâmico de enlace síncrono (synchlink DRAM, SLDRAM) e uma memória de acesso aleatório dinâmico direto ao rambus (direct rambus RAM, DR RAM).
[0289] Deve-se notar que quando o processador é um processador de uso geral, um DSP, um ASIC, um FPGA ou outro dispositivo lógico programável, porta discreta, dispositivo lógico transistor ou componente de hardware discreto, a memória (um módulo de armazenamento) é integrado ao processador.
[0290] Deve-se notar que a memória descrita neste Relatório Descritivo inclui, mas não está limitada a estas memórias e qualquer memória de outro tipo apropriado.
[0291] Um técnico no assunto pode estar ciente de que, em combinação com os exemplos descritos nas modalidades divulgadas neste relatório descritivo, unidades e etapas de algoritmo podem ser implementadas por hardware eletrônico ou uma combinação de software de computador e hardware eletrônico. Se as funções são realizadas por hardware ou software depende de determinadas aplicações e condições de restrições de projeto das soluções técnicas. Um técnico no assunto pode usar métodos diferentes para implementar as funções descritas para cada pedido particular, mas não deve ser considerado que a implementação vai além do escopo deste pedido.
[0292] Pode ser claramente entendido por um técnico no assunto que, com a finalidade de descrição conveniente e breve, para um processo de trabalho detalhado do sistema, aparelho e unidade anteriores, pode ser feita referência a um processo correspondente nas formas de realização de método anteriores, e detalhes não são descritos aqui.
[0293] Nas várias modalidades fornecidas neste pedido, deve-se entender que o sistema, aparelho e método divulgados podem ser implementados de outras maneiras. Por exemplo, a modalidade de aparelho descrita é meramente um exemplo. Por exemplo, a divisão em unidades é apenas uma divisão lógica da função e pode ser outra divisão na implementação real. Por exemplo, uma pluralidade de unidades ou componentes pode ser combinada ou integrada em outro sistema, ou alguns recursos podem ser ignorados ou podem não ser realizados. Além disso, os acoplamentos mútuos, acoplamentos diretos ou conexões de comunicação exibidos ou discutidos podem ser implementados usando algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implementados em formas eletrônicas, mecânicas ou outras.
[0294] As unidades descritas como partes separadas podem ou não estar fisicamente separadas, e as partes exibidas como unidades podem ou não ser unidades físicas, podem estar localizadas em uma posição, ou podem ser distribuídas em uma pluralidade de unidades de rede. Algumas ou todas as unidades podem ser selecionadas com base nos requisitos reais para atingir os objetivos das soluções das modalidades.
[0295] Além disso, as unidades funcionais nas modalidades deste pedido podem ser integradas em uma unidade de processamento, ou cada uma das unidades pode existir sozinha fisicamente, ou duas ou mais unidades são integradas em uma unidade.
[0296] Quando as funções são implementadas em uma forma de uma unidade funcional de software e vendidas ou usadas como um produto independente, as funções podem ser armazenadas em um meio de armazenamento legível por computador. Com base em tal entendimento, as soluções técnicas deste pedido essencialmente, ou a parte que contribui para o estado da técnica, ou algumas das soluções técnicas podem ser implementadas na forma de um produto de software. O produto de software de computador é armazenado em um meio de armazenamento e inclui várias instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor, um dispositivo de rede, ou semelhante) para executar todas ou algumas das etapas dos métodos descritos nas modalidades deste pedido. O meio de armazenamento anterior inclui: qualquer meio que armazene código de programa, como uma unidade USB, um disco rígido removível, uma memória somente leitura (read-only memory, ROM), uma memória de acesso aleatório (Random Access Memory, RAM), um disco magnético, ou um disco óptico.
[0297] As descrições precedentes são meramente implementações específicas deste pedido, mas não se destinam a limitar o escopo de proteção deste pedido. Qualquer variação ou substituição prontamente determinada por um técnico no assunto dentro do escopo técnico divulgado neste pedido deve estar dentro do escopo de proteção deste pedido. Portanto, o escopo de proteção deste pedido estará sujeito ao escopo de proteção das reivindicações.

Claims (22)

REIVINDICAÇÕES
1. Método de codificação de sinal estéreo, caracterizado pelo fato de que compreende: determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, em que o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N e M é um número inteiro positivo; e determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas compreende: comparar o parâmetro de codificação de sinal residual do quadro atual com um primeiro limite predefinido, em que o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual do quadro atual é menos ou igual ao primeiro limite, determinar não codificar os sinais residuais das M sub-bandas; ou quando o parâmetro de codificação de sinal residual é maior do que o primeiro limite, determinar a codificação dos sinais residuais das M sub-bandas.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a determinação de um parâmetro de codificação de sinal residual de um quadro atual com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas compreende: determinar o parâmetro de codificação de sinal residual do quadro atual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que determinar o parâmetro de codificação de sinal residual do quadro atual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas compreende: determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, em que o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub- bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual, e no ganho lateral de cada uma das M sub-bandas compreende: determinar M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, em que os M parâmetros de energia indicam, cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/(res_cod_NRG_S[b] + (1 – g(b))∙(1 – g(b)) res_cod_NRG_M[b] + 1), em que res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual a um número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-
banda é b, e g(b) representa uma função de a ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
7. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a determinação de um parâmetro de codificação de sinal residual de um quadro atual com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas compreende: determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub- bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas compreende: determinar M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que os M parâmetros de energia indicam, cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub- bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b], em que res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual a um número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b.
10. Método, de acordo com qualquer uma das reivindicações 4 a 9, caracterizado pelo fato de que o parâmetro de codificação de sinal residual do quadro atual é um parâmetro de suavização de longo prazo do quadro atual, e o parâmetro de suavização de longo prazo do quadro atual atende uma fórmula: res_dmx_ratio_lt = res_dmx_ratio∙α + res_dmx_ratio_lt_prev∙(1 – α), em que res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1; e quando o segundo parâmetro é maior que um terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor ou igual a um terceiro limite predefinido, um valor de α é menor que um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido e o segundo parâmetro é maior que o terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a
2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
11. Método, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que o método compreende ainda: quando é determinado codificar os sinais residuais das M sub-bandas, codificar os sinais reduzidos e os sinais residuais das M sub-bandas; ou quando é determinado não codificar os sinais residuais das M sub-bandas, codificar sinais reduzidos das M sub-bandas.
12. Aparelho de codificação de sinal estéreo, caracterizado pelo fato de que compreende: uma memória configurada para armazenar um programa; e um processador, configurado para executar o programa armazenado na memória, em que quando o programa na memória é executado, o processador é configurado para: determinar um parâmetro de codificação de sinal residual de um quadro atual de um sinal estéreo com base na energia de sinal reduzido e energia de sinal residual de cada uma das M sub-bandas do quadro atual, em que o parâmetro de codificação de sinal residual do quadro atual é usado para indicar se codifica sinais residuais das M sub-bandas, as M sub-bandas são pelo menos algumas das N sub-bandas, N é um número inteiro positivo maior que 1, M ≤ N, e M é um número inteiro positivo; e determinar, com base no parâmetro de codificação de sinal residual do quadro atual, se codifica os sinais residuais das M sub-bandas do quadro atual.
13. Aparelho, de acordo com a reivindicação 12, caracterizado pelo fato de que o processador é ainda configurado para:
comparar o parâmetro de codificação de sinal residual com um primeiro limite predefinido, em que o primeiro limite é maior que 0 e menor que 1,0; e quando o parâmetro de codificação de sinal residual do quadro atual é menos ou igual ao primeiro limite, determinar não codificar os sinais residuais das M sub-bandas; ou quando o parâmetro de codificação de sinal residual do quadro atual é maior do que o primeiro limite, determinar codificar os sinais residuais das M sub-bandas.
14. Aparelho, de acordo com a reivindicação 12 ou 13, caracterizado pelo fato de que o processador é ainda configurado para: determinar o parâmetro de codificação de sinal residual do quadro atual com base na energia de sinal reduzido, na energia de sinal residual e em um ganho lateral de cada uma das M sub-bandas.
15. Aparelho, de acordo com a reivindicação 14, caracterizado pelo fato de que o processador é ainda configurado para: determinar um primeiro parâmetro com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, em que o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub- bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
16. Aparelho, de acordo com a reivindicação 15, caracterizado pelo fato de que o processador é ainda configurado para: determinar M parâmetros de energia com base na energia de sinal reduzido, na energia de sinal residual e no ganho lateral de cada uma das M sub-bandas, em que os M parâmetros de energia indicam, cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub-bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
17. Aparelho, de acordo com a reivindicação 16, caracterizado pelo fato de que um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo processador atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/(res_cod_NRG_S[b] + (1 – g(b))∙(1 – g(b)) res_cod_NRG_M[b] + 1), em que res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual a um número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub- banda é b, e g(b) representa uma função de a ganho lateral side_gain[b] da sub-banda cujo número de índice de sub-banda é b.
18. Aparelho, de acordo com a reivindicação 12 ou 13, caracterizado pelo fato de que o processador é ainda configurado para: determinar um primeiro parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o primeiro parâmetro indica uma relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas; determinar um segundo parâmetro com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que o segundo parâmetro indica uma relação de valor entre uma primeira soma de energia e uma segunda soma de energia, a primeira soma de energia é uma soma de energia de sinal residual e energia de sinal reduzido das M sub-bandas, a segunda soma de energia é uma soma da energia de sinal residual e energia de sinal reduzido de M sub-bandas em um sinal de domínio de frequência de um quadro anterior do quadro atual, e as M sub-bandas do quadro atual têm os mesmos números de índice de sub-banda que as M sub- bandas do quadro anterior; e determinar o parâmetro de codificação de sinal residual do quadro atual com base no primeiro parâmetro, no segundo parâmetro e em um parâmetro de suavização de longo prazo do quadro anterior do quadro atual.
19. Aparelho, de acordo com a reivindicação 18, caracterizado pelo fato de que o processador é ainda configurado para: determinar M parâmetros de energia com base na energia de sinal reduzido e na energia de sinal residual de cada uma das M sub-bandas, em que os M parâmetros de energia indicam, cada um, a relação de valor entre a energia de sinal reduzido e a energia de sinal residual de cada uma das M sub-bandas, e os M parâmetros de energia um a um correspondem às M sub- bandas; e determinar um parâmetro de energia com um maior valor nos M parâmetros de energia como o primeiro parâmetro.
20. Aparelho, de acordo com a reivindicação 19, caracterizado pelo fato de que um parâmetro de energia de uma sub-banda cujo número de índice de sub-banda é b nos M parâmetros de energia determinados pelo processador atende a uma fórmula: res_dmx_ratio[b] = res_cod_NRG_S[b]/res_cod_NRG_M[b], em que res_dmx_ratio[b] representa o parâmetro de energia da sub-banda cujo número de índice de sub-banda é b, b é maior ou igual a 0 e é menor ou igual a um número de índice de sub-banda máximo predefinido, res_cod_NRG_S[b] representa a energia de sinal residual da sub-banda cujo número de índice de sub-banda é b, e res_cod_NRG_M[b] representa a energia de sinal reduzido da sub-banda cujo número de índice de sub-
banda é b.
21. Aparelho, de acordo com qualquer uma das reivindicações de 15 a 20, caracterizado pelo fato de que o parâmetro de codificação de sinal residual do quadro atual é um parâmetro de suavização de longo prazo do quadro atual, e o parâmetro de suavização de longo prazo do quadro atual atende a uma fórmula: res_dmx_ratio_lt = res_dmx_ratio∙α + res_dmx_ratio_lt_prev∙(1 – α), em que res_dmx_ratio_lt representa o parâmetro de suavização de longo prazo do quadro atual, res_dmx_ratio representa o primeiro parâmetro, res_dmx_ratio_lt_prev representa o parâmetro de suavização de longo prazo do quadro anterior do quadro atual, e 0 <α <1; e quando o segundo parâmetro é maior que um terceiro limite predefinido, um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido é maior que um valor de α quando o primeiro parâmetro é maior ou igual ao segundo limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, e o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7; ou quando o segundo parâmetro é menor que um quinto limite predefinido, um valor de α quando o primeiro parâmetro é maior que um quarto limite predefinido é maior que um valor de α quando o primeiro parâmetro é menor ou igual ao quarto limite predefinido, o quarto limite é maior ou igual a 0 e menor ou igual a 0,9, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71; ou quando o segundo parâmetro é maior ou igual a um quinto limite predefinido e é menor ou igual a um terceiro limite predefinido, um valor de α é menor que um valor de α quando o primeiro parâmetro é menor que um segundo limite predefinido e o segundo parâmetro é maior que o terceiro limite predefinido, o segundo limite é maior ou igual a 0 e menor ou igual a 0,6, o terceiro limite é maior ou igual a 2,7 e menor ou igual a 3,7, e o quinto limite é maior ou igual a 0 e menor ou igual a 0,71.
22. Aparelho, de acordo com qualquer uma das reivindicações 12 a 21, caracterizado pelo fato de que o processador é ainda configurado para: quando é determinado codificar os sinais residuais das M sub-bandas, codificar os sinais reduzidos e os sinais residuais das M sub-bandas; ou quando é determinado não codificar os sinais residuais das M sub-bandas, codificar sinais reduzidos das M sub-bandas.
BR112020024257-8A 2018-05-31 2019-02-27 método de codificação de sinal estéreo, aparelho, meio de armazenamento legível por computador e chip BR112020024257A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810549237.3 2018-05-31
CN201810549237.3A CN110556117B (zh) 2018-05-31 2018-05-31 立体声信号的编码方法和装置
PCT/CN2019/076341 WO2019227991A1 (zh) 2018-05-31 2019-02-27 立体声信号的编码方法和装置

Publications (1)

Publication Number Publication Date
BR112020024257A2 true BR112020024257A2 (pt) 2021-02-23

Family

ID=68697244

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020024257-8A BR112020024257A2 (pt) 2018-05-31 2019-02-27 método de codificação de sinal estéreo, aparelho, meio de armazenamento legível por computador e chip

Country Status (8)

Country Link
US (2) US11462224B2 (pt)
EP (1) EP3783607B1 (pt)
JP (2) JP7110401B2 (pt)
KR (2) KR20230098708A (pt)
CN (2) CN110556117B (pt)
BR (1) BR112020024257A2 (pt)
SG (1) SG11202011324RA (pt)
WO (1) WO2019227991A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110556118B (zh) 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN115280411A (zh) * 2020-03-09 2022-11-01 日本电信电话株式会社 声音信号缩混方法、声音信号编码方法、声音信号缩混装置、声音信号编码装置、程序及记录介质
CN117079657B (zh) * 2023-10-16 2024-01-26 中国铁塔股份有限公司 压限处理方法、装置、电子设备及可读存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
PL3561810T3 (pl) * 2004-04-05 2023-09-04 Koninklijke Philips N.V. Sposób kodowania lewego i prawego sygnału wejściowego audio, odpowiedni koder, dekoder i produkt w postaci programu komputerowego
US7835918B2 (en) * 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
KR101183859B1 (ko) 2004-11-04 2012-09-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 다중채널 오디오 신호들의 인코딩 및 디코딩
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP1987513B1 (fr) * 2006-02-06 2009-09-09 France Telecom Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与***
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
US8374883B2 (en) * 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101635145B (zh) * 2008-07-24 2012-06-06 华为技术有限公司 编解码方法、装置和***
RU2520329C2 (ru) * 2009-03-17 2014-06-20 Долби Интернешнл Аб Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101710113B1 (ko) 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
IN2014CN01270A (pt) * 2011-09-29 2015-06-19 Dolby Int Ab
CN104170007B (zh) * 2012-06-19 2017-09-26 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
EP2690621A1 (en) * 2012-07-26 2014-01-29 Thomson Licensing Method and Apparatus for downmixing MPEG SAOC-like encoded audio signals at receiver side in a manner different from the manner of downmixing at encoder side
EP2863657B1 (en) 2012-07-31 2019-09-18 Intellectual Discovery Co., Ltd. Method and device for processing audio signal
KR102204136B1 (ko) * 2012-08-22 2021-01-18 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
US20150125023A1 (en) 2013-03-08 2015-05-07 Ideavillage Products Corp. Headset with variable acoustic impedance
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
RU2729603C2 (ru) * 2015-09-25 2020-08-11 Войсэйдж Корпорейшн Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала

Also Published As

Publication number Publication date
CN110556117A (zh) 2019-12-10
CN114708874A (zh) 2022-07-05
JP7520922B2 (ja) 2024-07-23
US11462224B2 (en) 2022-10-04
JP2021525390A (ja) 2021-09-24
US20210082445A1 (en) 2021-03-18
KR20210008091A (ko) 2021-01-20
US20220392470A1 (en) 2022-12-08
EP3783607A1 (en) 2021-02-24
KR102548475B1 (ko) 2023-06-26
SG11202011324RA (en) 2020-12-30
EP3783607A4 (en) 2021-06-30
EP3783607B1 (en) 2024-05-08
CN110556117B (zh) 2022-04-22
WO2019227991A1 (zh) 2019-12-05
JP2022163058A (ja) 2022-10-25
JP7110401B2 (ja) 2022-08-01
KR20230098708A (ko) 2023-07-04
US11978463B2 (en) 2024-05-07

Similar Documents

Publication Publication Date Title
ES2821676T3 (es) Codificación de múltiples señales de audio
ES2777282T3 (es) Extensión de ancho de banda armónico de señales de audio
JP7520922B2 (ja) ステレオ信号符号化方法およびステレオ信号符号化装置
ES2880343T3 (es) Codificación y descodificación optimizada de información de espacialización para la codificación y la descodificación paramétrica de una señal de audio multicanal
ES2808096T3 (es) Método y aparato para el control adaptativo de los filtros de decorrelación
BR112020024488A2 (pt) método de codificação de sinal estéreo, aparelho e meio de armazenamento legível por computador não transitório
BR112015029574B1 (pt) Aparelho e método de decodificação de sinal de áudio.
WO2018188424A1 (zh) 多声道信号的编解码方法和编解码器
BR112015019040B1 (pt) Sistemas e métodos de realizar filtragem para determinação de ganho
BR112014023577B1 (pt) Método e dispositivo de codificação de sinal de áudio e método e dispositivo de decodificação de sinal de áudio
BR112015019056B1 (pt) Métodos, aparelho e memória legível por computador para realização de controle de ganho
BR112020018466A2 (pt) representando áudio espacial por meio de um sinal de áudio e de metadados associados
BR112019023204A2 (pt) parâmetros estéreo para decodificação estéreo
ES2945723T3 (es) Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo
TW201911888A (zh) 時域身歷聲編解碼方法和相關產品
ES2843903T3 (es) Codificación de múltiples señales de audio
US20240249731A1 (en) Method and apparatus for calculating downmixed signal and residual signal
BR112019014544A2 (pt) Modificação de parâmetro de diferença de fase entre canais
EP3783608A1 (en) Method and apparatus for calculating down-mixed signal
BR112020026932A2 (pt) Método e aparelho de codificação de sinal estéreo, e método e aparelho de decodificação de sinal estéreo
BR112019015509A2 (pt) Decodificação multicanal

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]