RU2013142079A - Генерирование шума в аудиокодеках - Google Patents

Генерирование шума в аудиокодеках Download PDF

Info

Publication number
RU2013142079A
RU2013142079A RU2013142079/08A RU2013142079A RU2013142079A RU 2013142079 A RU2013142079 A RU 2013142079A RU 2013142079/08 A RU2013142079/08 A RU 2013142079/08A RU 2013142079 A RU2013142079 A RU 2013142079A RU 2013142079 A RU2013142079 A RU 2013142079A
Authority
RU
Russia
Prior art keywords
audio signal
background noise
input audio
parametric
representation
Prior art date
Application number
RU2013142079/08A
Other languages
English (en)
Other versions
RU2585999C2 (ru
Inventor
Панджи СЕТИАВАН
Штефан ВИЛЬДЕ
Антони ЛОМБАР
Мартин ДИТЦ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2013142079A publication Critical patent/RU2013142079A/ru
Application granted granted Critical
Publication of RU2585999C2 publication Critical patent/RU2585999C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Image Generation (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Optical Communication System (AREA)

Abstract

1. Аудиокодер, содержащий:- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,- при этом:- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оц�

Claims (18)

1. Аудиокодер, содержащий:
- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и
- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,
- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом:
- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или
- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.
2. Аудиокодер по п. 1, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.
3. Аудиокодер по п. 1 или 2, в котором модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в спектральном представлении сигнала возбуждения и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
4. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала.
5. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и выбирать между использованием параметрического кодирования для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала, или оставлением части верхних частот входного аудиосигнала некодированной.
6. Аудиокодер по п. 4, в котором кодер выполнен с возможностью прерывать прогнозирующее кодирование и/или кодирование с преобразованием и параметрическое кодирование в неактивных фазах или прерывать прогнозирующее кодирование и/или кодирование с преобразованием и выполнять параметрическое кодирование спектральной огибающей части верхних частот представления в форме спектрального разложения входного аудиосигнала при более низком частотно-временном разрешении по сравнению с использованием параметрического кодирования в активной фазе.
7. Аудиокодер по п. 4, в котором кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот.
8. Аудиокодер, содержащий:
- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и
- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,
- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,
- при этом кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и
- при этом модуль оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.
9. Аудиокодер по п. 8, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в частях нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала и выполнять статистический анализ частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала в локальных минимумах для того, чтобы извлекать параметрическую оценку фонового шума.
10. Аудиокодер по п. 1, в котором модуль оценки шума выполнен с возможностью продолжать непрерывное обновление оценки фонового шума в течение неактивной фазы, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума, непрерывно обновляемой в течение неактивной фазы.
11. Аудиокодер по п. 10, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума в фиксированном или переменном интервале времени.
12. Аудиодекодер для декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, причем аудиодекодер содержит:
- модуль (90) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- декодер (92), выполненный с возможностью восстанавливать аудиосигнал из потока данных в течение активной фазы;
- параметрический генератор (94) случайных чисел; и
- генератор (96) фонового шума, выполненный с возможностью восстанавливать аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,
- при этом модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
13. Аудиодекодер по п. 12, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе и с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.
14. Аудиодекодер по п. 12, в котором декодер выполнен с возможностью, при восстановлении аудиосигнала из потока данных, применять формирование спектрального разложения сигнала возбуждения, кодированного с преобразованием в поток данных согласно коэффициентам линейного прогнозирования, также кодированным в данные, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума, посредством идентификации локальных минимумов в спектральном представлении сигнала возбуждения и оценки спектральной огибающей фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в спектральном представлении сигнала возбуждения в качестве опорных точек.
15. Способ кодирования аудио, содержащий этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодируют входной аудиосигнал в поток данных в течение активной фазы; и
- обнаруживают вход в неактивную фазу после активной фазы на основе входного сигнала, и
- кодируют в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом:
- определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или
- кодирование входного аудиосигнала содержит этап, на котором прогнозирующим образом кодируют входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодируют с преобразованием спектральное разложение сигнала возбуждения и кодируют коэффициенты линейного прогнозирования в поток данных, при этом определение параметрической оценки фонового шума содержит этап, на котором используют спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.
16. Способ кодирования аудио, содержащий этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодируют входной аудиосигнал в поток данных в течение активной фазы; и
- обнаруживают вход в неактивную фазу после активной фазы на основе входного сигнала, и
- кодируют в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом кодирование входного аудиосигнала содержит этап, на котором используют прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и используют параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,
- при этом используют гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и
- при этом определение параметрической оценки фонового шума содержит этап, на котором обновляют параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.
17. Способ декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, при этом способ содержит этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- восстанавливают аудиосигнал из потока данных в течение активной фазы;
- восстанавливают аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,
- при этом определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
18. Компьютерная программа, содержащая программный код для осуществления, при выполнении на компьютере, способа по п. 15.
RU2013142079/08A 2011-02-14 2012-02-14 Генерирование шума в аудиокодеках RU2585999C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052464 WO2012110482A2 (en) 2011-02-14 2012-02-14 Noise generation in audio codecs

Publications (2)

Publication Number Publication Date
RU2013142079A true RU2013142079A (ru) 2015-03-27
RU2585999C2 RU2585999C2 (ru) 2016-06-10

Family

ID=71943600

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013142079/08A RU2585999C2 (ru) 2011-02-14 2012-02-14 Генерирование шума в аудиокодеках

Country Status (17)

Country Link
US (1) US8825496B2 (ru)
EP (2) EP3373296A1 (ru)
JP (3) JP5934259B2 (ru)
KR (1) KR101624019B1 (ru)
CN (1) CN103477386B (ru)
AR (2) AR085895A1 (ru)
AU (1) AU2012217162B2 (ru)
BR (1) BR112013020239B1 (ru)
CA (2) CA2827305C (ru)
ES (1) ES2681429T3 (ru)
MX (1) MX2013009305A (ru)
MY (1) MY167776A (ru)
RU (1) RU2585999C2 (ru)
SG (1) SG192745A1 (ru)
TW (1) TWI480856B (ru)
WO (1) WO2012110482A2 (ru)
ZA (1) ZA201306874B (ru)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI476760B (zh) 2011-02-14 2015-03-11 Fraunhofer Ges Forschung 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
SG192734A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
TWI469136B (zh) 2011-02-14 2015-01-11 Fraunhofer Ges Forschung 在一頻譜域中用以處理已解碼音訊信號之裝置及方法
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
AU2012217184B2 (en) 2011-02-14 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Encoding and decoding of pulse positions of tracks of an audio signal
KR101617816B1 (ko) 2011-02-14 2016-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식
US9530424B2 (en) * 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
CN105469805B (zh) * 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
KR101629661B1 (ko) * 2012-08-29 2016-06-13 니폰 덴신 덴와 가부시끼가이샤 복호 방법, 복호 장치, 프로그램 및 그 기록매체
EP3579228A1 (en) * 2012-11-15 2019-12-11 NTT DoCoMo, Inc. Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
AU2013366552B2 (en) 2012-12-21 2017-03-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
SG11201504810YA (en) * 2012-12-21 2015-07-30 Fraunhofer Ges Forschung Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
EP2951818B1 (en) * 2013-01-29 2018-11-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling concept
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN105225668B (zh) * 2013-05-30 2017-05-10 华为技术有限公司 信号编码方法及设备
EP3007166B1 (en) * 2013-05-31 2019-05-08 Sony Corporation Encoding device and method, decoding device and method, and program
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
CN104978970B (zh) * 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码***
US10715833B2 (en) * 2014-05-28 2020-07-14 Apple Inc. Adaptive syntax grouping and compression in video data using a default value and an exception value
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
CN106971741B (zh) * 2016-01-14 2020-12-01 芋头科技(杭州)有限公司 实时将语音进行分离的语音降噪的方法及***
JP7011449B2 (ja) 2017-11-21 2022-01-26 ソニーセミコンダクタソリューションズ株式会社 画素回路、表示装置および電子機器
US10650834B2 (en) * 2018-01-10 2020-05-12 Savitech Corp. Audio processing method and non-transitory computer readable medium
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10326100A (ja) * 1997-05-26 1998-12-08 Kokusai Electric Co Ltd 音声録音方法及び音声再生方法及び音声録音再生装置
JP3223966B2 (ja) * 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
DE10084675T1 (de) * 1999-06-07 2002-06-06 Ericsson Inc Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
US7901873B2 (en) * 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US20020184009A1 (en) * 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
EP1852851A1 (en) 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
RU2407071C2 (ru) * 2005-01-31 2010-12-20 Скайп Лимитед Способ генерации кадров маскирования в системе связи
CN100593197C (zh) * 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8484036B2 (en) * 2005-04-01 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
RU2296377C2 (ru) * 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) * 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US7933770B2 (en) * 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
EP2052548B1 (en) 2006-12-12 2012-02-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
FR2911426A1 (fr) * 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
JP5140730B2 (ja) 2007-08-27 2013-02-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成
JP4886715B2 (ja) * 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8000487B2 (en) * 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
RU2492530C2 (ru) 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
MY154633A (en) 2008-10-08 2015-07-15 Fraunhofer Ges Forschung Multi-resolution switched audio encoding/decoding scheme
JP5699141B2 (ja) 2009-06-23 2015-04-08 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
BR112012009490B1 (pt) 2009-10-20 2020-12-01 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados

Also Published As

Publication number Publication date
TWI480856B (zh) 2015-04-11
AR102715A2 (es) 2017-03-22
EP2676262A2 (en) 2013-12-25
CA2968699C (en) 2020-12-22
KR20130126711A (ko) 2013-11-20
JP2017223968A (ja) 2017-12-21
MY167776A (en) 2018-09-24
EP2676262B1 (en) 2018-04-25
RU2585999C2 (ru) 2016-06-10
BR112013020239A2 (pt) 2020-11-24
WO2012110482A3 (en) 2012-12-20
JP6185029B2 (ja) 2017-08-23
SG192745A1 (en) 2013-09-30
ES2681429T3 (es) 2018-09-13
US20130332176A1 (en) 2013-12-12
JP5934259B2 (ja) 2016-06-15
WO2012110482A2 (en) 2012-08-23
ZA201306874B (en) 2014-05-28
AU2012217162B2 (en) 2015-11-26
US8825496B2 (en) 2014-09-02
CA2968699A1 (en) 2012-08-23
JP2014510307A (ja) 2014-04-24
BR112013020239B1 (pt) 2021-12-21
MX2013009305A (es) 2013-10-03
CA2827305A1 (en) 2012-08-23
CN103477386B (zh) 2016-06-01
KR101624019B1 (ko) 2016-06-07
AU2012217162A1 (en) 2013-08-29
JP2016026319A (ja) 2016-02-12
JP6643285B2 (ja) 2020-02-12
CN103477386A (zh) 2013-12-25
TW201248615A (en) 2012-12-01
EP3373296A1 (en) 2018-09-12
AR085895A1 (es) 2013-11-06
CA2827305C (en) 2018-02-06

Similar Documents

Publication Publication Date Title
RU2013142079A (ru) Генерирование шума в аудиокодеках
RU2013141934A (ru) Аудиокодек, использующий синтез шума в течение неактивной фазы
RU2638734C2 (ru) Кодирование спектральных коэффициентов спектра аудиосигнала
RU2013142133A (ru) Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области
JP6426626B2 (ja) 信号復号の間のフレーム損失訂正の改善
RU2016105759A (ru) Устройство и способ для кодирования или декодирования звукового сигнала с интеллектуальным заполнением интервалов в спектральной области
FI3751566T3 (fi) Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä
CN107533847B (zh) 音频编码器和音频解码器及对应的方法
AU2015295519B2 (en) Harmonicity-dependent controlling of a harmonic filter tool
RU2017103102A (ru) Аудиопроцессор и способ для обработки аудиосигнала с использованием горизонтальной фазовой коррекции
CA2716926A1 (en) Apparatus for mixing a plurality of input data streams
RU2015102588A (ru) Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей
RU2011104004A (ru) Устройство аудиокодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов
RU2012147587A (ru) Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания
RU2018115191A (ru) Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием
RU2016101521A (ru) Устройство и способ для генерации адаптивной формы спектра комфотного шума
RU2011104000A (ru) Устройство и способ декодирования кодированного звукового сигнала
RU2017106099A (ru) Кодер и декодер аудиосигнала , использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации
RU2016121148A (ru) Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки, модифицирующего сигнал возбуждения во временной области
RU2013134227A (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
ATE489703T1 (de) Vorrichtung und verfahren zur nachbearbeitung von spektralwerten sowie kodiergerät und dekodiergerät für audiosignale
RU2016105517A (ru) Заполнение шумом при многоканальном кодировании аудио
RU2015127216A (ru) Предсказание на основе модели в наборе фильтров с критической дискретизацией
US9449605B2 (en) Inactive sound signal parameter estimation method and comfort noise generation method and system
RU2017144520A (ru) Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой