RU2011133700A - Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала - Google Patents

Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала Download PDF

Info

Publication number
RU2011133700A
RU2011133700A RU2011133700/08A RU2011133700A RU2011133700A RU 2011133700 A RU2011133700 A RU 2011133700A RU 2011133700/08 A RU2011133700/08 A RU 2011133700/08A RU 2011133700 A RU2011133700 A RU 2011133700A RU 2011133700 A RU2011133700 A RU 2011133700A
Authority
RU
Russia
Prior art keywords
expansion
complex
valued
parameter
parameters
Prior art date
Application number
RU2011133700/08A
Other languages
English (en)
Other versions
RU2518696C2 (ru
Inventor
Маттиас НЕУЗИНГЕР
Жульен РОБИЛЛИАРД
Йоханес ХИЛПЕРТ
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен
Publication of RU2011133700A publication Critical patent/RU2011133700A/ru
Application granted granted Critical
Publication of RU2518696C2 publication Critical patent/RU2518696C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

1. Аппаратный блок (100, 200) для расширения сжатого аудио сигнала (110, 210), содержащего один или более сжатых аудио каналов в расширенный звуковой сигнал (120, 214), содержащий множество расширенных аудиоканалов, аппаратный блок, включающийблок расширения (130; 230), настроенный на использование текущих значений переменных параметров расширения (150; 262; Н) для расширения сжатого аудио сигнала (110, 210) и получения расширенного звукового сигнала (120, 214); а также модуль интерполяции параметров (140; 260), настроенный на получение одного или нескольких текущих интерполированных параметров расширения (150, 262), которые будут использоваться в блоке расширения (130, 230) на основе информации, описывающей первый комплекснозначный параметр расширения (142) и последующий второй комплекснозначный параметр расширения (144), причем модуль интерполяции параметров (140; 260) настроен на независимую интерполяцию (а) между величиной магнитуды (254) первого комплекснозначного параметра расширения (142) и величиной магнитуды (254) второго комплекснозначного параметра расширения (144), и (б) между значением фазы (256) первого комплекснозначного параметра расширения (142) и значением фазы (256) второго комплекснозначного параметра расширения (144), для получения одного или нескольких текущих интерполированных комплекснозначных параметров расширения (150, 262).2. Аппаратный блок (100, 200) по п.1, котором модуль интерполяции параметров (140; 260) настроен на монотонную во времени интерполяцию между величиной магнитуды (254) первого комплекснозначного параметра расширения (142) и величиной магнитуды (254) второго комплекснозначного параметра расширения (144) для получения значений магнитуды (274) о�

Claims (15)

1. Аппаратный блок (100, 200) для расширения сжатого аудио сигнала (110, 210), содержащего один или более сжатых аудио каналов в расширенный звуковой сигнал (120, 214), содержащий множество расширенных аудиоканалов, аппаратный блок, включающий
блок расширения (130; 230), настроенный на использование текущих значений переменных параметров расширения (150; 262; Нij) для расширения сжатого аудио сигнала (110, 210) и получения расширенного звукового сигнала (120, 214); а также модуль интерполяции параметров (140; 260), настроенный на получение одного или нескольких текущих интерполированных параметров расширения (150, 262), которые будут использоваться в блоке расширения (130, 230) на основе информации, описывающей первый комплекснозначный параметр расширения (142) и последующий второй комплекснозначный параметр расширения (144), причем модуль интерполяции параметров (140; 260) настроен на независимую интерполяцию (а) между величиной магнитуды (254) первого комплекснозначного параметра расширения (142) и величиной магнитуды (254) второго комплекснозначного параметра расширения (144), и (б) между значением фазы (256) первого комплекснозначного параметра расширения (142) и значением фазы (256) второго комплекснозначного параметра расширения (144), для получения одного или нескольких текущих интерполированных комплекснозначных параметров расширения (150, 262).
2. Аппаратный блок (100, 200) по п.1, котором модуль интерполяции параметров (140; 260) настроен на монотонную во времени интерполяцию между величиной магнитуды (254) первого комплекснозначного параметра расширения (142) и величиной магнитуды (254) второго комплекснозначного параметра расширения (144) для получения значений магнитуды (274) одного или нескольких текущих интерполированных параметров расширения (150, 262), линейную во времени интерполяцию между значением фазы (256) первого комплекснозначного параметра расширения (142) и значением фазы (256) второго комплекснозначного параметра расширения (144) и получение значений фазы (276) одного или нескольких текущих интерполированных параметров расширения, и объединение одного или нескольких интерполированных значений магнитуды (274) с одним или более соответствующими интерполированными значениями фазы (276) и получение одного или нескольких комплекснозначных текущих интерполированных параметров расширения (150, 262).
3. Аппаратный блок (100, 200) по п.1, в котором модуль интерполяции параметров (140; 260) настроен на линейную интерполяцию между величиной магнитуды (254) первого комплекснозначного параметра расширения (142) и величиной магнитуды (254) второго комплекснозначного параметра расширения (144) для получения интерполированных значений магнитуды от одного или нескольких интерполированных во времени комплекснозначных параметров расширения (150, 262).
4. Аппаратный блок (100, 200) по п.1, в котором блок расширения (130; 230) настроен на выполнение линейной суперпозиции с масштабированием комплекснозначных параметров поддиапазонов частот множества входных аудио сигналов (x(k), q(k)) в блоке расширения, в зависимости от текущих комплекснозначных интерполированных параметров расширения (150, 262) для получения расширенного звукового сигнала (120, 214); причем блок расширения (130, 230) настроен на обработку последовательностей комплекснозначных параметров поддиапазонов, представляющих последовательные аудио выборки входных аудио сигналов (x(k), q(k)) блока расширения; и причем модуль интерполяции параметров (140; 260) настроен на прием представления (142, 144, 254, 256) последовательности комплекснозначных параметров расширения, которая имеет длительность во времени больше, чем продолжительность одной из выборок, и более частое обновление текущих интерполированных параметров расширения (150, 262).
5. Аппаратный блок (100, 200) по п.4, в котором блок расширения (130, 230) настроен на получение блоком расширения обновленных входных аудио сигналов (x(k), q(k)) со скоростью обновления блока расширения, и причем модуль интерполяции параметров (140; 260) настроен на обновление текущих интерполированных параметров расширения (150, 262) со скоростью обновления блока расширения.
6. Аппаратный блок (100, 200) по п.4, в котором блок расширения (130; 230) настроен на выполнение умножения матрицы на вектор с использованием матрицы (Н), содержащей интерполированные параметры расширения (150, 262), и вектора (
Figure 00000001
), включающего параметры поддиапазона входных аудио сигналов (x(k), q(k)) блока расширения, для получения в результате вектора (
Figure 00000002
), содержащего комплекснозначные параметры поддиапазона расширенных звуковых сигналов (у1, у2).
7. Аппаратный блок (100, 200) по п.1, в котором блок расширения (130; 230) настроен на выполнение умножения матрицы на вектор с использованием представления чисел в виде действительной и мнимой частей.
8. Аппаратный блок (100, 200) по п.1, настроенный на получение пространственных сигналов (ILD, ICC, ITD, IPD), представляющих параметры расширения.
9. Аппаратный блок (100, 200) по п.8, в котором модуль интерполяции параметров (140; 260) настроен на определение величины магнитуды (274) интерполированных параметров расширения (150; 262) в зависимости от параметров разности уровней между каналами, или в зависимости от корреляции между каналами или параметров когерентности, или в зависимости от параметров разности уровней между каналами и корреляции между каналами или параметров когерентности; а также для получения значений фазы (276) интерполированных параметров расширения (150; 262) в зависимости от параметров разности фаз между каналами или параметров разности во времени между каналами.
10. Аппаратный блок (100, 200) по п.1, в котором блок расширения (130, 230) настроен на использование текущих интерполированных параметров расширения (150, 262) и суммирование одного или нескольких сжатых аудио сигналов (х(к)) с одной или несколькими декоррелированными версиями (q(k)) одного или нескольких сжатых аудио сигналов.
11. Аппаратный блок (100, 200) по одному из пп.1-10, в котором модуль интерполяции параметров (140; 260) настроен на определение направления интерполяции между значениями фазы (256) последовательных комплекснозначных параметров расширения, так, что диапазон углов при интерполяции, ограниченный значениями фазы первого комплекснозначного параметра расширения (142) и фазы второго комплекснозначного параметра расширения (144), будет меньше или равен 180°.
12. Аппаратный блок (100, 200) по п.1, в котором модуль интерполяции параметров (140; 260) настроен на расчет интерполированного значения фазы αi; в соответствии со следующим уравнением
Figure 00000003
в котором αn-1 определяет значение фазы (256) первого комплекснозначного параметра расширения (142);
αn определяет значение фазы (256) второго комплекснозначного параметра расширения (144);
|.| обозначает оператор абсолютного значения;
mod назначает оператор модуля, а также i обозначает индекс интерполированного значения фазы (276), причем i=0 обозначает индекс, связанный с первым параметром расширения (142), i=imax обозначает индекс, связанный со вторым параметром расширения (144), а индексы i между 0 and imax связаны с текущими интерполированными параметрами расширения (150, 262).
13. Аппаратный блок (100, 200) по п.1, где модуль интерполяции параметров (140; 260) настроен на суммирование независимо друг от друга интерполированных величин магнитуды (274) и значений фазы (276) путем применения комплексного вращения интерполированных величин магнитуды (274), причем угол комплекснозначного вращения определяется интерполированными значениями фазы (276).
14. Способ (700) для расширения сжатого аудио сигнала, содержащего один или более сжатых аудио каналов, в расширенный звуковой сигнал, содержащий множество расширенных аудио каналов, включающий получение (710) одного или нескольких текущих интерполированных параметров расширения на основе первого комплекснозначного параметра расширения и последующего второго комплекснозначного параметра расширения, причем интерполяция производится независимо (а) между величиной магнитуды первого комплекснозначного параметра расширения и величиной магнитуды второго комплекснозначного параметра расширения, и (б) между значением фазы первого комплекснозначного параметра расширения и значением фазы второго комплекснозначного параметра расширения; и
применения интерполированных комплекснозначных параметров расширения (720) для расширения сжатого аудио сигнала получения расширенного звукового сигнала.
15. Компьютерная программа для осуществления способа по п.14, когда компьютерная программа выполняется на компьютере.
RU2011133700/08A 2009-01-28 2010-01-12 Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала RU2518696C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14781509P 2009-01-28 2009-01-28
US61/147,815 2009-01-28
EP09007086A EP2214161A1 (en) 2009-01-28 2009-05-27 Apparatus, method and computer program for upmixing a downmix audio signal
EP09007086.3 2009-05-27
PCT/EP2010/050279 WO2010086216A1 (en) 2009-01-28 2010-01-12 Apparatus, method and computer program for upmixing a downmix audio signal

Publications (2)

Publication Number Publication Date
RU2011133700A true RU2011133700A (ru) 2013-03-10
RU2518696C2 RU2518696C2 (ru) 2014-06-10

Family

ID=41139170

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011133700/08A RU2518696C2 (ru) 2009-01-28 2010-01-12 Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала

Country Status (20)

Country Link
US (1) US8867753B2 (ru)
EP (2) EP2214161A1 (ru)
JP (1) JP5174973B2 (ru)
KR (1) KR101290486B1 (ru)
CN (1) CN102301420B (ru)
AR (1) AR075163A1 (ru)
AU (1) AU2010209869B2 (ru)
BR (1) BRPI1005299B1 (ru)
CA (1) CA2750272C (ru)
CO (1) CO6420380A2 (ru)
ES (1) ES2401554T3 (ru)
HK (1) HK1163912A1 (ru)
MX (1) MX2011007924A (ru)
MY (1) MY156497A (ru)
PL (1) PL2380167T3 (ru)
RU (1) RU2518696C2 (ru)
SG (1) SG173138A1 (ru)
TW (1) TWI417870B (ru)
WO (1) WO2010086216A1 (ru)
ZA (1) ZA201105417B (ru)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5513976B2 (ja) * 2010-05-12 2014-06-04 株式会社東芝 超音波診断装置
KR101666465B1 (ko) * 2010-07-22 2016-10-17 삼성전자주식회사 다채널 오디오 신호 부호화/복호화 장치 및 방법
US9236064B2 (en) * 2012-02-15 2016-01-12 Microsoft Technology Licensing, Llc Sample rate converter with automatic anti-aliasing filter
MX346944B (es) 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de frecuencia reforzada mediante la suavizacion temporal de las subbandas.
BR112015025092B1 (pt) * 2013-04-05 2022-01-11 Dolby International Ab Sistema de processamento de áudio e método para processar um fluxo de bits de áudio
CN110085240B (zh) * 2013-05-24 2023-05-23 杜比国际公司 包括音频对象的音频场景的高效编码
EP3961622B1 (en) 2013-05-24 2023-11-01 Dolby International AB Audio encoder
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP3293734B1 (en) * 2013-09-12 2019-05-15 Dolby International AB Decoding of multichannel audio content
EP2854133A1 (en) 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
KR102381216B1 (ko) * 2013-10-21 2022-04-08 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
US10049683B2 (en) * 2013-10-21 2018-08-14 Dolby International Ab Audio encoder and decoder
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
TWI587286B (zh) * 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
CN107818790B (zh) * 2017-11-16 2020-08-11 苏州麦迪斯顿医疗科技股份有限公司 一种多路音频混音方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
KR20070001111A (ko) * 2004-01-28 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 신호를 시간 스케일링하는 방법 및 장치
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
CN1930914B (zh) * 2004-03-04 2012-06-27 艾格瑞***有限公司 对多声道音频信号进行编码和合成的方法和装置
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
WO2007032648A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US20080221907A1 (en) 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
CN101379766B (zh) 2006-03-29 2011-12-14 株式会社日立制作所 宽带无线通信中的资源分配方法、基站装置以及终端装置
CN101518103B (zh) * 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals

Also Published As

Publication number Publication date
WO2010086216A1 (en) 2010-08-05
AR075163A1 (es) 2011-03-16
ZA201105417B (en) 2012-03-28
HK1163912A1 (en) 2012-09-14
CO6420380A2 (es) 2012-04-16
EP2214161A1 (en) 2010-08-04
TW201034005A (en) 2010-09-16
US8867753B2 (en) 2014-10-21
SG173138A1 (en) 2011-08-29
CA2750272A1 (en) 2010-08-05
CA2750272C (en) 2015-04-21
KR20110111432A (ko) 2011-10-11
KR101290486B1 (ko) 2013-07-26
MY156497A (en) 2016-02-26
JP5174973B2 (ja) 2013-04-03
EP2380167B1 (en) 2013-01-02
CN102301420A (zh) 2011-12-28
AU2010209869B2 (en) 2013-07-11
BRPI1005299B1 (pt) 2020-11-24
RU2518696C2 (ru) 2014-06-10
PL2380167T3 (pl) 2013-06-28
JP2012516461A (ja) 2012-07-19
US20110317842A1 (en) 2011-12-29
ES2401554T3 (es) 2013-04-22
CN102301420B (zh) 2014-12-24
MX2011007924A (es) 2011-08-17
BRPI1005299A2 (pt) 2016-12-06
TWI417870B (zh) 2013-12-01
EP2380167A1 (en) 2011-10-26
AU2010209869A1 (en) 2011-08-25

Similar Documents

Publication Publication Date Title
RU2011133700A (ru) Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала
RU2547221C2 (ru) Аппаратный блок, способ и компьютерная программа для расширения сжатого аудио сигнала
RU2550525C2 (ru) Аппаратный блок, способ и компьютерная программа для преобразования расширения сжатого аудио сигнала с помощью сглаженного значения фазы
KR102114648B1 (ko) 오디오 프로세싱 시스템에서 신호 역상관
AU2011357816B2 (en) Determining the inter-channel time difference of a multi-channel audio signal
EP3035330B1 (en) Determining the inter-channel time difference of a multi-channel audio signal
CN102158198B (zh) 滤波器产生器、滤波器***和提供中间滤波器定义信号的方法
KR101729930B1 (ko) 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
KR100971700B1 (ko) 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과,그를 이용한 바이노럴 스테레오 복호화 장치
KR20080042166A (ko) 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램
CA2553784A1 (en) Improved coding techniques using estimated spectral magnitude and phase derived from mdct coefficients
CN111863015B (zh) 一种音频处理方法、装置、电子设备和可读存储介质
KR20150109400A (ko) 추정된 공간 파라미터들을 사용한 오디오 신호 강화
JP7062727B2 (ja) オーディオ信号処理方法および装置、記憶媒体
Katzberg et al. A compressed sensing framework for dynamic sound-field measurements
JP2007512763A5 (ru)
RU2013155384A (ru) Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов
Hahn et al. Identification of dynamic acoustic systems by orthogonal expansion of time-variant impulse responses
US10021500B2 (en) Audio file playing method and apparatus
WO2009073958A1 (en) Method and system for estimating parameters of a multi-tone signal
RU2016115360A (ru) Структура декоррелятора для параметрического восстановления звуковых сигналов
Dehner et al. Analysis of the quantization error in digital multipliers with small wordlength
Zhou et al. Linear prediction approach to oversampling parameter estimation for multiple complex sinusoids
CN107132552B (zh) 一种并行码相位搜索装置及实现并行码相位搜索的方法
Ghirmai A random-coefficient third-order autoregressive process