KR20130093783A - 오디오 객체 전송 장치 및 방법 - Google Patents

오디오 객체 전송 장치 및 방법 Download PDF

Info

Publication number
KR20130093783A
KR20130093783A KR1020110147536A KR20110147536A KR20130093783A KR 20130093783 A KR20130093783 A KR 20130093783A KR 1020110147536 A KR1020110147536 A KR 1020110147536A KR 20110147536 A KR20110147536 A KR 20110147536A KR 20130093783 A KR20130093783 A KR 20130093783A
Authority
KR
South Korea
Prior art keywords
audio
multichannel
encoder
encoding
signal
Prior art date
Application number
KR1020110147536A
Other languages
English (en)
Inventor
유재현
서정일
이태진
최근우
강경옥
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020110147536A priority Critical patent/KR20130093783A/ko
Priority to US13/729,303 priority patent/US9312971B2/en
Publication of KR20130093783A publication Critical patent/KR20130093783A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법이 개시된다.
오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.

Description

오디오 객체 전송 장치 및 방법{APPARATUS AND METHOD FOR TRANSMITTING AUDIO OBJECT}
본 발명은 다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법에 관한 것으로, 보다 상세하게는 복수의 오디오 객체를 다채널 부호화기로 부호화하여 전송함으로써, 복수의 오디오 객체를 용이하게 전송하는 오디오 객체 전송 장치 및 방법에 관한 것이다.
음장 합성(WFS) 재생 기술은 재생하고자 하는 음원의 파면을 합성하여 청취 공간 상의 여러 청취자에게 동일한 음장감을 제공하는 기술이다.
음장 합성 재생 기술에서는 하나의 오디오 장면을 위해서는 많은 개수의 오디오 객체를 필요로 한다. 반면에 음장 합성 신호를 전송하는 전송 매체는 한정된 대역폭을 가지고 있으므로, 오디오 객체의 개수가 증가함에 따라 오디오 객체들을 전송하기 과정의 난이도가 증가하게 된다.
최근 MPEG에서는 SAOC(Spatial Audio Object Coding)으로 많은 객체를 전송하는 방법이 개발되었으나, SAOC는 별도의 코덱을 사용하는 방식이므로, 추가로 별도의 코덱을 구현해야 한다는 한계가 있었다.
따라서, 추가 코덱의 구현 없이 복수의 오디오 객체를 전송할 수 있는 방법이 요청되고 있다.
본 발명은 복수의 오디오 객체를 용이하게 전송하기 위한 장치 및 방법을 제공한다.
또한, 본 발명은 기존의 다채널 부호화기를 사용하여 많은 개수의 오디오 객체들을 부호화하는 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치와, 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 장치는 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 신호 추출부; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 복호화부; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 랜더링부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 방법은 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 방법은 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 단계를 포함할 수 있다.
본 발명의 일실시예에 의하면, 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다.
또한, 본 발명의 일실시예에 의하면, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 도 1에 도시된 바와 같이 오디오 객체 신호에 기반한 음장 합성(WFS: Wave Field Synthesis) 시스템에서 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치(110)와 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치(120)를 포함할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 다채널 부호화기 결정부(111), 부호화부(112), 및 다채널 객체 오디오 신호 생성부(113)를 포함할 수 있다.
다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 오디오 객체는 3차원 효과 음원을 발생하는 객체일 수 있다. 예를 들어 오디오 객체는 기차, 동물과 같이 소리를 발생시키는 오브젝트 및 번개와 같은 자연 현상의 위치를 나타내는 객체일 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 6개인 경우 6개의 채널을 사용하는 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 또한, 다채널 부호화기 결정부(111)는 오디오 객체가 8개인 경우 8개의 채널을 사용하는 7.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
그리고, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 12개인 경우 12개의 채널을 사용하는 10.2 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 그러나, 부호화부(112)가 5.1 채널 부호화기와 7.1 채널 부호화기만을 구비하고 있는 경우, 부호화부(112)는 10.2 채널 부호화기로 오디오 객체를 부호화할 수 없다.
따라서, 다채널 부호화기 결정부(111)는 2개의 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정함으로써, 12개의 오디오 객체를 부호화할 수 있다.
부호화부(112)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
또한, 부호화부(112)는 다채널 부호화기 결정부(111)가 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정한 경우, 복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화할 수 있다.
다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 각 오디오 객체의 방향과 거리와 관련된 정보일 수 있다. 이때, 다채널 객체 오디오 신호 생성부(113)는 복수의 신호를 단일 신호로 출력하는 다중화기(MUX: multiplexer)일 수 있다.
이때, 다채널 객체 오디오 신호 생성부(113)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가할 수도 있다.
즉, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 복호화 장치(120)는 신호 추출부(121), 복호화부(122), 및 랜더링부(123)를 포함할 수 있다.
신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출할 수 있다. 이때, 신호 추출부(121)는 단일 신호를 입력 받아 복수의 신호를 출력하는 역 다중화기(DEMUX: demultiplexer)일 수 있다.
또한, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출할 수 있다.
복호화부(122)는 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
이때, 복호화부(122)는 부호화기 정보에 따른 다채널 복호화기를 사용하여 오디오 객체들을 복호화할 수 있다. 또한, 복호화부(122)는 부호화기 정보에서 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화할 수 있다.
랜더링부(123)는 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부(123)는 사용자 환경 정보를 수신하고, 수신한 사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
오디오 객체 부호화 장치(110)는 도 2에 도시된 바와 같이 6개의 오디오 객체(210)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(220)로 오디오 객체들을 부호화하여 부호화 신호(230)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(240)들을 부호화 신호(230)와 다중화하여 다채널 객체 오디오 신호(250)를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 제1 오디오 객체(211) 내지 제6 오디오 객체(211)의 방향과 거리와 관련된 정보일 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 1개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
오디오 객체 부호화 장치(110)는 도 3에 도시된 바와 같이 12개의 오디오 객체(310)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(320, 325)를 2개 사용하여 오디오 객체들을 부호화하고, 부호화 신호(330, 335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 부호화부(112)는 도 3에 도시된 바와 같이 5.1 채널 부호화기 1(320)과 5.1채널 부호화기 2(325)를 병렬로 사용하여 오디오 객체(310)들을 부호화함으로써, 동시에 12개의 오디오 신호(310)를 부호화할 수 있다. 이때, 5.1 채널 부호화기 1(320)은 제1 오디오 객체(311) 내지 제6 오디오 객체(312)를 부호화하여 부호화 신호(330)를 생성하고, 5.1 채널 부호화기 2(325)는 제7 오디오 객체(313) 내지 제12 오디오 객체(314)를 부호화하여 부호화 신호(335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(340)들을 부호화 신호(330, 335)와 다중화하여 다채널 객체 오디오 신호(350)를 생성할 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 2개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
즉, 본 발명에 따른 오디오 객체 부호화 장치(110)는 10.2 채널부호화기가 없더라도 종래의 5.1 채널 부호화기를 병렬로 사용하여 12개의 오디오 객체를 동시에 부호화할 수 있다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
오디오 객체 복호화 장치(120)의 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호(250)에서 부호화 신호(410)와 오디오 객체들의 음상 정위 정보들(440)을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
이때, 오디오 객체 복호화 장치(120)의 복호화부(122)는 도 4에 도시된 바와 같이 부호화기 정보에 대응하는 5.1 채널 복호화기(420)로 부호화 신호(410)를 복호화하여 6개의 오디오 객체(430)들을 복원할 수 있다.
마지막으로 랜더링부(123)는 음상 정위 정보(440)를 사용하여 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부는 사용자 환경 정보(450)를 수신하고, 수신한 사용자 환경 정보(450)에 따라 음상 정위 정보(440)를 사용하여 오디오 객체(430)들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보(450)는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
단계(S510)에서 다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 부호화부(112)가 사용 가능한 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
단계(S520)에서 부호화부(112)는 단계(S510)에서 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
단계(S530)에서 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 단계(S520)에서 생성한 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
단계(S610)에서 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 부호화 신호와 오디오 객체들의 음상 정위 정보들을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
단계(S620)에서 복호화부(122)는 단계(S610)에서 추출한 부호화기 정보에 대응하는 다채널 복호화기로 단계(S610)에서 추출한 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
단계(S630)에서 랜더링부(123)는 단계(S610)에서 추출한 음상 정위 정보(440)를 사용하여 단계(S620)에서 복원한 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
본 발명은 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 오디오 객체 부호화 장치
111: 다채널 부호화기 결정부
112: 부호화부
113: 다채널 객체 오디오 신호 생성부
120: 오디오 객체 복호화 장치
121: 신호 추출부
122: 복호화부
123: 랜더링부

Claims (19)

  1. 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부;
    결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및
    오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부
    를 포함하는 오디오 객체 부호화 장치.
  2. 제1항에 있어서,
    상기 다채널 부호화기 결정부는,
    오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정하는 것을 특징으로 하는 오디오 객체 부호화 장치.
  3. 제2항에 있어서,
    상기 부호화부는,
    복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화하는 것을 특징으로 하는 오디오 객체 부호화 장치.
  4. 제1항에 있어서,
    상기 다채널 객체 오디오 신호 생성부는,
    결정된 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가하는 것을 특징으로 하는 오디오 객체 부호화 장치.
  5. 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 신호 추출부;
    적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 복호화부; 및
    음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 랜더링부
    를 포함하는 오디오 객체 복호화 장치.
  6. 제5항에 있어서,
    상기 신호 추출부는,
    수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출하는 것을 특징으로 하는 오디오 객체 복호화 장치.
  7. 제6항에 있어서,
    상기 복호화부는,
    부호화기 정보에 따른 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화하는 것을 특징으로 하는 오디오 객체 복호화 장치.
  8. 제5항에 있어서,
    상기 랜더링부는
    사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링하는 것을 특징으로 하는 오디오 객체 복호화 장치.
  9. 제8항에 있어서,
    상기 사용자 환경 정보는,
    라우드 스피커의 개수나 위치와 관련된 정보인 것을 특징으로 하는 오디오 객체 복호화 장치.
  10. 복수의 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치와,
    수신한 신호를 다채널 복호화기로 복호화하여 오디오 객체를 복원하는 오디오 객체 복호화 장치
    를 포함하는 오디오 객체 전송 장치.
  11. 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계;
    결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및
    오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계
    를 포함하는 오디오 객체 부호화 방법.
  12. 제11항에 있어서,
    상기 다채널 부호화기를 결정하는 단계는,
    오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  13. 제12항에 있어서,
    상기 부호화 신호를 생성하는 단계는,
    복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  14. 제11항에 있어서,
    상기 다채널 객체 오디오 신호를 생성하는 단계는,
    결정된 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가하는 것을 특징으로 하는 오디오 객체 부호화 방법.
  15. 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계;
    적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및
    음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 단계
    를 포함하는 오디오 객체 복호화 방법.
  16. 제15항에 있어서,
    상기 신호를 추출하는 단계는,
    수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  17. 제16항에 있어서,
    상기 복원하는 단계는,
    부호화기 정보에 따른 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  18. 제15항에 있어서,
    상기 랜더링하는 단계는
    사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링하는 것을 특징으로 하는 오디오 객체 복호화 방법.
  19. 제18항에 있어서,
    상기 사용자 환경 정보는,
    라우드 스피커의 개수나 위치와 관련된 정보인 것을 특징으로 하는 오디오 객체 복호화 방법.
KR1020110147536A 2011-12-30 2011-12-30 오디오 객체 전송 장치 및 방법 KR20130093783A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110147536A KR20130093783A (ko) 2011-12-30 2011-12-30 오디오 객체 전송 장치 및 방법
US13/729,303 US9312971B2 (en) 2011-12-30 2012-12-28 Apparatus and method for transmitting audio object

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110147536A KR20130093783A (ko) 2011-12-30 2011-12-30 오디오 객체 전송 장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190030000A Division KR20190031460A (ko) 2019-03-15 2019-03-15 오디오 객체 전송 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20130093783A true KR20130093783A (ko) 2013-08-23

Family

ID=48694808

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110147536A KR20130093783A (ko) 2011-12-30 2011-12-30 오디오 객체 전송 장치 및 방법

Country Status (2)

Country Link
US (1) US9312971B2 (ko)
KR (1) KR20130093783A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200054445A (ko) 2018-11-10 2020-05-20 김수진 머리에 쓰고 스마트폰 어플로 온도, 각도 및 건조시간 설정이 가능한 무선 헤어 드라이어

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2891149A1 (en) * 2012-08-31 2015-07-08 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
KR102327504B1 (ko) 2013-07-31 2021-11-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱
KR102243395B1 (ko) * 2013-09-05 2021-04-22 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970005131B1 (ko) * 1994-01-18 1997-04-12 대우전자 주식회사 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US20030084277A1 (en) * 2001-07-06 2003-05-01 Dennis Przywara User configurable audio CODEC with hot swappable audio/data communications gateway having audio streaming capability over a network
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
WO2007083931A1 (en) * 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
DE102007059597A1 (de) 2007-09-19 2009-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Eine Vorrichtung und ein Verfahren zur Ermittlung eines Komponentensignals in hoher Genauigkeit
EP2250821A1 (en) * 2008-03-03 2010-11-17 Nokia Corporation Apparatus for capturing and rendering a plurality of audio channels
JP5267362B2 (ja) * 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200054445A (ko) 2018-11-10 2020-05-20 김수진 머리에 쓰고 스마트폰 어플로 온도, 각도 및 건조시간 설정이 가능한 무선 헤어 드라이어

Also Published As

Publication number Publication date
US20130170646A1 (en) 2013-07-04
US9312971B2 (en) 2016-04-12

Similar Documents

Publication Publication Date Title
KR102131748B1 (ko) 2차원 또는 3차원 음장의 앰비소닉스 표현의 연속 프레임을 인코딩 및 디코딩하는 방법 및 장치
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
CN101981617B (zh) 多对象音频信号的附加信息比特流产生方法和装置
KR101387902B1 (ko) 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더
KR20110036023A (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
RU2007139918A (ru) Кодирование многоканального аудио
KR102172279B1 (ko) 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
KR20210151741A (ko) 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
US8626515B2 (en) Apparatus for processing media signal and method thereof
KR20130093783A (ko) 오디오 객체 전송 장치 및 방법
KR100636145B1 (ko) 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
KR20130093798A (ko) 다채널 신호 부호화 및 복호화 장치 및 방법
KR101949756B1 (ko) 오디오 신호 처리 방법 및 장치
KR20190031460A (ko) 오디오 객체 전송 장치 및 방법
KR20140017344A (ko) 오디오 신호 처리 방법 및 장치
KR102191260B1 (ko) 다채널 오디오 코덱과 다객체 오디오 코덱을 이용한 오디오 부호화/복호화 장치 및 방법
KR101950455B1 (ko) 오디오 신호 처리 방법 및 장치
KR101949755B1 (ko) 오디오 신호 처리 방법 및 장치
KR20100020889A (ko) 오디오 신호 부호화/복호화 방법 및 그 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X091 Application refused [patent]
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2019101000883; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20190315

Effective date: 20200408

E902 Notification of reason for refusal
AMND Amendment
S601 Decision to reject again after remand of revocation
X091 Application refused [patent]
E902 Notification of reason for refusal
S601 Decision to reject again after remand of revocation