KR20130093783A - 오디오 객체 전송 장치 및 방법 - Google Patents
오디오 객체 전송 장치 및 방법 Download PDFInfo
- Publication number
- KR20130093783A KR20130093783A KR1020110147536A KR20110147536A KR20130093783A KR 20130093783 A KR20130093783 A KR 20130093783A KR 1020110147536 A KR1020110147536 A KR 1020110147536A KR 20110147536 A KR20110147536 A KR 20110147536A KR 20130093783 A KR20130093783 A KR 20130093783A
- Authority
- KR
- South Korea
- Prior art keywords
- audio
- multichannel
- encoder
- encoding
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005236 sound signal Effects 0.000 claims abstract description 44
- 238000009877 rendering Methods 0.000 claims abstract description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000004807 localization Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법이 개시된다.
오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.
오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.
Description
본 발명은 다채널 부호화 장치, 복호화 장치를 사용하여 복수의 오디오 객체를 전송하는 장치 및 방법에 관한 것으로, 보다 상세하게는 복수의 오디오 객체를 다채널 부호화기로 부호화하여 전송함으로써, 복수의 오디오 객체를 용이하게 전송하는 오디오 객체 전송 장치 및 방법에 관한 것이다.
음장 합성(WFS) 재생 기술은 재생하고자 하는 음원의 파면을 합성하여 청취 공간 상의 여러 청취자에게 동일한 음장감을 제공하는 기술이다.
음장 합성 재생 기술에서는 하나의 오디오 장면을 위해서는 많은 개수의 오디오 객체를 필요로 한다. 반면에 음장 합성 신호를 전송하는 전송 매체는 한정된 대역폭을 가지고 있으므로, 오디오 객체의 개수가 증가함에 따라 오디오 객체들을 전송하기 과정의 난이도가 증가하게 된다.
최근 MPEG에서는 SAOC(Spatial Audio Object Coding)으로 많은 객체를 전송하는 방법이 개발되었으나, SAOC는 별도의 코덱을 사용하는 방식이므로, 추가로 별도의 코덱을 구현해야 한다는 한계가 있었다.
따라서, 추가 코덱의 구현 없이 복수의 오디오 객체를 전송할 수 있는 방법이 요청되고 있다.
본 발명은 복수의 오디오 객체를 용이하게 전송하기 위한 장치 및 방법을 제공한다.
또한, 본 발명은 기존의 다채널 부호화기를 사용하여 많은 개수의 오디오 객체들을 부호화하는 장치 및 방법을 제공한다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치와, 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 장치는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 장치는 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 신호 추출부; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 복호화부; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 랜더링부를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 부호화 방법은 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계; 결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 오디오 객체 복호화 방법은 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계; 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 단계를 포함할 수 있다.
본 발명의 일실시예에 의하면, 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다.
또한, 본 발명의 일실시예에 의하면, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 오디오 객체 전송 장치를 도시한 블록 다이어그램이다.
본 발명의 일실시예에 따른 오디오 객체 전송 장치는 도 1에 도시된 바와 같이 오디오 객체 신호에 기반한 음장 합성(WFS: Wave Field Synthesis) 시스템에서 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치(110)와 다채널 복호화기로 오디오 객체를 복원하는 오디오 객체 복호화 장치(120)를 포함할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 다채널 부호화기 결정부(111), 부호화부(112), 및 다채널 객체 오디오 신호 생성부(113)를 포함할 수 있다.
다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 오디오 객체는 3차원 효과 음원을 발생하는 객체일 수 있다. 예를 들어 오디오 객체는 기차, 동물과 같이 소리를 발생시키는 오브젝트 및 번개와 같은 자연 현상의 위치를 나타내는 객체일 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 6개인 경우 6개의 채널을 사용하는 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 또한, 다채널 부호화기 결정부(111)는 오디오 객체가 8개인 경우 8개의 채널을 사용하는 7.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
그리고, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
예를 들어, 다채널 부호화기 결정부(111)는 오디오 객체가 12개인 경우 12개의 채널을 사용하는 10.2 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다. 그러나, 부호화부(112)가 5.1 채널 부호화기와 7.1 채널 부호화기만을 구비하고 있는 경우, 부호화부(112)는 10.2 채널 부호화기로 오디오 객체를 부호화할 수 없다.
따라서, 다채널 부호화기 결정부(111)는 2개의 5.1 채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정함으로써, 12개의 오디오 객체를 부호화할 수 있다.
부호화부(112)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
또한, 부호화부(112)는 다채널 부호화기 결정부(111)가 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정한 경우, 복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화할 수 있다.
다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 각 오디오 객체의 방향과 거리와 관련된 정보일 수 있다. 이때, 다채널 객체 오디오 신호 생성부(113)는 복수의 신호를 단일 신호로 출력하는 다중화기(MUX: multiplexer)일 수 있다.
이때, 다채널 객체 오디오 신호 생성부(113)는 다채널 부호화기 결정부(111)가 결정한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가할 수도 있다.
즉, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 본 발명의 일실시예에 따른 오디오 객체 부호화 장치(110)는 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
도 1을 참고하면, 본 발명의 일실시예에 따른 오디오 객체 복호화 장치(120)는 신호 추출부(121), 복호화부(122), 및 랜더링부(123)를 포함할 수 있다.
신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출할 수 있다. 이때, 신호 추출부(121)는 단일 신호를 입력 받아 복수의 신호를 출력하는 역 다중화기(DEMUX: demultiplexer)일 수 있다.
또한, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출할 수 있다.
복호화부(122)는 적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
이때, 복호화부(122)는 부호화기 정보에 따른 다채널 복호화기를 사용하여 오디오 객체들을 복호화할 수 있다. 또한, 복호화부(122)는 부호화기 정보에서 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화할 수 있다.
랜더링부(123)는 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부(123)는 사용자 환경 정보를 수신하고, 수신한 사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 2는 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 일례이다.
오디오 객체 부호화 장치(110)는 도 2에 도시된 바와 같이 6개의 오디오 객체(210)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(220)로 오디오 객체들을 부호화하여 부호화 신호(230)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(240)들을 부호화 신호(230)와 다중화하여 다채널 객체 오디오 신호(250)를 생성할 수 있다. 이때, 오디오 객체들의 음상 정위 정보들은 제1 오디오 객체(211) 내지 제6 오디오 객체(211)의 방향과 거리와 관련된 정보일 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 1개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
도 3은 본 발명의 일실시예에 따른 오디오 객체 부호화 장치가 오디오 객체를 부호화하는 과정의 다른 일례이다.
오디오 객체 부호화 장치(110)는 도 3에 도시된 바와 같이 12개의 오디오 객체(310)를 부호화하는 경우, 6개의 채널을 사용하는 5.1 채널 부호화기(320, 325)를 2개 사용하여 오디오 객체들을 부호화하고, 부호화 신호(330, 335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 부호화부(112)는 도 3에 도시된 바와 같이 5.1 채널 부호화기 1(320)과 5.1채널 부호화기 2(325)를 병렬로 사용하여 오디오 객체(310)들을 부호화함으로써, 동시에 12개의 오디오 신호(310)를 부호화할 수 있다. 이때, 5.1 채널 부호화기 1(320)은 제1 오디오 객체(311) 내지 제6 오디오 객체(312)를 부호화하여 부호화 신호(330)를 생성하고, 5.1 채널 부호화기 2(325)는 제7 오디오 객체(313) 내지 제12 오디오 객체(314)를 부호화하여 부호화 신호(335)를 생성할 수 있다.
이때, 오디오 객체 부호화 장치(110)의 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보(340)들을 부호화 신호(330, 335)와 다중화하여 다채널 객체 오디오 신호(350)를 생성할 수 있다. 또한, 다채널 객체 오디오 신호 생성부(113)는 2개의 5.1 채널 부호화기를 사용하였다는 부호화기 정보를 다채널 객체 오디오 신호(250)에 추가할 수 있다.
즉, 본 발명에 따른 오디오 객체 부호화 장치(110)는 10.2 채널부호화기가 없더라도 종래의 5.1 채널 부호화기를 병렬로 사용하여 12개의 오디오 객체를 동시에 부호화할 수 있다.
도 4는 본 발명의 일실시예에 따른 오디오 객체 복호화 장치가 오디오 객체를 복호화하는 과정의 일례이다.
오디오 객체 복호화 장치(120)의 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호(250)에서 부호화 신호(410)와 오디오 객체들의 음상 정위 정보들(440)을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
이때, 오디오 객체 복호화 장치(120)의 복호화부(122)는 도 4에 도시된 바와 같이 부호화기 정보에 대응하는 5.1 채널 복호화기(420)로 부호화 신호(410)를 복호화하여 6개의 오디오 객체(430)들을 복원할 수 있다.
마지막으로 랜더링부(123)는 음상 정위 정보(440)를 사용하여 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
이때, 랜더링부는 사용자 환경 정보(450)를 수신하고, 수신한 사용자 환경 정보(450)에 따라 음상 정위 정보(440)를 사용하여 오디오 객체(430)들을 음장 합성 랜더링할 수 있다. 이때, 사용자 환경 정보(450)는 라우드 스피커의 개수나 위치와 관련된 정보일 수 있다.
도 5는 본 발명의 일실시예에 따른 오디오 객체 부호화 방법을 도시한 플로우차트이다.
단계(S510)에서 다채널 부호화기 결정부(111)는 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정할 수 있다. 이때, 다채널 부호화기 결정부(111)는 오디오 객체들의 개수가 부호화부(112)가 사용 가능한 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정할 수 있다.
단계(S520)에서 부호화부(112)는 단계(S510)에서 결정한 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성할 수 있다.
단계(S530)에서 다채널 객체 오디오 신호 생성부(113)는 오디오 객체들의 음상 정위 정보들을 단계(S520)에서 생성한 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성할 수 있다.
도 6은 본 발명의 일실시예에 따른 오디오 객체 복호화 방법을 도시한 플로우차트이다.
단계(S610)에서 신호 추출부(121)는 오디오 객체 부호화 장치(110)로부터 수신한 다채널 객체 오디오 신호에서 부호화 신호와 오디오 객체들의 음상 정위 정보들을 추출할 수 있다. 이때, 신호 추출부(121)는 수신한 다채널 객체 오디오 신호에서 5.1 채널 부호화기를 사용하여 부호화하였다는 부호화기 정보를 더 추출할 수 있다.
단계(S620)에서 복호화부(122)는 단계(S610)에서 추출한 부호화기 정보에 대응하는 다채널 복호화기로 단계(S610)에서 추출한 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원할 수 있다.
단계(S630)에서 랜더링부(123)는 단계(S610)에서 추출한 음상 정위 정보(440)를 사용하여 단계(S620)에서 복원한 오디오 객체들(430)을 음장 합성(WFS: Wave Field Synthesis) 랜더링할 수 있다.
본 발명은 복수의 오디오 객체를 다채널 부호화기로 부호화 함으로써, 복수의 오디오 객체를 용이하게 전송할 수 있다. 또한, 오디오 객체의 개수가 많은 경우, 복수의 다채널 부호화기를 병렬로 사용함으로써, 기존의 다채널 부호화기를 사용하여 기존의 다채널 부호화기가 부호화할 수 있는 채널의 개수보다 많은 개수의 오디오 객체들을 동시에 부호화할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 오디오 객체 부호화 장치
111: 다채널 부호화기 결정부
112: 부호화부
113: 다채널 객체 오디오 신호 생성부
120: 오디오 객체 복호화 장치
121: 신호 추출부
122: 복호화부
123: 랜더링부
111: 다채널 부호화기 결정부
112: 부호화부
113: 다채널 객체 오디오 신호 생성부
120: 오디오 객체 복호화 장치
121: 신호 추출부
122: 복호화부
123: 랜더링부
Claims (19)
- 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 다채널 부호화기 결정부;
결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 부호화부; 및
오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 다채널 객체 오디오 신호 생성부
를 포함하는 오디오 객체 부호화 장치. - 제1항에 있어서,
상기 다채널 부호화기 결정부는,
오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정하는 것을 특징으로 하는 오디오 객체 부호화 장치. - 제2항에 있어서,
상기 부호화부는,
복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화하는 것을 특징으로 하는 오디오 객체 부호화 장치. - 제1항에 있어서,
상기 다채널 객체 오디오 신호 생성부는,
결정된 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가하는 것을 특징으로 하는 오디오 객체 부호화 장치. - 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 신호 추출부;
적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 복호화부; 및
음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 랜더링부
를 포함하는 오디오 객체 복호화 장치. - 제5항에 있어서,
상기 신호 추출부는,
수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출하는 것을 특징으로 하는 오디오 객체 복호화 장치. - 제6항에 있어서,
상기 복호화부는,
부호화기 정보에 따른 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화하는 것을 특징으로 하는 오디오 객체 복호화 장치. - 제5항에 있어서,
상기 랜더링부는
사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링하는 것을 특징으로 하는 오디오 객체 복호화 장치. - 제8항에 있어서,
상기 사용자 환경 정보는,
라우드 스피커의 개수나 위치와 관련된 정보인 것을 특징으로 하는 오디오 객체 복호화 장치. - 복수의 오디오 객체를 다채널 부호화기로 부호화하여 전송하는 오디오 객체 부호화 장치와,
수신한 신호를 다채널 복호화기로 복호화하여 오디오 객체를 복원하는 오디오 객체 복호화 장치
를 포함하는 오디오 객체 전송 장치. - 오디오 객체들의 개수에 따라 오디오 객체들의 부호화에 사용할 다채널 부호화기를 결정하는 단계;
결정된 다채널 부호화기로 오디오 객체들을 부호화하여 부호화 신호를 생성하는 단계; 및
오디오 객체들의 음상 정위 정보들을 부호화 신호와 다중화하여 다채널 객체 오디오 신호를 생성하는 단계
를 포함하는 오디오 객체 부호화 방법. - 제11항에 있어서,
상기 다채널 부호화기를 결정하는 단계는,
오디오 객체들의 개수가 다채널 부호화기의 채널 개수보다 많은 경우, 복수의 다채널 부호화기를 오디오 객체들의 부호화에 사용할 다채널 부호화기로 결정하는 것을 특징으로 하는 오디오 객체 부호화 방법. - 제12항에 있어서,
상기 부호화 신호를 생성하는 단계는,
복수의 다채널 부호화기를 병렬로 사용하여 오디오 객체들을 동시에 부호화하는 것을 특징으로 하는 오디오 객체 부호화 방법. - 제11항에 있어서,
상기 다채널 객체 오디오 신호를 생성하는 단계는,
결정된 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 다채널 객체 오디오 신호에 추가하는 것을 특징으로 하는 오디오 객체 부호화 방법. - 수신한 다채널 객체 오디오 신호에서 오디오 객체들의 음상 정위 정보들과 부호화 신호를 추출하는 단계;
적어도 하나의 다채널 복호화기로 부호화 신호를 복호화하여 복수의 오디오 객체들을 복원하는 단계; 및
음상 정위 정보를 사용하여 오디오 객체들을 음장 합성(WFS: Wave Field Synthesis) 랜더링하는 단계
를 포함하는 오디오 객체 복호화 방법. - 제15항에 있어서,
상기 신호를 추출하는 단계는,
수신한 다채널 객체 오디오 신호에서 부호화에 사용한 다채널 부호화기의 종류와 개수에 관련된 정보를 포함하는 부호화기 정보를 더 추출하는 것을 특징으로 하는 오디오 객체 복호화 방법. - 제16항에 있어서,
상기 복원하는 단계는,
부호화기 정보에 따른 다채널 부호화기의 개수가 복수인 경우, 부호화기 정보에 따른 다채널 복호화기를 병렬로 사용하여 오디오 객체들을 동시에 복호화하는 것을 특징으로 하는 오디오 객체 복호화 방법. - 제15항에 있어서,
상기 랜더링하는 단계는
사용자 환경 정보에 따라 음상 정위 정보를 사용하여 오디오 객체들을 음장 합성 랜더링하는 것을 특징으로 하는 오디오 객체 복호화 방법. - 제18항에 있어서,
상기 사용자 환경 정보는,
라우드 스피커의 개수나 위치와 관련된 정보인 것을 특징으로 하는 오디오 객체 복호화 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110147536A KR20130093783A (ko) | 2011-12-30 | 2011-12-30 | 오디오 객체 전송 장치 및 방법 |
US13/729,303 US9312971B2 (en) | 2011-12-30 | 2012-12-28 | Apparatus and method for transmitting audio object |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110147536A KR20130093783A (ko) | 2011-12-30 | 2011-12-30 | 오디오 객체 전송 장치 및 방법 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190030000A Division KR20190031460A (ko) | 2019-03-15 | 2019-03-15 | 오디오 객체 전송 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130093783A true KR20130093783A (ko) | 2013-08-23 |
Family
ID=48694808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110147536A KR20130093783A (ko) | 2011-12-30 | 2011-12-30 | 오디오 객체 전송 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9312971B2 (ko) |
KR (1) | KR20130093783A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200054445A (ko) | 2018-11-10 | 2020-05-20 | 김수진 | 머리에 쓰고 스마트폰 어플로 온도, 각도 및 건조시간 설정이 가능한 무선 헤어 드라이어 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2891149A1 (en) * | 2012-08-31 | 2015-07-08 | Dolby Laboratories Licensing Corporation | Processing audio objects in principal and supplementary encoded audio signals |
KR102327504B1 (ko) | 2013-07-31 | 2021-11-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱 |
KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US20030084277A1 (en) * | 2001-07-06 | 2003-05-01 | Dennis Przywara | User configurable audio CODEC with hot swappable audio/data communications gateway having audio streaming capability over a network |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
WO2007083931A1 (en) * | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
DE102007059597A1 (de) | 2007-09-19 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Eine Vorrichtung und ein Verfahren zur Ermittlung eines Komponentensignals in hoher Genauigkeit |
EP2250821A1 (en) * | 2008-03-03 | 2010-11-17 | Nokia Corporation | Apparatus for capturing and rendering a plurality of audio channels |
JP5267362B2 (ja) * | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
-
2011
- 2011-12-30 KR KR1020110147536A patent/KR20130093783A/ko not_active IP Right Cessation
-
2012
- 2012-12-28 US US13/729,303 patent/US9312971B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200054445A (ko) | 2018-11-10 | 2020-05-20 | 김수진 | 머리에 쓰고 스마트폰 어플로 온도, 각도 및 건조시간 설정이 가능한 무선 헤어 드라이어 |
Also Published As
Publication number | Publication date |
---|---|
US20130170646A1 (en) | 2013-07-04 |
US9312971B2 (en) | 2016-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102131748B1 (ko) | 2차원 또는 3차원 음장의 앰비소닉스 표현의 연속 프레임을 인코딩 및 디코딩하는 방법 및 장치 | |
KR101283783B1 (ko) | 고품질 다채널 오디오 부호화 및 복호화 장치 | |
CN101981617B (zh) | 多对象音频信号的附加信息比特流产生方法和装置 | |
KR101387902B1 (ko) | 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더 | |
KR20110036023A (ko) | 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법 | |
RU2007139918A (ru) | Кодирование многоканального аудио | |
KR102172279B1 (ko) | 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법 | |
KR20210151741A (ko) | 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치 | |
US8626515B2 (en) | Apparatus for processing media signal and method thereof | |
KR20130093783A (ko) | 오디오 객체 전송 장치 및 방법 | |
KR100636145B1 (ko) | 확장된 고해상도 오디오 신호 부호화 및 복호화 장치 | |
KR20130093798A (ko) | 다채널 신호 부호화 및 복호화 장치 및 방법 | |
KR101949756B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
KR20190031460A (ko) | 오디오 객체 전송 장치 및 방법 | |
KR20140017344A (ko) | 오디오 신호 처리 방법 및 장치 | |
KR102191260B1 (ko) | 다채널 오디오 코덱과 다객체 오디오 코덱을 이용한 오디오 부호화/복호화 장치 및 방법 | |
KR101950455B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
KR101949755B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
KR20100020889A (ko) | 오디오 신호 부호화/복호화 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X091 | Application refused [patent] | ||
J201 | Request for trial against refusal decision | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2019101000883; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20190315 Effective date: 20200408 |
|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
S601 | Decision to reject again after remand of revocation | ||
X091 | Application refused [patent] | ||
E902 | Notification of reason for refusal | ||
S601 | Decision to reject again after remand of revocation |