KR20140046980A - 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 - Google Patents

오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 Download PDF

Info

Publication number
KR20140046980A
KR20140046980A KR1020130102544A KR20130102544A KR20140046980A KR 20140046980 A KR20140046980 A KR 20140046980A KR 1020130102544 A KR1020130102544 A KR 1020130102544A KR 20130102544 A KR20130102544 A KR 20130102544A KR 20140046980 A KR20140046980 A KR 20140046980A
Authority
KR
South Korea
Prior art keywords
channel
descriptor
audio signal
audio
information
Prior art date
Application number
KR1020130102544A
Other languages
English (en)
Inventor
유재현
이태진
강경옥
카오루 와타나베
사토시 오오데
이쿠코 사와야
Original Assignee
한국전자통신연구원
닛폰호소쿄카이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 닛폰호소쿄카이 filed Critical 한국전자통신연구원
Priority to US14/434,484 priority Critical patent/US9836269B2/en
Priority to PCT/KR2013/009112 priority patent/WO2014058275A1/ko
Priority to JP2015536716A priority patent/JP6407155B2/ja
Priority to KR1020130121247A priority patent/KR102149411B1/ko
Publication of KR20140046980A publication Critical patent/KR20140046980A/ko
Priority to US15/803,464 priority patent/US10282160B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Stereophonic System (AREA)
  • Otolaryngology (AREA)

Abstract

오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법이 개시된다. 일실시예에 따른 오디오 데이터 재생 장치는 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호에 관한 디스크립터(descriptor)를 추출하고, 상기 추출한 디스크립터에 기초하여 상기 멀티 채널 오디오 신호를 재생할 수 있다. 디스크립터는 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함할 수 있다.

Description

오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법{APPARATUS AND METHOD FOR GENERATING AUDIO DATA, APPARATUS AND METHOD FOR PLAYING AUDIO DATA}
아래의 설명은 오디오 데이터를 생성하는 방법 및 오디오 데이터를 재생하는 방법에 관한 것이다.
최근, 3DTV나 UHDTV 등과 같은 차세대 TV 시스템 개발과 더불어 오디오 시스템에 대한 다양한 오디오 기술이 개발되고 있다. 이는 ITU-R Recommend BS.775에서 정의한 5.1채널 방식보다 많은 수의 라우드 스피커를 사용하는 멀티 채널 오디오 시스템에 대한 기술이다.
그러나, 최근 발표되는 멀티 채널 오디오 시스템들은 독자적인 방식으로 멀티 채널 오디오 신호를 표현하고 있기 때문에, 특정 오디오 기기를 이용하지 않으면 멀티 채널 오디오 신호를 제대로 재생할 수 없다는 문제점을 가지고 있다.
따라서, 다양한 멀티 채널 오디오 신호를 표현하면서 차세대 오디오 시스템에 적용이 가능한 멀티 채널 오디오 표현법 또는 기술법의 정의가 요구된다.
일실시예에 따른 오디오 데이터 재생 장치는, 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호에 관한 디스크립터(descriptor)를 추출하는 디스크립터 추출부; 및 상기 추출한 디스크립터에 기초하여 상기 멀티 채널 오디오 신호를 재생하는 재생부를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 디스크립터는 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 디스크립터는 사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 사운드 채널 디스크립터는 채널 라벨 디스크립터(channel label descriptors) 및 채널 위치 디스크립터(channel position descriptors) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 채널 라벨 디스크립터는 오디오 신호의 배치 순서(Allocation number), 오디오 채널의 라벨 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 오디오 채널의 라벨은 수평 채널 라벨(horizontal channel label), 수직 채널 라벨(vertical channel label), 거리 채널 라벨(distance channel label) 및 객체 채널 라벨(object channel label) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 채널 컴포넌트 객체의 타입은 채널 컴포넌트의 주파수 특성 정보(Nominal frequency range), 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 채널 위치 디스크립터는 오디오 신호의 배치 순서(allocation number), 공간 위치 데이터(spatial position data), 거리 위치 데이터(distance position data), 공간 위치의 허용 범위(tolerance of spatial position), 거리 위치의 허용 범위(tolerance of distance position) 및 채널 컴포넌트 객체의 타입 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 공간 위치 데이터는 오디오 신호가 재생되는 공간 상의 위치를 나타내는 방위각(azimuth angle) 및 앙각(elevation angle) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 공간 위치의 허용 범위에 관한 정보는 수평 방향의 허용 범위(horizontal tolerance), 수직 방향의 허용 범위(vertical tolerance) 및 재생 시간에 따른 음상 정위(moving information of time) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 거리 위치의 허용 범위에 관한 정보는 수평 방향의 허용 범위(horizontal tolerance), 수직 방향의 허용 범위(vertical tolerance) 및 재생 시간에 따른 음상 정위(moving information of time) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치에서, 상기 채널 컴포넌트 객체의 타입은 채널 컴포넌트의 주파수 특성 정보(Nominal frequency range) 및 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 장치는, 상기 디스크립터에 포함된 정보를 화면상에 표시하는 표시부를 더 포함할 수 있다.
일실시예에 따른 오디오 데이터 생성 장치는, 멀티 채널 오디오 신호를 표현하기 위한 디스크립터(descriptor)를 생성하는 디스크립터 생성부; 및 상기 디스크립터와 상기 멀티 채널 오디오 신호를 비트스트림으로 생성하는 비트스트림 생성부를 포함할 수 있다.
일실시예에 따른 오디오 데이터 생성 장치에서, 상기 비트스트림 생성부는 상기 디스크립터 및 상기 멀티 채널 오디오 신호를 부호화하고, 멀티플렉싱하여 비트스트림을 생성할 수 있다.
일실시예에 따른 오디오 데이터 생성 장치는, 상기 생성된 비트스트림을 오디오 데이터 재생 장치로 전송하는 전송부를 더 포함할 수 있다.
일실시예에 따른 오디오 데이터 재생 방법은, 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호에 관한 디스크립터(descriptor)를 추출하는 단계; 및 상기 추출한 디스크립터에 기초하여 상기 멀티 채널 오디오 신호를 재생하는 단계를 포함할 수 있고, 상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함할 수 있다.
일실시예에 따른 오디오 데이터 생성 방법은, 멀티 채널 오디오 신호를 표현하기 위한 디스크립터(descriptor)를 생성하는 단계; 및 상기 디스크립터와 상기 멀티 채널 오디오 신호를 비트스트림으로 생성하는 단계를 포함할 수 있고, 상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함할 수 있다.
도 1은 일실시예에 따른 생성된 오디오 데이터를 재생하는 동작을 설명하기 위한 도면이다.
도 2는 일실시예에 따른 오디오 데이터 생성 장치의 세부 구성을 도시한 도면이다.
도 3은 일실시예에 따른 오디오 데이터 재생 장치의 세부 구성을 도시한 도면이다.
도 4는 일실시예에 따른 오디오 데이터를 생성하는 일례를 설명하기 위한 도면이다.
도 5는 일실시예에 따른 오디오 데이터를 재생하는 일례를 설명하기 위한 도면이다.
도 6은 일실시예에 따른 오디오 데이터 생성 방법의 동작을 도시한 흐름도이다.
도 7는 일실시예에 따른 오디오 데이터 재생 방법의 동작을 도시한 흐름도이다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 아래의 특정한 구조적 내지 기능적 설명들은 단지 발명의 실시예들을 설명하기 위한 목적으로 예시된 것으로, 발명의 범위가 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 안된다. 일실시예에 따른 오디오 데이터 생성 방법은 오디오 데이터 생성 장치에 의해 수행될 수 있고, 오디오 데이터 재생 방법은 오디오 데이터 재생 장치에 의해 수행될 수 있다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 일실시예에 따른 생성된 오디오 데이터를 재생하는 동작을 설명하기 위한 도면이다.
도 1을 참조하면, 오디오 데이터 생성 장치(110)는 멀티 채널 오디오 신호를 포함하는 오디오 데이터를 생성할 수 있다. 멀티 채널 오디오 신호는 채널기반 오디오 신호 및 객체기반 오디오 신호를 포함할 수 있다. 예를 들어, 멀티 채널 오디오 신호는 10.2 채널, 22.2 채널 등의 멀티 채널 음향 콘텐츠를 나타낼 수 있다. 오디오 데이터 생성 장치(110)는 오디오 데이터, 오디오 데이터를 재생하는데 필요한 메타데이터(metadata)를 비트스트림으로 생성할 수 있다. 메타데이터는 멀티 채널 오디오 신호를 표현할 수 있는 디스크립터(descriptor)를 포함할 수 있다. 디스크립터는 멀티 채널 오디오 신호에 포함된 오디오 신호의 재생 위치 등에 관한 정보를 포함할 수 있다. 디스크립터는 어떠한 오디오 채널이 어떤 위치에서 재생되는지를 나타내는 정보 등을 포함할 수 있다. 오디오 데이터 생성 장치(110)는 생성된 비트스트림을 오디오 데이터 재생 장치(120)에 전송할 수 있다.
오디오 데이터 재생 장치(120)는 비트스트림으로부터 멀티 채널 오디오 신호 및 메타데이터를 추출할 수 있다. 오디오 데이터 재생 장치(120)는 메타데이터에 포함된 디스크립터에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 예를 들어, 오디오 데이터 재생 장치(120)는 디스크립터에 포함된 재생 정보에 기초하여 멀티 채널 오디오 신호를 렌더링(rendering)할 수 있다. 오디오 데이터 재생 장치(120)는 오디오 데이터 재생 장치(120)의 재생 환경에 기초하여 멀티 채널 오디오 신호를 믹싱하고, 믹싱된 멀티 채널 오디오 신호를 재생할 수 있다.
도 2는 일실시예에 따른 오디오 데이터 생성 장치(210)의 세부 구성을 도시한 도면이다.
도 2를 참조하면, 오디오 데이터 생성 장치(210)는 디스크립터 생성부(220) 및 비트스트림 생성부(230)를 포함할 수 있다. 오디오 데이터 생성 장치(210)는 전송부(240)를 더 포함할 수도 있다.
디스크립터 생성부(220)는 멀티 채널 오디오 신호를 표현하기 위한 디스크립터를 생성할 수 있다. 디스크립터는 멀티 채널 오디오 신호에 포함된 오디오 신호의 재생 위치에 관한 정보 등을 포함할 수 있다. 생성된 디스크립터는 메타데이터를 이용하여 멀티 채널 오디오 포맷 신호의 헤더에 저장되거나 또는 멀티 채널 오디오 신호를 구성하는 각각의 오디오 채널의 각 헤더에 저장될 수 있다. 메타데이터는 활용성에 의해 몇 가지로 구분할 수 있는데, 멀티 채널 음향 콘텐츠를 구성, 교환하는 데에 적용될 수 있는 것을 basic structure라 정의한다. 예를 들어, basic structure descriptor는 멀티 채널 음향 콘텐츠(complete mix)의 제작, 교환에 이용될 수 있다.
이하, 일실시예에 따른 디스크립터의 basic structure를 설명하도록 한다
디스크립터에서 사용되는 용어들은 다음의 표 1과 같이 정의할 수 있다.
Terms Description
Sound Channel 재생되어야 할 각각의 음향채널 위치(방향)으로 구성된다.
재생 주파수의 레벨 특성, 공간 지향 특성(sound channel component object)를 포함한다.
여기에는 객체기반 오디오 신호도 포함된다.
Type of Sound Channel Component Object 각각의 음향 채널 신호 성분(재생 주파수 레벨 특성, 공간지향특성)을 나타낸다.
Sound-field configuration 하나의 음향 공간을 재현하는데 필요한 채널 배치를 나타낸다.
Sound-field Sound field configuration에 의해 구축되는 음향 공간을 나타낸다.
Sound Essence TV/라디오 프로그램의 사운드를 나타낸다.
사운드 에센스(Sound Essence)는 프로그램에 관한 표현, 음장(Sound-field)에 관한 표현(또는, 명칭), 그 외 관련되는 정보를 기술한다. Sound-field는 계층적인 구성을 가지는 Sound-field configuration에 의해 표현될 수 있다. Sound-field configuration은 복수 개의 Sound Channel들로 구성될 수 있다. Sound channel은 채널 라벨(Channel label) 및 채널 위치(Channel position) 중 적어도 하나에 의한 표현으로 기술될 수 있다. 디스크립터 생성부(220)는 멀티 채널 음향 콘텐츠가 교환되는 다양한 시나리오에 따라 필요한 디스크립터를 선택할 수 있다.
디스크립터는 사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함할 수 있다.
사운드 에센스 디스크립터는 프로그램 이름(program name), 사운드 에센스의 타입(type of sound essence), 사운드 필드 구성의 이름(name of sound-field configuration), 및 소리 크기 값(loudness value) 중 적어도 하나에 관한 정보를 포함할 수 있다.
일실시예에 따른 사운드 에센스 디스크립터의 구성은 다음의 표 2와 같이 나타낼 수 있다.
Name of Descriptor Subject of Description example
Program name - Program title Programme Title
Type of Sound essence (Sound-field) - Name of Type and Content of Sound essence Complete mix
Name of Sound-field configuration - Name of defined multichannel sound arrangement or configuration 22.2ch, 10.2ch, etc.
Loudness value - Loudness value
사운드 필드 구성 디스크립터는 사운드 필드 구성의 이름(name of sound-field configuration), 오디오 채널의 개수(the number of audio channels), 멀티 채널 오디오 신호의 배열(multichannel sound arrangement description), 오디오 채널의 할당(list of channel allocation), 다운믹싱 계수(down-mixing coefficient) 중 적어도 하나에 관한 정보를 포함할 수 있다. 사운드 필드 구성 디스크립터는 멀티 채널 배열 데이터(multichannel arrangement data)를 기술할 수 있다.
일실시예에 따른 사운드 필드 구성 디스크립터의 구성은 다음의 표 3와 같이 나타낼 수 있다.
Name of Descriptor Subject of Description example
Name of Sound-field configuration - Name of defined multichannel sound arrangement 22.2ch, 10.2ch, etc.
The number of channels - The total number of channel 24 channels, 12 channels
Multichannel sound arrangement description - Numbers of horizontal and/or vertical channels middle:10, front:5,side:2,back:3,
top:9, front:3,side:3,back:3,
bottom:3, front:3,side:0,back:0,
LFE:2
List of channel allocation - Mapping of channel allocation 1: Mid_L, 2: Mid_R, 3: Mid_C, 4: LFE 5: Mid_LS, 6: Mid_RS,
Down-mixing coefficient - Coefficients in order to down mix to conventional Sound-field (5.1ch, 2ch or 1ch)
사운드 채널 디스크립터는 채널 라벨 디스크립터(channel label descriptors) 및 채널 위치 디스크립터(channel position descriptors) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 사운드 채널 디스크립터의 구성은 다음의 표 4와 같이 나타낼 수 있다.
Name of Descriptor Subject of Description example
Indicator of Sound Channel descriptor - Indicator of Channel label data and Channel position data 11: Channel label data [On] / Channel position data [On]
채널 라벨 디스크립터는 채널 라벨 데이터를 기술할 수 있다. 채널 라벨 디스크립터는 오디오 신호의 배치 순서(allocation number), 오디오 채널의 라벨(channel label) 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함할 수 있다.
오디오 채널의 라벨(Channel label)은 수평 채널 라벨(horizontal channel label), 수직 채널 라벨(vertical channel label), 거리 채널 라벨(distance channel label) 및 객체 채널 라벨(object channel label) 중 적어도 하나를 포함할 수 있다.
채널 컴포넌트 객체의 타입은 채널 컴포넌트의 주파수 특성 정보(Nominal frequency range), 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 채널 라벨 디스크립터의 구성은 다음의 표 5와 같이 나타낼 수 있다.
Name of Descriptor Subject of Description example
Allocation number - Allocation number 1: first channel, 2: second channel,
Channel label
(A label to indicate the intended channel for sound reproduction)
- Horizontal Channel label C: Center of screen, L: Left side of screen, Lc: Inner side on the left of the screen, Lw: Outer side on the left of screen
- Vertical Channel label Mid: Middle layer, Tp: Top layer (above the listener's ear height), Bt: Bottom layer (under the listener's ear height)
- Distance Channel label Near, Far
- Object Channel label Vocal, Piano, Drum, etc
Type (Characteristics) of channel component object - Nominal frequency Range Full: general channel, LFE: Low frequency effect channel
(Include channel label or other?)
- Type of channel component directivity / Direct / Diffuse / Surround
(Include channel label or other?)
- Moving Information Information for moving objects: (Time, position) information
채널 위치 디스크립터는 채널 위치 데이터를 기술할 수 있다. 채널 위치 디스크립터는 오디오 신호의 배치 순서(allocation number), 공간 위치 데이터(spatial position data), 거리 위치 데이터(distance position data), 공간 위치의 허용 범위(tolerance of spatial position), 거리 위치의 허용 범위(tolerance of distance position) 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함할 수 있다.
공간 위치 데이터는 오디오 신호가 재생되는 공간 상의 위치를 나타내는 방위각(azimuth angle) 및 앙각(elevation angle) 중 적어도 하나에 관한 정보를 포함할 수 있다.
거리 위치 데이터는 오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리를 나타낼 수 있다.
공간 위치의 허용 범위에 관한 정보는 수평 방향의 허용 범위(horizontal tolerance), 수직 방향의 허용 범위(vertical tolerance) 및 재생 시간에 따른 음상 정위(moving information of time) 중 적어도 하나에 관한 정보를 포함할 수 있다.
거리 위치의 허용 범위에 관한 정보는 오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나에 관한 정보를 포함할 수 있다.
채널 컴포넌트 객체의 타입은 채널 컴포넌트의 주파수 특성 정보(Nominal frequency range) 및 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 중 적어도 하나를 포함할 수 있다.
일실시예에 따른 채널 위치 디스크립터의 구성은 다음의 표 6와 같이 나타낼 수 있다.
Name of Descriptor Subject of Description example
Allocation number - Allocation number 1; first channel
Spatial position data - Azimuth angle 000:center of screen, 060: 60-degrees )
- Elevation angle 000:position of listener? ear height, 060: 60-degrees)
Distance position data - distance 3: 3meter
Tolerance of Spatial position - horizontal tolerance 10:±10 degrees, 15:±15 degrees
- vertical tolerance 10:±10 degrees, 15:±15 degrees
- Moving Information of time Information for moving objects: especially Time information
Tolerance of Distance position - distance 3: 3meter
- Moving Information of position Information for moving objects: especially Position information
Type (Characteristics) of channel component object - Nominal frequency Range Full: general channel, LFE: Low frequency effect channel
- Type of channel component directivity / Direct / Diffuse / Surround
다음은, 22.2 채널에서 멀티 채널 오디오 신호를 기술하기 위한 디스크립터 구성의 일례를 나타낸다.
<제1 실시예>
(A) Sound Essence descriptors
Figure pat00001
(B) Sound-field configuration descriptors
Figure pat00002
(C) Sound Channel descriptors
Figure pat00003
Figure pat00004
Figure pat00005
Figure pat00006
Figure pat00007
Figure pat00008

<제2 실시예>
(A) Sound Essence descriptors
Figure pat00009
(B) Sound-field configuration descriptors
Figure pat00010
(C) Sound Channel descriptors
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
위와 같은 디스크립터 기술 방법을 통해 차세대 멀티 채널 오디오 신호를 일반 가정이나 다른 국가, 스튜디오에서 UHDTV 등과 같은 차세대 A/V 시스템에서 활용할 수 있다.
비트스트림 생성부(230)는 디스크립터와 멀티 채널 오디오 신호를 비트스트림으로 생성할 수 있다. 비트스트림 생성부(230)는 디스크립터 멀티 채널 오디오 신호를 부호화하고, 멀티플렉싱하여 비트스트림을 생성할 수 있다.
전송부(240)는 생성된 비트스트림을 오디오 데이터 재생 장치로 전송할 수 있다.
도 3은 일실시예에 따른 오디오 데이터 재생 장치(310)의 세부 구성을 도시한 도면이다.
도 3을 참조하면, 오디오 데이터 재생 장치(310)는 디스크립터 추출부(320) 및 재생부(330)를 포함할 수 있다. 오디오 데이터 재생 장치(310)는 표시부(340)를 더 포함할 수도 있다.
디스크립터 추출부(320)는 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호에 관한 디스크립터를 추출할 수 있다. 디스크립터 추출부(320)는 멀티 채널 오디오 포맷 신호의 헤더 또는 멀티 채널 오디오 신호를 구성하는 각각의 오디오 채널의 헤더에서 디스크립터를 추출할 수 있다. 디스크립터는 멀티 채널 오디오 신호에 포함된 오디오 신호의 재생 위치에 관한 정보를 포함할 수 있다. 디스크립터는 사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함할 수 있다. 디스크립터에 관한 내용은 도 2와 관련하여 기재된 내용을 참고할 수 있다.
재생부(330)는 추출한 디스크립터에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 재생부(330)는 디스크립터에 기술된 멀티 채널 오디오 신호의 재생 정보에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 재생부(330)는 디스크립터에 포함된 재생 위치 정보에 기초하여 멀티 채널 오디오 신호에 포함된 각각의 오디오 신호를 렌더링할 수 있다.
재생부(330)는 오디오 데이터 재생 장치(310)의 재생 환경 정보에 기초하여 멀티 채널 오디오 신호를 다운믹싱(down-mixing)할 수 있다. 예를 들어, 재생부(330)는 22.2 채널로 믹싱된 오디오 데이터를 10.2 채널 환경의 오디오 데이터 재생 장치(310)에서 재생하기 위해 22.2 채널의 오디오 데이터를 10.2 채널의 오디오 데이터로 다운믹싱할 수 있다. 재생 환경 정보는 오디오 재생 장치의 채널 환경, 라우드스피커 배치 정보 등을 포함할 수 있다.
표시부(340)는 메타데이터 또는 디스크립터에 포함된 정보를 화면상에 표시할 수 있다. 예를 들어, 표시부(340)는 오디오 신호의 재생 위치 정보, 재생되고 있는 오디오 신호의 식별 정보 등을 표시할 수 있다.
도 4는 일실시예에 따른 오디오 데이터를 생성하는 일례를 설명하기 위한 도면이다.
오디오 데이터 생성 장치는 오디오 데이터를 수신하는 수신단에서 오디오 신호의 수정, 변환, 교환 등을 용이하게 수행할 수 있도록 basic structure의 디스크립터에 기초하여 오디오 데이터를 생성할 수 있다. 오디오 데이터 생성 장치는 디스크립터 정보를 멀티 채널 오디오 포맷 신호의 헤더 또는 멀티 채널을 구성하는 각각의 오디오 채널의 헤더에 저장시킨 뒤, 수신단에 전송할 수 있다.
일실시예에 따른 오디오 데이터 생성 장치는 믹싱부(420), 코딩부(460) 및 멀티플렉싱부(470)를 포함할 수 있다. 믹싱부(420)는 여러 오디오 소스들(audio sources)(410)을 믹싱(mixing)하여 채널기반 오디오 신호(430), 객체기반 오디오 신호(440)를 출력할 수 있다. 코딩부(460)는 디스크립터를 포함하는 메타데이터(450) 및 멀티 채널 오디오 신호를 코딩할 수 있다. 멀티 채널 오디오 신호는 채널기반 오디오 신호(430)뿐만 아니라 객체기반 오디오 신호(440)를 포함할 수 있다. 디스크립터는 멀티 채널의 구성을 표현하는 정보를 포함할 수 있다. 멀티 채널 코딩부(460)는 다양한 방식을 통해 오디오 신호와 디스크립터를 별도로 코딩하거나 또는 멀티 채널 오디오 신호와 디스크립터를 함께 코딩할 수 있다. 멀티플렉싱부(470)는 코딩된 멀티 채널 오디오 신호와 메타데이터(450)를 다중화하여 비트스트림을 생성할 수 있다.
도 5는 일실시예에 따른 오디오 데이터를 재생하는 일례를 설명하기 위한 도면이다.
오디오 데이터 재생 장치는 디멀티플렉싱(demultiplexing)부(510), 디코딩부(520), 렌더링부(560), 표시부(580)를 포함할 수 있다.
디멀티플렉싱부(510)는 수신한 비트스트림을 역다중화(demuxing)할 수 있다. 디코딩부(520)는 역다중화된 비트스트림을 디코딩하여 멀티 채널 오디오 신호와 메타데이터(550)를 렌더링부(560)에 출력할 수 있다. 멀티 채널 오디오 신호는 채널기반 오디오 신호(530), 객체기반 오디오 신호(540)를 포함할 수 있다. 렌더링부(560)는 메타데이터(550)에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 렌더링부(560)는 라우드스피커의 배치 정보 또는 객체기반 오디오 신호의 위치 정보 등에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 라우드스피커의 배치 정보, 객체기반 오디오 신호의 위치 정보는 사용자에 의해 오디오 데이터 재생 장치에 입력될 수 있다.
오디오 데이터 재생 장치의 재생 환경 정보(570)에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 오디오 데이터 재생 장치는 오디오 데이터 재생 장치의 재생 환경에 따라 원래의 멀티 채널 오디오 신호를 그대로 재생하거나 또는 멀티 채널 오디오 신호를 다운믹싱(down-mixing)할 수 있다. 멀티 채널 오디오 신호는 오디오 데이터 재생 장치의 재생 환경에 맞추어 재생될 수 있다.
오디오 데이터 재생 장치가 초기의 믹싱(mixing) 단계에서 22.2 채널로 제작된 신호가 재생 환경인 10.2 채널 구조에 맞추어 다운믹싱을 수행하는 방법의 일례는 아래의 표 7과 같이 나타낼 수 있다. Down-mixing coefficient descriptor는 이외에도 다양한 멀티채널 간의 변환을 기술할 수 있다.
10.2 채널의 신호 22.2 채널 신호의 조합
L FL + BtFL(-6dB) + FLc
C FC + BtFC(-6dB)
R FR + BtFR(-6dB) + FRc
LS -3dB(TpSiL+ SiL) + TpC(-3dB)
RS -3dB(TpSiR+ SiR) + TpC(-3dB)
LB BL + BC(-3dB)
RB BR + BC(-3dB)
LH TpFL+ TpFC(-3.5dB)
RH TpFR+TpFC(-3.5dB)
CH -3dB(TpBL + TpBR) + TpBC
LFE1 LFE1
LFE2 LFE2
렌더링부(560)는 멀티 채널 오디오 신호를 구성하는 오디오 신호들은 디스크립터의 Channel position data에 정의된 대로, allocation number에 따라 채널 순서대로 Spatial position data에 제시된 Azimuth angle과 Elevation angle 정보에 기초하여 재생될 수 있다. 렌더링부(560)는 Type of channel component object의 Moving Information(또는, Tolerance of Spatial position 의 Moving Information of time 이나 Moving Information of position)에 기술되어 있는 콘텐츠 재생 시간에 따른 음상 정위 정보에 기초하여 객체기반 오디오 신호를 재생할 수 있다. 일례에 따르면, 사용자는 임의로 객체기반 오디오 신호가 렌더링되는 공간상의 위치를 제어할 수 있다.
표시부(580)는 디스크립터에 기술된 정보를 화면상에 디스플레이할 수 있다. 사용자는 디스크립터의 Tolerance of Spatial position 정보를 통해 최적의 재생 위치에 비해 본인의 스피커 배치 등의 환경이 얼마나 유동적인지를 확인할 수 있고, 디스크립터의 Channel label 정보를 통해 개별 채널들의 이름 정보를 확인할 수도 있다. 멀티 채널 오디오 신호에 객체기반 오디오 신호가 포함되어 있는 경우, 사용자는 Channel label의 Object Channel label을 통해 해당 객체기반 오디오 신호가 어떤 소리의 정보인지를 확인할 수 있다.
도 6은 일실시예에 따른 오디오 데이터 생성 방법의 동작을 도시한 흐름도이다.
단계(610)에서, 오디오 데이터 생성 장치는 멀티 채널 오디오 신호를 표현하기 위한 디스크립터를 생성할 수 있다. 디스크립터는 멀티 채널 오디오 신호에 포함된 오디오 신호의 재생 위치에 관한 정보를 포함할 수 있다. 오디오 데이터 생성 장치는 생성된 디스크립터를 메타데이터를 이용하여 멀티 채널 오디오 포맷 신호의 헤더에 저장하거나 또는 멀티 채널 오디오 신호를 구성하는 각각의 오디오 채널의 각 헤더에 저장할 수 있다. 디스크립터는 사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함할 수 있다.
단계(620)에서, 오디오 데이터 생성 장치는 디스크립터와 멀티 채널 오디오 신호를 비트스트림으로 생성할 수 있다. 오디오 데이터 생성 장치는 디스크립터 멀티 채널 오디오 신호를 부호화하고, 멀티플렉싱하여 비트스트림을 생성할 수 있다.
단계(630)에서, 오디오 데이터 생성 장치는 생성된 비트스트림을 오디오 데이터 재생 장치로 전송할 수 있다.
도 7는 일실시예에 따른 오디오 데이터 재생 방법의 동작을 도시한 흐름도이다.
단계(710)에서, 오디오 데이터 재생 장치는 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호를 표현하기 위한 디스크립터를 추출할 수 있다. 오디오 데이터 재생 장치는 멀티 채널 오디오 포맷 신호의 헤더 또는 멀티 채널 오디오 신호를 구성하는 각각의 오디오 채널의 헤더에서 디스크립터를 추출할 수 있다.
단계(720)에서, 오디오 데이터 재생 장치는 추출한 디스크립터에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 오디오 데이터 재생 장치는 디스크립터에 기술된 멀티 채널 오디오 신호의 재생 정보에 기초하여 멀티 채널 오디오 신호를 재생할 수 있다. 오디오 데이터 재생 장치는 디스크립터에 포함된 재생 위치 정보에 기초하여 멀티 채널 오디오 신호에 포함된 각각의 오디오 신호를 렌더링할 수 있다. 오디오 데이터 재생 장치는 오디오 재생 장치의 채널 환경, 라우드스피커 배치 정보 등과 같은 재생 환경 정보에 따라 멀티 채널 오디오 신호를 다운믹싱할 수 있다.
일실시예에 따르면, 오디오 데이터 재생 장치는 메타데이터 또는 디스크립터에 포함된 정보를 화면상에 표시할 수 있다. 오디오 데이터 재생 장치는 오디오 신호의 재생 위치 정보, 재생되고 있는 오디오 신호의 식별 정보 등을 표시할 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
110: 오디오 데이터 생성 장치
120: 오디오 데이터 재생 장치

Claims (30)

  1. 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호에 관한 디스크립터(descriptor)를 추출하는 디스크립터 추출부; 및
    상기 추출한 디스크립터에 기초하여 상기 멀티 채널 오디오 신호를 재생하는 재생부를 포함하고,
    상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  2. 제1항에 있어서,
    상기 디스크립터는,
    사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  3. 제2항에 있어서,
    상기 사운드 채널 디스크립터는,
    채널 라벨 디스크립터(channel label descriptors) 및 채널 위치 디스크립터(channel position descriptors) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  4. 제3항에 있어서,
    상기 채널 라벨 디스크립터는,
    오디오 신호의 배치 순서(allocation number), 오디오 채널의 라벨(channel label) 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  5. 제4항에 있어서,
    상기 오디오 채널의 라벨은,
    수평 채널 라벨(horizontal channel label), 수직 채널 라벨(vertical channel label), 거리 채널 라벨(distance channel label) 및 객체 채널 라벨(object channel label) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  6. 제4항에 있어서,
    상기 채널 컴포넌트 객체의 타입은,
    채널 컴포넌트의 주파수 특성 정보(Nominal frequency range), 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  7. 제3항에 있어서,
    상기 채널 위치 디스크립터는,
    오디오 신호의 배치 순서(allocation number), 공간 위치 데이터(spatial position data), 거리 위치 데이터(distance position data), 공간 위치의 허용 범위(tolerance of spatial position), 거리 위치의 허용 범위(tolerance of distance position) 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  8. 제7항에 있어서,
    상기 공간 위치 데이터는,
    오디오 신호가 재생되는 공간 상의 위치를 나타내는 방위각(azimuth angle) 및 앙각(elevation angle) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  9. 제7항에 있어서,
    상기 거리 위치 데이터는,
    오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리를 나타내는 것을 특징으로 하는 오디오 데이터 재생 장치.
  10. 제7항에 있어서,
    상기 공간 위치의 허용 범위에 관한 정보는,
    수평 방향의 허용 범위(horizontal tolerance), 수직 방향의 허용 범위(vertical tolerance) 및 재생 시간에 따른 음상 정위(moving information of time) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  11. 제7항에 있어서,
    상기 거리 위치의 허용 범위에 관한 정보는,
    오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  12. 제7항에 있어서,
    상기 채널 컴포넌트 객체의 타입은,
    채널 컴포넌트의 주파수 특성 정보(Nominal frequency range) 및 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  13. 제2항에 있어서,
    상기 사운드 에센스 디스크립터는,
    프로그램 이름(program name), 사운드 에센스의 타입(type of sound essence), 사운드 필드 구성의 이름(name of sound-field configuration), 및 소리 크기 값(loudness value) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  14. 제2항에 있어서,
    상기 사운드 필드 구성 디스크립터는,
    사운드 필드 구성의 이름(name of sound-field configuration), 오디오 채널의 개수(the number of audio channels), 멀티 채널 오디오 신호의 배열(multichannel sound arrangement description), 오디오 채널의 할당(list of channel allocation), 다운믹싱 계수(down-mixing coefficient) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  15. 제1항에 있어서,
    상기 디스크립터 추출부는,
    상기 멀티 채널 오디오 포맷 신호의 헤더(header) 또는 상기 멀티 채널 오디오 신호를 구성하는 각각의 오디오 채널의 헤더에서 디스크립터를 추출하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  16. 제1항에 있어서,
    상기 재생부는,
    상기 디스크립터에 포함된 재생 위치 정보에 기초하여 상기 멀티 채널 오디오 신호에 포함된 각각의 오디오 신호를 렌더링하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  17. 제1항에 있어서,
    상기 재생부는,
    오디오 데이터 재생 장치의 재생 환경 정보에 기초하여 상기 멀티 채널 오디오 신호를 다운믹싱(down-mixing)하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  18. 제1항에 있어서,
    상기 디스크립터에 포함된 정보를 화면상에 표시하는 표시부
    를 더 포함하는 것을 특징으로 하는 오디오 데이터 재생 장치.
  19. 멀티 채널 오디오 신호를 표현하기 위한 디스크립터(descriptor)를 생성하는 디스크립터 생성부; 및
    상기 디스크립터와 상기 멀티 채널 오디오 신호를 비트스트림으로 생성하는 비트스트림 생성부를 포함하고,
    상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  20. 제19항에 있어서,
    상기 디스크립터는,
    사운드 에센스 디스크립터(sound essence descriptors), 사운드 필드 구성 디스크립터(sound-field configuration descriptors), 및 사운드 채널 디스크립터(sound channel descriptors) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  21. 제19항에 있어서,
    상기 디스크립터는,
    공간 위치 데이터(spatial position data), 거리 위치 데이터(distance position data), 공간 위치의 허용 범위(tolerance of spatial position), 거리 위치의 허용 범위(tolerance of distance position) 및 채널 컴포넌트 객체의 타입(type of channel component object) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  22. 제21항에 있어서,
    상기 공간 위치 데이터는,
    오디오 신호가 재생되는 공간 상의 위치를 나타내는 방위각(azimuth angle) 및 앙각(elevation angle) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  23. 제21항에 있어서,
    상기 거리 위치 데이터는,
    오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리를 나타내는 것을 특징으로 하는 오디오 데이터 생성 장치.
  24. 제21항에 있어서,
    상기 공간 위치의 허용 범위에 관한 정보는,
    수평 방향의 허용 범위(horizontal tolerance), 수직 방향의 허용 범위(vertical tolerance) 및 재생 시간에 따른 음상 정위(moving information of time) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  25. 제21항에 있어서,
    상기 거리 위치의 허용 범위에 관한 정보는,
    오디오 재생 공간의 중심으로부터 오디오 신호가 재생되는 공간 상의 위치까지의 거리 및 움직임이 있는 객체에 대한 정보(Moving information) 중 적어도 하나에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  26. 제21항에 있어서,
    상기 채널 컴포넌트 객체의 타입은,
    채널 컴포넌트의 주파수 특성 정보(Nominal frequency range) 및 채널 컴포넌트의 방향성 정보(Type of channel component directivity) 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  27. 제19항에 있어서,
    상기 비트스트림 생성부는,
    상기 디스크립터, 상기 멀티 채널 오디오 신호를 부호화하고, 멀티플렉싱하여 비트스트림을 생성하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  28. 제19항에 있어서,
    상기 생성된 비트스트림을 오디오 데이터 재생 장치로 전송하는 전송부
    를 더 포함하는 것을 특징으로 하는 오디오 데이터 생성 장치.
  29. 오디오 데이터 생성 장치에 의해 생성된 비트스트림으로부터 멀티 채널 오디오 신호를 표현하기 위한 디스크립터(descriptor)를 추출하는 단계; 및
    상기 추출한 디스크립터에 기초하여 상기 멀티 채널 오디오 신호를 재생하는 단계를 포함하고,
    상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 재생 방법.
  30. 멀티 채널 오디오 신호를 표현하기 위한 디스크립터(descriptor)를 생성하는 단계; 및
    상기 디스크립터와 상기 멀티 채널 오디오 신호를 비트스트림으로 생성하는 단계를 포함하고,
    상기 디스크립터는, 상기 멀티 채널 오디오 신호에 포함된 오디오 신호에 관한 정보를 포함하는 것을 특징으로 하는 오디오 데이터 생성 방법.
KR1020130102544A 2012-10-11 2013-08-28 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 KR20140046980A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US14/434,484 US9836269B2 (en) 2012-10-11 2013-10-11 Device and method for generating audio data, and device and method for playing audio data
PCT/KR2013/009112 WO2014058275A1 (ko) 2012-10-11 2013-10-11 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
JP2015536716A JP6407155B2 (ja) 2012-10-11 2013-10-11 オーディオデータ生成装置及びオーディオデータ再生装置
KR1020130121247A KR102149411B1 (ko) 2012-10-11 2013-10-11 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US15/803,464 US10282160B2 (en) 2012-10-11 2017-11-03 Apparatus and method for generating audio data, and apparatus and method for playing audio data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020120112984 2012-10-11
KR20120112984 2012-10-11

Publications (1)

Publication Number Publication Date
KR20140046980A true KR20140046980A (ko) 2014-04-21

Family

ID=50653786

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020130102544A KR20140046980A (ko) 2012-10-11 2013-08-28 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR1020130121247A KR102149411B1 (ko) 2012-10-11 2013-10-11 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020130121247A KR102149411B1 (ko) 2012-10-11 2013-10-11 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Country Status (3)

Country Link
US (2) US9836269B2 (ko)
JP (1) JP6407155B2 (ko)
KR (2) KR20140046980A (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140046980A (ko) 2012-10-11 2014-04-21 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US10075796B2 (en) * 2013-10-04 2018-09-11 Sony Corporation File generation device, file generation method, file reproduction device, and file reproduction method
CN105992120B (zh) * 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
WO2017209196A1 (ja) * 2016-05-31 2017-12-07 シャープ株式会社 スピーカシステム、音声信号レンダリング装置およびプログラム
US11064453B2 (en) * 2016-11-18 2021-07-13 Nokia Technologies Oy Position stream session negotiation for spatial audio applications
KR101964359B1 (ko) 2017-11-14 2019-04-01 네오컨버전스 주식회사 딥러닝용 오디오 데이터 생성방법 및 장치
KR102556092B1 (ko) 2018-03-20 2023-07-18 한국전자통신연구원 지향성 마이크를 이용한 음향 이벤트 검출 방법, 그리고 지향성 마이크를 이용한 음향 이벤트 검출 장치
US11540075B2 (en) 2018-04-10 2022-12-27 Gaudio Lab, Inc. Method and device for processing audio signal, using metadata

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59100677A (ja) * 1982-11-30 1984-06-09 Victor Co Of Japan Ltd 多重記録方式及び多重記録再生方式
IL134979A (en) * 2000-03-09 2004-02-19 Be4 Ltd A system and method for optimizing three-dimensional hearing
DE10355146A1 (de) * 2003-11-26 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Tieftonkanals
US8116465B2 (en) * 2004-04-28 2012-02-14 Sony Corporation Measuring apparatus and method, and recording medium
WO2006004048A1 (ja) * 2004-07-06 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
KR101118214B1 (ko) * 2004-09-21 2012-03-16 삼성전자주식회사 청취 위치를 고려한 2채널 가상 음향 재생 방법 및 장치
US7928311B2 (en) * 2004-12-01 2011-04-19 Creative Technology Ltd System and method for forming and rendering 3D MIDI messages
JP4466453B2 (ja) * 2005-04-26 2010-05-26 ソニー株式会社 音響装置、時間遅延算出方法および時間遅延算出プログラム
JP5006315B2 (ja) 2005-06-30 2012-08-22 エルジー エレクトロニクス インコーポレイティド オーディオ信号のエンコーディング及びデコーディング方法及び装置
EP1932147A4 (en) 2005-08-30 2011-03-30 Lg Electronics Inc AUDIO SIGNAL DECODING METHOD
BRPI0715312B1 (pt) * 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
EP2595148A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for coding multi-object audio signals
JP5232795B2 (ja) * 2007-02-14 2013-07-10 エルジー エレクトロニクス インコーポレイティド オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置
KR101336237B1 (ko) * 2007-03-02 2013-12-03 삼성전자주식회사 멀티 채널 스피커 시스템의 멀티 채널 신호 재생 방법 및장치
KR101049144B1 (ko) 2007-06-08 2011-07-18 엘지전자 주식회사 오디오 신호 처리방법 및 장치
EP2227299B1 (en) * 2007-09-07 2012-07-18 Edh Us Llc Methods and processes for detecting a mark on a playing surface and for tracking an object
KR101003415B1 (ko) 2007-10-17 2010-12-23 엘지전자 주식회사 Dmb 신호의 디코딩 방법 및 이의 디코딩 장치
US8155971B2 (en) 2007-10-17 2012-04-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoding of multi-audio-object signal using upmixing
KR101435815B1 (ko) 2007-11-28 2014-08-29 엘지전자 주식회사 방송 시스템 및 오디오 데이터 처리 방법
TWI455064B (zh) 2007-12-20 2014-10-01 Thomson Licensing 聲影文件突起映圖之決定方法和裝置
US20090238371A1 (en) * 2008-03-20 2009-09-24 Francis Rumsey System, devices and methods for predicting the perceived spatial quality of sound processing and reproducing equipment
KR101596504B1 (ko) * 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
EP2194527A3 (en) * 2008-12-02 2013-09-25 Electronics and Telecommunications Research Institute Apparatus for generating and playing object based audio contents
JP5635097B2 (ja) * 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
EP2485644B1 (en) * 2009-10-09 2016-08-24 Auckland Uniservices Limited Tinnitus treatment system and method
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
KR20120048312A (ko) * 2010-11-05 2012-05-15 삼성전자주식회사 모바일 장치 및 그 제어방법
KR20120071072A (ko) 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9245514B2 (en) * 2011-07-28 2016-01-26 Aliphcom Speaker with multiple independent audio streams
CN102595317B (zh) * 2012-02-27 2015-11-18 歌尔声学股份有限公司 一种通讯信号自适配传输方法和***
KR20140046980A (ko) * 2012-10-11 2014-04-21 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법

Also Published As

Publication number Publication date
KR102149411B1 (ko) 2020-08-31
US20150281842A1 (en) 2015-10-01
US10282160B2 (en) 2019-05-07
JP6407155B2 (ja) 2018-10-17
JP2015534656A (ja) 2015-12-03
US20180060019A1 (en) 2018-03-01
KR20140047005A (ko) 2014-04-21
US9836269B2 (en) 2017-12-05

Similar Documents

Publication Publication Date Title
RU2741738C1 (ru) Система, способ и постоянный машиночитаемый носитель данных для генерирования, кодирования и представления данных адаптивного звукового сигнала
KR102149411B1 (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US7912566B2 (en) System and method for transmitting/receiving object-based audio
CN101981617B (zh) 多对象音频信号的附加信息比特流产生方法和装置
CN104982042B (zh) 多信道音频信号处理装置及方法
EP3131313B1 (en) Method and apparatus for rendering sound signal, and computer-readable recording medium
KR20080082924A (ko) 오디오 신호의 처리 방법 및 장치
KR101682323B1 (ko) 음향 신호 기술 방법, 음향 신호 생성 장치 및 음향 신호 재생 장치
KR101915258B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102370672B1 (ko) 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치
KR20150028147A (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
KR102370348B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102220521B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102421292B1 (ko) 오디오 객체 신호 재생 시스템 및 그 방법
KR20220030983A (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
Lee et al. Hybrid immersive audio architecture based on 3D object layer
KR20180121452A (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
JP2020120377A (ja) オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法
KR20140128561A (ko) 사용자의 재생 채널 환경에 따른 선택적 객체 복호화 방법
KR20140128562A (ko) 사용자의 재생 채널의 위치에 따른 객체 신호 복호화 방법
KR20140128181A (ko) 예외 채널 신호의 렌더링 방법
KR20140128182A (ko) 예외 채널 근방의 객체 신호의 렌더링 방법