KR101755531B1 - 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 - Google Patents

오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 Download PDF

Info

Publication number
KR101755531B1
KR101755531B1 KR1020127025099A KR20127025099A KR101755531B1 KR 101755531 B1 KR101755531 B1 KR 101755531B1 KR 1020127025099 A KR1020127025099 A KR 1020127025099A KR 20127025099 A KR20127025099 A KR 20127025099A KR 101755531 B1 KR101755531 B1 KR 101755531B1
Authority
KR
South Korea
Prior art keywords
decoding
matrix
sound field
mode matrix
panning
Prior art date
Application number
KR1020127025099A
Other languages
English (en)
Other versions
KR20130031823A (ko
Inventor
요한-마커스 바트케
플로리안 케일러
요하네스 보엠
Original Assignee
돌비 인터네셔널 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비 filed Critical 돌비 인터네셔널 에이비
Publication of KR20130031823A publication Critical patent/KR20130031823A/ko
Application granted granted Critical
Publication of KR101755531B1 publication Critical patent/KR101755531B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

예컨대 앰비소닉스와 같은 사운드필드 신호는 원하는 사운드필드의 표현을 갖고 있다. 앰비소닉스 포맷은 사운드필드의 구면 고조파 분해에 바탕을 두고 있으며, 고차 앰비소닉스(HOA)는 적어도 2차의 구면 고조파를 이용한다. 그러나, 일반적으로 이용되는 확성기 설정은 불규칙적이며 디코더 설계 시에 문제가 된다. 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법은 복수의 확성기 의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하는 단계(110), 상기 확성기 위치들로부터 모드 행렬(
Figure 112012077847932-pct00058
)을 산출하는 단계(120), 의사 역모드 행렬(
Figure 112012077847932-pct00059
)을 산출하는 단계(130), 및 상기 오디오 사운드필드 표현을 디코딩하는 단계(140)를 포함한다. 상기 디코딩은 상기 패닝 함수(W)와 상기 의사 역모드 행렬(
Figure 112012077847932-pct00060
)로부터 구한 디코드 행렬(D)에 기초한다.

Description

오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치{METHOD AND DEVICE FOR DECODING AN AUDIO SOUNDFIELD REPRESENTATION FOR AUDIO PLAYBACK}
본 발명은 오디오 재생을 위한 오디오 사운드필드 표현, 특히 앰비소닉스 포맷 오디오 표현을 디코딩하는 방법 및 장치에 관한 것이다.
이 절에서는 하기에서 설명 및/또는 권리청구되는 본 발명의 여러 가지 양상에 관련될 수 있는 기술의 여러 가지 양상을 독자에게 소개하고자 한다. 이 설명은 본 발명의 여러 가지 양상을 더 잘 이해할 수 있도록 하는 배경 정보를 독자에게 제공하는 데 도움이 될 것으로 생각한다. 따라서, 이 설명은 소스가 명시적으로 언급되지 않는 한, 이러한 견지에서 파악되어야 하며, 종래 기술을 인정하는 것으로 이해되어서는 안 된다는 것을 알아야 한다.
정확한 로컬라이제이션(localization)은 임의의 공간적 오디오 재생 시스템의 핵심적인 목표이다. 그와 같은 재생 시스템은 화상회의 시스템, 게임, 또는 기타 여러 가지 3D 사운드로 득을 보는 가상 환경에 매우 잘 적용될 수 있다. 3D 사운드 장면은 자연스러운 사운드필드로서 합성되거나 캡쳐될 수 있다. 예컨대 앰비소닉스와 같은 사운드필드 신호는 원하는 사운드필드의 표현을 갖고 있다. 앰비소닉스 포맷은 사운드필드의 구면 고조파 분해(spherical harmonic decomposition)에 바탕을 두고 있다. 기본 앰비소닉스 포맷, 즉 B-포맷은 차수가 제로 또는 1인 구면 고조파를 이용하지만, 소위 고차 앰비소닉스(Higher Order Ambisonics: HOA)는 또한 적어도 2차의 구면 고조파를 더 이용한다. 개별적인 확성기 신호를 얻기 위해서는 디코딩 프로세스가 필요하다. 오디오 장면을 합성하려면, 특정 사운드 소스의 공간적 로컬라이제이션을 얻기 위해서 공간적 확성기 배치를 지시하는 패닝(panning) 함수가 필요하다. 자연스러운 사운드필드가 녹화되기 위해서는 공간 정보를 캡쳐하는 마이크로폰 어레이가 필요하다. 공지의 앰비소닉스 방식은 이를 달성할 수 있는 매우 적합한 도구이다. 앰비소닉스 포맷 신호는 원하는 사운드필드의 표현을 갖고 있다. 그와 같은 앰비소닉스 포맷 신호로부터 개별적인 확성기 신호를 얻기 위해서는 디코딩 프로세스가 필요하다. 이 경우에도 패닝 함수가 디코딩 함수로부터 유도될 수 있기 때문에, 패닝 함수는 공간적 로컬라이제이션 업무를 기술하는 데 있어 핵심적인 문제이다. 확성기의 공간적 배치는 여기서는 확성기 설정이라고 한다.
일반적으로 이용되는 확성기 설정은 2개의 확성기를 이용하는 스테레오 설정, 5개의 확성기를 이용하는 표준 서라운드 설정, 5개 초과의 확성기를 이용하는 확장된 서라운드 설정이다. 이들 설정은 공지되어 있다. 그러나, 이들은 2차원(2D)에 한정된다. 예컨대, 높이 정보는 재생되지 않는다.
3차원(3D) 재생을 위한 확성기 설정은 예컨대 「"Wide listening area with exceptional spatial sound quality of a 22.2 multichannel sound system", K. Hamasaki, T. Nishiguchi, R. Okumaura, and Y. Nakayama in Audio Engineering Society Preprints, Vienna, Austria, May 2007」(이것은 22.2 format, 즉 2+2+2 arrangement of Dabringhaus(mdg-musikproduktion dabringhaus und grimm, www.mdg.de)를 가진 NHK 초고해상 TV에 대한 제안서임)과, 「10.2 setup in "Sound for Film and Television", T. Holman in 2nd ed. Boston: Focal Press, 2002」에 기재되어 있다. 공간 재생과 패닝 전략을 지시하는 몇 가지 공지의 시스템들 중 하나는 「"Virtual sound source positioning using vector base amplitude panning," Journal of Audio Engineering Society, vol. 45, no. 6, pp. 456-466, June 1997」(여기에서, Pulkki라 함)에서의 벡터 베이스 진폭 패닝(VBAP) 방식이다. Pulkki는 VBAP(Vector Base Amplitude Panning)를 이용하여 임의의 확성기 설정을 가지고 가상 음향 소스를 재생하였다. 가상 소스를 2D 평면에 배치하기 위해서는 한쌍의 확성기가 필요한 반면에, 3D 경우에는 3중의 확성기가 필요하다. 각 가상 소스에 있어서, (가상 소스의 위치에 따라서) 이득이 서로 다른 모노포닉 신호가 전체 설정 중에서 선택된 확성기에 공급된다. 그런 다음에, 모든 가상 소스에 대한 확성기 신호가 합산된다. VBAP는 확성기들 간의 패닝을 위해 확성기 신호의 이득을 산출하기 위해 기하학적 방식을 적용한다.
여기서 고려되고 새로이 제시되는 예시적인 3D 확성기 설정예는 도 2에 도시된 바와 같이 위치하는 16개의 확성기를 갖고 있다. 각각이 3개의 확성기를 가진 4개의 기둥을 가지고 이들 기둥 사이에 추가 확성기가 있는 실제 고려 사항 때문에 이러한 위치 설정이 선택되었다. 더 구체적으로 설명하면, 청취자의 머리 주위에는 8개의 확성기가 원형으로 45도 각도로 동등하게 분포되어 있다. 추가적인 4개의 확성기가 상단과 하단에 90도의 방위각으로 배치되어 있다. 앰비소닉스에 관해서는, 「"An ambisonics format for flexible playback layouts," by H. Pomberger and F. Zotter in Proceedings of the 1st Ambisonis Symposium, Graz, Austria, July 2009」에서 언급한 바와 같이, 이 설정은 불규칙적이며 디코더 설계시에 문제가 된다.
「"Three-dimensional surround sound systems based on spherical harmonics" by M. Poletti in J. Audio Eng. Soc., vol. 53, no. 11, pp. 1004-1025, Nov. 2005」에 기재되어 있는 바와 같이, 종래의 앰비소닉스 디코딩은 일반적으로 알려져 있는 모드 매칭 프로세스를 이용한다. 모드는 명확한 입사 방향에 대한 구면 고조파의 값을 포함하는 모드 벡터에 의해 기술된다. 개별 확성기에 의해 주어지는 모든 방향을 조합하면 확성기 설정의 모드 행렬이 되며, 이 모드 행렬은 확성기 위치를 나타낸다. 명확한 소스 신호의 모드를 재생하기 위해서는 개별적인 확성기의 중첩된 모드들이 원하는 모드로 합산되는 식으로 확성기 모드들이 가중된다. 필요한 가중치를 얻기 위해서는 확성기 모드 행렬의 역행렬 표현이 산출될 필요가 있다. 신호 디코딩 면에서 보면, 가중치는 확성기의 구동 신호를 형성하며, 역 확성기 모드 행렬은 앰비소닉스 포맷 신호 표현을 디코딩하는 데 적용되는 "디코딩 행렬"이라 한다. 특히, 많은 확성기 설정에 있어서, 예컨대 도 2에 도시된 설정에 있어서는 모드 행렬의 역을 구하기가 어렵다.
전술한 바와 같이, 일반적으로 이용되는 확성기 설정은 2D에 한정된다. 즉, 높이 정보는 재생되지 않는다. 수학적으로 규칙적이지 않는 공간 분포를 갖는 확성기 설정에 대한 사운드필드 표현을 디코딩하면 일반적으로 알려진 기법으로는 로컬라이제이션과 음색 변화 문제가 생긴다. 앰비소닉스 신호를 디코딩하기 위해서는 디코딩 행렬(즉, 디코딩 계수 행렬)이 이용된다. 종래의 앰비소닉스 신호, 특히 HOA 신호 디코딩에서는 적어도 2가지 문제가 발생한다. 첫째, 올바른 디코딩을 위해서는 디코딩 행렬을 얻기 위해 신호 소스 방향을 알아야 한다. 둘째, 수학적으로 올바른 디코딩의 결과 양의 확성기 진폭뿐만 아니라 일부 음의 확성기 진폭도 생길 것이라는 수학적 문제 때문에 기존의 확성기 설정에의 맵핑은 조직적으로 틀린다. 그러나, 이들은 양의 신호로서 틀리게 재생되고, 따라서 전술한 문제가 생기게 된다.
본 발명은 개선된 로컬라이제이션과 음색 변화 특성을 가진 비규칙적 공간 분포에 대한 사운드필드 표현을 디코딩하는 방법을 제공한다. 본 발명은 예컨대 앰비소닉스 포맷으로 된 사운드필드 데이터에 대한 디코딩 행렬을 구하는 다른 방법을 대표하며, 프로세스를 시스템 평가 방식으로 이용한다. 가능한 입사 방향 세트를 고려하여, 원하는 확성기와 관련된 패닝 함수가 산출된다. 패닝 함수는 앰비소닉스 디코딩 프로세스의 출력으로서 취해진다. 필요한 입력 신호는 모든 고려되는 방향의 모드 행렬이다. 그러므로, 후술하는 바와 같이, 디코딩 행렬은 다중 행렬에 입력 신호의 모드 행렬의 역행렬을 직접적으로 곱함으로써 구해진다.
전술한 두 번째 문제와 관련하여, 확성기 위치를 나타내는 소위 모드 행렬의 역과 위치 종속 가중 함수("패닝 함수") W로부터 디코딩 행렬을 구하는 것도 가능함을 알았다. 본 발명의 일 양상은 이들 패닝 함수 W가 일반적으로 이용되는 것과 다른 방법을 이용하여 도출될 수 있다는 것이다. 양호하게도 간단한 기하학적 방법이 이용된다. 그와 같은 방법은 신호 소스 방향을 몰라도 되며, 따라서 전술한 첫 번째 문제를 해결할 수 있다. 그와 같은 하나의 방법은 VBAP(Vector-Based Amplitude Panning)로 알려져 있다. 본 발명에 따라서, VBAP는 필요한 패닝 함수를 산출하는 데 이용되며, 이 패닝 함수는 앰비소닉스 디코딩 행렬을 산출하는 데 이용된다. (확성기 설정을 표현하는) 모드 행렬의 역행렬이 필요하다는 점에서 다른 문제가 발생한다. 그러나, 정확한 역행렬을 구하기는 어렵고, 이 또한 오디오 재생을 틀리게 한다. 따라서, 추가적인 양상은 디코딩 행렬을 구하기 위해 구하기 훨씬 쉬운 의사 역모드 행렬이 산출된다는 것이다.
본 발명은 2단계 방식을 이용한다. 제1 단계는 재생을 위해 이용된 확성기 설정에 의존하는 패닝 함수를 도출하는 것이다. 제2 단계에서는 모든 확성기에 대한 패닝 함수로부터 앰비소닉스 디코딩 행렬이 계산된다.
본 발명의 이점은 사운드 소스의 파라메트릭 기술(description)이 필요치 않고, 대신에 앰비소닉스와 같은 사운드필드 기술이 이용될 수 있다는 것이다.
본 발명에 따라서, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법은, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하는 단계, 상기 소스 방향으로부터 모드 행렬을 산출하는 단계, 상기 모드 행렬의 의사 역모드 행렬을 산출하는 단계, 및 상기 오디오 사운드필드 표현을 디코딩하는 단계를 포함하며, 상기 디코딩은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬로부터 구한 디코드 행렬에 기초한다.
다른 양상에 따라서, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 장치는, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하기 위한 제1 산출 수단, 상기 소스 방향으로부터 모드 행렬을 산출하기 위한 제2 산출 수단, 상기 모드 행렬의 의사 역모드 행렬을 산출하기 위한 제3 산출 수단, 및 상기 사운드필드 표현을 디코딩하기 위한 디코더 수단을 포함하고, 상기 디코딩은 디코드 행렬에 기초하고, 상기 디코더 수단은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬을 이용하여 상기 디코드 행렬을 구한다. 상기 제1, 제2 및 제3 산출 수단은 단일 프로세서 또는 2개 이상의 독립적인 프로세서일 수 있다.
또 다른 양상에 따라서, 컴퓨터 판독 가능 매체는, 컴퓨터에게, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하는 단계, 상기 소스 방향으로부터 모드 행렬을 산출하는 단계, 상기 모드 행렬의 의사 역모드 행렬을 산출하는 단계, 및 상기 오디오 사운드필드 표현을 디코딩하는 단계를 포함하며, 상기 디코딩은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬로부터 구한 디코드 행렬에 기초하는, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법을 수행하게 하는 실행 가능 명령어를 저장한다.
본 발명의 바람직한 실시예들은 종속항, 하기의 상세한 설명 및 도면에 개시된다.
첨부 도면을 참조로 본 발명의 예시적 실시예들에 대해 설명한다.
도 1은 본 방법의 플로우차트.
도 2는 16개의 확성기를 가진 예시적 3D 설정을 보여주는 도.
도 3은 비규칙화(non-regularized) 모드 매칭을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 4는 규칙화 모드 행렬을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 5는 VBAP로부터 도출된 디코딩 행렬을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 6은 듣기 평가의 결과를 보여주는 도.
도 7은 장치의 블록도를 도시한 도.
도 1에 도시된 바와 같이, 오디오 재생을 위한 오디오 사운드필드 표현(SFc)을 디코딩하는 방법은, 복수의 확성기 각각에 대해, 확성기들의 위치(102)(L은 확성기 수)와 복수의 소스 방향(103)(S는 소스 방향 수)에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하는 단계(110), 상기 소스 방향과 상기 사운드필드 표현의 주어진 차수(N)로부터 모드 행렬
Figure 112012077847932-pct00001
을 산출하는 단계(120), 모드 행렬
Figure 112012077847932-pct00002
의 의사 역모드 행렬
Figure 112012077847932-pct00003
을 산출하는 단계(130), 및 디코딩된 사운드 데이터(AUdec)를 얻도록 상기 오디오 사운드필드 표현(SFc)을 디코딩하는 단계(135, 140)를 포함한다. 이 디코딩은 적어도 패닝 함수 W와 의사 역모드 행렬
Figure 112012077847932-pct00004
로부터 구한(135) 디코드 행렬 D에 기초한다. 일 실시예에서, 의사 역모드 행렬은
Figure 112012077847932-pct00005
에 따라서 구해진다. 사운드필드 표현의 차수(N)는 미리 정의되거나 입력 신호(SFc)로부터 추출될(105) 수 있다.
도 7에 도시된 바와 같이, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 장치는, 복수의 확성기 각각에 대해, 확성기들의 위치(102)와 복수의 소스 방향(103)에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하기 위한 제1 산출 수단(210), 상기 소스 방향으로부터 모드 행렬
Figure 112012077847932-pct00006
을 산출하기 위한 제2 산출 수단(220), 모드 행렬
Figure 112012077847932-pct00007
의 의사 역모드 행렬
Figure 112012077847932-pct00008
을 산출하기 위한 제3 산출 수단(230), 및 상기 사운드필드 표현을 디코딩하기 위한 디코더 수단(240)을 포함한다. 이 디코딩은 디코드 행렬 산출 수단(235)(예컨대 곱셈기)에 의해 적어도 패닝 함수 W와 의사 역모드 행렬
Figure 112012077847932-pct00009
로부터 구한 디코드 행렬 D에 기초한다. 디코더 수단(240)은 디코드 행렬 D를 이용하여 디코딩된 오디오 신호(AUdec)를 얻는다. 제1, 제2 및 제3 산출 수단(210, 220, 230)은 단일 프로세서 또는 2 이상의 독립적인 프로세서일 수 있다. 사운드필드 표현의 차수(N)는 미리 정의되거나 입력 신호(SFc)로부터 그 차수를 추출하기 위한 수단(205)에 의해 구해질 수 있다.
특히 유용한 3D 확성기 설정은 16개의 확성기를 갖고 있다. 도 2에 도시된 바와 같이, 각각이 3개의 확성기를 가진 4개의 기둥이 있으며, 이들 기둥 사이에 추가 확성기가 있다. 청취자의 머리 주위에는 8개의 확성기가 원형으로 45도 각도로 동등하게 분포되어 있다. 추가적인 4개의 확성기가 상단과 하단에 90도의 방위각으로 배치되어 있다. 앰비소닉스에 관해서는 이 설정은 불규칙적이며, 보통은 디코더 설계 시에 문제가 된다.
이하에서는 VBAP(Vector Base Amplitude Panning)에 대해 상세히 설명한다. 일 실시예에서, VBAP는 확성기들이 청취 위치로부터 동일한 거리에 있다고 가정한 임의의 확성기 설정으로 가상 음향 소스들을 배치하는 데 이용된다. VBAP는 3개의 확성기를 이용하여 3D 공간에 가상 소스를 배치한다. 각 가상 소소에 대해서는, 사용될 확성기들에 이득이 서로 다른 모노포닉(monophonic) 신호가 공급된다. 이들 서로 다른 확성기의 이득은 가상 소스의 위치에 따라 달라진다. VBAP는 확성기들 간의 패닝(panning)을 위한 확성기 신호들의 이득을 산출하는 기하학적 방식이다. 3D 경우에는, 삼각형으로 배치된 3개의 확성기가 벡터 베이스를 구축한다. 각 벡터 베이스는 확성기 번호 k, m, n으로 식별되며, 확성기 위치 벡터 lk, lm, ln은 단위 길이로 정규화된 직교 좌표로 주어진다. 확성기(k, m, n)에 대한 벡터 베이스는 다음과 같이 정의된다.
Figure 112012077847932-pct00010
가상 소스의 원하는 방향 Ω=(θ,φ)는 방위각 φ와 경사각 θ로 주어져야 한다. 그러므로 직교 좌표에서 가상 소스의 단위 길이 위치 벡터 p(Ω)는 다음과 같이 정의된다.
Figure 112012077847932-pct00011
가상 소스 위치는 상기 벡터 베이스와 이득 계수
Figure 112012077847932-pct00012
를 가지고 다음과 같이 표현될 수 있다.
Figure 112012077847932-pct00013
벡터 베이스 행렬을 역변환(invert)함으로써 필요한 이득 계수는 다음과 같이 계산될 수 있다.
Figure 112012077847932-pct00014
사용될 벡터 베이스는 Pulkki의 논문에 따라서 결정된다. 먼저, 모든 벡터 베이스에 대해 Pulkki에 따라서 이득이 산출된다. 그 다음, 각 벡터 베이스에 대해 이득 계수의 최소치가
Figure 112012077847932-pct00015
에 따라서 구해진다. 마지막으로
Figure 112012077847932-pct00016
가 최고치를 갖는 벡터 베이스가 이용된다. 이렇게 해서 도출되는 이득 계수는 음수이어서는 안 된다. 청취방 음향에 따라서는 이득 계수는 에너지 보존을 위해 정규화될 수 있다.
이하에서는 사운드필드 포맷의 예로서 앰비소닉스 포맷에 대해서 설명한다. 앰비소닉스 표현은 일 위치에서의 사운드필드의 수학적 근사를 이용하는 사운드필드 기술 방법이다. 구면 좌표계를 이용하여 공간 내 지점 r=(r,θ,φ)에서의 압력은 구면 푸리에 변환에 의해 다음과 같이 기술된다.
Figure 112012077847932-pct00017
여기서, k는 파수(wave number)이다. 통상적으로 n은 유한 차수 M에 이른다. 이 급수의 계수 Am n(k)는 (소스가 유효 영역밖에 있다고 가정하면) 사운드필드를 기술하며, jn(kr)은 제1종 구면 베셀 함수이고, Ym n(θ,φ)는 구면 고조파를 나타낸다. 이와 관련하여 계수 Am n(k)는 앰비소닉스 계수로 간주된다. 구면 고조파 Ym n(θ,φ)는 경사각과 방위각에만 종속되며 단위 구면 상의 함수를 기술한다.
단순화하기 위해 사운드필드 재생에 종종 평면파가 가정된다. 평면파를 방향 Ωs로부터의 음향 소스로서 기술하는 앰비소닉스 계수는 다음과 같다.
Figure 112012077847932-pct00018
이 계수의 파수 k에의 종속성은 이러한 특수한 경우에는 순수한 방향 종속성으로 감소한다. 한정된 차수 M에 대해서는 계수는 O = (M+1)2 원소를 유지하면서 다음과 같이 배열될 수 있는 벡터 A를 형성한다.
Figure 112012077847932-pct00019
이 배열은 벡터
Figure 112012077847932-pct00020
를 산출하는 구면 고조차 계수에 이용된다. 윗 첨자 H는 복소 공액 전치를 나타낸다.
사운드필드의 앰비소닉스 표현으로부터 확성기 신호를 산출하는 데는 일반적으로 모드 매칭이 이용된다. 기본 개념은 특정 앰비소닉스 사운드필드 기술(description) A(Ωs)를 확성기들의 사운드필드 기술 A(Ωl)의 가중합으로 표현하는 것이다.
Figure 112012077847932-pct00021
여기서, Ωl은 확성기 방향을 나타내며, wl은 가중치이고, L은 확성기 수이다. 수학식 8로부터 패닝 함수를 유도하기 위해서 입사 방향 Ωs는 이미 알고 있는 것으로 가정한다. 소스와 스피커 사운드필드 모두 평면파라면 계수 4πin(수학식 6 참조)은 뺄 수 있고, 수학식 8은 "모드"라고도 하는 구면 고조파 벡터의 복소 공액에만 의존한다. 이는 행렬식으로는 다음과 같다.
Figure 112012077847932-pct00022
여기서, Ψ는 O×L개의 원소를 가진 다음과 같은 확성기 설정의 모드 행렬이다.
Figure 112012077847932-pct00023
원하는 가중 벡터 w를 얻기 위해, 이를 달성하는 여러 가지 전략이 알려져 있다. 만일 M=3이 선택되면, Ψ는 정방형(sqaure)이며 역변환가능(invertible)하다. 그렇지만 불규칙적인 확성기 설정으로 인해 이 행렬은 확장성이 나쁘다. 그와 같은 경우에, 대개는 의사 역행렬이 선택되며, 하기 수학식은 L×O 디코딩 행렬 D를 산출한다.
Figure 112012077847932-pct00024
최종적으로 다음과 같은 수학식이 성립할 수 있다.
Figure 112012077847932-pct00025
여기서, 가중치 w(Ωs)는 수학식 9에 대한 최소 에너지 해이다. 이하, 의사 역행렬을 이용하여 얻은 결과에 대해 설명한다.
이하에서는 패닝 함수와 앰비소닉스 디코딩 행렬 간의 연계에 대해 설명한다. 앰비소닉스부터 시작하여, 개별 확성기에 대한 패닝 함수는 수학식 12를 이용하여 산출될 수 있다.
Figure 112012077847932-pct00026
이 S개의 입력 신호 방향의 모드 행렬, 예컨대, 1°에서 180°까지 1도씩 단계적으로 증가하는 경사각과 1°에서 360°까지의 방위각을 가진 구면 그리드(spherical grid)라고 하자. 이 모드 행렬은 O×S개의 원소를 갖고 있다. 수학식 12를 이용하여 도출된 행렬 W는 L×S개의 원소를 갖고 있으며, 행 l은 각자의 확성기에 대해 S개의 패닝 가중치를 갖고 있다.
Figure 112012077847932-pct00027
대표적인 예로서, 단일 확성기(2)의 패닝 함수는 도 3에서 빔 패턴으로서 나타나 있다. 이 예에서 디코드 행렬 D의 차수 M=3이다. 도시된 바와 같이, 패닝 함수값은 확성기의 물리적 위치를 나타내지 않는다. 이는 선택된 차수에 대한 공간 샘플링 방식으로서는 충분치 않은 확성기의 수학적 불규칙적 위치 설정에 기인한다. 그러므로 디코드 행렬은 비규칙화 모드 행렬이라고 한다. 이 문제는 수학식 11에서 확성기 모드 행렬 Ψ의 규칙화에 의해 극복될 수 있다. 이 해는 디코딩 행렬의 공간 분해능을 희생하는 것이며, 따라서 보다 낮은 앰비소닉스 차수로 표현될 수 있다. 도 4는 규칙화 모드 행렬을 이용하여, 특히 규칙화를 위한 모드 행렬의 고유값들(eigenvalues)의 평균을 이용하여 디코딩한 결과로서 생긴 예시적인 빔 패턴을 보여준다. 도 3과 비교해서, 다루어진 확성기의 방향은 이제 명확히 인식된다.
배경 기술 부분에서 설명한 바와 같이, 패닝 함수가 이미 알려져 있는 경우에는 앰비소닉스 신호의 재생을 위한 디코딩 행렬 D를 얻는 다른 방법도 가능하다. 패닝 함수 W는 가상 소스 방향 Ω 세트 상에서 정의된 원하는 신호로 간주되며, 이들 방향의 모드 행렬
Figure 112012077847932-pct00028
은 입력 신호로서 이용된다. 그러면, 디코딩 행렬은 하기 수학식을 이용하여 산출될 수 있다.
Figure 112012077847932-pct00029
여기서,
Figure 112012077847932-pct00030
또는 간단히
Figure 112012077847932-pct00031
는 모드 행렬
Figure 112012077847932-pct00032
의 의사 역행렬이다. 이 새로운 방식에서는 VBAP로부터 W 패닝 함수를 취하고 이로부터 앰비소닉스 디코딩 행렬을 산출한다.
W 패닝 함수는 다시 수학식 4를 이용해 산출된 이득값 g(Ω)로서 취해지며, Ω는 수학식 13에 따라서 선택된다. 수학식 15를 이용하는 최종적인 디코드 행렬은 VBAP 패닝 함수를 용이하게 하는 앰비소닉스 디코딩 행렬이다. VBAP로부터 도출된 디코딩 행렬를 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도 5에 일례가 도시되어 있다. 양호하게도, 사이드로브 SL은 도 4의 규칙화 모드 매칭 결과의 사이드로브 SLreg보다 훨씬 작다. 더욱이, 개별적인 확성기에 대한 VBAP 도출 빔 패턴은, VBAP 패닝 함수가 다루어진 방향의 벡터 베이스에 의존함에 따라, 확성기 설정의 기하학적 형태를 따른다. 결과적으로, 본 발명에 따른 새로운 방식은 확성기 설정의 모든 방향에 대해 더 양호한 결과를 준다.
소스 방향(103)은 상당히 자유롭게 정의될 수 있다. 소스 방향 S의 수에 대한 조건은 이것이 적어도 (N+1)2이어야 한다는 것이다. 따라서, 사운드필드 신호 SFc의 특정 차수 N을 갖는다면, S≥(N+1)2에 따라서 S를 정의하고, S 소스 방향을 단위 구면에 고르게 분포시키는 것이 가능하다. 전술한 바와 같이, 결과는 1°에서 180°까지 x(예컨대 x=1...5 또는 x=10, 20 등)도씩 단계적으로 증가하는 경사각 θ와 1°에서 360°까지의 방위각 φ를 가진 구면 그리드일 수 있으며, 각 소스 방향 Ω=(θ,φ)는 방위각 φ와 경사각 θ로 주어질 수 있다.
듣기 평가에서 양호한 효과가 확인되었다. 단일 소스의 로컬라이제이션의 평가를 위해, 가상 소스가 기준으로서의 실제 소스와 비교된다. 실제 소스에 대해서는, 원하는 위치에 있는 확성기가 사용된다. 사용된 재생 방법은 VBAP, 앰비소닉스 모드 매칭 디코딩, 그리고, 본 발명에 따라 VBAP 패닝 함수를 이용하는 새로이 제시된 앰비소닉스 디코딩이다. 후자의 2가지 방법에 있어서는 각 평가 위치와 각 평가 입력 신호에 대해 3차(third order)의 앰비소닉스 신호가 생성된다. 그 후, 이 합성 앰비소닉스 신호는 대응하는 디코딩 행렬을 이용하여 디코딩된다. 사용된 평가 신호는 광대역 핑크 노이즈와 남성 음성 신호이다. 평가 위치는 다음과 같은 방향을 가진 정면 영역에 위치한다.
Figure 112012077847932-pct00033
듣기 평가는 대략 0.2초의 평균 잔향 시간을 가진 음향실에서 실시되었다. 이 듣기 평가에는 9명의 사람이 참여했다. 평가 대상자에게 기준과 비교한 모든 재생 방법의 공간 재생 성능에 등급을 매기도록 하였다. 단일 등급값은 가상 소스의 로컬라이제이션과 음색 변화를 나타내는 것이어야 했다. 도 5는 듣기 평가의 결과를 보여준다.
결과가 보여주듯이, 비규칙화 앰비소닉스 모드 매칭 디코딩은 평가한 다른 방법보다 지각적으로 더 나쁜 등급이 매겨져 있다. 이 결과는 도 3에 대응한다. 앰비소닉스 모드 매칭 방법은 이 듣기 평가에서 앵커(anchor) 역할을 한다. 다른 이점은 잡음 신호에 대한 신뢰 구간이 다른 방법에서보다 VBAP에서 더 크다는 것이다. 평균값은 VBAP 패닝 함수를 이용한 앰비소닉스 디코딩에서 최고치를 보여준다. 따라서, 이용된 앰비소닉스 차수로 인해 공간 분해능이 감소되기는 하나, 이 방법은 파라메트릭 VBAP 방식에 비해 이점을 보여준다. VBAP에 비해, 강건 패닝 함수와 VBAP 패닝 함수를 가진 양쪽 앰비소닉스 디코딩은 가상 소스를 렌더링하는 데 3개의 확성기만 사용되는 것은 아니라는 이점을 갖고 있다. VBAP에서는, 가상 소스 위치가 확성기의 물리적 위치들 중 하나에 가까이 있다면 단일 확성기들이 우세할 수 있다. 대부분의 평가 대상자들은 직접 적용 VBAP에서보다는 앰비소닉스 구동 VBAP에서 음색 변화가 적었다고 했다. VBAP에서의 음색 변화 문제는 Pulkki에서 이미 알려져 있다. VBAP와는 달리, 상기 새로이 제시된 방법은 가상 소스의 재생을 위해 3개 초과의 확성기를 사용하지만 놀랍게도 음색 변화가 더 적다.
결론으로서, VBAP 패닝 함수로부터 앰비소닉스 디코딩 행렬을 얻는 새로운 방법이 개시된다. 이 방법은 여러 가지 서로 다른 확성기 설정에 있어서는 모드 매칭 방식의 행렬에 비해 유리하다. 이들 디코딩 행렬의 특성과 결과에 대해서는 전술하였다. 요약하면, VBAP 패닝 함수를 이용한 새로이 제시된 앰비소닉스 디코딩은 공지의 모드 매칭 방법의 통상적인 문제를 방지한다. 듣기 평가는 VBAP 도출 앰비소닉스 디코딩이 VBAP의 직접적인 이용보다도 공간 재생 품질이 더 양호할 수 있다는 것을 보여주었다. VBAP는 렌더링될 가상 소스의 파라메트릭 기술(description)을 필요로 하지만, 이 제시된 방법은 사운드필드 기술만을 필요로 한다.
지금까지 바람직한 실시예에 적용된 본 발명의 기본적이고 신규한 특징들을 도시하고, 설명하고, 지적하였지만, 당업자라면 본 발명의 본질로부터 벗어남이 없이, 설명된 장치와 방법, 개시된 디바이스의 형태와 세부 사항, 그리고 그들의 동작에 있어 여러 가지 생략, 치환, 및 수정이 가능함을 잘 알 것이다. 동일한 결과를 달성하기 위해 실질적으로 동일한 기능을 실질적으로 동일한 방식으로 수행하는 구성요소들의 모든 조합이 본 발명의 범위 내에 속하는 것이다. 설명된 실시예들 간의 구성요소 치환도 충분히 의도하고 고려할 수 있다. 본 발명의 범위로부터 벗어남이 없이 세부 사항의 변경이 가능함을 알아야 한다. 상세한 설명 및 (적당한 경우) 청구범위 및 도면에 개시된 각 특징은 서로 독립적으로 또는 임의의 적당한 조합으로 제공될 수 있다. 특징들은 적당한 경우 하드웨어, 소프트웨어, 또는 이 둘의 조합으로 구현될 수 있다. 청구범위에 나타난 도면부호는 단지 예시적인 것이며 청구범위를 한정하는 것이 아니다.

Claims (15)

  1. 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법에 있어서,
    복수의 확성기 각각에 대해, 상기 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝(panning) 함수(W)를 산출하는 단계(110);
    상기 소스 방향들로부터 모드 행렬(
    Figure 112017008890861-pct00068
    )을 산출하는 단계(120);
    상기 모드 행렬(
    Figure 112017008890861-pct00035
    )의 의사 역모드 행렬(
    Figure 112017008890861-pct00036
    )을 산출하는 단계(130); 및
    상기 오디오 사운드필드 표현을 디코딩하는 단계(140)
    를 포함하며,
    상기 디코딩은 적어도 상기 패닝 함수(W)와 상기 의사 역모드 행렬(
    Figure 112017008890861-pct00037
    )로부터 구한 디코드 행렬(D)에 기초하는 오디오 사운드필드 표현 디코딩 방법.
  2. 제1항에 있어서,
    상기 패닝 함수(W) 산출 단계에서 이용된 상기 기하학적 방법은 VBAP(Vector Base Amplitude Panning)인 오디오 사운드필드 표현 디코딩 방법.
  3. 제1항에 있어서,
    상기 사운드필드 표현은 적어도 제2 차수의 앰비소닉스(Ambisonics) 포맷인 오디오 사운드필드 표현 디코딩 방법.
  4. 제1항에 있어서,
    상기 의사 역모드 행렬(
    Figure 112013012123287-pct00038
    )은
    Figure 112013012123287-pct00039
    에 따라서 구해지고,
    Figure 112013012123287-pct00040
    는 상기 복수의 소스 방향의 모드 행렬인 오디오 사운드필드 표현 디코딩 방법.
  5. 제4항에 있어서,
    상기 디코드 행렬(D)은
    Figure 112017008890861-pct00041
    에 따라서 구해지고(135), W는 각 확성기에 대한 패닝 함수 세트인 오디오 사운드필드 표현 디코딩 방법.
  6. 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 장치에 있어서,
    복수의 확성기 각각에 대해, 상기 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하기 위한 제1 산출 수단(210);
    상기 소스 방향들로부터 모드 행렬(
    Figure 112017008890861-pct00042
    )을 산출하기 위한 제2 산출 수단(220);
    상기 모드 행렬(
    Figure 112017008890861-pct00043
    )의 의사 역모드 행렬(
    Figure 112017008890861-pct00044
    )을 산출하기 위한 제3 산출 수단(230); 및
    적어도 상기 패닝 함수(W)와 상기 의사 역모드 행렬(
    Figure 112017008890861-pct00069
    )을 이용하여 획득된 디코드 행렬(D)에 기초하여 상기 오디오 사운드필드 표현을 디코딩하기 위한 디코더 수단(240)
    을 포함하는 오디오 사운드필드 표현 디코딩 장치.
  7. 제6항에 있어서,
    상기 패닝 함수(W)와 상기 의사 역모드 행렬(
    Figure 112012077847932-pct00046
    )로부터 상기 디코드 행렬(D)을 산출하기 위한 수단(235)을 더 포함하는 오디오 사운드필드 표현 디코딩 장치.
  8. 제6항에 있어서,
    상기 패닝 함수(W) 산출 단계에서 이용된 상기 기하학적 방법은 VBAP(Vector Base Amplitude Panning)인 오디오 사운드필드 표현 디코딩 장치.
  9. 제6항에 있어서,
    상기 사운드필드 표현은 적어도 제2 차수의 앰비소닉스 포맷인 오디오 사운드필드 표현 디코딩 장치.
  10. 제6항에 있어서,
    상기 의사 역모드 행렬(
    Figure 112013012123287-pct00047
    )은
    Figure 112013012123287-pct00048
    에 따라서 구해지고,
    Figure 112013012123287-pct00049
    는 상기 복수의 소스 방향의 모드 행렬인 오디오 사운드필드 표현 디코딩 장치.
  11. 제10항에 있어서,
    상기 디코드 행렬(D)은
    Figure 112017008890861-pct00050
    에 따라서 디코드 행렬을 산출하기 위한 수단(245)에서 구해지고, W는 각 확성기에 대한 패닝 함수 세트인 오디오 사운드필드 표현 디코딩 장치.
  12. 컴퓨터로 하여금 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법을 수행하게 하는 실행 가능 명령어를 저장한 컴퓨터 판독가능 매체로서,
    상기 방법은,
    복수의 확성기 각각에 대해, 상기 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하는 단계(110);
    상기 소스 방향들로부터 모드 행렬(
    Figure 112012077847932-pct00051
    )을 산출하는 단계(120);
    상기 모드 행렬(
    Figure 112012077847932-pct00052
    )의 의사 역모드 행렬(
    Figure 112012077847932-pct00053
    )을 산출하는 단계(130); 및
    상기 오디오 사운드필드 표현을 디코딩하는 단계(140)
    를 포함하며, 상기 디코딩은 적어도 상기 패닝 함수(W)와 상기 의사 역모드 행렬(
    Figure 112012077847932-pct00054
    )로부터 구한 디코드 행렬(D)에 기초하는 컴퓨터 판독 가능 매체.
  13. 제12항에 있어서,
    상기 패닝 함수(W) 산출 단계에서 이용된 상기 기하학적 방법은 VBAP(Vector Base Amplitude Panning)인 컴퓨터 판독 가능 매체.
  14. 제12항에 있어서,
    상기 사운드필드 표현은 적어도 제2 차수의 앰비소닉스 포맷인 컴퓨터 판독 가능 매체.
  15. 제12항에 있어서,
    상기 의사 역모드 행렬(
    Figure 112013012123287-pct00055
    )은
    Figure 112013012123287-pct00056
    에 따라서 구해지고,
    Figure 112013012123287-pct00057
    는 상기 복수의 소스 방향의 모드 행렬인 컴퓨터 판독 가능 매체.
KR1020127025099A 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 KR101755531B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10305316.1 2010-03-26
EP10305316 2010-03-26
PCT/EP2011/054644 WO2011117399A1 (en) 2010-03-26 2011-03-25 Method and device for decoding an audio soundfield representation for audio playback

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020177018317A Division KR101795015B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130031823A KR20130031823A (ko) 2013-03-29
KR101755531B1 true KR101755531B1 (ko) 2017-07-07

Family

ID=43989831

Family Applications (9)

Application Number Title Priority Date Filing Date
KR1020177031814A KR101890229B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020177018317A KR101795015B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197025623A KR102093390B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020127025099A KR101755531B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020207008095A KR102294460B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020247000412A KR20240009530A (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020187023439A KR101953279B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020217026627A KR102622947B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197005396A KR102018824B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Family Applications Before (3)

Application Number Title Priority Date Filing Date
KR1020177031814A KR101890229B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020177018317A KR101795015B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197025623A KR102093390B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Family Applications After (5)

Application Number Title Priority Date Filing Date
KR1020207008095A KR102294460B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020247000412A KR20240009530A (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020187023439A KR101953279B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020217026627A KR102622947B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197005396A KR102018824B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Country Status (12)

Country Link
US (9) US9100768B2 (ko)
EP (1) EP2553947B1 (ko)
JP (8) JP5559415B2 (ko)
KR (9) KR101890229B1 (ko)
CN (1) CN102823277B (ko)
AU (1) AU2011231565B2 (ko)
BR (2) BR122020001822B1 (ko)
ES (1) ES2472456T3 (ko)
HK (1) HK1174763A1 (ko)
PL (1) PL2553947T3 (ko)
PT (1) PT2553947E (ko)
WO (1) WO2011117399A1 (ko)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101890229B1 (ko) * 2010-03-26 2018-08-21 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2727381B1 (en) 2011-07-01 2022-01-26 Dolby Laboratories Licensing Corporation Apparatus and method for rendering audio objects
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
KR20230154111A (ko) 2012-07-16 2023-11-07 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2738962A1 (en) * 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
JP6271586B2 (ja) * 2013-01-16 2018-01-31 ドルビー・インターナショナル・アーベー Hoaラウドネスレベルを測定する方法及びhoaラウドネスレベルを測定する装置
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
EP2979467B1 (en) 2013-03-28 2019-12-18 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary n-gons
KR102332968B1 (ko) * 2013-04-26 2021-12-01 소니그룹주식회사 음성 처리 장치, 정보 처리 방법, 및 기록 매체
US9681249B2 (en) * 2013-04-26 2017-06-13 Sony Corporation Sound processing apparatus and method, and program
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9716959B2 (en) 2013-05-29 2017-07-25 Qualcomm Incorporated Compensating for error in decomposed representations of sound fields
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
BR112015030103B1 (pt) * 2013-05-29 2021-12-28 Qualcomm Incorporated Compressão de representações decomposta de campo sonoro
US9691406B2 (en) * 2013-06-05 2017-06-27 Dolby Laboratories Licensing Corporation Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
EP2824661A1 (en) * 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
CN105981100B (zh) 2014-01-08 2020-02-28 杜比国际公司 用于改善对声场的高阶高保真度立体声响复制表示进行编码所需的边信息的编码的方法和装置
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
KR102201726B1 (ko) 2014-03-21 2021-01-12 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
JP6374980B2 (ja) 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
RU2666248C2 (ru) 2014-05-13 2018-09-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для амплитудного панорамирования с затуханием фронтов
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9847087B2 (en) * 2014-05-16 2017-12-19 Qualcomm Incorporated Higher order ambisonics signal compression
KR20240050436A (ko) * 2014-06-27 2024-04-18 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 장치
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9910634B2 (en) * 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) * 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3073488A1 (en) 2015-03-24 2016-09-28 Thomson Licensing Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
EP3531714B1 (en) 2015-09-17 2022-02-23 Sonos Inc. Facilitating calibration of an audio playback device
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
CN105392102B (zh) * 2015-11-30 2017-07-25 武汉大学 用于非球面扬声器阵列的三维音频信号生成方法及***
EP3402223B1 (en) 2016-01-08 2020-10-07 Sony Corporation Audio processing device and method, and program
WO2017119318A1 (ja) * 2016-01-08 2017-07-13 ソニー株式会社 音声処理装置および方法、並びにプログラム
CN108476365B (zh) * 2016-01-08 2021-02-05 索尼公司 音频处理装置和方法以及存储介质
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
CN110383856B (zh) 2017-01-27 2021-12-10 奥罗技术公司 用于平移音频对象的处理方法和***
US10861467B2 (en) 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
KR102490786B1 (ko) 2017-04-13 2023-01-20 소니그룹주식회사 신호 처리 장치 및 방법, 그리고 프로그램
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
EP3625974B1 (en) 2017-05-15 2020-12-23 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
US10674301B2 (en) * 2017-08-25 2020-06-02 Google Llc Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US20200402523A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN112530445A (zh) * 2020-11-23 2021-03-19 雷欧尼斯(北京)信息技术有限公司 高阶Ambisonic音频的编解码方法及芯片
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008113428A1 (en) 2007-03-21 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for conversion between multi-channel audio formats
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP2009218655A (ja) 2008-03-07 2009-09-24 Nippon Hoso Kyokai <Nhk> 音響信号変換装置、その方法及びそのプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
EP1275272B1 (en) 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
JP2002218655A (ja) 2001-01-16 2002-08-02 Nippon Telegr & Teleph Corp <Ntt> 空港における給電システム
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
DE602005003342T2 (de) 2005-06-23 2008-09-11 Akg Acoustics Gmbh Methode zur Modellierung eines Mikrofons
JP4928177B2 (ja) * 2006-07-05 2012-05-09 日本放送協会 音像形成装置
DE102006053919A1 (de) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
ES2425814T3 (es) 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
EP2460118B1 (en) 2009-07-30 2013-05-29 OCE-Technologies B.V. Automatic table location in documents
KR101890229B1 (ko) * 2010-03-26 2018-08-21 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
JP6589838B2 (ja) 2016-11-30 2019-10-16 カシオ計算機株式会社 動画像編集装置及び動画像編集方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008113428A1 (en) 2007-03-21 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for conversion between multi-channel audio formats
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP2009218655A (ja) 2008-03-07 2009-09-24 Nippon Hoso Kyokai <Nhk> 音響信号変換装置、その方法及びそのプログラム

Also Published As

Publication number Publication date
KR102622947B1 (ko) 2024-01-10
US11217258B2 (en) 2022-01-04
JP6615936B2 (ja) 2019-12-04
JP5559415B2 (ja) 2014-07-23
WO2011117399A1 (en) 2011-09-29
JP2015159598A (ja) 2015-09-03
US20180308498A1 (en) 2018-10-25
US10522159B2 (en) 2019-12-31
EP2553947A1 (en) 2013-02-06
US10134405B2 (en) 2018-11-20
JP2023052781A (ja) 2023-04-12
KR20210107165A (ko) 2021-08-31
JP6336558B2 (ja) 2018-06-06
US20130010971A1 (en) 2013-01-10
KR20190022914A (ko) 2019-03-06
US9460726B2 (en) 2016-10-04
JP6918896B2 (ja) 2021-08-11
JP2013524564A (ja) 2013-06-17
AU2011231565A1 (en) 2012-08-23
KR20170084335A (ko) 2017-07-19
US10629211B2 (en) 2020-04-21
CN102823277B (zh) 2015-07-15
JP2018137818A (ja) 2018-08-30
EP2553947B1 (en) 2014-05-07
US20170025127A1 (en) 2017-01-26
US9100768B2 (en) 2015-08-04
US11948583B2 (en) 2024-04-02
JP2017085620A (ja) 2017-05-18
KR102294460B1 (ko) 2021-08-27
CN102823277A (zh) 2012-12-12
KR20170125138A (ko) 2017-11-13
JP5739041B2 (ja) 2015-06-24
US20150294672A1 (en) 2015-10-15
AU2011231565B2 (en) 2014-08-28
JP6067773B2 (ja) 2017-01-25
ES2472456T3 (es) 2014-07-01
US9767813B2 (en) 2017-09-19
KR20180094144A (ko) 2018-08-22
JP2021184611A (ja) 2021-12-02
KR102093390B1 (ko) 2020-03-25
PT2553947E (pt) 2014-06-24
JP7220749B2 (ja) 2023-02-10
HK1174763A1 (en) 2013-06-14
KR20190104450A (ko) 2019-09-09
US20200273470A1 (en) 2020-08-27
BR112012024528A2 (pt) 2016-09-06
KR20130031823A (ko) 2013-03-29
US20170372709A1 (en) 2017-12-28
KR101890229B1 (ko) 2018-08-21
BR122020001822B1 (pt) 2021-05-04
BR112012024528B1 (pt) 2021-05-11
JP2020039148A (ja) 2020-03-12
KR102018824B1 (ko) 2019-09-05
US20190139555A1 (en) 2019-05-09
KR20200033997A (ko) 2020-03-30
US20220189492A1 (en) 2022-06-16
BR112012024528A8 (pt) 2017-12-05
KR101953279B1 (ko) 2019-02-28
KR20240009530A (ko) 2024-01-22
PL2553947T3 (pl) 2014-08-29
US20190341062A1 (en) 2019-11-07
KR101795015B1 (ko) 2017-11-07
US10037762B2 (en) 2018-07-31
JP2014161122A (ja) 2014-09-04

Similar Documents

Publication Publication Date Title
KR101755531B1 (ko) 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
AU2014265108A1 (en) Method and device for decoding an audio soundfield representation for audio playback

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
GRNT Written decision to grant