KR102678270B1 - 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 - Google Patents

고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR102678270B1
KR102678270B1 KR1020227044967A KR20227044967A KR102678270B1 KR 102678270 B1 KR102678270 B1 KR 102678270B1 KR 1020227044967 A KR1020227044967 A KR 1020227044967A KR 20227044967 A KR20227044967 A KR 20227044967A KR 102678270 B1 KR102678270 B1 KR 102678270B1
Authority
KR
South Korea
Prior art keywords
matrix
panning
loudspeaker
decoding
panning function
Prior art date
Application number
KR1020227044967A
Other languages
English (en)
Other versions
KR20230003436A (ko
Inventor
플로리안 케일러
요하네스 뵘
Original Assignee
돌비 인터네셔널 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP12305356.3A external-priority patent/EP2645748A1/en
Application filed by 돌비 인터네셔널 에이비 filed Critical 돌비 인터네셔널 에이비
Publication of KR20230003436A publication Critical patent/KR20230003436A/ko
Application granted granted Critical
Publication of KR102678270B1 publication Critical patent/KR102678270B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

스테레오 라우드스피커(loudspeaker) 셋업에 대한 앰비소닉(Ambisonics)의 디코딩 표현은 1차 앰비소닉 오디오 신호에 대해 공지되어 있다. 그러나 그러한 1차 앰비소닉 접근은 높은 네거티브 사이드 로브 또는 전면 영역에서의 부족한 방향감(localisation)을 갖는다. 본 발명은 고차 앰비소닉 HOA에 대한 스테레오 디코더의 프로세싱을 다룬다. 원하는 패닝 함수(desired panning function)는 라우드스피커들 사이에 가상 소스의 배치에 대한 패닝 법칙으로부터 얻을 수 있다. 각각의 라우드스피커에 대하여, 샘플링 포인트에서 모든 가능한 입력 방향들에 대한 원하는 패닝 함수가 정의된다. 패닝 함수는 원형 조화 함수에 의해 근사치를 얻고, 앰비소닉 차수를 증가시키면서 원하는 패닝 함수가 감소하는 오류로 일치된다. 라우드스피커들 사이의 전면 영역에서, 탄젠트 법칙 또는 VBAP(vector base amplitude panning)와 같은 패닝 법칙이 사용된다. 후방에 대하여 이러한 방향들로부터 사운드의 경미한 감쇠를 갖는 패닝 함수가 정의된다.

Description

고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치{METHOD AND APPARATUS FOR DECODING STEREO LOUDSPEAKER SIGNALS FROM A HIGHER-ORDER AMBISONICS AUDIO SIGNAL}
본 발명은 원 상의 포인트들을 샘플링하기 위해 패닝 함수(panning function)를 이용하여 고차 앰비소닉(higher-order Ambisonics) 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치에 관한 것이다.
스테레오 라우드스피커 또는 헤드폰 셋업을 위한 앰비소닉의 디코딩 표현들은, 예를 들어, 뉴욕, 1995년 10월 제99회 컨벤션에서 발표된 오디오 공학회 프리프린트의 컨벤션 논문 4138, J.S. Bamford, J. Vender-kooy의 "Ambisonic sound for us"에서의 식(10)으로부터, 및 XiphWiki-Ambisonics(http://wiki.xiph.org/index.php/Ambisonics#Default_channel_conversions_from_B-Format)으로부터 1차 앰비소닉에 대해 공지되어 있다. 이러한 접근들은 영국 특허 제394325호에서 개시된 바와 같은 블룸레인(Blumlein) 스테레오에 기초한다.
또 다른 접근은 모드-매칭(mode-matching)을 이용한다 - 2005년 11월 J. Audio 공학회의 M.A. Poletti "Three-Dimensional Surround Sound Systems Based on Spherical Harmonics", 제53호(11), 페이지 1004 내지 1025 참조 -.
그러한 1차 앰비소닉 접근은 8자 모양의 패턴(2008년 베를린 Springer, S. Weinzierl의 "Handbuch der Audiotechnik"에서 3.3.4.1 부분 참조)을 갖는 가상 마이크로폰을 포함하는 블룸레인 스테레오(영국 특허 제394325호)에 기초한 앰비소닉 디코더와 같이 높은 네거티브 사이드 로브(negative side lobe)를 갖거나, 또는 전방에서의 부족한 방향감(localisation)를 갖는다. 네거티브 사이드 로브로 인해, 예를 들어, 우측 후방으로부터의 사운드 오브젝트들은 좌측 스테레오 라우드스피커에서 재생된다.
본 발명에 의해 해결될 문제는 앰비소닉 신호 디코딩에 향상된 스테레오 신호 출력을 제공하는 것이다. 이러한 문제는 청구항 1 및 청구항 2에서 개시된 방법에 의해 해결된다. 이러한 방법들을 활용하는 장치는 청구항 3에서 개시된다.
본 발명은 고차 앰비소닉 HOA 오디오 신호들에 대한 스테레오 디코더의 프로세싱을 설명한다. 원하는 패닝 함수(desired panning function)는 라우드스피커들 사이에 가상 소스들의 배치에 대한 패닝 법칙으로부터 얻을 수 있다. 각각의 라우드스피커들에서 모든 가능한 입력 방향들에 대한 원하는 패닝 함수가 정의된다. 앰비소닉 디코딩 행렬은, 프랑스 파리, 2010년 5월 6일에서 7일, 앰비소닉 및 구형 음향에 대한 제2회 국제 심포지엄 회보, J.M. Batke, F. Keiler의 "Using VBAP-derived panning functions for 3D Ambisonics decoding", URL http://ambisonics10.ircam.fr/drupal/files/proceedings/presentations/O14_47.pdf, 및 WO 2011/117399 A1에서 대응하는 설명과 유사하게 연산된다. 패닝 함수는 원형 조화 함수(circular harmonic function)에 의해 근사치를 얻고, 앰비소닉 차수를 증가시키면서 원하는 패닝 함수가 감소하는 오류로 일치된다. 특히 라우드스피커들 사이에 전면 영역에서, 탄젠트 법칙 또는 VBAP(vector base amplitude panning)와 같은 패닝 법칙이 사용될 수 있다. 라우드스피커 위치들을 넘는 후방에서, 이러한 방향들로부터의 사운드의 경미한 감쇠를 갖는 패닝 함수가 사용된다.
특정 경우에는 라우드스피커 방향을 후방으로 향하게 하는 심장형 특성(cardioid pattern)의 일 반면이 사용된다.
본 발명에서, 고차 앰비소닉의 더 높은 공간 해상력은 특히 전면 영역에서 활용되고 앰비소닉 차수를 증가시켜 후방에서의 네거티브 사이드 로브의 감쇠를 증가시킨다.
본 발명은 반원에 또는 반원보다 더 작은 원의 세그먼트에 배치된 2개를 초과하는 라우드스피커들을 포함하는 라우드스피커 셋업을 위해 또한 사용될 수 있다.
또한 그것은 일부 공간 영역들이 더 많은 감쇠를 갖는 스테레오에 보다 예술적인 다운믹싱을 용이하게 한다. 이것은 대화의 더 나은 명료성을 가능하게 하는 향상된 직접 사운드 대 확산 사운드(direct-sound-to-diffuse-sound) 비율을 생성하는데 유익하다.
본 발명에 따른 스테레오 디코더는 일부 중요한 특성들 - 라우드스피커들 사이의 전방에서의 바람직한 방향감, 결과 패닝 함수들에서의 매우 작은 네거티브 사이드 로브, 및 후방의 경미한 감쇠 - 을 충족한다. 또한 그것은 감쇠 또는 공간 영역의 마스킹을 가능하게 하는데, 그렇지 않다면 그것들은 2채널 버젼을 청취할 때 방해하는 것 또는 산만하게 하는 것으로서 감지될 수 있을 것이다.
WO 2011/117399 A1에 비교하면, 원하는 패닝 함수는 정의된 원형 세그먼트 방향(segment-wise)이고, 후방이 경미하게 감쇠될 수 있는 반면 라우드스피커 위치들 사이의 전면 영역에서는 공지된 패닝 프로세싱(예를 들어, VBAP 또는 탄젠트 법칙)이 사용될 수 있다. 그러한 특성들은 1차 앰비소닉 디코더들을 이용할 때는 실현 가능하지 않다.
원칙적으로, 본 발명의 방법은 고차 앰비소닉 오디오 신호 a(t)로부터 스테레오 라우드스피커 신호 l(t)를 디코딩하는데 적합하고, 상기 방법은:
좌우 라우드스피커들의 방위각 값들 및 원 상의 S개의 가상 샘플링 포인트들로부터, 모든 가상 샘플링 포인트들에 대한 원하는 패닝 함수를 포함하는 행렬 G를 계산하는 단계 - 여기서 이고, gL(ø) 및 gR(ø) 엘리먼트들은 S개의 상이한 샘플링 포인트들에 대한 패닝 함수임 -,
상기 앰비소닉 오디오 신호 a(t)의 차수 N을 결정하는 단계,
상기 수 S 및 상기 차수 N으로부터, 모드 행렬 Ξ 및 상기 모드 행렬 Ξ의 대응하는 의사 역행렬(pseudo-inverse) Ξ+를 계산하는 단계 - 여기서 이고, 는 상기 앰비소닉 오디오 신호 a(t)의 원형 조화 벡터 의 켤레 복소이고, Ym(ø)는 원형 조화 함수들임 -,
상기 행렬 G 및 Ξ+로부터 디코딩 행렬 D = GΞ+를 계산하는 단계,
라우드스피커 신호 l(t) = Da(t)를 계산하는 단계를 포함한다.
원칙적으로, 본 발명의 방법은 2D 고차 앰비소닉 오디오 신호 a(t)로부터 스테레오 라우드스피커 신호 l(t) = Da(t)를 디코딩하기 위해 사용될 수 있는 디코딩 행렬 D를 결정하는데 적합하고, 상기 방법은:
상기 앰비소닉 오디오 신호 a(t)의 차수 N을 수신하는 단계,
좌우 라우드스피커들의 원하는 방위각 값들 (øL, øR) 및 원 상의 S개의 가상 샘플링 포인트들로부터, 모든 가상 샘플링 포인트들에 대한 원하는 패닝 함수를 포함하는 행렬 G를 계산하는 단계 - 여기서 이고, gL(ø) 및 gR(ø) 엘리먼트들은 S개의 상이한 샘플링 포인트들에 대한 패닝 함수임 -,
상기 수 S 및 상기 차수 N으로부터 모드 행렬 Ξ 및 상기 모드 행렬 Ξ의 대응하는 의사 역행렬 Ξ+를 계산하는 단계 - 여기서 이고, 는 상기 앰비소닉 오디오 신호 a(t)의 원형 조화 벡터 의 켤레 복소이고, Ym(ø)는 원형 조화 함수들임 -,
상기 행렬 G 및 Ξ+로부터 디코딩 행렬 D = GΞ+를 계산하는 단계를 포함한다.
원칙적으로 본 발명의 장치는 고차 앰비소닉 오디오 신호 a(t)로부터 스테레오 라우드스피커 신호 l(t)를 디코딩하는데 적합하고, 상기 장치는:
좌우 라우드스피커들의 방위각 값들 및 원 상의 S개의 가상 샘플링 포인트들로부터, 모든 가상 샘플링 포인트들에 대한 원하는 패닝 함수를 포함하는 행렬 G를 계산하도록 구성되는 수단 - 여기서 이고, gL(ø) 및 gR(ø) 엘리먼트들은 S개의 상이한 샘플링 포인트들에 대한 패닝 함수임 -,
상기 앰비소닉 오디오 신호 a(t)의 차수 N을 결정하도록 구성되는 수단,
상기 수 S 및 상기 차수 N으로부터, 모드 행렬 Ξ 및 상기 모드 행렬 Ξ의 대응하는 의사 역행렬 Ξ+를 계산하도록 구성되는 수단 - 여기서 이고, 는 상기 앰비소닉 오디오 신호 a(t)의 원형 조화 벡터 의 켤레 복소이고, Ym(ø)는 원형 조화 함수들임 -,
상기 행렬 G 및 Ξ+로부터 디코딩 행렬 D = GΞ+를 계산하도록 구성되는 수단,
라우드스피커 신호 l(t) = Da(t)를 계산하도록 구성되는 수단을 포함한다.
본 발명의 바람직한 추가 실시예들은 각각의 종속항들에서 개시된다.
본 발명의 예시적인 실시예들은 첨부 도면들을 참조하여 설명된다.
도 1은 라우드스피커 위치 øL = 30˚, øR = -30˚에 대한 원하는 패닝 함수를 도시한다.
도 2는 라우드스피커 위치 øL = 30˚, øR = -30˚에 대한 원하는 패닝 함수를 극좌표로서 도시한다.
도 3은 라우드스피커 위치 øL = 30˚, øR = -30˚에 대한 N = 4에서의 결과 패닝 함수를 도시한다.
도 4는 라우드스피커 위치 øL = 30˚, øR = -30˚에 대한 N = 4에서의 결과 패닝 함수를 극좌표로서 도시한다.
도 5는 본 발명에 따른 프로세싱의 블록도를 도시한다.
디코딩 프로세싱에서의 제1 단계에서, 라우드스피커의 위치들이 정의되어야 한다. 라우드스피커들은 청취 위치로부터 동일한 거리를 갖는 것으로 가정되고, 이에 따라 라우드스피커 위치들이 방위각으로 정의된다. 방위각은 ø로 나타내고, 반시계 방향으로 측정된다. 좌우 라우드스피커들의 방위각은 øL 및 øR 이고, 대칭 셋업에서 øR = -øL 이다. 전형적인 값은 øL = 30˚이다. 다음 설명에서, 모든 각 값들은 2π (rad) 또는 360˚의 정수배의 오프셋으로 해석될 수 있다.
원 상의 가상 샘플링 포인트들이 정의될 것이다. 이것들은 앰비소닉 디코딩 프로세싱에서 사용된 가상 소스 방향들이고, 이러한 방향들에 대하여, 예를 들어, 2개의 후방 라우드스피커 위치들에 대한 원하는 패닝 함수 값들이 정의된다. 가상 샘플링 포인트들의 수는 S로 나타내고, 대응하는 방향은 균등하게 원 주위에 분배되며, 다음을 초래한다.
S는 2N + 1보다 커야 하고, 여기서 N은 앰비소닉 차수를 나타낸다. 실험들은 바람직한 값이 S = 8N이라는 것을 보여준다.
좌우 라우드스피커에 대한 원하는 패닝 함수 gL(ø) 및 gR(ø)가 정의되어야 한다. WO 2011/117399 A1 및 상기 언급된 Batke/Keiler 논문으로부터의 접근과 대조적으로, 패닝 함수는 다중 세그먼트들에 대해 정의되고, 여기서 세그먼트들에 대하여 상이한 패닝 함수가 사용된다. 예를 들어, 원하는 패닝 함수들에 대하여 3개의 세그먼트들이 사용된다.
a) 2개의 라우드스피커들 사이의 전방에서 공지된 패닝 법칙, 예를 들어, 1997년 6월, V. Pulkki의 "Virtual sound source positioning using vector base amplitude panning", J. Audio 공학회, 45(6), 페이지 456 내지 466에 설명된 바와 같이 탄젠트 법칙 또는 동등하게, VBAP(vector base amplitude panning)가 사용된다.
b) 라우드스피커 원형 부분의 위치들을 넘는 방향들에 대하여, 후방에 대한 경미한 감쇠가 정의되고, 이를 통해 대략적으로 라우드스피커 위치에 반대인 각에서 이러한 패닝 함수의 일부가 0 값에 접근한다.
c) 좌측 라우드스피커에서 우측으로부터의 사운드 및 우측 라우드스피커에서 좌측으로부터의 사운드의 재생을 피하기 위하여 원하는 패닝 함수의 남아있는 부분은 0으로 설정된다.
원하는 패닝 함수가 영으로 접근하는 포인트 또는 각 값들은 좌측 라우드스피커에 대해 øL,0 및 우측 라우드스피커에 대해 øR,0로 정의된다. 좌우 라우드스피커들에 대한 원하는 패닝 함수는 다음과 같이 나타낼 수 있다.
패닝 함수 gL,1(ø) 및 gR,1(ø)는 라우드스피커 위치들 사이의 패닝 법칙을 정의하고, 반면에 패닝 함수 gL,2(ø) 및 gR,2(ø)는 전형적으로 후방에 대한 감쇠를 정의한다. 교차 포인트에서 다음 특성들이 만족되어야 한다.
원하는 패닝 함수는 가상 샘플링 포인트에서 샘플링된다. 모든 가상 샘플링 포인트들에 대해 원하는 패닝 함수값들을 포함하는 행렬은 다음과 같이 정의된다.
실수 또는 복소수 값의 앰비소닉 원형 조화 함수는 m = -N, ..., N 에 대해 Ym(ø)이고, 여기서 N은 상기에 언급된 바와 같이 앰비소닉 차수이다. 원형 조화는 구형 조화의 방위 의존(azimuth-dependent) 부분으로써 나타낸다(1999년 Applied Mathematical Sciences, 제93호, Earl G. Williams의 "Fourier Acoustics", Academic Press 참조).
실수 값의 원형 조화에 대하여,
원형 조화 함수는 전형적으로 다음에 의해 정의된다.
여기서 은 사용된 정규화 기법(normalisation scheme)에 따른 스케일링 인자이다.
원형 조화는 벡터에서 결합된다.
(·)*로 나타낸 켤레 복소는 다음으로 나타낸다.
가상 샘플링 포인트에 대한 모드 행렬은 다음에 의해 정의된다.
결과 2D 디코딩 행렬은 다음에 의해 연산된다.
여기서 Ξ+는 행렬 Ξ의 의사 역행렬이다. 식(1)에서 주어진 바와 같이 균등하게 분배된 가상 샘플링 포인트들에 대하여, 의사 역행렬은 Ξ의 수반 행렬(전치 및 켤레 복소)인 ΞH의 스케일링된 버젼으로 대체될 수 있다. 이러한 경우에 디코딩 행렬은
여기서 스케일링 인자 α는 원형 조화의 정규화 기법 및 설계 방향들의 수 S에 의존한다.
시간 인스턴스 t에 대한 라우드스피커 샘플 신호를 나타내는 벡터 l(t)는 다음에 의해 계산된다.
입력 신호로서 3D 고차 앰비소닉 신호 a(t)를 이용하는 경우에, 2D 공간에 대한 적절한 변환이 적용되고, 변환된 앰비소닉 계수 a'(t)를 초래한다. 이러한 경우에 식(16)은 l(t) = Da'(t)로 변경된다.
3D/2D 변환을 이미 포함하고 3D 앰비소닉 신호 a(t)에 직접 적용되는 행렬 D3D를 정의하는 것이 또한 가능하다.
다음에서, 스테레오 라우드스피커 셋업에 대한 패닝 함수의 예가 설명된다. 라우드스피커 위치들 사이에, 식(2) 및 식(3)으로부터 패닝 함수 gL,1(ø), gR,1(ø) 및 VBAP에 따른 패닝 이득이 사용된다. 이러한 패닝 함수는 라우드스피커 위치에서 그것의 최대값을 갖는 심장형 특성의 일 반면으로 이어진다. 각 øL,0 및 øR,0는 라우드스피커 위치에 반대인 위치를 갖도록 정의된다.
정규화된 패닝 이득은 gL,1L) = 1 및 gR,1R) = 1을 충족한다. øL 및 øR 쪽으로 향하는 심장형 특성은 다음에 의해 정의된다.
디코딩의 평가를 위하여, 임의의 입력 방향에 대한 결과 패닝 함수는 다음에 의해 획득될 수 있다.
여기서 는 고려된 입력 방향의 모드 행렬이다. 는 앰비소닉 디코딩 프로세스를 적용하는 경우에, 사용된 입력 방향 및 사용된 라우드스피커 위치들에 대한 패닝 가중치들을 포함하는 행렬이다.
도 1 및 도 2는 극좌표 포맷에서뿐만 아니라 원하는 (즉, 이론적인 또는 완벽한) 패닝 함수 대 선형 각 스케일의 이득을 각각 도시한다.
앰비소닉 디코딩에 대한 결과 패닝 가중치들은 사용된 입력 방향에 대해 식(21)을 이용하여 연산된다. 도 3 및 도 4는 극좌표 포맷에서뿐만 아니라 앰비소닉 차수 N = 4에 대해 계산된 대응하는 결과 패닝 함수 대 선형 각 스케일을 각각 도시한다.
도 1/도 2와 도 3/도 4의 비교는 원하는 패닝 함수가 잘 일치되고, 결과 네거티브 사이드 로브가 매우 작다는 것을 도시한다.
다음에서, 3D 대 2D 변환에 대한 예는 복소수 값의 구형 및 원형 조화를 위해 제공된다(실수 값 기반 함수에 대하여 유사한 방식으로 수행될 수 있음). 3D 앰비소닉에 대한 구형 조화는 다음과 같다.
여기서 n = 0, ..., N 은 차수 인덱스, m = -n, ..., n은 각도 인덱스, Mn,m은 정규화 기법에 따른 정규화 인자이고, θ는 경사각이며, 는 연관된 르장드르 함수(Legendre function)이다. 3D 경우에 대해 주어진 앰비소닉 계수 를 이용하여, 2D 계수는 다음에 의해 계산된다.
여기서 스케일링 인자는
도 5에서, 원하는 패닝 함수를 계산하는 단계 또는 스테이지(51)는 가상 샘플링 포인트들의 수 S뿐만 아니라 좌우 라우드스피커들의 방위각 øL 및 øR의 값들을 수신하고, - 상기 설명된 - 모든 가상 샘플링 포인트들에 대한 원하는 패닝 함수 값들을 포함하는 행렬 G로부터 계산한다. 앰비소닉 신호 a(t)로부터 차수 N은 단계/스테이지(52)에서 얻는다. S 및 N으로부터 모드 행렬 Ξ는 식(11) 내지 식(13)에 기초하여 단계/스테이지(53)에서 계산된다.
단계 또는 스테이지(54)는 행렬 Ξ의 의사 역행렬 Ξ+를 연산한다. 행렬 G 및 Ξ+로부터 디코딩 행렬 D는 식(15)에 따라 단계/스테이지(55)에서 계산된다. 단계/스테이지(56)에서 라우드스피커 신호 l(t)는 디코딩 행렬 D를 이용하여 앰비소닉 신호 a(t)로부터 계산된다. 앰비소닉 입력 신호 a(t)가 3D 공간 신호인 경우에, 3D 대 2D 변환은 단계 또는 스테이지(57)에서 수행될 수 있고, 단계/스테이지(56)은 2D 앰비소닉 신호 a'(t)를 수신한다.

Claims (5)

  1. 고차 앰비오소닉(High-Order Ambiosonics: HOA) 오디오 신호를 디코딩하기 위한 방법으로서,
    상기 HOA 오디오 신호를 수신하는 단계;
    패닝 함수 값들의 행렬 G를 결정하는 단계 - 상기 행렬 G는, 원 상의 S개의 가상 샘플링 포인트들 각각에 대해, 이득 벡터들 g1...gs을 포함하고, 라우드스피커 위치에 대향하여 위치된 제1 가상 샘플링 포인트에 대한 적어도 제1 패닝 함수 값은 0에 접근하고, 상기 라우드스피커 위치에 가깝게 위치된 제2 소스에 대한 적어도 제2 패닝 함수 값은 0에 접근하지 않는 값을 가짐 -;
    상기 행렬 G에 기초하여 디코딩 행렬을 결정하는 단계; 및
    적어도 하나의 프로세서에 의해, 상기 디코딩 행렬에 기초하여 상기 HOA 오디오 신호를 스테레오 라우드스피커 신호들로 렌더링하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 행렬 G는 크기 L x S를 가지며, L은 라우드스피커들의 수에 대응하는 방법.
  3. 제2항에 있어서, 상기 이득 벡터들 g1...gs은 상기 L개의 라우드스피커들의 S 방향들에서 패닝된 믹스(panned mix)를 달성하도록 지향되는, 방법.
  4. 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 프로세서로 하여금 제1항의 방법을 수행하게 하는 명령어들이 저장되어 있는 비일시적 컴퓨터 판독가능 매체.
  5. 고차 앰비오소닉(High-Order Ambiosonics: HOA) 오디오 신호를 디코딩하기 위한 장치로서,
    상기 HOA 오디오 신호를 수신하도록 구성된 제1 수신기;
    패닝 함수 값들의 행렬 G를 결정하기 위한 제1 프로세서 - 상기 행렬 G는, 원 상의 S개의 가상 샘플링 포인트들 각각에 대해, 이득 벡터들 g1...gs을 포함하고, 라우드스피커 위치에 대향하여 위치된 제1 가상 샘플링 포인트에 대한 적어도 제1 패닝 함수 값은 0에 접근하고, 상기 라우드스피커 위치에 가깝게 위치된 제2 소스에 대한 적어도 제2 패닝 함수 값은 0에 접근하지 않는 값을 가짐 -;
    상기 행렬 G에 기초하여 디코딩 행렬을 결정하기 위한 제2 프로세서; 및
    상기 디코딩 행렬에 기초하여 상기 HOA 오디오 신호를 스테레오 라우드스피커 신호들로 렌더링하기 위한 렌더러
    를 포함하는 장치.
KR1020227044967A 2012-03-28 2013-03-20 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 KR102678270B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP12305356.3A EP2645748A1 (en) 2012-03-28 2012-03-28 Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP12305356.3 2012-03-28
PCT/EP2013/055792 WO2013143934A1 (en) 2012-03-28 2013-03-20 Method and apparatus for decoding stereo loudspeaker signals from a higher-order ambisonics audio signal
KR1020217001737A KR102481338B1 (ko) 2012-03-28 2013-03-20 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020217001737A Division KR102481338B1 (ko) 2012-03-28 2013-03-20 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247020658A Division KR20240100475A (ko) 2012-03-28 2013-03-20 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20230003436A KR20230003436A (ko) 2023-01-05
KR102678270B1 true KR102678270B1 (ko) 2024-06-26

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011117399A1 (en) * 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011117399A1 (en) * 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback

Similar Documents

Publication Publication Date Title
US12010501B2 (en) Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
KR102678270B1 (ko) 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치
KR20240100475A (ko) 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치
TWI845344B (zh) 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法
WO2023126573A1 (en) Apparatus, methods and computer programs for enabling rendering of spatial audio
TW202416269A (zh) 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法