KR20090122145A - 신호의 처리 방법 및 장치 - Google Patents

신호의 처리 방법 및 장치 Download PDF

Info

Publication number
KR20090122145A
KR20090122145A KR1020090044743A KR20090044743A KR20090122145A KR 20090122145 A KR20090122145 A KR 20090122145A KR 1020090044743 A KR1020090044743 A KR 1020090044743A KR 20090044743 A KR20090044743 A KR 20090044743A KR 20090122145 A KR20090122145 A KR 20090122145A
Authority
KR
South Korea
Prior art keywords
signal
phase shift
information
shift information
phase
Prior art date
Application number
KR1020090044743A
Other languages
English (en)
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to US12/470,832 priority Critical patent/US8060042B2/en
Priority to PCT/KR2009/002744 priority patent/WO2009142465A2/en
Priority to EP09006959A priority patent/EP2124224A1/en
Publication of KR20090122145A publication Critical patent/KR20090122145A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 멀티채널 신호로 이루어진 저주파 대역 다운믹스 신호, 상기 저주파 다운믹스 신호의 파라미터 밴드에 대응하는 위상이동정보 및 공간정보를 수신하는 단계; 상기 저주파 대역 다운믹스 신호로부터 복원된 고주파 대역 다운믹스 신호와 상기 저주파 대역 다운믹스 신호를 포함하는 전대역 다운믹스 신호에 상기 공간정보를 적용하여 멀티채널 신호를 생성하는 단계; 상기 위상이동정보를 이용하여 상기 위상이동정보가 대응되지 아니하는 파라미터 밴드에 관한 추정 위상이동정보를 생성하는 단계; 및 상기 위상이동정보 및 상기 추정 위상이동정보에 기초하여 멀티채널 신호의 위상이 이동된 위상이동 멀티채널 신호를 생성하는 단계를 포함한는 것을 특징으로 하는 신호 처리 방법 및 이의 장치를 개시한다.
본 발명의 신호 처리 방법 및 장치에 따르면, 위상이동정보 및 추정 위상이동정보를 이용하여 디코딩된 오디오 신호 또는 음성 신호의 위상을 이동시켜 디코딩시 디코릴레이터에 의하여 효율적으로 재생하기 어려운 위상 차이 또는 딜레이 차이를 효율적으로 재생할 수 있고, 코딩 효율을 높이고 스테레오 신호의 파라미터 밴드별로 적합한 위상이동을 가능하게 한다.
Figure P1020090044743
위상이동정보, 추정 위상이동정보, 위상이동 멀티채널 신호.

Description

신호의 처리 방법 및 장치{A METHOD AND APPARATUS FOR PROCESSING A SIGNAL}
본 발명은 입력된 신호의 위상을 이동시킨 신호를 이용함으로써 신호의 음질을 향상시키는 신호 처리 방법 및 장치에 관한 것이다.
일반적으로, 모노 신호로부터 스테레오 신호를 생성하기 위하여 디코릴레이터(decorrelator)를 이용하여 신호를 코딩할 수 있다.
음성 신호를 디코릴레이터(decorrelator)를 이용하여 생성하는 경우, 디코릴레이터는 채널 신호들 사이에 존재하는 위상 차이 또는 딜레이 차이를 정확하게 재생하지 못하는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 디코딩된 오디오 신호 또는 음성 신호의 위상을 위상이동정보를 이용하여 이동함으로써, 음질이 향상된 신호의 처리 방법 및 장치를 제공하는데 그 목적이 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 본 발명의 신호 처리 장치 및 방법은, 위상이동정보에 기초하여 디코딩된 오디오 신호 또는 음성 신호의 위상을 이동시켜 디코딩시 디코릴레이터에 의하여 효율적으로 재생하기 어려운 위상 차이 또는 딜레이 차이를 효율적으로 재생할 수 있는 효과를 갖는다.
둘째, 본 발명의 신호 처리 장치 및 방법은, 인코딩부로부터 수신된 위상이동정보에 인터폴레이션(interpolation) 기법 및 스무딩(smoothing) 기법을 주파수 도메인상에서 이용하여 생성된 추정 위상이동정보를 함께 적용함으로써, 코딩 효율을 높이고 스테레오 신호의 파라미터 밴드별로 적합한 위상이동을 가능하게 한다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
특히, 본 발명에서 코딩이라 함은, 인코딩 및 디코딩을 모두 포함하는 개념으로 이해되어야 한다.
또한, 본 명세서에서 정보(information)란, 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
그리고, 본 명세서에서 신호의 일 예로 스테레오 신호를 설명하나, 이에 한정되지 아니하고, 스테레오 신호가 아닌 3 개 이상의 복수 개의 채널을 갖는 멀티채널 신호일 수 있다.
도 1은 본 발명의 실시예에 따른 신호 코딩 장치(100)를 나타낸다. 도 1을 참조하면, 신호 인코딩 장치(100)는 위상이동정보 생성부(110), 신호수정부(120), 다운믹싱부(130), 업믹싱부(140) 및 신호이동부(150)를 포함한다.
위상이동정보 생성부(110)는 위상이동 스테레오 신호를 입력받아 위상이동정보를 생성하는데, 위상이동정보 추출부(112) 및 위상이동정보 인코딩부(114)를 포함한다. 상기 위상이동 스테레오 신호는 하나 이상의 채널 신호(L', R')가 위상이 틀어진 신호일 수 있다. 위상이동정보 추출부(112)는 입력된 상기 위상이동 스테레오 신호의 채널 신호의 위상을 일치시키기 위하여 이동될 위상의 정도를 추정함으로써, 상기 위상이동정보(phase shift information)를 상기 위상이동 스테레오 신호로부터 생성한다.
상기 위상이동정보는 상기 위상이동 스테레오 신호의 교차상관 정보에 기초한 딜레이를 측정함으로써 일정 주파수 범위 또는 시간 범위마다 가변적으로 결정될 수 있다. 이후, 상기 추출된 위상이동정보는 위상이동정보 인코딩부(114)에서 인코딩되어 전송된다.
상기 위상이동정보는 상기 스테레오 신호의 위상이 이동되었다는 것을 나타내는 플래그 정보(phase_shift_flag)일 수 있고, 상기 플래그 정보뿐만 아니라 위상이 이동된 정도, 위상이 이동되는 채널신호, 위상이동이 일어나는 주파수 대역 및 위상이동과 대응하는 프레임 및/또는 시간 정보 등의 위상이동과 관련된 정보를 더 포함할 수 있다.
첫째로, 상기 위상이동정보가 플래그 정보(phase_shift_flag)만을 나타내는 경우, 상기 위상이동 스테레오 신호는 고정된 값을 이용하여 위상이 이동됨으로써 상기 스테레오 신호를 생성할 수 있다. 예를 들면, 상기 위상이동 스테레오 신호 중 우측 채널의 위상을 π/2만큼 감소시키거나 좌측 채널의 위상을 π/2 만큼 증가시킴으로써 좌측 및 우측 채널이 직교하도록 위상을 이동시켜 상기 스테레오 신호를 생성할 수 있고, π/2의 위상이동에 한정되지 아니하고 좌측 및 우측 채널이 직교하도록 위상을 위동시켜 상기 스테레오 신호를 생성할 수 있다.
이 때, 상기 이동된 위상은 상기 위상이동 스테레오 신호의 전체 주파수 밴드에 동일하게 적용되어 상기 스테레오 신호를 생성할 수 있다. 또한, 상기 위상이동 스테레오 신호의 하나 이상의 채널의 위상을 π/2만큼 변형한다는 정보 또는 직교하기 위하여 이동된 위상에 관한 정보는 별도로 전송되지 아니하고, 추후 디코더단에 기설정된 정보를 이용할 수 있으며, 이에 한정되지 아니한다.
반면, 위상이동에 이용되는 상기 고정된 값이 파라미터 밴드별로 두 개 이상인 경우에는 기 설정된 파라미터 밴드의 범위에 적용되어 상기 스테레오 신호를 생성할 수도 있다.
상기 위상이동정보가 플래그 정보(phase_shift_flag)뿐만 아니라, 위상이동과 관련된 상세 정보를 더 포함할 수도 있다. 상기 상세정보는 위상의 이동정도, 위상이 이동되는 채널신호, 위상이동이 일어나는 주파수 대역 및 시간 정보를 포함할 수 있으며, 상기 위상의 이동정도는 위상이동정보 추출부(112)에 입력되는 상기 위상이동 스테레오 신호의 교차상관 정보에 기초한 딜레이를 측정하여 결정될 수 있다.
한편, 상기 위상이동정보는 프레임별로 상기 복수 채널 신호의 위상이 이동되는 정도를 가변적으로 나타낼 수 있고, 상기 위상이동정보가 플래그 정보만을 포 함하는 경우에는 프레임별로 위상이 이동되었는지 여부를 나타낼 수 있다. 또한, 상기 위상이동정보가 플래그 정보 및 위상이동에 관한 상세 정보를 포함하는 경우는, 상기 상세 정보는 서브밴드별로 위상의 이동정도를 가변적으로 나타낼 수 있고, 일정한 시간 범위마다 가변적으로 해당 시간에서의 위상의 이동정도를 나타낼 수도 있다.
신호수정부(120)는 위상이동 스테레오 신호(L', R') 및 위상이동정보를 입력받아, 상기 위상이동 스테레오 신호의 위상을 이동시켜 수정함으로써 스테레오 신호(L, R)를 생성한다. 예를 들면, 상기 위상이동 스테레오 신호(L', R')는 하나 이상의 채널 신호의 위상이 틀어진 신호인 경우, 상기 스테레오 신호(L, R)는 상기 위상이 틀어진 신호들의 위상을 수정하여 위상을 일치시킨 신호일 수 있다. 반면, 상기 위상이동 스테레오 신호가(L', R')가 위상이 일치하는 신호인 경우에는, 신호수정부(120)가 고의적으로 상기 위상이동 스테레오 신호의 위상을 수정하여 음원의 특성이 수정된 스테레오 신호를 생성할 수도 있다.
즉, 상술한 바와 같이, 위상이 불일치하는 위상이동 스테레오 신호의 위상을 일치하도록(in-phase) 위상을 수정하고, 위상이동정보를 생성하는 방법에 대하여 서술하였으나, 위상이 일치하는 신호를 고의적으로 이동시켜 위상이 불일치하는 신호로 만들고(out-of-phase), 이에 대응하는 위상이동정보를 생성하는 것도 가능하다.
다운믹싱부(130)는 상기 스테레오 신호를 입력받아 다운믹스 신호 및 공간 정보를 생성할 수 있다. 상기 스테레오 신호는 3 개 이상의 채널을 갖는 복수 채 널 신호일 수 있으며, 이 경우, 상기 다운믹스 신호는 스테레오 다운믹스 신호 또는 3개 이상의 채널을 갖는 다운믹스 신호일 수 있다.
또한, 다운믹싱부(130)는 상기 스테레오 신호의 속성을 나타내는 공간정보(spatial information)를 생성할 수 있다. 상기 공간정보는 디코더에서 상기 다운믹스 신호를 상기 스테레오 신호로 디코딩하기 위한 것으로, 채널 레벨 차이 정보(Channel Level Difference, CLD), 채널 예측 계수(Channel Prediction Codfficient), 및 채널간 상관정보(Inter-Channel Correlation, ICC) 등을 포함할 수 있다.
또한, 비트스트림 생성부(미도시)는 상기 다운믹스 신호, 상기 공간정보 및 상기 위상이동정보를 포함하는 하나의 비트스트림을 생성할 수 있다.
한편, 상기 다운믹스 신호를 이루는 입력신호는 상기 스테레오 신호에 한정되지 아니하고, 하나 이상의 오브젝트 신호로 구성된 복수 오브젝트 신호일 수 있다. 이 경우, 상기 공간정보는 상기 복수 오브젝트 신호에 관한 정보임은 당업자에게 자명하다 할 것이다.
업믹싱부(140)는 상기 공간정보를 이용하여 상기 다운믹스 신호를 업믹싱함으로써 스테레오 신호를 생성할 수 있다. 상기 업믹싱이라 함은, 상기 다운믹스 신호의 채널보다 많은 수의 채널 신호를 생성하기 위하여 업믹싱 매트릭스를 적용하는 것을 지칭하고, 업믹싱된 신호라 함은 상기 업믹싱 매트릭스가 적용된 신호를 지칭한다. 따라서, 상기 스테레오 신호는 상기 다운믹스 신호보다 많은 수의 채널을 갖는 신호이다. 또한, 상기 스테레오 신호는 상기 업믹싱 매트릭스가 적용된 신호 자체를 지칭할 수 있고, 상기 업믹싱 매트릭스가 적용됨으로써 복수개의 채널을 갖도록 생성된 QMF 도메인 신호일 수도 있으며, 상기 QMF 도메인 신호가 시간 도메인 상의 신호로 변환된 최종 신호일 수도 있다.
신호 이동부(150)는 상기 스테레오 신호 및 상기 위상이동정보를 이용하여 상기 스테레오 신호의 하나 이상의 채널의 위상을 이동시킴으로써 위상이동 스테레오 신호를 생성한다. 신호 이동부(150)는 위상이동정보 디코딩부(152), 추정 위상이동정보 생성부(154) 및 위상이동정보 적용부(156)를 포함한다.
위상이동 정보 디코딩부(152)는 수신된 위상이동정보를 디코딩한다. 상기 디코딩된 위상이동정보는 상기 스테레오 신호의 주파수 전대역에 적용되는 정보일 수 있고, 일부 파라미터 밴드에 대응되는 정보일 수 있다. 이 때, 상기 위상이동정보는 QMF 도메인 상의 정보일 수 있고, 상기 스테레오 신호도 QMF 도메인 신호일 수 있으나 이에 한정되지는 아니한다.
위상이동정보 디코딩부(254)에서 디코딩된 상기 위상이동정보는 상기 스테레오 신호의 위상이 이동되는지 여부를 나타내는 플래그 정보(phase_shift_flag)만을 포함할 수 있다. 상기 위상이동정보는 프레임별로 가변적으로 포함될 수 있고, 파라미터 밴드별로 가변적으로 포함될 수 있으며, 그 의미는 하기 표 1 과 같다.
Phase_shift_flag 의미(Meaning)
1 스테레오 신호에 위상이동정보가 적용됨
0 스테레오 신호에 위상이동정보가 적용되지 아니함
상기 위상이동정보(phas_shift_flag)가 상기 스테레오 신호에 위상이동정보가 적용되었음을 나타내는 플래그 정보인 경우, 추정 위상이동정보 생성부(154)에서 상기 위상이동정보를 이용하여 추정 위상이동정보를 생성하지 아니하고, 바로 위상이동정보 적용부(156)는 상기 스테레오 신호에 상기 위상이동정보(즉, 고정된 이동위상값)를 적용하여 위상이동 스테레오 신호를 복원할 수 있다. 예를 들면, 상기 스테레오 신호의 하나 이상의 채널을 π/2만큼 증가시키거나 감소시킬 수 있으며, 상기 스테레오 신호가 서로 직교하도록 위상을 이동시킬 수 있다. 이 때, π/2 또는 직교를 위하여 이동되는 위상의 크기는 디코딩 장치에 기설정된 값을 이용하며, 별도로 인코더에서 측정되어 전송되지 아니한다. 한편, 상기 위상이동정보는 프레임별로 상기 복수 채널 신호의 위상이 이동되는 정도를 가변적으로 나타낼 수 있고, 상기 위상이동정보가 플래그 정보만을 포함하는 경우에는 프레임별로 위상이 이동되었는지 여부를 나타낼 수 있다.
이 때, 상기 π/2 또는 직교를 위하여 이동되는 위상의 크기는 상기 스테레오 신호의 전체 주파수 밴드에 동일하게 적용되어 상기 위상이동 스테레오 신호를 생성할 수 있고, 만일 이동되는 위상의 크기가 각 채널 신호의 파라미터 밴드별로 설정되어 있는 경우에는 설정된 파라미터 밴드별로 적용되어 상기 위상이동 스테레오 신호를 생성할 수 있다.
둘째로, 상기 위상이동정보는 상기 플래그 정보(phase_shift_flag)뿐만 아니라, 위상이동과 관련된 상세 정보를 더 포함하는 경우, 상기 상세 정보를 이용하여 위상이동 스테레오 신호를 복원할 수 있다. 상기 상세 정보는 위상의 이동정도, 위상이 이동되는 채널 신호, 위상이동이 일어나는 주파수 대역, 위상이동과 대응하는 시간 정보 등을 포함하고, 이들의 역변환을 위한 정보를 포함할 수 있다. 또한, 상기 위상의 이동정도는 인코딩 장치에 입력된 위상이동 스테레오 신호의 교차상관 정보에 기초한 딜레이를 이용하여 결정된 것일 수 있다.
상기 위상이동정보가 플래그 정보 및 위상이동에 관한 상세 정보를 포함하는 경우는, 상기 상세 정보는 서브밴드별 또는 파라미터 밴드별로 위상의 이동정도를 가변적으로 나타낼 수 있고, 일정한 시간 범위마다 가변적으로 해당 시간에서의 위상의 이동정도를 나타낼 수도 있다.
상기 위상이동정보가 플래그 정보뿐만 아니라, 위상이동에 관한 상세 정보를 포함하는 경우, 추정 위상이동정보 생성부(142)는 상기 위상이동정보를 이용하여 상기 위상이동정보가 대응되지 아니하는 상기 스테레오 신호의 파라미터 밴드에 관한 추정 위상이동정보(estimated phase shift information)를 더 생성하는데, 이와 관련된 상세한 내용은 도 2a 내지 도 3b를 참조하여 후술하기로 한다.
위상이동정보 적용부(156)는 업믹싱부(140)에서 생성된 스테레오 신호에 상기 위상이동정보 및 상기 추정 위상이동정보를 적용하여 위상이동 스테레오 신호를 생성한다.
이와 같이, 업믹싱된 스테레오 신호에 공간정보 이외의 위상이동정보 및 추정 위상이동정보를 더 이용함으로써, 상기 공간정보 만을 이용하여 상기 다운믹스 신호를 디코딩하는 경우, 손실이 발생하여 잘 복원되지 안히나느 위상 차이 또는 딜레이 차이 등을 효율적으로 재생할 수 있고, 음질을 향상시킬 수 있게 된다.
도 2a 및 도 2b는 추정 방법을 거친 공간정보를 나타내는 것이다. 본 명세서에서 추정(estimation)이란, 주변 정보를 이용하여 수신되지 않은 유닛에 대응하는 정보를 인터폴레이션(interpolation)하는 것과 양자화 레벨 등을 조절하여 정보의 크기 차이 등을 감소시키는 스무딩(smoothing)하는 것을 포함한다. 시간상 유닛인 타임슬롯 중 일부 타임슬롯에 대응하는 공간정보만을 디코딩 장치로 전송하여, 코딩효율을 높일 수 있다. 이 때, 디코딩 장치에서는 대응되는 공간정보가 수신되지 아니한 타임슬롯에 대하여 수신된 공간정보를 이용하여 인터폴레이션(interpolation)할 수 있다.
도 2a는 인터폴레이션을 거쳐 모든 타임슬롯(또는 시간 유닛)에 대응하는 공간정보가 생성된 것을 나타내는 것이다. 시간 도메인상으로 인터폴레이션된(스무딩되기 전) 공간정보는 타임슬롯 별로 크기 차이가 커서 음질을 떨어뜨릴 수 있다. 따라서, 양자화레벨 간격을 작게 하는 등의 방법으로 공간정보를 스무딩하는 것이 필요하게 된다.
도 2b는 스무딩된 공간정보의 크기를 나타내는 것이다. 도 2b를 참조하면, 타임 유닛 1, 4, 6, 8, 9에서의 파라미터의 크기가 도 2a에 비하여 감소하거나 증가하여 단계적인 크기의 변화가 일어났음을 알 수 있다. 또한, 시간 유닛 9 및 9 사이의 피크(peak)가 작아졌음을 알 수 있다. 이와 같은 최대값의 감소 또는 단계적인 크기 변화는 복원되는 신호의 음질을 향상시키는 효과가 있다.
도 3a 및 도 3b는 주파수 도메인 상에서 추정된 위상이동정보를 (estimated phase shift information)을 나타내는 것이다. 공간정보와 달리, 위상이동정보는 주파수 도메인으로 인터폴레이션 및 스무딩될 수 있다.
먼저 도 3a를 참조하면, 주파수 유닛인 파라미터 밴드 중 일부 파라미터 밴드에 대응하는 위상이동정보만을 디코딩 장치로 전송하여, 코딩 효율을 높일 수 있다. 이 때, 디코딩 장치에서는 대응되는 위상이동정보가 수신되지 아니한 파라미터 밴드에 대하여 수신된 위상이동정보를 이용하여 인터폴레이션(interpolation)하여 추정 위상이동정보를 생성할 수 있다. 도 3a는 인터폴레이션을 거쳐 모든 파라미터 밴드(또는 주파수 유닛)에 대응하는 추정 위상이동정보가 생성된 것을 나타내는 것이다. 주파수 도메인상으로 인터폴레이션된(스무딩되기 전) 위상이동정보는 파라미터 밴드 별로 크기 차이가 커서 음질을 떨어뜨릴 수 있다. 따라서, 양자화레벨 간격을 작게 하는 등의 방법으로 위상이동정보를 스무딩하는 단계가 더 필요하게 된다.
도 3b는 스무딩 방법을 통하여 생성된 추정 위상이동정보 및 위상이동정보의 크기를 나타내는 것이다. 도 3b를 참조하면, 파라미터 밴드 유닛 200 및 300 사이, 700 및 800 사이의 피크(peak)가 작아졌음을 알 수 있다. 이와 같이 위상이동정보가 파라미터 밴드별로 단계적으로 점진적으로 증가 또는 감소함으로써 복원되는 위상이동 스테레오 신호의 음질 손실을 줄이는 효과를 갖는다. 또한, 위상이동정보가 파라미터 밴드별로 수신되고, 추정 위상이동정보를 생성하여 적용함으로써 실질적으로 이동된 위상을 이용하여 파라미터 밴드별로 가변적으로 적용할 수 있으므로 위상이동 스테레오 신호를 더 섬세하게 복원할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 신호 처리 장치(400)를 나타내는 것이다. 신호 처리 장치(400)는 크게 복수채널 인코딩부(410), 대역폭 확장신호 인코딩부(420), 오디오 신호 인코딩부(430), 음성 신호 인코딩부(435), 다중화부(440), 역다중화부(450), 오디오 신호 디코딩부(460), 음성 신호 디코딩부(465), 대역폭 확장신호 디코딩부(470) 및 복수채널 디코딩부(480)를 포함한다.
먼저, 복수채널 인코딩부(410)에서 스테레오 신호를 다운믹싱하여 생성하는 다운믹스 신호를 전대역 다운믹스 신호라 지칭하고, 추후 상기 전대역 다운믹스 신호로부터 고주파 대역의 신호가 제거되어 저주파 대역만이 존재하는 다운믹스 신호를 저주파 대역 다운믹스 신호라 지칭한다.
복수채널 인코딩부(410)는 스테레오 신호를 입력받는다. 입력된 복수채널 신호를 다운믹싱하여 전대역 다운믹스 신호를 생성하는 한편, 스테레오 신호에 대응하는 공간정보를 생성한다. 상기 공간정보는 채널 레벨 차이정보, 채널 예측 계수, 채널간 상관정보, 및 다운믹스 게인 정보 등을 포함할 수 있다. 본 발명의 일실시예에 따른 복수채널 인코딩부(410)는 입력 신호가 위상이 불일치한 위상이동 스테레오 신호인 경우, 위상을 수정하여 스테레오 신호 및 위상이동정보를 생성하고 이를 공간정보와 함께 전송할 수 있고, 입력 신호의 위상을 수정하지 아니하고 단순히 디코더단에서 위상을 이동하도록 위상이동정보만을 생성하여 전송할 수 있는데, 이는 도 1을 참조하여 서술한 바와 같으므로, 이 과정에 대한 구체적인 설명은 생략하기로 한다. 따라서, 복수채널 인코딩부(410)는 위상이동정보 생성부(412), 신호수정부(414) 및 다운믹싱부(416)를 포함하며, 이들은 도 1의 동일한 명칭을 갖는 유닛과 그 구성 및 기능이 동일하므로 구체적인 설명을 생략하기로 한다.
대역폭 확장신호 인코딩부(420)는 상기 전대역 다운믹스 신호를 입력받아, 상기 전대역 다운믹스 신호 중 고주파 대역의 신호에 대응하는 확장정보를 생성할 수 있다. 상기 확장정보는 추후 디코더단에서 고주파 대역이 제거된 저주파 대역 다운믹스 신호를 상기 전대역 다운믹스 신호로 복원하기 위한 정보이고, 공간정보와 함께 전송할 수 있다.
또한, 다운믹스 신호는 신호의 특성에 기초하여 오디오 신호 코딩 방식 또는 음성 신호 코딩 방식으로 코딩될지 결정되고, 상기 코딩방식을 결정하는 모드정보를 생성한다(미도시). 이 때, 상기 오디오 코딩 방식은 MDCT(Modified Discrete Cosine Transform)을 이용하는 것일 수 있으나, 본 발명은 이에 한정되지 아니한다. 상기 음성 코딩 방식(speech coding scheme)은 AMR-WB(Adaptive multi-rate Wide-Band) 표준에 따른 것일 수 있으나, 본 발명은 이에 한정되지 아니한다.
오디오 신호 인코딩부(430)는 대역폭 확장신호 인코딩부(420)로부터 입력된 확장정보 및 전대역 다운믹스 신호를 이용하여 고주파 영역이 제거된 저주파 대역 다운믹스 신호를 오디오 신호 코딩 방식에 따라 인코딩한다.
상기 오디오 신호 코딩 방식으로 코딩되는 신호는, 오디오 신호일 수 있고, 오디오 신호에 일부 음성 신호가 포함된 신호일 수 있다. 또한, 오디오 신호 인코딩부(430)는 주파수 도메인 인코딩부일 수 있다.
음성 신호 인코딩부(435)는 대역폭 확장신호 인코딩부(420)로부터 입력된 확장정보 및 전대역 다운믹스 신호를 이용하여 고주파 영역이 제거된 저주파 대역 다운믹스 신호를 음성 신호 코딩 방식에 따라 인코딩한다.
상기 음성 신호 코딩 방식으로 코딩되는 신호는, 음성 신호일 수 있고, 음성 신호에 일부 오디오 신호가 포함된 신호일 수 있다. 또한, 음성 신호 인코딩부(435)는 선형 예측 부호화(LPC: Linear Prediction Coding) 방식을 더 이용할 수 있다. 입력 신호가 시간축 상에서 높은 중복성을 가지는 경우, 과거 신호로부터 현재 신호를 예측하는 선형 예측에 의해 모델링될 수 있는데, 이 경우 선형 예측 부호화 방식을 채택하면 부호화 효율을 높일 수 있다. 한편, 음성 신호 인코딩부(435)는 시간 도메인 인코딩부일 수 있다.
다중화부(440)는 인코딩된 오디오 신호 또는 음성 신호, 위상이동정보 및 확장정보를 포함하는 공간정보를 이용하여 전송할 비트스트림을 생성한다.
역다중화부(450)는 다중화부(440)로부터 수신된 모든 신호를 분리할 수 있다. 오디오 코딩 방식 및 음성 코딩 방식 중 어느 하나 이상에 따라 인코딩된 신호를 수신할 수 있고, 상기 신호는 공간정보뿐만 아니라, 위상이동정보, 확장정보 및 저주파 대역 다운믹스 신호일 수 있다. 오디오 신호 디코딩부(460)는 신호를 오디오 신호 코딩 방식에 따라 디코딩한다. 오디오 신호 디코딩부(460)에 입력되어 디코딩되는 신호는 오디오 신호일 수 있고, 오디오 신호에 일부 음성 신호가 포함된 신호일 수 있다. 또한, 오디오 신호 디코딩부(460)는 주파수 도메인 디코딩부를 포함할 수 있고, IMDCT(Inverse Modified Discrete Coefficient Tramsform) 를 이용할 수 있다.
음성 신호 디코딩부(465)는 신호를 음성 신호 코딩 방식에 따라 디코딩한다. 음성 신호 디코딩부(465)에서 디코딩되는 신호는 음성 신호일 수 있고, 음성 신호에 일부 오디오 신호가 포함된 신호일 수 있다. 또한, 음성 신호 디코딩부(465)는 시간 도메인 디코딩부를 포함할 수 있고, 선형 예측 부호화(LPC: Linear Prediction Coding) 방식을 더 이용할 수 있다.
대역폭 확장 디코딩부(470)는 오디오 신호 디코딩부(460)로 디코딩된 신호 또는 음성 신호 디코딩부(465)로 디코딩된 신호인 저주파 대역 다운믹스 신호 및 확장정보를 입력받아, 인코딩시 제거된 고주파 영역에 해당하는 신호가 복원된 전대역 다운믹스 신호를 생성한다.
상기 전대역 다운믹스 신호는, 상기 저주파 대역 다운믹스 신호 전부 및 상기 확장정보를 이용하여 생성될 수 있을 뿐만 아니라, 상기 저주파 대역 다운믹스 신호의 일부를 이용하여 생성될 수도 있다.
복수채널 디코딩부(480)는 업믹싱부(482), 추정 위상이동정보 생성부(484) 및 위상이동정보 적용부(486)를 포함한다. 먼저, 업믹싱부(482)가 상기 전대역 다운믹스 신호, 공간정보, 위상이동정보를 입력받아, 상기 공간정보를 상기 전대역 다운믹스 신호에 적용하여 스테레오 신호를 생성한다. 또한, 추정 위상이동정보 생성부(484)에서 위상이동정보를 이용하여 대응되는 위상이동정보가 수신되지 아니한 파라미터 밴드에 관한 추정 위상이동정보를 생성한다. 이후, 위상이동정보 적용부(486)는 위상이동정보 및 추정 위상이동정보를 대응하는 스테레오 신호의 파라미터 밴드에 적용함으로써 위상이동 스테레오 신호를 복원하는데, 이 과정에 대한 상세한 설명은 도 1을 참조하여 상세하게 서술하였으므로 이를 생략하기로 한다.
이와 같이, 본 발명의 신호 처리 방법 및 장치는, 복수채널 디코딩부(480)를 이용하여 복원된 스테레오 신호에 위상이동정보 및 추정 위상이동정보를 적용하여 위상이동 스테레오 신호를 생성함으로써, 종래의 복수채널 디코딩부가 재생하기 어려운 위상 차이 또는 딜레이 차이를 효과적으로 재생할 수 있게 한다.
도 5은 본 발명의 보상정보의 비트스트림 구조를 나타내는 것이다. 도 5를 참조하면, 공간정보(510)는 필수적으로 전송되는 정보이고, 위상이동정보(520)는 선택적으로 이용될 수 있다. 위상이동정보(520)는 기존 비트스트림의 뒷부분에 추가적으로 위치하는 신규 확장 영역에 포함된다.
따라서, 위상이동정보(520)가 종래의 HE AAC v2와 같은 디코딩 장치에서는 디코딩되지 않고, 신규 확장 영역까지 지원하는 디코딩 장치에서는 디코딩되어 이용될 수 있으므로, 하위 호환성(Backword Compatibility)을 갖게 된다.
또한, 본 발명의 위상이동정보는 음성 신호 및/또는 오디오 신호를 적절한 방식에 따라 코딩하기 위한 신호 처리 장치에 포함되는 복수채널 인코딩부 및 복수채널 디코딩부에서 이용될 수 있다.
도 6은 본 발명의 또다른 실시예에 따른 신호 처리 장치(600)를 나타내는 것이다. 신호 처리 장치(600)는 하모닉 추정부(610), 하모닉 수정부(620), 인코딩부(630) 및 디코딩부(640)를 포함한다.
먼저, 하모닉 추정부(610)는 스테레오 신호(또는 복수 채널 신호, X1)를 입력받아, 스테레오 신호의 하모닉(harmonic) 성분의 시간 유닛 및 파라미터 밴드 유닛 상의 위치 및 크기 등을 나타내는 하모닉 정보(harmonic information)를 생성할 수 있다. 이 때, 상기 하모닉(harmonic) 성분은 입력 신호의 피치(pitch) 성분일 수 있다.
종래의 LTP(Long-Term Prediction)을 사용하는 코딩장치, 예를 들면, AAC-LTP는 LTP 를 이용하여 하모닉 성분(또는 피치 성분)을 제거한 레지듀얼 신호를 코딩하는 방식을 채택한다. 그러나, 음성 및 오디오 신호는 하모닉(또는 피치) 성분의 특성에 따라 음원의 성격이 결정될 수 있으므로 하모닉(또는 피치) 성분이 잘 보존되는 것이 바람직하다. 따라서, 하모닉 수정부(620)는 종래의 LTP를 사용하는 대신에 하모닉 추정부(610)에서 추정된 하모닉 성분을 더 강조하도록 상기 하모닉 정보를 이용하여 입력 신호를 수정함으로써 하모닉 수정 스테레오 신호(X1')를 생성한다. 예를 들면, 주파수 영역에서 하모닉 성분을 강조하거나, 시간 영역에서 피치 정보에 해당하는 신호를 강조하여 하모닉 수정 스테레오 신호(X1')를 생성할 수 있으며, 이는 하기 수학식 1과 같이 계산될 수 있다.
Figure 112009030653853-PAT00001
이 때,
Figure 112009030653853-PAT00002
는 피치 딜레이이고,
Figure 112009030653853-PAT00003
는 게인이다. 일반적으로 LTP에서 게인은
Figure 112009030653853-PAT00004
인데 수학식 1에서는 양수이고, 상세하게는
Figure 112009030653853-PAT00005
인 것이 바람직하다.
인코딩부(630)는 하모닉 성분 또는 피치 성분을 강조한 하모닉 수정 스테레오 신호(X1')를 입력받아 도 4의 복수채널 인코딩부(410)와 같은 방법으로 인코딩하여 다운믹스 신호 및 공간정보를 생성한다.
이후, 디코딩부(640)에서 공간정보, 하모닉 정보 및 다운믹스 신호를 이용하 여 스테레오 신호를 복원할 수 있다. 또한, 하모닉 추정부(610)에서 생성된 하모닉 정보는 하모닉 수정부(620)로만 입력되고 디코딩부(640)로 전송되지 아니할 수 있다. 디코딩부(640)에 하모닉 정보가 전송되지 아니하는 경우, 입력된 공간정보 및 다운믹스 신호만을 이용하여 스테레오 신호를 디코딩한다.
도 7은 본 발명의 일실시예에 따른 위상이동정보 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부가 구현된 제품의 개략적인 구성을 보여주는 도면이고, 도 18은 본 발명의 실시예에 따른 위상이동정보 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부가 구현된 제품들의 관계를 보여주는 도면이다.
도 7을 참조하면, 유무선 통신부 유무선 통신부(710)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(710)는 유선통신부(711), 적외선통신부(712), 블루투스부(713), 무선랜통신부(714) 중 하나 이상을 포함할 수 있다.
사용자 인증부는(720)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부(721), 홍채인식부(722), 얼굴인식부(723) 및 음성인식부(724) 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(730)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부(731), 터치패드부(732), 리모컨부(733) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 한편, 후술한 메타데이터 수신부(741)에서 출력되는 복수개의 프리셋 정보에 대한 프리셋 메타데이터가 디스플레이부(762)를 통하여 화면에 현시되는 경우에, 입력부(730)를 통하여 사용자가 프리셋 메타데이터를 선택할 수 있고, 선택된 프리셋 메타데이터에 대한 정보가 제어부(750)로 입력된다.
신호 디코딩부(740)는 위상이동정보 디코딩부(941), 추정 위상이동정보 생성부(942) 및 위상이동정보 적용부(943)를 포함하는데, 위상이동정보 디코딩부(941)는 수신된 위상이동정보를 디코딩한다. 상기 위상이동정보는 플래그 정보(phase_shift_flag)만을 포함할 수 있고, 상세 정보를 더 포함할 수 있으며, 프레임별로 또는 파라미터 밴드별로 가변적일 수 있다. 상기 위상이동정보가 파라미터 밴드별로 가변적인 경우, 추정 위상이동정보 생성부(942)는 상기 위상이동정보를 이용하여 대응되는 위상이동정보가 수신되지 아니하는 파라미터 밴드에 관한 추정 위상이동정보를 생성한다. 이후, 위상이동정보 적용부(943)는 공간정보를 이용하여 이미 업믹싱된 스테레오 신호에 상기 위상이동정보 및 상기 추정 위상이동정보를 적용하여 스테레오 신호 중 어느 하나 이상의 채널의 해당 파라미터 밴드의 위상이 이동된 위상이동 스테레오 신호를 생성한다. 이들은 도 1의 동일한 명칭을 갖는 유닛과 그 구성 및 기능이 동일하므로 상세한 설명은 생략하기로 한다.
제어부(750)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부(740)와 출력부(760)의 모든 프로세스를 제어한다. 상술한 바와 같이, 제어부(750)에 입력부(730)로부터 사용자 입력, 예를 들면, 출력 신호의 위상이동의 on/off, 메타 데이터의 입/출력, 신호 디코딩부의 작용 on/off 등이 입력되는 경우, 이를 이용하여 신호를 디코딩한다.
출력부(760)는 신호 디코딩부(740)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 신호 출력부(761) 및 디스플레이부(762)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 신호 출력부(761)를 통하여 출력되고, 비디오 신호일 때 출력 신호는 디스플레이부(762)를 통해 출력된다. 또한, 입력부(730)에 메타데이터가 입력된 경우에는 이를 디스플레이부(762)를 통하여 화면에 현시한다.
도 8은 도 7에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서, 도 8a를 참조하면, 제1 단말(810) 및 제2 단말(820)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있음을 알 수 있다. 상기 유무선 통신부를 통해서 통신하는 데이터 또는 비트스트림은 본 발명의 도 5의 비트스트림의 형태일 수 있고, 도 1 내지 도 6을 참조하여 설명한 본 발명의 위상이동정보 및 추정 위상이동정보 등을 포함하는 데이터일 수 있다. 도 8b를 참조하면, 서버(830) 및 제1 단말(840) 또한 서로 유무선 통신을 수행할 수 있음을 알 수 있다.
도 9는 본 발명의 일실시예에 따른 위상이동정보 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부를 포함하는 복수채널 디코딩부가 구현된 방송신호 디코딩 장치(900)의 개략적인 구성을 보여주는 도면이다.
도 9를 참조하면, 디멀티플렉서(920)는 튜너(910)로부터 TV방송과 관련된 데 이터들을 수신한다. 수신된 데이터들은 디멀티플렉서(920)에서 분리되고, 데이터 디코더(930)를 통하여 디코딩된다. 한편, 디멀티플렉서(920)에서 분리된 데이터들은 HDD 와 같은 저장매체(950)에 저장될 수 있다.
디멀티플렉서(920)에서 분리된 데이터들은 복수채널 디코딩부(941) 및 비디오 디코딩부(942)를 포함하는 신호 디코딩부(940)로 입력되어 오디오 신호 및 비디오 신호를 디코딩한다. 복수채널 디코딩부(941)는 본 발명의 일실시예에 따른 위상이동정보 디코딩부(941A), 추정 위상이동정보 생성부(941B) 및 위상이동정보 적용부(941C) 를 포함하고, 이는 도 4의 동일한 명칭의 유닛들과 그 구성 및 기능이 동일하므로 상세한 설명을 생략하기로 한다. 신호 디코딩부(941)는 수신된 위상이동정보 및 스테레오 신호 이외에 추정 위상이동정보 등을 이용하여 신호를 디코딩하고, 비디오 신호가 입력되는 경우 비디오 신호도 디코딩하여 출력하며, 메타데이터가 생성되는 경우에는 이를 텍스트 형태로 출력한다.
출력부(970)는 비디오 디코딩부(942)에서 출력된 비디오 신호와 오디오 디코딩부(941)에서 출력된 프리셋 메타데이터를 화면에 현시한다. 또한, 출력부(970)는 스피커부(미도시)를 포함하고, 오디오 디코딩부(941)에서 출력되는 스테레오 신호 중 하나 이상의 채널의 위상이 이동된 위상이동 스테레오 신호를 출력부(970)에 포함된 스피커부를 통하여 출력한다. 또한, 신호 디코딩부(940)에서 디코딩된 데이터들은 HDD 와 같은 저장매체(950)에 저장될 수 있다.
한편, 신호 디코딩 장치(900)는 사용자로부터 정보를 입력받아 수신된 데이터들을 제어할 수 있는 애플리케이션 매니저(960)를 더 포함할 수 있다. 애플리케 이션 매니저(960)는 유저 인터페이스 매니저(961) 및 서비스 매니저(962)를 포함하는데, 유저 인터페이스 매니저(961)는 사용자로부터 정보를 입력받기 위한 인터페이스(interface)를 제어한다. 예를 들면, 출력부(970)에 현시되는 텍스트의 글자체, 화면의 밝기, 메뉴 구성 등을 제어할 수 있다. 한편, 서비스 매니저(962)는 신호 디코딩부(940) 및 출력부(970)에서 방송신호를 디코딩하여 출력하는 경우, 수신되는 방송신호를 사용자로부터 입력되는 정보를 이용하여 제어할 수 있다. 예를 들면, 방송채널의 설정, 알람 기능 설정, 성인인증 기능 등을 제공할 수 있다. 애플리케이션 매니저(960)에서 출력되는 데이터들은 신호 디코딩부(940)뿐만 아니라, 출력부(970)로도 전송되어 이용가능하다.
이와 같이, 실제 제품에 본 발명의 신호 처리 장치가 포함됨으로써, 공간정보만을 이용하여 업믹싱된 스테레오 신호를 이용하는 종래의 기술보다 보다 음질이 향상되고 원 입력신호인 위상이동 스테레오 신호에 가까운 신호를 청취할 수 있는 효과가 있다.
본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.
도 1은 본 발명의 일실시예에 따른 신호 코딩 장치를 나타내는 개략도이다.
도 2a 및 도 2b는 본 발명의 일실시예 따른 공간정보의 스무딩(smoothing) 방법을 나타내는 개략도이다.
도 3a 및 도 3b는 본 발명의 일실시예에 따른 추정 위상이동정보를 생성하는 방법을 나타내는 개략도이다.
도 4는 본 발명의 다른 실시예에 따른 신호 코딩 장치를 나타내는 개략도이다.
도 5는 본 발명의 일실시예에 따른 비트스트림의 구조를 나타내는 것이다.
도 6은 본 발명의 또다른 실시예에 따른 신호 코딩 장치를 나타내는 것이다.
도 7은 본 발명의 또다른 실시예에 따른 위상이동 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부가 구현된 제품의 개략적인 구성을 보여주는 것이다.
도 8a 및 도 8b 는 본 발명의 또다른 실시예에 따른 위상이동 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부가 구현된 제품들의 관계를 보여주는 것이다.
도 9는 본 발명의 또다른 일실시예에 따른 위상이동 디코딩부, 추정 위상이동정보 생성부 및 위상이동정보 적용부가 구현된 방송신호 디코딩 장치의 개략적인 구성을 보여주는 것이다.

Claims (15)

  1. 멀티채널 신호로 이루어진 저주파 대역 다운믹스 신호, 상기 저주파 다운믹스 신호의 파라미터 밴드에 대응하는 위상이동정보 및 공간정보를 수신하는 단계;
    상기 저주파 대역 다운믹스 신호로부터 복원된 고주파 대역 다운믹스 신호와 상기 저주파 대역 다운믹스 신호를 포함하는 전대역 다운믹스 신호에 상기 공간정보를 적용하여 멀티채널 신호를 생성하는 단계;
    상기 위상이동정보를 이용하여 상기 위상이동정보가 대응되지 아니하는 파라미터 밴드에 관한 추정 위상이동정보를 생성하는 단계; 및
    상기 위상이동정보 및 상기 추정 위상이동정보에 기초하여 멀티채널 신호의 위상이 이동된 위상이동 멀티채널 신호를 생성하는 단계를 포함한는 것을 특징으로 하는 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 위상이동 스테레오 신호는 상기 스테레오 신호의 각 채널의 파라미터 밴드별로 위상이 이동되는 것을 특징으로 하는 신호 처리 방법.
  3. 제 1 항에 있어서,
    상기 추정 위상이동정보는 파라미터 밴드의 개수 및 상기 위상이동정보를 이용하여 주파수 도메인으로 인터폴레이션 및 스무딩하여 생성되는 것을 특징으로 하 는 신호 처리 방법.
  4. 제 1 항에 있어서,
    상기 위상이동정보는 상기 파라미터 밴드에 대응하는 하나 이상의 위상값을 포함하는 것을 특징으로 하는 신호 처리 방법.
  5. 제 1 항에 있어서, 상기 멀티채널 신호를 생성하는 단계는,
    상기 공간정보를 시간 도메인으로 인터폴레이션하여, 상기 공간정보에 대응되지 않은 상기 다운믹스 신호의 시간 유닛에 대한 인터폴레이션 공간정보를 생성하는 단계; 및
    상기 공간정보 및 상기 인터폴레이션 공간정보를 상기 전대역 다운믹스 신호에 적용하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
  6. 제 1 항에 있어서,
    상기 위상이동 스테레오 신호는 상기 스테레오 신호 중 우측 채널의 위상이 π/2만큼 이동된 것을 특징으로 하는 신호 처리 방법.
  7. 제 6 항에 있어서,
    상기 이동위상은 상기 스테레오 신호 중 하나의 채널의 전체 주파수 밴드에 동일하게 이동된 것을 특징으로 하는 신호 처리 방법.
  8. 제 1 항에 있어서,
    상기 전대역 다운믹스 신호는 상기 저주파 대역 다운믹스 신호 중에서 일부 또는 전부를 이용하여 복원되는 것을 특징으로 하는 신호 처리 방법.
  9. 멀티채널 신호로 이루어진 저주파 대역 다운믹스 신호, 상기 저주파 다운믹스 신호의 파라미터 밴드에 대응하는 위상이동정보 및 공간정보를 수신하는 신호수신부;
    상기 저주파 대역 다운믹스 신호로부터 복원된 고주파 대역 다운믹스 신호와 상기 저주파 대역 다운믹스 신호를 포함하는 전대역 다운믹스 신호에 상기 공간정보를 적용하여 멀티채널 신호를 생성하는 업믹싱부;
    상기 위상이동정보를 이용하여 상기 위상이동정보가 대응되지 아니하는 파라미터 밴드에 관한 추정 위상이동정보를 생성하는 추정 위상이동정보 생성부; 및
    상기 위상이동정보 및 상기 추정 위상이동정보에 기초하여 멀티채널 신호의 위상이 이동된 위상이동 멀티채널 신호를 생성하는 위상이동정보 적용부를 포함한는 것을 특징으로 하는 신호 처리 장치.
  10. 제 9항에 있어서,
    상기 추정 위상이동정보 생성부는 상기 파라미터 밴드의 개수 및 상기 위상이동정보를 이용하여 주파수 도메인으로 상기 위상이동정보를 인터폴레이션 및 스 무딩함으로써, 상기 추정 위상이동정보를 생성하는 것을 특징으로 하는 신호 처리 장치.
  11. 제 9항에 있어서,
    상기 위상이동 멀티채널 신호는 상기 멀티채널 신호의 각 채널의 파라미터 밴드별로 위상이 이동된 것을 특징으로 하는 신호 처리 장치.
  12. 제 9항에 있어서,
    상기 위상이동정보는 상기 파라미터 밴드에 대응하는 하나 이상의 위상값을 포함하는 것을 특징으로 하는 신호 처리 장치.
  13. 제 9 항에 있어서,
    상기 위상이동 멀티채널 신호는 상기 멀티채널 신호 중 우측 채널의 위상이 π/2만큼 이동된 것을 특징으로 하는 신호 처리 장치.
  14. 채널 신호 사이의 위상이 뒤틀린 위상이동 멀티채널 신호를 수신하는 단계;
    상기 위상이동 멀티채널 신호로부터 파라미터 밴드별로 각 채널 사이의 위상차이를 나타내는 위상이동정보를 추출하는 단계;
    상기 위상이동정보를 이용하여 상기 위상이동 멀티채널 신호 중 하나 이상의 채널의 위상을 이동시킨 멀티채널 신호를 생성하는 단계;
    상기 멀티채널 신호의 속성을 나타내는 공간정보를 생성하는 단계;
    상기 멀티채널 신호를 다운믹싱하여 전대역 다운믹스 신호를 생성하는 단계; 및
    상기 전대역 다운믹스 신호로부터 고주파 대역을 제거한 저주파 다운믹스 신호를 생성하는 단계를 포함하는 신호 처리 방법.
  15. 채널 신호 사이의 위상이 뒤틀린 위상이동 멀티채널 신호를 수신하는 신호 수신부;
    상기 위상이동 멀티채널 신호로부터 파라미터 밴드별로 각 채널 사이의 위상차이를 나타내는 위상이동정보를 추출하는 위상이동정보 추출부;
    상기 위상이동정보를 이용하여 상기 멀티채널 신호 중 하나 이상의 채널의 위상을 이동시킨 멀티채널 신호를 생성하는 신호수정부;
    상기 멀티채널 신호의 속성을 나타내는 공간정보를 생성하고, 상기 멀티채널 신호를 다운믹싱하여 전대역 다운믹스 신호를 생성하는 다운믹싱부; 및
    상기 전대역 다운믹스 신호로부터 고주파 대역을 제거한 저주파 다운믹스 신호를 생성하는 대역폭 확장신호 인코딩부를 포함하는 신호 처리 장치.
KR1020090044743A 2008-05-23 2009-05-22 신호의 처리 방법 및 장치 KR20090122145A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US12/470,832 US8060042B2 (en) 2008-05-23 2009-05-22 Method and an apparatus for processing an audio signal
PCT/KR2009/002744 WO2009142465A2 (en) 2008-05-23 2009-05-25 A method and an apparatus for processing a signal
EP09006959A EP2124224A1 (en) 2008-05-23 2009-05-25 A method and an apparatus for processing an audio signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US5546208P 2008-05-23 2008-05-23
US61/055,462 2008-05-23

Publications (1)

Publication Number Publication Date
KR20090122145A true KR20090122145A (ko) 2009-11-26

Family

ID=41604946

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090044743A KR20090122145A (ko) 2008-05-23 2009-05-22 신호의 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20090122145A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8824577B2 (en) 2010-04-17 2014-09-02 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multichannel signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8824577B2 (en) 2010-04-17 2014-09-02 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multichannel signal

Similar Documents

Publication Publication Date Title
US8060042B2 (en) Method and an apparatus for processing an audio signal
KR101108060B1 (ko) 신호 처리 방법 및 이의 장치
CA2705968C (en) A method and an apparatus for processing a signal
RU2439718C1 (ru) Способ и устройство для обработки звукового сигнала
JP6531649B2 (ja) 符号化装置および方法、復号化装置および方法、並びにプログラム
JP5038138B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
US8258849B2 (en) Method and an apparatus for processing a signal
EP2169666B1 (en) A method and an apparatus for processing a signal
WO2009150288A1 (en) Method, apparatus and computer program product for providing improved audio processing
US8744088B2 (en) Method, medium, and apparatus decoding an input signal including compressed multi-channel signals as a mono or stereo signal into 2-channel binaural signals
US8346380B2 (en) Method and an apparatus for processing a signal
KR20090122145A (ko) 신호의 처리 방법 및 장치
KR20090122143A (ko) 오디오 신호 처리 방법 및 장치
KR20070011100A (ko) 다채널 오디오 코딩에서 오디오 신호의 에너지 보정방법 및그 보정을 위한 부호화된 오디오 신호 생성방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination