KR20210125534A

KR20210125534A - 전 프레임 손실 은닉 및 부분 프레임 손실 은닉을 포함하는 lc3 은닉을 위한 디코더 및 디코딩 방법

Info

Publication number: KR20210125534A
Application number: KR1020217028812A
Authority: KR
Inventors: 아드리안 토마세크; 랄프 스페르슈나이더; 얀 뷔테; 콘라드 벤도르프; 마틴 디에츠; 마르쿠스 슈넬; 막시밀리안 슐레겔
Original assignee: 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date: 2019-02-13
Filing date: 2020-02-12
Publication date: 2021-10-18
Also published as: JP2024026178A; AU2023204176A1; US20230274750A1; JP2022520609A; MX2021009731A; KR20210125555A; EP4369334A3; TWI745862B; EP4369334A2; SG11202108537YA; JP7472154B2; TW202044779A; CA3231339A1; CA3205152A1; KR20230147747A; TWI748339B; TWI797422B; JP2022520816A; TW202044777A; CN113491080B

Abstract

도 1은 일 실시예에 따라 오디오 신호를 재구성하기 위해 현재 프레임을 디코딩하기 위한 디코더(100)를 도시한다. 오디오 신호는 현재 프레임 내에서 인코딩된다. 현재 프레임은 현재 비트스트림 페이로드를 포함한다. 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함한다. 복수의 페이로드 비트는 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩한다. 페이로드 비트 각각은 현재 비트스트림 페이로드 내의 위치를 나타낸다. 디코더(100)는 디코딩 모듈(110) 및 출력 인터페이스(120)를 포함한다. 디코딩 모듈(110)은 오디오 신호를 재구성하도록 구성된다. 출력 인터페이스(120)는 오디오 신호를 출력하도록 구성된다. 디코딩 모듈(110)은 디코딩 모듈(110)이 상기 오류 은닉 모드에 있는 경우, 디코딩 모듈(110)은 임계 주파수보다 큰 주파수를 나타내는 오디오 신호 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 오디오 신호를 재구성하도록 구성되는, 은닉 모드를 포함한다. 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 디코딩 모듈(110)은 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성된다.

Description

전 프레임 손실 은닉 및 부분 프레임 손실 은닉을 포함하는 LC3 은닉을 위한 디코더 및 디코딩 방법

본 발명은 전 프레임 손실 은닉 및 부분 프레임 손실 은닉을 포함하는 LC3 프레임 손실 은닉을 위한 디코더 및 디코딩 방법에 관한 것이다.

변환 기반 오디오 코덱은 오디오 프레임 스펙트럼의 코딩된 표현에 의존한다. 이러한 스펙트럼은 복수의 스펙트럼 라인으로 구성된다. 다양한 이유로 인해 일부 또는 모든 스펙트럼 라인이 디코더 측에서 사용 가능하지 않을 수 있다. 주파수 영역의 오디오 오류 은닉 개념은 예를 들어, 이러한 누락된 스펙트럼 라인으로 인해 발생하는 아티팩트를 완화하는 수단을 제공하기 위한 것이다. 일반적인 접근 방식은 가능한 한 좋은 대체를 찾는 것이다.

종래 기술에서 다양한 프레임 손실 은닉 기술이 이용 가능하다.

주파수 영역에서 프레임 손실 은닉 개념은 예를 들어 [1]에서 논의되며, 여기서 특히 뮤팅, 반복, 잡음 대체 및 예측이 언급된다. 이러한 기술은 항상 페이드 아웃 프로세스와 결합되며, 이는 신호를 - 일반적으로 여러 손실 프레임에 걸쳐 - 0 쪽으로 또는 일종의 배경 잡음/편안한 잡음으로 페이드한다.

[2]에서 주파수 대역에 대한 다른 감쇠 계수는 해당 대역의 에너지에 따라 제안되고: 감쇠 계수가 클수록 예를 들어 임계값보다 더 높은 에너지를 갖는 대역에 적용될 수 있고, 감쇠 계수가 적을수록 해당 임계값 미만의 에너지를 가진 대역에 적용될 수 있다. 또한 [2]에서 마지막 양호한 프레임에 대한 에너지 진행이 관찰된다. 마지막 양호한 프레임의 에너지가 마지막 하나의 양호한 프레임보다 작으면 더 강한 감쇠가 적용된다.

또한, 신호의 스펙트럼 모양이 일종의 일반적인 모양으로 페이드될 수도 있다. 이 접근 방식은 특히 선형 예측 코딩(LPC) 기반 코덱, 예를 들어 EVS(향상된 음성 서비스)에서 사용되고, 이 때 LPC 계수는 제공된 일부 평균 계수 쪽으로 혼합된다.

본 발명의 목적은 오류 은닉에 대한 개선된 개념을 제공하는 것이다. 본 발명의 목적은 청구항 1에 따른 디코더, 제39항에 따른 방법 및 제40항에 따른 컴퓨터 프로그램에 의해 해결된다.

오디오 신호를 재구성하기 위해 현재 프레임을 디코딩하기 위한 디코더가 제공된다. 오디오 신호는 현재 프레임 내에서 인코딩된다. 현재 프레임은 현재 비트스트림 페이로드를 포함한다. 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함한다. 복수의 페이로드 비트는 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩한다. 페이로드 비트 각각은 현재 비트스트림 페이로드 내의 위치를 나타낸다. 디코더는 디코딩 모듈 및 출력 인터페이스를 포함한다. 디코딩 모듈은 오디오 신호를 재구성하도록 구성된다. 출력 인터페이스는 오디오 신호를 출력하도록 구성된다. 디코딩 모듈은 디코딩 모듈이 상기 오류 은닉 모드에 있는 경우, 디코딩 모듈은 임계 주파수보다 큰 주파수를 나타내는 오디오 신호 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 오디오 신호를 재구성하도록 구성되는, 은닉 모드를 포함한다. 디코딩 모듈에 의해 오류 은닉이 수행되는 경우, 디코딩 모듈은 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성된다.

더욱, 오디오 신호를 복원하기 위해 현재 프레임을 디코딩하는 방법이 제공된다. 상기 오디오 신호는 상기 현재 프레임 내에서 인코딩되고, 상기 현재 프레임은 현재 비트스트림 페이로드를 포함하고, 상기 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함하고, 상기 복수의 페이로드 비트는 상기 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩하고, 상기 페이로드 비트의 각각은 상기 비트스트림 페이로드 내의 위치를 나타낸다. 상기 방법은: 상기 오디오 신호를 복원하는 단계 - 오류 은닉 모드에서, 상기 오디오 신호를 복원하는 단계는 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 수행되고; 및/또는 오류 은닉이 수행되는 경우, 오류 은닉은 상기 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 수행됨 - ; 및 상기 오디오 신호를 출력하는 단계를 포함한다.

또한, 컴퓨터 또는 신호 프로세서 상에서 실행될 때 상술한 방법을 구현하기 위한 컴퓨터 프로그램이 제공된다.

일부 상황에서는 오류 은닉 개념이 예를 들어 전체 프레임이 손실되거나 유효하지 않은 것으로 표시된 경우, 또는 스펙트럼의 일부를 사용할 수 있는 경우에도, 전 프레임 손실 은닉이 가능한 최상의 오류 은닉 전략으로 간주되는 경우에, 전체 프레임에 적용될 수 있다.

그러나 다른 상황에서, 오류 은닉 기술은 예를 들어, 스펙트럼의 일부가 사용 가능한 경우 프레임의 일부에만 적용될 수 있다.

스펙트럼의 일부를 사용할 수 있는 상황은 예를 들어, 확장 가능한 코딩, 예를 들어 AAC 확장 가능, AAC SLS 또는 BSAC에서 발생할 수 있으며, 이 때 일부 레이어는 수신되지만 다른 레이어는 수신되지 않는다 (AAC = 고급 오디오 코딩, SLS = 무손실로 확장 가능, BSAC = 비트 슬라이스 산술 코딩).

또는 스펙트럼의 일부는 예를 들어, 손실된 프레임의 중복 저 품질 사본을 사용할 수 있는 중복 프레임 코딩에서, 즉 VoIP 또는 VoLTE의 컨텍스트에서 중복 저 품질 사본을 사용할 수 있다 ((VoIP 및 VoLTE의 견고성 및 오류 복원력에 대한 자세한 내용은 [3] 및 [4] 참조; VoIP = VoIP = VoIP/인터넷 프로토콜을 통한 음성, VoLTE = LTE를 통한 음성/장기적 진화에 대한 음성).

또는 스펙트럼의 일부는 예를 들어, 선택적 오류 감지가 수행될 때, 예를 들어, 특정 스케일 팩터가 손상된 것으로 감지되어 특정 개수의 스펙트럼 라인이 손상될 수 있는 스케일 팩터 데이터에 대한 RVLC(가역 가변 길이 코딩)가 있는 AAC에서, 또는 스펙트럼 부분의 코드화된 표현(심리음향적으로 덜 중요한 스펙트럼 범위를 나타냄)의 오류가 별도로 감지될 수 있는, 예를 들어 DECT의 경우 LC3에서 (디지털 강화 무선 통신)에서 수행될 수 있다.

다음에서, 본 발명의 실시 예가 다음 도면을 참조하여 보다 상세하게 설명된다:
도 1은 일 실시 예에 따라 오디오 신호의 오디오 신호 부분을 복원하기 위해 현재 프레임을 디코딩하기 위한 디코더를 도시한다.
도 2는 특정 실시 예에 따른 디코딩 모듈을 도시한다.
도 3은 클린 채널 디코딩을 위한 일실시 예에 따른 디코딩 모듈 개요를 도시한다.
도 4는 전 프레임 손실 은닉을 위한 일 실시 예에 따른 디코딩 모듈 개요를 도시한다.
도 5는 부분 프레임 손실 은닉을 위한 일 실시 예에 따른 디코딩 모듈 개요를 도시한다.
도 6은 일 행(a row)의 손실 프레임의 수에 의존하고 프레임 길이에 더 의존하는, 일 실시 예에 따른 페이딩 기능을 도시한다.
도 7은 일 행의 손실 프레임의 수에 의존하고 프레임 길이에 더 의존하는, 일 실시 예에 따른 부호 스크램블링에 대한 임계값을 도시한다.
도 8은 일 행의 손실 프레임의 수에 의존하고 프레임 길이에 더 의존하는, 일 실시 예에 따른 에너지 임계 지수를 도시한다.
도 9는 일 행의 손실 프레임의 수에 의존하는, 일 실시 예에 따른 비선형 감쇠를 도시한다.

도 1은 일 실시 예에 따라 오디오 신호를 복원하기 위해 현재 프레임을 디코딩하는 디코더(100)를 도시한다.

오디오 신호는 현재 프레임 내에서 인코딩된다. 현재 프레임은 현재 비트스트림 페이로드를 포함한다. 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함한다. 복수의 페이로드 비트는 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩한다. 페이로드 비트 각각은 현재 비트스트림 페이로드 내의 위치를 나타낸다.

디코더(100)는 디코딩 모듈(110) 및 출력 인터페이스(120)를 포함한다.

디코딩 모듈(110)은 오디오 신호를 복원하도록 구성된다.

출력 인터페이스(120)는 오디오 신호를 출력하도록 구성된다.

디코딩 모듈(110)은 오류 은닉 모드를 포함하고, 여기서 디코딩 모듈(110)이 상기 오류 은닉 모드에 있는 경우, 디코딩 모듈(110)은 임계 주파수보다 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 오디오 신호를 복원하도록 구성되고/되거나, 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 디코딩 모듈(110)은 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성된다.

일부 실시 예에서, 현재 프레임의 현재 비트스트림 페이로드가 수정 불가능한 오류를 포함하는 경우 및/또는 현재 프레임이 손실된 경우, 디코딩 모듈은 예를 들어, 상기 오류 은닉 모드에 있을 수 있다. 현재 비트스트림 페이로드는, 디코더(100)에 의해 오류 정정이 수행된 경우; 또는 현재 비트스트림 페이로드가 오류를 포함하고 오류 정정이 전혀 수행되지 않는 경우, 예를 들어 수정 불가능한 오류를 포함할 수 있다. 수정 불가능한 오류를 포함하는 프레임은 예를 들어, 손상된 프레임으로 지칭될 수 있다.

예를 들어, 일 실시 예에 따르면, 특정 오류 은닉 매개변수는 예를 들어 현재 프레임에 선행하는 상기 이전 프레임의 상기 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 상기 신호 성분을 인코딩하는지 여부에 따라 구성될 수 있다.

일 실시 예에 따르면, 이전 프레임은 예를 들어, 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임일 수 있다.

이하, 실시 예를 보다 상세히 설명한다.

스펙트럼은 예를 들어, 사용 가능하고 사용해야 하는 스펙트럼 라인과, 사용할 수 없거나 사용해서는 안되는(예를 들어, 이들은 사용 가능한 경우에도) 스펙트럼 라인으로 세분되는 것으로 간주된다.

일부 실시 예에 따르면, 예를 들어 다음과 같이 진행할 수 있다:

어떤 상황에서는 모든 스펙트럼 라인을 사용할 수 있고 사용해야 하므로, 프레임 손실 은닉은 수행될 수 없다.

다른 상황에서는 특정 스펙트럼 라인을 사용할 수 있으며 사용되어야 하고, 부분 프레임 손실 은닉은 예를 들어 누락된 스펙트럼 라인에 대해 수행될 수 있다.

또 다른 상황에서는 스펙트럼 라인을 사용할 수 없거나 사용할 수 없으며 전 프레임 손실 은닉이 수행될 수 있다.

다음에서, 일부 실시 예에 따른 음조에 따른 오류 은닉이 설명된다.

일 실시 예에서, 오류 은닉이 디코딩 모듈(110)에 의해 수행되는 경우, 디코딩 모듈(110)은 예를 들어 오디오 신호의 이전 스펙트럼의 복수의 부호를 사용하여 오류 은닉을 수행함으로써 오디오 신호의 현재 스펙트럼을 복원하도록 구성될 수 있고, 상기 복수의 부호는 이전 프레임 내에서 인코딩되고, 여기서 디코딩 모듈(110)은 예를 들어, 상기 이전 프레임이 음조 또는 고조파 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성될 수 있다. 예를 들어, 오류 은닉을 위한 매개변수는 예를 들어 신호 성분이 음조인지 고조파인지에 따라 다른 방식으로 선택될 수 있다.

일 실시 예에서, 상기 이전 프레임은 예를 들어, 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임일 수 있다. 또는, 상기 이전 프레임은 예를 들어, 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임일 수 있다. 또는, 상기 이전 프레임은 예를 들어 부분 프레임 손실 은닉 모드 또는 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임일 수 있다.

일 실시 예에 따르면, 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 및 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 신호 성분을 인코딩하는 경우, 디코딩 모듈(110)은, 예를 들어, 현재 스펙트럼을 복원하기 위해 이전 스펙트럼의 복수의 부호의 하나 이상의 부호를 반전하도록 구성될 수 있고, 여기서, 현재 스펙트럼을 복원하기 위해 디코딩 모듈(110)에 의해 반전될 이전 스펙트럼의 복수의 부호의 부호에 대한 확률을 나타내는 백분율 값 p는, 예를 들어, 0% ≤ p ≤ 50%일 수 있고, 여기서 디코딩 모듈(110)은 예를 들어 백분율 값 p를 결정하도록 구성될 수 있다. 일 실시 예에서, 디코딩 모듈(110)은 예를 들어 의사 난수의 시퀀스를 사용하여 이전 스펙트럼의 고려된 부호가 백분율 값 p에 따라 실제로 반전할지 여부를 결정할 수 있다.

일 실시 예에서, 디코딩 모듈(110)은, 예를 들어, 후속 프레임들의 수에 따라 백분율 값 p를 증가시키도록 구성될 수 있다. 후속 프레임의 상기 수는, 예를 들어, 디코딩 모듈(110)에 의해 연속적으로(부분적으로 또는 완전히) 손실된 프레임 오류 은닉이 얼마나 많이 수행되었는지를 나타낼 수 있고; 또는 상기 후속 프레임의 수는, 예를 들어, 얼마나 많은 후속 프레임에 대해서 특정 오류 은닉 모드의 오류 은닉이 디코딩 모듈(110)에 의해 수행되었는지를 나타낼 수 있다.

일 실시 예에서, 디코딩 모듈(110)은, 예를 들어, 상기 후속 프레임들의 수에 의존하는 함수에 따라 백분율 값 p를 결정하도록 구성될 수 있고, 상기 후속 프레임의 수는 상기 함수의 인수이다.

일 실시 예에 따르면, 디코딩 모듈(110)은 예를 들어 후속 프레임의 수가 제 1 임계값보다 작은 경우 p는 0%가 되고; 상기 후속 프레임의 수가 제 1 임계값 이상이고 제 2 임계값보다 작은 경우 0 % ≤ p ≤ 50 %가 되고; 후속 프레임의 수가 제 2 임계값보다 큰 경우 p = 50%가 되도록 백분율 값 p를 결정하도록 구성된다.

일 실시 예에서, 디코딩 모듈(110)은 예를 들어, 백분율 값 p가 후속 프레임의 수에 따라 제1 임계값과 제2 임계값 사이의 범위에서 선형적으로 증가하도록 백분율 값 p를 결정하도록 구성된다.

일 실시 예에 따르면, 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우 및 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하지 않는 경우, 디코딩 모듈(110)은, 예를 들어, 현재 스펙트럼을 복원하기 위해 이전 스펙트럼의 복수의 부호의 50%를 반전하도록 구성될 수 있다.

일 실시 예에서, 오류 은닉이 디코딩 모듈(110)에 의해 수행되는 경우, 디코딩 모듈(110)은 예를 들어, 이전 프레임이 음조 또는 고조파 신호 성분을 인코딩하는지 여부에 따라, 오디오 신호의 이전 스펙트럼의 복수의 진폭을 사용하여 오류 은닉을 수행함으로써 오디오 신호의 현재 스펙트럼을 복원하도록 구성될 수 있고, 상기 복수의 진폭은 이전 프레임 내에서 인코딩된다.

일 실시 예에 따르면, 디코딩 모듈(110)에 의해 오류 은닉이 수행되면, 디코딩 모듈(110)은 예를 들어, 현재 스펙트럼을 복원하기 위해 비선형 감쇠 특성에 따라 이전 스펙트럼의 복수의 진폭을 감쇠하도록 구성될 수 있고, 여기서 비선형 감쇠 특성은 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하는지 여부에 따라 좌우된다. 예를 들어, 비선형 감쇠 특성에 대한 매개변수는 예를 들어 신호 성분이 음조인지 고조파인지에 따라 다른 방식으로 선택될 수 있다.

일 실시 예에서, 오류 은닉이 디코딩 모듈(110)에 의해 수행되는 경우, 및 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하는 경우, 디코딩 모듈(110)은, 예를 들어, 안정성 계수에 따라 이전 스펙트럼의 복수의 진폭을 감쇠하도록 구성될 수 있고, 여기서 상기 안정성 계수는 현재 스펙트럼과 이전 스펙트럼 사이의 유사성을 나타내고; 또는 상기 안정성 계수는 이전 스펙트럼과 이전 프레임에 선행하는 더 이전 프레임의 더 이전 스펙트럼 사이의 유사성을 나타낸다.

일 실시 예에 따르면, 상기 더 이전 프레임은 예를 들어 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 이전 프레임 이전에 마지막으로 수신된 프레임일 수 있다. 또는, 상기 더 이전 프레임은 예를 들어, 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 이전 프레임 이전에 마지막으로 수신된 프레임일 수 있다 (예를 들어, 마지막에서 두 번째로 수신된 프레임). 또는, 상기 더 이전 프레임은 예를 들어 부분 프레임 손실 은닉 모드 또는 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 디코딩 모듈(110)에 의해 디코딩된 이전 프레임 이전에 마지막으로 수신된 프레임일 수 있다.

일 실시 예에서, 디코딩 모듈(110)이 부분 프레임 손실 은닉을 수행하도록 설정된 경우, 상기 안정성 계수는 예를 들어, 현재 스펙트럼과 이전 스펙트럼 사이의 상기 유사성을 나타낼 수 있다. 디코딩 모듈(110)이 전 프레임 손실 은닉을 수행하도록 설정된 경우, 상기 안정성 계수는 예를 들어, 이전 스펙트럼과 더 이전 스펙트럼 사이의 상기 유사성을 나타낼 수 있다.

일 실시 예에 따르면, 디코딩 모듈(110)은, 예를 들어, 이전 스펙트럼의 스펙트럼 빈의 에너지를 결정하도록 구성될 수 있다. 더욱이, 디코딩 모듈(110)은, 예를 들어, 상기 스펙트럼 빈의 상기 에너지가 에너지 임계값보다 작은지 여부를 결정하도록 구성될 수 있다. 상기 에너지가 상기 에너지 임계값보다 작은 경우, 디코딩 모듈(110)은 예를 들어, 제1 페이딩 계수로 상기 스펙트럼 빈에 할당되는 복수의 진폭 중 하나의 진폭을 감쇠하도록 구성될 수 있다. 상기 에너지가 상기 에너지 임계값보다 크거나 같으면, 디코딩 모듈(110)은 예를 들어, 제1 페이딩 계수보다 작은 제2 페이딩 계수로 상기 스펙트럼 빈에 할당되는 복수의 진폭 중 상기 진폭을 감쇠시키도록 구성될 수 있다. 디코딩 모듈(110)은, 예를 들어, 복수의 진폭 중 하나의 감쇠에 대해 더 작은 페이딩 계수를 사용함으로써 진폭 중 상기 하나의 감쇠가 증가하도록 감쇠를 수행하도록 구성될 수 있다.

실시 예에서, 디코딩 모듈(110)은, 예를 들어, 이전 스펙트럼의 복수의 스펙트럼 빈을 포함하는 스펙트럼 대역의 에너지를 결정하도록 구성될 수 있다. 디코딩 모듈(110)은 예를 들어, 상기 스펙트럼 대역의 상기 에너지가 에너지 임계값보다 작은지 여부를 결정하도록 구성될 수 있다. 상기 에너지가 상기 에너지 임계값보다 작은 경우, 디코딩 모듈(110)은 예를 들어, 제1 페이딩 계수로 상기 스펙트럼 대역의 상기 스펙트럼 빈에 할당되는 복수의 진폭의 진폭을 감쇠하도록 구성될 수 있다. 상기 에너지가 상기 에너지 임계값보다 크거나 같으면, 디코딩 모듈(110)은, 예를 들어, 제1 페이딩 계수보다 작은 제2 페이딩 계수로 상기 스펙트럼 대역의 상기 스펙트럼 빈에 할당되는 복수의 진폭 중 상기 진폭을 감쇠시키도록 구성될 수 있다. 디코딩 모듈(110)은, 예를 들어, 복수의 진폭 중 하나의 감쇠에 대해 더 작은 페이딩 계수를 사용함으로써 진폭 중 하나의 감쇠가 증가하도록 감쇠를 수행하도록 구성될 수 있다.

일 실시 예에 따르면, 디코딩 모듈(110)은, 예를 들어, 후속 프레임들의 상기 수에 따라, 제1 페이딩 계수가 더 작아지도록 제1 페이딩 계수를 결정하도록 구성될 수 있다. 더욱이, 디코딩 모듈(110)은, 예를 들어, 상기 후속 프레임들의 수에 따라, 제2 페이딩 계수가 더 작아지도록 제2 페이딩 계수를 결정하도록 구성될 수 있다.

일 실시 예에서, 디코딩 모듈(110)은 예를 들어, 현재 프레임이 후속 프레임 중 제 1 프레임인 경우,

cum_fading_slow = 1, 및

cum_fading_fast = 1이 되고,

현재 프레임이 후속 프레임 중 제 1 프레임에 이어지는 프레임들 중 하나인 경우, 제 1 페이딩 계수 및 제 2 페이딩 계수는 예를 들어:

cum_fading_slow = cum_fading_slow * slow;

cum_fading_fast = cum_fading_fast * fast;

에 따라 상기 후속 프레임의 수에 따라 결정될 수 있도록 제1 페이딩 계수 및 제2 페이딩 계수를 결정하도록 구성될 수 있다.

여기서 상기 수학식의 오른쪽의 cum_fading_slow는 이전 프레임의 제 1 페이딩 계수이고 (예를 들어, 제 1 손실 프레임에서 1로 초기화됨), 상기 수학식의 왼쪽에 있는 cum_fading_slow는 현재 프레임의 제 1 페이딩 계수이고, 상기 수학식의 오른쪽에 있는 cum_fading_fast는 이전 프레임의 제 2 페이딩 계수이고 (예를 들어, 제 1 손실 프레임에서 1로 초기화됨), 상기 수학식의 왼쪽에 있는 cum_fading_fast는 현재 프레임의 제 2 페이딩 계수이며, 여기서 1 > slow > fast > 0이다.

일 실시 예에 따르면, 1 > slow > fast > 0.3이다.

일 실시 예에서, 디코딩 모듈(110)은 예를 들어, 상기 후속 프레임의 수가 제3 임계값보다 작은 경우, 상기 에너지 임계값이 제1 에너지 값과 같고; 상기 후속 프레임의 수가 제3 임계값 이상이고 제4 임계값보다 작은 경우, 상기 에너지 임계값이 상기 제1 에너지 값보다 작고 제2 에너지 값보다 크고; 상기 후속 프레임의 수가 제4 임계값보다 큰 경우, 상기 에너지 임계값이 상기 제2 에너지 값과 같도록, 상기 에너지 임계값을 결정하도록 구성될 수 있다.

실시 예에 따르면, 디코딩 모듈(110)은, 예를 들어, 에너지 임계값은 후속 프레임의 수에 따라 제3 임계값과 제4 임계값 사이의 범위에서 선형적으로 감소하도록 에너지 임계값을 결정하도록 구성될 수 있다.

사용불가능하거나 사용할 수 없는 스펙트럼 라인에 대해, 대체 라인이 생성되는 반면, 이전에 수신된 신호의 음조에 따라, 이 정보가 사용 가능한 경우 현재 수신된 신호의 음조에 따라 어느 정도의 음조는 유지된다:

지표가 마지막으로 양호한 신호가 음조였음을 나타내는 경우, 더 많은 음조가 보존된다.

지표가 마지막으로 양호한 신호가 음조가 아니었음을 나타내는 경우 더 적은 음조가 보존된다.

음조는 주로 한 프레임 내의 다양한 빈 사이의 위상 관계 및/또는 후속 프레임에 대한 동일한 빈의 위상 관계로 표현된다.

일부 실시 예는 제 1 양태, 즉 음조가 주로 하나의 프레임 내의 다양한 빈 사이의 위상 관계에 의해 표현된다는 점에 초점을 맞춘다.

한 프레임 내 다양한 빈의 위상은 주로 해당 기호만이 아니라, 인접 빈의 진폭의 관계에 의해서도 특징된다. 따라서 진폭 관계의 보존과 부호의 보존은 고도로 보존된 음조로 이어진다. 그 반대로, 진폭 및/또는 부호 관계가 후속 빈 간에서 더 변경될수록, 음조는 더 적게 보존된다.

일부 실시 예에 따른 부호의 취급이 이제 설명된다.

최신 기술에서는, 두 가지 접근 방식이 알려져 있다.

제 1 접근 방식에 따르면 프레임 반복이 적용되고: 부호는 이전 스펙트럼에서 보존된다.

제 2 접근 방식에서는 잡음 대체가 수행된다. 부호는 이전 스펙트럼과 관련하여 스크램블되고; 무작위로 부호의 50%가 반전된다.

무성 신호의 경우, 잡음 대체가 좋은 결과를 제공한다.

음성 신호의 경우, 프레임 반복을 대신 사용할 수 있지만, 더 긴 손실의 경우 보존된 음조(손실 시작 시 선호됨)는 불편한 것이 될 수 있다.

실시 예는 유성 신호에 대해 프레임 반복과 잡음 대체 사이의 전이 위상이 바람직하다는 발견에 기초한다.

일부 실시 예에 따르면, 이는 예를 들어, 프레임당 부호의 특정 백분율을 무작위로 반전하여 달성될 수 있으며, 이 때 이 비율은 0%에서 50% 사이에 있으며 시간이 지남에 따라 증가한다.

이제, 일부 실시 예에 따른 진폭의 취급에 대해 설명된다.

최신 기술에서 자주 사용되는 가장 간단한 방법은 모든 주파수 빈에 특정 감쇠 계수를 적용하는 것이다. 이 감쇠 계수는 부드러운 페이드 아웃을 달성하기 위해 프레임마다 증가한다. 페이드 아웃 속도는 고정되거나 신호 특성에 따라 달라질 수 있다. 이 접근 방식을 사용하면 전 프레임의 스펙트럼 모양뿐만 아니라 인접한 빈의 크기 관계가 유지된다.

또한 각 대역 내의 에너지에 따라 상이한 감쇠 계수를 사용하는 대역별 감쇠가 당해 기술 분야에 공지되어 있다. 이 접근 방식은 또한 각 대역 내에서 인접한 빈의 크기 관계를 유지하지만, 전 프레임의 스펙트럼 모양은 평평해진다.

일부 실시 예에 따르면, 더 큰 값을 갖는 빈은 더 작은 값을 갖는 빈보다 더 강하게 감쇠된다. 이를 위해 일부 실시 예는 예를 들어 비선형 감쇠 특성을 정의할 수 있다. 이 비선형 감쇠 특성은 중첩 추가 동안 앨리어스 삭제 보장되지 않기 때문에 발생할 수 있는 오버슈트를 방지하고, 인접한 빈의 크기 관계를 변경하여 더 평평한 스펙트럼 모양이 결과되게 한다. 일부 실시 예는 인접한 빈의 크기 비율이 사전에 1 이상인 경우, 1 이상으로 유지되어야 하고, 비율이 사전에 1 미만인 경우 비율이 1 미만으로 유지되어야 한다는 발견을 기반으로 한다.

이 감쇠를 정상적으로 적용하기 위해서, 일부 실시 예에서, 비선형 특성은 예를 들어 손실 시작 시 작을 수 있으며, 예를 들어 차후에 증가할 수 있다. 실시 예에서, 시간에 따른 조정은 예를 들어 신호의 음조에 따라 달라질 수 있다. 일부 실시 예에 따르면, 무성 신호의 경우, 비선형성은 예를 들어, 유성 신호보다 더 강할 수 있다.

이러한 비선형 감쇠 특성은 스펙트럼 모양에 영향을 준다. 실시 예에서, 스펙트럼은 예를 들어 시간이 지남에 따라 더 평평해질 수 있으며, 이로 인해 버스트 손실 동안 불편한 합성 사운드 아티팩트가 생기는 것을 줄여준다.

다음에서, 일부 실시 예에 따른 부분 프레임 손실 은닉이 설명된다.

일 실시 예에 따르면, 상기 오류 은닉 모드는 예를 들어, 부분 프레임 손실 은닉 모드일 수 있고, 여기서, 디코딩 모듈(110)이 부분 프레임 손실 은닉 모드에 있는 경우, 디코딩 모듈(110)은 예를 들어, 임계 주파수보다 작거나 같은 주파수를 나타내는 스펙트럼의 복수의 스펙트럼 라인 중 하나 이상의 제1 스펙트럼 라인에 대해 오류 은닉을 수행하지 않고 오디오 신호를 복원하도록 구성될 수 있고, 여기서 상기 하나 이상의 제1 스펙트럼 라인은 복수의 페이로드 비트 중 하나 이상의 제1 그룹에 의해 인코딩된다. 더욱이, 디코딩 모듈(110)은, 예를 들어, 임계 주파수보다 더 큰 주파수를 나타내는, 스펙트럼의 복수의 스펙트럼 라인의 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 오디오 신호를 복원하도록 구성될 수 있고, 여기서 상기 하나 이상의 제2 스펙트럼 라인은 복수의 페이로드 비트 중 하나 이상의 제2 그룹에 의해 인코딩된다.

일 실시 예에서, 디코딩 모듈(110)은, 예를 들어, 현재 프레임이 임계 주파수 보다 작거나 동일한 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 임의의 손상된 비트를 포함하지 않는지 여부를 검출하도록 구성될 수 있다. 더욱이, 디코딩 모듈(110)은, 예를 들어, 현재 프레임이 임계값 주파수 보다 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 하나 이상의 손상된 비트를 포함하는지 여부를 검출하도록 구성될 수 있다. 상기 하나 이상의 손상된 비트는 왜곡되거나 왜곡될 가능성이 있는 페이로드 비트 중 하나 이상이다. 현재 프레임이 임계 주파수보다 작거나 같은 주파수를 나타내는 오디오 신호 스펙트럼의 상기 하나 이상의 제 1 스펙트럼 라인을 인코딩하는 손상된 비트를 포함하지 않는 경우 및 현재 프레임이 임계 주파수보다 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 상기 하나 이상의 손상된 비트를 포함하는 경우, 디코딩 모듈(110)은, 예를 들어, 임계 주파수보다 더 큰 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 부분 프레임 손실 은닉 모드에서 오류 은닉을 수행하도록 구성될 수 있다.

일 실시 예에 따르면, 현재 프레임이 임계 주파수보다 작거나 같은 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 임의의 손상된 비트를 포함하지 않는 경우 및 현재 프레임이 임계 주파수보다 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 상기 하나 이상의 손상된 비트를 포함하는 경우, 디코딩 모듈(110)은 예를 들어, 임계 주파수보다 작거나 같은 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 복수의 페이로드 비트 중 하나 이상의 상기 제1 그룹을 디코딩하여 오디오 신호를 복원하도록 구성될 수 있다.

일 실시 예에서, 디코딩 모듈(110)은 예를 들어 현재 프레임이 손실되었는지 여부를 검출하도록 구성될 수 있고, 여기서, 디코더(100)가 현재 프레임이 손실된 것을 검출한 경우, 디코딩 모듈(110)은, 예를 들어, 임계 주파수보다 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 오디오 신호를 복원하도록 구성될 수 있다. 또한, 디코딩 모듈(110)은 예를 들어, 상기 제1 그룹에 대한 오류 은닉을 수행하지 않고, 상기 임계 주파수 보다 적거나 동일한 오디오 신호의 스펙트럼의 상기 하나 이상의 제1 주파수에 대해 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 복수의 페이로드 비트 중 하나 이상의 상기 제1 그룹을 디코딩하도록 구성될 수 있고, 상기 복수의 페이로드 비트 중 하나 이상의 상기 제1 그룹은 현재 프레임과 상이한 리던던트 프레임의 하나 이상의 페이로드 비트이다.

일 실시 예에서, 리던던트 프레임은 예를 들어, 현재 프레임의 대역폭 제한 버전일 수 있다. 예를 들어, 중복 프레임은 현재 프레임과 동일한 시간 기간 동안 오디오 신호를 인코딩하는 데이터(예를 들어, 현재 프레임에 비해 감소된 데이터 세트)를 제공할 수 있다. 이 데이터는, 예를 들어, 임계 주파수보다 작거나 같은 오디오 신호의 스펙트럼의 상기 하나 이상의 제1 주파수에 대해 상기 하나 이상의 제1 스펙트럼 라인의 오디오 신호를 인코딩하는 복수의 페이로드 비트에 대해 상이할 수 있는데, 현재 프레임의 동일한 기간 동안 스펙트럼의 상기 제1 주파수의 현재 프레임보다 적은 비트로 인코딩되기 때문이다.

일 실시 예에서, 디코딩 모듈(110)이 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하도록 구성되는 경우, 디코딩 모듈(110)은 (전체) 스펙트럼의 모든 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성된다 (그렇지 않으면 현재 프레임의 현재 비트스트림 페이로드의 모든 페이로드 비트에 의해 복원 가능함).

일 실시 예에 따르면, 복수의 페이로드 비트는 복수의 현재 페이로드 비트이다. 디코딩 모듈(110)이 부분 프레임 손실 은닉 모드에 있는 경우, 디코딩 모듈(110)은, 예를 들어, 이전 프레임의 이전 비트스트림 페이로드의 하나 이상의 이전 페이로드 비트에 의해 인코딩된 하나 이상의 저장된 스펙트럼 라인을 사용하여, 임계 주파수보다 더 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성될 수 있다.

일 실시 예에서, 스펙트럼은 예를 들어 현재 양자화된 스펙트럼일 수 있다. 디코딩 모듈(110)이 부분 프레임 손실 은닉 모드에서 오류 은닉을 수행하는 경우, 디코딩 모듈(110)은, 예를 들어, 상기 현재 양자화된 스펙트럼의 하나 이상의 중간 스펙트럼 라인을 얻기 위해서, 임계 주파수보다 더 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성될 수 있다.

일 실시 예에 따르면, 스펙트럼은 현재 양자화된 스펙트럼이다. 디코딩 모듈(110)이 부분 프레임 손실 은닉 모드에서 오류 은닉을 수행하는 경우, 디코딩 모듈(110)은 예를 들어, 상기 현재 양자화된 스펙트럼의 하나 이상의 중간 스펙트럼 라인을 얻기 위해서, 임계 주파수보다 더 큰 주파수를 나타내는 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성될 수 있고, 여기서 디코딩 모듈(110)은 예를 들어 오디오 신호를 복원하기 위해 재조정 계수를 사용하여 하나 이상의 중간 스펙트럼 라인을 재조정하도록 구성될 수 있다.

일 실시 예에서, 디코딩 모듈(110)은, 예를 들어, 다음 중 적어도 하나에 따라 재조정 계수를 결정하도록 구성될 수 있다:

- 상기 현재 비트스트림 페이로드 내에서 인코딩되는 전역 이득 및

- 상기 이전 비트스트림 페이로드 내에서 인코딩되는 전역 이득, 및

- 상기 이전 프레임의 이전 양자화된 스펙트럼의 에너지, 상기 이전 프레임의 이전 디코딩된 스펙트럼의 에너지, 및

- 상기 현재 프레임의 상기 현재 양자화된 스펙트럼의 에너지.

일 실시 예에 따르면, 디코딩 모듈(110)은, 예를 들어, 다음 여부에 따라 재조정 계수를 결정하도록 구성될 수 있다:

- 오류 은닉을 수행하지 않고 복원될 수 없는 제 1 스펙트럼 빈에서 시작하여 스펙트럼의 상단까지 이전 프레임의 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 이전 프레임의 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지 이상인지, 또는

- 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 현재 프레임의 상기 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 이전 프레임의 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지보다 크거나 같은지.

일 실시 예에서,

- 오류 은닉을 수행하지 않고 복원될 수 없는 상기 제 1 스펙트럼 빈에서 시작하여 스펙트럼의 상단까지 이전 프레임의 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 이전 프레임의 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지보다 작은 경우,

- 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 현재 프레임의 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈까지 이전 프레임의 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지보다 작은 경우,

디코딩 모듈(110)은, 예를 들어, 재조정 계수가

- 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈에 현재 프레임의 이득 계수의 제곱을 곱한 값 까지 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지

대

- 0부터 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈에 이전 프레임의 이득 계수의 제곱을 곱한 값 까지 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지

의 비율의 제곱근과 동일하도록 재조정 계수를 결정하도록 구성된다.

일 실시 예에 따르면, 디코딩 모듈(110)은, 예를 들어, 전체 재조정 계수인 상기 재조정 계수가 전역 이득 재조정 계수에 의존하는 것을 결정하도록 구성될 수 있으며, 여기서 디코딩 모듈(110)은:

에 따라 전역 이득 재조정 계수를 결정하도록 구성될 수 있다.

여기서 gg는 현재 프레임의 전역 이득을 나타내고, gg_prev는 상기 이전 프레임의 전역 이득을 나타내고, fac_gg는 전역 이득 재조정 계수이다.

일 실시 예에서,

이거나,

이면,

디코딩 모듈(110)은, 예를 들어, 총 재조정 계수가 전역 이득 재조정 계수와 동일한지 결정하도록 구성될 수 있고, 여기서 k는 스펙트럼 빈을 나타내고, k_be는 복구될 수 없는 제 1 스펙트럼 빈을 나타내며, N_F는 스펙트럼 라인의 수를 나타내며,

는 이전 프레임의 이전 양자화된 스펙트럼이 마지막 비 이 아닌 전 프레임 손실 은닉 프레임임을 나타내고,

는 현재 프레임의 현재 양자화된 스펙트럼을 나타내고,

는 이전 프레임의 이전 디코딩된 스펙트럼이 상기 마지막 전체가 아닌 프레임 손실 은닉 프레임임을 나타낸다.

일 실시 예에 따르면,

이거나,

이면,

디코딩 모듈(110)은, 예를 들어, 전체 재조정 계수가 또한 에너지 재조정 계수,

에 의존한다고 결정하도록 구성될 수 있고, 이것은 예를 들어, 전체 재조정 계수

를 형성하기 위해 사용될 수 있다.

여기서, fac_ener는 에너지 재조정 계수를 나타내며, k는 스펙트럼 빈을 나타내고, k_be는 복구되 수 없는 제 1 스펙트럼 빈을 나타내며, N_F는 스펙트럼 라인의 수를 나타내며,

는 이전 프레임의 이전 양자화된 스펙트럼이 마지막 비 전 프레임 손실 은닉 프레임인 것을 나타내고,

는 현재 프레임의 현재 양자화된 스펙트럼을 나타내고,

는 이전 프레임의 이전 디코딩된 스펙트럼이 상기 마지막 비 전 프레임 손실 은닉 프레임인 것을 나타낸다.

부분 프레임 손실 은닉이 적용되는 시나리오에서, 비트스트림 페이로드의 더 민감한 비트에 오류가 없는 것으로 가정되거나 결정되었다.

실시 예에서, 현재 프레임의 양자화된 스펙트럼

는 예를 들어, 본 명세서에서 주파수 빈 k_be-1로 지칭되는 특정 주파수 빈까지 복원될 수 있다. 따라서 부분 프레임 손실 은닉은 이 주파수 위의 양자화된 스펙트럼 라인을 은닉하게 된다.

일부 실시 예에 따라 부분 프레임 손실 은닉을 수행할 때, 마지막 비-FFLC 프레임

의 양자화된 스펙트럼의 스펙트럼 라인은 예를 들어 재사용될 수 있다(FFLC = 전 프레임 손실 은닉).

전환 프레임에서 에너지가 변하는 고에너지 아티팩트를 방지하기 위해, 은닉 스펙트럼 라인은 후속적으로 재조정되는 반면, 결과적인 재조정 계수는 예를 들어 다음 중 적어도 하나에 의존할 수 있다:

a) 전역 이득

b) 스펙트럼의 에너지

바람직하게는, 결과적인 재조정 계수는 예를 들어 스펙트럼의 전역 이득 및 에너지 둘 모두에 의존할 수 있다. 전역 이득을 기반으로 한 재조정 계수는 현재 전역 이득에 대한 이전 전역 이득의 비율과 같다.

에너지에 기반한 재조정 계수는:

주파수 빈 k_be(오류 은닉을 수행하지 않고 복원할 수 없는 제 1 스펙트럼 빈)에서 시작하여 스펙트럼의 상단까지 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지가 0에서 시작하여 주파수 빈 k_be-1까지 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지보다 크거나 같은 경우 (오류 은닉을 수행하지 않고 복원될 수 있는 마지막 스펙트럼 빈);

0에서 시작하여 주파수 빈 k_be-1까지 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지가 0에서 시작하여 주파수 빈 k_be-1까지 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지보다 크거나 같은 경우에,

1로 초기화된다 (예를 들어, 재조정이 수행되지 않음/예를 들어, 재조정은 적용되지 않음):

그렇지 않으면, 재조정 계수는:

0에서 시작하여 주파수 빈 k_be-1에 현재 프레임의 이득 계수의 제곱을 곱한 값까지 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지; 대

0에서 시작하여 주파수 빈 k_be-1에 이전 프레임의 이득 계수의 제곱을 곱한 값까지 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지의 비율의 제곱근과 같다.

그렇지 않으면, 재조정 계수는:

이 경우 두 계수를 곱하면, 이득 계수는 서로 상쇄된다. 따라서 재조정 계수는:

0에서 시작하여 주파수 빈 k_be-1까지 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지; 대

0에서 시작하여 주파수 빈 k_be-1까지 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지의 비율의 제곱근과 같다.

그 후, 은닉된 양자화된 스펙트럼은 예를 들어 오류가 없는 양자화된 스펙트럼으로서 처리될 수 있다. 이는 잡음 채움, 잡음 성형 또는 매개변수가 오류 없는 비트스트림 페이로드에 저장되는 기타 작업과 같은, 후속 디코더 작업이 이후에 용될 수 있다는 것을 의미한다. 따라서 가능한 은닉 아티팩트가 완화된다.

이에 따라, 전술한 바와 유사한 페이딩 프로세스가 예를 들어 주파수 빈 k_be에서 시작하여 스펙트럼의 상단까지 스펙트럼에 적용될 수 있으며; 가능한 사용 가능한 음조 특성은 예를 들어, 잡음 쪽으로 서서히 사라질 수 있고/있거나; 예를 들어, 가능하게 표명된 스펙트럼 형상은 예를 들어 평평해질 수 있고/있거나; 에너지는 예를 들어 감소될 수 있다.

이하, 실시 예를 상세히 설명한다.

도 2는 특정 실시 예에 따른 디코딩 모듈(110)을 도시한다.

도 2의 디코딩 모듈(110)은 디코딩된 스펙트럼 저장 모듈(330), 및 선택적으로 양자화된 스펙트럼 저장 모듈(310), 부분 프레임 반복 및 재조정 모듈(320) 및 페이드아웃 및 부호 스크램블링 모듈(340)을 포함한다. 도 2의 특정 디코딩 모듈(110)의 이러한 (서브)모듈의 특정 세부사항은 도 3 내지 도 5를 참조하여 설명된다.

도 3 내지 도 5는 실시 예에 따른 LC3 디코더(예를 들어 독창적인 방식으로 수정된 최첨단 변환 코더로 사용됨)의 고수준 개요를 제공한다. 특히, 도 3 내지 도 5는 디코딩 모듈(110)에 대한 상이한 종류의 특정 실시 예를 제공한다.

일 실시 예에서, 디코딩 모듈(110)은, 예를 들어, 오디오 신호의 양자화된 스펙트럼을 저장하도록 구성된 양자화된 스펙트럼 저장 모듈(310)을 포함할 수 있고, 여기서 양자화된 스펙트럼 저장 모듈(310)은 마지막 비-전 프레임 손실 은닉 양자화된 스펙트럼을 제공하도록 구성된다. 더욱이, 디코딩 모듈(110)은 예를 들어 오디오 신호의 디코딩된 스펙트럼을 저장하도록 구성된 디코딩된 스펙트럼 저장 모듈(330)을 포함할 수 있고, 여기서 디코딩된 스펙트럼 저장 모듈(330)은 마지막 비-전 프레임 손실 은닉 디코딩된 스펙트럼을 제공하도록 구성된다.

도 3은 클린 채널 디코딩을 위한 실시 예에 따른 디코딩 모듈(110) 개요를 도시한다. 특히, 도 3은 정상적인 디코더 동작을 나타낸다. 전 프레임 손실 은닉 및 부분 프레임 손실 은닉에 필요한 처리 블록은 처리 블록(310 및 330)이다.

양자화된 스펙트럼 저장 모듈(310)은, 예를 들어, 양자화된 스펙트럼의 저장을 위해 구성될 수 있다: 양자화된 스펙트럼 저장 모듈(310)은 부분 프레임 손실 은닉의 경우에 재사용을 허용하기 위해 마지막 비-FFLC 양자화된 스펙트럼을 저장한다.

디코딩된 스펙트럼 저장 모듈(330)은 스펙트럼의 저장을 위해 구성된다 (예를 들어, 디코딩된 스펙트럼이라고 함): 이 처리 블록은 전 프레임 손실 은닉의 경우 재사용을 허용하기 위해 마지막 비 FFLC 스펙트럼을 저장한다. 예를 들어, 부분 프레임 손실 은닉 동안 재조정을 위해 사용될 수도 있다.

일 실시 예에서, 디코딩 모듈(110)은 예를 들어 오디오 신호의 디코딩된 스펙트럼을 저장하도록 구성된 디코딩된 스펙트럼 저장 모듈(330)을 포함할 수 있고, 여기서 디코딩된 스펙트럼 저장 모듈(330)은 마지막 비-전 프레임 손실 은닉 디코딩된 스펙트럼을 제공하도록 구성된다. 더욱이, 디코딩 모듈(110)은 예를 들어 스펙트럼의 스펙트럼 라인에 대한 페이드 아웃 및 부호 스크램블링을 위해 구성되는 페이드아웃 및 부호 스크램블링 모듈(340)을 포함할 수 있다.

또한, 일 실시 예에 따르면, 디코딩 모듈(110)은 예를 들어, 오디오 신호의 양자화된 스펙트럼을 저장하도록 구성된 양자화된 스펙트럼 저장 모듈(310)을 포함할 수 있으며, 여기서, 양자화된 스펙트럼 저장 모듈(310)은 마지막 비-전 프레임 손실 은닉 양자화된 스펙트럼을 제공하도록 구성된다. 또한, 디코딩 모듈(110)은, 예를 들어, 부분 프레임 반복 및 재조정을 위해 구성된 부분 프레임 반복 및 재조정 모듈(320)을 포함할 수 있고, 여기서 부분 프레임 반복 및 재조정 모듈(320)은 디코딩 모듈(110)에 의해 디코딩될 수 없는 스펙트럼 라인을 추가함으로써 스펙트럼을 보완하도록 구성되며, 부분 프레임 반복 및 재조정 모듈(320)은 상기 스펙트럼 라인을 재조정하도록 구성된다.

도 4는 전 프레임 손실 은닉을 위한 실시 예에 따른 디코딩 모듈(110) 개요를 도시한다. 특히, 도 4는 전 프레임 손실 은닉을 수행하도록 구성된 실시 예를 도시한다. 전 프레임 손실 은닉에 필요한 처리 블록은 처리 블록(330 및 340)이다. 처리 블록(330 및 340)은 예를 들어, 다음 작업을 가질 수 있다.

디코딩된 스펙트럼 저장 모듈(330)은, 예를 들어, 스펙트럼(예를 들어, 다시 디코딩된 스펙트럼으로 지칭됨)의 저장을 위해 구성될 수 있다: 이 처리 블록(330)은 마지막 비-FFLC 스펙트럼을 제공한다.

페이드아웃 및 부호 스크램블링 모듈(340)은 예를 들어, 다음과 같이 페이드아웃 및 부호 스크램블링을 위해 구성될 수 있다. 이 처리 블록은 아래에서 설명하는 것처럼 마지막 비 FFLC 프레임의 스펙트럼 라인을 처리하여 스펙트럼을 생성하도록 구성된다.

도 5는 부분 프레임 손실 은닉을 위한 실시 예에 따른 디코딩 모듈(110) 개요를 도시한다.

특히, 도 5는 부분 프레임 손실 은닉의 적용을 나타낸다. 부분 프레임 손실 은닉에 필요한 처리 블록은 처리 블록(310, 320, 330, 340)이다. 이러한 처리 블록(310, 320, 330 및 340)은 다음 작업을 수행한다.

양자화된 스펙트럼 저장 모듈(310)은, 예를 들어, 양자화된 스펙트럼의 저장을 위해 구성될 수 있다: 양자화된 스펙트럼 저장 모듈(310)은, 예를 들어, 마지막 비-FFLC 양자화된 스펙트럼을 제공하도록 구성될 수 있다.

부분 프레임 반복 및 재조정 모듈(320)은 예를 들어 부분 프레임 반복 및 재조정을 위해 구성될 수 있다: 이 처리 블록은 예를 들어 디코딩될 수 없는 스펙트럼 라인을 추가함으로써 스펙트럼을 보완하도록 구성될 수 있다. 그 후에, 그 스펙트럼 라인은 예를 들어, 아래에서 설명되는 바와 같이 재조정될 수 있고 특정 임계값 미만의 값은 0으로 양자화된다.

디코딩된 스펙트럼 저장 모듈(330)은, 예를 들어, 스펙트럼(예를 들어, 다시 디코딩된 스펙트럼으로 지칭됨)의 저장을 위해 구성될 수 있다: 디코딩된 스펙트럼 저장 모듈(330)은, 예를 들어, 재조정 계수를 계산하기 위해 사용될 수 있는 마지막 비-FFLC 스펙트럼을 제공하도록 구성될 수 있다.

페이드아웃 및 부호 스크램블링 모듈(340)은 예를 들어, 다음과 같이 페이드아웃 및 부호 스크램블링을 위해 구성될 수 있다: 페이드아웃 및 부호 스크램블링 모듈(340)은 예를 들어, 부분 프레임 손실 은닉에 의해 이전에 제공되었던 스펙트럼 라인을 처리하도록 구성될 수 있다. 이하 설명한다.

이하에서는 일부 실시 예에 따른 계조에 따른 오류 은닉에 대해 보다 구체적으로 설명한다.

먼저, 일부 실시 예에 따른 페이딩 함수가 제공된다.

아래에 설명된 바와 같이, 부호 스크램블링 및 비선형 감쇠를 위해 구현된 페이딩 프로세스의 경우, 특정 값(plc_start_inFrames)까지 1이고, 특정 값(plc_end_inFrames)부터 영이고; plc_start_inFrames와 plc_end_inFrames 사이에서는 1과 0 사이에서 (1 > x > 0) 선형적으로 감소하는, 이후에 손실된 프레임 수에 따른 함수(nbLostFramesInRow)가 이용될 수 있다.

특정 실시 예는 예를 들어 다음과 같이 구현될 수 있다:

plc_duration_inFrames = plc_end_inFrames - plc_start_inFrames;

x = max(plc_start_inFrames, (min (nbLostFramesInRow, plc_end_inFrames)));

m = -1 / plc_duration_inFrames;

b = - plc_end_inFrames;

linFuncStartStop = m * (x + b);

여기서,

plc_start_inFrames - linFuncStartStop의 값은 1과 같을 때 까지 이후에 손실된 프레임 수,

plc_end_inFrames - linFuncStartStop의 값은 0과 같을 때 부터 이후에 손실된 프레임 수,

linFuncStartStop - 페이딩 함수의 값,

시작 값과 끝 값은 신호 특성(예: 유성음 대 무성음) 및 프레임 손실 은닉(예: PFLC 대 FFLC)에 따라 다르게 선택될 수 있다 (PFLC = 부분 프레임 손실 은닉, FFLC = 전 프레임 손실 은닉).

도 6은 연속된 손실 프레임의 수에 의존하는 실시 예에 따른 페이딩 함수를 도시한다 (연속적으로 손실된 프레임 수).

특히, 도 6은 20ms와 60ms 사이에서 선형적으로 감소하도록 구성된 이 페이딩 함수의 예를 제공한다.

이하에서는 일부 실시 예에 따른 부호의 취급을 보다 구체적으로 설명한다.

전제 조건으로서, 부호 스크램블링에 대한 임계값은 예를 들어 위에서 도출된 페이딩 값(linFuncStartStop)에 기초하여 결정될 수 있다.

randThreshold = -32768 * linFuncStartStop;

도 7은 일 실시 예에 따른 부호 스크램블링에 대한 임계값을 도시하며, 이는 연속적으로 손실된 프레임의 수(연속적으로 손실된 프레임의 수)에 의존하고 또한 프레임 길이에 의존한다.

특히, 도 7은 페이딩 기능을 사용하여 연속적으로 손실된 프레임의 수에 의존하는 임계값에 대한 예를 제공하고, 여기서 임계값 0은 50% 부호 반전에 해당하는 반면, 임계값 -32768은 0% 부호 반전에 해당한다.

실시 예는 예를 들어 다음 의사 코드에 의해 실현될 수 있다:

for k=k_be.. N_F-1

seed = 16831+seed*12821;

seed = seed-round(seed*2^-16)*2^16;

if seed==32768

seed=-32768;

end

if (seed < 0 && pitch_present == 0) || seed < randThreshold

spec(k) = -spec_prev(k);

else

spec(k) = spec_prev(k);

end

여기서:

k - 스펙트럼 빈

k_be - 복구될 수 없는 제 1 스펙트럼 빈

N_F - 스펙트럼 라인의 수

seed - 예시적인 초기값이 24607인 임의의 값

pitch_present - 현재 프레임의 신호가 음조인지 여부

spec_prev(k) - 마지막 양호한 프레임에서 빈 k의 스펙트럼 값

라고도 함)

spec(k) - 현재 프레임에서 빈 k의 스펙트럼 값.

이 예에서 시드(즉, 임의 값)는 32768과 -32768 사이에서 다양한다. 무성 신호(pitch_present == 0)의 경우 부호 반전 임계값은 0이며, 이는 50% 확률이 된다.음성 신호의 경우, -32768(부호 반전 확률 0%)과 0(부호 반전 확률 50%) 사이에 있는 가변 임계값(randThreshold)이 적용된다.

다음에서, 일부 실시 예에 따른 진폭의 취급이 더 상세하게 설명된다.

특정 실시 예에서, 2개의 감쇠 계수는 예를 들어 다음과 같이 안정성 측정에 따라 정의될 수 있다:

slow = 0.8 + 0.2 * stabFac;

fast = 0.3 + 0.2 * stabFac.

여기서 stabFac는 FFLC 경우 마지막 프레임과 마지막에서 두 번째 프레임 사이 또는 PFLC 경우 현재와 마지막 프레임 사이의 안정성 값을 나타낸다.

안정성 계수는, 예를 들어, 두 신호 사이, 예를 들어, 현재 신호와 과거 신호 사이의 유사성을 나타낼 수 있다. 예를 들어, 안정성 계수는 예를 들어 [0:1]로 제한될 수 있다. 1 또는 1에 가까운 안정성 계수는 예를 들어 두 신호가 매우 유사함을 의미할 수 있고, 0 또는 0에 가까운 안정성 계수는 예를 들어 두 신호가 매우 다르다는 것을 의미할 수 있다. 유사성은 예를 들어 2개의 오디오 신호의 스펙트럼 엔벨로프에 대해 계산될 수 있다.

안정성 계수 θ는 예를 들어 다음과 같이 계산될 수 있다:

여기서:

scfQ_curr은 현재 프레임의 스케일팩터 벡터를 나타내고,

scfQ_prev는 이전 프레임의 스케일팩터 벡터를 나타내고,

N은 스케일팩터 벡터 내의 스케일팩터의 수를 나타내고,

θ는 0≤θ≤1로 경계를 이루는 안정성 계수를 나타내고,

k는 스케일팩터 벡터에 대한 인덱스를 나타낸다.

일부 실시 예에서, stabFac는 예를 들어 FFLC 및 PFLC에 대해 상이하게 사용될 수 있고; 즉 이것은 FFLC의 경우 안정성에 따라 0과 1 사이의 값을 설정할 수 있는 반면, PFLC의 경우에는 1로 설정할 수 있다.

결과적으로, 예를 들어 다음과 같이 프레임 마다 변경될 수 있는 해당 누적 감쇠 계수 (cum_fading_slow 및 cum_fading_fast, 각 버스트 손실의 시작 부분에서 1로 초기화됨)가 파생될 수 있다.

cum_fading_slow = cum_fading_slow * slow;

cum_fading_fast = cum_fading_fast * fast;

여기서, cum_fading_slow는 느린 누적 감쇠 계수를 나타내고, cum_fading_fast는 빠른 누적 감쇠 계수를 나타낸다.

일 실시 예에서, 축적은 예를 들어 FFLC에 대해서만 수행될 수 있지만, PFLC에 대해서는 수행되지 않을 수 있다.

또한, 일 실시 예에 따르면, 예를 들어, 제1 임계값(ad_ThreshFac_start) 및 마지막 임계값(ad_ThreshFac_end)에 대한 값이 정의될 수 있다. 일부 실시 예에서, 이러한 값은 예를 들어 경험적으로 선택될 수 있다. 일반적으로 두 값은 예를 들어 1 보다 클 수 있으며 제 1 임계값은 마지막 임계값보다 더 크다. 이러한 두 임계값 제한에 기초하여, 현재 프레임(ad_threshFac)에 대한 임계값은 예를 들어 위에서 도출된 페이딩 값(linFuncStartStop)에 기초하여 결정될 수 있다:

ad_ThreshFac_start = 10;

ad_ThreshFac_end = 1.2;

ad_threshFac = (ad_ThreshFac_start - ad_ThreshFac_end) *

linFuncStartStop + ad_ThreshFac_end;

여기서 ad_ThreshFac_start는 더 강한 감쇠가 적용되는 에너지를 의미하는 제 1 요소를 나타내며; ad_ThreshFac_stop은 더 강한 감쇠가 적용되는 에너지를 의미하는 마지막 요소를 나타낸다.

임계값 조정은 FFLC에 대해서만 수행될 수 있고, PFLC에 대해서는 수행될 수 없다. 이 경우 임계값은 후속 프레임에 대해 수정된다.

도 8은 일 실시 예에 따른 에너지 임계 지수를 도시하며, 이는 연속된 손실 프레임의 수에 의존하고 프레임 길이에 더 의존한다.

특히, 도 8은 페이딩 기능을 사용하여 연속적으로 손실된 프레임의 수에 따른 임계 지수에 대한 예를 제공하고, 여기서 임계 지수는 20ms와 60ms 사이에서 10에서 1.2로 감소한다.

특정 실시 예에서, 적응적 페이딩은 빈 입도에서 동작한다. 이것은 다음과 같이 실현할 수 있다:

frame_energy = mean(spec(k_be.. N_F-1).^2);

energThreshold = ad_threshFac * frame_energy;

for k=k_be.. N_F-1

if (spec(k)^2) < energThreshold

m = cum_fading_slow;

n = 0;

else

m = cum_fading_fast;

n = (cum_fading_slow-cum_fading_fast)

* sqrt(energThreshold)

* sign(spec_prev(k));

end

spec(k) = m * spec_prev(k) + n;

end

여기서:

k - 스펙트럼 빈

k_be - 복구될 수 없는 제 1 스펙트럼 빈

N_F - 스펙트럼 라인의 수

spec_prev(k) - 마지막 양호한 프레임에서 빈 k의 스펙트럼 값(아래에서

라고 함)

spec(k) - 현재 프레임에서 빈 k의 스펙트럼 값.

그 외 경로에서 n을 유도하면 감쇠 곡선이 더 큰 값을 더 크게 유지하고 더 작은 값을 더 작게 유지한다.

도 9는 누적 감쇠가 적용된 예를 도시한다. 예제에서 가능한 입력 값은 0에서 1000 사이이다. n=0은 수신된 프레임을 나타내며 일종의 참조를 제공한다. 예에서 초기 저속 감쇠 계수는 0.9로 설정되고 초기 고속 감쇠 계수는 0.4로 설정된다(stabFac=0.5). 제 2 프레임에서, 이들 값의 제곱이 사용되는 등으로 후속 곡선이 더 평평해진다. 동시에, 임계값이 예를 들어, 감소될 수 있고, 이로 인해 연속적 곡선이 왼쪽으로 더 비틀어지게 한다.

다른 특정 실시 예에서, 적응적 페이딩은 대역별로 동작한다. 이 예에서 대역별 에너지가 파생되고 모든 대역의 평균보다 높은 대역의 빈에 적응형 감쇠가 적용된다. 그러한 경우에, 그 대역의 에너지는 예를 들어, 빈 단위 적응 감쇠에 대한 임계값으로 사용될 수 있다. 예시적인 구현은 예를 들어 다음과 같이 실현될 수 있다:

bin_energy_per_band = zeros(ceil((

-

)/8),1);

idx = 1;

for k=

:8:(

-7)

bin_energy_per_band(idx) = mean(spec(k:k+7).^2);

idx = idx + 1;

end

energThreshold = ad_threshFac * mean(bin_energy_per_band);

idx = 1;

for k=

:8:(

-7)

if bin_energy_per_band(idx) < energThreshold

m = cum_fading_slow;

spec(k:k+7) = m * spec_prev(k:k+7);

else

for j=k:k+7

if (spec(j)^2) < bin_energy_per_band(idx)

m = cum_fading_slow;

n = 0;

else

m = cum_fading_fast;

n = (cum_fading_slow-cum_fading_fast) * sqrt(energThreshold) * sign(spec_prev(j));

end

spec(j) = m * spec_prev(j) + n;

end

idx = idx + 1;

end

여기서:

k, j - 스펙트럼 빈

k_be - 복구될 수 없는 제 1 스펙트럼 빈

N_F - 스펙트럼 라인의 수

라고 함)

spec(k) - 현재 프레임에서 빈 k의 스펙트럼 값.

idx - 대역 지수

bin_energy_per_band - 대역당 빈 에너지

수신된 프레임 동안 스펙트럼 라인의 저장과 (부분적으로 또는 완전히) 손실된 프레임 동안 스펙트럼 라인 삽입은 일반적으로 비트스트림에 제공된 정보에 기초한 스펙트럼의 디코딩과 시간 도메인으로의 변환 사이의 임의의 위치에서 수행될 수 있다. LC3를 참조하면, 이것은 특히 예를 들어 SNS 디코딩(SNS = Spectral Noise Shaping) 전후, 예를 들어, TNS 디코딩 전후(TNS = Temporal Noise Shaping), 예를 들어, 전역 이득 적용 전 또는 후에, 및/또는 예를 들어 잡음 채움 전이나 후에 수행될 수 있다.

선호하는 위치의 선택은 부분적으로 또는 완전히 손실된 프레임에 대한 추가 정보의 가용성에 따라 달라질 수도 있다. 이것은 예를 들어, 부분적으로 프레임이 손실된 경우(부분 프레임 손실 은닉) 신호 처리의 시작 부분에서 수행될 수 있는데; 이는 후속 신호 처리 단계에 대한 매개변수를 사용할 수 있기 때문이다. 예를 들어, 프레임이 완전히 손실된 경우(전 프레임 손실 은닉) 나중 단계에서 수행될 수 있는데, 이는 후속 신호 처리 단계의 매개변수를 사용할 수 없기 때문이다. 그러나 예를 들어 SNS 디코딩 전에 여전히 수행될 수 있는데, 이 단계가 전용 스펙트럼 형성을 허용하기 때문이다.

다음에서, 일부 실시 예에 따른 부분 프레임 손실 은닉에 대해 더 자세히 설명한다.

부분 프레임 손실 은닉을 위한 특정 구현은 예를 들어 먼저 재조정 계수를 적용한 다음에, 예를 들어 특정 임계값 아래의 스펙트럼 빈을 0으로 양자화할 수 있다. 이것은 다음 예제 의사 코드에 표시되어 있다:

for k=

..

=

;

if |

| < threshold

= 0;

여기서:

k - 스펙트럼 빈

NF - 스펙트럼 라인의 수

k_be - 복구될 수 없는 제 1 스펙트럼 빈

- 현재 프레임의 양자화된 스펙트럼 라인 k

- 마지막 비-FFLC 프레임의 양자화된 스펙트럼 라인 k

fac - 재조정 계수

임계값 - 0으로 양자화하기 위한 예시적인 값이 0.625인 임계값.

전역 이득 fac_gg에 따른 재조정 계수는 현재 전역 이득과 과거 전역 이득 간의 비율로 파생된다:

에너지 fac_ener에 따른 재조정 계수는 1로 초기화된다. 다음 조건:

이 충족되는 경우, 이 재조정 계수는 해당 전역 이득의 제곱을 곱한 현재와 과거 양자화된 스펙트럼 사이의 비율의 근으로 설정된다:

총 재조정 계수는 다음과 같이 유도된다:

fac_ener≠1일 때, 이것은 다음이 된다(전역 이득 값이 서로 상쇄됨):

위 방정식에서 변수의 의미는 다음과 같다.

k - 스펙트럼 빈

k_be - 복구될 수 없는 제 1 스펙트럼 빈

N_F - 스펙트럼 라인의 수

- 마지막 비-FFLC 프레임의 양자화된 스펙트럼

- 현재 프레임의 양자화된 스펙트럼

- 마지막 비-FFLC 프레임의 디코딩된 스펙트럼

gg - 현재 프레임의 전역 이득(비트스트림에 코딩된 양자화된 스펙트럼이 전역 이득으로 재조정되는 경우)

gg_prev - 마지막 비-FFLC 프레임의 전역 이득(비트스트림에 코딩된 양자화된 스펙트럼이 전역 이득으로 재조정되는 경우).

다음 예시 의사 코드는 예시적인 구현에 따른 재조정 계수의 결정을 보여준다:

fac =

;

mean_nrg_high = mean(

(

:

).^2);

mean_nrg_low = mean(

(0:

-1).^2);

if (mean_nrg_low > mean_nrg_high)

ener_prev = sum(

(0:

-1).^2);

ener_curr = sum(

(0:

-1).^2);

if ener_prev*

^2 > ener_curr*

^2

fac = sqrt(ener_curr/ener_prev);

여기서:

fac - 재조정 계수

gg_prev - 마지막 비-FFLC 프레임의 전역 이득(비트스트림에 코딩된 양자화된 스펙트럼이 전역 이득으로 재조정되는 경우)

k_be - 복구될 수 없는 제 1 스펙트럼 빈

N_F - 스펙트럼 라인의 수

- 마지막 비-FFLC 프레임의 디코딩된 스펙트럼

- 마지막 비-FFLC 프레임의 양자화된 스펙트럼

- 현재 프레임의 양자화된 스펙트럼

sqrt - 제곱근 함수.

일부 양태가 장치의 맥락에서 설명되었지만, 이러한 양태는 또한 블록 또는 장치가 방법 단계 또는 방법 단계의 특징에 대응하는 해당 방법의 설명을 나타내는 것이 분명한다. 유사하게, 방법 단계의 맥락에서 설명된 양태는 또한 대응하는 장치의 대응 블록 또는 항목 또는 특징의 설명을 나타낸다. 방법 단계의 일부 또는 전부는 예를 들어 마이크로프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 이를 사용하여) 실행될 수 있다. 일부 실시 예에서, 가장 중요한 방법 단계 중 하나 이상이 그러한 장치에 의해 실행될 수 있다.

특정 구현 요구 사항에 따라, 본 발명의 실시 예는 하드웨어 또는 소프트웨어, 또는 적어도 일부가 하드웨어로, 또는 적어도 일부가 소프트웨어로 구현될 수 있다. 구현은 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는 (또는 협력할 수 있는) 전자적으로 판독 가능한 제어 신호가 저장되어 있는, 플로피 디스크, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리와 같은 디지털 저장 매체를 사용하여 수행할 수 있다. 따라서, 디지털 저장 매체는 컴퓨터 판독 가능할 수 있다.

본 발명에 따른 일부 실시 예는 전자적으로 판독 가능한 제어 신호를 갖는 데이터 캐리어를 포함하며, 이는 본 명세서에서 설명된 방법 중 하나가 수행되는 것과 같이, 프로그래밍 가능한 컴퓨터 시스템과 협력할 수 있다.

일반적으로, 본 발명의 실시 예는 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로 구현될 수 있으며, 이 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 방법 중 하나를 수행하기 위해 작동한다. 프로그램 코드는 예를 들어 기계 판독 가능 캐리어에 저장될 수 있다.

다른 실시 예는 기계 판독 가능 캐리어에 저장된 본 명세서에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.

즉, 본 발명의 방법의 실시 예는 컴퓨터 프로그램은 컴퓨터에서 실행될 때,본 명세서에 설명된 방법 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.

따라서 본 발명의 방법의 추가 실시 예는, 본 명세서에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램이 기록되어 있는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능 매체)이다. 데이터 캐리어, 디지털 저장 매체 또는 기록 매체는 일반적으로 유형적 및/또는 비 과도적이다.

따라서 본 발명의 방법의 추가 실시 예는 본 명세서에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호 시퀀스이다. 데이터 스트림 또는 신호 시퀀스는 예를 들어 데이터 통신 연결을 통해, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.

추가 실시 예는 본 명세서에서 설명된 방법 중 하나를 수행하도록 구성되거나 적응된 처리 수단, 예를 들어 컴퓨터, 또는 프로그래밍 가능한 논리 장치를 포함한다.

추가 실시 예는 본 명세서에서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.

본 발명에 따른 추가 실시 예는 본 명세서에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기로 (예를 들어, 전자적으로 또는 광학적으로) 전송하도록 구성된 장치 또는 시스템을 포함한다. 수신기는 예를 들어 컴퓨터, 모바일 장치, 메모리 장치 등일 수 있다. 장치 또는 시스템은 예를 들어 컴퓨터 프로그램을 수신기로 전송하기 위한 파일 서버를 포함할 수 있다.

일부 실시 예에서, 프로그래밍 가능 논리 장치 (예를 들어, 필드 프로그래밍 가능 게이트 어레이)는 본 명세서에서 설명된 방법의 기능의 일부 또는 전부를 수행하는 데 사용될 수 있다. 일부 실시 예에서, 필드 프로그래밍 가능 게이트 어레이는 본 명세서에서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 방법은 바람직하게는 임의의 하드웨어 장치에 의해 수행된다.

본 명세서에 설명된 장치는 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 하드웨어 장치와 컴퓨터의 조합을 사용하여 구현될 수 있다.

본 명세서에 설명된 방법은 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 하드웨어 장치와 컴퓨터의 조합을 사용하여 수행될 수 있다.

전술한 실시 예는 본 발명의 원리에 대한 예시일 뿐이다. 본 명세서에 기술된 배열 및 세부 사항의 정정 및 변경은 당업자에게 명백할 것임이 이해된다. 따라서, 본 명세서의 실시 예의 설명 및 설명에 의해 제시된 특정 세부 사항이 아니라 임박한 특허 청구 범위에 의해서만 제한하고자 한다.

[참고문헌]

[1] P. Lauuber 및 R. Sperschneider, "압축 디지털 오디오에 대한 오류 은닉", 2001년 오디오 엔지니어링 학회.

[2] J. Lecomte 및 A. Tomasek, "상이한 주파수 대역에 대한 상이한 감쇠율에 따라 은닉된 오디오 프레임을 페이드아웃하는 오류 은닉 장치, 오디오 디코더 및 관련 방법 및 컴퓨터 프로그램" 2017년 공개된 WO 2017/153299 A2.

[3] A. Ramo, A. Kurittu 및 H. Toukomaa, "프레임 삭제에 대한 EVS 채널 인식 모드 견고성", Interspeech 2016, San Francisco, CA, USA, 2016.

[4] A. Venkatraman, DJ Sinder, S. Shaminda, R. Vivek, D. Duminda, C. Venkata, V. Imre, K. Venkatesh, S. Benjamin, L. Jeremie, Z. Xingtao 및 M. Lei, "3GPP EVS 채널 인식 코딩으로 VoLTE 및 VoIP에 대한 향상된 오류 복원력", 2015년 ICASSP.

[5] M. Schnabel, G. Markovic, R. Sperschneider, C. Helmrich 및 J. Lecomte, "fdns 적용 이전에 백색 잡음에 대한 mdct 스펙트럼의 페이딩을 실현하는 장치 및 방법". 2017년 공개된 유럽 특허 EP 3 011 559 B1.

Claims

현재 프레임을 디코딩하여 오디오 신호를 복원하는 디코더(100)에 있어서,
상기 오디오 신호는 상기 현재 프레임 내에서 인코딩되고, 상기 현재 프레임은 현재 비트스트림 페이로드를 포함하고, 상기 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함하고, 상기 복수의 페이로드 비트는 상기 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩하고, 상기 페이로드 비트의 각각은 상기 현재 비트스트림 페이로드 내의 위치를 나타내고,
상기 디코더(100)는,
상기 오디오 신호를 복원하도록 구성된 디코딩 모듈(110), 및
상기 오디오 신호를 출력하도록 구성된 출력 인터페이스(120)
를 포함하고,
상기 디코딩 모듈(110)은 오류 은닉 모드를 포함하고,
상기 디코딩 모듈(110)이 상기 오류 은닉 모드에 있는 경우, 상기 디코딩 모듈(110)은 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 상기 오디오 신호를 복원하도록 구성되며; 및/또는
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 상기 디코딩 모듈(110)은 상기 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 상기 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성되는, 디코더(100).
제 1 항에 있어서,
상기 오류 은닉 모드는 부분 프레임 손실 은닉 모드이고, 상기 디코딩 모듈(110)이 상기 부분 프레임 손실 은닉 모드에 있는 경우, 상기 디코딩 모듈(110)은:
상기 임계 주파수보다 작거나 같은 주파수를 나타내는 상기 스펙트럼의 상기 복수의 스펙트럼 라인 중 하나 이상의 제1 스펙트럼 라인에 대해 오류 은닉을 수행하지 않고 상기 오디오 신호를 복원하고 - 상기 하나 이상의 제1 스펙트럼 라인은 상기 복수의 페이로드 비트 중 하나 이상의 제1 그룹에 의해 인코딩됨 -
상기 임계 주파수보다 큰 주파수를 나타내는 상기 스펙트럼의 상기 복수의 스펙트럼 라인 중 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 상기 오디오 신호를 복원하도록 - 상기 하나 이상의 제2 스펙트럼 라인은 상기 복수의 페이로드 비트 중 하나 이상의 제2 그룹에 의해 인코딩됨 -
구성되는, 디코더(100).
제 2 항에 있어서,
상기 디코딩 모듈(110)은 상기 현재 프레임이 상기 임계 주파수보다 작거나 같은 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 임의의 손상된 비트를 포함하지 않는지를 검출하도록 구성되고,
상기 디코딩 모듈(110)은 현재 프레임이 상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 하나 이상의 손상된 비트를 포함하는지 여부를 검출하도록 구성되고,
상기 하나 이상의 손상된 비트는 왜곡되거나 왜곡될 가능성이 있는 상기 페이로드 비트 중 하나 이상이고,
상기 현재 프레임이 상기 임계 주파수보다 작거나 같은 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 임의의 손상된 비트를 포함하지 않는 경우 및 상기 현재 프레임이 상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 상기 하나 이상의 손상된 비트를 포함하는 경우, 상기 디코딩 모듈(110)은 상기 임계 주파수보다 큰 상기 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 상기 부분 프레임 손실 은닉 모드에서 오류 은닉을 수행하도록 구성되는, 디코더(100).
제 3 항에 있어서,
상기 현재 프레임이 상기 임계 주파수보다 작거나 같은 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 임의의 손상된 비트를 포함하지 않는 경우 및 상기 현재 프레임이 상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인을 인코딩하는 상기 하나 이상의 손상된 비트를 포함하는 경우, 상기 디코딩 모듈(110)은 상기 임계 주파수보다 작거나 같은 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 상기 복수의 페이로드 비트 중 상기 하나 이상의 상기 제1 그룹을 디코딩하여 상기 오디오 신호를 복원하도록 구성되는, 디코더(100).
제 2 항 내지 제 4 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)은 상기 현재 프레임이 손실되었는지 여부를 검출하도록 구성되고,
상기 디코더(100)가 상기 현재 프레임이 손실된 것을 검출한 경우, 상기 디코딩 모듈(110)은
상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하고,
오류 은닉을 수행하지 않고, 상기 임계 주파수 보다 작거나 같은 상기 오디오 신호의 상기 스펙트럼의 상기 하나 이상의 제1 주파수에 대해 상기 하나 이상의 제1 스펙트럼 라인을 인코딩하는 상기 복수의 페이로드 비트 중 상기 하나 이상의 상기 제1 그룹을 디코딩함으로써,
상기 오디오 신호를 복원하도록 구성되고,
상기 복수의 페이로드 비트 중 상기 하나 이상의 상기 제1 그룹은 상기 현재 프레임과 상이한 리던던트 프레임의 하나 이상의 페이로드 비트인, 디코더(100).
제 2 항 내지 제 5 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)이 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하도록 구성된 경우, 상기 디코딩 모듈(110)은 상기 스펙트럼의 모든 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성되는, 디코더(100).
제 6 항에 있어서,
상기 복수의 페이로드 비트는 복수의 현재 페이로드 비트이고,
상기 디코딩 모듈(110)이 부분 프레임 손실 은닉 모드에 있는 경우, 상기 디코딩 모듈(110)은 상기 이전 프레임의 상기 이전 비트스트림 페이로드의 하나 이상의 이전 페이로드 비트에 의해 인코딩된 하나 이상의 저장된 스펙트럼 라인을 사용하여, 상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성되는, 디코더(100).
제 7 항에 있어서,
상기 스펙트럼은 현재 양자화된 스펙트럼이고,
상기 디코딩 모듈(110)이 상기 부분 프레임 손실 은닉 모드에서 오류 은닉을 수행하는 경우, 상기 디코딩 모듈(110)은 상기 현재 양자화된 스펙트럼의 하나 이상의 중간 스펙트럼 라인을 얻기 위해서, 상기 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 스펙트럼의 상기 하나 이상의 제2 스펙트럼 라인에 대해 오류 은닉을 수행하도록 구성되고, 상기 디코딩 모듈(110)은 오디오 신호를 복원하기 위해 재조정 계수를 사용하여 상기 하나 이상의 중간 스펙트럼 라인을 재조정하도록 구성되는, 디코더(100).
제 8 항에 있어서,
상기 디코딩 모듈(110)은
상기 현재 비트스트림 페이로드 내에서 인코딩되는 전역 이득,
상기 이전 비트스트림 페이로드 내에서 인코딩되는 전역 이득,
상기 이전 프레임의 이전 양자화된 스펙트럼의 에너지, 상기 이전 프레임의 이전 디코딩된 스펙트럼의 에너지, 및
상기 현재 프레임의 상기 현재 양자화된 스펙트럼의 에너지
중 적어도 하나에 따라 상기 재조정 계수를 결정하도록 구성되는, 디코더(100).
제 8 항 또는 제 9 항에 있어서,
상기 디코딩 모듈(110)은:
오류 은닉을 수행하지 않고 복원될 수 없는 제 1 스펙트럼 빈에서 시작하여 상기 스펙트럼의 상단까지 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼의 스펙트럼 빈의 평균 에너지 보다 크거나 같은지, 또는
0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 현재 프레임의 상기 현재 양자화된 스펙트럼의 스펙트럼 빈의 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 이전 프레임의 상기 이전 양자화된 스펙트럼의 스펙트럼 빈의 에너지보다 크거나 같은지
에 따라서 상기 재조정 계수를 결정하도록 구성되는, 디코더(100).
제 10 항에 있어서,
오류 은닉을 수행하지 않고 복원될 수 없는 상기 제1 스펙트럼 빈으로부터 시작하여 상기 스펙트럼의 상단까지 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼의 상기 스펙트럼 빈의 상기 평균 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼의 상기 스펙트럼 빈의 상기 평균 에너지보다 작고,
0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 현재 프레임의 상기 현재 양자화된 스펙트럼의 스펙트럼 빈의 상기 에너지가 0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈까지 상기 이전 프레임의 상기 이전 양자화된 스펙트럼의 상기 스펙트럼 빈의 상기 에너지보다 작은 경우,
상기 디코딩 모듈(110)은 상기 재조정 계수가
0에서 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈에 상기 현재 프레임의 이득 계수의 제곱을 곱한 값까지 상기 현재 양자화된 스펙트럼의 상기 스펙트럼 빈의 상기 에너지, 대(to)
0부터 시작하여 오류 은닉을 수행하지 않고 복원될 수 있는 상기 마지막 스펙트럼 빈에 상기 이전 프레임의 이득 계수의 제곱을 곱한 값까지 상기 이전 양자화된 스펙트럼의 상기 스펙트럼 빈의 상기 에너지
의 비율의 제곱근과 동일하도록 상기 재조정 계수를 결정하도록 구성되는, 디코더(100).
제 9 항 내지 제 11 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)은 전체 재조정 계수인 상기 재조정 계수가 전역 이득 재조정 계수에 따라 좌우된다고 결정하도록 구성되며,
상기 디코딩 모듈(110)은 상기 전역 이득 재조정 계수를:

에 따라 결정하도록 구성되고,
gg는 상기 현재 비트스트림 페이로드 내에서 인코딩되는 상기 전역 이득을 나타내고,
gg_prev는 상기 전역 이득이 상기 이전 비트스트림 페이로드 내에서 인코딩되는 것을 나타내고,
fac_gg는 상기 전역 이득 재조정 계수인, 디코더(100).
제 12 항에 있어서,

이거나,

인 경우,
상기 디코딩 모듈(110)은 상기 전체 재조정 계수가 상기 전역 이득 재조정 계수와 동일한지 결정하도록 구성되고,
k는 스펙트럼 빈을 나타내고, k_be는 복구될 수 없는 제 1 스펙트럼 빈을 나타내며, N_F는 스펙트럼 라인의 수를 나타내며,
는 상기 이전 프레임의 상기 이전 양자화된 스펙트럼이 마지막 비-전 프레임 손실 은닉 프레임인 것을 나타내고,
는 상기 현재 프레임의 상기 현재 양자화된 스펙트럼을 나타내고,
는 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼이 상기 마지막 비-전 프레임 손실 은닉 프레임인 것을 나타내는, 디코더(100).
제 12 항 또는 제 13 항에 있어서,

이거나,

인 경우,
상기 디코딩 모듈(110)은 상기 총 재조정 계수가 또한 에너지 재조정 계수,

에 의존한다고 결정하도록 구성되고,
k는 스펙트럼 빈을 나타내고, k_be는 복구될 수 없는 제 1 스펙트럼 빈을 나타내며, N_F는 스펙트럼 라인의 수를 나타내며,
는 상기 이전 프레임의 상기 이전 양자화된 스펙트럼이 마지막 비-전 프레임 손실 은닉 프레임인 것을 나타내고,
는 상기 현재 프레임의 상기 현재 양자화된 스펙트럼을 나타내고,
는 상기 이전 프레임의 상기 이전 디코딩된 스펙트럼이 상기 마지막 비-전 프레임 손실 은닉 프레임인 것을 나타내는, 디코더(100).
제 14 항에 있어서,

인 경우, 및

인 경우,
상기 디코딩 모듈(110)은 총 재조정 계수 fac를

에 따라, 또는

에 따라, 또는

에 따라 결정하도록 구성되는, 디코더(100).
이전 항들 중 어느 한 항에 따라서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 상기 디코딩 모듈(110)은 상기 오디오 신호의 이전 스펙트럼의 복수의 부호를 사용하여 오류 은닉을 수행함으로써 상기 오디오 신호의 현재 스펙트럼을 복원하도록 구성되고, 상기 복수의 부호는 상기 이전 프레임 내에서 인코딩되고, 상기 디코딩 모듈(110)은 상기 이전 프레임이 음조 또는 고조파 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 오류 은닉을 수행하도록 구성되는, 디코더(100).
제 16 항에 있어서,
상기 이전 프레임은 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임이거나,
상기 이전 프레임은 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된, 마지막 수신 프레임이거나,
상기 이전 프레임은 부분 프레임 손실 은닉 모드 또는 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된 마지막 수신 프레임인, 디코더(100).
제 16 항 또는 제 17 항에 있어서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 및 상기 이전 프레임의 상기 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하는 경우, 상기 디코딩 모듈(110)은 상기 현재 스펙트럼을 복원하기 위해 상기 이전 스펙트럼의 상기 복수의 부호 중 하나 이상의 부호를 반전하도록 구성되고, 상기 현재 스펙트럼을 복원하기 위해 상기 이전 스펙트럼의 상기 복수의 부호 중 하나의 부호가 상기 디코딩 모듈(110)에 의해 반전될 확률을 나타내는 백분율 값 p은 0% ≤ p ≤ 50% 사이이고, 상기 디코딩 모듈(110)은 상기 백분율 값 p를 결정하도록 구성되는, 디코더(100).
제 18 항에 있어서,
상기 디코딩 모듈(110)은 후속 프레임의 수에 따라 상기 백분율 값 p를 증가시키도록 구성되고;
상기 후속 프레임의 수는 얼마나 많은 후속하는 부분 또는 완전 손실된 프레임에 대해 상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는지를 나타내고; 또는 상기 후속 프레임의 수는 특정 오류 은닉 모드에서 얼마나 많은 후속 프레임에 대해 디코딩 모듈(110)에 의해 오류 은닉이 수행되었는지를 나타내는, 디코더(100).
제 19 항에 있어서,
상기 디코딩 모듈(110)은 상기 후속 프레임의 수에 의존하는 함수에 따라 백분율 값 p를 결정하도록 구성되고, 상기 후속 프레임의 수는 상기 함수의 인수인, 디코더(100).
제 20 항에 있어서,
상기 디코딩 모듈(110)은,
상기 후속 프레임의 수가 제1 임계값보다 작은 경우, p가 0%가 되고;
상기 후속 프레임의 수가 상기 제1 임계값보다 크거나 같고 제2 임계값보다 작은 경우, 0 % ≤ p ≤ 50 %가 되고; 및
상기 후속 프레임의 수가 상기 제2 임계값보다 큰 경우, p = 50%가 되도록
상기 백분율 값 p를 결정하도록 구성되는, 디코더(100).
제 21 항에 있어서, 상기 디코딩 모듈(110)은, 상기 백분율 값 p가 후속 프레임의 수에 따라 상기 제1 임계값과 상기 제2 임계값 사이의 범위에서 선형적으로 증가하도록 상기 백분율 값 p를 결정하도록 구성되는, 디코더(100).
제 18 항 내지 제 22 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 및 상기 이전 프레임의 상기 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하지 않는 경우, 상기 디코딩 모듈(110)은 상기 현재 스펙트럼을 복원하기 위해 상기 이전 스펙트럼의 상기 복수의 부호의 50%를 반전하도록 구성되는, 디코더(100).
이전 항들 중 어느 한 항에 따라서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 상기 디코딩 모듈(110)은 상기 이전 프레임이 음조 또는 고조파인 신호 성분을 인코딩하는지 여부에 따라, 상기 오디오 신호의 상기 이전 스펙트럼의 복수의 진폭을 사용하여 오류 은닉을 수행하여 상기 오디오 신호의 현재 스펙트럼을 복원하도록 구성되고, 상기 복수의 진폭은 상기 이전 프레임 내에서 인코딩되는, 디코더(100).
제 24 항에 있어서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 상기 디코딩 모듈(110)은 상기 현재 스펙트럼을 복원하기 위해 비선형 감쇠 특성에 따라 상기 이전 스펙트럼의 상기 복수의 진폭을 감쇠하도록 구성되고, 상기 비선형 감쇠 특성은 상기 이전 프레임이 음조 또는 고조파인 신호 성분을 인코딩하는지 여부에 따라 의존하는, 디코더(100).
제 24 항 또는 제 25 항에 있어서,
상기 디코딩 모듈(110)에 의해 오류 은닉이 수행되는 경우, 및 상기 이전 프레임의 상기 이전 비트스트림 페이로드가 음조 또는 고조파 신호 성분을 인코딩하는 경우, 상기 디코딩 모듈(110)은 안정성 계수에 따라 상기 이전 스펙트럼의 상기 복수의 진폭을 감쇠하도록 구성되고, 상기 안정성 계수는 상기 현재 스펙트럼과 상기 이전 스펙트럼 사이의 유사성을 나타내거나; 상기 안정성 계수는 상기 이전 스펙트럼과 상기 이전 프레임에 선행하는 더 이전 프레임의 더 이전 스펙트럼 사이의 유사성을 나타내는, 디코더(100).
제 26 항에 있어서,
상기 더 이전 프레임은 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된 상기 이전 프레임 이전에 마지막으로 수신된 프레임이거나,
상기 더 이전 프레임은 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된 상기 이전 프레임 이전에 마지막으로 수신된 프레임이거나,
상기 더 이전 프레임은 부분 프레임 손실 은닉 모드 또는 전 프레임 손실 은닉 모드에서 오류 은닉을 수행하지 않고 상기 디코딩 모듈(110)에 의해 디코딩된 상기 이전 프레임 이전에 마지막으로 수신된 프레임인, 디코더(100).
제 26 항 또는 제 27 항에 있어서,
상기 디코딩 모듈(110)이 부분 프레임 손실 은닉을 수행하도록 설정된 경우, 상기 안정성 계수는 상기 현재 스펙트럼과 상기 이전 스펙트럼 사이의 상기 유사성을 나타내고;
상기 디코딩 모듈(110)이 전 프레임 손실 은닉을 수행하도록 설정된 경우, 상기 안정성 계수는 상기 이전 스펙트럼과 상기 더 이전 스펙트럼 사이의 상기 유사성을 나타내는, 디코더(100).
제 26 항 내지 제 28 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)은 상기 이전 스펙트럼의 스펙트럼 빈의 에너지를 결정하도록 구성되고;
상기 디코딩 모듈(110)은 상기 스펙트럼 빈의 상기 에너지가 에너지 임계값보다 작은지 여부를 결정하도록 구성되고;
상기 에너지가 상기 에너지 임계값보다 작은 경우, 상기 디코딩 모듈(110)은 제1 페이딩 계수로 상기 스펙트럼 빈에 할당되는 상기 복수의 진폭 중 하나의 진폭을 감쇠하도록 구성되고,
상기 에너지가 상기 에너지 임계값보다 크거나 같으면, 상기 디코딩 모듈(110)은 상기 제1 페이딩 계수보다 작은 제2 페이딩 계수로 상기 스펙트럼 빈에 할당되는 상기 복수의 진폭 중 상기 진폭을 감쇠하도록 구성되고,
상기 디코딩 모듈(110)은 감쇠를 수행할 때 상기 복수의 진폭 중 하나의 상기 감쇠에 대해 더 작은 페이딩 계수를 사용함으로써 상기 진폭 중 상기 하나의 상기 감쇠가 증가하도록 구성되는, 디코더(100).
제 26 항 내지 제 28 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)은 상기 이전 스펙트럼의 복수의 스펙트럼 빈을 포함하는 스펙트럼 대역의 에너지를 결정하도록 구성되고;
상기 디코딩 모듈(110)은 상기 스펙트럼 대역의 상기 에너지가 에너지 임계값보다 작은지 여부를 결정하도록 구성되고;
상기 에너지가 상기 에너지 임계값보다 작은 경우, 상기 디코딩 모듈(110)은 제1 페이딩 계수로 상기 스펙트럼 대역의 상기 스펙트럼 빈에 할당되는 상기 복수의 진폭 중 하나의 진폭을 감쇠하도록 구성되고,
상기 에너지가 상기 에너지 임계값보다 크거나 같으면, 상기 디코딩 모듈(110)은 상기 제1 페이딩 계수보다 작은 제2 페이딩 계수로 상기 스펙트럼 대역의 상기 스펙트럼 빈에 할당되는 상기 복수의 진폭 중 상기 진폭을 감쇠하도록 구성되고,
상기 디코딩 모듈(110)은 감쇠를 수행할 때 상기 복수의 진폭 중 하나의 상기 감쇠를 위해 더 작은 페이딩 계수를 사용함으로써 상기 진폭들 중 상기 하나의 상기 감쇠가 증가되도록 구성되는, 디코더(100).
제 19 항 또는 제 30 항에 있어서,
상기 디코딩 모듈(110)은 상기 후속 프레임의 수에 따라, 상기 제 1 페이딩 계수가 더 작아지도록 상기 제1 페이딩 계수를 결정하도록 구성되고,
상기 디코딩 모듈(110)은 상기 후속 프레임의 수에 따라, 상기 제 2 페이딩 계수가 더 작아지도록 상기 제 2 페이딩 계수를 결정하도록 구성되는, 디코더(100).
제 31 항에 있어서,
상기 디코딩 모듈(110)은 상기 제1 페이딩 계수 및 상기 제2 페이딩 계수를 결정하도록 구성되므로,
상기 현재 프레임이 상기 후속 프레임 중 제 1 프레임인 경우,
cum_fading_slow = 1, 및
cum_fading_fast = 1 이고,
상기 현재 프레임이 상기 후속 프레임 중 상기 제 1 프레임에 이어지는 프레임 중 하나인 경우, 상기 제1 페이딩 계수 및 상기 제 2 페이딩 계수는
cum_fading_slow = cum_fading_slow * slow;
cum_fading_fast = cum_fading_fast * fast;
에 따라 상기 후속 프레임의 수에 따라 결정되고,
상기 수학식의 오른쪽의 cum_fading_slow는 상기 이전 프레임의 상기 제 1 페이딩 계수이며,
상기 수학식의 왼쪽에 있는 cum_fading_slow는 상기 현재 프레임의 상기 제 1 페이딩 계수이고,
상기 수학식의 오른쪽에 있는 cum_fading_fast는 상기 이전 프레임의 상기 제 2 페이딩 계수이고,
상기 수학식의 왼쪽에 있는 cum_fading_fast는 상기 현재 프레임의 상기 제 2 페이딩 계수이고,
1 > slow > fast > 0인, 디코더(100).
제 32 항에 있어서, 1 > slow > fast > 0.3인, 디코더(100).
제 19 항 또는 제 29 항 내지 제 33 항 중 한 항에 있어서,
상기 디코딩 모듈(110)은,
상기 후속 프레임의 수가 제 3 임계값보다 작은 경우, 상기 에너지 임계값이 제 1 에너지 값과 같고;
상기 후속 프레임의 수가 상기 제 3 임계값보다 크거나 같고 제4 임계값보다 작은 경우, 상기 에너지 임계값이 상기 제1 에너지 값보다 작고 제2 에너지 값보다 크고; 및
상기 후속 프레임의 수가 상기 제4 임계값보다 큰 경우, 상기 에너지 임계값이 상기 제2 에너지 값과 같도록
상기 에너지 임계값을 결정하게 구성되는, 디코더(100).
제 34 항에 있어서, 상기 디코딩 모듈(110)은 상기 에너지 임계값이 상기 후속 프레임의 수에 따라 상기 제3 임계값과 상기 제4 임계값 사이의 범위에서 선형적으로 감소하도록 상기 에너지 임계값을 결정하게 구성되는, 디코더(100).
제 1 항 또는 제 15 항 내지 제 35 항 중 어느 한 항에 있어서,
상기 디코딩 모듈(110)은 상기 오디오 신호의 디코딩된 스펙트럼을 저장하도록 구성된 디코딩된 스펙트럼 저장 모듈(330)을 포함하고, 상기 디코딩된 스펙트럼 저장 모듈(330)은 마지막 비-전 프레임 손실 은닉 디코딩된 스펙트럼을 제공하도록 구성되고,
상기 디코딩 모듈(110)은 상기 스펙트럼의 스펙트럼 라인에 대한 페이드아웃 및 부호 스크램블링을 위해 구성되는 페이드아웃 및 부호 스크램블링 모듈(340)을 포함하는, 디코더(100).
제 36 항에 있어서,
상기 디코딩 모듈(110)은 상기 오디오 신호의 양자화된 스펙트럼을 저장하도록 구성된 양자화된 스펙트럼 저장 모듈(310)을 포함하고, 상기 양자화된 스펙트럼 저장 모듈(310)은 마지막 비-전 프레임 손실 은닉 양자화된 스펙트럼을 제공하도록 구성되고,
상기 디코딩 모듈(110)은 부분 프레임 반복 및 재조정을 위해 구성된 부분 프레임 반복 및 재조정 모듈(320)을 포함하고, 상기 부분 프레임 반복 및 재조정 모듈(320)은 상기 디코딩 모듈(110)에 의해 디코딩될 수 없는 스펙트럼 라인을 추가함으로써 상기 스펙트럼을 보완하도록 구성되고, 상기 부분 프레임 반복 및 재조정 모듈(320)은 상기 스펙트럼 라인을 재조정하도록 구성되는, 디코더(100).
제 2 항 내지 제 14 항에 있어서,
상기 디코딩 모듈(110)은 상기 오디오 신호의 양자화된 스펙트럼을 저장하도록 구성된 양자화된 스펙트럼 저장 모듈(310)을 포함하고, 상기 양자화된 스펙트럼 저장 모듈(310)은 마지막 비-전 프레임 손실 은닉 양자화된 스펙트럼을 제공하도록 구성되고,
상기 디코딩 모듈(110)은 상기 오디오 신호의 디코딩된 스펙트럼을 저장하도록 구성된 디코딩된 스펙트럼 저장 모듈(330)을 포함하고, 상기 디코딩된 스펙트럼 저장 모듈(330)은 마지막 비-전 프레임 손실 은닉 디코딩된 스펙트럼을 제공하도록 구성되는, 디코더(100).
오디오 신호를 복원하기 위해 현재 프레임을 디코딩하는 방법에 있어서,
상기 오디오 신호는 상기 현재 프레임 내에서 인코딩되고, 상기 현재 프레임은 현재 비트스트림 페이로드를 포함하고, 상기 현재 비트스트림 페이로드는 복수의 페이로드 비트를 포함하고, 상기 복수의 페이로드 비트는 상기 오디오 신호의 스펙트럼의 복수의 스펙트럼 라인을 인코딩하고, 상기 페이로드 비트의 각각은 상기 비트스트림 페이로드 내의 위치를 나타내고, 상기 방법은:
상기 오디오 신호를 복원하는 단계 - 오류 은닉 모드에서, 상기 오디오 신호를 복원하는 단계는 임계 주파수보다 큰 주파수를 나타내는 상기 오디오 신호의 상기 스펙트럼의 스펙트럼 라인에 대해 오류 은닉을 수행함으로써 수행되고; 및/또는 오류 은닉이 수행되는 경우, 오류 은닉은 상기 현재 프레임에 선행하는 이전 프레임의 이전 비트스트림 페이로드가 음조 또는 고조파인 오디오 신호의 신호 성분을 인코딩하는지 여부에 의존하는 방식으로 수행됨 - ; 및
상기 오디오 신호를 출력하는 단계
를 포함하는, 방법.
컴퓨터 또는 신호 프로세서 상에서 실행될 때 제 39 항의 방법을 구현하기 위한 컴퓨터 프로그램.