KR19990037152A - 부호화 방법 및 장치 및 복호화 방법 및 장치 - Google Patents

부호화 방법 및 장치 및 복호화 방법 및 장치 Download PDF

Info

Publication number
KR19990037152A
KR19990037152A KR1019980043296A KR19980043296A KR19990037152A KR 19990037152 A KR19990037152 A KR 19990037152A KR 1019980043296 A KR1019980043296 A KR 1019980043296A KR 19980043296 A KR19980043296 A KR 19980043296A KR 19990037152 A KR19990037152 A KR 19990037152A
Authority
KR
South Korea
Prior art keywords
output
encoding
coding
decoding
speech
Prior art date
Application number
KR1019980043296A
Other languages
English (en)
Inventor
유지 마에다
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR19990037152A publication Critical patent/KR19990037152A/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0059Convolutional codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0064Concatenated codes
    • H04L1/0065Serial concatenated codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본 발명에 의하면, 음성 부호화기(3)는 시간축 상에서 입력 음성 신호를 소정의 부호화 단위로 분할하고, 이 부호화 단위 각각에 부호화를 행하여 복수의 유형의 음성 부호화 파라미터를 출력한다. CRC 부호 산출부(5)는 음성 부호화기(3)로부터의 복수의 유형의 음성 부호화 파라미터로부터 청감상 중요 비트들을 선택하고, 이 중요 비트들로부터 CRC 검사 부호를 산출한다. 콘벌루션 부호화기(6)는 CRC 부호 산출부로부터의 CRC 검사 부호와 중요 비트들에 콘벌루션 부호화를 행한다.

Description

부호화 방법 및 장치 및 복호화 방법 및 장치(Coding method and apparatus, and decoding method and apparatus)
본 발명은 입력 음성신호를 블록과 프레임 등의 소정의 부호화 단위로 분할하고 이 부호화 단위 각각에 부호화 처리를 행하는 부호화 방법 및 장치 뿐만아니라 이 부호화된 신호를 복호화하는 복호화 방법 및 장치에 관한 것이다.
음성 신호(사운드 신호 및 음향 신호를 포함)의 시간 영역 및 주파수 영역에서 통계적 특성 및 인간의 청감상 특성을 이용하므로써 신호 압축을 행하는 다양한 부호화 방법이 알려져 있다. 이와같은 부호화 방법으로서는, 요즘 저비트율 음성 부호화 방법으로서 각광 받고 있는 VSELP부호화(Vector Sum Excited Linear Prediction ; 벡터합 여기 선형 예측) 방법 및 PSI-CELP부호화(Pitch Synchronous Innovation-CELP ; 피치 동기 잡음 여진원-CELP) 방법 등의 이른바 CELP(Coding Excited Linear Prediction ; 부호화 여기 선형 예측)부호화가 있다.
CELP부호화 방법과 같은 파형 부호화 방법에서는, 입력 음성 신호의 소정 수의 샘플이 블록 또는 프레임 등의 부호화 단위로서 사용되어, 음성 시간축 파형의 각 블록 또는 프레임은 합성에 의한 분석법이 행해져서 파형의 양자화를 위해 최적 벡터의 폐쇄 루프 탐색을 행하고, 이 벡터의 인덱스를 출력한다.
2kbps 또는 4kbps 등의 저비트율의 상기 음성 부호화 방법에 의해 얻어진 부호화 비트는 특정 음성 정보 내용과 무관하게 일반적인 음성으로서 통신, 컴퓨터, 방송 등에 널리 적용된다. 따라서, 이것은 전송로에서 발생된 에러에 대해 엄격하게 보호되어야 한다.
만약 에러가 전송로에서 반복되어 발생되면, 음성 복호화는 장시간 동안 음이 들리지 않고, 음질의 저하를 수반하게 된다.
따라서 본 발명의 목적은 전송로 에러에 대해 강하여 품질 저하를 개선할 수 있는 부호화 방법 및 장치 및 복호화 방법 및 장치를 제공하는 것이다.
도 1은 본 발명에 의한 부호화 방법 및 장치 및 복호화 방법 및 장치의 일실시예로서 이동 전화 장치의 기본 구성을 나타내는 블록도이다.
도 2는 이동 전화 장치를 구성하는 음성 부호화기의 기본 구성을 나타내는 블록도이다.
도 3은 음성 부호화기의 상세한 구성을 나타내는 블록도이다.
도 4는 이동 전화 장치를 구성하는 전송로 복호화기의 동작을 설명하는 상태 송신 순서를 나타낸다.
도 5는 이동 전화 장치를 구성하는 음성 복호화기의 기본 구성을 나타내는 블록도이다.
도 6은 음성 복호화기의 상세한 구성을 나타내는 블록도이다.
도 7은 이동 전화 장치에 의해 행해지는 부호화 방법을 설명하는 순서도이다.
도 8은 이동 전화 장치에 의해 행해지는 복호화 방법을 설명하는 순서도이다.
* 도면의 주요부분에 대한 부호의 설명
4. 전송로 부호화기 5. CRC 부호 계산부
6. 콘벌루션 부호화기 14. 전송로 복호화기
15. CRC 부호 비교 & 프레임 마스크부
16. 콘벌루션 복호화기
상기 목적을 달성하기 위해서, 본 발명에 의한 부호화 방법은 시간축 상에서 입력 음성 신호를 소정의 부호화 단위로 분할하고 이 부호화 단위 각각을 부호화하여 복수의 유형의 음성 부호화 파라미터를 출력하는 음성 부호화 단계와, 이 음성 부호화 단계로부터의 복수의 유형의 음성 부호화 파라미터로부터 청감상에 중요한 비트들을 선택하고, 이 중요 비트군으로부터 에러 검사부호를 생성하는 에러 검사 부호생성단계와, 이 에러 검사 부호 생성단계로부터의 에러 검사부호와 중요 비트군에 콘벌루션 부호화를 행하는 콘벌루션 부호화 단계를 포함한다. 결과적으로, 전송로 에러로부터 청감상에 중요한 비트들을 보호하는 것이 가능하다.
여기에서, 음성 부호화 단계는 입력 음성신호의 단기 예측 잔차를 구하는 단기 예측 잔차 산출단계와, 구해진 단기 예측 잔차에 사인파 분석 부호화를 행하는 사인파 분석 부호화 단계와, 파형 부호화에 의해 입력 음성신호를 부호화하는 파형 부호화 단계를 포함한다.
또한, 에러 검사 부호 생성단계는, 단기 예측 잔차가 단기 예측 잔차 산출단계에서 구해질 때 생성된 파라미터 중 일부 또는 전부와, 사인파 분석 부호화 단계의 부호화 출력의 일부 또는 전부와, 파형 부호화 단계로부터의 부호화 출력의 일부 또는 전부를 중요 비트들로서 선택하고, 이 중요 비트들로부터 에러 검사 부호를 생성한다.
단기 예측 잔차 산출단계에 의해 단기 예측 잔차를 구하기 위해 생성된 상기 파라미터들은 입력 음성신호의 주파수 스펙트럼의 윤곽을 형성하는 선형 스펙트럼 쌍 파라미터이고, 사인파 분석 부호화 단계로부터의 부호화 출력은 입력 음성신호가 유성음인지 무성음인지를 나타내는 유성음/무성음 판정 파라미터와, 입력 음성신호가 유성음인 경우에 피치 파라미터와, 단기 예측 부호화 잔차의 스펙트럼 엔벌로프를 나타내는 스펙트럼 코드북 인덱스와 이득 인덱스를 포함하고, 파형 부호화 단계로부터의 부호화 출력은 입력 신호가 무성음인 경우에 단기 예측 잔차에 의거한 잡음 코드북 인덱스와 이득 인덱스임을 주의한다.
또한, 상기 목적을 달성하기 위해서, 본 발명에 의한 부호화 장치는 시간축 상에서 입력 음성 신호를 소정의 부호화 단위로 분할하고 이 부호화 단위 각각을 부호화하여 복수의 유형의 음성 부호화 파라미터를 출력하는 음성 부호화 수단과, 이 음성 부호화 수단으로부터의 복수의 유형의 음성 부호화 파라미터로부터 청감상에 중요한 비트들을 선택하고, 이 중요 비트들로부터 에러 검사부호를 생성하는 에러 검사 부호 생성수단과, 이 에러 검사 부호 생성단계로부터의 에러 검사부호와 중요 비트에 콘벌루션 부호화를 행하는 콘벌루션 부호화 수단을 포함한다.
또한, 본 발명에 의한 복호화 방법은, 시간축 상에서 소정의 단위로 분할되고, 부호화 되어 복수의 유형의 음성 부호화 파라미터를 얻고, 이로부터의 청감상에 중요한 비트들을 사용하여 에러 검사 부호를 생성하고, 여기에서 송신에 중요하지 않은 비트들에 인접한 부호화 출력을 얻기 위해 에러 검사 부호와 중요 비트들이 콘벌루션 부호화되는 입력 음성 신호로부터 얻어진 부호화 데이터를 복호화하는 것이고, 이 복호화 방법은 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하여 에러 검사 부호가 부가된 중요 비트들과 비중요 비트들로부터 복호화 출력을 얻는 콘벌루션 복호화 단계와, 이 콘벌루션 복호화 단계로부터의 콘벌루션 복호화 출력에 부가된 에러 검사 부호를 사용하여 송신 에러를 검사하는 에러 검사 단계와, 이 에러 검사 단계에서의 에러 검사의 결과에 따라 콘벌루션 복호화 출력을 조정하는 출력 조정 단계와, 이 출력 조정 단계로부터의 콘벌루션 복호화 출력에 음성 복호화 처리를 행하는 음성 복호화 단계를 포함하여 구성된다.
여기에서, 만약 에러 검사 단계에서 에러가 검출되면, 출력 조정 단계는 콘벌루션 복호화 출력 대신에 보간 처리에 의해 얻어진 보간 데이터를 출력한다.
또한, 출력 조정 단계는 에러 검사의 결과에 의한 콘벌루션 복호화 출력에 배드 프레임 마스킹(bad frame masking) 처리를 행한다.
또한, 본 발명에 의한 복호화 장치는, 시간축 상에서 소정의 단위로 분할되고, 부호화 되어 복수의 유형의 음성 부호화 파라미터를 얻고, 이로부터의 청감상에 중요한 비트를 사용하여 에러 검사 부호를 생성하고, 여기에서 에러 검사 부호와 중요 비트는 송신에 중요하지 않은 비트와 인접한 부호화 출력을 얻기 위해 콘벌루션 부호화되는, 입력 음성신호로부터 얻어진 부호화 데이터를 복호화하는 것으로서, 이 복호화 장치는 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하여 에러 검사 부호가 부가된 중요 비트와 비중요 비트로부터 복호화 출력을 얻는 콘벌루션 복호화 수단과, 이 콘벌루션 복호화 수단으로부터의 콘벌루션 복호화 출력에 부가된 에러 검사 부호를 사용하여 송신 에러를 검사하고 이 에러 검사의 결과에 따라 콘벌루션 복호화 출력을 조정하는 에러 검사 및 출력 조정 수단과, 이 에러 검사 및 출력 조정 수단으로부터의 콘벌루션 복호화 출력에 음성 복호화 처리를 행하는 음성 복호화 수단을 포함한다.
이제 본 발명의 일실시예에 의한 부호화 방법 및 장치 및 복호화 방법 및 장치에 대한 설명을 할 것이다.
도 1은 본 발명의 실시예에 따라 부호화 장치를 구성하는 음성 부호화기(3)와 전송로 부호화기(4)와, 복호화 장치를 구성하는 전송로 복호화기(14)와 음성 복호화기(17)를 포함하는 이동 전화 장치를 나타낸다. 전송로 부호화기(4)는 CRC부호 계산부(5)와 콘벌루션 부호화기(6)를 갖는다. 전송로 복호화기(14)는 콘벌루션 복호화기(16)와 CRC 부호 비교 & 프레임 마스크부(15)를 갖는다.
즉, 이 이동 전화 장치에서, 본 발명에 의한 부호화 방법을 이용하는 부호화 장치는, 시간축 상의 입력 음성 신호를 소정의 단위로 분할하고, 각 단위마다 부호화를 행하고, 복수의 유형의 음성 부호화 파라미터를 출력하는 음성 부호화기(3)와, 음성 부호화기(3)로부터의 복수의 유형의 음성 부호화 파라미터 중에서 청감상 중요한 비트군을 선택하여 CRC(Cyclic Redundancy Check) 부호를 생성하는 CRC 부호 계산부(5)와, CRC 부호 계산부(5)로부터의 상기 CRC 부호와 중요 비트군에 콘벌루션 부호화를 행하는 콘벌루션 부호화기(6)를 포함한다.
또한, 이 이동 전화 장치에서, 본 발명에 의한 복호화 방법을 이용하는 복호화 장치는 콘벌루션 부호화 출력을 복호화한다. 즉, 입력 음성신호는 시간축 상에서 소정의 단위로 분할되고, 이 각각은 부호화 되어 복수의 유형의 음성 부호화 파라미터를 얻고, 이로부터의 청감상에 중요한 비트군이 사용되어 CRC 부호를 생성한다. 이와같이 생성된 CRC 부호와 상기 중요 비트군은 콘벌루션 부호화되어 콘벌루션 부호화 출력을 얻고, 이것은 중요 비트군이 제거된 나머지 비트군과 결합된다. 이 나머지 비트군과 결합된 콘벌루션 부호화 출력은 복호화 장치에 의해 복호화된다. 이 복호화 장치는 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하고 CRC 부호가 부가된 중요 비트군과 나머지 비트군을 복호화 출력으로서 출력하는 콘벌루션 복호화기(16)와, 콘벌루션 복호화기(16)로부터의 콘벌루션 복호화 출력에 부가된 CRC부호를 나머지 비트군으로부터 산출된 CRC 에러 검사부호와 비교하고, 이 비교결과에 따라, 상기 콘벌루션 복호화 출력을 조정하는 CRC 부호 비교 & 프레임 마스크부(15)와, 이 CRC 부호 비교 & 프레임 마스크부(15)로부터의 콘벌루션 복호화 출력에 음성 복호화 처리를 행하는 음성 복호화기(17)를 포함한다.
이 이동 전화 장치에서는, 송신시에, 마이크(1)로부터 입력된 음성 신호가 A/D 변환기에 의해 디지털 신호로 변환되고, 이것은 음성 부호화기(3)에 의해 2kbps/4kbps의 저비트 부호화에 의해 부호화된다. 이 부호화 디지털 신호는 전송로 부호화기에 의해 또다시 부호화되어 음질은 전송로 품질에 의해 영향을 받지 않는다. 이후에, 디지털 신호는 변조기(7)에 의해 변조되고 그 출력비트는 송신기(8)에 의해 송신 처리되고 그리고나서 안테나 공용기(9)를 통해 안테나(10)로부터 송신된다.
또한, 수신시에, 안테나(10)에 의해 잡힌 무선파는 안테나 공용기(9)를 통해 수신기(11)에 의해 수신되고, 복조기(13)에 의해 복조되고, 전송로 복호화기(14)에서 전송로 에러 정정되고, 음성 복호화기(17)에 의해 복호화되고, 확성 스피커(19)로부터의 출력을 위해 D/A 변환기에 의해 아날로그 음성 신호로 변환된다.
또한, 제어부(20)는 상기 구성성분들을 제어한다. 합성기(12)는 송신/수신 주파수를 송신기(8)와 수신기(11)에 공급한다. 또한, 키패드(21)와 LCD표시기(22)는 맨-머신 인터페이스(man-machine interface)에 사용된다.
상기 구성을 갖는 이동 전화 장치에서, CRC 부호 계산부(5)는, 상기 음성 신호의 주파수 스펙트럼 윤곽을 구성하는 선형 스펙트럼 쌍(LSP) 파라미터의 일부 또는 전부와, 음성 신호가 유성음(V)인지 무성음(UV)인지를 나타내는 V/UV 판정 파라미터 전부와, 만약 음성 신호가 유성음이면 피치 파라미터의 일부 또는 전부와, 만약 음성 신호가 유성음이면 선형 예측 부호화(LPC) 잔차 신호 스펙트럼 엔벌로프와 이들 인덱스를 나타내는 스펙트럼 코드북 인덱스의 일부 또는 전부와, 만약 음성 신호가 무성음이면 선형 예측 부호화(LPC) 잔차 신호와 이득 인덱스를 나타내는 잡음 코드북 인덱스의 일부 또는 전부를, 상기 중요 비트군으로서 선택한다.
이 중요 비트는 음성 부호화기(3)에 의해 얻어진다. 이 음성 부호화기(3)는, 입력 음성 신호의 단기 예측 잔차를 결정하는 단기 예측 잔차 산출 단계와, 구해진 단기 예측 잔차를 사인파 분석 부호화하는 사인파 분석 부호화 단계와, 파형 부호화에 의해 입력 음성 신호를 부호화 하는 파형 부호화 단계를 포함하는 음성 부호화를 행한다. 이 음성 부호화기(3)는 도 2와 도 3을 참고로 이하에 상세하게 설명할 것이다.
도 2의 음성 부호화기(3)는, LPC(Linear Prediction Coding) 잔차와 같은 입력 음성 신호의 단기 예측 잔차를 결정하는 제 1부호화부(110)와, 제 2부호화부(120)의 2개의 부호화기의 사용에 근거한 것으로, 제 1부호화부(110)는 입력 신호의 유성음(V) 부분을 부호화하는데 사용되고 제 2부호화부(120)는 입력 신호의 무성음(UV) 부분을 부호화하는데 사용된다.
제 1부호화부(110)는 하모닉 부호화와 다중 대역 여기(MBE ; Multi-Band Excitation) 부호화와 같은 LPC 잔차의 사인파 분석 부호화를 행하는 구성을 갖는다.
제 2부호화부(120)는 예를 들어, 합성에 의한 분석을 사용하는 최적 벡터의 폐쇄 루프 탐색에 의한 벡터 양자화를 이용하여 부호 여기 선형 예측(CELP)을 행하는 구성을 갖는다.
도 2의 예에서, 입력 단자(101)에 공급된 음성 신호는 제 1부호화부(110)의 LPC역필터(111)와 LPC 분석-양자화부(113)에 공급된다. LPC 분석-양자화부(113)로부터 구해진 LPC 계수, 즉 이른바 α파라미터는 LPC 역필터(111)에 공급된다. 이 LPC 역필터(111)는 입력 음성 신호의 선형 예측 잔차(LPC 잔차)를 추출한다. 또한, LPC 분석-양자화부(113)는 후술하는 바와같이 LSP(Linear Spectrum Pair)의 양자화 출력을 출력하고, 이 출력은 출력 단자(102)에 공급된다. LPC 역필터(111)로부터의 LPC 잔차는 사인파 분석 부호화부(114)에 공급된다. 사인파 분석 부호화부(114)는 피치 검출과 스펙트럼 엔벌로프 진폭 산출을 행할 뿐만아니라 V/UV 판정부(115)에서 V(유성음)/UV(무성음) 판정을 행한다. 사인파 분석 부호화부(114)는 스펙트럼 엔벌로프 진폭 데이터를 벡터 양자화부(116)에 공급한다. 이 벡터 양자화부(116)는 스펙트럼 엔벌로프의 벡터 양자화 출력으로서 코드북 인덱스를 출력하고, 이것은 스위치(117)를 통해 출력 단자(103)에 공급된다. 사인파 분석 부호화부(114)로부터의 출력은 스위치(118)를 통해 출력 단자(104)에 공급된다. 또한, V/UV 판정부(115)로부터의 V/UV 판정의 결과는 출력 단자(105)에 공급될 뿐만아니라 스위치(117, 118)의 제어 신호로서 공급된다. 상기 유성음(V)의 경우에, 상기 인덱스와 피치가 선택되어 각각 출력단자(103, 104)로부터 꺼내어진다.
도 2의 제 2부호화부(120)는 CELP(Code Excition Linear Prediction ; 부호 여기 선형 예측) 부호화 구성을 갖는다. 잡음 코드북(121)으로부터의 출력은 가중 합성 필터(122)에 의해 합성된다. 구해진 가중 음성은 감산기(123)에 공급되고, 여기에서 가중 음성과 입력 단자(101)에 공급되어 가중 필터(125)에 공급된 음성 신호 사이의 차이가 구해진다. 이 오차는 거리 계산을 위해 거리 계산 회로(124)에 공급되고, 이 오차를 최소화하는 벡터가 잡음 코드북(121)에서 탐색된다. 따라서, 합성에 의한 분석법은 시간축 파형의 벡터 양자화를 위해 폐쇄 루프 탐색에서 사용된다. 이 CELP 부호화는 상기한 바와같이, 무성음 부분을 위해 사용된다. 잡음 코드북(121)으로부터의 UV 데이터로서 코드북 인덱스는, V/UV 판정부(115)로부터의 V/UV판정 결과가 무성음(UV)일 때 켜지는 스위치(127)를 통해 출력 단자(107)로부터 꺼내어진다.
도 3은 도 2에 도시된 음성 부호화기(3)의 더 구체적인 구성을 나타낸다. 이 도 3에서는, 도 2에서와 동일한 구성 부분은 동일한 참조 부호로 표시된다.
도 3에 도시된 음성 부호화기에서, 입력 단자(101)에 공급된 음성 신호는 고역 통과 필터(HPF)(109)에서 필터 처리되어 불필요한 대역의 신호를 제거하여, LPC(Linear Prediction Coding) 분석-양자화부(113)의 LPC 분석 회로(132)와 LPC 역필터(111)에 전송된다.
LPC 분석-양자화부(113)의 LPC 분석 회로(132)는 대략 256샘플로 구성된 입력 신호 파형의 1블록에 해밍창(Hamming window)을 적용하여, 자기상관법에 의해 선형 예측 계수, 즉 이른바 α파라미터를 구한다. 데이터 출력 단위인 프레임 간격은 대략 160 샘플이다. 샘플링 주파수(fs)가 8kHz일 때, 예를 들어 프레임 간격은 20msec에 160샘플이다.
LPC 분석 회로(132)로부터의 α파라미터는 α-LSP 변환회로(133)에 공급되어 선형 스펙트럼 쌍(LSP) 파라미터로 변환된다. 즉, 직접형 필터계수로서 구해진 α파라미터는 10개, 즉 5쌍의 LSP 파라미터로 변환된다. 이 변환은 예를 들어, 뉴튼-랩슨(Newton-Raphson)법 등을 사용하여 행해진다. LSP 파라미터는 α파라미터보다 우수한 보간 특성을 갖는다.
α-LSP 변환회로(133)로부터의 LSP 파라미터는 LSP 양자화기(134)에 의해 행렬 양자화 또는 벡터 양자화된다. 여기에서, 벡터 양자화 이전에 프레임들간의 차이를 구하는 것이나 또는 한번에 복수의 프레임의 행렬 양자화를 행하는 것이 가능하다. 여기에서, 20msec는 1프레임을 구성하고, 각각 20msec 단위로 산출된 2프레임의 LSP 파라미터는 행렬 양자화 및 벡터 양자화된다.
LSP 양자화기(134)로부터의 양자화 출력, 즉 LSP 양자화 인덱스는 단자(102)를 통해 꺼내어지고, 양자화된 LSP 벡터는 LSP 보간 회로(136)에 공급된다.
LSP 보간 회로(136)는 20msec 또는 40msec마다 양자화된 LSP 벡터를 보간하여 8배율로하여, LSP 벡터는 2.5msec마다 갱신된다. 하모닉 부호화 복호화 방법에 의해 분석-합성된 잔차 파형은 매우 완만하고 매끈한 엔벌로프를 갖는 합성 파형이 된다. 만약 LPC 계수가 20msec마다 급격하게 변화하면, 비정상적인 잡음이 발생된다. 이와같은 비정상적 잡음의 발생은 LPC 계수가 2.5msec마다 점진적으로 변화된다면 방지될 수 있다.
이와같이 2.5msec마다 보간된 LSP 벡터를 사용하여 입력음성의 역필터를 행하기 위해, LSP-α변환 회로(137)는 LSP 파라미터를 예를들어 대략 10차의 직접형 필터의 계수인 α파라미터로 변환한다. 이 LSP-α변환회로(137)로부터의 출력은 상기한 LPC 역필터(111)에 공급된다. 이 LPC 역필터(111)는 2.5msec마다 갱신된 α파라미터에 역필터링을 행하여 매끈한 출력을 얻는다. 이 LPC 역필터(111)로부터의 출력은 사인파 분석 부호화부(114), 구체적으로, 예를 들어 DFT(Descrete Fourier Transform ; 이산 푸리에 변환)회로 등의 하모닉 부호화 회로의 직교 변환회로(145)에 공급된다.
LPC 분석-양자화부(113)의 LPC 분석회로(132)로부터의 α파라미터는 청감 가중 필터 산출회로(139)에 공급되어 청감가중용 데이터를 구한다. 이 가중 데이터는 청감가중된 벡터 양자화기(116)와 제 2부호화부(120), 즉 청감 가중 필터(125)와 청감 가중 합성 필터(122)에 공급된다.
하모닉 부호화 회로와 같은 사인파 분석 부호화부(114)에서, LPC 역필터(111)로부터의 출력은 하모닉 부호화 방법에 의해 분석된다. 즉, 피치 검출, 각 하모닉 진폭(Am)의 산출, 유성음(V)/무성음(UV)의 판별이 행해져서, 피치 또는 진폭(Am)의 개수에 따라 변화하는 하모닉 엔벌로프를 차원 변환하므로써 일정하게 한다.
도 3에 도시된 사인파 분석 부호화부(114)의 구체적인 예에서는, 통상의 하모닉 부호화인 것으로 가정한다. MBE(Multi-Band Excitation) 부호화의 경우에, 유성음 부분과 무성음 부분은 동시각(1블록 또는 프레임내)의 주파수 축영역, 즉 각 대역마다 존재하는 것으로 가정한다. 다른 하모닉 부호화에서는, 1블록 또는 프레임내의 음성이 유성음 또는 무성음 중 하나로 판정된다. 후술하는 설명에서는, 1프레임내의 V/UV는 MBE부호화에 적용될 때, 만약 전체 대역이 UV이면 그 프레임은 UV인 것으로 판정되는 식으로 결정됨을 주의한다. 상기한 MBE 분석-합성 방법은 본 발명의 출원인에 의해 출원된 일본특허 출원 4-91422의 명세서와 도면에 상세히 설명되어 있다.
도 3의 사인파 분석 부호화부(114)는 입력 단자(101)로부터 입력 음성신호가 공급되는 개방 루프 피치 탐색부(141)와 상기한 HPF(High Pass Filter)(109)로부터의 신호가 공급되는 제로 크로스 카운터(142)를 갖는다. 사인파 분석 부호화부(114)에서, 직교 변환회로(145)에는 LPC 역필터(111)로부터의 LPC 잔차 또는 선형 예측 잔차가 공급된다. 개방 루프 탐색부(141)에서는, 입력 신호의 LPC 잔차에 따라, 개방 루프를 사용하여 비교적 대략적인 피치 탐색이 행해진다. 추출된 대략적인 피치 데이터는 고정밀 피치 탐색(146)에 공급되어, 후술하는 폐쇄 루프를 사용하여 정밀 피치 탐색이 행해진다. 개방 루프 피치 탐색부(141)는 파워로 정규화된 LPC 잔차의 자기 상관의 최대값, 즉 정규화 자기 상관 최대값(r(p))을 상기한 대략적인 피치 데이터와 함께 출력하고, 이것은 V/UV 판정부(115)에 공급된다.
직교 변환회로(145)에서는, DFT(Discrete Fourier Transform)와 같은 직교 변환처리가 행해져서 시간축상의 LPC 잔차를 주파수축상의 스펙트럼 진폭 데이터로 변환한다. 이 직교 변환회로(145)로부터의 출력은 정밀 피치 탐색부(146)와 스펙트럼 진폭 또는 엔벌로프를 평가하는 스펙트럼 평가부(148)에 공급된다.
정밀 피치 탐색부(146)에는 개방 루프 피치 탐색부(141)에서 추출된 비교적 대략적인 피치 데이터와 직교 변환 회로(145)로부터 주파수축상의 DFT된 데이터가 공급된다. 이 정밀 피치 탐색부(146)에서는, 상기한 대략적인 피치 데이터 상하로 0.2 내지 0.5의 간격의 일부 샘플들이 탐색되어 최적의 부동 정밀 피치 데이터 값을 구한다. 여기에서 사용된 이 정밀 탐색방법은 합성 전력 스펙트럼이 오리지널 음성 전력 스펙트럼에 가장 가까운 것이 되는 식으로 피치가 선택되는 이른바 합성에 의한 분석법이다. 상기 폐쇄 루프를 사용하는 정밀 피치 탐색부(146)에서 얻어진 피치 데이터는 스위치(118)를 통해 출력 단자(104)에 공급된다.
스펙트럼 평가부(148)에서는, LPC 잔차의 직교 변환 출력으로서 스펙트럼 진폭과 피치에 따라, 각 하모닉스의 크기 및 그 세트, 즉 스펙트럼 엔벌로프가 평가된다. 이 평가의 결과는 정밀 피치 탐색부(146), V/UV(유성음/무성음) 판정부(115) 및 청감 가중 벡터 양자화기(116)에 공급된다.
V/UV 판정부(115)는 직교 변환회로(145)로부터의 출력, 정밀 피치 탐색부(146)로부터의 최적 피치, 스펙트럼 평가부(148)로부터의 스펙트럼 진폭 데이터, 개방 루프 피치 탐색부(141)로부터의 정규화 자기 상관 최대값(r(p)) 및 제로 크로스 카운터(142)로부터의 제로 크로스 카운트 값에 따라 프레임이 V인지 UV인지를 판정한다. 또한, MBE의 경우에, 각 대역마다의 V/UV 판정 결과의 경계위치를 해당 프레임의 V/UV 판정의 조건으로서 사용하는 것이 가능하다. 이 V/UV 판정부(115)로부터의 판정 출력은 출력 단자(105)를 통해 꺼내진다.
한편, 데이터수 변환(1종의 샘플링 레이트 변환)부는 스펙트럼 평가부(148)의 출력부에 또는 벡터 양자화기(116)의 입력부에 설치된다. 이 데이터수 변환부는 주파수축상의 분할 대역의 수와 데이터 수가 상기한 피치에 따라 다름을 고려하여, 엔벌로프 진폭 데이터(|Am|)를 일정 개수로 유지하는 역할을 한다. 즉, 만약 유효 대역이 예를 들어 3400kHz까지인 것으로 가정하면, 이 유효 대역은 상기한 피치에 따라 8 내지 63대역으로 분할되고 따라서, 각 대역 마다 구해진 진폭 데이터(|Am|)의 개수(mMX+1)도 또한 8에서 63까지 변화한다. 이에 대처하기 위해, 데이터수 변환부(119)는 진폭 데이터의 가변개수(mMX+1)를 일정 개수 M개, 예를 들어 44개로 변환한다.
스펙트럼 평가부(148)의 출력부에 또는 벡터 양자화기(116)의 입력부에 설치된 데이터수 변환부으로부터 출력된 일정 개수(M)(예를 들어 44개)의 진폭 데이터 즉 엔벌로프 데이터는 소정 개수, 예를 들어 44개의 데이터로 벡터로 집합되어, 가중 벡터 양자화된다. 이 가중은 청감 가중 필터 산출 회로(139)로부터의 출력에 의해 제공된다. 벡터 양자화기(116)로부터의 엔벌로프 인덱스는 스위치(117)를 통해 출력 단자(103)로부터 꺼내어진다. 가중 벡터 양자화 이전에, 소정의 개수의 데이터로 구성된 벡터의 적당한 리크(leak) 계수를 사용하여 프레임간 차를 구할 수 있다.
다음으로, 제 2부호화부(120)에 대한 설명을 할 것이다. 제 2부호화부(120)는 이른바 CELP부호화 구성을 갖고 특히 입력 음성의 무성음 부분을 부호화하는데 사용된다. 무성음 부분에 대한 이 CELP부호화 구성에서, 잡음 코드북, 즉 이른바 스토캐스틱(Stochastic) 코드북(121)은 무성음 LPC 잔차에 대응하는 잡음 출력의 대표값을 출력하고, 이것을 이득 회로(126)를 통해 가중 합성 필터(122)에 공급한다. 이 가중 합성 필터(122)에서, 입력된 잡음은 LPC 합성 처리되고 얻어진 가중 무성음은 감산기(123)에 공급된다. 감산기(123)에는 또한 입력 단자(101)로부터, HPF(High Pass Filter)와, 음성 신호가 청감 가중되는 청감 가중 필터(125)를 통해 공급된 음성신호가 공급된다. 감산기에서는, 이 가중된 신호와 합성 필터(122)로부터의 신호간의 차이 또는 오차가 구해진다. 청감 가중 필터(125)로부터의 출력은 청감 가중 합성 필터의 제로 입력 응답에 의해 미리 감산되는 것으로 가정함을 주의한다. 구해진 오차는 거리 계산을 위해 거리 계산회로(124)에 공급되고 이 오차를 최소화하는 대표값 벡터가 잡음 코드북(121)에서 탐색된다. 따라서, 시간축 파형의 벡터 양자화는 합성에 의한 분석에 의해 폐쇄 루프 탐색을 사용하여 행해진다.
CELP 부호화 구성을 사용하는 제 2부호화부(120)로부터, 무성음(UV) 부분용 데이터로서, 잡음 코드북(121)으로부터의 코드북의 형상 인덱스와 이득 회로(126)로부터의 코드북의 이득 인덱스가 출력된다. 잡음 코드북(121)으로부터의 UV데이터인 형상 인덱스는 스위치(127s)를 통해 출력 단자(107s)에 공급되는 반면, 이득 회로(126)의 UV 데이터인 이득 인덱스는 스위치(127g)를 통해 출력 단자(107g)에 공급된다.
여기에서, 상기한 스위치들(117, 118) 뿐만아니라 이 스위치들(127s, 127g)은 UV 판정부(115)로부터의 V/UV 판정 결과에 따라 온과 오프되도록 제어된다. 스위치들(117, 118)은 송신될 현재 프레임의 음성 신호가 유성음(V)인 것으로 판정될 때 온이 되도록 제어되는 반면, 스위치들(127s, 127g)은 송신될 현재 프레임의 음성 신호가 무성음(UV)인 것으로 판정될 때 온이 되도록 제어된다.
표 1은 상기 구성을 갖는 음성 부호화기(3)에 의해 출력되고, 2k/4kbps 부호화로 분할된 파라미터, 즉 LSP 파라미터, 유성음/무성음 판정 파라미터, 피치 파라미터, 스펙트럼 엔벌로프 코드북 파라미터 및 이득 인덱스, 잡음 코드북 파라미터 및 이득 인덱스를 나타낸다. 표 1은 또한 할당된 비트의 수를 나타낸다.
기호 의미 비트수
LSP0 제 0 LSP 파라미터 (6비트)
LSP2 제 2 LSP 파라미터 (6비트)
LSP3 제 3 LSP 파라미터 (5비트)
LSP4 제 4 LSP 파라미터 (1비트)
LSP5 제 5 LSP 파라미터 (8비트)
VUV 유성음/무성음 플래그 (2비트)
PCH 피치 파라미터 (7비트)
idS0 제 0 스펙트럼 파라미터 (4비트)
idS1 제 1 스펙트럼 파라미터 (4비트)
idG 스펙트럼 이득 파라미터 (5비트)
idS0_4K 4k용 제 0 스펙트럼 파라미터 (7비트)
idS1_4K 4k용 제 1 스펙트럼 파라미터 (10비트)
idS2_4K 4k용 제 2 스펙트럼 파라미터 (9비트)
idS3_4K 4k용 제 3 스펙트럼 파라미터 (6비트)
idSL00 제 0 잡음 코드북 파라미터 (6비트)
idSL01 제 1 잡음 코드북 파라미터 (6비트)
idGL00 제 0 잡음 코드북 이득 파라미터 (4비트)
idGL01 제 1 잡음 코드북 이득 파라미터 (4비트)
idSL10 4k용 제 0 잡음 코드북 파라미터 (5비트)
idSL11 4k용 제 1 잡음 코드북 파라미터 (5비트)
idSL12 4k용 제 2 잡음 코드북 파라미터 (5비트)
idSL13 4k용 제 3 잡음 코드북 파라미터 (5비트)
idGL10 4k용 제 0 잡음 코드북 이득 파라미터 (3비트)
idGL11 4k용 제 1 잡음 코드북 이득 파라미터 (3비트)
idGL12 4k용 제 2 잡음 코드북 이득 파라미터 (3비트)
idGL13 4k용 제 3 잡음 코드북 이득 파라미터 (3비트)
상기 전송로 부호화기(4)는 CRC 부호 계산부(5)가 청감상 중요 비트군으로서 표 1에 도시된 파라미터 중 일부 또는 전부를 선택하고 CRC 부호를 계산하도록 한다. 이 CRC 부호와 중요 비트군은 콘벌루션 부호화기(6)에 의해 콘벌루션 부호화된다.
표 2에 도시된 바와같이, 2kbps의 경우에는, 2프레임, 40msec당 120비트에 대해, 중요 비트군의 80비트는 클래스 I으로 처리하고, 나머지 40비트는 클래스 II로 처리한다.
2kbps 4kbps
클래스 I 80 112
CRC 14 14
TAIL 10 10
총수 104 136
클래스 II 40 104
144(3.6kbps) 240(8.0kbps)
클래스 I의 80비트에 따르면, CRC부호 계산부(5)는 14비트의 CRC부호를 계산한다. 콘벌루션 부호화기(6)는 클래스 I의 80비트와, 14비트의 CRC부호와 10테일 비트를 사용하여 콘벌루션 부호화를 행한다.
콘벌루션 부호화기(6)에 의해 얻어진 104비트와 클래스 II의 40비트, 즉 총 144비트는 송신을 위해 비트 인터리브와 2프레임 인터리브되고, 따라서 2kbps로 음성 부호화를 실현한다. 송신이 실제로 행해질 때는, 다른 용장 비트가 부가됨을 주의한다.
또한, 4kbps의 경우에는, 표 2에 도시된 바와같이, 중요 비트군의 112비트가 클래스 I으로 처리되고 다른 104비트는 클래스 II로 처리된다.
클래스 I의 112비트에 의하면, CRC부호 계산부(5)는 14비트의 CRC부호를 계산한다. 콘벌루션 부호화기(6)는 클래스 I의 112비트와, 14비트의 CRC부호와, 10테일 비트를 사용하여 콘벌루션 부호화를 행한다.
이 콘벌루션 부호화기(6)에 의해 얻어진 136비트와 클래스 II의 104비트, 즉 총 240비트는 송신을 위해 비트 인터리브와 2프레임 인터리브되고, 따라서 4kbps로 음성 부호화를 실현한다. 실제 송신이 행해질 때는, 다른 용장 비트가 부가됨을 주의한다.
표 3은 2kbps의 경우에 클래스 I과 클래스 II의 할당예를 나타낸다. 클래스 I은 보호 비트로서 할당된 중요 비트군이고 클래스 II는 비보호 비트로 할당됨을 주의한다. 여기에서 주어진 예는 1프레임, 20msec에 대한 것이다.
파라미터 유성음 무성음
보호비트수 비보호 비트수 총수 보호비트수 비보호비트수 총수
LSP0 6 0 6 6 0 6
LSP2 0 6 6 3 3 6
LSP3 0 5 5 0 5 5
LSP4 1 0 1 1 0 1
VUV 2 0 2 2 0 2
PCH 6 1 7
idS0 0 4 4
idS1 0 4 4
idG 5 0 5
idSL00 0 6 6
idSL01 0 6 6
idGL00 4 0 4
idGL01 4 0 4
총수 20 20 40 20 20 40
또한, 표 4는 4kbps의 경우에 클래스 I과 클래스 II의 할당예를 나타낸다.
파라미터 유성음 무성음
보호비트수 비보호 비트수 총수 보호비트수 비보호비트수 총수
LSP0 6 0 6 6 0 6
LSP2 6 0 6 3 3 6
LSP3 0 5 5 0 5 5
LSP4 1 0 1 1 0 1
LSP5 0 8 8 0 8 8
VUV 2 0 2 2 0 2
PCH 6 1 7
idS0 1 3 4
idS1 1 3 4
idG 5 0 5
idS0_4K 0 7 7
idS1_4K 0 10 10
idS2_4K 0 9 9
idS3_4K 0 6 6
idSL00 0 6 6
idSL01 0 6 6
idGL00 4 0 4
idGL01 4 0 4
idSL10 0 5 5
idSL11 0 5 5
idSL12 0 5 5
idSL13 0 5 5
idGL10 2 1 3
idGL11 2 1 3
idGL12 2 1 3
idGL13 2 1 3
총수 28 52 80 28 52 80
상기 표 3과 표 4는 보호 비트/비보호 비트의 할당예, 즉 청감상 중요 비트의 할당예가 음성 신호의 주파수 스펙트럼의 윤곽을 형성하는 선형 스펙트럼 쌍(LSP) 파라미터의 일부 또는 전부, 음성 신호가 유성음인지 무성음인지를 나타내는 유성음(V)/무성음(UV) 파라미터의 전부, 음성 신호가 유성음일 때 피치 파라미터의 일부 또는 전부, 음성 신호가 유성음일 때 선형 예측 부호화(LPC) 잔차 신호의 스펙트럼 엔벌로프를 나타내는 스펙트럼 코드북 인덱스와 이득 인덱스의 일부 또는 전부, 음성 신호가 무성음일 때 선형 예측 부호화(LPC) 잔차 신호의 잡음 코드북 인덱스와 이득 인덱스의 일부 또는 전부를 포함하는 것을 나타낸다.
이동 전화 장치에서, 통신 품질을 유지하기 위해, 제 1LSP 파라미터(LSP0)는 코드북으로부터 얻어진 실제 LSP 계수에 근사한 LSP 주파수이다. 정확한 송신을 원하므로, 6비트 전부가 보호 비트로서 처리된다. 또한, V/UV 판정 파라미터 역할을 하는 VUV 파라미터는 신호의 질을 나타내고, 2비트 전부가 보호된다. 또한, 피치 파라미터(PCH)는 신호의 기본 주파수이고 7비트 중 6비트 까지 보호된다. 또한, 유성음의 경우에는, LPC 잔차 신호의 스펙트럼 엔벌로프를 나타내는 코드북의 이득 인덱스는 신호의 사운드 레벨을 나타내고, 정확한 통신을 원하므로 5비트 전부가 보호된다.
즉, 이 중요 비트는 전송로 에러가 쉽게 발생되는 환경하에서 통신 품질을 소정의 레벨로 유지하는 기능을 한다. 이는 비트 에러에 의해 발생될 수 있는 비정상적인 음의 발생을 방지한다.
다음으로, CRC부호 계산부(5)에 의한 CRC 부호 계산과 콘벌루션 부호화기(6)에 의한 콘벌루션 부호화에 대한 상세한 설명을 할 것이다.
표 5a, 5b와 표 6a, 6b는, 2kbps의 경우에는 클래스 I의, 4kbps의 경우에는 클래스 II의 CRC생성 다항식으로 입력 비트순(P[i])을 나타낸다. 여기에서, 첨자 "P"는 이전 프레임의 파라미터를 나타낸다. 또한, 비트 0은 LSB를 나타낸다. 2개의 파라미터가 하나의 항목에 쓰여지는 경우에, 상단에 쓰여진 파라미터는 유성음용이고 하단에 쓰여진 파라미터는 무성음용이다.
i 항목 비트 i 항목 비트 i 항목 비트
0 LSP0p 5 14 idGp 4 28 PCHp 5
idGL00p 0 idGL01p 0
1 LSP0 5 15 idG 4 29 PCH 5
idGL00 0 idGL01 0
2 LSP0p 3 16 idGp 3 30 VUVp 0
LSP2p 5
3 LSP0 3 17 idG 3 31 VUV 0
LSP2 5
4 LSP0p 1 18 idGp 2 32 LSP4p 0
LSP2p 4
5 LSP0 1 19 idG 2 33 LSP4 0
LSP2 4
6 VUVp 1 20 idGp 1 34 LSP0p 0
LSP2p 3
7 VUV 1 21 idG 1 35 LSP0 0
LSP2 3
8 PCHp 6 22 idGp 0 36 LSP0p 2
idGL00p 3 idGL01p 3
9 PCH 6 23 idG 0 37 LSP0 2
idGL00 3 idGL00 3
10 PCHp 4 24 PCHp 1 38 LSP0p 4
icGL00p 2 idGL01p 2
11 PCH 4 25 PCH 1 39 LSP0 4
icGL00 2 idGL01 2
12 PCHp 2 26 PCHp 3
icGL00p 1 idGL01p 1
13 PCH 2 27 PCH 3
icGL00 1 idGL01 1
i 항목 비트 i 항목 비트 i 항목 비트
0 LSP0p 5 19 idG 0 38 idGp 3
idGL10 1 idGL01p 3
1 LSP0 5 20 idS0p 3 39 idG 33
idGL11p 2 idGL01 3
2 LSP0p 3 21 idS0 3 40 PCHp 1
idGL11 2 idGL01p 2
3 LSP0 3 22 LSP2p 0 41 PCH 1
LSP2 1 idGL01 2
4 LSP0p 1 23 LSP2 0 42 PCHp 3
LSP2p 1 idGL01p 1
5 LSP0 1 24 LSP2p 5 43 PCH 3
idGL01 1
6 VUVp 1 25 LSP2 5 44 PCHp 5
idGL01p 0
7 VUV 1 26 LSP2p 4 45 PCH 5
idGL01 0
8 PCHp 6 27 LSP2 4 46 VUVp 0
idGL00p 3
9 PCH 6 28 LSP2p 3 47 VUV 0
idGL00 3
10 PCHp 4 29 LSP2 3 48 LSP4p 0
icGL00p 2
11 PCH 4 30 LSP2p 2 49 LSP4p 0
icGL00 2 idGL12p 2
12 PCHp 2 31 LSP2 2 50 LSP0p 0
icGL00p 1 idGL012 2
13 PCH 2 32 LSP2p 1 51 LSP0 0
icGL00 1 idGL12p 1
14 idGp 4 33 LSP2 1 52 LSP0p 2
icGL00p 1 idGL12 1
15 idG 4 34 idS1p 3 53 LSP0 2
icGL00 0 idGL13p 2
16 idGp 2 35 idS1 3 54 LSP0p 4
icGL10p 2 idGL13 2
17 idG 2 36 idS1p 1 55 LSP0 4
icGL10 2 idGL13p 1
18 idGp 0 37 idG 1
icGL10p 1 idGL13 1
CRC 계산부(5)는 아래에 주어진 수학식 1에 도시된 CRC 다항식을 사용하여 1프레임당 7비트의 CRC부호, 즉 CRC[i]를 구한다.
그런데,
GCRC(x) = 1+x4+x5+x6+x7
수학식 2에서 2kbps이면 N = 39이고, 4kbps이면 N = 55이다. 이후에는, 달리 설명이 없으면, 이것으로 가정한다.
상기 수학식 1 내지 3으로부터 구해진 CRC 부호(CRC[i])와 표 5와 표 6에 나타난 P[i]를 사용하여, 콘벌루션 부호화기(6)로의 입력 비트열(CVin[i])이 이하에 주어진 수학식 4에 나타난 바와같이 계산된다.
콘벌루션 부호화기(6)에는 입력 비트열(CVin[i])과 상기 중요 비트군이 공급되어 이하 수학식 5와 수학식 6에 나타난 2개의 생성 다항식을 사용하여 콘벌루션 부호화를 행한다.
G1(D) = i+D+D3+D5
G2(D) = i+D2+D3+D4+D5
이 콘벌루션 부호화기(6)는 G1(D)로 시작하여 수학식 5와 6을 교대로 사용하면서 콘벌루션 부호화를 행한다.
표 7a, 7b과 표 8a, 8b은 2kbps와 4kbps의 클래스 II의 비트순을 나타낸다. 이 입력순으로, 클래스 II 비트는 송신을 위해 콘벌루션 부호화기(6)로부터의 부호화 출력과 결합된다.
i 항목 비트 i 항목 비트 i 항목 비트
0 LSP2p 2 14 LSP3p 0 28 LSP2p 4
idSL00p 4
1 LSP2 2 15 LSP3 0 29 LSP2 4
idSL00 4
2 LSP2p 1 16 idS0p 0 30 LSP2p 3
idSL01p 5 idSL00p 3
3 LSP2 1 17 idS0 0 31 LSP2 3
idSL01 5 idSL00 3
4 LSP2p 0 18 idS1p 3 32 PCHp 0
idSL01p 4 idSL00p 2
5 LSP2 0 19 idS1 3 33 PCH 0
idSL01 4 idSL00 2
6 LSP3p 4 20 idS1p 2 34 idS0p 3
idSL01p 3 idSL00p 1
7 LSP3 4 21 idS1 2 35 idS0 3
idSL01 3 idSL00 1
8 LSP3p 3 22 idS1p 1 36 idS0p 2
idSL01p 2 idSL00p 0
9 LSP2p 3 23 idS1 1 37 idS0 2
idSL01 2 idSL00 0
10 LSP3 2 24 idS1p 0 38 idS0p 1
idSL01p 1 idSL01p 0
11 LSP3p 2 25 LSP2p 0 39 idS0 1
idSL01 1 idSL01 0
12 LSP3 1 26 idS2p 5
idSL00p 5
13 LSP3p 1 27 LSP2 5
idSL00 5
i 항목 비트 i 항목 비트 i 항목 비트
0 LSP3 4 18 idS1 1 36 idS1_4K 0
idSL00 3 idSL11 2
1 LSP3 3 19 idS1 0 37 idS2_4K 8
idSL00 2 idSL11 1
2 LSP3 2 20 idS0_4K 6 38 idS2_4K 7
idSL00 1 idSL11 0
3 LSP3 1 21 idS0_4K 5 39 idS2_4K 6
idSL00 0 idSL11 0
4 LSP3 0 22 idS0_4K 4 40 idS2_4K 5
idSL01 5 idSL12 4
5 LSP5 7 23 idS0_4K 3 41 idS2_4K 4
idSL01 4 idSL12 3
6 LSP5 6 24 idS0_4K 2 42 idS2_4K 3
idSL01 3 idSL12 2
7 LSP5 5 25 idS0_4K 1 43 idS2_4K 2
idSL01 2 idSL12 1
8 LSP5 4 26 idS0_4K 0 44 idS2_4K 1
idSL01 1 idSL12 0
9 LSP5 3 27 idS1_4K 9 45 idS2_4K 0
idSL01 0 idSL12 0
10 LSP5 2 28 idS1_4K 8 46 idS3_4K 5
idSL10 4 idSL13 4
11 LSP5 1 29 idS1_4K 7 47 idS3_4K 4
idSL10 3 idSL13 3
12 LSP5 0 30 idS1_4K 6 48 idS3_4K 3
idSL10 2 idSL13 2
13 PCH 0 31 idS1_4K 5 49 idS3_4K 2
LSP2 2 idSL10 1 idSL13 1
14 idS0 2 32 idS1_4K 4 50 idS3_4K 1
LSP2 1 idSL10 0 idSL13 0
15 idS0 1 33 idS1_4K 3 51 idS3_4K 0
LSP2 0 idSL10 0 idSL13 0
16 idS0 0 34 idS1_4K 2
idSL00 5 idSL11 4
17 idS0 2 35 idS1_4K 1
idSL00 4 idSL11 3
표 8a, 8b에 도시된 4kbps 클래스 II 비트 순서에서는, 비트수가 104만큼 크다. 2프레임 세트에 대해서는, 1프레임만이 도시되어 있다. 실제로, 이전 프레임과 다음 프레임의 비트가 교대로 배열된다.
다음으로, 상기 복호화 장치에서는, 예를 들어, 또다른 이동 전화 장치의 부호화 장치로부터 수신된 콘벌루션 부호화 출력인 비트열을 복호화한 후에, 콘벌루션 복호화기(16)는 콘벌루션 복호화를 행하고, CRC 부호 비교 & 프레임 마스크부(15)는 콘벌루션 복호화기(16)로부터의 콘벌루션 복호화 출력에 부가된 CRC검사 부호를 중요 비트군에 의해 삭제된 비트군으로부터 계산된 CRC 에러 검사 부호와 비교하고, 이 비교 결과에 따라 콘벌루션 복호화 출력을 조정한다.
CRC 부호 비교 & 프레임 마스크부(15)는 콘벌루션 복호화기(16)에 의해 실행된 콘벌루션 복호화 단계로부터의 콘벌루션 복호화 출력에 부가된 상기 에러 검사 부호를 사용하여 전송 에러를 검사하는 에러 검사 단계와, 상기 에러 검사 단계의 에러 검사 결과에 따른 콘벌루션 복호화 출력을 조정하는 출력 조정단계를 행한다.
CRC 부호가 일치하지 않을 때는, 프레임의 데이터를 사용하는 음성 복호화는 음질의 상당한 저하를 초래한다. 만약 에러가 계속해서 발생되면, 공급전에 파라미터 치환이 행해져서 조정 출력이 음성 복호화기(17)에 공급된다. 파라미터 치환은 배드 프레임 마스킹(bad frame masking)에 의해 행해질 수 있다.
도 4는 배드 프레임 마스킹처리에서의 상태 천이를 나타낸다. CRC 부호 검사 처리의 결과에 따라, 현 프레임의 상태 변수가 변경된다. 상태(0 내지 7)는 화살표로 지시된 방향으로 천이된다. 송신은 상태 0에서 시작하여 에러가 있으면 "1"의 방향으로, 에러가 없으면 "0"의 방향으로 진행한다.
보통, 상태 0은 CRC 에러가 없음을 나타낸다. 예를 들어, CRC가 계속해서 6번 만족되지 않으면 상태 6에 도달된다. 또한, 상태 0에서는 어떤 처리도 행해지지 않는다. 즉, 정상적인 복호화가 행해진다.
예를 들어, 상기한 LSP 파라미터를 복호화할 때, 상태 1 내지 6에서는, 이전 프레임의 LSP 파라미터가 사용된다. 또한, 상태 7에서, 만약 LSP 파라미터가 스트레이트 모드(Straight mode)이면, LSP0 내지 LSP5가 사용되고, 만약 LSP 파라미터가 차분 모드이면 제 0LSP 부호 인덱스(LSP0)만이 사용된다.
또한, 예를 들어, 상태 변수("state")값에 따르면, 뮤트 변수("mute")는 이하의 표 9에 도시된바와같이 설정되어 출력 음량을 조절한다. 만약 상태 변수가 state = 7이면, 뮤트(p)는 이전 프레임의 뮤트 변수를 나타낸다.
state mute
0 1.000
1.2 0.800
3 0.500
4 0.250
5 0.125
6 0.000
7 mute(p)
또한, 예를 들어, 만약 VUV 판정 파라미터가 V이면, 상태 변수 state = 1 내지 6에서는, 이전 프레임의 스펙트럼 파라미터(idS0, idS1), 스펙트럼 이득 파라미터(idG), 및 4kbps 스펙트럼 파라미터(idS0_4K 내지 idS3_4K)가 사용된다.
또한, 잔차 신호의 주파수 스펙트럼 변수(Am[00..44])는 수학식 7에 나타난 바와같이 구해져서 출력 음량을 조절한다. 여기에서, 파라미터로부터 구해진 Am[i]를 Am(org)[i]로 한다.
Am[i] = mute*Am(org)[i] (0≤i≤159)
또한, 예를 들어, 만약 VUV 판정 파라미터가 UV이면, 상태 변수 1 내지 6에서는, 이전 프레임의 잡음 코드북 이득 파라미터(idGL00, idGL01)와 4kbps 잡음 코드북 이득 파라미터(idGL10 내지 idGL13)가 사용된다. 잡음 코드북 파라미터(idSL00, idSL01)와 4kbps 잡음 코드북 파라미터(idSL10 내지 idSL13)에 대해서는, 각 비트수의 범위내에서 발생된 난수가 사용된다.
또한, 잔차 신호(res[00..159])는 수학식 8에 도시된 바와같이 생성된다. 여기에서 파라미터로부터 구해진 res[i]를 res(org)[i]로 한다.
res[i] = mute*res(org)[i] (0≤i≤159)
CRC 부호 비교 & 프레임 마스크부(15)에 의해 배드 프레임 마스킹된 콘벌루션 부호화 출력은 음성 복호화기(17)에 공급된다.
음성 복호화기(17)는 도 5와 도 6에 도시된 바와 같은 구성을 갖는다. CRC 부호 비교 & 프레임 마스크부(15)는, 단자(202)를 통해 도 3의 단자(102)로부터의 상기 LSP(Linear Spectrum Pair)의 양자화 출력에 대응하는 코드북 인덱스를, 단자(203, 204, 205)를 통해 도 3의 단자(103, 104, 105)로부터의 출력에 대응하는 엔벌로프 양자화 출력으로서의 인덱스, 피치 및 V/UV 판정을, 단자(207)를 통해, 도 3의 단자(107)로부터의 출력에 대응하는 UV(무성음) 데이터로서의 인덱스를 출력한다. 또한, CRC 부호 비교 & 프레임 마스크부(15)에 의한 CRC 검사의 결과로서 구해진 CRC 에러 신호는 무성음 합성부(220)에 공급된다.
단자(203)로부터의 엔벌로프 양자화 출력으로서의 인덱스는 역벡터 양자화기(212)에 공급되고 역벡터 양자화되어 LPC 잔차의 스펙트럼 엔벌로프를 구하고, 이것은 유성음 합성부(211)에 공급된다. 유성음 합성부(211)는 사인파 합성에 의해 유성음 부분의 LPC(Linear Prediction Coding) 잔차를 합성한다. 이 유성음 합성부(211)에는 또한 단자(204, 205)로부터의 피치와 V/UV 판정 출력이 공급된다. 유성음 합성부(211)로부터의 유성음 LPC 잔차는 LPC 합성 필터(214)에 공급된다. 또한, 단자(207)로부터의 UV 데이터 인덱스는 무성음 합성부(220)에 공급되고 여기에서 잡음 코드북이 참조되어 무성음 부분의 여기 벡터로서의 LPC 잔차를 출력한다. 이 LPC 잔차는 또한 LPC 합성 필터(214)에 공급된다. LPC 합성 필터(214)에서는, 유성음 부분의 LPC 잔차와 무성음 부분의 LPC 잔차가 서로 독립적으로 LPC 합성 처리된다. 또한, 유성음 부분의 LPC 잔차가 무성음 부분의 LPC 잔차에 부가되어 함께 LPC 합성처리되는 것도 가능하다. 여기에서, 단자(202)로부터의 LSP 인덱스는 LPC 파라미터 재생부(213)에 공급되고 여기에서 LPC의 α파라미터가 출력되어 LPC 합성 필터(214)에 공급된다. LPC 합성 필터에 의한 LPC 합성에 의해 구해진 음성 신호는 출력 단자(201)로부터 출력된다.
다음으로, 도 6은 도 5의 음성 복호화기(17)의 더 구체적인 구성을 나타낸다. 도 6에서는, 도 5에서와 동일한 구성 부분은 동일한 참조 부호로 표시된다.
이 도 6에서, 입력 단자(202)에는 이른바 코드북 인덱스, 즉 도 2와 도 3의 출력 단자(102)로부터의 출력에 대응하는 LSP 벡터 양자화 출력이 상기 CRC 부호 비교 & 프레임 마스크부(15)를 통해 공급된다.
이 LSP 인덱스는 LPC 파라미터 재생부(213)의 역벡터 양자화기(231)에 공급되고 LSP(Linear Spectrum Pair)로 역벡터 양자화되고, 이것은 보간회로(232, 233)에 공급되고, 여기에서 LSP 보간 처리가 행해진다. 이 다음으로, 구해진 데이터는 LSP-α변환회로(234, 235)에 공급되어 LPC(Linear Prediction Code)의 α파라미터로 변환된다. 이 α파라미터는 LPC 합성 필터(214)에 공급된다. 여기에서 LSP 보간회로(232)와 LSP-α변환회로(234)는 유성음(V)용이고, LSP 보간 회로(233)와 LSP-α변환회로(235)는 무성음(UV)용이다. 또한, LPC 합성 필터(214)는 유성음용 LPC 합성 필터(236)와 무성음용 LPC 합성 필터(237)로 구성된다. 즉, 유성음 및 무성음은 서로 독립적으로 LPC 계수 보간처리되어, 유성음에서 무성음으로나 무성음에서 유성음으로의 천이 부분에서 완전히 다른 특성을 갖는 LSP들간의 보간에 의해 발생되는 역영향을 방지한다.
또한, 도 6의 입력 단자(203)에는, 도 2와 도 3에 도시된 부호화기의 단자(103)로부터의 출력에 대응하는 가중 벡터 양자화된 스펙트럼 엔벌로프(Am) 부호 인덱스 데이터가 상기한 CRC 부호 비교 & 프레임 마스크부(15)를 통해 공급된다. 도 6의 입력 단자(204)에는 도 2와 도 3의 단자(104)로부터의 피치 데이터가 CRC 부호 비교 & 프레임 마스크부(15)를 통해 공급된다. 도 6의 입력 단자(205)에는 도 2와 도 3의 단자(105)로부터의 V/UV 판정 데이터가 CRC 부호 비교 & 프레임 마스크부(15)를 통해 공급된다.
스펙트럼 엔벌로프(Am)의 벡터 양자화 인덱스 데이터는 역벡터 양자화기(212)에 공급되어 역양자화, 즉 상기 데이터수 변환에 대응하여 역변환되고, 스펙트럼 엔벌로프 데이터로서 유성음 합성부(211)의 사인파 합성 회로(215)에 공급된다.
부호화시에 스펙트럼의 벡터 양자화 이전에 프레임간 차이가 구해지는 경우에, 프레임간 차이를 복호화하므로써 여기에서의 역벡터 양자화가 그 다음으로 따라서 스펙트럼 엔벌로프 상의 데이터를 구함을 주의한다.
사인파 합성 회로(215)에는 입력 단자(204)로부터의 피치와 입력 단자(205)로부터의 V/UV판정 데이터가 공급된다. 사인파 합성 회로(215)는 도 2와 도 3의 LPC 역필터(111)로부터의 출력에 대응하는 LPC 잔차 데이터를 출력하고, 이 데이터는 가산기(218)에 공급된다. 이 사인파 합성의 구체적인 방법은 일예로, 본 발명의 발명자에 의해 출원된 일본 특허 출원4-91422호의 명세서와 도면, 또는 일본 특허 출원 6-198451호의 명세서와 도면에 개시되어 있다.
또한, 역벡터 양자화기(212)로부터의 엔벌로프 데이터, 입력 단자(204)로부터의 피치 데이터, 입력 단자(205)로부터의 V/UV 판정 데이터는 유성음(V) 부분용 잡음 가산을 위해 잡음 합성 회로(216)에 공급된다. 이 잡음 합성 회로(216)는 데이터를 출력하여 가중 중첩 가산회로(217)를 거쳐 가산기(218)에 공급한다. 이것은 다음과 같은 사실에 의거한 것이다. 유성음의 여기가 사인파 합성에 의해 LPC 합성 필터로의 입력으로서 생성될 때, 남성의 음성과 같은 낮은 피치음에 의해 코막힘감이 발생되거나, 만약 음질이 유성음에서 무성음으로 급격하게 변화되면 부자연스러운 음감이 발생된다. 이에 대해, 피치, 스펙트럼 엔벌로프 진폭, 프레임내의 최대 진폭, 잔차 신호 레벨 등의 음성 부호화 데이터에 의거한 파라미터를 고려하여, LPC 잔차 신호의 유성음 부분에 잡음이 부가된다.
가산기(218)로부터의 출력은 LPC 합성 필터(214)의 유성음 합성 필터(236)에 공급되어 LPC 합성 처리되어 시간파형 데이터로 되고, 이것은 유성음용 포스트 필터(238v)에 공급되어 필터처리된 후에 가산기(239)에 공급된다.
다음으로, 도 6의 입력단자(207s, 207g)에는 UV 데이터, 즉 도 3의 출력단자(107s, 107g)로부터의 형상 인덱스와 이득 인덱스가 각각 공급되고, 이 데이터는 무성음 합성부(220)에 공급된다. 단자(207s)로부터의 형상 인덱스는 무성음 합성부(220)의 잡음 코드북(221)에 공급되고 단자(207g)로부터의 이득 인덱스는 이득 회로(222)에 공급된다. 잡음 코드북으로부터 판독된 대표값 출력은 유성음의 LPC 잔차에 대응하는 잡음 신호 성분이고, 이것은 이득 회로(222)에서 소정의 이득 진폭으로 사용되고 윈도우 회로(223)에 공급되어 유성음 부분과의 연결부를 원활화하기 위해 윈도우 처리된다.
윈도우 회로(223)로부터의 출력은 무성음 합성부(220)로부터의 출력으로서 LPC 합성 필터(214)의 무성음 합성 필터(237)에 공급된다. 합성 필터(237)에서는, LPC 합성 처리가 실시되어 무성음 부분의 시간파형 데이터를 얻고, 이것은 무성음용 포스트 필터(238u)에서 필터처리된 후 가산기(239)에 공급된다.
가산기(239)에서, 유성음용 합성 필터로부터의 유성음 부분의 시간파형 신호는 출력 단자(201)로부터의 출력을 위해 무성음용 포스트 필터(238u)로부터의 무성음 부분의 시간파형 데이터에 부가된다.
출력 단자(201)로부터의 음성 복호화 출력은 D/A 변환기(18)에 의해 아날로그 음성 신호로 변환되고, 확성 스피커(19)에서 음으로 출력된다.
도 7과 도 8은 상기 이동 전화 장치에 의해 행해진 음성 부호화 방법 및 음성 복호화 단계를 나타내는 순서도이다.
즉, 이동 전화 장치의 부호화 장치에 의해 행해진 음성 부호화 처리는 입력 음성 신호를 부호화하는 스텝(S1)과, 스텝(S1)으로부터의 복수의 음성 부호화 파라미터로부터 첨감상 중요 비트군을 선택하고, 이 중요 비트군으로부터 CRC 검사 부호를 계산하는 스텝(S2)과, 스텝(S2)에서 얻어진 CRC검사 부호와 중요 비트군에 콘벌루션 부호화를 행하는 스텝(S3)을 포함한다.
또한, 이동 전화 장치의 복호화 장치에 의해 행해지는 음성 복호화 처리는, 또다른 이동 전화 장치로부터의 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하는 스텝(S11)과, 스텝(S11)으로부터의 콘벌루션 복호화 출력에 부가된 CRC 검사 부호를 사용하여 CRC에러 검사를 실행하는 스텝(S12)과, CRC부호에 에러가 있는지를 결정하는 스텝(S13)과, 만약 에러가 스텝(S13)에서 검출되면, 배드 프레임 마스킹처리를 행하기 위해 제어되는 스텝(S14)과, 음성 복호화를 행하는 스텝(S15)을 포함한다.
따라서, 송신측에서 전송로 부호화기(4)와 음성 부호화기(3)로서, 본 발명에 의한 부호화 방법 및 장치를 사용하는 이동 전화 장치에서, 전송로 에러에 대해 강한 부호화 데이터를 출력하는 것이 가능하다.
또한, 전송로 복호화기와 음성 복호화기로서 본 발명에 의한 복호화 방법 및 장치를 사용하는 이동 전화 장치에서, 전송로 에러로 인한 품질 저하가 억제되도록 음성을 복호화하는 것이 가능하다.
본 발명에 의한 부호화 방법 및 장치는 전송로 에러에 강한 부호화 데이터를 출력할 수 있다.
또한, 본 발명에 의한 복호화 방법 및 장치는 전송로 에러로 인한 품질 저하가 억제되게 음성을 복호화할 수 있다.

Claims (13)

  1. 부호화 방법에 있어서,
    시간축상에서 입력 음성 신호를 소정의 부호화 단위로 분할하고 상기 각 부호화 단위를 부호화하여 복수의 유형의 음성 부호화 파라미터를 출력하는 음성 부호화 단계와,
    상기 음성 부호화 단계로부터의 상기 복수의 유형의 음성 부호화 파라미터로부터 청감상 중요 비트들을 선택하고, 상기 중요 비트군으로부터 에러 검사 부호를 생성하는 에러 검사 부호 생성 단계와,
    상기 에러 검사 부호 생성 단계로부터의 상기 에러 검사 부호와 상기 중요 비트군에 콘벌루션 부호화를 행하는 콘벌루션 부호화 단계와,
    를 포함하여 구성된 것을 특징으로 하는 부호화 방법.
  2. 제 1항에 있어서,
    상기 음성 부호화 단계는,
    상기 입력 음성 신호의 단기 예측 잔차를 구하는 단기 예측 잔차 산출 단계와,
    상기 구해진 단기 예측 잔차에 사인파 분석 부호화를 행하는 사인파 분석 부호화 단계와,
    파형 부호화에 의해 상기 입력 음성 신호를 부호화하는 파형 부호화 단계와,
    를 포함하는 것을 특징으로 하는 부호화 방법.
  3. 제 2항에 있어서,
    상기 에러 검사 부호 생성 단계는, 상기 단기 예측 잔차가 상기 단기 예측 잔차 산출 단계에서 구해질 때 생성된 파라미터 중 일부 또는 전부와, 상기 사인파 분석 부호화 단계의 부호화 출력 중 일부 또는 전부와, 상기 파형 부호화 단계로부터의 부호화 출력 중 일부 또는 전부를 상기 중요 비트들로서 선택하고, 상기 중요 비트들로부터 에러 검사 부호를 산출하는 것을 특징으로 하는 부호화 방법.
  4. 제 2항에 있어서,
    상기 에러 검사 부호 생성 단계는, 단기 예측 잔차가 상기 단기 예측 잔차 산출단계에 의해 구해질 때 산출된 선형 스펙트럼 쌍 파라미터 중 일부 또는 전부와, 유성음/무성음 판정 파라미터 전부와, 피치 파라미터 중 일부 또는 전부와, 상기 사인파 분석 부호화 단계로부터의 부호화 출력인 단기 예측 잔차 신호의 스펙트럼 엔벌로프 이득 파라미터 중 일부 또는 전부와, 상기 단기 예측 잔차의 파형 부호화 출력인 잡음 코드북 이득 파라미터 중 일부 또는 전부를, 상기 중요 비트들로서 선택하고, 상기 중요 비트들로부터 에러 검사 부호를 산출하는 것을 특징으로 하는 부호화 방법.
  5. 제 3항에 있어서,
    상기 단기 예측 잔차 산출 단계에 의해 단기 예측 잔차를 구하기 위해 생성된 상기 파라미터는 상기 입력 음성신호의 주파수 스펙트럼의 윤곽을 형성하는 선형 스펙트럼 쌍 파라미터이고, 상기 사인파 분석 부호화 단계의 상기 부호화 출력은 상기 입력 음성신호가 유성음인지 무성음인지를 나타내는 유성음/무성음 판정 파라미터와, 상기 입력 음성신호가 유성음인 경우에 피치 파라미터와, 상기 단기 예측 부호화 잔차 신호의 스펙트럼 엔벌로프를 나타내는 스펙트럼 코드북 인덱스와 이득 인덱스를 포함하고, 상기 파형 부호화 단계의 상기 부호화 출력은 상기 입력 음성신호가 무성음일 때 단기 예측 잔차에 의거한 잡음 코드북 인덱스와 이득 인덱스인 것을 특징으로 하는 부호화 방법.
  6. 제 1항에 있어서,
    상기 음성 부호화 단계는 상기 입력 음성신호에 2k/4k bps 음성 부호화를 행하는 것을 특징으로 하는 부호화 방법.
  7. 부호화 장치에 있어서,
    시간축상에서 입력 음성 신호를 소정의 부호화 단위로 분할하고, 상기 각 부호화 단위를 부호화하여 복수의 유형의 음성 부호화 파라미터를 출력하는 음성 부호화 수단과,
    상기 음성 부호화 수단으로부터의 상기 복수의 유형의 음성 부호화 파라미터로부터 청감상 중요 비트들을 선택하고, 상기 중요 비트들로부터 에러 검사 부호를 생성하는 에러 검사 부호 생성 수단과,
    상기 에러 검사 부호 생성 수단으로부터의 상기 에러 검사 부호와 상기 중요 비트군에 콘벌루션 부호화를 행하는 콘벌루션 부호화 수단과,
    를 포함하여 구성된 것을 특징으로 하는 부호화 장치.
  8. 시간축 상에서 소정의 단위로 분할되고, 부호화 되어 복수의 유형의 음성 부호화 파라미터를 얻고, 이로부터의 청감상에 중요한 비트들이 사용되어 에러 검사 부호를 생성하고, 여기에서 송신에 중요하지 않은 비트들에 인접한 부호화 출력을 얻기 위해 에러 검사 부호와 중요 비트들이 콘벌루션 부호화되는, 입력 음성 신호로부터 얻어진 부호화 데이터를 복호화 하는 복호화 방법에 있어서,
    상기 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하여 에러 검사 부호가 부가된 상기 중요 비트들과 상기 비중요 비트들로부터 복호화 출력을 얻는 콘벌루션 복호화 단계와,
    상기 콘벌루션 복호화 단계로부터의 상기 콘벌루션 복호화 출력에 부가된 상기 에러 검사 부호를 사용하여 송신 에러를 검사하는 에러 검사 단계와,
    상기 에러 검사 단계에서의 에러 검사의 결과에 따라 상기 콘벌루션 복호화 출력을 조정하는 출력 조정 단계와,
    상기 출력 조정 단계로부터의 상기 콘벌루션 복호화 출력에 음성 복호화 처리를 행하는 음성 복호화 단계와,
    를 포함하여 구성된 것을 특징으로 하는 복호화 방법.
  9. 제 8항에 있어서,
    상기 에러 검사 단계는, 상기 단기 예측 잔차가 상기 단기 예측 잔차 산출 단계에 의해 구해질 때 생성된 선형 스펙트럼 쌍 파라미터 중 일부 또는 전부와, 유성음/무성음 판정 파라미터 전부와, 피치 파라미터 중 일부 또는 전부와, 상기 사인파 분석 부호화 단계로부터의 부호화 출력인 단기 예측 잔차 신호의 스펙트럼 엔벌로프 이득 파라미터 중 일부 또는 전부와, 상기 단기 예측 잔차의 파형 부호화 출력인 잡음 코드북 이득 파라미터 중 일부 또는 전부를, 상기 중요 비트들로서 선택하고, 상기 중요 비트들로부터 산출된 에러 검사 부호와 상기 콘벌루션 부호화 출력으로부터 구해진 상기 에러 검사 부호를 사용하여 송신 에러를 검출하는 것을 특징으로 하는 복호화 방법.
  10. 제 8항에 있어서,
    만약 상기 에러 검사 단계에서 에러가 검출되면, 상기 출력 조정 단계는 상기 콘벌루션 복호화 출력 대신에 보간 처리에 의해 구해진 보간 데이터를 출력하는 것을 특징으로 하는 복호화 방법.
  11. 제 8항에 있어서,
    상기 출력 조정 단계는 상기 에러 검사의 결과에 따라 상기 콘벌루션 복호화 출력에 배드 프레임 마스킹 처리를 행하는 것을 특징으로 하는 복호화 방법.
  12. 제 8항에 있어서,
    상기 부호화 데이터는 상기 입력 음성 신호에 2k/4k bps 음성 부호화를 행하므로써 얻어지는 것을 특징으로 하는 복호화 방법.
  13. 시간축 상에서 소정의 단위로 분할되고, 부호화 되어 복수의 유형의 음성 부호화 파라미터를 얻고, 이로부터의 청감상에 중요한 비트들이 사용되어 에러 검사 부호를 생성하고, 여기에서 송신에 중요하지 않은 비트들에 인접한 부호화 출력을 얻기 위해 에러 검사 부호와 중요 비트들이 콘벌루션 부호화되는, 입력 음성 신호로부터 얻어진 부호화 데이터를 복호화 하는 복호화 장치에 있어서,
    상기 콘벌루션 부호화 출력에 콘벌루션 복호화를 행하여 에러 검사 부호가 부가된 상기 중요 비트와 상기 비중요 비트로부터 복호화 출력을 얻는 콘벌루션 복호화 수단과,
    상기 콘벌루션 복호화 단계로부터의 상기 콘벌루션 복호화 출력에 부가된 상기 에러 검사 부호를 사용하여 송신 에러를 검사하고, 상기 에러 검사의 결과에 따라 상기 콘벌루션 복호화 출력을 조정하는 에러 검사 및 출력 조정 수단과,
    상기 에러 검사 및 출력 조정 수단으로부터의 상기 콘벌루션 복호화 출력에 음성 복호화 처리를 행하는 음성 복호화 수단과,
    를 포함하여 구성된 것을 특징으로 하는 복호화 장치.
KR1019980043296A 1997-10-17 1998-10-16 부호화 방법 및 장치 및 복호화 방법 및 장치 KR19990037152A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP97-285903 1997-10-17
JP9285903A JPH11122120A (ja) 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置

Publications (1)

Publication Number Publication Date
KR19990037152A true KR19990037152A (ko) 1999-05-25

Family

ID=17697519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980043296A KR19990037152A (ko) 1997-10-17 1998-10-16 부호화 방법 및 장치 및 복호화 방법 및 장치

Country Status (5)

Country Link
US (1) US6230124B1 (ko)
EP (1) EP0910066A3 (ko)
JP (1) JPH11122120A (ko)
KR (1) KR19990037152A (ko)
CN (1) CN1154283C (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100440055B1 (ko) * 2002-05-02 2004-07-14 엘지전자 주식회사 보코더 및 그 보코더를 이용한 비트 오류율 시험 방법

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6681203B1 (en) * 1999-02-26 2004-01-20 Lucent Technologies Inc. Coupled error code protection for multi-mode vocoders
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US7110947B2 (en) * 1999-12-10 2006-09-19 At&T Corp. Frame erasure concealment technique for a bitstream-based feature extractor
US20010041981A1 (en) * 2000-02-22 2001-11-15 Erik Ekudden Partial redundancy encoding of speech
FI115178B (fi) * 2000-10-31 2005-03-15 Nokia Corp Menetelmä ja järjestely bittien suojaamiseksi parhaalla mahdollisella tavalla tiedonsiirtovirheitä vastaan
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
US7047475B2 (en) * 2003-02-04 2006-05-16 Hewlett-Packard Development Company, L.P. CRC encoding scheme for conveying status information
US8359197B2 (en) * 2003-04-01 2013-01-22 Digital Voice Systems, Inc. Half-rate vocoder
WO2004093376A1 (en) * 2003-04-17 2004-10-28 Thomson Licensing Method to decode a data string
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4542405B2 (ja) * 2004-09-30 2010-09-15 株式会社ケンウッド ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
AU2008312198B2 (en) * 2007-10-15 2011-10-13 Intellectual Discovery Co., Ltd. A method and an apparatus for processing a signal
US20110026581A1 (en) * 2007-10-16 2011-02-03 Nokia Corporation Scalable Coding with Partial Eror Protection
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2011144112A2 (zh) * 2011-05-27 2011-11-24 华为技术有限公司 语音信号处理方法、装置和接入网***
JP6190373B2 (ja) * 2011-10-24 2017-08-30 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ信号ノイズ減衰
MX355091B (es) * 2013-10-18 2018-04-04 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz.
KR20160070147A (ko) * 2013-10-18 2016-06-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
JP7240387B2 (ja) * 2018-05-11 2023-03-15 株式会社三共製作所 角度検出器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073940A (en) * 1989-11-24 1991-12-17 General Electric Company Method for protecting multi-pulse coders from fading and random pattern bit errors
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5255343A (en) * 1992-06-26 1993-10-19 Northern Telecom Limited Method for detecting and masking bad frames in coded speech signals
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100440055B1 (ko) * 2002-05-02 2004-07-14 엘지전자 주식회사 보코더 및 그 보코더를 이용한 비트 오류율 시험 방법

Also Published As

Publication number Publication date
CN1221169A (zh) 1999-06-30
CN1154283C (zh) 2004-06-16
US6230124B1 (en) 2001-05-08
JPH11122120A (ja) 1999-04-30
EP0910066A2 (en) 1999-04-21
EP0910066A3 (en) 2000-03-29

Similar Documents

Publication Publication Date Title
KR19990037152A (ko) 부호화 방법 및 장치 및 복호화 방법 및 장치
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
US8359197B2 (en) Half-rate vocoder
US5473727A (en) Voice encoding method and voice decoding method
US5097507A (en) Fading bit error protection for digital cellular multi-pulse speech coder
US6131084A (en) Dual subframe quantization of spectral magnitudes
US6968309B1 (en) Method and system for speech frame error concealment in speech decoding
EP1598811B1 (en) Decoding apparatus and method
JP2004287397A (ja) 相互使用可能なボコーダ
KR100526829B1 (ko) 음성부호화방법및장치음성복호화방법및장치
US5893060A (en) Method and device for eradicating instability due to periodic signals in analysis-by-synthesis speech codecs
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
Woodard Digital coding of speech using code excited linear prediction
JP2962623B2 (ja) 音声符号の誤り検出方法
Fumoto et al. A low‐bit‐rate speech codec using multiband excitation and LPC modeling of harmonic magnitudes for private mobile radio
Sasaki et al. A low bit rate speech codec using mixed excitation linear prediction for private mobile radio
Yang et al. Performance of pitch synchronous multi-band (PSMB) speech coder with error-correction coding
JPH03245199A (ja) エラー補償方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application