KR20000047944A - 수신장치 및 방법과 통신장치 및 방법 - Google Patents

수신장치 및 방법과 통신장치 및 방법 Download PDF

Info

Publication number
KR20000047944A
KR20000047944A KR1019990055298A KR19990055298A KR20000047944A KR 20000047944 A KR20000047944 A KR 20000047944A KR 1019990055298 A KR1019990055298 A KR 1019990055298A KR 19990055298 A KR19990055298 A KR 19990055298A KR 20000047944 A KR20000047944 A KR 20000047944A
Authority
KR
South Korea
Prior art keywords
band
signal
sampling rate
voice
speech
Prior art date
Application number
KR1019990055298A
Other languages
English (en)
Inventor
미네다카히로
아라키다카시
오모리시로
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP10353345A external-priority patent/JP2000181495A/ja
Priority claimed from JP10353344A external-priority patent/JP2000181494A/ja
Priority claimed from JP35483198A external-priority patent/JP4135240B2/ja
Priority claimed from JP36171198A external-priority patent/JP4135242B2/ja
Priority claimed from JP11007001A external-priority patent/JP2000206997A/ja
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR20000047944A publication Critical patent/KR20000047944A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • H04B1/44Transmit/receive switching
    • H04B1/46Transmit/receive switching by voice-frequency signals; by pilot signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

수신기에서, 대역폭확장기는 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성 주파수를 갖는 음성신호를 산출하기 위해 의도된 음성 파라미터로부터, 제 2대역(B2)(3,400∼6,000 Hz)용 음성 파라미터를 생성하여 LPC합성회로로 광역 LPC를 합성한다. 그리고나서, 원래 음성의 저주파수대역 성분(300∼3,400 Hz)은 원래 음성을 업샘플링한 결과의 신호로 대체된다. 즉, 이 음성은 하이패스필터에 공급되어 음성의 고주파수대역 성분(3,400∼6,000 Hz)만을 유지한다. 고주파수대역의 고주파수 성분은 억제되고 게인은 조정되어, 원래 음성(300∼3,400 Hz)이 가산기의 업샘플링된 신호(제 2샘플링 레이트(fs2))에 가산된다.

Description

수신장치 및 방법과 통신장치 및 방법{Receiving apparatus and method, and communicating apparatus and method}
이 발명은 수신장치 및 방법, 통신장치 및 방법에 관한 것으로 음성신호를 코딩하여 얻은, 통신 네트워크나 방송 네트워크을 통해 송신된 음성 파라미터 코드를 수신하고 이로부터 음성신호를 합성하는데 이용되는 것이다.
종래의 통신장치에서는, 수신기로의 음성입력 및 수신기로부터의 음성출력이 그 샘플링 레이트가 동일하고 그 주파수도 동일한 음성주파수대역에 속해 있는데 이것은 전화선의 송신주파수대역이 예를 들어 300∼3,400Hz의 좁은 범위로 제한되어 있어서 전화선을 통해 송신되는 음성신호의 음성주파수대역이 제한되기 때문이다.
그러나, 제한된 음성주파수대역 내에 포함된 음성주파수로 송신되는 입력음성과 동일한 음성주파수대역에 포함된 음성주파수를 갖는 음성출력이 고품질을 가지고 있다고 말할 수 없다. 즉, 출력음성이 음향적으로 좋지 않다.
또한, 종래의 통신장치를 사용하는 디지털 이동전화의 음질도 만족스럽지 않다.
본 발명의 목적은 향상된 음향품질을 갖는 음성출력을 제공하는데 적용되는 수신장치 및 방법, 통신장치 및 방법을 제공함으로써 종래기술의 상기 문제점을 해결하는 데 있다.
본 발명에 따르면, 수신장치는,
음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 제 1샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 샘플링 레이트 변환수단과,
음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 대역외성분 예측수단을 포함한다.
상기 수신장치는 제 2샘플링 레이트(fs2)로 샘플링되는 샘플링 레이트 변환수단에 의해 만들어진, 제 1대역(B1)에 포함되는 음성 주파수를 갖는 음성신호 및 대역외성분 예측수단에 의해 예측되고 제 2샘플링 레이트(fs2)의 제 2대역(B2)에 포함된 음성 주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 가산하는 가산수단을 더 포함한다.
본 발명에 의하면, 수신방법은,
음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 단계와,
음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 단계를 포함한다.
본 발명에 의하면, 통신장치는,
제 1 샘플링 레이트을 갖는 입력 음성신호를 인코딩하여 송신용 신호를 생성하는 송신수단과,
제 1샘플링 레이트(fs1)로 인코딩하여 생성된 송신신호에 기초한 음성 파라미터 코드로부터 제 2샘플링 레이트(fs2)(fs2>fs1)의 음성신호를 생성하는 수신수단을 포함한다.
상기 수신수단은 음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 샘플링 레이트 변환수단과, 음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 예측수단을 더 포함한다.
상기 수신수단은 또한 제 2샘플링 레이트(fs2)로 샘플링되는 샘플링 레이트 변환수단에 의해 만들어진, 제 1대역(B1)에 포함되는 음성 주파수를 갖는 음성신호 및 대역외성분 예측수단에 의해 예측된, 제 2샘플링 레이트(fs2)의 제 2대역(B2)에 포함된 음성 주파수를 갖는 음성신호를 가산하는 가산수단을 포함한다.
본 발명에 의하면, 통신방법은,
제 1샘플링 레이트(fs1)를 갖는 입력 음성신호를 인코딩하여 송신용 신호를 생성하는 단계와,
제 1샘플링 레이트(fs1)로 인코딩하여 생성된 송신신호에 기초한 음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 단계를 포함한다.
본 발명에 의하면, 수신수단에 송신된 송신 신호에 기초한 음성 파라미터 코드를 사용하여 생성된 제 1대역(B1)에 속하는 제 1샘플링 레이트(fs1)가 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환되고, 제 2샘플링 레이트(fs2)는 제 2샘플링 레이트(fs2)의 제 2대역(B2)에 속하고 음성 파라미터 코드를 사용하여 예측된 음성신호에 가산되어, 고샘플링 레이트를 갖는 광대역(Bw) 음성을 제공하도록 한다.
본 발명의 목적, 특성 및 이점은 첨부된 도면와 함께 다음의 바람직한 실시예의 상세한 기술로부터 더욱 명확해질 것이다.
도 1은 본 발명에 따른 수신기의 실시형태의 블럭도이다.
도 2는 기지국을 통해 도 1에 도시된 수신기에 음성 파라미터 코드를 송신하는데 사용되는 송신기의 블럭도이다.
도 3은 신호선택기와 함께 도 1에 도시된 수신기에 제공된 신호처리기를 형성하는 PSI-CELP 디코더를 나타낸다.
도 4는 PSI-CELP 디코더와 함께 도 1에 도시된 수신기에 제공된 신호처리기를 형성하는 신호선택기의 블럭도이다.
도 5는 도 4에 도시된 신호선택기에 속하는 여기 소스 대역확장 회로의 상세 블럭도이다.
도 6은 도 4에 도시된 신호선택기에 속하는 노이즈 감소기의 상세 블럭도이다.
도 7은 도 4에 도시된 신호 선택기의 동작의 상세 플로우차트이다.
도 8은 도 4에 도시된 신호선택기에서 사용되는 코드북에 사용되는 트레이닝 데이터를 생성하는 과정의 플로우차트이다.
도 9는 코드북을 생성하는 과정의 플로우차트이다.
도 10은 도 1에 도시된 수신기에 제공된 신호 선택기의 변형에 속하는 VSELP 디코더를 나타낸다.
도 11은 도 1에 도시된 수신기에 제공된 신호 처리기의 변형에 속하는 신호선택기의 블럭도이다.
도 12는 도 1에 도시된 신호선택기의 동작의 상세 플로우차트이다.
도 13은 도 1에 도시된 수신기에 제공된 신호 처리기의 다른 변형에 속하는 신호선택기의 블럭도이다.
도 14는 도 1에 도시된 수신기에 제공된 신호 처리기의 또 다른 변형에 속하는 디코더의 블럭도이다.
도 15는 도 1에 도시된 수신기에 제공된 신호 처리기의 또 다른 변형에 속하는 신호선택기의 블럭도이다.
도 16은 도 4에 도시된 신호선택기에 제공되고 후단에 연결된 포스트 필터를 갖는 노이즈 감소기의 블럭도이다.
도 17은 도 16에 도시된 신호선택기에 속하는 포스트 필터의 상세 블럭도이다.
도 18은 필터 팩터 갱신주기 및 포스트 필터의 게인 갱신주기를 설명한다.
도 19는 각 신호선택기를 사용하는 신호처리기를 포함하는 수신기에 송신기가 일체로 설치되는 이동전화의 블럭도이다.
* 도면의 주요부분에 대한 부호설명
1. 수신기 15. 송신기
27. PSC-CELP 디코더 32. 신호 선택기
41. 여기소스 대역확장 회로 58. VSELP 디코더
65. 신호선택기 70. 신호선택기
77. VSELP 디코더 81. PSC-CELP 디코더
90. 신호 선택기 110.이동전화
도 1을 참조하여, 본 발명에 따른 수신기의 실시형태를 설명한다. 수신기는 참조번호(1)로 나타낸다. 수신기(1)는 개인 디지털 휴대폰(PDC) 규격(RCR STD-27)에 맞게 설계된 현재 널리 사용되고 있는 디지털 이동전화에서 사용될 수 있다.
제 1샘플링 레이트(fs1)의 음성신호를 산출하기 위해, 수신기(1)가, 후술할 송신기로부터 기지국을 통해 송신된 음성 파라미터 코드에서, 제 1대역(B1)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 제 1샘플링 레이트(fs1)인 음성신호, 제 2대역(B2)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 제 2샘플링 레이트(fs2)(fs2>fs1)인 음성신호 및 광대역(Bw)(제 1대역(B1)+제 2대역(B2))에 속하는 음성주파수를 갖고 그 샘플링 레이트가 제 2샘플링 레이트(fs2)인 음성신호를 산출하고, 이 세 음성신호 중 선택된 어느 하나를 제공하는데 사용된 제 1샘플링 레이트(fs1)은 8 kHz이고, 제 2샘플링 레이트(fs2)는 16 kHz이다. 제 1음성주파수대역(B1)은 300∼3,400 Hz이고, 제 2음성주파수대역(B2)은 3,400∼6,000 Hz이다. 따라서, 광음성주파수대역(Bw)은 300∼6,000 Hz이다.
도 1에서 도시한 바와 같이, 수신기(1)가 기지국으로부터 안테나(2)를 통해 수신한 음성 파라미터 코드는 RF 수신기(5) 및 제어기(4)를 거쳐 신호처리기(5)의 메모리(5a)에 저장된다.
신호처리기(5)는 그 안에 있는 디코더에 의해 신호처리기(5)의 메모리(5a)에 저장된 음성 파라미터 코드를 디코드하고 이를 소정의 방식으로 처리한 다음 처리된 신호를 출력한다. 수신기(1)의 이러한 동작을 이하 "실시간 통신모드"라고 한다. 또한, 사용자가 수신기(1)에도 제공된 전화응답기능을 사용하여 전화응답기능에 의해 자동으로 기록된 수신 메세지 음성신호을 재산출할 때, 신호처리기(5)는 디코더로 신호처리기(1)에 또한 제공된 메모리(13)에 저장된 음성신호의 음성 파라미터 코드를 디코드하고 이를 소정의 방식으로 처리하여 처리된 신호를 출력한다. 이러한 동작을 이하 "메세지 재산출 모드"라고 한다.
실시간 통신 및 메세지 재산출 동안, 신호처리기(5)의 출력신호는 D/A변환기에 의해 아날로그 신호로 변환된다. 이 아날로그 신호는 안티 에일리어싱 필터(7), 여러 저항(8) 및 증폭기(9)를 통과하고 스피커(10)에서 출력된다. 또한, 예를 들어 키보드(11) 및 LCD 디스플레이(12)는 제어기(4)에 연결된다.
도 2를 참조하여, 예를 들어 무선송신선 및 기지국을 통해 음성 파라미터 코드를 송신하는데 사용되는 송신기를 설명한다. 송신기는 참조번호 15로 표시된다. 이 송신기(15)는 개인 디지털 휴대폰(PDC) 규격(RCR STD-27)에 맞게 설계된 현재 널리 사용되고 있는 디지털 이동전화에서 사용될 수 있다.
도 2에서 도시한 바와 같이, 마이크로폰(16)에 인가된 음성신호는 안티 에일리어싱 필터(17), 가변 저항(18), 증폭기(19) 및 A/D 변환기(20)를 거쳐, 신호처리기(21)의 메모리(21a)에 저장된다.
송신기(15)는 신호처리기(21)에 있는 음성신호 인코더에 의해 메모리(21a)에 저장된 음성신호를 음성신호 파라미터 코드로 코드화하고, 이를 출력한다. 음성 파라미터 코드는 제어기(22), RF 송신기(23) 및 안테나(24)를 통해 기지국으로 송신된다. 키보드(25) 및 LCD 디스플레이(26)는 제어기(22)에 연결된다
신호처리기(21)의 음성신호 인코더는 음성주파수가 무선송신선에 의해 제한된 협대역에 속하는 음성 파리미터 코드를 산출한다. 일반적으로, 송신대역은 300∼3,400 Hz이다. 송신된 신호에 기초한 음성 파라미터 코드는 제어기(23)을 거쳐 RF송신기에 인가된다. 그러한 음성 파라미터로서, 예를 들어, 여기 소스 연관 선형 예측 코딩(LPC) 잔차나 선형 예측 필터 팩터(α), 피치 주파수 연관 래그, 20 msec 프레임의 프레임 파워(R0) 등이 사용될 수 있다.
음성 파라미터 코드는 송신기(15)로부터 기지국을 거쳐 송신된다. 수신기(1)의 전화응답기능이 설정되면, 음성 파라미터 코드는 상술한 바와 같이 수신기(1)의 메모리(13)에 기록된다.
표 1은 디지털 전화규격에 의한 1프레임의 풀 레이트 음성데이터 포맷에 있는 음성 파라미터 코드를 리스트하고, 표 2는 하프 레이트 음성데이터 포맷에 있는 음성 파라미터 코드를 리스트한다.
상기한 바와 같이, 본 발명에서 사용되는 음성 파라미터 코드는 여기 소스 연관 선형 예측 코딩(LPC) 잔차나 선형 예측 필터 팩터(α) 외에, 피치 주파수 연관 래그, 20 msec 프레임의 프레임 파워(R0), CRC를 포함한다. 이 음성 파라미터 코드는 1워드가 16비트인 프레임에서 프레임 당 10워드의 단위로 송신된다.
메세지 재산출 모드에서 음성 파라미터 코드가 메모리(13)에서 독출되어 수신기(1)의 신호 처리기(5)에 보내진다.
도 1에 도시된 수신기(1)의 신호 처리기(5)에 도 3에 도시된 PSI-CELP 디코더(27) 및 도 4에 도시된 신호 선택기(32)가 더 제공된다.
도 2에 도시된 송신기(15)에 제공된 신호 처리기(21)의 음성 인코더가 PSI-CELP(피치 동기 이노베이션-CELP) 코딩 방식을 채택하면, PSI-CELP 디코더(27)는, 송신을 위해 PSI-CELP 방식으로 코드화된 신호에 기초하여 음성신호를 디코드하고 디코드된 음성신호(SndN)을 출력단자(28)로, 선형 예측 필터 팩터(αN)을 출력단자(29)로, 여기 소스(N ExcN)를 출력단자(30)로 운반한다. PSI-CELP 방식으로 코드화된 신호는 송신되어 300∼3,400 Hz의 제 1대역(B1)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 8 kHz의 제 1샘플링 레이트(fs1)인 음성신호를 산출한다.
신호 선택기(32)는, 샘플링 레이트가 8 kHz의 제 1샘플링 레이트(fs1)인 음성신호를 생성하는 송신기로부터 송신된 PSI-CELP 코드화된 신호에 기초하여 PSI-CELP 디코더(27)에 의해 디코드된, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성 주파수를 갖는 디코드된 음성신호(SndN)의 샘플링 레이트를, 16 kHz의 제 2샘플링 레이트(fs2)로 변환하는 샘플링 레이트 변환수단과, 음성 파리미터 코드로부터 생성된, 제 1대역(B1)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 제 1샘플링 레이트(fs1)인 음성신호를 제 1노이즈 감소처리하고 샘플링 레이트 변환수단으로부터 공급된, 제 1대역(B1)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 제 2샘플링 레이트(fs2)인 음성신호를 제 2노이즈 감소처리하는 노이즈 감소기와, 필요한 경우 노이즈 감소기로부터의 제 1노이즈 감소출력 또는 제 2노이즈 감소출력을 선택하는 선택수단을 포함한다.
또한, 수신기(1)는 선형 예측 필터 팩터(αN)및 PSI-CELP 디코더(27)에 의한 PSI-CELP 코드화된 신호의 디코딩을 통해 공급된, 제 2대역(B2)(3,400∼6,000 Hz)에 포함된 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 신호를 예측하는 대역외성분 예측수단과, 샘플링 데이트변환수단으로부터 공급된, 제 1대역(B1)에 속하는 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를, 대역바깥성분예측수단에 의해 예측된, 제 2대역(B2)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 제 2샘플링 레이트(fs2)인 음성신호에 가산하는 가산수단을 포함한다. 노이즈 감소기는 가산수단으로부터의 가산출력을 제 3노이즈 감소처리하고, 필요하면 선택수단은 제 1, 제 2 및 제 3노이즈 감소출력의 어느 하나를 선택한다.
노이즈 감소기는 도 4에서 도시된 제 1내지 제 3회로(47∼49)를 포함한다. 노이즈 감소를 위한 이들 회로(47∼49)는 제 1노이즈 감소처리(a), 제 2노이즈 감소처리(b), 제 3노이즈 감소처리(b)에 각각 제공된다. 제 2노이즈 감소처리(b) 또는 제 3노이즈 감소처리(b)를 위한 회로(48 또는 49)는 각각 제 1대역(B1) 또는 광대역(Bw)에 속하는 음성 주파수를 갖는 음성신호의 음성주파수가 fs1/fs2인 음성주파수를 가지고 그 샘플링 레이트가 제 2샘플링 레이트(fs2)인 샘플에 제 1노이즈 감소처리(a)(회로(47)에서)를 하도록 제공된다. 노이즈 감소회로에 가산된 신호(a,b)는 샘플링 레이트(fs1)의 노이즈감소처리 및 샘플링 레이트(fs2)의 노이즈감소처리를 상호 구별하기 위한 것임에 유의한다.
도 4에서, 상기한 샘플링 데이트 변환수단이 업 샘플링 회로(45)로서 도시되고, 선택수단은 선택 스위치(150)이고, 가산수단은 가산기(46)이다. 대역외성분 예측수단은 업 샘플링 회로(45), 각각의 노이즈 감소처리(a,b,b)를 위한 회로(47,48,49), 선택 스위치(150) 및 가산기(46)를 제외하고 도 4에서 신호 선택기(32)의 가산적인 것이다.
다음, 신호 선택기(32)를 더 설명한다.
우선, 대역밖 성분 예측수단은 선형 예측필터 팩터를 오토코릴레이션 (autocorrelation)(αN→ rN)으로 변환하는 회로(36), 오토코릴레이션(r)의 음성 주파수대역을 확장하는 회로(37), 광대역(Bw) 코드북(rNCB)(38), 오토코릴레이션을 선형 예측 필터 팩터(rW→ αW)로 변환하는 회로(39), LPC 합성회로(40), 여기 소스 대역 확장회로(41), 고주파수 대역 추출/억제 필터(42) 및 곱셈기(43)으로 구성된다.
입력단자(34)에 공급된 선형 예측 필터 팩터(αN)는 αN/rN변환회로(36)에 공급되고 여기서 선형 예측 필터 팩터(αN)는 오토코릴레이션(r) 주파수 대역 확장회로(37)에 공급될 오토코릴레이션(rN)으로 변환된다. 이 오토코릴레이션(r) 주파수 대역 확장회로(37)는 광대역 코드북(rWCB)(38)을 사용하여 오토코릴레이션(r)의 대역을 확장한다. 광대역 코드북(rWCB)(38)은 광대역(Bw) 음성으로부터 추출된 오토코릴레이션 파라미터(rW)에 기초하여 미리 준비된다.
주파수 대역이 광대역 코드북(rWCB)(38)에 기초하여 오토코릴레이션(r) 주파수 대역 확장회로(37)에 의해 확장된 오토코릴레이션(rW)이 rWW변환회로(39)에 공급된다. rWW변환회로(39)는 대역확장 코릴레이션 파라미터(rW)를 대역확장 선형 예측필터 팩터(αW)로 재변환하고 이를 LPC 합성회로(40)에 공급한다.
LPC 합성회로(40)는 rWW변환회로(39)로부터의 대역확장 또는 광대역(Bw) 선형 예측필터 팩터(αW) 및 여기 소스 대역 확장 회로(41)로부터의 대역확장 여기 소스 에 기초하여 광대역(Bw) 음성을 합성한다.
LPC 합성회로(40)의 합성출력은 고주파수대역 추출/억제 필터(42)에 공급된다. 고주파수대역 추출/억제 필터(42)는 300∼3,400 Hz 대역에 속하는 음성주파수를 갖는 신호성분을 제거하고 고주파수성분을 억제하여 3,400∼6,000 Hz의 제 2대역(B2)에 속하는 음성주파수를 갖는 신호성분을 추출한다. 필터(42)의 출력은 곱셈기(43)에 공급되어 단자(44)에서 공급된 게인과 곱해진다. 곱셈기(43)의 출력(3,400∼6,000 Hz의 제 2대역(B2)에 있는, 필터출력 및 게인의 곱)이 가산기(46)에 공급된다.
LPC 합성회로(40)는 또한 여기 소스 대역 확장 회로(41)로부터 대역확장된 여기 소스를 공급받는다. 여기 소스 대역 확장 회로(41)는 입력단자(35)로부터 공급된 여기소스에 대한 파라미터로서 LPC 잔차(여기소스 N ExcN) 대역을 확장한다. 여기 소스 대역 확장 회로(41)는 도 5에 상세히 도시되어 있다.
우선, 입력단자(35)를 통해 공급된 여기소스(N ExcN)는 업샘플링 회로(50)에 의해 업샘플링된다. 업샘플링 회로(50)의 출력이 LPF(로패스필터)(51) 및 부스터(booster)(52)를 통해 출력단자(55)에서 LPC 합성회로(40)로 보내진다. 즉, 여기소스(N ExcN)를 업샘플링하여 생성된 신호는 음성신호의 합성용 대역확장 여기소스로 사용된다. 부스터(52)는 파찰음 또는 마찰음이 검출될 때, 대역확장 여기소스를 부스트하고 그 부스팅 범위는 파찰음 검출기(54)의 출력에 의해 제어된다. 파찰음 검출기(54)는 입력단자(54)를 통해 αN/rN변환회로(36)로부터 오토코릴레이션(rN)을 받아 파찰음 또는 마찰음을 검출한다.
여기 소스 대역 확장 회로(41)의 여기소스는 상기와 같이 구성되어 LPC 합성회로(40)에 공급되고 여기서 rWW변환회로(39) 및 대역확장 여기소스로부터의 대역확장 선형 예측필터 팩터(αW)에 기초하여 광대역(Bw) 음성을 합성한다. 상기한 회로는 대역외성분 예측수단이다.
다음, 입력단자(33)를 거쳐 도 3에 도시된 디코더(27)로부터 공급된 디코드된 음성(SndN)에 대한 제 1노이즈 감소처리를 행하는 노이즈 감소기를 설명한다.
본 발명이 이미 출원하여 아직 심사되지 않은 일본 특허공고 제 7-193548호에서 기술된 노이즈 감소 방식을 사용하여, 노이즈 감소는 백그라운드 노이즈를 검출하고 이를 억제한다. 이 노이즈 감소 방식은 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초한 음성 파라미터 코드에서 검출된 백그라운드 노이즈 지역의 노이즈 레벨에 따라서 제어신호가 생성되며, 노이즈 감소 방식이 이 제어신호에 기초하여 변경된다.
도 6을 참조하여 상기 노이즈 감소방식을 채택하는 노이즈 감소기의 구성을 상세히 설명한다. 300∼3,400 Hz 대역에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz인 디코드된 음성(SndN)이 입력단자(141)를 거쳐 프레임 전력 계산회로(142)에 공급된다. 프레임 전력 계산회로(142)는 예를 들어, 디코드된 음성(SndN)에서부터 제곱근, 소위 rms를 20 msec 주기를 갖는 각 프레임의 전력로서 계산한다. 프레임 전력 계산회로(142)에 의해 계산된 프레임 평균전력은 스케일 계산회로(143)에 공급되어 여기서 프레임 전력 계산회로(142)에 의해 계산된 프레임 평균전력으로부터 스케일을 노이즈 억제용 팩터로서 계산한다. 스케일 계산회로(143)에 의해 계산된 스케일은 스무싱(smoothing)회로(144)로 전달되어 스무싱처리된다. 스무싱 처리는 20 msec 마다 160 샘플의 프레임으로 이루어진 입력 음성신호 분할 사이에서의 불연속을 피할 목적으로 실행된다. 스무싱처리된 스케일은 노이즈 감소 회로(145)에 보내져 대역확장된 음성신호(SndW)로부터 노이즈를 제거하는데 사용된다.
스케일 계산회로(143)는 단자(148)를 거쳐 공급된 노이즈 레벨 검출신호의 레벨 식별회로(147)에 의한 식별을 통해 생성된 제어신호를 공급받는다. 이 제어신호에 기초하여, 상기 스케일 계산을 위해 임계값(threshold)이 선택된다. 상기와 같이 구성된 노이즈 감소기의 동작을 이하에서 더 설명한다.
도 4에서와 같이, 업샘플링 회로(45)는 300∼3,400 Hz의 제 1 대역에 속하는 음성주파수를 갖는 음성신호의 샘플링 레이트(fs1)(8 kHz)를 16 kHz의 제 2샘플링 레이트(fs2)로 변환하는 샘플링 레이트 변환수단으로서 제공된다. 300∼3,400 Hz의 제 1 대역에 속하는 음성주파수를 갖고 그 샘플링 레이트(8 kHz)가 16 kHz의 제 2샘플링 레이트(fs2)로 변환된 음성신호 성분은 가산기(46) 및 노이즈감소(b)용 회로(48)에 공급된다.
가산기(46)에서, 업샘플링 회로(45)의 음성신호 성분이 곱셈기(43)의 음성신호성분 즉, 제 2대역(B2)(3,400∼6,000 Hz)에 포함된 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호와 가산되어, 어드레스로부터의 가산출력이 노이즈감소(b) 처리용 노이즈 감소 회로(49)에 공급된다.
신호선택기(32)는 300∼3,400 Hz의 제 1대역(B1)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz의 제 1샘플링 레이트(fs1)인 음성신호(이 음성신호의 노이즈는 노이즈 감소(a)용 회로(47)에 의해 감소된다), 300∼3,400 Hz의 제 1대역(B1)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호(이 음성신호의 노이즈는 노이즈 감소(b)용 회로(48)에 의해 감소된다) 및 300∼6,000 Hz의 제 2대역(B2)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 샘플링 레이트(fs2)인 음성신호(이 음성신호의 노이즈는 노이즈 감소(b)용 회로(49)에 의해 감소된다) 중의 어느 하나를 선택하는 선택수단으로서 선택스위치(150)를 갖는다.
선택스위치(150)는 선택가능한 단자(a, b, c) 및 선택 막대(d)를 갖고 있다. 이것은 선택 단자(a)에서 300∼3,400 Hz의 제 1대역(B1)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz의 제 1샘플링 레이트(fs1)인 음성신호를 수신하고, 선택단자(b)에서 300∼3,400 Hz의 제 1대역(B1)에 속하고 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호를 수신하고, 선택단자(c)에서 300∼6,000 Hz의 제 2대역(B2)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 샘플링 레이트(fs2)인 음성신호를 수신한다. 선택 제어신호단자(151)로부터의 선택제어신호에 기초하여 선택 단자(a, b, c)에 대응 단자에 선택 스위치(150)의 선택막대(d)를 이동시킴으로써 음성신호에서 희망하는 것이 공급된다.
상기 신호 선택기(32)의 주요 동작은 아래에서 설명한다.
신호 선택기(32)는 300∼3,400 Hz의 제 1대역(B1)에 속하는 음성주파수의 음성신호 산출을 위해 의도된 음성 파라미터 코드로부터 3,400∼6,000 Hz의 제 2대역(B2)에 속하는 음성주파수를 갖는 음성을 코딩하기 위한 파라미터를 생성하고 광역 LPC를 합성한다. 그리고 나서, 신호선택기(32)는 원래 음성의 음성 주파수대역인 저주파수대역(300∼3,400 Hz)을 샘플링 레이트가 16 kHz로 업샘플링된 원래의 음성신호로 대체한다. 즉, 신호선택기(32)는 음성신호를 하이패스 필터링하여 고주파수대역(3,400∼6,000 Hz) 성분만을 유지하고 고주파수대역의 최고주파수 성분을 억제하고 게인을 조정한 후, 300∼3,400 Hz에 있는 음성주파수의 원음을 업샘플링된 원음에 가산하여 300∼6,000 Hz의 광대역(Bw)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호를 생성한다.
음성 파라미터 코드의 주파수대역을 확장하기 위해, 선형 예측 필터 팩터(α) 및 여기 소스(N ExcN)가 음성주파수대역이 확대되어야 한다. 또한, 선형 예측 필터 팩터(α)의 주파수대역을 확장하기 위해, 오토코릴레이션(r)으로도 재변환할 수 있는 선형 예측 필터 팩터(α)로 변환할 수 있는 파라미터인 오토코릴레이션(r)의 코드북을 준비하는 것이 필요하다. 오토코릴레이션(r)은 코드북에 기초하여 양자화 및 양자화해제에 의해 음성 주파수대역에서 확장된다.
우선, 선형 예측 필터 팩터(α)의 대역 확장을 아래에서 설명한다
선형 예측 필터 팩터(α)는 스펙트럼 포락선을 나타내는 필터 팩터라는 점을 고려하면, 선형 예측 필터 팩터(α)는 고주파수 대역이 쉽게 예측되는 다른 스펙트럼 포락선을 나타내는 파라미터인 오토코릴레이션(r)으로 한 번 변환되고, 주파수 대역이 확장된 후 광대역 또는 확장된 오토코릴레이션(rW)이 대역확장 또는 광대역 선형 예측 필터 팩터(α)로 역변환된다. 확장을 위해, 벡터 양자화가 사용된다. 협대역 오토코릴레이션(rN)은 벡터 양자화처리되어야 하고 대응 광대역(Bw) 오토코릴레이션(rW)은 벡터 양자화된 오토코릴레이션의 인덱스로부터 결정되어야 한다.
후술하는 것처럼 협대역 오토코릴레이션 및 광대역 오토코릴레이션 사이에 일정한 관계(constant relation)가 있기 때문에, 광대역 오토코릴레이션의 코드북을 준비하는 것으로 충분하다. 협대역 오토코릴레이션은 코드북의 벡터 양자화에 의해 제공될 수 있고 광대역 오토코릴레이션은 협대역 오토코릴레이션의 양자화에 의해 결정된다.
협대역 신호가 광대역 신호의 음성 주파수를 제한함으로써 생성된다고 가정하면, 협대역 오토코릴레이션과 광대역 오토코릴레이션 사이에 다음의 관계(1)가 있다.
Φ(xn)=Φ(xwⓧh)=Φ(xw)ⓧΦ(h)
여기서, Φ는 오토코릴레이션이고, xn는 협대역 신호이고, xw는 광대역 신호이고, h는 대역 제한필터의 임펄스 응답이다.
또한, 다음 수학식(2)은 오토코릴레이션과 전력 스펙트럼 사이의 관계에 기초하여 주어질 수 있다.
Φ(h)=F-1(|H|2)
상기한 대역 제한 피터의 전력특성과 같은 주파수특성을 갖는 다른 대역 제한 필터가 제공되고 그것이 H'라고 가정한다. 다음, 수학식(2)은 다음 수학식(3)과 같이 주어질 수 있다.
Φ(h)=F-1(|H|2)=F-1(H')=h'
새로운 필터는 현 대역제한 필터와 같은 패스 및 저지 대역을 갖고, 후자의 필터의 감쇠 특성의 제곱인 감쇠특성을 갖는다. 따라서, 새로운 필터를 대역제한필터라고 할 수 있다. 이것을 고려하면, 협대역 오토코릴레이션은 광대역 오토코릴레이션의 컨벌루션(convolution) 및 대역제한필터의 임펄스 응답에 의해 즉, 광역 오토코릴레이션의 대역을 제한함으로써 단순화될 수 있다. 즉, 이것은 다음 식(4)로 주어질 수 있다.
Φ(xn)=Φ(xw)ⓧh'
앞서 기술한 바와 같이, 광역 코드북이 준비되기만 하면, 협대역 코릴레이션의 벡터 양자화에 필요한 협대역 벡터가 그 코드북을 사용한 계산에 의해 생성되고, 모든 코드북이 협대역 오토코릴레이션으로 준비된다.
각 광대역 오토코릴레이션(rW)의 코드벡터가 단조하게 떨어지거나 서서히 오르고 떨어지는 곡선을 따라 변하기 때문에, 저주파수대역이 대역 제한 필터(H')를 통해 지나가더라도 크게 변하지 않는다. 따라서, 협대역 오토코릴레이션(rN)은 광대역 오토코릴레이션(rW)의 코드북의 직접 양자화에 의해 획득될 수 있다. 그러나, 샘플링 레이트가 광대역용 샘플링 레이트의 절반이고, 협대역 오토코릴레이션 및 광대역 오토코릴레이션 간의 비교는 두 차수에 한 번 씩 행해져야 한다.
선형 예측 필터 팩터(α)는 유성음과 무성음에 대해 분리하여 높은 정확도로 대역이 확장될 수 있다. 따라서, 두 코드북이 유성음과 무성음으로 각각 분리되어 준비된다.
다음으로, 여기 소스의 대역 확장은 아래에서 더 설명한다.
PSI-CELP 방식에서, 협대역에 속하는 여기 소스는 도 5의 업샘플링 회로(50)에 의해 0으로 채움으로써 업샘플링되고, 에일리어싱(aliasing)에 의해 왜곡된 여기소스가 사용된다. 이 방식은 매우 간단하지만, 원래 음성의 전력 멱(power)과 고조파 구성의 차이가 보존되기 때문에 이 방식에 의해 준비된 여기 소스가 충분한 품질을 갖고 있다고 말할 수 있다.
선형 예측 필터 팩터(α) 및 광대역(Bw) 여기소스는 선형 예측 코드를 합성하기위해 LPC 합성회로(40)에서 사용된다.
광대역 LPC에 의해 합성된 음성이 더 이상 처리되지 않으면 이 음성은 품질이 낮다. 고품질을 위해, 음성은 코덱(codec)으로부터의 출력인 원래 음성(SndN)으로 대체된 저주파수 대역을 갖는다. 이러한 목적을 위해, 3,400 Hz를 초과하는 음성주파수 대역의 합성된 음성이 추출되며 반면에 코덱 출력이 16 kHz의 샘플링 레이트로 업샘플링되고 추출된 결과와 업샘플링된 주파수가 함께 가산된다.
곱셈기(43)에서 고주파수 대역과 곱해지는 게인은 사용자의 취향에 의해 게인제어기에 의해 조정된다. 따라서, 사용자에 의한 입력에 기초한 고주파수 대역 게인에 대해 값이 미리 설정되고, 그 값을 참조하여 게인과의 곱이 행해진다.
또한, 상기의 가산 전에, 고주파수 대역이 고주파수 대역 추출 및 억제 필터(42)에 의해 필터링되어 약 6 kH보다 높은 성분을 억제하여 듣기 쉬운 음성을 제공한다. 필터 팩터가 선택가능하고 필터링이 미리 선택된 필터에 의해 행해지기 때문에, 사용자의 의도에 따라 고주파수 대역이 선택가능하다. 필터는 사용자가 지정함으로써 선택된다.
필터(42)에 의한 필터링은 저주파수 대역 전력 특성에 영향을 주지 않기 때문에 상기 가산의 완료 후에 할 수도 있음을 유의한다. 다른 방법으로, 저주파수 대역 전력 특성에 영향을 주는 필터는 가산 후에 할 수 있다. 이 동작은 광역 음성을 제공한다.
다음, 상기의 동작 이론에 기초하여, 신호선택기(32)는 도 7를 참조하여 아래에서 설명한 바와 같이 광역 음성신호를 생성한다.
스텝(S1)에서, 도 4에 도시된 αN/rN변환기(36)는 도 3에 도시된 디코더(27)에 의해 디코드된 선형 예측 필터 팩터(αN)를 오토코릴레이션(rN)으로 변환한다. 스텝(S2)에서, 디코더(27)에 의해서 디코드된 음성(SndN)이 유성음(V)인지 무성음(UV)인지가 판단된다.
스텝(S2)에서의 판단 결과 음성이 무성음(V)이면, 무성음 오토코릴레이션(rN)이 스텝(S4)에서 양자화되는데 이 때 스텝(S3)에서 결정된 협대역 음성 파라미터를 사용한다. 스텝(S3)에서는 이 협대역 음성 파라미터가 두 차수마다 한 번씩 비교되어 광대역 유성음(V) 코드북(38)로부터 결정되게 된다.
한편, 스텝(S2)에서의 판단 결과 음성이 무성음(UV)이면, 협대역 무성음 파라미터(r)가 스텝(S3)에서 사용되어 무성음 오토코릴레이션(r)을 양자화한다.
스텝(S5)에서, 유성음 또는 무성음 오토코릴레이션이 각각 광대역 유성음 또는 무성음 코드북을 사용하여 양자화가 해제되어 광대역 오토코릴레이션(rW)을 제공한다. 이 광대역 오토코릴레이션(rW)은 스텝(S6)에서 rWW변환회로(39)에 의해 αW로 변환된다.
한편, 디코더(27)로부터의 여기소스는 스텝(S7)에서 도 5의 업샘플링 회로에 의해 샘플들 사이에 0으로 채움으로써 업샘플링되고, 안티 에일리어싱에 의해 음성 주파수가 확장된다. 여기 소스는 LPC 합성 회로(40)에 광대역 선형 예측 필터 팩터(αW)로서 공급된다.
스텝(S8)에서, 광대역 선형 예측 필터 팩터(αW) 및 광대역 여기 소스는 LPC 합성 회로(40)에서 LPC 합성되어 광대역 음성을 제공한다.
그러나, 광대역 음성은 예측에 의해서만 획득되는 광대역 신호이고 예측에 의해 발생된 에러를 포함한다. 즉, 품질이 열악하다. 특히, 입력 협대역 음성의 음성 주파수 범위(300∼3,400 Hz)에서, 코덱 출력의 원 음성(SndN)(입력 음성)이 그대로 이용되어야 한다.
따라서, 스텝(S9)에서 밴드스톱 필터(BSP)로 필터링하여 LPC 합성 회로(40)에 의해 합성된 음성으로부터 입력 협대역 음성의 300∼3,400 Hz의 음성주파수대역이 제거된다.
스텝(S13)에서, LPC 합성 회로(40)에서 합성된 음성은 가산기(46)에 의해 스텝(S10)의 업샘플링 회로(45)에 의해 업샘플링된 원 음성(SndN)에 가산된다. 스텝(S11)에서, 가산에 의해 생성된 음성의 고주파수 대역이 고주파수 대역 추출 및 대략 6 kHz보다 높은 성분을 다소 억제하는 억제 필터(42)에 의해 필터링되어, 듣기 좋은 음성을 제공한다. 필터(42)의 필터 팩터는 상술한 바와 같이 선택가능하다.
또한, 스텝(S12)에서는, 곱셈기(43)가 사용되어 사용자의 취향에 따라 음성의 고주파수 대역의 게인이 조정된다.
이하에서는 신호 선택기(32)에서 사용 코드북을 준비하는 것에 대해 설명한다.
잘 알려진 GLA(generalized Lloyd algorithm) 방식으로 코드북을 준비한다. 이 방식에서, 광대역 음성은 소정의 시간 길이,예컨대 20 msec 동안 지속하는 프레임으로 나누어진다. 소정의 차수로 예컨대, 6차까지 각 프레임에 대하여 오토코릴레이션이 결정된다. 각 프레임의 오토코릴레이션은 트레이닝 데이트(training date)로서 사용되어 6차까지 코드북을 준비한다. 이를 위해, 광대역 음성이 유성음인지 무성음인지가 판단되고, 유성음(V) 오토코릴레이션 및 무성음(UV) 오토코릴레이션이 분리 집합되어서 각각 유성음 및 무성음 코드북을 준비한다. 이 경우에, 코드북은 선형 예측 필터 팩터(α)의 대역 확장 동안 참조된다. 또한, 이 경우에, 음성이 유성음인지 무성음인지가 판단되고, 대응하는 코드북이 사용된다.
신호 선택기(32)에서, 광대역 유성음 및 무성음 코드북이 들다 사용된다. 이 광대역(Bw) 유성음 및 무성음 코드북이 각각 도 8 및 9를 참조하여 설명한 것처럼 준비된다.
우선, 광대역 음성이 학습을 위해 생성되고, 도 8의 스텝(S31)에서, 음성이 각각 20 msec 주기를 갖는 프레임으로 분리된다. 다음, 스텝(S32)에서, 유성음인지 무성음인지를 판단하기 위해 각 프레임의 에너지 및 제로-크로스 값이 조사된다.
스텝(S33)에서, 오토코릴레이션 파라미터(r)가 예컨대 광역 유성음 프레임에 대해 6차까지 계산된다. 스텝(S34)에서, 오토코릴레이션 파리미터(r)가 예컨대 광역 무성음 프레임에 대해 6차까지 계산된다.
도 9의 스텝(S41)에서, 광대역 파라미터가 각 프레임의 1차에서 6차까지의 오토코릴레이션 파리미터가 추출된다. 스텝(S42)에서, GLA 방식이 사용되어 1차에서 6차까지의 광대역 유성음 및 무성음 코드북을 작성한다.
상술한 바와 같이, 광대역 유성음 및 무성음 코드북이 작성될 수 있다.
노이즈 감소기는 아래에서 기술한 바와 같은 기능을 한다.
도 6에서 도시한 바와 같은 프레임 전력 계산 회로(142)가 제공되어 상기 디코드된 음성 신호(SndN)의 프레임 당 평균 전력(rms)을 계산한다. 평균 전력(rms)은 스케일 계산회로(143)에 제공된다.
스케일 계산회로(143)는 평균 전력(rms)과 특정의 임계값(nr1)을 비교하고, 계산에 기초하여 스케일을 계산한다. 평균 전력(rms)이 임계값(nr1)보다 클 때, 스케일이 1이지만 스케일이 임계값(nr1)보다 작으면, 스케일은 다음과 같다.
여기서 K는 상수(예를 들어, K=nr1)이다.
다른 방법으로, 수학식(5)는 모든 평균 전력(rms)에 대해서 계산된다. 계산 결과 스케일이 1보다 작으면(scale<1), 수학식(5)에서 계산된 스케일은 디코드된 음성(SndN)과 곱해진다. 이것은 평균 전력(rms)이 임계값(nr1)보다 작은 프레임에 대해, 디코드된 음성(SndN)이 1보다 작은 게인과 곱해진다는 것을 의미한다. 계산 결과 스케일이 1보다 크면(scale≥1), 디코드된 음성 신호(SndN)가 별도의 다른 처리없이 출력된다. 따라서, 임계값(nr1)에 대한 적당한 값을 선택하여, 노이즈 등의 전력이 작은 부분에 대해서는 게인을 작게 조정할 수 있어서, 결과적으로 노이즈의 실제적인 감소를 가져온다. 수학식(5)를 사용한 노이즈 억제는 입력 신호의 평균전력에 대해 절반의 효과를 갖는다.
노이즈 억제가 너무 크거나 노이즈 억제가 소정의 레벨보다 낮은 노이즈를 뮤팅(muting)하는 회로의 뮤팅과 함께 실행될 때, 상기 임계값(nr1)(제 1임계값)보다 작은 제 2임계값(nr2)가 설정되어야 한다. 이러한 설정으로, 제 2임계값(nr2)보다 작은 입력레벨이 있는 소리부분에 대해 낮은 노이즈억제를 획득하여 즉 대역 확장 회로의 효과를 약화시킨다.
입력 신호가 그 소리 및 노이즈가 분리되지 않은 상태에서 처리되기 때문에, 자음과 같이 음전력이 상대적으로 작은 입력신호의 부분이 음으로서 되지 않는 현상이 있다. 이러한 현상은 입력신호가 특별히 강한 노이즈 감소처리를 받으면 해결되는데, 이러한 처리는 원음과 다소 다르게 들리는 음성을 만들어낸다. 따라서, 입력 신호가 메인 프레임에 대하여 얼마나 강하게 노이즈 감소처리되는지와 노이즈 처리되는 음이 얼마나 커야되는 지를 고려할 필요가 있다.
프레임에서 상기와 같이 처리되면, 음성 프레임이 불연속이 될 것이며 결과적으로 사용자가 소리를 들을 때 부자연스럽게 된다.
이러한 문제를 고려하여, 각 프레임을 스무싱처리 예컨대 자연스러운 음을 만들기 위해 어택 타임(attack time) 및 회복 시간이 스케일에 대해 설정된다.
즉, 도 6에서 명확한 바와 같이, 스케일 계산회로(143)에 의해 계산된 스케일은 스무싱 회로(144)에 의해 스무싱처리되어 노이즈 감쇠회로(145)에 공급된다.
스무싱 회로(144)는 노이즈 감소처리 시에 발생할 수 있는 상기의 문제를 해결하기 위해 제공된다. 어택 타임(attack time) 및 회복 시간이 이를 위해 제공된다. 어택 타임(attack time)은 "0"이고 반면에 회복 시간은 변할 수 있다.
즉, 현재의 프레임에 대해 계산된 음전력이 전의 프레임보다 큰 때에는, 이것이 그대로 사용된다. 현재의 프레임에 대해 계산된 음전력이 전의 프레임보다 작을 때는, 소정의 특성을 갖는 로패스필터(LPF)에 의해 스무싱처리되어 프레임 전력의 변화에 기인한 상기 부자연스러운 느낌을 막을 수 있다.
노이즈 감소회로(145)는 디코드된 음성 신호(SndN)와 스무싱회로(144)를 통해 공급된 스케일을 곱하여 입력신호(SndN)의 노이즈를 감소시키고, 외부단자(146)에 노이즈가 덜한 출력 신호를 전달한다.
스케일 계산회로(143)에는 제어신호가 제공된다. 이 제어신호는 단자(148)를 통해 공급된 노이즈레벨 검출신호를 레벨 구별회로(147)에 의해 구별하여 생성된다. 이 제어신호에 기초하여, 임계값이 상기 스케일 계산을 위해 선택된다. 즉, 스케일 계산을 위한 임계값은 노이즈 레벨 검출 신호에 기초한다.
이 노이즈레벨 검출신호는 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초한 음성 파라미터 코드로부터 검출된 백그라운드 노이즈부분의 음레벨이다.
상기의 목적을 달성하기 위해, 음성 파라미터 코드로부터의 백그라운드 노이즈부분을 검출하는 노이즈부분 검출회로 및 노이즈부분 검출회로에 의해 검출괸 노이즈부분의 노이즈 레벨을 검출하는 노이즈 레벨 검출회로가 제공된다. 노이즈 부분 검출회로와 노이즈 레벨 검출회로 중 어느 것도 도시되어 있지는 않다. 노이즈 레벨 검출회로에 의해 생성된 노이즈 레벨 검출신호는 단자(148)로 전달된다.
노이즈 감소기는 제 1노이즈 감소처리(a)용 회로(47)에서의 디코드된 음성의 노이즈를 감소시키기 위해 샘플링 레이트가 제 1샘플링 레이트(fs1)(8 kHz)인 음성 신호를 생성하는 송신기로부터 송신된 신호를 사용한다. 각각의 제 2노이즈 감소처리(b)용 및 제 3노이즈 감소처리(b)용 회로(48, 49)는 실제로 샘플링 레이트가 제 1샘플링 레이트(fs1)(16 kHz)인 음성의 노이즈를 감소시킨다. 따라서, 노이즈 감소기에서, 각각의 제 2노이즈 감소처리(b)용 및 제 3노이즈 감소처리(b)용 회로(48, 49)가 제공되어 제 1대역(B1) 또는 광대역(Bw)에 속하고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성 신호의 음성주파수보다 2배(=fs2/fs1) 높은 음성주파수를 갖는 샘플에 제 1노이즈 감소처리(a)를 적용한다.
따라서, 제 1노이즈 감소처리(a)용 회로(47)에 의해, 노이즈 감소기는 디코드된 음성 신호에서의 노이즈 성분을 감소시키고, 각각의 제 2노이즈 감소처리(b)용 및 제 3노이즈 감소처리(b)용 회로(48, 49)에 의해, 제 1대역(B1) 및 광대역(Bw)에 속하고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성 신호에 있는 노이즈성분을 감소시킨다.
도 4의 신호 선택기(32)는 D/A 변환기(6)에 제 1, 제 2 및 제 3노이즈 감소처리(a, b, b))용 회로(47, 48, 49)에 의해 노이즈가 감소된 음성 신호의 어느 하나를 보낼 수 있다. 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz인 음성신호, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 16 kHz인 음성신호 및 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 음성신호의 어느 하나를 선택 스위치 (150)에 의해 선택하여 보낸다.
따라서, 도 1에 도시된 수신기(1)는, 신호가 사용자에 의해 선택되기 전에, PSI-CELP 방식에 의해 처리되고, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트(8 kHz, 16 kHz)가 서로 다른 수신 음성 신호의 노이즈 및 PSI-CELP 방식에 의해 처리되고, 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 수신 음성 신호의 노이즈를 감소시킨다. 또한, 수신된 음성 신호의 음성주파수가 상황에 따라 확대될 수 있고 입력 때와 같은 대역을 갖도록 처리되어 결합된 배터리가 많이 소비되는 것을 방지할 수 있다.
샘플링 레이트가 D/A변환기(6)에 대해 16 kHz로 고정되고 제 1대역(B1) 및 광대역(Bw)에 속해 있는 음성 주파수를 갖는 음성 신호의 하나가 16 kHz로 고정유지된 샘플링 레이트로 선택될 수도 있음을 유의한다. D/A변환기(6)에 사용되는 클럭은 샘플링 주파수(8 kHz, 16 kHz) 각각에 대해 변하지 않기 때문에 어떤 하드웨어도 클럭변경을 위해 제공될 수 없다.
업샘플링 회로(45)에서, 필터 출력은 노이즈가 발생하는 것을 막기 위해 선택 스위치(150)가 샘플링 주파수(8 kHz, 16 kHz) 사이에서 이동될 때 클리어된다.
도 1에 도시된 수신기(1)에 제공된 신호처리기(5)의 변형예를 도 10내지 12를 참조하여 설명한다. 도 10은 도 1에 도시된 수신기(1)에 제공된 신호선택기의 변형예에 포함된 VSELP를 나타내고, 도 11은 도 1에 도시된 수신기(1)에 제공된 신호처리기의 변형예에 포함된 신호선택기의 블럭도이고, 도 12는 도 1에 도시된 신호선택기의 동작의 상세한 플로우차트이다. 이 신호 처리기(5)는 도 10의 디코더(58) 및 도 11의 신호 처리기(65)를 갖는다.
도 2에 도시된 송신기(15)의 신호 처리기(21)에 있는 음성 인코더가 채택하는 코딩 방식이 VSELP(Vector sum excited linear prediction)일 때, 디코더(58)는 송신용 VSELP에 의해 코드화된 음성 신호를 디코드하고 이 디코드된 음성(SndN)을 출력단자(59)에, 선형 예측 필터 팩터(αN)를 출력단자(60)에, 여기소스(1 ExcN1)를 출력단자(61)에, 여기소스(2 ExcN2)를 출력단자(62)에 전달한다.
신호 선택기(65)는 도 11에 도시된 바와 같이 구성되는데, 이는 여기 소스 선택 및 대역 확장 회로(68)가 제공된다는 점을 제외하고 도 4의 신호 선택기와 동일하다.
PSI-CELP 방식에서는, 코덱은 무엇보다도 음성을 처리하여 음향학적으로 자연스럽게 한다. 그러나, VSELP 방식에서는, 이 처리가 수행되지 않아서 대역이 확장된 음성이 노이즈를 포함한 것 처럼 들리게 된다. 이를 피하기 위해, 여기 소스 선택 및 대역 확장 회로(68)이 사용되어 광역 여기 소스 생성을 위해 도 12에 도시된 바와 같이 신호를 처리한다. 여기 소스 선택 및 확장회로(68)는 여기 소스회로를 갖고 있다. 도 12의 플로우차트에서, 스텝(S87) 내지 스텝(S89)은 도 6에 도시된 여기 소스 처리를 대체한다.
VSELP용 여기 소스는 다음과 같이 생성된다.
β*bL[i]+γ*cl[i]
여기서 β는 코덱에서 사용되는 파라미터이고(롱텀(long-term) 예측 팩터), bL[i]는 롱텀 필터 상태이고, γ는 게인이고, cl[i]는 여기 코드 벡터이다. 상기 수식의 전항은 피치 성분을 나타내고, 후항은 노이즈 성분을 나타낸다. 따라서, 여기 소스가 두 부분β*bL[i]와 γ*cl[i]으로 나누어진다. 소정의 시간 범위에서 전(前)부분의 에너지가 크다고 스텝(S87)에서 판단되면, 여기 소스가 강한 피치를 갖는 음성으로 간주될 수 있다. 따라서, 여기소스(1)의 샘플링된 값이 소정의 값보다 크다고 스텝(S88)에서 판단되면(YES), 여기소스는 펄스트레인이다. 피치 성분이 없다고 판단되면(NO), 여기 소스는 0으로 억제된다. 만약, 전항(피치 성분)의 에너지가 크지 않다고 스텝(S87)에서 판단되면, 종래의 절차가 실행된다. 스텝(S89)에서, 생성된 협대역 여기 소스는 PSI-CELP 방식에서와 같이 0으로 채움으로써 업샘플링되어, 광대역(Bw) 여기 소스를 제공한다. 따라서, 음성의 음향 품질이 VSELP 방식에서 향상되게 된다.
스텝(S95)에서, 광대역(Bw) 여기소스는 가산기(46)에 의해 스텝(S92)에서 업샘플링 회로(45)에 의해 업샘플링된 원 음성(SndN)에 가산된다. 스텝(S91)에서, 가산에 의해 생성된 음성의 고주파수대역은 대략 6 kH보다 높은 성분을 다소 억제하는 고주파수대역 추출 및 억제 필터(42)에 의해 필터링되어, 듣기 좋은 음성을 제공한다. 필터(42)의 필터 팩터는 상기한 바와 같이 선택가능하다.
또한, 스텝(S93)에서, 곱셈기(43)이 사용되어 사용자의 취향에 따라 음성의 고주파수대역의 게인을 조정한다.
또한, 신호선택기(65)는 제 1, 제 2 및 제 3노이즈 감소처리(a, b, b))용 회로(47, 48, 49)로 구성되는 노이즈 감소기를 갖는다. 제 1노이즈 감소처리(a)용 회로(47)는 디코드된 음성 신호에서의 노이즈 성분을 감소시키고, 제 2 및 제 3노이즈 감소처리(b)용 회로(48, 49)는 제 1대역(B1) 및 광대역(Bw)에 속하고 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성 신호에서의 노이즈 성분을 감소시킨다.
따라서, VSELP 디코딩 방식을 사용하는 신호 선택기(65)는 또한 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz인 신호, 제 1대역(B1)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 음성 신호 및 광대역(Bw)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 광대역 음성 신호를 선택 스위치(150)의 선택에 따라 D/A 변환기(16)에 보낸다.
따라서, 사용자에 의해 신호가 선택되기 전에, 도 1에 도시된 수신기(1)는 VSELP 방식에 의해 처리된, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트(8 kHz, 16 kHz)인 수신 음성 신호 및 광대역(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 수신 음성 신호에서의 노이즈를 감소시킨다. 따라서, 사용자는 넓게 음성을 선택할 수 있다. 또한, VSELP 방식에 의해 처리된 수신 음성 신호는 상황에 따라 음성 주파수 대역을 확장할 수 있고, 입력 때와 동일한 대역을 갖게 처리되어, 배터리가 너무 많이 소모되는 것을 막을 수 있다.
또한, VSELP 디코딩 방식을 사용하는 신호 선택기(65)는 기록된 메세지를 재생할 때 메시지 기록 모드 동안 메모리에 기록된 음성 파라미터 코드를 사용하여, 샘플링 레이트가 8 kHz에서 16 kHz인 고품질의 광역 음성을 생성한다.
샘플링 레이트 8 kHz의 음성 파라미터 코드는 메모리(13)에 기록되고, 샘플링 레이트 16 kHz의 광대역 음성이 산출된다. 따라서, 감소된 기록 용량으로 메세지 음성이 저장될 수 있고 고품질로 재생될 수 있다.
도 13을 참조하여, 도 1에 도시된 수신기에 제공된 신호 처리기의 다른 변형예에 포함된 신호처리기의 블럭도를 설명한다. 도 14는 도 1에 도시된 수신기에 제공된 신호 처리기의 또 다른 변형예에 포함된 디코더의 블럭도이다. 도 1의 수신기(1)에 있는 신호 처리기(5)는 도 13의 신호선택기(70) 및 도 14의 디코더로 구성된다. 이것은 다른 변형예로서 여기에 도입된다.
도 14에 도시된 디코더는 VSELP 디코더(77) 및 PSI-CELP 디코더(81)로 구성된다. 이 방식에 의하면, VSELP 또는 PSI-CELP에 의해 송신기로부터 송신된 음성 파라미터 코드가 만들어며, 이 코드가 VSELP 디코더(77) 또는 PSI-CELP 디코더(81)에 공급된다. 즉, 입력 단자(75)를 통해 수신된 음성 파라미터 코드가 인코딩 방식(VSELP 또는 PSI-CELP)에 따라 선택 스위치(76)에 의해 상호 스위칭된다.
VSELP 디코더(77)으로부터의 두 여기 소스(1 ExcN1, 2 ExcN2)는 각각 출력 단자(78, 79)를 거쳐 입력 단자(66, 67)에 공급된다. PSI-CELP 디코더(81)로부터의 여기 소스(N ExcN)은 출력 단자(82)를 거쳐 도 13에 도시된 입력 단자(35)에 공급된다.
VSELP 디코더(77) 또는 PSI-CELP 디코더(81)으로부터의 선형 예측 필터 팩터(αN) 또는 선형 예측 필터 팩터(αP)는 코딩 방식에 따라 선택 스위치(80)에 의해 선택된다. 이 코딩 방식에 의해 음성이 코드화되어 출력단자(83)를 거쳐 도 13의 입력 단자(34)에 공급된다.
동일하게, VSELP 디코더(77) 또는 PSI-CELP 디코더(81)으로부터 디코드된 음성은 코딩 방식에 따라 선택 스위치(84)에 의해 선택된다. 이 코딩 방식에 의해 음성이 코드화되어 출력단자(85)를 거쳐 도 13의 입력 단자(33)에 공급된다.
도 13의 신호 선택기(70)에 있어서, 여기 소스 선택 및 대역 확장 회로(68) 또는 여기 소스 대역 확장회로(41)로부터의 여기 소스 출력은 코딩 방식에 따라 설정가능한 선택스위치(71)에 의해 선택되어 LPC 합성회로(40)에 공급된다.
또한, 신호 선택기(70)는 각각 제 1, 제 2 및 제 3노이즈 감소처리(a, b, b))용 회로(47, 48, 49)로 구성되는 노이즈 감소기를 갖는다.
제 1노이즈 감소처리(a)용 회로(47)는 디코드된 음성 신호에서의 노이즈 성분을 감소시키고, 제 2 및 제 3노이즈 감소처리(b)용 회로(48, 49)는 제 1대역(B1) 및 광대역(Bw)에 속하고 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성 신호에서의 노이즈 성분을 감소시킨다.
따라서, 송신기로부터 송신된 신호가 코드화되는 코딩방식에 따라, 사용자가 신호를 선택하기 전에, 신호선택기(70)는 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트(8 kHz, 16 kHz)가 서로 다른 수신 음성 신호 및 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 수신 음성 신호에서의 노이즈를 감소시킨다. 따라서, 사용자는 넓게 음성을 선택할 수 있다. 또한, 상황에 따라 수신 음성 신호가 확장될 수 있고, 입력 때와 동일한 대역을 갖도록 처리되어, 배터리가 너무 많이 소모되는 것을 막을 수 있다.
또한, 신호 선택기(70)는 메세지 기록 모드 동안 메시지 기록시 메모리(13)에 기록된 음성 파라미터 코드를 사용하여, 샘플링 레이트가 8 kHz에서 16 kHz인 광역 음성을 생성할 수 있다. 특별히, 메모리(13)에 기록된 음성 파라미터 코드는 송신기로부터 송신된 신호를 코딩하는 방식에 따라 대역 확장하여 샘플링 레이트가 두 배 이상(16 kHz)으로 설정된 고품질의 광역 음성을 제공하는 데 사용될 수 있다.
또한, 도 1에 도시된 수신기(1)에 있는 신호 처리기(5)는 도 14에서 도시한 바와 같이 신호 선택기(90)로 구성될 수 있다. 이 신호 선택기(90)는 메시지 기록 동안 도 1의 메모리(13)에 기록된 음성 파라미터 코드도 읽을 수 있어서 표 1 및 2에 보인 바와 같이 메세지 재생 타임에 샘플링 레이트가 16 kHz인 광대역(Bw) 음성을 재생한다.
메모리(13)로부터 읽은 LPC 잔차인 여기소스는 신호 선택기(90)의 입력 단자(91)에 공급된다. 또한, 메모리(13)로부터 읽은 선형 예측 필터 팩터(α)는 입력 단자(92)에 공급된다. 입력 단자(92)에서의 여기 소스는 LPC 합성 필터 및 업샘플링 회로(100)에 공급된다. 입력 단자(92)에서의 선형 예측 필터 팩터가 LPC 합성 필터(93)에 보내진다.
LPC 합성 필터(93)는 입력 단자(92)에서의 선형 예측 필터 팩터를 사용하여 입력단자(91)로부터의 여기소스에 기초하여 음성 신호를 합성한다. LPC 합성 필터(93)부터 합성된 신호는 노이즈 감소기에 있는 제 1노이즈 감소처리(a)용 회로 및 업샘플링 회로(94)에 공급된다.
제 1노이즈 감소처리(a)용 회로(161)는 제 1노이즈 감소처리(a)용 회로(47)과 동일한 기능을 하기 때문에 더이상 설명하지 않는다.
업샘플링 회로(94)는 LPC 합성 필터(93)에 의해 공급된 음성 신호의 샘플링 레이트(fs1)를 업샘플링한다. 업샘플링된 음성신호는 노이즈 감소기의 제 2노이즈 감소처리(b)용 회로(162) 및 밴드 패스 필터(BPF)(95)에 공급된다.
제 2노이즈 감소처리(b)용 회로(162)는 제 2노이즈 감소처리(b)용 회로(48)과 동일한 작동을 한다. 즉, 도 6에 도시된 것과 동일한 구성을 갖는 노이즈 감소기의 회로(161)의 제 1노이즈 감소처리(a)를 샘플링 레이트가 16 kHz(제 1대역(B1) 및 광대역(Bw)에 속하는 음성주파수를 갖는 음성 신호의 샘플링 레이트의 두배(=fs1/fs2)인 샘플에 적용한다.
밴드 패스 필터(BPF)(95)는 업샘플링 회로(94)에서 나온 출력의 소정의 대역에 속하는 신호만 통과시키고 이를 가산기(96)에 공급한다. 업샘플링 회로(94), 밴드패스필터(95) 및 가산기(96)에 이어진 경로는 이것을 따라 원 음성 주파수에 속한 성분의 신호가 합성된 음성 신호에 가산되는 경로이다.
또한, 선형 예측 필터 팩터는 LPC 합성 필터(93)에서 선형 예측 필터 팩터/오토코릴레이션(α/r) 변환기(97)로 보내진다. 오토코릴레이션은 협대역 코드북(98)로 보내지고 또한 파찰음 검출기(99)에도 보내진다.
또한, 입력 단자(91)에서의 여기 소스는 업샘플링 회로(100)에 의해 업샘플링되어 로패스 필터(101) 및 부스터(102)를 통해 LPC 합성 필터(93)에 보내진다. 부스터(102)는 파찰음 또는 마찰음이 검출될 때 여기 소스를 부스트하기 위해 제공된다. 부스터(102)의 부스팅 레이트는 파찰음 검출기(99)의 출력에 기초하여 제어된다.
협대역 코드북(98)은 복수의 음성 신호 패턴으로부터 이전에 획득된 협대역 음성 신호의 오토코릴레이션을 코드 벡터로서 저장한다. 협대역 코드북(98)에서, α/r 변환기(97)로부터의 오토코릴레이션이 코드북(98)에 있는 오토코릴레이션 정보와 비교되어 그것들 서로 매치시킨다. 변환기(97)의 오토코릴레이션을 가장 잘 매치시키는 것으로 판단되는 오토코릴레이션 정보의 어느 한 인덱스가 광대역 코드북(104)에 보내진다.
협대역 코드북(98)에 대응하여, 광대역 코드북(104)는 광대역 음성 신호의 오토코릴레이션 정보를 코드 벡터로서 저장한다. 이 광대역 음성 신호의 오토코릴레이션 정보 협대역 코드북(98)이 생성될 때 사용되는 같은 패턴을 가진 음성 신호로부터 획득된다. 변환기(97)의 오토코릴레이션을 가장 잘 매치시키는 것으로 판단되는 협대역에 코드북에 있는 오토코릴레이션 정보의 어느 한 인덱스를 광대역 코드북(104)에 보내진다. 이 광대역 코드북(104)으로부터 오토코릴레이션을 가장 잘 매치시키는 것으로 판단되는 협대역 오토코릴레이션 정보에 대응되는 광대역 오토코릴레이션 정보를 읽는다.
광대역 코드북(104)으로부터 읽은 광대역 오토코릴레이션 정보는 오토코릴레이션을 선형 예측 필터 팩터로 변환하는 오토코릴레이션/선형 예측 필터 팩터(r/α) 변환기(105)로 보낸다. 선형 예측 필터 팩터는 LPC 합성 필터(103)에 보내 진다.
LPC 합성 필터(103)는 고주파수 대역 추출 및 억제 필터(106)와 곱셈기(107)에 공급되는 광대역 음성 신호를 합성하는 LPC 합성을 제공한다.
고주파수 대역 추출 및 억제 필터(106)는 LPC 합성 필터(103)의 합성 출력에서 협대역 음성 신호의 300∼3,400 Hz 신호 성분을 제거하고, 3,400 Hz보다 높은 신호성분을 추출하여 사용자의 취향에 따라 고주파수 성분을 억제한다. 곱셈기(107)는 고주파수 대역 추출 및 억제 필터(106)의 출력과 출력(108)으로부터의 조정 게인을 곱한다.
가산기(96)는 밴드패스필터(BPF)를 통해 통과된 원 협대역 음성 신호성분을 곱셈기(107)의 곱셈 출력에 가산하여 광대역 음성 신호를 제공한다. 광대역 음성 신호는 노이즈 감소기에 포함된 제 3노이즈 감소처리(b)용 회로(163)에 공급된다.
제 3노이즈 감소처리(b)용 회로(163)는 제 3노이즈 감소처리(b)용 회로(49)와 동일하게 작용한다. 즉, 제 2노이즈 감소처리(b)용 회로(162)와 같이, 도 6에 도시된 것과 동일한 구성을 갖는 노이즈 감소기의 회로(161)의 제 1노이즈 감소처리(a)를 샘플링 레이트가 16 kHz(제 1대역(B1) 및 광대역(Bw)에 속하는 음성주파수를 갖는 음성 신호의 샘플링 레이트의 두배(=fs1/fs2))인 샘플에 적용한다.
제 1노이즈 감소처리(a)용 회로(161)의 출력, 제 2노이즈 감소처리(b)용 회로(162)의 출력, 제 2노이즈 감소처리(b)용 회로(163)의 출력이 선택스위치(109)의 선택가능 단자(a, b, c) 각각에 공급된다.
특히, 선택스위치(109)는 선택가능 단자(a)에서 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성 주파수를 갖고 그 샘플링 레이트가 8 kHz의 제 1샘플링 레이트(fs1)이며 노이즈 감소된 음성신호를 수신하고, 선택가능 단자(b)에서 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호이며 노이즈 감소된 음성신호를 수신하고, 선택가능 단자(c)에서 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz의 제 2샘플링 레이트(fs2)인 음성신호이며 노이즈 감소된 음성신호를 수신한다. 선택스위치(109)는 또한 선택 막대(d)도 갖고 있다. 선택 제어 신호 단자(129)로부터의 선택제어신호에 따라 선택막대(d)를 이동함으로써, 선택 스위치(109)는 상기의 방법의 어느 하나에 따라 노이즈 감소된 음성신호 D/A 변환기에 공급한다.
도 15를 참조하여, 도 1에 도시한 수신기(1)에 제공된 신호 처리기의 또 다른 변형예에 포함된 신호 선택기(90)를 블럭도의 형태로 설명한다. 상기에서 설명한 바와 같이, 도 15의 신호 선택기(90)을 포함하는 수신기는 사용자가 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 서로 다르며(8 kHz, 16 kHz) 노이즈 감소된 수신 음성신호와, 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz이며 노이즈 감소된 음성신호의 어느 하나를 선택할 수 있도록 한다.
수신기(1)의 신호처리기(5)는 각각의 신호 선택기(32, 65, 90) 내에, 노이즈 감소처리 각각의 다운스트림 또는 업스트림으로 연결된 포스트 필터를 포함할 수 있다는 것을 유의한다.
포스트 필터는 아직 심사되지 않은 본 발명의 일본 특허출원공보 제 9-127996호에서 개시된 음성 디코딩 방법 및 장치에서 적용된 기술을 이용해 각 음성신호가 스펙트럼 쉐이핑 및 음질 향상 처리가 되도록 한 포스트 필터링을 제공한다.
도 16을 참조하면, 도 4에 도시된 신호 선택기(32)에 제공된 노이즈 감소기의 블럭도인데, 다운스트림으로 연결된 포스트 필터를 갖고 있다. 도시된 바와 같이, 신호 선택기(32)는 제 1포스트 필터링처리(a)용 회로(171), 제 2포스트 필터링처리(b)용 회로(172) 및 제 3포스트 필터링처리(b)용 회로(173)를 포함하고, 각각 제 1노이즈 감소처리(a)용 회로(47), 제 2노이즈 감소처리(b)용 회로(48) 및 제 3노이즈 감소처리(b)용 회로(49)에 다운스트림으로 연결된다. 여기에 음성 디코딩 방법 및 장치가 적용된다. 도 17은 도 16에 도시한 신호 선택기에 포함된 포스트 필터의 상세한 블럭도이다.
도 17에서 도시한 바와 같이, 포스트 필터는 특별한 부분으로서 스펙트럼 쉐이핑 필터(131)를 포함한다. 스펙트럼 쉐이핑 필터(131)는 포맷 인핸싱(enhancing) 필터(132) 및 고주파수 대역 인핸싱 필터(133)로 구성된다. 스펙트럼 쉐이핑 필터(131)의 출력은 게인 제어기(134)로 보내지고 이 게인 제어기(134)는 스펙트럼 쉐이핑에 기인하는 게인 변화를 수정한다. 게인 제어기(134)의 게인은 게인 제어회로(136)에 의해 결정된다. 게인 제어회로(136)는 스펙트럼 쉐이핑 필터(131) 입력과 출력을 비교하여 게인 변화를 계산하고 게인 제어기(134)의 게인(G)에 대한 수정값을 제공한다. 스펙트럼 쉐이핑 필터(131)의 입력은 제 1노이즈 감소처리(a)용 회로(47)에 의해 노이즈가 감소된 디코드된 음성 신호(SndN)이고, 스펙트럼 쉐이핑 필터(131)의 출력은 포스트 필터의 출력으로 단자(137)에 전달된다.
포스트 필터는 아래서 설명하는 바와 같이 동작한다.
도 17에 있는 스펙트럼 쉐이핑 필터(131)의 특성(PF(Z))은 선형 예측 필터 팩터(αi)를 사용하여 다음과 같이 표현된다.
여기서, β,γ 및 k는 예를 들어 0.6, 0.8 및 0.3인 상수이다. 수학식(6)에서, 분수는 포맷 인핸싱 필터(132)의 특성을 나타내고 [1-kz-1] 부분은 고주파수대역 인핸싱 필터(133)의 특성을 나타낸다.
게인 제어회로(134)의 게인(G)은 다음과 같이 표현된다.
여기서, x(i)는 스펙트럼 쉐이핑 필터(131)의 입력, 즉 입력 광대역 음성 신호(SndW)이고, y(i)는 스펙트럼 쉐이핑 필터(131)의 출력이다.
도 18을 참조하여, 포스트 필터의 필터 팩터 갱신 주기 및 게인 갱신 주기를 설명한다. 도시한 바와 같이, 스펙트럼 쉐이핑 필터(131)의 팩터 갱신 주기는 LPC 합성회로(40)의 팩터(αW) 갱신 주기, 즉 20 샘플(2.5 msec)이고, 반면에 게인 제어회로(134)의 게인(G) 갱신 주기는 160 샘플(20 msec)이다.
따라서, 게인 제어회로(134)의 게인(G) 갱신 주기는 제 1노이즈 감소처리(a)용 회로(171)의 스펙트럼 쉐이핑 필터(131)에 대한 팩터 갱신 주기보다 길게 설정되어 게인 변화의 역효과를 방지한다.
즉, 일반적인 포스트 필터에서, 스펙트럼 쉐이핑 필터에 대한 팩터 갱신 주기는 게인 제어회로의 게인 갱신 주기와 같다. 게인 갱신 주기가 20 샘플(2.5 msec)이라고 가정하면, 1피치 주기에서 클릭 노이즈를 일으키며 게인이 변환다. 더 길게 게인 갱신 주기를 설정하여, 예를 들어, 1프레임에 160 샘플(20 msec)로 함으로써, 게인이 포스트 필터에서 변하는 것을 막을 수 있다. 스펙트럼 쉐이핑 필터(131)의 팩터 갱신 주기가 160 샘플(20 msec)과 같이 길게 설정되면, 포스트 필터의 특성은 단시간 내에 음성 스펙트럼의 변화를 따라 갈 수가 없다. 따라서, 음질의 향상을 가져올 수 없다. 그러나, 20 샘플(2.5 msec)과 같이 짧은 필터 팩터 갱신 주기를 설정하면 효과적인 포스트 필터링을 줄 수 있다.
제 1포스트 필터링(a)처리용 회로(171)은 8 kHz의 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초한 음성 파라미터 코드(예를 들어, α)를 처리하는데 사용된다. 제 2포스트 필터링(b)처리용 회로(172) 및 제 3포스트 필터링(b)처리용 회로(173)는 제 2샘플링 레이트(fs2)의 음성신호를 처리하는 데 사용된다. 즉, 제 2포스트 필터링(b)처리용 회로(172) 및 제 3포스트 필터링(b)처리용 회로(173)는 실제로 사용되어 제 1샘플링 레이트(fs1) 8 kHz의 두 배(=fs1/fs2)인 16 kHz의 음성 신호에 도 17에 도시된 제 1포스트 필터링 처리를 적용한다.
제 1포스트 필터링은 노이즈가 감소된 디코드된 음성 신호의 스펙트럼 형태 및 음질을 효과적으로 향상시킬 수 있다. 또한, 제 2포스트 필터링(b)처리용 회로(172) 및 제 3포스트 필터링(b)처리용 회로(173)는 각각 제 1대역(B1) 및 광대역(Bw)에 속하는 음성주파수를 갖는 음성 신호(노이즈가 감소되고 샘플링 레이트가 16 kHz)의 스펙트럼 형태 및 음질을 효과적으로 향상시킬 수 있다
따라서, 도 16에 도시된 신호선택기(32)는 선택 스위치(150)을 통해 D/A 변환기(6)로, 제 1 , 제 2 및 제 3 노이즈 감소처리용(a, b, b) 회로(47, 48, 49)에 의해 노이즈가 감소되고 각각의 제 1 , 제 2 및 제 3 포스트 필터링처리용(a, b, b) 회로(171, 172, 173)에 의해 스펙트럼 형태 및 음질이 효과적으로 향상된 음성 신호를 보낸다. 즉, 필요에 따라, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 8 kHz인 음성신호, 제 1대역(B1)(300∼3,400 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 음성신호 및 광대역(Bw)(300∼6,000 Hz)에 속하는 음성주파수를 갖고 그 샘플링 레이트가 16 kHz인 음성신호에서 선택된 어느 하나를 D/A 변환기(6)에 보낼 수 있다.
신호 선택기(32, 65, 70, 90)로 구성되는 신호처리를 하는 수신기는 송신기와 일체로 형성되어 도 19에 도시된 이동 전화를 제공할 수 있음에 유의한다. 이동 전화는 전체적으로 참조번호 110으로 되어 있다. 이동전화(110)은 PDC로서 현재 널리 보급된 이동전화에 응용된다. 이동전화(110)는 음성 파라미터 코드가 반도체 메모리, 자기테이프 등의 기록매체에 기록되는 전화응답 기능을 갖고 있다. 이것은 기록매체에서 판독되고 제 2샘플링 레이트(fs2)를 사용하여 자동 메세지기록모드 동안에 자동으로 송신되고 기록된 음성이 재생될 수 있다.
이동전화(110)에서, 마이크로폰으로부터 입력된 음성은 증폭기(112), 가변 저항기(113), 안티 에일리어싱 필터(114) 및 D/A 변환기를 거쳐 신호처리기(116)의 메모리(116a)에 저장된다.
메모리(116a)에 저장된 음성은 신호처리기(116)에 있는 음성 인코더에 의해 코드화되어 음성 파라미터 코드를 제공한다.
음성 파라미터 코드는 제어기(117), RF 송신 증폭기(118) 및 안테나(119)를 거쳐 기지국으로 송신된다.
신호처리기(116)에 있는 음성 인코더는 대역폭이 제한되는 송신로에 따라 대역이 좁아지는 것을 고려하여 음성 파라미터 코드를 제어기(117)를 거쳐 RF 송신 증폭기(118)에 공급한다.
또한, 기지국으로부터 안테나(119)를 거쳐 수신된 음성 파라미터 코드는 RF 송신 증폭기(118) 및 안테나(119)를 거쳐 통과되어 신호처리기(122)의 메모리(112a)에 저장된다.
신호처리기(122)의 메모리(112a)에 저장된 음성 파라미터 코드는 신호처리기(122)의 디코더에 의해 디코드되어, 출력 전에 소정의 방식으로 처리된다. 또한, 자동 메세지 기록모드에서 자동기록된 수신 음성이 재생될 때, 메모리(130)에 저장된 음성 파라미터 코드는 신호처리기(122)의 디코더에 의해 디코드되어, 출력 전에 소정의 방식으로 처리된다.
신호처리기(122)의 출력은 D/A 변환기(123)에 의해 아날로그 신호로 변환되어, 안티 에일리어싱 필터(124), 증폭기(128), 가변 저항기(125)를 거쳐 스피커(127)에 출력된다.
신호 처리기(122)는 상기의 신호 선택기(32, 65, 70 또는 90)으로 구성된다. 따라서, 도 19에 도시된 이동전화는 샘플링 레이트가 수신기에서 2배인 광대역 음성 신호의 스펙트럼 형태와 음질을 효과적으로 향상시키고 신호의 노이즈 성분을 감소시킬 수 있다.
또한, 샘플링 레이트가 8 kHz인 음성 파라미터 코드가 메모리(130)에 저장되고 샘플링 레이트가 16 kHz인 광대역 음성으로서 재생되어, 작은 용량으로 기록가능하고 고품질의 음성을 재생할 수 있다.
수신기 및 이동전화에서 반도체 메모리가 기록매체로 사용되어 음성 파라미터 코드를 기록한다고 하더라도, 기록매체로서 자기테이프 같은 다른 종류의 것도 사용될 수 있음에 유의한다.
또한, 수신기 및 이동전화에서 음성 파라미터 코드가 전용의 메모리(13, 130)에 기록되더라도, 본 발명에 따라 제어기나 신호 처리기에 있는 메모리가 공통으로 사용되어 음성 파라미터 코드를 기록할 수도 있다.
상기의 상술에서, 본 발명의 실시예로서의 수신기, 송신기 및 이동전화는 PDC로서 사용되는 디지털 이동전화에 적용될 수 있다. 그러나, 광대역 CDMA 시스템, 즉, 광대역의 음성주파수를 사용하는 이동통신 시스템에도 적용할 수 있다.

Claims (25)

  1. 수신장치에 있어서,
    음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 샘플링 레이트 변환수단과,
    음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 대역외 성분 예측수단을 포함하여 구성되는 것을 특징으로 하는 수신장치.
  2. 제 1항에 있어서,
    제 2샘플링 레이트(fs2)로 샘플링되는 샘플링 레이트 변환수단에 의해 만들어진, 제 1대역(B1)에 포함되는 음성 주파수를 갖는 음성신호와, 대역외성분 예측수단에 의해 예측된, 제 2샘플링 레이트(fs2)의 제 2대역(B2)에 포함된 음성 주파수를 갖는 음성신호를 가산하여 광대역(Bw)에 포함된 음성주파수를 갖는 음성신호를 제공하는 가산수단을 더 포함하는 것을 특징으로 하는 수신장치.
  3. 제 2항에 있어서,
    상기 가산수단으로부터 가산 출력의 노이즈를 감소시키는 노이즈 감소수단을 더 포함하는 것을 특징으로 하는 수신장치.
  4. 제 3항에 있어서,
    노이즈 감소수단은 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 검출된 백그라운드 노이즈 성분에서의 노이즈 레벨에 따라 제어신호를 만들고, 제어신호에 기초하여 가산출력에 노이즈 감소를 행하는 것을 특징으로 하는 수신장치.
  5. 제 4항에 있어서,
    노이즈 감소수단은 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 검출된 백그라운드 노이즈 성분에서의 노이즈 레벨에 따라 제어신호를 만들고, 제어신호에 기초하여 노이즈감소를 fs2/fs1회 반복하는 것을 특징으로 하는 수신장치.
  6. 제 2항에 있어서,
    가산수단으로부터의 가산 출력을 포스트 필터링하는 포스트 필터링수단을 더 포함하는 것을 특징으로 하는 수신장치.
  7. 제 6항에 있어서,
    포스트 필터링수단은 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초한 음성 파라미터 코드에 따라 가산출력의 포스트 필터링을 fs2/fs1회 반복하는 것을 특징으로 하는 수신장치.
  8. 제 7항에 있어서,
    포스트 필터링수단은,
    디코드된 신호가 공급되고 필터 팩터가 제 1주기에서 갱신되는 스펙트럼 쉐이핑 필터(spectrum shaping filter)와,
    스펙트럼 쉐이핑 필터로부터의 출력이 공급되고 게인이 제 1주기와 다른 제 2주기에서 갱신되는 게인제어수단을 포함하여 구성되는 것을 특징으로 하는 수신장치.
  9. 제 8항에 있어서,
    포스트 필터링수단은 제 1주기보다 긴 제 2주기를 설정하는 것을 특징으로 하는 수신장치.
  10. 제 2항에 있어서,
    대역(B1)에 속하는 음성주파수를 갖고, 제 2샘플링 레이트(fs2)로 샘플링되는 샘플링 레이트 변환수단에 의해 만들어진 음성신호와, 광대역(Bw)에 속하는 음성 주파수를 갖고, 가산수단으로부터 제공된 음성신호 중의 어느 하나를 선택하는 선택수단을 더 포함하는 것을 특징으로 하는 수신장치.
  11. 제 10항에 있어서,
    선택수단은 제 1대역(B1)에 속하는 음성 주파수를 갖고 음성 파라미터 코드로부터 생성된, 제 1샘플링 레이트(fs1)의 음성신호들 중 하나를 선택하는 것을 특징으로 하는 수신장치.
  12. 제 1항에 있어서,
    송신기로부터 송신된 신호에 기초한 음성 파라미터코드를 저장하는 기록매체와,
    기록매체에 저장된 음성 파라미터 코드를 사용하여 생성되는 제 1대역(B1)에 속하는 음성신호를 더 포함하는 것을 특징으로 하는 수신장치.
  13. 제 1항에 있어서,
    대역외성분 예측수단은,
    음성 파라미터 코드로서 선형의 예측 잔차 대역을 확장하는 부분과,
    선형 예측 필터 팩터의 대역을 광대역(Bw)으로 확장하는 부분을 더 포함하는 것을 특징으로 하는 수신장치.
  14. 제 13항에 있어서,
    선형 예측 필터 팩터의 대역을 광대역(Bw)으로 확장하는 부분은,
    선형 예측 필터 팩터를 오토코릴레이션(autocorrelation)으로 변환하는 제 1변환기와,
    광대역(Bw)에 이전에 저장된 오토코릴레이션을 갖는 코드북을 참조하여 제 1변환기로부터의 오토코리레이션의 대역을 확장하는 오토코릴레이션 주파수 대역 확장수단과,
    오토코릴레이션 주파수 대역 확장수단으로부터 대역 확장된 오토코릴레이션을 대역 확장된 선형 예측 필터 팩터로 변환하는 제 2변환기를 포함하는 것을 특징으로 하는 수신장치.
  15. 제 13항에 있어서,
    선형 예측 잔차 대역 확장부분은 선형의 예측 잔차를 업샘플링하는 업샘플링 회로를 포함하는 것을 특징으로 하는 수신장치.
  16. 제 1항에 있어서,
    송신 신호는 PSI-CELP코드화되거나 VSELP코드화된 신호이고,
    대역외성분 예측수단은 PSI-CELP코드화되거나 VSELP코드화된 신호를, 제 1대역(B1) 밖의 한 성분인 제 2대역(B2)에 속하는 음성 주파수를 갖는, 제 2샘플링 레이트(fs2)의 음성신호로 디코딩하여 생성된 음성 파라미터 코드를 사용하는 것을 특징으로 하는 수신장치.
  17. 수신방법에 있어서,
    그 음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하는 송신기로부터 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 단계와,
    음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 단계를 포함하여 구성되는 것을 특징으로 하는 수신방법.
  18. 통신장치에 있어서,
    제 1 샘플링 레이트을 갖는 입력 음성신호를 인코딩하여 송신용 신호를 생성하는 송신수단과,
    제 1샘플링 레이트(fs1)로 인코딩하여 생성된 송신신호에 기초하여 음성 파라미터 코드로부터 제 2샘플링 레이트(fs2)(fs2>fs1)의 음성신호를 생성하는 수신수단을 포함하여 구성되는 것을 특징으로 하는 통신장치.
  19. 제 18항에 있어서,
    수신수단은,
    음성주파수가 제 1대역(B1)에 포함되고, 제 1샘플링 레이트(fs1)의 음성신호를 생성하도록 송신된 신호에 기초하여 음성 파라미터 코드로부터 생성되는 음성신호의 샘플링 레이트(fs1)를 제 2샘플링 레이트(fs2)(fs2>fs1)로 변환하는 샘플링 레이트 변환수단과, 음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 예측수단을 포함하여 구성되는 것을 특징으로 하는 통신장치.
  20. 제 19항에 있어서,
    수신수단은 제 2샘플링 레이트(fs2)로 샘플링되는 샘플링 레이트 변환수단에 의해 만들어진, 제 1대역(B1)에 포함되는 음성 주파수를 갖는 음성신호와, 대역외성분 예측수단에 의해 예측된, 제 2대역(B2)에 포함된 음성 주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 가산하는 가산수단을 포함하는 것을 특징으로 하는 통신장치.
  21. 제 19항에 있어서,
    대역외성분 예측수단은,
    음성 파라미터 코드로서 선형의 예측 잔차 대역을 확장하는 부분과,
    선형 예측 필터 팩터의 대역을 광대역(Bw)으로 확장하는 부분을 더 포함하는 것을 특징으로 하는 통신장치.
  22. 제 21항에 있어서,
    선형 예측 필터 팩터의 대역을 광대역(Bw)으로 확장하는 부분은,
    선형 예측 필터 팩터를 오토코릴레이션(autocorrelation)으로 변환하는 제 1변환기와,
    광대역(Bw)에 이전에 저장된 오토코릴레이션을 갖는 코드북을 참조하여 제 1변환기로부터의 오토코리레이션의 대역을 확장하는 오토코릴레이션 주파수 대역 확장수단과,
    오토코릴레이션 주파수 대역 확장수단으로부터 대역 확장된 오토코릴레이션을 대역 확장된 선형 예측 필터 팩터로 변환하는 제 2변환기를 포함하는 것을 특징으로 하는 통신장치.
  23. 제 21항에 있어서,
    선형 예측 잔차 대역 확장부분은 선형의 예측 잔차를 업샘플링하는 업샘플링 회로를 포함하는 것을 특징으로 하는 통신장치.
  24. 제 19항에 있어서,
    송신 신호는 PSI-CELP코드화되거나 VSELP코드화된 신호이고,
    대역외성분 예측수단은 PSI-CELP코드화되거나 VSELP코드화된 신호를, 제 1대역(B1) 밖의 한 성분인 제 2대역(B2)에 속하는 음성 주파수를 갖는, 제 2샘플링 레이트(fs2)의 음성신호로 디코딩하여 생성된 음성 파라미터 코드를 사용하는 것을 특징으로 하는 통신장치.
  25. 제 1샘플링 레이트(fs1)를 갖는 입력 음성신호를 인코딩하여 송신용 신호를 생성하는 단계와,
    제 1샘플링 레이트(fs1)로 인코딩하여 생성된 송신신호에 기초한 음성 파라미터 코드에 기초하여, 제 1대역(B1) 밖의 성분인 제 2대역(B2)에 포함된 음성주파수를 갖는 제 2샘플링 레이트(fs2)의 음성신호를 예측하는 단계를 포함하여 구성되는 것을 특징으로 하는 통신방법.
KR1019990055298A 1998-12-11 1999-12-07 수신장치 및 방법과 통신장치 및 방법 KR20000047944A (ko)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
JP98-353344 1998-12-11
JP98-353345 1998-12-11
JP10353345A JP2000181495A (ja) 1998-12-11 1998-12-11 受信装置及び方法、通信装置及び方法
JP10353344A JP2000181494A (ja) 1998-12-11 1998-12-11 受信装置及び方法、通信装置及び方法
JP98-354831 1998-12-14
JP35483198A JP4135240B2 (ja) 1998-12-14 1998-12-14 受信装置及び方法、通信装置及び方法
JP36171198A JP4135242B2 (ja) 1998-12-18 1998-12-18 受信装置及び方法、通信装置及び方法
JP98-361711 1998-12-18
JP11007001A JP2000206997A (ja) 1999-01-13 1999-01-13 受信装置及び方法、通信装置及び方法
JP99-007001 1999-01-13

Publications (1)

Publication Number Publication Date
KR20000047944A true KR20000047944A (ko) 2000-07-25

Family

ID=27518772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990055298A KR20000047944A (ko) 1998-12-11 1999-12-07 수신장치 및 방법과 통신장치 및 방법

Country Status (3)

Country Link
EP (1) EP1008984A3 (ko)
KR (1) KR20000047944A (ko)
CN (1) CN1261713A (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2351889B (en) 1999-07-06 2003-12-17 Ericsson Telefon Ab L M Speech band expansion
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
DE10102173A1 (de) * 2001-01-18 2002-07-25 Siemens Ag Verfahren und Anordnung zum Umsetzen von parametrisch codier-ten Sprachsignalen verschiedener Bandbreite in Sprachsignale
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
JP4630956B2 (ja) * 2004-03-30 2011-02-09 学校法人早稲田大学 ハウリング周波数成分強調方法およびその装置、ハウリング検出方法およびその装置、ハウリング抑圧方法およびその装置、ピーク周波数成分強調方法およびその装置
DE602006012637D1 (de) 2005-04-01 2010-04-15 Qualcomm Inc Vorrichtung und Verfahren für die Teilband-Sprachkodierung
TR201821299T4 (tr) 2005-04-22 2019-01-21 Qualcomm Inc Kazanç faktörü yumuşatma için sistemler, yöntemler ve aparat.
EP1970900A1 (en) 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
CN104023188B (zh) * 2014-05-28 2017-03-29 北京数字电视国家工程实验室有限公司 一种dtmb接收机的多带宽应用方法及对应的dtmb接收机
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及***
CN110610717B (zh) * 2019-08-30 2021-10-15 西南电子技术研究所(中国电子科技集团公司第十研究所) 复杂频谱环境混合信号的分离方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置

Also Published As

Publication number Publication date
CN1261713A (zh) 2000-08-02
EP1008984A3 (en) 2000-08-02
EP1008984A2 (en) 2000-06-14

Similar Documents

Publication Publication Date Title
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
RU2262748C2 (ru) Многорежимное устройство кодирования
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
KR20000047944A (ko) 수신장치 및 방법과 통신장치 및 방법
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
AU2005234181B2 (en) Coding of audio signals
US6604070B1 (en) System of encoding and decoding speech signals
KR100915733B1 (ko) 음성 신호들의 대역폭의 인공 확장을 위한 방법 및 장치
JP3653826B2 (ja) 音声復号化方法及び装置
US20040138876A1 (en) Method and apparatus for artificial bandwidth expansion in speech processing
US6694018B1 (en) Echo canceling apparatus and method, and voice reproducing apparatus
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
EP0732686A2 (en) Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
JP2007156506A (ja) 音声処理装置及び音声を処理する方法
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP4558734B2 (ja) 信号復号化装置
JP4135242B2 (ja) 受信装置及び方法、通信装置及び方法
JP4135240B2 (ja) 受信装置及び方法、通信装置及び方法
JP4099879B2 (ja) 帯域幅拡張方法及び装置
JP2000206995A (ja) 受信装置及び方法、通信装置及び方法
JP2000206996A (ja) 受信装置及び方法、通信装置及び方法
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid