KR100455826B1 - 가변율보코더의인코딩속도를선택하기위한방법및장치 - Google Patents

가변율보코더의인코딩속도를선택하기위한방법및장치 Download PDF

Info

Publication number
KR100455826B1
KR100455826B1 KR1019960701839A KR19960701839A KR100455826B1 KR 100455826 B1 KR100455826 B1 KR 100455826B1 KR 1019960701839 A KR1019960701839 A KR 1019960701839A KR 19960701839 A KR19960701839 A KR 19960701839A KR 100455826 B1 KR100455826 B1 KR 100455826B1
Authority
KR
South Korea
Prior art keywords
subband
determining
signal
encoding
encoding rate
Prior art date
Application number
KR1019960701839A
Other languages
English (en)
Other versions
KR960705305A (ko
Inventor
앤드류 피. 데자코
윌리암 알. 가드너
Original Assignee
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23106989&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100455826(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 콸콤 인코포레이티드 filed Critical 콸콤 인코포레이티드
Publication of KR960705305A publication Critical patent/KR960705305A/ko
Application granted granted Critical
Publication of KR100455826B1 publication Critical patent/KR100455826B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Dc Digital Transmission (AREA)

Abstract

본 발명은 배경 잡음으로서 저에너지 음성화된 음성을 코딩할 확률을 줄이기 위한 방법에 관한 것이다. 인코딩 속도는 디지탈 부대역 필터(4) 및 (6)를 사용하여 입력 신호를 부대역으로 분할하고 상기 대역의 에너지와 부대역 속도 결정 엘리먼트(12) 및 (14)의 일 세트의 임계치를 비교하여 인코딩 속도 선택기(16)에서 상기 비교를 검사하므로써 결정된다. 이와같은 방법에 의해, 음성화된 음성이 배경 잡음과 구별될 수 있다. 또한, 본 발명은 입력 신호의 신호 대 잡음비를 사용하여 임계치를 설정하기 위한 수단을 제공하며, 배경 잡음으로부터 음악을 구별하기 위하여 입력 신호의 주기성을 검사하는 것에 의해 가변 속도 보코더를 통해 음악을 코딩하기 위한 방법을 제공한다.

Description

가변율 보코더의 인코딩 속도를 선택하기 위한 방법 및 장치
본 발명은 보코더에 관한 것으로, 특히 가변율 보코더에서 음성 인코딩 속도를 결정하기 위한 새롭고 개선된 방법에 관한 것이다.
가변율 음성 표현 시스템은 일반적으로 인코딩을 시작하기 전에 일정한 속도 결정 알고리즘의 형태를 사용한다. 상기 속도 결정 알고리즘은 음성이 존재하는 오디오 신호의 세그먼트에 대해서는 높은 비트 속도 인코딩 구성을, 무성 세크먼트에 대해서는 저속 인코딩 구성을 할당한다. 이러한 방법을 사용하여 재구성된 음성 품질을 높이면서도 평균적으로 낮은 비트 속도를 달성할 수 있다. 그러므로 가변율 음성 코더를 효과적으로 작동하려면, 다양한 잡음 환경에서 침묵(silence)으로부터 음성을 구별할 수 있는 강력한 속도 결정 알고리즘이 요구된다.
이와같은 가변율 음성 압축 시스템 또는 가변율 보코더는 "가변율 보코더"라는 발명의 명칭으로 1991년 6월 11일에 출원하고 현재 계류중인 미합중국 특허출원 제 07/713,661호에 개시되어 있다. 이러한 가변율 보코더의 특수한 실시에 있어서, 입력 음성은 음성활성도의 레벨에 상응하여 결정되는 여러 가지 속도들 중 하나의 속도로 코드 여기 선형 예측 코딩(CELP) 방식을 사용하여 인코딩한다. 음성 활성도의 레벨은 음성뿐만 아니라 배경 잡음을 포함하는 입력 오디오 샘플의 에너지로부터 결정된다. 배경 잡음의 가변 레벨에 걸쳐 고품질 음성 인코딩을 보코더가 제공할 수 있도록 하기 위해서, 상기 속도 결정 알고리즘상에서 배경 잡음의 효과를 보상하는 임계값 기술을 적절히 사용하는 것이 요구된다.
보코더는 일반적으로 전송을 위한 디지탈 형태로 전환되는 아날로그 오디오 신호의 디지탈 신호 압축을 제공하기 위하여 셀룰라 전화 또는 개인 통신 장치와 같은 통신장치에 사용된다. 셀룰라 전화 또는 개인 통신 장치가 사용될 수도 있는 이동 환경에 있어서, 높은 레벨의 배경 잡음 에너지 때문에 속도 결정 알고리즘은 신호 에너지를 사용하여 배경 잡음 침묵(silence)으로부터 저에너지 무성음을 구별하기가 어렵게 된다. 그러므로 무성음은 자주 저비트 속도에서 인코딩되며 "s", "x", "ch", "sh", "t" 등과 같은 자음은 재구성된 음성에서 상실되므로 음성 품질이 저하된다.
배경 잡음 에너지만을 속도 결정의 기초로 하는 보코더는 임계값 설정에 있어서 배경 잡음에 대한 상대적인 신호 세기를 고려하지 않는다. 배경 잡음만을 그 임계 레벨의 기초로 하는 보코더는 배경 잡음이 증가하는 경우에, 임계 레벨을 서로 압축하려는 경향이 있다. 그러나, 신호 레벨이 변하지 않을 경우에 이러한 방식으로 임계값을 설정하는 것은 옳은 접근방법이지만, 신호 레벨이 배경 잡음 레벨과 함께 증가하는 경우에는 임계값을 압축하는 것은 최선의 방법이 아니다. 신호 세기를 고려한 임계 레벨를 설정하기 위한 다른 방법이 가변율 보코더에 필요하다.
남아있는 마지막 문제는 배경 잡음 에너지에 근거한 속도 결정 보코더를 통해 음악이 연주되는 동안에 일어난다. 사람들이 말하는 동안에는 숨을 쉬기 위해 잠시 멈춰야만 하는데, 이것은 임계 레벨이 적당한 배경 잡음 레벨로 재설정되도록 한다. 그러나, 음악이 계속되는 상태에서 일어나는 것과 같이 보코더를 통해 음악을 전송함에 있어서, 어떠한 일시 정지도 발생하지 않으며 임계 레벨은 음악이 완전속도(full rate) 이하의 속도로 코드화되기 시작할 때 까지 연속해서 증가할 것이다. 이와같은 상태에서 가변율 보코더는 음악을 배경 잡음으로 혼동하게 된다.
발명의 요약
본 발명은 가변율 보코더에서 인코딩 속도를 결정하기 위한 새롭게 개선된 방법 및 장치이다. 본 발명의 제1목적은 저에너지 무성음이 배경잡음으로 코딩될 확률을 감소시키기 위한 방법을 제공하는 것이다. 본 발명에 있어서, 입력 신호는 고주파 성분 및 저주파 성분으로 필터링된다. 입력신호의 필터링된 성분들은 음성의 존재를 검출하기 위하여 개별적으로 분석된다. 무성음은 고주파 성분을 가지기 때문에 고주파 대역에 관련한 그 신호 세기는 전체 주파수 대역에 걸쳐 배경 잡음과 비교하는 것보다 상기 대역에서 배경잡음으로부터 보다 잘 구별될 수 있다.
본 발명의 제2목적은 배경 잡음 에너지뿐만 아니라 신호 에너지를 고려한 임계값 설정 수단을 제공하는 것이다. 본 발명에 있어서, 음성 검출 임계 설정은 입력 신호의 신호 대 잡음비(SNR)의 평가에 의거한다. 전형적인 실시예에 있어서, 신호 에너지는 음성 활성 시간동안 최대 신호 에너지로 평가되며 배경 잡음 에너지는 침묵 시간동안 최소 신호에너지로서 평가된다.
본 발명의 제3목적은 가변율 보코더를 통과하는 음악을 코딩하기 위한 방법을 제공하는 것이다. 전형적인 실시예에 있어서, 속도 선택 장치는 임계 레벨이 증가하는 다수의 연속 프레임을 검출하고 상기 프레임들 전반에 걸쳐서 주기성을 체크한다. 입력 신호가 주기성이 있으면 이것은 음악의 존재를 나타낸다. 음악의 존재가 검출되면 임계값은 신호가 완전속도로 코딩되는 레벨로 설정된다.
본 발명의 특징, 목적 및 이점들은 도면을 참조하여 상세한 설명으로부터 보다 명백하게 될 것이다.
제 1도는 본 발명의 블록도이다.
바람직한 실시예의 상세한 설명
제 1도에서, 입력 신호 S(n)는 서브대역 에너지 계산 엘리먼트(4) 및 서브대역 에너지 계산 엘리먼트(6)에 제공된다. 입력 신호 S(n)는 오디오 신호 및 배경 잡음으로 이루어진다. 오디오 신호는 전형적으로 음성이지만 음악일수도 있다. 전형적인 실시예에서, S(n)은 20ms 프레임의 160 샘플로 각각 제공된다. 전형적인 실시예에 있어서, 입력 신호 S(n)은 사람 음성 신호의 대역폭인 대략 0kHz 내지 4kHz의 주파수 성분을 갖는다.
전형적인 실시예에 있어서, 4kHz 입력 신호 S(n)는 두 개의 분리된 서브대역으로 필터링된다. 두 개의 분리된 서브대역은 각각 0kHz 내지 2kHz와 2kHz 내지 4kHz 사이에 놓인다. 전형적인 실시예에 있어서, 입력 신호는 서브 대역 필터에 의해 서브대역들로 분할될 수도 있으며, 그 설계는 당해분야에서 공지이고 "주파수 선택 적응 필터링"이란 발명의 명칭으로 1994년 2월 1일에 출원한 미합중국 특허출원 제 08/189,819호에 상세되어 있다.
서브대역 필터의 임펄스 응답은 저대역통과 필터에 대해서는 hL(n), 고대역통과 필터에 대해서는 hH(n)으로 규정된다. 신호의 서브대역 성분의 에너지는 당해분야에서 공지인 바와같이, 상기 서브대역 필터 출력 샘플들의 제곱을 합함으로써 RL(O) 및 RH(O)을 제공하도록 간단히 계산될 수 있다.
바람직한 실시예에 있어서, 입력 신호 S(n)가 서브대역 에너지 계산 엘리먼트(4)에 제공되는 경우, 입력 프레임의 저주파 성분의 에너지값,RL(O),은 다음과 같이 계산된다.
여기서 L은 임펄스 응답 hL(n)을 갖는 저대역통과 필터에서 탭수이며, RS(i)는 다음 방정식에 의해 주어진 입력 신호 S(n)의 자기상관 함수이다 :
여기서 N은 프레임의 샘플수이며, RhL은 다음 방정식에 의해 주어진 저대역 통과 필터 hL(n)의 자기상관 함수이다 :
고주파 에너지 RH(O)는 서브대역 에너지 계산 엘리먼트(6)에서 유사한 방식으로 계산된다.
서브대역 필터의 자기상관 함수의 값은 계산 로드를 감소시키기 위해 시간에 앞서 계산될 수 있다. 또한, RS(i)의 계산된 값의 일부는 입력 신호
S(n)의 코딩에서 다른 계산에 사용되며, 그것에 의해 본 발명의 인코딩 속도 선택 방법의 계산 부담이 더 감소된다. 예를 들면, LPC 필터 탭 값의 유도는 일 세트의 입력 신호 자기상관 계수의 계산을 필요로 한다.
LPC 필터 탭 값의 계산은 당해 분야에서 공지이며 미합중국 특허출원 제 08/004,484호에 상세하게 설명되어 있다. 10 탭 LPC 필터를 필요로 하는 방법으로 음성을 코딩하면 11부터 L-1까지 i값에 대한 RS(i)의 값만이 계산될 필요가 있으며, 그것에 더하여, LPC 필터 탭 값을 계산하는데 0 내지 10까지 i값에 대한 RS(i)이 사용되기 때문에 상기 11부터 L-1까지 i값에 대한 RS(i)이 신호를 코딩하는데 사용된다. 전형적인 실시예에 있어서, 서브 대역 필터는 17 탭을 갖는다. 즉, L=17이다.
서브대역 에너지 계산 엘리먼트(4)는 서브대역 속도 결정 엘리먼트(12)에 RL(O)의 계산된 값을 제공하며, 서브대역 에너지 계산 엘리먼트(6)는 서브대역 속도 결정 엘리먼트(14)에 RH(O)의 계산된 값을 제공한다. 속도 결정 엘리먼트(12)는 두 개의 소정의 입계값 TL1/2 및 TLfull에 대하여 RL(O)값을 비교하며, 상기 비교에 따라서 제안된 인코딩 속도 RATEL를 할당한다. 속도 할당은 다음과 같이 이루어진다 :
서브대역 속도 결정 엘리먼트(14)는 유사한 방식으로 동작하며 고주파 에너지 값RH(O)에 따라서 그리고 다른 세트의 입계값 TH1/2 및 THfull에 의거하여 제안 인코딩 속도 RATEH를 선택한다. 서브대역 속도 결정 엘리먼트(12)는 인코딩 속도 선택 엘리먼트(16)에 그 제안된 인코딩 속도 RATEL를 제공하며, 서브대역 속도 결정 엘리먼트(14)는 인코딩 속도 선택 엘리먼트(16)에 그 제안된 인코딩 속도 RATEH를 제공한다. 전형적인 실시예에 있어서, 인코딩 속도 선택 엘리먼트(16)는 두 개의 제안 속도들 중에서 더 빠른 속도를 선택하며, 상기 더 빠른 속도를 선택된 인코딩 속도로 제공한다.
또한 서브대역 에너지 계산 엘리먼트(4)는 임계 적응 엘리먼트(8)에 저주파 에너지값 RL(O)를 제공하며, 여기서 다음 입력 프레임에 대한 임계값 TL1/2 및 TLfull이 계산된다. 유사하게, 서브대역 에너지 계산 엘리먼트(6)는 임계 적응 엘리먼트(10)에 고주파 에너지값 RH(O)를 제공하며, 여기서 다음 입력 프레임에 대한 임계값 TH1/2 및 THfull이 계산된다.
임계 적응 엘리먼트(8)는 저주파 에너지값 RL(O)를 수신하여 S(n)이 배경 잡음이나 오디오 신호중 어느 것을 포함하고 있는지를 결정한다. 전형적인 실시에 있어서, 임계 적응 엘리먼트(8)가 오디오 신호가 존재하는지를 결정하는 방법은 i번째 프레임에 대한 정규화된 자기상관 함수 NACF(i)를 검사하는 것이며, 상기 NACF(i)는 다음과 같은 방정식에 의해 주어진다 :
여기서 e(n)은 LPC 필터에 의해 입력 신호 S(n)을 필터링함으로써 생긴 포르만트(formant) 잔여 신호이다.
LPC 필터에 의해 신호를 필터링하는 설계 구조는 당해분야에서 공지이며 미합중국 특허출원 제 08/004,484호에 상세하게 설명되어 있다. 입력 신호 S(n)은 포르만트의 상호작용을 제거하기 위하여 LPC 필터에 의해 필터링된다. NACF는 오디오 신호가 존재하는지를 결정하기 위하여 임계값에 대하여 비교된다. NACF가 소정의 임계값보다 더 크면, 입력 프레임은 음성 또는 음악과 같은 오디오 신호의 존재를 나타내는 주기적 특성을 갖는다는 것을 나타낸다. 음성 또는 음악은 부분적으로 주기적이 아니며 낮은 NACF 값을 나타낼 수 있지만, 배경 잡음은 전형적으로 어떤 주기성도 디스플레이하지 않으며 거의 항상 낮은 NACF 값을 나타낸다.
S(n)이 배경 잡음을 포함하는 것으로 결정되면, NACF의 값은 임계값 TH1 이하이며, RL(O) 값은 현재의 배경 잡음 평가 BGNL의 값을 갱신하는데 사용된다. 전형적인 실시예에 있어서, TH1은 0.35이다. RL(O)은 배경 잡음 평가 BGNL의 현재값에 대하여 비교된다. RL(O)이 BGNL 이하이면, 배경 잡음 평가 BGNL은 NACF의 값에 관계없이 RL(O)와 동일하게 설정된다.
배경 잡음 평가 BGNL은 NACF가 임계값 TH1 보다 작은 경우에만 증가된다. RL(O)이 BGNL보다 크고 NACF가 TH1보다 작으면, 배경 잡음 평가 BGNL은 α1 · BGNL로 설정되며, 여기서 α1은 1 보다 큰 수이다. 전형적인 실시예에 있어서, α1은 1.03과 같다. 배경 잡음 평가 BGNL이 BGNmax로 설정되는 소정의 최대값 BGNmax에 이를 때까지, NACF가 임계값 TH1 보다 적고 RL(O)이 현재의 BGNL 값보다 클 동안은 BGNL은 계속해서 증가할 것이다.
제 2 임계값 TH2를 초과하는 NACF의 값으로 나타나는 오디오 신호가 검출되면, 신호 에너지 평가 SL이 갱신된다. 전형적인 실시예에 있어서, TH2는 0.5로 설정된다. RL(O)의 값은 현재의 저대역통과 신호 에너지 평가 SL에 대하여 비교된다. RL(O)이 SL의 현재값보다 크면 SL은 RL(O)와 동일하게 설정된다. RL(O)이 SL의 현재값보다 작으며 NACF가 TH2보다 큰 경우에만, SL은 α2×RL(O)로 설정된다. 전형적인 실시예에서, α2는 0.96으로 설정된다.
임계 적응 엘리먼트(8)는 다음 방정식(8)에 따라서 신호 대 잡음비 평가를 계산한다 :
임계 적응 엘리먼트(8)는 다음 방정식(9)-(12)에 따라서 양자화된 신호 대 잡음비 ISNRL의 인덱스를 결정한다.
여기서 nint는 분수값을 가장 가까운 정수로 표시하는 함수이다.
임계 적응 엘리먼트(8)는 신호 대 잡음비 인덱스 ISNRL에 따라서 두 개의 스케일 인자 kL1/2 및 kLfull을 선택 또는 계산한다. 전형적인 스케일 값 조사표는 표1에 제공되어 있다 :
표 1
이 두 개의 값은 다음 방정식에 따라서 속도 선택을 위한 임계값을 계산하는데 사용된다 :
여기서 TL1/2은 저주파 1/2 속도 임계값이며 TLfull은 저주파 완전속도 임계값이다.
임계 적응 엘리먼트(8)는 속도 결정 엘리먼트(12)에 적응된 임계값 TLfull 및 TL1/2을 제공한다. 임계 적응 엘리먼트(10)는 유사한 방식으로 동작하며 서브 대역 속도 결정 엘리먼트(14)에 임계값 THull 및 TH1/2을 제공한다.
오디오 신호 에너지 평가 S(여기서 S는 SL 또는 SH일수 있음)의 초기값은 다음과 같이 설정된다. 신호 에너지 평가 SINIT는 -18.0 dBmO로 설정되며, 여기서 3.17 dBmO는 완전 사인 파형의 신호 세기를 규정하고, 상기 사인 파형은 전형적인 실시예에서는 -8031 내지 8031까지의 진폭범위를 갖는 디지탈 사인 파형이다. SINIT는 음향 신호가 존재하는 것이 결정될 때 까지 사용된다.
음향 신호가 초기에 검출되는 방법은 임계값에 대하여 NACF값을 비교하는 것이며, NACF가 소정수의 연속 프레임들 동안에 임계값을 초과하면, 음향 신호가 존재하는 것으로 결정된다. 전형적인 실시예에 있어서, NACF는 10 연속 프레임에 대한 임계값을 초과해야만 한다. 이 상태가 충족된 후에 신호 에너지 평가 S는 선행 10 프레임의 최대 신호 에너지로 설정된다.
배경 잡음 평가 BGNL의 초기값은 BGNmax로 설정된다. 서브대역 프레임 에너지가 BGNmax 보다 작은 것을 수신하자마자, 배경 잡음 평가는 수신된 서브대역 에너지 레벨의 값으로 재설정되며, 배경 잡음 평가(BGNL)의 발생은 먼저 전술한 바와같이 진행된다.
바람직한 실시예에 있어서 잔존 상태는 일련의 완전속도 음성 프레임을 뒤따라 저속 프레임이 검출될 때 활성화된다. 전형적인 실시예에 있어서, 인코딩 속도가 완전속도보다 작게 설정되고 계산된 신호 대 잡음비가 소정의 최소 SNR 보다 작은 프레임이 완전속도의 4개의 연속적인 음성 프레임들을 뒤이어 인코딩 될 경우, 상기 프레임에 대한 인코딩 속도는 완전속도로 설정된다. 전형적인 실시예에 있어서 소정의 최소 SNR은 방정식(8)에 규정된 27.5 dB이다.
바람직한 실시예에 있어서, 잔존 프레임의 수는 신호 대 잡음비의 함수이다. 전형적인 실시예에 있어서, 잔존 프레임의 수는 다음과 같이 결정된다 :
본 발명은 음악의 존재를 검출하기 위한 방법을 제공하는 것으로, 상기 음악은 전술한 바와같이 배경 잡음 측정을 재설정하게 하는 일시 정지가 없는 것이다. 음악의 존재를 검출하기 위한 방법은 음악이 콜의 시작에 존재하지 않는 것으로 추정한다. 이것에 의해 본 발명의 인코딩 속도 선택 장치는 초기 배경 잡음 에너지를 적절히 평가한다. 배경 잡음과는 달리 음악은 주기적 특성을 가지기 때문에, 본 발명은 배경 잡음으로부터 음악을 구별하기 위하여 NACF의 값을 검사한다. 본 발명의 음악 검출 방법은 다음 방정식에 따라서 평균 NACF를 계산한다 :
여기서 NACF(i)는 방정식(7)에서 규정되며, T는 배경 잡음의 평가된 값이 초기 배경 잡음 평가 BGNINT로부터 증가되는 연속 프레임 수이다.
배경 잡음 BGN이 소정수의 프레임 T에 대하여 증가되고 NACFAVE가 소정 임계값을 초과하면, 음악이 검출되고 배경 잡음 BGN이 BGNINIT로 재설정된다. 값 T는 인코딩 속도가 완전속도 이하로 떨어지지 않도록 충분히 낮게 설정되어야 한다. 그러므로, T 값은 음향 신호 및 BGNINIT의 함수로서 설정되어야 한다.
바람직한 실시예의 전술한 설명은 당해업자가 본 발명을 사용하는 것을 가능하게 하도록 제공되어 있다. 실시예에 대한 다양한 변형은 당해업자에게 아주 명백할 것이며 여기에 기술된 일반적인 원리들은 발명적 기능을 사용하지 않고 다른 실시예에 적용될 수도 있다. 그러므로, 본 발명은 여기에 도시된 실시예에 한정되는 것은 아니며 여기에 기술된 원리 및 신규한 특징들과 일관되게 가장 광범위한 범위에 적용된다.
발명의 배경

Claims (87)

  1. 가변율 보코더에서 입력 신호에 대한 인코딩 속도를 결정하기 위한 장치로서,
    상기 입력 신호를 수신하고 소정의 서브대역 에너지 계산 포맷에 따라 다수의 서브대역 에너지 값들을 결정하는 서브대역 에너지 계산 수단;
    각각의 서브대역 속도 결정 수단이 상기 다수의 서브대역 에너지 값들 중 대응하는 하나를 수신하여 상기 다수의 서브대역 에너지 값들 중 상기 대응하는 하나에 따라 서브대역 인코딩 속도를 결정하여 다수의 서브대역 인코딩 속도를 제공하는 다수의 서브대역 속도 결정 수단들; 및
    상기 다수의 서브대역 인코딩 속도들을 수신하여 상기 다수의 서브대역 인코딩 속도들에 따라 상기 입력 신호에 대한 상기 인코딩 속도를 선택하는 인코딩 속도 선택 수단을 포함하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  2. 제 1항에 있어서, 상기 서브대역 에너지 계산 수단은 다음 방정식;
    에 따라 상기 다수의 서브대역 에너지 값들을 각각 결정하며, 여기서 L은 저 대역통과 필터 hL(n)의 탭 수, RS(i)는 상기 입력 신호 S(n)의 자기상관 함수, Rhbp은 대역통과 필터 hbp(n)의 자기상관 함수인 인코딩 속도 결정 장치.
  3. 제 1항에 있어서, 상기 서브대역 에너지 계산 수단과 상기 속도 결정 수단 사이에 위치하고 있으며, 상기 서브대역 에너지 값들을 수신하여 상기 다수의 서브대역 에너지 값들에 따라 일 세트의 인코딩 속도 임계값들을 결정하는 임계값 계산 수단을 더 포함하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  4. 제 3항에 있어서, 상기 임계값 계산 수단은 상기 다수의 서브대역 에너지 값들에 따라 신호 대 잡음비 값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  5. 제 4항에 있어서, 상기 임계값 계산 수단은 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  6. 제 5항에 있어서, 상기 임계값 계산 수단은 배경 잡음 평가에 상기 스케일링 값을 곱함으로써 적어도 하나의 임계값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  7. 제 6항에 있어서, 상기 서브대역 속도 결정 수단 각각은 상기 서브대역 인코딩 속도를 결정하기 위하여 상기 상응하는 서브대역 에너지 값을 상기 적어도 하나의 임계값에 비교하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  8. 제 1항에 있어서, 상기 서브대역 속도 결정 수단 각각은 상기 서브대역 인코딩 속도를 결정하기 위하여 상기 상응하는 서브대역 에너지 값을 적어도 하나의 임계값에 비교하는 것을 특징으로 하는 인코딩 속도 결정장치.
  9. 제 1항에 있어서, 상기 속도 선택 수단은 상기 다수의 서브대역 인코딩 속도들 중에서 가장 빠른 속도를 상기 인코딩 속도로 선택하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  10. 가변율 보코더의 인코딩 속도를 결정하기 위한 장치에 있어서,
    입력 신호를 수신하여 상기 입력 신호의 정보 신호 에너지 평가를 발생하며, 상기 입력 신호의 배경잡음 에너지 평가를 발생하여 상기 정보 신호 에너지 평가와 상기 배경잡음 에너지 평가에 따라 신호 대 잡음비를 생성하는 신호 대 잡음비 수단; 및
    상기 신호 대 잡음비 값을 수신하고 상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 속도 결정 수단을 포함하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  11. 가변율 보코더의 인코딩 속도를 결정하기 위한 장치에 있어서,
    입력 신호를 수신하여 상기 입력 신호의 정보 신호 에너지 평가를 발생하며, 상기 입력 신호의 배경잡음 에너지 평가를 발생하여 상기 정보 신호 에너지 평가와 상기 배경잡음 에너지 평가에 상응하게 신호 대 잡음비를 생성하는 신호 대 잡음비 계산기; 및
    상기 신호 대 잡음비 값을 수신하고 상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 선택하는 속도 선택기를 포함하는 것을 특징으로 하는 인코딩 속도 결정 장치.
  12. 가변율 보코더에서 입력 신호에 대한 인코딩 속도를 결정하기 위한 방법에 있어서,
    상기 입력 신호를 수신하는 단계;
    소정의 서브대역 에너지 계산 포맷에 따라 다수의 서브대역 에너지 값들을 결정하는 단계;
    다수의 서브대역 인코딩 속도들을 제공하기 위해 상기 다수의 서브대역 에너지 값들 각각에 대한 상응하는 서브대역 인코딩 속도를 결정하는 단계; 및
    상기 다수의 서브대역 인코딩 속도에 따라 상기 입력 신호에 대한 상기 인코딩 속도를 선택하는 단계를 포함하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  13. 제 12항에 있어서, 다수의 서브대역 에너지 값들을 결정하는 상기 단계는 다음 방정식
    에 따라 실행되며, 여기서 L은 저대역통과 필터 hL(n)의 탭 수, RS(i)는 입력 신호 S(n)의 자기상과 함수, Rhbp은 대역통과 필터 hbp(n)의 자기상관 함수인 인코딩 속도 결정 방법.
  14. 제 12항에 있어서, 상기 다수의 서브대역 에너지 값들에 따라 일 세트의 인코딩 속도 임계값들을 결정하는 단계를 더 포함하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  15. 제 14항에 있어서, 일 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 다수의 서브대역 에너지 값들에 따라 신호 대 잡음비 값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  16. 제 15항에 있어서, 일 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  17. 제 16항에 있어서, 일 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 배경 잡음 평가에 상기 스케일링 값을 곱함으로써 상기 속도 임계값을 결정하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  18. 제 17항에 있어서, 상기 상응하는 서브대역 인코딩 속도를 결정하는 상기 단계는 상기 상응하는 서브대역 인코딩 속도를 결정하기 위해 상기 상응하는 서브대역 에너지 값을 상기 적어도 하나의 임계값에 비교하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  19. 제 12항에 있어서, 상기 상응하는 서브대역 인코딩 속도를 결정하는 상기 단계는 상기 상응하는 서브대역 인코딩 속도를 결정하기 위해 상기 상응하는 서브대역 에너지 값을 적어도 하나의 임계값에 비교하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  20. 제 12항에 있어서, 인코딩 속도를 선택하는 상기 단계는 상기 다수의 서브대역 인코딩 속도들 중 최고로 빠른 속도를 상기 인코딩 속도로 선택하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  21. 가변율 보코더의 인코딩 속도를 결정하기 위한 방법에 있어서,
    입력 신호를 수신하는 단계;
    상기 입력 신호의 정보 신호 에너지의 평가를 발생하는 단계;
    상기 입력 신호의 배경 잡음 에너지의 평가를 발생하는 단계;
    정보 신호의 에너지의 상기 평가와 배경 잡음 에너지의 상기 평가에 따라 신호 대 잡음비를 계산하는 단계; 및
    상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 단계를 포함하는 것을 특징으로 하는 인코딩 속도 결정 방법.
  22. 가변율 보코더에서 음악이 존재하는지를 결정하는 방법에 있어서,
    입력 신호 프레임을 수신하는 단계;
    상기 프레임에 대한 선형 예측 코딩(LPC) 계수들을 발생하는 단계;
    상기 LPC 계수들과 상기 프레임에 따라 정규화된 자기상관 값을 발생하는 단계;
    상기 프레임에 대한 배경 잡음 평가를 발생하는 단계;
    상기 배경 잡음 평가가 소정의 초기 배경 잡음 평가로부터 증가하는 상기 연속 프레임들에 대한 평균 정규 자기상관 값을 발생하는 단계; 및
    상기의 평균 정규 자기상관 값과 소정의 임계값에 따라 음악의 존재를 결정하는 단계를 포함하는 것을 특징으로 하는 음악 존재 여부 결정 방법
  23. 가변율 보코더에서 인코딩 속도를 결정하는 장치로서
    입력 신호(S(n))를 수신하여 수신된 입력신호(S(n))에 따라 신호 대 잡음비 값을 결정하는 신호 대 잡음비 수단(8,10); 및
    상기 신호 대 잡음비 값을 수신하여 상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 속도 결정 수단을 포함하는 인코딩 속도 결정장치.
  24. 제23항에 있어서,
    상기 입력 신호(S(n))을 수신하고 소정의 서브대역 에너지 계산 포맷에 따라 복수의 서브대역 에너지 값들(RL(O),RH(O))을 결정하는 서브대역 에너지 계산 수단을 추가로 포함하는 인코딩 속도 결정 장치.
  25. 제24항에 있어서,
    상기 속도 결정 수단은 상기 복수의 서브대역 에너지 값들(RL(O),RH(O))을 수신하고 복수의 제안된 서브대역 인코딩 속도들을 결정하는 서브대역 속도 결정 엘리먼트(12,14)들을 포함하는 인코딩 속도 결정 장치.
  26. 제25항에 있어서,
    상기 복수의 제안된 서브대역 인코딩 속도들을 수신하여 상기 복수의 제안된 서브대역 인코딩 속도들에 따라 상기 인코딩 속도를 결정하는 인코딩 속도 선택 엘리먼트(16)를 추가로 포함하는 인코딩 속도 결정 장치.
  27. 제24항에 있어서,
    상기 서브대역 에너지 계산 수단(4,6)은 다음 방정식;
    에 따라 상기 다수의 서브대역 에너지 값들(RL(O),RH(O))을 각각 결정하며, 여기서 L은 대역통과 필터 hbp(n)의 탭 수, RS(i)는 상기 입력 신호 S(n)의 자기 상관 함수, Rhbp은 대역통과 필터 hbp(n)의 자기상관 함수인 인코딩 속도 결정 장치.
  28. 제23항에 있어서,
    상기 신호 대 잡음비 수단(8,10)은 임계값 계산 수단(8,10)을 추가로 포함하는 인코딩 속도 결정 장치.
  29. 제25항 또는 제28항에 있어서,
    상기 임계값 계산 수단(8,10)은 상기 서브대역 에너지 계산 수단(4,6) 및 상기 서브대역 속도 결정 엘리먼트 사이에 배치되어 상기 서브대역 에너지 값들(RL(O),RH(O))을 수신하여 상기 복수의 서브대역 에너지값들(RL(O),RH(O))에 따라 한 세트의 인코딩 속도 임계값들을 결정하는 인코딩 속도 결정 장치.
  30. 제24항 또는 제28항에 있어서,
    상기 임계값 계산 수단(8,10)은 상기 복수의 서브대역 에너지 값들(RL(O),RH(O))에 따라 상기 신호 대 잡음비 값을 결정하는 인코딩 속도 결정장치.
  31. 제28항에 있어서,
    상기 임계값 계산 수단(8,10)은 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 인코딩 속도 결정 장치.
  32. 제31항에 있어서,
    상기 임계값 계산 수단(8,10)은 배경 잡음 평가치에 상기 스케일링 값을 곱함으로써 적어도 하나의 임계값 값을 결정하는 인코딩 속도 결정 장치.
  33. 제25항에 있어서,
    상기 서브대역 속도 결정 엘리먼트(12,14)는 상기 제안된 인코딩 속도를 결정하기 위해서 상기 복수의 서브대역 에너지 값들(RL(O),RH(O)) 중 적어도 하나를 적어도 하나의 임계값 값과 비교하는 인코딩 속도 결정 장치.
  34. 제32항에 있어서,
    상기 속도 결정 수단은 상기 인코딩 속도를 결정하기 위해서 상기 복수의 서브대역 에너지 값들(RL(O),RH(O)) 중 적어도 하나를 상기 적어도 하나의 임계값 값과 비교하는 인코딩 속도 결정 장치.
  35. 제24항에 있어서,
    상기 속도 결정 수단은 복수의 제안된 인코딩 속도들을 결정하며, 여기서 각각의 제안된 인코딩 속도는 상기 복수의 서브대역 에너지 값들(RL(O),RH(O)) 각각에 대응하며, 상기 속도 결정 수단은 상기 복수의 제안된 인코딩 속도들에 따라 상기 인코딩 속도를 결정하는 인코딩 속도 결정 장치.
  36. 제23항에 있어서,
    상기 신호 대 잡음비 수단은 상기 입력 신호를 수신하고 상기 입력 신호에 따라 신호 대 잡음비 값을 결정하는 신호 대 잡음비 계산기를 포함하며, 상기 속도 결정 수단은 상기 신호 대 잡음비 값을 수신하고 상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 선택하는 속도 선택기를 포함하는 인코딩 속도 결정 장치.
  37. 제23항에 있어서,
    입력 신호(S(n))의 각 주파수 서브대역에 대해 신호 에너지를 결정하는 서브대역 필터 서브시스템(4,6)을 추가로 포함하며, 상기 속도 결정 수단은 입력 신호(S(n))의 각각의 주파수 서브대역의 신호 에너지들에 기반하여 입력 신호의 인코딩 속도를 선택하는 속도 선택 서브시스템을 포함하는 인코딩 속도 결정 장치.
  38. 제37항에 있어서,
    상기 서브대역 필터 서브시스템은 복수의 서브대역 에너지 계산 엘리먼트(4,6)를 포함하며, 복수의 서브대역 에너지 계산 엘리먼트들 각각은 주파수 서브대역 신호 에너지를 결정하는 인코딩 속도 결정 장치.
  39. 제38항에 있어서,
    상기 신호 대 잡음비 수단은 복수의 임계값 적응 엘리먼트(8,10)들을 포함하며, 복수의 임계값 적응 엘리먼트(8,10)들 각각은 대응하는 서브대역 에너지 계산 엘리먼트(4,6)로부터의 주파수 서브대역 신호 에너지를 사용하여 오디오 신호가 주파수 서브대역에 존재하는지 여부를 결정하는 인코딩 속도 결정 장치.
  40. 제39항에 있어서,
    각각의 임계값 적응 엘리먼트(8,10)는 대응하는 주파수 서브대역의 신호 에너지 및 잡음 평가치에 기반하여 임계값을 결정하도록 구성되며, 상기 임계값은 오디오 신호가 주파수 서브대역에 존재하는지 여부를 결정하는데 사용되는 인코딩 속도 결정 장치.
  41. 제38항에 있어서,
    상기 복수의 임계값 적응 엘리먼트(8,10)들은 입력 신호 주파수 서브 대역들의 조합된 신호 에너지들에 기반하여 임계값을 결정하도록 구성되며, 상기 임계값은 오디오 신호가 주파수 서브대역에서 존재하는지 여부를 결정하기 위해서 사용되는 인코딩 속도 결정 장치.
  42. 가변율 보코더에서 인코딩 속도를 결정하는 방법으로서,
    입력 신호(S(n))를 수신하는 단계;
    상기 입력 신호(S(n))에 따라 신호 대 잡음비 값을 결정하는 단계; 및
    상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 단계를 포함하는 인코딩 속도 결정 방법.
  43. 제42항에 있어서,
    소정의 서브대역 에너지 계산 포맷에 따라 복수의 서브대역 에너지 값들을 결정하는 단계를 추가로 포함하는 인코딩 속도 결정 방법.
  44. 제43항에 있어서,
    상기 복수의 서브대역 에너지 값들에 따라 복수의 제안된 서브대역 인코딩 속도들을 결정하는 단계를 추가로 포함하는 인코딩 속도 결정 방법.
  45. 제43항 또는 제44항에 있어서,
    상기 복수의 서브대역 에너지 값들을 결정하는 단계는 다음 방정식;
    에 따라 수행되며, 여기서 L은 대역통과 필터 hbp(n)의 탭 수, RS(i)는 상기 입력 신호 S(n)의 자기상관 함수, Rhbp은 대역통과 필터 hbp(n)의 자기상관 함수인 인코딩 속도 결정 방법.
  46. 제44항에 있어서,
    상기 복수의 서브대역 에너지 값들에 따라 한 세트의 인코딩 속도 임계값들을 결정하는 단계를 추가로 포함하는 인코딩 속도 결정 방법.
  47. 제46항에 있어서,
    한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 복수의 서브대역 에너지 값들에 따라 상기 신호 대 잡음비 값을 결정하는 인코딩 속도 결정 방법.
  48. 제47항에 있어서,
    상기 한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 인코딩 속도 결정 방법.
  49. 제48항에 있어서,
    상기 한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 배경 잡음 평가치에 상기 스케일링 값을 곱함으로써 상기 임계값을 결정하는 인코딩 속도 결정 방법.
  50. 제44항에 있어서,
    상기 인코딩 속도를 결정하는 상기 단계는 상기 인코딩 속도를 결정하기 위해서 상기 복수의 서브대역 에너지 값들 중 적어도 하나를 적어도 하나의 임계값과 비교하는 인코딩 속도 결정 방법.
  51. 제46항 또는 제49항에 있어서,
    상기 복수의 제안된 서브대역 인코딩 속도들을 결정하는 상기 단계는 상기 복수의 제안된 서브대역 인코딩 속도들을 결정하기 위해서 상기 복수의 서브대역 에너지 값들 중 적어도 하나와 상기 적어도 하나의 임계값을 비교하는 인코딩 속도 결정 방법.
  52. 제44항에 있어서,
    상기 복수의 서브대역 에너지 값들 각각에 따라 제안된 인코딩 속도를 발생시키는 단계를 추가로 포함하며, 상기 인코딩 속도 결정 단계는 상기 제안된 인코딩 속도들 중에서 하나를 선택하는 인코딩 속도 결정 방법.
  53. 입력 신호(S(n))에 대한 인코딩 속도를 선택하는 장치로서,
    입력 신호(S(n))의 각 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하는 오디오 신호 탐지 장치; 및
    입력 신호(S(n))의 각 주파수 서브대역에서 오디오 신호가 존재하는지 여부에 대한 상기 결정에 따라 입력 신호(S(n))의 인코딩 속도를 선택하는 인코딩 속도 선택 장치를 포함하는 인코딩 속도 선택 장치.
  54. 제53항에 있어서, 상기 오디오 신호 탐지 장치는
    입력 신호(S(n))의 각 주파수 서브대역에 대해 신호 에너지를 결정하는 복수의 서브대역 에너지 계산 엘리먼트들(4,6); 및
    상기 복수의 서브대역 에너지 계산 엘리먼트들(4,6)에 각각 통신적으로 연결되는 복수의 임계값 적응 엘리먼트들을 포함하며, 각각의 임계값 적응 엘리먼트들은 할당된 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하기 위해 할당된 주파수 서브대역의 신호 에너지를 이용하는 인코딩 속도 선택 장치.
  55. 제54항에 있어서,
    상기 인코딩 속도 선택 장치는 상기 복수의 임계값 적응 엘리먼트들 각각에 의해 이뤄진 결정들에 기반하여 입력 신호(S(n))의 인코딩 속도를 선택하도록 구성되는 인코딩 속도 선택 장치.
  56. 제55항에 있어서,
    상기 복수의 임계값 적응 엘리먼트들 각각은 할당된 주파수 서브대역의 신호 에너지 및 배경 잡음 평가치에 기반하여 임계값을 결정하고, 여기서 임계값은 할당된 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하는데 사용되는 인코딩 속도 선택 장치.
  57. 제54항에 있어서,
    각각의 임계값 적응 엘리먼트는 다음식
    에 의해 주어지는 정규화 자기상관 함수를 검사함으로써 오디오 신호가 존재하는지 여부를 결정하며, 여기서 e(n)은 LPC 필터에 의해 입력 신호(S(n))를 필터링함으로써 발생되는 포르만트 잔류 신호인 인코딩 속도 선택 장치.
  58. 제53항에 있어서,
    상기 오디오 신호 탐지 장치는 입력 신호(S(n))의 각 주파수 서브대역에 대한 신호 에너지를 결정하는 서브대역 필터 서브시스템(4,6)을 포함하며, 인코딩 속도 선택 장치는 입력 신호(S(n))의 각 주파수 서브대역의 신호 에너지들에 기반하여 입력 신호(S(n))의 인코딩 속도를 선택하는 속도 선택 서브시스템을 포함하는 인코딩 속도 선택 장치.
  59. 제53항에 있어서,
    상기 인코딩 속도가 가변율 보코더에 대해 결정되며, 오디오 신호 탐지 장치는 상기 입력 신호(S(n))를 수신하여 소정 서브대역 에너지 계산 포맷에 따라 복수의 서브대역 에너지 값들(RL(O),RH(O))을 결정하는 서브대역 에너지 계산 수단(4,6)을 포함하는 인코딩 속도 선택 장치.
  60. 제59항에 있어서,
    상기 인코딩 속도 선택 장치는 상기 복수의 서브대역 에너지 값들(RL(O),RH(O))을 수신하여 복수의 제안된 서브대역 인코딩 속도들을 결정하는 서브대역 속도 결정 엘리먼트(12,14)를 포함하는 인코딩 속도 선택 장치.
  61. 제60항에 있어서,
    상기 인코딩 속도 선택 장치는 상기 복수의 제안된 서브대역 인코딩 속도들을 수신하여 상기 복수의 제안된 서브대역 인코딩 속도들에 따라 상기 인코딩 속도를 결정하는 인코딩 속도 선택 엘리먼트(16)를 추가로 포함하는 인코딩 속도 선택 장치.
  62. 제59항에 있어서,
    상기 서브대역 에너지 계산 수단(4,6)은 다음식
    에 따라 상기 복수의 서브대역 에너지 값들(RL(O),RH(O)) 각각을 결정하고, 여기서 L은 대역통과 필터 hbp(n)의 탭 수, RS(i)는 상기 입력 신호 S(n)의 자기상관 함수, Rhbp은 대역통과 필터 hbp(n)의 자기상관 함수인 인코딩 속도 선택 장치.
  63. 제53항에 있어서,
    상기 인코딩 속도는 가변율 보코더에 대해 결정되며, 상기 장치는 상기 입력 신호(S(n))을 수신하고 상기 입력 신호(S(n))에 따라 신호 대 잡음 비 값을 결정하는 신호 대 잡음비 수단(8,10)을 추가로 포함하며,
    여기서 상기 인코딩 선택 장치는 상기 신호 대 잡음비 값을 수신하고, 상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 속도 결정 수단을 포함하는 인코딩 속도 선택 장치.
  64. 제60항에 있어서,
    상기 장치는 상기 서브대역 에너지 계산 수단(4,6) 및 상기 서브대역 속도 결정 엘리먼트들 사이에 배치되어 상기 서브대역 에너지 값들(RL(O),RH(O))을 수신하고 상기 복수의 서브대역 에너지 값들(RL(O),RH(O))에 따라 한 세트의 인코딩 속도 임계값들을 결정하는 임계값 계산 수단을 추가로 포함하는 인코딩 속도 선택 장치.
  65. 제63항 또는 제64항에 있어서,
    상기 임계값 계산 수단(8,10)은 상기 복수의 서브대역 에너지 값들(RL(O),RH(O))에 따라 상기 신호 대 잡음비 값을 결정하는 인코딩 속도 선택장치.
  66. 제65항에 있어서,
    상기 임계값 계산 수단(8,10)은 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 인코딩 속도 선택 장치.
  67. 제66항에 있어서,
    상기 임계값 계산 수단(8,10)은 배경 잡음 평가치를 상기 스케일링 값과 곱함으로써 적어도 하나의 임계값을 결정하는 인코딩 속도 선택 장치.
  68. 제67항에 있어서,
    상기 인코딩 속도 선택 장치는 상기 복수의 서브대역 에너지 값들(RL(O),RH(O)) 중 적어도 하나를 상기 적어도 하나의 임계값과 비교하여 상기 인코딩 속도를 결정하는 인코딩 속도 선택 장치.
  69. 제59항에 있어서,
    상기 인코딩 속도 선택 장치는 복수의 제안된 인코딩 속도들을 결정하고, 여기서 제안된 인코딩 속도 각각은 상기 복수의 서브대역 에너지값들(RL(O),RH(O)) 각각에 상응하고, 상기 인코딩 속도 선택 장치는 상기 복수의 제안된 인코딩 속도들에 따라 상기 인코딩 속도를 결정하는 인코딩 속도 선택 장치.
  70. 입력 신호(S(n))에 대한 인코딩 속도를 선택하는 방법으로서,
    상기 입력 신호(S(n))을 수신하는 단계;
    입력 신호의 각 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하는 단계; 및
    입력 신호(S(n))의 각 주파수 서브대역에서 오디오 신호가 존재하는지 여부에 대한 결정에 따라 상기 입력 신호(S(n))에 대한 상기 인코딩 속도를 선택하는 단계를 포함하는 인코딩 속도 선택 방법.
  71. 제70항에 있어서,
    오디오 신호가 존재하는지 여부를 결정하는 상기 단계는
    입력 신호(S(n))의 각 주파수 서브대역에 대해 신호 에너지를 결정하는 단계; 및
    할당된 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하기 위해 복수의 임계값 적응 엘리먼트들 중 대응하는 하나에서 할당된 주파수 서브대역의 신호 에너지를 사용하는 단계를 추가로 포함하는 인코딩 속도 선택 방법.
  72. 제71항에 있어서,
    인코딩 속도를 선택하는 상기 단계는 복수의 임계값 적응 엘리먼트들 각각에 의해 이뤄진 결정들에 기반하여 입력 신호(S(n))의 인코딩 속도를 선택하는 것을 포함하는 인코딩 속도 선택 방법.
  73. 제71항 또는 제72항에 있어서, 신호 에너지를 사용하는 상기 단계는
    할당된 주파수 서브대역의 신호 에너지 및 배경잡음 평가치에 기반하여 복수의 임계값 적응 엘리먼트들 각각에서 임계값을 결정하는 단계; 및
    할당된 주파수 서브대역에서 오디오 신호가 존재하는지 여부를 결정하기 위해 상기 임계값을 사용하는 단계를 추가로 포함하는 인코딩 속도 선택 방법.
  74. 제73항에 있어서,
    임계값을 사용하는 상기 단계는 다음식
    에 의해 주어지는 정규화 자기상관 함수를 검사함으로써 오디오 신호가 존재하는지 여부를 각각의 임계값 적응 엘리먼트에서 결정하는 것을 포함하며, 여기서 e(n)은 LPC 필터에 의해 입력 신호(S(n))를 필터링함으로써 발생되는 포르만트 잔류 신호인 인코딩 속도 선택 방법.
  75. 제70항에 있어서,
    오디오 신호가 존재하는지 여부를 결정하는 상기 단계는 서브대역 필터 서브시스템(4,6)을 사용하여 입력 신호(S(n))의 각 주파수 서브대역에 대한 신호 에너지를 결정하는 것을 포함하며,
    인코딩 속도를 선택하는 상기 단계는 속도 선택 서브시스템에서 입력 신호(S(n))의 각 주파수 서브밴드의 신호 에너지들에 기반하여 입력 신호 S(n))의 인코딩 속도를 선택하는 것을 포함하는 인코딩 속도 선택 방법.
  76. 제70항에 있어서,
    오디오 신호가 존재하는지 여부를 결정하는 상기 단계는
    서브대역 에너지 계산 수단(4,6)에서 상기 입력 신호(S(n))를 수신하는 단계; 및
    소정 서브대역 에너지 계산 포맷에 따라 복수의 서브대역 에너지값들(RL(O),RH(O))을 결정하는 단계를 추가로 포함하며,
    상기 입력 신호(S(n))에 대한 상기 인코딩 속도 선택 단계는
    상기 복수의 서브대역 에너지값들에 따라 상기 인코딩 속도를 결정하는 단계를 포함하는 인코딩 속도 선택 방법.
  77. 제76항에 있어서,
    인코딩 속도를 선택하는 상기 단계는
    서브대역 속도 결정 엘리먼트(12,14)에서 상기 복수의 서브대역 에너지값들(RL(O),RH(O))을 수신하고,
    복수의 제안된 서브대역 에너지 속도들을 결정하는 것을 포함하는 인코딩 속도 선택 방법.
  78. 제77항에 있어서,
    인코딩 속도를 선택하는 상기 단계는
    인코딩 속도 선택 엘리먼트(16)에서 상기 복수의 제안된 서브대역 인코딩 속도들을 수신하는 단계; 및
    상기 복수의 제안된 서브대역 인코딩 속도들에 따라 상기 인코딩 속도를 결정하는 단계를 추가로 포함하는 인코딩 속도 선택 방법.
  79. 제76항에 있어서,
    복수의 서브대역 에너지값들을 결정하는 상기 단계는 다음식
    에 따라 수행되며, 여기서 L은 대역통과 필터 hbp(n)의 탭 수, RS(i)는 상기 입력 신호 S(n)의 자기상관 함수, Rhbp은 대역통과 필터 hbp(n)의 자기 상관 함수인 인코딩 속도 선택 방법.
  80. 제76항에 있어서,
    상기 복수의 서브대역 에너지값들에 따라 한 세트의 인코딩 속도 임계값들을 결정하는 단계를 추가로 포함하는 인코딩 속도 선택 방법.
  81. 제80항에 있어서,
    한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 복수의 서브대역 에너지값들에 따라 신호 대 잡음비 값을 결정하는 인코딩 속도 선택 방법.
  82. 제81항에 있어서,
    한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 상기 신호 대 잡음비 값에 따라 스케일링 값을 결정하는 인코딩 속도 선택 방법.
  83. 제82항에 있어서,
    한 세트의 인코딩 속도 임계값들을 결정하는 상기 단계는 배경 잡음 평가치에 상기 스케일링 값을 곱함으로써 상기 임계값을 결정하는 인코딩 속도 선택 방법.
  84. 제76항에 있어서,
    인코딩 속도를 결정하는 상기 단계는 상기 인코딩 속도를 결정하기 위해 상기 복수의 서브대역 에너지값들 중 적어도 하나를 적어도 하나의 임계값과 비교하는 인코딩 속도 선택 방법.
  85. 제83항에 있어서,
    인코딩 속도를 결정하는 상기 단계는 상기 인코딩 속도를 결정하기 위해 상기 복수의 서브대역 에너지값들 중 적어도 하나를 상기 적어도 하나의 임계값과 비교하는 인코딩 속도 선택 방법.
  86. 제76항에 있어서,
    상기 복수의 서브대역 에너지값들 각각에 따라 제안된 인코딩 속도를 발생시키는 단계를 추가로 포함하며, 인코딩 속도를 결정하는 상기 단계는 상기 제안된 인코딩 속도들 중에서 하나를 선택하는 인코딩 속도 선택 방법.
  87. 제70항에 있어서,
    신호 대 잡음비 수단(8,10)에서 상기 입력 신호(S(n))를 수신하고 상기 입력 신호(S(n))에 따라 신호 대 잡음비 값을 결정하는 단계를 추가로 포함하고,
    상기 입력 신호(S(n))에 대하여 상기 인코딩 속도를 선택하는 상기 단계는
    속도 결정 수단에서 신호 대 잡음비 값을 수신하는 단계; 및
    상기 신호 대 잡음비 값에 따라 상기 인코딩 속도를 결정하는 단계를 추가로 포함하는 인코딩 속도 선택 방법.
KR1019960701839A 1994-08-10 1995-08-01 가변율보코더의인코딩속도를선택하기위한방법및장치 KR100455826B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US288413 1994-08-10
US08/288,413 US5742734A (en) 1994-08-10 1994-08-10 Encoding rate selection in a variable rate vocoder
US288,413 1994-08-10
PCT/US1995/009830 WO1996005592A1 (en) 1994-08-10 1995-08-01 Method and apparatus for selecting an encoding rate in a variable rate vocoder

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR10-2003-7005883A Division KR20040004420A (ko) 1994-08-10 1995-08-01 가변율 보코더의 인코딩 속도를 선택하기 위한 방법 및 장치
KR10-2003-7005884A Division KR100455225B1 (ko) 1994-08-10 1995-08-01 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR960705305A KR960705305A (ko) 1996-10-09
KR100455826B1 true KR100455826B1 (ko) 2005-04-06

Family

ID=23106989

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1019960701839A KR100455826B1 (ko) 1994-08-10 1995-08-01 가변율보코더의인코딩속도를선택하기위한방법및장치
KR10-2003-7005883A KR20040004420A (ko) 1994-08-10 1995-08-01 가변율 보코더의 인코딩 속도를 선택하기 위한 방법 및 장치
KR10-2003-7005884A KR100455225B1 (ko) 1994-08-10 1995-08-01 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR10-2003-7005883A KR20040004420A (ko) 1994-08-10 1995-08-01 가변율 보코더의 인코딩 속도를 선택하기 위한 방법 및 장치
KR10-2003-7005884A KR100455225B1 (ko) 1994-08-10 1995-08-01 보코더에 의해 인코드되는 다수의 프레임들에 잔존 프레임들을 추가하는 방법 및 장치

Country Status (20)

Country Link
US (1) US5742734A (ko)
EP (6) EP1703493B1 (ko)
JP (8) JP3502101B2 (ko)
KR (3) KR100455826B1 (ko)
CN (5) CN1512488A (ko)
AT (5) ATE235734T1 (ko)
AU (1) AU711401B2 (ko)
BR (2) BR9510780B1 (ko)
CA (3) CA2171009C (ko)
DE (5) DE69533881T2 (ko)
DK (3) DK1233408T3 (ko)
ES (5) ES2299122T3 (ko)
FI (5) FI117993B (ko)
HK (2) HK1015185A1 (ko)
IL (1) IL114874A (ko)
MX (1) MX9600920A (ko)
PT (3) PT1239465E (ko)
TW (1) TW277189B (ko)
WO (1) WO1996005592A1 (ko)
ZA (1) ZA956081B (ko)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389010B1 (en) 1995-10-05 2002-05-14 Intermec Ip Corp. Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones
US7924783B1 (en) 1994-05-06 2011-04-12 Broadcom Corporation Hierarchical communications system
TW271524B (ko) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6292476B1 (en) * 1997-04-16 2001-09-18 Qualcomm Inc. Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
JPH09162837A (ja) * 1995-11-22 1997-06-20 Internatl Business Mach Corp <Ibm> 圧縮方式を動的に変更する通信方法及び装置
JPH09185397A (ja) * 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
JPH10210139A (ja) * 1997-01-20 1998-08-07 Sony Corp 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
DE19742944B4 (de) * 1997-09-29 2008-03-27 Infineon Technologies Ag Verfahren zum Aufzeichnen eines digitalisierten Audiosignals
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6463407B2 (en) * 1998-11-13 2002-10-08 Qualcomm Inc. Low bit-rate coding of unvoiced segments of speech
US6393074B1 (en) 1998-12-31 2002-05-21 Texas Instruments Incorporated Decoding system for variable-rate convolutionally-coded data sequence
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US7330902B1 (en) * 1999-05-10 2008-02-12 Nokia Corporation Header compression
US7127390B1 (en) 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
US6745012B1 (en) * 2000-11-17 2004-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive data compression in a wireless telecommunications system
US7120134B2 (en) 2001-02-15 2006-10-10 Qualcomm, Incorporated Reverse link channel architecture for a wireless communication system
CN1288625C (zh) * 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
US7657427B2 (en) 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US7602722B2 (en) * 2002-12-04 2009-10-13 Nortel Networks Limited Mobile assisted fast scheduling for the reverse link
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
CN1295678C (zh) * 2004-05-18 2007-01-17 中国科学院声学研究所 子带自适应谷点降噪***和方法
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
KR100757858B1 (ko) * 2005-09-30 2007-09-11 와이더댄 주식회사 선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의동작 방법
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
CN101213589B (zh) * 2006-01-12 2011-04-27 松下电器产业株式会社 对象声音分析装置和对象声音分析方法
EP1984911A4 (en) * 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR SIGNAL CODING AND DECODING
CN101379548B (zh) 2006-02-10 2012-07-04 艾利森电话股份有限公司 语音检测器和用于其中抑制子频带的方法
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
CN100483509C (zh) * 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
CN101217037B (zh) * 2007-01-05 2011-09-14 华为技术有限公司 对音频信号的编码速率进行源控的方法和***
JPWO2009038170A1 (ja) * 2007-09-21 2011-01-06 日本電気株式会社 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム
WO2009038115A1 (ja) * 2007-09-21 2009-03-26 Nec Corporation 音声符号化装置、音声符号化方法及びプログラム
US20090099851A1 (en) * 2007-10-11 2009-04-16 Broadcom Corporation Adaptive bit pool allocation in sub-band coding
US8554550B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN102396024A (zh) * 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
CN104485118A (zh) 2009-10-19 2015-04-01 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
US9047878B2 (en) * 2010-11-24 2015-06-02 JVC Kenwood Corporation Speech determination apparatus and speech determination method
CN102985969B (zh) * 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
US8990074B2 (en) * 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
CN110265059B (zh) 2013-12-19 2023-03-31 瑞典爱立信有限公司 估计音频信号中的背景噪声
US9564136B2 (en) 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
ES2754706T3 (es) * 2014-03-24 2020-04-20 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
ES2838006T3 (es) * 2014-07-28 2021-07-01 Nippon Telegraph & Telephone Codificación de señal de sonido
RU2713852C2 (ru) * 2014-07-29 2020-02-07 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
KR101619293B1 (ko) 2014-11-12 2016-05-11 현대오트론 주식회사 전원 반도체의 제어 방법 및 제어 장치
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
EP3751567B1 (en) 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
CN110992963B (zh) * 2019-12-10 2023-09-29 腾讯科技(深圳)有限公司 网络通话方法、装置、计算机设备及存储介质
WO2021253235A1 (zh) * 2020-06-16 2021-12-23 华为技术有限公司 语音活动检测方法和装置
CN113611325B (zh) * 2021-04-26 2023-07-04 珠海市杰理科技股份有限公司 基于清浊音实现的语音信号变速方法、装置和音频设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0167364A1 (en) * 1984-07-06 1986-01-08 AT&T Corp. Speech-silence detection with subband coding
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ko) * 1973-06-15 1975-02-25
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ko) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
DE3412430A1 (de) * 1984-04-03 1985-10-03 Nixdorf Computer Ag, 4790 Paderborn Schalteranordnung
FR2577084B1 (fr) * 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
JPS6491200A (en) * 1987-10-02 1989-04-10 Fujitsu Ltd Voice analysis system and voice synthesization system
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4897832A (en) 1988-01-18 1990-01-30 Oki Electric Industry Co., Ltd. Digital speech interpolation system and speech detector
DE3883519T2 (de) * 1988-03-08 1994-03-17 Ibm Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
EP0331857B1 (en) * 1988-03-08 1992-05-20 International Business Machines Corporation Improved low bit rate voice coding method and system
CA1335003C (en) * 1988-03-11 1995-03-28 Daniel Kenneth Freeman Voice activity detection
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
CA1321645C (en) * 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
EP0392126B1 (en) * 1989-04-11 1994-07-20 International Business Machines Corporation Fast pitch tracking process for LTP-based speech coders
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
JP3004664B2 (ja) * 1989-12-21 2000-01-31 株式会社東芝 可変レート符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
JPH04100099A (ja) * 1990-08-20 1992-04-02 Nippon Telegr & Teleph Corp <Ntt> 音声検出装置
JPH04157817A (ja) * 1990-10-20 1992-05-29 Fujitsu Ltd 可変レート符号化装置
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
ATE294441T1 (de) * 1991-06-11 2005-05-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
JP2705377B2 (ja) * 1991-07-31 1998-01-28 松下電器産業株式会社 帯域分割符号化方法
EP0525774B1 (en) * 1991-07-31 1997-02-26 Matsushita Electric Industrial Co., Ltd. Digital audio signal coding system and method therefor
US5410632A (en) 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
JP3088838B2 (ja) * 1992-04-09 2000-09-18 シャープ株式会社 音楽検出回路及び該回路を用いた音声信号入力装置
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5644596A (en) 1994-02-01 1997-07-01 Qualcomm Incorporated Method and apparatus for frequency selective adaptive filtering
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6134215A (en) 1996-04-02 2000-10-17 Qualcomm Incorpoated Using orthogonal waveforms to enable multiple transmitters to share a single CDM channel

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0167364A1 (en) * 1984-07-06 1986-01-08 AT&T Corp. Speech-silence detection with subband coding
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus

Also Published As

Publication number Publication date
US5742734A (en) 1998-04-21
CN1131473A (zh) 1996-09-18
EP1424686A3 (en) 2006-03-22
ATE235734T1 (de) 2003-04-15
HK1015185A1 (en) 1999-10-08
DE69535452T2 (de) 2007-12-13
DE69530066D1 (de) 2003-04-30
FI122272B (fi) 2011-11-15
ATE285620T1 (de) 2005-01-15
ES2233739T3 (es) 2005-06-16
ATE298124T1 (de) 2005-07-15
CA2488918C (en) 2011-02-01
ES2281854T3 (es) 2007-10-01
JP4680958B2 (ja) 2011-05-11
EP1239465B2 (en) 2010-02-17
JP2007293355A (ja) 2007-11-08
JP2011209733A (ja) 2011-10-20
FI961112A (fi) 1996-04-12
JP4680956B2 (ja) 2011-05-11
EP1530201B1 (en) 2007-04-04
ES2299122T3 (es) 2008-05-16
JP2007304605A (ja) 2007-11-22
IL114874A0 (en) 1995-12-08
EP1703493A3 (en) 2007-02-14
ES2240602T3 (es) 2005-10-16
BR9506036A (pt) 1997-10-07
DK1239465T3 (da) 2005-08-29
EP1233408B1 (en) 2004-12-22
IL114874A (en) 1999-03-12
WO1996005592A1 (en) 1996-02-22
KR20040004420A (ko) 2004-01-13
EP1239465A3 (en) 2002-09-18
JP4870846B2 (ja) 2012-02-08
CN1512488A (zh) 2004-07-14
EP0728350B1 (en) 2003-03-26
CA2171009A1 (en) 1996-02-22
CA2488921C (en) 2010-09-14
JP2007304604A (ja) 2007-11-22
FI117993B (fi) 2007-05-15
JP3502101B2 (ja) 2004-03-02
JP4680957B2 (ja) 2011-05-11
HK1077911A1 (en) 2006-02-24
PT728350E (pt) 2003-07-31
ATE386321T1 (de) 2008-03-15
AU711401B2 (en) 1999-10-14
DK1233408T3 (da) 2005-01-24
PT1239465E (pt) 2005-09-30
PT1233408E (pt) 2005-05-31
KR100455225B1 (ko) 2004-11-06
CN1512489A (zh) 2004-07-14
CN1512487A (zh) 2004-07-14
EP1703493B1 (en) 2008-02-13
DE69533881D1 (de) 2005-01-27
ES2194921T3 (es) 2003-12-01
FI20050703A (fi) 2005-07-01
EP1530201A2 (en) 2005-05-11
DE69530066T2 (de) 2004-01-29
FI123708B (fi) 2013-09-30
JPH09504124A (ja) 1997-04-22
AU3275195A (en) 1996-03-07
JP2004004971A (ja) 2004-01-08
CA2488918A1 (en) 1996-02-22
CN1945696A (zh) 2007-04-11
EP0728350A1 (en) 1996-08-28
EP1233408A1 (en) 2002-08-21
JP3927159B2 (ja) 2007-06-06
DE69534285T2 (de) 2006-03-23
CA2488921A1 (en) 1996-02-22
DE69534285D1 (de) 2005-07-21
CN100508028C (zh) 2009-07-01
EP1239465B1 (en) 2005-06-15
DK0728350T3 (da) 2003-06-30
DE69535709T2 (de) 2009-02-12
ES2240602T5 (es) 2010-06-04
FI961112A0 (fi) 1996-03-08
TW277189B (ko) 1996-06-01
FI20050702A (fi) 2005-07-01
CN1320521C (zh) 2007-06-06
EP1424686A2 (en) 2004-06-02
DK1239465T4 (da) 2010-05-31
JP2004046228A (ja) 2004-02-12
KR960705305A (ko) 1996-10-09
EP1703493A2 (en) 2006-09-20
ZA956081B (en) 1996-03-15
DE69535709D1 (de) 2008-03-27
BR9510780B1 (pt) 2011-05-31
DE69534285T3 (de) 2010-09-09
DE69535452D1 (de) 2007-05-16
JP2007304606A (ja) 2007-11-22
ATE358871T1 (de) 2007-04-15
CN1168071C (zh) 2004-09-22
MX9600920A (es) 1997-06-28
KR20040004421A (ko) 2004-01-13
CA2171009C (en) 2006-04-11
EP1530201A3 (en) 2005-08-10
FI122273B (fi) 2011-11-15
EP1239465A2 (en) 2002-09-11
DE69533881T2 (de) 2006-01-12
FI20061084A (fi) 2006-12-07
FI119085B (fi) 2008-07-15
FI20050704A (fi) 2005-07-01

Similar Documents

Publication Publication Date Title
KR100455826B1 (ko) 가변율보코더의인코딩속도를선택하기위한방법및장치
JP4778010B2 (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130927

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140929

Year of fee payment: 11

EXPY Expiration of term