KR100269216B1 - 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 - Google Patents

스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 Download PDF

Info

Publication number
KR100269216B1
KR100269216B1 KR1019980013665A KR19980013665A KR100269216B1 KR 100269216 B1 KR100269216 B1 KR 100269216B1 KR 1019980013665 A KR1019980013665 A KR 1019980013665A KR 19980013665 A KR19980013665 A KR 19980013665A KR 100269216 B1 KR100269216 B1 KR 100269216B1
Authority
KR
South Korea
Prior art keywords
autocorrelation
pitch
spectro
temporal
formant
Prior art date
Application number
KR1019980013665A
Other languages
English (en)
Other versions
KR19990080416A (ko
Inventor
조용덕
김무영
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019980013665A priority Critical patent/KR100269216B1/ko
Priority to US09/226,115 priority patent/US6208958B1/en
Priority to JP11109162A priority patent/JPH11327595A/ja
Publication of KR19990080416A publication Critical patent/KR19990080416A/ko
Application granted granted Critical
Publication of KR100269216B1 publication Critical patent/KR100269216B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 피치결정오류를 방지하기 위한 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템 및 그 방법에 관한 것으로, 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템은 입력음성에 대한 제1포만트의 영향을 줄이기 위하여 포만트의 대역폭을 확장하는 포만트 대역폭 확장부, 포만트 대역폭 확장부로부터 출력되는 시간축 신호에 대한 피치후보 범위에서 시간축 음성의 자기 상관치를 구하는 템포럴 자기상관 계산부, 포만트 대역폭 확장부로부터 출력되는 시간축 신호를 주파수축 신호로 변환하고, 피치후보 범위에서 주파수축 크기 스펙트럼간에 자기 상관치를 구하는 스펙트럴 자기상관 계산부 및 템포럴 자기상관 계산부와 스펙트럴 자기상관 계산부로부터 계산된 자기상관치를 합하여 스펙트로-템포럴 자기상관치를 구하는 자기상관치 합성부 및 스펙트로-템포럴 자기상관치가 최대인 피치를 최종의 피치로 결정하는 피치결정부를 포함함을 특징으로 한다.
본 발명에 의하면, 스펙트로-템포럴 자기상관을 이용하여 피치를 결정하므로써 피치 결정 오류를 줄여 음성통화품질을 향상할 수 있다.

Description

스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
본 발명은 음성신호처리에 관한 것으로, 특히 저비트율의 음성부호화기, 음성인식등에 사용하는 피치 결정방식에 관한 것이다.
피치(Pitch)는 사람의 발성특성상 성문(vocal cord) 개폐의 주기적 특성으로 발생하며, 음성모델링 과정에서 사용되는 중요 파라미터 중의 하나이다. 이를 사용하는 주요 응용처로는 음성부호화기(또는 보코더, 음성코덱), 음성인식, 음성변환 등이 있다.
저비트율(low bit rate) 음성부호화기의 경우 피치결정에 오류가 발생하면, 음성통화 품질이 상당히 저하된다. 따라서, 이와같은 응용분야에서는 고정확도의 피치결정방식을 선택하는 것이 매우 중요하다.
일반적으로 피치결정오류는 피치 더블링(pitch doubling), 피치 하빙(pitch halving), 제1포만트를 피치로 오판하는 경우로 분류된다. 피치 더블링은 원 피치가 T일 경우 2T, 3T, 4T,…로 잘못 결정된 경우이며, 피치 하빙은 T/2, T/4, T/8,…으로 잘못된 경우이다. 제1포만트가 피치로 판단되는 경우는 제1포만트의 자기상관치가 피치의 상관치보다 큰 경우로, 피치결정오류를 발생시키는 원인이 되기도 한다.
종래에 널리 사용된 대표적인 피치결정법중에는 도 1에 도시된 것과 같이 시간축에서의 자기상관(autocorrelation)을 이용한 피치결정법이 있다. 자기상관법은 각 래그(lag)에서 자기상관치가 가장 큰 값의 래그를 피치로 결정하는 방식인데, 종래의 피치결정법은 위의 제1포만트로 인한 오류를 자주 발생시키는 문제점이 있다. 예를들어 입력음성이 도 3a와 같을 때, 자기상관법으로 자기상관치를 계산하면 도 3b와 같이 된다. 원 음성의 피치가 31일 때, 자기상관법은 래그(lag) 31, 62, 93에서 상관값이 매우 커서 피치 결정시 오류를 야기한다. 따라서 종래의 자기상관법에 의한 피치결정법을 사용하면 피치결정 오류율이 높아 음성부호화기의 음질이 상당히 저하되고, 특히 입력음성에 배경잡음이 섞여있으면 피치결정오류로 인해 더욱 음질이 저하된다.
본 발명이 이루고자하는 기술적 과제는 피치결정오류를 방지하기 위해 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템 및 그 방법을 제공하는 것이다.
도 1은 종래의 피치결정법을 블록도로 도시한 것이다.
도 2는 본 발명에 의한 스펙트로-템포럴 자기상관을 사용한 피치결정시스템을 블록도로 도시한 것이다.
도 3a는 입력음성의 샘플을 도시한 것이다.
도 3b는 후보피치에 따른 템포럴 자기 상관치를 도시한 것이다.
도 3c는 후보피치에 따른 스펙트럴 자기 상관치를 도시한 것이다.
도 3d는 후보피치에 따른 스펙트로-템포럴 자기 상관치를 도시한 것이다.
도 4는 가중치값에 따른 성능 비교를 도시한 것이다.
도 5는 자동차 잡음환경에서 발성된 음성의 피치에러 비교를 도시한 것이다.
상기 기술적 과제를 해결하기 위한, 본 발명에 의한 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템은 입력음성에 대한 제1포만트의 영향을 줄이기 위하여 포만트의 대역폭을 확장하는 포만트 대역폭 확장부, 상기 포만트 대역폭 확장부로부터 출력되는 시간축 신호에 대한 피치후보 범위에서 시간축 음성의 자기 상관치를 구하는 템포럴 자기상관 계산부, 상기 포만트 대역폭 확장부로부터 출력되는 시간축 신호를 주파수축 신호로 변환하고, 피치후보 범위에서 주파수축 크기 스펙트럼간에 자기 상관치를 구하는 스펙트럴 자기상관 계산부, 상기 템포럴 자기상관 계산부와 상기 스펙트럴 자기상관 계산부로부터 계산된 자기상관치를 합하여 스펙트로-템포럴 자기상관치를 구하는 자기상관치 합성부 및 상기 스펙트로-템포럴 자기상관치가 최대인 피치를 최종의 피치로 결정하는 피치결정부를 포함함을 특징으로 한다.
상기 다른 기술적 과제를 해결하기 위한, 본 발명에 의한 스펙트로-템포럴 자기상관을 이용한 피치결정방법은 입력음성에 대한 제1포만트의 영향을 줄이기 위하여 포만트의 대역폭을 확장하는 포만트 대역폭 확장과정, 상기 포만트 대역폭 확장 단계로부터 출력되는 포만트를 확장한 음성신호에서 후보피치에 대한 템포럴 자기상관치를 구하는 템포럴 자기상관치 계산과정, 상기 포만트 대역폭 확장 단계로부터 출력되는 포만트를 확장한 음성신호에서 후보피치에 대한 스펙트럴 자기상관치를 구하는 스펙트럴 자기상관치 계산과정, 상기 템포럴 자기상관치 계산단계로부터 구한 후보피치에 대한 템포럴 자기상관치와 상기 스펙트럴 자기상관치 계산단계로부터 구한 후보피치에 대한 스펙트럴 자기상관치를 이용하여 후보피치에 대한 스펙트로-템포럴 자기상관치를 구하는 스펙트로-템포럴 자기상관치 계산과정 및 상기 스펙트로-템포럴 자기상관치 계산단계로부터 구한 후보피치에 대한 스펙트로-템포럴 자기상관치가 최대인 후보피치를 결정하는 피치 결정과정를 포함함을 특징으로 한다.
이하 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 2는 본 발명에 의한 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템으로, 포만트 대역폭 확장부(210), 템포럴 자기상관 계산부(220), 스펙트럴 자기상관 계산부(230), 자기상관치 합성부(240) 및 피치결정부(250)로 이루어진다.
포만트 대역폭 확장부(210)는 제1포만트의 영향을 줄이기 위하여 포만트(formant)의 대역폭(bandwidth)을 확장한다.
템포럴 자기상관 계산부(220)는 포만트 대역폭 확장부(210)로부터 출력되는 시간축 신호에 대한 피치후보 범위에서 시간축 음성의 자기 상관치를 구하는 것으로, 제1영평균(zero-mean) 신호변환부(221) 및 제1자기상관 계산부(222)로 이루어진다. 제1영평균(zero-mean) 신호변환부(221)는 포만트 대역폭 확장부(210)로부터 출력되는 시간축 음성신호를 시간축 영평균신호로 변환하고, 제1자기상관 계산부(222)는 제1영평균(zero-mean) 신호변환부(221)로부터 출력되는 시간축 영평균신호의 자기상관치를 계산하는 제1자기상관 계산부(222)로 이루어진다.
스펙트럴 자기상관 계산부(230)는 포만트 대역폭 확장부(210)로부터 출력되는 시간축 신호를 주파수축 신호로 변환하고, 피치후보 범위에서 주파수축 크기 스펙트럼간에 자기 상관치를 구하는 것으로, 퓨리에변환부(231), 제2영평균(zero-mean) 신호변환부(232) 및 제2자기상관 계산부(233)로 이루어진다. 퓨리에변환부(231)는 포만트 대역폭 확장부(210)로부터 출력되는 시간축 음성신호를 주파수축 음성신호로 변환한다. 제2영평균(zero-mean) 신호변환부(232)는 푸리에변환부(231)로부터 출력되는 주파수축 음성신호를 영평균 신호로 변환한다. 제2자기상관 계산부(233)는 제2영평균(zero-mean) 신호변환부(232)로부터 출력되는 주파수축 영평균신호의 자기상관치를 계산한다.
자기상관치 합성부(240)는 템포럴 자기상관 계산부(220)와 스펙트럴 자기상관 계산부(230)로부터 계산된 자기상관치를 합하여 스펙트로-템포럴 자기상관치를 구한다.
피치결정부(250)는 스펙트로-템포럴 자기상관치가 최대인 피치를 최종의 피치로 결정한다.
상술한 구성에 의거하여 본 발명의 동작을 설명하기로 한다.
본 발명에서는 먼저 입력음성 s(n)의 전처리로, 제1포만트의 영향을 줄이기 위하여 포만트(formant)의 대역폭을 확장한다. 확장방식으로는 CELP(code excited linear prediction)계열의 음성부호화기에서 사용하는 퍼셉추얼 웨이팅 필터(perceptual weighting filter)를 사용하여 구현할 수 있다. 입력음성 s(n)은 포만트 대역포 확장부(210)에서 사용되는 퍼셉추얼 웨이팅 필터에 의해 포만트의 대역폭을 확장한 음성신호 sf(n)으로 변환된다. 퍼셉추얼 웨이팅 필터는 다음과 같은 함수로 표현된다.
여기서, ai는 선형예측계수(linear prediction coefficient)이고, γ는 0과 1사이의 값인데 스펙트럼의 평탄화를 조절할 수 있다. γ=1이면 위의 필터는 바이패스필터이고, γ=0이면 sf(n)은 선형예측의 잔차 신호가 된다. 본 발명에서는 실험으로서 γ=0.8일 때, 성능이 가장 우수함을 알 수 있다.
포만트 대역폭이 확장된 음성신호 sf(n)에 대한 템포럴 자기상관치를 계산하기 위해 제1영평균 신호변환부(221)는 수학식 2를 이용하여 영평균(zero-mean) 신호 로 변환한다.
여기서, N은 음성 샘플의 개수이다.
포만트 대역폭이 확장된 음성신호 sf(n)이 주어질 때, 제1자기상관부(222)는 후보피치 τ에서 다음과 같이 템포럴 자기상관치를 구한다.
스펙트럴 자기상관(spectral autocorrelation)은 주파수축에서 음성스펙트럼의 자기상관치이다. 먼저 퓨리에 변환부(231)는 포만트 대역폭이 확장된 음성신호 sf(n)에 윈도우 w(n)을 적용한후, 각 주파수별 크기응답을 수학식 4와 같이 구한다.
제2영평균 신호변환부(232)는 스펙트럴 자기상관치를 계산하기 위해 크기 스펙트럼 Sf(m)의 영평균 신호로 다음과 같이 변환한다.
제2자기상관 계산부(233)는 크기 스펙트럼 Sf(m) 간에 자기상관치를 다음과 같이 구한다.
여기서, ωτ=round(2M/τ)이고, 은 Sf(m)의 영평균 신호이다.
따라서, 자기상관치 합성부(240)는 템포럴 자기상관계산부(220)에서 구한 템포럴 자기상관치와 스펙트럴 자기상관 계산부(230)에서 구한 스펙트럴 자기상관치를 이용하여, 다음과 같이 후보피치 τ에서 스펙트로-템포럴 자기상관치를 구한다.
R(τ)=βRT(τ)+(1-β)RS(τ)
여기서, β는 가중치값으로 0에서 1사이의 값을 갖는다.
최종적으로 피치결정부(250)는 R(τ)가 최대인 피치를 결정한다. 최종적인 피치 τ*의 결정은 R(τ)가 최대일 때, τ값이다. 즉,
τ*=arg maxR(τ)
사람의 발성특성을 관찰하여 피치 τ값의 변화를 관찰할 때, 통상적으로 20에서 140사이의 값을 취한다. β=1일 때는 종래의 자기상관법과 동일하다. β값의 변화에 따라 성능을 관찰한 결과를 도 4에 나타낸다. 도 4의 분석으로는 β가 0.5 일 때, 피치 오류율이 가장 낮다. 즉 종래의 방식보다 성능이 월등히 개선됨을 확인할 수 있다. 도 5에서는 음성에 자동차 잡음을 섞은 후, 성능 분석한 결과이다. 본 발명에서 제안한 방식(STA : Spectro-Temporal Autocorrelation)이 종래의 방식(TA : Temporal Autocorrelation)보다 월등히 우수함을 확인할 수 있다.
본 발명에 의한 피치결정방식이 종래의 피치결정방식보다 우수한 성능을 얻은 이유는 도 3a부터 도3d를 참조하여 설명한다. 도 3b는 종래의 방식을 사용할 때, 즉 피치후보(lag)의 변화에 따른 자기 상관치이다. 종래의 방식은 피치후보 31, 62, 93에서 자기상관치가 매우 높아 변별력이 낮음을 알 수 있다. 즉, 피치오류(피치 더블링 에러) 발생 가능성이 크다. 도 3c는 피치후보의 변화에 따를 스펙트럴 자기상관치이다. 스펙트럴 자기상관치의 특성은 원 피치가 T일 때, T/2, T/4...에서 자기상관치가 크다는 특성이 있다. 즉 피치 하빙 에러를 발생시키는 경향이 있다(도 3c에서는 T/2= 15.5인데, 피치검색범위가 20이상이므로 탐색구간에 포함되지 않음). 도 3d는 피치후보의 변화에 따른 스펙트로-템포럴 자기상관치의 변화를 그림으로 나타냈다. 본 상관치는 수학식 7에서 나타낸 바와 같이 도 3b의 템포럴 자기상관치와 도 3c의 스펙트럴 자기상관치의 가중화된 합(weighted sum)이다. 도 3d에서 보이듯이 원 피치 31에서 상관치가 매우 크고, 피치후보 62, 93에서는 상대적으로 값이 작아, 본 발명에 의한 피치결정방식이 종래의 피치결정방식보다 변별력이 우수함을 확인할 수 있다.
본 발명에 의하면, 스펙트로-템포럴 자기상관을 이용하여 피치를 결정하므로써 피치 결정 오류를 줄여 음성통화품질을 향상할 수 있다.

Claims (9)

  1. 입력음성에 대한 제1포만트의 영향을 줄이기 위하여 포만트의 대역폭을 확장하는 포만트 대역폭 확장부;
    상기 포만트 대역폭 확장부로부터 출력되는 시간축 신호에 대한 피치후보 범위에서 시간축 음성의 자기 상관치를 구하는 템포럴 자기상관 계산부;
    상기 포만트 대역폭 확장부로부터 출력되는 시간축 신호를 주파수축 신호로 변환하고, 피치후보 범위에서 주파수축 크기 스펙트럼간에 자기 상관치를 구하는 스펙트럴 자기상관 계산부;
    상기 템포럴 자기상관 계산부와 상기 스펙트럴 자기상관 계산부로부터 계산된 자기상관치를 합하여 스펙트로-템포럴 자기상관치를 구하는 자기상관치 합성부; 및
    상기 스펙트로-템포럴 자기상관치가 최대인 피치를 최종의 피치로 결정하는 피치결정부를 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템.
  2. 제1항에 있어서, 상기 포만트 대역폭 확장부는
    퍼셉추얼 웨이팅 필터(perceptual weighting filter)를 사용하여 포만트의 대역폭을 확장함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템.
  3. 제2항에 있어서, 상기 퍼셉추얼 웨이팅 필터는
    (여기서, ai는 선형예측 계수이고, γ는 0과 1 사이의 값인데 스펙트럼의 평탄화를 조절할 수 있다.)
    로 구현됨을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템.
  4. 제1항에 있어서, 상기 템포럴 자기상관 계산부는
    상기 포만트 대역폭 확장부로부터 출력되는 시간축 음성신호를 영평균 신호로 변환하는 제1영평균(zero-mean) 신호변환부; 및
    상기 제1영평균(zero-mean) 신호변환부로부터 출력되는 시간축 영평균신호를 이용하여 후보피치의 자기상관치를 계산하는 제1자기상관 계산부를 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템.
  5. 제1항에 있어서, 상기 스펙트럴 자기상관 계산부는
    상기 포만트 대역폭 확장부로부터 출력되는 시간축 음성신호를 주파수축 음성신호로 변환하는 푸리에변환부;
    상기 푸리에변환부로부터 출력되는 주파수축 음성신호를 영평균 신호로 변환하는 제2영평균(zero-mean) 신호변환부; 및
    상기 제2영평균(zero-mean) 신호변환부로부터 출력되는 주파수축 영평균신호를 이용하여 후보피치의 자기상관치를 계산하는 제2자기상관 계산부를 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정 시스템.
  6. 입력음성에 대한 피치를 결정하는 방법에 있어서,
    입력음성에 대한 제1포만트의 영향을 줄이기 위하여 포만트의 대역폭을 확장하는 포만트 대역폭 확장 과정;
    포만트 대역폭이 확장된 음성신호에서 후보피치에 대한 템포럴 자기상관치를 구하는 템포럴 자기상관치 계산과정;
    포만트 대역폭이 확장된 음성신호에서 후보피치에 대한 스펙트럴 자기상관치를 구하는 스펙트럴 자기상관치 계산과정;
    상기 템포럴 자기상관치와 상기 스펙트럴 자기상관치를 이용하여 후보피치에 대한 스펙트로-템포럴 자기상관치를 구하는 스펙트로-템포럴 자기상관치 계산과정; 및
    각 후보피치에 대한 스펙트로-템포럴 자기상관치중 최대의 값을 후보피치로 결정하는 피치 결정과정를 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정방법.
  7. 제6항에 있어서, 상기 템포럴 자기상관치 계산과정은
    포만트를 확장한 음성신호를 sf(n)이라 할 때, sf(n)의 영평균신호는
    (여기서, N은 음성 샘플의 갯수이다.)
    를 이용하여 구하는 제1영평균 계산과정; 및
    포만트를 확장한 음성신호를 sf(n)의 후보피치 τ에 대한 템포럴 자기상관치는
    (여기서, N은 음성 샘플의 갯수이다.)
    을 이용하여 구하는 제1자기상관 계산과정을 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정방법.
  8. 제6항에 있어서, 상기 스펙트럴 자기상관치 계산과정은
    포만트를 확장한 음성신호를 sf(n)이라 할 때, sf(n)의 주파수별 크기응답은
    을 이용하여 구하는 퓨리에 변환과정;
    상기 퓨리에 변환과정으로부터 구한 크기 스펙트럼 Sf(m)의 영평균 신호는
    을 이용하여 구하는 제2영평균 계산과정; 및
    포만트를 확장한 음성신호에서 후보피치를 τ라 할 때, 후보피치에 대한 스펙트럴 자기상관치는
    (여기서, ωτ=round(2M/τ) 이다.)
    을 이용하여 구하는 제2자기상관 계산과정을 포함함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정방법.
  9. 제7항 또는 제8항에 있어서, 상기 스펙트로-템포럴 자기상관치 계산과정은
    포만트를 확장한 음성신호에서 후보피치를 τ라 할 때, 후보피치에 대한 스펙트로-템포럴 자기상관치는
    R(τ)=βRT(τ)+(1-β)RS(τ)
    (여기서, β는 가중치값으로, β값의 변화에 따라 피치오류율이 변화한다.)
    을 이용하여 구함을 특징으로 하는 스펙트로-템포럴 자기상관을 이용한 피치결정방법.
KR1019980013665A 1998-04-16 1998-04-16 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 KR100269216B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1019980013665A KR100269216B1 (ko) 1998-04-16 1998-04-16 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US09/226,115 US6208958B1 (en) 1998-04-16 1999-01-07 Pitch determination apparatus and method using spectro-temporal autocorrelation
JP11109162A JPH11327595A (ja) 1998-04-16 1999-04-16 スペクトロ―テンポラル自己相関を用いたピッチ決定装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980013665A KR100269216B1 (ko) 1998-04-16 1998-04-16 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법

Publications (2)

Publication Number Publication Date
KR19990080416A KR19990080416A (ko) 1999-11-05
KR100269216B1 true KR100269216B1 (ko) 2000-10-16

Family

ID=19536337

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980013665A KR100269216B1 (ko) 1998-04-16 1998-04-16 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법

Country Status (3)

Country Link
US (1) US6208958B1 (ko)
JP (1) JPH11327595A (ko)
KR (1) KR100269216B1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356799A (ja) * 2000-06-12 2001-12-26 Toshiba Corp タイム/ピッチ変換装置及びタイム/ピッチ変換方法
US6675114B2 (en) * 2000-08-15 2004-01-06 Kobe University Method for evaluating sound and system for carrying out the same
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
DE10123366C1 (de) * 2001-05-14 2002-08-08 Fraunhofer Ges Forschung Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen
KR100393899B1 (ko) 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
KR100499047B1 (ko) * 2002-11-25 2005-07-04 한국전자통신연구원 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
US6988064B2 (en) * 2003-03-31 2006-01-17 Motorola, Inc. System and method for combined frequency-domain and time-domain pitch extraction for speech signals
KR100516678B1 (ko) * 2003-07-05 2005-09-22 삼성전자주식회사 음성 코덱의 음성신호의 피치검출 장치 및 방법
KR100590561B1 (ko) * 2004-10-12 2006-06-19 삼성전자주식회사 신호의 피치를 평가하는 방법 및 장치
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
JP4851447B2 (ja) * 2005-06-09 2012-01-11 株式会社エイ・ジー・アイ ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
KR100713366B1 (ko) * 2005-07-11 2007-05-04 삼성전자주식회사 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
US20070038455A1 (en) * 2005-08-09 2007-02-15 Murzina Marina V Accent detection and correction system
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
KR100724736B1 (ko) * 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
JP5992427B2 (ja) * 2010-11-10 2016-09-14 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置
CN110260925B (zh) * 2019-07-12 2021-06-25 重庆赛迪奇智人工智能科技有限公司 司机停车技术优劣的检测方法及其***、智能推荐方法、电子设备
CN113129921B (zh) * 2021-04-16 2022-10-04 北京市理化分析测试中心 用于检测语音信号中的基音的频率的方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5365592A (en) * 1990-07-19 1994-11-15 Hughes Aircraft Company Digital voice detection apparatus and method using transform domain processing
TW271524B (ko) * 1994-08-05 1996-03-01 Qualcomm Inc
JP2993396B2 (ja) * 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
US5619004A (en) * 1995-06-07 1997-04-08 Virtual Dsp Corporation Method and device for determining the primary pitch of a music signal
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US5799271A (en) * 1996-06-24 1998-08-25 Electronics And Telecommunications Research Institute Method for reducing pitch search time for vocoder
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations

Also Published As

Publication number Publication date
JPH11327595A (ja) 1999-11-26
KR19990080416A (ko) 1999-11-05
US6208958B1 (en) 2001-03-27

Similar Documents

Publication Publication Date Title
KR100269216B1 (ko) 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US5751903A (en) Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US7257535B2 (en) Parametric speech codec for representing synthetic speech in the presence of background noise
US7664650B2 (en) Speech speed converting device and speech speed converting method
KR100388387B1 (ko) 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템
US20070027681A1 (en) Method and apparatus for extracting voiced/unvoiced classification information using harmonic component of voice signal
JPH08328588A (ja) ピッチラグを評価するためのシステム、音声符号化装置、ピッチラグを評価する方法、および音声符号化方法
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
KR20070017524A (ko) 부호화 장치, 복호화 장치, 및 이들의 방법
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JP2007523388A (ja) エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、オーディオ信号を符号化する方法、モジュール、およびコンピュータプログラム製品
KR20070118170A (ko) 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JP2014500521A (ja) 低ビットレート低遅延の一般オーディオ信号の符号化
KR19990088582A (ko) 신호의기본주파수를추정하기위한방법및장치
US5884251A (en) Voice coding and decoding method and device therefor
JPH04270398A (ja) 音声符号化方式
KR100463417B1 (ko) 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
KR100516678B1 (ko) 음성 코덱의 음성신호의 피치검출 장치 및 방법
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
KR100383668B1 (ko) 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법
JP2001083978A (ja) 音声認識装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080708

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee