KR20040026794A - 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법 - Google Patents

전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법 Download PDF

Info

Publication number
KR20040026794A
KR20040026794A KR1020020058371A KR20020058371A KR20040026794A KR 20040026794 A KR20040026794 A KR 20040026794A KR 1020020058371 A KR1020020058371 A KR 1020020058371A KR 20020058371 A KR20020058371 A KR 20020058371A KR 20040026794 A KR20040026794 A KR 20040026794A
Authority
KR
South Korea
Prior art keywords
pitch
error
signal
threshold
egg
Prior art date
Application number
KR1020020058371A
Other languages
English (en)
Other versions
KR100923384B1 (ko
Inventor
장경애
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020020058371A priority Critical patent/KR100923384B1/ko
Publication of KR20040026794A publication Critical patent/KR20040026794A/ko
Application granted granted Critical
Publication of KR100923384B1 publication Critical patent/KR100923384B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 음성인식 및 합성을 위한 피치(pitch)를 검출하기 위하여 전자적성문그래프(EGG) 신호와 음성신호를 상호 보완적으로 이용하여 피치추출의 정확도를 높이기 위한 피치 추출 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 음성인식 및 합성을 위한 피치를 추출하는 장치에 있어서, 전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하기 위한 피치 추출수단; 상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하기 위한 피치 오류구간 검출수단; 및 음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하기 위한 피치 오류구간 수정수단을 포함함.
4. 발명의 중요한 용도
본 발명은 음성인식 및 합성 등에 이용됨.

Description

전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법{Apparatus and method for pitch extraction using electroglottograph}
본 발명은 음성인식 및 합성을 위한 피치(pitch)를 검출하기 위하여 전자적성문그래프(EGG : ElectroGlottoGraph) 신호와 음성신호를 상호 보완적으로 이용해 피치추출의 정확도를 높일 수 있는 피치 추출 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로, 피치를 검출하는 방법으로는 음성신호를 이용하는 방법과 전자적성문그래프를 이용하는 방법이 있으나, 일반인 대상의 실시간 음성인식에서의 용도로는 발화자의 목에 전자적성문그래프 검출장치를 설치하기가 부적당하므로 음성신호를 주로 이용한다. 그런데, 음성합성이나 일부 음성인식의 분야에서는 음성신호와 전자적성문그래프 검출장치를 사용하는 것이 가능하다.
그런데, 음성신호를 이용한 피치 검출 방법은 여러 가지 문제로 정확하고 신뢰성있는 피치 검출이 수행되지 못하므로 전자적성문그래프 신호로부터 피치를 검출하는 방법을 널리 사용하고 있다. 이를 구체적으로 살펴보면 다음과 같다.
음성신호로부터 음원의 기본주파수인 피치를 추출하는 방법은 지난 20여년간 연구되어 왔지만, 아직 정확도 면에서 실용화하기에 문제가 많다. 음성신호는 준주기성을 갖는 유성음과 랜덤한 성질을 갖는 무성음으로 분류가 되며, 유성음은 성문의 진동으로부터 발생되므로 진동주기와 기본주파수가 중요한 의미가 있지만 무성음은 성문이 열려있어 성문진동의 주기성이 없으므로 기본주파수가 없다.
유성음의 음성신호로부터 피치를 구하는 과정은 기본 주파수를 계산하기 위하여 음성신호의 단구간자기상관도(short-term autocorrelation)를 계산하여 주기를 찾는 방법이 주로 사용된다. 그런데, 유성음은 성문의 개폐 형태 및 개폐 주기에 따른 여기신호에 성도의 물리적인 형태의 영향으로 공명(resonance) 현상이 추가된 신호이므로 유성음의 음성신호로부터 성도의 영향을 제외한 기본주파수를 정확히 추출하기는 어렵다.
이에 비해, 전자적성문그래프 신호는 음성이 생성되는 이전 단계인 성문의 개폐에 따라 성문이 떨리는 주기와 개폐 형태를 그래프로 나타낸 것이므로 성도의 영향인 공명현상이 추가되지 않아 피치추출의 정확도가 비교적 높다.
전자적성문그래프 신호로부터 피치를 추출하는 방법은 성도의 영향이 배제된 성문 개폐에 의한 진동파형이므로 단순히 미분하거나 앞뒤 데이터를 비교함으로써 최고점을 찾을 수 있으므로 주기와 주파수를 쉽계 구할 수 있다.
그러나, 전자적성문그래프 신호는 발화자의 발화특성 또는 전자적성문그래프 검출기의 오류 등으로 인하여 유성음 구간임에도 불구하고 성문의 진동이 그래프에 나타나지 않는 경우가 있다. 이 경우 피치가 급격히 변하지 않으면 틀린 피치값을 그대로 사용하며, 피치가 급격히 변하는 구간은 이를 파악하여 인접한 피치값이나 보간법(interpolation)을 사용하여 피치값을 추측하여 사용한다. 피치는 음성인식에서도 사용되며, 특히 음성합성의 음질을 결정하는 중요한 파라미터이므로 틀린 피치값이나 피치의 추측값을 사용하는 것은 인식과 합성에서 성능저하의 원인이 된다.
정리해 보면, 음성인식과 음성합성에서 음성 DB의 피치정보를 추출하기 위하여 전자적성문그래프를 사용하는 경우에 발화자의 발화특성 등으로 인한 전자적성문그래프의 오류가 피치의 정확도를 떨어뜨린다. 음성신호와 달리 전자적성문그래프는 성문의 개폐 형태와 진동주기만을 나타내며 성도의 영향은 포함되지 않으므로 성문의 진동이 몇 주기 간격동안 나타나지 않으면 피치를 계산할 수 없으므로 틀린 값이나 부정확한 값을 예측하여 피치값으로 부여할 수 밖에 없다. 따라서, 피치추출의 정확도를 높일 수 있는 방안이 필수적으로 요구된다.
본 발명은, 상기한 바와 같은 요구에 부응하기 위하여 제안된 것으로, 음성인식 및 합성을 위한 피치(pitch)를 검출하기 위하여 전자적성문그래프(EGG) 신호와 음성신호를 상호 보완적으로 이용하여 피치추출의 정확도를 높이기 위한 피치 추출 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 피치 추출 장치의 일실시예 구성도.
도 2 는 본 발명에 따른 피치 추출 방법에 대한 일실시예 흐름도.
도 3 은 본 발명에 따른 피치 추출 방법 중 피치의 오류구간 검출 과정에 대한 일실시예 상세 흐름도.
도 4a 내지 4b 는 본 발명에 따른 피치 오류구간 검출 및 수정 과정을 나타낸 일실시예 설명도.
* 도면의 주요 부분에 대한 부호의 설명
11 : 피치 추출부 12 : 피치 오류구간 검출부
13 : 피치 오류구간 수정부
상기 목적을 달성하기 위한 본 발명은, 음성인식 및 합성을 위한 피치를 추출하는 장치에 있어서, 전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하기 위한 피치 추출수단; 상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하기 위한 피치 오류구간 검출수단; 및 음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하기 위한 피치 오류구간 수정수단을 포함하여 이루어진 것을 특징으로 한다.
그리고, 본 발명은 음성인식 및 합성을 위한 피치를 추출하는 방법에 있어서, 전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하는 제 1 단계; 상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하는 제 2 단계; 및 음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다.
한편, 본 발명은 프로세서를 구비한 피치 추출 장치에, 전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하는 제 1 기능; 상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하는 제 2 기능; 및 음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명은 전자적성문그래프 신호로부터 피치를 추출하고 결과 피치의 오류구간을 자동검출하여 자동으로 수정하고자 한다. 즉, 본 발명은 피치 추출의 정확도를 높이기 위하여 전자적성문그래프 신호로부터 피치를 구하되, 결과 피치의 오류구간을 자동으로 찾아 수정하는데, 이때 음성신호로부터 피치를 구하여 보완적으로 사용한다.
이처럼, 본 발명에서는 음성신호를 이용한 피치를 추출하는 과정이 필요하며, 음성신호로부터 추출한 피치는 전자적성문그래프에 비하여 신뢰도는 낮으나 성문의 진동주기가 전자적성문그래프에 나타나지 않는 구간에서는 피치를 추출하는 최선의 해결책이 음성신호에 의존하는 것이다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 피치 추출 장치의 일실시예 구성도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 피치 추출 장치는, 전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하기 위한 피치 추출부(11)와, 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하기 위한 피치 오류구간 검출부(12)와, 음성신호로부터 제2 피치를 추출하여, 제2 피치 중 제1 피치의 오류구간에 대응되는 부분을 찾아 제1 피치의 오류구간을 대체(수정)하기 위한 피치 오류구간 수정부(13)를 포함한다.
피치 추출부(11)는 전자적성문그래프(EGG) 신호로부터 피치를 추출함에 있어서, 성문개폐에 의한 진동파형으로부터 단순히 미분하거나 앞뒤 데이터를 비교함으로써 최고점을 찾아 주기와 주파수를 구한다. 그러나, 성문의 진동파형이 발화특성에 따라 나타나지 않을 수 있는데, 이때는 주기와 주파수를 구할 수 없으므로, 시간적으로 인접한 피치값을 보간법(interpolation)으로 추측하여 부여하게 된다. 그결과, 실제 음성에서는 피치가 높음에도 불구하고 피치가 낮게 추측되거나, 실제로 피치가 낮은데 높게 부여되는 오류가 있다.
무성음은 주기성이 없이 랜덤한 성질을 가지므로 피치의 정확도가 중요하지 않으나, 유성음은 음원이 성문의 개폐에 따른 주기적인 진동에서 발생되므로 피치의 높고 낮음이 음색을 결정하는데 중요한 역할을 한다.
피치 오류구간 검출부(12)는 전자적성문그래프의 오류로 인한 피치의 오류구간을 찾는데 있어서, 음성신호로부터 유성음과 무성음을 구별하여 유성음에서 비정상적으로 낮은 피치와 무성음에서 비정상적으로 높은 피치를 오류로 판단한다. 그리고, 음성신호로부터 유성음구간과 무성음구간을 정확히 구별하기는 어려우므로, 음성신호의 세기(intensity)가 세기_임계치_A 이상이면 유성음으로 간주하고, 세기_임계치_B 이하이면 무성음으로 간주한다. 그리고, 피치는 피치_임계치_A와 피치_임계치_B를 설정하여, 도 3과 같이 유성음구간의 피치가 피치_임계치_A보다 낮으면 오류로 판단하고, 무성음구간의 피치가_피치_임계치_B보다 높으면 오류로 판단한다.
피치 오류구간 수정부(13)는 오류의 원인으로 판단된 전자적성문그래프(EGG) 이외에 성문의 진동정보를 포함하고 있는 음성신호를 이용하여 단구간 자기상관도(short-term autocorrelation)를 계산하고 최고점의 주기와 주파수를 찾아 피치를 추출한다. 피치는 음성인식과 음성합성에서 분석단위인 10~20msec 구간의 프레임단위로 추출되므로, 도 4의 4d에서와 같이 오류구간에 해당하는 시작 프레임과 끝 프레임을 음성신호에서 찾아 해당 구간의 피치값을 대치(replacement)한다.
도 4a는 전자적성문그래프로부터 추출한 피치를 곡선으로 표현한 것이며, 4b에서의 음성신호와 비교할 때 세기가 높은 유성음구간에서 피치가 높지 않은 구간이 있다. 이 구간이 전자적성문그래프에 성문의 진동이 검출되지 않은 구간으로 예상할 수 있으며, 피치 오류구간 검출부(12)에서 검출될 수 있다.
도 4c에서 오류구간의 음성신호로부터 피치를 추출하여 전자적성문그래프로부터 추출한 피치보다 높은 피치가 추출되어 오류구간에 대치되어 4d와 같은 오류가 수정된 피치를 추출할 수 있다.
본 발명에 따른 전자적성문그래프를 이용한 피치 검출 장치는 전자적성문그래프로부터 구한 피치의 오류구간을 자동으로 찾고 수정함으로써, 피치의 정확성을 높여 피치 오류로 인한 음성인식과 음성합성의 성능저하를 개선시킬 수 있다.
도 2 는 본 발명에 따른 피치 추출 방법에 대한 일실시예 흐름도이다.
도 2에 도시된 바와 같이, 본 발명에 따른 피치 추출 방법은, 먼저 피치 추출부(11)에서 전자적성문그래프(EGG) 신호로부터 피치를 추출한다(201). 즉, 성문개폐에 의한 진동파형으로부터 단순히 미분하거나 앞뒤 데이터를 비교함으로써 최고점을 찾아 주기와 주파수를 구한다. 그러나, 성문의 진동파형이 발화특성에 따라 나타나지 않을 수 있는데, 이때는 주기와 주파수를 구할 수 없으므로, 시간적으로 인접한 피치값을 보간법(interpolation)으로 추측하여 부여하게 된다. 그 결과, 실제 음성에서는 피치가 높음에도 불구하고 피치가 낮게 추측되거나, 실제로 피치가 낮은데 높게 부여되는 오류가 있다.
따라서, 피치 오류구간 검출부(12)에서 전자적성문그래프(EGG)의 오류로 인한 피치의 오류구간을 검출한다(202). 이때, 전자적성문그래프(EGG)의 오류로 인한 피치의 오류구간을 찾는 방법으로, 음성신호로부터 유성음과 무성음을 구별하여 유성음에서 비정상적으로 낮은 피치와 무성음에서 비정상적으로 높은 피치를 오류로 판단한다. 그리고, 음성신호로부터 유성음구간과 무성음구간을 정확히 구별하기는 어려우므로, 음성신호의 세기(intensity)가 세기_임계치_A 이상이면 유성음으로 간주하고, 세기_임계치_B 이하이면 무성음으로 간주한다. 그리고, 피치는 피치_임계치_A와 피치_임계치_B를 설정하여, 유성음구간의 피치가 피치_임계치_A보다 낮으면 오류로 판단하고, 무성음구간의 피치가_피치_임계치_B보다 높으면 오류로 판단한다.
즉, 도 3에 도시된 바와 같이 피치의 오류구간 검출 과정은, 먼저 피치값과 음성신호의 세기를 비교하여(301), 음성신호의 세기가 세기_임계치_A 이상인 경우에(302) 유성음으로 간주하여 유성음구간의 피치가 피치_임계치_A보다 높으면(303) 정상으로 판정한다(306). 그러나, 음성신호의 세기가 세기_임계치_A 이상인 경우에(302), 유성음구간의 피치가 피치_임계치_A보다 낮으면(303) 오류로 판정한다(307). 한편, 음성신호의 세기가 세기_임계치_A 미만이고(302) 음성신호의 세기가 세기_임계치_B 이하인 경우에(304), 무성음으로 간주하여 무성음구간의 피치가 피치_임계치_B보다 높으면(305) 오류로 판정한다(307). 그러나, 음성신호의 세기가 세기_임계치_B 이하인 경우에(304), 무성음구간의 피치가 피치_임계치_B보다 낮으면(305) 정상으로 판정한다(306). 다른 한편, 음성신호의 세기가 세기_임계치_A와세기_임계치_B 사이의 값이면, 피치를 정상으로 판정한다(306).
마지막으로, 피치 오류구간 수정부(13)에서 음성신호로부터 피치를 추출하여, 음성신호로부터 추출된 피치 중 전자적성문그래프(EGG) 신호로부터 추출된 피치의 오류구간에 대응되는 부분을 찾아 전자적성문그래프(EGG) 신호로부터 추출된 피치의 오류구간을 대체(수정)한다. 즉, 오류의 원인으로 판단된 전자적성문그래프(EGG) 이외에 성문의 진동정보를 포함하고 있는 음성신호를 이용하여 단구간 자기상관도(short-term autocorrelation)를 계산하고 최고점의 주기와 주파수를 찾아 피치를 추출한 후에, 오류구간에 해당하는 시작 프레임과 끝 프레임을 음성신호에서 찾아 해당 구간의 피치값을 대치(replacement)한다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, 피치의 오류를 최소화하기 위하여 전자적성문그래프로부터 추출한 피치의 오류를 자동으로 찾아 수정할 수 있어, 음성인식과 합성에서 피치의 정확성을 높여 성능을 개선시킬 수 있는 효과가 있다.

Claims (7)

  1. 음성인식 및 합성을 위한 피치를 추출하는 장치에 있어서,
    전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하기 위한 피치 추출수단;
    상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하기 위한 피치 오류구간 검출수단; 및
    음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하기 위한 피치 오류구간 수정수단
    을 포함하는 전자적성문그래프 신호를 이용한 피치 추출 장치.
  2. 제 1 항에 있어서,
    상기 피치 오류구간 검출수단에서 전자적성문그래프의 오류로 인한 피치의 오류구간을 찾는 과정은,
    음성신호로부터 유성음과 무성음을 구별하여 유성음에서 비정상적으로 낮은 피치와 무성음에서 비정상적으로 높은 피치를 오류로 판단하며, 음성신호의 세기(intensity)가 세기_임계치_A 이상이면 유성음으로 간주하고, 세기_임계치_B 이하이면 무성음으로 간주하며, 피치는 피치_임계치_A와 피치_임계치_B를 설정하여, 유성음구간의 피치가 피치_임계치_A보다 낮으면 오류로 판단하고, 무성음구간의 피치가_피치_임계치_B보다 높으면 오류로 판단하는 것을 특징으로 전자적성문그래프 신호를 이용한 피치 추출 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 피치 오류구간 수정수단에서 오류구간을 수정하는 과정은,
    오류의 원인으로 판단된 전자적성문그래프(EGG) 이외에 성문의 진동정보를 포함하고 있는 음성신호를 이용하여 단구간 자기상관도(short-term autocorrelation)를 계산하고 최고점의 주기와 주파수를 찾아 피치를 추출한 후에, 오류구간에 해당하는 시작 프레임과 끝 프레임을 음성신호에서 찾아 해당 구간의 피치값을 대치(replacement)하는 것을 특징으로 하는 전자적성문그래프 신호를 이용한 피치 추출 장치.
  4. 음성인식 및 합성을 위한 피치를 추출하는 방법에 있어서,
    전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하는 제 1 단계;
    상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하는 제 2 단계; 및
    음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하는 제 3 단계
    를 포함하는 전자적성문그래프 신호를 이용한 피치 추출 방법.
  5. 제 4 항에 있어서,
    상기 제 2 단계는,
    음성신호로부터 유성음과 무성음을 구별하여 유성음에서 비정상적으로 낮은 피치와 무성음에서 비정상적으로 높은 피치를 오류로 판단하며, 음성신호의 세기(intensity)가 세기_임계치_A 이상이면 유성음으로 간주하고, 세기_임계치_B 이하이면 무성음으로 간주하며, 피치는 피치_임계치_A와 피치_임계치_B를 설정하여, 유성음구간의 피치가 피치_임계치_A보다 낮으면 오류로 판단하고, 무성음구간의 피치가_피치_임계치_B보다 높으면 오류로 판단하는 것을 특징으로 전자적성문그래프 신호를 이용한 피치 추출 방법.
  6. 제 4 항 또는 제 5 항에 있어서,
    상기 제 3 단계는,
    오류의 원인으로 판단된 전자적성문그래프(EGG) 이외에 성문의 진동정보를 포함하고 있는 음성신호를 이용하여 단구간 자기상관도(short-termautocorrelation)를 계산하고 최고점의 주기와 주파수를 찾아 피치를 추출한 후에, 오류구간에 해당하는 시작 프레임과 끝 프레임을 음성신호에서 찾아 해당 구간의 피치값을 대치(replacement)하는 것을 특징으로 하는 전자적성문그래프 신호를 이용한 피치 추출 장치.
  7. 프로세서를 구비한 피치 추출 장치에,
    전자적성문그래프(EGG) 신호로부터 제1 피치를 추출하는 제 1 기능;
    상기 제1 피치를 음성신호와 비교하여, 전자적성문그래프(EGG)의 오류로 인한 오류구간을 검출하는 제 2 기능; 및
    음성신호로부터 제2 피치를 추출하여, 상기 제2 피치 중 상기 제1 피치의 오류구간에 대응되는 부분을 찾아 상기 제1 피치의 오류구간을 대체(수정)하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020020058371A 2002-09-26 2002-09-26 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법 KR100923384B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020058371A KR100923384B1 (ko) 2002-09-26 2002-09-26 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020058371A KR100923384B1 (ko) 2002-09-26 2002-09-26 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20040026794A true KR20040026794A (ko) 2004-04-01
KR100923384B1 KR100923384B1 (ko) 2009-10-23

Family

ID=37329414

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020058371A KR100923384B1 (ko) 2002-09-26 2002-09-26 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100923384B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281744B (zh) * 2007-04-04 2011-07-06 纽昂斯通讯公司 语音分析方法和装置以及语音合成方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100269255B1 (ko) * 1997-11-28 2000-10-16 정선종 유성음 신호에서 성문 닫힘 구간 신호의 가변에의한 피치 수정방법
KR20000073638A (ko) * 1999-05-13 2000-12-05 김종찬 전자적성문그래프 검출장치 및 그 검출신호와 음성신호를 이용한음성분석방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281744B (zh) * 2007-04-04 2011-07-06 纽昂斯通讯公司 语音分析方法和装置以及语音合成方法和装置

Also Published As

Publication number Publication date
KR100923384B1 (ko) 2009-10-23

Similar Documents

Publication Publication Date Title
US8140330B2 (en) System and method for detecting repeated patterns in dialog systems
Dhananjaya et al. Voiced/nonvoiced detection based on robustness of voiced epochs
Deshmukh et al. Use of temporal information: Detection of periodicity, aperiodicity, and pitch in speech
US8880409B2 (en) System and method for automatic temporal alignment between music audio signal and lyrics
Rao et al. Vocal melody extraction in the presence of pitched accompaniment in polyphonic music
US8005666B2 (en) Automatic system for temporal alignment of music audio signal with lyrics
Kasi et al. Yet another algorithm for pitch tracking
Murty et al. Characterization of glottal activity from speech signals
Audhkhasi et al. Formant-based technique for automatic filled-pause detection in spontaneous spoken English
Yang et al. BaNa: A noise resilient fundamental frequency detection algorithm for speech and music
Hedelin et al. Pitch period determination of aperiodic speech signals
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
WO2007026436A1 (ja) ボーカル・フライ検出装置
Yarra et al. A mode-shape classification technique for robust speech rate estimation and syllable nuclei detection
KR100923384B1 (ko) 전자적성문그래프 신호를 이용한 피치 추출 장치 및 그 방법
Lin et al. A two-phase pitch marking method for TD-PSOLA synthesis.
CN107993649A (zh) 基于五门限的声音端点检测方法及其应用
JP2007292940A (ja) 音声識別装置及び音声識別方法
JP3635614B2 (ja) 機械音処理装置
Lin et al. A Novel Normalization Method for Autocorrelation Function for Pitch Detection and for Speech Activity Detection.
US20060150805A1 (en) Method of automatically detecting vibrato in music
Baghai-Ravary et al. Detecting gross alignment errors in the Spoken British National Corpus
Ishi et al. Perceptually-related acoustic-prosodic features of phrase finals in spontaneous speech.
Meen et al. Improving phone label alignment accuracy by utilizing voicing information
Ariga et al. Spotting parodies: Detecting alignment collapse between lyrics and singing voice

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121008

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131004

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee