KR960005739B1

KR960005739B1 - 음성검출장치

Info

Publication number: KR960005739B1
Application number: KR1019910000760A
Authority: KR
Inventors: 죠지 카네; 아끼라 노하라
Original assignee: 마쯔시다덴기산교 가부시기가이샤; 다니이 아끼오
Priority date: 1990-01-18
Filing date: 1991-01-18
Publication date: 1996-05-01
Also published as: FI20030087A; NO992257D0; FI117953B; EP0614171A1; NO992258D0; NO992256L; HK1010006A1; CA2034333C; DE69112855T2; NO992256D0; DE69132147T2; CA2034333A1; EP0439073B1; NO306489B1; AU6868891A; HK1010008A1; NO910221L; AU644124B2; EP0614169A1; FI20030089A

Abstract

내용 없음.

Description

음성검출장치

제1도와 제2도는 종래예의 음성검출장치의 블록도.

제3도는 본 발명의 제1실시예에 의한 음성검출장치의 블록도.

제4도는 본 발명의 제2실시예에 의한 음성검출장치의 블록도.

제5도는 캡스트럼의 특성을 나타내는 그래프.

제6도는 본 발명의 제3실시예에 의한 음성검출장치의 블록도.

제7도는 켑스트럼의 시간의존특성을 나타내는 그래프.

제8도는 본 발명의 제4실시예에 의한 음성검출장치의 블록도.

제9도는 본 발명의 제5실시예에 의한 음성검출장치의 블록도.

제10도는 상기 제5실시예의 동작을 설명하기 위한 켑스트럼의 특성을 나타내는 그래프.

* 도면의 주요부분에 대한 부호의 설명

(1),(5),(11),(71),(75) : 켑스트럼산출부

(2),(7),(13) : 평균값산출부 (3),(74),(714) : 음성검출부

(4),(10),(18) : 한계레벨설정부 (8),(14) : 켑스트럼가산부

(9),(15) : 비교부 (16),(17),(79),(710) : 메모리군

(72),(76) : 피크검출부 (73) : 분석구간설정부

(77) : 제어부 (78) : 구간데이터설정부

(711) : 구간데이터기억부 (97),(712),(713) : 스위치

본 발명은 음성검출에 사용되는 음성검출장치에 관한 거이다.

최근 음성인식, 화자인식, 음성에 의한 기기의 조작, 음성에 의한 컴퓨터에의 입력등에 적용하기 위해 음성의 유무를 검출하는 음성검출장치가 널리 사용되고 있다.

제1도는 종래의 음성검출장치를 도시한 블록도이다. 도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다. 파워검출부(19)는 입력신호로부터 파워값을 검출해서 비교기(21)에 의해 비교될 값을 출력하고, 다음에 비교기(21)는 상기 파워검출부(19)의 출력값과 미리 설정된 한계레벨설정부(20)의 설정값을 비교해서 상기 파워검출부(19)의 출력값이 상기 한계레벨설정부(20)의 설정값보다 큰 경우에 음성검출신호를 출력한다.

그러나 상기와 같은 종래의 음성검출장치에 의하면 입력신호가 음성이외의 잡음을 포함한 때에는 음성입력이 작은 경우에도 파워검출부에 의해 검출된 파워가 한겨레벨설정부의 설정값보다 크면 음성검출신호를 출력하므로, 오검출이 많다는 불편이 발생한다.

또한, 음성검출장치는, 검출정밀도를 높이기 위한 음성스펙트럼의 특징을 이용하여 잡음중에서 음성의 유무를 검출하는 방법이 검토되고 있다.

제2도는 종래의 음성검출장치를 도시한 블록도이다. 도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다. 켑스트럼검출부(22)는 음성입력으로부터 켑스트럼을 검출해서 피크검출부에 공급한다. 피크검출부(23)는 켑스트럼으로부터 피크를 검출해서 음성검출부(24)에 공급한다. 음성검출부(24)에서는 켑스트럼피크를 미리 설정한 한계치와 비교하여 음성의 유무를 판별해서 음성검출신호를 출력한다.

그러나 상기와 같은 종래의 음성검출장치에 의하면, 검출된 캡스트럼값으로부터 얻은 켑스트럼피크를 구하기 위한 처리시간이 매우 길게 걸린다고 하는 문제가 있었다.

본 발명의 목적은, 켑스트럼 분석방법을 이용하여 실시간내에 음성을 정확하게 검출하는 음성검출장치를 제공하는데 있다.

상기 목적을 달성하기 위하여, 본 발명의 제1측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시(quefrency)구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 상기 켑스트럼 값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부와 상기 제1비교부로부터 출력된 켑스트럼값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하는 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 제2비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.

상기 구성에 의해, 잡음이 있는 경우에도 켑스트럼의 피크를 정확하게 검출할 수 있고 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 고정밀도로 검출할 수 있다.

본 발명의 제2측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여, 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.

상기 구성에 의해, 켑스트럼피크의 형상에 대한 피크검출의 의존성이 적게되어 음성을 고정밀도로 검출할 수 있다. 또한, 퀴프렌시구간을 미리 설정하는 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 검출할 수 있다.

본 발명의 제3측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프레시구간에서 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 상기 켑스트럼값을 기억하는 n조의 제1메모리군과 상기 평균값산출수단의 상기 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과 상기 제1메모리에 대응하는 조의 제2메모리로부터 출력하는 켑스트럼평균값을 초과하는 제1메모리의 켑스트럼값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.

상기 구성에 의해, 상기 메모리군에 시계열적으로 데이터를 축적할 수 있으므로, 켑스트럼값의 시간의 존성에 의한 변화를 검출할 수 있고 또한 한층더 정확한 음성을 검출할 수 있다. 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 검출할 수 있다.

본 발명의 제4측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 한다.

상기 구성에 의해, 켑스트럼피크의 분석구간이 최적의 상태로 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개선된다. 또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 제한되므로 정확한 음성검출을 동일의 화자에 대해 행할 수 있다. 또한, 음성이 잡음에 의해 중첩되는 경우에도 분석될 켑스트러피크를 제한할 수 있으므로, 음성검출을 고정밀도로 행할 수 있고 양호한 동작성능을 얻을 수 있다.

본 발명의 제5측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 제2스위치에 의해 선택되는 제1메모리군 또는 제2메모리군의 출력에 대응하는 퀴프렌시구간에서, 상기 켑스트럼 산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크에 의거하여 분석될 퀴프렌시구간을 설정하는 구간데이터설정수단과, 상기 구간데이터설정수단에서 설정된 퀴프렌시구간이 제1스위치를 통하여 기억되는 제1메모리군과, 미리 설정된 구간데이터가 기억되어 있는 제2메모리군과, 상기 복수의 메모리군의 메모리출력을 선택하는 제2스위치와, 동작모드에 응답하여 상기 제1스위치와 상기 제2스위치를 제어하는 제어수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 한다.

상기 구성에 의해, 미리 설정된 분석구간과 입력에 응답하여 켑스트럼피크의 분석구간이 최적의 상태로 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개선된다. 또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 재한되므로 정확한 음성검출을 동일의 화자에 대해 행할 수 있다. 메모리군의 수를 증가하여 분석구간을 여러가지 방식으로 설정할 수도 있다.

이하 본 발명의 실시예에 대해서 도면을 참조하면서 설명한다.

제3도는 본 발명의 제1실시예에 의한 음성처리장치의 블록도를 도시한다.

상기 제3도를 참조하면서 음성검출장치의 구성과 동작에 대하여 이하 설명한다,.

켑스트럼산출수단인 켑스트럼산출부(1)는 입력된 음성신호로부터 켑스트럼값을 산출한다. 평균치산출수단인 평균치산출부(2)는, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출부(1)의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출한다. 음성검출수단인 음성검출부(3)는, 켑스트럼산출부(1)의 켑스트럼값과 평균값산출부(2)의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부(도시되지 않음)와, 상기 제1비교부로부터 출력된 켑스트럼값과 한계레벨설정수단인 한계레벨설정수단(4)의 음성검출한계레벨신호를 비교하여 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 제2비교부(도시되지 않음)를 가진다. 이때에, 한계레벨설정부(4)는 특정한 방정식에 의해 산출된 값을 가진 음성검출한계신호를 상기 평균치산출부의(2)의 상기 켑스트럼 평균값에 의거하여 발생해서, 음성검출부(3)에 의한 음성검출부의 최소레벨을 켑스트럼평균값에 따라서 규정한다.

상기한 바와 같은 본 실시예에 의하면, 잡음이 있는 경우에도, 캡스트럼의 피크를 정확하게 검출할 수 있으므로, 음성을 고정밀도로 검출할 수 있다.

즉, 본 발명은, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출부와, 미리 설정된 퀴프렌시구간에서 켑스트럼의 평균값을 산출하는 평균값산출부와, 켑스트럼의 피크를 판정하고 판정된 값과 기준값을 비교하여, 음성의 유무를 검출하는 음성검출부와, 상기 켑스트럼의 평균값을 사용하여 음성검출부의 한계값을 설정하는 한계레벨설정부를 포함한 구성에 의해, 잡음을 가진 환경하에서도 켑스트럼피크값을 정확하게 검출할 수 있고 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 고정밀도로 검출할 수 있다.

다음에 본 발명의 제2실시예에 대해서 도면을 참조하면서 설명한다.

제4도는 본 발명의 제2실시예에 의한 음성검출장치의 블록도를 도시한다.

제5도는 제4도의 켑스트럼산출부(5)의 켑스트럼을 도시한 것으로서, 실제로는 이산치이지만, 포락선으로 표시되어 있다. 제4도에 도시한 제2실시예의 음성검출장치의 구성과 동작에 대해서 제5도와 함께 설명한다. 우선, 켑스트럼산출부(5)에 음성신호가 입력되어 켑스트럼을 얻는다. 켑스트럼의 일부는 평균값산출부(7)에 공급되어 제5도에 도시한 퀴프렌시구간(a-b)에서 켑스트럼평균값레벨(m)을 얻는다. 켑스트럼산출부(5)의 켑스트럼값과 평균값산출부(7)의 켑스트럼평균값이 켑스트럼가산부(8)에 공급된다. 다음에, 켑스트럼가산부(8)는, 제5도에 도시한 퀴프렌시구간(a-b)의 범위내에 있는 퀴프렌시폭(W)에서, 켑스트럼평균값레벨(m)과 동일하거나 켑스트럼균값레벨(m)보다 큰 켑스트럼값을 가산하고, 켑스트럼가산결과를 비교부(9)에 공급한다. 켑스트럼가산부(8)의 켑스트럼가산값과 한계레벨설정부(10)의 음성검출한계레벨신호가 비교부(9)에 공급되고, 켑스트럼가산값이 음성검출한계레벨신호보다 큰때에는 음성신호를 출력한다. 이때에, 한계레벨설정부(10)는 특정한 방정식에 따른 음성검출한계레벨신호를 제5도에 도시한 켑스트럼평균값레벨(m)에 의거하여 계산하고, 켑스트럼가산값과 비교될 상기 음성검출한계레벨신호를 비교부(9)에 공급한다.

상기한 바와 같이 상기 실시예에 의하면, 켑스트럼피크를 정확하게 검출할 수 있고, 또한 켑스트럼피크부근의 켑스트럼형상에 대한 의존성이 적게 되어 켑스트럼피크의 검출능력이 높게 되므로, 음성을 고정밀도로 검출할 수 있다. 또한, 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정함으로써 입력신호의 크기에 의존하지 않고 음성검출을 행할 수 있다.

즉, 음성검출부가, 켑스트럼평균값보다 큰때에는 켑스트럼값을 가산하는 켑스트럼가산부와, 한계레벨설정부의 음성검출한계레벨신호와 켑스트럼가산부의 가산결과를 비교하여 음성검출을 행하는 비교부를 가지도록함으로써, 켑스트럼피크의 형상에 대한 피크검출의 의존성이 적게되어 음성을 고정밀도로 검출할 수 있다. 또한, 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간애에 검출할 수 있다. 또한, 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하므로 입력신호의 크기에 의존함이 없이 음성을 검출할 수 있다.

다음에 본 발명의 제3실시예에 대해서 도면을 참조하면서 설명한다.

제6도는 본 발명의 제3실시예에 의한 음성검출장치의 블록도를 도시하고, 제7도는 켑스트럼산출부(11)의 켑스트럼값을 도시한다. 제7도에서 구간(a-b)은 퀴프렌시구간을 나타내고, "ml", "mn"은 각각 시간(tl), (tn)에 대한 구간(a-b)에서의 켑스트럼평균값을 나타내고, "W"는 피크검출폭을 나타낸다. 제3실시예에 의한 음성검출장치의 구성과 동작에 대하여 제6도와 제7도를 참조하면서 이하 설명한다. 우선, 켑스트럼산출부(11)는 음성신호를 입력하고, 입력된 음성신호로부터 켑스트럼출력을 얻는다. 켑스트럼출력의 일부를 평균값산출부(13)에 공급되어 제7도에 도시한 퀴프렌시구간(a-b)에서 켑스트럼평균값을 얻는다. 복수의 n개의 기억장소를 가진 메모리군(17)에 평균값산출부(13)의 켑스트럼평균값이 공급되어 제7도에 도시한 시간(t1)에서의 켑스트럼평균값(ml)으로부터 시간(tn)에서의 켑스트럼평균값(mn)까지를 기억하고, 기억된 켑스트럼평균값을 켑스트럼가산부(14)에 공급한다. 또한, n조의 기억장소를 가진 메모리군(16)에 켑스트럼산출부(11)의 켑스트럼값이 공급되어 제7도에서 도시한 시간(t1)부터 시간(tn)가지의 켑스트럼값을 기억하고, 기억된 켑스트럼값을 켑스트럼가산부(14)에 공급한다. 켑스트럼가산부(14)에 메모리군(16)의 켑스트럼값과 메모리군(17)의 켑스트럼 평균값이 공급되고, 제7도에 도시한 시간(tl)부터 시간(tn)까지의 기간동안 각각의 시간(t1)∼(tn)마다 퀴프렌시구간(a-b)에 나타난 폭(W)에 대해서 켑스트럼평균값보다 큰 켑스트럼값을 가산하고, 켑스트럼의 가산결과를 비교부(15)에 공급한다. 켑스트럼 가산부(14)의 켑스트럼가산값과 한계레벨설정부(18)에서 설정된 음성검출한계레벨신호가 비교부(15)에 공급되고, 켑스트럼가산값이 음성검출한계레벨신호보다 큰 경우에 음성검출신호를 출력한다. 이때, 한계레벨설정부(18)는 제7도에 도시한 시간(tl)부터 시간(tn)사이의 기간동안 켑스트럼평균값에 의거하여 설정된 음성검출한계레벨신호와 켑스트럼가산값을 비교하기 위해, 상기 음성검출한계레벨신호를 비교부(15)에 공급한다. 메모리군(16), (17)은 상기 메모리군(16), (17)에 새로운 입력이 있으면 오래된 메이러는 다음의 기억장소로 시프트되어, 항상 복수의 데이터가 병렬로 비교될 수 있는 상태로 되어 있다. 상기한 바와 같이 본 실시예에 의하면, 켑스트럼피크의 시간의 존성에 따른 변화를 비교함으로써 보다 정확한 음성검출을 행할 수 있다.

즉, 음성검출부가, 켑스트럼값을 기억하는 n조의 제1메모리군과 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과, 켑스트럼평균값보다 큰 경우에 켑스트럼값을 가산하는 켑스트럼가산부와 한계레벨설정부의 음성검출한계레벨신호와 켑스트럼가산부의 켑스트럼가산값을 비교해서 음성을 검출하는 비교부를 포함한 구성을 가지도록 함으로써, 상기 메모리군에서 시계열적으로 데이터를 축적할 수 있고, 이에 의해 켑스트럼값의 시간의 존성에 의한 시간변화를 검출할 수 있어 한층더 정확한 음성을 검출할 수 있다. 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제할할 수 있으므로, 음성을 실시간내에 검출할 수 있다.

다음에 본 발명의 제4실시예에 대해서 도면을 참조하면서 설명한다.

제8도는 본 발명의 제4실시예에 의한 음성검출장치의 블록도를 도시한다.

도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다.

우선, 켑스트러만출수단인 켑스트럼산출부(71)는 음성신호가 입력되고 상기 음성신호로부터 켑스트럼값을 산출한다. 피크검출수단인 피크검출부(72)는 상기 켑스트럼값이 공급되고, 분석구간설정부(73)로부터 지시되는 분석구간에서 켑스트럼피크를 얻는다.

음성검출수단인 음성검출부(74)는 상기 켑스트럼피크를 미리 설정된 한계치와 비교하고, 입력이 음성으로 판정되는 경우 음성검출신호를 출력한다. 이때에, 분석구간 설정수단인 분석구간설정부(73)는 피크검출부(72)에 분석구간을 지시하고, 또한 상기 분석구간설정부(73)는 이하에 설명하는 방식으로 동작모드설정신호에 의해 제어된다. 우선, 상기 분석구간설정부(73)는, 제1동작모드시에는 미리 설정된 퀴프렌시분석구간을 피클검출부(72)에 지시하고, 또한 피크검출부(72)로부터 얻은 켑스트럼피크에 응답하여 제2동작모드시에 피크검출부(72)에 지시하기 위한 퀴프렌시분석구간을 설정한다. 다음에, 제2동작모드시에는 제1동작모드시에 설정된 분석구간을 피크검출부(72)에 지시한다.

수동동작의 동작모드설정신호에 의하거나 또는 특정한 시간의 경과후나 특정한 회수의 음성검출신호의 출력후에 자동발생의 동작모드설정신호에 의해서, 상기 제1모드에서 제2모드로 시프트되어도 된다.

상기한 바와 같은 본 실시예에 의하면, 켑스트럼피크의 분석구간을 미리 설정할 수 있으므로, 켑스트럼피크를 검출하는 분석구간을 좁힐 수 있어 처리속도를 개선할 수 있다.

또한, 검출될 켑스트럼피크의 범위는 제1동작모드시에 검출해서 화자에 따라서 좁혀지므로, 동일의 화자에 대한 음성을 정확하게 검출할 수 있다. 또한, 다른 음성잡음이 일시적으로 중첩된 경우에도 검출될 켑스트럼피크의 범위를 좁히고 있으므로, 음성을 정확하게 검출할 수 있다.

즉, 상기 설명으로부터 명백한 바와 같이, 본 발명은, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크가 공급되어 음성을 검출하는 음성검출수단을 포함함으로써, 켑스트럼피크의 분석구간이 최적의 상태로 미리 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개시된다.

또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 제한되므로 정확한 음성검출츨 동일의 화자에 대해 행할 수 있다. 또한, 음성이 잡음에 의해 중첩되는 경우에도 분석될 캡스트럼피크를 제한할 수 있으므로, 음성검출을 고정밀도로 행할 수 있고 양호한 동작성능을 얻을 수 있다.

다음에 본 발명의 제5실시예에 대해서 도면을 참조하면서 설명한다.

제9도는 본 발명의 제5실시예에 의한 음성검출장치의 블록도이다.

상기 제9도를 참조하면서 음성검출장치의 구성과 동작에 대하여 설명한다. 우선, 켑스트럼산출부(75)는, 입력되는 음성신호로부터 켑스트럼값을 산출하여 피크검출부(76)에 공급한다. 피크검출부(76)는 상기 켑스트럼 값으로부터 피크를 검출하고, 이때에, 구간데이터기억부(711)로 부터 제2스위치(712)를 통하여 얻은 퀴프렌시 구간데이터를 사용해서 켑스트럼산출부(75)로 부터 얻은 켑스트럼값의 피크검출폭이 제어된다. 음성검출부(714)는 피크검출부(76)로부터 검출된 켑스트럼피크를 미리 설정된 한계값과 비교하고, 입력이 음성으로 판정되는 경우에 음성검출신호를 출력한다. 이때에, 구간데이터설정부(78)는 피크검출부(76)로부터 공급된 켑스트럼피크에 의거해서 검출될 퀴프렌시구간을 설정한다. 동작모드에 응답하여 제어부(77)의 제어신호에 의해서 제1스위치(713)을 ON함으로써 구간데이터설정부(78)에서 설정된 구간데이터가 제1메모리군(79)에 기록된다. 제어부(77)는, 상기한 바와 같이 제1스위치(713)를 제어하는 동시에 제2스위치(712)로 동작모드에 응답하여 제어한다. 제2스위치(712)는, 제1스위치(713)가 OFF인 경우에는 제1메모리군(79)에 접속되고, 제1스위치(713)가 ON인 경우에는 제2메모리군(710)에 접속되도록 제어된다. 구간데이터기억부(711)의 제1메모리군(79)과 제2메모리군(710)의 구간데이터를 동작모드에 응답하여 각각 피크검출부의 분석구간데이터로서 제2스위치(712)를 통하여 피크검출부(76)에 공급된다.

제2메모리군(710)에 미리 구간데이터가 설정되어 있다.

다음에 제10도를 참조하면서 피크검출부(76)에 공급되는 구간데이터에 대하여 상세하게 설명한다.

제10도는 켑스트럼산출부(75)로부터 산출된 켑스트럼값을 도시한 것으로서, 실제로는 이산치이지만, 편의상 도면에서는 포탁선으로 표시하고 있다. "P"는 켑스트럼피크의 퀴프렌시이고, "a₀-b₀"은 제2메모리군(710)에 미리 기억되어 있는 분석구간이고, "a₁-b₁"은 제1메모리군(79)에 기억되어 있는 분석구간이다. 음성입력에 대해서는 제10도에 도시한 바와 같이 퀴프렌서(P)의 위치에서 켑스트럼피크가 발생한다.

우선, 제1모드시에 제어부(77)에 의해서 제2스위치(712)가 제2메모리군(710)에 접속되고, 제1스위치(713)가 제1메모리군(79)에 접속된 경우를 생각할 수 있다. 이 경우에, 음성입력이 존재하면, 제2스위치(712)가 제2메모리군(710)에 접속되어 있으므로, 피크검출부(76)는 메모리내용인 구간데이터 (a₀-b₀)에서 켑스트럼피크를 검출하여, 켑스트럼피크의 퀴프렌시(P)를 얻는다. 구간데이터설정부(78)는 피크검출부(76)에서 검출된 켑스트럼피크인 퀴프렌시(P)를 사용하여 퀴렌시(P)근처의 값을 선택하여 구간데이터 (a₁-b₁)를 구하고, 제1스위치(713)를 통하여 제1메모리군(79)에 구간데이터 (a₁-b₁)를 기억한다. 다음에 제2모드시에는, 제어부(77)에 의해서 제2스위치(712)가 제1메모리군(79)에 접속되고, 제1스위치(713)가 OFF가 된 경우를 생각할 수 있다. 이 경우에 제2스위치(712)가 제1메모리군(79)에 접속되어 있으므로, 피크검출부(76)는 제1메모리를 (79)의 구간데이터(a₁-b₁)에서 켑스트럼피크를 검출한다. 모드의 절환에 대해서는 제8도의 설명과 마찬가지로 생각하면 된다.

상기한 바와 같이 상기 실시예에 의하면, 켑스트럼피크분석구간을 미리 설정하여 메모리에 기억해둠으로써, 항상 최적의 켑스트럼피크분석구간이 공급될 수 있고, 또한 최적의 켑스트럼피크분석구간에 응답하여 한층더 좁은 분석구간을 다시 설정할 수 있으므로, 처리시간을 단축함과 동시에 잡음방해에 대해서 음성을 고정밀도로 검출할 수 있다. 또한 일단 분석구간을 설정해두면 분석구간이 항상 유효하므로, 우수한 조작성으로 효과적인 음성검출처리를 행할 수 있다. 또한 상기 메모리군은 2조에 한정되지 않고, 필요에 따라 추가하고, 그중에서 선택적으로 사용하여도 된다.

즉, 본 발명의 제5실시예에서는, 본 발명의 제4실시예의 분석구간설정수단을 대신해서, 구간데이터설정수단과, 복수의 메모리군과, 구간데이터를 제1메모리에 접속하는 제1스위치와, 복수의 메모리군의 구간데이터를 선택해서 피크검출부에 공급하는 제2스위치와, 상기 제1, 제2스위치를 동작모드에 응답하여 제어하는 제어부를 포함하고 있으므로, 본 발명의 제4실시예와 마찬가지로 미리 설정된 분석구간과 입력에 응답하여 켑스트럼 분석구간을 좁히므로, 본 발명의 제4실시예와 마찬가지의 효과를 얻을 수 있고, 메모리군의 수를 증가하여 분석구간을 여러가지 방식으로 설정할 수도 있다.

Claims

음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시(quefrency)구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부와 상기 제1비교부로부터 출력된 켑스트럼값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하는 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에 음성검출신호를 출력하는 제2비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여, 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출 한계레벨신호를 설정하는 한계레벨설정수단과 상기 켑스트럼산출수단의 상기 켑스트럼값을 기억하는 n조의 제1메모리군과 상기 평균값산출수단의 상기 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과 상기 제1메모리에 대응하는 조의 제2메모리로부터 출력하는 켑스트럼평균값을 초가하는 제1메모리의 켑스트럼과값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 제2스위치에 의해 선택되는 제1메모리군 또는 제2메모리군의 출력에 대응하는 퀴프렌시구간에서, 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크에 의거하여, 분석될 퀴프렌시구간을 설정하는 구간데이터설정수단과, 상기 구간데이터설정수단에서 설정된 퀴프렌시구간이 제1스위치를 통하여 기억되는 제1메모리군과, 미리 설정된 구간데이터가 기억되는 있는 제2메모리군과, 상기 복수의 메모리군의 메모리 출력을 선택하는 제2스위치와, 동작모드에 응답하여 상기 제1스위치와 상기 제2스위치를 제어하는 제어수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.