KR960005739B1 - 음성검출장치 - Google Patents

음성검출장치 Download PDF

Info

Publication number
KR960005739B1
KR960005739B1 KR1019910000760A KR910000760A KR960005739B1 KR 960005739 B1 KR960005739 B1 KR 960005739B1 KR 1019910000760 A KR1019910000760 A KR 1019910000760A KR 910000760 A KR910000760 A KR 910000760A KR 960005739 B1 KR960005739 B1 KR 960005739B1
Authority
KR
South Korea
Prior art keywords
strum
value
peak
voice detection
cepstrum
Prior art date
Application number
KR1019910000760A
Other languages
English (en)
Other versions
KR910014869A (ko
Inventor
죠지 카네
아끼라 노하라
Original Assignee
마쯔시다덴기산교 가부시기가이샤
다니이 아끼오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2008595A external-priority patent/JP2712692B2/ja
Priority claimed from JP2008592A external-priority patent/JP2712691B2/ja
Priority claimed from JP2017348A external-priority patent/JPH03220600A/ja
Priority claimed from JP2026506A external-priority patent/JP2712703B2/ja
Priority claimed from JP2026507A external-priority patent/JP2712704B2/ja
Priority claimed from JP2034297A external-priority patent/JP2712708B2/ja
Application filed by 마쯔시다덴기산교 가부시기가이샤, 다니이 아끼오 filed Critical 마쯔시다덴기산교 가부시기가이샤
Publication of KR910014869A publication Critical patent/KR910014869A/ko
Priority to KR1019940023426A priority Critical patent/KR950001068B1/ko
Priority to KR1019940023427A priority patent/KR950001069B1/ko
Application granted granted Critical
Publication of KR960005739B1 publication Critical patent/KR960005739B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Selective Calling Equipment (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

내용 없음.

Description

음성검출장치
제1도와 제2도는 종래예의 음성검출장치의 블록도.
제3도는 본 발명의 제1실시예에 의한 음성검출장치의 블록도.
제4도는 본 발명의 제2실시예에 의한 음성검출장치의 블록도.
제5도는 캡스트럼의 특성을 나타내는 그래프.
제6도는 본 발명의 제3실시예에 의한 음성검출장치의 블록도.
제7도는 켑스트럼의 시간의존특성을 나타내는 그래프.
제8도는 본 발명의 제4실시예에 의한 음성검출장치의 블록도.
제9도는 본 발명의 제5실시예에 의한 음성검출장치의 블록도.
제10도는 상기 제5실시예의 동작을 설명하기 위한 켑스트럼의 특성을 나타내는 그래프.
* 도면의 주요부분에 대한 부호의 설명
(1),(5),(11),(71),(75) : 켑스트럼산출부
(2),(7),(13) : 평균값산출부 (3),(74),(714) : 음성검출부
(4),(10),(18) : 한계레벨설정부 (8),(14) : 켑스트럼가산부
(9),(15) : 비교부 (16),(17),(79),(710) : 메모리군
(72),(76) : 피크검출부 (73) : 분석구간설정부
(77) : 제어부 (78) : 구간데이터설정부
(711) : 구간데이터기억부 (97),(712),(713) : 스위치
본 발명은 음성검출에 사용되는 음성검출장치에 관한 거이다.
최근 음성인식, 화자인식, 음성에 의한 기기의 조작, 음성에 의한 컴퓨터에의 입력등에 적용하기 위해 음성의 유무를 검출하는 음성검출장치가 널리 사용되고 있다.
제1도는 종래의 음성검출장치를 도시한 블록도이다. 도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다. 파워검출부(19)는 입력신호로부터 파워값을 검출해서 비교기(21)에 의해 비교될 값을 출력하고, 다음에 비교기(21)는 상기 파워검출부(19)의 출력값과 미리 설정된 한계레벨설정부(20)의 설정값을 비교해서 상기 파워검출부(19)의 출력값이 상기 한계레벨설정부(20)의 설정값보다 큰 경우에 음성검출신호를 출력한다.
그러나 상기와 같은 종래의 음성검출장치에 의하면 입력신호가 음성이외의 잡음을 포함한 때에는 음성입력이 작은 경우에도 파워검출부에 의해 검출된 파워가 한겨레벨설정부의 설정값보다 크면 음성검출신호를 출력하므로, 오검출이 많다는 불편이 발생한다.
또한, 음성검출장치는, 검출정밀도를 높이기 위한 음성스펙트럼의 특징을 이용하여 잡음중에서 음성의 유무를 검출하는 방법이 검토되고 있다.
제2도는 종래의 음성검출장치를 도시한 블록도이다. 도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다. 켑스트럼검출부(22)는 음성입력으로부터 켑스트럼을 검출해서 피크검출부에 공급한다. 피크검출부(23)는 켑스트럼으로부터 피크를 검출해서 음성검출부(24)에 공급한다. 음성검출부(24)에서는 켑스트럼피크를 미리 설정한 한계치와 비교하여 음성의 유무를 판별해서 음성검출신호를 출력한다.
그러나 상기와 같은 종래의 음성검출장치에 의하면, 검출된 캡스트럼값으로부터 얻은 켑스트럼피크를 구하기 위한 처리시간이 매우 길게 걸린다고 하는 문제가 있었다.
본 발명의 목적은, 켑스트럼 분석방법을 이용하여 실시간내에 음성을 정확하게 검출하는 음성검출장치를 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명의 제1측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시(quefrency)구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 상기 켑스트럼 값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부와 상기 제1비교부로부터 출력된 켑스트럼값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하는 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 제2비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.
상기 구성에 의해, 잡음이 있는 경우에도 켑스트럼의 피크를 정확하게 검출할 수 있고 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 고정밀도로 검출할 수 있다.
본 발명의 제2측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여, 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.
상기 구성에 의해, 켑스트럼피크의 형상에 대한 피크검출의 의존성이 적게되어 음성을 고정밀도로 검출할 수 있다. 또한, 퀴프렌시구간을 미리 설정하는 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 검출할 수 있다.
본 발명의 제3측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프레시구간에서 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 상기 켑스트럼값을 기억하는 n조의 제1메모리군과 상기 평균값산출수단의 상기 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과 상기 제1메모리에 대응하는 조의 제2메모리로부터 출력하는 켑스트럼평균값을 초과하는 제1메모리의 켑스트럼값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 한다.
상기 구성에 의해, 상기 메모리군에 시계열적으로 데이터를 축적할 수 있으므로, 켑스트럼값의 시간의 존성에 의한 변화를 검출할 수 있고 또한 한층더 정확한 음성을 검출할 수 있다. 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 검출할 수 있다.
본 발명의 제4측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 한다.
상기 구성에 의해, 켑스트럼피크의 분석구간이 최적의 상태로 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개선된다. 또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 제한되므로 정확한 음성검출을 동일의 화자에 대해 행할 수 있다. 또한, 음성이 잡음에 의해 중첩되는 경우에도 분석될 켑스트러피크를 제한할 수 있으므로, 음성검출을 고정밀도로 행할 수 있고 양호한 동작성능을 얻을 수 있다.
본 발명의 제5측면에 따른 음성검출장치는, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 제2스위치에 의해 선택되는 제1메모리군 또는 제2메모리군의 출력에 대응하는 퀴프렌시구간에서, 상기 켑스트럼 산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크에 의거하여 분석될 퀴프렌시구간을 설정하는 구간데이터설정수단과, 상기 구간데이터설정수단에서 설정된 퀴프렌시구간이 제1스위치를 통하여 기억되는 제1메모리군과, 미리 설정된 구간데이터가 기억되어 있는 제2메모리군과, 상기 복수의 메모리군의 메모리출력을 선택하는 제2스위치와, 동작모드에 응답하여 상기 제1스위치와 상기 제2스위치를 제어하는 제어수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 한다.
상기 구성에 의해, 미리 설정된 분석구간과 입력에 응답하여 켑스트럼피크의 분석구간이 최적의 상태로 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개선된다. 또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 재한되므로 정확한 음성검출을 동일의 화자에 대해 행할 수 있다. 메모리군의 수를 증가하여 분석구간을 여러가지 방식으로 설정할 수도 있다.
이하 본 발명의 실시예에 대해서 도면을 참조하면서 설명한다.
제3도는 본 발명의 제1실시예에 의한 음성처리장치의 블록도를 도시한다.
상기 제3도를 참조하면서 음성검출장치의 구성과 동작에 대하여 이하 설명한다,.
켑스트럼산출수단인 켑스트럼산출부(1)는 입력된 음성신호로부터 켑스트럼값을 산출한다. 평균치산출수단인 평균치산출부(2)는, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출부(1)의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출한다. 음성검출수단인 음성검출부(3)는, 켑스트럼산출부(1)의 켑스트럼값과 평균값산출부(2)의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부(도시되지 않음)와, 상기 제1비교부로부터 출력된 켑스트럼값과 한계레벨설정수단인 한계레벨설정수단(4)의 음성검출한계레벨신호를 비교하여 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 제2비교부(도시되지 않음)를 가진다. 이때에, 한계레벨설정부(4)는 특정한 방정식에 의해 산출된 값을 가진 음성검출한계신호를 상기 평균치산출부의(2)의 상기 켑스트럼 평균값에 의거하여 발생해서, 음성검출부(3)에 의한 음성검출부의 최소레벨을 켑스트럼평균값에 따라서 규정한다.
상기한 바와 같은 본 실시예에 의하면, 잡음이 있는 경우에도, 캡스트럼의 피크를 정확하게 검출할 수 있으므로, 음성을 고정밀도로 검출할 수 있다.
즉, 본 발명은, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출부와, 미리 설정된 퀴프렌시구간에서 켑스트럼의 평균값을 산출하는 평균값산출부와, 켑스트럼의 피크를 판정하고 판정된 값과 기준값을 비교하여, 음성의 유무를 검출하는 음성검출부와, 상기 켑스트럼의 평균값을 사용하여 음성검출부의 한계값을 설정하는 한계레벨설정부를 포함한 구성에 의해, 잡음을 가진 환경하에서도 켑스트럼피크값을 정확하게 검출할 수 있고 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간내에 고정밀도로 검출할 수 있다.
다음에 본 발명의 제2실시예에 대해서 도면을 참조하면서 설명한다.
제4도는 본 발명의 제2실시예에 의한 음성검출장치의 블록도를 도시한다.
제5도는 제4도의 켑스트럼산출부(5)의 켑스트럼을 도시한 것으로서, 실제로는 이산치이지만, 포락선으로 표시되어 있다. 제4도에 도시한 제2실시예의 음성검출장치의 구성과 동작에 대해서 제5도와 함께 설명한다. 우선, 켑스트럼산출부(5)에 음성신호가 입력되어 켑스트럼을 얻는다. 켑스트럼의 일부는 평균값산출부(7)에 공급되어 제5도에 도시한 퀴프렌시구간(a-b)에서 켑스트럼평균값레벨(m)을 얻는다. 켑스트럼산출부(5)의 켑스트럼값과 평균값산출부(7)의 켑스트럼평균값이 켑스트럼가산부(8)에 공급된다. 다음에, 켑스트럼가산부(8)는, 제5도에 도시한 퀴프렌시구간(a-b)의 범위내에 있는 퀴프렌시폭(W)에서, 켑스트럼평균값레벨(m)과 동일하거나 켑스트럼균값레벨(m)보다 큰 켑스트럼값을 가산하고, 켑스트럼가산결과를 비교부(9)에 공급한다. 켑스트럼가산부(8)의 켑스트럼가산값과 한계레벨설정부(10)의 음성검출한계레벨신호가 비교부(9)에 공급되고, 켑스트럼가산값이 음성검출한계레벨신호보다 큰때에는 음성신호를 출력한다. 이때에, 한계레벨설정부(10)는 특정한 방정식에 따른 음성검출한계레벨신호를 제5도에 도시한 켑스트럼평균값레벨(m)에 의거하여 계산하고, 켑스트럼가산값과 비교될 상기 음성검출한계레벨신호를 비교부(9)에 공급한다.
상기한 바와 같이 상기 실시예에 의하면, 켑스트럼피크를 정확하게 검출할 수 있고, 또한 켑스트럼피크부근의 켑스트럼형상에 대한 의존성이 적게 되어 켑스트럼피크의 검출능력이 높게 되므로, 음성을 고정밀도로 검출할 수 있다. 또한, 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정함으로써 입력신호의 크기에 의존하지 않고 음성검출을 행할 수 있다.
즉, 음성검출부가, 켑스트럼평균값보다 큰때에는 켑스트럼값을 가산하는 켑스트럼가산부와, 한계레벨설정부의 음성검출한계레벨신호와 켑스트럼가산부의 가산결과를 비교하여 음성검출을 행하는 비교부를 가지도록함으로써, 켑스트럼피크의 형상에 대한 피크검출의 의존성이 적게되어 음성을 고정밀도로 검출할 수 있다. 또한, 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제한할 수 있으므로, 음성을 실시간애에 검출할 수 있다. 또한, 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하므로 입력신호의 크기에 의존함이 없이 음성을 검출할 수 있다.
다음에 본 발명의 제3실시예에 대해서 도면을 참조하면서 설명한다.
제6도는 본 발명의 제3실시예에 의한 음성검출장치의 블록도를 도시하고, 제7도는 켑스트럼산출부(11)의 켑스트럼값을 도시한다. 제7도에서 구간(a-b)은 퀴프렌시구간을 나타내고, "ml", "mn"은 각각 시간(tl), (tn)에 대한 구간(a-b)에서의 켑스트럼평균값을 나타내고, "W"는 피크검출폭을 나타낸다. 제3실시예에 의한 음성검출장치의 구성과 동작에 대하여 제6도와 제7도를 참조하면서 이하 설명한다. 우선, 켑스트럼산출부(11)는 음성신호를 입력하고, 입력된 음성신호로부터 켑스트럼출력을 얻는다. 켑스트럼출력의 일부를 평균값산출부(13)에 공급되어 제7도에 도시한 퀴프렌시구간(a-b)에서 켑스트럼평균값을 얻는다. 복수의 n개의 기억장소를 가진 메모리군(17)에 평균값산출부(13)의 켑스트럼평균값이 공급되어 제7도에 도시한 시간(t1)에서의 켑스트럼평균값(ml)으로부터 시간(tn)에서의 켑스트럼평균값(mn)까지를 기억하고, 기억된 켑스트럼평균값을 켑스트럼가산부(14)에 공급한다. 또한, n조의 기억장소를 가진 메모리군(16)에 켑스트럼산출부(11)의 켑스트럼값이 공급되어 제7도에서 도시한 시간(t1)부터 시간(tn)가지의 켑스트럼값을 기억하고, 기억된 켑스트럼값을 켑스트럼가산부(14)에 공급한다. 켑스트럼가산부(14)에 메모리군(16)의 켑스트럼값과 메모리군(17)의 켑스트럼 평균값이 공급되고, 제7도에 도시한 시간(tl)부터 시간(tn)까지의 기간동안 각각의 시간(t1)∼(tn)마다 퀴프렌시구간(a-b)에 나타난 폭(W)에 대해서 켑스트럼평균값보다 큰 켑스트럼값을 가산하고, 켑스트럼의 가산결과를 비교부(15)에 공급한다. 켑스트럼 가산부(14)의 켑스트럼가산값과 한계레벨설정부(18)에서 설정된 음성검출한계레벨신호가 비교부(15)에 공급되고, 켑스트럼가산값이 음성검출한계레벨신호보다 큰 경우에 음성검출신호를 출력한다. 이때, 한계레벨설정부(18)는 제7도에 도시한 시간(tl)부터 시간(tn)사이의 기간동안 켑스트럼평균값에 의거하여 설정된 음성검출한계레벨신호와 켑스트럼가산값을 비교하기 위해, 상기 음성검출한계레벨신호를 비교부(15)에 공급한다. 메모리군(16), (17)은 상기 메모리군(16), (17)에 새로운 입력이 있으면 오래된 메이러는 다음의 기억장소로 시프트되어, 항상 복수의 데이터가 병렬로 비교될 수 있는 상태로 되어 있다. 상기한 바와 같이 본 실시예에 의하면, 켑스트럼피크의 시간의 존성에 따른 변화를 비교함으로써 보다 정확한 음성검출을 행할 수 있다.
즉, 음성검출부가, 켑스트럼값을 기억하는 n조의 제1메모리군과 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과, 켑스트럼평균값보다 큰 경우에 켑스트럼값을 가산하는 켑스트럼가산부와 한계레벨설정부의 음성검출한계레벨신호와 켑스트럼가산부의 켑스트럼가산값을 비교해서 음성을 검출하는 비교부를 포함한 구성을 가지도록 함으로써, 상기 메모리군에서 시계열적으로 데이터를 축적할 수 있고, 이에 의해 켑스트럼값의 시간의 존성에 의한 시간변화를 검출할 수 있어 한층더 정확한 음성을 검출할 수 있다. 또한 퀴프렌시구간을 미리 설정하여 켑스트럼평균값의 계산범위를 제할할 수 있으므로, 음성을 실시간내에 검출할 수 있다.
다음에 본 발명의 제4실시예에 대해서 도면을 참조하면서 설명한다.
제8도는 본 발명의 제4실시예에 의한 음성검출장치의 블록도를 도시한다.
도면을 참조하면서 상기 음성검출장치의 구성과 동작에 대하여 이하 설명한다.
우선, 켑스트러만출수단인 켑스트럼산출부(71)는 음성신호가 입력되고 상기 음성신호로부터 켑스트럼값을 산출한다. 피크검출수단인 피크검출부(72)는 상기 켑스트럼값이 공급되고, 분석구간설정부(73)로부터 지시되는 분석구간에서 켑스트럼피크를 얻는다.
음성검출수단인 음성검출부(74)는 상기 켑스트럼피크를 미리 설정된 한계치와 비교하고, 입력이 음성으로 판정되는 경우 음성검출신호를 출력한다. 이때에, 분석구간 설정수단인 분석구간설정부(73)는 피크검출부(72)에 분석구간을 지시하고, 또한 상기 분석구간설정부(73)는 이하에 설명하는 방식으로 동작모드설정신호에 의해 제어된다. 우선, 상기 분석구간설정부(73)는, 제1동작모드시에는 미리 설정된 퀴프렌시분석구간을 피클검출부(72)에 지시하고, 또한 피크검출부(72)로부터 얻은 켑스트럼피크에 응답하여 제2동작모드시에 피크검출부(72)에 지시하기 위한 퀴프렌시분석구간을 설정한다. 다음에, 제2동작모드시에는 제1동작모드시에 설정된 분석구간을 피크검출부(72)에 지시한다.
수동동작의 동작모드설정신호에 의하거나 또는 특정한 시간의 경과후나 특정한 회수의 음성검출신호의 출력후에 자동발생의 동작모드설정신호에 의해서, 상기 제1모드에서 제2모드로 시프트되어도 된다.
상기한 바와 같은 본 실시예에 의하면, 켑스트럼피크의 분석구간을 미리 설정할 수 있으므로, 켑스트럼피크를 검출하는 분석구간을 좁힐 수 있어 처리속도를 개선할 수 있다.
또한, 검출될 켑스트럼피크의 범위는 제1동작모드시에 검출해서 화자에 따라서 좁혀지므로, 동일의 화자에 대한 음성을 정확하게 검출할 수 있다. 또한, 다른 음성잡음이 일시적으로 중첩된 경우에도 검출될 켑스트럼피크의 범위를 좁히고 있으므로, 음성을 정확하게 검출할 수 있다.
즉, 상기 설명으로부터 명백한 바와 같이, 본 발명은, 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크가 공급되어 음성을 검출하는 음성검출수단을 포함함으로써, 켑스트럼피크의 분석구간이 최적의 상태로 미리 설정되고 모드의 시프트에 의해 제한되어 켑스트럼피크를 결정하는 처리속도가 개시된다.
또한, 화자에 따라서 검출될 켑스트럼피크의 범위가 제한되므로 정확한 음성검출츨 동일의 화자에 대해 행할 수 있다. 또한, 음성이 잡음에 의해 중첩되는 경우에도 분석될 캡스트럼피크를 제한할 수 있으므로, 음성검출을 고정밀도로 행할 수 있고 양호한 동작성능을 얻을 수 있다.
다음에 본 발명의 제5실시예에 대해서 도면을 참조하면서 설명한다.
제9도는 본 발명의 제5실시예에 의한 음성검출장치의 블록도이다.
상기 제9도를 참조하면서 음성검출장치의 구성과 동작에 대하여 설명한다. 우선, 켑스트럼산출부(75)는, 입력되는 음성신호로부터 켑스트럼값을 산출하여 피크검출부(76)에 공급한다. 피크검출부(76)는 상기 켑스트럼 값으로부터 피크를 검출하고, 이때에, 구간데이터기억부(711)로 부터 제2스위치(712)를 통하여 얻은 퀴프렌시 구간데이터를 사용해서 켑스트럼산출부(75)로 부터 얻은 켑스트럼값의 피크검출폭이 제어된다. 음성검출부(714)는 피크검출부(76)로부터 검출된 켑스트럼피크를 미리 설정된 한계값과 비교하고, 입력이 음성으로 판정되는 경우에 음성검출신호를 출력한다. 이때에, 구간데이터설정부(78)는 피크검출부(76)로부터 공급된 켑스트럼피크에 의거해서 검출될 퀴프렌시구간을 설정한다. 동작모드에 응답하여 제어부(77)의 제어신호에 의해서 제1스위치(713)을 ON함으로써 구간데이터설정부(78)에서 설정된 구간데이터가 제1메모리군(79)에 기록된다. 제어부(77)는, 상기한 바와 같이 제1스위치(713)를 제어하는 동시에 제2스위치(712)로 동작모드에 응답하여 제어한다. 제2스위치(712)는, 제1스위치(713)가 OFF인 경우에는 제1메모리군(79)에 접속되고, 제1스위치(713)가 ON인 경우에는 제2메모리군(710)에 접속되도록 제어된다. 구간데이터기억부(711)의 제1메모리군(79)과 제2메모리군(710)의 구간데이터를 동작모드에 응답하여 각각 피크검출부의 분석구간데이터로서 제2스위치(712)를 통하여 피크검출부(76)에 공급된다.
제2메모리군(710)에 미리 구간데이터가 설정되어 있다.
다음에 제10도를 참조하면서 피크검출부(76)에 공급되는 구간데이터에 대하여 상세하게 설명한다.
제10도는 켑스트럼산출부(75)로부터 산출된 켑스트럼값을 도시한 것으로서, 실제로는 이산치이지만, 편의상 도면에서는 포탁선으로 표시하고 있다. "P"는 켑스트럼피크의 퀴프렌시이고, "a0-b0"은 제2메모리군(710)에 미리 기억되어 있는 분석구간이고, "a1-b1"은 제1메모리군(79)에 기억되어 있는 분석구간이다. 음성입력에 대해서는 제10도에 도시한 바와 같이 퀴프렌서(P)의 위치에서 켑스트럼피크가 발생한다.
우선, 제1모드시에 제어부(77)에 의해서 제2스위치(712)가 제2메모리군(710)에 접속되고, 제1스위치(713)가 제1메모리군(79)에 접속된 경우를 생각할 수 있다. 이 경우에, 음성입력이 존재하면, 제2스위치(712)가 제2메모리군(710)에 접속되어 있으므로, 피크검출부(76)는 메모리내용인 구간데이터 (a0-b0)에서 켑스트럼피크를 검출하여, 켑스트럼피크의 퀴프렌시(P)를 얻는다. 구간데이터설정부(78)는 피크검출부(76)에서 검출된 켑스트럼피크인 퀴프렌시(P)를 사용하여 퀴렌시(P)근처의 값을 선택하여 구간데이터 (a1-b1)를 구하고, 제1스위치(713)를 통하여 제1메모리군(79)에 구간데이터 (a1-b1)를 기억한다. 다음에 제2모드시에는, 제어부(77)에 의해서 제2스위치(712)가 제1메모리군(79)에 접속되고, 제1스위치(713)가 OFF가 된 경우를 생각할 수 있다. 이 경우에 제2스위치(712)가 제1메모리군(79)에 접속되어 있으므로, 피크검출부(76)는 제1메모리를 (79)의 구간데이터(a1-b1)에서 켑스트럼피크를 검출한다. 모드의 절환에 대해서는 제8도의 설명과 마찬가지로 생각하면 된다.
상기한 바와 같이 상기 실시예에 의하면, 켑스트럼피크분석구간을 미리 설정하여 메모리에 기억해둠으로써, 항상 최적의 켑스트럼피크분석구간이 공급될 수 있고, 또한 최적의 켑스트럼피크분석구간에 응답하여 한층더 좁은 분석구간을 다시 설정할 수 있으므로, 처리시간을 단축함과 동시에 잡음방해에 대해서 음성을 고정밀도로 검출할 수 있다. 또한 일단 분석구간을 설정해두면 분석구간이 항상 유효하므로, 우수한 조작성으로 효과적인 음성검출처리를 행할 수 있다. 또한 상기 메모리군은 2조에 한정되지 않고, 필요에 따라 추가하고, 그중에서 선택적으로 사용하여도 된다.
즉, 본 발명의 제5실시예에서는, 본 발명의 제4실시예의 분석구간설정수단을 대신해서, 구간데이터설정수단과, 복수의 메모리군과, 구간데이터를 제1메모리에 접속하는 제1스위치와, 복수의 메모리군의 구간데이터를 선택해서 피크검출부에 공급하는 제2스위치와, 상기 제1, 제2스위치를 동작모드에 응답하여 제어하는 제어부를 포함하고 있으므로, 본 발명의 제4실시예와 마찬가지로 미리 설정된 분석구간과 입력에 응답하여 켑스트럼 분석구간을 좁히므로, 본 발명의 제4실시예와 마찬가지의 효과를 얻을 수 있고, 메모리군의 수를 증가하여 분석구간을 여러가지 방식으로 설정할 수도 있다.

Claims (5)

  1. 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시(quefrency)구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 출력하는 제1비교부와 상기 제1비교부로부터 출력된 켑스트럼값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하는 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에 음성검출신호를 출력하는 제2비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
  2. 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출한계레벨신호를 설정하는 한계레벨설정수단과, 상기 켑스트럼산출수단의 켑스트럼값과 상기 평균값산출수단의 켑스트럼평균값을 비교하여 상기 켑스트럼평균값을 초과하는 켑스트럼값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여, 상기 켑스트럼값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
  3. 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 미리 설정된 퀴프렌시구간에서, 상기 켑스트럼산출수단의 상기 켑스트럼값으로부터 켑스트럼평균값을 산출하는 평균값산출수단과, 상기 평균값산출수단의 상기 켑스트럼평균값에 의거하여 음성검출 한계레벨신호를 설정하는 한계레벨설정수단과 상기 켑스트럼산출수단의 상기 켑스트럼값을 기억하는 n조의 제1메모리군과 상기 평균값산출수단의 상기 켑스트럼평균값을 기억하기 위해 복수의 n개의 기억장소를 가지는 제2메모리군과 상기 제1메모리에 대응하는 조의 제2메모리로부터 출력하는 켑스트럼평균값을 초가하는 제1메모리의 켑스트럼과값을 가산하는 켑스트럼가산부와 상기 켑스트럼가산부의 켑스트럼가산값과 상기 한계레벨설정수단의 음성검출한계레벨신호를 비교하여 상기 켑스트럼가산값이 상기 음성검출한계레벨신호보다 큰때에는 음성검출신호를 출력하는 비교부와를 가진 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
  4. 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 분석구간설정수단에 의해 설정된 분석구간에서 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크와 동작모드설정신호에 의거하여 분석구간을 설정하는 분석구간설정수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
  5. 음성신호로부터 켑스트럼값을 산출하는 켑스트럼산출수단과, 제2스위치에 의해 선택되는 제1메모리군 또는 제2메모리군의 출력에 대응하는 퀴프렌시구간에서, 상기 켑스트럼산출수단의 켑스트럼값으로부터 켑스트럼피크를 검출하는 피크검출수단과, 상기 피크검출수단의 켑스트럼피크에 의거하여, 분석될 퀴프렌시구간을 설정하는 구간데이터설정수단과, 상기 구간데이터설정수단에서 설정된 퀴프렌시구간이 제1스위치를 통하여 기억되는 제1메모리군과, 미리 설정된 구간데이터가 기억되는 있는 제2메모리군과, 상기 복수의 메모리군의 메모리 출력을 선택하는 제2스위치와, 동작모드에 응답하여 상기 제1스위치와 상기 제2스위치를 제어하는 제어수단과, 상기 피크검출수단의 켑스트럼피크와 미리 설정된 한계값을 비교하여 상기 켑스트럼피크가 상기 한계값보다 큰때에는 음성검출신호를 출력하는 음성검출수단을 포함한 것을 특징으로 하는 음성검출장치.
KR1019910000760A 1990-01-18 1991-01-18 음성검출장치 KR960005739B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019940023426A KR950001068B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치
KR1019940023427A KR950001069B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP2-8592 1990-01-18
JP2-8595 1990-01-18
JP2008595A JP2712692B2 (ja) 1990-01-18 1990-01-18 信号制御装置
JP2008592A JP2712691B2 (ja) 1990-01-18 1990-01-18 信号処理装置
JP2017348A JPH03220600A (ja) 1990-01-26 1990-01-26 音声検出装置
JP2-17348 1990-01-26
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2-26506 1990-02-06
JP2026507A JP2712704B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2-26507 1990-02-06
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置
JP2-34297 1990-02-14

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1019940023426A Division KR950001068B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치
KR1019940023427A Division KR950001069B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치

Publications (2)

Publication Number Publication Date
KR910014869A KR910014869A (ko) 1991-08-31
KR960005739B1 true KR960005739B1 (ko) 1996-05-01

Family

ID=27548141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910000760A KR960005739B1 (ko) 1990-01-18 1991-01-18 음성검출장치

Country Status (9)

Country Link
US (1) US5195138A (ko)
EP (4) EP0439073B1 (ko)
KR (1) KR960005739B1 (ko)
AU (1) AU644124B2 (ko)
CA (1) CA2034333C (ko)
DE (4) DE69132147T2 (ko)
FI (4) FI115569B (ko)
HK (4) HK184795A (ko)
NO (4) NO306489B1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5414674A (en) * 1993-11-12 1995-05-09 Discovery Bay Company Resonant energy analysis method and apparatus for seismic data
US5502717A (en) * 1994-08-01 1996-03-26 Motorola Inc. Method and apparatus for estimating echo cancellation time
WO1998001847A1 (en) * 1996-07-03 1998-01-15 British Telecommunications Public Limited Company Voice activity detector
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
WO2006005337A1 (en) * 2004-06-11 2006-01-19 Nanonord A/S A method for analyzing fundamental frequencies and application of the method
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
AU2014251347B2 (en) * 2013-03-15 2017-05-18 Apple Inc. Context-sensitive handling of interruptions
CN104967793B (zh) * 2015-07-28 2023-09-19 格科微电子(上海)有限公司 适用于cmos图像传感器的电源噪声抵消电路
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
ATE83329T1 (de) * 1987-04-03 1992-12-15 American Telephone & Telegraph Detektor fuer stimmhafte laute mit adaptiver schwelle.

Also Published As

Publication number Publication date
FI20030087A (fi) 2003-01-21
NO992257D0 (no) 1999-05-10
FI117953B (fi) 2007-04-30
EP0614171A1 (en) 1994-09-07
NO992258D0 (no) 1999-05-10
NO992256L (no) 1991-07-19
HK1010006A1 (en) 1999-06-11
CA2034333C (en) 1996-04-16
DE69112855T2 (de) 1996-02-15
NO992256D0 (no) 1999-05-10
DE69132147T2 (de) 2000-09-21
CA2034333A1 (en) 1991-07-19
EP0439073B1 (en) 1995-09-13
NO306489B1 (no) 1999-11-08
AU6868891A (en) 1991-07-25
HK1010008A1 (en) 1999-06-11
NO910221L (no) 1991-07-19
AU644124B2 (en) 1993-12-02
EP0614169A1 (en) 1994-09-07
FI20030089A (fi) 2003-01-21
DE69130294D1 (de) 1998-11-05
DE69112855D1 (de) 1995-10-19
FI910293A (fi) 1991-07-19
FI116595B (fi) 2005-12-30
KR910014869A (ko) 1991-08-31
NO910221D0 (no) 1991-01-18
DE69130294T2 (de) 1999-05-06
NO992258L (no) 1991-07-19
NO308337B1 (no) 2000-08-28
FI20030088A (fi) 2003-01-21
US5195138A (en) 1993-03-16
FI116594B (fi) 2005-12-30
HK184795A (en) 1995-12-15
EP0614170B1 (en) 2000-04-26
EP0439073A1 (en) 1991-07-31
DE69132148T2 (de) 2000-09-21
FI115569B (fi) 2005-05-31
FI910293A0 (fi) 1991-01-18
DE69132148D1 (de) 2000-05-31
EP0614171B1 (en) 2000-04-26
NO308335B1 (no) 2000-08-28
DE69132147D1 (de) 2000-05-31
EP0614170A1 (en) 1994-09-07
EP0614169B1 (en) 1998-09-30
NO308336B1 (no) 2000-08-28
HK1010007A1 (en) 1999-06-11
NO992257L (no) 1991-07-19

Similar Documents

Publication Publication Date Title
KR960005739B1 (ko) 음성검출장치
CA2034354C (en) Signal processing device
US5867581A (en) Hearing aid
US6314396B1 (en) Automatic gain control in a speech recognition system
KR100330478B1 (ko) 노이즈 상태 음성 검출 시스템
KR930010852A (ko) 음성인식장치
EP0335521A1 (en) Voice activity detection
KR930007298B1 (ko) 펄스형 간섭 검출장치
KR20000023823A (ko) 다중 행렬식을 채용하는 음성검출 시스템
KR960030072A (ko) 현악기/타악기용 피치인식방법
CA1218457A (en) Method and apparatus for determining the endpoints of a speech utterance
US20020198704A1 (en) Speech processing system
KR960030071A (ko) 타악기/현악기의 악음 개시 및 악음 종료 인지방법 및 그 장치
US5864793A (en) Persistence and dynamic threshold based intermittent signal detector
JPH053595B2 (ko)
JP3983421B2 (ja) 音声認識装置
JP2712708B2 (ja) 音声検出装置
KR950001069B1 (ko) 음성신호처리장치
KR0138148B1 (ko) 음성신호 검출구간 설정회로
KR970010947B1 (ko) 가라오케의 점수 채점장치
KR19980017116A (ko) 운전자의 음성 신호 구간 검출장치 및 그 방법
KR970013662A (ko) 자동차 오디오 음량조절장치 및 그 제어방법
JP2712176B2 (ja) 音声検出装置
JPH01244497A (ja) 音声区間検出回路
JPH04251299A (ja) 音声区間検出方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J2X1 Appeal (before the patent court)

Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL

G160 Decision to publish patent application
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070424

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee