KR20000040572A - Method for post process voice recognition using correlation - Google Patents

Method for post process voice recognition using correlation Download PDF

Info

Publication number
KR20000040572A
KR20000040572A KR1019980056234A KR19980056234A KR20000040572A KR 20000040572 A KR20000040572 A KR 20000040572A KR 1019980056234 A KR1019980056234 A KR 1019980056234A KR 19980056234 A KR19980056234 A KR 19980056234A KR 20000040572 A KR20000040572 A KR 20000040572A
Authority
KR
South Korea
Prior art keywords
value
word
voice
correlation
words
Prior art date
Application number
KR1019980056234A
Other languages
Korean (ko)
Inventor
황창업
이도순
권오일
정남호
Original Assignee
김영환
현대전자산업 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영환, 현대전자산업 주식회사 filed Critical 김영환
Priority to KR1019980056234A priority Critical patent/KR20000040572A/en
Publication of KR20000040572A publication Critical patent/KR20000040572A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Telephone Function (AREA)

Abstract

PURPOSE: A method for post process voice recognition using correlation is provided to register vocabulary using a correlation between the vocabulary rather than analyzing frequency of vocabulary. CONSTITUTION: A method for post process voice recognition using correlation includes a first through a sixth steps. At the first step(S1), a non-specific voice is input through a microphone. At the second step(S2), a voice characteristic is extracted. At the third step(S3), a characteristic pattern of the voice is compared with a pattern of registered vocabulary. At the forth step(S4), another voice is input when no match vocabulary exists. At the fifth step(S5), the distance arrangement is stored only when a match vocabulary is detected. At the sixth step(S6), another voice is input when the number of registered vocabulary is bigger than that of the vocabulary to be registered.

Description

상관관계를 이용한 후처리 음성인식 방법Postprocessing Speech Recognition Using Correlation

본 발명은 후처리 음성인식방법에 관한 것으로, 특히 나중에 입력되는 음성을 처리하는 과정에서 이미 등록된 단어간의 상관관계를 도입하여 음성인식율을 향상시키고 오인식을 방지할 수 있도록 하는 상관관계를 이용한 후처리 음성인식 방법에 관한 것이다.The present invention relates to a post-processing speech recognition method. In particular, the present invention relates to a post-processing speech recognition method in which a correlation between words already registered is introduced in the process of processing a speech input later, thereby improving the speech recognition rate and preventing mis-recognition. It relates to a voice recognition method.

주지하다시피, 현재 생산되고 있는 각종 장치에 음성인식기능이 내장된 제품이 보편화되고 있는 시점에서 음성을 인식하는 신뢰성 즉, 인식율이 뛰어난 제품을 만드는 것은 무엇보다 중요하다.As is well known, it is important to make a product that has a high recognition rate, that is, the reliability of speech recognition at a time when a product having a voice recognition function is embedded in various devices being produced.

현재 사용되고 있는 음성인식 방법으로는 입력되는 음성신호중 음성구간만 판별해내는 방법과, 검출된 음성 구간에 상응하는 음성특징패턴을 찾아내는 일 또는, 이 패턴구간의 유사도를 비교하는 방법등을 사용하고 있다.The speech recognition methods currently used include a method of discriminating only a speech section of an input speech signal, finding a speech feature pattern corresponding to the detected speech section, or comparing similarities between the pattern sections. .

여기서, 검출된 음성 구간에 상응하는 음성특징패턴을 찾아내는 일은 알고리즘에 따라 음성을 인식하는데 많은 차이가 있고, 패턴간의 유사도를 비교하는 일은 특징패턴간의 유사도 즉, 거리로 판별하는 형태로 음성인식 알고리즘과는 거의 관계가 없이 음성을 인식하는 방법이 거의 동일하다.Here, the finding of the speech feature pattern corresponding to the detected speech section has a lot of difference in recognizing the speech according to the algorithm, and comparing the similarity between the patterns is determined by the similarity, that is, the distance between the feature patterns and the speech recognition algorithm. The method of recognizing the voice is almost the same regardless of the relationship.

그러나, 상기와 같은 방식에서 등록된 단어를 발음할때에는 인식되는 알고리즘에 따라 일정한 인식율을 가지게 되지만, 등록되지 않은 단어를 이후에 발음할때는 단어를 오인식할 가능성이 높게 되는 등의 문제점이 있었다.However, when the registered words are pronounced in the above manner, they have a certain recognition rate according to the recognized algorithm. However, there is a problem that the possibility of misrecognition of the words is high when the unregistered words are pronounced later.

본 발명의 목적은, 상기와 같은 종래의 문제점을 해소하기 위한 것으로, 종래에 등록된 단어의 주파수를 분석하는 등의 방법을 이용하여 단어를 인식하는 방법에서, 단어의 상관관계를 이용하여 단어를 등록하고 나중에 입력되는 단어를 인식하는 방법을 제공하는데 그 목적이 있다.SUMMARY OF THE INVENTION An object of the present invention is to solve a conventional problem as described above. In a method of recognizing a word using a method such as analyzing a frequency of a conventionally registered word, the word is identified using a correlation of the word. The purpose is to provide a method for registering and recognizing a word entered later.

상기와 같은 목적을 달성하기 위하여 본 발명 상관관계를 이용한 후처리 음성인식 방법에서 사용할 인식단어간 상관관계를 등록하는 과정은, 불특정한 음성을 마이크를 통해 입력시키는 제 1 단계(S1)와; 상기 제 1 단계(S1)에서 입력된 음성의 특징을 추출하는 제 2 단계(S2)와; 상기 제 2 단계(S2)에서 추출된 음성의 특징패턴과 등록된 단어들간의 패턴과의 거리를 계산하여 특징을 비교하는 제 3 단계(S3)와; 상기 제 3 단계(S3)에서 특징을 비교한 후, 입력되어 있는 단어와 입력하는 단어가 일치하는지 판단하여 일치하지 않으면 다시 마이크를 통해 음성을 입력하는 제 4 단계(S4)와; 상기 제 4 단계(S4)에서 발음한 음성과 등록된 단어들 중에 일치한 결과가 나왔을때만 계산된 단어들간의 거리배열을 저장하는 제 5 단계(S5)와; 상기 제 5 단계(S5)를 수행한 후, 이미 등록되어 있는 총단어와 현재 등록하고자 하는 단어의 수를 비교하여 등록되어 있는 단어수가 많으면 다시 마이크를 통해 음성을 입력하고 작으면 상관관계를 이용한 단어등록을 끝내는 제 6 단계(S6)를 포함하여 구성된 것을 특징으로 한다.In order to achieve the above object, the process of registering the correlation between the recognition words to be used in the post-processing speech recognition method using the correlation of the present invention comprises the steps of: inputting an unspecified voice through a microphone (S1); A second step (S2) of extracting features of the voice input in the first step (S1); A third step (S3) of comparing the features by calculating a distance between the feature pattern of the voice extracted in the second step (S2) and the pattern between the registered words; A fourth step (S4) of comparing the features in the third step (S3), and then determining whether the input word matches the input word and if not, again inputting the voice through a microphone; A fifth step (S5) of storing the distance arrangement between the words calculated only when a matched voice among the registered words is registered in the fourth step (S4); After performing the fifth step (S5), by comparing the total number of words already registered and the number of words to be registered, if the number of registered words is large, the voice is input again through a microphone, and if it is small, a word using correlation Characterized in that it comprises a sixth step (S6) to complete the registration.

또한, 상기와 같은 목적을 달성하기 위하여 본 발명 상관관계를 이용한 후처리 음성인식 방법에서 상관관계를 이용하여 등록된 단어를 이용하여 나중에 입력되는 단어를 인식하는 과정은, 불특정인이 마이크를 통해 음성을 입력하는 제 10단계(S10)와; 상기 제 10단계(S10)에서 입력된 음성에 대한 특징을 추출하는 제 20단계(S20)와; 상기 제 20단계(S20)에서 추출된 음성의 특징을 이용하여 단어들간의 패턴을 비교하는 제 30단계(S30)와; 상기 제 30단계(S30)에서 비교된 단어들간의 패턴을 이용하여 등록된 단어와 입력되는 단어들간의 거리가 첫 번째로 일치하는 단어(N1)와 상관관계가 첫 번째로 일치하는 단어(M1)가 같은지 판단하여 같으면 결과를 출력하는 제 40단계(S40)와; 상기 제 40단계(S40)에서 N1값과 M1값이 일치하지 않으면 N1값과 상관관계가 두 번째로 일치하는 단어(M2)가 같은지 또는, 단어들간의 거리가 두 번째로 일치하는 단어(N2)가 M1값과 같은지 판단하여 같지 않으면 결과를 출력하는 제 50단계(S50)와; 상기 제 50단계(S50)에서 N1값이 M2값과 같고 N2값이 M1값과 같으면 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 큰가를 판단하는 제 60단계(S60)와; 상기 제 60단계(S60)에서 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 크면 N1값으로 인식하고, 작으면 M1값으로 인식하여 인식된 결과를 출력하는 제 70단계(S70)를 포함하여 구성된 것을 특징으로 한다.In addition, in order to achieve the above object, in the post-processing speech recognition method using the correlation of the present invention, a process of recognizing a word input later using a registered word using a correlation may be performed by a non-specific person using a microphone. A tenth step (S10) of inputting; A twentieth step (S20) of extracting a feature on the voice input in the tenth step (S10); A thirtieth step (S30) of comparing patterns between words using features of the voice extracted in the twentieth step (S20); The word M1 having a first correlation with the word N1 where the distance between the registered word and the input word is the first match using the pattern between the words compared in the thirtieth step S30. A 40th step (S40) of judging whether is equal to and outputting a result; If the N1 value and the M1 value do not match in the 40th step (S40), the word M2 having the second correlation with the N1 value is the same or the word N2 having the second distance between the words is the same. Determining whether M is equal to the M1 value and outputting a result if it is not equal (S50); In step 50, when the N1 value is equal to the M2 value and the N2 value is equal to the M1 value, the 60th step (S60) determines whether the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value Wow; In step S60, if the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value, the 70th step of recognizing the value N1 and outputting the recognized result when the value is smaller than the M1 value ( S70), characterized in that configured.

도 1 은 본 발명의 일 실시예에 따른 상관관계를 이용한 후처리 음성을 인식 하기 위한 구성상태를 나타낸 기능 블럭도,1 is a functional block diagram illustrating a configuration state for recognizing post-processing speech using correlations according to an embodiment of the present invention;

도 2 는 본 발명의 일 실시예에 따른 인식단어간 상관관계를 등록하는 과정 을 나타낸 제어흐름도,2 is a control flowchart illustrating a process of registering correlation between recognized words according to an embodiment of the present invention;

도 3 은 본 발명의 일 실시예에 따른 상관관계를 이용한 후처리 음성을 인식 하기 위한 방법을 나타낸 제어흐름도이다.3 is a control flowchart illustrating a method for recognizing post-processing speech using correlations according to an embodiment of the present invention.

도면의 주요 부분에 대한 부호의 설명Explanation of symbols for the main parts of the drawings

10 : 마이크 20 : A/D 변환부10: microphone 20: A / D conversion unit

30 : 제어부 40 : 메모리부30 control unit 40 memory unit

50 : D/A 변환부 60 : 출력부50: D / A conversion unit 60: output unit

이하, 첨부도면을 참조하여 본 발명의 일 실시예에 따른 상관관계를 이용한 후처리 음성인식 방법을 상세히 설명한다.Hereinafter, a post-processing speech recognition method using correlations according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 상관관계를 이용한 후처리 음성을 인식하기 위한 구성상태를 나타낸 기능 블럭도로서, 도시한 바와 같이, 불특정한 단어를 입력하는 마이크(10)와; 상기 마이크(10)를 통해 입력되는 단어의 아날로그 신호를 디지탈 신호로 변환시키는 A/D 변환부(20)로 구성된다.1 is a functional block diagram showing a configuration state for recognizing a post-processing voice using correlation according to an embodiment of the present invention, as shown, a microphone 10 for inputting an unspecified word; The A / D converter 20 converts an analog signal of a word input through the microphone 10 into a digital signal.

또한, 상기 A/D 변환부(20)를 통해 입력된 디지탈 신호를 메모리부(40)에 입력시키고, 입력된 단어의 특징을 추출하여 나중에 입력되는 단어와 일치하는지 상관관계를 통해 인식하는 제어부(30)와; 상기 제어부(30)에서 추출된 단어를 저장하는 메모리부(40)로 구성된다.In addition, the control unit for inputting the digital signal input through the A / D conversion unit 20 to the memory unit 40, and extracts the characteristics of the input word and recognizes whether it matches the input word later through the correlation ( 30); The memory unit 40 stores the words extracted by the controller 30.

또한, 상기 제어부(30)에서 출력되는 단어 즉, 디지탈 신호를 스피커등과 같은 출력장치를 통해 출력시키기 위해 아날로그 신호로 변환시키는 D/A 변환부(50)와; 상기 D/A 변환부(50)에서 변환된 단어(아날로그 형태)를 스피커를 통해 사용자에게 알려주는 출력부(60)를 포함하여 본 실시예를 구성한다.In addition, the D / A conversion unit 50 for converting a word output from the control unit 30, that is, a digital signal into an analog signal for output through an output device such as a speaker; This embodiment includes an output unit 60 for notifying a user of a word (analog form) converted by the D / A converter 50 through a speaker.

또한, 도 2는 본 발명의 일 실시예에 따른 인식단어간 상관관계를 등록하는 과정을 나타낸 제어흐름도로서, 도시한 바와 같이, 불특정한 음성을 마이크(10)를 통해 입력시키는 제 1 단계(S1)와; 상기 제 1 단계(S1)에서 입력된 음성의 특징(주파수 분석등과 같은 방법)을 추출하는 제 2 단계(S2)와; 상기 제 2 단계(S2)에서 추출된 음성의 특징패턴과 등록된 단어들간의 패턴과의 거리를 제어부(30)에서 계산하여 특징을 비교하는 제 3 단계(S3)로 구성된다.FIG. 2 is a control flowchart illustrating a process of registering correlation between recognized words according to an embodiment of the present invention. As shown in FIG. 2, a first step of inputting an unspecified voice through the microphone 10 (S1) is described. )Wow; A second step (S2) of extracting features (such as frequency analysis) of the voice input in the first step (S1); And a third step S3 of comparing the features by calculating the distance between the feature pattern of the speech extracted in the second step S2 and the pattern between the registered words.

또한, 상기 제 3 단계(S3)에서 특징을 비교한 후, 입력되어 있는 단어와 입력하는 단어가 일치하는지 제어부(30)에서 판단하여 일치하지 않으면 다시 마이크(10)를 통해 음성을 입력하는 제 4 단계(S4)와; 상기 제 4 단계(S4)에서 발음한 음성과 등록된 단어들 중에 일치한 결과가 나왔을때만 계산된 단어들간의 거리배열을 메모리부(40)에 저장하는 제 5 단계(S5)와; 상기 제 5 단계(S5)를 수행한 후, 이미 등록되어 있는 총단어와 현재 등록하고자 하는 단어의 수를 비교하여 등록되어 있는 단어수가 많으면 다시 마이크(10)를 통해 음성을 입력하고 작으면 상관관계를 이용한 단어등록을 끝내는 제 6 단계(S6)를 포함하여 본 실시예를 구성한다.In addition, after comparing the features in the third step (S3), the controller 30 determines whether the input word coincides with the input word, and if it does not match, the fourth inputting voice again through the microphone 10. Step S4; A fifth step (S5) of storing the distance arrangement between the words calculated only when a matched voice among registered words is found in the fourth step (S4); After performing the fifth step (S5), by comparing the total number of words already registered and the number of words to be registered, if the number of registered words is large, the voice is input again through the microphone 10 and the correlation is small. This embodiment includes a sixth step S6 of ending word registration using.

또한, 도 3은 본 발명의 일 실시예에 따른 상관관계를 이용한 후처리 음성을 인식하기 위한 방법을 나타낸 제어흐름도로서, 도시한 바와 같이, 불특정인이 마이크(10)를 통해 음성을 입력하는 제 10단계(S10)와; 상기 제 10단계(S10)에서 입력된 음성에 대한 특징(주파수 분석등과 같은 방법)을 추출하는 제 20단계(S20)와; 상기 제 20단계(S20)에서 추출된 음성의 특징을 이용하여 단어들간의 패턴을 제어부(30)에서 비교하는 제 30단계(S30)로 구성된다.3 is a control flow diagram illustrating a method for recognizing a post-processing voice using correlation according to an embodiment of the present invention. As shown in FIG. 3, an unspecified person inputs a voice through a microphone 10. 10 step (S10); A twentieth step (S20) of extracting features (such as frequency analysis) for the voice input in the tenth step (S10); The thirtieth step (S30) of comparing the pattern between words using the feature of the voice extracted in the twentieth step (S20) in the control unit 30.

또한, 상기 제 30단계(S30)에서 비교된 단어들간의 패턴을 이용하여 등록된 단어와 입력되는 단어들간의 거리가 첫 번째로 일치하는 단어(N1)와 상관관계(배열이 유사한 단어)가 첫 번째로 일치하는 단어(M1)가 같은지 판단하여 같으면 결과를 출력하는 제 40단계(S40)와; 상기 제 40단계(S40)에서 N1값과 M1값이 일치하지 않으면 N1값과 상관관계가 두 번째로 일치하는 단어(M2)가 같은지 또는, 단어들간의 거리가 두 번째로 일치하는 단어(N2)가 M1값과 같은지 판단하여 같지 않으면 결과를 출력하는 제 50단계(S50)로 구성된다.In addition, a correlation between a word N1 having a first matching distance between a registered word and an input word using a pattern between words compared in the thirtieth step S30 is first correlated (words having similar arrangements). A 40th step S40 of determining whether a second matching word M1 is the same and outputting a result if the same is the same; If the N1 value and the M1 value do not match in the 40th step (S40), the word M2 having the second correlation with the N1 value is the same or the word N2 having the second distance between the words is the same. Is determined to be equal to the value M1, and if it is not the same, a fifty-step step S50 of outputting a result is provided.

또한, 상기 제 50단계(S50)에서 N1값이 M2값과 같고 N2값이 M1값과 같으면 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 큰가를 판단하는 제 60단계(S60)와; 상기 제 60단계(S60)에서 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 크면 N1값으로 인식하고, 작으면 M1값으로 인식하여 인식된 결과를 출력하는 제 70단계(S70)를 포함하여 본 실시예를 구성한다.In addition, when the N1 value is equal to the M2 value and the N2 value is equal to the M1 value in the 50th step (S50), the 60th step of determining whether the value obtained by dividing the N1 value by the N2 value is greater than the value obtained by dividing the M1 value by the M2 value ( S60); In step S60, if the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value, the 70th step of recognizing the value N1 and outputting the recognized result when the value is smaller than the M1 value ( This embodiment is configured to include S70).

이하, 상기와 같이 구성된 상관관계를 이용한 후처리 음성인식 방법의 동작과정을 첨부된 도 1, 도 2 및 도 3을 참조하여 더욱 상세히 설명하면 다음과 같다.Hereinafter, the operation of the post-processing speech recognition method using the correlation configured as described above will be described in more detail with reference to FIGS. 1, 2, and 3.

먼저, 상관관계를 이용하여 나중에 입력되는 음성(아날로그 형태)을 인식하기 위해서는 인식할 단어간 상관관계를 이용하여 단어를 미리 등록시키는데, 상관관계란 단어들간의 배열이 유사한 관계를 말하는 것이다.First, in order to recognize a voice (analog type) input later using correlation, a word is registered in advance by using a correlation between words to be recognized. Correlation refers to a relationship in which arrangements between words are similar.

또한, 상관관계를 이용하여 소정의 단어를 등록하기 위해서는 마이크(10)를 통해 음성(아날로그 형태)을 입력하고(다수번 발음), 상기 마이크(10)를 통해 입력된 단어는 A/D 변환부(20)에서 디지탈 신호로 변환되며 이후에 제어부(30)에 입력된다.In addition, in order to register a predetermined word using correlation, a voice (analog form) is input through the microphone 10 (pronounced many times), and the word input through the microphone 10 is an A / D converter. A digital signal is converted at 20 and then input to the controller 30.

이후, 상기 제어부(30)에서 입력되는 음성을 주파수 분석등과 같은 방법을 이용하여 특징을 추출하게 되고, 추출된 음성의 특징으로 비교하게 되는데, 여기서 입력된 음성의 특징패턴과 등록된 단어들간의 패턴과의 거리를 계산하여 특징을 비교하게 된다.Thereafter, the voice inputted by the controller 30 is extracted using a method such as frequency analysis, and the feature is extracted and compared with the feature of the extracted voice, wherein the feature pattern of the input voice and the registered words The feature is compared by calculating the distance from the pattern.

이후, 발음한 음성과 등록된 단어들 중에 일치한 결과가 나왔을때만 계산된 거리에 대한 배열을 저장하고, 이후 메모리부(40)에 등록되어 있는 총단어와 마이크(10)를 통해 입력되는 현재의 단어수를 비교하여 등록되어 있는 단어수가 많으면 다시 음성을 입력하고 현재등록하는 단어수가 많으면 상관관계를 이용한 단어등록을 끝낸다.Subsequently, an array of the calculated distance is stored only when a matched voice and a registered word are found, and then the total word registered in the memory unit 40 and the current word input through the microphone 10 are stored. When the number of registered words is compared and the number of registered words is large, the voice is input again. If the number of currently registered words is large, the word registration using correlation is finished.

이제, 상관관계를 이용하여 등록된 단어를 통해 이후에 입력되는 단어를 정확하게 인식하기 위해서는, 마이크(10)를 통해 음성을 입력하면 A/D 변환부(20)에서 디지탈 신호로 변환시키고, 입력되는 음성에 대한 특징을 상관관계를 이용하여 단어를 등록하는 방법과 동일한 방법으로 제어부(30)에서 추출한다.Now, in order to accurately recognize a word that is subsequently input through the registered word using the correlation, when the voice is input through the microphone 10, the A / D converter 20 converts the digital signal into a digital signal and is input. The feature of the voice is extracted by the controller 30 in the same manner as that of registering a word using correlation.

이후, 상관관계를 이용한 단어등록방법과 동일한 방법으로 추출된 음성에 대한 특징패턴을 비교하여, 거리가 첫 번째로 일치하는 단어(N1)와 상관관계가 첫 번째로 일치하는 단어(M1)가 같은지 판단한다.Then, by comparing the feature pattern for the speech extracted in the same way as the word registration method using the correlation, whether the first word (M1) and the first match the correlation (M1) is the same as the distance. To judge.

이후, N1값과 M1값이 같으면 인식된 결과를 D/A 변환부(50)에서 아날로그 신호로 변환시킨 후 출력부(60)를 통해 출력하고, 상기 N1값과 M1값이 같지 않으면 N1값이 상관관계가 두 번째로 일치하는 단어(M2)와 같은지 또는 거리가 두 번째로 일치하는 단어(N2)가 M1값과 같은지 판단한다.Thereafter, when the N1 value and the M1 value are the same, the recognized result is converted into an analog signal by the D / A converter 50 and then output through the output unit 60. When the N1 value and the M1 value are not equal, the N1 value is It is determined whether the correlation is equal to the second matching word M2 or the distance N2 with the second matching distance equals the M1 value.

이때, N1값이 M2값과 같지않고 N2값이 M1값과 같지 않으면 역시 인식된 결과를 D/A 변환부(50)에서 아날로그 신호로 변환시킨 후 출력부(60)를 통해 출력시킨다.At this time, if the N1 value is not equal to the M2 value and the N2 value is not equal to the M1 value, the recognized result is also converted into an analog signal by the D / A converter 50 and then output through the output unit 60.

그러나, N1값이 M2값과 같고 N2값이 M1값과 같으면 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 큰가를 판단하여 크면 N1값을 제어부(30)에서 인식함을 인지하여 인식된 결과를 D/A 변환부(50)에서 아날로그 신호로 변환시켜 출력부(60)를 통해 결과를 출력시키고, N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 작으면 M1값을 제어부(30)에서 인식함을 인지하여 인식된 결과를 D/A 변환부(50)에서 아날로그 신호로 변환시켜 출력부(60)를 통해 결과를 출력시키는 동작을 수행한다.However, if the N1 value is equal to the M2 value and the N2 value is the same as the M1 value, the controller 30 determines whether the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value is greater. The D / A converter 50 converts the recognized and recognized result into an analog signal and outputs the result through the output unit 60. The value obtained by dividing the N1 value by the N2 value is greater than the value obtained by dividing the M1 value by the M2 value. If it is small, the controller 30 recognizes that the M1 value is recognized and converts the recognized result into an analog signal in the D / A converter 50 to output the result through the output unit 60.

따라서, 상기와 같이 상관관계를 이용하여 단어를 등록하고 이후에 입력되는 단어를 인식할 수 있어 오인식율이 감소하게 된다.Therefore, the word can be registered using the correlation as described above, and the word inputted later can be recognized, thereby reducing the false recognition rate.

한편, 본 발명은 상기 실시예에 한정되지 않고 본 발명의 기술적 요지를 벗어나지 않는 범위내에서 다양하게 변형실시할 수 있다.Meanwhile, the present invention is not limited to the above embodiments and can be variously modified within the scope not departing from the technical gist of the present invention.

이상에서 살펴본 바와 같이 본 발명 상관관계를 이용한 후처리 음성인식 방법은, 음성을 인식할 수 있는 불특정한 제품에서, 등록되지 않은 단어를 인식하기 위해 상관관계를 통해 단어를 등록 함으로써, 나중에 입력되는 단어도 정확하게 판단할 수 있어 오인식율을 감소시킬 수 있는 등의 효과가 있다.As described above, in the post-processing speech recognition method using the correlation of the present invention, a word input later by registering a word through correlation to recognize an unregistered word in an unspecified product capable of recognizing speech. Can also be accurately judged to reduce the false recognition rate has the effect.

Claims (2)

상관관계(배열이 유사한 단어)를 이용하여 단어를 등록하는 과정은, 불특정한 음성을 마이크를 통해 입력시키는 제 1 단계(S1)와; 상기 제 1 단계(S1)에서 입력된 음성의 특징(주파수 분석등과 같은 방법)을 추출하는 제 2 단계(S2)와; 상기 제 2 단계(S2)에서 추출된 음성의 특징패턴과 등록된 단어들간의 패턴과의 거리를 계산하여 특징을 비교하는 제 3 단계(S3)와; 상기 제 3 단계(S3)에서 특징을 비교한 후, 입력되어 있는 단어와 입력하는 단어가 일치하는지 판단하여 일치하지 않으면 다시 마이크를 통해 음성을 입력하는 제 4 단계(S4)와; 상기 제 4 단계(S4)에서 발음한 음성과 등록된 단어들 중에 일치한 결과가 나왔을때만 계산된 단어들간의 거리배열을 저장하는 제 5 단계(S5)와; 상기 제 5 단계(S5)를 수행한 후, 이미 등록되어 있는 총단어와 현재 등록하고자 하는 단어의 수를 비교하여 등록되어 있는 단어수가 많으면 다시 마이크를 통해 음성을 입력하고 작으면 상관관계를 이용한 단어등록을 끝내는 제 6 단계(S6)를 포함하여 구성된 것을 특징으로 하는 상관관계를 이용한 후처리 음성인식 방법.The process of registering a word using a correlation (words having similar arrangements) includes: a first step S1 of inputting an unspecified voice through a microphone; A second step (S2) of extracting features (such as frequency analysis) of the voice input in the first step (S1); A third step (S3) of comparing the features by calculating a distance between the feature pattern of the voice extracted in the second step (S2) and the pattern between the registered words; A fourth step (S4) of comparing the features in the third step (S3), and then determining whether the input word matches the input word and if not, again inputting the voice through a microphone; A fifth step (S5) of storing the distance arrangement between the words calculated only when a matched voice among the registered words is registered in the fourth step (S4); After performing the fifth step (S5), by comparing the total number of words already registered and the number of words to be registered, if the number of registered words is large, the voice is input again through a microphone, and if it is small, a word using correlation Postprocessing speech recognition method using a correlation characterized in that it comprises a sixth step (S6) to complete the registration. 상관관계를 이용하여 등록된 단어를 이용하여 나중에 입력되는 단어를 인식하는 과정은, 불특정인이 마이크를 통해 음성을 입력하는 제 10단계(S10)와; 상기 제 10단계(S10)에서 입력된 음성에 대한 특징을 추출하는 제 20단계(S20)와; 상기 제 20단계(S20)에서 추출된 음성의 특징을 이용하여 단어들간의 패턴을 비교하는 제 30단계(S30)와; 상기 제 30단계(S30)에서 비교된 단어들간의 패턴을 이용하여 등록된 단어와 입력되는 단어들간의 거리가 첫 번째로 일치하는 단어(N1)와 상관관계가 첫 번째로 일치하는 단어(M1)가 같은지 판단하여 같으면 결과를 출력하는 제 40단계(S40)와; 상기 제 40단계(S40)에서 N1값과 M1값이 일치하지 않으면 N1값과 상관관계가 두 번째로 일치하는 단어(M2)가 같은지 또는, 단어들간의 거리가 두 번째로 일치하는 단어(N2)가 M1값과 같은지 판단하여 같지 않으면 결과를 출력하는 제 50단계(S50)와; 상기 제 50단계(S50)에서 N1값이 M2값과 같고 N2값이 M1값과 같으면 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 큰가를 판단하는 제 60단계(S60)와; 상기 제 60단계(S60)에서 N2값에서 N1값을 나눈값이 M2값에서 M1값을 나눈값보다 크면 N1값으로 인식하고, 작으면 M1값으로 인식하여 인식된 결과를 출력하는 제 70단계(S70)를 포함하여 구성된 것을 특징으로 하는 상관관계를 이용한 후처리 음성인식 방법.The process of recognizing a word input later using a registered word using correlation may include a tenth step (S10) in which an unspecified person inputs a voice through a microphone; A twentieth step (S20) of extracting a feature on the voice input in the tenth step (S10); A thirtieth step (S30) of comparing patterns between words using features of the voice extracted in the twentieth step (S20); The word M1 having a first correlation with the word N1 where the distance between the registered word and the input word is the first match using the pattern between the words compared in the thirtieth step S30. A 40th step (S40) of judging whether is equal to and outputting a result; If the N1 value and the M1 value do not match in the 40th step (S40), the word M2 having the second correlation with the N1 value is the same or the word N2 having the second distance between the words is the same. Determining whether M is equal to the M1 value and outputting a result if it is not equal (S50); In step 50, when the N1 value is equal to the M2 value and the N2 value is equal to the M1 value, the 60th step (S60) determines whether the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value Wow; In step S60, if the value obtained by dividing the N1 value from the N2 value is greater than the value obtained by dividing the M1 value by the M2 value, the 70th step of recognizing the value N1 and outputting the recognized result when the value is smaller than the M1 value ( Post processing speech recognition method using the correlation characterized in that it comprises a.
KR1019980056234A 1998-12-18 1998-12-18 Method for post process voice recognition using correlation KR20000040572A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980056234A KR20000040572A (en) 1998-12-18 1998-12-18 Method for post process voice recognition using correlation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980056234A KR20000040572A (en) 1998-12-18 1998-12-18 Method for post process voice recognition using correlation

Publications (1)

Publication Number Publication Date
KR20000040572A true KR20000040572A (en) 2000-07-05

Family

ID=19563803

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980056234A KR20000040572A (en) 1998-12-18 1998-12-18 Method for post process voice recognition using correlation

Country Status (1)

Country Link
KR (1) KR20000040572A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10134387B2 (en) 2014-11-12 2018-11-20 Samsung Electronics Co., Ltd. Image display apparatus, method for driving the same, and computer readable recording medium
US11205415B2 (en) 2018-11-15 2021-12-21 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10134387B2 (en) 2014-11-12 2018-11-20 Samsung Electronics Co., Ltd. Image display apparatus, method for driving the same, and computer readable recording medium
US11205415B2 (en) 2018-11-15 2021-12-21 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11615780B2 (en) 2018-11-15 2023-03-28 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11961506B2 (en) 2018-11-15 2024-04-16 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof

Similar Documents

Publication Publication Date Title
US20130054236A1 (en) Method for the detection of speech segments
CN109074804B (en) Accent-based speech recognition processing method, electronic device, and storage medium
KR20000040572A (en) Method for post process voice recognition using correlation
JPH11231895A (en) Method and device speech recognition
JPH0643895A (en) Device for recognizing voice
JP2000020089A (en) Speed recognition method and apparatus therefor as well as voice control system
KR100998230B1 (en) Speaker independent voice recognition processing method
JP4282354B2 (en) Voice recognition device
JP2001350494A (en) Device and method for collating
JP3708747B2 (en) Speech recognition method
JP2000122678A (en) Controller for speech recogniging equipment
JPH05210397A (en) Voice recognizing device
JP2019101285A (en) Voice processor, voice processing method and program
CN112151070B (en) Voice detection method and device and electronic equipment
KR100304665B1 (en) Apparatus and method of speech recognition using pitch-wave feature
JPH0997095A (en) Speech recognition device
JP3458285B2 (en) Voice recognition device
KR100677224B1 (en) Speech recognition method using anti-word model
JP2864511B2 (en) Speaker identification method and device
KR19980045013A (en) How to Improve Speaker Recognizer by Entering Password
JP3439602B2 (en) Voice recognition device
KR100677197B1 (en) Voice recognizing dictation method
KR19980040752A (en) Speaker Recognition Method Using Improved Threshold Setting Method in Speaker Recognition System
Pandit et al. Selection of speaker independent feature for a speaker verification system
JPH07334186A (en) Speech recognition device

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination