KR100301725B1 - Interactive Voice Recognition Method in Mobile Phones - Google Patents

Interactive Voice Recognition Method in Mobile Phones Download PDF

Info

Publication number
KR100301725B1
KR100301725B1 KR1019980042229A KR19980042229A KR100301725B1 KR 100301725 B1 KR100301725 B1 KR 100301725B1 KR 1019980042229 A KR1019980042229 A KR 1019980042229A KR 19980042229 A KR19980042229 A KR 19980042229A KR 100301725 B1 KR100301725 B1 KR 100301725B1
Authority
KR
South Korea
Prior art keywords
voice
user
response
qcelp
specific coefficient
Prior art date
Application number
KR1019980042229A
Other languages
Korean (ko)
Other versions
KR20000025230A (en
Inventor
영 봉 박
성 모 구
Original Assignee
송문섭
주식회사 현대큐리텔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 송문섭, 주식회사 현대큐리텔 filed Critical 송문섭
Priority to KR1019980042229A priority Critical patent/KR100301725B1/en
Publication of KR20000025230A publication Critical patent/KR20000025230A/en
Application granted granted Critical
Publication of KR100301725B1 publication Critical patent/KR100301725B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/36Memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 휴대전화기의 음성인식 방법, 더욱 상세하게는 음성인식 방식을 통해 호를 시도할 때 사용자로 하여금 다시한번 자신의 호시도 음성을 확인할 수 있도록 해주는 휴대전화기에서의 대화형 음성인식 방법에 관한 것으로, 본 발명에 의하면 사용자가 입력한 호시도 음성이 정확하게 입력되었는가의 여부를 사용자 확인절차를 통해 다시한번 점검한 후 호시도 동작을 수행해 줌으로써, 사용자가 원하는 전화번호를 통해 정확한 통화가 이루어지도록 해줄 뿐만 아니라, 출력 용량이 큰 스피커폰을 사용함으로써 소음지역이나 시끄러운 장소에서도 사용자가 호시도 확인 음성을 정확하게 들을 수 있도록 해준다는 뛰어난 효과가 있다.The present invention relates to a voice recognition method of a mobile phone, and more particularly, to an interactive voice recognition method in a mobile phone that enables a user to check his / her own view voice again when a call is attempted through the voice recognition method. According to the present invention, by checking whether or not the voice inputted by the user is correctly input through the user confirmation procedure, and performing the hoshido operation, the user can make an accurate call through the desired telephone number. In addition, the use of a speakerphone with a large output capacity has an excellent effect of allowing the user to accurately hear the confirmation voice even in noisy areas or noisy places.

Description

휴대전화기에서의 대화형 음성인식 방법Interactive voice recognition method on mobile phone

본 발명은 휴대전화기의 음성인식 방법에 관한 것으로, 특히, 음성인식 방식을 통해 호(Call)를 시도할 때 사용자로 하여금 다시한번 자신의 호시도 음성을 확인할 수 있도록 해주는 휴대전화기에서의 대화형 음성인식 방법에 관한 것이다.The present invention relates to a voice recognition method of a mobile phone, and in particular, an interactive voice in a mobile phone that enables a user to check his / her own voice even when a call is attempted through a voice recognition method. It is about a recognition method.

일반적으로, 종래 휴대전화기에서의 음성인식 방법은 사용자가 호시도 음성을 입력하면 호시도 음성 데이터에 해당하는 특정계수를 산출하여, 산출된 호시도 음성 데이터에 해당하는 특정계수와 메모리(Memory)부에 저장된 다수개의 호시도 특정계수를 비교하고, 이후 비교결과 동일한 특정계수가 있는가를 판단하여 동일한 특정계수가 없으면 호시도를 거부하며, 동일한 특정계수가 있으면 호시도를 해주는 방법이었다.In general, in the conventional mobile phone, the voice recognition method calculates a specific coefficient corresponding to the voiced voice data when the user inputs the voiced voice voice, and the memory and memory unit corresponding to the calculated voiced voice data. It compares a number of specific Hosido specific coefficients stored in, and determines whether there is the same specific coefficient as a result of the comparison. If the same specific coefficient is not included, the Hoshido is rejected.

그러나, 상술한 종래 휴대전화기에서의 음성인식 방법으로는, 사용자가 입력한 호시도 음성을 사용자에게 다시한번 재송신한 후 맞는지의 여부를 확인하는 동작이 없음으로써, 사용자가 호출하고자 하는 호시도 음성과 유사한 호시도 음성을 입력하면 다른 전화번호를 호출하는 오동작이 빈번하게 발생하였고, 특히 잡음과 호시도 음성을 식별하는 식별력이 떨어지기 때문에 에러(Error) 발생율이 높아 서비스의 질이 떨어지는 문제점이 있었다.However, in the above-described conventional voice recognition method, the voice recognition method of the mobile phone does not check whether it is correct after retransmitting the user-provided voice call back to the user once again, If a similar hoshido voice is inputted, a malfunction of calling another telephone number frequently occurs. In particular, there is a problem that the quality of service decreases due to a high error rate due to the inferior identification of noise and hoshido voice.

따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 휴대전화기 사용자의 음성 인식을 통한 전화 통화시 사용자가 원하는 착신지로 통화가 정확하게 진행되도록 해주기 위한 휴대전화기에서의 대화형 음성인식 방법을 제공하는데 있다.Accordingly, the present invention has been made to solve the above-mentioned conventional problems, and an object of the present invention is to provide a mobile phone for precisely progressing a call to a desired destination when a user makes a phone call through voice recognition of a mobile phone user. An interactive voice recognition method is provided.

상기와 같은 목적을 달성하기 위하여 본 발명 휴대전화기에서의 대화형 음성인식 방법은, 메모리부, 마이크, CODEC부, MSM내에 장착된 보코더, 제어부, 디스플레이부, 및 스피커폰을 구비한 휴대전화기에서의 대화형 음성인식 방법에 있어서, 상기 보코더가 사용자가 호시도하고자 하는 음성을 입력하면 그 음성 데이터를 QCELP로 압축한 후 상기 제어부로 출력하는 제 1 단계; 상기 제어부가 QCELP로 압축된 호시도 음성에 해당하는 특정 계수를 산출하는 제 2 단계; 상기 제어부가 상기 메모리부내에 그 QCELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하는지의 여부를 판단하는 제 3 단계; 상기 제 3 단계에서 상기 메모리부내에 그 QCELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하면, 상기 제어부가 그 호시도 음성 데이터를 상기 스피커폰을 통해 사용자에게 재출력시키는 제 4 단계; 상기 보코더가 사용자가 상기 스피커폰을 통해 재출력된 호시도 음성을 듣고 응답음성을 입력하면, 그 응답 데이터를 QCELP로 압축한 후 상기 제어부로 출력하는 제 5 단계; 상기 제어부가 QCELP로 압축된 응답음성에 해당하는 특정계수를 산출하는 제 6 단계; 상기 제어부가 상기 메모리부내에 저장된 응답음성의 특정계수를 이용하여 사용자가 입력한 응답음성의 특정계수가 “예”에 해당하는 응답음성인지, 아니면 “아니오”에 해당하는 응답음성인지의 여부를 판단하는 제 7 단계; 및 상기 제 7 단계에서 그 응답음성이 “아니오”에 해당하는 응답음성이면 다시 상기 제 3 단계로 진행하는 한편, 그 응답음성이 “예”에 해당하는 응답음성이면, 상기 제어부가 그 응답음성에 해당하는 전화번호를 통해 호를 진행시키는 제 8 단계로 이루어진 것을 특징으로 한다.In order to achieve the above object, the interactive voice recognition method in the mobile phone of the present invention is a conversation in a mobile phone having a memory unit, a microphone, a CODEC unit, a vocoder mounted in the MSM, a control unit, a display unit, and a speakerphone. A voice recognition method comprising: a first step of, when the vocoder inputs a voice to be attempted by a user, compressing the voice data into a QCELP and outputting the voice data to the controller; A second step of the control unit calculating a specific coefficient corresponding to the Hoshido voice compressed with QCELP; A third step of determining, by the controller, whether a specific coefficient equal to a specific coefficient of the Hoshido voice compressed by the QCELP exists in the memory unit; A fourth step in which the control unit re-outputs the call view voice data to the user through the speakerphone when the specific coefficient equal to the specific coefficient of the Hoshido voice compressed by the QCELP exists in the memory unit in the third step; A fifth step of the vocoder outputting the response data to the control unit after compressing the response data into the QCELP when the user hears the Hoshido voice re-output through the speakerphone and inputs the response voice; A sixth step of calculating, by the controller, a specific coefficient corresponding to the response voice compressed by the QCELP; The controller determines whether the response coefficient input by the user is the response voice corresponding to "yes" or the response voice corresponding to "no" by using the specific coefficient of the response voice stored in the memory unit. A seventh step; And if the response voice corresponds to "no" in the seventh step, the process proceeds to the third step again; if the response voice corresponds to "yes", the controller controls the response voice. Characterized in that the eighth step of proceeding to the call through the corresponding phone number.

제1도는 본 발명의 일 실시예에 따른 휴대전화기에서의 대화형 음성인식 장치의 구성을 나타낸 기능블록도.1 is a functional block diagram showing the configuration of an interactive voice recognition device in a mobile phone according to an embodiment of the present invention.

제2도는 본 발명의 일 실시예에 따른 휴대전화기에서의 대화형 음성인식 방법을 나타낸 동작플로우챠트이다.2 is an operation flowchart showing an interactive voice recognition method in a mobile phone according to an embodiment of the present invention.

* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings

100 : 메모리부 200 : 마이크100: memory 200: microphone

300 : CODEC부 400 : MSM300: CODEC 400: MSM

410 : 보코더 500 : 제어부410: vocoder 500: control unit

600 : 디스플레이부 700 : 스피커폰600: display unit 700: speakerphone

이하, 본 발명의 일 실시예에 의한 휴대전화기에서의 대화형 음성인식 방법에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, an interactive voice recognition method in a mobile phone according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

제1도는 본 발명의 일 실시예에 의한 휴대전화기에서의 대화형 음성인식 장치의 기능블록도로서, 본 발명의 일 실시예에 의한 휴대전화기에서의 대화형 음성인식 장치는 메모리(Memory)부(100), 마이크(200), CODEC(Coder-Decoder Companding; 이하 “CODEC”라 칭함.)부(300), MSM(Mobile Station Modem; 이하 “MSM”이라 칭함.)(400)내에 장착된 보코더(Vocoder)(410), 제어부(500), 디스플레이(Display)부(600), 및 스피커폰(700)으로 구성되어 있다.1 is a functional block diagram of an interactive voice recognition device in a mobile phone according to an embodiment of the present invention, the interactive voice recognition device in a mobile phone according to an embodiment of the present invention is a memory unit (Memory) ( 100), the vocoder mounted in the microphone 200, Coder-Decoder Companding (CODEC) section 300, MSM (Mobile Station Modem; hereinafter referred to as "MSM") 400 Vocoder 410, the control unit 500, the display unit 600, and the speaker phone 700.

상기 메모리부(100)는 호시도 음성 데이터, 즉 “우리집”, “학교” 등과 같은 음성 데이터에 대한 특정계수와 응답음성, 즉 “예” 또는 “아니오”에 해당하는 특정계수를 저장하는 메모리이다.The memory unit 100 is a memory for storing a specific coefficient corresponding to voice data, namely, "my home", "school", and the like, and a response voice, that is, "yes" or "no". .

한편, 상기 마이크(200)는 사용자가 호시도 음성을 입력하면 그 음성을 아날로그(Analog) 데이터로 변환시켜 상기 CODEC부(300)로 출력하는 역할을 한다.On the other hand, the microphone 200 serves to convert the voice into analog (Analog) data when the user inputs a hododo voice to output to the CODEC unit 300.

또한, 상기 마이크(200)는 사용자가 “예” 또는 “아니오”의 응답음성을 입력하면 그 응답음성에 해당하는 아날로그 음성 데이터를 상기 CODEC부(300)로 출력하는 역할을 한다.In addition, when the user inputs a response voice of "yes" or "no", the microphone 200 outputs analog voice data corresponding to the response voice to the CODEC unit 300.

한편, 상기 CODEC부(300)는 상기 마이크(200)로부터 아날로그 음성 데이터를 입력받으면 이를 PCM(Pulse Code Modulation; 이하 “PCM”이라 칭함.) 호시도 음성데이터로 변환한 후 상기 MSM(400)내에 장착된 보코더(410)로 출력하는 한편, 상기 MSM(400)내에 장착된 보코더(410)로부터 PCM 호시도 음성 데이터를 입력받으면 이를 아날로그 호시도 음성 데이터로 변환한 후 상기 스피커폰(700)으로 출력하는 역할을 한다.On the other hand, when the CODEC unit 300 receives analog voice data from the microphone 200, it converts it into PCM (Pulse Code Modulation; " PCM "). While outputting to the mounted vocoder 410, when receiving the PCM Hoshido voice data from the vocoder 410 mounted in the MSM 400, converts it to analog Hoshido voice data and outputs it to the speakerphone 700 Play a role.

또한, 상기 MSM(400)내에 장착된 보코더(410)는 상기 CODEC부(300)로부터 PCM 호시도 음성 데이터를 입력받으면 이를 QCELP(Qualcomm CELP; 이하 “QCELP”라 칭함.)로 압축한 후 상기 제어부(500)로 출력하는 한편, 상기 제어부(500)로부터 QCELP로 압축된 호시도 음성 데이터를 입력받으면 이를 PCM 호시도 음성 데이터로 복원한 후 상기 CODEC부(300)로 출력하는 역할을 한다.In addition, when the vocoder 410 mounted in the MSM 400 receives the PCM call view voice data from the CODEC unit 300, the vocoder 410 compresses this to QCELP (Qualcomm CELP; hereinafter referred to as “QCELP”). On the other hand, when the control unit 500 receives the received voice data compressed by the QCELP from the control unit 500, it restores the PCM voice view voice data and then outputs the voice data to the CODEC unit 300.

한편, 상기 제어부(500)는 상기 MSM(400)내에 장착된 보코더(410)로부터 QCELP로 압축된 호시도 음성 데이터를 입력받으면 그 호시도 음성 데이터에 해당하는 특정계수를 산출한 후 상기 메모리부(100)내에 저장된 다수개의 호시도 특정계수와 비교하여 동일한 특정계수가 있는지의 여부를 차례대로 비교하고, 이후 동일한 특정계수가 없으면 상기 디스플레이부(600)로 재입력 메시지 디스플레이 제어신호를 출력하는 한편, 동일한 특정계수가 있으면 QCELP로 압축된 호시도 음성 데이터를 다시 상기 MSM(400)내에 장착된 보코더(410)로 재전송하는 역할을 한다.On the other hand, if the control unit 500 receives the received voice data compressed by QCELP from the vocoder 410 mounted in the MSM 400, the control unit 500 calculates a specific coefficient corresponding to the corresponding voice data and then stores the memory unit ( Compared to the plurality of Hoshi also specified coefficients stored in 100 to compare whether there is the same specific coefficient in turn, and if there is no same specific coefficient thereafter outputs a re-input message display control signal to the display unit 600, If there is the same specific coefficient, it serves to retransmit the Hoshido voice data compressed with QCELP back to the vocoder 410 mounted in the MSM 400.

또한, 상기 제어부(500)는 상기 MSM(400)내에 장착된 보코더(410)로부터 QCELP로 압축된 응답음성을 입력받으면, 그 QCELP로 압축된 응답신호에 해당하는 특정계수를 산출한 후 상기 메모리부(100)내에 저장된 응답신호에 해당하는 특정계수와 비교하고, 이후 그 응답음성이 “예”에 해당하는 음성이면 정상적인 호시도 동작을 수행하는 역할을 한다.In addition, when the control unit 500 receives a response voice compressed with QCELP from the vocoder 410 mounted in the MSM 400, the control unit 500 calculates a specific coefficient corresponding to the response signal compressed with the QCELP and then stores the memory unit. Compared with the specific coefficient corresponding to the response signal stored in the (100), and if the response voice is the voice corresponding to "Yes", it performs a normal call attempt operation.

한편, 상기 디스플레이부(600)는 상기 제어부(500)로부터 재입력 메시지 디스플레이 제어신호를 입력받으면, 사용자에게 호시도 음성을 재입력하라는 메시지를 디스플레이시키는 역할을 한다.On the other hand, when the display unit 600 receives a re-input message display control signal from the control unit 500, the display unit 600 serves to display a message for re-inputting the voice of the call view.

또한, 상기 스피커폰(700)은 상기 CODEC부(300)로부터 아날로그 호시도 음성데이터를 입력받으면, 사용자에게 호시도 음성을 고출력으로 재전송하는 역할을 한다.In addition, the speakerphone 700 serves to retransmit the hoshido voice to a high output to the user, when the analog hoshido voice data is input from the CODEC unit 300.

그러면, 상기와 같은 구성을 가지는 휴대전화기에서의 대화형 음성인식 장치를 이용한 본 발명의 일 실시예에 의한 휴대전화기에서의 대화형 음성인식 방법에 대해 설명하기로 한다.Next, the interactive voice recognition method in the mobile phone according to the embodiment of the present invention using the interactive voice recognition device in the mobile phone having the above configuration will be described.

제2도는 본 발명의 일 실시예에 의한 휴대전화기에서의 대화형 음성인식 방법을 나타내는 동작플로우챠트로서, 여기서 S는 스텝(STEP)을 나타낸다.2 is an operation flowchart showing an interactive voice recognition method in a mobile phone according to an embodiment of the present invention, where S represents a step.

먼저, 하기에서는 사용자가 “우리집”이라는 음성을 통해 호를 시도하는 동작 과정을 예를 들어서 설명하기로 하며, 호시도 음성 데이터는 다수개가 상기 메모리부(100)에 저장되어 있다.First, an operation process in which a user attempts to call through a voice of “my house” will be described below by way of example, and a plurality of voice view voice data are stored in the memory unit 100.

사용자가 상기 마이크(200)를 통해 “우리집”이라는 음성을 입력하면, 상기 마이크(200)는 “우리집”이라는 음성을 입력받아 아날로그 음성 데이터로 변환한 후 상기 CODEC부(300)로 출력한다. 그러면, 상기 CODEC부(300)는 상기 마이크(200)에서 출력한 “우리집”이라는 아날로그 음성 데이터를 입력받아 PCM 음성 데이터로 변환한 후 상기 MSM(400)내에 장착된 보코더(410)로 출력한다. 이어서, 상기 보코더(410)는 상기 CODEC부(300)에서 출력한 “우리집”에 해당하는 PCM 음성 데이터를 입력받아 QCELP 신호로 압축한 후 상기 제어부(500)로 출력한다(S1).When the user inputs the voice of "my house" through the microphone 200, the microphone 200 receives the voice of "my house", converts it into analog voice data, and outputs it to the CODEC unit 300. Then, the CODEC unit 300 receives analog voice data of “my house” output from the microphone 200, converts the analog voice data into PCM voice data, and outputs it to the vocoder 410 mounted in the MSM 400. Subsequently, the vocoder 410 receives PCM voice data corresponding to “my house” output from the CODEC unit 300, compresses the PCM voice data into a QCELP signal, and outputs the same to the control unit 500 (S1).

그러면, 상기 제어부(500)는 상기 보코더(410)에서 출력한 “우리집”에 해당하는 QCELP로 압축된 호시도 신호에 해당하는 특정계수를 산출한다(S2).Then, the control unit 500 calculates a specific coefficient corresponding to the Hoshi-do signal compressed by the QCELP corresponding to the "my house" output from the vocoder 410 (S2).

그런후, 상기 제어부(500)는 상기 메모리부(100)내에 그 QCELP로 압축된 “우리집”에 해당하는 특정계수와 동일한 특정계수가 존재하는지의 여부를 판단한다(S3).Thereafter, the controller 500 determines whether a specific coefficient equal to a specific coefficient corresponding to “my house” compressed with the QCELP exists in the memory unit 100 (S3).

이 때, 상기 제 3 단계(S3)에서 상기 메모리부(100)내에 그 QCELP로 압축된 “우리집”에 해당하는 특정계수와 동일한 특정계수가 존재하면(YES), 상기 제어부(500)는 “우리집”이라는 음성 데이터를 사용자에게 재출력시키기 위해 “우리집”에 해당하는 QCELP 신호를 다시 상기 보코더(410)로 재전송한다. 그러면, 상기 보코더(410)는 상기 제어부(500)에서 출력한 “우리집”에 해당하는 QCELP 신호를 입력받아 PCM 음성 데이터로 복원한 후 상기 CODEC부(300)로 출력한다. 또한, 상기 CODEC부(300)는 상기 보코더(410)에서 출력한 “우리집”에 해당하는 PCM 음성 데이터를 입력받아 아날로그 음성 데이터로 변환한 후 상기 스피커폰(700)으로 출력하고, 상기 스피커폰(700)은 상기 CODEC부(300)에서 출력한 아날로그 호시도 음성데이터를 입력받아 사용자에게 “우리집”이라는 음성을 재출력한다(S4).At this time, in the third step S3, if the specific coefficient equal to the specific coefficient corresponding to the “our house” compressed by the QCELP is present in the memory unit 100 (YES), the control unit 500 determines the “our house”. "QCELP" signal corresponding to "my house" is retransmitted back to the vocoder 410 in order to re-output the voice data "." Then, the vocoder 410 receives the QCELP signal corresponding to the "our house" output from the control unit 500 and restores the PCM voice data to the CODEC unit 300. In addition, the CODEC unit 300 receives PCM voice data corresponding to “my house” output from the vocoder 410, converts the analog voice data into analog voice data, and outputs the same to the speaker phone 700, and the speaker phone 700. Receives the analog Hoshido voice data output from the CODEC unit 300 and re-outputs the voice of "My house" to the user (S4).

한편, 사용자는 상기 스피커폰(700)에서 출력한 “우리집”이라는 음성을 들은 후, 상기 마이크(200)를 통해 “예” 또는 “아니오”에 해당하는 응답음성을 입력한다. 그러면, 상기 마이크(200)는 사용자가 입력한 응답음성을 입력한 후, 응답음성에 해당하는 아날로그 음성 데이터를 상기 CODEC부(300)로 출력한다. 또한, 상기 CODEC부(300)는 상기 마이크(200)에서 출력한 아날로그 응답 데이터를 입력받아 PCM 응답 데이터로 변환한 후 상기 보코더(410)로 출력한다. 한편, 상기 보코더(410)는 상기 CODEC부(300)에서 출력한 PCM 응답 데이터를 입력받아 QCELP 응답신호로 압축한 후 상기 제어부(500)로 출력한다(S5).On the other hand, the user hears the voice of "my house" output from the speakerphone 700, and inputs a response voice corresponding to "yes" or "no" through the microphone 200. Then, the microphone 200 inputs the response voice input by the user, and then outputs analog voice data corresponding to the response voice to the CODEC unit 300. In addition, the CODEC unit 300 receives analog response data output from the microphone 200, converts the analog response data into PCM response data, and outputs the analog response data to the vocoder 410. On the other hand, the vocoder 410 receives the PCM response data output from the CODEC unit 300, compresses it into a QCELP response signal and outputs it to the control unit 500 (S5).

그러면, 상기 제어부(500)는 상기 보코더(410)로부터 QCELP로 압축된 “예” 또는 “아니오”의 응답음성을 입력받은 후 그 응답음성에 해당하는 특정계수를 산출한다(S6).Then, the control unit 500 receives a response voice of "yes" or "no" compressed by the QCELP from the vocoder 410 and calculates a specific coefficient corresponding to the response voice (S6).

그런후, 상기 제어부(500)는 상기 메모리부(100)내에 저장된 응답음성의 특정계수를 이용하여 사용자가 입력한 응답음성의 특정계수가 “예”에 해당하는 응답음성인지, 아니면 “아니오”에 해당하는 응답음성인지의 여부를 판단한다(S7).Thereafter, the control unit 500 determines whether or not the specific coefficient of the response voice input by the user corresponds to the answer voice corresponding to "yes" or "no" using the specific coefficient of the response voice stored in the memory unit 100. It is determined whether or not the corresponding response voice (S7).

이 때, 상기 제 7 단계(S7)에서 상기 메모리부(100)내에 저장된 응답음성의 특정계수를 이용하여 사용자가 입력한 응답음성의 특정계수가 “아니오”에 해당하는 응답음성이면 상기 제어부(500)는 다시 상기 제 3 단계(S3)로 진행하는 한편, “예”에 해당하는 응답음성이면, 상기 제어부(500)는 “우리집”에 해당하는 전화번호로 정상적인 호를 진행시킨다(S8).At this time, if the specific coefficient of the response voice input by the user using the specific coefficient of the response voice stored in the memory unit 100 in the seventh step (S7) is a response voice corresponding to "no", the control unit 500 ) Proceeds to the third step S3, and if the answering voice corresponds to "yes", the control unit 500 proceeds to the normal call to the telephone number corresponding to "my house" (S8).

한편, 상기 제 3 단계(S3)에서 상기 메모리부(100)내에 그 QELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하지 않으면(NO), 상기 제어부(500)는 상기 디스플레이부(600)로 재입력 메시지 디스플레이 제어신호를 출력함으로써 호시도를 거부한다. 그러면, 상기 디스플레이부(600)는 상기 제어부(500)에서 출력한 재입력 메시지 디스플레이 제어신호를 입력받아 사용자에게 호시도 음성을 재입력하라는 메시지를 디스플레이 시킨다(S9).On the other hand, if the specific coefficient equal to the specific coefficient of the Hoshido voice compressed by the QELP is not present in the memory unit 100 in the third step S3 (NO), the control unit 500 controls the display unit ( And rejects the call view by outputting a re-input message display control signal. Then, the display unit 600 receives a re-input message display control signal output from the control unit 500 and displays a message to the user to re-input a call voice.

따라서, 사용자가 입력한 호시도 음성이 정확하게 입력되었는가의 여부를 사용자 확인절차를 통해 다시한번 점검한 후 호시도 동작을 수행해 줌으로써, 사용자가 호출하고자 하는 전화번호만을 정확하게 호출해 줄 수 있도록 해주는 것이다.Therefore, by checking whether or not the voice inputted by the user is correctly input through the user confirmation procedure, and performing the hoshido operation, the user can correctly call only the phone number to be called.

상술한 바와 같이 본 발명에 의한 휴대전화기에서의 대화형 음성인식 방법에 의하면, 사용자가 입력한 호시도 음성이 정확하게 입력되었는가의 여부를 사용자 확인절차를 통해 다시한번 점검한 후 호시도 동작을 수행해 줌으로써, 사용자가 호출하고자 하는 전화번호만을 정확하게 호출해 줄 수 있을 뿐만 아니라, 스피커폰을 사용하기 때문에 소음지역이나 시끄러운 장소에서도 사용자가 호시도 확인 음성을 높은 레벨의 음량으로 들을 수 있다는 뛰어난 효과가 있다.According to the interactive voice recognition method in the mobile phone according to the present invention as described above, by checking whether or not the voice inputted by the user has been correctly input through the user confirmation procedure once again by performing the hododo operation In addition, since the user can not only correctly call the phone number that the user wants to call, but also uses the speakerphone, there is an excellent effect that the user can listen to the sound even at a high level even in a noisy area or a noisy place.

Claims (2)

메모리부, 마이크, CODEC부, MSM내에 장착된 보코더, 제어부, 디스플레이부, 및 스피커폰을 구비한 휴대전화기에서의 대화형 음성인식 방법에 있어서, 상기 보코더가 사용자가 호시도하고자 하는 음성을 입력하면 그 음성 데이터를 QCELP로 압축한 후 상기 제어부로 출력하는 제 1 단계; 상기 제어부가 QCELP로 압축된 호시도 음성에 해당하는 특정 계수를 산출하는 제 2 단계; 상기 제어부가 상기 메모리부내에 그 QCELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하는지의 여부를 판단하는 제 3 단계; 상기 제 3 단계에서 상기 메모리부내에 그 QCELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하면, 상기 제어부가 그 호시도 음성 데이터를 상기 스피커폰을 통해 사용자에게 재출력시키는 제 4 단계; 상기 보코더가 사용자가 상기 스피커폰을 통해 재출력된 호시도 음성을 듣고 응답음성을 입력하면, 그 응답 데이터를 QCELP로 압축한 후 상기 제어부로 출력하는 제 5 단계; 상기 제어부가 QCELP로 압축된 응답음성에 해당하는 특정계수를 산출하는 제 6 단계; 상기 제어부가 상기 메모리부내에 저장된 응답음성의 특정계수를 이용하여 사용자가 입력한 응답음성의 특정계수가 “예”에 해당하는 응답음성인지, 아니면 “아니오”에 해당하는 응답음성인지의 여부를 판단하는 제 7 단계; 및 상기 제 7 단계에서 그 응답음성이 “아니오”에 해당하는 응답음성이면 다시 상기 제 3 단계로 진행하는 한편, 그 응답음성이 “예”에 해당하는 응답음성이면, 상기 제어부가 그 응답음성에 해당하는 전화번호를 통해 호를 진행시키는 제 8 단게로 이루어진 것을 특징으로 하는 휴대전화기에서의 대화형 음성인식 방법.In an interactive voice recognition method in a mobile phone having a memory unit, a microphone, a CODEC unit, a vocoder mounted in an MSM, a control unit, a display unit, and a speakerphone, when the vocoder inputs a voice that a user wishes to call, Compressing voice data into QCELP and outputting the voice data to the controller; A second step of the control unit calculating a specific coefficient corresponding to the Hoshido voice compressed with QCELP; A third step of determining, by the controller, whether a specific coefficient equal to a specific coefficient of the Hoshido voice compressed by the QCELP exists in the memory unit; A fourth step in which the control unit re-outputs the call view voice data to the user through the speakerphone when the specific coefficient equal to the specific coefficient of the Hoshido voice compressed by the QCELP exists in the memory unit in the third step; A fifth step of the vocoder outputting the response data to the control unit after compressing the response data into the QCELP when the user hears the Hoshido voice re-output through the speakerphone and inputs the response voice; A sixth step of calculating, by the controller, a specific coefficient corresponding to the response voice compressed by the QCELP; The controller determines whether the response coefficient input by the user is the response voice corresponding to "yes" or the response voice corresponding to "no" by using the specific coefficient of the response voice stored in the memory unit. A seventh step; And if the response voice corresponds to "no" in the seventh step, the process proceeds to the third step again; if the response voice corresponds to "yes", the controller controls the response voice. Interactive voice recognition method in a mobile phone, characterized in that consisting of the eighth step to advance the call through the corresponding phone number. 제1항에 있어서, 상기 제 3 단계에서 상기 메모리부내에 그 QCELP로 압축된 호시도 음성의 특정계수와 동일한 특정계수가 존재하지 않으면, 상기 제어부가 상기 디스플레이부를 통해 사용자에게 호시도 음성을 재입력하라는 메시지를 디스플레이시켜 줌과 동시에 다시 리턴하는 제 9 단계를 추가로 포함시킴을 특징으로 하는 휴대전화기에서의 대화형 음성인식 방법.The method of claim 1, wherein in the third step, when the specific coefficient equal to the specific coefficient of the Hoshido voice compressed by the QCELP does not exist in the memory unit, the control unit re-inputs the Hoshido voice to the user through the display unit. And a ninth step of returning the message to the user and returning the message to the user.
KR1019980042229A 1998-10-09 1998-10-09 Interactive Voice Recognition Method in Mobile Phones KR100301725B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980042229A KR100301725B1 (en) 1998-10-09 1998-10-09 Interactive Voice Recognition Method in Mobile Phones

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980042229A KR100301725B1 (en) 1998-10-09 1998-10-09 Interactive Voice Recognition Method in Mobile Phones

Publications (2)

Publication Number Publication Date
KR20000025230A KR20000025230A (en) 2000-05-06
KR100301725B1 true KR100301725B1 (en) 2001-10-27

Family

ID=19553477

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980042229A KR100301725B1 (en) 1998-10-09 1998-10-09 Interactive Voice Recognition Method in Mobile Phones

Country Status (1)

Country Link
KR (1) KR100301725B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970055729A (en) * 1995-12-20 1997-07-31 양승택 Method and apparatus for transmitting telephone number by voice recognition in mobile terminal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970055729A (en) * 1995-12-20 1997-07-31 양승택 Method and apparatus for transmitting telephone number by voice recognition in mobile terminal

Also Published As

Publication number Publication date
KR20000025230A (en) 2000-05-06

Similar Documents

Publication Publication Date Title
US6782252B1 (en) Apparatus and method for transmitting call holding message in mobile communication terminal
US7974392B2 (en) System and method for personalized text-to-voice synthesis
US5058153A (en) Noise mitigation and mode switching in communications terminals such as telephones
CA2539649C (en) System and method for personalized text-to-voice synthesis
KR101367722B1 (en) Method for communicating voice in wireless terminal
US5842139A (en) Telephone communication terminal and communication method
JP5251588B2 (en) Mobile phone terminal device and method for determining call transmission
KR100467593B1 (en) Voice recognition key input wireless terminal, method for using voice in place of key input in wireless terminal, and recording medium therefore
KR100301725B1 (en) Interactive Voice Recognition Method in Mobile Phones
US6625474B1 (en) Method and apparatus for audio signal based answer call message generation
KR100298317B1 (en) Communication method for portable phone
KR100658889B1 (en) Method for generating a receiving ring in a mobile communication system
KR0124475B1 (en) Digital cellularphone reception massage system
JP2005123869A (en) System and method for dictating call content
KR100662427B1 (en) Mobile terminal providing improved sound
JP3477099B2 (en) Telephone equipment
Duerr Voice recognition in the telecommunications industry
JPH07177237A (en) Computer interlocked type voice mail system, telephone set, and computer terminal
JPH07288578A (en) Automatic answering telephone set
KR19990041643A (en) How to Play Audio on Your Phone
KR20010049060A (en) Method for confirming short telephone number in automatic answering telephone
KR20030039039A (en) Caller recognizing apparatus and method for telephone by voice recognition
JPH05227272A (en) Automatic telephone reception device
JP2003046647A (en) System, method and program for repeating call and recording medium with the program recorded thereon
JPS5851659A (en) Telephone terminal device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120604

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20130530

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee