KR20080052306A - 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치 - Google Patents

네비게이션 시스템에 이용되는 음성 인식 방법 및 장치 Download PDF

Info

Publication number
KR20080052306A
KR20080052306A KR1020070088918A KR20070088918A KR20080052306A KR 20080052306 A KR20080052306 A KR 20080052306A KR 1020070088918 A KR1020070088918 A KR 1020070088918A KR 20070088918 A KR20070088918 A KR 20070088918A KR 20080052306 A KR20080052306 A KR 20080052306A
Authority
KR
South Korea
Prior art keywords
word
feature data
registered
speech recognition
navigation system
Prior art date
Application number
KR1020070088918A
Other languages
English (en)
Other versions
KR100919227B1 (ko
Inventor
이은령
손동환
정영규
김광수
이호근
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20080052306A publication Critical patent/KR20080052306A/ko
Application granted granted Critical
Publication of KR100919227B1 publication Critical patent/KR100919227B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0968Systems involving transmission of navigation instructions to the vehicle
    • G08G1/096805Systems involving transmission of navigation instructions to the vehicle where the transmitted instructions are used to compute a route
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Navigation (AREA)

Abstract

본 발명은 음성 인식 장치 및 방법에 관한 것으로, 적은 리소스를 사용하여 음성 입력된 단어를 인식하기 위한 장치 및 방법을 제공한다.
이를 위해 본 발명에 따른 네비게이션을 이용한 음성 인식 방법은, (a) 음성을 통하여 입력된 단어의 특징 데이터를 추출하는 단계; (b) 상기 추출된 단어 특징 데이터와 미리 등록된 단어 특징 데이터를 비교함으로써 상기 단어를 인식하는 단계; (c) 상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 없다면, 상기 입력된 음성의 초성 특징 데이터를 추출하는 단계; 및 (d) 상기 추출된 초성 특징 데이터를 미리 등록된 초성 특징 데이터와 비교함으로써 상기 단어를 인식하는 단계를 포함함으로써, 적은 리소스를 사용하여 음성 입력된 단어를 인식할 수 있는 이점이 있다.
네비게이션, 음성 인식, 특징 데이터

Description

네비게이션 시스템에 이용되는 음성 인식 방법 및 장치{THE METHOD AND APPARATUS FOR RECOGNIZING SPEECH FOR NAVIGATION SYSTEM}
본 발명은 음성 인식 장치 및 방법에 관한 것으로, 특히 네비게이션에서 리소스를 효과적으로 제한하여 음성을 인식하기 위한 장치 및 방법에 관한 것이다.
현재 사용되고 있는 이동 단말기는 리소스(resource)가 한정적이어서 한 단계에서 음성 인식이 가능한 어휘의 수가 대략 1천 단어 정도로 매우 적다. 따라서, 기존의 고정 또는 가변 탐색망에 기반하여 음성 인식을 수행하는 방법은 수십만 어휘를 처리하기에 역부족이다. 따라서, 인식 대상 어휘를 얼마나 효과적으로 제한하여 유효한 어휘 집합을 구성할 수 있는지에 대한 방안의 필요성이 대두되고 있다. 미국 등록 특허 제 6694295호 'Method and a device for recognizing speech'에 게시된 발명은 키 보드나 터치 스크린으로 입력된 문자열을 인식하고, 그 문자열로 시작되는 어휘들만을 인식 대상 어휘로 하는 방법인데, 이 방식은 키보드를 사용하는 등 특정한 키를 눌러야하는 불편함이 있다. 또한, 이 방식에 따르더라도 음성 인식 장치는 많은 어휘를 검색해야 하는 단점이 있다.
따라서, 본 발명의 목적은, 적은 리소스를 사용하여 음성 입력된 단어를 인식하기 위한 장치 및 방법을 제공하는 데 있다.
또한, 본 발명의 다른 목적은, 음성 입력된 단어의 특징 데이터가 충분하지 않은 경우 초성 특징 데이터를 이용하여 단어를 인식하기 위한 장치 및 방법을 제공하는 데 있다.
이를 위해 본 발명에 따른 네비게이션을 이용한 음성 인식 방법은, (a) 음성을 통하여 입력된 단어의 특징 데이터를 추출하는 단계; (b) 상기 추출된 단어 특징 데이터와 미리 등록된 단어 특징 데이터를 비교함으로써 상기 단어를 인식하는 단계; (c) 상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 없다면, 상기 입력된 음성의 초성 특징 데이터를 추출하는 단계; 및 (d) 상기 추출된 초성 특징 데이터를 미리 등록된 초성 특징 데이터와 비교함으로써 상기 단어를 인식하는 단계를 포함한다.
또한, 이를 위해 본 발명에 따른 네비게이션을 이용한 음성 인식 장치는, 음성을 통하여 단어를 입력받는 음성 입력부; 상기 음성 입력된 단어의 단어 특징 데이터 및 초성 특징 데이터를 추출하는 음성 인식부; 및 상기 추출된 단어 특징 데이터를 미리 등록된 단어 특징 데이터와 비교하고, 상기 추출된 단어 특징 데이터 와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 없다면, 상기 추출된 초성 특징 데이터를 미리 등록된 초성 특성 데이터와 비교하여 음성 인식을 수행하는 제어부를 포함한다.
상술한 바와 같이 본 발명은, 적은 리소스를 사용하여 음성 입력된 단어를 인식할 수 있는 이점이 있다. 또한, 본 발명은 음성 입력된 단어의 특징 데이터가 등록되어 있지 않은 경우, 초성을 비교함으로써 음성 입력된 단어를 인식할 수 있는 이점이 있다.
도 1은 단어, 초성 및 숫자의 특징 데이터가 등록된 상태를 보여주는 예시도이다.
도 1의 (a)는 기존의 음성 인식 장치에서 특징 데이터가 등록된 상태를 보여주는 것으로, '경복궁', '경주', '경찰청' 및 '경희궁'이라는 단어가 메모리에 저장되어 있는 상태에서, 위 단어들에 대하여 음성 인식을 하고자 할 때, 각각의 단어에 대한 특징 데이터가 모두 메모리에 등록되어 있는 것을 보여준다.
도 1의 (b)는 본 발명의 일실시 예에 따른 특징 데이터가 등록된 상태를 보여주는 것으로, 상기 4개의 단어 중 '경복궁'과 '경주'는 그 사용이 빈번하게 예상되지만, 나머지 단어'경찰청'과 '경희궁'은 그 사용이 드물게 있으리라 예상되어 ' 경복궁'과 '경주'라는 단어에 대한 단어 특징 데이터만을 등록한 것을 보여준다. 이에 더하여, 숫자 및 초성에 대한 특징 데이터도 등록되어있다.
만약 사용자에 의하여 입력된 단어가 '경복궁' 또는 '경주'인 경우 본 발명의 일실시 예에 따른 음성 인식 장치는 미리 등록된 단어 특징 데이터와 비교하여 '경복궁' 또는 '경주'를 인식하고, 입력된 단어가 '경찰청' 또는 '경희궁'인 경우 상기 단어의 초성 'ㄱㅊㅊ' 또는 'ㄱㅎㄱ'을 추출한 후, 상기 추출된 초성 특징을 갖는 미리 저장된 단어가 있는지 판단하여 상기 단어를 인식하게 된다. 도 1의 (b)와 같이 등록되는 단어 특징 데이터의 수를 시스템의 성능에 따라 제한하면, 시스템을 효율적으로 사용할 수 있는 이점이 있게 된다.
도 2는 본 발명의 일실시 예에 따른 음성 인식 장치의 블록도이다.
본 발명의 일실시 예에 따른 음성 인식 장치는 제어부(200), 키 입력부(210), 음성 입력부(220), 음성 출력부(230), 표시부(240), 음성 인식부(250) 및 메모리부(260)를 포함한다.
제어부(200)는 음성 입력부(220)로부터 음성 입력이 있는지 판단하고, 입력된 음성을 음성 인식부(250)로 출력한다. 그 후, 음성 인식부(250)에서 추출된 단어 특징 데이터 및 초성 특징 데이터와 메모리부(260)에 미리 등록된 단어 특징 데이터 및 초성 특징 데이터를 비교하여 서로 일치하는 특징 데이터가 있는지 판단한다.
또한, 상기 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데 이터를 갖는 단어가 제어 명령이라면 상기 제어 명령을 수행하고, 상기 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터를 갖는 단어가 지명이라면, 상기 지명을 음성 출력부(230) 및 표시부(240)로 출력한다. 또한, 상기 지명에 해당하는 지역에 관한 영상 신호를 표시부(240)로 출력한다.
또한, 본 발명의 제 1실시예에 따른 제어부(200)는 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터가 없는 경우, 추출된 단어 특징 데이터와 유사한 단어 특징 데이터를 갖는 단어를 후보 단어로써 출력한다.
또한, 본 발명의 제 2실시예에 따른 제어부(200)는 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터가 없는 경우, 입력된 단어로부터 추출된 초성 특징 데이터와 일치하는 초성 특징 데이터를 갖는 단어가 저장되어 있는지 판단한다. 이 때, 추출된 초성 특징 데이터와 일치하는 초성 특징 데이터를 갖는 단어가 저장되어 있는 경우 제어부(200)는 상기 단어를 출력하고, 추출된 초성 특징 데이터와 일치하는 특징 데이터를 갖는 미리 저장된 단어가 없는 경우, 상기 추출된 초성 특징 데이터와 유사한 특징 데이터를 갖는 단어를 후보 단어로써 출력한다.
이 때, 유사한 특징 데이터를 갖는 단어는 추출된 초성 특징 데이터를 포함하는 단어이거나, 추출된 초성 특징 데이터 중 일부와 유사한 단어일 수 있다. 예를 들어, 초성 'ㄱㅂ'이 입력된 경우, 이를 포함하는 단어 '경복궁'이 유사한 특징 데이터를 갖는 단어가 된다. 또한, 제어부(200)는 상기 지명에 해당하는 지역까지의 경로를 분석하고, 상기 경로에 관한 정보를 표시부(240)를 통하여 출력한다.
키 입력부(210)는 각 종 키를 구비하며, 사용자는 키 입력부(210)에 구비된 키를 누름으로써, 음성 인식 모드를 선택할 수 있다. 또한, 키 입력부(210)는 제어부(200)의 제어하에 표시부(240)로 출력된 단어 중 어느 하나를 선택하는 사용자의 입력을 받는다.
음성 입력부(220)는 사용자로부터 음성을 입력받고 이를 제어부(200)로 출력한다. 특히, 본 발명의 일실시 예에 따른 음성 입력부(220)는 지명 및 각종 제어 명령을 입력받는다.
음성 출력부(230)는 제어부(200)로부터 출력되는 단어에 관한 음성 신호를 스피커를 통하여 출력한다.
표시부(240)는 제어부(200)로부터 출력되는 영상 신호를 화면에 표시한다. 특히, 본 발명의 실시 예에 따른 표시부(240)는 제어부(200)의 제어 하에 지명으로 인식된 단어에 해당하는 지역에 관한 영상 신호를 화면에 표시한다.
음성 인식부(250)는 제어부(200)로부터 수신된 음성 데이터를 분석하여, 단어 특징 데이터 및 초성 특징 데이터를 추출하고, 상기 추출된 데이터를 제어부(200)로 출력한다.
메모리부(260)에는 지명 및 제어 명령 등 다 수개의 단어가 저장된다. 또한, 상기 다 수개의 단어 중 미리 선택된 단어에 대한 특징 데이터가 등록되며, 초성, 숫자의 특징 데이터도 등록된다. 하기에서 설명하는 본 발명의 일실시 예에서는 제어 명령에 해당하는 단어에 대하여는 모두 단어 특징 데이터가 등록되어 있는 것으로 설명한다.
도 3은 본 발명의 제 1실시 예에 따른 음성 인식 방법을 나타낸 흐름도이다. 이하, 네비게이션의 모드가 맵을 보여주는 상태이거나, 메뉴를 보여주는 상태일 때 본 발명의 제 1실시 예에 따른 음성 인식을 하는 과정을 상세히 설명한다.
단계(300)에서 제어부(200)는 음성을 통한 단어 입력이 있는지 판단하고, 단어 입력이 있다면 단계(302)로 진행한다. 단계(302)에서 음성 인식부(250)는 입력된 단어의 특징 데이터를 추출한 후, 단계(304)로 진행한다.
단계(304)에서 제어부(200)는 음성 인식부(250)에서 추출된 단어 특징 데이터와 메모리부(260)에 미리 등록된 단어 특징 데이터를 비교한 후, 단계(306)로 진행한다. 단계(306)에서 제어부(200)는 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터가 있다면 단계(308)로 진행하고, 그렇지 않으면 단계(330)로 진행한다.
단계(308)에서 제어부(200)는 상기 일치하는 단어 특징 데이터가 제어 명령인지 판단하고, 제어 명령이라면 단계(310)로 진행하고, 그렇지 않으면 단계(320)로 진행한다. 단계(310)에서 제어부(200)는 상기 제어 명령을 수행한 후, 단계(300)로 진행한다.
한편, 단계(306)에서 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터가 없다고 판단하여 진행한 단계(330)에서, 제어부(200)는 추출된 단어 특징 데이터와 유사한 단어 특징 데이터를 갖는 후보 단어를 선택하여 출력한 후, 단계(300)로 진행한다.
한편, 단계(308)에서 상기 일치하는 단어 특징 데이터가 제어 명령이 아닌 지명이라고 판단하여 진행한 단계(330)에서 제어부(200)는, 상기 지명을 음성 및 영상으로 출력한 후, 단계(300)로 진행한다. 이때, 제어부(200)는 미리 정해진 설정에 따라 상기 지명에 해당하는 지역의 지도를 영상으로 출력할 수 있고, 상기 지명에 해당하는 지점까지의 경로를 분석할 수 있다.
도 4는 본 발명의 제 1실시 예에 따른 음성 인식 과정을 보여준 예시도이다. 이때, 메모리부(260)에는 '경복궁', '경희대' 및 '경희궁'이라는 단어가 저장되어 있고, '경복궁'의 특징 데이터가 등록되어 있다고 가정한다. 또한, 제어 명령어 '목적지', '경로 검색', '아래', '위' 및 '확인' 등에 대한 특징 데이터가 등록되어 있다고 가정한다.
도 4의 (a)는 네비게이션 화면에 지도가 나타난 상태에서 사용자가 '경복궁'이란 단어를 음성으로 입력한 경우를 보여준 예이다. 사용자로부터 '경복궁'이란 단어가 입력되면 음성 인식부(250)는 입력된 단어의 특징 데이터를 추출하고, 제어부(200)는 상기 추출된 단어의 특징 데이터를 메모리부(260)에 등록된 단어의 특징 데이터와 비교한다. 본 발명의 제 1실시 예에서 '경복궁'이란 단어의 특징 데이터가 메모리부(260)에 등록되어 있기 때문에, 제어부(200)는 '경복궁'이란 단어를 인식하고 이를 화면에 출력하고, 다음 입력을 기다리게 된다.
도 4의 (b)는 도 4의 (a)의 화면에서 사용자가 '목적지' 및 '경로 검색'이라는 단어를 음성으로 입력한 경우를 보여준 예이다. '목적지'라는 단어가 입력되면 음성 인식부(250)는 입력된 단어의 특징 데이터를 추출하고, 제어부(200)는 상기 추출된 단어의 특징 데이터를 메모리부(260)에 등록된 단어의 특징 데이터와 비교한다. 본 발명의 제 1실시 예에서 '목적지'란 명령어에 대한 특징 데이터가 메모리부(260)에 등록되어 있기 때문에, 제어부(200)는 '경복궁'을 목적지로 인식하고, 다음 입력을 기다리게 된다. '경복궁'이 목적지로 인식된 후에, 사용자로부터 '경로 검색'이라는 단어가 음성으로 입력되면, 음성 인식부(250)는 입력된 단어의 특징 데이터를 추출하고, 제어부(200)는 상기 추출된 단어의 특징 데이터를 메모리부(260)에 등록된 단어의 특징 데이터와 비교한다. '경로 검색'이라는 명령어의 특징 데이터 역시 메모리부(260)에 등록되어 있기 때문에, 제어부(200)는 '경복궁'까지의 경로를 검색하고, 이를 화면을 통하여 출력한다.
도 4의 (c)는 사용자로부터 '경희궁'이라는 단어가 음성으로 입력된 경우를 보여준 예이다.
음성 인식부(250)는 입력된 단어 '경희궁'의 특징 데이터를 추출하고, 제어부(200)는 상기 추출된 단어의 특징 데이터를 메모리부(260)에 등록된 단어의 특징 데이터와 비교한다. '경희궁'이라는 단어는 메모리부(260)에 저장되어 있지만, 특징 데이터는 등록되어있지 않기 때문에, 제어부(200)는 입력된 음성과 유사하다고 판단하는 '경희궁, 경희대'를 화면으로 출력한다. 이때, 사용자는 '아래', '위' 및 '확인' 등의 제어 명령어를 음성으로 입력하여 원하는 단어를 선택할 수 있다.
도 5는 본 발명의 제 2실시 예에 따른 음성 인식 방법을 나타낸 흐름도이다. 이하, 네비게이션의 검색 모드에서 본 발명의 제 2실시 예에 따른 음성 인식 방법을 상세히 설명한다.
단계(500)에서 제어부(200)는 음성을 통한 단어 입력이 있는지 판단하고, 단어입력이 있다면 단계(502)로 진행한다. 단계(502)에서 음성 인식부(250)는 입력된 단어의 특징 데이터 및 초성 특징 데이터를 추출한다.
단계(504)에서 제어부(200)는 음성 인식부(250)에서 추출된 단어 특징 데이터와 메모리부(260)에 미리 등록된 단어 특징 데이터를 비교한 후, 단계(506)로 진행한다. 단계(506)에서 제어부(200)는 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어 특징 데이터가 있다면 단계(508)로 진행하고, 그렇지 않으면 단계(530)로 진행한다.
단계(508)에서 제어부(200)는 상기 일치하는 단어가 제어 명령인지 판단하고, 제어 명령이라면 단계(510)로 진행하고, 그렇지 않으면 단계(520)로 진행한다. 단계(510)에서 제어부(200)는 제어 명령을 수행한 후, 단계(500)로 진행한다.
한편, 단계(508)에서 상기 일치하는 단어가 제어 명령이 아닌 지명이라고 판단하여 진행한 단계(520)에서, 제어부(200)는 상기 지명을 음성 및 영상으로 출력한 후, 단계(500)로 진행한다. 이때, 미리 정해진 설정에 따라 제어부(200)는 상기 지명에 해당하는 지역의 지도를 영상으로 출력할 수 있다.
한편, 단계(506)에서 상기 추출된 단어 특징 데이터와 일치하는 미리 등록된 단어가 없다고 판단하여 진행한 단계(530)에서, 제어부(200)는 추출된 초성 특징 데이터로 메모리부(260)에 저장된 단어를 검색한 후, 단계(532)로 진행한다. 단 계(532)에서 제어부(200)는 상기 추출된 초성 특징 데이터와 일치하는 미리 저장된 단어가 있다면 단계(534)로 진행하고, 그렇지 않으면 (536)단계로 진행한다. 단계(534)에서 제어부(200)는 상기 초성 특징 데이터가 일치하는 단어들을 음성 또는 영상으로 출력한 후, 단계(500)로 진행한다.
한편, 단계(536)에서 제어부(200)는 상기 초성 특징 데이터와 유사한 특징을 갖는 후보 단어를 출력한 후, 단계(500)로 진행한다.
도 6은 본 발명의 제 2실시 예에 따른 음성 인식 과정을 보여준 예시도이다.
도 6의 (a)는 사용자로부터 초성'ㄱㅎㄱ'이 음성으로 입력된 경우를 보여주는 도면이다. 초성이 하나씩 입력될 때마다 음성 인식부(250)는 메모리에 등록된 초성 특징 데이터와 비교하고, 일치하는 초성에 대하여 이를 화면에 출력한다.
사용자가 원하는 초성'ㄱㅎㄱ'이 모두 인식된 것을 확인한 후에 사용자가 '확인'이라는 명령어를 음성으로 입력하면, 제어부(200)는 초성'ㄱㅎㄱ'을 포함하는 단어가 등록되어 있는지 메모리부(260)에서 검색한다. 만약, '경희궁'이라는 단어의 특징 데이터가 등록되어 있다면, 제어부(200)는 도 5의 (b)와 같이 '경희궁'을 화면에 출력하고 다음 입력을 기다리게 된다.
만약, '경희궁'이라는 단어가 메모리부(260)에 저장되어 있기는 하나, 특징 데이터가 등록되어 있지 않은 경우, 제어부(200)는 후보 단어 제시에 이를 참조할 수 있다. 후보 단어 제시에 있어서, 예를 들어, 입력된 초성 특징 데이터 중 2개 이상의 특징 데이터가 일치하면 후보 단어로써 제시하도록 설정되어 있다면, 제어 부(200)는 메모리부(260)에 저장된 3개의 단어'경복궁', '경희궁', '경희대' 중 초성 'ㄱ, ㅎ'이 들어가는 단어 '경희궁'과 '경희대'를 도 5의 (c)와 같이 후보 단어로써 제시하게 된다. 이후 사용자에 의하여 입력되는 음성 제어 명령을 통해 원하는 지명이 선택되고, 이를 화면에 표시 및 상기 지명까지의 경로 검색에 관한 방법 등은 도 4에서 설명한 바와 같다.
상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시될 수 있다. 예를 들어, 음성 입력 단어가 주소에 해당하는 경우, 동 이름만으로 타당서 있는 후보의 범위를 축소할 수 있을 것이고, 입력된 음성이 전체로서 숫자에 해당한다면 전화 번호부 정보와 연결하여 전화 번호부에 저장된 주소를 경로 검색에 활용할 수도 있다. 또한, 이동 단말기의 경우, 음성 인식부 및 지도 정보 서버를 따로 구성하여 운영할 수도 있다. 따라서, 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정해져야 한다.
도 1은 단어, 초성 및 숫자의 특징 데이터가 등록된 상태를 보여주는 예시도,
도 2는 본 발명의 일실시 예에 따른 음성 인식 장치의 블록도,
도 3은 본 발명의 제 1실시 예에 따른 음성 인식 방법을 나타내는 흐름도,
도 4는 본 발명의 제 1실시 예에 따른 음성 인식 과정을 보여주는 예시도,
도 5는 본 발명의 제 2실시 예에 따른 음성 인식 방법을 나타내는 흐름도,
도 6은 본 발명의 제 2실시 예에 따른 음성 인식 과정을 보여주는 예시도.

Claims (22)

  1. (a) 음성을 통하여 입력된 단어의 특징 데이터를 추출하는 단계;
    (b) 상기 추출된 단어 특징 데이터와 미리 등록된 단어 특징 데이터를 비교함으로써 상기 단어를 인식하는 단계;
    (c) 상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 없다면, 상기 입력된 음성의 초성 특징 데이터를 추출하는 단계; 및
    (d) 상기 추출된 초성 특징 데이터를 미리 등록된 초성 특징 데이터와 비교함으로써 상기 단어를 인식하는 단계
    를 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  2. 제 1항에 있어서,
    상기 추출된 초성 특징 데이터와 일치하는 상기 미리 등록된 초성 특징 데이터가 없다면, 상기 추출된 초성 특징 데이터와 유사한 초성 특징 데이터를 갖는 후보 단어를 출력하고, 상기 출력된 후보 단어 중 어느 하나를 선택하는 사용자의 선택을 입력받는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  3. 제 1항에 있어서,
    상기 추출된 초성 특징 데이터와 일치하는 상기 미리 등록된 초성 특징 데이터를 갖는 상기 등록 단어가 다수 개인 경우, 상기 다수 개의 등록 단어를 출력하고, 상기 출력된 등록 단어 중 어느 하나를 선택하는 사용자의 선택을 입력받는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  4. 제 2항 또는 제 3항에 있어서,
    상기 사용자의 선택은 음성 입력 또는 키 입력을 통하여 이루어지는
    네비게이션 시스템에 이용되는 음성 인식 방법.
  5. 제 2항 또는 제 3항에 있어서,
    화면에 표시되는 지역을 상기 선택된 단어에 해당하는 지역으로 이동시키는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  6. 제 2항 또는 제 3항에 있어서,
    상기 선택된 단어에 해당하는 지역까지의 예상 이동 경로를 분석하는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  7. 제 1항에 있어서, 상기 (b) 단계는,
    상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 있는 경우, 상기 등록 단어가 지명이라면 상기 등록 단어를 출력하는 단계
    를 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  8. 제 7항에 있어서,
    화면에 표시되는 지역을 상기 지명에 해당하는 지역으로 이동시키는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  9. 제 7항 또는 제 8항에 있어서,
    상기 지명에 해당하는 지역까지의 예상 이동 경로를 분석하는 단계
    를 더 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  10. 제 7항에 있어서,
    상기 등록 단어가 제어 명령이라면 상기 제어 명령을 수행하는 단계
    를 포함하는 네비게이션 시스템에 이용되는 음성 인식 방법.
  11. 제 1항에 있어서,
    시스템 성능에 따라 상기 등록되는 단어 특징 데이터의 수를 제어하는
    네비게이션 시스템에 이용되는 음성 인식 방법
  12. 음성을 통하여 단어를 입력받는 음성 입력부;
    상기 음성 입력된 단어의 단어 특징 데이터 및 초성 특징 데이터를 추출하는 음성 인식부; 및
    상기 추출된 단어 특징 데이터를 미리 등록된 단어 특징 데이터와 비교하고, 상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 없다면, 상기 추출된 초성 특징 데이터를 미리 등록된 초성 특성 데이터와 비교하여 음성 인식을 수행하는 제어부
    를 포함하는 네비게이션 시스템에 이용되는 음성 인식 장치.
  13. 제 12항에 있어서, 상기 제어부는,
    상기 추출된 초성 특징 데이터와 일치하는 상기 미리 등록된 초성 특징 데이터가 없다면, 상기 추출된 초성 특징 데이터와 유사한 초성 특징 데이터를 갖는 후보 단어를 출력하고, 상기 출력된 후보 단어 중 어느 하나를 선택하는 신호를 입력받는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  14. 제 12항에 있어서, 상기 제어부는,
    상기 추출된 초성 특징 데이터와 일치하는 상기 미리 등록된 초성 특징 데이터를 갖는 상기 등록 단어가 다수 개인 경우, 상기 다수 개의 등록 단어를 출력하고, 상기 출력된 등록 단어 중 어느 하나를 선택하는 신호를 입력받는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  15. 제 13항 또는 제 14항에 있어서,
    상기 출력된 단어 중 어느 하나를 선택하는 사용자의 입력을 받는 키 입력부 및 음성 입력부 중 하나 이상을 포함하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  16. 제 13항 또는 제 14항에 있어서, 상기 제어부는,
    상기 선택된 단어에 해당하는 지역에 관한 영상 신호를 출력하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  17. 제 13항 또는 제 14항에 있어서, 상기 제어부는,
    상기 단어에 해당하는 지점까지의 예상 이동 경로를 분석하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  18. 제 12항에 있어서, 상기 제어부는,
    상기 추출된 단어 특징 데이터와 일치하는 상기 미리 등록된 단어 특징 데이터를 갖는 등록 단어가 있는 경우, 상기 등록 단어가 지명이라면 상기 등록 단어를 출력하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  19. 제 18항에 있어서, 상기 제어부는,
    상기 지명에 해당하는 지역에 관한 영상 신호를 출력하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  20. 제 18항 또는 제 19항에 있어서, 상기 제어부는,
    상기 지명에 해당하는 지역까지의 예상 이동 경로를 분석하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  21. 제 18항에 있어서, 상기 제어부는,
    상기 등록 단어가 제어 명령이라면 상기 제어 명령을 수행하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
  22. 제 12항에 있어서,
    시스템 성능에 따라 상기 등록되는 단어 특징 데이터의 수를 제어하는
    네비게이션 시스템에 이용되는 음성 인식 장치.
KR1020070088918A 2006-12-05 2007-09-03 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치 KR100919227B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060122297 2006-12-05
KR20060122297 2006-12-05

Publications (2)

Publication Number Publication Date
KR20080052306A true KR20080052306A (ko) 2008-06-11
KR100919227B1 KR100919227B1 (ko) 2009-09-28

Family

ID=39807141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070088918A KR100919227B1 (ko) 2006-12-05 2007-09-03 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100919227B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
WO2015167076A1 (ko) * 2014-04-30 2015-11-05 현대엠엔소프트 주식회사 음성인식 기반의 네비게이션 시스템 제어 방법 및 네비게이션 시스템
WO2015167077A1 (ko) * 2014-04-30 2015-11-05 현대엠엔소프트 주식회사 내비게이션 장치 및 그 제어 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930011739B1 (ko) * 1988-08-31 1993-12-18 주식회사 금성사 초성 프리매칭의 2단매칭을 이용한 음성 인식방법
KR100679042B1 (ko) * 2004-10-27 2007-02-06 삼성전자주식회사 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
WO2015167076A1 (ko) * 2014-04-30 2015-11-05 현대엠엔소프트 주식회사 음성인식 기반의 네비게이션 시스템 제어 방법 및 네비게이션 시스템
WO2015167077A1 (ko) * 2014-04-30 2015-11-05 현대엠엔소프트 주식회사 내비게이션 장치 및 그 제어 방법

Also Published As

Publication number Publication date
KR100919227B1 (ko) 2009-09-28

Similar Documents

Publication Publication Date Title
JP3962763B2 (ja) 対話支援装置
KR100790700B1 (ko) 문자 규정 방법 및 문자 선택 장치
JP5048174B2 (ja) ユーザの発話を認識するための方法及び装置
KR101109265B1 (ko) 텍스트 입력 방법
US7949524B2 (en) Speech recognition correction with standby-word dictionary
EP3039531B1 (en) Display apparatus and controlling method thereof
KR101819458B1 (ko) 음성 인식 장치 및 시스템
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
JP2015510176A (ja) 入力処理方法及び装置
JP2007538278A (ja) 音声認識システム
CN107832035B (zh) 一种智能终端的语音输入方法
CN110827803A (zh) 方言发音词典的构建方法、装置、设备及可读存储介质
US20170372695A1 (en) Information providing system
CN109326284B (zh) 语音搜索的方法、装置和存储介质
EP1281114A2 (en) Constrained keyboard disambiguation using voice recognition
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
KR20090108239A (ko) 휴대용 단말기에서의 한글 검색 시스템 및 그 방법
CN110827815B (zh) 一种语音识别方法、终端、***以及计算机存储介质
JP2011221591A (ja) 地図検索システム
JP4498906B2 (ja) 音声認識装置
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
KR20110017600A (ko) 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법
JP2003140682A (ja) 音声認識装置及び音声辞書作成方法
KR101373206B1 (ko) 음성인식과 영상인식을 이용한 휴대단말기에서의 문서작성방법
JP2007193184A (ja) 音声住所認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121214

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee