KR20170058664A

KR20170058664A - 음성 인식 모듈, 그를 가지는 단말기 및 차량

Info

Publication number: KR20170058664A
Application number: KR1020150162539A
Authority: KR
Inventors: 방규섭; 박성수
Original assignee: 현대자동차주식회사
Priority date: 2015-11-19
Filing date: 2015-11-19
Publication date: 2017-05-29
Also published as: KR101755308B1

Abstract

본 발명은 제1정보와, 제1정보보다 용량이 큰 제2정보를 저장하는 데이터베이스부; 음성 인식 모드이면 제1 스레드를 이용하여 제1정보의 로딩 및 음성 인식을 수행하고, 제2스레드를 이용하여 제2정보의 로딩 및 음성 인식을 수행하되, 제1 스레드에서 인식된 음성이 제1정보와 매칭되면 제2스레드의 로딩을 정지시키는 프로세서를 포함한다.
본 발명은 멀티 스레드(Multi Thread)를 이용하여 주소 데이터 베이스(DB)를 로딩 함으로써 주소 DB를 로딩하는 시간을 줄일 수 있고 음성 인식을 통한 주소의 인식 시간을 단축시킬 수 있다.
이에 따라 본 발명은 음성 인식 시, 사용자가 발화를 대기하는 시간을 최소화할 수 있어 사용자의 만족도를 향상시킬 수 있다.
이와 같이 본 발명은 사용자에게 보다 정확하고 신속한 주소 검색 결과를 제공할 수 있다.

Description

음성 인식 모듈, 그를 가지는 단말기 및 차량{Sound recognition module, Navigation apparatus having the same and vehicle having the same}

본 발명은 음성을 인식하는 음성 인식 모듈과, 음성 인식을 이용하여 목적지를 입력받고, 입력된 목적지까지의 경로를 탐색하여 안내하는 단말기 및 차량에 관한 것이다.

일반적으로, 단말기는 내비게이션 기능, 전화 기능, 오디오 기능, 라디오 기능, 방송 기능, 문자 메시지 서비스 기능, 인터넷 기능 등을 수행할 수 있다.

여기서 내비게이션 기능은 다수의 위성위치확인시스템(Global Positioning System: 이하 "GPS"라 함)을 통해 위성들로부터 위치 정보를 각각 제공받아 현재 차량의 위치를 계산하고, 계산된 위치를 지도에 맵 매칭(Map Matching)시켜 표시하고, 사용자로부터 목적지를 입력받아 미리 설정된 경로탐색 알고리즘에 따라 계산된 현재 위치부터 목적지까지의 경로탐색을 수행하고, 탐색된 경로를 지도에 매칭시켜 표시하고, 경로를 따라 사용자를 목적지까지 안내하는 기능이다.

단말기는 내비게이션 기능을 통해 경로 안내 시 도로가 교차하는 교차점에서 사용자가 진입도로를 명확하게 인지할 수 있도록 그래픽 지도를 확대하여 표시하거나, 2분할 화면 기능을 사용하여 일측에는 기존 스케일(Scale)의 그래픽 지도를 디스플레이하고 다른 일측에는 교차점을 확대한 그래픽 지도를 표시한다.

여기서 교차점은 삼거리 이상의 교차로 및 고가도로 또는 지하도로의 분기점 및 고속도로의 인터체인지(Interchange) 등을 의미한다.

단말기는 내비게이션 기능 수행 시 터치 또는 조그 다이얼을 통해 목적지의 이름이나 주소를 입력받기 때문에 목적지 입력이 번거로운 문제가 있었다.

또한 차량은 주행 중에 터치 또는 조그 다이얼을 통해 목적지를 입력받기 때문에 운전자의 시선이 분산되게 하고 운전 집중력이 저하되게 하는 문제가 있었다. 이 때문에 사고 위험성이 높아지는 문제가 발생하였다.

이에 따라 최근에는 음성 인식을 이용하여 단말기나 차량의 각종 기능을 제어하는 기술들이 개발되고 있다.

일 측면은 음성 인식 명령이 입력되면 데이터베이스부의 제1정보를 로딩하여 음성인식을 수행하는 제1스레드와, 제1스레드 동작 중 데이터베이스부의 제2정보를 로딩하여 음성인식을 수행하는 제2스레드를 생성하는 프로세서를 포함하는 음성 인식 모듈, 그를 가지는 단말기 및 차량을 제공한다.

다른 측면은 음성 인식 명령이 입력되면 제1정보를 로딩하여 음성인식을 수행하는 제1스레드와, 제2정보를 로딩하여 음성인식을 수행하는 제2스레드를 생성하고, 제2스레드에서 제2정보 로딩 중 제1스레드에서 음성이 명령어로 인식되면 제2스레드의 로딩 동작을 정지시키는 프로세서를 포함하는 음성 인식 모듈, 그를 가지는 단말기 및 차량을 제공한다.

일 측면에 따른 음성 인식 모듈은 제1정보와, 제1정보보다 용량이 큰 제2정보를 저장하는 데이터베이스부; 음성 인식 모드이면 제1 스레드를 이용하여 제1정보를 로딩하고 로딩된 제1정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2정보를 로딩하고 로딩된 제2정보를 이용하여 음성 인식을 수행하되, 제2스레드에 제2정보의 로딩이 완료되기 전에 제1 스레드에서 음성이 인식되면 제2스레드의 로딩을 정지시키는 프로세서를 포함한다.

일 측면에 따른 음성 인식 모듈의 프로세서는, 제1스레드에서 음성이 미인식되면 제1스레드의 음성 인식을 정지시키고 제2스레드의 제2정보의 로딩을 유지시키며, 제2스레드에서 제2정보의 로딩이 완료되면 제2스레드에 로딩된 제2정보를 이용하여 음성인식을 수행하는 것을 포함한다.

일 측면에 따른 음성 인식 모듈의 제1정보는, 미리 설정된 단어수보다 적은 단어수를 갖는 제어 명령어 및 복수의 기능에 각각 대응하는 기능 명칭어의 정보를 포함하고, 제2정보는, 미리 설정된 단어수 이상의 단어수를 갖고, 복수의 기능을 각각 수행하기 위해 필요한 자료 정보를 포함한다.

일 측면에 따른 음성 인식 모듈은 소리를 수집하고 수집된 소리에 대응하는 신호를 프로세서에 전송하는 소리 수집부를 더 포함한다.

일 측면에 따른 음성 인식 모듈은 외부에서 전송된 소리의 신호를 프로세서에 전송하는 수신부를 더 포함한다.

일 측면에 따른 음성 인식 모듈은 소리의 신호를 저장하는 메모리부를 더 포함한다.

일 측면에 따른 음성 인식 모듈의 프로세서는, 음성 인식 모드의 동작 명령이 수신되면 제1 스레드 및 제 2 스레드를 생성하는 것을 더 포함한다.

일 측면에 따른 음성 인식 모듈의 프로세서는, 음성 인식 모드의 동작 명령이 수신되면 제1스레드를 이용하여 음성 인식을 위한 안내음의 출력을 수행하는 것을 포함한다.

다른 측면에 따른 단말기는 소리를 검출하고 검출된 소리의 신호를 출력하는 소리 검출부; 소리의 신호에 기초하여 음성 인식을 수행하는 음성 인식 모듈; 복수의 기능 중 내비게이션 기능이 선택되면 음성 인식의 정보에 기초하여 길 안내를 제어하는 제어부; 및 내비게이션 기능을 표시하는 표시부를 포함하고, 음성 인식 모듈은, 복수의 기능에 각각 대응하는 기능 명칭어 및 각 기능의 복수의 제어 명령어의 정보를 저장하는 제1데이터베이스와, 주소 정보를 저장하는 제2데이터베이스를 갖는 데이터베이스부와, 음성 인식 모드이면 제1 스레드를 이용하여 제1데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하되, 제2스레드에 정보의 로딩이 완료되기 전에 제1 스레드에서 인식된 음성이 제1데이터베이스에 저장된 정보와 매칭되면 제2스레드의 로딩을 정지시키는 프로세서를 포함다.

다른 측면에 따른 단말기는 음성 인식 모드를 입력받는 입력부를 더 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈의 프로세서는, 제1스레드에서 인식된 음성이 제1데이터베이스의 정보와 비매칭되면 제1스레드의 음성 인식을 정지시키고 제2스레드의 제2데이터베이스의 정보의 로딩을 유지시키고, 제2스레드에 정보의 로딩이 완료되면 로딩된 제2데이터베이스의 정보를 이용하여 음성인식을 수행하는 것을 포함한다.

다른 측면에 따른 단말기는 현재의 위치 정보를 수신하는 통신부를 더 포함하고, 제어부는, 제2스레드에서 인식된 음성 인식의 정보에 대응하는 목적지를 확인하고, 현재의 위치 정보에 기초하여 확인된 목적지까지의 경로를 탐색하는 것을 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈은 음소별로 특징 벡터의 벡터열을 저장하는 음향 모델부를 더 포함하고, 프로세서는, 상시 소리의 신호의 주파수 특성을 프레임 별로 계산하여 소리의 신호에 포함된 특징 벡터를 추출하는 것을 더 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈은, 소리의 신호를 저장하는 메모리부를 더 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈의 제1스레드는, 음향 모델부 및 제1데이터베이스의 정보에 기초하여 음성 인식을 수행하고, 제2스레드는, 메모리부, 음향 모델부 및 제2데이터베이스의 정보에 기초하여 음성 인식을 수행한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈의 프로세서는, 음성 인식 모드의 동작 명령이 수신되면 제1 스레드 및 제 2 스레드를 생성하는 것을 더 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈의 프로세서는, 음성 인식 모드의 동작 명령이 수신되면 제1스레드를 이용하여 음성 인식을 위한 안내음의 출력을 수행하는 것을 포함한다.

다른 측면에 따른 단말기에 마련된 음성 인식 모듈은, 제1 스레드에서 인식된 음성이 제어 명령어이면 제어 명령어의 정보를 제어부에 출력하고, 제1 스레드에서 인식된 음성이 기능 명칭어이면 기능 명칭어의 정보를 제어부에 출력하고, 제어부는, 제어 명령어의 정보가 수신되면 수신된 제어 명령어의 정보에 기초하여 내비게이션 기능의 동작을 제어하고, 기능 명칭어의 정보가 수신되면 수신된 기능 명칭어의 정보에 기초하여 수행 중인 기능을 변경한다.

또 다른 측면에 따른 차량은 위치 정보를 수신하는 통신부; 소리를 검출하고 검출된 소리의 신호를 출력하는 소리 검출부; 소리의 신호에 기초하여 음성 인식을 수행하는 음성 인식 모듈; 복수의 기능 중 내비게이션 기능이 선택되면 위치 정보 및 음성 인식의 정보에 기초하여 길 안내를 제어하는 제어부; 및 내비게이션 기능을 표시하는 표시부를 포함하고, 음성 인식 모듈은, 복수의 기능에 각각 대응하는 기능 명칭어 및 각 기능의 복수의 제어 명령어의 정보를 저장하는 제1데이터베이스와, 주소 정보를 저장하는 제2데이터베이스를 갖는 데이터베이스부와, 음성 인식 모드이면 제1 스레드를 이용하여 제1데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하되, 제2스레드에서 정보의 로딩이 완료되기 전에 제1스레드에서 인식된 음성이 제1데이터베이스의 정보와 비매칭되면 제2스레드에 로딩된 제2데이터베이스의 정보를 이용하여 음성인식을 수행하고 인식된 음성의 정보를 제어부에 출력하는 프로세서를 포함한다.

또 다른 측면에 따른 차량에 마련된 음성 인식 모듈의 프로세서는, 제2스레드에서 정보의 로딩이 완료되기 전에 제1 스레드에서 인식된 음성이 제1데이터베이스에 저장된 정보와 매칭되면 제2스레드의 로딩을 정지시키는 것을 포함한다.

또 다른 측면에 따른 차량에 마련된 음성 인식 모듈의 프로세서의 제2스레드는, 위치 정보에 대응하는 주소의 정보를 로딩한다.

또 다른 측면에 따른 차량의 제어부는, 제2스레드에서 인식된 음성 인식의 정보에 대응하는 목적지를 확인하고, 위치정보에 기초하여 확인된 목적지까지의 경로를 탐색하는 것을 포함한다.

또 다른 측면에 따른 차량에 마련된 음성 인식 모듈은, 음소별로 특징 벡터의 벡터열을 저장하는 음향 모델부와, 소리의 신호를 저장하는 메모리부를 더 포함하고, 프로세서는, 상시 소리의 신호의 주파수 특성을 프레임 별로 계산하여 소리의 신호에 포함된 특징 벡터를 추출하는 것을 포함한다.

또 다른 측면에 따른 차량에 마련된 음성 인식 모듈의 제1스레드는, 음향 모델부 및 제1데이터베이스의 정보에 기초하여 음성 인식을 수행하고, 제2스레드는, 메모리부, 음향 모델부 및 제2데이터베이스의 정보에 기초하여 음성 인식을 수행한다.

또 다른 측면에 따른 차량에 마련된 음성 인식 모듈은, 제1 스레드에서 인식된 음성이 제어 명령어이면 제어 명령어의 정보를 제어부에 출력하고, 제1 스레드에서 인식된 음성이 기능 명칭어이면 기능 명칭어의 정보를 제어부에 출력하고, 제어부는, 제어 명령어의 정보가 수신되면 수신된 제어 명령어의 정보에 기초하여 내비게이션 기능의 동작을 제어하고, 기능 명칭어의 정보가 수신되면 수신된 기능 명칭어의 정보에 기초하여 수행 중인 기능을 변경한다.

본 발명은 멀티 스레드(Multi Thread)를 이용하여 주소 데이터 베이스(DB)를 로딩 함으로써 주소 DB를 로딩하는 시간을 줄일 수 있고 음성 인식을 통한 주소의 인식 시간을 단축시킬 수 있다.

이에 따라 본 발명은 음성 인식 시, 사용자가 발화를 대기하는 시간을 최소화할 수 있어 사용자의 만족도를 향상시킬 수 있다.

이와 같이 본 발명은 사용자에게 보다 정확하고 신속한 주소 검색 결과를 제공할 수 있다.

또한 본 발명은 내비게이션 기능 수행 중 다른 기능을 수행하기 위한 명령어가 입력되면 입력된 명령어의 인식 결과에 기초하여 내비게이션 기능의 수행이 정지되도록 한 후 다른 기능이 수행되도록 할 수 있어 기능 변경의 처리 속도를 향상시킬 수 있다.

이로 인해 음성인식 기능을 갖는 음성 인식 모듈, 단말기 및 차량의 품질을 향상시킬 수 있고 나아가 사용자의 만족도를 높일 수 있으며 사용자의 편리성 및 차량의 안전성을 향상시킬 수 있다.

도 1은 실시 예에 따른 음성 인식 모듈이 마련된 차량의 예시도이다.
도 2는 실시 예에 따른 음성 인식 모듈이 마련된 차량의 내부 예시도이다.
도 3은 실시 예에 따른 음성 인식 모듈이 마련된 차량의 제어 구성도이다.
도4는 실시 예에 따른 음성 인식 모듈의 제어 구성도이다.
도 5는 실시 예에 따른 음성 인식 모듈의 프로세서의 상세 구성도이다.
도 6은 실시 예에 따른 음성 인식 모듈의 프로세서의 음성 인식 순서도로, 일 예의 순서도이다.
도 7 내지 도 9는 실시 예에 따른 음성 인식 모듈의 음성 인식에 대응하는 표시부의 표시 예시도이다.
도 10은 실시 예에 따른 음성 인식 모듈의 프로세서의 음성 인식 순서도로, 다른 예의 순서도이다.
도 11은 실시 예에 따른 음성 인식 모듈이 마련된 단말기 제어 구성도이다.

이하, 첨부된 도면을 참조하여 본 발명에 대해 상세히 설명한다.

도 1은 일 실시 예에 따른 음성 인식 모듈이 마련된 차량의 예시도이고, 도2는 도1에 도시된 차량의 내부 예시도이다.

차량(1)은 사람 또는 화물을 운송할 목적으로 차륜을 구동시켜 주행하는 기기로, 도로 위를 이동한다.

차량(1)은 내장과 외장을 갖는 차체(Body)와, 차체를 제외한 나머지 부분으로 주행에 필요한 기계 장치가 설치되는 차대(Chassis)를 포함한다.

도 1 에 도시된 바와 같이 차체의 외장(110)은 프론트 패널(111), 본네트(112), 루프 패널(113), 리어 패널(114), 트렁크(115), 전후좌우의 도어(116) 등을 포함한다.

그리고 차체의 외장은 프론트 패널, 본네트, 루프 패널, 리어 패널, 트렁크, 전후좌우 도어(116), 전후좌우 도어(116)에 마련된 윈도우 글래스(117), 전후좌우 윈도우 글래스(117) 사이의 경계에 마련된 필러(118)를 더 포함한다.

또한 전후좌우의 도어에 설치된 윈도우 글래스는, 사이드 윈도우 글래스와, 필러와 필러 사이에 설치되되 개폐 불가능하게 설치된 쿼터 윈도우 글래스와, 후방 측에 설치된 리어 윈도우 글래스와, 전방 측에 설치된 프런트 윈도우 글래스를 더 포함한다.

차체의 외장은 운전자에게 차량(1) 후방의 시야를 제공하는 사이드 미러(119) 등을 더 포함한다.

도 2에 도시된 바와 같이, 차체의 내장(120)은 탑승자가 앉는 시트(121: 121a, 121b)와, 대시 보드(122)와, 대시 보드 상에 배치되고 타코미터, 속도계, 냉각수 온도계, 연료계, 방향전환 지시등, 상향등 표시등, 경고등, 안전벨트 경고등, 주행 거리계, 주행 기록계, 자동변속 선택레버 표시등, 도어 열림 경고등, 엔진 오일 경고등, 연료부족 경고등이 배치된 계기판(즉 클러스터, 123)과, 차량 방향을 조작하는 스티어링 휠(124)과, 대시 보드(122)에서 시트(121)의 사이 영역까지 연장된 센터 페시아(125)를 포함한다.

시트(121)는 운전자가 앉는 운전석(121a), 동승자가 앉는 조수석(121b), 차량 내 후방에 위치하는 뒷좌석을 포함한다.

클러스터(123)는 디지털 방식으로 구현할 수 있다. 이러한 디지털 방식의 클러스터는 차량 정보 및 주행 정보를 영상으로 표시한다.

센터 페시아(125)는 대시 보드(122) 중에서 운전석(121a)과 조수석(121b) 사이에 위치하는 헤드 유닛(126)을 포함한다.

즉 헤드 유닛(126)은 오디오 기능, 라디오 기능, 공기 조화 기능 및 시트의 열선 기능, 내비게이션 기능, 디엠비 기능, 전화 기능을 수행하는 각종 부하와 연결되어 있고, 각 기능을 수행하기 위한 동작 명령을 입력받고 입력된 동작 명령에 기초하여 각 기능의 동작을 제어하거나 해당 부하로 동작 명령을 전송한다.

센터 페시아(125)에는 송풍구, 시거잭 등이 설치될 수 있고 멀티단자(127) 등이 설치될 수 있다.

여기서 멀티단자(127)는 헤드 유닛(126)과 인접한 위치에 배치될 수 있고, USB 포트, AUX단자를 포함하고, SD슬롯을 더 포함할 수 있다.

차량(1)은 각종 기능의 동작 명령을 입력받기 위한 입력부(128)를 더 포함할 수 있고 수행 중인 기능에 대한 정보 및 사용자에 의해 입력된 정보를 표시하는 표시부(129)를 더 포함할 수 있다.

입력부(128)는 헤드 유닛(126) 및 센터페시아(125)에 마련될 수 있고, 각종 기능의 동작 온 오프 버튼, 각종 기능의 설정값을 변경하기 위한 버튼 등과 같은 적어도 하나의 물리적인 버튼을 포함한다.

좀 더 구체적으로 입력부(128)는 차량에서 수행 가능한 복수의 기능 중 적어도 하나의 기능의 동작 명령을 입력받는 것도 가능하고, 각 기능의 동작 명령을 음성 인식을 통해 입력받기 위한 음성 인식 모드를 입력받는 것도 가능하며, 입력된 신호를 헤드 유닛(126)의 제어부에 전송한다.

또한, 입력부(128)는 내비게이션 기능 선택 시 목적지의 정보를 입력받고 입력된 목적지의 정보를 단말기(130)에 전송하며, 디엠비 기능 또는 라디오 기능 선택 시 채널 및 음량 정보를 입력받고 입력된 채널 및 음량 정보를 단말기(130)에 전송한다.

입력부(128)는 단말기(130)의 표시부에 표시된 커서의 이동 명령 및 선택 명령 등을 입력하기 위한 조그 다이얼(미도시) 또는 터치 패드를 더 포함하는 것도 가능하다.

여기서 조그 다이얼 또는 터치 패드는 센터페시아 등에 마련될 수 있다.

센터 페시아(125)에는 사용자로부터 정보를 입력받고 입력된 정보에 대응하는 결과를 출력하는 단말기(130)가 마련될 수 있다.

이러한 단말기(130)는 입력부와 표시부를 포함하고, 내비게이션 기능, 디엠비 기능, 오디오 기능, 비디오 기능, 전화 기능, 라디오 기능 중 적어도 하나의 기능이 선택되면 선택된 적어도 하나의 기능을 수행하고 수행 중인 기능의 동작 정보 등을 표시할 수 있다.

단말기(130)의 입력부는 단말기(130)의 표시부에 일체로 마련된 터치 패널을 포함할 수 있다.

이러한 단말기의 입력부는 단말기의 표시부에 버튼 형상으로 활성화되어 표시될 수 있고 이때 표시된 버튼의 위치 정보를 입력받는다.

단말기의 입력부와 표시부는 터치스크린으로 마련될 수 있다.

이러한 단말기는 대시 보드 상에 거치식으로 설치될 수도 있다.

차량(1)은 룸미러 주변, 또는 실내등 주변에 마련되고, 내부의 소리를 검출하는 소리 검출부(140)와, 소리 검출부에서 검출된 소리 내의 음성을 인식하는 음성 인식 모듈(150)를 더 포함한다.

소리 검출부(140)는 사용자가 발화한 검출하고 검출된 음성 신호를 전기 신호로 출력하는 하나 또는 복수 개의 마이크로 폰 또는 마이크로 폰 어레이일 수 있다.

아울러 소리 검출부(140)는 음성 인식 모듈(150)에 마련될 수도 있다.

음성 인식 모듈(150)는 헤드 유닛(126)과 통신을 수행하여 인식된 음성의 정보를 헤드 유닛(126)에 전송한다.

이러한 음성 인식 모듈(150)는 헤드 유닛(126)으로부터 음성 인식 모드의 동작 명령을 수신할 수 있다.

아울러 음성 인식 모듈(150)는 헤드 유닛(126)에 일체로 마련될 수 있다.

헤드 유닛(126)은 음성 인식 모듈로부터 전송된 음성 정보에 기초하여 각종 기능을 제어할 수 있다.

차량의 차대는 동력 발생 장치, 동력 전달 장치, 주행 장치, 조향 장치, 제동 장치, 현가 장치, 변속 장치, 연료 장치, 전후좌우 차륜 등을 더 포함한다.

차량(1)은 운전자 및 탑승자의 안전을 위한 여러 가지 안전장치들을 더 포함한다.

차량의 안정장치로는 차량 충돌 시 운전자 등 탑승자의 안전을 목적으로 하는 에어백 제어 장치와, 차량의 가속 또는 코너링 시 차량의 자세를 차량자세 안정 제어 장치(ESC: Electronic Stability Control) 등 여러 종류의 안전장치들이 있다.

이외에도 차량(1)은 후방 또는 측방의 장애물 내지 다른 차량을 감지하는 근접센서, 강수 여부 및 강수량을 감지하는 레인 센서 등의 감지 장치를 더 포함하는 것도 가능하다.

이러한 차량(1)은 동력 발생 장치, 동력 전달 장치, 주행 장치, 조향 장치, 제동 장치, 현가 장치, 변속 장치, 연료 장치, 여러 가지 안전 장치 및 각종 센서들의 구동을 제어하는 전자 제어 유닛(ECU: Electronic Control Unit)을 포함한다.

또한 차량(1)은 운전자의 편의를 위해 설치된 핸즈프리 장치, GPS, 오디오 장치 및 블루투스 장치, 후방 카메라, 단말기의 충전 장치, 하이패스 장치 등의 전자 장치를 선택적으로 포함할 수 있다.

이러한 차량(1)은 시동모터(미도시)에 동작 명령을 입력하기 위한 시동 버튼을 더 포함할 수 있다.

즉 차량(1)은 시동 버튼이 온 되면 시동모터(미도시)를 동작시키고 시동 모터의 동작을 통해 동력 발생장치인 엔진(미도시)을 구동시킨다.

차량(1)은 단말 장치, 오디오 기기, 실내 등, 시동 모터, 그 외 전자장치들에 전기적으로 연결되어 구동 전력을 공급하는 배터리(미도시)를 더 포함한다.

이러한 배터리는 주행 중 자체 발전기 또는 엔진의 동력을 이용하여 충전을 수행한다.

도 3은 실시 예에 따른 음성 인식 모듈이 마련된 차량의 제어 구성도로, 차량은 단말기(130), 소리 검출부(140), 음성 인식 모듈(150), 제어부(160), 저장부(170), 통신부(180) 및 부하부(190)를 포함한다.

단말기(130)는 사용자와의 인터페이스를 위한 기기로, 사용자로부터 적어도 하나의 기능의 동작 명령을 입력받고, 입력된 동작 명령에 기초하여 적어도 하나의 기능을 수행하며, 수행 중인 기능의 동작 정보를 표시한다.

단말기(130)는 입력부(131)와 표시부(132)를 포함할 수 있다.

여기서 입력부(131)는 터치 패널로 구현 가능하고, 표시부(132)는 LCD 등의 평판 표시 패널로 구현 가능하다. 즉 단말기(130)는 터치 패널과 평판 표시 패널이 일체로 형성된 터치 스크린으로 구현 가능하다.

이러한 단말기(130)는 터치 패널에 터치된 위치의 신호를 제어부(160)에 전송한다.

단말기(130)의 입력부(131)는 복수의 기능의 동작 명령을 각각 입력받을 수 있고, 음성 인식 모드의 동작/정지 명령을 입력받을 수 있다.

여기서 음성 인식 모드는 복수의 기능 중 적어도 하나의 기능 수행 시 음성으로 동작 명령을 입력받는 모드이다.

입력부(131)는 내비게이션 기능 수행 시 수동으로 목적지 정보 및 경로 안내 명령을 입력받고, 입력된 목적지 정보를 제어부(160)에 전송한다.

여기서 사용자에 의해 수동으로 입력된 목적지 정보는, 문자로, 주소, 전화 번호 및 시설명 정보 중 적어도 하나를 포함하고, 목적지에 대응하는 단축어(예를 들어, 집, 회사 등)를 더 포함할 수 있다.

아울러 내비게이션 기능의 주소 입력은 음성 인식 모드와 수동 입력 모드를 통해 입력받을 수 있다.

단말기(130)의 표시부(132)는 수행 중인 기능의 동작 정보를 표시한다.

예를 들어, 단말기(130)의 표시부(132)는 내비게이션 기능의 수행 시 길 안내를 위한 지도, 도로 환경 정보 및 입력 가능한 입력 정보를 표시할 수 있다.

즉 표시부(132)는 차량의 현재 위치가 매칭된 지도, 동작 상태 및 그 외 부가정보들을 표시한다.

표시부(132)는 전화 통화와 관련된 정보를 표시하거나, 음악 재생과 관련된 정보를 표시하거나, 라디오 방송과 관련된 정보를 표시하는 것도 가능하고, 외부의 방송 신호를 영상으로 표시하는 것도 가능하다.

또한 단말기의 표시부(132)는 음성 인식 모드의 동작/정지 정보를 표시한다.

표시부(132)는 음성 인식에 의해 주소가 입력된 경우, 음성 인식된 주소 정보를 표시하는 것도 가능하다.

또한 표시부(132)는 라디오 기능이나, 전화 기능, 오디오 기능 시 음성 인식된 채널, 전화번호, 음악의 곡명의 정보 등을 표시하는 것도 가능하다.

표시부(132)는 음성 인식된 제어 명령어 및 기능 명칭어를 표시하는 것도 가능하다.

소리 검출부(140)는 소리를 검출하고 검출된 소리의 신호를 음성 인식 모듈(150)에 전달한다. 여기서 소리는 사용자가 발화한 사용자의 음성을 포함한다.

음성 인식 모듈(150)은 수신된 소리의 신호를 분석하여 음성을 인식한다.

여기서 음성을 인식하는 것은, 사용자에 의해 발화된 발화어를 인식하는 것을 포함한다.

이러한 음성 인식 모듈(150)는 외부의 소리 검출부로부터 소리의 신호를 수신하는 것도 가능하고, 내부에 소리 검출부를 구비하는 것도 가능하다.

이러한 음성 인식 모듈을 도 4 및 도 5를 참조하여 설명한다.

도 4에 도시된 바와 같이 음성 인식 모듈(150)은 신호처리부(151), 프로세서(152), 메모리부(153), 데이터베이스부(154) 및 음향 모델부(155)를 포함하고, 프로세서(152)는 수신부(152a), 로딩부(152b), 인식부(152c) 및 출력부(152d)를 포함한다.

신호처리부(151)는 소리 검출부에서 검출된 소리의 신호가 수신되면 수신된 소리의 신호를 신호 처리한다.

즉 신호처리부(151)는 아날로그의 소리의 신호를 디지털 신호로 변환하고, 변환된 디지털 신호 중의 노이즈를 제거하며 노이즈가 제거된 소리의 신호를 프로세서(152)에 전송한다.

아울러 신호처리부(151)는 아날로그 신호에서 노이즈를 제거한 후 디지털 신호로 변환하는 것도 가능하다.

프로세서(152)는 음성 인식 모드의 동작 명령이 수신되면 신호 처리된 소리의 신호와 데이터베이스부에 저장된 정보에 기초하여 음성을 인식하고, 인식된 음성의 정보를 제어부(160)에 전송한다.

이러한 프로세서(152)의 수신부(152a)는 음성 인식 모드의 동작 온/오프 명령을 수신하고, 소리 검출부에서 검출된 소리의 신호를 수신한다.

프로세서의 로딩부(152b)는 데이터베이스부(154)에 저장된 정보를 로딩하여 인식부(152c)에 전달한다.

프로세서의 인식부(152c)는 복수 개의 스레드를 생성하고, 복수의 스레드를 이용하여 음성을 각각 인식하되, 신호 처리된 소리의 신호와 데이터베이스부에 저장된 정보, 음향 모델부의 음향 모델에 기초하여 음성을 각각 인식하고, 인식된 음성의 정보를 제어부(160)에 전송한다.

프로세서의 출력부(152d)는 인식부에서 인식된 발화어의 정보를 제어부(160)에 출력한다.

메모리부(153)는 발화어의 정보를 저장한다.

메모리부(153)는 신호 처리된 소리의 신호를 저장하는 것도 가능하다.

메모리부(153)는 발화어를 발음 기호(즉, 발음 문자열)로 변환하는 프로그램을 더 저장할 수 있다.

데이터베이스부(154)는 제1정보를 저장하는 제1데이터베이스(154a), 제1정보보다 용량이 큰 제2정보를 저장하는 제2데이터베이스(154 b)를 저장한다.

여기서 제1정보는 미리 설정된 단어수보다 작은 단어수를 갖는 정보로, 확인, 취소, 삭제, 수정/편집, 종료, 이전 화면 이동, 이후 화면 이동 등의 제어 명령어의 정보, 기능 명칭어의 정보를 포함하고, 제2정보는 미리 설정된 단어수 이상의 단어수를 갖는 정보로, 복수의 기능을 수행하기 위해 필요한 자료 정보(예 주소 정보)를 포함한다.

제어 명령어의 정보와 기능 명칭어의 정보는, 어느 하나의 동작을 바로 수행할 수 있도록 하는 명령을 가진 단어의 정보이다.

아울러 제1정보는 목적지의 단축어, 지방 자치단체(특별시, 광역시, 도 등)의 지역 명칭어의 정보를 더 포함할 수 있고, 제2정보는 시도구동별 주소의 하위 정보, 전화 번호 정보, 음악 정보, 영상 정보 등을 더 포함할 수 있다.

여기서 목적지의 단축어는 사용자에 의해 설정된 것이다. 예를 들면, 목적지의 단축어는 사용자가 자주 가는 목적지의 이름으로, 집, 회사일 수 있다.

음향 모델부(155)는 음소별로 특징 벡터의 벡터열을 갖는 음향 모델을 저장한다.

데이터베이스부(154)의 정보를 로딩하여 음성을 인식하는 프로세서(152)를 도 5를 참조하여 좀 더 구체적으로 설명한다.

도 5에 도시된 바와 같이, 음성 인식 모듈의 데이터베이스부(154)는 제1데이터베이스(154a)와 제2데이터베이스(154b)를 포함하고, 프로세서(152)의 로딩부(152b)는 제1로딩부(b1)와, 제2로딩부(b2)를 포함하며, 프로세서의 인식부는 제1스레드(c1)와 제2스레드(c2)를 포함한다.

제1데이터베이스(154a)는 확인, 취소, 삭제, 수정/편집, 종료, 이전 화면 이동, 이후 화면 이동 등의 제어 명령어의 정보와, 내비게이션 기능, 라디오 기능, 비디오 기능, 전화 기능, 오디오 기능의 기능 명칭어의 정보를 저장한다.

아울러 제1데이터베이스는 주소 정보 중 가장 상위 정보인 각 도의 도명 및 수도, 광역시 등 단어의 정보를 저장하는 것도 가능하다. 예를 들어, 서울시, 인천, 울산, 강원도, 경기도 등을 포함할 수 있다.

제2데이터베이스(154 b)는 도별 시설물의 주소 정보를 저장한다.

아울러 제2데이터베이스(154 b)는 시별 시설물명의 주소 정보를 저장하는 것도 가능하고, 구별 시설물명의 주소 정보, 동별 시설물명의 주소 정보를 저장하는 것도 가능하며, 번지나 도로명의 주소 정보를 저장하는 것도 가능하다.

제1로딩부(b1)는 제1데이터베이스(154a)의 정보를 로딩하여 제1스레드(c1)로 전달하고, 제2로딩부(b2)는 제2데이터베이스(154b)의 정보를 로딩하여 제2스레드(c2)로 전달한다.

이러한 로딩부의 기능은 스레드 내에 포함될 수 있다.

인식부(152c)는 미리 생성된 제1스레드(c1)를 포함하고, 음성 인식 모드의 동작 명령이 입력되면 제2스레드(c2)를 추가로 생성한다.

아울러 인식부는 미리 생성된 제1스레드(c1)와 제2스레드(c2)를 모두 포함할 수 있다.

인식부의 제1스레드(c1)는 소리의 신호에서 포즈(pause) 구간을 인식하고, 포즈(pause) 구간이 인식되면 사용자의 발화가 끝났다고 판단하고, 발화 시작 시점부터 발화 종료 시점 사이에 검출된 소리의 신호의 주파수 특성을 프레임 별로 계산하여 소리의 신호에 포함된 특징 벡터를 추출한다.

인식부의 제1스레드(c1)는 추출된 특징 벡터의 벡터열을 음향모델부의 음향 모델과 비교하여 소리의 신호 내 음소를 확인하며 확인된 음소를 문맥으로 변환시켜 발화어를 인식하고 인식된 발화어의 정보의 저장을 제어한다.

아울러 인식부의 제1스레드(c1)는 수신된 소리의 신호의 저장을 제어하는 것도 가능하다.

인식부의 제1스레드(c1)는 제1데이터베이스(154a)의 정보가 로딩되면 로딩된 제1데이터베이스(154a)의 정보 중 음성 인식된 발화어의 정보와 매칭되는 정보가 존재하는지 판단한다.

여기서 제1데이터베이스의 정보 중 음성 인식된 발화어의 정보와 매칭되는 정보가 존재하는지 판단하는 것은, 음성 인식된 발화어의 정보와 제1데이터베이스(154a)에 저장된 복수 정보를 각각 비교하여 매칭 정도에 따른 신뢰 스코어를 각각 확인하고, 확인된 신뢰 스코어(Confidence score) 중 기준 스코어 이상의 신뢰 스코어를 갖는 정보가 존재하면 제1데이터베이스(154a)의 정보 중 음성 인식된 발화어의 정보와 매칭되는 정보가 존재한다고 판단하는 것을 포함한다.

인식부의 제1스레드(c1)는 기준 스코어 이상의 신뢰 스코어를 갖는 정보를 확인하고 확인된 정보를 출력부에 전송한다.

이때 인식부의 제1스레드(c1)는 제2스레드(c2)의 제2데이터베이스의 로딩이 정지되도록 한다.

인식부의 제1스레드(c1)는 제1데이터베이스의 정보 중 음성 인식된 발화어의 정보와 매칭되는 정보가 없다고 판단되면 제2스레드(c2)에서의 음성 인식을 제어한다.

인식부의 제1스레드(c1)는 음성 인식 모드의 동작 명령이 수신되면 음성 인식을 위한 안내음의 출력을 수행한다.

인식부(152c)의 제2스레드(c2)는 제1스레드(c1)에서 음성 인식을 수행하는 동안 제2데이터베이스(154b)의 정보를 로딩하고, 제1스레드(c1)에서 음성 인식 명령이 수신되면 메모리부(153)에 저장된 발화어의 정보를 수신하고, 로딩된 제2데이터베이스의 정보와 음성 인식된 발화어의 정보에 기초하여 음성 인식을 수행하고, 음성 인식된 발화어의 정보에 대응하는 주소 정보를 출력부에 전송한다.

아울러 인식부(152c)의 제2스레드(c2)는 제1스레드(c1)에서 음성 인식을 수행하는 동안 제2데이터베이스(154b)의 정보를 로딩하고, 제2데이터베이스(154b)의 정보가 모두 로딩되면 발화어의 정보에 대응하는 주소 정보를 인식하는 것도 가능하다.

아울러 인식부(152c)의 제1스레드(c1)와 제2스레드(c2)는 소리 신호의 주파수 특성을 프레임 별로 계산하여 소리의 신호에 포함된 특징 벡터를 추출하고 추출된 특징 벡터의 벡터열을 음향모델부의 음향 모델과 비교하여 소리 신호 내 음소를 확인하며 확인된 음소를 문맥으로 변환시켜 발화어를 각각 인식하는 것도 가능하다.

출력부(152d)는 음성 인식된 발화어의 정보를 다용도 입출력포트(gpio)를 통해 복수의 부하에 직접 전송하여 복수의 부하를 직접적으로 제어하는 것도 가능하고, 음성 인식된 발화어의 정보를 제어부(160)에 전송하는 것도 가능하다.

제어부(160)는 입력 모드 시 입력부(131)에 입력된 정보에 기초하여 부하부(190)의 복수 부하의 동작을 제어한다.

제어부(160)는 음성 인식 모드 시 소리 검출부(140)를 활성화시키고, 음성 인식 모듈(150)과 통신을 수행하여 음성 인식된 발화어의 정보를 수신하고 수신된 발화어의 정보에 기초하여 부하부의 동작을 제어한다.

여기서 음성 인식된 발화어는, 제어 명령어, 기능 명칭어를 포함하고, 주소, 전화번호, 곡명, 목적지의 단축어 등의 검색어를 포함할 수 있다.

제어 명령어는 확인, 삭제, 취소, 종료, 수정, 이전 화면 이동, 이후 화면 이동 명령어, 검색 명령어를 포함할 수 있고, 기능 명칭어는 수행 가능한 기능의 명칭을 포함할 수 있다.

제어부(160)는 제어 명령어 및 기능 명칭어의 정보가 수신되면 수신된 제어 명령어 및 기능 명칭어의 정보에 기초하여 부하부(190)의 복수 부하의 동작을 각각 제어한다.

예를 들어, 제어부(160)는 내비게이션 기능 수행 중 종료의 제어 명령어가 인식되면 내비게이션 기능의 종료를 제어하고, 내비게이션 기능 수행 중 라디오 기능의 기능 명칭어가 인식되면 라디오 기능이 수행되도록 라디오 장치를 제어한다.

제어부(160)는 내비게이션 기능이 선택되면 인식된 음성에 대응하는 주소 정보가 표시되도록 제어하고, 확인(OK)의 명령어가 수신되면 주소 정보에 기초하여 현재의 위치부터 목적지까지의 경로를 탐색하고 탐색된 경로를 지도에 맵 매칭한 후 맵 매칭된 지도가 표시되도록 제어하고 탐색된 경로에 기초하여 길 안내를 제어한다.

제어부(160)는 내비게이션 기능 수행 중 목적지가 입력되지 않은 경우 일반 안내 모드로 현재 위치를 중심으로 현재 위치한 도로 및 도로의 주변 환경의 안내를 제어하고 또한 주행 정보 등의 안내를 제어한다.

제어부(160)는 헤드 유닛(126)의 제어부일 수 있다.

아울러 제어부(160)는 차량에 마련된 전자 제어 유닛(ECU)일 수 있다.

제어부(160)의 내부에는 음성 인식 모듈(150)이 마련될 수 있다.

저장부(170)는 제어 명령어에 대응하는 동작 명령을 저장하고, 기능 명칭어에 대응하는 기능 정보를 저장한다.

통신부(180)는 외부 기기와의 통신을 수행하는 유무선 통신을 포함한다.

통신부(180)는 현재의 위치를 수신하는 GPS 수신부를 포함할 수 있다.

또한 GPS 수신부는 다수의 GPS(Global Positioning System) 위성들로부터 위성 신호를 수신하여 자신의 위치를 계산하고 계산된 자신(즉, 차량)의 현재 위치를 제어부(160)에 전송한다.

통신부(180)는 서버(미도시)와 통신을 수행하는 것도 가능하다.

여기서 유무선 통신망은 DMB 등의 TPEG, SXM, RDS와 같은 브로드캐스팅 망 등을 포함한다.

부하부(190)는 복수의 기능을 각각 수행하는 복수의 부하를 포함하고 각 부하는 제어부(160)의 명령을 수신하고 수신된 명령에 기초하여 기능을 온오프시키거나, 수행 중인 기능의 동작을 제어한다.

여기서 복수의 부하는 라디오 기능을 수행하는 라디오 장치, 음악 등의 오디오 재생 기능을 수행하는 오디오 장치, 공기 조화 기능을 수행하는 공기 조화 장치, 길 안내 기능을 수행하는 내비게이션 장치, 전화 통화 기능을 수행하는 전화 통신 장치, 디엠비 방송 재생 기능을 수행하는 방송 장치, 사운드를 출력하는 사운드 출력 장치를 포함할 수 있다.

도 6은 실시 예에 따른 음성 인식 모듈의 프로세서의 음성 인식 순서도로, 일 예의 순서도이다.

도 6의 (a)는 종래 기술에 따른 음성 인식 순서도이고, 도 6의 (b)는 종래 기술에 따른 음성 인식 순서도이다. 이를 도 7 내지 도 9를 참조하여 설명한다.

아울러 차량에 마련된 음성 인식 모듈의 음성 인식 순서에 대해 설명한다.

차량은 내비게이션 기능이 선택되고 음성 인식 모드의 동작 명령이 입력되면 음성 인식 모듈(150) 및 소리 검출부(140)의 동작을 활성화시키고, 통신부(180)의GPS수신부와의 통신을 수행하고, GPS로부터 현재 위치를 수신한다.

현재 위치가 서울이라고 가정한다.

도 6의 (a)에 도시된 바와 같이, 종래의 음성 인식 모듈은 음성 인식 모드의 동작 명령이 입력되면 제1정보를 로딩하고, 안내음(예, 명령어를 말씀하세요)을 출력하고, 사용자에 의해 발화된 주소 검색의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성 인식을 수행한다.

그리고 음성 인식 모듈은 음성 인식 결과 및 현재의 위치 정보에 기초하여 제2정보인 서울시 주소 정보를 로딩하고 서울시 주소 정보의 로딩이 완료되면 다시 안내음(시설명을 말씀하세요)을 출력하고, 사용자에 의해 발화된 시설명(마트)의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성인식을 수행하며, 음성 인식된 주소 정보를 출력한다.

이와 같이 음성 인식 모듈은 시간 n11에서 시간 n18까지 8개의 동작으로 음성 인식을 수행한다.

하지만 도 6의 (b)에 도시된 바와 같이, 본 실시 예의 음성 인식 모듈(150)은 음성 인식 모드의 동작 명령이 입력되면 제1스레드(c1)와 제2스레드(c2)를 생성하고, 생성된 제1스레드를 이용하여 제1데이터베이스의 제1정보를 로딩하고, 안내음(예, 명령어를 말씀하세요)을 출력한다.

이때 제1데이터베이스에 저장된 정보는 용량이 작기 때문에 빠른 시간 내에 로딩될 수 있다.

음성 인식 모듈은 제1스레드에 사용자에 의해 발화된 주소 검색의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성 인식을 수행하면서 다시 안내음(시설명을 말씀하세요)을 출력하고 제2스레드에 제2데이터베이스의 정보 로딩을 지시한다.

음성 인식 모듈의 제2스레드는 주소 검색의 검색 명령어가 인식되면 제2데이터베이스의 제2정보를 로딩하되, 인식된 검색 명령어에 대응하는 정보인 주소 정보를 로딩한다. 즉 제2스레드는 현재의 위치 정보에 기초하여 주소 정보를 로딩한다.이때 제2데이터베이스의 주소 정보는 시도구동별 상호 연결된 하위 정보를 갖고 있기 때문에 제1데이터베이스의 제1정보의 용량보다 크다. 이 때문에 제2데이터베이스의 주소 정보의 로딩 시간은 제1데이터베이스의 정보 로딩 시간 보다 더 길다.

아울러 제2스레드는 인식된 검색 명령어가 음악 재생이면 제2데이터베이스에 저장된 음악 정보를 로딩한다.

음성 인식 모듈은 사용자에 의해 발화된 시설명(마트)의 음성이 제1스레드에 수신되면 제1스레드를 이용하여 수신된 음성의 음성 인식을 수행하고 이때 음성 인식된 발화어의 정보가 제1데이터베이스의 제1정보와 매칭되는지 판단한다.

즉 음성 인식 모듈의 제1스레드는 음성 인식된 발화어가 제1데이터베이스에 저장된 명령어 또는 기능 명칭어인지 확인하고 음성 인식된 발화어가 제1데이터베이스에 저장된 명령어 또는 기능 명칭어라고 판단되면 판단 결과에 기초하여 기능의 동작을 제어한다.

여기서 명령어, 기능 명칭어는 미리 설정된 개수보다 적은 개수를 갖는 단어를 갖는다.

이와 같이 음성 인식 모듈은 제2스레드에 제2정보를 로딩하는 동안 제1스레드에서 음성 인식을 수행할 수 있고, 이를 통해 주소를 입력받기 전에 다른 명령어나 기능 명칭어를 입력 받을 수 있다. 이를 통해 정보의 로딩과 무관하게 기능을 이전의 기능으로 되돌릴 수 있다.

아울러 음성 인식 모듈의 제1스레드는 음성 인식된 발화어가 제1데이터베이스에 저장된 명령어 또는 기능 명칭어가 아니라고 판단되면 제2스레드에 음성 인식을 지시한다.

음성 인식 모듈의 제2스레드는 음성 인식의 명령이 수신되면 제2데이터베이스의 제2정보의 로딩이 완료되었는지 판단하고 제2데이터베이스의 제2정보의 로딩이 완료되었다고 판단되면 로딩된 제2데이터베이스의 정보와 음성 인식된 발화어의 정보에 기초하여 사용자에 의해 발화된 주소 정보를 인식한다.

이와 같이 음성 인식 모듈은 제1스레드를 이용하여 사용자에 의해 발화된 시설명의 음성 신호를 수신하고 시설명의 음성을 인식할 때까지 제2스레드를 이용하여 주소 정보를 로딩하기 때문에 주소 정보 로딩에 소요되는 시간을 줄일 수 있다.

또한 음성 인식 모듈은 제2스레드를 이용하여 로딩된 주소 정보 중 음성 인식된 발화어의 정보에 대응하는 주소 정보를 검색하기 때문에 시설명의 주소를 인식하는 시간을 줄일 수 있다.

이와 같이 음성 인식 모듈은 제1스레드에서 시간 n11에서 시간 n17의 이전 시간까지 7개의 동작으로 음성 인식을 수행하고, 동시에 제2스레드에서 2개의 동작으로 음성 인식을 수행하기 때문에 총 음성 인식 시간을 줄일 수 있다.

만약, 음성 인식 모듈의 제1스레드는 마트가 아닌 취소의 음성이 인식되면 제2정보의 로딩을 정지시키고, 또한 주소 검색 동작을 정지시키며, 주소 검색 동작의 이전 동작을 수행하도록 하거나, 시설명을 말씀하세요의 안내음을 다시 출력하는 것도 가능하다.

아울러 음성 인식 모듈은 음성 인식된 발화어가 마트가 아닌 음악 재생이면 제2데이터베이스의 음악 정보를 로딩하고, 또한 음악 정보의 로딩이 완료되면 음악 재생을 수행하는 것도 가능하다.

도 7에 도시된 바와 같이 음성 인식 모드의 표시부(132)는, 주소 검색의 음성이 인식된 후 제어 명령어나 기능의 명칭어가 입력되지 않으면 제2데이터베이스의 정보에 기초하여 주소 검색 결과를 표시한다.

표시부(132)는 주소 검색 시 현재의 음성 인식 모드를 이모티콘(m1)으로 표시하고, 음성 인식된 발화어를 음성 인식 창(m2)에 표시하며, 음성 인식에 대응하는 주소 검색 결과를 주소 검색 창(m3)에 표시하고, 검색된 주소의 단축번호를 단축번호 창(m4)에 표시한다.

그리고 표시부(132)는 사용자에 의해 선택 가능한 버튼으로 종료 버튼(s1), 수동 입력 버튼(s2), 도움말 버튼(s3), 이전 화면으로의 이동 버튼(s4) 등을 표시한다.

도 8에 도시된 바와 같이, 표시부(132)는 주소 검색의 음성이 인식된 후 사용자에 의해 시설명이 아닌 제어 명령어인 고백(go back)이 발화되면 주소 검색 화면의 이전 화면으로 변경하여 표시한다.

도 9에 도시된 바와 같이, 표시부(132)는 주소 검색의 음성이 인식된 후 사용자에 의해 시설명이 아닌 기능의 명칭어인 음악이 발화되면 내비게이션 기능에 대한 영상을 오디오 기능에 대한 영상으로 변경하여 표시한다.

도 10은 실시 예에 따른 음성 인식 모듈의 프로세서의 음성 인식 순서도로, 다른 예의 순서도이다.

도 10의 (a)는 종래 기술에 따른 음성 인식 순서도이고, 도 10의 (b)는 종래 기술에 따른 음성 인식 순서도이다.

현재 위치가 서울이라고 가정한다.

도 10의 (a)에 도시된 바와 같이, 종래의 음성 인식 모듈은 음성 인식 모드의 동작 명령이 입력되면 제1정보를 로딩하고 제1정보의 로딩이 완료되면 안내음(예, 명령어를 말씀하세요)을 출력하고, 사용자에 의해 발화된 주소 검색의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성 인식을 수행한다.

그리고 음성 인식 모듈은 음성 인식 결과가 주소 검색이면 현재 위치 정보에 기초하여 서울시 주소 정보를 로딩하고 서울시 주소 정보의 로딩이 완료되면 다시 안내음(시설명을 말씀하세요)을 출력하고, 사용자에 의해 발화된 시설명(경기도)의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성인식을 수행한다.

음성 인식 모듈은 서울 내의 시설명이 아닌 다른 지역의 명칭이 인식되었다고 판단되면, 인식된 지역 명칭에 대응하는 경기도의 주소 정보를 로딩하고, 경기도의 주소 정보의 로딩이 완료되면 다시 안내음(시설명을 말씀하세요)을 출력하고, 사용자에 의해 발화된 시설명(마트)의 음성이 수신되면 수신된 음성의 신호에 기초하여 음성인식을 수행하며 음성 인식된 주소 정보를 출력한다.

이와 같이 종래의 음성 인식 모듈은 시간 n21에서 시간 n32까지 12개의 동작으로 음성 인식을 수행한다.

하지만 도 10의 (b)에 도시된 바와 같이, 본 실시 예의 음성 인식 모듈(150)은 음성 인식 모드의 동작 명령이 입력되면 제1스레드(c1)와 제2스레드(c2)를 생성하고, 생성된 제1스레드를 이용하여 안내음(예, 명령어를 말씀하세요)을 출력하며 제1데이터베이스의 제1 정보를 로딩한다.

이때 제1데이터베이스에 저장된 정보의 용량이 작기 때문에 제1데이터베이스의 정보는 빠른 시간 내에 로딩될 수 있다.

즉 음성 인식 모듈의 제2스레드는 주소 검색의 검색 명령어가 인식되면 제2데이터베이스의 제2정보를 로딩하되 현재 위치 정보에 기초하여 서울의 주소 정보를 로딩한다.

이때 제2데이터베이스의 주소 정보는 제1데이터베이스의 정보의 용량보다 크다. 이 때문에 제2데이터베이스의 주소 정보의 로딩 시간은 제1데이터베이스의 정보 로딩 시간 보다 더 많이 소요된다.

음성 인식 모듈은 서울의 주소 정보의 로딩이 완료되면 사용자에 의해 발화된 시설명(경기도)의 음성이 제1스레드에 수신되면 제1스레드를 이용하여 수신된 음성의 음성 인식을 수행하고 이때 음성 인식된 발화어의 정보가 제1데이터베이스의 정보와 매칭되는지 판단한다.

아울러 음성 인식 모듈의 제1스레드는 음성 인식된 발화어가 제1데이터베이스에 저장된 명령어 또는 기능 명칭어가 아니라고 판단되면 지방자치단체의 지역명인지 판단하고, 발화어가 지역 명칭어라고 판단되면 판단된 지역의 주소 정보의 로딩을 제2스레드에 지시한다.

즉 음성 인식 모듈의 제2스레드는 경기도의 주소 정보의 로딩 명령이 수신되면 제2데이터베이스의 주소 정보 중 경기도의 주소 정보를 로딩한다.

음성 인식 모듈은 경기도의 주소 정보의 로딩이 완료되면 다시 안내음(시설명을 말씀하세요)을 출력하고 사용자에 의해 발화된 시설명(마트)의 음성이 제1스레드에 수신되면 제1스레드를 이용하여 수신된 음성의 음성 인식을 수행하고 이때 음성 인식된 발화어의 정보가 제1데이터베이스의 정보와 매칭되는지 판단한다.

음성 인식 모듈의 제1스레드는 음성 인식된 발화어가 제1데이터베이스에 저장된 명령어 또는 기능 명칭어가 아니라고 판단되면 제2스레드에 음성 인식을 지시한다.

음성 인식 모듈의 제2스레드는 음성 인식의 명령이 수신되면 제2데이터베이스의 경기도의 주소 정보의 로딩이 완료되었는지 판단하고 제2데이터베이스의 주소 정보의 로딩이 완료되었다고 판단되면 로딩된 제2데이터베이스의 주소 정보와 음성 인식된 발화어의 정보에 기초하여 사용자에 의해 발화된 주소 정보를 인식한다.

예를 들어 음성 인식 모듈의 제1스레드는 마트가 아닌 취소의 음성이 인식되면 제2스레드의 제2정보의 로딩을 정지시키고, 또한 주소 검색 동작을 정지시키며, 주소 검색 동작의 이전 동작을 수행하도록 하거나, '시설명을 말씀하세요'의 안내음을 다시 출력하는 것도 가능하다.

음성 인식 모듈의 제1스레드는 발화어가 제1정보가 아니라고 판단되면 음성 인식을 정지한다. 이때 제2스레드는 제2정보를 이용하여 음성인식을 수행한다.

아울러, 음성 인식 모듈은 음성인식 명령이 입력되면 제1스레드를 이용하여 제1데이터베이스의 제1정보를 로딩하고 동시에 제2스레드를 이용하여 제2데이터베이스의 제2정보를 로딩하는 것도 가능하다.

이와 같이 음성 인식 모듈은 제1스레드에서 시간 n21에서 시간 n29까지 10개의 동작으로 음성 인식을 수행하고, 동시에 제2스레드에서 3개의 동작으로 음성 인식을 수행하기 때문에 총 음성 인식 시간을 줄일 수 있다.

도 11은 실시 예에 따른 음성 인식 모듈이 마련된 단말기 제어 구성도이다.

단말기(130)는 입력부(131), 표시부(132), 제어부(133), 저장부(134), 통신부(135), 사운드 출력부(136), 소리 검출부(140), 음성 인식 모듈(150)를 포함한다.

여기서 소리 검출부와 음성 인식 모듈은 도 3의 실시 예의 소리 검출부 및 음성 인식 모듈과 동일하여 도 3과 동일한 도면 번호로 기재한다.

이러한 단말기는 내비게이션 기능이 있는 이동 통신 단말기, 태블릿, 노트북 중 어느 하나일 수 있고, 차량에 마련된 내비게이션 장치일 수도 있다.

입력부(131)는 복수의 기능의 동작 명령을 각각 입력받을 수 있고, 음성 인식 모드의 동작/정지 명령을 입력받을 수 있다.

음성 인식 모듈(150)은 소리 검출부에서 검출된 소리의 신호가 수신되면 수신된 소리의 신호를 신호 처리하고 신호 처리된 소리의 신호와 데이터베이스부에 저장된 정보에 기초하여 음성을 인식하고, 인식된 음성의 정보를 제어부(133)에 전송한다.

음성 인식 모듈은 음성 인식 모드 시 복수 개의 스레드를 생성하고, 복수의 스레드를 이용하여 음성을 각각 인식하되, 신호 처리된 소리의 신호와 데이터베이스부에 저장된 정보, 음향 모델부의 음향 모델에 기초하여 음성을 각각 인식하고, 인식된 음성의 정보를 제어부(133)에 전송한다.

이러한 음성 인식 모듈은 도 4 및 도 5의 음성 인식 모듈과 동일하여 설명을 생략한다.

제어부(133)는 입력 모드 시 입력부(131)에 입력된 정보에 기초하여 표시부와 사운드 출력부의 동작을 제어한다.

제어부(133)는 음성 인식 모드 시 소리 검출부(140)를 활성화시키고, 음성 인식 모듈(150)과 통신을 수행하여 음성 인식된 발화어의 정보를 수신하고 수신된 발화어의 정보에 기초하여 부하부의 동작을 제어한다.

제어부(160)는 제어 명령어 및 기능 명칭어의 정보가 수신되면 수신된 제어 명령어 및 기능 명칭어의 정보에 기초하여 복수 기능의 동작을 각각 제어한다.

예를 들어, 제어부(133)는 내비게이션 기능 수행 중 종료의 제어 명령어가 인식되면 내비게이션 기능의 종료를 제어하고, 내비게이션 기능 수행 중 라디오 기능의 기능 명칭어가 인식되면 라디오 기능이 수행되도록 제어한다.

제어부(133)는 내비게이션 기능이 선택되면 인식된 음성에 대응하는 주소 정보가 표시되도록 제어하고, 확인(OK)의 명령어가 수신되면 주소 정보에 기초하여 현재의 위치부터 목적지까지의 경로를 탐색하고 탐색된 경로를 지도에 맵 매칭한 후 맵 매칭된 지도가 표시되도록 제어하고 탐색된 경로에 기초하여 길 안내를 제어한다.

제어부(133)는 내비게이션 기능 수행 중 목적지가 입력되지 않은 경우 일반 안내 모드로 현재 위치를 중심으로 현재 위치한 도로 및 도로의 주변 환경의 안내를 제어하고 또한 주행 정보 등의 안내를 제어한다.

제어부(133)의 내부에는 음성 인식 모듈(150)이 마련될 수 있다.

저장부(134)는 제어 명령어에 대응하는 동작 명령을 저장하고, 기능 명칭어에 대응하는 기능 정보를 저장한다.

통신부(135)는 외부 기기와의 통신을 수행하는 유무선 통신을 포함한다.

통신부(135)는 현재의 위치를 수신하는 GPS 수신부를 포함할 수 있다.

통신부(135)는 서버(미도시)와 통신을 수행하는 것도 가능하다.

사운드 출력부(136)는 음성 검색 모드 시 검색 결과를 사운드로 출력한다.

사운드 출력부(136)는 내비게이션 기능 시 경로 및 주행 정보를 사운드로 출력하고, 사용자에 의해 선택된 음악, 영상의 사운드 등을 출력하는 것도 가능하다.

1: 차량 130: 단말기
140: 소리 검출부 150: 음성인식 모듈

Claims

제1정보와, 상기 제1정보보다 용량이 큰 제2정보를 저장하는 데이터베이스부;
음성 인식 모드이면 제1 스레드를 이용하여 상기 제1정보를 로딩하고 로딩된 제1정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2정보를 로딩하고 로딩된 제2정보를 이용하여 음성 인식을 수행하되, 상기 제2스레드에 상기 제2정보의 로딩이 완료되기 전에 상기 제1 스레드에서 음성이 인식되면 상기 제2스레드의 로딩을 정지시키는 프로세서를 포함하는 음성 인식 모듈.
제 1 항에 있어서, 상기 프로세서는,
상기 제1스레드에서 음성이 미인식되면 상기 제1스레드의 음성 인식을 정지시키고 상기 제2스레드의 제2정보의 로딩을 유지시키며, 상기 제2스레드에서 제2정보의 로딩이 완료되면 상기 제2스레드에 로딩된 제2정보를 이용하여 음성인식을 수행하는 것을 포함하는 음성 인식 모듈.
제 2 항에 있어서,
상기 제1정보는, 미리 설정된 단어수보다 적은 단어수를 갖는 제어 명령어 및 복수의 기능에 각각 대응하는 기능 명칭어의 정보를 포함하고,
상기 제2정보는, 미리 설정된 단어수 이상의 단어수를 갖고, 상기 복수의 기능을 각각 수행하기 위해 필요한 자료 정보를 포함하는 음성 인식 모듈.
제 1 항에 있어서,
소리를 수집하고 수집된 소리에 대응하는 신호를 상기 프로세서에 전송하는 소리 수집부를 더 포함하는 음성 인식 모듈.
제 1 항에 있어서,
외부에서 전송된 소리의 신호를 상기 프로세서에 전송하는 수신부를 더 포함하는 음성 인식 모듈.
제 1 항에 있어서,
소리의 신호를 저장하는 메모리부를 더 포함하는 음성 인식 모듈.
제 1 항에 있어서, 상기 프로세서는,
음성 인식 모드의 동작 명령이 수신되면 제1 스레드 및 제 2 스레드를 생성하는 것을 더 포함하는 음성 인식 모듈.
제 7 항에 있어서, 상기 프로세서는,
상기 음성 인식 모드의 동작 명령이 수신되면 상기 제1스레드를 이용하여 음성 인식을 위한 안내음의 출력을 수행하는 것을 포함하는 음성 인식 모듈.
소리를 검출하고 검출된 소리의 신호를 출력하는 소리 검출부;
상기 소리의 신호에 기초하여 음성 인식을 수행하는 음성 인식 모듈;
복수의 기능 중 내비게이션 기능이 선택되면 상기 음성 인식의 정보에 기초하여 길 안내를 제어하는 제어부; 및
상기 내비게이션 기능을 표시하는 표시부를 포함하고,
상기 음성 인식 모듈은,
상기 복수의 기능에 각각 대응하는 기능 명칭어 및 각 기능의 복수의 제어 명령어의 정보를 저장하는 제1데이터베이스와, 주소 정보를 저장하는 제2데이터베이스를 갖는 데이터베이스부와, 음성 인식 모드이면 제1 스레드를 이용하여 상기 제1데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하되, 상기 제2스레드에 정보의 로딩이 완료되기 전에 상기 제1 스레드에서 인식된 음성이 상기 제1데이터베이스에 저장된 정보와 매칭되면 상기 제2스레드의 로딩을 정지시키는 프로세서를 포함하는 단말기.
제 9 항에 있어서,
음성 인식 모드를 입력받는 입력부를 더 포함하는 단말기.
제 9 항에 있어서, 상기 프로세서는,
상기 제1스레드에서 인식된 음성이 상기 제1데이터베이스의 정보와 비매칭되면 상기 제1스레드의 음성 인식을 정지시키고 상기 제2스레드의 제2데이터베이스의 정보의 로딩을 유지시키고, 상기 제2스레드에 정보의 로딩이 완료되면 로딩된 제2데이터베이스의 정보를 이용하여 음성인식을 수행하는 것을 포함하는 단말기.
제 11 항에 있어서,
현재의 위치 정보를 수신하는 통신부를 더 포함하고,
상기 제어부는, 상기 제2스레드에서 인식된 음성 인식의 정보에 대응하는 목적지를 확인하고, 상기 현재의 위치 정보에 기초하여 확인된 목적지까지의 경로를 탐색하는 것을 포함하는 단말기.
제 9 항에 있어서,
음소별로 특징 벡터의 벡터열을 저장하는 음향 모델부를 더 포함하고,
상기 프로세서는, 상시 소리의 신호의 주파수 특성을 프레임 별로 계산하여 상기 소리의 신호에 포함된 특징 벡터를 추출하는 것을 더 포함하는 단말기.
제 13 항에 있어서, 상기 음성 인식 모듈은,
상기 소리의 신호를 저장하는 메모리부를 더 포함하는 단말기.
제 14 항에 있어서,
상기 제1스레드는, 상기 음향 모델부 및 제1데이터베이스의 정보에 기초하여 음성 인식을 수행하고,
상기 제2스레드는, 상기 메모리부, 음향 모델부 및 제2데이터베이스의 정보에 기초하여 음성 인식을 수행하는 단말기.
제 9 항에 있어서, 상기 프로세서는,
음성 인식 모드의 동작 명령이 수신되면 제1 스레드 및 제 2 스레드를 생성하는 것을 더 포함하는 단말기.
제 16 항에 있어서, 상기 프로세서는,
상기 음성 인식 모드의 동작 명령이 수신되면 상기 제1스레드를 이용하여 음성 인식을 위한 안내음의 출력을 수행하는 것을 포함하는 단말기.
제 9 항에 있어서,
상기 음성 인식 모듈은, 상기 제1 스레드에서 인식된 음성이 제어 명령어이면 상기 제어 명령어의 정보를 상기 제어부에 출력하고, 상기 제1 스레드에서 인식된 음성이 기능 명칭어이면 상기 기능 명칭어의 정보를 상기 제어부에 출력하고,
상기 제어부는, 상기 제어 명령어의 정보가 수신되면 상기 수신된 제어 명령어의 정보에 기초하여 상기 내비게이션 기능의 동작을 제어하고, 상기 기능 명칭어의 정보가 수신되면 상기 수신된 기능 명칭어의 정보에 기초하여 수행 중인 기능을 변경하는 단말기.
위치 정보를 수신하는 통신부;
소리를 검출하고 검출된 소리의 신호를 출력하는 소리 검출부;
상기 소리의 신호에 기초하여 음성 인식을 수행하는 음성 인식 모듈;
복수의 기능 중 내비게이션 기능이 선택되면 상기 위치 정보 및 상기 음성 인식의 정보에 기초하여 길 안내를 제어하는 제어부; 및
상기 내비게이션 기능을 표시하는 표시부를 포함하고,
상기 음성 인식 모듈은,
상기 복수의 기능에 각각 대응하는 기능 명칭어 및 각 기능의 복수의 제어 명령어의 정보를 저장하는 제1데이터베이스와, 주소 정보를 저장하는 제2데이터베이스를 갖는 데이터베이스부와,
음성 인식 모드이면 제1 스레드를 이용하여 상기 제1데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하고, 제2스레드를 이용하여 제2데이터베이스의 정보를 로딩하고 로딩된 정보를 이용하여 음성 인식을 수행하되, 상기 제2스레드에서 정보의 로딩이 완료되기 전에 상기 제1스레드에서 인식된 음성이 상기 제1데이터베이스의 정보와 비매칭되면 상기 제2스레드에 로딩된 제2데이터베이스의 정보를 이용하여 음성인식을 수행하고 인식된 음성의 정보를 상기 제어부에 출력하는 프로세서를 포함하는 차량.
제 19 항에 있어서, 상기 프로세서는,
상기 제2스레드에서 정보의 로딩이 완료되기 전에 상기 제1 스레드에서 인식된 음성이 상기 제1데이터베이스에 저장된 정보와 매칭되면 상기 제2스레드의 로딩을 정지시키는 것을 포함하는 차량.
제 19 항에 있어서, 상기 프로세서의 제2스레드는,
위치 정보에 대응하는 주소의 정보를 로딩하는 차량.
제 19 항에 있어서, 상기 제어부는,
상기 제2스레드에서 인식된 음성 인식의 정보에 대응하는 목적지를 확인하고, 상기 위치정보에 기초하여 확인된 목적지까지의 경로를 탐색하는 것을 포함하는 차량.
제 19 항에 있어서,
상기 음성 인식 모듈은, 음소별로 특징 벡터의 벡터열을 저장하는 음향 모델부와, 상기 소리의 신호를 저장하는 메모리부를 더 포함하고,
상기 프로세서는, 상시 소리의 신호의 주파수 특성을 프레임 별로 계산하여 상기 소리의 신호에 포함된 특징 벡터를 추출하는 것을 포함하는 차량.
제 23 항에 있어서,
상기 제1스레드는, 상기 음향 모델부 및 제1데이터베이스의 정보에 기초하여 음성 인식을 수행하고,
상기 제2스레드는, 상기 메모리부, 음향 모델부 및 제2데이터베이스의 정보에 기초하여 음성 인식을 수행하는 단말기.
제 19 항에 있어서,
상기 음성 인식 모듈은, 상기 제1 스레드에서 인식된 음성이 제어 명령어이면 상기 제어 명령어의 정보를 상기 제어부에 출력하고, 상기 제1 스레드에서 인식된 음성이 기능 명칭어이면 상기 기능 명칭어의 정보를 상기 제어부에 출력하고,
상기 제어부는, 상기 제어 명령어의 정보가 수신되면 상기 수신된 제어 명령어의 정보에 기초하여 상기 내비게이션 기능의 동작을 제어하고, 상기 기능 명칭어의 정보가 수신되면 상기 수신된 기능 명칭어의 정보에 기초하여 수행 중인 기능을 변경하는 차량.