KR20200085970A

KR20200085970A - 자동차 및 그 제어 방법

Info

Publication number: KR20200085970A
Application number: KR1020190001745A
Authority: KR
Inventors: 신희원; 김신구; 김동우; 지상우
Original assignee: 현대자동차주식회사; 기아자동차주식회사
Priority date: 2019-01-07
Filing date: 2019-01-07
Publication date: 2020-07-16
Also published as: US11535268B2; US20200216088A1

Abstract

본 발명은 자동차 및 그 제어 방법에 관한 것으로, 운전자의 제스처와 음성 명령을 조합하여 사용자 인터페이스를 구현함으로써 자동차의 개선된 사용자 인터페이스를 제공하는데 그 목적이 있다. 이를 위해 본 발명에 따른 자동차는, 조작 대상을 지시하는 운전자의 제스처를 검출하도록 마련되는 제스처 검출부와; 지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식부와; 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어부를 포함한다.

Description

자동차 및 그 제어 방법{VEHCLE AND CONTROL METHOD THEREOF}

본 발명은 자동차에 관한 것으로, 자동차의 인터페이스에 관한 것이다.

자동차의 사용자 인터페이스는 운전자가 자동차를 운전하고 있는 동안에 조작이 이루어지는 경우가 많다. 따라서 자동차의 사용자 인터페이스는 안전 운전을 충분히 고려하여 구현할 필요가 있다. 자동차의 사용자 인터페이스는 크게 물리적 버튼(스위치) 방식과 디스플레이 패널을 통한 터치 방식, 음성 명령 방식으로 구분할 수 있다.

물리적 버튼(스위치)은 자동차 내부의 한정된 공간(면적)에 구현해야 하기 때문에 그 확장성이 매우 제한적이다. 디스플레이 패널을 통한 터치 방식은 제한된 디스플레이 면적에 많은 메뉴를 구현하기 위해서는 복잡하고 많은 단계의 화면 전환이 수반되기 때문에 안전 운전을 고려하면 역시 확장성이 제한적이라 할 수 있다. 음성 명령 방식은 물리적 버튼(스위치) 방식이나 터치 방식에 비해 상대적으로 확장성이 매우 높지만, 음성 명령의 수가 너무 많으면 운전자가 이를 숙지하여 정확히 활용하는데 제약이 따르므로 음성 명령 방식의 높은 확장성이 오히려 음성 명령 방식의 활용도를 떨어뜨리는 원인이 될 수 있다.

본 발명의 일 측면에 따르면, 운전자의 제스처와 음성 명령을 조합하여 사용자 인터페이스를 구현함으로써 자동차의 개선된 사용자 인터페이스를 제공하는데 그 목적이 있다.

상술한 목적의 본 발명에 따른 자동차는, 조작 대상을 지시하는 운전자의 제스처를 검출하도록 마련되는 제스처 검출부와; 지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식부와; 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어부를 포함한다.

상술한 자동차에서, 상기 제스처 검출부는, 상기 운전자의 위치와 자세를 검출하기 위한 3D 카메라이다.

상술한 자동차에서, 상기 제스처 검출부는, 상기 운전자의 서로 다른 두 부분의 신체 부위의 위치와 자세를 검출하도록 마련된다.

상술한 자동차에서, 상기 제스처 검출부는, 상기 운전자의 상기 서로 다른 두 부분의 신체 부위를 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련된다.

상술한 자동차에서, 상기 운전자의 상기 서로 다른 두 부분의 신체 부위는 상기 운전자의 눈과 상기 운전자의 손을 포함한다.

상술한 목적의 본 발명에 따른 자동차의 제어 방법은, 조작 대상을 지시하는 운전자의 제스처를 검출하도록 마련되는 제스처 검출 단계와; 지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식 단계와; 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어 단계를 포함한다.

상술한 자동차의 제어 방법에서, 상기 제스처 검출 단계는, 3D 카메라를 이용하여 상기 운전자의 위치와 자세를 검출하는 것을 포함한다.

상술한 자동차의 제어 방법에서, 상기 제스처 검출 단계는, 상기 운전자의 서로 다른 두 부분의 신체 부위의 위치와 자세를 검출하는 것을 포함한다.

상술한 자동차의 제어 방법에서, 상기 제스처 검출 단계는, 상기 운전자의 상기 서로 다른 두 부분의 신체 부위를 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하는 것을 포함한다.

상술한 자동차의 제어 방법에서, 상기 운전자의 상기 서로 다른 두 부분의 신체 부위는 상기 운전자의 눈과 상기 운전자의 손을 포함한다.

상술한 자동차의 제어 방법은, 상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 음성 명령을 다시 수신하는 단계를 더 포함한다.

상술한 자동차의 제어 방법은, 상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 운전자의 제스처를 다시 검출하는 단계를 더 포함한다.

상술한 자동차의 제어 방법은, 상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하는 단계를 더 포함한다.

상술한 자동차의 제어 방법은, 상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하고, 운전자에게 상기 음성 명령의 재수신과 상기 제스처의 재검출 가운데 어느 하나를 선택하도록 가이드하는 단계를 더 포함한다.

상술한 목적의 본 발명에 따른 또 다른 자동차는, 운전자의 눈과 손을 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련되는 3D 카메라와; 지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식부와; 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어부를 포함한다.

상술한 목적의 본 발명에 따른 자동차의 또 다른 제어 방법은, 음성 인식을 시작하는 단계와; 운전자의 눈과 손을 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련되는 제스처 검출 단계와; 지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식 단계와; 상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하고, 운전자에게 상기 음성 명령의 재수신과 상기 제스처의 재검출 가운데 어느 하나를 선택하도록 가이드 함으로써, 상기 제스처와 상기 음성 인식 단계와 상기 제스처 검출 단계 가운데 적어도 하나를 재실시하는 단계와; 상기 조작 대상과 상기 음성 명령이 서로 대응하면 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어 단계를 포함한다.

도 1은 본 발명의 일 실시 예에 따른 자동차의 제어 계통을 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 자동차의 제스처 검출부의 동작을 나타낸 도면이다.
도 3은 본 발명의 실시 예에 따른 자동차의 제어 방법을 나타낸 도면이다.
도 4는 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다.
도 5는 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다.
도 6은 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다.

도 1은 본 발명의 일 실시 예에 따른 자동차의 제어 계통을 나타낸 도면이다. 도 1에 나타낸 자동차의 제어 계통은, 본 발명의 실시 예에 따른 멀티 모달 인터페이스를 구현하기 위한 것이다. 도 1에 나타낸 바와 같이, 제어부(ECU)(102)의 입력 측에는 음성 인식부(112)와 제스처 검출부(114)가 통신 가능하도록 연결된다.

음성 인식부(112)는 운전자의 발화에 의해 생성되는 음성 신호를 분석하여 해당 음성 명령을 인식하고, 인식된 음성 명령을 제어부(102)로 전달한다. 음성 인식부(112)는 운전자의 발성에 의해 생성되는 음성 명령을 음성 인식 기술을 이용하여 인지한다. 음성 인식 기술은 마이크와 같은 소리 센서를 통해 얻은 음향학적 신호(acoustic　speech　signal)를 단어나 문장으로 변환시키는 기술이다. 음성 인식 기술은 일반적으로, 음향 신호를 추출한 후 잡음을 제거하는 작업을 하게 되며, 이후 음성 신호의 특징을 추출하여 음성 모델 데이터베이스와 비교하는 방식으로 음성인식을 수행한다. 음성 인식부(112)의 음성 인식에 의해 생성되는 음성 명령은 본 발명의 실시 예에 따른 자동차의 여러 장치들을 제어할 수 있도록 한다.

제스처 검출부(114)는 운전자의 위치와 자세를 검출하여 운전자의 위치 및 자세에 기초한 조작 대상 정보를 생성하고, 생성된 조작 대상 정보를 제어부(102)로 전달한다. 제스처 검출부(114)는, 운전자의 위치와 자세의 분석을 통해 자동차에서 운전자가 조작하고자 하는 조작 대상이 무엇인지를 인지한다. 예를 들면, 운전자가 제스처를 통해 자동차의 멀티미디어 장치를 지시하는지 아니면 도어에 마련되어 있는 윈도우 조작 스위치를 지시하는지를 운전자의 위치와 자세의 분석을 통해 인지한다. 제스처 검출부(114)는 3D 카메라(3D Camera 또는 3d Depth camera)일 수 있다. 제스처 검출부(114)를 구성하는 3D 카메라는, 스테레오 방식과 ToF(Time-of-Flight) 방식, 스트럭처드 패턴 방식 중 어느 하나 방식 또는 두 개 이상의 방식의 조합으로 구현될 수 있다. 제스처 검출부(114)의 운전자 검출 동작에 대해서는 후술하는 도 2를 통해 더 자세히 설명하고자 한다.

제어부(102)는 제스처 검출부(114)에서 발생하는 조작 대상 정보와 음성 인식부(212)에서 발생하는 음성 명령에 기초하여 해당 조작 대상을 음성 명령대로 제어하기 위한 제어 신호를 발생시켜서 조작 대상으로 전달한다. 이를 위해 제어부(102)는 조작 대상 별 음성 명령들을 데이터베이스의 형태로 저장한다.

도 2는 본 발명의 실시 예에 따른 자동차의 제스처 검출부의 동작을 나타낸 도면이다. 앞서 설명한 것처럼, 제스처 검출부(114)는 3D 카메라일 수 있다.

도 2에 나타낸 바와 같이, 본 발명의 실시 예에 따른 자동차의 멀티 모달 인터페이스에서는, 운전자(202)의 위치와 자세로부터 운전자(202)가 목적하는 조작 대상(윈도우 업/다운 버튼 252)을 확인하고, 운전자(202)의 발화에 의해 생성되는 음성 명령으로부터 운전자가 목적하는 조작의 양태를 확인한다. 조작 대상은, 예를 들면, 운전자의 눈과 특정 손가락의 끝부분을 가상으로 연결한 직선의 연장선 상에 위치하는 장치일 수 있다. 이를 위해 운전자(202)의 제스처를 통해 지정할 수 있는 조작 대상 및 그 위치(좌표)를 미리 설정하여 운용할 필요가 있다. 예를 들면, 멀티미디어 장치와 도어 잠금 스위치, 윈도우 업/다운 버튼, 실내 조명 스위치, 공조 스위치 등의 위치(좌표)를 미리 확보하여 등록해 두고, 운전자(202)의 제스처를 통해 해당 장치들을 목적하는 조작 대상으로 지시할 수 있도록 한다.

예를 들면, 제스처 검출부(114)는, 운전자(202)가 지정하는 조작 대상을 확인하기 위해 운전자의 위치와 자세를 3D 영상을 통해 검출한다. 예를 들면, 제스처 검출부(114)는 운전자의 눈(204)과 특정 손가락(206)의 끝(206)의 위치를 3D 영상의 분석을 통해 검출하고, 또 운전자의 특정 손가락(206)이 어떤 자세를 취하고 있는지를 검출한다. 도 2에서, 운전자(202)는 자신의 오른 손 검지 손가락(206)를 위로 향하도록 세운 상태에서 자신의 눈(204)과 검지 손가락(206)의 끝 부분, 윈도우 업/다운 버튼(252)을 가상의 일직선 상에 일치시킨다. 윈도우 업/다운 버튼(252)은 운전자가 목적하는 조작 대상이다.

위치 검출부(114)는 운전자(202)의 위치와 자세, 더욱 구체적으로는 운전자(202)의 눈과 위로 향상한 오른손 검지 손가락(206)의 끝 부분을 3D 영상을 통해 검출하고, 이와 같은 운전자(202)의 위치와 자세의 정보로부터 운전자(202)의 눈(204)과 오른손 검지 손가락(206)의 끝 부분을 가상으로 연결한 직선의 연장 선의 끝에 위치한 윈도우 업/다운 버튼(252)이 운전자(202)가 목적하는 조작 대상임을 인지한다. 위치 검출부(114)에 의해 생성된 조작 대상 정보는 제어부(102)로 전달된다.

운전자(202)가 목적하는 조작 대상을 확인하기 위한 운전자(202)의 위치와 자세는 운전자(202)의 눈(204)과 특정 손가락(206)의 특정 자세로 제한되지 않고, 운전자(202)의 다른 신체 부분의 위치와 자세로 대체될 수 있다. 예를 들면 운전자(202)의 왼손 엄지를 위쪽으로 향하도록 하거나, 또는 오른손 검지를 지시하고자 하는 대상을 향하도록 뻗는 것을 통해 목적하는 조작 대상을 지시할 수도 있다.

이와 같이, 운전자(202)의 제스처를 통해 목적하는 조작 대상의 지시가 이루어지면, 운전자(202)는 발화를 통해 음성 명령을 발생시켜서 조작 대상이 음성 명령대로 동작되도록 할 수 있다.

도 3은 본 발명의 실시 예에 따른 자동차의 제어 방법을 나타낸 도면이다. 도 3에 나타낸 바와 같이, 본 발명의 실시 예에 따른 자동차의 제어 방법은, 운전자의 위치 및 자세로부터 획득한 조작 대상 정보에 기초하여 조작 대상을 인지하고, 운전자의 발화로부터 획득한 음성 명령에 기초하여 조작 대상을 제어하는 방법을 나타낸다.

운전자(202)는 조작 대상을 지정하고 관련 음성 명령을 발생시키기 위해 음성 인식이 시작되도록 한다(300). 운전자(202)는, 음성 명령 관련 버튼(미도시)을 조작하거나, 또는 음성 명령이 시작됨을 나타내는 미리 설정된 음성 인식 시작 관련 예약어를 발화함으로써 음성 인식 모드를 활성화시켜서 음성 인식이 시작되도록 할 수 있다.

음성 인식 모드가 활성화되면, 제스처 검출부(114)는 3D 영상의 분석을 통해 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)를 검출한다(302).

또한 제스처 검출부(114)는 3D 영상의 분석을 통해 획득한 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)에 기초하여 조작 대상(252)을 판단한다(304). 예를 들면, 앞서 설명한 도 2에 나타낸 것처럼, 위치 검출부(114)는 운전자(202)의 위치와 자세, 더욱 구체적으로는 운전자(202)의 눈과 위로 향상한 오른손 검지 손가락(206)의 끝 부분을 3D 영상을 통해 검출하고, 이와 같은 운전자(202)의 위치와 자세의 정보로부터 운전자(202)의 눈(204)과 오른손 검지 손가락(206)의 끝 부분을 가상으로 연결한 직선의 연장 선의 끝에 위치한 윈도우 업/다운 버튼(252)이 운전자(202)가 목적하는 조작 대상임을 인지한다.

운전자(202)의 위치와 자세(제스처)의 분석을 통해 목적하는 조작 대상의 인지가 완료되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 조작 대상 관련 명령어 그룹을 로딩한다(306). 예를 들면 윈도우 업/다운 버튼(252)이 조작 대상으로 인지되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 윈도우 업/다운 버튼(152)에 관련된 음성 명령 그룹을 로딩한다. 윈도우 업/다운 버튼(152)에 관련된 음성 명령으로는 '올려(닫아)'와 '내려(열어)' 등을 포함할 수 있다.

운전자(202)가 발화를 통해 조작 대상을 제어하기 위한 음성 신호를 발생시키면, 음성 인식부(212)는 운전자(202)가 발생시킨 음성 신호를 수신하여 분석함으로써 음성 명령을 인식하고, 인식한 음성 명령을 제어부(102)로 전달한다(308).

제어부(102)는, 제스처 검출부(114)로부터 제공되는 조작 대상 정보와 음성 인식부(112)로부터 제공되는 음성 명령에 기초하여, 음성 인식부(112)로부터 전달된 음성 명령이 현재 지정되어 있는 조작 대상(예를 들면 윈도우 업/다운 버튼)에 관련된 음성 명령인지를 확인한다(310).

만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이면(310의 '예'), 제어부(102)는 조작 대상으로 제어 명령을 전달함으로써 음성 명령에 해당하는 조작 대상의 제어가 이루어지도록 한다(312). 예를 들면, 조작 대상이 윈도우 업/다운 버튼(252)이고, 음성 명령이 '내려(열어)'이면, 제어부(102)는 윈도우 업/다운 버튼(252)으로 제어 명령을 전달하여 자동차의 윈도우가 열릴 수 있도록 한다.

반대로, 만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이 아니면(310의 '아니오'), 제어부(102)는 음성 명령 인식 단계(308)로 복귀하여 음성 명령의 재입력을 위해 대기한다.

도 3에 나타낸 이와 같은 일련의 과정을 통해 운전자(202)의 위치와 자세 즉 제스처를 통해 운전자(202)가 지시하는 조작 대상을 인지하고, 운전자의 발화를 통해 발생하는 음성 명령을 인식하여 운전자(202)가 지시한 조작 대상이 음성 명령에 따라 제어되도록 할 수 있다.

도 4는 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다. 도 4에 나타낸 바와 같이, 본 발명의 실시 예에 따른 자동차의 제어 방법은, 운전자의 위치 및 자세로부터 획득한 조작 대상 정보에 기초하여 조작 대상을 인지하고, 운전자의 발화로부터 획득한 음성 명령에 기초하여 조작 대상을 제어하는 방법을 나타낸다.

운전자(202)는 조작 대상을 지정하고 관련 음성 명령을 발생시키기 위해 음성 인식이 시작되도록 한다(400). 운전자(202)는, 음성 명령 관련 버튼(미도시)을 조작하거나, 또는 음성 명령이 시작됨을 나타내는 미리 설정된 음성 인식 시작 관련 예약어를 발화함으로써 음성 인식 모드를 활성화시켜서 음성 인식이 시작되도록 할 수 있다.

음성 인식 모드가 활성화되면, 제스처 검출부(114)는 3D 영상의 분석을 통해 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)를 검출한다(402).

또한 제스처 검출부(114)는 3D 영상의 분석을 통해 획득한 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)에 기초하여 조작 대상(252)을 판단한다(404). 예를 들면, 앞서 설명한 도 2에 나타낸 것처럼, 위치 검출부(114)는 운전자(202)의 위치와 자세, 더욱 구체적으로는 운전자(202)의 눈과 위로 향상한 오른손 검지 손가락(206)의 끝 부분을 3D 영상을 통해 검출하고, 이와 같은 운전자(202)의 위치와 자세의 정보로부터 운전자(202)의 눈(204)과 오른손 검지 손가락(206)의 끝 부분을 가상으로 연결한 직선의 연장 선의 끝에 위치한 윈도우 업/다운 버튼(252)이 운전자(202)가 목적하는 조작 대상임을 인지한다.

운전자(202)의 위치와 자세(제스처)의 분석을 통해 목적하는 조작 대상의 인지가 완료되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 조작 대상 관련 명령어 그룹을 로딩한다(406). 예를 들면 윈도우 업/다운 버튼(252)이 조작 대상으로 인지되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 윈도우 업/다운 버튼(152)에 관련된 음성 명령 그룹을 로딩한다. 윈도우 업/다운 버튼(152)에 관련된 음성 명령으로는 '올려(닫아)'와 '내려(열어)' 등을 포함할 수 있다.

운전자(202)가 발화를 통해 조작 대상을 제어하기 위한 음성 신호를 발생시키면, 음성 인식부(212)는 운전자(202)가 발생시킨 음성 신호를 수신하여 분석함으로써 음성 명령을 인식하고, 인식한 음성 명령을 제어부(102)로 전달한다(408).

제어부(102)는, 제스처 검출부(114)로부터 제공되는 조작 대상 정보와 음성 인식부(112)로부터 제공되는 음성 명령에 기초하여, 음성 인식부(112)로부터 전달된 음성 명령이 현재 지정되어 있는 조작 대상(예를 들면 윈도우 업/다운 버튼)에 관련된 음성 명령인지를 확인한다(410).

만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이면(410의 '예'), 제어부(102)는 조작 대상으로 제어 명령을 전달함으로써 음성 명령에 해당하는 조작 대상의 제어가 이루어지도록 한다(412). 예를 들면, 조작 대상이 윈도우 업/다운 버튼(252)이고, 음성 명령이 '내려(열어)'이면, 제어부(102)는 윈도우 업/다운 버튼(252)으로 제어 명령을 전달하여 자동차의 윈도우가 열릴 수 있도록 한다.

반대로, 만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이 아니면(410의 '아니오'), 제어부(102)는 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치를 검출하는 단계(402) 즉 운전자(202)의 제스처 검출 단계로 복귀하여 음성 명령의 재입력을 위해 대기한다. 음성 명령과 조작 대상이 일치하지 않는 것은 음성 명령이 잘 못 발생한 것이거나 또는 조작 대상이 잘 못 지시된 것 중 어느 하나일 수 있으므로, 운전자(202)가 지시하는 조작 대상을 인지하기 위한 단계(402)로 복귀하여 운전자(202)의 제스처 검출과 음성 명령의 수신 모두를 다시 실시함으로써 정확한 조작 대상의 지시 및 음성 명령의 발생이 이루어지도록 하는 것이 바람직하다.

도 4에 나타낸 이와 같은 일련의 과정을 통해 운전자(202)의 위치와 자세 즉 제스처를 통해 운전자(202)가 지시하는 조작 대상을 인지하고, 운전자의 발화를 통해 발생하는 음성 명령을 인식하여 운전자(202)가 지시한 조작 대상이 음성 명령에 따라 제어되도록 할 수 있다.

도 5는 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다. 도 5에 나타낸 바와 같이, 본 발명의 실시 예에 따른 자동차의 제어 방법은, 운전자의 위치 및 자세로부터 획득한 조작 대상 정보에 기초하여 조작 대상을 인지하고, 운전자의 발화로부터 획득한 음성 명령에 기초하여 조작 대상을 제어하는 방법을 나타낸다.

운전자(202)는 조작 대상을 지정하고 관련 음성 명령을 발생시키기 위해 음성 인식이 시작되도록 한다(500). 운전자(202)는, 음성 명령 관련 버튼(미도시)을 조작하거나, 또는 음성 명령이 시작됨을 나타내는 미리 설정된 음성 인식 시작 관련 예약어를 발화함으로써 음성 인식 모드를 활성화시켜서 음성 인식이 시작되도록 할 수 있다.

음성 인식 모드가 활성화되면, 제스처 검출부(114)는 3D 영상의 분석을 통해 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)를 검출한다(502).

또한 제스처 검출부(114)는 3D 영상의 분석을 통해 획득한 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)에 기초하여 조작 대상(252)을 판단한다(504). 예를 들면, 앞서 설명한 도 2에 나타낸 것처럼, 위치 검출부(114)는 운전자(202)의 위치와 자세, 더욱 구체적으로는 운전자(202)의 눈과 위로 향상한 오른손 검지 손가락(206)의 끝 부분을 3D 영상을 통해 검출하고, 이와 같은 운전자(202)의 위치와 자세의 정보로부터 운전자(202)의 눈(204)과 오른손 검지 손가락(206)의 끝 부분을 가상으로 연결한 직선의 연장 선의 끝에 위치한 윈도우 업/다운 버튼(252)이 운전자(202)가 목적하는 조작 대상임을 인지한다.

운전자(202)의 위치와 자세(제스처)의 분석을 통해 목적하는 조작 대상의 인지가 완료되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 조작 대상 관련 명령어 그룹을 로딩한다(506). 예를 들면 윈도우 업/다운 버튼(252)이 조작 대상으로 인지되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 윈도우 업/다운 버튼(152)에 관련된 음성 명령 그룹을 로딩한다. 윈도우 업/다운 버튼(152)에 관련된 음성 명령으로는 '올려(닫아)'와 '내려(열어)' 등을 포함할 수 있다.

운전자(202)가 발화를 통해 조작 대상을 제어하기 위한 음성 신호를 발생시키면, 음성 인식부(212)는 운전자(202)가 발생시킨 음성 신호를 수신하여 분석함으로써 음성 명령을 인식하고, 인식한 음성 명령을 제어부(102)로 전달한다(508).

제어부(102)는, 제스처 검출부(114)로부터 제공되는 조작 대상 정보와 음성 인식부(112)로부터 제공되는 음성 명령에 기초하여, 음성 인식부(112)로부터 전달된 음성 명령이 현재 지정되어 있는 조작 대상(예를 들면 윈도우 업/다운 버튼)에 관련된 음성 명령인지를 확인한다(510).

만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이면(510의 '예'), 제어부(102)는 조작 대상으로 제어 명령을 전달함으로써 음성 명령에 해당하는 조작 대상의 제어가 이루어지도록 한다(512). 예를 들면, 조작 대상이 윈도우 업/다운 버튼(252)이고, 음성 명령이 '내려(열어)'이면, 제어부(102)는 윈도우 업/다운 버튼(252)으로 제어 명령을 전달하여 자동차의 윈도우가 열릴 수 있도록 한다.

반대로, 만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이 아니면(510의 '아니오'), 제어부(102)는 음성 명령 인식 단계(508)로 복귀하여 음성 명령의 재입력을 위해 대기한다. 단, 음성 명령 인식 단계(508)로 복귀하기 앞서, 운전자(202)에게 조작 대상에 관련된 음성 명령의 가이드를 제공한다(552). 만약 현재 지정된 조작 대상이 윈도우 업/다운 버튼(252)임에도 불구하고 운전자(202)가 발생시킨 음성 명령이 윈도우의 업/다운에 관련되지 않은 음성 명령이거나, 또는 윈도우의 업/다운에 관련된 음성 명령과 유사하지만 올바르지 않은 형태일 때, 제어부(102)는 운전자(202)가 윈도우의 업/다운에 관련된 올바른 음성 명령을 발생시킬 수 있도록 가이드할 수 있다. 예를 들면, 현재 지정된 조작 대상이 윈도우 업/다운 버튼(252)임을 운전자(202)에게 상기시키고, 윈도우 업/다운 버튼(252)을 대상으로 하는 음성 명령의 예시를 들려주어 운전자(202)가 윈도우 업/다운 버튼(252)의 제어를 위해 올바른 음성 명령을 발생시킬 수 있도록 가이드한다. 운전자(202)는 제어부(102)의 가이드를 참조하여 윈도우 업/다운 버튼(252)의 제어를 위한 올바른 음성 명령을 발생시킬 수 있다.

도 5에 나타낸 이와 같은 일련의 과정을 통해 운전자(202)의 위치와 자세 즉 제스처를 통해 운전자(202)가 지시하는 조작 대상을 인지하고, 운전자의 발화를 통해 발생하는 음성 명령을 인식하여 운전자(202)가 지시한 조작 대상이 음성 명령에 따라 제어되도록 할 수 있다.

도 6은 본 발명의 실시 예에 따른 자동차의 또 다른 제어 방법을 나타낸 도면이다. 도 6에 나타낸 바와 같이, 본 발명의 실시 예에 따른 자동차의 제어 방법은, 운전자의 위치 및 자세로부터 획득한 조작 대상 정보에 기초하여 조작 대상을 인지하고, 운전자의 발화로부터 획득한 음성 명령에 기초하여 조작 대상을 제어하는 방법을 나타낸다.

운전자(202)는 조작 대상을 지정하고 관련 음성 명령을 발생시키기 위해 음성 인식이 시작되도록 한다(600). 운전자(202)는, 음성 명령 관련 버튼(미도시)을 조작하거나, 또는 음성 명령이 시작됨을 나타내는 미리 설정된 음성 인식 시작 관련 예약어를 발화함으로써 음성 인식 모드를 활성화시켜서 음성 인식이 시작되도록 할 수 있다.

음성 인식 모드가 활성화되면, 제스처 검출부(114)는 3D 영상의 분석을 통해 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)를 검출한다(602).

또한 제스처 검출부(114)는 3D 영상의 분석을 통해 획득한 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치(좌표)에 기초하여 조작 대상(252)을 판단한다(604). 예를 들면, 앞서 설명한 도 2에 나타낸 것처럼, 위치 검출부(114)는 운전자(202)의 위치와 자세, 더욱 구체적으로는 운전자(202)의 눈과 위로 향상한 오른손 검지 손가락(206)의 끝 부분을 3D 영상을 통해 검출하고, 이와 같은 운전자(202)의 위치와 자세의 정보로부터 운전자(202)의 눈(204)과 오른손 검지 손가락(206)의 끝 부분을 가상으로 연결한 직선의 연장 선의 끝에 위치한 윈도우 업/다운 버튼(252)이 운전자(202)가 목적하는 조작 대상임을 인지한다.

운전자(202)의 위치와 자세(제스처)의 분석을 통해 목적하는 조작 대상의 인지가 완료되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 조작 대상 관련 명령어 그룹을 로딩한다(606). 예를 들면 윈도우 업/다운 버튼(252)이 조작 대상으로 인지되면, 제어부(102)는 음성 인식 명령 데이터베이스로부터 윈도우 업/다운 버튼(152)에 관련된 음성 명령 그룹을 로딩한다. 윈도우 업/다운 버튼(152)에 관련된 음성 명령으로는 '올려(닫아)'와 '내려(열어)' 등을 포함할 수 있다.

운전자(202)가 발화를 통해 조작 대상을 제어하기 위한 음성 신호를 발생시키면, 음성 인식부(212)는 운전자(202)가 발생시킨 음성 신호를 수신하여 분석함으로써 음성 명령을 인식하고, 인식한 음성 명령을 제어부(102)로 전달한다(608).

제어부(102)는, 제스처 검출부(114)로부터 제공되는 조작 대상 정보와 음성 인식부(112)로부터 제공되는 음성 명령에 기초하여, 음성 인식부(112)로부터 전달된 음성 명령이 현재 지정되어 있는 조작 대상(예를 들면 윈도우 업/다운 버튼)에 관련된 음성 명령인지를 확인한다(610).

만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이면(610의 '예'), 제어부(102)는 조작 대상으로 제어 명령을 전달함으로써 음성 명령에 해당하는 조작 대상의 제어가 이루어지도록 한다(612). 예를 들면, 조작 대상이 윈도우 업/다운 버튼(252)이고, 음성 명령이 '내려(열어)'이면, 제어부(102)는 윈도우 업/다운 버튼(252)으로 제어 명령을 전달하여 자동차의 윈도우가 열릴 수 있도록 한다.

반대로, 만약 음성 명령이 해당 조작 대상에 관련된 음성 명령이 아니면(610의 '아니오'), 제어부(102)는 음성 명령 인식 단계(608)로 복귀하여 음성 명령의 재입력을 위해 대기한다. 단, 음성 명령 인식 단계(608)로 복귀하기 앞서, 운전자(202)에게 조작 대상에 관련된 음성 명령의 가이드를 제공한다(652). 만약 현재 지정된 조작 대상이 윈도우 업/다운 버튼(252)임에도 불구하고 운전자(202)가 발생시킨 음성 명령이 윈도우의 업/다운에 관련되지 않은 음성 명령이거나, 또는 윈도우의 업/다운에 관련된 음성 명령과 유사하지만 올바르지 않은 형태일 때, 제어부(102)는 운전자(202)가 윈도우의 업/다운에 관련된 올바른 음성 명령을 발생시킬 수 있도록 가이드할 수 있다. 예를 들면, 현재 지정된 조작 대상이 윈도우 업/다운 버튼(252)임을 운전자(202)에게 상기시키고, 윈도우 업/다운 버튼(252)을 대상으로 하는 음성 명령의 예시를 들려주어 운전자(202)가 윈도우 업/다운 버튼(252)의 제어를 위해 올바른 음성 명령을 발생시킬 수 있도록 가이드한다. 운전자(202)는 제어부(102)의 가이드를 참조하여 윈도우 업/다운 버튼(252)의 제어를 위한 올바른 음성 명령을 발생시킬 수 있다.

또한, 제어부(102)는, 운전자(202)가 조작 대상에 관련된 올바른 음성 명령을 발생시킬 수 있도록 가이드한 다음, 운전자(202)에게 조작 대상을 재선택할 것인지를 확인한다(654). 만약 운전자(202)가 조작 대상을 재선택하고자 하는 경우에는(654의 '예'), 제어부(102)는 운전자(202)의 눈(204)과 손 끝(206) 각각의 위치를 검출하는 단계(402) 즉 운전자(202)의 제스처 검출 단계로 복귀하여 음성 명령의 재입력을 위해 대기한다. 반대로 운전자(202)가 조작 대상을 재선택하지 않고자 하는 경우에는(654의 '아니오'), 제어부(102)는 음성 명령 인식 단계(608)로 복귀하여 음성 명령의 재입력을 위해 대기한다. 즉, 음성 명령과 조작 대상이 일치하지 않는 것은 음성 명령이 잘 못 발생한 것이거나 또는 조작 대상이 잘 못 지시된 것 중 어느 하나일 수 있으므로, 운전자(202)가 조작 대상을 재설정하거나 또는 음성 명령을 재발생시키는 것을 선택할 수 있도록 함으로써, 조작 대상의 재 지정과 음성 명령의 재발생 가운데 어느 하나의 단계가 좀 더 신속하고 정확하게 이루어질 수 있게 된다.

도 6에 나타낸 이와 같은 일련의 과정을 통해 운전자(202)의 위치와 자세 즉 제스처를 통해 운전자(202)가 지시하는 조작 대상을 인지하고, 운전자의 발화를 통해 발생하는 음성 명령을 인식하여 운전자(202)가 지시한 조작 대상이 음성 명령에 따라 제어되도록 할 수 있다.

위의 설명은 기술적 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명의 기술 분야에서 통상의 지식을 가진 자라면 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서 위에 개시된 실시 예 및 첨부된 도면들은 기술적 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예 및 첨부된 도면에 의하여 기술적 사상의 범위가 한정되는 것은 아니다. 그 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술적 사상은 권리 범위에 포함되는 것으로 해석되어야 할 것이다.

102 : 제어부
112 : 음성 인식부
114 : 제스처 검출부
202 : 운전자
204 : (운전자의) 눈
206 : (운전자의) 손가락
252 : 윈도우 업/다운 버튼(조작 대상)

Claims

조작 대상을 지시하는 운전자의 제스처를 검출하도록 마련되는 제스처 검출부와;
지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식부와;
상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어부를 포함하는 자동차.
제 1 항에 있어서, 상기 제스처 검출부는,
상기 운전자의 위치와 자세를 검출하기 위한 3D 카메라인 자동차.
제 2 항에 있어서, 상기 제스처 검출부는,
상기 운전자의 서로 다른 두 부분의 신체 부위의 위치와 자세를 검출하도록 마련되는 자동차.
제 3 항에 있어서, 상기 제스처 검출부는,
상기 운전자의 상기 서로 다른 두 부분의 신체 부위를 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련되는 자동차.
제 3 항에 있어서,
상기 운전자의 상기 서로 다른 두 부분의 신체 부위는 상기 운전자의 눈과 상기 운전자의 손을 포함하는 자동차.
조작 대상을 지시하는 운전자의 제스처를 검출하도록 마련되는 제스처 검출 단계와;
지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식 단계와;
상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어 단계를 포함하는 자동차의 제어 방법.
제 6 항에 있어서, 상기 제스처 검출 단계는,
3D 카메라를 이용하여 상기 운전자의 위치와 자세를 검출하는 것을 포함하는 자동차의 제어 방법.
제 7 항에 있어서, 상기 제스처 검출 단계는,
상기 운전자의 서로 다른 두 부분의 신체 부위의 위치와 자세를 검출하는 것을 포함하는 자동차의 제어 방법.
제 8 항에 있어서, 상기 제스처 검출 단계는,
상기 운전자의 상기 서로 다른 두 부분의 신체 부위를 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하는 것을 포함하는 자동차의 제어 방법.
제 8 항에 있어서,
상기 운전자의 상기 서로 다른 두 부분의 신체 부위는 상기 운전자의 눈과 상기 운전자의 손을 포함하는 자동차의 제어 방법.
제 6 항에 있어서,
상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 음성 명령을 다시 수신하는 단계를 더 포함하는 자동차의 제어 방법.
제 6 항에 있어서,
상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 운전자의 제스처를 다시 검출하는 단계를 더 포함하는 자동차의 제어 방법.
제 6 항에 있어서,
상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하는 단계를 더 포함하는 자동차의 제어 방법.
제 6 항에 있어서,
상기 조작 대상과 상기 음성 명령이 서로 대응하지 않으면 상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하고, 운전자에게 상기 음성 명령의 재수신과 상기 제스처의 재검출 가운데 어느 하나를 선택하도록 가이드하는 단계를 더 포함하는 자동차의 제어 방법.
운전자의 눈과 손을 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련되는 3D 카메라와;
지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식부와;
상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어부를 포함하는 자동차.
음성 인식을 시작하는 단계와;
운전자의 눈과 손을 가상으로 연결하는 직선의 연장선 상에 위치하는 조작 대상을 검출하도록 마련되는 제스처 검출 단계와;
지시된 상기 조작 대상을 제어하기 위해 상기 운전자가 발생시키는 음성 명령을 인식하도록 마련되는 음성 인식 단계와;
상기 조작 대상에 관련된 음성 명령을 상기 운전자에게 가이드하고, 운전자에게 상기 음성 명령의 재수신과 상기 제스처의 재검출 가운데 어느 하나를 선택하도록 가이드 함으로써, 상기 제스처와 상기 음성 인식 단계와 상기 제스처 검출 단계 가운데 적어도 하나를 재실시하는 단계와;
상기 조작 대상과 상기 음성 명령이 서로 대응하면 상기 음성 명령에 상응하는 제어 신호를 상기 조작 대상으로 전달하여 상기 조작 대상이 상기 음성 명령에 해당하는 동작을 수행하도록 하는 제어 단계를 포함하는 자동차의 제어 방법.