KR20110049541A

KR20110049541A - 이동 단말기 및 그 제어 방법

Info

Publication number: KR20110049541A
Application number: KR1020090106602A
Authority: KR
Inventors: 차선화; 윤종근
Original assignee: 엘지전자 주식회사
Priority date: 2009-11-05
Filing date: 2009-11-05
Publication date: 2011-05-12
Also published as: US20110105190A1; KR101612788B1; US9465794B2

Abstract

본 발명은 모바일 메신저를 이용한 대화 시 전송할 문자 메시지를 음성을 입력받아 자동으로 생성할 수 있는 이동 단말기 및 그 제어방법에 관한 것으로, 사용자의 음성을 입력받는 마이크와, 모바일 메신저를 표시하는 디스플레이부와, 상기 모바일 메신저가 실행되면 사용자의 음성을 입력받아 인식한 후 메시지로 변환하여 상기 모바일 메신저의 메시지 입력창에 표시하고, 상기 표시된 메시지를 기설정된 상대방에게 송신하며, 상기 상대방에게 송신하는 메시지와 상기 상대방으로부터 수신되는 메시지를 그 송수신 순서에 따라 상기 모바일 메신저의 송수신 메시지 표시창에 표시하는 제어부를 포함하여 구성된다.

Description

이동 단말기 및 그 제어 방법{MOBILE TERMINAL AND METHOD FOR CONTROLLING THE SAME}

본 발명은 모바일 메신저를 이용한 대화 시 전송할 메시지를 음성을 입력받아 자동으로 생성할 수 있는 이동 단말기 및 그 제어방법에 관한 것이다.

단말기는 이동 가능 여부에 따라 이동 단말기(mobile/portable terminal) 및 고정 단말기(stationary terminal)으로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mount terminal)로 나뉠 수 있다.

이와 같은 단말기(terminal)는 기능이 다양화됨에 따라 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송의 수신 등의 복합적인 기능들을 갖춘 멀티미디어 기기(Multimedia player) 형태로 구현되고 있다. 이러한 단말기의 기능 지지 및 증대를 위해, 단말기의 구조적인 부분 및/또는 소프트웨어적인 부분을 개량하는 것이 고려될 수 있다.

최근에는 음성인식 기능을 이동 단말기에 적용하려는 노력이 이루어지고 있다. 예를 들어, 음성을 텍스트로 변환하는 STT(Speech To Text) 기능을 이용하여 문자 메시지(Text Message)를 작성할 수 있도록 함으로써 사용자가 텍스트를 간편하게 입력할 수 있도록 한다. 그러나 음성인식 범위가 넓기 때문에 음성 인식률이 떨어지는 문제점이 있다. 즉, 이동 단말기는 어떤 내용이 음성으로 입력될지 모르기 때문에 음성인식 범위가 넓어지고 그에 따라 음성 인식률이 떨어지는 문제점이 있다.

본 발명은 모바일 메신저를 이용한 대화 시 전송할 메시지를 음성을 입력받아 자동으로 생성할 수 있는 이동 단말기 및 그 제어방법을 제공하기 위한 것이다.

또한 본 발명은 이전 대화 내용으로부터 문맥 정보를 파악하여 다음 입력받은 문장의 음성인식에 반영할 수 있는 이동 단말기 및 그 제어방법을 제공하기 위한 것이다.

또한 본 발명은 파악된 문맥 정보를 이용하여 문장을 자동으로 완성할 수 있는 이동 단말기 및 그 제어방법을 제공하기 위한 것이다.

또한 본 발명은 파악된 문맥 정보를 이용하여 음성인식 범위(즉, 음성인식을 위한 특정 데이터베이스의 정보범위)를 자동으로 한정시킬 수 있는 이동 단말기 및 그 제어방법을 제공하기 위한 것이다.

또한 본 발명은 상대방이 속한 그룹이나 사용자와의 관계 정보를 이용하여 음성인식 범위(즉, 음성인식을 위한 특정 데이터베이스의 정보범위)를 한정시킬 수 있는 이동 단말기 및 그 제어방법을 제공하기 위한 것이다.

상기한 과제를 실현하기 위한 본 발명은 사용자의 음성을 입력받는 마이크와, 모바일 메신저를 표시하는 디스플레이부와, 상기 모바일 메신저가 실행되면 사용자의 음성을 입력받아 인식한 후 메시지로 변환하여 상기 모바일 메신저의 메시지 입력창에 표시하고, 상기 표시된 메시지를 기설정된 상대방에게 송신하며, 상기 상대방에게 송신하는 메시지와 상기 상대방으로부터 수신되는 메시지를 그 송수신 순서에 따라 상기 모바일 메신저의 송수신 메시지 표시창에 표시하는 제어부를 포함하여 구성된다.

또한 상기한 과제를 실현하기 위한 본 발명은 모바일 메신저가 실행되면 사용자의 음성을 입력받고, 상기 입력받은 사용자의 음성을 인식하여 메시지로 변환하고, 상기 메시지를 상기 모바일 메신저의 메시지 입력창에 표시한 후, 상기 메시지 입력창에 표시된 메시지를 기설정된 상대방에게 송신하고, 상기 상대방에게 송신하는 메시지와 상기 상대방으로부터 수신되는 메시지를 그 송수신 순서에 따라 상기 모바일 메신저의 송수신 메시지 표시창에 표시하도록 이루어진다.

상기와 같이 구성되는 본 발명의 적어도 하나의 실시 예에 관련된 이동 단말기는 메신저를 이용한 대화 시 이전 대화 내용으로부터 문맥 정보를 파악하여 다음 음성 인식할 문장에 반영함으로써 음성 인식률을 향상시킬 수 있다.

또한 본 발명은 메신저를 이용한 대화 시 상대방이 속한 그룹이나 사용자와의 관계 정보를 이용하여 음성인식 범위를 한정시킴으로써 음성 인식률을 향상시킬 수 있다.

이하, 본 발명과 관련된 이동 단말기에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서 로 구별되는 의미 또는 역할을 갖는 것은 아니다.

본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 등이 포함될 수 있다. 그러나, 본 명세서에 기재된 실시예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.

도1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도이다.

상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기가 구현될 수도 있다.

이하, 상기 구성요소들에 대해 차례로 살펴본다.

무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 사이 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.

방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방 송 신호 및/또는 방송 관련된 정보를 수신한다.

상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.

상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.

상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.

상기 방송 수신 모듈(111)은, 예를 들어, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모 듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.

방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.

이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.

근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.

위치정보 모듈(115)은 이동 단말기의 위치를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Position System) 모듈이 있다.

도 1을 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.

카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.

마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.

사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.

센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라 이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등을 센싱할 수도 있다. 한편, 상기 센싱부(140)는 근접 센서(141)를 포함할 수 있다.

출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(152), 알람부(153), 및 햅틱 모듈(154) 등이 포함될 수 있다.

디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.

디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다.

이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하 여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디의 후방에 위치한 사물을 볼 수 있다.

이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)이 2개 이상 존재할 수 있다. 예를 들어, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.

디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.

터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.

터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.

도1을 참조하면, 상기 터치스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(141)가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계 의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.

상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.

이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.

상기 근접센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.

음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(152)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.

알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(151)나 음성 출력 모듈(152)을 통해서도 출력될 수 있어서, 그들(151,152)은 알람부(153)의 일부로 분류될 수도 있다.

햅틱 모듈(haptic module)(154)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(154)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(154)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.

햅틱 모듈(154)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.

햅틱 모듈(154)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(154)은 휴대 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.

메모리(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(160)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.

메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.

인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모 듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(170)에 포함될 수 있다.

식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다.

상기 인터페이스부는 이동단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동단말기로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동단말기가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.

제어부(controller, 180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.

상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.

전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.

여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.

하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 제어부(180) 자체로 구현될 수 있다.

소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.

도2a는 본 발명과 관련된 이동 단말기 또는 휴대 단말기의 일 예를 전면에서 바라본 사시도이다.

개시된 휴대 단말기(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고, 2 이상의 바디들이 상대 이동 가능하게 결합되는 슬라이드 타입, 폴더 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용이 가능하다.

바디는 외관을 이루는 케이스(케이싱, 하우징, 커버 등)를 포함한다. 본 실시예에서, 케이스는 프론트 케이스(101)와 리어 케이스(102)로 구분될 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 사이에 형성된 공간에는 각종 전자부품들이 내장된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 중간 케이스가 추가로 배치될 수도 있다.

케이스들은 합성수지를 사출하여 형성되거나 금속 재질, 예를 들어 스테인레스 스틸(STS) 또는 티타늄(Ti) 등과 같은 금속 재질을 갖도록 형성될 수도 있다.

단말기 바디, 주로 프론트 케이스(101)에는 디스플레이부(151), 음향출력부(152), 카메라(121), 사용자 입력부(130/131,132), 마이크(122), 인터페이스(170) 등이 배치될 수 있다.

디스플레이부(151)는 프론트 케이스(101)의 주면의 대부분을 차지한다. 디스플레이부(151)의 양단부 중 일 단부에 인접한 영역에는 음향출력부(151)와 카메라(121)가 배치되고, 다른 단부에 인접한 영역에는 사용자 입력부(131)와 마이 크(122)가 배치된다. 사용자 입력부(132)와 인터페이스(170) 등은 프론트 케이스(101) 및 리어 케이스(102)의 측면들에 배치될 수 있다.

사용자 입력부(130)는 휴대 단말기(100)의 동작을 제어하기 위한 명령을 입력받기 위해 조작되는 것으로서, 복수의 조작 유닛들(131,132)을 포함할 수 있다. 조작 유닛들(131,132)은 조작부(manipulating portion)로도 통칭 될 수 있으며, 사용자가 촉각 적인 느낌을 가면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.

제1 또는 제2조작 유닛들(131, 132)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1 조작 유닛(131)은 시작, 종료, 스크롤 등과 같은 명령을 입력받고, 제2 조작 유닛(132)은 음향출력부(152)에서 출력되는 음향의 크기 조절 또는 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력받을 수 있다.

도2b는 도 2a에 도시된 휴대 단말기의 후면 사시도이다.

도2b를 참조하면, 단말기 바디의 후면, 다시 말해서 리어 케이스(102)에는 카메라(121')가 추가로 장착될 수 있다. 카메라(121')는 카메라(121, 도 2a 참조)와 실질적으로 반대되는 촬영 방향을 가지며, 카메라(121)와 서로 다른 화소를 가지는 카메라일 수 있다.

예를 들어, 카메라(121)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저 화소를 가지며, 카메라(121')는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지는 것이 바람 직하다. 카메라(121,121')는 회전 또는 팝업(pop-up) 가능하게 단말기 바디에 설치될 수도 있다.

카메라(121')에 인접하게는 플래쉬(123)와 거울(124)이 추가로 배치된다. 플래쉬(123)는 카메라(121')로 피사체를 촬영하는 경우에 피사체를 향해 빛을 비추게 된다. 거울(124)은 사용자가 카메라(121')를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.

단말기 바디의 후면에는 음향 출력부(152')가 추가로 배치될 수도 있다. 음향 출력부(152')는 음향 출력부(152, 도 2a 참조)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.

단말기 바디의 측면에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(116)가 추가적으로 배치될 수 있다. 방송수신모듈(111, 도 1 참조)의 일부를 이루는 안테나(116)는 단말기 바디에서 인출 가능하게 설치될 수 있다.

단말기 바디에는 휴대 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 직접 탈착될 수 있게 구성될 수 있다.

리어 케이스(102)에는 터치를 감지하기 위한 터치 패드(135)가 추가로 장착될 수 있다. 터치 패드(135) 또한 디스플레이부(151)와 마찬가지로 광 투과형으로 구성될 수 있다. 이 경우에, 디스플레이부(151)가 양면에서 시각 정보를 출력하도록 구성된다면, 터치 패드(135)를 통해서도 상기 시각 정보를 인지할 수 있게 된다. 상기 양면에 출력되는 정보는 상기 터치 패드(135)에 의해 모두 제어될 수도 있다. 이와 달리, 터치 패드(135)에는 디스플레이가 추가로 장착되어, 리어 케이스(102)에도 터치 스크린이 배치될 수도 있다.

터치 패드(135)는 프론트 케이스(101)의 디스플레이부(151)와 상호 관련되어 작동한다. 터치 패드(135)는 디스플레이부(151)의 후방에 평행하게 배치될 수 있다. 이러한 터치 패드(135)는 디스플레이부(151)와 동일하거나 작은 크기를 가질 수 있다.

디스플레이부(151)에는 다양한 종류의 시각 정보들이 표시될 수 있다. 이들 정보들은 문자, 숫자, 기호, 그래픽, 또는 아이콘 등의 형태로 표시될 수 있다. 이러한 정보의 입력을 위하여 상기 문자, 숫자, 기호, 그래픽 또는 아이콘 들 중 적어도 하나는 일정한 배열을 이루어 표시됨으로써 키패드의 형태로 구현될 수 있다. 이러한 키패드는 소위 '소프트키'(또는 소프트웨어 버튼)이라 불릴 수 있다.

이하에서는 상기와 같이 구성된 단말기에서 구현될 수 있는 제어 방법에 관련된 실시 예들에 대하여 첨부된 도면을 참조하여 설명한다. 후술하는 실시 예들은 단독으로 또는 서로 조합되어 사용될 수 있다. 또한, 후술하는 실시 예들이 상술한 사용자 인터페이스(UI)와 조합되어 사용될 수도 있다.

본 발명에 관련된 이동 단말기에는 음성인식을 위한 알고리즘과 STT(Speech To Text)를 위한 알고리즘이 메모리(160)에 저장되어 있으며, 이동 단말기에 구비된 임의의 기능 및 상기 음성인식 기능과 STT 기능을 연계하여 사용자가 입력하는 음성을 텍스트로 변환할 수 있다. 그리고, 상기 변환된 텍스트를 상기 기능의 실행 화면에 출력할 수 있다. 여기서, 상기 특정 기능은 텍스트 메시지나 메일과 같이 텍스트를 작성하는 기능을 포함하고, 상기 텍스트 메시지나 메일 작성 기능이 실행됨에 따라, 제어부(180)는 음성인식 기능의 활성화 및 STT 기능을 자동으로 작동시킬 수 있다.

도3는 본 발명에 관련된 이동 단말기의 음성을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도로서, 이동 단말기의 제어부(180)는 활성화 제어신호를 입력받아 음성인식 기능의 활성화를 시작할 수 있다(S101). 상기 활성화 제어신호는 음성인식 기능의 활성화를 종료시킬 경우에도 이용될 수 있다.

상기 활성화 제어신호는 단말기에 구비된 특정 하드웨어 버튼, 또는 디스플레이부(151)에 표시된 소프트웨어 버튼, 또는 터치 입력, 또는 디스플레이부(151)에 표시된 특정 메뉴의 조작에 의해 생성될 수 있다. 또는, 특정 사운드나 음향, 근거리나 원거리의 무선신호, 또는 사용자의 손짓이나 몸짓(Gesture)을 포함한 신체의 동작 정보에 의해서도 생성될 수 있다.

상기 특정 사운드나 음향은 박수 소리와 같이 특정레벨 이상을 갖는 일종의 충격음을 포함할 수 있다. 상기 특정레벨 이상의 사운드나 음향은 간단한 음향레벨 검출 알고리즘(도시하지 않음)을 이용해서 검출할 수 있다.

상기 음향레벨 검출 알고리즘은 음성인식 알고리즘보다 상대적으로 간단하며 단말기의 자원을 적게 소모할 수 있다. 상기 음향레벨 검출 알고리즘(또는 회로)은 음성인식 알고리즘(또는 회로)과 별도로 구성할 수 있고, 음성인식 알고리즘의 일부 기능을 제한하는 방식으로 구현할 수도 있다.

상기 무선신호는 무선 통신부(110)를 통해 입력받을 수 있으며, 상기 사용자의 손짓이나 몸짓은 센싱부(140)를 통해 입력받을 수 있다. 상기 활성화 제어신호를 입력받는 무선 통신부(110), 사용자 입력부(130), 센싱부(140)를 통칭하여 신호 입력부라고 할 수 있다.

상기 음성인식 기능이 활성화되면, 제어부(180)는 특정 데이터베이스를 참조하여, 마이크(122)를 통해 입력받은 상기 음성데이터나 음성명령의 문맥(context)이나 내용(content)을 분석하고, 그 음성명령에 포함된 의미를 판단할 수 있다(S103, S104).

여기서, 상기 음성명령의 의미를 인식하기 위해 참조하는 데이터베이스는, 상기 음성인식 기능이 활성화되면서 그 정보범위(domain)가 특정 기능이나 메뉴에 관련된 정보들로 특정될 수 있다(S102). 예를 들어, 상기 특정되는 정보범위는 현재 디스플레이부(151)에 출력된 메뉴들이나 그 메뉴들 중 선택된 특정 메뉴의 서브 메뉴들에 관련된 정보들로 특정될 수 있다. 상기와 같이 음성명령을 인식하기 위해 참조할 데이터베이스의 정보범위가 특정됨으로써, 음성명령에 대한 인식률을 더욱 높일 수 있게 된다.

상기 서브 메뉴들에 관련된 정보들은 데이터베이스로 구성될 수 있다.

상기 정보들은 키 워드 형태일 수 있으며, 한가지 기능이나 메뉴에 대하여 복수의 정보가 대응될 수 있다. 또한, 상기 데이터베이스는 정보의 특성에 따라 복수로 구성될 수 있으며, 메모리(160)에 저장될 수 있다. 또한, 상기 각 데이터베이스에 구성된 정보들은 학습을 통해 갱신될 수 있다. 또한, 상기 각 데이터베이스의 정보들은 음성명령의 인식률 향상을 위하여, 현재 출력되고 있는 기능이나 메뉴들에 관련된 정보들로 특정될 수 있다. 또한, 상기 정보범위는 메뉴의 단계(depth)가 깊어짐에 따라 변경될 수 있다.

상기 음성명령의 의미판단 동작은, 상기 입력된 음성명령을 임시 저장해두었다가 음성인식 기능의 활성화가 종료되면 곧바로 시작하거나, 음성인식 기능의 활성화 상태에서 음성명령이 입력됨과 동시에 수행할 수 있다.

한편, 상기 음성인식 기능이 활성화 상태에 있더라도, 제어부(180)는 터치나 버튼의 입력을 검출하는 알고리즘을 계속해서 구동할 수 있다. 따라서, 상기 제어부(180)는 음성인식 기능이 활성화된 상태에서도, 음성명령 이외의 터치나 버튼과 같은 다른 입력수단을 통해서 특정 메뉴를 선택받거나 실행할 수 있다(S109, S110).

상기 제어부(180)는 상기 음성명령의 의미가 판단되면 그 결과를 출력할 수 있다(S105). 상기 결과는 상기 음성명령의 의미에 대응하는 기능이나 서비스에 관련된 메뉴를 실행시키거나, 단말기의 특정 구성요소를 제어하기 위한 제어신호, 또는 상기 인식된 음성명령에 관련된 정보를 표시하기 위한 데이터를 포함할 수 있다.

한편, 상기 제어부(180)는 상기 결과를 출력하거나 실행할 때, 그 결과가 정확한지 여부에 대하여 사용자의 확인을 받을 수 있다(S106). 예를 들어, 상기 제어부(180)는 상기 음성명령의 인식률이 낮거나 복수의 의미로 인식될 경우, 각 의미에 관련된 복수의 메뉴들을 출력한 후, 사용자의 선택을 받아 실행할 수 있다. 또는 단순히 인식률이 높은 특정 메뉴의 실행 여부를 묻고, 사용자의 선택이나 응답을 받아 해당하는 기능이나 메뉴를 실행하거나 표시할 수 있다.

상기 특정 메뉴에 대한 실행 여부는 메시지나 음성을 출력하여 사용자에게 확인할 수 있다(예 : 텍스트 메시지작성 기능을 실행할까요? 예/아니오 로 응답해 주세요. 응답이 없으면 5초 후에 자동으로 텍스트 메시지작성 기능을 실행합니다).

이에 따라, 사용자는 음성이나 다른 입력수단을 이용하여 응답(예 : 1. 그래(Yes), 2.아니오(No))할 수 있으며, 상기 다른 입력수단으로는 하드웨어 버튼이나 소프트웨어 버튼, 또는 터치 방식으로 입력할 수 있다. 만약, 사용자의 응답이 없을 경우, 제어부(180)는 긍정 응답으로 판단하여 상기 기능이나 메뉴를 자동으로 실행할 수 있다(S107).

만약, 사용자의 응답이 부정적인 경우, 즉 상기 음성명령의 의미를 정확하게 판단하지 못하였을 경우에는 에러처리 과정을 수행할 수 있다(S108).

상기 에러처리 과정은 음성명령을 다시 입력받거나, 특정 인식률 이상을 갖는 복수의 메뉴들(또는, 유사한 의미로 해석될 수 있는 복수의 메뉴들)을 표시한 후, 사용자에 의해 어느 하나의 메뉴를 선택받을 수 있다. 만약, 특정 인식률 이상을 갖는 기능이나 메뉴가 특정 개수(예 : 2개) 미만인 경우 그 기능이나 메뉴를 자동으로 실행할 수 있다.

도4a는 본 발명에 관련된 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 예시도이다.

상기 음성인식 기능을 계속 활성화 상태로 유지할 경우, 음성인식 알고리즘 의 계속된 구동에 따라 자원소모와 전력소모가 증가하게 된다. 따라서, 이동 단말기의 불필요한 전력소모를 방지하고, 자원소모를 줄이기 위해서 음성인식 기능의 활성화 시작과 종료를 제어할 필요가 있다. 따라서, 본 발명에서는 사용자 입력부(130)에 구비된 임의의 버튼을 입력받아 활성화를 제어할 수 있다(410).

상기 임의의 버튼은 하드웨어 버튼일 수도 있고, 디스플레이부(151)에 표시된 소프트웨어 버튼이나 아이콘(411)일 수 있다. 상기 소프트웨어 버튼은 대기상태에서의 메뉴호출 버튼을 포함한다. 즉, 대기상태에서 메뉴호출 버튼이 입력되면, 제어부(180)는 메뉴 리스트를 출력하면서 동시에 음성인식 기능을 활성화할 수 있다.

또한, 상기 제어부(180)는 디스플레이부(151)에 아무것도 표시되지 않은 임의의 영역(버튼이나 메뉴 아이콘이 표시되지 않은 영역)이 터치될 경우, 상기 음성인식 기능의 활성화를 제어할 수 있다(420).

또한, 상기 제어부(180)는 특정레벨 이상의 사운드나 음향이 입력될 경우, 상기 음성인식 기능의 활성화를 제어할 수 있다(430). 예를 들어, 상기 음성인식 기능을 2가지 모드로 구동할 수 있다. 즉, 단순히 특정레벨 이상의 사운드나 음향을 검출하는 제1 모드와, 음성명령을 인식하여 그 음성명령의 의미를 판단하는 제2 모드로 구동할 수 있으며, 상기 제1 모드에서 특정레벨 이상의 사운드나 음향이 입력될 경우 제2 모드를 활성화함으로써 음성명령을 인식할 수 있다.

또한, 상기 음성인식 기능의 활성화는 근거리나 원거리의 무선신호, 또는 사용자의 손짓이나 몸짓(Gesture)을 포함한 신체의 동작 정보가 입력될 경우 제어 할 수 있다(440).

한편, 상기와 같이 음성인식 기능이 활성화됨에 따라, 제어부(180)는 음성인식을 위해 참조할 수 있는 특정 데이터베이스의 정보범위를 상기 디스플레이부(151)에 표시된 메뉴 리스트에 관련된 정보들로 특정할 수 있다. 만약, 상기 메뉴 리스트에서 특정 메뉴가 선택되거나 실행될 경우, 상기 데이터베이스의 정보범위는 그 선택된 메뉴나 그 하위 메뉴들에 관련된 정보들로 특정될 수 있다.

또한, 상기 특정 메뉴가 음성명령이나 터치 입력에 의해서 선택되거나 실행될 경우, 제어부(180)는 하위 메뉴들에 관련된 도움말 정보를 음성이나 풍선 도움말 형식으로 출력할 수 있다. 예를 들어, 도4b에 도시된 바와 같이, '멀티미디어 메뉴'가 선택될 경우, 그 하위 메뉴들(예 : 방송, 카메라, 텍스트 뷰어, 게임 등)에 관련된 정보가 도움말 정보(441, 442)로서 출력될 수 있다. 또는, 도4c에 도시된 바와 같이, 특정 메뉴를 선택하기 위해 손가락을 특정 메뉴(443)에 접근시키는 경우, 서브 메뉴 리스트(444)를 출력할 수 있다. 상기 도움말 정보는 디스플레이부(151)에 출력될 때 접근 거리에 따라 투명도나 명암이 조절될 수 있다.

상기 제어부(180)는 활성화 상태를 일정시간 동안 유지한 후 자동으로 활성화 상태를 종료시킬 수 있다. 또한, 상기 제어부(180)는 특정 버튼이나 터치가 입력되고 있는 동안에만 활성화 상태를 유지한 후, 그 입력이 해제되면 활성화 상태를 종료시킬 수 있다. 또한, 상기 제어부(180)는 활성화 상태가 시작된 후, 특정시간 이상 음성이 입력되지 않으면 자동으로 활성화 상태를 종료시킬 수 있다.

도5a는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위 한 흐름도이다.

상기와 같이 음성인식 기능이 활성화됨에 따라, 제어부(180)는 음성인식에 참조할 수 있는 데이터베이스의 정보범위를 디스플레이부(151)에 표시된 메뉴들이나 그 서브 메뉴들, 또는 현재 실행된 기능이나 메뉴에 관련된 정보들로 특정할 수 있다(S201). 상기 음성인식 기능이 활성화된 후 입력받은 음성명령은 메모리(160)의 특정 데이터베이스에 저장될 수 있다(S202, S203).

상기와 같이 정보범위가 특정된 상태에서 음성명령을 입력받으면, 제어부(180)는 음성인식 알고리즘을 이용하여, 상기 데이터베이스의 특정된 정보범위 내에서 음성명령의 내용과 문맥을 분석한다. 상기 음성명령을 분석하기 위하여 텍스트 형식의 정보로 변환할 수 있으며, 그 텍스트 형식의 정보를 메모리(160)의 특정 데이터베이스에 저장할 수 있다(S204). 그러나, 상기 음성명령을 반드시 텍스트 형식의 정보로 변환해야 하는 것은 아니다.

상기 제어부(180)는 내용과 문맥의 분석을 위하여, 상기 음성명령에 포함된 특정 단어 또는 키 워드를 검출할 수 있다(S205). 상기 검출된 단어 또는 키 워드를 바탕으로, 특정 데이터베이스에 저장된 정보를 참조하여, 상기 음성명령의 내용이나 문맥을 분석하고 그 의미를 판단할 수 있다(S206). 그리고, 상기 참조되는 데이터베이스는 그 정보범위가 현재 실행된 기능이나 메뉴에 관련된 정보범위로 특정될 수 있으며, 그 데이터베이스를 참조하여 판단된 음성명령의 의미에 해당하는 기능이나 메뉴를 실행할 수 있다(S207).

예컨대, 텍스트 메시지작성 기능을 실행한 후 STT 기능을 이용하여 텍스트 를 입력했다고 가정할 경우, 상기 음성명령의 인식을 위한 정보범위의 우선순위는, 텍스트의 수정에 관련된 명령들이나, 메시지의 전송을 위한 상대방의 검색이나 전송에 관련된 명령들로 설정될 수 있다. 상기와 같이 음성인식을 위한 정보범위가 특정 메뉴들에 관련된 정보들로 특정됨으로써, 음성인식을 위한 속도와 인식률이 향상되고 자원소모를 줄일 수 있게 된다. 상기 인식률은 특정 메뉴에 설정된 명칭과 일치하는 정도를 의미할 수 있다.

상기 음성명령의 인식률은 상기 음성명령에 포함된 정보 중, 특정 기능이나 메뉴에 관련된 정보들의 개수에 의해서 판단할 수 있다. 따라서, 상기 음성명령의 인식률은 특정 기능이나 메뉴와 정확히 일치하는 정보(예 : 메뉴 명칭)이 음성명령에 포함되어 있을 경우에 음성명령 인식률이 높아질 수 있다.

예를 들어, 도5b에 도시된 바와 같이 상기 음성명령이 6개의 단어로 이루어진 자연어(예 : I want to send text message)로 입력되었다고 가정할 경우, 특정 메뉴(예 : text message)에 관련된 의미있는 단어(예 : send, text, message)의 개수에 의해서 인식률을 판단할 수 있다. 상기 음성명령에 포함된 단어가 특정 기능이나 메뉴에 관련된 의미있는 단어인지 여부는 데이터베이스에 저장된 정보에 따라 다를 수 있다. 예컨대, 상기 자연어 음성명령에서(예 : I want to I want to send text message) 메뉴와 관련없는 의미없는 단어는 문법적으로는 주어(I) 또는 전치사(to)가 될 수 있다.

상기 자연어는 사람들이 일상적으로 쓰는 언어를 인공적으로 만들어진 언어인 인공어와 구분하여 부르는 개념으로서, 자연어 처리 알고리즘을 이용해 처리할 수 있다. 상기 자연어에는 특정 메뉴에 관련된 정확한 명칭이 포함될 수도 있고 포함되지 않을 수도 있기 때문에, 사실상 음성명령을 100% 정확하게 인식하는 것은 어려울 수 있다. 따라서, 인식률이 특정 값(예 : 80%) 이상이면 정확하다고 판단할 수 있으며, 만약 상기와 같은 인식률을 갖는 의미가 복수로 있을 경우(즉, 비슷한 인식률을 갖는 여러가지 의미로 해석될 수 있는 음성명령이 입력된 경우)에는 해당하는 메뉴들을 표시하고, 그 중 사용자의 선택을 받아 적어도 한가지 기능이나 메뉴를 실행할 수 있다.

상기 메뉴들을 표시함에 있어서 인식률이 상대적으로 높은 메뉴의 순서로 표시할 수 있다. 예를 들어, 도6에 도시된 바와 같이 인식률이 높은 메뉴 아이콘을 화면의 중심에 더욱 가깝게 표시할 수 있다(510). 또는 인식률이 높은 메뉴 아이콘을 더욱 크게 표시하거나 더욱 진하게 표시할 수 있다(520). 또한, 상기 복수의 메뉴 중 인식률이 높은 순서에 따라, 크기, 위치, 컬러, 명암 중 적어도 하나를 다르게 표시할 수 있으며, 하이라이트 시키거나 투명도를 조정할 수도 있다.

이때, 상기 복수로 표시된 메뉴 중 사용자의 선택도가 높은 메뉴의 인식률을 더 높게 변경할 수 있다. 즉, 상기 인식률은 사용자가 자주 선택하는 메뉴에 대하여 그 선택 회수를 학습할 수 있고, 그 선택된 메뉴에 대한 인식률을 변경할 수 있다. 따라서, 이 후에 동일하거나 유사한 발음 또는 내용으로 입력되는 음성명령에 대하여 인식률이 달라질 수 있다.

도7는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 예시도이다.

이동 단말기가 대기상태에 있는 것으로 가정하고, 상기 대기상태에서 사용자에 의해 특정 메뉴(예 : 메시지)가 선택될 경우, 제어부(180)는 상기 선택된 메뉴의 서브 메뉴들을 디스플레이한다(610). 그리고, 내부적으로 음성인식 기능의 활성화를 시작한다. 상기 음성인식 기능의 활성화가 시작되면, 제어부(180)는 기설정된 환경설정 옵션에 따라, 상기 음성명령의 인식을 위한 데이터베이스의 정보범위를 상기 디스플레이된 서브 메뉴들(610)에 관련된 정보들로 특정하여 설정할 수 있다.

상기와 같이 서브 메뉴들이 디스플레이된 상태에서 제어부(180)는 사용자의 음성명령, 또는 터치나 버튼을 입력받아 특정 메뉴(621)를 선택할 수 있다. 상기와 같이 음성명령 또는 터치나 버튼 입력을 받아 특정 메뉴(621)가 선택되면, 제어부(180)는 그 서브 메뉴들을 디스플레이할 수 있다(620).

상기 서브메뉴가 디스플레이된 상태(620)에서 자연어 음성명령(예 : I want to send text message)이 입력될 경우, 제어부(180)는 상기 음성명령의 내용과 문맥에 따라, 특정 기능이나 메뉴에 관련된 의미 있는 단어 또는 키 워드(예 : send, text, message)를 검출하고, 특정 데이터베이스에서 상기 서브 메뉴들에 관련된 정보들과 비교하여 인식률이 가장 높은 의미를 판단한다.

그리고, 상기 판단된 의미에 관련된 메뉴(예 : send text)를 실행한다.

또한, 제어부(180)는 단말기의 동작상태나 동작모드(예 : 음성인식 기능을 안내하는 모드)에 따라, 특정 메뉴가 음성명령이나 터치 입력에 의해서 선택되거나 실행될 경우, 제어부(180)는 하위 메뉴들에 관련된 도움말 정보를 음성이나 텍스트 형식의 풍선 도움말로 출력할 수 있다.

상기 도움말을 출력하는 동작모드는 환경설정 메뉴에 관련된 옵션을 구비하여 설정할 수 있다. 이에 따라, 본 발명은 음성명령에 대한 사용자의 숙련도에 관계없이, 버튼이나 터치 입력 및 음성명령에 의해서 특정 기능이나 서비스에 관련된 메뉴를 제어할 수 있다.

한편, 상기 음성명령의 의미가 복수로 인식된 경우, 즉, 자연어 음성명령에 정확한 메뉴의 명칭이 포함되어 있지 않은 경우, 예를 들어, "메시지 전송" 카테고리에 포함되지만, "send photo", "sned shotmail", "outbox" 중, 사용자가 선택하기를 원하는 메뉴가 정확히 어떤 메뉴에 관련된 것인지 판단되지 않을 경우, 제어부(180)는 특정 값(예 : 80%) 이상의 인식률을 갖는 복수의 메뉴를 표시할 수 있다. 그러나, 특정 값 이상의 인식률을 갖는 메뉴가 둘 미만인 경우에는 해당 기능이나 메뉴를 자동으로 실행시킬 수 있다.

도8은 본 발명에 관련된 이동 단말기의 음성명령 인식을 위한 데이터베이스의 구성을 설명하기 위한 예시도이다.

상기 데이터베이스는 음성명령의 의미를 판단하기 위한 정보들을 저장하는 것으로, 그 정보들의 특성에 따라 복수의 데이터베이스를 구성할 수 있다. 상기 정보들의 특성에 따라 구성된 각 데이터베이스는 제어부(180)의 제어를 받아 지속적인 학습을 통해 정보를 업데이트 할 수 있다.

상기 데이터베이스의 학습이란, 사용자가 발음하는 음성을 그에 해당하는 단어와 대응시키는 것으로, 예를 들어, 사용자가 "waiting"이라고 발음했으나 "eighteen"이라고 인식되었을 경우, 사용자가 "eighteen"을 "waiting"로 수정해 줌으로써, 이후부터 동일한 발음에 대하여 "waiting"으로 인식될 수 있도록 학습하는 것이다. 상기 학습을 통해 데이터베이스의 각 정보들에 복수의 음성정보가 대응될 수 있다.

상기 정보들의 특성에 따른 각 데이터베이스는, 마이크를 통해 입력받은 음성을 음소, 음절, 또는 형태소 단위로 인식하기 위한 음성 정보를 저장하는 제1 데이터베이스(161), 상기 인식된 음성정보를 바탕으로 음성명령의 전체적인 의미를 판단하기 위한 정보(예 : 문법, 발음 정확도, 문장 구조 등)를 저장하는 제2 데이터베이스(162), 이동 단말기에 구비된 기능이나 서비스를 위한 메뉴에 관련된 정보들을 저장하는 제3 데이터베이스(163), 상기 판단된 음성명령의 의미를 사용자로부터 확인받기 위해 단말기에서 출력할 메시지 또는 음성 정보를 저장하는 제4 데이터베이스(164)를 포함할 수 있다.

상기 제3 데이터베이스(163)는 상술한 음성명령 인식을 위해 설정된 정보범위에 따라, 특정 카테고리의 메뉴들에 관련된 정보로 특정될 수 있다. 상기 각 데이터베이스에는 음성(또는 발음) 정보 및 그 음성(또는 발음) 정보에 대응하는 음소, 음절, 형태소, 단어, 키 워드, 또는 문장 정보가 저장될 수 있다.

따라서, 제어부(180)는 상기 복수의 데이터베이스(161 ~ 164) 중 적어도 어느 하나를 이용하여, 음성명령에 포함된 의미를 판단하는 동작을 수행하고, 그 판단된 음성명령의 의미에 해당하는 기능이나 서비스에 관련된 메뉴를 실행할 수 있다. 또한, 본 발명은 음성명령 인식 기능이나 STT 기능이 적용되고 있는 동작상태 나 동작모드를 특정 모양의 인디케이터(Indicator)나 아이콘을 이용해 표시할 수 있다. 상기 인디케이터나 아이콘의 출력 시 특정 음향이나 음성을 출력하여 사용자에게 통보할 수 있다.

본 발명은 상술한 데이터베이스뿐만 아니라 특정한 상황(예 : 약속, 여행, 출장, 교통, 식사, 예약, 장소, 시간, 쇼핑 등)에서 많이 사용되는 용어나 대화 정보들(예 : 특정 상대방과의 누적된 대화)이 저장된 데이터베이스들(미도시)을 추가로 구비할 수 있다. 또한 본 발명은 상기와 같이 복수의 데이터베이스를 구비하지 않고, 상기 정보들을 카테고리별로 구분하여 하나의 데이터베이스에 저장할 수도 있다.

상기와 같이 여러가지 상황이나 주제별로 구분된 데이터베이스들(또는 카테고리별로 구분된 정보들)을 구비함으로써 제어부(180)는 음성인식 범위(즉, 음성인식을 위한 특정 데이터베이스의 정보범위 또는 특정 카테고리의 정보범위)를 한정할 수 있다. 상기와 같이 음성인식 범위를 좁게 한정함으로써 제어부(180)는 음성인식률을 향상시킬 수 있다. 즉, 상기 음성 인식률이 향상된다는 것은 더 짧은 시간에 더 정확하게 음성을 인식할 수 있음을 의미한다.

특히 본 발명은 단순히 사용자의 발음(또는 음성)을 인식하는 것뿐만 아니라, 그 사용자가 자연어로 입력한 문장의 의미까지도 인식할 수 있다. 그리고, 상기와 같이 인식된 문맥(context) 정보를 이용하여 음성인식 범위를 한정함으로써 다음에 입력받을 음성의 음성 인식률을 향상시키는데 이용할 수 있다.

도9a 내지 도9c는 본 발명에 관련된 이동 단말기의 음성인식 방법을 설명하는 예시도이다.

도9a에 도시된 바와 같이 사용자와 임의의 상대방이 운전중(또는 이동중)에 이동 단말기의 모바일 메신저를 이용하여 특정 카테고리(예 : 약속장소, 약속시간)에 관련된 대화를 주고받고 있다고 가정한다.

일반적으로 단문 메시지(Short Message)는 송신 메시지와 수신 메시지를 별도로 표시한다. 그러나, 도9b에 도시된 바와 같이 상기 모바일 메신저(711)는 사용자가 상대방으로 전송하는 메시지와 상대방으로부터 수신한 메시지를 한 화면(예 : 송수신 메시지 표시창)(711)에 순차로 표시함으로써 대화 내용을 순서에 따라 한꺼번에 볼 수 있다.

상기 모바일 메신저는 송신 메시지와 수신 메시지를 한꺼번에 표시하는 화면(711)과 송신 메시지의 내용을 입력할 화면(712)과 상기 입력된 메시지를 전송하도록 지시하는 송신 버튼(713)을 구비하고 있다. 본 발명은 사용자가 전송할 메시지의 내용을 음성으로 입력하면 제어부(180)에서 상기 음성을 텍스트로 변환하여 상기 문자 입력 화면(예 : 메시지 입력창)(712)에 표시하게 된다.

상기와 같이 메신저 형식의 문자 메시지는 대화의 연속성을 유지시킬 수 있는 장점이 있다. 즉, 사용자는 특정 상대방과 주고받은 문자 메시지들을 한 화면에서 볼 수 있으며, 하나의 파일로 저장하여 관리함으로써 서로 관련된 메시지들의 내용을 한꺼번에 볼 수 있도록 하는 장점이 있다.

도9c에 도시된 바와 같이 사용자가 모바일 메신저를 이용하여 대화를 시작 하면(S301), 제어부(180)는 사용자가 특정 상대방과 주고받을때 누적된 대화 내용, 또는 상대방이 속한 그룹(예 : 폰북의 그룹)이나 사용자와의 관계 정보(예 : 친구, 고객, 가족, 동호인 등)를 이용하여 '우선 음성인식 범위'를 설정할 수 있다(S302). 상기 '우선 음성인식 범위'란 음성인식을 위해 우선적으로 참조할 수 있는 특정 데이터베이스(또는 정보 카테고리)를 의미한다.

예를 들어, 상기 누적된 대화 내용중에서 장소와 시간에 관련된 문장이 많으면 해당하는 카테고리(예 : 약속관련 카테고리)로 음성인식 범위를 설정할 수 있고, 상기 상대방이 속한 그룹이 클라이언트 그룹이라면 비즈니스에 관련된 카테고리로 '우선 음성인식 범위'를 설정할 수 있다.

여기서 상기 '우선 음성인식 범위'는 복수의 카테고리(또는 데이터베이스)가 동시에 설정될 수 있다. 예를 들어 '약속 카테고리'와 '친구 카테고리'가 동시에 설정될 수도 있고, '교통 카테고리'와 '예약 카테고리'가 동시에 설정될 수도 있으며, 그 이외에도 다른 특정 카테고리가 추가로 설정될 수도 있다.

상기와 같이 '우선 음성인식 범위'가 설정된 상태에서 메시지가 수신되거나 사용자가 음성을 입력하면(S303의 예) 제어부(180)는 상기 설정된 '우선 음성인식 범위'에서 우선 음성인식을 수행한다(S304). 즉, 상기 수신 메시지 또는 사용자가 입력한 음성의 의미나 문맥 정보를 판단한다(S305).

그리고 상기 '우선 음성인식 범위'에서 음성인식이 어려울 경우에는 점차 그 음성인식 범위를 기설정된 임의의 방식에 따라 확대할 수 있다.

그리고 상기와 같이 음성인식을 수행하면 제어부(180)는 상기 인식된 내용 을 텍스트로 변환하여 상대방에게 전송한다. 그리고 상기 전송된 메시지의 내용을 메신저 형식으로 화면(711)에 표시한다.

상기와 같이 제어부(180)는 대화 내용의 의미나 문맥 정보를 파악하고 이를 활용하여 다음에 입력받을 음성의 내용을 예측할 수도 있다(S306). 예를 들어 상기 대화 내용의 문맥 정보가 '약속'에 관련된 것으로 파악될 경우, 이전에 입력된 음성의 의미가 약속 시간에 대한 질문일 경우 다음에 입력받을 음성은 구체적인 시각일 확률이 가장 크다. 따라서, 다음 '우선 음성인식 범위'는 시간에 대한 가중치를 높여 음성 인식률을 향상시킬 수 있다. 또한 이전에 입력받은 문장(예 : 상대방으로부터 문자 메시지로 수신된 문장 또는 사용자로부터 음성으로 입력된 문장)의 의미나 문맥 정보를 이용하여 간단한 문장을 완성시킬 수도 있다. 예를 들어 'What time do you want to meet?'이라는 상대방의 질문에 사용자가 'seven'라고 간단하게 말했을 경우, 제어부(180)는 'Let's meet at seven o'clock'와 같이 문장을 자동으로 완성시킬 수도 있다. 그리고 상기 자동으로 완성된 문장(=문자 메시지)을 메신저 화면에 표시하여 사용자의 확인을 받을 수 있다. 이에 사용자가 상기 자동 완성된 문장을 확인하면 그 문장을 상대방으로 전송할 수 있다.

그리고 상기와 같이 대화가 계속됨에 따라 제어부(180)는 상기 '우선 음성인식 범위'를 재설정할 수 있다(S307). 그리고 상기 재설정된 '우선 음성인식 범위'를 반영하여 음성인식을 수행하게 된다.

다시 말해 제어부(180)는 상기 판단된 문맥 정보를 바탕으로 '우선 음성인식 범위'를 재설정하거나 추가 또는 변경할 수 있다. 즉, 상기 제어부(180)는 상대 방에 따라 '우선 음성인식 범위'가 설정되었다고 하더라도 현재 실행되고 있는 대화(예 : 상대방으로부터 수신한 문자 메시지, 사용자가 입력한 음성을 텍스트로 변환하여 전송한 문자 메시지)가 계속됨에 따라 그 대화 상황에 적합한 '우선 음성인식 범위'로 재설정하거나 추가 또는 변경할 수 있다.

도10은 본 발명에 관련된 음성인식을 위한 데이터베이스의 구성을 설명하는 예시도이다.

일반적으로 이동 단말기의 폰북에 저장된 그룹에 따라 사용자가 주고받는 대화 내용에는 차이가 있다. 예를 들어 가족들과 나누는 대화와 회사동료들 또는 친구들과 나누는 대화 내용에는 차이가 있다. 따라서 사용자가 대화할 상대방이 포함된 그룹에 따라 해당하는 '우선 음성인식 범위'를 설정함으로써 음성 인식률을 더 향상시킬 수 있다.

본 발명은 상술한 데이터베이스(또는 정보 카테고리)뿐만 아니라 음성인식 모델링을 위한 새로운 데이터베이스(또는 정보 카테고리)를 추가로 포함할 수 있다. 예를 들어, 상기 데이터베이스는 이동 단말기의 폰북에 저장된 각 그룹별(예 : 친구, 고객, 가족, 회사동료, 동호인 등)로 주로 사용하는 언어와 대화의 주제(Topic) 정보로 구성된 제5 데이터베이스(165)와, 또한 각 개인별로 주고받은 대화 내용을 이용하여 주로 사용하는 언어와 대화의 주제 정보로 구성된 제6 데이터베이스(166)와, 또한 현재 실행되고 있는 메신저 형식의 대화 내용 정보로 구성된 제7 데이터베이스(167)를 포함할 수 있다.

또한 상기 제5 내지 데7 데이터베이스들은 상대방과의 대화가 진행될수록 그 정보들이 업데이트될 수 있다.

여기서, 상기 제어부(180)는 상기 제7 데이터베이스를 이용하여 새로운 음성이 입력되기 바로 직전에 주고받은 대화 내용(예 : 답변을 해야하는 바로 직전의 질문), 또는 시간적으로 인접하여 계속 송수신된 대화 내용(예 : 3분 이내의 간격으로 주고 받은 대화 내용)을 이용하여 음성인식을 수행할 수도 있다.

상기 제어부(180)는 상술한 데이터베이스들을 이용하여 음성인식 엔진을 구동할 수 있다. 상기 음성인식 엔진은 소프트웨어 알고리즘으로 구현될 수 있고 하드웨어 칩셋으로 구현될 수도 있다. 또는 상기 제어부(180) 자체가 음성인식 엔진으로서 구동될 수도 있다.

도11a 와 도11b는 본 발명에 관련된 이동 단말기에서 '우선 음성인식 범위'를 설정하는 방법을 설명하는 예시도이다.

상술한 바와 같이 '우선 음성인식 범위'는 좀 더 정확하고 빠른 음성인식을 위하여 다른 데이터베이스들보다 우선적으로 참조할 데이터베이스(또는 정보 카테고리)의 정보범위를 의미한다.

상기 '우선 음성인식 범위'는 대화의 상황에 따라 제어부(180)에서 자동으로 설정할 수 있다. 예를 들어 상대방으로부터 사용자에게 메시지가 도착했을 경우, 또는 사용자가 상기 상대방으로 메시지를 전송할 경우, 제어부(180)는 그 상대방의 발신자 정보를 참조하여 사용자의 이동 단말기에 등록된 폰북의 그룹을 판단한다(S401). 그리고 상기 판단된 폰북의 그룹에 관련된 데이터베이스(예 : 제5 데이터베이스)를 '우선 음성인식 범위'로 설정할 수 있다(S404).

또한 제어부(180)는 상기 폰북의 그룹에 저장된 상대방에 해당하는 개인별 특성 정보(예 : 대화 스타일, 주로하는 대화의 종류 등)가 저장된 데이터베이스(예 : 제6 데이터베이스)를 '우선 음성인식 범위'로 추가로 설정할 수 있다(S402, S404).

또한 제어부(180)는 상기 상대방과 메신저 형식으로 대화를 시작할 때부터 상호간에 주고받는 메시지를 실시간으로 저장하고, 그 저장된 대화 내용을 이용하여 현재 진행중인 대화의 문맥 정보를 판단하거나 분석할 때 참조하기 위한 데이터베이스(예 : 제7 데이터베이스)를 '우선 음성인식 범위'로 추가로 설정할 수 있다(S403, S404).

상기와 같이 현재 대화를 나누는 상대방에 관련된 데이터베이스들로 '우선 음성인식 범위'를 한정함으로써 제어부(180)는 사용자가 입력할 음성의 내용을 예측할 수 있다. 즉, 사용자가 음성으로 입력할 내용의 의미나 문맥을 예측할 수 있다(S405). 예를 들어 현재 약속에 관련된 대화를 나누고 있다고 가정할 경우 그 상대방이 속한 그룹(예 : 친구, 고객, 가족, 직장동료)에 따라 대화 스타일(예 : 존댓말, 편한말, 낮춤말)을 판단할 수 있고, 현재 진행되고 있는 대화 내용(예 : 질문과 대답)으로부터 그 문맥에 따라 다음에 사용자가 입력할 질문이나 대답을 예측할 수 있다.

이에 따라 만약 상대방이 약속시간에 관련된 질문(예 : 몇시?)을 하였을 경우 제어부(180)는 사용자가 약속시간에 관련된 대답을 할 것으로 예측할 수 있다. 그리고 사용자가 음성(예 : 대답)을 입력하면(S406의 예), 사용자의 발음이 정확하 지 않더라도 약속시간에 관련된 데이터베이스(또는 정보 카테고리)에서 비슷한 발음을 갖는 대답(예 : waiting, eighteen)으로 음성인식을 할 수 있다(S407). 예를 들어, 도11b에 도시된 바와 같이, 약속시간을 묻는 상대방의 질문에 대하여 사용자가 약속시간을 대답해야 할 때 'waiting o'clock'에 가까운 부정확한 발음(721)을 할 경우 제어부(180)는 'eighteen o'clock'이라고 정확하게 인식하여 자동 완성된 문장(722)을 화면에 표시하는 것이다.

상기와 같이 '우선 음성인식 범위'를 한정하는 것은 한정된 정보범위 내에서만 음성인식을 수행할 수 있도록 제한하고자 하는것이 아니라, 사용자가 다소 부정확한 발음을 입력하더라도 그 대화 상황에 맞는 정확한 음성인식을 수행할 수 있도록 하기 위한 것이다.

한편 본 발명은 상기와 같이 '우선 음성인식 범위'가 설정된 상태에서 사용자가 음성을 입력할 경우 제어부(180)는 상기 설정된 '우선 음성인식 범위'에서 우선으로 음성인식을 수행함으로써 사용자의 음성 인식률을 향상시키는것 뿐만 아니라 문장을 자동으로 완성하는 것에도 이용할 수 있다(S408).

이하 상기 문장 자동 완성 방법에 대해서 설명한다.

도12는 본 발명에 관련된 이동 단말기에서 문장을 자동 완성하는 방법을 설명하는 예시도이다.

본 발명의 음성인식 방법은 사용자의 음성을 단순히 텍스트로 변환하기 위한 것이 아니라, 사용자의 음성에 포함된 의미나 문맥 정보까지 인식하여 해당하는 동작을 수행하는 것을 의미한다.

여기서 문맥(context) 정보란 문장이 연속될 때 앞뒤 문장에 표현된 의미의 연결 관계나 흐름을 나타내는 정보이다. 예를 들어 서로 대화를 나누는 사람들은 동일한 주제로 이야기를 하므로 문맥이 연속적이라고 할 수 있다. 그러나 앞문장과 뒷문장이 동일한 주제로 연결되지 않을 경우에는 문맥이 끊겼다라고 할 수 있는 것이다.

본 발명에서 제어부(180)는 사용자가 말하는 음성(731)에 포함된 의미나 문맥을 판단할 수 있을 뿐만 아니라, 상대방으로부터 수신된 메시지(732)에서도 의미나 문맥을 판단할 수 있다. 이에 따라 메신저 형식으로 대화가 이루어지는 동안 제어부(180)는 그 대화의 문맥(또는 대화의 흐름)을 판단할 수 있게 된다(S501).

예를 들어 상대방으로부터 만날 장소를 묻는 메시지(예 : where do you want to meet?)를 수신하였을 경우 제어부(180)는 그 메시지의 의미나 문맥 정보를 판단한다. 즉, 제어부(180)는 상기 메시지의 의미나 문맥 정보가 '만남', '장소' 및 '약속'에 관한 것으로 판단한다. 이에 따라 그에 관련된 정보들이 저장된 데이터베이스(또는 카테고리)로 '우선 음성인식 범위'를 설정할 수 있다(S502). 그리고 그 판단된 문맥에 따라 사용자도 역시 '만남', '장소' 및 '약속'에 관한 대답을 입력할 것으로 예측할 수 있다(S503).

그리고 다시 상대방으로부터 만날 시간을 묻는 메시지(예 : what time do you want to meet?)를 수신하였을 경우 제어부(180)는 그 메시지의 의미나 문맥 정보를 판단한다. 즉, 제어부(180)는 상기 메시지의 의미나 문맥 정보가 '만남', '시간' 및 '약속'에 관한 것으로 판단한다. 이에 따라 그에 관련된 정보들이 저장된 데이터베이스(또는 카테고리)로 '우선 음성인식 범위'를 설정할 수 있다(S502). 그리고 그 판단된 문맥에 따라 사용자도 역시 '만남', '시간' 및 '약속'에 관한 대답을 입력할 것으로 예측할 수 있다(S503).

그리고 사용자가 대답(예 : eighteen)을 입력하면 제어부(180)는 상기 판단된 문맥 정보와 상기 사용자가 입력한 대답 및 특정 데이터베이스(733)에 저장된 샘플 문장들을 참조하여 상대방으로 전송할 문장(예 : Let's meet at eighteen o'clock)을 자동으로 완성할 수 있다(S504). 예를 들어 상기와 같이 문장을 자동으로 완성하기 위하여 이미 기본적인 형식의 문장들(예 : 대화 상황별 샘플 문장)을 특정 데이터베이스(733)에 저장해둘 수 있다. 따라서 제어부(180)는 상기 샘플 문장에 사용자가 입력한 음성(예 : 약속시간, 약속장소, 상대방의 이름 등)을 기설정된 적절한 위치에 삽입하는 방식으로 문장을 완성할 수도 있다.상기 문장은 제어부(180)에서 판단한 상대방의 대화 스타일에 따라 다른 타입의 문장으로 변경될 수 있다.

상기와 같이 문장을 자동으로 완성한 후 제어부(180)는 상기 완성된 문장을 메신저 화면에 표시할 수 있다(S505). 이에 사용자는 상기 메신저 화면에 표시된 문장을 확인한 후 전송 버튼을 입력할 수 있다.

이상, 본 발명의 바람직한 실시 예를 첨부된 도면들을 참조로 설명하였다.

여기서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.

따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.

도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도.

도 2a은 본 발명의 일 실시예에 관련된 휴대 단말기의 전면 사시도.

도 2b는 본 발명의 일 실시예에 관련된 휴대 단말기의 후면 사시도.

도 3은 본 발명에 관련된 이동 단말기의 음성을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도.

도 4a는 본 발명에 관련된 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 예시도.

도 4b와 도 4c는 본 발명에 관련된 이동 단말기의 도움말 정보 출력방법을 설명하기 위한 예시도.

도 5a는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 흐름도.

도 5b는 본 발명에 관련된 이동 단말기의 음성인식 방법을 설명하기 위한 예시도.

도 6은 본 발명에 관련된 이동 단말기의 음성 인식률에 따른 메뉴 표시 방법을 설명하기 위한 예시도.

도 7은 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 예시도.

도 8은 본 발명에 관련된 이동 단말기의 음성명령 인식을 위한 데이터베이스의 구성을 설명하기 위한 예시도.

도 9a 내지 도9c는 본 발명에 관련된 이동 단말기의 음성인식 방법을 설명하는 예시도.

도 10은 본 발명에 관련된 음성인식을 위한 데이터베이스의 구성을 설명하는 예시도.

도 11a 와 도 11b는 본 발명에 관련된 이동 단말기에서 '우선 음성인식 범위'를 설정하는 방법을 설명하는 예시도.

도 12는 본 발명에 관련된 이동 단말기에서 문장을 자동 완성하는 방법을 설명하는 예시도.

Claims

모바일 메신저가 실행되면 사용자의 음성을 입력받는 단계와;

상기 입력받은 사용자의 음성을 인식하여 메시지로 변환하는 단계와;

상기 메시지를 상기 모바일 메신저의 메시지 입력창에 표시하는 단계와;

상기 메시지 입력창에 표시된 메시지를 기설정된 상대방에게 송신하는 단계와;

상기 상대방에게 송신하는 메시지와 상기 상대방으로부터 수신되는 메시지를 그 송수신 순서에 따라 상기 모바일 메신저의 송수신 메시지 표시창에 표시하는 단계;를 포함하여 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제1항에 있어서, 상기 음성을 인식하여 메시지로 변환하는 단계는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 음성을 인식하도록 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제1항에 있어서, 상기 음성을 인식하여 메시지로 변환하는 단계는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 사용자가 입력할 음성의 내용을 예측하는 단계;를 더 포함하여 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제1항에 있어서, 상기 음성을 인식하여 메시지로 변환하는 단계는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 사용자의 음성으로 입력받은 내용을 이용하여 상기 메시지로 변환할 특정 문장을 자동으로 완성하는 단계;를 더 포함하여 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제4항에 있어서, 상기 특정 문장을 자동으로 완성하는 단계는,

상기 송수신되는 메시지의 문맥에 따라 특정 데이터베이스에 기 저장되어 있는 샘플 문장에 상기 사용자가 입력한 음성을 삽입하여 완성하도록 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제1항에 있어서, 상기 사용자의 음성을 인식하기 위하여 '우선 음성인식 범위'를 설정하는 단계;를 더 포함하여 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제6항에 있어서, 상기 우선 음성인식 범위는,

사용자와 특정 상대방과의 대화 내용, 상기 특정 상대방이 속한 폰북의 그룹 정보 및 상기 특정 상대방과 사용자와의 관계 정보를 이용하여 설정하도록 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제6항에 있어서, 상기 우선 음성인식 범위는,

음성인식을 위하여 우선적으로 참조할 수 있는 특정 정보들이 저장된 복수의 데이터베이스 또는 복수의 정보 카테고리인 것을 특징으로 하는 이동 단말기의 제어방법.
제6항에 있어서, 상기 우선 음성인식 범위는,

사용자와 상대방의 대화 내용에서 판단된 문맥 정보를 바탕으로 재설정하거나 추가 또는 변경할 수 있도록 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
제6항에 있어서, 상기 우선 음성인식 범위는,

폰북에 저장된 각 그룹에 따라 주로 사용하는 언어와 대화의 주제 정보로 구성된 데이터베이스, 각 개인별로 주로 사용하는 언어와 대화의 주제 정보로 구성된 데이터베이스 및 현재 진행되고 있는 대화 내용을 저장하여 그 대화의 문맥 정보를 판단하기 위한 데이터베이스를 이용하여 설정될 수 있도록 이루어진 것을 특징으로 하는 이동 단말기의 제어방법.
사용자의 음성을 입력받는 마이크와;

모바일 메신저를 표시하는 디스플레이부와;

상기 모바일 메신저가 실행되면 사용자의 음성을 입력받아 인식한 후 메시 지로 변환하여 상기 모바일 메신저의 메시지 입력창에 표시하고, 상기 표시된 메시지를 기설정된 상대방에게 송신하며, 상기 상대방에게 송신하는 메시지와 상기 상대방으로부터 수신되는 메시지를 그 송수신 순서에 따라 상기 모바일 메신저의 송수신 메시지 표시창에 표시하는 제어부;를 포함하여 구성된 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 음성을 인식하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 사용자가 입력할 음성의 내용을 예측하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는,

상기 송수신하는 메시지의 의미와 문맥을 판단하고 그 판단된 문맥에 따라 사용자의 음성으로 입력받은 내용을 이용하여 상기 메시지로 변환할 특정 문장을 자동으로 완성하는 것을 특징으로 하는 이동 단말기.
제14항에 있어서, 상기 제어부는,

상기 송수신하는 메시지의 문맥에 따라 특정 데이터베이스에 기 저장되어 있는 샘플 문장의 기설정된 위치에 상기 사용자가 입력한 음성을 삽입하여 상기 특정 문장으로 완성하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는,

상기 사용자가 특정 상대방과 송수신하는 메시지의 문맥 정보, 상기 특정 상대방이 속한 폰북의 그룹 정보 및 상기 특정 상대방과 사용자와의 관계 정보를 이용하여 '우선 음성인식 범위'를 설정하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 이동 단말기는,

폰북에 저장된 각 그룹에 따라 주로 사용하는 언어와 대화의 주제 정보로 구성된 데이터베이스, 각 개인별로 주로 사용하는 언어와 대화의 주제 정보로 구성된 데이터베이스 및 현재 진행되고 있는 대화 내용을 저장하여 그 대화의 문맥 정보를 판단하기 위한 데이터베이스를 포함하는 메모리;를 더 포함하여 구성되는 것을 특징으로 하는 이동 단말기.