KR20140139982A

KR20140139982A - 전자 장치의 음성인식을 수행하는 방법 및 이를 사용하는 전자 장치

Info

Publication number: KR20140139982A
Application number: KR1020140063805A
Authority: KR
Inventors: 이상훈; 김경태; 체크라달 서브호지트; 이태진; 정석영
Original assignee: 삼성전자주식회사
Priority date: 2013-05-28
Filing date: 2014-05-27
Publication date: 2014-12-08

Abstract

전자 장치에서 음성 명령 기능을 실행하는 방법에 있어서, 사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함할 수 있다.

Description

전자 장치의 음성인식을 수행하는 방법 및 이를 사용하는 전자 장치{Method for executing voice recognition and Electronic device using the same}

본 명세서에 개시된 다양한 실시예들은 전자 장치의 음성인식을 수행하는 방법 및 이를 사용하는 전자 장치에 관한 것이다.

전자 장치는 스마트폰(Smart Phone)과 같은 휴대 단말기의 형태로 진화하면서 다양한 기능을 제공하는 애플리케이션들을 통해 사용자에게 여러 가지 유용한 기능을 제공하고 있다.

전자 장치에서 제공하는 다양한 기능들 중에는 음성 명령 기능이 있다. 음성 명령 기능을 이용하면 전자장치의 다양한 애플리케이션을 보다 편리하게 실행할 수 있고, 애플리케이션들에서 제공하는 동작들을 제어할 수 있다.

한편, 전자 장치의 사용자는 키, 버튼 또는 터치패널 등의 별도의 입력 장치를 통해 음성 명령 기능을 활성화 시키는 불편함이 존재할 수 있다.

본 명세서에 개시된 다양한 실시예들은 키, 버튼 또는 터치패널 등의 별도의 입력 장치가 아닌 사용자의 음성을 인식하여 음성 명령 기능을 활성화 시킬 수 있다. 또한, 적어도 둘 이상의 프로세서를 이용하여 음성 명령 기능을 활성화시키는 프로세서 및 사용자의 명령에 대응하여 애플리케이션을 실행하는 프로세서를 구분하여 전력 절감을 도모할 수 있다. 추가적으로, 화자 종속 음성 인식을 통해 기 저장된 사용자만 음성 명령 기능을 활성화 시킬 수 있으므로 전자 장치의 보안을 강화할 수 있다.

본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자 장치에서 음성 명령 기능을 실행하는 방법은, 사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함할 수 있다.

본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자 장치는, 사용자의 음성을 감지하는 음성 입력 모듈; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하고, 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 제1 프로세서; 및 상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 음성 명령 기능을 활성화 하고, 상기 사용자의 음성 명령을 입력 받고, 상기 음성 명령에 대응하는 애플리케이션을 실행하는 제2 프로세서를 포함할 수 있다.

본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 명령들을 저장하고 있는 기계로 판독 가능한 저장 장치는, 상기 명령들은 적어도 하나의 프로세서에 의하여 실행될 경우, 상기 적어도 하나의 프로세서로 하여금 적어도 하나의 동작을 수행하도록 설정된 것으로서, 상기 적어도 하나의 동작은, 사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함할 수 있다.

본 발명의 다양한 실시예에 따른 전자 장치에 의하면 예컨대, 전자 장치의 음성 명령 기능을 보다 효과적으로 수행할 수 있다.

도 1은 본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자장치를 포함하는 네트워크 환경에 관한 도면,
도 2는 본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자 장치에 관한 블록도,
도 3은 본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 프로그래밍 모듈에 관한 도면,
도 4는 본 명세서에 개시된 다양한 실시예에 따른 음성 인식 시스템의 구성에 관한 도면,
도 5는 본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자 장치에서 음성을 입력하여 애플리케이션을 실행하는 방법에 관한 흐름도,
도 6은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 인식 모델을 생성하는 방법에 관한 흐름도,
도 7은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 주변 환경을 고려하여 음성을 감지하는 방법에 관한 흐름도,
도 8은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 음성 정보 생성 및 이를 검증하는 방법에 관한 흐름도이다.

이하, 첨부된 도면을 참조하여 본 개시(present disclosure)를 설명한다. 본 개시는 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들이 도면에 예시되고 관련된 상세한 설명이 기재되어 있다. 그러나, 이는 본 개시를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 사상 및 기술 범위에 포함되는 모든 변경 및/또는 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조부호가 사용되었다.

본 개시 가운데 사용될 수 있는“포함한다,”“포함할 수 있다” 등의 표현은 개시된 해당 기능, 동작, 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작, 구성요소 등을 제한하지 않는다. 또한, 본 개시에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한 본 개시에서 “및/또는” 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, A 및/또는 B는, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.

또한 본 개시 가운데 “제 1,” “제2,” “첫째,” “둘째”등의 표현들이 본 개시의 다양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분 짓기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제 2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 개시의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.

본 개시에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 개시를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 개시에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

본 발명의 다양한 실시예에 따른 전자 장치는, 스마트 폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 화상전화기, 전자북 리더기(e-book reader), 데스크탑 PC(desktop personal computer), 랩탑 PC(laptop personal computer), 넷북 컴퓨터(netbook computer), PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라(camera), 또는 웨어러블 장치(wearable device)(예: 전자 안경과 같은 head-mounted-device(HMD), 전자 의복, 전자 팔찌, 전자 목걸이, 전자 앱세서리(appcessory), 전자 문신, 또는 스마트 와치(smart watch))중 적어도 하나를 포함할 수 있다.

어떤 실시예들에 따르면, 전자 장치는 스마트 가전 제품(smart home appliance)일 수 있다. 스마트 가전 제품은, 예를 들자면, 전자 장치는 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), TV 박스(예를 들면, 삼성 HomeSync^TM, 애플TV^TM, 또는 구글 TV^TM), 게임 콘솔(game consoles), 전자 사전, 전자 키, 캠코더(camcorder), 또는 전자 액자 중 적어도 하나를 포함할 수 있다.

어떤 실시예들에 따르면, 전자 장치는 각종 의료기기(예: MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 초음파기 등), 네비게이션(navigation) 장치, GPS 수신기(global positioning system receiver), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트(infotainment) 장치, 선박용 전자 장비(예: 선박용 항법 장치 및 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛, 산업용 또는 가정용 로봇, 금융 기관의 ATM(automatic teller? machine) 또는 상점의 POS(point of sales) 중 적어도 하나를 포함할 수 있다.

어떤 실시예들에 따르면, 전자 장치는 가구(furniture) 또는 건물/구조물의 일부, 전자 보드(electronic board), 전자 사인 입력장치(electronic signature receiving device), 프로젝터(projector), 또는 각종 계측기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 본 발명의 다양한 실시예에 따른 전자 장치는 전술한 다양한 장치들 중 하나 또는 그 이상의 조합일 수 있다. 또한, 본 개세에 따른 전자 장치는 플렉서블 장치일 수 있다. 또한, 본 발명의 다양한 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않음은 당업자에게 자명하다.

이하, 첨부된 도면을 참조하여 다양한 실시예에 따른 전자 장치에 대해서 살펴본다. 다양한 실시예에서 이용되는 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.

도 1은 다양한 실시예에 따른, 전자 장치(101)를 포함하는 네트워크 환경(100)를 도시한다. 도 1을 참조하면, 상기 전자 장치(101)는 버스(110), 프로세서(120), 메모리(130), 입출력 인터페이스(140), 디스플레이(150), 통신 인터페이스(160) 및 어플리케이션 제어 모듈(170)을 포함할 수 있다.

상기 버스(110)는 전술한 구성요소들을 서로 연결하고, 전술한 구성요소들 간의 통신(예: 제어 메시지)을 전달하는 회로일 수 있다.

상기 프로세서(120)는, 예를 들면, 상기 버스(110)를 통해 전술한 다른 구성요소들(예: 상기 메모리(130), 상기 입출력 인터페이스(140), 상기 디스플레이(150), 상기 통신 인터페이스(160), 또는 상기 어플리케이션 제어 모듈(170) 등)로부터 명령을 수신하여, 수신된 명령을 해독하고, 해독된 명령에 따른 연산이나 데이터 처리를 실행할 수 있다.

상기 메모리(130)는, 상기 프로세서(120) 또는 다른 구성요소들(예: 상기 입출력 인터페이스(140), 상기 디스플레이(150), 상기 통신 인터페이스(160), 또는 상기 어플리케이션 제어 모듈(170) 등)로부터 수신되거나 상기 프로세서(120) 또는 다른 구성요소들에 의해 생성된 명령 또는 데이터를 저장할 수 있다. 상기 메모리(130)는, 예를 들면, 커널(131), 미들웨어(132), 어플리케이션 프로그래밍 인터페이스(API: application programming interface) (133) 또는 어플리케이션 (134) 등의 프로그래밍 모듈들을 포함할 수 있다. 전술한 각각의 프로그래밍 모듈들은 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구성될 수 있다.

상기 커널(131)은 나머지 다른 프로그래밍 모듈들, 예를 들면, 상기 미들웨어(132), 상기 API(133) 또는 상기 어플리케이션(134)에 구현된 동작 또는 기능을 실행하는 데 사용되는 시스템 리소스들(예: 상기 버스(110), 상기 프로세서(120) 또는 상기 메모리(130) 등)을 제어 또는 관리할 수 있다. 또한, 상기 커널(131)은 상기 미들웨어(132), 상기 API(133) 또는 상기 어플리케이션(134)에서 상기 전자 장치(101)의 개별 구성요소에 접근하여 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.

상기 미들웨어(132)는 상기 API(133) 또는 상기 어플리케이션(134)이 상기 커널(131)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다. 또한, 상기 미들웨어(132)는 상기 어플리케이션(134)로부터 수신된 작업 요청들과 관련하여, 예를 들면, 상기 어플리케이션(134) 중 적어도 하나의 어플리케이션에 상기 전자 장치(101)의 시스템 리소스(예: 상기 버스(110), 상기 프로세서(120) 또는 상기 메모리(130) 등)를 사용할 수 있는 우선 순위를 배정하는 등의 방법을 이용하여 작업 요청에 대한 제어(예: 스케줄링 또는 로드 밸런싱)을 수행할 수 있다.

상기 API(133)는 상기 어플리케이션(134)이 상기 커널(131) 또는 상기 미들웨어(132)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일 제어, 창 제어, 화상 처리 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(예: 명령어)를 포함할 수 있다.

다양한 실시예에 따르면, 상기 어플리케이션(134)는 SMS/MMS 어플리케이션, 이메일 어플리케이션, 달력 어플리케이션, 알람 어플리케이션, 건강 관리(health care) 어플리케이션(예: 운동량 또는 혈당 등을 측정하는 어플리케이션) 또는 환경 정보 어플리케이션(예: 기압, 습도 또는 온도 정보 등을 제공하는 어플리케이션) 등을 포함할 수 있다. 추가적으로 또는 대체적으로, 상기 어플리케이션(134)은 상기 전자 장치(101)와 외부 전자 장치(예: 전자 장치 104) 사이의 정보 교환과 관련된 어플리케이션일 수 있다. 상기 정보 교환과 관련된 어플리케이션은, 예를 들어, 상기 외부 전자 장치에 특정 정보를 전달하기 위한 알림 전달(notification relay) 어플리케이션, 또는 상기 외부 전자 장치를 관리하기 위한 장치 관리(device management) 어플리케이션을 포함할 수 있다.

예를 들면, 상기 알림 전달 어플리케이션은 상기 전자 장치(101) 의 다른 어플리케이션(예: SMS/MMS 어플리케이션, 이메일 어플리케이션, 건강 관리 어플리케이션 또는 환경 정보 어플리케이션 등)에서 발생한 알림 정보를 외부 전자 장치(예: 전자 장치(104))로 전달하는 기능을 포함할 수 있다. 추가적으로 또는 대체적으로, 상기 알림 전달 어플리케이션은, 예를 들면, 외부 전자 장치(예: 전자 장치(104))로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다. 상기 장치 관리 어플리케이션은, 예를 들면, 상기 전자 장치(101)와 통신하는 외부 전자 장치(예: 전자 장치(104))의 적어도 일부에 대한 기능(예: 외부 전자 장치 자체(또는, 일부 구성 부품)의 턴온/턴오프 또는 디스플레이의 밝기(또는, 해상도) 조절), 상기 외부 전자 장치에서 동작하는 어플리케이션 또는 상기 외부 전자 장치에서 제공되는 서비스(예: 통화 서비스 또는 메시지 서비스)를 관리(예: 설치, 삭제 또는 업데이트)할 수 있다.

다양한 실시예에 따르면, 상기 어플리케이션(134)은 상기 외부 전자 장치(예: 전자 장치(104))의 속성(예: 전자 장치의 종류)에 따라 지정된 어플리케이션을 포함할 수 있다. 예를 들어, 외부 전자 장치가 MP3 플레이어인 경우, 상기 어플리케이션(134)은 음악 재생과 관련된 어플리케이션을 포함할 수 있다. 유사하게, 외부 전자 장치가 모바일 의료기기인 경우, 상기 어플리케이션(134)은 건강 관리와 관련된 어플리케이션을 포함할 수 있다. 한 실시예에 따르면, 상기 어플리케이션(134)은 전자 장치(101)에 지정된 어플리케이션 또는 외부 전자 장치(예: 서버(106) 또는 전자 장치(104))로부터 수신된 어플리케이션 중 적어도 하나를 포함할 수 있다.

상기 입출력 인터페이스(140)은, 입출력 장치(예: 센서, 키보드 또는 터치 스크린)를 통하여 사용자로부터 입력된 명령 또는 데이터를, 예를 들면, 상기 버스(110)를 통해 상기 프로세서(120), 상기 메모리(130), 상기 통신 인터페이스(160), 또는 상기 어플리케이션 제어 모듈(170)에 전달할 수 있다. 예를 들면, 상기 입출력 인터페이스(140)은 터치 스크린을 통하여 입력된 사용자의 터치에 대한 데이터를 상기 프로세서(120)로 제공할 수 있다. 또한, 상기 입출력 인터페이스(140)은, 예를 들면, 상기 버스(110)을 통해 상기 프로세서(120), 상기 메모리(130), 상기 통신 인터페이스(160), 또는 상기 어플리케이션 제어 모듈(170)로부터 수신된 명령 또는 데이터를 상기 입출력 장치(예: 스피커 또는 디스플레이)를 통하여 출력할 수 있다. 예를 들면, 상기 입출력 인터페이스(140)은 상기 프로세서(120)를 통하여 처리된 음성 데이터를 스피커를 통하여 사용자에게 출력할 수 있다.

상기 디스플레이(150)는 사용자에게 각종 정보(예: 멀티미디어 데이터 또는 텍스트 데이터 등)을 표시할 수 있다.

상기 통신 인터페이스(160)은 상기 전자 장치(101)와 외부 장치(예: 전자 장치 104 또는 서버 106) 간의 통신을 연결할 수 있다. 예를 들면, 상기 통신 인터페이스(160)은 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 상기 외부 장치와 통신할 수 있다. 상기 무선 통신은, 예를 들어, Wifi(wireless fidelity), BT(Bluetooth), NFC(near field communication), GPS(global positioning system) 또는 cellular 통신(예: LTE, LTE-A, CDMA, WCDMA, UMTS, WiBro 또는 GSM 등) 중 적어도 하나를 포함할 수 있다. 상기 유선 통신은, 예를 들어, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard 232) 또는 POTS(plain old telephone service) 중 적어도 하나를 포함할 수 있다.

일 실시예에 따르면, 상기 네트워크(162)는 통신 네트워크(telecommunications network)일 수 있다. 상기 통신 네트워크는 컴퓨터 네트워크(computer network), 인터넷(internet), 사물 인터넷(internet of things) 또는 전화망(telephone network) 중 적어도 하나를 포함할 수 있다. 한 실시예에 따르면, 상기 전자 장치(101)와 외부 장치 간의 통신을 위한 프로토콜(예: transport layer protocol, data link layer protocol 또는 physical layer protocol))은 어플리케이션(134), 어플리케이션 프로그래밍 인터페이스(133), 상기 미들웨어(132), 커널(131) 또는 통신 인터페이스(160) 중 적어도 하나에서 지원될 수 있다.

어플리케이션 제어 모듈(170)은, 다른 구성요소들(예: 상기 프로세서(120), 상기 메모리(130), 상기 입출력 인터페이스(140), 또는 상기 통신 인터페이스(160) 등)로부터 획득된 정보 중 적어도 일부를 처리하고, 이를 다양한 방법으로 사용자에게 제공할 수 있다. 예를 들면, 상기 어플리케이션 제어 모듈(170)은, 상기 전자 장치(101)에 구비된 접속 부품의 정보를 인식하고, 접속 부품의 정보를 상기 메모리(130)에 저장하고, 접속 부품의 정보에 기반하여, 어플리케이션(134)를 실행시킬 수 있다.

도 2는 본 명세서에 개시된 다양한 실시예들에 따른 전자 장치(200)의 블록도이다. 상기 전자 장치(200)는, 예를 들면, 도 1에 도시된 전자 장치(101)의 전체 또는 일부를 구성할 수 있다. 도 2를 참조하면, 상기 전자 장치(200)는 하나 이상의 어플리케이션 프로세서(AP: application processor)(210), 통신 모듈(220), SIM(subscriber identification module) 카드(226), 메모리(230), 센서 모듈(240), 입력 장치(250), 디스플레이 모듈(260), 인터페이스(270), 오디오 모듈(280), 카메라 모듈(291), 전력관리 모듈(295), 배터리(296), 인디케이터 (297) 및 모터 (298) 를 포함할 수 있다.

상기 AP(210)는 운영체제 또는 응용 프로그램을 구동하여 상기 AP(210)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 멀티미디어 데이터를 포함한 각종 데이터 처리 및 연산을 수행할 수 있다. 상기 AP(210)는, 예를 들면, SoC(system on chip)로 구현될 수 있다. 한 실시예에 따르면, 상기 AP(210)는 GPU(graphic processing unit, 미도시)를 더 포함할 수 있다.

상기 통신 모듈(220)(예: 상기 통신 인터페이스(160))은 상기 전자 장치(200)(예: 상기 전자 장치(101))와 네트워크를 통해 연결된 다른 전자 장치들(예: 전자 장치(104) 또는 서버(106)) 간의 통신에서 데이터 송수신을 수행할 수 있다. 한 실시예에 따르면, 상기 통신 모듈(220)은 셀룰러 모듈(221), Wifi 모듈(223), BT 모듈(225), GPS 모듈(227), NFC 모듈(228) 및 RF(radio frequency) 모듈(229)를 포함할 수 있다.

상기 셀룰러 모듈(221)은 통신망(예: LTE, LTE-A, CDMA, WCDMA, UMTS, WiBro 또는 GSM 등)을 통해서 음성 통화, 영상 통화, 문자 서비스 또는 인터넷 서비스 등을 제공할 수 있다. 또한, 상기 셀룰러 모듈(221)은, 예를 들면, 가입자 식별 모듈(예: SIM 카드 226)을 이용하여 통신 네트워크 내에서 전자 장치의 구별 및 인증을 수행할 수 있다. 한 실시예에 따르면, 상기 셀룰러 모듈(221)은 상기 AP(210)가 제공할 수 있는 기능 중 적어도 일부 기능을 수행할 수 있다. 예를 들면, 상기 셀룰러 모듈(221)은 멀티 미디어 제어 기능의 적어도 일부를 수행할 수 있다.

한 실시예에 따르면, 상기 셀룰러 모듈(221)은 커뮤니케이션 프로세서(CP: communication processor)를 포함할 수 있다. 또한, 상기 셀룰러 모듈(221)은, 예를 들면, SoC로 구현될 수 있다. 셀룰러 모듈(221)(예: 커뮤니케이션 프로세서), 상기 메모리(230) 또는 상기 전력관리 모듈(295) 등의 구성요소들이 상기 AP(210)와 별개의 구성요소로 도시되어 있으나, 한 실시예에 따르면, 상기 AP(210)가 전술한 구성요소들의 적어도 일부(예: 셀룰러 모듈(221))를 포함하도록 구현될 수 있다.

한 실시예에 따르면, 상기 AP(210) 또는 상기 셀룰러 모듈(221)(예: 커뮤니케이션 프로세서)은 각각에 연결된 비휘발성 메모리 또는 다른 구성요소 중 적어도 하나로부터 수신한 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리할 수 있다. 또한, 상기 AP(210) 또는 상기 셀룰러 모듈(221)은 다른 구성요소 중 적어도 하나로부터 수신하거나 다른 구성요소 중 적어도 하나에 의해 생성된 데이터를 비휘발성 메모리에 저장(store)할 수 있다.

상기 Wifi 모듈(223), 상기 BT 모듈(225), 상기 GPS 모듈(227) 또는 상기 NFC 모듈(228) 각각은, 예를 들면, 해당하는 모듈을 통해서 송수신되는 데이터를 처리하기 위한 프로세서를 포함할 수 있다. 셀룰러 모듈(221), Wifi 모듈(223), BT 모듈(225), GPS 모듈(227) 또는 NFC 모듈(228)이 각각 별개의 블록으로 도시되었으나, 한 실시예에 따르면, 셀룰러 모듈(221), Wifi 모듈(223), BT 모듈 (225), GPS 모듈(227) 또는 NFC 모듈(228) 중 적어도 일부(예: 두 개 이상)는 하나의 integrated chip(IC) 또는 IC 패키지 내에 포함될 수 있다. 예를 들면, 셀룰러 모듈(221), Wifi 모듈(223), BT 모듈(225), GPS 모듈(227) 또는 NFC 모듈 (228) 각각에 대응하는 프로세서들 중 적어도 일부(예: 셀룰러 모듈(221)에 대응하는 커뮤니케이션 프로세서 및 Wifi 모듈(223)에 대응하는 Wifi 프로세서)는 하나의 SoC로 구현될 수 있다.

상기 RF 모듈(229)는 데이터의 송수신, 예를 들면, RF 신호의 송수신을 할 수 있다. 상기 RF 모듈(229)는, 도시되지는 않았으나, 예를 들면, 트랜시버(transceiver), PAM(power amp module), 주파수 필터(frequency filter) 또는 LNA(low noise amplifier) 등을 포함할 수 있다. 또한, 상기 RF 모듈(229)는 무선 통신에서 자유 공간상의 전자파를 송수신하기 위한 부품, 예를 들면, 도체 또는 도선 등을 더 포함할 수 있다. 셀룰러 모듈(221), Wifi 모듈 (223), BT 모듈(225), GPS 모듈(227) 및 NFC 모듈(228)이 하나의 RF 모듈(229)을 서로 공유하는 것으로 도시되어 있으나, 한 실시예에 따르면, 셀룰러 모듈(221), Wifi 모듈(223), BT 모듈(225), GPS 모듈(227) 또는 NFC 모듈(228) 중 적어도 하나는 별개의 RF 모듈을 통하여 RF 신호의 송수신을 수행할 수 있다.

상기 SIM 카드 226_1~N는 가입자 식별 모듈을 포함하는 카드일 수 있으며, 전자 장치의 특정 위치에 형성된 슬롯 224_1~N에 삽입될 수 있다. 상기 SIM 카드 226_1~N는 고유한 식별 정보(예: ICCID(integrated circuit card identifier)) 또는 가입자 정보(예: IMSI(international mobile subscriber identity))를 포함할 수 있다.

상기 메모리(230)(예: 상기 메모리(130))는 내장 메모리(232) 또는 외장 메모리(234)를 포함할 수 있다. 상기 내장 메모리(232)는, 예를 들면, 휘발성 메모리(예를 들면, DRAM(dynamic RAM), SRAM(static RAM), SDRAM(synchronous dynamic RAM) 등) 또는 비휘발성 메모리(non-volatile Memory, 예를 들면, OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, NAND flash memory, NOR flash memory 등) 중 적어도 하나를 포함할 수 있다.

한 실시예에 따르면, 상기 내장 메모리(232)는 Solid State Drive (SSD)일 수 있다. 상기 외장 메모리(234)는 flash drive, 예를 들면, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital) 또는 Memory Stick 등을 더 포함할 수 있다. 상기 외장 메모리(234)는 다양한 인터페이스를 통하여 상기 전자 장치(200)과 기능적으로 연결될 수 있다. 한 실시예에 따르면, 상기 전자 장치(200)는 하드 드라이브와 같은 저장 장치(또는 저장 매체)를 더 포함할 수 있다.

상기 센서 모듈(240)은 물리량을 계측하거나 전자 장치(200)의 작동 상태를 감지하여, 계측 또는 감지된 정보를 전기 신호로 변환할 수 있다. 상기 센서 모듈(240)은, 예를 들면, 제스처 센서(240A), 자이로 센서(240B), 기압 센서(240C), 마그네틱 센서(240D), 가속도 센서(240E), 그립 센서(240F), 근접 센서(240G), color 센서(240H)(예: RGB(red, green, blue) 센서), 생체 센서 (240I), 온/습도 센서(240J), 조도 센서(240K) 또는 UV(ultra violet) 센서(240M) 중의 적어도 하나를 포함할 수 있다. 추가적으로 또는 대체적으로, 상기 센서 모듈(240)은, 예를 들면, 후각 센서(E-nose sensor, 미도시), EMG 센서(electromyography sensor, 미도시), EEG 센서(electroencephalogram sensor, 미도시), ECG 센서(electrocardiogram sensor, 미도시), IR(infra red) 센서(미도시), 홍채 센서(미도시) 또는 지문 센서(미도시) 등을 포함할 수 있다. 상기 센서 모듈(240)은 그 안에 속한 적어도 하나 이상의 센서들을 제어하기 위한 제어 회로를 더 포함할 수 있다.

상기 입력 장치(250)은 터치 패널(touch panel) (252), (디지털) 펜 센서(pen sensor)(254), 키(key)(256) 또는 초음파(ultrasonic) 입력 장치(258)를 포함할 수 있다. 상기 터치 패널(252)은, 예를 들면, 정전식, 감압식, 적외선 방식, 전자기유도 방식 또는 초음파 방식 중 적어도 하나의 방식으로 터치 입력을 인식할 수 있다. 또한, 상기 터치 패널(252)은 제어 회로를 더 포함할 수도 있다. 정전식 또는 전자기 유도 방식의 경우, 물리적 접촉 입력 또는 근접 입력이 가능하다. 상기 터치 패널(252)은 택타일 레이어(tactile layer)를 더 포함할 수도 있다. 이 경우, 상기 터치 패널 (252)은 사용자에게 촉각 반응을 제공할 수 있다.

상기 (디지털) 펜 센서(254)는, 예를 들면, 사용자의 터치 입력을 받는 것과 동일 또는 유사한 방법 또는 별도의 인식용 쉬트(sheet)를 이용하여 구현될 수 있다. 상기 키(256)는, 예를 들면, 물리적인 버튼, 광학식 키 또는 키패드를 포함할 수 있다. 상기 초음파(ultrasonic) 입력 장치(258)는 초음파 신호를 발생하는 입력 도구를 통해, 전자 장치(200)에서 마이크(예: 마이크(288))로 음파를 감지하여 데이터를 확인할 수 있는 장치로서, 무선 인식이 가능하다. 한 실시예에 따르면, 상기 전자 장치(200)는 상기 통신 모듈(220)를 이용하여 이와 연결된 외부 장치(예: 컴퓨터 또는 서버)로부터 사용자 입력을 수신할 수도 있다.

상기 디스플레이 모듈(260)(예: 상기 디스플레이(150))는 패널(262), 홀로그램 장치(264) 또는 프로젝터(266)을 포함할 수 있다. 상기 패널(262)은, 예를 들면, LCD(liquid-crystal display) 또는 AM-OLED(active-matrix organic light-emitting diode) 등일 수 있다. 상기 패널(262)은, 예를 들면, 유연하게(flexible), 투명하게(transparent) 또는 착용할 수 있게(wearable) 구현될 수 있다. 상기 패널(262)은 상기 터치 패널 (252)과 하나의 모듈로 구성될 수도 있다. 상기 홀로그램 장치(264)은 빛의 간섭을 이용하여 입체 영상을 허공에 보여줄 수 있다. 상기 프로젝터(266)는 스크린에 빛을 투사하여 영상을 표시할 수 있다. 상기 스크린은, 예를 들면, 상기 전자 장치(200)의 내부 또는 외부에 위치할 수 있다. 한 실시예에 따르면, 상기 디스플레이 모듈(260)는 상기 패널(262), 상기 홀로그램 장치(264), 또는 프로젝터(266)를 제어하기 위한 제어 회로를 더 포함할 수 있다.

상기 인터페이스(270)는, 예를 들면, HDMI(high-definition multimedia interface)(272), USB(universal serial bus)(274), 광 인터페이스(optical interface)(276) 또는 D-sub(D-subminiature)(278)를 포함할 수 있다. 상기 인터페이스(270)는, 예를 들면, 도 1에 도시된 통신 인터페이스(160)에 포함될 수 있다. 추가적으로 또는 대체적으로, 상기 인터페이스(270)는, 예를 들면, MHL(mobile high-definition link) 인터페이스, SD(secure Digital) 카드/MMC(multi-media card) 인터페이스 또는 IrDA(infrared data association) 규격 인터페이스를 포함할 수 있다.

상기 오디오 모듈(280)은 소리(sound)와 전기신호를 쌍방향으로 변환시킬 수 있다. 상기 오디오 모듈(280)의 적어도 일부 구성요소는, 예를 들면, 도 1 에 도시된 입출력 인터페이스(140)에 포함될 수 있다. 상기 오디오 모듈(280)은, 예를 들면, 스피커(282), 리시버(284), 이어폰(286) 또는 마이크(288) 등을 통해 입력 또는 출력되는 소리 정보를 처리할 수 있다.

상기 카메라 모듈(291)은 정지 영상 및 동영상을 촬영할 수 있는 장치로서, 한 실시예에 따르면, 하나 이상의 이미지 센서(예: 전면 센서 또는 후면 센서), 렌즈(미도시), ISP(image signal processor, 미도시) 또는 플래쉬 (flash, 미도시)(예: LED 또는 xenon lamp)를 포함할 수 있다.

상기 전력 관리 모듈(295)은 상기 전자 장치(200)의 전력을 관리할 수 있다. 도시하지는 않았으나, 상기 전력 관리 모듈(295)은, 예를 들면, PMIC(power management integrated circuit), 충전 IC(charger integrated circuit) 또는 배터리 또는 연료 게이지(battery or fuel gauge)를 포함할 수 있다.

상기 PMIC는, 예를 들면, 집적회로 또는 SoC 반도체 내에 탑재될 수 있다. 충전 방식은 유선과 무선으로 구분될 수 있다. 상기 충전 IC는 배터리를 충전시킬 수 있으며, 충전기로부터의 과전압 또는 과전류 유입을 방지할 수 있다. 한 실시예에 따르면, 상기 충전 IC는 유선 충전 방식 또는 무선 충전 방식 중 적어도 하나를 위한 충전 IC를 포함할 수 있다. 무선 충전 방식으로는, 예를 들면, 자기공명 방식, 자기유도 방식 또는 전자기파 방식 등이 있으며, 무선 충전을 위한 부가적인 회로, 예를 들면, 코일 루프, 공진 회로 또는 정류기 등의 회로가 추가될 수 있다.

상기 배터리 게이지는, 예를 들면, 상기 배터리(296)의 잔량, 충전 중 전압, 전류 또는 온도를 측정할 수 있다. 상기 배터리(296)는 전기를 저장 또는 생성할 수 있고, 그 저장 또는 생성된 전기를 이용하여 상기 전자 장치(200)에 전원을 공급할 수 있다. 상기 배터리(296)는, 예를 들면, 충전식 전지(rechargeable battery) 또는 태양 전지(solar battery)를 포함할 수 있다.

상기 인디케이터(297)는 상기 전자 장치(200) 혹은 그 일부(예: 상기 AP(210))의 특정 상태, 예를 들면, 부팅 상태, 메시지 상태 또는 충전 상태 등을 표시할 수 있다. 상기 모터(298)는 전기적 신호를 기계적 진동으로 변환할 수 있다. 도시되지는 않았으나, 상기 전자 장치(200)는 모바일 TV 지원을 위한 처리 장치(예: GPU)를 포함할 수 있다. 상기 모바일 TV지원을 위한 처리 장치는, 예를 들면, DMB(digital multimedia broadcasting), DVB(digital video broadcasting) 또는 미디어 플로우(media flow) 등의 규격에 따른 미디어 데이터를 처리할 수 있다.

본 발명의 다양한 실시예에 따른 전자 장치의 전술한 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성 요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 본 발명의 다양한 실시예에 따른 전자 장치는 전술한 구성요소 중 적어도 하나를 포함하여 구성될 수 있으며, 일부 구성요소가 생략되거나 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 또한, 본 발명의 다양한 실시예에 따른 전자 장치의 구성 요소들 중 일부가 결합되어 하나의 개체(entity)로 구성됨으로써, 결합되기 이전의 해당 구성 요소들의 기능을 동일하게 수행할 수 있다.

본 발명의 다양한 실시예에 사용된 용어 "모듈"은, 예를 들어, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "모듈"은 예를 들어, 유닛(unit), 로직(logic), 논리 블록(logical block), 부품(component) 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "모듈"은, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들면, 본 발명의 다양한 실시예에 따른 "모듈"은, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.

도 3은 본 명세서에 개시된 다양한 실시예에 따른 프로그래밍 모듈(300)에 관한 도면이다.

상기 프로그래밍 모듈(300)은 도 1에 도시된 전자 장치(101)에 포함될 수 있다. 상기 프로그래밍 모듈(300)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구성될 수 있다.

일 실시예에 따른 상기 프로그래밍 모듈(300)는 커널(310), 미들웨어(330), API(application programming interface, 360) 및/또는 어플리케이션(370)을 포함할 수 있다.

상기 커널(310)(예: 상기 커널(131))은, 예를 들면, 시스템 리소스 매니저(311) 및/또는 디바이스 드라이버(312)을 포함할 수 있다.

상기 미들웨어(330)(예: 상기 미들웨어(132))는, 예를 들면, 런타임 라이브러리(335), 어플리케이션 매니저(application manager, 341), 윈도우 매니저(window manager, 342), 멀티미디어 매니저(multimedia manager, 343), 리소스 매니저(resource manager, 344), 파워 매니저(power manager, 345), 데이터베이스 매니저(database manager, 346), 패키지 매니저(347), 연결 매니저(connectivity manager, 348), 통지 매니저(notification manager, 349), 위치 매니저(location manager, 350), 그래픽 매니저(graphic manager, 351) 및/또는 보안 매니저(security manager, 352) 중 적어도 하나를 포함할 수 있다.

상기 프로그래밍 모듈(300)는 하드웨어(예: 상기 하드웨어 (200))에 구현되어 전자 장치(예: 상기 전자 장치 (101))에 관련된 자원을 제어하는 운영체제(OS: operation system) 또는 운영체제 상에서 구동되는 다양한 어플리케이션(예: 상기 어플리케이션 (370))을 포함할 수 있다. 상기 운영체제는, 예를 들면, 안드로이드(Android), iOS, 윈도우즈(Windows), 심비안(Symbian), 타이젠(Tizen) 또는 바다(Bada) 등이 될 수 있다.

상기 시스템 리소스 매니저(311)는, 예를 들면, 프로세스관리부(313), 메모리관리부(315) 및/또는 파일시스템관리부(317) 등을 포함할 수 있다. 상기 시스템 리소스 매니저(311)는 시스템 리소스의 제어, 할당 또는 회수 등을 수행할 수 있다.

상기 디바이스 드라이버(312)는, 예를 들면, 디스플레이 드라이버(314), 카메라 드라이버(316), 블루투스 드라이버(318), 공유 메모리 드라이버(320), USB 드라이버(322), 키패드 드라이버(324), WiFi 드라이버(326) 및/또는 오디오 드라이버(328)를 포함할 수 있다. 또한, 구현 예에 따라서, 상기 디바이스 드라이버(312)는, 예를 들면, IPC (inter-process communication, 미도시) 드라이버를 포함할 수 있다.

상기 미들웨어(330)는, 예를 들면, 상기 어플리케이션(370)이 공통적으로 필요로 하는 기능을 제공하기 위해 미리 구현해 놓은 복수의 모듈들을 포함할 수 있다. 또한, 상기 미들웨어(330)는 상기 어플리케이션(370)이 전자 장치 내부의 제한된 시스템 자원을 효율적으로 사용할 수 있도록 상기 API(360)를 통해 기능을 제공할 수 있다.

상기 런타임 라이브러리(335)는, 상기 어플리케이션(370)이 실행되는 동안에 프로그래밍 언어를 통해 새로운 기능을 추가하기 위해 컴파일러가 사용하는 라이브러리 모듈을 포함할 수 있다. 예를 들면, 상기 런타임 라이브러리(335)는 입출력, 메모리 관리 또는 산술 함수에 대한 기능 등을 수행할 수 있다.

상기 어플리케이션 매니저(341)는, 상기 어플리케이션(370)중 적어도 하나의 어플리케이션의 생명주기(life cycle)를 관리할 수 있다. 상기 윈도우 매니저(342)는 화면에서 사용하는 GUI 자원을 관리할 수 있다. 상기 멀티미디어 매니저(343)는 다양한 미디어 파일들의 재생에 필요한 포맷을 파악하고, 해당 포맷에 맞는 코덱(codec)을 이용하여 미디어 파일의 인코딩(encoding) 또는 디코딩(decoding)을 수행할 수 있다. 상기 리소스 매니저 (344)는 상기 어플리케이션(370)중 적어도 어느 하나의 어플리케이션의 소스 코드, 메모리 또는 저장 공간 등의 자원을 관리할 수 있다.

상기 파워 매니저(345)는 바이오스(BIOS: basic input/output system) 등과 함께 동작하여 배터리(battery) 또는 전원을 관리하고, 동작에 필요한 전력 정보 등을 제공할 수 있다. 상기 데이터베이스 매니저(346)는 상기 어플리케이션(370) 중 적어도 하나의 어플리케이션에서 사용할 데이터베이스를 생성, 검색 또는 변경할 수 있도록 관리할 수 있다. 상기 패키지 매니저(347)는 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 업데이트를 관리할 수 있다.

상기 연결 매니저(348)는, 예를 들면, WiFi 또는 블루투스 등의 무선 연결을 관리할 수 있다. 상기 통지 매니저(349)는 도착 메시지, 약속, 근접성 알림 등의 사건(event)을 사용자에게 방해되지 않는 방식으로 표시 또는 통지할 수 있다. 상기 위치 매니저(350)는 전자 장치의 위치 정보를 관리할 수 있다. 상기 그래픽 매니저(351)는 사용자에게 제공될 그래픽 효과 및/또는 이와 관련된 사용자 인터페이스를 관리할 수 있다. 상기 보안 매니저(352)는 시스템 보안 또는 사용자 인증 등에 필요한 제반 보안 기능을 제공할 수 있다.

전자 장치(예: 상기 전자 장치 (101))가 전화 기능을 구비한 경우에는, 상기 미들웨어(330)는 상기 전자 장치의 음성 또는 영상 통화 기능을 관리하기 위한 통화 매니저(telephony manager, 미도시)를 더 포함할 수 있다.

상기 미들웨어(350)는 전술한 내부 구성요소 모듈들의 다양한 기능 조합을 통해 새로운 미들웨어 모듈을 생성하여 사용할 수 있다. 상기 미들웨어(350)는 차별화된 기능을 제공하기 위해 운영체제의 종류별로 특화된 모듈을 제공할 수 있다. 또한, 상기 미들웨어(350)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다. 따라서, 본 개시의 실시예에 기재된 구성요소를 일부 생략하거나 다른 구성요소를 더 구비하거나, 또는 유사한 기능을 수행하는 다른 명칭을 갖는 구성요소로 대체할 수 있다.

상기 API(360)(예: 상기 API 133)는, API 프로그래밍 함수들의 집합으로, 운영체제에 따라 다른 구성으로 제공될 수 있다. 예를 들면, 안드로이드 또는 iOS의 경우, 예를 들면, 플랫폼 별로 하나의 API 셋을 제공할 수 있으며, 타이젠(Tizen)의 경우, 예를 들면, 두 개 이상의 API 셋을 제공할 수 있다.

상기 어플리케이션(370)(예: 상기 어플리케이션(134))은, 예를 들면, 프리로디드 어플리케이션(preloaded application) 또는 제 삼자 어플리케이션(third party application)을 포함할 수 있다.

상기 프로그래밍 모듈(300)의 적어도 일부는 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어는, 하나 이상의 프로세서 (예를 들어, 어플리케이션 프로세서(AP, 210))에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행 할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들어 상기 메모리(230)가 될 수 있다.

또한, 상기 프로그래밍 모듈(300)의 적어도 일부는, 예를 들어 상기 어플리케이션 프로세서(210)에 구현(implement)될 수 있다.

또한, 상기 프로그래밍 모듈(300)의 적어도 일부는, 하나 이상의 기능을 수행하기 위한, 예를 들어 모듈, 프로그램, 루틴, 명령어 세트 (sets of instructions) 및 프로세스 등을 포함할 수 있다.

본 개시에 따른 프로그래밍 모듈의 전술한 구성요소들의 명칭은 운영체제의 종류에 따라서 달라질 수 있다. 또한, 본 개시에 따른 프로그래밍 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다.

도 4는 본 명세서에 개시된 다양한 실시예에 따른 음성 인식 시스템의 구성에 관한 도면이다.

도 4를 참조하면, 음성 인식 시스템(400)은 음성 정보 생성 모듈(410), 제1 프로세서(420), 제2 프로세서(430) 및 음성 인식 모듈(440)을 포함할 수 있다.

전자 장치(101, 200)는 음성 인식 시스템(400)을 이용하여 사용자로부터 음성을 입력 받고, 이를 기반으로 사용자가 실행하고자 하는 애플리케이션(134, 370)을 실행할 수 있다.

음성 정보 생성 모듈(410)은 사용자로부터 음성을 입력 받고, 이를 기반으로 음성 정보를 생성할 수 있다.

음성 정보 생성 모듈(410)은 음성 입력 모듈(412), 주변 환경 정보 측정 모듈(414) 및 전처리 모듈(416)을 포함할 수 있다.

전자 장치(101, 200)는 음성 입력 모듈(412)을 이용하여 사용자의 음성을 수집할 수 있다. 예를 들어, 전자 장치(101, 200)는 마이크(288)를 이용하여 사용자의 음성을 수집할 수 있다.

주변 환경 정보 측정 모듈(414)는 음성 입력 모듈(412)을 이용하여 전자 장치(101, 200)의 주변 환경 정보를 측정할 수 있다. 예를 들어, 전자 장치(101, 200)는 마이크(288)를 이용하여 주변 환경의 잡음 상황을 측정할 수 있다. 이를 통해, 사용자가 발화하기 좋은 환경인지 아닌지를 사용자에게 알려줄 수 있다. 구체적으로, 주변 환경 정보 측정 모듈(414)는 음성 입력 모듈(412)을 통해 잡음 레벨 정보를 측정할 수 있고, 잡음 레벨 정보에 따라 사용자에게 보다 조용한 환경에서 시도할 것을 제안할 수 있다.

전처리 모듈(416)은 음성 입력 모듈(412)을 통해 유입되는 소리를 변형 또는 정제화할 수 있다. 전처리 모듈(416)은 전처리(preprocessing)를 통해 보다 정확한 음성 정보를 생성할 수 있고, 이를 기반으로 보다 정확한 인식 모델(442)을 생성할 수 있다. 전처리 모듈(416)은, 예를 들어, 잔향 제거(Echo Cancellation), 잡음 제거(Noise Reduction), 음성 검출(Voice Activity Detection), 끝점 검출 (End-Point Detection) 또는 자동 이득 제어(Automatic gain controller) 등을 수행하여 유입된 소리를 전처리할 수 있다. 이러한 전처리 동작은 음성이 유입됨과 동시에 수행될 수 있고, 또한 음성이 유입된 후에 수행될 수 있다.

제1 프로세서(420)는 저전력 동작이 가능한 프로세서로 전자 장치(101, 200)의 특정 기능 또는 애플리케이션을 수행할 수 있다.

제1 프로세서(420)는 사용자가 직접 키워드를 지정하여 화자 종속 음성 인증을 수행할 수 있다. 예를 들어, 제1 프로세서(420)는 전자 장치(101, 200)의 메모리(230)에 기 저장된 인식 모델(442)을 입력된 음성과 비교하여 음성 인증을 수행할 수 있다.

한편, 제1 프로세서(420)에서 수행되는 음성 인증은 인식할 음성의 특징을 반영하는 정보와 입력된 사용자 음성을 비교하는 동작을 포함한다. 이 때 사용되는 인식할 음성의 특징을 반영하는 정보를 통틀어 인식 모델(recognition model, 442)이라고 정의할 수 있다. 인식 모델(442)은 은닉 마르코프 모델(HMM; Hidden Markov Model), 신경 망(Neural network) 등과 같은 통계 모델로 표현될 수도 있으며, 동적 시간 신축(DTW; Dynamic Time Warping), 벡터 양자화(VQ; Vector Quantization)와 같은 인식 알고리즘이 사용될 경우 음성신호의 특징 벡터열로 표현될 수 있다. 인식과정에 차원 축소(Dimensionality Reduction)나 선형 변환(Linear Transformation)과 같은 변환방법이 적용될 경우 변환에 사용되는 파라미터(parameter)가 모델정보가 될 수 있다. 나열된 인식 모델 외에도 다양한 인식 모델이 있을 수 있으며, 이들은 공통적으로 인식할 음성을 대표할 수 있는 정보의 구성으로 이루어진다. 또한, 인식 모델(442)은 입력된 음성의 속성 정보를 포함할 수 있다. 예를 들어, 속성 정보는 입력된 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함할 수 있다.

제1 프로세서(420)는 입력된 음성의 속성 정보를 기 저장된 인식 모델(442)의 속성 정보와 비교할 수 있다. 제1 프로세서(420)는, 속성 정보가 일치하는 경우, 입력된 음성이 기 저장된 사용자의 음성임을 인증할 수 있다.

제1 프로세서(420)는 입력된 음성이 기 저장된 사용자의 음성으로 확인되면, 제2 프로세서(430)를 활성화 시키는 웨이크 업(wake up) 신호를 전달할 수 있다. 제1 프로세서(420)는 웨이크 업 신호를 이용하여 제2 프로세서(430)를 비활성화 모드(sleep mode)에서 활성화 모드(active mode)로 상태 변경시킬 수 있다. 이를 통해. 제2 프로세서(430)는 음성 명령 기능을 활성화할 수 있고, 입력된 음성에 대응하여 전자 장치의 특정 기능 또는 애플리케이션을 실행할 수 있다.

제2 프로세서(430)는 제1 프로세서(420)보다 더 많은 전력을 사용할 수 있으며, 더욱 복잡한 기능을 수행할 수 있다.

제2 프로세서(430)는 제1 프로세서(420)로부터 활성화 신호(wake up signal)를 전달 받을 수 있고, 이를 통해 인식 명령 기능을 활성화할 수 있다. 제2 프로세서(430)는 인식 명령 기능이 활성화되면 애플리케이션 실행 모듈(444)을 이용하여 전자 장치의 특정 기능 또는 애플리케이션을 실행할 수 있다.

일 실시예서, 제2 프로세서(430)는 제1 프로세서(420)에서 생성된 활성화 신호에 반응하여, 메모리(230)로부터 인식 모델 생성 모듈(444) 또는 애플리케이션 실행 모듈(446) 중 적어도 하나를 로드(load)하여, 인식 모델 생성 모듈(444) 또는 애플리케이션 실행 모듈(446) 중 적어도 하나를 실행할 수 있다.

일 실시예에서, 제2 프로세서(430)는 사용자로부터 음성 명령을 입력 받기 위해 인식 명령 기능이 활성화되었음을 알릴 수 있다. 예를 들어, “주인님 무엇을 도와드릴까요?”와 같은 문구를 전자 디스플레이 모듈(260)에 표시하거나, 스피커(282)를 통해 외부로 출력할 수 있다.

제2 프로세서(430)는 사용자의 음성 명령을 입력 받을 수 있고, 애플리케이션 실행 모듈(444)을 이용하여 전자 장치의 애플리케이션을 실행할 수 있다. 예를 들어, 사용자가 “지금 날씨가 어떠한가?”라고 입력하면 현재 날씨와 관련된 정보를 사용자에게 디스플레이 모듈(260) 및/또는 스피커(282)를 통해 출력할 수 있다.

음성 인식 모듈(440)은 인식 모델(442), 인식 모델 생성 모듈(444) 및 애플리케이션 실행 모듈(446)을 포함할 수 있다.

인식 모델 생성 모듈(444)은 입력된 음성의 속성 정보를 기반으로 인식 모델(442)을 생성할 수 있다. 인식 모델 생성 모듈(444)은 사용자로부터 임의의 키워드를 음성으로 입력 받을 수 있고, 수집된 음성을 이용하여 인식 모델(442)을 생성할 수 있다. 한편, 인식 모델 생성 모듈(444)을 이용하여 인식 모델(442)을 생성하는 동작은 제1 프로세서(420) 또는 제2 프로세서(430)에서 수행될 수 있다. 생성된 인식 모델(442)은 제1 프로세서(420) 및 제2 프로세서(430)가 공유하고 있는 메모리(230)에 저장될 수 있고, 제1 프로세서(420)에서 음성 인증이 수행될 때 활용될 수 있다.

애플리케이션 실행 모듈(446)은 사용자의 음성 명령을 분석하여 사용자가 실행하고자 하는 애플리케이션(134, 370)을 실행할 수 있다. 제1 프로세서(420)로부터 웨이크 업 신호가 발생하면, 제2 프로세서(430)의 인식 명령 기능이 활성화되므로, 애플리케이션 실행 모듈(446)은 사용자로부터 음성 명령을 입력 받아 전자 장치의 특정 기능 또는 애플리케이션을 실행할 수 있다. 한편, 애플리케이션 실행 모듈(446)을 이용하여 전자 장치의 특정 기능 또는 애플리케이션을 실행하는 동작은 제2 프로세서(430)에서 수행될 수 있다.

다양한 실시예에 따른 전자 장치는, 사용자의 음성을 감지하는 음성 입력 모듈; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하고, 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 제1 프로세서; 및 상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 음성 명령 기능을 활성화 하고, 상기 사용자의 음성 명령을 입력 받고, 상기 음성 명령에 대응하는 애플리케이션을 실행하는 제2 프로세서를 포함할 수 있다.

상기 제1 프로세서는, 상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 활성화 신호(wake up signal)를 발생시키고, 상기 활성화 신호를 상기 제2 프로세서로 전달할 수 있다.

상기 제2 프로세서는 상기 활성화 신호를 수신하여 상기 음성 명령 기능을 활성화할 수 있다.

상기 적어도 하나의 속성 정보는 상기 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함할 수 있다.

상기 인식 모델은 상기 적어도 하나의 속성 정보를 포함하는 화자 종속 음성 인식 모델일 수 있다.

주변 환경 정보 측정 모듈을 더 포함하고, 상기 주변 환경 정보 측정 모듈을 이용하여 상기 사용자의 주변 환경 정보를 측정할 수 있다.

도 5는 본 명세서에 개시된 다양한 실시예들 중 어느 하나에 따른 전자 장치에서 음성을 입력하여 애플리케이션을 실행하는 방법에 관한 흐름도이다.

전자 장치(200)는, 510 동작에서, 사용자의 음성을 감지할 수 있다.

전자 장치(200)는 음성 입력 모듈(412)를 통해 유입되는 소리를 전처리 모듈(416)을 이용하여 변형 또는 정제할 수 있다. 예를 들어 잔향 제거기(Echo Cancellation), 잡음 제거(Noise Reduction), 음성 검출(Voice Activity Detection), 끝점 검출 (End-Point Detection) 또는 자동 이득 제어(Automatic gain controller) 등이 수행될 수 있다. 이러한 전처리 기능은 음성 정보가 생성되기 전이나 후에 수행될 수 있다. 전자 장치(200)는 음성 입력 모듈(412)을 통해 음성 입력이 확인되면 전처리 모듈(416)을 통해 정제화 된 음성 정보를 생성할 수 있다.

전자 장치(200)는, 520 동작에서, 제1 프로세서(420)를 이용하여 감지된 음성의 속성 정보를 결정할 수 있다. 예를 들어, 속성 정보는 입력된 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함할 수 있다.

전자 장치(200)는, 530 동작에서, 제1 프로세서(420)를 이용하여 감지된 음성의 속성 정보가 기 저장된 인식 모델과 일치하는지 여부를 판단할 수 있다.

전자 장치(200)는 감지된 음성과 기 저장된 인식 모델이 일치하는 경우, 입력된 음성이 기 저장된 사용자의 음성임을 인증할 수 있다.

한편, 전자 장치(200)의 제1 프로세서(420)에서 수행되는 음성 인증은 인식할 음성의 특징을 반영하는 정보와 입력된 사용자 음성을 비교하는 동작을 포함한다. 이 때 사용되는 인식할 음성의 특징을 반영하는 정보를 통틀어 인식 모델(recognition model, 442)이라고 정의할 수 있다. 인식 모델(442)은 은닉 마르코프 모델(HMM; Hidden Markov Model), 신경 망(Neural network) 등과 같은 통계 모델로 표현될 수도 있으며, 동적 시간 신축(DTW; Dynamic Time Warping), 벡터 양자화(VQ; Vector Quantization)와 같은 인식 알고리즘이 사용될 경우 음성신호의 특징 벡터열로 표현될 수 있다. 인식과정에 차원 축소(Dimensionality Reduction)나 선형 변환(Linear Transformation)과 같은 변환방법이 적용될 경우 변환에 사용되는 파라미터(parameter)가 모델정보가 될 수 있다. 나열된 인식 모델 외에도 다양한 인식 모델이 있을 수 있으며, 이들은 공통적으로 인식할 음성을 대표할 수 있는 정보의 구성으로 이루어진다. 또한, 인식 모델(442)은 입력된 음성의 속성 정보를 포함할 수 있다. 예를 들어, 속성 정보는 입력된 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함할 수 있다.

일 실시예에서, 전자 장치(200)는 입력된 음성 정보와 인식 모델과의 유사도를 측정할 수 있다. 예를 들어, 인식 모델과 음성 정보간 유사도를 측정하기 위해 비터비 알고리즘(Viterbi algorithm), 전향후향 확률(forward-backward probability) 측정 또는 동적 시간 신축(DTW; Dynamic Time Warping)등과 같은 방법이 사용될 수 있다. 전자 장치(200)는 유사도가 기 설정된 기준치보다 클 경우에는, 입력된 음성 정보가 인식 모델과 일치한다고 판단할 수 있다.

전자 장치(200)는, 입력된 음성 정보가 기 저장된 인식 모델과 일치하는 경우, 540 동작으로 분기하여 제2 프로세서(430)를 활성화할 수 있다.

즉, 전자 장치(200)의 제1 프로세서(420)에서 사용자 인증이 완료되면 활성화 신호(wake up signal)를 발생시켜 전자 장치(200)의 제2 프로세서(430)의 음성 명령 기능을 활성화 시킬 수 있다.

한편, 전자 장치(200)는, 감지된 음성의 속성 정보가 기 저장된 인식 모델과 일치하지 않는 경우, 510 동작으로 분기하여 사용자 음성을 감지할 수 있다. 전자 장치(200)는 사용자에게 생성된 인식 모델과 대응되는 음성 정보를 들려줄 수 있다. 또한, 전자 장치(200)는 사용자에게 인식 모델을 변경하기 위한 추가 음성 입력을 제안할 수 있고, 사용자가 새로운 음성을 입력하면 기 저장된 인식 모델을 추가 입력된 음성 정보를 이용하여 갱신할 수 있다.

전자 장치(200)는, 550 동작에서, 제2 프로세서(430)를 이용하여 음성 명령 기능을 실행할 수 있고, 사용자로부터 음성 명령을 입력 받을 수 있다.

전자 장치(200)는 음성 입력이 확인되면 사용자 인터페이스(예: 화면 메시지, 소리 또는 진동 등)를 통해서 음성 입력이 되었음을 알려줄 수 있다.

전자 장치(200)는, 560 동작에서, 제2 프로세서(430)를 이용하여 사용자의 음성 명령에 대응하는 애플리케이션을 실행할 수 있다.

전자 장치는 입력된 음성 정보에 대응하여 전자 장치의 특정 기능 또는 애플리케이션을 실행할 수 있다.

이를 통해, 전자 장치(200)는 화자 종속 음성 인식을 통해 보안 기능을 강화할 수 있고, 제1 프로세서와 제2 프로세서의 역할을 분담하여 소비 전력 부담을 경감시킬 수 있다. 또한, 전자 장치(200)는 사용자의 별도의 터치 이벤트 또는 키 입력 없이 음성 인식만으로 음성 명령 기능을 활성화 시킬 수 있다.

도 6은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 인식 모델을 생성하는 방법에 관한 흐름도이다. 전자 장치(200)는 사용자 음성 또는 사용자 지정 키워드를 이용하여 인식 모델을 생성 또는 변경할 수 있다.

전자 장치(200)는, 610 동작에서, 사용자의 음성을 감지할 수 있다.

전자 장치(200)는, 610 동작에서, 보다 정확한 인식 모델을 생성하기 위해 동일한 언어 정보에 대응되는 복수의 음성을 수신할 수 있다.

전자 장치(200)는, 620 동작에서, 생성된 음성 정보의 속성 정보를 결정할 수 있다. 예를 들어, 속성 정보는 입력된 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함할 수 있다.

전자 장치(200)는, 630 동작에서, 속성 정보에 기반하여 중간 인식 모델을 생성 또는 변경할 수 있다.

전자 장치(200)는, 예를 들어, 기대최대화 알고리즘(Expectation-Maximization algorithm)과 같은 최대 우도 최적화(Maximum likelihood optimization), 기울기 하강 최적화(Gradient descent optimization) 또는 최대 우도 선형 회귀(Maximum Likelihood Linear Regression) 등의 방식을 이용하여 중간 인식 모델을 생성 또는 변경할 수 있다. 전자 장치(200)는 생성 또는 변경된 인식모델을 메모리(230)에 저장할 수 있다.

전자 장치(200)는, 640 동작에서, 동일한 언어 정보에 대응되는 음성의 추가 수신 여부 및 추가 수신 횟수를 결정할 수 있다.

전자 장치(200)는 동일한 언어 정보에 대응되는 복수의 음성 정보들을 서로 비교할 수 있고, 비교 결과에 따라 관련된 정보를 표시 할 수 있다. 예를 들어, 전자 장치(200)는 복수의 음성 정보 간에 유사도를 측정할 수 있다. 전자 장치(200)는 음성 정보가 생성될 때마다 또는, 생성된 음성 정보가 기 설정된 개수 이상이면 유사도를 측정할 수 있다. 예를 들어, 전자 장치(200)는 유사도 측정을 위해 동적 시간 신축(DTW; Dynamic Time Warping), 상호 상관(Cross correlation) 또는 간섭성(Coherence) 등을 포함하는 기법을 사용할 수 있다. 전자 장치(200)는, 유사도가 기 설정된 수치보다 낮은 경우, 동일한 언어 정보에 대응하는 복수의 음성 정보가 불일치 한다고 판단할 수 있다. 전자 장치(200)는 유사도에 근거하여 동일한 언어 정보에 대응되는 음성의 추가 수신 여부 및 추가 수신 횟수를 결정할 수 있다.

한편, 전자 장치(200)는 음성 정보에 대한 분산(variance)값이 클수록 추가 음성 입력 횟수도 크게 조절할 수 있다. 또한, 전자 장치(200)는 신호 대 잡음 비(signal to noise)의 총합이 클수록 추가 음성 입력 횟수를 크게 조절할 수 있다.

전자 장치(200)는, 640 동작에서, 인식 모델 생성을 위해 추가적으로 음성 수신이 필요하다고 판단된 경우 610 동작으로 분기하여 사용자의 음성을 감지할 수 있다.

전자 장치(200)는, 640 동작에서, 인식 모델 생성을 위해 추가적으로 음성 수신이 필요하지 않다고 판단된 경우 660 동작으로 분기하여 중간 인식 모델을 최종 인식 모델로 결정할 수 있다. 전자 장치(200)는 결정된 최종 인식 모델을 메모리(230)에 저장할 수 있고, 이를 이용해서 사용자 음성을 인증할 수 있다.

도 7은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 주변 환경을 고려하여 음성을 감지하는 방법에 관한 흐름도이다.

전자 장치(200)는, 710 동작에서, 전자 장치의 주변 환경 정보를 측정할 수 있다. 예를 들어, 전자 장치(200)는 주변 환경 정보 측정 모듈(414)를 이용하여 잡음 레벨을 확인할 수 있다.

전자 장치(200)는, 720 동작에서, 전자 장치가 속한 주변 환경이 사용자 음성 감지에 적합한지 판단할 수 있다.

전자 장치(200)는, 전자 장치가 속한 주변 환경이 음성 감지에 적합하지 않은 경우, 722 동작으로 분기하여 사용자에게 음성 감지에 적합하지 않은 환경임을 경고할 수 있고, 710 동작으로 분기하여 전자 장치의 주변 환경 정보를 측정할 수 있다.

예를 들어, 전자 장치(200)는 잡음 레벨 결과에 대응하여 사용자에게 보다 조용한 환경에서 음성 입력을 시도할 것을 권유하는 메시지를 표시할 수 있다. 전자 장치(200)는 잡음 레벨을 주기적으로 확인할 수 있고, 이를 디스플레이 모듈(260), 스피커(282) 또는 모터(298) 중 적어도 하나를 이용하여 사용자에게 알릴 수 있다. 따라서, 적합한 음성 입력 환경으로 사용자를 유도할 수 있다.

전자 장치(200)는, 전자 장치가 속한 주변 환경이 음성 감지에 적합한 경우, 730 동작으로 분기하여 사용자의 음성을 감지할 수 있다. 전자 장치(200)는 입력 받은 음성을 음성정보로 저장하여 음성 인증 또는 애플리케이션 실행에 이용할 수 있다.

도 8은 본 명세서에 개시된 다양한 실시예에 따른 전자 장치의 음성 정보 생성 및 이를 검증하는 방법에 관한 흐름도이다.

전자 장치(200)는, 810 동작에서, 사용자의 음성을 감지할 수 있고, 820 동작에서, 감지된 음성을 기초로 음성 정보를 생성할 수 있다.

예를 들어, 전자 장치(200)는 음성 입력 모듈(412)를 통해 유입되는 소리를 전처리 모듈(416)을 이용하여 변형 또는 정제할 수 있다. 예를 들어 잔향 제거기(Echo Cancellation), 잡음 제거(Noise Reduction), 음성 검출(Voice Activity Detection), 끝점 검출 (End-Point Detection) 또는 자동 이득 제어(Automatic gain controller) 등이 수행될 수 있다. 이러한 전처리 기능은 음성 정보가 생성되기 전이나 후에 수행될 수 있다. 전자 장치(200)는 음성 입력 모듈(412)을 통해 음성 입력이 확인되면 전처리 모듈(416)을 통해 정제화 된 음성 정보를 생성할 수 있다.

전자 장치(200)는, 830 동작에서, 음성 정보가 음성 인증에 사용되기 적합한 지 판단할 수 있다.

구체적으로, 전자 장치(200)는 입력된 음성 정보를 이용하여 음성 인증에 필요한 속성 정보를 획득할 수 있는 지 확인할 수 있다. 예를 들어, 입력 음성의 길이, 크기(음량), 음소 개수 또는 음소 길이 등을 포함할 수 있다. 전자 장치(200)는 입력된 음성의 길이가 기 설정된 수치보다 작을 경우, 음량이 기 설정된 수치보다 낮을 경우, 또는 음량이 기 설정된 수치보다 클 경우 등을 포함하여 입력된 음성이 음성 인증에 사용가능한지 판단할 수 있다.

전자 장치(200)는, 음성 정보가 음성 인증에 사용되기 부적합한 경우, 832 동작으로 분기하여 사용자에게 경고할 수 있고, 810 동작으로 분기하여 사용자 음성을 다시 입력 받을 수 있다.

전자 장치(200)는, 음성 정보가 음성 인증에 사용되기 적합한 경우, 840 동작으로 분기하여 입력된 음성 정보의 속성 정보를 저장할 수 있다. 전자 장치(200)는 저장된 속성 정보를 이용하여 인식 모델을 생성 또는 변경할 수 있고, 사용자 인증에 사용할 수 있다.

다양한 실시예에 따른 전자 장치에서 음성 명령 기능을 실행하는 방법은, 사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함할 수 있다.

상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 상기 음성 명령 기능을 활성화하는 동작; 상기 사용자의 음성 명령을 입력 받는 동작; 및 상기 음성 명령에 대응하는 애플리케이션을 실행하는 동작을 포함할 수 있다.

상기 사용자를 인증하는 동작은 제1 프로세서에서 실행하고, 상기 음성 명령에 대응하는 애플리케이션을 실행하는 동작은 제2 프로세서에서 실행할 수 있다.

상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 상기 제1 프로세서에서 활성화 신호를 생성하는 동작; 및 상기 활성화 신호를 상기 제1 프로세서에서 상기 제2 프로세서로 전송하는 동작을 포함할 수 있다.

상기 활성화 신호를 상기 제2 프로세서에서 수신하는 동작; 및 상기 활성화 신호에 대응하여 상기 제2 프로세서에서 상기 음성 명령 기능을 실행하는 동작을 포함할 수 있다.

상기 음성을 감지하는 동작은, 상기 사용자의 음성을 포함한 소리를 감지하는 동작; 상기 소리에 기반하여 상기 사용자의 주변 환경 정보를 측정하는 동작; 및 상기 주변 환경 정보를 사용자에게 알려주는 동작을 포함할 수 있다.

다양한 실시예들에 따르면, 본 개시에 따른 장치(예: 프로세서(120) 및 모듈 들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그래밍 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어는, 하나 이상의 프로세서에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다.

컴퓨터로 읽을 수 있는 저장매체는, 도시되지는 않았지만 예를 들면 저장부 또는 메모리가 될 수 있다. 상기 프로그래밍 모듈의 적어도 일부는, 예를 들면, 프로세서에 의해 구현(implement)(예: 실행)될 수 있다. 상기 프로그래밍 모듈의 적어도 일부는 하나 이상의 기능을 수행하기 위한, 예를 들면, 모듈, 프로그램, 루틴, 명령어 세트 (sets of instructions) 또는 프로세스 등을 포함할 수 있다.

상기 컴퓨터로 판독 가능한 기록 매체에는 하드디스크, 플로피디스크 및 자기 테이프와 같은 마그네틱 매체(Magnetic Media)와, CD-ROM(Compact Disc Read Only Memory), DVD(Digital Versatile Disc)와 같은 광기록 매체(Optical Media)와, 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media)와, 그리고 ROM(Read Only Memory), RAM(Random Access Memory), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 또한 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 개시의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

다양한 실시예에 따른 명령들을 저장하고 있는 기계로 판독 가능한 저장 장치는, 상기 명령들은 적어도 하나의 프로세서에 의하여 실행될 경우, 상기 적어도 하나의 프로세서로 하여금 적어도 하나의 동작을 수행하도록 설정된 것으로서, 상기 적어도 하나의 동작은, 사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함할 수 있다.

상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 제1 프로세서에서 활성화 신호를 생성하는 동작; 및 상기 활성화 신호를 상기 제1프로세서에서 제2 프로세서로 전송하는 동작을 포함할 수 있다.

본 개시에 따른 모듈 또는 프로그래밍 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 본 개시에 따른 모듈, 프로그래밍 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.

그리고, 본 개시의 다양한 실시예들은 본 개시의 기술 내용을 쉽게 설명하고 본 개시의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 개시의 범위를 한정하고자 하는 것은 아니다. 따라서 본 개시의 범위는 여기에 개시된 실시예들 이외에도 본 개시의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 개시의 범위에 포함되는 것으로 해석되어야 한다.

음성 정보 생성 모듈: 410 제1 프로세서: 420
제2 프로세서: 430 음성 인식 모듈: 440
인식 모델: 442 인식 모델 생성 모듈: 444
애플리케이션 실행 모듈: 446

Claims

전자 장치에서 음성 명령 기능을 실행하는 방법에 있어서,
사용자의 음성을 감지하는 동작;
상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및
상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함하는 방법.
제1 항에 있어서,
상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우,
상기 음성 명령 기능을 활성화하는 동작;
상기 사용자의 음성 명령을 입력 받는 동작; 및
상기 음성 명령에 대응하는 애플리케이션을 실행하는 동작을 포함하는 방법.
제2 항에 있어서,
상기 사용자를 인증하는 동작은 제1 프로세서에서 실행하고,
상기 음성 명령에 대응하는 애플리케이션을 실행하는 동작은 제2 프로세서에서 실행하는 방법.
제2 항에 있어서,
상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우,
상기 제1 프로세서에서 활성화 신호를 생성하는 동작; 및
상기 활성화 신호를 상기 제1 프로세서에서 상기 제2 프로세서로 전송하는 동작을 포함하는 방법.
제4 항에 있어서,
상기 활성화 신호를 상기 제2 프로세서에서 수신하는 동작; 및
상기 활성화 신호에 대응하여 상기 제2 프로세서에서 상기 음성 명령 기능을 실행하는 동작을 포함하는 방법.
제1 항에 있어서,
상기 적어도 하나의 속성 정보는 상기 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함하는 방법.
제1 항에 있어서,
상기 인식 모델은 상기 적어도 하나의 속성 정보를 포함하는 화자 종속 음성 인식 모델인 방법.
제1 항에 있어서,
상기 음성을 감지하는 동작은,
상기 사용자의 음성을 포함한 소리를 감지하는 동작;
상기 소리에 기반하여 상기 사용자의 주변 환경 정보를 측정하는 동작; 및
상기 주변 환경 정보를 사용자에게 알려주는 동작을 포함하는 방법.
사용자의 음성을 감지하는 음성 입력 모듈;
상기 음성으로부터 적어도 하나의 속성 정보를 결정하고, 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 제1 프로세서; 및
상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 음성 명령 기능을 활성화 하고, 상기 사용자의 음성 명령을 입력 받고, 상기 음성 명령에 대응하는 애플리케이션을 실행하는 제2 프로세서를 포함하는 전자 장치.
제9 항에 있어서,
상기 제1 프로세서는, 상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우, 활성화 신호(wake up signal)를 발생시키고, 상기 활성화 신호를 상기 제2 프로세서로 전달하는 전자 장치.
제10 항에 있어서,
상기 제2 프로세서는 상기 활성화 신호를 수신하여 상기 음성 명령 기능을 활성화하는 전자 장치.
제9 항에 있어서,
상기 적어도 하나의 속성 정보는 상기 음성의 길이, 크기, 음소 개수 또는 음소 길이 중 적어도 하나를 포함하는 전자 장치.
제9 항에 있어서,
상기 인식 모델은 상기 적어도 하나의 속성 정보를 포함하는 화자 종속 음성 인식 모델인 전자 장치.
제9 항에 있어서,
주변 환경 정보 측정 모듈을 더 포함하고,
상기 주변 환경 정보 측정 모듈을 이용하여 상기 사용자의 주변 환경 정보를 측정하는 전자 장치.
음성 명령 기능을 실행하는 방법을 전자 장치에서 실행시키기 위한 명령들을 저장하고 있는 저장 매체에 있어서,
사용자의 음성을 감지하는 동작; 상기 음성으로부터 적어도 하나의 속성 정보를 결정하는 동작; 및 상기 속성 정보를 기 저장된 인식 모델과 비교하여 상기 사용자를 인증하는 동작을 포함하는 전자 장치에서 실행시키기 위한 명령들을 저장하고 있는 저장 매체.
제15 항에 있어서,
상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우,
상기 음성 명령 기능을 활성화하는 동작; 상기 사용자의 음성 명령을 입력 받는 동작; 및 상기 음성 명령에 대응하는 애플리케이션을 실행하는 동작을 포함하는 전자 장치에서 실행시키기 위한 명령들을 저장하고 있는 저장 매체.
제16 항에 있어서,
상기 속성 정보가 기 저장된 인식 모델과 일치하는 경우,
제1 프로세서에서 활성화 신호를 생성하는 동작; 및 상기 활성화 신호를 상기 제1프로세서에서 제2 프로세서로 전송하는 동작을 포함하는 전자 장치에서 실행시키기 위한 명령들을 저장하고 있는 저장 매체.
제17 항에 있어서,
상기 활성화 신호를 상기 제2 프로세서에서 수신하는 동작; 및 상기 활성화 신호에 대응하여 상기 제2 프로세서에서 상기 음성 명령 기능을 실행하는 동작을 포함하는 전자 장치에서 실행시키기 위한 명령들을 저장하고 있는 저장 매체.