KR102161913B1 - Remote control for speech recognition and method thereof - Google Patents

Remote control for speech recognition and method thereof Download PDF

Info

Publication number
KR102161913B1
KR102161913B1 KR1020190029291A KR20190029291A KR102161913B1 KR 102161913 B1 KR102161913 B1 KR 102161913B1 KR 1020190029291 A KR1020190029291 A KR 1020190029291A KR 20190029291 A KR20190029291 A KR 20190029291A KR 102161913 B1 KR102161913 B1 KR 102161913B1
Authority
KR
South Korea
Prior art keywords
voice
external device
recognition
caller
user input
Prior art date
Application number
KR1020190029291A
Other languages
Korean (ko)
Other versions
KR20200109742A (en
Inventor
박세호
한정안
이정우
Original Assignee
주식회사 엘지유플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지유플러스 filed Critical 주식회사 엘지유플러스
Priority to KR1020190029291A priority Critical patent/KR102161913B1/en
Publication of KR20200109742A publication Critical patent/KR20200109742A/en
Application granted granted Critical
Publication of KR102161913B1 publication Critical patent/KR102161913B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42221Transmission circuitry, e.g. infrared [IR] or radio frequency [RF]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

음성 인식 리모콘이 개시된다. 일실시예에 따른 외부 장치를 제어하는 음성 인식 리모콘은 외부에서 전달되는 음성을 수신하고, 음성을 전기적인 신호로 변환하는 음성 수신 모듈; 전기적인 신호에 기초하여 미리 정해진 호출어의 발화 여부를 판단하고, 음성에 호출어가 포함된다고 판단되는 경우 호출어 이후에 발화되는 음성의 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈을 제어하며, 음성과 구별되는 사용자 입력에 반응하여 사용자 입력에 의한 모드가 유지되는 동안 음성 수신 모듈로부터 수신되는 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈을 제어하는 호출어 인식 모듈; 호출어 인식 모듈의 제어에 따라 외부 장치와 통신하는 근거리 통신 모듈; 및 충방전이 가능한 배터리를 이용하여 전원을 공급하는 전원부를 포함한다.The voice recognition remote control is started. According to an embodiment, a voice recognition remote controller for controlling an external device includes: a voice receiving module for receiving a voice transmitted from the outside and converting the voice into an electric signal; Controls the short-range communication module to determine whether or not a predetermined caller is uttered based on an electrical signal, and to transmit an electrical signal of a voice uttered after the caller to an external device when it is determined that the voice includes the caller, A pager recognition module for controlling the short-range communication module to transmit an electrical signal received from the voice receiving module to an external device while a mode by the user input is maintained in response to a user input distinguished from voice; A short-range communication module that communicates with an external device under the control of the call word recognition module; And a power supply unit that supplies power using a battery capable of charging and discharging.

Description

음성 인식을 위한 리모콘 및 그 장치를 이용한 음성 인식 방법 {REMOTE CONTROL FOR SPEECH RECOGNITION AND METHOD THEREOF}Remote control for voice recognition and voice recognition method using the device {REMOTE CONTROL FOR SPEECH RECOGNITION AND METHOD THEREOF}

아래 실시예들은 음성 인식을 위한 리모콘 및 그 장치를 이용한 음성 인식 방법에 관한 것이다.The following embodiments relate to a remote control for voice recognition and a voice recognition method using the device.

컴퓨터 연산능력이 발달하고 네트워크 대역폭이 확대되면서 실시간에 가까운 데이터 분석이 가능해지고 있다. 실시간에 가까운 데이터 분석과 딥 러닝 등의 인공지능(AI) 기술이 접목되면서, 음성인식 기술이 빠르게 발전하고 있다. 또한, 사물인터넷(IoT) 기술이 발달하면서 각종 기기들의 기능, 연결성, 및 편의성이 증대되고 있으며, 그 일환으로 음성 인식 기술을 가정용 전자기기 등에 장착하여 사용하려는 시도가 계속되고 있다.As computer computing power develops and network bandwidth expands, near real-time data analysis is becoming possible. As artificial intelligence (AI) technologies such as near real-time data analysis and deep learning are combined, speech recognition technology is rapidly developing. In addition, as the Internet of Things (IoT) technology develops, the functions, connectivity, and convenience of various devices are increasing, and as part of that, attempts to install and use voice recognition technology in home electronic devices are continuing.

리모콘은 전자기기의 원격제어에 광범위하게 사용되어 오고 있는 장치로써 그 활용도가 높다. 종래의 리모콘은 사용자가 리모콘의 각 키에 할당된 기능을 미리 숙지해야 하고, 일일이 손으로 제어해야 한다는 불편이 있었다. 따라서, 리모콘을 편리하게 작동시키기 위하여 음성 인식이 가능한 리모콘을 개발하기 위한 연구가 진행되고 있다.The remote control is a device that has been widely used for remote control of electronic devices and has high utilization. In the conventional remote control, there is an inconvenience that the user must be familiar with the functions assigned to each key of the remote control in advance and must manually control each key. Therefore, research is being conducted to develop a remote control capable of voice recognition in order to conveniently operate the remote control.

일실시예에 따른 음성 인식 리모콘은 외부에서 전달되는 음성을 전기적인 신호로 변환하고, 외부에서 전달되는 음성에 미리 정해진 호출어가 발화되었는지 여부 및 사용자 입력에 반응하여 푸시 투 토크 모드가 유지되는지 여부에 기초하여, 외부에서 전달되는 음성의 전기적인 신호를 외부 장치로 전송한다. 호출어 인식 이후의 음성 인식 과정은 외부 장치 및 외부 장치와 연동된 플랫폼에서 수행될 수 있다. 따라서, 일실시예에 따른 음성 인식 리모콘은 모든 음성 인식 과정을 리모콘에서 수행할 필요가 없으므로, 저전력 구동이 가능할 수 있다.The voice recognition remote control according to an embodiment converts the voice transmitted from the outside into an electrical signal, and determines whether a predetermined call word is uttered in the voice transmitted from the outside and whether the push-to-talk mode is maintained in response to a user input. Based on this, the electrical signal of voice transmitted from the outside is transmitted to the external device. The voice recognition process after the call word recognition may be performed in an external device and a platform interlocked with the external device. Accordingly, the voice recognition remote control according to an embodiment does not need to perform all voice recognition processes on the remote control, and thus, low power driving may be possible.

일실시예에 따른 외부 장치를 제어하는 음성 인식 리모콘은 외부에서 전달되는 음성(voice)을 수신하고, 상기 음성을 전기적인 신호로 변환하는 음성 수신 모듈; 상기 전기적인 신호에 기초하여 미리 정해진 호출어(wake-up word)의 발화 여부를 판단하고, 상기 음성에 상기 호출어가 포함된다고 판단되는 경우 상기 호출어 이후에 발화되는 상기 음성의 전기적인 신호를 상기 외부 장치로 전송하도록 상기 근거리 통신 모듈을 제어하며, 상기 음성과 구별되는 사용자 입력에 반응하여 상기 사용자 입력에 의한 모드가 유지되는 동안 상기 음성 수신 모듈로부터 수신되는 전기적인 신호를 상기 외부 장치로 전송하도록 상기 근거리 통신 모듈을 제어하는 호출어 인식 모듈; 상기 호출어 인식 모듈의 제어에 따라 상기 외부 장치와 통신하는 근거리 통신 모듈; 및 충방전이 가능한 배터리를 이용하여 전원을 공급하는 전원부를 포함한다.According to an embodiment, a voice recognition remote control for controlling an external device includes: a voice receiving module for receiving a voice transmitted from the outside and converting the voice into an electric signal; It is determined whether or not a predetermined wake-up word is uttered based on the electrical signal, and when it is determined that the voice includes the call word, the electrical signal of the voice uttered after the call word is transmitted. Controls the short-range communication module to transmit to an external device, and transmits an electrical signal received from the voice receiving module to the external device while the mode according to the user input is maintained in response to a user input distinguished from the voice. A pager recognition module that controls the short-range communication module; A short-range communication module communicating with the external device under the control of the call word recognition module; And a power supply unit that supplies power using a battery capable of charging and discharging.

일실시예에 따르면, 상기 사용자 입력에 의한 모드가 유지되는 경우, 상기 호출어 인식 모듈에서 상기 호출어의 발화 여부가 판단되지 않을 수 있다.According to an embodiment, when the mode according to the user input is maintained, the caller recognition module may not determine whether the caller is spoken.

일실시예에 따르면, 상기 음성 수신 모듈은 복수 개의 마이크를 포함할 수 있다.According to an embodiment, the voice receiving module may include a plurality of microphones.

일실시예에 따르면, 상기 호출어 인식 모듈이 비활성화되어 있는 경우, 상기 복수 개의 마이크의 적어도 일부는 동작하지 않을 수 있다.According to an embodiment, when the caller recognition module is deactivated, at least some of the plurality of microphones may not operate.

일실시예에 따르면, 상기 음성이 미리 정해진 거리보다 가까운 거리에서 전달되는 경우, 상기 복수 개의 마이크의 적어도 일부는 동작하지 않을 수 있다.According to an embodiment, when the voice is transmitted at a distance closer than a predetermined distance, at least some of the plurality of microphones may not operate.

일실시예에 따르면, 상기 호출어 인식 모듈은 상기 음성 및 상기 사용자 입력과 구별되는 제2 사용자 입력에 의하여 활성화 또는 비활성화될 수 있다.According to an embodiment, the pager recognition module may be activated or deactivated by the voice and a second user input distinguished from the user input.

일실시예에 따르면, 상기 외부 장치는 셋톱박스(set top box)를 포함할 수 있다.According to an embodiment, the external device may include a set top box.

일실시예에 따르면, 상기 외부 장치에서 외부의 플랫폼과 연동함으로써 음성 인식이 수행될 수 있다.According to an embodiment, voice recognition may be performed by interworking with an external platform in the external device.

일실시예에 따르면, 상기 플랫폼에서 상기 음성에 포함된 명령(command)이 인식되고, 상기 명령에 대응하는 피드백 정보가 생성될 수 있다.According to an embodiment, the platform may recognize a command included in the voice, and feedback information corresponding to the command may be generated.

일실시예에 따르면, 외부 장치를 제어하는 음성 인식 리모콘은 상기 플랫폼으로부터 상기 외부 장치를 통해 상기 음성에 포함된 명령에 대응하는 피드백 정보를 수신하고, 상기 피드백 정보를 출력하는 출력부를 더 포함할 수 있다.According to an embodiment, the voice recognition remote control for controlling an external device may further include an output unit for receiving feedback information corresponding to a command included in the voice from the platform through the external device, and outputting the feedback information. have.

일실시예에 따른 외부 장치를 제어하는 음성 인식 리모콘의 호출어 인식 방법은 외부에서 전달되는 음성(voice)을 변환한 전기적인 신호를 수신하는 단계; 상기 음성과 구별되는 사용자 입력에 반응하여 상기 사용자 입력에 의한 모드가 유지되는지 여부를 판단하는 단계; 상기 사용자 입력에 의한 모드가 유지되는 경우, 상기 전기적인 신호를 상기 외부 장치로 전송하는 단계; 상기 사용자 입력에 의한 모드가 유지되지 않는 경우, 상기 전기적인 신호에 기초하여 상기 음성에 미리 정해진 호출어(wake-up word)가 포함되는지 여부를 판단하는 단계; 및 상기 음성에 상기 호출어가 포함된다고 판단되는 경우 상기 호출어 이후에 발화되는 음성의 전기적인 신호를 상기 외부 장치로 전송하는 단계를 포함한다.According to an embodiment, a method for recognizing a call word of a voice recognition remote controller for controlling an external device includes: receiving an electrical signal converted from an external voice; Determining whether a mode according to the user input is maintained in response to a user input distinguished from the voice; Transmitting the electrical signal to the external device when the mode according to the user input is maintained; Determining whether a predetermined wake-up word is included in the voice based on the electrical signal when the mode according to the user input is not maintained; And transmitting an electrical signal of a voice spoken after the call word to the external device when it is determined that the voice includes the call word.

도 1은 일실시예에 따른 음성 인식(speech recognition) 리모콘의 구성을 설명하기 위한 도면이다.
도 2는 일실시예에 따른 음성 인식 리모콘의 구성의 예시도이다.
도 3은 일실시예에 따른 사용자 입력에 따른 호출어 인식 모듈 및 근거리 통신 모듈의 동작을 설명하기 위한 도면이다.
도 4는 일실시예에 따른 음성 인식 리모콘의 구조를 설명하기 위한 예시도이다.
도 5는 일실시예에 따른 호출어 인식 모듈의 동작 방법을 설명하기 위한 동작 흐름도이다.
도 6은 일실시예에 따른 음성 인식 리모콘, 외부 장치, 및 플랫폼이 연동하여 음성 인식을 수행하는 방법을 설명하기 위한 도면이다.
1 is a view for explaining the configuration of a speech recognition (speech recognition) remote control according to an embodiment.
2 is an exemplary diagram of a configuration of a voice recognition remote control according to an embodiment.
3 is a diagram for explaining the operation of a call word recognition module and a short range communication module according to a user input according to an embodiment.
4 is an exemplary diagram for explaining the structure of a voice recognition remote control according to an embodiment.
5 is a flowchart illustrating an operation method of a call word recognition module according to an embodiment.
6 is a diagram for explaining a method of performing voice recognition by interlocking with a voice recognition remote control, an external device, and a platform according to an embodiment.

실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 실시될 수 있다. 따라서, 실시예들은 특정한 개시형태로 한정되는 것이 아니며, 본 명세서의 범위는 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.Specific structural or functional descriptions of the embodiments are disclosed for illustrative purposes only, and may be changed in various forms and implemented. Accordingly, the embodiments are not limited to a specific disclosure form, and the scope of the present specification includes changes, equivalents, or substitutes included in the technical idea.

제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.Although terms such as first or second may be used to describe various components, these terms should be interpreted only for the purpose of distinguishing one component from other components. For example, a first component may be referred to as a second component, and similarly, a second component may be referred to as a first component.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.When a component is referred to as being "connected" to another component, it is to be understood that it may be directly connected or connected to the other component, but other components may exist in the middle.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present specification, terms such as "comprise" or "have" are intended to designate that the described feature, number, step, action, component, part, or combination thereof exists, but one or more other features or numbers, It is to be understood that the presence or addition of steps, actions, components, parts, or combinations thereof, does not preclude the possibility of preliminary exclusion.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms, including technical or scientific terms, used herein have the same meaning as commonly understood by one of ordinary skill in the relevant technical field. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this specification. Does not.

이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. The same reference numerals in each drawing indicate the same members.

도 1은 일실시예에 따른 음성 인식(speech recognition) 리모콘의 구성을 설명하기 위한 도면이다.1 is a view for explaining the configuration of a speech recognition (speech recognition) remote control according to an embodiment.

도 1을 참조하면, 음성 인식 리모콘은 음성(voice) 수신 모듈(110), 전원부(120), 호출어 인식 모듈(130), 및 근거리 통신 모듈(140)을 포함한다. 음성 수신 모듈(110)은 외부에서 전달되는 음성(voice)을 수신하고, 수신된 음성을 전기적인 신호로 변환한다. 전원부(120)는 충전 및 방전이 가능한 배터리를 이용하여 음성 인식 리모콘의 각 구성 요소에 전원을 공급한다. 호출어(wake-up word) 인식 모듈(130)은 미리 정해진 호출어의 발화 여부를 인식한다. 아래에서 상세하게 설명하겠으나, 호출어 인식 모듈(130)은 음성에 호출어가 포함되는지 여부를 판단하고, 판단 결과에 따라 음성 인식을 수행하는 외부 장치로 음성을 전달한다. 아래에서 설명할 실시예들은 리모콘에 호출어 인식 모듈(130)을 포함시킴으로써 음성 인식 장치의 휴대성 및 사용자 근접성을 향상시킬 수 있다. 또한, 실시예들은 호출어 인식 이외의 음성 인식은 외부 장치 및 플랫폼을 통하여 수행함으로써 음성 인식 장치의 저전력 동작을 실현하고, 음성 인식 장치의 구동 시간을 증가시킬 수 있다.Referring to FIG. 1, the voice recognition remote controller includes a voice receiving module 110, a power supply unit 120, a pager recognition module 130, and a short-range communication module 140. The voice receiving module 110 receives a voice transmitted from the outside and converts the received voice into an electrical signal. The power supply unit 120 supplies power to each component of the voice recognition remote control using a battery capable of charging and discharging. The wake-up word recognition module 130 recognizes whether or not a predetermined call word is spoken. Although described in detail below, the caller recognition module 130 determines whether the caller is included in the voice, and transmits the voice to an external device that performs voice recognition according to the determination result. Embodiments to be described below may improve portability and user proximity of the voice recognition apparatus by including the pager recognition module 130 in the remote control. In addition, in the embodiments, voice recognition other than call word recognition is performed through an external device and a platform, thereby realizing a low power operation of the voice recognition device and increasing the driving time of the voice recognition device.

예를 들어, 호출어 인식 모듈(130)은 호출어의 발화 여부에 기초하여 근거리 통신 모듈(140)을 제어한다. 실시예에 따라, 호출어 인식 모듈(130)은 호출어의 발화 여부 및 사용자 입력에 의한 모드(예를 들어, 푸시 투 토크(push to talk) 모드)의 유지 여부의 조합에 기초하여 근거리 통신 모듈(140)을 제어할 수 있다. 근거리 통신 모듈(140)은 호출어 인식 모듈(130)의 제어에 따라 외부 장치와 통신한다. 외부 장치는 플랫폼과 연동하여 음성 인식을 수행하는 장치로서, 예를 들어 셋톱박스(set top box)일 수 있다.For example, the caller recognition module 130 controls the short-range communication module 140 based on whether the caller is spoken. According to an embodiment, the caller recognition module 130 is a short-range communication module based on a combination of whether the caller is uttered and whether or not a mode (eg, a push to talk mode) is maintained according to a user input. You can control 140. The short-range communication module 140 communicates with an external device under the control of the call word recognition module 130. The external device is a device that performs voice recognition in conjunction with a platform, and may be, for example, a set top box.

음성 수신 모듈(110)은 외부에서 전달되는 음성을 수신하고, 수신된 음성을 전기적인 신호로 변환하기 위하여 복수 개의 마이크를 포함할 수 있다. 일실시예에 따르면, 소리의 지향성이 반영되도록 복수 개의 마이크가 이용됨으로써, 외부에서 전달되는 음성이 증폭되어 수신될 수 있다. 외부에서 전달되는 음성이 증폭되어 수신되는 경우, 음성과 노이즈의 구별이 더욱 명확해질 수 있고, 외부 장치 및 플랫폼에서 수행되는 음성 인식의 정확도가 향상될 수 있다.The voice receiving module 110 may include a plurality of microphones in order to receive voice transmitted from the outside and convert the received voice into an electrical signal. According to an embodiment, a plurality of microphones are used to reflect the directivity of sound, so that a voice transmitted from the outside may be amplified and received. When the voice transmitted from the outside is amplified and received, the distinction between voice and noise may become more clear, and the accuracy of voice recognition performed by external devices and platforms may be improved.

미리 정해진 거리보다 가까운 거리에서 전달되는 음성을 수신하기 위하여, 복수 개의 마이크 중 일부만이 이용될 수 있다. 미리 정해진 거리는 소리의 지향성을 반영하지 않고 외부에서 전달되는 음성과 노이즈가 명확하게 구별되는지 여부를 결정하는 기준이 되는 거리일 수 있다. 호출어 인식 모듈(130)이 활성화되어 있는 경우, 미리 정해진 거리보다 가까운 거리에서 전달되는 음성을 수신하기 위하여 이용되지 않는 마이크의 적어도 일부는 미리 정해진 거리보다 먼 거리에서 전달되는 음성을 수신하기 위하여 이용될 수 있다. 반면, 호출어 인식 모듈(130)이 비활성화되어 있는 경우, 미리 정해진 거리보다 가까운 거리에서 전달되는 음성을 수신하기 위하여 이용되지 않는 마이크는 미리 정해진 거리보다 먼 거리에서 음성이 전달되는 경우에도 이용되지 않을 수 있다.In order to receive a voice transmitted at a distance closer than a predetermined distance, only some of the plurality of microphones may be used. The predetermined distance may not reflect the directivity of the sound and may be a distance that serves as a reference for determining whether voice and noise transmitted from the outside are clearly distinguished. When the pager recognition module 130 is activated, at least some of the microphones that are not used to receive voices delivered from a distance closer than a predetermined distance are used to receive voices delivered from a distance greater than a predetermined distance. Can be. On the other hand, when the caller recognition module 130 is deactivated, a microphone that is not used to receive a voice transmitted from a distance closer than a predetermined distance will not be used even when a voice is transmitted from a distance greater than a predetermined distance. I can.

전원부(120)에서 공급된 전원은 음성 수신 모듈(110), 호출어 인식 모듈(130), 및 근거리 통신 모듈(140)의 동작을 위하여 사용될 수 있다. 후술하겠으나, 본 발명의 음성 인식 리모콘은 저전력 구동이 가능할 수 있다. 따라서, 일 회의 배터리 충전으로 인한 음성 인식 리모콘의 구동 시간을 증가시킬 수 있다.Power supplied from the power supply unit 120 may be used for the operation of the voice receiving module 110, the call word recognition module 130, and the short-range communication module 140. As will be described later, the voice recognition remote controller of the present invention may be capable of low power driving. Accordingly, it is possible to increase the driving time of the voice recognition remote controller due to one battery charge.

설계에 따라, 음성 인식 리모콘은 출력부(150) 및 리모콘 입력 인터페이스(160)를 더 포함할 수 있다. 이 경우, 공급된 전원은 출력부(150) 및 리모콘 입력 인터페이스(160)의 동작을 위하여 사용될 수도 있다.Depending on the design, the voice recognition remote control may further include an output unit 150 and a remote control input interface 160. In this case, the supplied power may be used for the operation of the output unit 150 and the remote control input interface 160.

외부에서 전달되는 음성 및 사용자 입력과 구별되는 제2 사용자 입력에 의하여, 파필드(far-field) 모드가 유지될 수 있다. 파필드 모드는 호출어 인식 모듈의 활성화 여부를 제어할 수 있다. 예를 들어, 파필드(far-field) 모드가 유지되는 경우, 호출어 인식 모듈(130)이 활성화될 수 있다. 반면, 파필드 모드가 유지되지 않는 경우, 호출어 인식 모듈(130)이 비활성화될 수 있다.A far-field mode may be maintained by a voice transmitted from the outside and a second user input distinguished from the user input. The far field mode can control whether or not the caller recognition module is activated. For example, when the far-field mode is maintained, the call word recognition module 130 may be activated. On the other hand, if the far field mode is not maintained, the caller recognition module 130 may be deactivated.

파필드 모드와 관련된 보다 상세한 사항은 도 3을 통하여 후술한다.More details related to the far field mode will be described later with reference to FIG. 3.

호출어 인식 모듈(130)이 활성화된 경우, 호출어 인식 모듈(130)은 외부에서 전달되는 음성을 변환한 전기적인 신호를 음성 수신 모듈(110)로부터 수신한다. 호출어 인식 모듈(130)은 호출어의 발화 여부를 판단하기 전에, 사용자 입력에 반응하여 사용자 입력에 의한 모드(이하, 푸시 투 토크 모드)가 유지되는지 여부를 판단한다. 사용자 입력은 외부에서 전달되는 음성과 구별되는 사용자의 입력을 의미하는 것으로, 사용자의 음성 인식 리모콘에 대한 물리적 조작 또는 음성 명령 등을 포함할 수 있다. 일실시예에 따르면, 음성 인식 리모콘의 특정 버튼을 누르거나, 특정 스위치를 슬라이드(slide)하거나, 특정한 방식으로 음성 인식 리모콘을 흔드는 등의 물리적 조작에 의하여 푸시 투 토크 모드가 유지될 수 있다. 이 경우, 푸시 투 토크 모드를 유지하기 위한 특정 버튼 또는 특정 스위치는 후술할 리모콘 입력 인터페이스(160)에 포함될 수 있다.When the pager recognition module 130 is activated, the pager recognition module 130 receives an electrical signal converted from an external voice from the voice receiving module 110. Before determining whether or not the caller is spoken, the pager recognition module 130 determines whether a mode (hereinafter, push-to-talk mode) is maintained in response to a user input. The user input refers to a user's input that is distinct from a voice transmitted from the outside, and may include a physical manipulation or a voice command for the user's voice recognition remote control. According to an embodiment, the push-to-talk mode may be maintained by physical manipulation such as pressing a specific button of the voice recognition remote control, sliding a specific switch, or shaking the voice recognition remote control in a specific manner. In this case, a specific button or a specific switch for maintaining the push-to-talk mode may be included in the remote control input interface 160 to be described later.

일실시예에 따르면, 사용자가 특정 단어(예를 들어, '푸시 투 토크 모드')를 발화함으로써, 푸시 투 토크 모드가 유지될 수 있다. 다만, 이 경우, 푸시 투 토크 모드를 유지하기 위하여 사용자가 발화하는 단어는 호출어와 명확히 구별되어야 한다. 푸시 투 토크 모드를 유지하기 위한 단어와 호출어가 명확히 구별되지 않는 경우, 호출어 인식 모듈(130)이 사용자의 의도를 정확히 파악하지 못할 수 있다.According to an embodiment, the push-to-talk mode may be maintained by the user uttering a specific word (eg,'push-to-talk mode'). However, in this case, in order to maintain the push-to-talk mode, the word spoken by the user must be clearly distinguished from the call word. When a word for maintaining the push-to-talk mode and a call word are not clearly distinguished, the call word recognition module 130 may not accurately grasp the intention of the user.

사용자 입력에 반응하여 푸시 투 토크 모드가 유지되는 경우, 호출어 인식 모듈(130)에서 호출어의 발화 여부가 판단되지 않을 수 있다. 이 경우, 호출어 인식 모듈(130)은 푸시 투 토크 모드가 유지되는 동안 음성 수신 모듈(110)로부터 수신되는 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈(140)을 제어할 수 있다.When the push-to-talk mode is maintained in response to a user input, the caller recognition module 130 may not determine whether the caller is spoken. In this case, the pager recognition module 130 may control the short-range communication module 140 to transmit an electrical signal received from the voice receiving module 110 to an external device while the push-to-talk mode is maintained.

푸시 투 토크 모드가 유지되지 않는 경우, 호출어 인식 모듈(130)은 음성 수신 모듈(110)로부터 수신된 전기적인 신호에 기초하여 외부에서 전달되는 음성에 미리 정해진 호출어가 포함되는지 여부를 판단한다. 외부에서 전달되는 음성에 미리 정해진 호출어가 포함된다고 판단되는 경우, 호출어 인식 모듈(130)은 미리 정해진 호출어 이후에 발화되는 음성의 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈(140)을 제어한다.If the push-to-talk mode is not maintained, the pager recognition module 130 determines whether or not a predetermined pager is included in the voice transmitted from the outside based on the electrical signal received from the voice receiving module 110. When it is determined that a predetermined call word is included in the voice transmitted from the outside, the call word recognition module 130 uses the short-range communication module 140 to transmit an electrical signal of the voice spoken after the predetermined call word to the external device. Control.

푸시 투 토크 모드와 관련된 보다 상세한 사항은 도 3을 통하여 후술한다.More details related to the push-to-talk mode will be described later with reference to FIG. 3.

근거리 통신 모듈(140)은 호출어 인식 모듈(130)의 제어에 따라 외부 장치와 통신한다. 일실시예에 따르면, 근거리 통신 모듈(140)은 호출어 인식 모듈(130)의 제어에 따라, 음성 수신 모듈(110)로부터 수신되는 전기적인 신호를 외부 장치로 전송할 수 있다. 외부 장치는 근거리 통신 모듈(140)과의 통신에 기초하여 외부의 플랫폼과 연동함으로써 음성 인식을 수행하도록 제어될 수 있다.The short-range communication module 140 communicates with an external device under the control of the call word recognition module 130. According to an embodiment, the short-range communication module 140 may transmit an electrical signal received from the voice receiving module 110 to an external device under the control of the call word recognition module 130. The external device may be controlled to perform voice recognition by interworking with an external platform based on communication with the short-range communication module 140.

외부 장치는 외부의 플랫폼으로부터 수신된 피드백 정보를 음성 인식 리모콘으로 전달할 수도 있다. 설계에 따라, 음성 인식 리모콘은 출력부(150)를 더 포함할 수 있으며, 이 경우 출력부(150)는 외부 장치를 통해 피드백 정보를 수신하고, 수신된 피드백 정보를 출력할 수 있다.The external device may transmit feedback information received from an external platform to a voice recognition remote control. Depending on the design, the voice recognition remote control may further include an output unit 150. In this case, the output unit 150 may receive feedback information through an external device and output the received feedback information.

외부 장치 및 출력부(150)의 동작과 관련된 보다 상세한 사항은 도 6을 통하여 후술한다.More details related to the operation of the external device and the output unit 150 will be described later with reference to FIG. 6.

설계에 따라, 음성 인식 리모콘은 리모콘 입력 인터페이스(160)를 더 포함할 수도 있다. 리모콘 입력 인터페이스(160)는 음성 인식 리모콘을 수동으로 제어하기 위한 하나 이상의 인터페이스로, 버튼 또는 스위치 등 다양한 형태를 포함할 수 있다. 리모콘 입력 인터페이스(160)는 사용자로부터 다양한 종류의 명령을 수신하고, 사용자의 명령에 기초하여 음성 인식 리모콘을 제어할 수 있다. 경우에 따라, 리모콘 입력 인터페이스(160)는 사용자로부터 수신된 명령을 외부 장치로 전송하도록 근거리 통신 모듈을 제어할 수도 있다. 예를 들어, 리모콘 입력 인터페이스(160)는 사용자로부터 외부 장치의 전원을 제어하는 명령을 수신하고, 이를 외부 장치로 전송할 수 있다.Depending on the design, the voice recognition remote control may further include a remote control input interface 160. The remote control input interface 160 is one or more interfaces for manually controlling a voice recognition remote control, and may include various types such as buttons or switches. The remote control input interface 160 may receive various types of commands from a user and control a voice recognition remote control based on the user's command. In some cases, the remote control input interface 160 may control the short range communication module to transmit a command received from a user to an external device. For example, the remote control input interface 160 may receive a command to control power of an external device from a user and transmit the command to the external device.

일실시예에 따른 음성 인식 리모콘은 외부에서 전달되는 음성을 전기적인 신호로 변환하고, 외부에서 전달되는 음성에 미리 정해진 호출어가 발화되었는지 여부 및 사용자 입력에 반응하여 푸시 투 토크 모드가 유지되는지 여부에 기초하여, 외부에서 전달되는 음성의 전기적인 신호를 외부 장치로 전송한다. 호출어 인식 이후의 음성 인식 과정은 외부 장치 및 외부 장치와 연동된 플랫폼에서 수행될 수 있다. 따라서, 일실시예에 따른 음성 인식 리모콘은 모든 음성 인식 과정을 수행할 필요가 없으므로, 저전력 구동이 가능할 수 있다.The voice recognition remote control according to an embodiment converts the voice transmitted from the outside into an electrical signal, and determines whether a predetermined call word is uttered in the voice transmitted from the outside and whether the push-to-talk mode is maintained in response to a user input. Based on this, the electrical signal of voice transmitted from the outside is transmitted to the external device. The voice recognition process after the call word recognition may be performed in an external device and a platform interlocked with the external device. Accordingly, since the voice recognition remote controller according to an embodiment does not need to perform all voice recognition processes, low power driving may be possible.

도 2는 일실시예에 따른 음성 인식 리모콘의 구성의 예시도이다.2 is an exemplary diagram of a configuration of a voice recognition remote control according to an embodiment.

도 2를 참조하면, 일실시예에 따른 음성 인식 리모콘은 음성 수신 모듈(210), 충전용 USB 커넥터(220), LED 소자(221), 배터리(222), 배터리 커넥터(223), 푸시 투 토크 인터페이스(230), 및 파필드(far-field) 인터페이스(240)를 포함할 수 있다. 마이크(210)는 도 1의 음성 수신 모듈(110)에 대응될 수 있다. 충전용 USB 커넥터(220), LED 소자(221), 리튬 배터리(222), 및 배터리 커넥터(223)는 도 1의 전원부(120)에 대응될 수 있다. 푸시 투 토크 인터페이스(230) 및 파필드(far-field) 인터페이스(240)는 도 1의 리모콘 입력 인터페이스(160)에 대응될 수 있다.2, a voice recognition remote control according to an embodiment includes a voice receiving module 210, a charging USB connector 220, an LED element 221, a battery 222, a battery connector 223, and a push-to-talk. An interface 230 and a far-field interface 240 may be included. The microphone 210 may correspond to the voice receiving module 110 of FIG. 1. The charging USB connector 220, the LED element 221, the lithium battery 222, and the battery connector 223 may correspond to the power supply unit 120 of FIG. 1. The push-to-talk interface 230 and the far-field interface 240 may correspond to the remote control input interface 160 of FIG. 1.

음성 수신 모듈(210)은 외부에서 전달되는 음성을 수신하고, 수신된 음성을 전기적인 신호로 변환할 수 있다. 예시도에 따른 음성 인식 리모콘은 두 개의 마이크를 포함할 수 있다. 이 경우, 하나의 마이크는 미리 정해진 거리보다 먼 거리에서 전달되는 음성을 수신하도록 동작하는 반면, 나머지 하나의 마이크는 미리 정해진 거리보다 가까운 거리에서 전달되는 음성을 수신하도록 동작할 수 있다.The voice receiving module 210 may receive voice transmitted from the outside and convert the received voice into an electrical signal. The voice recognition remote control according to the exemplary diagram may include two microphones. In this case, one microphone may operate to receive a voice transmitted from a distance greater than a predetermined distance, while the other microphone may operate to receive a voice transmitted from a distance closer than a preset distance.

충전용 USB 커넥터(220)는 충전 장치와 연결되어 배터리(222)에 대한 충전을 수행하는 접속부일 수 있다. 충전용 USB 커넥터(220)에 연결되는 충전 장치는 보조 배터리 및 충전기 등 다양한 형태의 장치를 포함할 수 있다.The charging USB connector 220 may be a connection part connected to the charging device to perform charging for the battery 222. The charging device connected to the charging USB connector 220 may include various types of devices such as an auxiliary battery and a charger.

예시도에 따른 충전용 USB 커넥터(220)는 마이크로 5핀 단자에 연결되는 접속부일 수 있다. 다만, 이는 예시적인 것이며, 충전용 USB 커넥터(220)는 마이크로 5핀 단자와 연결되는 접속부 외에도 C타입 단자와 연결되는 접속부 또는 라이트닝 8핀 단자와 연결되는 접속부 등 다양한 종류의 단자와 연결될 수도 있다.The USB connector 220 for charging according to the exemplary diagram may be a connection part connected to a micro 5-pin terminal. However, this is exemplary, and the USB connector 220 for charging may be connected to various types of terminals such as a connection part connected to a C-type terminal or a connection part connected to a Lightning 8-pin terminal in addition to a connection part connected to the micro 5-pin terminal.

LED 소자(221)는 리튬 배터리(222)의 충전 여부 및 완충 상태를 표시하는 소자일 수 있다. 예시도에 따른 LED 소자(221)는 비 충전 시에는 발광하지 않고, 충전이 진행중일 때는 간헐적으로 발광하며, 완충 상태에서는 계속하여 발광할 수 있다. 다만, 이는 예시적인 것이며, LED 소자(221)의 발광 형태는 다양하게 정의될 수 있고, LED 소자(221)는 충전 여부 및 완충 상태의 구별을 위하여 서로 다른 색을 발광할 수도 있다.The LED device 221 may be a device that displays whether or not the lithium battery 222 is charged and a fully charged state. The LED device 221 according to the exemplary diagram does not emit light when not charged, intermittently emit light when charging is in progress, and may continue to emit light in a fully charged state. However, this is exemplary, and the light emission form of the LED element 221 may be defined in various ways, and the LED element 221 may emit different colors to distinguish between charging status and charging status.

배터리(222)는 충전용 USB 커넥터(220)에 충전 장치가 연결됨으로써 충전이 이루어지고, 음성 인식 리모콘의 각 구성 요소에 전원을 공급하면서 방전이 이루어지는 장치일 수 있다. 배터리(222)는 그 충전 및 방전이 원활하게 이루어지도록 배터리 커텍터(223)에 고정된 상태로 보관될 수 있다.The battery 222 may be a device in which charging is performed by connecting a charging device to the charging USB connector 220 and discharged while supplying power to each component of the voice recognition remote control. The battery 222 may be stored in a state fixed to the battery connector 223 so that charging and discharging thereof are smoothly performed.

예시도에 따른 배터리(222)는 리튬 전지일 수 있다. 다만, 배터리(222)는 리튬 전지 외에도 납 전지, 금속공기전지 등 다양한 형태의 전지를 포함할 수 있다.The battery 222 according to the exemplary diagram may be a lithium battery. However, the battery 222 may include various types of batteries such as lead batteries and metal-air batteries in addition to lithium batteries.

푸시 투 토크 인터페이스(230)는 사용자 입력에 반응하여 푸시 투 토크 모드를 유지시키는 인터페이스일 수 있다. 예시도에 따르면, 푸시 투 토크 인터페이스(230)는 스위치 형태로 구현될 수 있다. 이 경우, 푸시 투 토크 인터페이스(230)가 윗 방향으로 리모콘의 앞 방향으로 푸시(push)되는 동안 푸시 투 토크 모드가 유지될 수 있다. 푸시 투 토크 모드는 도 1의 푸시 투 토크 모드에 대응될 수 있다. 푸시 투 토크 모드가 유지되는 경우, 사용자는 도 1의 호출어 인식 모듈(130)에서 호출어의 발화 여부가 판단되지 않을 수 있다. 다만, 푸시 투 토크 인터페이스(230)는 스위치 외에도 버튼이나 음성 인식 모듈 등의 다양한 형태를 포함할 수 있고, 그 형태에 따라 구동 방식도 달라질 수 있다.The push-to-talk interface 230 may be an interface that maintains a push-to-talk mode in response to a user input. According to the exemplary diagram, the push-to-talk interface 230 may be implemented in the form of a switch. In this case, the push-to-talk mode may be maintained while the push-to-talk interface 230 is pushed upwardly toward the front of the remote controller. The push-to-talk mode may correspond to the push-to-talk mode of FIG. 1. When the push-to-talk mode is maintained, the user may not determine whether the caller is spoken in the caller recognition module 130 of FIG. 1. However, the push-to-talk interface 230 may include various forms such as a button or a voice recognition module in addition to a switch, and a driving method may vary according to the form.

파필드 인터페이스(240)는 외부에서 전달되는 음성 및 사용자 입력과 구별되는 제2 사용자 입력에 반응하여 도 1의 호출어 인식 모듈(130)을 활성화 또는 비활성화하는 인터페이스일 수 있다. 예시도에 따르면, 파필드 인터페이스(240)는 버튼 형태로 구현될 수 있다. 이 경우, 파필드 인터페이스(240)를 한 번 누르면 파필드 모드(far-field mode)가 유지될 수 있고, 파필드 인터페이스(240)를 한 번 더 누르면 파필드 모드(far-field mode)가 유지되지 않을 수 있다. 파필드 모드(far-field mode)가 유지되는 동안 도 1의 호출어 인식 모듈(130)이 활성화될 수 있다. 다만, 파필드 인터페이스(240)는 버튼 외에도 스위치나 음성 인식 모듈 등의 다양한 형태를 포함할 수 있고, 그 형태에 따라 구동 방식도 달라질 수 있다.The farfield interface 240 may be an interface that activates or deactivates the caller recognition module 130 of FIG. 1 in response to a second user input distinguished from a voice transmitted from the outside and a user input. According to the exemplary diagram, the far field interface 240 may be implemented in the form of a button. In this case, if the far field interface 240 is pressed once, the far-field mode can be maintained, and if the far field interface 240 is pressed once more, the far-field mode is maintained. May not be. While the far-field mode is maintained, the pager recognition module 130 of FIG. 1 may be activated. However, the farfield interface 240 may include various forms such as a switch or a voice recognition module in addition to a button, and a driving method may vary according to the form.

푸시 투 토크 모드 및 파필드 모드와 관련된 보다 상세한 사항은 도 3을 통하여 후술한다.More details related to the push-to-talk mode and the far field mode will be described later with reference to FIG. 3.

도 3은 일실시예에 따른 사용자 입력에 따른 호출어 인식 모듈 및 근거리 통신 모듈의 동작을 설명하기 위한 도면이다.3 is a diagram for explaining the operation of a call word recognition module and a short range communication module according to a user input according to an embodiment.

도 3을 참조하면, 외부에서 전달되는 음성과 구별되는 사용자의 입력에 의하여 푸시 투 토크 모드(320)가 유지될 수 있다. 또한, 외부에서 전달되는 음성 및 사용자 입력과 구별되는 제2 사용자 입력에 의하여, 파필드 모드(310)가 유지될 수 있다.Referring to FIG. 3, the push-to-talk mode 320 may be maintained by a user input that is distinguished from a voice transmitted from the outside. In addition, the far field mode 310 may be maintained by a voice transmitted from the outside and a second user input that is distinguished from the user input.

도 1의 호출어 인식 모듈(130)이 외부에서 전달되는 음성을 변환한 전기적인 신호를 도 1의 음성 수신 모듈(110)로부터 수신하기 위해서는 파필드 모드가 유지되는 상태(ON)여야 할 수 있다. 따라서, 파필드 모드(310)가 유지되지 않는 상태(OFF)인 경우, 푸시 투 토크 모드(320)의 상태와 관계없이 호출어 인식(330)이 수행되지 않을 수 있다.In order for the caller recognition module 130 of FIG. 1 to receive the electrical signal converted from the voice transmitted from the outside from the voice receiving module 110 of FIG. 1, the far field mode may be maintained (ON). . Accordingly, when the far field mode 310 is not maintained (OFF), the call word recognition 330 may not be performed regardless of the state of the push-to-talk mode 320.

파필드 모드(310)가 유지되는 상태(ON)인 경우, 도 1의 호출어 인식 모듈(130)은 활성화될 수 있다. 이 경우, 도 1의 호출어 인식 모듈(130)은 외부에서 전달되는 음성을 변환한 전기적인 신호를 도 1의 음성 수신 모듈(110)로부터 수신할 수 있다. 다만, 도 1의 호출어 인식 모듈(130)은 호출어의 발화 여부를 판단하기 이전에, 푸시 투 토크 모드(320)가 유지되는지 여부를 먼저 판단한다.When the far field mode 310 is maintained (ON), the pager recognition module 130 of FIG. 1 may be activated. In this case, the caller recognition module 130 of FIG. 1 may receive an electrical signal converted from an external voice from the voice receiving module 110 of FIG. 1. However, before determining whether the caller is spoken, the caller recognition module 130 of FIG. 1 first determines whether the push-to-talk mode 320 is maintained.

푸시 투 토크 모드(320)가 유지되는 경우, 호출어 인식(330)이 수행되지 않는다. 대신, 도 1의 호출어 인식 모듈(130)은 푸시 투 토크 모드(320)가 유지되는 동안 근거리 통신(340)을 수행한다. 이 경우, 도 1의 호출어 인식 모듈(130)은 도 1의 음성 수신 모듈(110)로부터 수신되는 전기적인 신호를 외부 장치로 전송하도록 도 1의 근거리 통신 모듈(140)을 제어할 수 있다.When the push-to-talk mode 320 is maintained, the pager recognition 330 is not performed. Instead, the pager recognition module 130 of FIG. 1 performs short-range communication 340 while the push-to-talk mode 320 is maintained. In this case, the caller recognition module 130 of FIG. 1 may control the short-range communication module 140 of FIG. 1 to transmit an electrical signal received from the voice receiving module 110 of FIG. 1 to an external device.

푸시 투 토크 모드(320)가 유지되지 않는 경우, 호출어 인식(330)이 수행된다. 이 경우, 도 1의 호출어 인식 모듈(130) 도 1의 음성 수신 모듈(110)로부터 수신되는 전기적인 신호에 기초하여 외부에서 전달되는 음성에 미리 정해진 호출어가 포함되는지 여부를 판단하고, 호출어가 포함된다고 판단되는 경우, 호출어 이후에 발화되는 음성의 전기적인 신호를 외부 장치로 전송하도록 도 1의 근거리 통신 모듈(140)을 제어할 수 있다.When the push-to-talk mode 320 is not maintained, page word recognition 330 is performed. In this case, the caller recognition module 130 of FIG. 1 determines whether or not a predetermined call word is included in the voice transmitted from the outside based on an electrical signal received from the voice reception module 110 of FIG. 1, and the call word is If it is determined to be included, the short-range communication module 140 of FIG. 1 may be controlled to transmit an electrical signal of a voice spoken after a pager to an external device.

도 4는 일실시예에 따른 음성 인식 리모콘의 구조를 설명하기 위한 예시도이다.4 is an exemplary diagram for explaining the structure of a voice recognition remote control according to an embodiment.

도 4를 참조하면, 일실시예에 따른 음성 인식 리모콘의 PCB는 상단 PCB(UPPER PCB) 및 하단 PCB(LOWER PCB)로 구성될 수 있다. 상단 PCB는 음성 수신 모듈(410), 디지털 신호 프로세서(430), 및 블루투스 모듈(440) 등을 포함할 수 있다. 음성 수신 모듈(410)은 도 1의 음성 수신 모듈(110)에 대응될 수 있고, 디지털 신호 프로세서(430)는 도 1의 호출어 인식 모듈(130)에 대응될 수 있고, 블루투스 모듈(440)은 도 1의 근거리 통신 모듈(140)에 대응될 수 있다. 하단 PCB는 전원부(420) 및 오디오 스트리밍 모듈(450) 등을 포함할 수 있다. 전원부(420)는 도 1의 전원부(120)에 대응될 수 있고, 오디오 스트리밍 모듈(450)은 도 1의 출력부(150)에 대응될 수 있다.Referring to FIG. 4, the PCB of the voice recognition remote control according to an embodiment may be composed of an upper PCB (PCB) and a lower PCB (LOWER PCB). The upper PCB may include a voice receiving module 410, a digital signal processor 430, and a Bluetooth module 440. The voice receiving module 410 may correspond to the voice receiving module 110 of FIG. 1, the digital signal processor 430 may correspond to the caller recognition module 130 of FIG. 1, and the Bluetooth module 440 May correspond to the short-range communication module 140 of FIG. 1. The lower PCB may include a power supply unit 420 and an audio streaming module 450. The power supply unit 420 may correspond to the power supply unit 120 of FIG. 1, and the audio streaming module 450 may correspond to the output unit 150 of FIG. 1.

음성 수신 모듈(410), 전원부(420), 디지털 신호 프로세서(430), 블루투스 모듈(440), 및 오디오 스트리밍 모듈(450)은 각기 독립적으로 작동할 수 있다. 일실시예에 따르면, 410 내지 450의 모듈 또는 장치들 각각은 그 기능의 일부 또는 전부가 독립적으로 활성화 또는 비활성화될 수 있다. 예를 들어, 파필드 모드가 유지되지 않는 경우, 디지털 신호 프로세서(430) 기능의 일부 또는 전부는 비활성화될 수 있다. 모듈 또는 장치들 각각의 기능의 일부 또는 전부가 독립적으로 활성화 또는 비활성화됨으로써, 불필요한 전력 소모를 방지할 수 있다.The voice receiving module 410, the power supply unit 420, the digital signal processor 430, the Bluetooth module 440, and the audio streaming module 450 may operate independently. According to an embodiment, each of the modules or devices of 410 to 450 may independently activate or deactivate some or all of its functions. For example, if the far field mode is not maintained, some or all of the functions of the digital signal processor 430 may be deactivated. Some or all of the functions of the modules or devices are independently activated or deactivated, thereby preventing unnecessary power consumption.

상단 PCB와 관련하여, 음성 수신 모듈(410)은 하나 이상의 마이크를 포함하며, 외부에서 전달되는 음성을 수신하고, 수신된 음성을 전기적인 신호로 변환할 수 있다. 일실시예에 따르면, 음성 수신 모듈(410)이 포함하는 하나 이상의 마이크는 MEMS 기술이 적용된 마이크일 수 있다. 음성 수신 모듈(410)은 변환된 전기적인 신호를 디지털 신호 프로세서(430)로 전송할 수 있다.With respect to the upper PCB, the voice receiving module 410 includes one or more microphones, receives voice transmitted from the outside, and converts the received voice into an electrical signal. According to an embodiment, one or more microphones included in the voice receiving module 410 may be a microphone to which MEMS technology is applied. The voice receiving module 410 may transmit the converted electrical signal to the digital signal processor 430.

디지털 신호 프로세서(430)는 미리 정해진 호출어의 발화 여부를 인식할 수 있다. 디지털 신호 프로세서(430)는 전원부(420)로부터 전원을 공급받을 수 있으며, 디지털 신호 프로세서(430)가 공급받는 전원은 로드 스위치(Load Switch)에 의하여 그 공급이 제어될 수 있다. 디지털 신호 프로세서(430)는 동작 과정에 있어서 플래시 메모리(Serial Flash)와 데이터를 교환할 수 있다.The digital signal processor 430 may recognize whether or not a predetermined page word is spoken. The digital signal processor 430 may be supplied with power from the power supply unit 420, and the supply of the power supplied by the digital signal processor 430 may be controlled by a load switch. The digital signal processor 430 may exchange data with a flash memory (Serial Flash) during an operation process.

실시예에 따라, 블루투스 모듈(440)은 키 매트릭스(Key Matrix)로부터 파필드 모드의 유지 여부를 지시하는 사용자 입력을 포함하는 다양한 사용자 입력들을 수신할 수 있다. 또한, 블루투스 모듈(440)은 슬라이드 스위치(SLIDE SWITCH)로부터 푸시 투 토크 모드의 유지 여부를 지시하는 사용자 입력을 수신할 수 있다. 슬라이드 스위치는 도 2의 푸시 투 토크 인터페이스(230)에 대응될 수 있고, 키 매트릭스는 도 2의 파필드 인터페이스(240)를 포함할 수 있다. 블루투스 모듈(440)은 파필드 모드의 유지 여부 및 푸시 투 토크 모드의 유지 여부를 디지털 프로세서(430)로 전달할 수 있다. 디지털 프로세서(430)는 호출어의 발화 여부, 파필드 모드의 유지 여부, 및 푸시 투 토크 모드의 유지 여부의 조합에 기초하여 블루투스 모듈(440)을 제어할 수 있다.According to an embodiment, the Bluetooth module 440 may receive various user inputs including a user input indicating whether to maintain the far field mode from a key matrix. In addition, the Bluetooth module 440 may receive a user input indicating whether to maintain the push-to-talk mode from a slide switch (SLIDE SWITCH). The slide switch may correspond to the push-to-talk interface 230 of FIG. 2, and the key matrix may include the far field interface 240 of FIG. 2. The Bluetooth module 440 may transmit whether to maintain the far field mode and whether to maintain the push-to-talk mode to the digital processor 430. The digital processor 430 may control the Bluetooth module 440 based on a combination of whether the caller is spoken, whether the far field mode is maintained, and whether the push-to-talk mode is maintained.

블루투스 모듈(440)은 디지털 신호 프로세서(430)의 제어에 따라 외부 장치와 통신할 수 있다. 일실시예에 따르면, 블루투스 모듈(440)은 외부 장치와 통신하기 위하여 2.4 GHz Antenna를 이용할 수 있다. 실시예에 따라, 블루투스 모듈(440)은 빛으로 구동 상태를 표시하기 위하여 IR LED를 이용하거나, 소리로 구동 상태를 표시하기 위하여 버저(Buzzer)를 이용할 수 있다.The Bluetooth module 440 may communicate with an external device under the control of the digital signal processor 430. According to an embodiment, the Bluetooth module 440 may use a 2.4 GHz antenna to communicate with an external device. Depending on the embodiment, the Bluetooth module 440 may use an IR LED to display a driving state with light, or use a buzzer to display a driving state with sound.

하단 PCB와 관련하여, 전원부(420)는 재충전가능한 배터리(Rechargeable Battery), 집적회로(IC), 강압 변환기(Stepdown Converter), 및 로드 스위치(Load Switch)를 포함할 수 있다. 배터리는 집적회로를 통하여 충전 장치로부터 충전될 수 있다. 또한, 배터리는 집적회로를 통하여 리모콘의 구성 요소를 충전할 수 있다. 실시예에 따라, 배터리에서 집적회로로 전달된 전원은 리모콘의 구성 요소를 충전하기 이전에, 강압 변환기 및 로드 스위치로 먼저 전달될 수 있다. 구체적으로, 강압 변환기로 전달된 전원은 그 전압이 일정한 값(예를 들어, 3.3V)으로 조정될 수 있다. 또한, 로드 스위치로 전달된 전원은 그 공급이 제어될 수 있다.With respect to the lower PCB, the power supply unit 420 may include a rechargeable battery, an integrated circuit (IC), a stepdown converter, and a load switch. The battery can be charged from the charging device through an integrated circuit. In addition, the battery can charge the components of the remote control through the integrated circuit. Depending on the embodiment, power delivered from the battery to the integrated circuit may be first delivered to the step-down converter and the load switch before charging the components of the remote controller. Specifically, the voltage of the power delivered to the step-down converter may be adjusted to a constant value (eg, 3.3V). Also, the supply of power delivered to the load switch can be controlled.

오디오 스트리밍 모듈(450)은 플랫폼으로부터 외부 장치를 통해 피드백 정보를 수신하고, 수신된 피드백 정보를 출력할 수 있다. 일실시예에 따르면, 오디오 스트리밍 모듈(450)은 외부 장치와 통신하기 위하여 2.4 GHz Antenna를 이용할 수 있다. 오디오 스트리밍 모듈(450)은 동작 과정에 있어서 플래시 메모리(Serial Flash)와 데이터를 교환할 수 있다.The audio streaming module 450 may receive feedback information from a platform through an external device, and may output the received feedback information. According to an embodiment, the audio streaming module 450 may use a 2.4 GHz antenna to communicate with an external device. The audio streaming module 450 may exchange data with a flash memory (Serial Flash) during an operation process.

오디오 스트리밍 모듈(450)은 오디오 앰프(Audio AMP)를 통하여 수신된 피드백 정보를 증폭시킬 수 있다. 오디오 앰프에 이어 잭(EAR Jack)이 연결되면, 연결된 이어잭을 통하여 피드백 정보 및 서비스 결과가 출력될 수 있다. 실시예에 따라, 오디오 앰프에 이어잭이 연결되었음을 알리는 정보가 블루투스 모듈(440)로 전달될 수 있다.The audio streaming module 450 may amplify feedback information received through an audio amplifier. When an EAR jack is connected to the audio amplifier, feedback information and service results may be output through the connected ear jack. Depending on the embodiment, information indicating that the ear jack is connected to the audio amplifier may be transmitted to the Bluetooth module 440.

상단 PCB 및 하단 PCB는 커넥터를 통하여 연결될 수 있다. 커넥터를 통하여, 상단 PCB가 포함하는 구성 요소들 및 하단 PCB가 포함하는 구성 요소들 간의 상호작용이 이루어질 수 있다. 예를 들어, 하단 PCB가 포함하는 전원부(420)는 커넥터를 통하여 상단 PCB가 포함하는 블루투스 모듈(440) 및 디지털 신호 프로세서(430) 등에 전원을 공급할 수 있다.The upper PCB and the lower PCB can be connected through connectors. Through the connector, the components included in the upper PCB and the components included in the lower PCB may interact. For example, the power unit 420 included in the lower PCB may supply power to the Bluetooth module 440 and the digital signal processor 430 included in the upper PCB through a connector.

도 5는 일실시예에 따른 호출어 인식 모듈의 동작 방법을 설명하기 위한 동작 흐름도이다.5 is a flowchart illustrating an operation method of a call word recognition module according to an embodiment.

도 5를 참조하면, 호출어 인식 모듈은 외부에서 전달되는 음성을 변환한 전기적인 신호를 음성 수신 모듈로부터 수신한다(510). 호출어 인식 모듈은 도 1의 호출어 인식 모듈(130)에 대응될 수 있고, 음성 수신 모듈은 도 1의 음성 수신 모듈(110)에 대응될 수 있다.Referring to FIG. 5, the pager recognition module receives an electrical signal converted from an external voice from the voice receiving module (510). The pager recognition module may correspond to the pager recognition module 130 of FIG. 1, and the voice receiving module may correspond to the voice receiving module 110 of FIG. 1.

호출어 인식 모듈은 외부에서 전달되는 음성과 구별되는 사용자 입력에 반응하여 푸시 투 토크 모드(사용자 입력에 의한 모드)가 유지되는지 여부를 판단한다(520). 푸시 투 토크 모드가 유지되는 경우, 호출어 인식 모듈은 음성 수신 모듈로부터 수신되는 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈을 제어한다(550). 근거리 통신 모듈은 도 1의 근거리 통신 모듈(140)에 대응될 수 있다.The pager recognition module determines whether or not the push-to-talk mode (mode by user input) is maintained in response to a user input distinguished from a voice transmitted from the outside (520). When the push-to-talk mode is maintained, the pager recognition module controls the short-range communication module to transmit an electrical signal received from the voice receiving module to an external device (550). The short-range communication module may correspond to the short-range communication module 140 of FIG. 1.

푸시 투 토크 모드가 유지되지 않는 경우, 호출어 인식 모듈은 전기적인 신호에 기초하여, 외부에서 전달되는 음성에 미리 정해진 호출어가 포함되는지 여부를 판단한다(530). 외부에서 전달되는 음성에 미리 정해진 호출어가 포함되지 않는 경우, 호출어 인식 모듈은 단계 510 내지 530을 반복하여 수행한다. 외부에서 전달되는 음성에 미리 정해진 호출어가 포함되는 경우, 호출어 인식 모듈은 호출어 이후에 발화되는 음성의 전기적인 신호를 외부 장치로 전송하도록 근거리 통신 모듈을 제어한다(540).If the push-to-talk mode is not maintained, the pager recognition module determines whether a predetermined pager is included in the voice transmitted from the outside based on the electrical signal (530). When the predetermined call word is not included in the voice transmitted from the outside, the call word recognition module repeats steps 510 to 530. When a predetermined call word is included in the voice transmitted from the outside, the call word recognition module controls the short range communication module to transmit an electrical signal of the voice spoken after the call word to the external device (540).

도 6은 일실시예에 따른 음성 인식 리모콘, 외부 장치, 및 플랫폼이 연동하여 음성 인식을 수행하는 방법을 설명하기 위한 도면이다.6 is a diagram for explaining a method of performing voice recognition by interlocking with a voice recognition remote control, an external device, and a platform according to an embodiment.

도 6을 참조하면, 음성 인식 리모콘은 외부에서 전달되는 음성에 대한 전처리 및 발화어 인식을 수행할 수 있다(610). 구체적으로, 음성 인식 리모콘은 외부에서 전달되는 음성을 수신하여 전기적인 신호로 변환하고, 파필드 모드가 유지되는지 및 푸시 투 토크 모드가 유지되는지 여부에 기초하여 발화어 인식을 수행할 수 있다.Referring to FIG. 6, the voice recognition remote control may perform preprocessing and speech word recognition for voice transmitted from the outside (610). Specifically, the voice recognition remote control may receive a voice transmitted from the outside, convert it into an electrical signal, and perform speech recognition based on whether the far field mode and the push-to-talk mode are maintained.

음성 인식 리모콘은 외부 장치에 서비스 시작을 요청하고, 음성을 변환한 전기적인 신호를 전달할 수 있다(620). 구체적으로, 도 1의 근거리 통신 모듈(140)은 도 1의 호출어 인식 모듈(130)의 제어에 따라, 도 1의 음성 수신 모듈(110)로부터 수신되는 전기적인 신호를 외부 장치로 전송할 수 있다.The voice recognition remote controller may request a service start to an external device and transmit an electrical signal converted from a voice (620). Specifically, the short-range communication module 140 of FIG. 1 may transmit an electrical signal received from the voice receiving module 110 of FIG. 1 to an external device under the control of the caller recognition module 130 of FIG. 1. .

외부 장치는 음성 인식 리모콘으로부터 전달받은 서비스 시작 요청 및 전기적인 신호에 기초하여, 서비스 UI를 노출하고(630), 음성을 변환한 전기적인 신호를 플랫폼으로 전달할 수 있다(640).The external device may expose a service UI based on an electric signal and a service start request received from the voice recognition remote control (operation 630), and may transmit an electric signal converted from voice to the platform (640).

플랫폼은 음성을 변환한 전기적인 신호에 기초하여, 음성 인식 및 의도 분석을 수행할 수 있다(650). 음성 인식 및 의도 분석은 플랫폼 단독으로 수행될 수 있다. 또는, 음성 인식 및 의도 분석은 플랫폼 및 외부 장치가 연동함으로써 수행될 수 있다. 음성 인식 및 의도 분석을 통하여, 음성에 포함된 명령(command)이 인식되고, 인식된 명령에 대응하는 피드백 정보가 생성될 수 있다.The platform may perform speech recognition and intention analysis based on the electrical signal converted from speech (650 ). Speech recognition and intention analysis can be performed by the platform alone. Alternatively, speech recognition and intention analysis may be performed by interlocking the platform and an external device. Through voice recognition and intention analysis, a command included in the voice is recognized, and feedback information corresponding to the recognized command may be generated.

플랫폼은 인식 결과를 외부 장치로 전달할 수 있다(660). 구체적으로, 플랫폼은 음성에 포함된 명령에 대응하는 피드백 정보를 외부 장치로 전달할 수 있다. 도면에는 도시되지 않았으나, 외부 장치는 플랫폼으로부터 수신된 피드백 정보를 음성 인식 리모콘으로 전달할 수 있다. 음성 인식 리모콘이 출력부를 포함하는 경우, 출력부는 외부 장치를 통해 피드백 정보를 수신하고, 수신된 피드백 정보를 출력할 수 있다. 출력부는 도 1의 출력부(150)에 대응될 수 있다.The platform may transmit the recognition result to an external device (660). Specifically, the platform may transmit feedback information corresponding to a command included in the voice to an external device. Although not shown in the drawing, the external device may transmit the feedback information received from the platform to the voice recognition remote controller. When the voice recognition remote control includes an output unit, the output unit may receive feedback information through an external device and output the received feedback information. The output unit may correspond to the output unit 150 of FIG. 1.

플랫폼으로부터 인식 결과를 전달받은 외부 장치는 사용자를 위한 맞춤 서비스를 제공할 수 있다(670). 필요에 따라, 외부 장치는 서비스 결과를 음성 인식 리모콘으로 전달할 수 있다(680). 이 경우, 음성 인식 리모콘에서 서비스 결과가 안내될 수 있고, 서비스가 제공될 수도 있다(690). 설계에 따라, 음성 인식 리모콘이 출력부를 더 포함하는 경우, 서비스 결과는 출력부에서 안내될 수 있다.The external device receiving the recognition result from the platform may provide a customized service for the user (670 ). If necessary, the external device may transmit the service result to the voice recognition remote controller (680). In this case, a service result may be guided by the voice recognition remote controller, and a service may be provided (690). According to the design, when the voice recognition remote control further includes an output unit, the service result may be guided by the output unit.

이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The embodiments described above may be implemented as a hardware component, a software component, and/or a combination of a hardware component and a software component. For example, the devices, methods, and components described in the embodiments include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate (FPGA). array), programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions, such as one or more general purpose computers or special purpose computers. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. In addition, the processing device may access, store, manipulate, process, and generate data in response to the execution of software. For the convenience of understanding, although it is sometimes described that one processing device is used, one of ordinary skill in the art, the processing device is a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of these, configuring the processing unit to behave as desired or processed independently or collectively. You can command the device. Software and/or data may be interpreted by a processing device or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. , Or may be permanently or temporarily embodyed in a transmitted signal wave. The software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operation of the embodiment, and vice versa.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described by the limited drawings, a person of ordinary skill in the art can apply various technical modifications and variations based on the above. For example, the described techniques are performed in a different order from the described method, and/or components such as a system, structure, device, circuit, etc. described are combined or combined in a form different from the described method, or other components Alternatively, even if substituted or substituted by an equivalent, an appropriate result can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and claims and equivalents fall within the scope of the claims to be described later.

Claims (15)

외부 장치를 제어하는 음성 인식 리모콘에 있어서,
외부에서 전달되는 음성(voice)을 수신하고, 상기 음성을 전기적인 신호로 변환하는 음성 수신 모듈;
상기 전기적인 신호에 기초하여 미리 정해진 호출어(wake-up word)의 발화 여부를 판단하고, 상기 음성에 상기 호출어가 포함된다고 판단되는 경우 상기 호출어 이후에 발화되는 상기 음성의 전기적인 신호를 상기 외부 장치로 전송하도록 근거리 통신 모듈을 제어하며, 상기 음성과 구별되는 사용자 입력에 반응하여 상기 사용자 입력에 의한 모드가 유지되는 동안 상기 음성 수신 모듈로부터 수신되는 전기적인 신호를 상기 외부 장치로 전송하도록 상기 근거리 통신 모듈을 제어하는 호출어 인식 모듈;
상기 호출어 인식 모듈의 제어에 따라 상기 외부 장치와 통신하는 근거리 통신 모듈; 및
충방전이 가능한 배터리를 이용하여 전원을 공급하는 전원부
를 포함하고,
상기 음성 및 상기 사용자 입력과 구별되는 제2 사용자 입력에 의해, 상기 호출어 인식 모듈의 활성화 여부를 제어하는 파필드 모드를 제공하고,
상기 파필드 모드에 의해 상기 호출어 인식 모듈이 활성화된 경우, 상기 호출어 인식 모듈은 상기 사용자 입력에 의한 모드가 유지되지 않는 동안 상기 호출어의 발화 여부를 판단하고, 상기 호출어의 발화로 판단되는 경우 상기 전기적인 신호를 상기 외부 장치로 전송하며, 상기 호출어의 발화로 판단되지 않는 경우 상기 사용자 입력에 의한 모드가 유지되는 동안 상기 전기적인 신호를 상기 외부 장치로 전송하고,
상기 파필드 모드에 의해 상기 호출어 인식 모듈이 비활성화된 경우, 상기 호출어 인식 모듈은 상기 호출어의 발화 여부를 판단하지 않고, 상기 사용자 입력에 의한 모드가 유지되는 동안 상기 전기적인 신호를 상기 외부 장치로 전송하는,
음성 인식 리모콘.
In the voice recognition remote control for controlling an external device,
A voice receiving module for receiving a voice transmitted from the outside and converting the voice into an electrical signal;
It is determined whether or not a predetermined wake-up word is uttered based on the electrical signal, and when it is determined that the voice includes the call word, the electrical signal of the voice uttered after the call word is transmitted. The short-range communication module is controlled to transmit to an external device, and in response to a user input distinguished from the voice, the electrical signal received from the voice receiving module is transmitted to the external device while the mode according to the user input is maintained. A pager recognition module that controls a short-range communication module;
A short-range communication module communicating with the external device under the control of the call word recognition module; And
A power supply that supplies power using a battery capable of charging and discharging
Including,
Providing a far field mode for controlling whether or not the caller recognition module is activated based on the voice and a second user input distinguished from the user input,
When the caller recognition module is activated by the far field mode, the caller recognition module determines whether the caller is spoken while the mode by the user input is not maintained, and determines whether the caller is spoken. If yes, the electrical signal is transmitted to the external device, and if it is not determined that the caller is spoken, the electrical signal is transmitted to the external device while the mode according to the user input is maintained,
When the caller recognition module is deactivated by the far field mode, the caller recognition module does not determine whether the caller is uttered, and transmits the electrical signal to the external while the mode according to the user input is maintained. Transmitted to the device,
Voice recognition remote control.
제1항에 있어서,
상기 사용자 입력에 의한 모드가 유지되는 경우, 상기 호출어 인식 모듈에서 상기 호출어의 발화 여부가 판단되지 않는,
음성 인식 리모콘.
The method of claim 1,
When the mode according to the user input is maintained, the caller recognition module does not determine whether the caller is spoken,
Voice recognition remote control.
제1항에 있어서,
상기 음성 수신 모듈은 복수 개의 마이크를 포함하는,
음성 인식 리모콘.
The method of claim 1,
The voice receiving module includes a plurality of microphones,
Voice recognition remote control.
제3항에 있어서,
상기 호출어 인식 모듈이 비활성화되어 있는 경우, 상기 복수 개의 마이크의 적어도 일부는 동작하지 않는,
음성 인식 리모콘.
The method of claim 3,
When the pager recognition module is deactivated, at least some of the plurality of microphones do not operate,
Voice recognition remote control.
제3항에 있어서,
상기 음성이 미리 정해진 거리보다 가까운 거리에서 전달되는 경우, 상기 복수 개의 마이크의 적어도 일부는 동작하지 않는,
음성 인식 리모콘.
The method of claim 3,
When the voice is transmitted at a distance closer than a predetermined distance, at least some of the plurality of microphones do not operate,
Voice recognition remote control.
삭제delete 제1항에 있어서,
상기 외부 장치는 셋톱박스(set top box)를 포함하는,
음성 인식 리모콘.
The method of claim 1,
The external device includes a set top box,
Voice recognition remote control.
제1항에 있어서,
상기 외부 장치에서 외부의 플랫폼과 연동함으로써 음성 인식이 수행되는,
음성 인식 리모콘.
The method of claim 1,
Voice recognition is performed by interlocking with an external platform in the external device,
Voice recognition remote control.
제8항에 있어서,
상기 플랫폼에서 상기 음성에 포함된 명령(command)이 인식되고,
상기 명령에 대응하는 피드백 정보가 생성되는,
음성 인식 리모콘.
The method of claim 8,
The platform recognizes a command included in the voice,
Feedback information corresponding to the command is generated,
Voice recognition remote control.
제8항에 있어서,
상기 플랫폼으로부터 상기 외부 장치를 통해 상기 음성에 포함된 명령에 대응하는 피드백 정보를 수신하고,
상기 피드백 정보를 출력하는 출력부
를 더 포함하는,
음성 인식 리모콘.
The method of claim 8,
Receiving feedback information corresponding to the command included in the voice through the external device from the platform,
An output unit that outputs the feedback information
Further comprising,
Voice recognition remote control.
외부 장치를 제어하는 음성 인식 리모콘의 호출어 인식 방법에 있어서,
외부에서 전달되는 음성(voice)을 변환한 전기적인 신호를 수신하는 단계;
상기 음성과 구별되는 사용자 입력에 반응하여 상기 사용자 입력에 의한 모드 및 상기 음성 및 상기 사용자 입력과 구별되는 제2 사용자 입력에 의한 호출어의 발화 여부를 판단하기 위한 파필드 모드가 유지되는지 여부를 판단하는 단계;
상기 파필드 모드가 유지되고 상기 사용자 입력에 의한 모드가 유지되는 경우,
상기 전기적인 신호를 상기 외부 장치로 전송하는 단계;
상기 파필드 모드가 유지되고 상기 사용자 입력에 의한 모드가 유지되지 않는 경우,
상기 전기적인 신호에 기초하여 상기 음성에 미리 정해진 호출어(wake-up word)가 포함되는지 여부를 판단하는 단계;
상기 음성에 상기 호출어가 포함된다고 판단되는 경우 상기 호출어 이후에 발화되는 음성의 전기적인 신호를 상기 외부 장치로 전송하는 단계; 및
상기 파필드 모드가 유지되지 않고 상기 사용자 입력에 의한 모드가 유지되는 경우,
상기 전기적인 신호를 상기 외부 장치로 전송하는 단계;
를 포함하는, 호출어 인식 방법.
In the method of recognizing a call word of a voice recognition remote control for controlling an external device,
Receiving an electrical signal converted from an external voice;
In response to a user input distinguished from the voice, it is determined whether a mode according to the user input and a far field mode for determining whether a caller is uttered by the voice and a second user input distinguished from the user input are maintained. Step to do;
When the far field mode is maintained and the mode by the user input is maintained,
Transmitting the electrical signal to the external device;
When the far field mode is maintained and the mode by the user input is not maintained,
Determining whether or not a predetermined wake-up word is included in the voice based on the electrical signal;
Transmitting an electrical signal of a voice spoken after the call word to the external device when it is determined that the voice includes the call word; And
If the far field mode is not maintained and the mode by the user input is maintained,
Transmitting the electrical signal to the external device;
Containing, caller recognition method.
삭제delete 제11항에 있어서,
상기 외부 장치는 셋톱박스를 포함하는,
호출어 인식 방법.
The method of claim 11,
The external device includes a set-top box,
Caller recognition method.
제11항에 있어서,
상기 외부 장치에서 외부의 플랫폼과 연동함으로써 음성 인식이 수행되는,
호출어 인식 방법.
The method of claim 11,
Voice recognition is performed by interlocking with an external platform in the external device,
Caller recognition method.
제14항에 있어서,
상기 외부 장치에서 상기 음성에 포함된 명령(command)이 인식되고,
상기 명령에 대응하는 피드백 신호가 생성되는,
호출어 인식 방법.
The method of claim 14,
The external device recognizes a command included in the voice,
A feedback signal corresponding to the command is generated,
Caller recognition method.
KR1020190029291A 2019-03-14 2019-03-14 Remote control for speech recognition and method thereof KR102161913B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190029291A KR102161913B1 (en) 2019-03-14 2019-03-14 Remote control for speech recognition and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190029291A KR102161913B1 (en) 2019-03-14 2019-03-14 Remote control for speech recognition and method thereof

Publications (2)

Publication Number Publication Date
KR20200109742A KR20200109742A (en) 2020-09-23
KR102161913B1 true KR102161913B1 (en) 2020-10-05

Family

ID=72708913

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190029291A KR102161913B1 (en) 2019-03-14 2019-03-14 Remote control for speech recognition and method thereof

Country Status (1)

Country Link
KR (1) KR102161913B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022266367A1 (en) * 2021-06-16 2022-12-22 Roku, Inc. Voice control device with push-to-talk (ptt) and mute controls
US12033625B2 (en) 2021-06-16 2024-07-09 Roku, Inc. Voice control device with push-to-talk (PTT) and mute controls

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496704B (en) * 2021-07-29 2024-05-24 康佳集团股份有限公司 Far-field voice control method, terminal and computer readable storage medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150004051A (en) * 2013-07-02 2015-01-12 엘지전자 주식회사 Method for controlling remote controller and multimedia device
KR20150040445A (en) * 2013-10-07 2015-04-15 삼성전자주식회사 remote control apparatus for inputting user voice and method thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022266367A1 (en) * 2021-06-16 2022-12-22 Roku, Inc. Voice control device with push-to-talk (ptt) and mute controls
US12033625B2 (en) 2021-06-16 2024-07-09 Roku, Inc. Voice control device with push-to-talk (PTT) and mute controls

Also Published As

Publication number Publication date
KR20200109742A (en) 2020-09-23

Similar Documents

Publication Publication Date Title
KR102490376B1 (en) Electronic apparatus and Method of executing a function by speech recognition between the electronic apparatus
KR102161913B1 (en) Remote control for speech recognition and method thereof
KR102592769B1 (en) Electronic device and operating method thereof
KR20210016815A (en) Electronic device for managing a plurality of intelligent agents and method of operating thereof
US20210160618A1 (en) Electronic device, method, and system for converting digital audio signal received in wired or wireless manner into analog audio signal
US20230032366A1 (en) Method and apparatus for wireless connection between electronic devices
KR20200086536A (en) Electronic device and method for identifying input
US11204882B2 (en) Electronic device for controlling external conversion device
KR102629796B1 (en) An electronic device supporting improved speech recognition
KR20190101249A (en) Power converter and method for converting power
US11361750B2 (en) System and electronic device for generating tts model
US20230259188A1 (en) Electronic device comprising connector
US20230126305A1 (en) Method of identifying target device based on reception of utterance and electronic device therefor
KR20210061091A (en) Electronic device for providing intelligent assistance service and operating method thereof
CN104871241A (en) Voice recognition device
KR102214661B1 (en) Sound systme using wireless erabuds and charging cradle
CN114121002A (en) Electronic equipment, interactive module, control method and control device of interactive module
KR101465967B1 (en) Dongle type digital device control system capable of interface expanding using smart terminal
KR20210125356A (en) An electronic apparatus and a method of operating the electronic apparatus
US20230410788A1 (en) Method for providing group call service, and electronic device supporting same
US20230260512A1 (en) Electronic device and method of activating speech recognition service
KR20240039565A (en) Electronic device and method for processing user utterance thereof
KR20240039562A (en) Electronic device and method for providing operating state of pluralitiy of devices
KR20220125566A (en) Electronic device and method for connecting device thereof
KR20230064504A (en) Electronic device for providing voice recognition service and operating method thereof

Legal Events

Date Code Title Description
GRNT Written decision to grant