WO2019035504A1 - 이동 단말기 및 그 제어 방법 - Google Patents

이동 단말기 및 그 제어 방법 Download PDF

Info

Publication number
WO2019035504A1
WO2019035504A1 PCT/KR2017/009496 KR2017009496W WO2019035504A1 WO 2019035504 A1 WO2019035504 A1 WO 2019035504A1 KR 2017009496 W KR2017009496 W KR 2017009496W WO 2019035504 A1 WO2019035504 A1 WO 2019035504A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
speaker
screen
microphone
pattern
Prior art date
Application number
PCT/KR2017/009496
Other languages
English (en)
French (fr)
Inventor
송영훈
양승민
김성호
김준엽
정우수
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of WO2019035504A1 publication Critical patent/WO2019035504A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/667Preventing unauthorised calls from a telephone set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Definitions

  • the present invention relates to a mobile terminal and a control method thereof, in which usage of a terminal can be realized by further considering convenience of a user.
  • a terminal can be divided into a mobile terminal (mobile / portable terminal) and a stationary terminal according to whether the terminal can be moved.
  • the mobile terminal can be divided into a handheld terminal and a vehicle mounted terminal according to whether the user can directly carry the mobile terminal.
  • the functions of mobile terminals are diversified. For example, there are data and voice communication, photographing and video shooting through a camera, voice recording, music file playback through a speaker system, and outputting an image or video on a display unit.
  • Some terminals are equipped with an electronic game play function or a multimedia player function.
  • modern mobile terminals can receive multicast signals that provide visual content such as broadcast and video or television programs.
  • Such a terminal has various functions, for example, in the form of a multimedia device having multiple functions such as photographing and photographing of a moving picture, reproduction of a music or video file, reception of a game and broadcasting, etc. .
  • speech recognition technology can be a technology that can provide more convenience in daily life if it is activated.
  • Speech recognition technology is the implementation of a machine that can receive voice information and perform appropriate actions and conversations according to the information received. Speech recognition research has been conducted for a long time with the goal of realizing a machine that naturally communicates with humans. Speech recognition technology, which can naturally recognize an arbitrary speaker's voice under a given environment, has not yet been completed, but speech recognition technology is still applied to various applications.
  • voice-based services are emerging as the development of smartphone technology recently.
  • accurate speech recognition technology is required and a method for adapting speech recognition technology adaptively according to service characteristics and user settings is needed.
  • the present invention provides a mobile terminal and a control method thereof, which are capable of meeting the above-mentioned needs or solving the above-mentioned problems and capable of turning on or off a screen using a user's voice.
  • a mobile terminal including a display unit, a memory storing at least one voice for turning on a screen of the display unit or unlocking the screen, A first pattern of a speaker's voice inputted through the microphone and a second pattern of a speaker's voice inputted through the microphone in a state where the screen is turned off or the screen is locked, When the second pattern of the speaker's voice and the second pattern of the stored voice are secondarily recognized as being matched with each other, the screen is turned on or the screen is locked And a control unit for releasing it.
  • the controller displays information indicating that the screen is turned on or the screen can be unlocked through voice recognition when the screen lock is set on the mobile terminal, and if the screen lock is not set on the mobile terminal
  • the information requesting the lock setting of the screen can be displayed so that the screen can be turned on or the screen can be unlocked through the voice recognition.
  • At least one voice stored in the memory is stored through a voice registration menu, and when the voice registration menu is selected, the controller receives a speaker voice at least twice through the microphone, If the speaker's voice is recognized as the same voice, the same voice can be stored in the memory as the screen turn-on or the voice command for unlocking the screen.
  • control unit may display a setting UI for setting the same voice as a screen turn-on or a voice command for unlocking the screen in the voice registration menu.
  • the controller displays a microphone button in the voice registration menu, and if the speaker voice is not input from the microphone within a preset time, When the microphone button is selected, the microphone is turned on again to perform the voice recording operation of the speaker.
  • the controller may display text information to guide the speaker to speak less than the volume of the current voice if the volume of the speaker's voice inputted through the microphone is equal to or greater than a predetermined volume.
  • the controller may display text information for guiding the speaker to move the place and input voice.
  • the controller may output a voice for storing the recognized speaker's voice in the memory as the screen turning on or the voice for unlocking the screen
  • the registration menu can be displayed.
  • the control unit may mute the specific sound until the speaker voice is recognized through the microphone when a specific sound is being output from the speaker of the mobile terminal at the time when the speaker voice is input through the microphone.
  • At least one voice stored in the memory is further allocated with a function of executing a specific application, and when the recognized speaker voice matches the voice registered in the memory, the controller turns on the screen or locks the screen And at the same time, the specific application can be executed immediately.
  • the at least one voice stored in the memory may include a first voice language for the screen turn on or unlocking the screen and a second voice language for executing a specific application,
  • a first voice language for the screen turn on or unlocking the screen and a second voice language for executing a specific application,
  • the recognized speaker voice includes both the first and second voice words, the user turns on the screen or locks the screen
  • the specific application can be executed immediately.
  • the first pattern of each of the speaker voice and the stored voice includes a keyword pattern corresponding to each of the corresponding voices and the second pattern of each of the speaker voice and the stored voice corresponds to each of the corresponding voices And a keyword pattern of the speaker voice is matched with a keyword pattern of the stored voice when the keyword pattern of the speaker voice is similar to a keyword pattern of the stored voice at a predetermined level or more,
  • the voice pattern of the speaker voice and the voice pattern of the stored voice may be recognized as secondary.
  • the mobile terminal comprises: a buffer for buffering data of speaker voice input from the microphones at predetermined time intervals; and a speaker for analyzing the keyword pattern of the speaker voice input from the microphone, Further comprising a voice recognizer for transmitting a speaker voice buffered in the buffer to the controller if the voice pattern of the voice stored in the memory is equal to or more than a predetermined level,
  • a voice recognizer for transmitting a speaker voice buffered in the buffer to the controller if the voice pattern of the voice stored in the memory is equal to or more than a predetermined level
  • a method of controlling a mobile terminal including the steps of: receiving a speaker voice through a microphone in a state in which a screen of the display unit is turned off or the screen is locked; Determining whether the first pattern of the speaker speech and the first pattern of the stored speech are matched with each other, and, if the first pattern matches the second pattern of the stored speech, And a step of turning on the screen or unlocking the screen if the result of the second determination is matched.
  • a user can easily and quickly turn on and off a screen using his or her own voice, and can also easily and quickly turn on and off a screen And the like.
  • FIG. 1A is a block diagram illustrating a mobile terminal according to the present invention.
  • FIGS. 1B and 1C are conceptual diagrams illustrating an example of a mobile terminal according to the present invention in different directions.
  • FIG. 2 is a flowchart illustrating a control procedure of the mobile terminal for the voice turn-on and voice unlock functions according to the present invention.
  • 3 to 14 are diagrams for explaining a control procedure of the mobile terminal for the voice turn-on and voice unlock functions according to the present invention.
  • the mobile terminal described in this specification includes a mobile phone, a smart phone, a laptop computer, a digital broadcasting terminal, a personal digital assistant (PDA), a portable multimedia player (PMP), a navigation device, a slate PC A tablet PC, an ultrabook, a wearable device such as a smartwatch, a smart glass, and a head mounted display (HMD).
  • PDA personal digital assistant
  • PMP portable multimedia player
  • HMD head mounted display
  • FIG. 1A is a block diagram for explaining a mobile terminal according to the present invention
  • FIGS. 1B and 1C are conceptual diagrams illustrating an example of a mobile terminal according to the present invention in different directions.
  • the mobile terminal 100 includes a wireless communication unit 110, an input unit 120, a sensing unit 140, an output unit 150, an interface unit 160, a memory 170, a control unit 180, ), And the like.
  • the components shown in FIG. 1A are not essential for implementing a mobile terminal, so that the mobile terminal described herein may have more or fewer components than the components listed above.
  • the wireless communication unit 110 may be connected to the wireless communication system 100 between the mobile terminal 100 and another mobile terminal 100 or between the mobile terminal 100 and another mobile terminal 100. [ And one or more modules that enable wireless communication between the network in which the terminal 100, or an external server, is located.
  • the wireless communication unit 110 may include at least one of a broadcast receiving module 111, a mobile communication module 112, a wireless Internet module 113, a short distance communication module 114, and a location information module 115 .
  • the input unit 120 includes a camera 121 or an image input unit for inputting a video signal, a microphone 122 for inputting an audio signal, an audio input unit, a user input unit 123 for receiving information from a user A touch key, a mechanical key, and the like).
  • the voice data or image data collected by the input unit 120 may be analyzed and processed by a user's control command.
  • the codec 130 performs a process of converting the analog voice data input from the microphone 122 into the digital voice data and outputs the voice data to the buffer 122 for buffering the speaker voice data input from the microphone 122 And analyzes the pattern of the keyword corresponding to the speaker voice input from the microphone 122 and analyzes the pattern of the keyword corresponding to the speaker voice input from the microphone 122. If the analyzed keyword pattern is similar to the keyword pattern of the voice registered in the memory 170, And a voice recognizer 132 for transmitting a speaker voice buffered in the voice recognition unit 131 to the control unit 180. Operations of the buffer 131 and the voice recognizer 132 will be described in detail later.
  • the sensing unit 140 may include at least one sensor for sensing at least one of information in the mobile terminal, surrounding environment information surrounding the mobile terminal, and user information.
  • the sensing unit 140 may include a proximity sensor 141, an illumination sensor 142, a touch sensor, an acceleration sensor, a magnetic sensor, A G-sensor, a gyroscope sensor, a motion sensor, an RGB sensor, an infrared sensor, a finger scan sensor, an ultrasonic sensor,
  • the output unit 150 includes at least one of a display unit 151, an acoustic output unit 152, a haptic tip module 153, and a light output unit 154 to generate an output related to visual, auditory, can do.
  • the display unit 151 may have a mutual layer structure with the touch sensor or may be integrally formed to realize a touch screen.
  • the touch screen may function as a user input unit 123 that provides an input interface between the mobile terminal 100 and a user and may provide an output interface between the mobile terminal 100 and a user.
  • the interface unit 160 serves as a path to various types of external devices connected to the mobile terminal 100.
  • the interface unit 160 is connected to a device having a wired / wireless headset port, an external charger port, a wired / wireless data port, a memory card port, And may include at least one of a port, an audio I / O port, a video I / O port, and an earphone port.
  • a port corresponding to the connection of the external device to the interface unit 160, it is possible to perform appropriate control related to the connected external device.
  • the memory 170 may store a plurality of application programs or applications running on the mobile terminal 100, data for operation of the mobile terminal 100, and commands. At least some of these applications may be downloaded from an external server via wireless communication. At least some of these application programs may exist on the mobile terminal 100 from the time of shipment for the basic functions of the mobile terminal 100 (e.g., call incoming, outgoing, message reception, and origination functions) . Meanwhile, the application program may be stored in the memory 170, installed on the mobile terminal 100, and may be operated by the control unit 180 to perform the operation (or function) of the mobile terminal.
  • control unit 180 In addition to the operations related to the application program, the control unit 180 typically controls the overall operation of the mobile terminal 100.
  • the control unit 180 may process or process signals, data, information, and the like input or output through the above-mentioned components, or may drive an application program stored in the memory 170 to provide or process appropriate information or functions to the user.
  • controller 180 may control at least some of the components illustrated in FIG. 1A in order to drive an application program stored in the memory 170.
  • controller 180 may operate at least two of the components included in the mobile terminal 100 in combination with each other for driving the application program.
  • the power supply unit 190 receives external power and internal power under the control of the controller 180 and supplies power to the components included in the mobile terminal 100.
  • the power supply unit 190 includes a battery, which may be an internal battery or a replaceable battery.
  • At least some of the components may operate in cooperation with one another to implement a method of operation, control, or control of a mobile terminal according to various embodiments described below.
  • the operation, control, or control method of the mobile terminal may be implemented on the mobile terminal by driving at least one application program stored in the memory 170.
  • the broadcast receiving module 111 of the wireless communication unit 110 receives broadcast signals and / or broadcast-related information from an external broadcast management server through a broadcast channel.
  • the broadcast channel may include a satellite channel and a terrestrial channel.
  • Two or more broadcast receiving modules may be provided to the mobile terminal 100 for simultaneous broadcast reception or broadcast channel switching for at least two broadcast channels.
  • the mobile communication module 112 may be a mobile communication module or a mobile communication module capable of communicating with a plurality of mobile communication devices in accordance with technical standards or communication standards for mobile communication (e.g., Global System for Mobile communication (GSM), Code Division Multi Access (CDMA), Wideband CDMA (WCDMA) A terminal, or a server on a mobile communication network constructed according to a mobile communication network (e.g., GSM, Code Division Multi Access (CDMA), Wideband CDMA (WCDMA) A terminal, or a server on a mobile communication network constructed according to a mobile communication network (e.g.
  • GSM Global System for Mobile communication
  • CDMA Code Division Multi Access
  • WCDMA Wideband CDMA
  • the wireless signal may include various types of data depending on a voice call signal, a video call signal or a text / multimedia message transmission / reception.
  • the wireless Internet module 113 is a module for wireless Internet access, and may be built in or externally attached to the mobile terminal 100.
  • the wireless Internet module 113 is configured to transmit and receive a wireless signal in a communication network according to wireless Internet technologies.
  • wireless Internet technology examples include a wireless LAN (WLAN), a wireless fidelity (WiFi) direct, a digital living network alliance (DLNA), a wireless broadband (WIBRO), a wimax (World Interoperability for Microwave Access) Packet Access, and Long Term Evolution (LTE).
  • the wireless Internet module 113 transmits and receives data according to at least one wireless Internet technology, including Internet technologies not listed above.
  • the wireless Internet module 113 which performs wireless Internet access through the mobile communication network, is connected to the mobile communication module 110 through the mobile communication network, for example, from the viewpoint that the wireless Internet access by Wibro, HSDPA, GSM, CDMA, WCDMA, LTE, (112).
  • the short-range communication module 114 is for short-range communication, and includes a Bluetooth, a Radio Frequency Identification (RFID), an Infrared Data Association (IrDA), an Ultra Wideband (UWB), a ZigBee, Near Field Communication, Wi-Fi (Wireless-Fidelity), and Wi-Fi Direct technology.
  • RFID Radio Frequency Identification
  • IrDA Infrared Data Association
  • UWB Ultra Wideband
  • ZigBee Near Field Communication
  • Wi-Fi Wi-Fidelity
  • Wi-Fi Direct technology Wi-Fi Direct technology
  • the short-range communication module 114 may communicate with the mobile terminal 100 through a wireless personal area network (Wireless Personal Area Networks) between the mobile terminal 100 and the wireless communication system, between the mobile terminal 100 and another mobile terminal 100,
  • the mobile terminal 100 may support wireless communication between the mobile terminal 100 and the network where the other mobile terminal 100 or the external server is located.
  • the other mobile terminal 100 may be a wearable device (e.g., a smartwatch, a smart glass, etc.) capable of interchanging data with the mobile terminal 100 according to the present invention (smart glass), HMD (head mounted display)).
  • a wearable device e.g., a smartwatch, a smart glass, etc.
  • HMD head mounted display
  • the short range communication module 114 may detect (or recognize) a wearable device capable of communicating with the mobile terminal 100 around the mobile terminal 100. [ If the detected wearable device is a device authenticated to communicate with the mobile terminal 100 according to the present invention, the control unit 180 may transmit at least a part of the data processed by the mobile terminal 100 to the short- 114 to the wearable device.
  • the user of the wearable device can use the data processed by the mobile terminal 100 through the wearable device. For example, according to this, when a telephone is received in the mobile terminal 100, the user performs a telephone conversation via the wearable device, or when a message is received in the mobile terminal 100, It is possible to check the message.
  • the position information module 115 is a module for obtaining the position (or current position) of the mobile terminal, and a representative example thereof is a Global Positioning System (GPS) module or a Wireless Fidelity (WiFi) module.
  • GPS Global Positioning System
  • Wi-Fi Wireless Fidelity
  • the mobile terminal can acquire the position of the mobile terminal by using a signal transmitted from the GPS satellite.
  • the mobile terminal utilizes the Wi-Fi module, it can acquire the position of the mobile terminal based on information of a wireless access point (AP) that transmits or receives the wireless signal with the Wi-Fi module.
  • AP wireless access point
  • the input unit 120 is for inputting image information (or a signal), audio information (or a signal), or information input from a user.
  • the input unit 120 may input image information
  • the mobile terminal 100 may include one or a plurality of cameras 121.
  • the camera 121 processes image frames such as still images or moving images obtained by the image sensor in the video communication mode or the photographing mode.
  • the processed image frame can be displayed on the display unit 151.
  • a plurality of cameras 121 provided in the mobile terminal 100 may be arranged to have a matrix structure and various angles or foci may be provided to the mobile terminal 100 through the camera 121 having the matrix structure
  • a plurality of pieces of image information can be input.
  • the plurality of cameras 121 may be arranged in a stereo structure to acquire a left image and a right image for realizing a stereoscopic image.
  • the microphone 122 processes the external acoustic signal into electrical voice data.
  • the processed voice data can be utilized variously according to a function (or a running application program) being executed in the mobile terminal 100. Meanwhile, the microphone 122 may be implemented with various noise reduction algorithms for eliminating noise generated in the process of receiving an external sound signal.
  • the user input unit 123 is for receiving information from a user and when the information is inputted through the user input unit 123, the control unit 180 can control the operation of the mobile terminal 100 to correspond to the input information .
  • the user input unit 123 may include a mechanical input means (or a mechanical key such as a button located on the front, rear or side of the mobile terminal 100, a dome switch, a jog wheel, Jog switches, etc.) and touch-type input means.
  • the touch-type input means may comprise a virtual key, a soft key or a visual key displayed on the touch screen through software processing, And a touch key disposed on the touch panel.
  • the virtual key or the visual key can be displayed on a touch screen having various forms, for example, a graphic, a text, an icon, a video, As shown in FIG.
  • the sensing unit 140 senses at least one of information in the mobile terminal, surrounding environment information surrounding the mobile terminal, and user information, and generates a corresponding sensing signal.
  • the control unit 180 may control the driving or operation of the mobile terminal 100 or may perform data processing, function or operation related to the application program installed in the mobile terminal 100 based on the sensing signal. Representative sensors among various sensors that may be included in the sensing unit 140 will be described in more detail.
  • the proximity sensor 141 refers to a sensor that detects the presence of an object approaching a predetermined detection surface or an object existing in the vicinity of the detection surface without mechanical contact using an electromagnetic force or infrared rays.
  • the proximity sensor 141 may be disposed in the inner area of the mobile terminal or in proximity to the touch screen, which is covered by the touch screen.
  • the proximity sensor 141 has a longer life than the contact type sensor and its utilization is also high.
  • the proximity sensor 141 examples include a transmission type photoelectric sensor, a direct reflection type photoelectric sensor, a mirror reflection type photoelectric sensor, a high frequency oscillation type proximity sensor, a capacitive proximity sensor, a magnetic proximity sensor, and an infrared proximity sensor.
  • the proximity sensor 141 can be configured to detect the proximity of the object with a change of the electric field along the proximity of the object having conductivity.
  • the touch screen (or touch sensor) itself may be classified as a proximity sensor.
  • proximity touch the act of recognizing that the object is located on the touch screen in proximity with no object touching the touch screen is referred to as " proximity touch &
  • the act of actually touching an object on the screen is called a " contact touch. &Quot;
  • the position at which the object is closely touched on the touch screen means a position where the object corresponds to the touch screen vertically when the object is touched.
  • the proximity sensor 141 can detect a proximity touch and a proximity touch pattern (e.g., a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, have.
  • control unit 180 processes data (or information) corresponding to the proximity touch operation and the proximity touch pattern sensed through the proximity sensor 141 as described above, and further provides visual information corresponding to the processed data It can be output on the touch screen. Furthermore, the control unit 180 can control the mobile terminal 100 such that different operations or data (or information) are processed according to whether the touch to the same point on the touch screen is a proximity touch or a touch touch .
  • the touch sensor senses a touch (or touch input) applied to the touch screen (or the display unit 151) by using at least one of various touch methods such as a resistance film type, a capacitive type, an infrared type, an ultrasonic type, do.
  • the touch sensor may be configured to convert a change in a pressure applied to a specific portion of the touch screen and a capacitance generated in a specific portion into an electrical input signal.
  • the touch sensor may be configured to detect a position, an area, a pressure at the time of touch, etc. of a touch object to be touched on the touch screen on the touch sensor.
  • the touch object may be a finger, a touch pen, a stylus pen, a pointer, or the like as an object to which a touch is applied to the touch sensor.
  • the touch controller processes the signal (s) and transmits the corresponding data to the controller 180.
  • the control unit 180 can know which area of the display unit 151 is touched or the like.
  • the touch controller may be a separate component from the control unit 180, and may be the control unit 180 itself.
  • control unit 180 may perform different controls or perform the same control according to the type of the touch object, which touches the touch screen (or a touch key provided on the touch screen). Whether to perform different controls or to perform the same control according to the type of the touch object may be determined according to the current state of the mobile terminal 100 or an application program being executed.
  • the touch sensors and the proximity sensors discussed above can be used independently or in combination to provide a short touch (touch), a long touch, a multi touch, a drag touch ), A flick touch, a pinch-in touch, a pinch-out touch, a swipe touch, a hovering touch, Such as a touch screen, a touch screen, and a force touch screen.
  • the ultrasonic sensor can recognize the position information of the object to be sensed by using ultrasonic waves.
  • the controller 180 can calculate the position of the wave generating source through the information sensed by the optical sensor and the plurality of ultrasonic sensors.
  • the position of the wave source can be calculated using the fact that the light is much faster than the ultrasonic wave, that is, the time when the light reaches the optical sensor is much faster than the time the ultrasonic wave reaches the ultrasonic sensor. More specifically, the position of the wave generating source can be calculated using the time difference with the time when the ultrasonic wave reaches the reference signal.
  • the camera 121 includes at least one of a camera 121, a photosensor, and a laser sensor.
  • the camera 121 is a kind of camera sensor.
  • the camera 121 and the laser sensor may be combined with each other to sense a touch of the sensing object with respect to the three-dimensional stereoscopic image.
  • the photosensor can be laminated to the display element, which is adapted to scan the movement of the object to be detected proximate to the touch screen. More specifically, the photosensor mounts photo diodes and TRs (Transistors) in a row / column and scans the contents loaded on the photosensor using an electrical signal that varies according to the amount of light applied to the photo diode. That is, the photo sensor performs coordinate calculation of the object to be sensed according to the amount of change of light, and position information of the object to be sensed can be obtained through the calculation.
  • TRs Transistors
  • the display unit 151 displays (outputs) information processed by the mobile terminal 100.
  • the display unit 151 may display execution screen information of an application program driven by the mobile terminal 100 or UI (User Interface) and GUI (Graphic User Interface) information according to the execution screen information .
  • UI User Interface
  • GUI Graphic User Interface
  • the display unit 151 may be configured as a stereoscopic display unit for displaying a stereoscopic image.
  • a three-dimensional display system such as a stereoscopic system (glasses system), an autostereoscopic system (no-glasses system), and a projection system (holographic system) can be applied.
  • the sound output unit 152 may output audio data received from the wireless communication unit 110 or stored in the memory 170 in a call signal reception mode, a call mode or a recording mode, a voice recognition mode, a broadcast reception mode, The sound output unit 152 also outputs sound signals related to functions (e.g., call signal reception sound, message reception sound, etc.) performed in the mobile terminal 100.
  • the audio output unit 152 may include a receiver, a speaker, a buzzer, and the like.
  • the haptic module 153 generates various tactile effects that the user can feel.
  • a typical example of the haptic effect generated by the haptic module 153 may be vibration.
  • the intensity and pattern of the vibration generated in the haptic module 153 can be controlled by the user's selection or setting of the control unit.
  • the haptic module 153 may synthesize and output different vibrations or sequentially output the vibrations.
  • the haptic module 153 may be configured to perform various functions such as a pin arrangement vertically moving with respect to the contact skin surface, a spraying force or suction force of the air through the injection port or the suction port, a touch on the skin surface, contact with an electrode, And various tactile effects such as an effect of reproducing a cold sensation using an endothermic or exothermic element can be generated.
  • the haptic module 153 can transmit the tactile effect through the direct contact, and the tactile effect can be felt by the user through the muscles of the finger or arm.
  • the haptic module 153 may include two or more haptic modules 153 according to the configuration of the mobile terminal 100.
  • the light output unit 154 outputs a signal for notifying the occurrence of an event using the light of the light source of the mobile terminal 100.
  • Examples of events that occur in the mobile terminal 100 may include message reception, call signal reception, missed call, alarm, schedule notification, email reception, information reception through an application, and the like.
  • the signal output by the optical output unit 154 is implemented as the mobile terminal 100 emits light of a single color or a plurality of colors to the front or rear surface.
  • the signal output may be terminated when the mobile terminal 100 detects an event confirmation of the user.
  • the interface unit 160 serves as a path for communication with all external devices connected to the mobile terminal 100.
  • the interface unit 160 receives data from an external device or supplies power to each component in the mobile terminal 100 or transmits data in the mobile terminal 100 to an external device.
  • a port for connecting a device equipped with a wired / wireless headset port, an external charger port, a wired / wireless data port, a memory card port, an audio I / O port, a video I / O port, an earphone port, and the like may be included in the interface unit 160.
  • the identification module is a chip for storing various information for authenticating the use right of the mobile terminal 100 and includes a user identification module (UIM), a subscriber identity module (SIM) A universal subscriber identity module (USIM), and the like.
  • UIM user identification module
  • SIM subscriber identity module
  • USIM universal subscriber identity module
  • Devices with identification modules can be manufactured in a smart card format. Accordingly, the identification device can be connected to the terminal 100 through the interface unit 160.
  • the interface unit 160 may be a path through which power from the cradle is supplied to the mobile terminal 100 when the mobile terminal 100 is connected to an external cradle, And various command signals may be transmitted to the mobile terminal 100.
  • the various command signals or the power source input from the cradle may be operated as a signal for recognizing that the mobile terminal 100 is correctly mounted on the cradle.
  • the memory 170 may store a program for the operation of the controller 180 and temporarily store input / output data (e.g., a phone book, a message, a still image, a moving picture, etc.).
  • the memory 170 may store data related to vibration and sound of various patterns outputted when a touch is input on the touch screen.
  • the memory 170 may be a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (e.g., SD or XD memory), a RAM (Random Access Memory), a static random access memory (SRAM), a read-only memory (ROM), an electrically erasable programmable read-only memory (EEPROM), a programmable read- And may include a storage medium of at least one type of disk and optical disk.
  • the mobile terminal 100 may operate in association with a web storage that performs the storage function of the memory 170 on the Internet.
  • control unit 180 controls the operations related to the application program and the general operation of the mobile terminal 100.
  • the control unit 180 can execute or release a lock state for restricting input of a user's control command to applications.
  • control unit 180 performs control and processing related to voice communication, data communication, video call, or the like, or performs pattern recognition processing to recognize handwriting input or drawing input performed on the touch screen as characters and images, respectively .
  • controller 180 may control any one or a plurality of the above-described components in order to implement various embodiments described below on the mobile terminal 100 according to the present invention.
  • controller 180 may be configured in the form of an application processor, and in some cases, all operations of the controller 180 related to voice turn on or voice unlock according to the present invention may be executed in software form.
  • the power supply unit 190 receives external power and internal power under the control of the controller 180 and supplies power necessary for operation of the respective components.
  • the power supply unit 190 includes a battery, the battery may be an internal battery configured to be chargeable, and may be detachably coupled to the terminal body for charging or the like.
  • the power supply unit 190 may include a connection port, and the connection port may be configured as an example of an interface 160 through which an external charger for supplying power for charging the battery is electrically connected.
  • the power supply unit 190 may be configured to charge the battery in a wireless manner without using the connection port.
  • the power supply unit 190 may use at least one of an inductive coupling method based on a magnetic induction phenomenon from an external wireless power transmission apparatus and a magnetic resonance coupling method based on an electromagnetic resonance phenomenon Power can be delivered.
  • various embodiments may be embodied in a recording medium readable by a computer or similar device using, for example, software, hardware, or a combination thereof.
  • the disclosed mobile terminal 100 includes a bar-shaped terminal body.
  • the present invention is not limited thereto and can be applied to various structures such as a folder type, a flip type, a slide type, a swing type, and a swivel type in which a watch type, a clip type, a glass type or two or more bodies are relatively movably coupled .
  • the terminal body can be understood as a concept of referring to the mobile terminal 100 as at least one aggregate.
  • the mobile terminal 100 includes a case (a frame, a housing, a cover, etc.) which forms an appearance. As shown, the mobile terminal 100 may include a front case 101 and a rear case 102. Various electronic components are disposed in the inner space formed by the combination of the front case 101 and the rear case 102. At least one middle case may be additionally disposed between the front case 101 and the rear case 102.
  • a display unit 151 is disposed on a front surface of the terminal body to output information.
  • the window 151a of the display unit 151 may be mounted on the front case 101 to form a front surface of the terminal body together with the front case 101.
  • electronic components may also be mounted on the rear case 102.
  • Electronic parts that can be mounted on the rear case 102 include detachable batteries, an identification module, a memory card, and the like.
  • a rear cover 103 for covering the mounted electronic components can be detachably coupled to the rear case 102. Therefore, when the rear cover 103 is separated from the rear case 102, the electronic parts mounted on the rear case 102 are exposed to the outside.
  • the rear cover 103 when the rear cover 103 is coupled to the rear case 102, a side portion of the rear case 102 can be exposed. In some cases, the rear case 102 may be completely covered by the rear cover 103 during the engagement. Meanwhile, the rear cover 103 may be provided with an opening for exposing the camera 121b and the sound output unit 152b to the outside.
  • These cases 101, 102, and 103 may be formed by injection molding of synthetic resin or may be formed of metal such as stainless steel (STS), aluminum (Al), titanium (Ti), or the like.
  • STS stainless steel
  • Al aluminum
  • Ti titanium
  • the mobile terminal 100 may be configured such that one case provides the internal space, unlike the above example in which a plurality of cases provide an internal space for accommodating various electronic components.
  • a unibody mobile terminal 100 in which synthetic resin or metal is connected from the side to the rear side can be realized.
  • the mobile terminal 100 may include a waterproof unit (not shown) for preventing water from penetrating into the terminal body.
  • the waterproof portion is provided between the window 151a and the front case 101, between the front case 101 and the rear case 102, or between the rear case 102 and the rear cover 103, And a waterproof member for sealing the inside space of the oven.
  • the mobile terminal 100 is provided with a display unit 151, first and second sound output units 152a and 152b, a proximity sensor 141, an illuminance sensor 142, a light output unit 154, Cameras 121a and 121b, first and second operation units 123a and 123b, a microphone 122, an interface unit 160, and the like.
  • a display unit 151 a first sound output unit 152a, a proximity sensor 141, an illuminance sensor 142, an optical output unit (not shown)
  • the first camera 121a and the first operation unit 123a are disposed on the side of the terminal body and the second operation unit 123b, the microphone 122 and the interface unit 160 are disposed on the side surface of the terminal body, And a mobile terminal 100 having a second sound output unit 152b and a second camera 121b disposed on a rear surface thereof.
  • first operation unit 123a may not be provided on the front surface of the terminal body, and the second sound output unit 152b may be provided on the side of the terminal body rather than the rear surface of the terminal body.
  • the display unit 151 displays (outputs) information processed by the mobile terminal 100.
  • the display unit 151 may display execution screen information of an application program driven by the mobile terminal 100 or UI (User Interface) and GUI (Graphic User Interface) information according to the execution screen information .
  • UI User Interface
  • GUI Graphic User Interface
  • the display unit 151 may be a liquid crystal display (LCD), a thin film transistor-liquid crystal display (TFT LCD), an organic light-emitting diode (OLED), a flexible display display, a 3D display, and an e-ink display.
  • LCD liquid crystal display
  • TFT LCD thin film transistor-liquid crystal display
  • OLED organic light-emitting diode
  • flexible display display a 3D display
  • 3D display a 3D display
  • e-ink display e-ink display
  • the display unit 151 may exist in two or more depending on the embodiment of the mobile terminal 100.
  • the mobile terminal 100 may be provided with a plurality of display portions spaced apart from each other or disposed integrally with one another, or may be disposed on different surfaces, respectively.
  • the display unit 151 may include a touch sensor that senses a touch with respect to the display unit 151 so that a control command can be received by a touch method.
  • the touch sensor senses the touch, and the control unit 180 generates a control command corresponding to the touch based on the touch.
  • the content input by the touch method may be a character or a number, an instruction in various modes, or a menu item that can be designated.
  • the touch sensor may be a film having a touch pattern and disposed between the window 151a and a display (not shown) on the rear surface of the window 151a, or may be a metal wire .
  • the touch sensor may be formed integrally with the display.
  • the touch sensor may be disposed on a substrate of the display or inside the display.
  • the display unit 151 can form a touch screen together with the touch sensor.
  • the touch screen can function as a user input unit 123 (see FIG. 1A).
  • the touch screen may replace at least some functions of the first operation unit 123a.
  • the first sound output unit 152a may be implemented as a receiver for transmitting a call sound to a user's ear and the second sound output unit 152b may be implemented as a loud speaker for outputting various alarm sounds or multimedia playback sounds. ). ≪ / RTI >
  • the window 151a of the display unit 151 may be provided with an acoustic hole for emitting the sound generated from the first acoustic output unit 152a.
  • the present invention is not limited to this, and the sound may be configured to be emitted along an assembly gap (for example, a gap between the window 151a and the front case 101) between the structures.
  • the appearance of the mobile terminal 100 can be made more simple because the hole formed independently for the apparent acoustic output is hidden or hidden.
  • the optical output unit 154 is configured to output light for notifying the occurrence of an event. Examples of the event include a message reception, a call signal reception, a missed call, an alarm, a schedule notification, an email reception, and reception of information through an application.
  • the control unit 180 may control the light output unit 154 to terminate the light output when the event confirmation of the user is detected.
  • the first camera 121a processes an image frame of a still image or a moving image obtained by the image sensor in the photographing mode or the video communication mode.
  • the processed image frame can be displayed on the display unit 151 and can be stored in the memory 170.
  • the first and second operation units 123a and 123b may be collectively referred to as a manipulating portion as an example of a user input unit 123 operated to receive a command for controlling the operation of the mobile terminal 100 have.
  • the first and second operation units 123a and 123b can be employed in any manner as long as the user is in a tactile manner such as touch, push, scroll, or the like.
  • the first operation unit 123a is a touch key, but the present invention is not limited thereto.
  • the first operation unit 123a may be a mechanical key, or a combination of a touch key and a touch key.
  • the contents input by the first and second operation units 123a and 123b can be variously set.
  • the first operation unit 123a receives a command such as a menu, a home key, a cancellation, a search, and the like
  • the second operation unit 123b receives a command from the first or second sound output unit 152a or 152b The size of the sound, and the change of the display unit 151 to the touch recognition mode.
  • a rear input unit (not shown) may be provided on the rear surface of the terminal body as another example of the user input unit 123.
  • the rear input unit is operated to receive a command for controlling the operation of the mobile terminal 100, and input contents may be variously set. For example, commands such as power on / off, start, end, scrolling, and the like, the size adjustment of the sound output from the first and second sound output units 152a and 152b, And the like can be inputted.
  • the rear input unit may be implemented as a touch input, a push input, or a combination thereof.
  • the rear input unit may be disposed so as to overlap with the front display unit 151 in the thickness direction of the terminal body.
  • the rear input unit may be disposed at the rear upper end of the terminal body such that when the user holds the terminal body with one hand, the rear input unit can be easily operated using the index finger.
  • the present invention is not limited thereto, and the position of the rear input unit may be changed.
  • the display unit 151 can be configured as a larger screen.
  • the mobile terminal 100 may be provided with a fingerprint recognition sensor for recognizing the fingerprint of the user, and the controller 180 may use the fingerprint information sensed through the fingerprint recognition sensor as authentication means.
  • the fingerprint recognition sensor may be embedded in the display unit 151 or the user input unit 123.
  • the microphone 122 is configured to receive the user's voice, other sounds, and the like.
  • the microphone 122 may be provided at a plurality of locations to receive stereophonic sound.
  • the interface unit 160 is a path through which the mobile terminal 100 can be connected to an external device.
  • the interface unit 160 may include a connection terminal for connection with another device (for example, an earphone or an external speaker), a port for short-range communication (for example, an infrared port (IrDA Port), a Bluetooth port A wireless LAN port, or the like), or a power supply terminal for supplying power to the mobile terminal 100.
  • the interface unit 160 may be implemented as a socket for receiving an external card such as a SIM (Subscriber Identification Module) or a UIM (User Identity Module) or a memory card for storing information.
  • SIM Subscriber Identification Module
  • UIM User Identity Module
  • a second camera 121b may be disposed on a rear surface of the terminal body.
  • the second camera 121b has a photographing direction which is substantially opposite to that of the first camera 121a.
  • the second camera 121b may include a plurality of lenses arranged along at least one line.
  • the plurality of lenses may be arranged in a matrix form.
  • Such a camera can be named an 'array camera'.
  • the second camera 121b is configured as an array camera, images can be taken in various ways using a plurality of lenses, and a better quality image can be obtained.
  • the flash 124 may be disposed adjacent to the second camera 121b.
  • the flash 124 shines light toward the subject when the subject is photographed by the second camera 121b.
  • a second sound output unit 152b may be additionally disposed in the terminal body.
  • the second sound output unit 152b may implement a stereo function together with the first sound output unit 152a and may be used for implementing a speakerphone mode in a call.
  • the terminal body may be provided with at least one antenna for wireless communication.
  • the antenna may be embedded in the terminal body or formed in the case.
  • an antenna constituting a part of the broadcast receiving module 111 may be configured to be able to be drawn out from the terminal body.
  • the antenna may be formed in a film type and attached to the inner surface of the rear cover 103, or a case including a conductive material may be configured to function as an antenna.
  • the terminal body is provided with a power supply unit 190 (see FIG. 1A) for supplying power to the mobile terminal 100.
  • the power supply unit 190 may include a battery 191 built in the terminal body or detachable from the outside of the terminal body.
  • the battery 191 may be configured to receive power through a power cable connected to the interface unit 160.
  • the battery 191 may be configured to be wirelessly chargeable through a wireless charger.
  • the wireless charging may be implemented by a magnetic induction method or a resonance method (magnetic resonance method).
  • the rear cover 103 is configured to be coupled to the rear case 102 so as to cover the battery 191 to restrict the release of the battery 191 and to protect the battery 191 from external impact and foreign matter .
  • the rear cover 103 may be detachably coupled to the rear case 102.
  • the mobile terminal 100 may be provided with an accessory that protects the appearance or supports or expands the function of the mobile terminal 100.
  • an accessory that protects the appearance or supports or expands the function of the mobile terminal 100.
  • One example of such an accessory is a cover or pouch that covers or accommodates at least one side of the mobile terminal 100.
  • the cover or pouch may be configured to interlock with the display unit 151 to expand the function of the mobile terminal 100.
  • Another example of an accessory is a touch pen for supplementing or extending a touch input to the touch screen.
  • a function of turning on the screen of the mobile terminal using the speaker's voice will be described as a voice turn-on function
  • a function of unlocking the screen of the mobile terminal using the speaker's voice will be referred to as a voice unlock Voice Unlock function
  • an operation mode for performing a voice turn-on or voice unlock function by using a speaker voice will be described as a voice recognition mode.
  • FIG. 2 is a flowchart illustrating a control procedure of the mobile terminal for the voice turn-on and voice unlock functions according to the present invention.
  • 3 to 14 are diagrams for explaining a control procedure of the mobile terminal for the voice turn-on and voice unlock functions according to the present invention.
  • steps S200 through S230 of FIG. 2 are performed to record and register a speaker voice used as a voice command of voice turn-on and voice unlock functions.
  • Steps S240 through S290 of FIG. A voice turn-on or voice unlock function is performed when a speaker voice input from the speaker 122 and a speaker voice registered by the steps S200 to S230 are matched.
  • the control unit 180 of the mobile terminal 100 controls to display a voice registration menu corresponding to the selected menu item on the screen (S200).
  • the image or animation displayed within the second page may be an image or animation that asks the speaker to speak a voice to be recorded, which is large and pronouncing clearly.
  • the speaker voice used as a voice command of the voice turn-on and voice unlock functions is such that at least two or more speaker's voices are input through the microphone 122 and the speaker voices inputted at least two times are recognized as the same voice
  • the same voice may be registered in the memory 170 as a voice command for the voice turn on or voice unlock function.
  • control unit 180 may record the speaker's voice through the voice recording UI 300 (S210).
  • the voice recording UI 300 includes a microphone button 310 and a microphone button 310 for toggling the turn-on or turn-off of the microphone 122 for speaker voice recording, ), And a circular progressive bar indicating a state in which the recording is progressed for a preset time when the microphone 122 is turned on to start recording.
  • the controller 180 turns on the microphone 122 to start speaker voice recording as shown in (b) of FIG. 4A, It is possible to control to indicate the recording progress state.
  • the analog speaker voice data input from the microphone 122 is converted into digital speaker voice data through a PCM (Pulse Code Modulation) process through the voice recognizer 132, and the controller 180 controls the voice recognizer 132, And receives and records the converted digital speaker voice data.
  • PCM Pulse Code Modulation
  • the controller 180 determines whether the user's voice model used for the voice turn-on or voice unlock operation is at least twice It is possible to request the user to again record the same speaker voice as the recorded speaker voice.
  • the controller 180 may output first information for guiding the speaker to speak small and smooth speech below the predetermined level.
  • the first information may be displayed in the voice recording UI 300 as text that guides the speaker to speak small and smooth speech below the predetermined level.
  • the first information may be outputted through the sound output unit 152 as a guide sound or a guide sound informing the speaker to speak small and softly below the predetermined level.
  • the controller 180 may output the second information for guiding the speaker to move and record the recording location to the speaker if the ambient noise inputted through the microphone 122 during the current recording is equal to or greater than a predetermined volume .
  • the second information may be displayed in the voice recording UI 300 as a text for guiding the speaker to move and record the recording place.
  • the second information may be output through the sound output unit 152 as a guide sound or guide sound informing the speaker to move the recording place and record the sound.
  • control unit 180 may store the speaker voice in a predetermined number (for example, at least one of characters, words and sentences) included in the speaker voice inputted through the microphone 122 during the current recording (For example, two), it is possible to output the third information guiding to say beyond the predetermined number.
  • the third information may be displayed in the voice recording UI 300 as text for guiding the speaker to talk over the predetermined number.
  • the third information may be outputted through the sound output unit 152 as a guide sound or a guide sound for informing the speaker to speak more than the predetermined number.
  • the manufacturer name of the mobile terminal 100 may be included as part of the keyword in the keyword included in the speaker voice.
  • control unit 180 controls the speaker 180 so that the speaker voice inputted through the microphone 122 during the current recording is not voice for the voice turn-on or voice unlock according to the present invention
  • the fourth information that guides the user to input another speaker voice can be output.
  • the fourth information may be displayed in the voice recording UI 300 as text to guide the speaker to speak another speaker's voice.
  • the fourth information may be output through the sound output unit 152 as a guide sound or a guide sound informing the speaker to speak another speaker's voice.
  • the control unit 180 may mute the output of the specific sound through the microphone 122 until the speaker's voice is recorded Or it may stop at all.
  • the controller 180 determines whether or not the speaker voice that is the same as the speaker voice that has been successfully recorded by the procedure of (a) to (c) of FIG. 4 If the recording is successful over a preset number of times as in steps (a) to (c) of FIG. 4 and steps (a) to (c) of FIG. 4d, the speaker succeeds in recording the voice as a speaker voice to be used for voice turn on or voice unlock.
  • the controller 180 analyzes the first and second patterns of the recorded speaker voice to generate a speaker voice model.
  • the first pattern includes a keyword pattern corresponding to a speaker voice and a linguistic pattern for a keyword
  • the second pattern includes a speaker voice pattern corresponding to a speaker voice. That is, the first pattern means a linguistic pattern for at least one of letters, words, and sentences corresponding to the speaker's voice, and the second pattern indicates at least one of the speaking speed, the size and the strength of the speaker's voice corresponding to the speaker's voice It means a voice pattern for one.
  • the control unit 180 stores the generated speech model in the memory 170 and the speech recognizer 132 to complete the final speaker voice recording process.
  • the control unit 180 turns on the microphone 122 to start voice recording of the speaker, and controls the microphone button to indicate that the microphone is turned on.
  • the controller 180 controls the microphone (not shown)
  • the microphone button 122 is turned off, and the microphone button 310 controls the microphone 122 to be turned off.
  • control unit 180 may turn on the microphone 122 again to perform the voice recording operation of the speaker, as shown in (d) of FIG. 4e.
  • FIG. 4F when the recording of the speaker's voice is completed and the speaker's voice model is generated according to the procedure of FIGS. 4A to 4E, As shown, a function setting UI 410 for setting a voice turn-on or voice unlock function for the speaker voice model is displayed.
  • the controller 180 may map the selected voice turn-on function to the speaker voice model and store the selected voice turn-on function in the memory 170,
  • the voice unlock function may be mapped to the speaker voice model and stored in the memory 170 if the voice unlock function is selected.
  • the speaker voice model may be further assigned with the voice turn-on or voice unlock function as well as the execution function of the specific application.
  • the present invention when a speaker voice that matches the speaker voice model stored in the memory 170 through the microphone 122 is input in a state where the screen is turned off or the screen is locked and the lock screen is displayed, It is possible to simultaneously execute the specific application set in the speaker voice model while executing the voice turn on or voice unlock function set in the speaker voice model and display the execution screen of the executed specific application.
  • control unit 180 displays the application list 420 in the function setting UI 410, and when the user selects a specific application in the list 420, the control unit 180 adds the voice turn-on or voice unlock And the execution functions of the selected specific application are further allocated, set and stored.
  • FIG. 5 is a software structure diagram illustrating a process of generating and storing a speaker voice model for voice unlocking.
  • an example of an operating system (OS) installed in the mobile terminal 100 is a voice recognizer 132 in a kernel layer of the Android architecture layer, which receives analog speaker voice data from a microphone 122 , Converts the analog speaker voice data into digital speaker voice data through a PCM (Pulse Code Modulation) process, and transmits the converted digital speaker voice data to a speaker voice registration application in the application layer (1).
  • OS operating system
  • PCM Pulse Code Modulation
  • the speaker voice registration application analyzes the first and second patterns of the digital speaker voice data to generate a speaker voice model (2).
  • "/data/user/0/com.lge.voiceprint/app_enrollments/net.bin” refers to a pattern representing the frequency characteristic for a keyword corresponding to the speaker voice of the first pattern, and " / data / user / 0 / com.lge.voiceprint / app_enrollments / gram.bin "is a linguistic pattern for at least one of a character, a word, and a sentence of a keyword corresponding to the speaker voice of the first pattern, and" / data / user / 0 /com.lge.voiceprint/app_enrollments/tssvclient.bin " refers to a voice pattern for at least one of speaking speed, size, and accent of a speaker voice corresponding to the speaker voice of the second pattern.
  • the speaker speech model thus generated is stored in the speech recognizer 132 (3).
  • the voice unvoiced function set by the user is also set in the speaker voice model and is also stored in the memory 170.
  • the voice registration application grants the voice manager in the framework layer permission to perform the voice unlock service (4).
  • control unit 180 can perform all the software operations in the application layer and the framework layer in FIG. 5 in the same manner. That is, the control unit 180 can control the operation of the voice registration application in the application layer, and also includes an application processor (AP) and a voice manager in the framework layer, Can be performed.
  • AP application processor
  • the control unit 180 changes or deletes the speaker voice for executing the voice turn-on or voice unlock function stored in the memory 170, or registers the voice of the new speaker
  • first information (information indicating that the screen is turned on or the screen is unlocked) through voice recognition when displaying the voice recognition menu for changing the voice turn on or voice unlock function 510) can be displayed.
  • the control unit 180 changes or deletes the speaker voice for executing the voice turn-on or voice unlock function stored in the memory 170, or registers a new speaker voice
  • the screen lock is not set on the mobile terminal when the voice recognition menu for changing the voice turn on function or the voice unlock function is displayed,
  • the second information 520 requesting the lock setting of the screen may be displayed.
  • the voice recognition setting menu 600 changes the speaker voice for executing the voice turn on function or the voice unlock function stored in the memory 170, A " Delete voice " menu for deleting a speaker voice for executing a voice turn-on or voice unlock function stored in the memory 170, and a voice turn-on function set in the speaker voice as a voice unlock function Or a " function change menu " for changing the voice unlock function set in the speaker voice to the voice turn on function.
  • FIG. 7A shows a case where the voice turn-on function is set to the speaker voice through the function change menu, the text indicating the voice turn-on state is displayed in a rich and bright manner in the function change menu, Is displayed.
  • the user authentication process according to the security mode is skipped, and after the speaker voice stored in the memory 170 is authenticated and a swipe touch is input, It can be released.
  • the control unit 180 determines whether the " It is possible to delete the speaker voice for the voice turn on or voice unlock function stored in the memory 170 and to switch the voice recognition mode according to the present invention to the inactive state.
  • FIG. 9 is a software structural diagram showing a process of deleting a speaker voice for the voice unlock function.
  • the voice registration application restricts the authority to disable the voice unlock service to the voice manager in the framework layer (3).
  • the control unit 180 can perform all the software operations in the application layer and the framework layer in Fig. That is, the control unit 180 can control the operation of the voice registration application in the application layer, and also includes an application processor (AP) and a voice manager in the framework layer, Can be performed.
  • AP application processor
  • the controller 180 can receive a new speaker voice from the user through the above-described processes of FIGS. 4A to 4E.
  • the controller 180 controls the speaker 170 stored in the memory 170, as shown in FIG. 10 (b) It is possible to display the change UI 410 of the voice turn-on or voice unlock function set in the voice model.
  • the controller 180 controls the speaker
  • the voice turn-on function set in the voice model can be changed to the selected voice unlock function and stored.
  • the mobile terminal 100 displays a lock screen indicating that the screen of the display unit 151 is turned off or the screen is locked (S240), the microphone 122 Or the microphone 122 is kept turned on while the lock screen is being displayed (S250).
  • the mobile terminal 100 recognizes the speaker's voice input from the microphone 122 (S260), determines whether the recognized speaker's voice matches the speaker's voice model stored in the memory 170 (S270) If the recognized speaker's voice matches the speaker's voice model stored in the memory 170 (S280), the user turns on the screen or unlocks the screen (S290).
  • the voice turn-on function is set to the speaker voice model stored in the memory 170, Turn on.
  • the voice unlock function is set to the speaker's voice model stored in the memory 170, Release the lock.
  • step S250 the mobile terminal 100 deactivates the control unit 180 while the screen is turned off or the lock screen is displayed.
  • the mobile terminal when the mobile terminal is operated in the voice recognition mode for voice turn on or voice unlock according to the present invention, for the recognition of the speaker voice for the voice turn on or voice unlocking while the screen is turned off or the lock screen is displayed Since the microphone 122 must be kept turned on at all times and the controller 180 must also determine in real time whether the speaker voice inputted through the microphone 122 matches the speaker voice model stored in advance, .
  • the operation of the controller 180 performs operations corresponding to the framework and the application layer in the software architecture, when the controller 180 is always kept in an active state for performing a voice turn-on or voice unlock function, It becomes extreme.
  • a low-power voice recognizer 132 is disposed in a kernel layer that consumes less power than the framework and the application layer, and a voice recognizer 132 is provided in place of the control block 180
  • the controller 180 determines whether the speaker voice is matched between the speaker voice and the pre-stored speaker voice model. If the matching is determined as a result of the first determination, the control unit 180 activates the speaker voice It is possible to save the power while the control unit 180 is inactivated by finally determining whether or not to match.
  • FIG. 11 is a software architecture illustrating a voice unlocking process using a speaker voice model according to the present invention.
  • a microphone 122 and a buffer (LG PCM buffer) 131, And a voice recognizer (LG User Define Hotword Engine) 132 are activated, and the AP in the framework layer is inactivated.
  • the control unit 180 is inactivated when the screen of the display unit 151 is actually turned off or the screen is locked .
  • the AP in the framework layer is the control unit 180.
  • the buffer 131 buffers speech data of a speaker input from the microphone 122 in a predetermined time unit (for example, two seconds).
  • the voice recognizer 132 analyzes the first pattern of the speaker voice input from the microphone 122, and determines whether the first pattern of the analyzed speaker voice and the first pattern of the previously stored speaker voice model match It is judged (1).
  • the speech recognizer 132 is a first pattern of the speaker's voice input from the microphone 122, and includes a pattern indicating the frequency characteristics of the keyword corresponding to the speaker's voice, a character of a keyword corresponding to the speaker's voice, , And sentences, and analyzes the linguistic pattern of at least one of the frequency characteristics pattern and linguistic pattern of the analyzed keyword and the first pattern ("/data/user/0/com.lge.voiceprint" / app_enrollments / net.bin " and " /data/user/0/com.lge.voiceprint/app_enrollments/gram.bin ") is equal to or higher than a predetermined level, the first pattern of the speaker's voice and the previously stored speaker It is firstly determined whether the voice models are matched.
  • the speech recognizer 132 determines whether or not the speaker And transmits the voice data to the control unit 180 in the framework layer (2).
  • the speaker when recognizing the speaker's voice input from the microphone 122, if the recognized speaker's voice is too large and coarse to fail to recognize the speaker, the speaker recognizes that the speaker is small It is possible to control to output the first information to guide the user to speak smoothly.
  • the first information may be displayed in the lock screen when a lock screen indicating a locked state of the screen is displayed, which is a text for guiding the speaker to speak small and smoothly below the predetermined level.
  • the first information may be outputted through the sound output unit 152 as a guide sound or a guide sound informing the speaker to speak small and softly below the predetermined level.
  • the speaker when recognizing the speaker's voice input from the microphone 122, if the recognized speaker's voice is too small or less than a preset level and the recognition fails, the speaker recognizes the speaker So that the second information can be output.
  • the second information may be displayed in the lock screen when the lock screen is displayed as a text that guides the speaker to speak at a level higher than the predetermined level.
  • the second information may be outputted through the sound output unit 152 as a guide sound or a guide sound informing the speaker to speak at a level higher than the preset level.
  • the voice recognizer 132 moves the location to the speaker It is possible to control to output third information for guiding to speak.
  • the third information is text for guiding the speaker to move and speak the place, and may be displayed in the lock screen when the lock screen is displayed. Also, the third information may be output through the sound output unit 152 as a guide sound or a guide sound informing the speaker to move and speak the place.
  • the sound output unit 152 is activated to output a specific sound (e.g., music) when the speaker 122 receives the speaker sound from the microphone 122, the speaker recognizes the speaker sound through the microphone 122 It is possible to control so that the output of the specific sound is muted until it is recognized and analyzed.
  • a specific sound e.g., music
  • the voice recognizer 132 When recognizing the speaker voice inputted from the microphone 122, the voice recognizer 132 recognizes that the first pattern corresponding to the speaker voice input from the microphone 122 is not included in the pre-stored speaker voice model 1 pattern, the voice registration menu shown in FIG. 4A can be displayed on the lock screen to guide the speaker to set the speaker voice for the voice turn-on or voice unlock function according to the present invention again.
  • control unit 180 activates the mobile terminal 100 upon receiving the data of the speaker voice determined to be first-matched from the voice recognizer 132.
  • the controller 180 analyzes the second pattern of the received speaker's voice and determines whether the second pattern of the analyzed speaker's voice matches the second pattern of the speaker's voice model stored in the memory 170, .
  • control unit 180 generates a second pattern of the received speaker's voice by comparing at least one voice pattern among the speaking speed, the size and the strength of the voice corresponding to the speaker's voice, Judges whether at least one of the speed, size and accent of the speaker's voice in the second pattern (" /data/user/0/com.lge.voiceprint/app_enrollments/tssvclient.bin " in the model)
  • the voice of the speaker currently input through the microphone 122 and the voice of the speaker stored in the memory 170 are the same or similar to each other (3).
  • the present invention first determines whether a speech keyword corresponding to a speaker voice inputted from a current microphone 122 and a speaker voice keyword stored in the memory 170 are matched first through a speech recognizer 132, If the result of the determination is matched, the control unit 180 is activated to determine whether the speaker voice inputted from the microphone 122 and the speaker voice stored in the memory 170 match each other, and then both the first and second discrimination results are matched.
  • the voice turn-on or voice unlock function set in the speaker voice model stored in the memory 170 is executed.
  • the mobile terminal 100 can simultaneously turn on the specific application Can be executed.
  • the specific application may include all applications installed in the mobile terminal.
  • the specific application may include a schedule notification application in which two or more user schedules are registered.
  • the mobile terminal 100 may receive at least one The user can control the schedule notification application so as to search the user schedule and notify the user (by display or sound).
  • the specific application may include a weather information providing application.
  • the mobile terminal 100 displays the current weather for the current area or the area set by the user after the point of time when the speaker voice inputted from the microphone 122 is recognized
  • the weather information providing application may be controlled so as to search for future weather (notify by display or sound) to inform the user.
  • the speaker voice model stored in the memory 170 may include a first voice language for executing the voice turn-on or voice unlock function and a second voice language for executing a specific application.
  • the mobile terminal 100 performs only the voice turn-on or voice unlock function when only the first voice is included in the recognized speaker voice.
  • the mobile terminal 100 can execute the voice turn-on or voice unlock function when both the first and second voice voices are included in the recognized speaker voice, and simultaneously execute the specific application.
  • the first voice language includes the speaker voice stored in the procedure of Figs. 4A to 4E and / or the manufacturer name of the mobile terminal 100
  • the second voice language may include at least one of a full name of the specific application, a partial name, a representative name, a nickname set by the user for the specific application, and a category name to which the specific application belongs.
  • the first information is text that guides the speaker to speak small and smooth speech below the predetermined level, and is displayed in the lock screen when the lock screen is displayed .
  • the first information may be a guide voice or a guide sound to inform the speaker to speak small and softly below the predetermined level, and may be outputted through the sound output unit 152 when the screen is turned off.
  • the controller 180 displays a speaker's voice input screen, and when the predetermined time has elapsed after the first information is output, Button to select a speaker and input a speaker voice again.
  • the controller 180 when recognizing the speaker's voice, if the speaker's voice is too small or less than a predetermined level and the recognition fails, the controller 180 outputs second information for guiding the speaker to talk at a higher level than the preset level .
  • the second information may be displayed in the lock screen when the lock screen is displayed as a text that guides the speaker to speak at a level higher than the predetermined level.
  • the second information may be a guide voice or a guide sound for informing the speaker to speak at a level higher than the predetermined level, and may be outputted through the sound output unit 152 when the screen is turned off.
  • the control unit 180 transmits third information Can be output.
  • the third information is text for guiding the speaker to move and speak the place, and may be displayed in the lock screen when the lock screen is displayed.
  • the third information may be a guide voice or a guide sound for notifying the speaker to move and speak the place, and may be outputted through the sound output unit 152 when the screen is turned off.
  • the control unit 180 determines whether the speaker voice is recognized and the recognized speaker voice is not a speaker voice model for voice turn-on or voice unlock according to the present invention. ),
  • the fourth information that guides the user to input another speaker voice model can be output.
  • the fourth information may be displayed in the voice recording UI 300 as text to guide the speaker to speak another speaker's voice.
  • the fourth information may be output through the sound output unit 152 as a guide sound or a guide sound informing the speaker to speak another speaker's voice.
  • the speaker 180 is activated and outputs a specific sound (e.g., music) when the speaker's voice is input, the speaker 180 is operated until the speaker's voice is recognized and analyzed through the microphone 122 The output of the specific sound can be muted or stopped altogether.
  • a specific sound e.g., music
  • the control unit 180 When recognizing the speaker's voice, if the speaker's voice is not matched with the speaker's voice model stored in the memory 170 a predetermined number of times or more, the control unit 180 sets the voice registration menu of FIG. So that the speaker can guide the speaker to reset the speaker's voice for the voice turn-on or voice unlock function according to the present invention.
  • the present invention described above can be embodied as computer-readable codes on a medium on which a program is recorded.
  • the computer readable medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of the computer-readable medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and also implemented in the form of a carrier wave (for example, transmission over the Internet) .
  • the computer may include a control unit 180 of the terminal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 디스플레이부와, 상기 디스플레이부의 화면을 턴온하거나 또는 상기 화면의 잠금 해제를 위한 적어도 하나의 음성이 저장된 메모리와, 상기 화면이 턴오프되거나 또는 상기 화면이 잠금된 상태에서 턴온 상태가 유지되어 화자 음성을 입력받는 마이크로폰 및 상기 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서, 상기 마이크로폰을 통해 입력되는 화자 음성의 제1 패턴과 상기 저장된 음성의 제1 패턴이 매칭된 것으로 1차 인식되고, 상기 화자 음성의 제2 패턴 및 상기 저장된 음성의 제2 패턴이 매칭된 것으로 2차 인식될 경우, 상기 화면을 턴온하거나 또는 상기 화면의 잠금을 해제하는 제어부를 포함하는 이동 단말기 및 그 제어 방법에 관한 것으로써, 사용자가 본인의 음성을 이용하여 쉽고 빠르게 화면 턴온 및 화면 잠금 해제를 수행할 수 있는 효과를 제공한다.

Description

이동 단말기 및 그 제어 방법
본 발명은 사용자의 편의가 더욱 고려되어 단말기의 사용이 구현될 수 있도록 하는 이동 단말기 및 그 제어 방법에 관한 것이다.
단말기는 이동 가능여부에 따라 이동 단말기(mobile/portable terminal) 및 고정 단말기(stationary terminal)으로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mounted terminal)로 나뉠 수 있다.
이동 단말기의 기능은 다양화 되고 있다. 예를 들면, 데이터와 음성통신, 카메라를 통한 사진촬영 및 비디오 촬영, 음성녹음, 스피커 시스템을 통한 음악파일 재생 그리고 디스플레이부에 이미지나 비디오를 출력하는 기능이 있다. 일부 단말기는 전자게임 플레이 기능이 추가되거나, 멀티미디어 플레이어 기능을 수행한다. 특히 최근의 이동 단말기는 방송과 비디오나 텔레비전 프로그램과 같은 시각적 컨텐츠를 제공하는 멀티캐스트 신호를 수신할 수 있다.
이와 같은 단말기(terminal)는 기능이 다양화됨에 따라 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송의 수신 등의 복합적인 기능들을 갖춘 멀티미디어 기기(Multimedia player) 형태로 구현되고 있다.
이러한 단말기의 기능 지지 및 증대를 위해, 단말기의 구조적인 부분 및/또는 소프트웨어적인 부분을 개량하는 것이 고려될 수 있다.
최근 들어 자동 통역 시스템 및 음성 인식 전화기, 음성 인식 컴퓨터, 그리고 음성 인식 자동차 등의 제품이 등장하여 음성 인식에 대한 일반인들의 관심이 높아지고 있다.
음성은 사람들에게 가장 자연스럽고 효과적인 정보 교환 수단이기 때문에, 음성 인식 기술은 활성화된다면 일상 생활에서 보다 편리함을 줄 수 있는 기술이 될 수 있다.
음성 인식 기술의 목표는 음성 정보를 받을 수 있고 받은 정보에 따른 적절한 동작 및 대화를 할 수 있는 기계의 구현이다. 음성 인식 연구는 인간과 자연스럽게 대화하는 기계 구현을 목표로 오랜 시간 동안 진행되어 왔다. 아직도 임의의 화자의 음성을 주어진 환경하에서 자연스럽게 인식할 수 있는 음성 인식 기술은 완성되지 못했지만, 음성 인식 기술은 현재에도 다양한 응용 분야에 적용되고 있다.
예를 들어, 최근 스마트폰 기술의 발전으로 음성을 기반으로 한 서비스들이 선보이고 있다. 이러한 음성 기반의 서비스를 제공하기 위해서는 정확한 음성 인식 기술이 필요하고 서비스의 성격 및 사용자 설정에 따라 음성 인식 기술을 적응적으로 활용하기 위한 방법이 필요하다.
본 발명은 전술한 필요성을 충족하거나 또는 전술한 문제점을 해결하기 위해 제안되는 것으로서, 사용자의 음성을 이용하여 화면을 턴온하거나, 화면 잠금을 해제할 수 있는 이동 단말기 및 그 제어 방법을 제공하는데 있다.
상기 목적들을 달성하기 위한 본 발명에 따른 이동 단말기는, 디스플레이부와, 상기 디스플레이부의 화면을 턴온하거나 또는 상기 화면의 잠금 해제를 위한 적어도 하나의 음성이 저장된 메모리와, 상기 화면이 턴오프되거나 또는 상기 화면이 잠금된 상태에서 턴온 상태가 유지되어 화자 음성을 입력받는 마이크로폰 및 상기 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서, 상기 마이크로폰을 통해 입력되는 화자 음성의 제1 패턴과 상기 저장된 음성의 제1 패턴이 매칭된 것으로 1차 인식되고, 상기 화자 음성의 제2 패턴 및 상기 저장된 음성의 제2 패턴이 매칭된 것으로 2차 인식될 경우, 상기 화면을 턴온하거나 또는 상기 화면의 잠금을 해제하는 제어부를 포함할 수 있다.
이때, 상기 제어부는 상기 이동 단말기에 상기 화면 잠금이 설정된 상태에서는, 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능함을 알리는 정보를 표시하고, 상기 이동 단말기에 상기 화면 잠금이 설정되어 있지 않은 상태에서는, 상기 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능하도록 상기 화면의 잠금 설정을 요구하는 정보를 표시할 수 있다.
또한, 상기 메모리에 저장된 적어도 하나의 음성은 음성 등록 메뉴를 통해 저장되고, 상기 제어부는 상기 음성 등록 메뉴가 선택되면, 상기 마이크로폰을 통해 화자 음성을 적어도 2회 이상 입력받고, 상기 적어도 2회 이상 입력된 화자 음성이 동일 음성으로 인식되면, 상기 동일 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성 명령으로 상기 메모리에 저장할 수 있다.
이때, 상기 제어부는 상기 동일 음성이 인식되면, 상기 동일 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성 명령으로 설정하기 위한 설정 UI를 상기 음성 등록 메뉴 내에 표시할 수 있다.
또한, 상기 제어부는 상기 마이크로폰이 턴온되어 상기 화자의 음성 녹음이 시작되면, 상기 음성 등록 메뉴 내에 마이크로폰 버튼을 표시하고, 상기 마이크로폰으로부터 기 설정된 시간 이내에 상기 화자 음성이 입력되지 않으면, 상기 마이크로폰을 턴오프시키고, 상기 마이크로폰 버튼을 턴오프된 형상으로 표시하며, 상기 마이크로폰 버튼이 선택되면, 상기 마이크로폰를 다시 턴온하여 상기 화자의 음성 녹음 동작을 수행할 수 있다.
또한, 상기 제어부는 상기 마이크로폰을 통해 입력된 화자 음성의 음량이 기 설정된 음량 이상이면, 상기 화자에게 현재의 음성의 음량보다 작게 말하도록 가이드하는 텍스트 정보를 표시할 수 있다.
또한, 상기 제어부는 상기 마이크로폰을 통해 입력되는 주변 소음의 음량이 기 설정된 음량 이상이면, 상기 화자에게 장소를 이동하여 음성을 입력하도록 가이드하는 텍스트 정보를 표시할 수 있다.
또한, 상기 제어부는 상기 인식된 화자 음성이 기 설정된 횟수 이상 상기 메모리에 저장된 음성과 매칭되지 않으면, 상기 인식된 화자 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성으로 상기 메모리에 저장하기 위한 음성 등록 메뉴를 표시할 수 있다.
또한, 상기 제어부는 상기 마이크로폰을 통해 화자 음성이 입력되는 시점에 상기 이동 단말기의 스피커에서 특정 사운드가 출력 중이면, 상기 마이크로폰을 통해 상기 화자 음성이 인식되기 전까지 상기 특정 사운드를 뮤트시킬 수 있다.
또한, 상기 메모리에 저장된 적어도 하나의 음성은 특정 어플리케이션의 실행 기능이 더 할당되고, 상기 제어부는 상기 인식된 화자 음성이 상기 메모리에 등록된 음성과 매칭되면, 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하고, 동시에 상기 특정 어플리케이션을 바로 실행할 수 있다.
또한, 상기 메모리에 저장된 적어도 하나의 음성은 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 제1 음성어 및 특정 어플리케이션 실행을 위한 제2 음성어를 포함하고, 상기 제어부는 상기 인식된 화자 음성 내에 제1 음성어만 포함된 경우 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하는 동작만을 수행하고, 상기 인식된 화자 음성 내에 제1 및 제2 음성어가 모두 포함된 경우 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하고, 동시에 상기 특정 어플리케이션을 바로 실행할 수 있다.
또한, 상기 화자 음성 및 상기 저장된 음성 각각의 제1 패턴은, 각각의 해당 음성에 해당하는 키워드 패턴을 포함하고, 상기 화자 음성 및 상기 저장된 음성 각각의 제2 패턴은, 각각의 해당 음성에 해당하는 목소리 패턴을 포함하고, 상기 화자 음성의 키워드 패턴이 상기 저장된 음성의 키워드 패턴과 기 설정된 수준 이상 유사할 경우에 상기 화자 음성의 키워드 패턴과 상기 저장된 음성의 키워드 패턴이 매칭된 것으로 1차 인식되며, 상기 화자 음성의 목소리 패턴이 상기 저장된 음성의 목소리 패턴과 기 설정된 수준 이상 유사할 경우에 상기 화자 음성의 목소리 패턴과 상기 저장된 음성의 목소리 패턴이 매칭된 것으로 2차 인식될 수 있다.
이 경우, 본 발명에 따른 이동 단말기는 기 설정된 시간 단위로 상기 마이크로부터 입력되는 화자 음성의 데이터를 버퍼링하는 버퍼와, 상기 마이크로폰으로부터 입력되는 화자 음성의 키워드 패턴을 분석하고, 상기 분석된 키워드 패턴이 상기 메모리에 저장된 음성의 키워드 패턴과 기 설정된 수준 이상 유사하면, 상기 버퍼에 버퍼링된 화자 음성을 상기 제어부로 송신하는 음성 인식기를 더 포함하고, 상기 제어부는 상기 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서는 비활성 상태가 되고, 상기 음성 인식기로부터 상기 화자 음성이 수신되면, 활성화 상태로 전환되고, 상기 수신된 화자 음성의 목소리 패턴을 분석하며, 상기 분석된 화자 음성의 목소리 패턴이 상기 메모리에 저장된 음성의 목소리 패턴과 기 설정된 수준 이상 유사하면, 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제할 수 있다.
또한, 본 발명에 따른 이동 단말기의 제어 방법은, 디스플레이부의 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서, 마이크로폰을 통해 화자 음성을 입력받는 단계와, 상기 마이크로폰을 통해 입력되는 화자 음성의 제1 패턴 및 상기 저장된 음성의 제1 패턴의 매칭 여부를 1차 판단하는 단계와, 상기 1차 판단 결과 매칭되면, 상기 화자 음성의 제2 패턴 및 상기 저장된 음성의 제2 패턴의 매칭 여부를 2차 판단하는 단계 및 상기 2차 판단 결과 매칭되면, 상기 화면을 턴온하거나 또는 상기 화면의 잠금을 해제하는 단계를 포함할 수 있다.
본 발명에 따른 이동 단말기 및 그 제어 방법의 효과에 대해 설명하면 다음과 같다.
본 발명의 실시예들 중 적어도 하나에 의하면, 사용자가 본인의 음성을 이용하여 쉽고 빠르게 화면 턴온 및 화면 잠금 해제를 수행할 수 있고, 또한 시각 장애인들이 음성을 이용하여 쉽고 빠르게 화면 턴온 및 화면 잠금 해제를 수행할 수 있도록 하는 효과를 제공한다.
도 1a는 본 발명과 관련된 이동 단말기를 설명하기 위한 블록도이다.
도 1b 및 1c는 본 발명과 관련된 이동 단말기의 일 예를 서로 다른 방향에서 바라본 개념도이다.
도 2는 본 발명에 따른 보이스 턴온 및 보이스 언락 기능에 대한 이동 단말기의 제어 과정을 나타낸 일 실시예 흐름도이다.
도 3 내지 도 14는 본 발명에 따른 보이스 턴온 및 보이스 언락 기능에 대한 이동 단말기의 제어 과정을 나타낸 일 실시예 설명도이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다.
그러나, 본 명세서에 기재된 실시 예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.
도 1a는 본 발명과 관련된 이동 단말기를 설명하기 위한 블록도이고, 도 1b 및 1c는 본 발명과 관련된 이동 단말기의 일 예를 서로 다른 방향에서 바라본 개념도이다.
상기 이동 단말기(100)는 무선 통신부(110), 입력부(120), 감지부(140), 출력부(150), 인터페이스부(160), 메모리(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1a에 도시된 구성요소들은 이동 단말기를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 이동 단말기는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
보다 구체적으로, 상기 구성요소들 중 무선 통신부(110)는, 이동 단말기(100)와 무선 통신 시스템 사이, 이동 단말기(100)와 다른 이동 단말기(100) 사이, 또는 이동 단말기(100)와 다른 이동 단말기(100, 또는 외부서버)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다.
이러한 무선 통신부(110)는, 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114), 위치정보 모듈(115) 중 적어도 하나를 포함할 수 있다.
입력부(120)는, 영상 신호 입력을 위한 카메라(121) 또는 영상 입력부, 오디오 신호 입력을 위한 마이크로폰(microphone, 122), 또는 오디오 입력부, 사용자로부터 정보를 입력받기 위한 사용자 입력부(123, 예를 들어, 터치키(touch key), 푸시키(mechanical key) 등)를 포함할 수 있다. 입력부(120)에서 수집한 음성 데이터나 이미지 데이터는 분석되어 사용자의 제어명령으로 처리될 수 있다.
코덱(130)은, 마이크로폰(122)으로부터 입력되는 아날로그 음성 데이터를 디지털 음성 데이터로 변환하는 동작으로 수행하고, 기 설정된 시간 단위로 상기 마이크로폰(122)으로부터 입력되는 화자 음성의 데이터를 버퍼링하는 버퍼(131) 및 상기 마이크로폰(122)으로부터 입력되는 화자 음성에 해당하는 키워드의 패턴을 분석하고, 상기 분석된 키워드 패턴이 메모리(170)에 등록된 음성의 키워드 패턴과 기 설정된 수준 이상 유사하면, 상기 버퍼(131)에 버퍼링된 화자 음성을 제어부(180)로 송신하는 음성 인식기(132)를 포함한다.상기 버퍼(131) 및 음성 인식기(132)에 대한 동작은 추후 상세히 후술한다.
센싱부(140)는 이동 단말기 내 정보, 이동 단말기를 둘러싼 주변 환경 정보 및 사용자 정보 중 적어도 하나를 센싱하기 위한 하나 이상의 센서를 포함할 수 있다. 예를 들어, 센싱부(140)는 근접센서(141, proximity sensor), 조도 센서(142, illumination sensor), 터치 센서(touch sensor), 가속도 센서(acceleration sensor), 자기 센서(magnetic sensor), 중력 센서(G-sensor), 자이로스코프 센서(gyroscope sensor), 모션 센서(motion sensor), RGB 센서, 적외선 센서(IR 센서: infrared sensor), 지문인식 센서(finger scan sensor), 초음파 센서(ultrasonic sensor), 광 센서(optical sensor, 예를 들어, 카메라(121 참조), 마이크로폰(microphone, 122 참조), 배터리 게이지(battery gage), 환경 센서(예를 들어, 기압계, 습도계, 온도계, 방사능 감지 센서, 열 감지 센서, 가스 감지 센서 등), 화학 센서(예를 들어, 전자 코, 헬스케어 센서, 생체 인식 센서 등) 중 적어도 하나를 포함할 수 있다. 한편, 본 명세서에 개시된 이동 단말기는, 이러한 센서들 중 적어도 둘 이상의 센서에서 센싱되는 정보들을 조합하여 활용할 수 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부(151), 음향 출력부(152), 햅팁 모듈(153), 광 출력부(154) 중 적어도 하나를 포함할 수 있다. 디스플레이부(151)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 이동 단말기(100)와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부(123)로써 기능함과 동시에, 이동 단말기(100)와 사용자 사이의 출력 인터페이스를 제공할 수 있다.
인터페이스부(160)는 이동 단말기(100)에 연결되는 다양한 종류의 외부 기기와의 통로 역할을 수행한다. 이러한 인터페이스부(160)는, 유/무선 헤드셋 포트(port), 외부 충전기 포트(port), 유/무선 데이터 포트(port), 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트(port), 오디오 I/O(Input/Output) 포트(port), 비디오 I/O(Input/Output) 포트(port), 이어폰 포트(port) 중 적어도 하나를 포함할 수 있다. 이동 단말기(100)에서는, 상기 인터페이스부(160)에 외부 기기가 연결되는 것에 대응하여, 연결된 외부 기기와 관련된 적절할 제어를 수행할 수 있다.
메모리(170)는 이동 단말기(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 이동 단말기(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 또한 이러한 응용 프로그램 중 다른 적어도 일부는, 이동 단말기(100)의 기본적인 기능(예를 들어, 전화 착신, 발신 기능, 메시지 수신, 발신 기능)을 위하여 출고 당시부터 이동 단말기(100)상에 존재할 수 있다. 한편, 응용 프로그램은, 메모리(170)에 저장되고, 이동 단말기(100) 상에 설치되어, 제어부(180)에 의하여 상기 이동 단말기의 동작(또는 기능)을 수행하도록 구동될 수 있다.
제어부(180)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 이동 단말기(100)의 전반적인 동작을 제어한다. 제어부(180)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(170)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
또한, 제어부(180)는 메모리(170)에 저장된 응용 프로그램을 구동하기 위하여, 도 1a와 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 제어부(180)는 상기 응용 프로그램의 구동을 위하여, 이동 단말기(100)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작시킬 수 있다.
전원공급부(190)는 제어부(180)의 제어 하에서, 외부의 전원, 내부의 전원을 인가 받아 이동 단말기(100)에 포함된 각 구성요소들에 전원을 공급한다. 이러한 전원공급부(190)는 배터리를 포함하며, 상기 배터리는 내장형 배터리 또는 교체가능한 형태의 배터리가 될 수 있다.
상기 각 구성요소들 중 적어도 일부는, 이하에서 설명되는 다양한 실시 예들에 따른 이동 단말기의 동작, 제어, 또는 제어방법을 구현하기 위하여 서로 협력하여 동작할 수 있다. 또한, 상기 이동 단말기의 동작, 제어, 또는 제어방법은 상기 메모리(170)에 저장된 적어도 하나의 응용 프로그램의 구동에 의하여 이동 단말기 상에서 구현될 수 있다.
이하에서는, 위에서 살펴본 이동 단말기(100)를 통하여 구현되는 다양한 실시 예들을 살펴보기에 앞서, 위에서 열거된 구성요소들에 대하여, 도 1a를 참조하여 보다 구체적으로 살펴본다.
먼저, 무선 통신부(110)에 대하여 살펴보면, 무선 통신부(110)의 방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 적어도 두 개의 방송 채널들에 대한 동시 방송 수신 또는 방송 채널 스위칭을 위해 둘 이상의 상기 방송 수신 모듈이 상기 이동단말기(100)에 제공될 수 있다.
이동통신 모듈(112)은, 이동통신을 위한 기술 표준들 또는 통신 방식(예를 들어, GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), WCDMA(Wideband CDMA), HSDPA(High Speed Downlink Packet Access), LTE(Long Term Evolution) 등)에 따라 구축된 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다.
상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 모듈(113)은 무선 인터넷 기술들에 따른 통신망에서 무선 신호를 송수신하도록 이루어진다.
무선 인터넷 기술로는, 예를 들어 WLAN(Wireless LAN), WiFi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), LTE(Long Term Evolution) 등이 있으며, 상기 무선 인터넷 모듈(113)은 상기에서 나열되지 않은 인터넷 기술까지 포함한 범위에서 적어도 하나의 무선 인터넷 기술에 따라 데이터를 송수신하게 된다.
Wibro, HSDPA, GSM, CDMA, WCDMA, LTE 등에 의한 무선인터넷 접속은 이동통신망을 통해 이루어진다는 관점에서 본다면, 상기 이동통신망을 통해 무선인터넷 접속을 수행하는 상기 무선 인터넷 모듈(113)은 상기 이동통신 모듈(112)의 일종으로 이해될 수도 있다.
근거리 통신 모듈(114)은 근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다. 이러한, 근거리 통신 모듈(114)은, 근거리 무선 개인 통신망(Wireless Personal Area Networks)을 통해 이동 단말기(100)와 무선 통신 시스템 사이, 이동 단말기(100)와 다른 이동 단말기(100) 사이, 또는 이동 단말기(100)와 다른 이동 단말기(100, 또는 외부서버)가 위치한 네트워크 사이의 무선 통신을 지원할 수 있다.
여기에서, 다른 이동 단말기(100)는 본 발명에 따른 이동 단말기(100)와 데이터를 상호 교환하는 것이 가능한(또는 연동 가능한) 웨어러블 디바이스(wearable device, 예를 들어, 스마트워치(smartwatch), 스마트 글래스(smart glass), HMD(head mounted display))가 될 수 있다.
근거리 통신 모듈(114)은, 이동 단말기(100) 주변에, 상기 이동 단말기(100)와 통신 가능한 웨어러블 디바이스를 감지(또는 인식)할 수 있다. 나아가, 제어부(180)는 상기 감지된 웨어러블 디바이스가 본 발명에 따른 이동 단말기(100)와 통신하도록 인증된 디바이스인 경우, 이동 단말기(100)에서 처리되는 데이터의 적어도 일부를, 상기 근거리 통신 모듈(114)을 통해 웨어러블 디바이스로 전송할 수 있다.
따라서, 웨어러블 디바이스의 사용자는, 이동 단말기(100)에서 처리되는 데이터를, 웨어러블 디바이스를 통해 이용할 수 있다. 예를 들어, 이에 따르면 사용자는, 이동 단말기(100)에 전화가 수신된 경우, 웨어러블 디바이스를 통해 전화 통화를 수행하거나, 이동 단말기(100)에 메시지가 수신된 경우, 웨어러블 디바이스를 통해 상기 수신된 메시지를 확인하는 것이 가능하다.
위치정보 모듈(115)은 이동 단말기의 위치(또는 현재 위치)를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Positioning System) 모듈 또는 WiFi(Wireless Fidelity) 모듈이 있다. 예를 들어, 이동 단말기는 GPS모듈을 활용하면, GPS 위성에서 보내는 신호를 이용하여 이동 단말기의 위치를 획득할 수 있다. 다른 예로서, 이동 단말기는 Wi-Fi모듈을 활용하면, Wi-Fi모듈과 무선신호를 송신 또는 수신하는 무선 AP(Wireless Access Point)의 정보에 기반하여, 이동 단말기의 위치를 획득할 수 있다.
다음으로, 입력부(120)에 대하여 보다 구체적으로 살펴보면, 입력부(120)는 영상 정보(또는 신호), 오디오 정보(또는 신호), 또는 사용자로부터 입력되는 정보의 입력을 위한 것으로서, 영상 정보의 입력을 위하여, 이동 단말기(100)는 하나 또는 복수의 카메라(121)를 구비할 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다. 한편, 이동 단말기(100)에 구비되는 복수의 카메라(121)는 매트릭스 구조를 이루도록 배치될 수 있으며, 이와 같이 매트릭스 구조를 이루는 카메라(121)를 통하여, 이동 단말기(100)에는 다양한 각도 또는 초점을 갖는 복수의 영상정보가 입력될 수 있다. 또한, 복수의 카메라(121)는 입체영상을 구현하기 위한 좌 영상 및 우 영상을 획득하도록, 스트레오 구조로 배치될 수 있다.
마이크로폰(122)은 외부의 음향 신호를 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 이동 단말기(100)에서 수행 중인 기능(또는 실행 중인 응용 프로그램)에 따라 다양하게 활용될 수 있다. 한편, 마이크(122)에는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(123)는 사용자로부터 정보를 입력받기 위한 것으로서, 사용자 입력부(123)를 통해 정보가 입력되면, 제어부(180)는 입력된 정보에 대응되도록 이동 단말기(100)의 동작을 제어할 수 있다. 이러한, 사용자 입력부(123)는 기계식 (mechanical) 입력수단(또는, 메커니컬 키, 예를 들어, 이동 단말기(100)의 전·후면 또는 측면에 위치하는 버튼, 돔 스위치(dome switch), 조그 휠, 조그 스위치 등) 및 터치식 입력수단을 포함할 수 있다. 일 예로서, 터치식 입력수단은, 소프트웨어적인 처리를 통해 터치스크린에 표시되는 가상 키(virtual key), 소프트 키(soft key) 또는 비주얼 키(visual key)로 이루어지거나, 상기 터치스크린 이외의 부분에 배치되는 터치 키(touch key)로 이루어질 수 있다. 한편, 상기 가상키 또는 비주얼 키는, 다양한 형태를 가지면서 터치스크린 상에 표시되는 것이 가능하며, 예를 들어, 그래픽(graphic), 텍스트(text), 아이콘(icon), 비디오(video) 또는 이들의 조합으로 이루어질 수 있다.
한편, 센싱부(140)는 이동 단말기 내 정보, 이동 단말기를 둘러싼 주변 환경 정보 및 사용자 정보 중 적어도 하나를 센싱하고, 이에 대응하는 센싱 신호를 발생시킨다. 제어부(180)는 이러한 센싱 신호에 기초하여, 이동 단말기(100)의 구동 또는 동작을 제어하거나, 이동 단말기(100)에 설치된 응용 프로그램과 관련된 데이터 처리, 기능 또는 동작을 수행 할 수 있다. 센싱부(140)에 포함될 수 있는 다양한 센서 중 대표적인 센서들의 대하여, 보다 구체적으로 살펴본다.
먼저, 근접 센서(141)는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 이러한 근접 센서(141)는 위에서 살펴본 터치 스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(141)가 배치될 수 있다. 근접 센서(141)는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.
근접 센서(141)의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전 용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 터치 스크린이 정전식인 경우에, 근접 센서(141)는 전도성을 갖는 물체의 근접에 따른 전계의 변화로 상기 물체의 근접을 검출하도록 구성될 수 있다. 이 경우 터치 스크린(또는 터치 센서) 자체가 근접 센서로 분류될 수 있다.
한편, 설명의 편의를 위해, 터치 스크린 상에 물체가 접촉되지 않으면서 근접되어 상기 물체가 상기 터치 스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 명명하고, 상기 터치 스크린 상에 물체가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 명명한다. 상기 터치 스크린 상에서 물체가 근접 터치 되는 위치라 함은, 상기 물체가 근접 터치될 때 상기 물체가 상기 터치 스크린에 대해 수직으로 대응되는 위치를 의미한다. 상기 근접 센서(141)는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지할 수 있다. 한편, 제어부(180)는 위와 같이, 근접 센서(141)를 통해 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 데이터(또는 정보)를 처리하며, 나아가, 처리된 데이터에 대응하는 시각적인 정보를 터치 스크린상에 출력시킬 수 있다. 나아가, 제어부(180)는, 터치 스크린 상의 동일한 지점에 대한 터치가, 근접 터치인지 또는 접촉 터치인지에 따라, 서로 다른 동작 또는 데이터(또는 정보)가 처리되도록 이동 단말기(100)를 제어할 수 있다.
터치 센서는 저항막 방식, 정전용량 방식, 적외선 방식, 초음파 방식, 자기장 방식 등 여러가지 터치방식 중 적어도 하나를 이용하여 터치 스크린(또는 디스플레이부(151))에 가해지는 터치(또는 터치입력)을 감지한다.
일 예로서, 터치 센서는, 터치 스크린의 특정 부위에 가해진 압력 및 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는, 터치 스크린 상에 터치를 가하는 터치 대상체가 터치 센서 상에 터치 되는 위치, 면적, 터치 시의 압력 등을 검출할 수 있도록 구성될 수 있다. 여기에서, 터치 대상체는 상기 터치 센서에 터치를 인가하는 물체로서, 예를 들어, 손가락, 터치펜 또는 스타일러스 펜(Stylus pen), 포인터 등이 될 수 있다.
이와 같이, 터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다. 여기에서, 터치 제어기는, 제어부(180)와 별도의 구성요소일 수 있고, 제어부(180) 자체일 수 있다.
한편, 제어부(180)는, 터치 스크린(또는 터치 스크린 이외에 구비된 터치키)을 터치하는, 터치 대상체의 종류에 따라 서로 다른 제어를 수행하거나, 동일한 제어를 수 행할 수 있다. 터치 대상체의 종류에 따라 서로 다른 제어를 수행할지 또는 동일한 제어를 수행할 지는, 현재 이동 단말기(100)의 동작상태 또는 실행 중인 응용 프로그램에 따라 결정될 수 있다.
한편, 위에서 살펴본 터치 센서 및 근접 센서는 독립적으로 또는 조합되어, 터치 스크린에 대한 숏(또는 탭) 터치(short touch), 롱 터치(long touch), 멀티 터치(multi touch), 드래그 터치(drag touch), 플리크 터치(flick touch), 핀치-인 터치(pinch-in touch), 핀치-아웃 터치(pinch-out 터치), 스와이프(swype) 터치, 호버링(hovering) 터치, 특정 압력 세기를 가지는 포스(Force) 터치 등과 같은, 다양한 방식의 터치를 센싱할 수 있다.
초음파 센서는 초음파를 이용하여, 감지대상의 위치정보를 인식할 수 있다. 한편, 제어부(180)는 광 센서와 복수의 초음파 센서로부터 감지되는 정보를 통해, 파동 발생원의 위치를 산출하는 것이 가능하다. 파동 발생원의 위치는, 광이 초음파보다 매우 빠른 성질, 즉, 광이 광 센서에 도달하는 시간이 초음파가 초음파 센서에 도달하는 시간보다 매우 빠름을 이용하여, 산출될 수 있다. 보다 구체적으로 광을 기준 신호로 초음파가 도달하는 시간과의 시간차를 이용하여 파동 발생원의 위치가 산출될 수 있다.
한편, 입력부(120)의 구성으로 살펴본, 카메라(121)는 카메라 센서의 일종으로, 이러한 카메라 센서는, 카메라(121), 포토 센서 및 레이저 센서 중 적어도 하나를 포함한다.
카메라(121)와 레이저 센서는 서로 조합되어, 3차원 입체영상에 대한 감지대상의 터치를 감지할 수 있다. 포토 센서는 디스플레이 소자에 적층될 수 있는데, 이러한 포토 센서는 터치 스크린에 근접한 감지대상의 움직임을 스캐닝하도록 이루어진다. 보다 구체적으로, 포토 센서는 행/열에 Photo Diode와 TR(Transistor)를 실장하여 Photo Diode에 인가되는 빛의 양에 따라 변화되는 전기적 신호를 이용하여 포토 센서 위에 올려지는 내용물을 스캔한다. 즉, 포토 센서는 빛의 변화량에 따른 감지대상의 좌표 계산을 수행하며, 이를 통하여 감지대상의 위치정보가 획득될 수 있다.
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 디스플레이부(151)는 이동 단말기(100)에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다.
또한, 상기 디스플레이부(151)는 입체영상을 표시하는 입체 디스플레이부로서 구성될 수 있다.
상기 입체 디스플레이부에는 스테레오스코픽 방식(안경 방식), 오토 스테레오스코픽 방식(무안경 방식), 프로젝션 방식(홀로그래픽 방식) 등의 3차원 디스플레이 방식이 적용될 수 있다.
음향 출력부(152)는 호신호수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(170)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력부(152)는 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력부(152)에는 리시버(receiver), 스피커(speaker), 버저(buzzer) 등이 포함될 수 있다.
햅틱 모듈(haptic module)(153)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(153)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 될 수 있다. 햅택 모듈(153)에서 발생하는 진동의 세기와 패턴 등은 사용자의 선택 또는 제어부의 설정에 의해 제어될 수 있다. 예를 들어, 상기 햅틱 모듈(153)은 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.
햅틱 모듈(153)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.
햅틱 모듈(153)은 직접적인 접촉을 통해 촉각 효과를 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(153)은 이동 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
광출력부(154)는 이동 단말기(100)의 광원의 빛을 이용하여 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기(100)에서 발생 되는 이벤트의 예로는 메세지 수신, 호 신호 수신, 부재중 전화, 알람, 일정 알림, 이메일 수신, 어플리케이션을 통한 정보 수신 등이 될 수 있다.
광출력부(154)가 출력하는 신호는 이동 단말기(100)가 전면이나 후면으로 단색이나 복수색의 빛을 발광함에 따라 구현된다. 상기 신호 출력은 이동 단말기(100)가 사용자의 이벤트 확인을 감지함에 의하여 종료될 수 있다.
인터페이스부(160)는 이동 단말기(100)에 연결되는 모든 외부 기기와의 통로 역할을 한다. 인터페이스부(160)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 이동 단말기(100) 내부의 각 구성요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트(port), 외부 충전기 포트(port), 유/무선 데이터 포트(port), 메모리 카드(memory card) 포트(port), 식별 모듈이 구비된 장치를 연결하는 포트(port), 오디오 I/O(Input/Output) 포트(port), 비디오 I/O(Input/Output) 포트(port), 이어폰 포트(port) 등이 인터페이스부(160)에 포함될 수 있다.
한편, 식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(user identify module; UIM), 가입자 인증 모듈(subscriber identity module; SIM), 범용 사용자 인증 모듈(universal subscriber identity module; USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 상기 인터페이스부(160)를 통하여 단말기(100)와 연결될 수 있다.
또한, 상기 인터페이스부(160)는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동 단말기(100)로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동 단말기(100)가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수 있다.
메모리(170)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(170)는 상기 터치 스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.
메모리(170)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(170)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작될 수도 있다.
한편, 앞서 살펴본 것과 같이, 제어부(180)는 응용 프로그램과 관련된 동작과, 통상적으로 이동 단말기(100)의 전반적인 동작을 제어한다. 예를 들어, 제어부(180)는 상기 이동 단말기의 상태가 설정된 조건을 만족하면, 애플리케이션들에 대한 사용자의 제어 명령의 입력을 제한하는 잠금 상태를 실행하거나, 해제할 수 있다.
또한, 제어부(180)는 음성 통화, 데이터 통신, 화상 통화 등과 관련된 제어 및 처리를 수행하거나, 터치 스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다. 나아가 제어부(180)는 이하에서 설명되는 다양한 실시 예들을 본 발명에 따른 이동 단말기(100) 상에서 구현하기 위하여, 위에서 살펴본 구성요소들을 중 어느 하나 또는 복수를 조합하여 제어할 수 있다.
또한, 제어부(180)는 어플리케이션 프로세서 형태로 구성될 수 있고, 경우에 따라 본 발명에 따른 보이스 턴온 또는 보이스 언락과 관련된 제어부(180)의 모든 동작은 소프트웨어 형태로 실행될 수 있다.
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가 받아 각 구성요소들의 동작에 필요한 전원을 공급한다. 전원공급부(190)는 배터리를 포함하며, 배터리는 충전 가능하도록 이루어지는 내장형 배터리가 될 수 있으며, 충전 등을 위하여 단말기 바디에 착탈 가능하게 결합될 수 있다.
또한, 전원공급부(190)는 연결포트를 구비할 수 있으며, 연결포트는 배터리의 충전을 위하여 전원을 공급하는 외부 충전기가 전기적으로 연결되는 인터페이스(160)의 일 예로서 구성될 수 있다.
다른 예로서, 전원공급부(190)는 상기 연결포트를 이용하지 않고 무선방식으로 배터리를 충전하도록 이루어질 수 있다. 이 경우에, 전원공급부(190)는 외부의 무선 전력 전송장치로부터 자기 유도 현상에 기초한 유도 결합(Inductive Coupling) 방식이나 전자기적 공진 현상에 기초한 공진 결합(Magnetic Resonance Coupling) 방식 중 하나 이상을 이용하여 전력을 전달받을 수 있다.
한편, 이하에서 다양한 실시 예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
도 1 b 및 1c를 참조하면, 개시된 이동 단말기(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고 와치 타입, 클립 타입, 글래스 타입 또는 2 이상의 바디들이 상대 이동 가능하게 결합되는 폴더 타입, 플립 타입, 슬라이드 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용될 수 있다.
여기에서, 단말기 바디는 이동 단말기(100)를 적어도 하나의 집합체로 보아 지칭하는 개념으로 이해될 수 있다.
이동 단말기(100)는 외관을 이루는 케이스(프레임, 하우징, 커버 등)를 포함한다. 도시된 바와 같이, 이동 단말기(100)는 프론트 케이스(101)와 리어 케이스(102)를 포함할 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 결합에 의해 형성되는 내부공간에는 각종 전자부품들이 배치된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 미들 케이스가 추가로 배치될 수 있다.
단말기 바디의 전면에는 디스플레이부(151)가 배치되어 정보를 출력할 수 있다. 도시된 바와 같이, 디스플레이부(151)의 윈도우(151a)는 프론트 케이스(101)에 장착되어 프론트 케이스(101)와 함께 단말기 바디의 전면을 형성할 수 있다.
경우에 따라서, 리어 케이스(102)에도 전자부품이 장착될 수 있다. 리어 케이스(102)에 장착 가능한 전자부품은 착탈 가능한 배터리, 식별 모듈, 메모리 카드 등이 있다. 이 경우, 리어 케이스(102)에는 장착된 전자부품을 덮기 위한 후면커버(103)가 착탈 가능하게 결합될 수 있다. 따라서, 후면 커버(103)가 리어 케이스(102)로부터 분리되면, 리어 케이스(102)에 장착된 전자부품은 외부로 노출된다.
도시된 바와 같이, 후면커버(103)가 리어 케이스(102)에 결합되면, 리어 케이스(102)의 측면 일부가 노출될 수 있다. 경우에 따라서, 상기 결합시 리어 케이스(102)는 후면커버(103)에 의해 완전히 가려질 수도 있다. 한편, 후면커버(103)에는 카메라(121b)나 음향 출력부(152b)를 외부로 노출시키기 위한 개구부가 구비될 수 있다.
이러한 케이스들(101, 102, 103)은 합성수지를 사출하여 형성되거나 금속, 예를 들어 스테인레스 스틸(STS), 알루미늄(Al), 티타늄(Ti) 등으로 형성될 수도 있다.
이동 단말기(100)는, 복수의 케이스가 각종 전자부품들을 수용하는 내부 공간을 마련하는 위의 예와 달리, 하나의 케이스가 상기 내부 공간을 마련하도록 구성될 수도 있다. 이 경우, 합성수지 또는 금속이 측면에서 후면으로 이어지는 유니 바디의 이동 단말기(100)가 구현될 수 있다.
한편, 이동 단말기(100)는 단말기 바디 내부로 물이 스며들지 않도록 하는 방수부(미도시)를 구비할 수 있다. 예를 들어, 방수부는 윈도우(151a)와 프론트 케이스(101) 사이, 프론트 케이스(101)와 리어 케이스(102) 사이 또는 리어 케이스(102)와 후면 커버(103) 사이에 구비되어, 이들의 결합시 내부 공간을 밀폐하는 방수부재를 포함할 수 있다.
이동 단말기(100)에는 디스플레이부(151), 제1 및 제2 음향 출력부(152a, 152b), 근접 센서(141), 조도 센서(142), 광 출력부(154), 제1 및 제2 카메라(121a, 121b), 제1 및 제2 조작유닛(123a, 123b), 마이크(122), 인터페이스부(160) 등이 구비될 수 있다.
이하에서는, 도 1b 및 도 1c에 도시된 바와 같이, 단말기 바디의 전면에 디스플레이부(151), 제1 음향 출력부(152a), 근접 센서(141), 조도 센서(142), 광 출력부(154), 제1 카메라(121a) 및 제1 조작유닛(123a)이 배치되고, 단말기 바디의 측면에 제2 조작유닛(123b), 마이크(122) 및 인터페이스부(160)이 배치되며, 단말기 바디의 후면에 제2 음향 출력부(152b) 및 제2 카메라(121b)가 배치된 이동 단말기(100)를 일 예로 들어 설명한다.
다만, 이들 구성은 이러한 배치에 한정되는 것은 아니다. 이들 구성은 필요에 따라 제외되거나, 다른 면에 배치될 수 있다. 예를 들어, 단말기 바디의 전면에는 제1 조작유닛(123a)이 구비되지 않을 수 있으며, 제2 음향 출력부(152b)은 단말기 바디의 후면이 아닌 단말기 바디의 측면에 구비될 수 있다.
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 디스플레이부(151)는 이동 단말기(100)에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다.
디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전자잉크 디스플레이(e-ink display) 중에서 적어도 하나를 포함할 수 있다.
또한, 디스플레이부(151)는 이동 단말기(100)의 구현 형태에 따라 2개 이상 존재할 수 있다. 이 경우, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.
디스플레이부(151)는 터치 방식에 의하여 제어 명령을 입력 받을 수 있도록, 디스플레이부(151)에 대한 터치를 감지하는 터치센서를 포함할 수 있다. 이를 이용하여, 디스플레이부(151)에 대하여 터치가 이루어지면, 터치센서는 상기 터치를 감지하고, 제어부(180)는 이에 근거하여 상기 터치에 대응하는 제어명령을 발생시키도록 이루어질 수 있다. 터치 방식에 의하여 입력되는 내용은 문자 또는 숫자이거나, 각종 모드에서의 지시 또는 지정 가능한 메뉴항목 등일 수 있다.
한편, 터치센서는, 터치패턴을 구비하는 필름 형태로 구성되어 윈도우(151a)와 윈도우(151a)의 배면 상의 디스플레이(미도시) 사이에 배치되거나, 윈도우(151a)의 배면에 직접 패터닝되는 메탈 와이어가 될 수도 있다. 또는, 터치센서는 디스플레이와 일체로 형성될 수 있다. 예를 들어, 터치센서는, 디스플레이의 기판 상에 배치되거나, 디스플레이의 내부에 구비될 수 있다.
이처럼, 디스플레이부(151)는 터치센서와 함께 터치 스크린을 형성할 수 있으며, 이 경우에 터치 스크린은 사용자 입력부(123, 도 1a 참조)로 기능할 수 있다. 경우에 따라, 터치 스크린은 제1조작유닛(123a)의 적어도 일부 기능을 대체할 수 있다.
제1 음향 출력부(152a)는 통화음을 사용자의 귀에 전달시키는 리시버(receiver)로 구현될 수 있으며, 제2 음향 출력부(152b)는 각종 알람음이나 멀티미디어의 재생음을 출력하는 라우드 스피커(loud speaker)의 형태로 구현될 수 있다.
디스플레이부(151)의 윈도우(151a)에는 제1 음향 출력부(152a)로부터 발생되는 사운드의 방출을 위한 음향홀이 형성될 수 있다. 다만, 본 발명은 이에 한정되는 것은 아니고, 상기 사운드는 구조물 간의 조립틈[예를 들어, 윈도우(151a)와 프론트 케이스(101) 간의 틈]을 따라 방출되도록 구성될 수 있다. 이 경우, 외관상 음향 출력을 위하여 독립적으로 형성되는 홀이 보이지 않거나 숨겨져 이동 단말기(100)의 외관이 보다 심플해질 수 있다.
광 출력부(154)는 이벤트의 발생시 이를 알리기 위한 빛을 출력하도록 이루어진다. 상기 이벤트의 예로는 메시지 수신, 호 신호 수신, 부재중 전화, 알람, 일정 알림, 이메일 수신, 어플리케이션을 통한 정보 수신 등을 들 수 있다. 제어부(180)는 사용자의 이벤트 확인이 감지되면, 빛의 출력이 종료되도록 광 출력부(154)를 제어할 수 있다.
제1 카메라(121a)는 촬영 모드 또는 화상통화 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있으며, 메모리(170)에 저장될 수 있다.
제1 및 제2 조작유닛(123a, 123b)은 이동 단말기(100)의 동작을 제어하기 위한 명령을 입력 받기 위해 조작되는 사용자 입력부(123)의 일 예로서, 조작부(manipulating portion)로도 통칭될 수 있다. 제1 및 제2 조작유닛(123a, 123b)은 터치, 푸시, 스크롤 등 사용자가 촉각적인 느낌을 받으면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.
본 도면에서는 제1 조작유닛(123a)이 터치키(touch key)인 것으로 예시하나, 본 발명이 이에 한정되는 것은 아니다. 예를 들어, 제1 조작유닛(123a)은 푸시키(mechanical key)가 되거나, 터치키와 푸시키의 조합으로 구성될 수 있다.
제1 및 제2 조작유닛(123a, 123b)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1 조작유닛(123a)은 메뉴, 홈키, 취소, 검색 등의 명령을 입력 받고, 제2 조작유닛(123b)은 제1 또는 제2 음향 출력부(152a, 152b)에서 출력되는 음향의 크기 조절, 디스플레이부(151)의 터치 인식 모드로의 전환 등의 명령을 입력 받을 수 있다.
한편, 단말기 바디의 후면에는 사용자 입력부(123)의 다른 일 예로서, 후면 입력부(미도시)가 구비될 수 있다. 이러한 후면 입력부는 이동 단말기(100)의 동작을 제어하기 위한 명령을 입력 받기 위해 조작되는 것으로서, 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 전원의 온/오프, 시작, 종료, 스크롤 등과 같은 명령, 제1 및 제2 음향 출력부(152a, 152b)에서 출력되는 음향의 크기 조절, 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력 받을 수 있다. 후면 입력부는 터치입력, 푸시입력 또는 이들의 조합에 의한 입력이 가능한 형태로 구현될 수 있다.
후면 입력부는 단말기 바디의 두께방향으로 전면의 디스플레이부(151)와 중첩되게 배치될 수 있다. 일 예로, 사용자가 단말기 바디를 한 손으로 쥐었을 때 검지를 이용하여 용이하게 조작 가능하도록, 후면 입력부는 단말기 바디의 후면 상단부에 배치될 수 있다. 다만, 본 발명은 반드시 이에 한정되는 것은 아니며, 후면 입력부의 위치는 변경될 수 있다.
이처럼 단말기 바디의 후면에 후면 입력부가 구비되는 경우, 이를 이용한 새로운 형태의 유저 인터페이스가 구현될 수 있다. 또한, 앞서 설명한 터치 스크린 또는 후면 입력부가 단말기 바디의 전면에 구비되는 제1 조작유닛(123a)의 적어도 일부 기능을 대체하여, 단말기 바디의 전면에 제1 조작유닛(123a)이 미배치되는 경우, 디스플레이부(151)가 보다 대화면으로 구성될 수 있다.
한편, 이동 단말기(100)에는 사용자의 지문을 인식하는 지문인식센서가 구비될 수 있으며, 제어부(180)는 지문인식센서를 통하여 감지되는 지문정보를 인증수단으로 이용할 수 있다. 상기 지문인식센서는 디스플레이부(151) 또는 사용자 입력부(123)에 내장될 수 있다.
마이크(122)는 사용자의 음성, 기타 소리 등을 입력 받도록 이루어진다. 마이크(122)는 복수의 개소에 구비되어 스테레오 음향을 입력 받도록 구성될 수 있다.
인터페이스부(160)는 이동 단말기(100)를 외부기기와 연결시킬 수 있는 통로가 된다. 예를 들어, 인터페이스부(160)는 다른 장치(예를 들어, 이어폰, 외장 스피커)와의 연결을 위한 접속단자, 근거리 통신을 위한 포트[예를 들어, 적외선 포트(IrDA Port), 블루투스 포트(Bluetooth Port), 무선 랜 포트(Wireless LAN Port) 등], 또는 이동 단말기(100)에 전원을 공급하기 위한 전원공급단자 중 적어도 하나일 수 있다. 이러한 인터페이스부(160)는 SIM(Subscriber Identification Module) 또는 UIM(User Identity Module), 정보 저장을 위한 메모리 카드 등의 외장형 카드를 수용하는 소켓의 형태로 구현될 수도 있다.
단말기 바디의 후면에는 제2카메라(121b)가 배치될 수 있다. 이 경우, 제2카메라(121b)는 제1카메라(121a)와 실질적으로 반대되는 촬영 방향을 가지게 된다.
제2카메라(121b)는 적어도 하나의 라인을 따라 배열되는 복수의 렌즈를 포함할 수 있다. 복수의 렌즈는 행렬(matrix) 형식으로 배열될 수도 있다. 이러한 카메라는, ‘어레이(array) 카메라’로 명명될 수 있다. 제2카메라(121b)가 어레이 카메라로 구성되는 경우, 복수의 렌즈를 이용하여 다양한 방식으로 영상을 촬영할 수 있으며, 보다 나은 품질의 영상을 획득할 수 있다.
플래시(124)는 제2카메라(121b)에 인접하게 배치될 수 있다. 플래시(124)는 제2카메라(121b)로 피사체를 촬영하는 경우에 피사체를 향하여 빛을 비추게 된다.
단말기 바디에는 제2 음향 출력부(152b)가 추가로 배치될 수 있다. 제2 음향 출력부(152b)는 제1 음향 출력부(152a)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.
단말기 바디에는 무선 통신을 위한 적어도 하나의 안테나가 구비될 수 있다. 안테나는 단말기 바디에 내장되거나, 케이스에 형성될 수 있다. 예를 들어, 방송 수신 모듈(111, 도 1a 참조)의 일부를 이루는 안테나는 단말기 바디에서 인출 가능하게 구성될 수 있다. 또는, 안테나는 필름 타입으로 형성되어 후면 커버(103)의 내측면에 부착될 수도 있고, 도전성 재질을 포함하는 케이스가 안테나로서 기능하도록 구성될 수도 있다.
단말기 바디에는 이동 단말기(100)에 전원을 공급하기 위한 전원 공급부(190, 도 1a 참조)가 구비된다. 전원 공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 착탈 가능하게 구성되는 배터리(191)를 포함할 수 있다.
배터리(191)는 인터페이스부(160)에 연결되는 전원 케이블을 통하여 전원을 공급받도록 구성될 수 있다. 또한, 배터리(191)는 무선충전기기를 통하여 무선충전 가능하도록 구성될 수도 있다. 상기 무선충전은 자기유도방식 또는 공진방식(자기공명방식)에 의하여 구현될 수 있다.
한편, 본 도면에서는 후면 커버(103)가 배터리(191)를 덮도록 리어 케이스(102)에 결합되어 배터리(191)의 이탈을 제한하고, 배터리(191)를 외부 충격과 이물질로부터 보호하도록 구성된 것을 예시하고 있다. 배터리(191)가 단말기 바디에 착탈 가능하게 구성되는 경우, 후면 커버(103)는 리어 케이스(102)에 착탈 가능하게 결합될 수 있다.
이동 단말기(100)에는 외관을 보호하거나, 이동 단말기(100)의 기능을 보조 또는 확장시키는 액세서리가 추가될 수 있다. 이러한 액세서리의 일 예로, 이동 단말기(100)의 적어도 일면을 덮거나 수용하는 커버 또는 파우치를 들 수 있다. 커버 또는 파우치는 디스플레이부(151)와 연동되어 이동 단말기(100)의 기능을 확장시키도록 구성될 수 있다. 액세서리의 다른 일 예로, 터치 스크린에 대한 터치입력을 보조 또는 확장하기 위한 터치펜을 들 수 있다.
이하에서는, 도 2 내지 도 12를 참조하여, 본 발명에 따라, 화자 음성을 이용하여 이동 단말기의 화면을 턴온시키거나 또는 화면 잠금을 해제하는 과정에 대해 상세히 설명한다.
또한, 이하에서는 화자 음성을 이용하여 이동 단말기의 화면을 턴온시키는 기능을 보이스 턴온(Voice Turn on) 기능으로 명칭하여 설명하고, 화자 음성을 이용하여 이동 단말기의 화면 잠금을 해제하는 기능을 보이스 언락(Voice Unlock) 기능으로 명칭하여 설명하고, 화자 음성을 이용하여 보이스 턴온 또는 보이스 언락 기능을 수행하는 동작 모드를 보이스 인식 모드로 명칭하여 설명한다.
도 2는 본 발명에 따른 보이스 턴온 및 보이스 언락 기능에 대한 이동 단말기의 제어 과정을 나타낸 일 실시예 흐름도이다.
도 3 내지 도 14는 본 발명에 따른 보이스 턴온 및 보이스 언락 기능에 대한 이동 단말기의 제어 과정을 나타낸 일 실시예 설명도이다.
도 2 내지 도 14를 참조하면, 도 2의 S200 내지 S230 과정은 보이스 턴온 및 보이스 언락 기능의 음성 명령어로 사용되는 화자 음성을 녹음하여 등록하는 과정에 대한 것이고, 도 2의 S240 내지 S290 과정은 마이크로폰(122)으로부터 입력된 화자 음성과 S200 내지 S230 과정에 의해 등록된 화자 음성이 매칭되었을 때 보이스 턴온 또는 보이스 언락 기능을 실행하는 과정을 나타내고 있다.
먼저, 이동 단말기(100)의 제어부(180)는 디스플레이부(151) 상에 표시된 메뉴 항목들 중 보이스 턴온 및 보이스 언락 기능의 음성 명령어로 사용되는 화자 음성을 녹음하여 등록하기 위한 메뉴 항목이 선택되면, 상기 선택된 메뉴 항목에 해당하는 음성 등록 메뉴를 화면 상에 표시하도록 제어한다[S200].
일 예로, 도 3의 (a)에 도시된 바와 같이, 상기 음성 등록 메뉴가 최초 표시되면, 상기 음성 등록 메뉴의 제1 페이지 내에는 상기 보이스 턴온 및 보이스 언락 기능에 대한 설명이 기재되어 있고, 화자 음성을 녹음 시의 유의 사항 등이 기재되어 있을 수 있다.
그 다음으로, 상기 음성 등록 메뉴의 제1 페이지 내의 "Next 버튼"이 선택되면, 도 3의 (b)에 도시된 음성 등록 메뉴의 제2 페이지로 전환되고, 상기 음성 등록 메뉴의 제2 페이지는 실제 화자 음성을 녹음 시에 상기 화자 음성의 등록 성공에 대한 녹음 조건이 기재되어 있다.
또한, 제2 페이지 내에 표시되는 이미지 또는 애니메이션은 화자가 녹음할 음성을 말할 때 크고 발음이 명확하게 말하도록 요청하는 이미지 또는 애니메이션이 될 수 있다.
또한, 보이스 턴온 및 보이스 언락 기능의 음성 명령어로 사용되는 화자 음성은 마이크로폰(122)을 통해 화자 음성을 적어도 2회 이상이 입력되고, 상기 적어도 2회 이상 입력된 화자 음성이 서로 동일 음성으로 인식되었을 때 상기 동일 음성을 상기 보이스 턴온 또는 보이스 언락 기능을 위한 음성 명령어로 메모리(170)에 등록될 수 있다.
그 다음으로, 상기 음성 등록 메뉴의 제2 페이지 내의 "Start 버튼"이 선택되면, 도 3의 (c)에 도시된 음성 등록 메뉴의 제3 페이지로 전환되고, 상기 음성 등록 메뉴의 제3 페이지는 실제 화자 음성을 녹음하여 등록하기 위한 음성 녹음 UI(User Interface)(300)를 포함한다.
다시, 도 2를 이어서 설명하면, 제어부(180)는 음성 녹음 UI(300)를 통해 화자 음성을 녹음할 수 있다[S210].
이하, 도 4a 내지 도 4e를 참조하여 상기 화자 음성 녹음 과정에 대해 상세히 설명한다.
먼저, 도 4a의 (a)에 도시된 바와 같이, 음성 녹음 UI(300) 내에는 화자 음성 녹음을 위한 마이크로폰(122)의 턴온 또는 턴오프를 토글하기 위한 마이크로폰 버튼(310) 및 마이크로폰 버튼(310) 조작에 따라 마이크로폰(122)이 턴온되어 녹음이 개시되면, 기 설정된 시간 동안 상기 녹음이 진행되는 상태를 나타내는 원형의 프로그래시브 바를 포함할 수 있다.
이때, 제어부(180)는 마이크로폰 버튼(310)이 터치되어 선택되면, 도 4a의 (b)에 도시된 바와 같이, 마이크로폰(122)를 턴온시켜 화자 음성 녹음을 시작하고, 상기 프로그래시브 바가 현재 녹음 진행 상태를 나타내도록 제어할 수 있다.
더욱 상세하게, 마이크로폰(122)으로부터 입력되는 아날로그 화자 음성 데이터는 음성 인식기(132)를 통해 PCM(Pulse Code Modulation) 과정을 거쳐서 디지털 화자 음성 데이터로 변환되고, 제어부(180)는 음성 인식기(132)로부터 상기 변환된 디지털 화자 음성 데이터를 전달받아 녹음한다.
그리고, 도 4a의 (c)에 도시된 바와 같이, 제어부(180)는 기 설정된 시간 동안 화자 음성의 녹음이 완료되면, 보이스 턴온 또는 보이스 언락에 사용되는 사용자 음성 모델을 보다 정확하게 만들기 위해 적어도 2회 이상 상기 녹음 완료된 화자 음성과 동일한 화자 음성의 녹음을 다시 사용자에게 요청할 수 있다.
이때, 제어부(180)는 화자 음성을 현재 녹음 중에 화자 음성의 목소리가 기 설정된 수준 이상 너무 크고 거칠면, 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 제1 정보를 출력할 수 있다. 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 텍스트로써, 상기 음성 녹음 UI(300) 내에 표시될 수 있다. 또한, 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 제어부(180)는 화자 음성을 현재 녹음 중에 마이크로폰(122)을 통해 입력되는 주변 소음이 기 설정된 음량 이상이면, 상기 화자에게 녹음 장소를 이동하여 녹음하도록 가이드하는 제2 정보를 출력할 수 있다. 상기 제2 정보는 상기 화자에게 녹음 장소를 이동하여 녹음하도록 가이드하는 텍스트로써, 상기 음성 녹음 UI(300) 내에 표시될 수 있다. 또한, 상기 제2 정보는 상기 화자에게 녹음 장소를 이동하여 녹음하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 제어부(180)는 화자 음성을 현재 녹음 중에 마이크로폰(122)을 통해 입력되는 화자 음성 내에 포함된 키워드(일 예로, 문자, 단어 및 문장 중 적어도 하나를 포함할 수 있음)가 기 설정된 개수 이하(일 예로, 2개)이면, 상기 기 설정된 개수를 초과하여 말하도록 가이드하는 제3 정보를 출력할 수 있다. 상기 제3 정보는 상기 화자에게 상기 기 설정된 개수를 초과하여 말하도록 가이드하는 텍스트로써, 상기 음성 녹음 UI(300) 내에 표시될 수 있다. 또한, 상기 제3 정보는 상기 화자에게 상기 기 설정된 개수를 초과하여 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다. 한편, 상기 화자 음성 내에 포함된 키워드 내에는 이동 단말기(100)의 제조사 명칭이 키워드의 일부로 포함될 수 있다.
또한, 제어부(180)는 화자 음성을 현재 녹음 중에 마이크로폰(122)을 통해 입력되는 화자 음성이 본 발명에 따른 보이스 턴온 또는 보이스 언락을 위한 음성이 아닌 이동 단말기(100)의 다른 기능 사용을 위한 음성과 기 설정된 수준 이상 유사하면, 다른 화자 음성을 입력하도록 가이드하는 제4 정보를 출력할 수 있다. 상기 제4 정보는 상기 화자에게 다른 화자 음성을 말하도록 가이드하는 텍스트로써, 상기 음성 녹음 UI(300) 내에 표시될 수 있다. 또한, 상기 제4 정보는 상기 화자에게 다른 화자 음성을 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 제어부(180)는 화자 음성을 현재 녹음 중에 이동 단말기(100)의 스피커에서 특정 사운드가 출력 중이면, 마이크로폰(122)을 통해 화자 음성이 녹음되기 이전까지 상기 특정 사운드의 출력을 뮤트시키거나 또는 아예 중단시킬 수 있다.
그 다음으로, 제어부(180)는 도 4a의 (a) 내지 (c) 과정에 의해 녹음이 성공된 화자 음성과 동일한 화자 음성이 도 4b의 (a) 내지 (c) 과정과, 도 4c의 (a) 내지 (c) 과정 및 도 4d의 (a) 내지 (c) 과정처럼 기 설정된 회수 이상 녹음이 성공되면, 상기 녹음 성공된 화자 음성을 보이스 턴온 또는 보이스 언락에 사용될 화자 음성으로 결정한다.
그리고, 제어부(180)는 상기 녹음 성공된 화자 음성의 제1 및 제2 패턴을 분석하여 화자음성 모델을 생성한다. 이때, 상기 제1 패턴은 화자 음성에 해당하는 키워드 패턴 및 키워드에 대한 언어적인 패턴을 포함하고, 상기 제2 패턴은 화자 음성에 해당하는 화자 목소리 패턴을 포함한다. 즉, 상기 제1 패턴은 화자 음성에 해당하는 문자, 단어, 문장 중 적어도 하나에 대한 언어적 패턴을 뜻하고, 상기 제2 패턴은 화자 음성에 해당하는 화자 목소리의 말하는 속도, 크기 및 강세 중 적어도 하나에 대한 목소리 패턴을 뜻한다.
그리고, 제어부(180)는 상기 생성된 음성 모델을 메모리(170) 및 음성 인식기(132) 내에 저장하여 최종 화자 음성 녹음 과정을 완료한다.한편, 도 4e의 (a) 및 (b)에 도시된 바와 같이, 제어부(180)는 마이크로폰 버튼(310)이 선택되면, 마이크로폰(122)을 턴온시켜 상기 화자의 음성 녹음을 시작하고, 상기 마이크로폰 버튼이 상기 마이크로폰이 턴온된 상태를 나타내도록 제어한다.
이때, 제어부(180)는 상기 마이크로폰(122)으로부터 기 설정된 시간 이내에 상기 화자 음성이 입력되지 않거나 또는 상기 마이크로폰 버튼(310)이 다시 선택되면, 도 4e의 (c)에 도시된 바와 같이, 상기 마이크로폰(122)을 턴오프시키고, 상기 마이크로폰 버튼(310)이 상기 마이크로폰(122)이 턴오프된 상태를 나타내도록 제어한다.
그리고, 제어부(180)는 상기 마이크로폰 버튼(310)이 선택되면, 도 4e의 (d)에 도시된 바와 같이, 상기 마이크로폰(122)을 다시 턴온하여 상기 화자의 음성 녹음 동작을 수행할 수 있다.
그 다음으로, 도 2를 이어서 설명하면, 제어부(180)는 도 4a 내지 도 4e의 과정에 의해 화자 음성의 녹음이 완료되어 생성된 화자 음성 모델에 보이스 턴온 또는 보이스 언락 기능이 설정되면[S220], 상기 화자 음성 모델에 보이스 턴온 또는 보이스 언락 기능을 맵핑하여 메모리(170)에 저장한다[S230].
도 4f의 (a)에 도시된 바와 같이, 제어부(180)는 앞서 도 4a 내지 도 4e의 과정에 의해 화자 음성의 녹음이 완료되어 화자 음성 모델이 생성되면, 도 4f의 (b)에 도시된 바와 같이, 상기 화자 음성 모델에 대한 보이스 턴온 또는 보이스 언락 기능 설정을 위한 기능 설정 UI(410)를 표시한다.
그리고, 제어부(180)는 상기 기능 설정 UI(410)를 통해 보이스 턴온 기능이 선택되면, 상기 화자 음성 모델에 상기 선택된 보이스 턴온 기능을 맵핑하여 메모리(170)에 저장할 수 있고, 또한 상기 기능 설정 UI(410)를 통해 보이스 언락 기능이 선택되면, 상기 화자 음성 모델에 상기 선택된 보이스 언락 기능을 맵핑하여 메모리(170)에 저장할 수도 있다.
또한, 도 4g에 도시된 바와 같이, 상기 화자 음성 모델에 상기 보이스 턴온 또는 보이스 언락 기능과 함께 특정 어플리케이션의 실행 기능을 더 할당하여 설정할 수도 있다.
즉, 본 발명에 따라, 화면이 턴오프된 상태이거나 또는 화면이 잠금되어 잠금 화면이 표시된 상태에서, 마이크로폰(122)을 통해 메모리(170)에 저장된 화자 음성 모델과 매칭되는 화자 음성이 입력되면, 상기 화자 음성 모델에 설정된 보이스 턴온 또는 보이스 언락 기능을 실행하면서 동시에 상기 화자 음성 모델에 설정된 특정 어플리케이션을 바로 실행하고, 상기 실행된 특정 어플리케이션의 실행 화면을 표시할 수 있는 것이다.
더욱 상세하게, 제어부(180)는 상기 기능 설정 UI(410) 내에 어플리케이션 리스트(420)를 표시하고, 상기 리스트(420) 내에서 특정 어플리케이션을 선택하면, 상기 화자 음성 모델에 상기 보이스 턴온 또는 보이스 언락 기능과 함께 상기 선택된 특정 어플리케이션의 실행 기능을 더 할당하여 설정하여 저장한다.
도 5는 보이스 언락을 위한 화자 음성 모델을 생성하여 저장하는 과정을 나타내는 소프트웨어 구조도이다.
도 5를 참조하면, 이동 단말기(100)에 설치된 운영체제(OS)의 일 예로써, 안드로이드 아키텍처 레이어 중 커널 레이어(Kernel layer) 내의 음성 인식기(132)는 마이크로폰(122)으로부터 아날로그 화자 음성 데이터가 입력되면, 상기 아날로그 화자 음성 데이터를 PCM(Pulse Code Modulation) 과정을 거쳐 디지털 화자 음성 데이터로 변환하고, 상기 변환된 디지털 화자 음성 데이터를 어플리케이션 레이어 내의 화자 음성 등록 어플리케이션으로 전달한다(①).
그리고, 상기 화자 음성 등록 어플리케이션은 상기 디지털 화자 음성 데이터의 제1 및 제2 패턴을 분석하여 화자 음성 모델을 생성한다(②). 이때, "/data/user/0/com.lge.voiceprint/app_enrollments/net.bin"은 제1 패턴의 화자 음성에 해당하는 키워드에 대한 주파수 특성을 나타내는 패턴을 뜻하고, "/data/user/0/com.lge.voiceprint/app_enrollments/gram.bin"은 제1 패턴의 화자 음성에 해당하는 키워드의 문자, 단어, 문장 중 적어도 하나에 대한 언어적인 패턴을 뜻하고, "/data/user/0/com.lge.voiceprint/app_enrollments/tssvclient.bin"은 제2 패턴의 화자 음성에 해당하는 화자 목소리의 말하는 속도, 크기 및 강세 중 적어도 하나에 대한 목소리 패턴을 뜻한다.
상기와 같이 생성된 화자 음성 모델은 음성 인식기(132)에 저장된다(③). 또한, 상기 화자 음성 모델은 사용자에 의해 설정된 보이스 언락 기능이 설정되어 메모리(170)에도 저장된다.
상기와 같은 과정을 거치면, 음성 등록 어플리케이션은 프레임워크 레이어 내의 음성 매니저로 보이스 언락 서비스를 수행할 수 있도록 권한을 부여한다(④).
한편, 도 5 내의 어플리케이션 레이어 및 프레임워크 레이어 내의 모든 소프트웨어적 동작을 제어부(180)가 동일하게 수행할 수 있다. 즉, 제어부(180)는 상기 어플리케이션 레이어 내의 음성 등록 어플리케이션의 동작을 제어할 수 있고, 또한 상기 프레임워크 레이어 내의 AP(Application Processor) 및 음성 매니저를 포함하거나, 상기 AP 및 음성 매니저의 동작을 동일하게 수행할 수 있다.
한편, 도 6의 (a)에 도시된 바와 같이, 제어부(180)는 메모리(170)에 저장된 보이스 턴온 또는 보이스 언락 기능 실행을 위한 화자 음성을 변경하거나, 삭제하거나, 신규 화자 음성을 등록하거나 또는 보이스 턴온 또는 보이스 언락 기능을 변경하기 위한 음성 인식 메뉴를 표시할 때, 상기 이동 단말기에 상기 화면 잠금이 설정된 상태에서는, 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능함을 알리는 제1 정보(510)를 표시할 수 있다.
또한, 도 6의 (b)에 도시된 바와 같이, 제어부(180)는 메모리(170)에 저장된 보이스 턴온 또는 보이스 언락 기능 실행을 위한 화자 음성을 변경하거나, 삭제하거나, 신규 화자 음성을 등록하거나 또는 보이스 턴온 또는 보이스 언락 기능을 변경하기 위한 음성 인식 메뉴를 표시할 때, 상기 이동 단말기에 상기 화면 잠금이 설정되어 있지 않은 상태에서는, 상기 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능하도록 상기 화면의 잠금 설정을 요구하는 제2 정보(520)를 표시할 수도 있다.
한편, 도 7은 음성 인식 설정 메뉴(600)를 나타내고 있고, 상기 음성 인식 설정 메뉴(600)는 메모리(170)에 저장된 보이스 턴온 또는 보이스 언락 기능 실행을 위한 화자 음성을 변경하거나 또는 신규 화자 음성 등록을 위한 "Change voice" 메뉴와, 메모리(170)에 저장된 보이스 턴온 또는 보이스 언락 기능 실행을 위한 화자 음성을 삭제하기 위한 "Delete voice" 메뉴와, 상기 화자 음성에 설정된 보이스 턴온 기능을 보이스 언락 기능으로 변경하거나 또는 상기 화자 음성에 설정된 보이스 언락 기능을 보이스 턴온 기능으로 변경하기 위한 "기능 변경 메뉴"를 포함할 수 있다.
일 예로, 도 7의 (a)는 상기 기능 변경 메뉴를 통해 화자 음성에 보이스 턴온 기능이 설정된 경우 상기 기능 변경 메뉴 내에 상기 보이스 턴온을 나타내는 텍스트가 진하고 밝게 표시되거나 또는 보이스 언락을 나타내는 텍스트가 흐리고 어둡게 표시된 것을 나타내고 있다.
다른 예로, 도 7의 (b)는 상기 기능 변경 메뉴를 통해 화자 음성에 보이스 언락 기능이 설정된 경우 상기 기능 변경 메뉴 내에 상기 보이스 언락을 나타내는 텍스트가 진하고 밝게 표시되거나 또는 보이스 턴온을 나타내는 텍스트가 흐리고 어둡게 표시된 것을 나타내고 있다.
또한, 도 7에 도시된 바와 같이, 음성 인식 설정 메뉴(600) 내에는 상기 메모리(170)에 저장된 화자 음성이 인식된 후에 상기 잠금 화면 상에 스와이프 터치가 입력되었을 때에 잠금 화면의 잠금 해제를 설정할 수 있는 "스와이프 잠금 해제 설정 메뉴"가 더 포함될 수 있다.
즉, 이 경우에는 사용자의 인증(비밀번호 입력, 기 설정된 터치제스처 패턴 입력, 지문 입력, 홍체 인식 중 적어도 하나의 인증)을 거쳐야 잠금 화면의 잠금이 해제되는 보안 모드이더라도, 상기 "스와이프 잠금 해제 설정 메뉴"를 통해 잠금 해제가 설정되어 있으면, 상기 보안 모드에 따른 사용자 인증 절차를 생략하고, 상기 메모리(170) 내에 저장된 화자 음성이 인증된 후 스와이프 터치가 입력되면, 바로 상기 잠금 화면의 잠금을 해제할 수 있는 것이다.
한편, 현재 잠금 화면이 사용자 인증 절차를 거쳐야 하는 보안 모드가 아니면, 상기 음성 인식 설정 메뉴(600)를 통해 설정된 음성 인식 관련 설정값들은 모두 무시될 수 있고, 상기 잠금 화면이 비보안 모드에서 상기 사용자 인증 절차를 거쳐야 하는 보안 모드로 변경되면, 상기 음성 인식 설정 메뉴(600)를 통해 설정된 음성 인식 관련 설정값들은 모두 유지될 수 있다.
또한, 도 8의 (a)에 도시된 바와 같이, 제어부(180)는 상기 음성 인식 설정 메뉴(600) 내에서 "Delete voice" 메뉴(610)가 선택되면, 도 8의 (b)에 도시된 바와 같이, 메모리(170)에 저장된 보이스 턴온 또는 보이스 언락 기능을 위한 화자 음성을 삭제하고, 본 발명에 따른 보이스 인식 모드를 비활성화 상태로 전환할 수 있다.
도 9는 보이스 언락 기능을 위한 화자 음성을 삭제하는 과정을 나타내는 소프트웨어 구조도이다.
도 9를 참조하면, 이동 단말기(100)에 설치된 운영체제(OS)의 일 예로써, 안드로이드 아키텍처 레이어 중 어플리케이션 레이어 내의 음성 등록 어플리케이션을 통해 사용자로부터 기 저장된 화자 음성 모델의 삭제가 요청되면, 상기 음성 등록 어플리케이션은 메모리(170)에 저장된 화자 음성 모델을 삭제하고(①), 음성 인식기(132)에 저장된 화자 음성 모델을 삭제한다(②).
그리고, 음성 등록 어플리케이션은 프레임워크 레이어 내의 음성 매니저로 보이스 언락 서비스를 수행할 수 없도록 권한을 제한한다(③).
도 9 내의 어플리케이션 레이어 및 프레임워크 레이어 내의 모든 소프트웨어적 동작을 제어부(180)가 동일하게 수행할 수 있다. 즉, 제어부(180)는 상기 어플리케이션 레이어 내의 음성 등록 어플리케이션의 동작을 제어할 수 있고, 또한 상기 프레임워크 레이어 내의 AP(Application Processor) 및 음성 매니저를 포함하거나, 상기 AP 및 음성 매니저의 동작을 동일하게 수행할 수 있다. 한편, 제어부(180)는 상기 음성 인식 설정 메뉴(600) 내에서 "Change voice" 메뉴(610)가 선택되면, 앞서 설명한 도 4a 내지 도 4e 과정을 통해 사용자로부터 신규 화자 음성을 등록받을 수 있다.
또한, 도 10의 (a)에 도시된 바와 같이, 제어부(180)는 상기 음성 인식 설정 메뉴(600)가 선택되면, 도 10의 (b)에 도시된 바와 같이, 메모리(170)에 저장된 화자 음성 모델에 설정된 보이스 턴온 또는 보이스 언락 기능의 변경 UI(410)를 표시할 수 있다.
일 예로, 상기 화자 음성 모델에 보이스 턴온 기능이 설정된 상태에서, 상기 변경 UI(410)를 통해 보이스 언락 기능이 선택되면, 도 8의 (c)에 도시된 바와 같이, 제어부(180)는 상기 화자 음성 모델에 설정된 보이스 턴온 기능을 상기 선택된 보이스 언락 기능으로 변경하여 저장할 수 있다.
이상, 도 2의 S200 내지 S230 과정과, 도 3 내지 도 10의 과정을 참조하여, 본 발명에 따른 보이스 턴온 또는 보이스 언락 기능을 화자 음성 모델에 설정하여 저장하는 과정에 대해 상세히 설명하였다.
이하에서는, 도 2의 S240 내지 S290 과정과, 도 11 내지 도 14의 과정을 참조하여, 메모리(170)에 저장된 화자 음성을 이용하여 보이스 턴온 또는 보이스 언락 기능을 실행하는 과정에 대해 상세히 설명한다.
먼저, 도 2를 참조하면, 이동 단말기(100)는 디스플레이부(151)의 화면이 턴오프되거나 또는 상기 화면이 잠금된 상태를 나타내는 잠금 화면이 표시되면[S240], 마이크로폰(122)이 상기 화면이 턴오프되거나 또는 상기 잠금 화면이 표시된 동안 마이크로폰(122)의 턴온 상태를 유지시킨다[S250].
그리고, 이동 단말기(100)는 마이크로폰(122)으로부터 입력된 화자 음성을 인식하고[S260], 상기 인식된 화자 음성이 메모리(170)에 저장된 화자 음성 모델과 매칭되는지 여부를 판단한 후[S270], 상기 인식된 화자 음성이 메모리(170)에 저장된 화자 음성 모델과 매칭되면[S280], 상기 화면을 턴온시키거나 또는 상기 화면의 잠금을 해제한다[S290].
일 예로, 이동 단말기(100)는 상기 인식된 화자 음성이 메모리(170)에 저장된 화자 음성모델과 매칭되고, 상기 메모리(170)에 저장된 화자 음성 모델에 보이스 턴온 기능이 설정되어 있으면, 상기 화면을 턴온시킨다. 다른 예로, 이동 단말기(100)는 상기 인식된 화자 음성이 메모리(170)에 저장된 화자 음성 모델과 매칭되고, 상기 메모리(170)에 저장된 화자 음성 모델에 보이스 언락 기능이 설정되어 있으면, 상기 화면의 잠금을 해제한다.
한편, 이동 단말기(100)는 S250 과정에서 상기 화면이 턴오프되거나 또는 상기 잠금 화면이 표시된 동안 제어부(180)를 비활성화시킨다.
즉, 이동 단말기가 본 발명에 따른 보이스 턴온 또는 보이스 언락을 위한 보이스 인식 모드로 동작할 경우 상기 화면이 턴오프되거나 또는 상기 잠금 화면이 표시된 동안 상기 보이스 턴온 또는 보이스 언락을 위한 화자 음성의 인식을 위해 항상 마이크로폰(122)은 턴온 상태를 유지해야 되고, 제어부(180) 또한 상기 마이크로폰(122)을 통해 입력되는 화자 음성이 기 저장된 화자 음성 모델과 매칭되는지 실시간으로 판단해야 하기 때문에 전력 소모가 심해질 수 있다.
즉, 제어부(180)의 동작은 소프트웨어 아키텍처 내에서 프레임워크 및 어플리케이션 레이어에 해당하는 동작을 수행하므로, 제어부(180)가 보이스 턴온 또는 보이스 언락 기능 수행을 위해 항상 활성화 상태를 유지할 경우 전력 소모가 더 극심해진다.
따라서, 본 발명에서는 프레임워크 및 어플리케이션 레이어보다 상대적으로 전력 소모가 적은 커널 레이어 내에 저전력의 음성 인식기(132)를 배치하고, 음성 인식기(132)가 제어부(180) 대신에 마이크로폰(122)으로부터 입력되는 화자 음성 및 기 저장된 화자 음성 모델 간의 매칭 여부를 1차 판단하고, 상기 1차 판단 결과 매칭되었을 때 제어부(180)가 활성화되어 최종적으로 마이크로폰(122)으로부터 입력되는 화자 음성 및 기 저장된 화자 음성 모델 간의 매칭 여부를 최종적으로 판단함으로써, 제어부(180)가 비활성화되어 있는 동안의 전력을 세이브(save)할 수 있다.
도 11은 본 발명에 따른 화자 음성 모델을 이용한 보이스 언락 과정을 나타내는 소프트웨어 아키텍처이다.
도 11을 참조하면, 이동 단말기(100)의 디스플레이부(151)의 화면이 턴오프되거나 또는 상기 화면이 잠긴 상태가 되면, 커널 레이어 내의 마이크로폰(122)과, 버퍼(LG PCM Buffer)(131) 및 음성 인식기(LG User Define Hotword Engine)(132)가 활성화되고, 프레임워크 레이어 내의 AP는 비활성화된다. 이때, 상기 AP는 제어부(180)와 동일하거나 또는 제어부(180)에 속하므로, 실질적으로 상기 디스플레이부(151)의 화면이 턴오프되거나 또는 상기 화면이 잠긴 상태가 되면 제어부(180)는 비활성화되는 것이다. 이하의 설명에서는 프레임워크 레이어 내의 AP를 제어부(180)로 가정하여 설명한다.
그리고, 버퍼(131)는 기 설정된 시간 단위(일 예로, 2초)로 마이크로폰(122)으로부터 입력되는 화자의 음성 데이터를 버퍼링한다.
동시에, 음성 인식기(132)는 마이크로폰(122)으로부터 입력되는 화자 음성의 제1 패턴을 분석하고, 상기 분석된 화자 음성의 제1 패턴 및 기 저장된 화자 음성 모델의 제1 패턴 간의 매칭 여부를 1차 판단한다(①).
더욱 상세하게, 음성 인식기(132)는 마이크로폰(122)으로부터 입력되는 화자 음성의 제1 패턴으로써, 상기 화자 음성에 해당하는 키워드에 대한 주파수 특성을 나타내는 패턴 및 화자 음성에 해당하는 키워드의 문자, 단어, 문장 중 적어도 하나에 대한 언어적인 패턴을 분석하고, 상기 분석된 키워드의 주파수 특성 패턴 및 언어적 패턴과 기 저장된 화자 음성 모델 내의 제1 패턴("/data/user/0/com.lge.voiceprint/app_enrollments/net.bin" 및 "/data/user/0/com.lge.voiceprint/app_enrollments/gram.bin")이 기 설정된 수준 이상 유사한지를 판단함으로써, 상기 화자 음성의 제1 패턴 및 기 저장된 화자 음성 모델 간의 매칭 여부를 1차 판단하는 것이다.
음성 인식기(132)는 상기 분석된 화자 음성의 제1 패턴이 상기 기 저장된 화자 음성 모델의 제1 패턴과 기 설정된 수준 이상 유사한 것으로 판단되면, 상기 판단된 시점까지의 버퍼(131)에 버퍼링된 화자 음성의 데이터를 프레임워크 레이어 내의 제어부(180)로 송신한다(②).
한편, 음성 인식기(132)는 마이크로폰(122)으로부터 입력된 화자 음성을 인식할 때, 상기 입력된 화자 음성이 기 설정된 수준 이상 너무 크고 거칠어서 인식이 실패되면, 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 제1 정보를 출력하도록 제어할 수 있다. 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 텍스트로써, 상기 화면이 잠금된 상태를 나타내는 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 음성 인식기(132)는 마이크로폰(122)으로부터 입력된 화자 음성을 인식할 때, 상기 입력된 화자 음성이 기 설정된 수준 이하로 너무 작아서 인식이 실패되면, 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 가이드하는 제2 정보를 출력하도록 제어할 수 있다. 상기 제2 정보는 상기 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 가이드하는 텍스트로써, 상기 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제2 정보는 상기 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 음성 인식기(132)는 마이크로폰(122)으로부터 입력된 화자 음성을 인식할 때, 마이크로폰(122)으로부터 입력된 화자 음성 내에 주변 소음이 기 설정된 수준 커서 인식이 실패되면, 화자에게 장소를 이동하여 말하도록 가이드하는 제3 정보를 출력하도록 제어할 수 있다. 상기 제3 정보는 상기 화자에게 장소를 이동하여 말하도록 가이드하는 텍스트로써, 상기 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제3 정보는 상기 화자에게 장소를 이동하여 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 음성 인식기(132)는 마이크로폰(122)으로부터 화자 음성을 입력받을 때 음향 출력부(152)가 활성화되어 특정 사운드(일 예로, 음악)를 출력 중이면, 마이크로폰(122)을 통해 화자 음성이 인식되어 분석되기 전까지 상기 특정 사운드의 출력이 뮤트되도록 제어하거나 또는 아예 중단되도록 제어할 수 있다.
또한, 음성 인식기(132)는 마이크로폰(122)으로부터 입력된 화자 음성을 인식할 때, 마이크로폰(122)으로부터 입력되는 화자 음성에 해당하는 제1 패턴이 기 설정된 횟수 이상 상기 기 저장된 화자 음성 모델의 제1 패턴과 매칭되지 않으면, 앞서 설명한 도 4a의 음성 등록 메뉴를 잠금 화면상에 표시하여, 화자가 본 발명에 따른 보이스 턴온 또는 보이스 언락 기능을 위한 화자 음성을 다시 설정하도록 가이드할 수 있다.
그 다음으로, 제어부(180)는 음성 인식기(132)로부터 1차 매칭된 것으로 판단된 화자 음성의 데이터가 수신되면, 이동 단말기(100)에 의해 활성화된다.
그리고, 제어부(180)는 상기 수신된 화자 음성의 제2 패턴을 분석하고, 상기 분석된 화자 음성의 제2 패턴이 상기 메모리(170)에 저장된 화자 음성 모델의 제2 패턴과 매칭되는 지를 2차 판단한다.
더욱 상세하게, 제어부(180)는 상기 수신된 화자 음성의 제2 패턴으로써, 상기 화자 음성에 해당하는 목소리의 말하는 속도, 크기 및 강세 중 적어도 하나의 목소리 패턴과 상기 메모리(170)에 저장된 화자 음성 모델 내의 제2 패턴("/data/user/0/com.lge.voiceprint/app_enrollments/tssvclient.bin") 내의 화자 목소리의 속도, 크기 및 강세 중 적어도 하나의 패턴이 서로 기 설정된 수준 이상 유사한지를 판단하여 유사하면, 현재 마이크로폰(122)을 통해 입력되는 화자의 목소리와 상기 메모리(170)에 저장된 화자의 목소리가 동일 또는 유사한 것으로 최종 판단하는 것이다(③).
즉, 본 발명은 음성 인식기(132)를 통해 먼저 현재 마이크로폰(122)으로부터 입력된 화자 음성에 해당하는 음성 키워드와 메모리(170)에 저장된 화자 음성 키워드가 매칭되는지 1차 판단하고, 만약 상기 1차 판단 결과 매칭되면, 제어부(180)를 활성화시켜 상기 마이크로폰(122)으로부터 입력된 화자 목소리와 메모리(170)에 저장된 화자 목소리가 서로 매칭되는지 2차 판단한 후에 상기 1차 및 2차 판별 결과 모두 매칭되었을 때 상기 메모리(170)에 저장된 화자 음성 모델에 설정된 보이스 턴온 또는 보이스 언락 기능을 실행하는 것이다.
한편, 도 11 내에 도시된 커널 레이어 내의 "OK Google Detection Engine" 및 "Google PCM Buffer"와, 프레임워크 레이어 내의 "Audio HAL", "Audio Flinger", "Sound Trigger HAL", "Audio Record Java API" 및 "Sound trigger Framework"와, 어플리케이션 레이어 내의 "Google Assistant App."는 안드로이드 운영체제의 제조사(Google)에서 제공하는 종래의 일반적인 음성 인식 기능과 관련된 것이다.
한편, 이동 단말기(100)는 상기 메모리(170)에 저장된 화자 음성 모델에 보이스 턴온 또는 보이스 언락 기능에 추가로 특정 어플리케이션의 실행 기능이 설정되어 있으면, 화면 턴온 또는 화면 잠금 해제와 동시에 상기 특정 어플리케이션을 실행할 수 있다.
상기 특정 어플리케이션은 이동 단말기에 설치된 모든 어플리케이션을 포함할 수 있다. 일 예로, 상기 특정 어플리케이션은 둘 이상의 사용자 스케줄이 등록된 스케줄 알림 어플리케이션을 포함하고, 이 경우 이동 단말기(100)는 마이크로폰(122)으로부터 입력된 화자 음성이 인식된 시점 이후부터 알림이 설정된 적어도 하나의 사용자 스케줄을 검색하여 사용자에게 알리도록(표시, 또는 소리로 알림) 상기 스케줄 알림 어플리케이션을 제어할 수 있다.
다른 예로, 상기 특정 어플리케이션은 날씨 정보 제공 어플리케이션을 포함하고, 이 경우 이동 단말기(100)는 마이크로폰(122)으로부터 입력된 화자 음성이 인식된 시점 이후부터 현재 지역 또는 사용자가 설정한 지역에 대한 현재 날씨 또는 미래 날씨를 검색하여 사용자에게 알리도록(표시, 또는 소리로 알림) 상기 날씨 정보 제공 어플리케이션을 제어할 수도 있다.
또한, 상기 메모리(170)에 저장된 화자 음성 모델은, 상기 보이스 턴온 또는 보이스 언락 기능의 실행을 위한 제1 음성어 및 특정 어플리케이션의 실행을 위한 제2 음성어를 포함할 수 있다.
이때, 이동 단말기(100)는 상기 인식된 화자 음성 내에 제1 음성어만 포함된 경우 보이스 턴온 또는 보이스 언락 기능만을 실행한다.
또한, 이동 단말기(100)는 상기 인식된 화자 음성 내에 제1 및 제2 음성어가 모두 포함된 경우 보이스 턴온 또는 보이스 언락 기능을 실행하고, 동시에 상기 특정 어플리케이션을 바로 실행할 수 있다.
이때, 상기 인식된 화자 음성 내에 제1 및 제2 음성어가 모두 포함된 경우 제1 음성어는 앞서 설명한 도 4a 내지 도 4e의 과정에 의해 저장된 화자 음성 및/또는 이동 단말기(100)의 제조사 명칭을 포함할 수 있고, 상기 제2 음성어는 상기 특정 어플리케이션의 전체 명칭, 일부 명칭, 대표 명칭, 상기 특정 어플리케이션에 대해 사용자가 설정한 별칭 및 상기 특정 어플리케이션이 속한 카테고리 명칭 중 적어도 하나를 포함할 수 있다.
한편, 도 12의 (a)에 도시된 바와 같이, 제어부(180)는 상기 화자 음성을 인식 시에, 상기 화자 음성의 목소리가 기 설정된 수준 이상 너무 크고 거칠어서 상기 화자 음성의 인식이 실패되면, 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 제1 정보를 출력할 수 있다.
일 예로, 도 12의 (b)에 도시된 바와 같이, 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 가이드하는 텍스트로써, 상기 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제1 정보는 상기 화자에게 상기 기 설정된 수준 이하로 작고 부드럽게 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 상기 화면이 턴오프되었을 때 음향 출력부(152)를 통해 출력될 수 있다.
그리고, 제어부(180)는 제1 정보가 출력된 후 기 설정된 시간이 경과되면, 도 11의 (c)에 도시된 바와 같이, 화자 음성 입력 화면을 표시하고, 사용자는 상기 화자 음성 입력 화면 내의 마이크로폰 버튼을 선택하여 다시 화자 음성을 입력할 수 있다.
또한, 제어부(180)는 상기 화자 음성을 인식 시에, 상기 화자 음성이 기 설정된 수준 이하로 너무 작아서 인식이 실패되면, 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 가이드하는 제2 정보를 출력할 수 있다. 상기 제2 정보는 상기 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 가이드하는 텍스트로써, 상기 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제2 정보는 상기 화자에게 상기 기 설정된 수준 이상으로 크게 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 상기 화면이 턴오프되었을 때 음향 출력부(152)를 통해 출력될 수 있다.
또한, 제어부(180)는 화자 음성을 인식 시에, 마이크로폰(122)으로부터 입력된 화자 음성 내에 주변 소음이 기 설정된 수준 커서 인식이 실패되면, 화자에게 장소를 이동하여 말하도록 가이드하는 제3 정보를 출력할 수 있다. 상기 제3 정보는 상기 화자에게 장소를 이동하여 말하도록 가이드하는 텍스트로써, 상기 잠금 화면이 표시된 경우에 상기 잠금 화면 내에 표시될 수 있다. 또한, 상기 제3 정보는 상기 화자에게 장소를 이동하여 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 상기 화면이 턴오프되었을 때 음향 출력부(152)를 통해 출력될 수 있다.
그 다음으로, 도 13에 도시된 바와 같이, 제어부(180)는 상기 화자 음성이 인식되고, 상기 인식된 화자 음성이 본 발명에 따른 보이스 턴온 또는 보이스 언락을 위한 화자 음성 모델이 아닌 이동 단말기(100)의 다른 기능 사용을 위한 음성과 기 설정된 수준 이상 유사하면, 다른 화자 음성 모델을 입력하도록 가이드하는 제4 정보를 출력할 수 있다. 상기 제4 정보는 상기 화자에게 다른 화자 음성을 말하도록 가이드하는 텍스트로써, 상기 음성 녹음 UI(300) 내에 표시될 수 있다. 또한, 상기 제4 정보는 상기 화자에게 다른 화자 음성을 말하도록 알리는 가이드 음성 또는 가이드 음향으로써, 음향 출력부(152)를 통해 출력될 수 있다.
또한, 제어부(180)는 상기 화자 음성을 입력받을 때 음향 출력부(152)가 활성화되어 특정 사운드(일 예로, 음악)를 출력 중이면, 마이크로폰(122)을 통해 화자 음성이 인식되어 분석되기 전까지 상기 특정 사운드의 출력을 뮤트시키거나 또는 아예 중단시킬 수 있다.
또한, 제어부(180)는 상기 화자 음성을 인식 시에, 상기 화자 음성이 기 설정된 횟수 이상 상기 메모리(170)에 저장된 화자 음성 모델과 매칭되지 않으면, 앞서 설명한 도 4a의 음성 등록 메뉴를 잠금 화면상에 표시하여, 화자가 본 발명에 따른 보이스 턴온 또는 보이스 언락 기능을 위한 화자 음성을 다시 설정하도록 가이드할 수 있다.
또한, 도 14에 도시된 바와 같이, 이동 단말기(100)는 본 발명에 따른 보이스 턴온 또는 보이스 언락을 위한 화자 음성을 인식하기 전에, 이미 다른 어플리케이션을 통해 마이크로폰(122)이 사용 중이면, 상기 다른 어플리케이션의 실행을 중단시키고, 이후에 마이크로폰(122)으로부터 입력되는 화자 음성을 인식하여 보이스 턴온 또는 보이스 언락 기능을 실행할 수도 있다.
이상, 본 발명의 정신 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 당업자에게 자명하다.
전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는 단말기의 제어부(180)를 포함할 수도 있다.
따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

Claims (14)

  1. 디스플레이부;
    상기 디스플레이부의 화면을 턴온하거나 또는 상기 화면의 잠금 해제를 위한 적어도 하나의 음성이 저장된 메모리;
    상기 화면이 턴오프되거나 또는 상기 화면이 잠금된 상태에서 턴온 상태가 유지되어 화자 음성을 입력받는 마이크로폰; 및
    상기 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서, 상기 마이크로폰을 통해 입력되는 화자 음성의 제1 패턴과 상기 저장된 음성의 제1 패턴이 매칭된 것으로 1차 인식되고, 상기 화자 음성의 제2 패턴 및 상기 저장된 음성의 제2 패턴이 매칭된 것으로 2차 인식될 경우, 상기 화면을 턴온하거나 또는 상기 화면의 잠금을 해제하는 제어부;를 포함하는, 이동 단말기.
  2. 제1 항에 있어서,
    상기 제어부는,
    상기 이동 단말기에 상기 화면 잠금이 설정된 상태에서는, 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능함을 알리는 정보를 표시하고,
    상기 이동 단말기에 상기 화면 잠금이 설정되어 있지 않은 상태에서는, 상기 음성 인식을 통해 상기 화면 턴온 또는 상기 화면 잠금 해제가 가능하도록 상기 화면의 잠금 설정을 요구하는 정보를 표시하는, 이동 단말기.
  3. 제1 항에 있어서,
    상기 메모리에 저장된 적어도 하나의 음성은, 음성 등록 메뉴를 통해 저장되고,
    상기 제어부는,
    상기 음성 등록 메뉴가 선택되면, 상기 마이크로폰을 통해 화자 음성을 적어도 2회 이상 입력받고,
    상기 적어도 2회 이상 입력된 화자 음성이 동일 음성으로 인식되면, 상기 동일 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성 명령으로 상기 메모리에 저장하는, 이동 단말기.
  4. 제3 항에 있어서,
    상기 제어부는,
    상기 동일 음성이 인식되면, 상기 동일 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성 명령으로 설정하기 위한 설정 UI를 상기 음성 등록 메뉴 내에 표시하는, 이동 단말기.
  5. 제3 항에 있어서,
    상기 음성 등록 메뉴는, 상기 마이크로폰의 턴온 또는 턴오프를 위한 마이크로폰 버튼을 포함하고,
    상기 제어부는,
    상기 마이크로폰 버튼이 선택되면, 상기 마이크로폰을 턴온시켜 상기 화자의 음성 녹음을 시작하고, 상기 마이크로폰 버튼이 상기 마이크로폰이 턴온된 상태를 나타내도록 제어하고,
    상기 마이크로폰으로부터 기 설정된 시간 이내에 상기 화자 음성이 입력되지 않으면, 상기 마이크로폰을 턴오프시키고, 상기 마이크로폰 버튼이 상기 마이크로폰이 턴오프된 상태를 나타내도록 제어하며,
    상기 마이크로폰 버튼이 선택되면, 상기 마이크로폰을 다시 턴온하여 상기 화자의 음성 녹음 동작을 수행하는, 이동 단말기.
  6. 제1 항에 있어서,
    상기 제어부는,
    상기 마이크로폰을 통해 입력된 화자 음성의 음량이 기 설정된 음량 이상이면, 상기 화자에게 현재의 음성의 음량보다 작게 말하도록 가이드하는 텍스트 정보를 표시하는, 이동 단말기.
  7. 제1 항에 있어서,
    상기 제어부는,
    상기 마이크로폰을 통해 입력되는 주변 소음의 음량이 기 설정된 음량 이상이면, 상기 화자에게 장소를 이동하여 음성을 입력하도록 가이드하는 텍스트 정보를 표시하는, 이동 단말기.
  8. 제1 항에 있어서,
    상기 제어부는,
    상기 인식된 화자 음성이 기 설정된 횟수 이상 상기 메모리에 저장된 음성과 매칭되지 않으면, 상기 인식된 화자 음성을 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 음성으로 상기 메모리에 저장하기 위한 음성 등록 메뉴를 표시하는, 이동 단말기.
  9. 제1 항에 있어서,
    상기 제어부는,
    상기 마이크로폰을 통해 화자 음성이 입력되는 시점에 상기 이동 단말기의 스피커에서 특정 사운드가 출력 중이면, 상기 마이크로폰을 통해 상기 화자 음성이 인식되기 전까지 상기 특정 사운드를 뮤트시키는, 이동 단말기.
  10. 제1 항에 있어서,
    상기 메모리에 저장된 적어도 하나의 음성은, 특정 어플리케이션의 실행 기능이 더 할당되고,
    상기 제어부는,
    상기 인식된 화자 음성이 상기 메모리에 저장된 음성과 매칭되면, 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하고, 동시에 상기 특정 어플리케이션을 바로 실행하는, 이동 단말기.
  11. 제1 항에 있어서,
    상기 메모리에 저장된 적어도 하나의 음성은, 상기 화면 턴온 또는 상기 화면 잠금 해제를 위한 제1 음성어 및 특정 어플리케이션 실행을 위한 제2 음성어를 포함하고,
    상기 제어부는,
    상기 인식된 화자 음성 내에 제1 음성어만 포함된 경우 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하는 동작만을 수행하고,
    상기 인식된 화자 음성 내에 제1 및 제2 음성어가 모두 포함된 경우 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하고, 동시에 상기 특정 어플리케이션을 바로 실행하는, 이동 단말기.
  12. 제1 항에 있어서,
    상기 화자 음성 및 상기 저장된 음성 각각의 제1 패턴은, 각각의 해당 음성에 해당하는 키워드 패턴을 포함하고,
    상기 화자 음성 및 상기 저장된 음성 각각의 제2 패턴은, 각각의 해당 음성에 해당하는 목소리 패턴을 포함하고,
    상기 화자 음성의 키워드 패턴이 상기 저장된 음성의 키워드 패턴과 기 설정된 수준 이상 유사할 경우에 상기 화자 음성의 키워드 패턴과 상기 저장된 음성의 키워드 패턴이 매칭된 것으로 1차 인식되며,
    상기 화자 음성의 목소리 패턴이 상기 저장된 음성의 목소리 패턴과 기 설정된 수준 이상 유사할 경우에 상기 화자 음성의 목소리 패턴과 상기 저장된 음성의 목소리 패턴이 매칭된 것으로 2차 인식되는, 이동 단말기.
  13. 제12 항에 있어서,
    기 설정된 시간 단위로 상기 마이크로폰으로부터 입력되는 화자 음성의 데이터를 버퍼링하는 버퍼; 및
    상기 마이크로폰으로부터 입력되는 화자 음성의 키워드 패턴을 분석하고, 상기 분석된 키워드 패턴이 상기 저장된 음성의 키워드 패턴과 기 설정된 수준 이상 유사하면, 상기 버퍼에 버퍼링된 화자 음성을 상기 제어부로 송신하는 음성 인식기;를 더 포함하고,
    상기 제어부는,
    상기 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서는 비활성 상태가 되고,
    상기 음성 인식기로부터 상기 화자 음성이 수신되면, 활성화 상태로 전환되고,
    상기 수신된 화자 음성의 목소리 패턴을 분석하며,
    상기 분석된 화자 음성의 목소리 패턴이 상기 저장된 음성의 목소리 패턴과 기 설정된 수준 이상 유사하면, 상기 화면을 턴온하거나 또는 상기 화면을 잠금 해제하는, 이동 단말기.
  14. 디스플레이부의 화면이 턴오프된 상태이거나 또는 상기 화면이 잠금된 상태에서, 마이크로폰을 통해 화자 음성을 입력받는 단계;
    상기 마이크로폰을 통해 입력되는 화자 음성의 제1 패턴 및 상기 저장된 음성의 제1 패턴의 매칭 여부를 1차 판단하는 단계;
    상기 1차 판단 결과 매칭되면, 상기 화자 음성의 제2 패턴 및 상기 저장된 음성의 제2 패턴의 매칭 여부를 2차 판단하는 단계; 및
    상기 2차 판단 결과 매칭되면, 상기 화면을 턴온하거나 또는 상기 화면의 잠금을 해제하는 단계;를 포함하는, 이동 단말기의 제어 방법.
PCT/KR2017/009496 2017-08-16 2017-08-30 이동 단말기 및 그 제어 방법 WO2019035504A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762546472P 2017-08-16 2017-08-16
US62/546,472 2017-08-16

Publications (1)

Publication Number Publication Date
WO2019035504A1 true WO2019035504A1 (ko) 2019-02-21

Family

ID=65362755

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/009496 WO2019035504A1 (ko) 2017-08-16 2017-08-30 이동 단말기 및 그 제어 방법

Country Status (1)

Country Link
WO (1) WO2019035504A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019484A (zh) * 2019-05-31 2020-12-01 阿里巴巴集团控股有限公司 获取音源数据的方法及相关设备
CN114095612A (zh) * 2021-12-29 2022-02-25 努比亚技术有限公司 一种来电屏幕控制方法、终端及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090132869A (ko) * 2008-06-23 2009-12-31 주식회사 시소시스템 음성인식을 이용한 방범 방법 및 시스템
KR20130105219A (ko) * 2012-03-15 2013-09-25 삼성전자주식회사 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법
KR20140132286A (ko) * 2013-05-07 2014-11-17 삼성전자주식회사 단말 장치를 잠금 해제하기 위한 방법 및 장치
KR20160055162A (ko) * 2013-08-26 2016-05-17 삼성전자주식회사 음성 인식을 위한 전자 장치 및 방법
KR20160056551A (ko) * 2014-11-12 2016-05-20 삼성전자주식회사 잠금 해제 수행 방법 및 사용자 단말

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090132869A (ko) * 2008-06-23 2009-12-31 주식회사 시소시스템 음성인식을 이용한 방범 방법 및 시스템
KR20130105219A (ko) * 2012-03-15 2013-09-25 삼성전자주식회사 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법
KR20140132286A (ko) * 2013-05-07 2014-11-17 삼성전자주식회사 단말 장치를 잠금 해제하기 위한 방법 및 장치
KR20160055162A (ko) * 2013-08-26 2016-05-17 삼성전자주식회사 음성 인식을 위한 전자 장치 및 방법
KR20160056551A (ko) * 2014-11-12 2016-05-20 삼성전자주식회사 잠금 해제 수행 방법 및 사용자 단말

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019484A (zh) * 2019-05-31 2020-12-01 阿里巴巴集团控股有限公司 获取音源数据的方法及相关设备
CN112019484B (zh) * 2019-05-31 2024-06-07 阿里巴巴集团控股有限公司 获取音源数据的方法及相关设备
CN114095612A (zh) * 2021-12-29 2022-02-25 努比亚技术有限公司 一种来电屏幕控制方法、终端及计算机可读存储介质

Similar Documents

Publication Publication Date Title
WO2016010221A1 (ko) 이동 단말기 및 그 제어 방법
WO2016208797A1 (ko) 헤드셋 및 그 제어 방법
WO2017014374A1 (en) Mobile terminal and controlling method thereof
WO2016114444A1 (ko) 이동 단말기 및 이의 제어방법
WO2017094926A1 (ko) 단말 장치 및 제어 방법
WO2016076474A1 (ko) 이동단말기 및 그 제어방법
WO2016190466A1 (ko) 상황에 따라 최적화된 화면을 디스플레이하는 웨어러블 단말기
WO2016010262A1 (en) Mobile terminal and controlling method thereof
WO2018124334A1 (ko) 전자장치
WO2019216467A1 (ko) 이동 단말기
WO2017010595A1 (ko) 키보드 및 이를 구비하는 단말 시스템
WO2019160198A1 (ko) 이동 단말기 및 그 제어방법
WO2018093005A1 (en) Mobile terminal and method for controlling the same
WO2015194723A1 (ko) 이동단말기 및 그 제어방법
WO2015199279A1 (en) Mobile terminal and control method thereof
WO2015125993A1 (ko) 이동 단말기 및 이동 단말기의 제어방법
WO2018101508A1 (ko) 이동 단말기
WO2018135675A1 (ko) 전자장치
WO2016200005A1 (en) Mobile terminal and display operating method thereof
WO2016129781A1 (ko) 이동 단말기 및 그 제어 방법
WO2018124355A1 (ko) 오디오 장치 및 그 제어방법
WO2015108287A1 (ko) 이동 단말기
WO2016003066A1 (en) Mobile terminal and method for controlling the same
WO2016111406A1 (ko) 이동단말기 및 그 제어방법
WO2015152443A1 (ko) 스타일러스 및 이를 구비하는 이동 단말기

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17921475

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17921475

Country of ref document: EP

Kind code of ref document: A1