WO2020145417A1 - 로봇 - Google Patents

로봇 Download PDF

Info

Publication number
WO2020145417A1
WO2020145417A1 PCT/KR2019/000226 KR2019000226W WO2020145417A1 WO 2020145417 A1 WO2020145417 A1 WO 2020145417A1 KR 2019000226 W KR2019000226 W KR 2019000226W WO 2020145417 A1 WO2020145417 A1 WO 2020145417A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
spl
robot
signal
event
Prior art date
Application number
PCT/KR2019/000226
Other languages
English (en)
French (fr)
Inventor
송주만
조영필
손정관
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to PCT/KR2019/000226 priority Critical patent/WO2020145417A1/ko
Priority to US16/526,283 priority patent/US11654575B2/en
Priority to KR1020190145272A priority patent/KR102259428B1/ko
Publication of WO2020145417A1 publication Critical patent/WO2020145417A1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/008Manipulators for service tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/003Controls for manipulators by means of an audio-responsive input
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/021Optical sensing devices
    • B25J19/023Optical sensing devices including video camera means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/06Safety devices
    • B25J19/061Safety devices with audible signals
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0003Home robots, i.e. small robots for domestic use
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Definitions

  • a robot is a machine that automatically handles or operates a task given by its own capabilities, and its application fields are generally classified into various fields such as industrial, medical, space, and submarine. Recently, communication robots capable of communicating or interacting with humans through voice or gestures are increasing.
  • the communication robot may include various types of robots, such as a guide robot arranged at a specific location to guide various information to a user, or a home robot provided at home.
  • the communication robot may include an educational robot that directs or assists the learner's learning through interaction with the learner.
  • Another problem to be solved by the present invention is to provide a robot capable of performing a smoother interaction with a user and the like by sensing the direction of sound generation.
  • the robot according to an embodiment of the present invention, a microphone for obtaining a sound signal corresponding to the sound, an SPL calculator for calculating the SPL of the converted sound signal, and a reference SPL for background noise based on the SPL of the previously converted sound signal Background noise analyzer to set, a sound event detector to detect whether a sound event has occurred based on the SPL of the sound signal and the reference SPL, and when the occurrence of the sound event is detected, the sound event based on the sound signal It includes a sound event recognizer to recognize.
  • the threshold SPL may be set to be lower as the reference SPL is higher.
  • the background noise analyzer acquires maximum SPL, minimum SPL, and SPL change information from each SPL of the sound signals of the at least one continuous operation cycle, and the obtained maximum SPL, minimum SPL, and SPL
  • the reference SPL can be variably set according to the change information.
  • the sound event detector provides information on a section in which the occurrence of the sound event is detected, and the robot further comprises a sound slicing module that extracts a sound signal corresponding to the section from the sound signals based on the provided information. It can contain.
  • the robot further includes a memory that stores a plurality of signal characteristics corresponding to a plurality of sound events, and the sound event recognizer extracts signal characteristics of the sound signal and extracts the signal characteristics from the plurality of signals. Compared to each of the characteristics, a sound event corresponding to a signal characteristic matching the extracted signal characteristic among the plurality of signal characteristics may be output as a recognition result.
  • the sound event recognizer calculates the similarity between each of the plurality of signal characteristics and the extracted signal characteristic, and among the plurality of signal characteristics, the calculated similarity is greater than or equal to a reference similarity and has the highest signal characteristic. It can be detected as a signal characteristic that matches the extracted signal characteristic.
  • the memory stores interaction data corresponding to each of a plurality of sound events
  • the controller controls the display unit and the display unit based on interaction data corresponding to the recognized sound event among the plurality of interaction data. At least one of the sound output units can be controlled.
  • the sound event direction detector may detect a direction in which the sound is generated based on a difference between acquisition points of each of the plurality of sound signals.
  • the control unit after the display unit and the camera is rotated to face the detected direction of occurrence, by controlling the camera to obtain an image including the direction of occurrence, it is possible to detect the presence of the user from the image have.
  • the controller may recognize a user having the largest face area among the detected users as a user related to the sound.
  • the robot further includes a communication unit for connecting to the user's terminal, and when the controller detects that the user does not exist from the image, the control unit transmits a message or notification related to the sound through the communication unit. Can be transferred to.
  • the rotating mechanism may include a motor provided to rotate the robot about a vertical axis.
  • the robot can automatically recognize the occurrence of a specific event by acquiring the sound generated in the surroundings, and perform an intelligent interaction according to the recognized event.
  • the robot can react and behave similarly to a human in response to the sound event by filtering the sound signal acquired through the microphone based on human auditory characteristics or by detecting a sound event having a sound greater than background noise. .
  • the sound event recognizer implemented in the robot may be activated and operated only when a sound event is detected by the sound event detector. Accordingly, the sound event recognizer can effectively reduce the load compared to continuously activated and operated, which can improve the overall processing speed or performance of the robot.
  • the robot can effectively detect the direction in which the sound event is generated using a plurality of microphones.
  • the robot acquires an image in a sensed direction using a camera or the like, and recognizes the presence of the user from the image, so that the robot can respond more intelligently to the sound event according to the presence of the user.
  • FIG. 1 is a perspective view of a robot according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing a control configuration of a robot according to an embodiment of the present invention.
  • FIG. 3 is a block diagram showing the detailed configuration of the sound event analyzer shown in FIG. 2.
  • FIG. 4 is a flowchart schematically illustrating a sound event detection and recognition operation of a robot according to an embodiment of the present invention.
  • FIG. 5 is a flowchart for explaining an operation of a robot according to an embodiment of the present invention to set a reference SPL of background noise from a sound signal.
  • FIG. 6 is a graph for explaining an example of a threshold SPL variablely set according to a reference SPL of background noise, and an example of a detection SPL in which an occurrence of a sound event is detected according to the reference SPL and the threshold SPL.
  • FIG. 7 is a flowchart for explaining an operation in which a robot detects the occurrence of a sound event from a sound signal and recognizes the sound event when a sound event is detected, according to an embodiment of the present invention.
  • FIG. 9 is a block diagram showing a control unit of a robot according to an embodiment of the present invention.
  • FIG. 1 is a perspective view of a robot according to an embodiment of the present invention
  • FIG. 2 is a block diagram showing a control configuration of a robot according to an embodiment of the present invention.
  • the robot 1 may be a home robot disposed at home.
  • the home robot may perform various operations, such as providing various information to the user through interaction with the user or monitoring events occurring in the home.
  • the robot 1 includes a camera 132 (see FIG. 2) for acquiring an image of a user or a robot, and at least one microphone 124 (see FIG. 2) for acquiring a sound around the user or the robot ), a display unit 142 for outputting graphics or text, and an input/output means such as a sound output unit 144 (for example, a speaker) for outputting voice or sound.
  • a camera 132 see FIG. 2 for acquiring an image of a user or a robot
  • at least one microphone 124 for acquiring a sound around the user or the robot
  • a display unit 142 for outputting graphics or text
  • an input/output means such as a sound output unit 144 (for example, a speaker) for outputting voice or sound.
  • the display unit 142 may be arranged to face one surface from the robot 1.
  • the direction in which the display unit 142 faces is defined as the front of the robot 1.
  • the sound output unit 144 is illustrated as being disposed under the robot 1, the position of the sound output unit 144 may be variously changed according to embodiments.
  • control components included in the robot 1 will be described in detail with reference to FIG. 2.
  • the robot 1 may be connected to the network through an access point such as a router. Accordingly, the robot 1 may provide various information obtained through the input unit 12 or the sensor unit 13 to the server or mobile terminal through the network. In addition, the robot 1 may receive program data (such as firmware) related to the operation of the robot 1 from a server or the like through the network. According to an embodiment, the robot 1 may share various information with other robots.
  • an access point such as a router.
  • the robot 1 may provide various information obtained through the input unit 12 or the sensor unit 13 to the server or mobile terminal through the network.
  • the robot 1 may receive program data (such as firmware) related to the operation of the robot 1 from a server or the like through the network. According to an embodiment, the robot 1 may share various information with other robots.
  • the input unit 12 may include at least one input means for inputting signals or data corresponding to a user's manipulation or other actions (such as voice utterance) and sounds generated in the vicinity of the robot 1 to the robot 1.
  • the at least one input means may include a physical input means such as a button or a dial, a touch input unit 122 such as a touch pad or a touch panel, a user's voice or a microphone receiving sound around the robot 1; 124) and the like.
  • the user can input a request or command to the robot 1 by operating the input unit 12.
  • control unit 17 of the robot 1 detects whether a sound component corresponding to a specific event is included in the sound signal based on the sound signal received through the microphone 124, thereby The occurrence of a specific event can be detected. Based on the detection result, the controller 17 may perform a recognition operation of the specific event.
  • control unit 17 may detect the direction of sound generation based on sound signals received from the plurality of microphones 124, respectively. .
  • the camera 132 may acquire an image around the robot 1.
  • the controller 17 may acquire an image including a user's face through the camera 132 to recognize the user.
  • the controller 17 may acquire a user's gesture or facial expression through the camera 132.
  • the camera 132 may function as the input unit 12.
  • the proximity sensor 134 may detect that an object such as a user is approaching the robot 1. For example, when the user's approach is detected by the proximity sensor 134, the control unit 17 outputs an initial screen or an initial voice through the output unit 14 to induce the user to use the robot 1 can do.
  • the output unit 14 may output various information related to the operation or state of the robot 1, various services, programs, applications, and the like executed on the robot 1. Further, the output unit 14 may output various messages or information for performing an interaction with the user of the robot 1.
  • the output unit 14 may include a display unit 142, a sound output unit 144, and a light output unit 146.
  • the sound output unit 144 may output the various information or messages in the form of voice or sound.
  • the sound output unit 144 may include a speaker.
  • the light output unit 146 may be implemented as a light source such as LED.
  • the control unit 17 may indicate the state of the robot 1 and the like through the light output unit 146.
  • the light output unit 146 may provide various information to the user together with the display unit 142 and/or the sound output unit 144 as auxiliary output means.
  • the rotating mechanism 15 may include components (eg, a motor) for rotating the robot 1 about a vertical axis.
  • the control unit 17 controls the rotation mechanism 15 to rotate the robot 1 to change the direction in which the display unit 142 of the robot 1 faces (or the direction in which the front face of the robot 1 faces). Can.
  • program data such as software modules or applications executed by any one of at least one processor or controller included in the controller 17 may be stored in the memory 16.
  • characteristic information of each of a plurality of sound events may be stored in the memory 16.
  • the characteristic information may include information for classifying and identifying sound events, such as a frequency characteristic of a sound signal or a change characteristic of a signal over time.
  • the plurality of sound events include events occurring in a space (eg, a home) in which the robot 1 is disposed (eg, door opening, door lock operation, baby crying, etc.) or various events generated by a user ( For example, robot calls, conversations, and the like). When the events occur, sounds corresponding to each of the events may occur, and the robot 1 may acquire a sound signal corresponding to the sound through the microphone 124.
  • the memory 16 may be various storage devices such as ROM, RAM, EPROM, flash drive, hard drive, and the like in hardware.
  • the control unit 17 may include at least one processor or controller that controls the operation of the robot 1.
  • the control unit 17 may include at least one CPU, an application processor (AP), a microcomputer (or microcomputer), an integrated circuit, and an application specific integrated circuit (ASIC).
  • AP application processor
  • microcomputer or microcomputer
  • ASIC application specific integrated circuit
  • the ISP 174 and/or the display controller 176 may be included in the processor 172.
  • the processor 172 may be implemented as an integrated processor that performs the operations of the ISP 174 and/or the display controller 176.
  • the robot 1 may further include a sound event analyzer 200.
  • the sound event analyzer 200 may be implemented as a component or software module of the controller 17, but may be implemented as a separate hardware or device from the controller 17 according to an embodiment.
  • the sound event analyzer 200 may detect whether a sound event has occurred based on the sound signal received through the microphone 124 and recognize the type of the sound event when the occurrence of the sound event is detected. The sound event analyzer 200 will be described in more detail with reference to FIG. 3 later.
  • the power supply unit 18 of the robot 1 may supply power required for the operation of the components included in the robot 1.
  • the power supply unit 18 may include a power connection unit that can connect an external wired power cable, and a battery that stores power and supplies the components.
  • the power supply unit 18 may further include a wireless charging module that receives power wirelessly to charge the battery.
  • FIG. 3 is a block diagram showing the detailed configuration of the sound event analyzer shown in FIG. 2.
  • the sound event analyzer 200 includes a sound pressure level (SPL) calculation block (SPL calculation block) 210, a background noise analyzer (220), and a sound event analysis block ( sound event analyzing block; 230).
  • SPL sound pressure level
  • the SPL calculation block 210 may calculate the SPL of the sound signal received from the microphone 124.
  • the SPL is information indicating the strength of a sound corresponding to the sound signal, and is a value representing a ratio of the sound pressure of a sound signal to a reference sound pressure in decibels (dB).
  • the SPL calculation block 210 may include a signal compensator (212), an A-weighting filter (214), and an SPL calculator (SPL calculator) 216.
  • the signal compensator 212 may compensate a sound signal obtained through the microphone 124 based on the hardware characteristics of the microphone 124.
  • the A-weighting filter 214 may filter the sound signal compensated by the signal compensator 212 based on human auditory characteristics, and provide the filtered sound signal to the SPL calculator 216.
  • the A-weighting filter 214 is designed based on a human audible frequency and an equal loudness contour, so that the sound signal can be filtered according to human hearing characteristics.
  • the robot 1 can react to the sound event similarly to a human by detecting and recognizing a sound event from a sound signal obtained according to human hearing characteristics.
  • the A-weighting filter 214 is only an example of a filter included in the SPL calculation block 210. In addition to the A-weighting filter 214, various filters designed according to human hearing characteristics are provided in the SPL calculation block 210. Can be.
  • the calculated SPL may be provided to each of the background noise analyzer 220 and the sound event analysis block 230. Meanwhile, the SPL value input to the background noise analyzer 220 may be input after being delayed by a delay block 218. That is, the background noise analyzer 220 analyzes background noise based on the currently input sound signal, and may provide reference SPL and threshold SPL set based on the analyzed background noise to the sound event analysis block 230. . That is, the background noise may be used to analyze whether a sound event is included in the next sound signal of the currently input sound signal.
  • the background noise reference SPL and the threshold SPL are set based on the SPL of the currently input sound signal
  • the sound event analysis block 230 is based on the SPL of the next input sound signal and the reference SPL and the threshold SPL. , It may be detected whether a sound event is included in the next input sound signal.
  • the currently input sound signal and the next input sound signal may be classified according to an operation cycle of the sound event analyzer 200. That is, the sound signal may be continuously acquired through the microphone 124, and the sound event analyzer 200 may analyze and analyze the sound signal that is continuously obtained in units of a preset operation period to detect and recognize sound events. For example, assuming that the currently input sound signal corresponds to the sound signal during the first period, the next input sound signal will correspond to the sound signal during the second period, which is the next period of the first period.
  • the background noise analyzer 220 may set a reference SPL of background noise and a threshold SPL based on the reference SPL based on the SPL of the sound signal calculated by the SPL calculation block 210.
  • the background noise estimation module 222 included in the background noise analyzer 220 may set a reference SPL for background noise based on the SPL of each sound signal during at least one continuous period.
  • the threshold setting module 224 may variably set the threshold SPL based on the reference SPL. For example, the threshold setting module 224 may set the threshold SPL to be lower as the reference SPL is higher, but this is not necessarily the case.
  • the sound slicing module 234 may extract sound signals of sections detected as having a sound event by the sound event detector 232.
  • the extracted sound signal may be provided to the sound event recognizer 236.
  • the sound event recognizer 236 may calculate the similarity between each of the plurality of signal characteristics and the signal characteristics of the extracted sound signal.
  • the sound event recognizer 236 may detect, among the plurality of signal characteristics, that the calculated similarity is greater than or equal to a reference similarity and that the highest signal characteristic matches the signal characteristic of the extracted sound signal.
  • the sound event recognizer 236 may recognize that the sound event included in the extracted sound signal is a sound event corresponding to the matched signal characteristic.
  • the sound event recognizer 236 can provide the recognition result to the processor 172.
  • the sound event analysis block 230 may provide the processor 172 with information indicating that the sound event cannot be recognized. .
  • the processor 172 may output the recognition result to the user through the output unit 14 or the communication unit 11, and obtain information about a sound event included in the sound signal from the user.
  • the processor 172 may store signal characteristics obtained from the sound signal and information on the sound event in the memory 16 based on the obtained information. Accordingly, the sound event analyzer 200 may recognize a sound event included in the corresponding sound signal when a sound signal having similar signal characteristics is received later.
  • the sound event recognizer 236 extracts signal characteristics from the sound signal and calculates similarity by comparing the extracted signal characteristics with a plurality of signal characteristics, so that the load may be relatively high compared to other configurations.
  • the sound event recognizer 236 may be activated and operated only when it is detected that a sound event has been generated by the sound event detector 232. Accordingly, the sound event recognizer 236 is continuously activated and can effectively reduce its load compared to the operation, which can improve the overall processing speed or performance of the robot 1.
  • FIG. 4 is a flowchart schematically illustrating a sound event detection and recognition operation of a robot according to an embodiment of the present invention.
  • the robot 1 may receive a sound signal corresponding to sound generated in the vicinity of the robot 1 (S100).
  • the microphone 124 provided in the robot 1 can convert sound generated in the vicinity of the robot 1 into an electrical signal (sound signal).
  • the control unit 17 may receive the converted sound signal from the microphone 124.
  • the robot 1 may calculate the SPL of the received sound signal (S110).
  • the SPL calculation block 210 may compensate a sound signal through the signal compensator 212.
  • the compensated sound signal is filtered through the A-weighting filter 214, and the SPL calculator 216 can calculate the SPL of the filtered sound signal.
  • the calculated SPL may be provided to each of the background noise analyzer 220 and the sound event analysis block 230.
  • the robot 1 may detect whether a sound event has occurred based on the calculated SPL and the reference SPL of background noise (S120 ).
  • the sound event recognizer 236 included in the sound event analysis block 230 may recognize whether any sound event is included in a sound signal detected as having a sound event.
  • the processor 172 may obtain information on the recognized sound event from the sound event analyzer 200.
  • interaction data corresponding to each of a plurality of sound events may be stored in the memory 16.
  • the interaction data may include graphics, text, sound, voice data, etc. output through the output unit 14.
  • the interaction data may include a message or a notification to be transmitted to the user's mobile terminal through the communication unit 11, or other information related to various processing operations performed in connection with the sound event.
  • the background noise estimation module 222 may set a reference SPL of background noise based on each SPL of the sound signals for at least one successive period received.
  • the background noise estimation module 222 receives information such as maximum SPL, minimum SPL, and SPL change information (slope change, etc.) from each SPL of the sound signal during the at least one successive period. Based on the acquired information, the reference SPL can be variably set.
  • Matching information or an equation or algorithm for setting a threshold SPL corresponding to each of the reference SPLs of the background noise may be stored in the memory 16 or the like.
  • a graph based on the matching information, equation, or algorithm is shown in FIG. 6(a).
  • the threshold setting module 224 may set the threshold SPL to 15 decibels (dB).
  • the graph is only an example for convenience of description, and the threshold SPL corresponding to the reference SPL may vary according to matching information, an equation, or an algorithm.
  • the threshold SPL may be set lower as the reference SPL increases. This may be due to limitations in the SPL of sound events.
  • the sound event detector 232 detects whether a sound event is included in the sound signal (or whether a sound event has occurred) based on the SPL (detection SPL) calculated for the sound signal and the reference SPL and the threshold SPL. can do.
  • FIG. 7 is a flowchart for explaining an operation in which a robot detects the occurrence of a sound event from a sound signal and recognizes the sound event when a sound event is detected, according to an embodiment of the present invention.
  • the robot 1 may detect that a sound event has occurred from the sound signal (S720).
  • the robot 1 may extract a section in which the sound event is detected from the sound signal (S730).
  • the sound event detector 232 may provide information about a start point and an end point of a section (operation cycle) in which the sound event is detected to the sound slicing module 234.
  • the start point may mean an operation cycle in which the occurrence of the sound event is first detected among the operation cycles in which the occurrence of the sound event is continuously detected, and the end point means an operation cycle in which the occurrence of the sound event was last detected. can do.
  • the sound slicing module 234 may extract a sound signal between the start point and the end point based on the detection result of the sound event detector 232.
  • the sound event recognizer 236 may extract signal characteristics of the extracted sound signal.
  • the signal characteristic may include a frequency characteristic of a sound event or a characteristic of a signal change over time.
  • the sound event recognizer 236 may calculate similarities by comparing a plurality of signal characteristics stored in the memory 16 and the like with the extracted signal characteristics.
  • the sound event recognizer 236 may recognize that the sound event included in the extracted sound signal is a sound event corresponding to the matched signal characteristic.
  • the robot 1 may control the output unit 14 and the like to provide an interaction corresponding to the recognized sound event (S760).
  • Step S760 is substantially the same as step S150 of FIG. 4, and a description thereof is omitted.
  • the robot 1 may be implemented as a home robot disposed in a home.
  • the robot 1 may acquire various sounds generated in the home through the microphone 124.
  • the user 801 may return to the home by opening the front door 802, entering the home, and closing the front door 802. At this time, a sound event 803 corresponding to the opening and closing of the front door 802 may occur.
  • the robot 1 may acquire a sound signal including the sound event 803 through the microphone 124.
  • the sound event analyzer 200 of the robot 1 may calculate the SPL of the acquired sound signal, and compare the calculated SPL with a reference SPL of background noise.
  • the sound event analyzer 200 may detect that the calculated SPL is higher than the threshold SPL than the reference SPL, and detect that a sound event 803 has occurred according to the detection result. As the sound event 803 is detected, the sound event analyzer 200 may recognize the sound event 803 through the sound event recognizer 236.
  • the sound event recognizer 236 may recognize that the sound event 803 is “open and close of the front door”. Accordingly, the robot 1 may perform interaction with the user 801 using interaction data corresponding to “opening and closing of the front door”. For example, the interaction data said, “Hello. You can include voice data corresponding to “Welcome.” In this case, the processor 172 may perform interaction with the user by outputting the voice data through the sound output unit 144.
  • the robot 1 filters the sound signal obtained through the microphone 124 based on human auditory characteristics, or detects a sound event having a sound greater than background noise, thereby similar to the human for the sound event. Can react and act.
  • FIG. 9 is a block diagram showing a control unit of a robot according to an embodiment of the present invention.
  • the robot 1 is illustrated as including four microphones 124a to 124d, but the robot 1 may include a plurality of (preferably at least three) microphones.
  • the plurality of microphones 124a to 124d may be arranged spaced apart from each other in the horizontal direction.
  • the first microphone 124a may be disposed on the front left side of the robot 1, and the second microphone 124b may be placed on the front right side of the robot 1.
  • the third microphone 124c may be disposed on the rear right side of the robot 1, and the fourth microphone 124d may be disposed on the rear left side of the robot 1. That is, as the plurality of microphones 124a to 124d are spaced apart from each other, the SPLs of the sound signals acquired by the respective microphones 124a to 124d may be different, or the acquisition times of the sound signals may be different.
  • the sound event direction detector 900 is based on the difference between the SPLs of each of the sound signals received from the plurality of microphones 124a to 124d, or the difference in the acquisition time point of each of the sound signals, the sound corresponding to the sound signal (Or sound event) can be detected.
  • the robot 1 may further include a user recognizer 1000 that recognizes a user around the robot 1 based on the image acquired through the camera 132.
  • FIG. 10 is a flowchart for explaining a sound generating direction detection operation of a robot and a control operation related thereto according to an embodiment of the present invention.
  • the robot 1 may receive sound signals from each of the plurality of microphones 124a to 124d (S1000), and detect the direction of sound generation based on the received sound signals ( S1010).
  • the sound event direction detector 900 may detect a direction in which the sound is generated based on each of the calculated SPLs. For example, the sound event direction detector 900 estimates a distance between each of the plurality of microphones 124a to 124d and the sound generating position from the SPL of the sound signal corresponding to each of the plurality of microphones 124a to 124d. Can. The sound event direction detector 900 may detect a direction in which the sound is generated using a technique such as a triangulation method based on the position of each of the plurality of microphones 124a to 124d and the estimated distance.
  • a technique such as a triangulation method
  • the processor 172 may acquire an image of the sensed direction through the camera 132 when the front faces the sensed direction under the control of the rotating mechanism 15.
  • the user 1100 may utter a voice 1110 for calling the robot 1.
  • the processor 172 may acquire an image of the sensed direction through the camera 132 when the front faces the sensed direction under the control of the rotating mechanism 15.
  • 13 to 15 are diagrams illustrating an example of an operation in which a robot recognizes a user related to the sound when a plurality of users exist in a direction in which sound generation is detected.
  • the robot 1 may be rotated so that the front faces in the direction in which the voice 1320 occurs.
  • the robot 1 may acquire an image IMAGE of the direction in which the voice 1320 occurred through the camera 132 and recognize a user from the image IMAGE through the user recognizer 1000.
  • the processor 172 corresponds to the baby crying 1600 based on the interaction data when the user does not exist, among the interaction data corresponding to the baby crying 1600. Can perform the operation.
  • the processor 172 may output the sound 1610 through the sound output unit 144 and transmit event information (EVENT_INFO) to the user's terminal 1700 through the communication unit 11. .
  • the transmitted event information (EVENT_INFO) is output in the form of a notification 1710 on the screen of the terminal 1700, so that the user can recognize that the baby is crying.
  • the robot 1 may acquire an image in a sensed direction using a camera 132 or the like, and recognize a user's presence from the image, thereby more intelligently responding to a sound event according to the user's presence. have.

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Manipulator (AREA)
  • Toys (AREA)

Abstract

본 발명의 실시 예에 따른 로봇은, 사운드에 대응하는 사운드 신호를 획득하는 마이크로폰, 변환된 사운드 신호의 SPL을 산출하는 SPL 산출기, 이전 변환된 사운드 신호의 SPL에 기초하여 배경 노이즈의 기준 SPL을 설정하는 배경 노이즈 분석기, 상기 사운드 신호의 SPL과 상기 기준 SPL에 기초하여 사운드 이벤트의 발생 여부를 감지하는 사운드 이벤트 감지기, 및 상기 사운드 이벤트의 발생이 감지된 경우, 상기 사운드 신호에 기초하여 상기 사운드 이벤트를 인식하는 사운드 이벤트 인식기를 포함한다.

Description

로봇
본 발명은 로봇 및 그의 동작 방법에 관한 것으로서, 특히 로봇의 주변에서 발생하는 사운드 이벤트를 감지 및 인식하는 로봇에 관한 것이다.
로봇은 스스로 보유한 능력에 의해 주어진 일을 자동으로 처리하거나 작동하는 기계로서, 로봇의 응용분야는 대체로 산업용, 의료용, 우주용, 해저용 등 다양한 분야로 분류된다. 최근에는 음성이나 제스쳐 등을 통해 인간과 커뮤니케이션이나 인터랙션을 수행할 수 있는 커뮤니케이션 로봇이 증가되는 추세이다.
이러한 커뮤니케이션 로봇은 특정 장소에 배치되어 사용자에게 각종 정보를 안내하는 안내 로봇이나, 가정에 구비되는 홈 로봇 등 다양한 종류의 로봇을 포함할 수 있다. 또한, 커뮤니케이션 로봇은 학습자와의 인터랙션을 통해 상기 학습자의 학습을 지도하거나 보조하는 교육용 로봇을 포함할 수 있다.
이러한 로봇은 다양한 구성들을 이용하여 사용자나 학습자 등과의 인터랙션을 수행하도록 구현될 수 있다. 예컨대, 로봇은 로봇 주변에서 발생하는 사운드를 획득하는 마이크로폰이나, 로봇 주변의 이미지를 획득하는 카메라를 포함할 수 있다.
따라서 최근에는 상기 마이크로폰이나 카메라 등의 구성을 이용하여 로봇 주변에서 발생하는 각종 이벤트를 보다 정확히 인식하고, 인식 결과에 기초한 인터랙션이나 제어 동작을 능동적으로 수행하는 로봇의 제공을 위한 기술 개발이 진행되고 있다.
본 발명이 해결하고자 하는 과제는, 주변에서 발생하는 사운드로부터 이벤트를 인식함으로써, 인식된 이벤트에 따른 능동적인 인터랙션을 수행할 수 있는 로봇을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 과제는, 사운드의 발생 방향을 감지함으로써 사용자 등과 보다 원활한 인터랙션을 수행할 수 있는 로봇을 제공하는 것이다.
본 발명의 실시 예에 따른 로봇은, 사운드에 대응하는 사운드 신호를 획득하는 마이크로폰, 변환된 사운드 신호의 SPL을 산출하는 SPL 산출기, 이전 변환된 사운드 신호의 SPL에 기초하여 배경 노이즈의 기준 SPL을 설정하는 배경 노이즈 분석기, 상기 사운드 신호의 SPL과 상기 기준 SPL에 기초하여 사운드 이벤트의 발생 여부를 감지하는 사운드 이벤트 감지기, 및 상기 사운드 이벤트의 발생이 감지된 경우, 상기 사운드 신호에 기초하여 상기 사운드 이벤트를 인식하는 사운드 이벤트 인식기를 포함한다.
상기 배경 노이즈 분석기는, 상기 설정된 기준 SPL에 기초한 임계 SPL을 설정하고, 상기 사운드 이벤트 감지기는, 상기 사운드 신호의 SPL이 상기 기준 SPL보다 상기 임계 SPL 이상 높은 경우, 상기 사운드 신호에 상기 사운드 이벤트가 포함된 것으로 감지할 수 있다.
실시 예에 따라, 상기 임계 SPL은 상기 기준 SPL이 높을수록 낮게 설정될 수 있다.
실시 예에 따라, 상기 SPL 산출기는 기설정된 동작 주기마다, 상기 동작 주기 동안의 사운드 신호로부터 SPL을 산출하고, 상기 배경 노이즈 분석기는, 적어도 하나의 연속된 동작 주기의 사운드 신호 각각의 SPL에 기초하여 상기 배경 노이즈의 상기 기준 SPL을 설정할 수 있다.
실시 예에 따라, 상기 배경 노이즈 분석기는, 상기 적어도 하나의 연속된 동작 주기의 사운드 신호 각각의 SPL로부터 최대 SPL, 최소 SPL, 및 SPL 변화 정보를 획득하고, 획득된 최대 SPL, 최소 SPL, 및 SPL 변화 정보에 따라 상기 기준 SPL을 가변적으로 설정할 수 있다.
상기 사운드 이벤트 감지기는, 상기 사운드 이벤트의 발생이 감지된 구간에 대한 정보를 제공하고, 상기 로봇은 상기 제공된 정보에 기초하여 상기 사운드 신호 중 상기 구간에 대응하는 사운드 신호를 추출하는 사운드 슬라이싱 모듈을 더 포함할 수 있다.
상기 로봇은, 복수의 사운드 이벤트들에 대응하는 복수의 신호 특성을 저장하는 메모리를 더 포함하고, 상기 사운드 이벤트 인식기는, 상기 사운드 신호의 신호 특성을 추출하고, 추출된 신호 특성을 상기 복수의 신호 특성들 각각과 비교하고, 상기 복수의 신호 특성들 중 상기 추출된 신호 특성과 매칭되는 신호 특성에 대응하는 사운드 이벤트를 인식 결과로서 출력할 수 있다.
실시 예에 따라, 상기 신호 특성은 주파수 특성 및 시간 경과에 따른 신호 변화 특성 중 적어도 하나를 포함할 수 있다.
실시 예에 따라, 상기 사운드 이벤트 인식기는, 상기 복수의 신호 특성들 각각과 상기 추출된 신호 특성의 유사도를 산출하고, 복수의 신호 특성들 중, 산출된 유사도가 기준 유사도 이상이고 가장 높은 신호 특성을 상기 추출된 신호 특성과 매칭되는 신호 특성으로 검출할 수 있다.
상기 로봇은 디스플레이부, 사운드 출력부, 및 상기 디스플레이부와 상기 사운드 출력부를 제어하는 제어부를 더 포함하고, 상기 제어부는, 상기 사운드 이벤트 인식기에 의해 인식된 사운드 이벤트에 기초하여 상기 디스플레이부와 상기 사운드 출력부 중 적어도 하나를 제어할 수 있다.
실시 예에 따라, 상기 메모리는 복수의 사운드 이벤트들 각각에 대응하는 인터랙션 데이터를 저장하고, 상기 제어부는, 복수의 인터랙션 데이터 중 상기 인식된 사운드 이벤트에 대응하는 인터랙션 데이터에 기초하여 상기 디스플레이부와 상기 사운드 출력부 중 적어도 하나를 제어할 수 있다.
실시 예에 따라, 상기 로봇은 상기 사운드 신호를 필터링하는 A-weighting 필터를 더 포함하고, 상기 SPL 산출기는, 상기 A-weighting 필터에 의해 필터링된 사운드 신호의 SPL을 측정할 수 있다.
본 발명의 실시 예에 따른 로봇은 서로 이격되어 배치되는 복수의 마이크로폰들, 일 방향을 향하도록 배치되는 디스플레이부와 카메라, 상기 복수의 마이크로폰들로부터 복수의 사운드 신호들을 획득하고, 상기 복수의 사운드 신호들에 기초하여 사운드의 발생 방향을 감지하는 사운드 이벤트 방향 감지기, 및 상기 감지된 발생 방향으로 상기 디스플레이부 및 상기 카메라가 향하도록 상기 로봇을 회전시키는 회전 기구를 제어하는 제어부를 포함할 수 있다.
실시 예에 따라, 상기 사운드 이벤트 방향 감지기는, 상기 복수의 사운드 신호들 각각의 SPL을 획득하고, 획득된 복수의 SPL로부터 상기 복수의 마이크로폰들 각각과 상기 사운드의 발생 위치 사이의 거리를 추정하고, 상기 복수의 마이크로폰들 각각의 위치와 상기 추정된 거리에 기초하여 상기 사운드의 발생 방향을 감지할 수 있다.
실시 예에 따라, 상기 사운드 이벤트 방향 감지기는, 상기 복수의 사운드 신호들 각각의 획득 시점 간의 차이에 기초하여 상기 사운드의 발생 방향을 감지할 수 있다.
상기 제어부는, 상기 디스플레이부 및 상기 카메라가 상기 감지된 발생 방향을 향하도록 회전된 후, 상기 카메라를 제어하여 상기 발생 방향을 포함하는 이미지를 획득하고, 상기 이미지로부터 사용자의 존재 여부를 감지할 수 있다.
상기 제어부는, 상기 이미지로부터 상기 사용자가 존재하는 것으로 감지된 경우, 상기 사용자와의 인터랙션을 위한 인터랙션 데이터에 기초하여 상기 디스플레이부 및 사운드 출력부를 제어할 수 있다.
실시 예에 따라, 상기 제어부는 상기 이미지로부터 복수의 사용자들이 존재하는 것으로 감지된 경우, 감지된 사용자들 중 얼굴 영역의 크기가 가장 큰 사용자를, 상기 사운드와 관련된 사용자로 인식할 수 있다.
상기 로봇은 사용자의 단말기와 연결하기 위한 통신부를 더 포함하고, 상기 제어부는, 상기 이미지로부터 상기 사용자가 존재하지 않는 것으로 감지된 경우, 상기 사운드와 관련된 메시지 또는 알림을 상기 통신부를 통해 상기 사용자의 단말기로 전송할 수 있다.
상기 회전 기구는, 수직 축을 기준으로 상기 로봇을 회전시키도록 구비된 모터를 포함할 수 있다.
본 발명의 실시 예에 따르면, 로봇은 주변에서 발생하는 사운드를 획득하여 특정 이벤트의 발생을 자동으로 인식하고, 인식된 이벤트에 따라 지능적으로 인터랙션을 수행할 수 있다.
또한, 로봇은 마이크로폰을 통해 획득된 사운드 신호를 인간의 청각 특성에 기초하여 필터링하거나, 배경 노이즈보다 큰 소리를 갖는 사운드 이벤트를 감지함으로써, 상기 사운드 이벤트에 대해 인간과 유사하게 반응 및 행동할 수 있다.
뿐만 아니라, 로봇 내에 구현되는 사운드 이벤트 인식기는, 사운드 이벤트 감지기에 의해 사운드 이벤트가 발생한 것으로 감지된 경우에만 활성화되어 동작할 수 있다. 이에 따라, 사운드 이벤트 인식기가 지속적으로 활성화되어 동작하는 것에 비해 그 부하를 효과적으로 감소시킬 수 있고, 이는 로봇의 전체적인 처리 속도나 성능을 향상시킬 수 있다.
또한, 로봇은 복수의 마이크로폰들을 이용하여 사운드 이벤트의 발생 방향을 효과적으로 감지할 수 있다.
뿐만 아니라, 로봇은 카메라 등을 이용하여 감지된 방향의 이미지를 획득하고, 이미지로부터 사용자의 존재 여부를 인식함으로써, 사용자의 존재 여부에 따라 사운드 이벤트에 대해 보다 지능적으로 반응할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 로봇의 사시도이다.
도 2는 본 발명의 일 실시 예에 따른 로봇의 제어 구성을 나타낸 블록도이다.
도 3은 도 2에 도시된 사운드 이벤트 분석기의 상세 구성을 나타낸 블록도이다.
도 4는 본 발명의 실시 예에 따른 로봇의 사운드 이벤트 감지 및 인식 동작을 개략적으로 설명하기 위한 플로우차트이다.
도 5는 본 발명의 실시 예에 따른 로봇이, 사운드 신호로부터 배경 노이즈의 기준 SPL을 설정하는 동작을 설명하기 위한 플로우차트이다.
도 6은 배경 노이즈의 기준 SPL에 따라 가변적으로 설정되는 임계 SPL의 일례와, 상기 기준 SPL 및 상기 임계 SPL에 따라 사운드 이벤트의 발생이 감지되는 감지 SPL의 일례를 설명하기 위한 그래프이다.
도 7은 본 발명의 실시 예에 따른 로봇이 사운드 신호로부터 사운드 이벤트의 발생을 감지하는 동작과, 사운드 이벤트가 감지된 경우 상기 사운드 이벤트를 인식하는 동작을 설명하기 위한 플로우차트이다.
도 8은 도 4 내지 도 7의 실시 예와 관련된 예시도이다.
도 9는 본 발명의 일 실시 예에 따른 로봇의 제어부를 나타내는 블록도이다.
도 10은 본 발명의 일 실시 예에 따른 로봇의 사운드 발생 방향 감지 동작 및 그와 관련된 제어 동작을 설명하기 위한 플로우차트이다.
도 11 내지 도 12는 도 10의 실시 예와 관련된 예시도들이다.
도 13 내지 도 15는 사운드의 발생이 감지된 방향에 복수의 사용자들이 존재하는 경우, 로봇이 상기 사운드와 관련된 사용자를 인식하는 동작의 일례를 보여주는 도면들이다.
도 16은 사운드의 발생이 감지된 방향에 사용자가 존재하지 않는 경우 로봇이 수행하는 동작의 일례를 보여주는 도면이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시 예에 따른 로봇의 사시도이고, 도 2는 본 발명의 일 실시 예에 따른 로봇의 제어 구성을 나타낸 블록도이다.
도 1을 참조하면, 로봇(1)은 사용자와의 커뮤니케이션이나 인터랙션을 통해 사용자에게 정보를 제공하거나 특정 행위를 유도하는 등의 동작을 수행하는 커뮤니케이션 로봇에 해당할 수 있다.
예컨대, 상기 로봇(1)은 가정에 배치되는 홈 로봇일 수 있다. 이러한 홈 로봇은 사용자와의 인터랙션을 통해 상기 사용자에게 각종 정보를 제공하거나, 가정 내에서 발생하는 이벤트를 모니터링하는 등의 동작을 수행할 수 있다.
상술한 동작들의 수행을 위해, 로봇(1)은 사용자 또는 로봇 주변의 영상을 획득하는 카메라(132; 도 2 참조), 사용자 또는 로봇 주변의 사운드를 획득하는 적어도 하나의 마이크로폰(124; 도 2 참조), 그래픽 또는 텍스트를 출력하는 디스플레이부(142), 및 음성이나 음향을 출력하는 사운드 출력부(144; 예컨대 스피커) 등의 입출력 수단을 포함할 수 있다.
로봇(1)은 내부에 구현된 적어도 하나의 마이크로폰(124)을 통해 로봇 외부의 사운드를 원활히 획득하기 위해, 커버(또는 케이스)의 외면에 형성되는 마이크로폰 홀(125a~125c)을 포함할 수 있다. 마이크로폰 홀(125a~125c) 각각은 어느 하나의 마이크로폰(124)에 대응한 위치에 형성되고, 마이크로폰(124)은 상기 마이크로폰 홀(125a~125c)을 통해 외부와 연통될 수 있다. 도 1에서는 세 개의 마이크로폰 홀(125a~125c)이 형성된 것으로 도시되어 있으나, 반드시 그러한 것은 아니다. 한편, 도 9 내지 도 16에서 후술할 바와 같이, 로봇(1)은 복수(또는 적어도 세 개)의 마이크로폰들을 포함하고, 상기 복수의 마이크로폰들을 이용하여 사운드가 발생한 방향을 감지할 수 있다.
디스플레이부(142)는 로봇(1)으로부터 일 면을 향하도록 배치될 수 있다. 이하, 디스플레이부(142)가 향하는 방향을 로봇(1)의 전방으로 정의한다. 한편, 사운드 출력부(144)는 로봇(1)의 하부에 배치된 것으로 도시되어 있으나, 사운드 출력부(144)의 위치는 실시 예에 따라 다양하게 변경될 수 있다.
비록 도시되지는 않았으나, 로봇(1)은 일 위치에서 다른 위치로 이동하기 위한 이동 수단(주행 수단)을 더 포함할 수도 있다. 예컨대, 상기 이동 수단은 적어도 하나의 바퀴, 및 상기 바퀴를 회전시키는 모터를 포함할 수 있다.
이하 도 2를 통해 로봇(1)에 포함된 제어 구성들의 일례를 구체적으로 설명한다.
도 2를 참조하면, 로봇(1)은 통신부(11), 입력부(12), 센서부(13), 출력부(14), 회전 기구(15), 메모리(16), 제어부(17), 및 전원 공급부(18)를 포함할 수 있다. 도 2에 도시된 구성들은 설명의 편의를 위한 일례로서, 로봇(1)은 도 2에 도시된 구성들보다 많거나 적은 구성들을 포함할 수도 있다.
통신부(11)는, 로봇(1)을 네트워크를 통해 서버, 이동 단말기, 다른 로봇 등과 연결하기 위한 통신 모듈들을 포함할 수 있다. 예컨대, 통신부(11)는 블루투스, NFC(near field communication)와 같은 근거리 통신 모듈, Wi-Fi 등의 무선 인터넷 모듈, LTE(long term evolution) 등의 이동 통신 모듈을 포함할 수 있다.
예컨대, 로봇(1)은 공유기 등의 액세스 포인트를 통해 네트워크와 연결될 수 있다. 이에 따라, 로봇(1)은 입력부(12)나 센서부(13) 등을 통해 획득되는 각종 정보를, 상기 네트워크를 통해 상기 서버나 이동 단말기로 제공할 수 있다. 또한, 로봇(1)은 로봇(1)의 동작과 관련된 프로그램 데이터(펌웨어 등)를 상기 네트워크를 통해 서버 등으로부터 수신할 수 있다. 실시 예에 따라, 로봇(1)은 다른 로봇과 각종 정보를 공유할 수도 있다.
입력부(12)는, 사용자의 조작이나 기타 행위(음성 발화 등), 및 로봇(1) 주변에서 발생하는 사운드 등에 대응하는 신호 또는 데이터를 로봇(1)으로 입력하는 적어도 하나의 입력 수단을 포함할 수 있다. 예컨대, 상기 적어도 하나의 입력 수단은 버튼이나 다이얼 등의 물리 입력 수단, 터치 패드나 터치 패널과 같은 터치 입력부(122), 사용자의 음성이나 로봇(1) 주변의 사운드 등을 수신하는 마이크로폰(microphone; 124) 등을 포함할 수 있다. 사용자는 입력부(12)를 조작함으로써 요청이나 명령을 로봇(1)으로 입력할 수 있다.
실시 예에 따라, 로봇(1)의 제어부(17)는 마이크로폰(124)을 통해 수신되는 사운드 신호에 기초하여, 상기 사운드 신호 내에 특정 이벤트에 대응하는 사운드 성분이 포함되어 있는지 여부를 감지함으로써, 상기 특정 이벤트의 발생을 감지할 수 있다. 감지 결과에 기초하여, 제어부(17)는 상기 특정 이벤트의 인식 동작을 수행할 수 있다.
이하 설명의 편의를 위해, 상기 특정 이벤트는 “사운드 이벤트”로 정의한다. 또한, “사운드 신호에 사운드 이벤트가 포함됨” 또는 “사운드 이벤트가 발생함”은, 사운드 신호에 상기 사운드 이벤트에 대응하는 사운드 성분이 포함됨을 의미한다.
또한, 제어부(17)는 로봇(1)에 복수의 마이크로폰들(124)이 구비된 경우, 상기 복수의 마이크로폰들(124)로부터 각각 수신되는 사운드 신호에 기초하여 사운드의 발생 방향을 감지할 수도 있다.
센서부(13)는, 로봇(1) 주변의 다양한 정보를 센싱하는 적어도 하나의 센서를 포함할 수 있다. 예컨대, 센서부(13)는 카메라(132), 근접 센서(134), 및 조도 센서(136) 등의 다양한 센서들을 포함할 수 있다.
카메라(132)는 로봇(1) 주변의 영상을 획득할 수 있다. 실시 예에 따라, 제어부(17)는 카메라(132)를 통해 사용자의 얼굴을 포함하는 이미지를 획득하여 사용자를 인식할 수 있다. 또는, 제어부(17)는 카메라(132)를 통해 사용자의 제스쳐나 표정 등을 획득할 수도 있다. 이 경우, 카메라(132)는 입력부(12)로서 기능할 수도 있다.
근접 센서(134)는 로봇(1) 주변에 사용자 등의 오브젝트가 접근함을 감지할 수 있다. 예컨대, 근접 센서(134)에 의해 사용자의 접근이 감지되는 경우, 제어부(17)는 출력부(14)를 통해 초기 화면이나 초기 음성 등을 출력하여, 사용자로 하여금 로봇(1)의 사용을 유도할 수 있다.
조도 센서(136)는 로봇(1)이 배치된 공간의 밝기를 감지할 수 있다. 제어부(17)는 상기 조도 센서(136)의 감지 결과 및/또는 시간대 정보에 기초한 다양한 동작을 수행할 수 있다.
출력부(14)는, 로봇(1)의 동작이나 상태, 로봇(1)에서 실행되는 각종 서비스, 프로그램, 애플리케이션 등과 관련된 각종 정보를 출력할 수 있다. 또한, 출력부(14)는 로봇(1)의 사용자와의 인터랙션을 수행하기 위한 각종 메시지나 정보 등을 출력할 수 있다.
예컨대, 출력부(14)는 디스플레이부(142), 사운드 출력부(144), 및 광 출력부(146)를 포함할 수 있다.
디스플레이부(142)는 상술한 각종 정보나 메시지를 그래픽 형태로 출력할 수 있다. 실시 예에 따라, 디스플레이부(142)는 터치 입력부(122)와 함께 터치 스크린 형태로 구현될 수 있고, 이 경우 디스플레이부(142)는 출력 수단뿐만 아니라 입력 수단으로서도 기능할 수 있다.
사운드 출력부(144)는 상기 각종 정보나 메시지를 음성이나 음향 형태로 출력할 수 있다. 예컨대, 사운드 출력부(144)는 스피커를 포함할 수 있다.
광 출력부(146)는 LED 등의 광원으로 구현될 수 있다. 제어부(17)는 광 출력부(146)를 통해 로봇(1)의 상태 등을 나타낼 수 있다. 실시 예에 따라, 광 출력부(146)는 보조적인 출력 수단으로서 디스플레이부(142) 및/또는 사운드 출력부(144)와 함께 각종 정보를 사용자에게 제공할 수도 있다.
회전 기구(15)는 로봇(1)을 수직 축을 기준으로 회전시키기 위한 구성들(예컨대 모터 등)을 포함할 수 있다. 제어부(17)는 상기 회전 기구(15)를 제어하여 로봇(1)을 회전시킴으로써, 로봇(1)의 디스플레이부(142)가 향하는 방향(또는 로봇(1)의 정면이 향하는 방향)을 변경시킬 수 있다.
메모리(16)에는, 로봇(1)에 포함된 구성 요소들의 동작을 제어하기 위한 제어 데이터, 입력부(12)를 통해 획득된 입력이나 센서부(13)를 통해 획득되는 정보에 기초한 동작을 수행하기 위한 데이터 등의 각종 데이터가 저장될 수 있다.
또한, 메모리(16)에는 제어부(17)에 포함된 적어도 하나의 프로세서나 컨트롤러 중 어느 하나에 의해 실행되는 소프트웨어 모듈이나 어플리케이션 등의 프로그램 데이터가 저장될 수 있다.
또한, 메모리(16)에는 복수의 사운드 이벤트들 각각의 특성 정보가 저장될 수 있다. 상기 특성 정보는 사운드 신호의 주파수 특성이나, 시간에 따른 신호의 변화 특성 등과 같이 사운드 이벤트들을 구분하여 식별하기 위한 정보를 포함할 수 있다. 상기 복수의 사운드 이벤트들은, 로봇(1)이 배치된 공간(예컨대, 가정)에서 발생하는 이벤트들(예컨대, 문의 여닫음, 도어락 조작, 아기 울음소리 등) 또는 사용자에 의해 발생하는 다양한 이벤트들(예컨대, 로봇 호출, 대화 등)을 포함할 수 있다. 상기 이벤트들의 발생 시, 상기 이벤트들 각각에 대응하는 사운드가 발생할 수 있고, 로봇(1)은 마이크로폰(124)을 통해 상기 사운드에 대응하는 사운드 신호를 획득할 수 있다.
이러한 메모리(16)는 하드웨어적으로, ROM, RAM, EPROM, 플래시 드라이브, 하드 드라이브 등과 같은 다양한 저장기기일 수 있다.
제어부(17)는 로봇(1)의 동작을 제어하는 적어도 하나의 프로세서나 컨트롤러 등을 포함할 수 있다. 구체적으로, 제어부(17)는 적어도 하나의 CPU, AP(application processor), 마이크로컴퓨터(또는 마이컴), 집적 회로, ASIC(application specific integrated circuit) 등을 포함할 수 있다.
제어부(17)는 이하 도 4 내지 도 16을 통해 설명할 로봇(1)의 다양한 실시 예에 따른 동작들을 수행할 수 있다. 이를 위해, 제어부(17)에 포함된 상기 적어도 하나의 프로세서나 컨트롤러는, 메모리(16)에 저장된 프로그램 데이터나 알고리즘 등을 이용하여 상기 동작들을 수행할 수 있다.
예컨대, 제어부(17)는 프로세서(172), 이미지 신호 프로세서(image signal processor (ISP); 174), 및 디스플레이 컨트롤러(176) 등을 포함할 수 있다.
프로세서(172)는 로봇(1)에 포함된 구성들의 전반적인 동작을 제어할 수 있다. ISP(174)는 카메라(132)를 통해 획득되는 이미지 신호를 처리하여 이미지 데이터를 생성할 수 있다. 디스플레이 컨트롤러(176)는 프로세서(172)로부터 제공되는 신호나 데이터에 기초하여 디스플레이부(142)의 동작을 제어할 수 있다. 디스플레이부(142)는 디스플레이 컨트롤러(176)의 제어에 따라 그래픽 또는 텍스트 등을 출력할 수 있다.
실시 예에 따라, ISP(174) 및/또는 디스플레이 컨트롤러(176)는 프로세서(172)에 포함될 수도 있다. 이 경우, 프로세서(172)는 ISP(174) 및/또는 디스플레이 컨트롤러(176)의 동작을 수행하는 통합 프로세서로 구현될 수 있다.
본 발명의 실시 예에 따른 로봇(1)은 사운드 이벤트 분석기(200)를 더 포함할 수 있다. 상기 사운드 이벤트 분석기(200)는 제어부(17)의 일 구성요소 또는 소프트웨어 모듈로 구현될 수 있으나, 실시 예에 따라서는 제어부(17)와 별도의 하드웨어나 장치로 구현될 수도 있다.
사운드 이벤트 분석기(200)는 마이크로폰(124)을 통해 수신되는 사운드 신호에 기초하여 사운드 이벤트의 발생 여부를 감지하고, 사운드 이벤트의 발생이 감지된 경우 상기 사운드 이벤트의 종류를 인식할 수 있다. 사운드 이벤트 분석기(200)에 대해서는 추후 도 3을 통해 보다 구체적으로 설명한다.
한편, 로봇(1)의 전원 공급부(18)는 로봇(1)에 포함된 구성들의 동작에 필요한 전원을 공급할 수 있다. 예컨대, 전원 공급부(18)는 외부의 유선 전원 케이블을 연결할 수 있는 전원 연결부, 전력을 저장하여 상기 구성들로 공급하는 배터리를 포함할 수 있다. 실시 예에 따라, 전원 공급부(18)는 무선으로 전력을 공급받아 배터리를 충전시키는 무선 충전 모듈을 더 포함할 수도 있다.
도 3은 도 2에 도시된 사운드 이벤트 분석기의 상세 구성을 나타낸 블록도이다.
도 3을 참조하면, 사운드 이벤트 분석기(200)는 음압 레벨(sound pressure level (SPL)) 산출 블록(SPL calculation block; 210), 배경 노이즈 분석기(background noise analyzer; 220), 및 사운드 이벤트 분석 블록(sound event analyzing block; 230)을 포함할 수 있다.
SPL 산출 블록(210)은 마이크로폰(124)으로부터 수신된 사운드 신호의 SPL을 산출할 수 있다. 상기 SPL은 상기 사운드 신호에 대응하는 사운드의 세기를 나타내는 정보로서, 기준 음압에 대한 사운드 신호의 음압 비율을 데시벨(dB)로 나타낸 값이다.
예컨대, SPL 산출 블록(210)은 신호 보상기(signal compensator; 212), A-weighting 필터(214), 및 SPL 산출기(SPL calculator; 216)를 포함할 수 있다.
신호 보상기(212)는, 마이크로폰(124)을 통해 획득되는 사운드 신호를, 상기 마이크로폰(124)의 하드웨어 특성에 기초하여 보상할 수 있다.
이와 관련하여, 마이크로폰(124)은 하드웨어 특성에 따라 각 주파수 대역에 대한 민감도가 다를 수 있다. 즉, 모든 주파수 대역에서 동일한 세기(진폭)을 갖는 사운드가 발생하더라도, 마이크로폰(124)에 의해 획득되는 사운드 신호는 주파수 대역마다 서로 다른 진폭을 나타낼 수 있다. 즉, 상기 사운드 신호는 실제 발생한 사운드와 상이할 수 있고, 사운드 신호에 왜곡이 발생할 수 있다. 따라서, 신호 보상기(212)는 상기 사운드 신호를 보상함으로써, 실제 발생한 사운드와 실질적으로 동일한 사운드 신호를 획득(왜곡을 감소)할 수 있다.
A-weighting 필터(214)는 신호 보상기(212)에 의해 보상된 사운드 신호를 인간의 청각 특성에 기초하여 필터링하고, 필터링된 사운드 신호를 SPL 산출기(216)로 제공할 수 있다.
예컨대, A-weighting 필터(214)는 인간의 가청주파수 및 등청감곡선(equal loudness contour)을 기초로 설계됨으로써, 인간의 청각 특성에 따라 상기 사운드 신호를 필터링할 수 있다. 그 결과, 로봇(1)은 인간의 청각 특성에 따라 획득되는 사운드 신호로부터 사운드 이벤트를 감지 및 인식함으로써, 사운드 이벤트에 대해 인간과 유사하게 반응할 수 있다.
A-weighting 필터(214)는 SPL 산출 블록(210)에 포함되는 필터의 예시에 불과한 바, SPL 산출 블록(210)에는 A-weighting 필터(214) 외에도 인간의 청각 특성에 따라 설계된 다양한 필터가 구비될 수 있다.
SPL 산출기(216)는, A-weighting 필터(214)에 의해 필터링된 사운드 신호의 SPL을 산출할 수 있다. 상기 SPL은 사운드 신호의 음압과 기준 음압의 비에 기초하여 산출되는 것으로서, SPL 산출 방법은 당해 기술분야에서 이미 널리 공지된 바, 이에 대한 구체적인 설명은 생략하기로 한다.
산출된 SPL은 배경 노이즈 분석기(220) 및 사운드 이벤트 분석 블록(230) 각각으로 제공될 수 있다. 한편, 배경 노이즈 분석기(220)로 입력되는 SPL 값은 지연 블록(delay; 218)에 의해 지연된 후 입력될 수 있다. 즉, 배경 노이즈 분석기(220)는 현재 입력된 사운드 신호에 기초하여 배경 노이즈를 분석하고, 분석된 배경 노이즈에 기초하여 설정되는 기준 SPL과 임계 SPL을 사운드 이벤트 분석 블록(230)으로 제공할 수 있다. 즉, 상기 배경 노이즈는 현재 입력된 사운드 신호의 다음 사운드 신호에 사운드 이벤트가 포함되어 있는지 여부를 분석하기 위해 사용될 수 있다.
구체적으로, 현재 입력된 사운드 신호의 SPL에 기초하여 배경 노이즈의 기준 SPL 및 임계 SPL이 설정되고, 사운드 이벤트 분석 블록(230)는 다음 입력된 사운드 신호의 SPL과 상기 기준 SPL 및 임계 SPL에 기초하여, 상기 다음 입력된 사운드 신호에 사운드 이벤트가 포함되어 있는지 여부를 감지할 수 있다.
현재 입력된 사운드 신호와 다음 입력된 사운드 신호는, 사운드 이벤트 분석기(200)의 동작 주기에 따라 구분될 수 있다. 즉, 사운드 신호는 마이크로폰(124)을 통해 연속적으로 획득될 수 있고, 사운드 이벤트 분석기(200)는 연속적으로 획득되는 사운드 신호를 기설정된 동작 주기 단위로 분석하여 사운드 이벤트를 감지 및 인식할 수 있다. 예컨대, 현재 입력된 사운드 신호가 제1 주기 동안의 사운드 신호에 해당하는 것으로 가정하면, 상기 다음 입력된 사운드 신호는 상기 제1 주기의 다음 주기인 제2 주기 동안의 사운드 신호에 해당할 것이다.
배경 노이즈 분석기(220)는, SPL 산출 블록(210)에 의해 산출되는 사운드 신호의 SPL에 기초하여 배경 노이즈의 기준 SPL, 및 상기 기준 SPL에 기초한 임계 SPL을 설정할 수 있다.
배경 노이즈 분석기(220)에 포함된 배경 노이즈 추정 모듈(background noise estimation module; 222)은, 적어도 하나의 연속된 주기 동안의 사운드 신호 각각의 SPL에 기초하여 배경 노이즈의 기준 SPL을 설정할 수 있다.
배경 노이즈 추정 모듈(222)은, 상기 적어도 하나의 연속된 주기 동안의 사운드 신호 각각의 SPL로부터, 최대 SPL, 최소 SPL, SPL 변화 정보(기울기 변화 등) 등의 정보를 획득하고, 획득된 정보에 기초하여 기준 SPL을 가변적으로 설정할 수 있다. 배경 노이즈 추정 모듈(222)은 상기 획득된 정보에 기초하여 기준 SPL을 설정하기 위한 알고리즘을 포함할 수 있다.
일례로, 상기 기준 SPL은 최대 SPL 및 최소 SPL이 높을수록 증가할 수 있다. 일례로, SPL이 점차 증가하는 경우 기준 SPL 또한 서서히 증가할 수 있고, SPL이 낮아진 경우(큰소리가 종료된 경우) 기준 SPL이 급격히 낮아질 수도 있다.
임계 설정 모듈(threshold setting module; 224)은, 설정된 기준 SPL에 대응하는 임계 SPL을 설정할 수 있다. 상기 임계 SPL은, 사운드 신호로부터 배경 노이즈의 사운드 세기보다 큰 세기를 갖는 사운드 이벤트를 감지하기 위한 요소일 수 있다. 즉, 후술할 사운드 이벤트 분석 블록(230)은 배경 노이즈에 기초한 기준 SPL보다 큰 SPL을 갖는 사운드 신호가 감지될 경우 사운드 이벤트가 발생한 것으로 감지할 수 있다.
한편, 임계 설정 모듈(224)은 기준 SPL에 기초하여 가변적으로 임계 SPL을 설정할 수 있다. 예컨대, 임계 설정 모듈(224)은 기준 SPL이 높을수록 임계 SPL을 낮게 설정할 수 있으나, 반드시 그러한 것은 아니다.
사운드 이벤트 분석 블록(230)는 수신된 사운드 신호로부터 사운드 이벤트의 발생 여부를 감지하고, 감지된 사운드 이벤트의 종류를 인식할 수 있다.
예컨대, 사운드 이벤트 분석 블록(230)은 사운드 이벤트 감지기(sound event detector; 232), 사운드 슬라이싱 모듈(sound slicing module; 234), 및 사운드 이벤트 인식기(sound event recognizer; 236)를 포함할 수 있다.
사운드 이벤트 감지기(232)는, 사운드 신호에 대해 산출된 SPL과 배경 노이즈의 기준 SPL에 기초하여 사운드 이벤트의 발생 여부를 감지할 수 있다. 예컨대, 사운드 이벤트 감지기(232)는 상기 산출된 SPL이, 상기 기준 SPL보다 임계 SPL 이상 높은 경우 상기 사운드 이벤트가 발생한 것으로 감지할 수 있다. 예컨대, 사운드 이벤트 감지기(232)는 사운드 이벤트가 발생한 것으로 감지된 구간(동작 주기)의 시작 지점과 종료 지점에 대한 정보를 사운드 슬라이싱 모듈(234)로 제공할 수 있다.
사운드 슬라이싱 모듈(234)은, 사운드 이벤트 감지기(232)에 의해 사운드 이벤트가 발생한 것으로 감지된 구간들의 사운드 신호를 추출할 수 있다. 사운드 슬라이싱 모듈(234)은 마이크로폰(124)으로부터 수신되는 사운드 신호 중, 상기 사운드 이벤트 감지기(232)에 의해 사운드 이벤트가 발생한 것으로 감지된 구간(동작 주기)의 시작 지점과 종료 지점 사이의 사운드 신호를 추출하고, 추출된 사운드 신호를 사운드 이벤트 인식기(236)로 제공할 수 있다.
사운드 이벤트 인식기(236)는, 추출된 사운드 신호의 신호 특성에 기초하여, 상기 사운드 신호에 대응하는 사운드 이벤트를 인식할 수 있다.
구체적으로, 사운드 이벤트 인식기(236)는 메모리(16) 또는 사운드 이벤트 분석기(200)의 내부 메모리에 저장된 복수의 신호 특성들과, 상기 추출된 사운드 신호의 신호 특성을 비교할 수 있다. 상기 복수의 신호 특성들 각각은 어느 하나의 사운드 이벤트에 대응할 수 있다.
상기 신호 특성은, 사운드 이벤트의 주파수 특성이나, 시간의 경과에 따른 신호 변화 특성 등과 같이, 해당 사운드 이벤트와 관련된 고유한 특성을 포함할 수 있다.
사운드 이벤트 인식기(236)는 상기 복수의 신호 특성들 각각과, 상기 추출된 사운드 신호의 신호 특성 간의 유사도를 산출할 수 있다. 사운드 이벤트 인식기(236)는 상기 복수의 신호 특성들 중, 산출된 유사도가 기준 유사도 이상이면서 가장 높은 신호 특성을 상기 추출된 사운드 신호의 신호 특성과 매칭되는 것으로 검출할 수 있다.
검출 결과에 기초하여, 사운드 이벤트 인식기(236)는 상기 추출된 사운드 신호에 포함된 사운드 이벤트는 상기 매칭된 신호 특성에 대응하는 사운드 이벤트인 것으로 인식할 수 있다. 사운드 이벤트 인식기(236)는 인식 결과를 프로세서(172)로 제공할 수 있다.
실시 예에 따라, 인식 결과 상기 유사도가 기준 유사도 이상인 신호 특성이 존재하지 않는 경우, 사운드 이벤트 분석 블록(230)은 상기 사운드 이벤트를 인식할 수 없음을 나타내는 정보를 프로세서(172)로 제공할 수도 있다. 프로세서(172)는 출력부(14)나 통신부(11) 등을 통해 사용자에게 상기 인식 결과를 출력하여, 사용자로부터 상기 사운드 신호에 포함된 사운드 이벤트에 대한 정보를 획득할 수 있다. 프로세서(172)는 상기 획득된 정보에 기초하여, 상기 사운드 신호로부터 획득된 신호 특성과 상기 사운드 이벤트에 대한 정보를 메모리(16)에 저장할 수 있다. 이에 따라, 사운드 이벤트 분석기(200)는 추후 유사한 신호 특성을 갖는 사운드 신호가 수신될 경우 해당 사운드 신호에 포함된 사운드 이벤트를 인식할 수도 있다.
이러한 사운드 이벤트 인식기(236)는 사운드 신호로부터 신호 특성을 추출하고, 추출된 신호 특성을 복수의 신호 특성들과 비교하여 유사도를 산출하는 바, 다른 구성들에 비해 부하가 상대적으로 높을 수 있다.
본 발명의 실시 예에 따르면, 사운드 이벤트 인식기(236)는 사운드 이벤트 감지기(232)에 의해 사운드 이벤트가 발생한 것으로 감지된 경우에만 활성화되어 동작할 수 있다. 이에 따라, 사운드 이벤트 인식기(236)가 지속적으로 활성화되어 동작하는 것에 비해 그 부하를 효과적으로 감소시킬 수 있고, 이는 로봇(1)의 전체적인 처리 속도나 성능을 향상시킬 수 있다.
이하, 도 4 내지 도 8을 참조하여 로봇(1)의 사운드 이벤트 감지 및 인식 동작과 관련된 실시 예들을 설명한다.
도 4는 본 발명의 실시 예에 따른 로봇의 사운드 이벤트 감지 및 인식 동작을 개략적으로 설명하기 위한 플로우차트이다.
도 4를 참조하면, 로봇(1)은 로봇(1)의 주변에서 발생한 사운드에 대응하는 사운드 신호를 수신할 수 있다(S100).
로봇(1)에 구비된 마이크로폰(124)은, 로봇(1)의 주변에서 발생하는 사운드를 전기적인 신호(사운드 신호)로 변환할 수 있다. 제어부(17)는 마이크로폰(124)으로부터 상기 변환된 사운드 신호를 수신할 수 있다.
로봇(1)은 수신된 사운드 신호의 SPL을 산출할 수 있다(S110).
사운드 이벤트 분석기(200)의 SPL 산출 블록(210)은, 수신된 사운드 신호로부터 SPL을 산출할 수 있다.
도 3에서 상술한 바와 같이, SPL 산출 블록(210)은 신호 보상기(212)를 통해 사운드 신호를 보상할 수 있다. 보상된 사운드 신호는 A-weighting 필터(214)를 통해 필터링되고, SPL 산출기(216)는 상기 필터링된 사운드 신호의 SPL을 산출할 수 있다.
산출된 SPL은 배경 노이즈 분석기(220) 및 사운드 이벤트 분석 블록(230) 각각으로 제공될 수 있다.
로봇(1)은 산출된 SPL과, 배경 노이즈의 기준 SPL에 기초하여 사운드 이벤트의 발생 여부를 감지할 수 있다(S120).
사운드 이벤트 분석 블록(230)에 포함된 사운드 이벤트 감지기(232)는, SPL 산출 블록(210)에 의해 산출된 사운드 신호의 SPL과, 배경 노이즈 분석기(220)에 의해 설정된 기준 SPL에 기초하여 상기 사운드 신호에 사운드 이벤트가 포함되었는지, 즉 사운드 이벤트가 발생하였는지 여부를 감지할 수 있다.
사운드 이벤트가 발생한 것으로 감지되는 경우(S130의 YES), 로봇(1)은 사운드 신호에 포함된 사운드 이벤트를 인식할 수 있다(S140).
사운드 이벤트 분석 블록(230)에 포함된 사운드 이벤트 인식기(236)는, 사운드 이벤트가 발생한 것으로 감지된 사운드 신호에 어떠한 사운드 이벤트가 포함되어 있는지 여부를 인식할 수 있다.
사운드 이벤트 인식기(236)는 사운드 신호로부터 신호 특성을 추출하고, 추출된 신호 특성을 메모리(16) 등에 저장된 복수의 신호 특성들과 비교하여 유사도를 산출할 수 있다.
사운드 이벤트 인식기(236)는 복수의 신호 특성들 중 산출된 유사도가 기준 유사도 이상이면서 가장 높은 신호 특성을 상기 추출된 사운드 신호의 신호 특성과 매칭되는 것으로 검출할 수 있다. 사운드 이벤트 인식기(236)는 추출된 사운드 신호에 포함된 사운드 이벤트는 상기 매칭된 신호 특성에 대응하는 사운드 이벤트인 것으로 인식할 수 있다.
로봇(1)은 인식된 사운드 이벤트에 대응하는 인터랙션을 제공할 수 있다(S150).
프로세서(172)는 사운드 이벤트 분석기(200)로부터 상기 인식된 사운드 이벤트에 대한 정보를 획득할 수 있다.
한편, 메모리(16)에는 복수의 사운드 이벤트들 각각에 대응하는 인터랙션 데이터가 저장될 수 있다. 상기 인터랙션 데이터는, 출력부(14)를 통해 출력되는 그래픽, 텍스트, 사운드, 보이스 데이터 등을 포함할 수 있다. 또한, 상기 인터랙션 데이터는 통신부(11)를 통해 사용자의 이동 단말기 등으로 전송할 메시지나 알림을 포함하거나, 기타 상기 사운드 이벤트와 관련하여 수행되는 각종 처리 동작과 관련된 정보를 포함할 수도 있다.
프로세서(172)는 상기 인식된 사운드 이벤트에 대응하는 인터랙션 데이터를 출력함으로써, 상기 인터랙션을 제공할 수 있다. 예컨대, 상기 인터랙션은 사운드 이벤트에 기초한 사용자와의 커뮤니케이션, 사운드 이벤트에 대한 단순 리액션 등을 포함할 수 있다.
이하 도 5 내지 도 8을 참조하여 도 4에서 상술한 로봇(1)의 동작을 보다 상세히 설명한다.
도 5는 본 발명의 실시 예에 따른 로봇이, 사운드 신호로부터 배경 노이즈의 기준 SPL을 설정하는 동작을 설명하기 위한 플로우차트이다.
도 5를 참조하면, S500 단계 및 S510 단계는 도 4에서 상술한 S100 단계 및 S110 단계와 실질적으로 동일한 바, 이에 대한 설명은 생략한다.
로봇(1)은 사운드 신호로부터 산출된 SPL에 기초하여, 배경 노이즈의 기준 SPL을 설정할 수 있다(S520).
로봇(1)의 배경 노이즈 분석기(220)에 포함된 배경 노이즈 추정 모듈(222)은, SPL 산출기(216)로부터 기설정된 주기마다 해당 주기 동안의 사운드 신호에 대해 산출된 SPL을 수신할 수 있다.
배경 노이즈 추정 모듈(222)은 수신된 적어도 하나의 연속된 주기 동안의 사운드 신호 각각의 SPL에 기초하여, 배경 노이즈의 기준 SPL을 설정할 수 있다.
도 3에서 상술한 바와 같이, 배경 노이즈 추정 모듈(222)은 상기 적어도 하나의 연속된 주기 동안의 사운드 신호 각각의 SPL로부터, 최대 SPL, 최소 SPL, SPL 변화 정보(기울기 변화 등) 등의 정보를 획득하고, 획득된 정보에 기초하여 기준 SPL을 가변적으로 설정할 수 있다.
로봇(1)은 설정된 기준 SPL에 기초하여, 사운드 이벤트의 발생 여부를 감지하기 위한 임계 SPL을 설정할 수 있다(S530).
임계 설정 모듈(224)은 기준 SPL에 기초하여 가변적으로 임계 SPL을 설정할 수 있다. 메모리(16) 등에는 기준 SPL들 각각에 대응하는 임계 SPL에 대한 매칭 정보가 저장되거나, 기준 SPL을 이용하여 임계 SPL을 설정하기 위한 수학식이나 알고리즘이 저장될 수 있다. 임계 설정 모듈(224)은 메모리(16) 등에 저장된 상기 매칭 정보나, 수학식 또는 알고리즘에 기초하여 상기 임계 SPL을 설정할 수 있다.
즉, 로봇(1)은 배경 노이즈에 해당하는 사운드의 세기에 따라 임계 SPL을 가변적으로 설정함으로써, 다양한 종류의 사운드가 복합적으로 수신될 때에도 사운드 이벤트를 보다 효과적으로 감지 및 인식할 수 있다.
도 6은 배경 노이즈의 기준 SPL에 따라 가변적으로 설정되는 임계 SPL의 일례와, 상기 기준 SPL 및 상기 임계 SPL에 따라 사운드 이벤트의 발생이 감지되는 감지 SPL의 일례를 설명하기 위한 그래프이다.
메모리(16) 등에는 배경 노이즈의 기준 SPL들 각각에 대응하는 임계 SPL을 설정하기 위한 매칭 정보나 수학식 또는 알고리즘이 저장될 수 있다. 상기 매칭 정보, 수학식, 또는 알고리즘에 기초한 그래프가 도 6의 (a)에 도시되어 있다. 예컨대, 기준 SPL이 45 데시벨(dB)인 경우, 임계 설정 모듈(224)은 임계 SPL을 15 데시벨(dB)로 설정할 수 있다. 상기 그래프는 설명의 편의를 위한 일례에 지나지 아니하는 바, 기준 SPL에 대응하는 임계 SPL은 매칭 정보, 수학식, 또는 알고리즘에 따라 달라질 수 있다.
한편, 도 6의 (a)에 도시된 그래프와 같이, 임계 SPL은 기준 SPL이 증가할수록 낮게 설정될 수 있다. 이는 사운드 이벤트의 SPL에 한계가 존재하기 때문일 수 있다.
사운드 이벤트 감지기(232)는 사운드 신호에 대해 산출된 SPL(감지 SPL)과, 상기 기준 SPL 및 임계 SPL에 기초하여 상기 사운드 신호에 사운드 이벤트가 포함되었는지 여부(또는 사운드 이벤트가 발생하였는지 여부)를 감지할 수 있다.
도 6의 (b)에 도시된 그래프를 참조하면, 사운드 이벤트 감지기(232)는 산출된 SPL(감지 SPL)이 기준 SPL보다 임계 SPL 이상 높은 경우, 사운드 이벤트가 발생한 것으로 감지할 수 있다. 예컨대, 기준 SPL이 45 데시벨인 경우, 사운드 이벤트 감지기(232)는 감지 SPL이 60 데시벨 이상일 때 사운드 이벤트가 발생한 것으로 감지할 수 있다.
인간의 경우, 배경 노이즈보다 작은 소리에 대해서는 원활히 감지하지 못할 수 있다. 이에 기초하여, 로봇(1)은 배경 노이즈보다 큰 소리의 사운드 이벤트만을 감지하도록 구현됨으로써, 인간과 보다 유사한 방식으로 사운드 이벤트를 감지할 수 있다.
도 7은 본 발명의 실시 예에 따른 로봇이 사운드 신호로부터 사운드 이벤트의 발생을 감지하는 동작과, 사운드 이벤트가 감지된 경우 상기 사운드 이벤트를 인식하는 동작을 설명하기 위한 플로우차트이다.
도 7을 참조하면, 로봇(1)은 사운드 신호에 대해 산출된 SPL과 배경 노이즈의 기준 SPL을 비교할 수 있다(S700).
비교 결과, 산출된 SPL이 기준 SPL보다 임계 SPL 이상 높은 경우(S710의 YES), 로봇(1)은 상기 사운드 신호로부터 사운드 이벤트가 발생하였음을 감지할 수 있다(S720).
로봇(1)은 상기 사운드 신호 중 사운드 이벤트가 감지되는 구간을 추출할 수 있다(S730).
사운드 이벤트 감지기(232)는 사운드 이벤트가 발생한 것으로 감지된 구간(동작 주기)의 시작 지점과 종료 지점에 대한 정보를 사운드 슬라이싱 모듈(234)로 제공할 수 있다.
상기 시작 지점은 사운드 이벤트의 발생이 연속적으로 감지된 동작 주기들 중, 사운드 이벤트의 발생을 최초로 감지한 동작 주기를 의미할 수 있고, 종료 지점은 사운드 이벤트의 발생을 마지막으로 감지한 동작 주기를 의미할 수 있다.
사운드 슬라이싱 모듈(234)은 사운드 이벤트 감지기(232)의 감지 결과에 기초하여, 상기 시작 지점과 종료 지점 사이의 사운드 신호를 추출할 수 있다.
로봇(1)은 추출된 구간의 신호 특성을, 기 저장된 복수의 사운드 이벤트들에 대응하는 복수의 신호 특성들 각각과 비교할 수 있다(S740). 로봇(1)은 복수의 신호 특성들 중 상기 추출된 구간의 신호 특성과 매칭되는 신호 특성이 존재하는 경우, 상기 매칭된 신호 특성에 대응하는 사운드 이벤트가 발생한 것으로 인식할 수 있다(S750).
사운드 이벤트 인식기(236)는 추출된 사운드 신호의 신호 특성을 추출할 수 있다. 상기 신호 특성은 사운드 이벤트의 주파수 특성이나, 시간 경과에 따른 신호의 변화 특성 등을 포함할 수 있다.
사운드 이벤트 인식기(236)는 메모리(16) 등에 저장된 복수의 신호 특성들과 상기 추출된 신호 특성을 비교하여 유사도를 각각 산출할 수 있다.
사운드 이벤트 인식기(236)는 상기 복수의 신호 특성들 중, 산출된 유사도가 기준 유사도 이상이면서 가장 높은 신호 특성을 상기 추출된 사운드 신호의 신호 특성과 매칭되는 것으로 검출할 수 있다.
검출 결과에 기초하여, 사운드 이벤트 인식기(236)는 상기 추출된 사운드 신호에 포함된 사운드 이벤트는 상기 매칭된 신호 특성에 대응하는 사운드 이벤트인 것으로 인식할 수 있다.
로봇(1)은 인식된 사운드 이벤트에 대응하는 인터랙션을 제공하도록 출력부(14) 등을 제어할 수 있다(S760).
S760 단계는 도 4의 S150 단계와 실질적으로 동일한 바, 이에 대한 설명은 생략한다.
도 8은 도 4 내지 도 7의 실시 예와 관련된 예시도이다.
도 8을 참조하면, 로봇(1)은 가정 내에 배치되는 홈 로봇으로 구현될 수 있다.
로봇(1)은 가정 내에서 발생하는 각종 사운드를 마이크로폰(124)을 통해 획득할 수 있다.
예컨대, 사용자(801)는 현관(802)을 열고 가정 내로 진입한 후 현관(802)을 닫음으로써, 가정으로 복귀할 수 있다. 이 때, 현관(802)의 여닫음에 해당하는 사운드 이벤트(803)가 발생할 수 있다.
로봇(1)은 마이크로폰(124)을 통해 상기 사운드 이벤트(803)를 포함하는 사운드 신호를 획득할 수 있다.
로봇(1)의 사운드 이벤트 분석기(200)는 획득된 사운드 신호의 SPL을 산출하고, 산출된 SPL을 배경 노이즈의 기준 SPL과 비교할 수 있다.
한편, 상기 사운드 이벤트(803)가 발생하기 전에는, 가정 내에 사용자(801)가 부재중이었으므로, 가정 내에서는 상기 사운드 이벤트(803)보다 작은 사운드만 발생하였을 수 있다. 이에 따라, 상기 기준 SPL은 산출된 SPL보다 임계 SPL 이상 낮을 수 있다.
즉, 사운드 이벤트 분석기(200)는 산출된 SPL이 상기 기준 SPL보다 임계 SPL 이상 높음을 검출하고, 검출 결과에 따라 사운드 이벤트(803)가 발생하였음을 감지할 수 있다. 사운드 이벤트(803)가 감지됨에 따라, 사운드 이벤트 분석기(200)는 사운드 이벤트 인식기(236)를 통해 사운드 이벤트(803)를 인식할 수 있다.
사운드 이벤트 인식기(236)는, 상기 사운드 이벤트(803)가 “현관의 여닫음”인 것으로 인식할 수 있다. 이에 따라, 로봇(1)은 “현관의 여닫음”에 대응하는 인터랙션 데이터를 이용하여 사용자(801)와의 인터랙션을 수행할 수 있다. 예컨대, 상기 인터랙션 데이터는 “안녕하세요. 어서오세요”에 해당하는 보이스 데이터를 포함할 수 있다. 이 경우, 프로세서(172)는 사운드 출력부(144)를 통해 상기 보이스 데이터를 출력함으로써, 사용자와의 인터랙션을 수행할 수 있다.
즉, 도 4 내지 도 8에 도시된 실시 예에 따르면, 로봇(1)은 주변에서 발생하는 사운드를 획득하여 특정 이벤트의 발생을 자동으로 인식하고, 인식된 이벤트에 따라 지능적으로 인터랙션을 수행할 수 있다.
또한, 로봇(1)은 마이크로폰(124)을 통해 획득된 사운드 신호를 인간의 청각 특성에 기초하여 필터링하거나, 배경 노이즈보다 큰 소리를 갖는 사운드 이벤트를 감지함으로써, 상기 사운드 이벤트에 대해 인간과 유사하게 반응 및 행동할 수 있다.
이하 도 9 내지 도 16을 통해, 로봇(1)이 사운드의 발생 방향을 감지하는 동작과 관련된 실시 예들에 대해 설명한다.
도 9는 본 발명의 일 실시 예에 따른 로봇의 제어부를 나타내는 블록도이다.
도 1 내지 도 2에서 상술한 바와 같이, 로봇(1)은 복수의 마이크로폰들을 포함할 수 있고, 상기 복수의 마이크로폰들 각각으로부터 수신되는 사운드 신호에 기초하여 사운드의 발생 방향을 감지할 수 있다.
이와 관련하여 도 9를 참조하면, 로봇(1)은 복수의 마이크로폰들(124a, 124b, 124c, 124d) 각각의 사운드 신호를 수신하여, 사운드(또는 사운드 이벤트)의 발생 방향을 감지하는 사운드 이벤트 방향 감지기(900)를 포함할 수 있다.
한편, 도 9에서는 로봇(1)이 네 개의 마이크로폰들(124a~124d)을 포함하는 것으로 도시하였으나, 로봇(1)은 복수(바람직하게는 적어도 세 개)의 마이크로폰들을 포함할 수 있다. 상기 복수의 마이크로폰들(124a~124d)은 가로 방향으로 서로 이격되어 배치될 수 있다. 예컨대, 도 11 등에 도시된 바와 같이, 제1 마이크로폰(124a)은 로봇(1)의 전방 좌측에 배치되고, 제2 마이크로폰(124b)은 로봇(1)의 전방 우측에 배치될 수 있다. 또한, 제3 마이크로폰(124c)은 로봇(1)의 후방 우측에 배치되고, 제4 마이크로폰(124d)은 로봇(1)의 후방 좌측에 배치될 수 있다. 즉, 복수의 마이크로폰들(124a~124d)이 서로 이격되어 배치됨에 따라, 각각의 마이크로폰(124a~124d)이 획득하는 사운드 신호의 SPL이 상이하거나, 사운드 신호의 획득 시점이 상이할 수 있다.
사운드 이벤트 방향 감지기(900)는 복수의 마이크로폰들(124a~124d)로부터 수신된 사운드 신호들 각각의 SPL 간의 차이, 또는 상기 사운드 신호들 각각의 획득 시점의 차이에 기초하여, 사운드 신호에 대응하는 사운드(또는 사운드 이벤트)의 발생 방향을 감지할 수 있다.
한편, 로봇(1)은 카메라(132)를 통해 획득된 이미지에 기초하여 로봇(1) 주변의 사용자를 인식하는 사용자 인식기(1000)를 더 포함할 수 있다.
사용자 인식기(1000)는 기 공지된 각종 얼굴 인식 알고리즘을 이용하여, 로봇(1) 주변의 사용자를 인식할 수 있다. 이 때, 사용자 인식기(1000)에 의해 인식되는 사용자는 로봇(1)에 기 등록된 사용자뿐만 아니라 다른 사람들까지 포함할 수 있다.
도 10은 본 발명의 일 실시 예에 따른 로봇의 사운드 발생 방향 감지 동작 및 그와 관련된 제어 동작을 설명하기 위한 플로우차트이다.
도 10 내지 도 16의 실시 예는, 도 4 내지 도 8의 실시 예와 병렬적으로 수행될 수 있다. 다만, 실시 예에 따라, 도 10 내지 도 16의 실시 예는 도 4 내지 도 8의 실시 예에 따라 사운드 이벤트가 인식된 경우에만 수행될 수도 있다.
도 10을 참조하면, 로봇(1)은 복수의 마이크로폰들(124a~124d) 각각으로부터 사운드 신호를 수신하고(S1000), 수신된 사운드 신호들에 기초하여, 사운드의 발생 방향을 감지할 수 있다(S1010).
일례로, 로봇(1)에 포함된 사운드 이벤트 방향 감지기(900)는 복수의 마이크로폰들(124a~124d)로부터 수신되는 사운드 신호들 각각의 SPL을 산출할 수 있다. 이 경우, 사운드 이벤트 방향 감지기(900)는 도 3에서 상술한 SPL 산출 블록(210)을 이용하여 상기 사운드 신호들 각각의 SPL을 산출할 수 있다. 또는, 사운드 이벤트 방향 감지기(900)는 상기 SPL 산출 블록(210)과 동일 또는 유사한 구성을 직접 포함할 수도 있다.
사운드 이벤트 방향 감지기(900)는 산출된 SPL들 각각에 기초하여 상기 사운드의 발생 방향을 감지할 수 있다. 예컨대, 사운드 이벤트 방향 감지기(900)는 복수의 마이크로폰들(124a~124d) 각각에 대응하는 사운드 신호의 SPL로부터, 상기 복수의 마이크로폰들(124a~124d) 각각과 사운드 발생 위치 사이의 거리를 추정할 수 있다. 사운드 이벤트 방향 감지기(900)는 복수의 마이크로폰들(124a~124d) 각각의 위치와, 상기 추정된 거리에 기초한 삼각 측량법 등의 기법을 이용하여 상기 사운드의 발생 방향을 감지할 수 있다.
또는, 사운드 이벤트 방향 감지기(900)는 복수의 마이크로폰들 (124a~124d)로부터 수신되는 사운드 신호들 각각의 획득 시점 간의 차이를 이용하여, 사운드의 발생 방향을 감지할 수도 있다.
실시 예에 따라, 상기 S1010 단계는 도 3 내지 도 8에서 상술한 사운드 이벤트 분석기(200)에 의해, 사운드 신호에 사운드 이벤트가 포함된 것으로 감지되고, 감지된 사운드 이벤트가 인식된 경우에만 수행될 수도 있다.
로봇(1)은 디스플레이부(142)가 상기 감지된 방향을 향하도록 회전 기구(15)를 제어할 수 있다(S1020).
한편, 마이크로폰들(124a~124d)로 수신되는 사운드 신호의 SPL은 일정하지 않으므로, 로봇(1)은 S1010 단계의 수행에 따라 사운드의 발생 방향만을 감지할 수 있을 뿐, 사운드의 정확한 발생 위치는 감지하지 못할 수 있다.
이에 따라, 프로세서(172)는 감지된 방향으로 로봇(1)의 정면, 즉 디스플레이부(142)가 향하도록 회전 기구(15)를 제어할 수 있다.
로봇(1)은 카메라(132)를 통해 이미지를 획득하고(S1030), 획득된 이미지로부터 사용자의 존재 여부를 인식할 수 있다(S1040).
로봇(1)의 정면이 상기 감지된 방향을 향하는 경우, 로봇(1)에 장착된 카메라(132) 또한 상기 감지된 방향을 향할 수 있다. 즉, 카메라(132)는 디스플레이부(142)와 동일한 방향을 향하도록 배치될 수 있다.
프로세서(172)는 회전 기구(15)의 제어에 따라 정면이 상기 감지된 방향을 향하면, 카메라(132)를 통해 상기 감지된 방향에 대한 이미지를 획득할 수 있다.
로봇(1)에 포함된 사용자 인식기(1000)는, 기 공지된 각종 얼굴 인식 알고리즘을 이용하여, 상기 획득된 이미지로부터 사용자(사람)가 포함되어 있는지 여부를 인식할 수 있다.
인식 결과 사용자가 존재하는 경우(S1050의 YES), 로봇(1)은 상기 사운드에 기초하여 사용자와의 인터랙션을 수행할 수 있다(S1060).
반면 인식 결과 사용자가 존재하지 않는 경우(S1050의 NO), 로봇(1)은 상기 사운드에 대응하는 동작을 수행할 수 있다(S1070).
예컨대, 메모리(16)에는 사운드(또는 사운드 이벤트)에 대응하는 인터랙션 데이터가 저장되어 있을 수 있다. 또한, 상기 인터랙션 데이터는, 사용자가 존재하는 경우에 대한 인터랙션 데이터와, 사용자가 존재하지 않는 경우에 대한 인터랙션 데이터가 구분되어 존재할 수도 있다.
상술한 바와 같이, 상기 인터랙션 데이터는, 출력부(14)를 통해 출력되는 그래픽, 텍스트, 사운드, 보이스 데이터 등을 포함할 수 있다. 또한, 상기 인터랙션 데이터는 통신부(11)를 통해 사용자의 이동 단말기 등으로 전송할 메시지나 알림을 포함하거나, 기타 상기 사운드 이벤트와 관련하여 수행되는 각종 처리 동작과 관련된 정보를 포함할 수도 있다.
이에 따라, 프로세서(172)는 사용자 인식기(1000)의 인식 결과에 따라 사용자가 인식된 경우, 인터랙션 데이터에 기초하여 사용자와의 커뮤니케이션을 수행할 수 있다. 반면, 사용자가 인식되지 않은 경우, 프로세서(172)는 상기 사운드 이벤트에 대한 단순 리액션(음향 출력 등)을 처리하거나, 사운드 이벤트와 관련된 메시지나 알림을 사용자의 단말기 등으로 전송할 수 있다.
이와 관련된 실시 예들에 대해 이하 도 11 내지 도 16을 통해 설명한다.
도 11 내지 도 12는 도 10의 실시 예와 관련된 예시도들이다.
도 11과 도 12를 참조하면, 사용자(1100)는 로봇(1)의 호출을 위한 음성(1110)을 발화할 수 있다.
로봇(1)에 구비된 복수의 마이크로폰들(125a~125d) 각각은, 사용자(1100)의 음성(1110)을 포함하는 사운드를 수신하고, 수신된 사운드에 대응하는 사운드 신호(S1~S4)를 획득할 수 있다.
로봇(1)의 사운드 이벤트 방향 감지기(900)는 상기 사운드 신호들(S1~S4)에 기초하여, 음성(1110)의 발생 방향을 감지할 수 있다.
도 11에 도시된 바와 같이 로봇(1)의 후방에서 음성(1110)이 발화된 경우, 제1 사운드 신호(S1)와 제2 사운드 신호(S2)의 SPL은, 제3 사운드 신호 및 제4 사운드 신호(S4)의 SPL보다 낮을 수 있다. 또한, 제1 사운드 신호(S1)와 제2 사운드 신호(S2)의 획득 시점은, 제3 사운드 신호(S3) 및 제4 사운드 신호(S4)의 획득 시점보다 늦을 수 있다.
사운드 이벤트 방향 감지기(900)는 상술한 사운드 신호들(S1~S4) 간의 SPL 또는 획득 시점에 기초하여 음성(1110)의 발생 방향이 로봇(1)의 후방임을 감지할 수 있다.
도 12에 도시된 바와 같이, 프로세서(172)는 상기 감지된 방향에 기초하여, 로봇(1)의 정면이 상기 감지된 방향을 향하도록 회전 기구(15)를 제어할 수 있다. 제어 결과에 따라, 로봇(1)의 디스플레이부(142)는 상기 감지된 방향을 향할 수 있다.
프로세서(172)는 회전 기구(15)의 제어에 따라 정면이 상기 감지된 방향을 향하면, 카메라(132)를 통해 상기 감지된 방향에 대한 이미지를 획득할 수 있다.
로봇(1)에 포함된 사용자 인식기(1000)는, 기 공지된 각종 얼굴 인식 알고리즘을 이용하여, 상기 획득된 이미지로부터 사용자(1100)가 포함되어 있음을 인식할 수 있다.
프로세서(172)는 인식 결과에 기초하여, 사용자와의 인터랙션(커뮤니케이션) 을 위한 메시지(1120)를 디스플레이부(142) 또는 사운드 출력부(144)를 통해 출력할 수 있다.
도 13 내지 도 15는 사운드의 발생이 감지된 방향에 복수의 사용자들이 존재하는 경우, 로봇이 상기 사운드와 관련된 사용자를 인식하는 동작의 일례를 보여주는 도면들이다.
실시 예에 따라, 사운드의 발생이 감지된 방향에 복수의 사용자들이 존재할 수 있다. 일반적으로, 로봇(1)과의 인터랙션(커뮤니케이션)을 수행하고자 하는 사용자는, 다른 사용자에 비해 로봇(1)과 근접할 가능성이 높다.
따라서, 로봇(1)은 사운드의 발생이 감지된 방향에 복수의 사용자들이 존재하는 경우, 로봇(1)과 근접한 사용자를 상기 사운드를 발생시킨 사용자로 인식하고, 해당 사용자와 인터랙션을 수행할 수 있다.
구체적으로 도 13 내지 도 14를 참조하면, 로봇(1)은 음성(1320)이 발생한 방향으로 정면이 향하도록 회전될 수 있다.
로봇(1)은 카메라(132)를 통해 상기 음성(1320)이 발생한 방향에 대한 이미지(IMAGE)를 획득하고, 사용자 인식기(1000)를 통해 이미지(IMAGE)로부터 사용자를 인식할 수 있다.
인식 결과 복수의 사용자들(1300, 1310)이 인식된 경우, 프로세서(172) 또는 사용자 인식기(1000)는 복수의 사용자들(1300, 1310) 중 로봇(1)과 보다 근접한 사용자(1310)를 상기 음성(1320)을 발화한 사용자로 인식할 수 있다.
예컨대, 프로세서(172) 또는 사용자 인식기(1000)는 인식된 사용자들(1300, 1310) 중 인식된 얼굴 영역의 크기(1400, 1410)가 큰 제2 사용자(1310)를 상기 로봇(1)과 근접한 사용자로 인식할 수 있다.
이에 따라, 로봇(1)은 도 15에 도시된 바와 같이 제2 사용자(1310)를 향하도록 회전 기구(15)를 제어한 후, 제2 사용자(1310)와의 인터랙션을 수행하기 위한 메시지(1330)를 출력할 수 있다. 제2 사용자(1310)는 로봇(1)이 자신을 향하도록 회전됨을 확인함으로써, 로봇(1)이 음성(1320)을 발화한 제2 사용자(1310)를 올바로 인식하였음을 인지할 수 있다.
도 16은 사운드의 발생이 감지된 방향에 사용자가 존재하지 않는 경우 로봇이 수행하는 동작의 일례를 보여주는 도면이다.
도 16을 참조하면, 로봇(1)은 아기 울음소리(1600)에 대응하는 사운드 신호들을 수신하고, 수신된 사운드 신호들에 기초하여 아기가 위치한 방향으로 로봇(1)의 정면이 향하도록 회전 기구(15)를 제어할 수 있다.
프로세서(172)는 카메라(132)를 통해 상기 아기가 위치한 방향에 대한 이미지를 획득할 수 있다. 사용자 인식기(1000)는 획득된 이미지로부터 기 등록된 사용자(예컨대, 부모)가 존재하는지 여부를 인식할 수 있다.
인식 결과, 사용자가 존재하지 않는 경우, 프로세서(172)는 아기 울음소리(1600)에 대응하는 인터랙션 데이터 중, 사용자가 존재하지 않는 경우의 인터랙션 데이터에 기초하여, 상기 아기 울음소리(1600)에 대응하는 동작을 수행할 수 있다.
예컨대 상기 인터랙션 데이터는 아기의 울음을 멈추도록 유도하기 위한 음향(1610)과, 사용자(부모)의 단말기(1700)로 전송할 알림(또는 이벤트 정보(EVENT_INFO))를 포함할 수 있다.
상기 인터랙션 데이터에 기초하여, 프로세서(172)는 사운드 출력부(144)를 통해 음향(1610)을 출력하고, 이벤트 정보(EVENT_INFO)를 통신부(11)를 통해 사용자의 단말기(1700)로 전송할 수 있다. 전송된 이벤트 정보(EVENT_INFO)는 단말기(1700)의 화면상에 알림(1710) 형태로 출력됨으로써, 사용자로 하여금 아기가 울고 있음을 인지시킬 수 있다.
즉, 도 9 내지 도 16에 도시된 실시 예에 따르면, 로봇(1)은 복수의 마이크로폰들을 이용하여 사운드 이벤트의 발생 방향을 효과적으로 감지할 수 있다.
또한, 로봇(1)은 카메라(132) 등을 이용하여 감지된 방향의 이미지를 획득하고, 이미지로부터 사용자의 존재 여부를 인식함으로써, 사용자의 존재 여부에 따라 사운드 이벤트에 대해 보다 지능적으로 반응할 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.
본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 사운드에 대응하는 사운드 신호를 획득하는 마이크로폰;
    변환된 사운드 신호의 음압 레벨(sound pressure level (SPL))을 산출하는 SPL 산출기;
    이전 변환된 사운드 신호의 SPL에 기초하여 배경 노이즈의 기준 SPL을 설정하는 배경 노이즈 분석기;
    상기 사운드 신호의 SPL과 상기 기준 SPL에 기초하여 사운드 이벤트의 발생 여부를 감지하는 사운드 이벤트 감지기; 및
    상기 사운드 이벤트의 발생이 감지된 경우, 상기 사운드 신호에 기초하여 상기 사운드 이벤트를 인식하는 사운드 이벤트 인식기를 포함하는 로봇.
  2. 제1항에 있어서,
    상기 배경 노이즈 분석기는,
    상기 설정된 기준 SPL에 기초한 임계 SPL을 설정하고,
    상기 사운드 이벤트 감지기는,
    상기 사운드 신호의 SPL이 상기 기준 SPL보다 상기 임계 SPL 이상 높은 경우, 상기 사운드 신호에 상기 사운드 이벤트가 포함된 것으로 감지하는 로봇.
  3. 제2항에 있어서,
    상기 임계 SPL은,
    상기 기준 SPL이 높을수록 낮게 설정되는 로봇.
  4. 제1항에 있어서,
    상기 SPL 산출기는,
    기설정된 동작 주기마다, 상기 동작 주기 동안의 사운드 신호로부터 SPL을 산출하고,
    상기 배경 노이즈 분석기는,
    적어도 하나의 연속된 동작 주기의 사운드 신호 각각의 SPL에 기초하여 상기 배경 노이즈의 상기 기준 SPL을 설정하는 로봇.
  5. 제4항에 있어서,
    상기 배경 노이즈 분석기는,
    상기 적어도 하나의 연속된 동작 주기의 사운드 신호 각각의 SPL로부터 최대 SPL, 최소 SPL, 및 SPL 변화 정보를 획득하고,
    획득된 최대 SPL, 최소 SPL, 및 SPL 변화 정보에 따라 상기 기준 SPL을 가변적으로 설정하는 로봇.
  6. 제1항에 있어서,
    상기 사운드 이벤트 감지기는,
    상기 사운드 이벤트의 발생이 감지된 구간에 대한 정보를 제공하고,
    상기 제공된 정보에 기초하여 상기 사운드 신호 중 상기 구간에 대응하는 사운드 신호를 추출하는 사운드 슬라이싱 모듈을 더 포함하는 로봇.
  7. 제1항에 있어서,
    복수의 사운드 이벤트들에 대응하는 복수의 신호 특성을 저장하는 메모리를 더 포함하고,
    상기 사운드 이벤트 인식기는,
    상기 사운드 신호의 신호 특성을 추출하고,
    추출된 신호 특성을 상기 복수의 신호 특성들 각각과 비교하고,
    상기 복수의 신호 특성들 중 상기 추출된 신호 특성과 매칭되는 신호 특성에 대응하는 사운드 이벤트를 인식 결과로서 출력하는 로봇.
  8. 제7항에 있어서,
    상기 신호 특성은 주파수 특성 및 시간 경과에 따른 신호 변화 특성 중 적어도 하나를 포함하는 로봇.
  9. 제7항에 있어서,
    상기 사운드 이벤트 인식기는,
    상기 복수의 신호 특성들 각각과 상기 추출된 신호 특성의 유사도를 산출하고,
    복수의 신호 특성들 중, 산출된 유사도가 기준 유사도 이상이고 가장 높은 신호 특성을 상기 추출된 신호 특성과 매칭되는 신호 특성으로 검출하는 로봇.
  10. 제1항에 있어서,
    디스플레이부;
    사운드 출력부; 및
    상기 디스플레이부와 상기 사운드 출력부를 제어하는 제어부를 더 포함하고,
    상기 제어부는,
    상기 사운드 이벤트 인식기에 의해 인식된 사운드 이벤트에 기초하여 상기 디스플레이부와 상기 사운드 출력부 중 적어도 하나를 제어하는 로봇.
  11. 제10항에 있어서,
    복수의 사운드 이벤트들 각각에 대응하는 인터랙션 데이터를 저장하는 메모리를 더 포함하고,
    상기 제어부는,
    복수의 인터랙션 데이터 중 상기 인식된 사운드 이벤트에 대응하는 인터랙션 데이터에 기초하여 상기 디스플레이부와 상기 사운드 출력부 중 적어도 하나를 제어하는 로봇.
  12. 제1항에 있어서,
    상기 사운드 신호를 필터링하는 A-weighting 필터를 더 포함하고,
    상기 SPL 산출기는,
    상기 A-weighting 필터에 의해 필터링된 사운드 신호의 SPL을 측정하는 로봇.
  13. 서로 이격되어 배치되는 복수의 마이크로폰들;
    일 방향을 향하도록 배치되는 디스플레이부와 카메라;
    상기 복수의 마이크로폰들로부터 복수의 사운드 신호들을 획득하고,
    상기 복수의 사운드 신호들에 기초하여 사운드의 발생 방향을 감지하는 사운드 이벤트 방향 감지기; 및
    상기 감지된 발생 방향으로 상기 디스플레이부 및 상기 카메라가 향하도록 상기 로봇을 회전시키는 회전 기구를 제어하는 제어부를 포함하는 로봇.
  14. 제13항에 있어서,
    상기 사운드 이벤트 방향 감지기는,
    상기 복수의 사운드 신호들 각각의 음압 레벨(sound pressure level (SPL))을 획득하고,
    획득된 복수의 SPL로부터 상기 복수의 마이크로폰들 각각과 상기 사운드의 발생 위치 사이의 거리를 추정하고,
    상기 복수의 마이크로폰들 각각의 위치와 상기 추정된 거리에 기초하여 상기 사운드의 발생 방향을 감지하는 로봇.
  15. 제13항에 있어서,
    상기 사운드 이벤트 방향 감지기는,
    상기 복수의 사운드 신호들 각각의 획득 시점 간의 차이에 기초하여 상기 사운드의 발생 방향을 감지하는 로봇.
  16. 제13항에 있어서,
    상기 제어부는,
    상기 디스플레이부 및 상기 카메라가 상기 감지된 발생 방향을 향하도록 회전된 후, 상기 카메라를 제어하여 상기 발생 방향을 포함하는 이미지를 획득하고,
    상기 이미지로부터 사용자의 존재 여부를 감지하는 로봇.
  17. 제16항에 있어서,
    상기 제어부는,
    상기 이미지로부터 상기 사용자가 존재하는 것으로 감지된 경우, 상기 사용자와의 인터랙션을 위한 인터랙션 데이터에 기초하여 상기 디스플레이부 및 사운드 출력부를 제어하는 로봇.
  18. 제16항에 있어서,
    상기 제어부는,
    상기 이미지로부터 복수의 사용자들이 존재하는 것으로 감지된 경우, 감지된 사용자들 중 얼굴 영역의 크기가 가장 큰 사용자를, 상기 사운드와 관련된 사용자로 인식하는 로봇.
  19. 제16항에 있어서,
    사용자의 단말기와 연결하기 위한 통신부를 더 포함하고,
    상기 제어부는,
    상기 이미지로부터 상기 사용자가 존재하지 않는 것으로 감지된 경우, 상기 사운드와 관련된 메시지 또는 알림을 상기 통신부를 통해 상기 사용자의 단말기로 전송하는 로봇.
  20. 제13항에 있어서,
    상기 회전 기구는,
    수직 축을 기준으로 상기 로봇을 회전시키도록 구비된 모터를 포함하는 로봇.
PCT/KR2019/000226 2019-01-07 2019-01-07 로봇 WO2020145417A1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/KR2019/000226 WO2020145417A1 (ko) 2019-01-07 2019-01-07 로봇
US16/526,283 US11654575B2 (en) 2019-01-07 2019-07-30 Robot
KR1020190145272A KR102259428B1 (ko) 2019-01-07 2019-11-13 로봇

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2019/000226 WO2020145417A1 (ko) 2019-01-07 2019-01-07 로봇

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/526,283 Continuation US11654575B2 (en) 2019-01-07 2019-07-30 Robot

Publications (1)

Publication Number Publication Date
WO2020145417A1 true WO2020145417A1 (ko) 2020-07-16

Family

ID=71403649

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/000226 WO2020145417A1 (ko) 2019-01-07 2019-01-07 로봇

Country Status (3)

Country Link
US (1) US11654575B2 (ko)
KR (1) KR102259428B1 (ko)
WO (1) WO2020145417A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11386888B2 (en) * 2020-07-17 2022-07-12 Blue Ocean Robotics Aps Method of adjusting volume of audio output by a mobile robot device
CN114260919B (zh) * 2022-01-18 2023-08-29 华中科技大学同济医学院附属协和医院 一种智能机器人

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009222969A (ja) * 2008-03-17 2009-10-01 Toyota Motor Corp 音声認識ロボットおよび音声認識ロボットの制御方法
KR20100081587A (ko) * 2009-01-06 2010-07-15 삼성전자주식회사 로봇의 소리 인식 장치 및 그 제어 방법
KR20100117793A (ko) * 2009-04-27 2010-11-04 주식회사 싸이언 음원 분석 장치
KR20120114670A (ko) * 2011-04-07 2012-10-17 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법
KR20130103204A (ko) * 2012-03-09 2013-09-23 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820565B (zh) * 2009-02-27 2015-01-07 本田技研工业株式会社 音源位置的推断方法及其装置
JP6686583B2 (ja) 2016-03-17 2020-04-22 カシオ計算機株式会社 ロボット及びプログラム
JP2019104087A (ja) * 2017-12-13 2019-06-27 カシオ計算機株式会社 デバイス制御装置、デバイス制御方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009222969A (ja) * 2008-03-17 2009-10-01 Toyota Motor Corp 音声認識ロボットおよび音声認識ロボットの制御方法
KR20100081587A (ko) * 2009-01-06 2010-07-15 삼성전자주식회사 로봇의 소리 인식 장치 및 그 제어 방법
KR20100117793A (ko) * 2009-04-27 2010-11-04 주식회사 싸이언 음원 분석 장치
KR20120114670A (ko) * 2011-04-07 2012-10-17 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법
KR20130103204A (ko) * 2012-03-09 2013-09-23 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법

Also Published As

Publication number Publication date
KR20200085640A (ko) 2020-07-15
US11654575B2 (en) 2023-05-23
US20200215699A1 (en) 2020-07-09
KR102259428B1 (ko) 2021-06-02

Similar Documents

Publication Publication Date Title
WO2020204611A1 (en) Method for detecting wearing of acoustic device and acoustic device supporting the same
WO2019182325A1 (ko) 전자 장치 및 전자 장치의 음성 인식 제어 방법
WO2021100932A1 (ko) 디스플레이의 크기를 제어하는 전자 장치 및 그 제어 방법
WO2020045950A1 (en) Method, device, and system of selectively using multiple voice data receiving devices for intelligent service
WO2017188648A1 (ko) 이어셋 및 그 제어 방법
WO2020091505A1 (en) Electronic device and method for intelligent interaction thereof
WO2014157757A1 (ko) 이동식 입력 장치 및 그를 이용한 명령 입력 방법
WO2021085658A1 (ko) 크기가 변경되는 디스플레이를 포함하는 전자 장치 및 그 제어 방법
WO2022055068A1 (ko) 음성에 포함된 커맨드를 확인하는 전자 장치와 이의 동작 방법
WO2022080612A1 (ko) 휴대용 음향기기
WO2015194693A1 (ko) 영상 표시 기기 및 그의 동작 방법
WO2021251549A1 (en) Display device
WO2019221440A1 (ko) 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법
WO2020145417A1 (ko) 로봇
WO2020141634A1 (ko) 환경 변화 및 소음 변화에 따른 적응형 입체 히어링 시스템 및 그 방법
WO2021210795A1 (ko) 전자 장치들의 무선 연결 방법 및 장치
WO2020032363A1 (ko) 외부 전자 장치와의 거리에 기반하여 스피커의 출력 세기를 조정하기 위한 방법 및 전자 장치
WO2020251073A1 (ko) 안마 기구
EP3830821A1 (en) Method, device, and system of selectively using multiple voice data receiving devices for intelligent service
WO2022124493A1 (ko) 전자 장치 및 전자 장치에서 기억 서비스를 제공하는 방법
WO2022010187A1 (ko) 전자 장치 및 전자 장치의 인증 동작 수행 방법
WO2021194096A1 (ko) 하우징 디바이스
WO2022169039A1 (ko) 전자 장치 및 그 제어 방법
WO2022131533A1 (ko) 주변 소리 제어 방법 및 이를 위한 전자 장치
WO2021201429A1 (ko) 전자 장치 및 그의 오디오 출력을 제어하는 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19909341

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19909341

Country of ref document: EP

Kind code of ref document: A1