JP2020109463A - 視覚ベースのメカニズムに基づくスマート表示装置の音声コマンドによる起動方法及びシステム - Google Patents
視覚ベースのメカニズムに基づくスマート表示装置の音声コマンドによる起動方法及びシステム Download PDFInfo
- Publication number
- JP2020109463A JP2020109463A JP2019124380A JP2019124380A JP2020109463A JP 2020109463 A JP2020109463 A JP 2020109463A JP 2019124380 A JP2019124380 A JP 2019124380A JP 2019124380 A JP2019124380 A JP 2019124380A JP 2020109463 A JP2020109463 A JP 2020109463A
- Authority
- JP
- Japan
- Prior art keywords
- display device
- smart display
- image
- face
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 63
- 230000007246 mechanism Effects 0.000 title description 7
- 230000004913 activation Effects 0.000 title description 5
- 238000010801 machine learning Methods 0.000 claims description 13
- 230000003213 activating effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 39
- 238000012545 processing Methods 0.000 description 84
- 230000008569 process Effects 0.000 description 32
- 238000004364 calculation method Methods 0.000 description 20
- 230000003287 optical effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 229910044991 metal oxide Inorganic materials 0.000 description 2
- 150000004706 metal oxides Chemical class 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000010897 surface acoustic wave method Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (20)
- 特徴に基づいてスマート表示装置を制御するためのコンピュータ実施方法であって、
前記スマート表示装置に関連付けられた光捕捉装置から画像を受信するステップと、
前記画像内にある顔に基づいて、前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップと、
前記画像内にある前記顔に基づいて前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動すると判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスの前記音声認識を起動するステップと、を含むコンピュータ実施方法。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像を機械学習モデルにより解析するステップを含む請求項1に記載の方法。 - 前記スマート表示装置に関連付けられた前記光捕捉装置から第2の画像を受信するステップと、
前記顔が前記第2の画像内にあるか否かを判定するステップと、
前記顔が前記第2の画像内にないと判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスの前記音声認識を停止するステップと、をさらに含む請求項1に記載の方法。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像内の前記顔から前記スマート表示装置までの距離を確定するステップをさらに含む請求項1に記載の方法。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記スマート表示装置に対する前記画像内の前記顔の視線方向を確定するステップをさらに含む請求項1に記載の方法。 - 前記顔に関連付けられたユーザを識別するステップをさらに含む請求項1に記載の方法。
- 前記顔に関連付けられたユーザを識別するステップは、前記画像内に存在する前記顔と、ローカルモデル内に存在する前記ユーザの顔との比較に基づいて行われる請求項6に記載の方法。
- 命令が格納されている非一時的機械可読媒体であって、
前記命令がプロセッサにより実行されると、前記プロセッサに
スマート表示装置に関連付けられた光捕捉装置から画像を受信するステップと、
前記画像内にある顔に基づいて、前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップと、
前記画像内にある前記顔に基づいて前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動すると判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスを起動するステップと、を含む動作を実行させる非一時的機械可読媒体。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像を機械学習モデルにより解析するステップを含む請求項8に記載の非一時的機械可読媒体。 - 前記スマート表示装置に関連付けられた前記光捕捉装置から第2の画像を受信するステップと、
前記顔が前記第2の画像内にあるか否かを判定するステップと、
前記顔が前記第2の画像内にないと判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスの前記音声認識を停止するステップと、をさらに含む請求項8に記載の非一時的機械可読媒体。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像内の前記顔から前記スマート表示装置までの距離を確定するステップをさらに含む請求項8に記載の非一時的機械可読媒体。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記スマート表示装置に対する前記画像内の前記顔の視線方向を確定するステップをさらに含む請求項8に記載の非一時的機械可読媒体。 - 前記顔に関連付けられたユーザを識別するステップをさらに含む請求項8に記載の非一時的機械可読媒体。
- 前記顔に関連付けられたユーザを識別するステップは、前記画像内に存在する前記顔と、ローカルモデル内に存在する前記ユーザの顔との比較に基づいて行われる請求項13に記載の非一時的機械可読媒体。
- プロセッサと、
命令を格納するために前記プロセッサに接続されるメモリと、を備えるシステムであって、
前記命令が前記プロセッサにより実行されると、前記プロセッサに
スマート表示装置に関連付けられた光捕捉装置から画像を受信するステップと、
前記画像内にある顔に基づいて、前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップと、
前記画像内にある前記顔に基づいて前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動すると判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスの前記音声認識を起動するステップと、を含む動作を実行させるシステム。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像を機械学習モデルにより解析することを含む請求項15に記載のシステム。 - 前記スマート表示装置に関連付けられた前記光捕捉装置から第2の画像を受信するステップと、
前記顔が前記第2の画像内にあるか否かを判定するステップと、
前記顔が前記第2の画像内にないと判定されたことに応答して、前記スマート表示装置に関連付けられた前記記録デバイスの前記音声認識を停止するステップと、をさらに含む請求項15に記載のシステム。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記画像内の前記顔から前記スマート表示装置までの距離を確定することをさらに含む請求項15に記載のシステム。 - 前記スマート表示装置に関連付けられた記録デバイスの音声認識を起動するか否かを判定するステップは、
前記スマート表示装置に対する前記画像内の前記顔の視線方向を確定することをさらに含む請求項15に記載のシステム。 - 前記顔に関連付けられたユーザを識別するステップをさらに含む請求項15に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/235,538 | 2018-12-28 | ||
US16/235,538 US11151993B2 (en) | 2018-12-28 | 2018-12-28 | Activating voice commands of a smart display device based on a vision-based mechanism |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020109463A true JP2020109463A (ja) | 2020-07-16 |
Family
ID=71121830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019124380A Pending JP2020109463A (ja) | 2018-12-28 | 2019-07-03 | 視覚ベースのメカニズムに基づくスマート表示装置の音声コマンドによる起動方法及びシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11151993B2 (ja) |
JP (1) | JP2020109463A (ja) |
KR (1) | KR102323232B1 (ja) |
CN (1) | CN111383635A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219421A (ja) * | 1998-01-30 | 1999-08-10 | Toshiba Corp | 画像認識装置及び画像認識装置方法 |
JP2009222969A (ja) * | 2008-03-17 | 2009-10-01 | Toyota Motor Corp | 音声認識ロボットおよび音声認識ロボットの制御方法 |
JP2015514254A (ja) * | 2012-04-27 | 2015-05-18 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | ユーザからのオーディオ入力 |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7219062B2 (en) * | 2002-01-30 | 2007-05-15 | Koninklijke Philips Electronics N.V. | Speech activity detection using acoustic and facial characteristics in an automatic speech recognition system |
WO2007007257A1 (en) * | 2005-07-13 | 2007-01-18 | Koninklijke Philips Electronics N.V. | Processing method and device with video temporal up-conversion |
US8676273B1 (en) * | 2007-08-24 | 2014-03-18 | Iwao Fujisaki | Communication device |
KR101335346B1 (ko) | 2008-02-27 | 2013-12-05 | 소니 컴퓨터 엔터테인먼트 유럽 리미티드 | 장면의 심도 데이터를 포착하고, 컴퓨터 액션을 적용하기 위한 방법들 |
JP2011071962A (ja) * | 2009-08-28 | 2011-04-07 | Sanyo Electric Co Ltd | 撮像装置及び再生装置 |
US9723260B2 (en) * | 2010-05-18 | 2017-08-01 | Polycom, Inc. | Voice tracking camera with speaker identification |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
KR101795574B1 (ko) * | 2011-01-06 | 2017-11-13 | 삼성전자주식회사 | 모션에 의해 제어되는 전자기기 및 그 제어 방법 |
US9318129B2 (en) * | 2011-07-18 | 2016-04-19 | At&T Intellectual Property I, Lp | System and method for enhancing speech activity detection using facial feature detection |
US8666751B2 (en) * | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
US8863042B2 (en) * | 2012-01-24 | 2014-10-14 | Charles J. Kulas | Handheld device with touch controls that reconfigure in response to the way a user operates the device |
US9423870B2 (en) * | 2012-05-08 | 2016-08-23 | Google Inc. | Input determination method |
CN104428832B (zh) * | 2012-07-09 | 2018-06-26 | Lg电子株式会社 | 语音识别装置及其方法 |
KR101992676B1 (ko) * | 2012-07-26 | 2019-06-25 | 삼성전자주식회사 | 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치 |
US9467403B2 (en) * | 2013-11-28 | 2016-10-11 | Tencent Technology (Shenzhen) Company Limited | Method and mobile terminal for speech communication |
US10163455B2 (en) * | 2013-12-03 | 2018-12-25 | Lenovo (Singapore) Pte. Ltd. | Detecting pause in audible input to device |
KR102356549B1 (ko) * | 2014-03-12 | 2022-01-28 | 삼성전자주식회사 | 디바이스 내의 폴더를 암호화하는 시스템 및 방법 |
US10770075B2 (en) * | 2014-04-21 | 2020-09-08 | Qualcomm Incorporated | Method and apparatus for activating application by speech input |
US9298974B1 (en) * | 2014-06-18 | 2016-03-29 | Amazon Technologies, Inc. | Object identification through stereo association |
US9766702B2 (en) * | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US20160093081A1 (en) * | 2014-09-26 | 2016-03-31 | Samsung Electronics Co., Ltd. | Image display method performed by device including switchable mirror and the device |
US10228904B2 (en) * | 2014-11-12 | 2019-03-12 | Lenovo (Singapore) Pte. Ltd. | Gaze triggered voice recognition incorporating device velocity |
US20160139662A1 (en) * | 2014-11-14 | 2016-05-19 | Sachin Dabhade | Controlling a visual device based on a proximity between a user and the visual device |
US10404969B2 (en) * | 2015-01-20 | 2019-09-03 | Qualcomm Incorporated | Method and apparatus for multiple technology depth map acquisition and fusion |
EP3276618A4 (en) * | 2015-03-23 | 2018-11-07 | Sony Corporation | Information processing system and information processing method |
CN105204628A (zh) * | 2015-09-01 | 2015-12-30 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
CN106570443A (zh) * | 2015-10-09 | 2017-04-19 | 芋头科技(杭州)有限公司 | 一种快速识别方法及家庭智能机器人 |
WO2018010101A1 (en) * | 2016-07-12 | 2018-01-18 | Microsoft Technology Licensing, Llc | Method, apparatus and system for 3d face tracking |
US10438583B2 (en) * | 2016-07-20 | 2019-10-08 | Lenovo (Singapore) Pte. Ltd. | Natural language voice assistant |
US10621992B2 (en) * | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
US20180025725A1 (en) * | 2016-07-22 | 2018-01-25 | Lenovo (Singapore) Pte. Ltd. | Systems and methods for activating a voice assistant and providing an indicator that the voice assistant has assistance to give |
US10652397B2 (en) * | 2016-10-07 | 2020-05-12 | Samsung Electronics Co., Ltd. | Terminal device and method for performing call function |
KR102591413B1 (ko) * | 2016-11-16 | 2023-10-19 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
CN106782524A (zh) * | 2016-11-30 | 2017-05-31 | 深圳讯飞互动电子有限公司 | 一种混合唤醒方法及*** |
US10540488B2 (en) * | 2017-02-10 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dynamic face and voice signature authentication for enhanced security |
US11010595B2 (en) * | 2017-03-23 | 2021-05-18 | Samsung Electronics Co., Ltd. | Facial verification method and apparatus |
US20190027147A1 (en) * | 2017-07-18 | 2019-01-24 | Microsoft Technology Licensing, Llc | Automatic integration of image capture and recognition in a voice-based query to understand intent |
DE202018006448U1 (de) * | 2017-08-17 | 2020-10-14 | Google Llc | Skalieren eines Bilds eines Gesichts eines Sprechers basierend auf dem Abstand eines Gesichts und einer Grösse einer Anzeige |
KR102301599B1 (ko) * | 2017-09-09 | 2021-09-10 | 애플 인크. | 생체측정 인증의 구현 |
US11134227B2 (en) * | 2017-09-20 | 2021-09-28 | Google Llc | Systems and methods of presenting appropriate actions for responding to a visitor to a smart home environment |
US10796711B2 (en) * | 2017-09-29 | 2020-10-06 | Honda Motor Co., Ltd. | System and method for dynamic optical microphone |
CN107679506A (zh) * | 2017-10-12 | 2018-02-09 | Tcl通力电子(惠州)有限公司 | 智能产品的唤醒方法、智能产品及计算机可读存储介质 |
CA3080399A1 (en) * | 2017-10-30 | 2019-05-09 | The Research Foundation For The State University Of New York | System and method associated with user authentication based on an acoustic-based echo-signature |
US11100205B2 (en) * | 2017-11-13 | 2021-08-24 | Jpmorgan Chase Bank, N.A. | Secure automated teller machine (ATM) and method thereof |
US10402149B2 (en) * | 2017-12-07 | 2019-09-03 | Motorola Mobility Llc | Electronic devices and methods for selectively recording input from authorized users |
CN108231079B (zh) * | 2018-02-01 | 2021-12-07 | 北京百度网讯科技有限公司 | 用于控制电子设备的方法、装置、设备以及计算机可读存储介质 |
US10963273B2 (en) * | 2018-04-20 | 2021-03-30 | Facebook, Inc. | Generating personalized content summaries for users |
CN108711430B (zh) * | 2018-04-28 | 2020-08-14 | 广东美的制冷设备有限公司 | 语音识别方法、智能设备及存储介质 |
CA3009685C (en) * | 2018-06-27 | 2023-08-08 | The Toronto-Dominion Bank | Automatic generation and population of digital interfaces based on adaptively processed image data |
US10769428B2 (en) * | 2018-08-13 | 2020-09-08 | Google Llc | On-device image recognition |
WO2020049921A1 (ja) * | 2018-09-07 | 2020-03-12 | ソニー株式会社 | 端末装置、端末装置の制御方法および記憶媒体 |
WO2020062262A1 (en) * | 2018-09-30 | 2020-04-02 | Shanghai United Imaging Healthcare Co., Ltd. | Systems and methods for generating a neural network model for image processing |
US10896320B2 (en) * | 2018-11-14 | 2021-01-19 | Baidu Usa Llc | Child face distance alert system |
-
2018
- 2018-12-28 US US16/235,538 patent/US11151993B2/en active Active
-
2019
- 2019-05-16 CN CN201910406054.0A patent/CN111383635A/zh active Pending
- 2019-07-03 JP JP2019124380A patent/JP2020109463A/ja active Pending
- 2019-07-08 KR KR1020190082147A patent/KR102323232B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11219421A (ja) * | 1998-01-30 | 1999-08-10 | Toshiba Corp | 画像認識装置及び画像認識装置方法 |
JP2009222969A (ja) * | 2008-03-17 | 2009-10-01 | Toyota Motor Corp | 音声認識ロボットおよび音声認識ロボットの制御方法 |
JP2015514254A (ja) * | 2012-04-27 | 2015-05-18 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | ユーザからのオーディオ入力 |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111383635A (zh) | 2020-07-07 |
KR20200083155A (ko) | 2020-07-08 |
KR102323232B1 (ko) | 2021-11-05 |
US20200211542A1 (en) | 2020-07-02 |
US11151993B2 (en) | 2021-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11442580B2 (en) | Screen configuration method, electronic device, and storage medium | |
KR102564267B1 (ko) | 전자 장치 및 그 동작 방법 | |
US10621992B2 (en) | Activating voice assistant based on at least one of user proximity and context | |
CN105589336B (zh) | 多处理器设备 | |
KR102503684B1 (ko) | 전자 장치 및 그의 동작 방법 | |
CN108234750B (zh) | 用于检测盖设备的打开和闭合的电子设备及其操作方法 | |
US20170118402A1 (en) | Electronic device and camera control method therefor | |
US10359878B2 (en) | Method for providing events corresponding to touch attributes and electronic device thereof | |
KR102297383B1 (ko) | 보안 데이터 처리 | |
CN110325993B (zh) | 通过使用多个生物特征传感器执行认证的电子设备及其操作方法 | |
US10635245B2 (en) | Method and electronic device for processing touch input | |
US10091436B2 (en) | Electronic device for processing image and method for controlling the same | |
CN108427529B (zh) | 电子设备及其操作方法 | |
JP7190982B2 (ja) | 音声ベースのメカニズムに基づくスマート表示装置のディスプレイ停止の方法及びシステム | |
JP2020109463A (ja) | 視覚ベースのメカニズムに基づくスマート表示装置の音声コマンドによる起動方法及びシステム | |
JP6913128B2 (ja) | 視覚ベースのメカニズムに基づくスマート表示装置のディスプレイ停止の方法、システム及びコンピュータプログラム | |
US11061544B2 (en) | Method and electronic device for processing input | |
US20170243065A1 (en) | Electronic device and video recording method thereof | |
US20240134431A1 (en) | System and method for identifying presence and function of components of data processing systems | |
US20220214850A1 (en) | Electronic device for seamlessly displaying images, and operating method therefor | |
KR102558471B1 (ko) | 전자 장치 및 그의 동작 방법 | |
KR20240054466A (ko) | 얼굴 영상을 사용하는 신원 인증 방법 및 이를 이용한 장치 | |
KR20170009733A (ko) | 전자 장치 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210210 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210421 |