JP6028111B2 - ハイブリッド性能スケーリングまたは音声認識 - Google Patents
ハイブリッド性能スケーリングまたは音声認識 Download PDFInfo
- Publication number
- JP6028111B2 JP6028111B2 JP2015558202A JP2015558202A JP6028111B2 JP 6028111 B2 JP6028111 B2 JP 6028111B2 JP 2015558202 A JP2015558202 A JP 2015558202A JP 2015558202 A JP2015558202 A JP 2015558202A JP 6028111 B2 JP6028111 B2 JP 6028111B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- generating
- client device
- tactile
- power state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 69
- 238000004422 calculation algorithm Methods 0.000 claims description 52
- 238000012545 processing Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 10
- 230000000977 initiatory effect Effects 0.000 claims 6
- 230000000694 effects Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000015541 sensory perception of touch Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3293—Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Power Sources (AREA)
Description
本願は、2013年2月20日に出願された米国仮特許出願第61/767,065号の優先利益を主張するものであり、そのすべての開示内容は参照することによって本願に組み込まれる。
Claims (34)
- 1つまたは複数のセンサによる、装置への1つまたは複数の非触覚入力を記録することであって、前記1つまたは複数の入力は第1のメモリに記録され、前記装置は電力が第1のプロセッサ及び前記第1のメモリに提供される低電力状態で動作している、記録することと、
1つまたは複数の第1の信頼性スコアを生成することであって、前記1つまたは複数の第1の信頼性スコアのそれぞれは、対応している記録された非触覚入力と前記第1のメモリに格納される基準入力との間に一定の類似度がある、生成することと、
前記第1の信頼性スコアが第1の閾値レベルより大きいとき、前記装置の中間電力状態を開始することであって、前記中間電力状態は少なくとも第2のプロセッサに電力を提供することを含み、前記第2のプロセッサは前記第1のプロセッサより大きい利用可能な処理能力を有する、開始することと、
前記第1の信頼性スコアがチャレンジ範囲内にあるとき、チャレンジ信号を出力することと、
前記チャレンジ信号へのレスポンスが、1つまたは複数の前記センサにより検出されるとき、前記中間電力状態を開始することと、
前記第2のプロセッサにより、1つまたは複数の第2の信頼性スコアを生成することであって、前記1つまたは複数の第2の信頼性スコアのそれぞれは、各記録された非触覚入力と基準入力との間に一定の類似度がある、生成することと、
前記第2の信頼性スコアが第2の閾値より大きいとき、クライアント装置プラットフォームに前記基準入力と関連する1つまたは複数の動作を実行するように指示するコマンド信号を生成することと
を含む方法。 - 前記1つまたは複数のセンサの第1のセンサがマイクである、請求項1に記載の方法。
- 前記第1の信頼性スコアを生成することが、音声区間検出(VAD)アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項2に記載の方法。 - 前記VADアルゴリズムが、特定用途向け集積回路(ASIC)により実装される、
請求項3に記載の方法。 - 前記第1の信頼性スコアを生成することが、自動音声認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項2に記載の方法。 - 前記1つまたは複数の第1の信頼性スコアを生成することが、音声区間検出(VAD)アルゴリズム及び自動音声認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析すること含む、
請求項2に記載の方法。 - 前記1つまたは複数のセンサの第2のセンサが、前記クライアント装置プラットフォームに近接する人の存在を検出するように構成される、
請求項2に記載の方法。 - 前記クライアント装置プラットフォームに近接する人の存在を検出するように構成される前記センサが、ビデオカメラである、
請求項7に記載の方法。 - 前記クライアント装置プラットフォームに近接する人の存在を検出するように構成される前記センサが、赤外線カメラである、
請求項7に記載の方法。 - 前記クライアント装置プラットフォームに近接する人の存在を検出するように構成される前記センサが、テラヘルツセンサである、
請求項7に記載の方法。 - 前記1つまたは複数の第2の信頼性スコアを生成することが、音素を利用する自動音声認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項2に記載の方法。 - 前記第2の信頼性スコアを生成することが、聴覚注意キューを利用する自動音声認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項2に記載の方法。 - 前記第2の信頼性スコアを生成することが、特定の人の声を識別するように構成される音声認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項2に記載の方法。 - 前記1つまたは複数のセンサの1つが、ビデオカメラである、
請求項1に記載の方法。 - 前記第1の信頼性スコアを生成することが、物体認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項14に記載の方法。 - 前記物体認識アルゴリズムが、前記クライアント装置プラットフォームに近接する人の存在を検出するように構成される、
請求項15に記載の方法。 - 前記第1の信頼性スコアを生成することが、ジェスチャ認識アルゴリズムにより1つまたは複数の前記非触覚入力を分析することを含む、
請求項14に記載の方法。 - 前記第2の信頼性スコアを生成することが、視聴覚音声認識(ASVR)アルゴリズムにより1つまたは前記複数の非触覚入力を分析することを含む、
請求項14に記載の方法。 - 前記1つまたは複数のセンサの1つが動きセンサであり、
前記第1の信頼性スコアを生成することが動き検出を行うことを含む、
請求項1に記載の方法。 - 人が検出可能である前記チャレンジ信号が、点滅発光ダイオード(LED)である、
請求項1に記載の方法。 - 人によって検出可能に構成される可聴音である前記チャレンジ信号、
請求項1に記載の方法。 - 非触覚レスポンス入力が可聴フレーズである、
請求項1に記載の方法。 - 非触覚レスポンス入力がジェスチャである、
請求項1に記載の方法。 - 前記中間電力状態が、クラウドベースサーバ上に実装される、
請求項1に記載の方法。 - 前記1つまたは複数の非触覚入力が、ネットワーク上でクラウドベースサーバに配送される、
請求項24に記載の方法。 - 前記第2のプロセッサが、第2のメモリに結合される、
請求項1に記載の方法。 - 前記第2のメモリが、前記第1のメモリに格納されない1つまたは複数の基準信号を備える、
請求項26に記載の方法。 - 前記第1のプロセッサが、マルチコアプロセッサの1つまたは複数のコアを備える、
請求項1に記載の方法。 - 前記第2のプロセッサが、前記第1のプロセッサと前記マルチコアプロセッサの1つまたは複数の付加的なコアとを備える、
請求項28に記載の方法。 - 前記1つまたは複数の前記動作の1つが、前記クライアント装置プラットフォーム上で全電力状態を開始するように構成される、
請求項1に記載の方法。 - 前記1つまたは複数の前記動作の1つが、前記クライアント装置プラットフォーム上で特定のメディアタイトルのプレイバックを開始するように構成される、
請求項1に記載の方法。 - 前記1つまたは複数の前記動作の1つが、プレーヤプロファイルをロードするように構成される、
請求項1に記載の方法。 - ネットワーク上で動作するように構成されるクライアント装置プラットフォームであって、
プロセッサと、
前記プロセッサに結合されるメモリと、
前記プロセッサによる実行のためにメモリに具現化され、方法を実装するように構成される1つまたは複数の指示と
を備え、
前記方法は、
1つまたは複数のセンサによる、装置への1つまたは複数の非触覚入力を記録することであって、前記1つまたは複数の入力は第1のメモリに記録され、前記装置は電力が第1のプロセッサ及び前記第1のメモリに提供される低電力状態で動作している、記録することと、
1つまたは複数の第1の信頼性スコアを生成することであって、前記1つまたは複数の第1の信頼性スコアのそれぞれは、対応している記録された非触覚入力と前記第1のメモリに格納される基準入力との間に一定の類似度がある、生成することと、
前記第1の信頼性スコアが第1の閾値レベルより大きいとき、前記装置の中間電力状態を開始することであって、前記中間電力状態は少なくとも第2のプロセッサに電力を提供することを含み、前記第2のプロセッサは前記第1のプロセッサより大きい利用可能な処理能力を有する、開始することと、
前記第1の信頼性スコアがチャレンジ範囲内にあるとき、チャレンジ信号を出力することと、
前記チャレンジ信号へのレスポンスが、1つまたは複数の前記センサにより検出されるとき、前記中間電力状態を開始することと、
前記第2のプロセッサにより、1つまたは複数の第2の信頼性スコアを生成することであって、前記1つまたは複数の第2の信頼性スコアのそれぞれは、各記録された非触覚入力と基準入力との間に一定の類似度がある、生成することと、
前記第2の信頼性スコアが第2の閾値より大きいとき、当該クライアント装置プラットフォームに前記基準入力と関連する1つまたは複数の動作を実行するように指示するコマンド信号を生成することと
を含むクライアント装置プラットフォーム。 - プログラム命令を含み、
コンピュータシステムの1つまたは複数のプロセッサによる前記プログラム命令の実行は、1つまたは複数のプロセッサに、
1つまたは複数のセンサによる、装置への1つまたは複数の非触覚入力を記録するステップであって、前記1つまたは複数の入力は第1のメモリに記録され、前記装置は電力が第1のプロセッサ及び前記第1のメモリに提供される低電力状態で動作しているステップと、
1つまたは複数の第1の信頼性スコアを生成するステップであって、前記1つまたは複数の第1の信頼性スコアのそれぞれは、対応している記録された非触覚入力と前記第1のメモリに格納される基準入力との間に一定の類似度があるステップと、
前記第1の信頼性スコアが第1の閾値レベルより大きいとき、前記装置の中間電力状態を開始するステップであって、前記中間電力状態は少なくとも第2のプロセッサに電力を提供することを含み、前記第2のプロセッサは前記第1のプロセッサより大きい利用可能な処理能力を有するステップと、
前記第1の信頼性スコアがチャレンジ範囲内にあるとき、チャレンジ信号を出力するステップと、
前記チャレンジ信号へのレスポンスが、1つまたは複数の前記センサにより検出されるとき、前記中間電力状態を開始するステップと、
前記第2のプロセッサにより、1つまたは複数の第2の信頼性スコアを生成するステップであって、前記1つまたは複数の第2の信頼性スコアのそれぞれは、各記録された非触覚入力と基準入力との間に一定の類似度があるステップと、
前記第2の信頼性スコアが第2の閾値より大きいとき、クライアント装置プラットフォームに前記基準入力と関連する1つまたは複数の動作を実行するように指示するコマンド信号を生成するステップと
を実行させる、一時的でないコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361767065P | 2013-02-20 | 2013-02-20 | |
US61/767,065 | 2013-02-20 | ||
US13/791,716 | 2013-03-08 | ||
US13/791,716 US9256269B2 (en) | 2013-02-20 | 2013-03-08 | Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state |
PCT/US2014/016951 WO2014130463A2 (en) | 2013-02-20 | 2014-02-18 | Hybrid performance scaling or speech recognition |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016203417A Division JP6325626B2 (ja) | 2013-02-20 | 2016-10-17 | ハイブリッド性能スケーリングまたは音声認識 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016516225A JP2016516225A (ja) | 2016-06-02 |
JP6028111B2 true JP6028111B2 (ja) | 2016-11-16 |
Family
ID=51352186
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558202A Active JP6028111B2 (ja) | 2013-02-20 | 2014-02-18 | ハイブリッド性能スケーリングまたは音声認識 |
JP2016203417A Active JP6325626B2 (ja) | 2013-02-20 | 2016-10-17 | ハイブリッド性能スケーリングまたは音声認識 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016203417A Active JP6325626B2 (ja) | 2013-02-20 | 2016-10-17 | ハイブリッド性能スケーリングまたは音声認識 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9256269B2 (ja) |
EP (1) | EP2959474B1 (ja) |
JP (2) | JP6028111B2 (ja) |
CN (2) | CN112863510B (ja) |
WO (1) | WO2014130463A2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9063731B2 (en) | 2012-08-27 | 2015-06-23 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US9892729B2 (en) * | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
US20140343949A1 (en) * | 2013-05-17 | 2014-11-20 | Fortemedia, Inc. | Smart microphone device |
US9665155B2 (en) * | 2013-12-28 | 2017-05-30 | Intel Corporation | Techniques for increasing energy efficiency of sensor controllers that receive data from one or more sensors |
US9619010B1 (en) * | 2014-06-17 | 2017-04-11 | Amazon Technologies, Inc. | Selective powering off of hardware components for battery management in mobile devices |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US11289077B2 (en) * | 2014-07-15 | 2022-03-29 | Avaya Inc. | Systems and methods for speech analytics and phrase spotting using phoneme sequences |
US10127927B2 (en) | 2014-07-28 | 2018-11-13 | Sony Interactive Entertainment Inc. | Emotional speech processing |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
FR3030177B1 (fr) | 2014-12-16 | 2016-12-30 | Stmicroelectronics Rousset | Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement |
KR102418892B1 (ko) * | 2015-06-15 | 2022-07-11 | 한국전자통신연구원 | 신뢰구간에 기반한 에너지 절감 방법 및 이를 이용한 장치 |
US9542941B1 (en) * | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
WO2017105517A1 (en) | 2015-12-18 | 2017-06-22 | Hewlett Packard Enterprise Development Lp | Memristor crossbar arrays to activate processors |
CN105868108B (zh) * | 2016-03-28 | 2018-09-07 | 中国科学院信息工程研究所 | 基于神经网络的指令集无关的二进制代码相似性检测方法 |
CN105868082B (zh) * | 2016-06-01 | 2019-04-02 | 楚天龙股份有限公司 | 非接触式cpu卡通讯监测器 |
US10438583B2 (en) * | 2016-07-20 | 2019-10-08 | Lenovo (Singapore) Pte. Ltd. | Natural language voice assistant |
US10621992B2 (en) * | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10671925B2 (en) * | 2016-12-28 | 2020-06-02 | Intel Corporation | Cloud-assisted perceptual computing analytics |
US10878342B2 (en) * | 2017-03-30 | 2020-12-29 | Intel Corporation | Cloud assisted machine learning |
US10664533B2 (en) | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
US10770094B2 (en) * | 2018-01-09 | 2020-09-08 | Intel IP Corporation | Routing audio streams based on semantically generated result sets |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
CN109065046A (zh) * | 2018-08-30 | 2018-12-21 | 出门问问信息科技有限公司 | 语音唤醒的方法、装置、电子设备及计算机可读存储介质 |
US11580355B2 (en) * | 2018-10-25 | 2023-02-14 | Electronic Warfare Associates, Inc. | System-on-a-chip incorporating artificial neural network and general-purpose processor circuitry |
KR20200090438A (ko) | 2019-01-21 | 2020-07-29 | 삼성전자주식회사 | 디스플레이의 손상을 방지하기 위한 전자 장치 및 방법 |
US11659332B2 (en) | 2019-07-30 | 2023-05-23 | Dolby Laboratories Licensing Corporation | Estimating user location in a system including smart audio devices |
US11462218B1 (en) * | 2020-04-29 | 2022-10-04 | Amazon Technologies, Inc. | Conserving battery while detecting for human voice |
US11782149B2 (en) * | 2021-01-08 | 2023-10-10 | Google Llc | Systems and methods for managing motion detection of an electronic device, and associated electronic devices |
KR20230129183A (ko) * | 2021-01-08 | 2023-09-06 | 구글 엘엘씨 | 전자 장치 및 그 전자 장치의 모션 검출을 관리하기위한 시스템 및 방법 |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
JP2000193752A (ja) * | 1998-12-28 | 2000-07-14 | Matsushita Electric Ind Co Ltd | 人体検知装置 |
US6963759B1 (en) * | 1999-10-05 | 2005-11-08 | Fastmobile, Inc. | Speech recognition technique based on local interrupt detection |
US6397186B1 (en) * | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
US7039951B1 (en) * | 2000-06-06 | 2006-05-02 | International Business Machines Corporation | System and method for confidence based incremental access authentication |
JP2003195880A (ja) * | 2001-12-28 | 2003-07-09 | Nec Corp | サーバ・クライアント型音声認識装置 |
JP2004072260A (ja) * | 2002-08-02 | 2004-03-04 | Ricoh Co Ltd | 画像処理装置、プログラムおよび記録媒体並びに画像処理システム |
JP4413564B2 (ja) * | 2003-09-16 | 2010-02-10 | 三菱電機株式会社 | 情報端末および音声認識システム |
US7697026B2 (en) * | 2004-03-16 | 2010-04-13 | 3Vr Security, Inc. | Pipeline architecture for analyzing multiple video streams |
US20060068851A1 (en) * | 2004-09-28 | 2006-03-30 | Ashman William C Jr | Accessory device for mobile communication device |
US7844465B2 (en) * | 2004-11-30 | 2010-11-30 | Scansoft, Inc. | Random confirmation in speech based systems |
US20060149544A1 (en) * | 2005-01-05 | 2006-07-06 | At&T Corp. | Error prediction in spoken dialog systems |
US20060215821A1 (en) * | 2005-03-23 | 2006-09-28 | Rokusek Daniel S | Voice nametag audio feedback for dialing a telephone call |
US7574590B2 (en) * | 2005-10-26 | 2009-08-11 | Sigmatel, Inc. | Method for booting a system on a chip integrated circuit |
ES2386977T3 (es) * | 2005-11-29 | 2012-09-10 | Google Inc. | Aplicaciones sociales e interactivas para medios masivos |
JP2008009153A (ja) * | 2006-06-29 | 2008-01-17 | Xanavi Informatics Corp | 音声対話システム |
US8355915B2 (en) * | 2006-11-30 | 2013-01-15 | Rao Ashwin P | Multimodal speech recognition system |
US8380511B2 (en) * | 2007-02-20 | 2013-02-19 | Intervoice Limited Partnership | System and method for semantic categorization |
US8886545B2 (en) * | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8165877B2 (en) * | 2007-08-03 | 2012-04-24 | Microsoft Corporation | Confidence measure generation for speech related searching |
KR100919225B1 (ko) * | 2007-09-19 | 2009-09-28 | 한국전자통신연구원 | 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법 |
US8239203B2 (en) | 2008-04-15 | 2012-08-07 | Nuance Communications, Inc. | Adaptive confidence thresholds for speech recognition |
US8259082B2 (en) * | 2008-09-12 | 2012-09-04 | At&T Intellectual Property I, L.P. | Multimodal portable communication interface for accessing video content |
US9134798B2 (en) * | 2008-12-15 | 2015-09-15 | Microsoft Technology Licensing, Llc | Gestures, interactions, and common ground in a surface computing environment |
US9086875B2 (en) * | 2009-06-05 | 2015-07-21 | Qualcomm Incorporated | Controlling power consumption of a mobile device based on gesture recognition |
KR101688655B1 (ko) * | 2009-12-03 | 2016-12-21 | 엘지전자 주식회사 | 사용자의 프레전스 검출에 의한 제스쳐 인식 장치의 전력 제어 방법 |
US8712143B2 (en) * | 2010-02-26 | 2014-04-29 | Bank Of America Corporation | Processing financial documents |
JP5039214B2 (ja) * | 2011-02-17 | 2012-10-03 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US8650029B2 (en) * | 2011-02-25 | 2014-02-11 | Microsoft Corporation | Leveraging speech recognizer feedback for voice activity detection |
US8990082B2 (en) * | 2011-03-25 | 2015-03-24 | Educational Testing Service | Non-scorable response filters for speech scoring systems |
US10372191B2 (en) * | 2011-05-12 | 2019-08-06 | Apple Inc. | Presence sensing |
WO2012173672A1 (en) * | 2011-06-13 | 2012-12-20 | United Video Properties, Inc. | Systems and methods for transmitting content metadata from multiple data records |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
EP2783365B1 (en) * | 2011-11-21 | 2018-02-21 | Robert Bosch GmbH | Method and system for adapting grammars in hybrid speech recognition engines for enhancing local speech recognition performance |
US20130155237A1 (en) * | 2011-12-16 | 2013-06-20 | Microsoft Corporation | Interacting with a mobile device within a vehicle using gestures |
US9389690B2 (en) * | 2012-03-01 | 2016-07-12 | Qualcomm Incorporated | Gesture detection based on information from multiple types of sensors |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
TWI474317B (zh) * | 2012-07-06 | 2015-02-21 | Realtek Semiconductor Corp | 訊號處理裝置以及訊號處理方法 |
KR102117841B1 (ko) * | 2012-10-30 | 2020-06-02 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
US9361885B2 (en) * | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US10229697B2 (en) * | 2013-03-12 | 2019-03-12 | Google Technology Holdings LLC | Apparatus and method for beamforming to obtain voice and noise signals |
-
2013
- 2013-03-08 US US13/791,716 patent/US9256269B2/en active Active
-
2014
- 2014-02-18 JP JP2015558202A patent/JP6028111B2/ja active Active
- 2014-02-18 CN CN202110034665.4A patent/CN112863510B/zh active Active
- 2014-02-18 WO PCT/US2014/016951 patent/WO2014130463A2/en active Application Filing
- 2014-02-18 EP EP14753571.0A patent/EP2959474B1/en active Active
- 2014-02-18 CN CN201480007443.1A patent/CN105229724A/zh active Pending
-
2016
- 2016-10-17 JP JP2016203417A patent/JP6325626B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP6325626B2 (ja) | 2018-05-16 |
EP2959474A4 (en) | 2016-10-19 |
WO2014130463A3 (en) | 2014-10-16 |
WO2014130463A2 (en) | 2014-08-28 |
CN112863510A (zh) | 2021-05-28 |
JP2016516225A (ja) | 2016-06-02 |
CN105229724A (zh) | 2016-01-06 |
US9256269B2 (en) | 2016-02-09 |
JP2017050010A (ja) | 2017-03-09 |
US20140237277A1 (en) | 2014-08-21 |
EP2959474B1 (en) | 2019-06-05 |
EP2959474A2 (en) | 2015-12-30 |
CN112863510B (zh) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6325626B2 (ja) | ハイブリッド性能スケーリングまたは音声認識 | |
US10504511B2 (en) | Customizable wake-up voice commands | |
US20230267921A1 (en) | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence | |
KR102596430B1 (ko) | 화자 인식에 기초한 음성 인식 방법 및 장치 | |
US10705789B2 (en) | Dynamic volume adjustment for virtual assistants | |
BR102018070673A2 (pt) | Gerar diálogo baseado em pontuações de verificação | |
US10880833B2 (en) | Smart listening modes supporting quasi always-on listening | |
JP2017536568A (ja) | キーフレーズユーザ認識の増補 | |
JP7328265B2 (ja) | 音声インタラクション制御方法、装置、電子機器、記憶媒体及びシステム | |
MX2014006001A (es) | Igualacion de patron de audio para activacion de dispositivo. | |
JP7418563B2 (ja) | オンデバイスの機械学習モデルの訓練のための自動化アシスタントの機能の訂正の使用 | |
US20210011887A1 (en) | Activity query response system | |
EP3724875B1 (en) | Text independent speaker recognition | |
JP7063937B2 (ja) | 音声対話するための方法、装置、電子デバイス、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム | |
US20230377580A1 (en) | Dynamically adapting on-device models, of grouped assistant devices, for cooperative processing of assistant requests | |
KR20230005966A (ko) | 거의 일치하는 핫워드 또는 구문 검출 | |
US20230143177A1 (en) | Contextual suppression of assistant command(s) | |
US20230061929A1 (en) | Dynamically configuring a warm word button with assistant commands | |
JPWO2019093123A1 (ja) | 情報処理装置および電子機器 | |
US20230031461A1 (en) | Providing certain reasoning with respect to fulfillment of an assistant command | |
US20230197072A1 (en) | Warm word arbitration between automated assistant devices | |
US20240161741A1 (en) | Short-Lived Repeat Voice Commands | |
JP2024508209A (ja) | アシスタントコマンドの実現についてのある特定の論拠づけの提供 | |
WO2023114087A1 (en) | Warm word arbitration between automated assistant devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6028111 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |