JP7418526B2 - 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード - Google Patents
自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード Download PDFInfo
- Publication number
- JP7418526B2 JP7418526B2 JP2022168638A JP2022168638A JP7418526B2 JP 7418526 B2 JP7418526 B2 JP 7418526B2 JP 2022168638 A JP2022168638 A JP 2022168638A JP 2022168638 A JP2022168638 A JP 2022168638A JP 7418526 B2 JP7418526 B2 JP 7418526B2
- Authority
- JP
- Japan
- Prior art keywords
- automated assistant
- hotwords
- context
- default
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 claims description 68
- 238000000034 method Methods 0.000 claims description 66
- 230000007704 transition Effects 0.000 claims description 46
- 238000001514 detection method Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 13
- 230000001960 triggered effect Effects 0.000 claims description 10
- 230000000007 visual effect Effects 0.000 description 51
- 230000004913 activation Effects 0.000 description 37
- 230000000694 effects Effects 0.000 description 37
- 238000010801 machine learning Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 230000003213 activating effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 235000013550 pizza Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Description
106 クライアントコンピューティングデバイス、クライアントデバイス
107 視覚センサー、カメラ
108 自動アシスタントクライアント
109 マイクロフォン
110 音声キャプチャモジュール
111 画像キャプチャモジュール
112 視覚キューモジュール
1121 視覚キューモジュール
1122 クラウドベースの視覚キューモジュール、視覚キューモジュール
113 起動モジュール
114 オンデバイスモデルデータベース、オンデバイス起動モデル
1141 デフォルトオンデバイス起動モデル、デフォルト起動モデル
1142~114N コンテキスト起動モデル、コンテキスト固有の機械学習モデルまたは分類器
116 クラウドベースのテキスト対音声(「TTS」)モジュール、TSSモジュール
117 クラウドベースのSTTモジュール、STTモジュール
119 クラウドベースの自動アシスタント構成要素
120 自動アシスタント
122 自然言語プロセッサ
124 実現モジュール
126 自然言語生成器
128 動的ホットワードエンジン
129 動的ホットワードインデックス
130 第三者コンピューティングサービス、第三者サービス、第三者アプリケーション
134 ユーザ制御リソースエンジン
135 意図マッチャー
150 検索モジュール
306 クライアントコンピューティングデバイス、コンピューティングデバイス、クライアントデバイス
506A 第1のクライアントデバイス
506B 第2のクライアントデバイス
606 クライアントデバイス
611 スピーカ
613 ディスプレイ
700 方法
810 コンピューティングデバイス
812 バスサブシステム
814 プロセッサ
816 ネットワークインターフェースサブシステム
820 ユーザインターフェース出力デバイス
822 ユーザインターフェース入力デバイス
824 記憶サブシステム
825 メモリサブシステム、メモリ
826 ファイル記憶サブシステム
830 メインランダムアクセスメモリ(RAM)
832 読取り専用メモリ(ROM)
Claims (16)
少なくとも部分的にコンピューティングデバイス上で自動アシスタントを動作させるステップと、
1つまたは複数のデフォルトホットワードに対して、マイクロフォンによってキャプチャされたオーディオデータを監視するステップであって、前記デフォルトホットワードの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、ステップと、
前記コンピューティングデバイスの所与の状態への遷移を検出するステップであって、前記所与の状態は、タイマーの終了が可聴アラームをトリガした状態である、ステップと、
前記コンピューティングデバイスの前記所与の状態への前記遷移を検出したことに応答して、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して、前記マイクロフォンによりキャプチャされた前記オーディオデータを監視するステップであって、前記コンテキスト固有のホットワードの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の検出または前記自動アシスタントの前記音声認識状態への遷移を必要とせずに、前記可聴アラームを止めるために前記自動アシスタントをトリガする、ステップと
を含む、方法。
前記デフォルトホットワードの前記1つまたは複数を検出したことに基づいて、前記自動アシスタントを限定ホットワード聴取状態から前記音声認識状態へ遷移させるステップと
をさらに含む、請求項3に記載の方法。
少なくとも部分的に1つまたは複数のデバイスにおいて自動アシスタントを動作させるステップと、
1つまたは複数のデフォルトホットワードに対して、マイクロフォンによってキャプチャされたオーディオデータを監視するステップであって、前記デフォルトホットワードの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、ステップと、
メディアコンテンツが前記デバイスの1つまたは複数においてレンダリングされている間に、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して、前記マイクロフォンによりキャプチャされた前記オーディオデータを監視するステップと、
前記コンテキスト固有のホットワードの1つまたは複数を検出したことに基づいて、前記自動アシスタントをコンテキスト固有の聴取状態に遷移させるステップと、
前記コンテキスト固有の聴取状態にある間に、前記デフォルトホットワードのうちの1つまたは複数の検出または前記自動アシスタントの前記音声認識状態への遷移を必要とせずに、前記メディアコンテンツに関する情報を含む自然言語出力を提供するステップと
を含む、方法。
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに動作可能なように結合されたマイクロフォンと、
前記1つまたは複数のプロセッサに動作可能なように結合された非一時的なメモリと
を備え、前記メモリは命令を記録し、前記命令は、前記プロセッサの1つまたは複数による前記命令の実行に応答して、前記1つまたは複数のプロセッサに自動アシスタントを実行させ、前記自動アシスタントは、
1つまたは複数のデフォルトホットワードに対して、マイクロフォンによってキャプチャされたオーディオデータを監視することであって、前記デフォルトホットワードの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、監視することと、
コンピューティングデバイスの所与の状態への遷移を検出することであって、前記所与の状態は、タイマーの終了が可聴アラームをトリガした状態である、検出することと、
前記コンピューティングデバイスの前記所与の状態への前記遷移を検出したことに応答して、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して、前記マイクロフォンによりキャプチャされた前記オーディオデータを監視することであって、前記コンテキスト固有のホットワードの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の検出または前記自動アシスタントの前記音声認識状態への遷移を必要とせずに、前記可聴アラームを止めるために自動アシスタントをトリガする、監視することと
を行うためのものである、アシスタントコンピューティングデバイス。
前記デフォルトホットワードの前記1つまたは複数を検出したことに基づいて、前記自動アシスタントを限定ホットワード聴取状態から前記音声認識状態へ遷移させる
ための命令をさらに備える、請求項15に記載のアシスタントコンピューティングデバイス。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022168638A JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020569051A JP7322076B2 (ja) | 2018-08-21 | 2018-08-21 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
PCT/US2018/047280 WO2020040744A1 (en) | 2018-08-21 | 2018-08-21 | Dynamic and/or context-specific hot words to invoke automated assistant |
JP2022168638A JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569051A Division JP7322076B2 (ja) | 2018-08-21 | 2018-08-21 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023021975A JP2023021975A (ja) | 2023-02-14 |
JP7418526B2 true JP7418526B2 (ja) | 2024-01-19 |
Family
ID=63668007
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569051A Active JP7322076B2 (ja) | 2018-08-21 | 2018-08-21 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
JP2022168638A Active JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569051A Active JP7322076B2 (ja) | 2018-08-21 | 2018-08-21 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Country Status (6)
Country | Link |
---|---|
US (2) | US11423890B2 (ja) |
EP (1) | EP3642833B1 (ja) |
JP (2) | JP7322076B2 (ja) |
KR (1) | KR102523982B1 (ja) |
CN (1) | CN112272846A (ja) |
WO (1) | WO2020040744A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
KR102523982B1 (ko) | 2018-08-21 | 2023-04-20 | 구글 엘엘씨 | 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트-특정 핫 워드 |
JP7055721B2 (ja) * | 2018-08-27 | 2022-04-18 | 京セラ株式会社 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
US11798552B2 (en) * | 2018-10-05 | 2023-10-24 | Honda Motor Co., Ltd. | Agent device, agent control method, and program |
KR102225001B1 (ko) * | 2019-05-21 | 2021-03-08 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11705114B1 (en) * | 2019-08-08 | 2023-07-18 | State Farm Mutual Automobile Insurance Company | Systems and methods for parsing multiple intents in natural language speech |
US11393477B2 (en) * | 2019-09-24 | 2022-07-19 | Amazon Technologies, Inc. | Multi-assistant natural language input processing to determine a voice model for synthesized speech |
US11120790B2 (en) | 2019-09-24 | 2021-09-14 | Amazon Technologies, Inc. | Multi-assistant natural language input processing |
KR20220024557A (ko) * | 2019-10-15 | 2022-03-03 | 구글 엘엘씨 | 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 |
US11790173B2 (en) | 2020-10-22 | 2023-10-17 | Google Llc | Recommending action(s) based on entity or entity type |
US11557278B2 (en) * | 2020-12-10 | 2023-01-17 | Google Llc | Speaker dependent follow up actions and warm words |
US11557293B2 (en) | 2021-05-17 | 2023-01-17 | Google Llc | Contextual suppression of assistant command(s) |
CA3228869A1 (en) * | 2021-08-31 | 2023-03-09 | Christopher Landry | Dynamic labeling of and generating indications of real-time communication sessions |
US11922938B1 (en) | 2021-11-22 | 2024-03-05 | Amazon Technologies, Inc. | Access to multiple virtual assistants |
KR102643796B1 (ko) * | 2022-01-11 | 2024-03-06 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
US20230281205A1 (en) * | 2022-03-01 | 2023-09-07 | Google Llc | Contextually Relevant Suggestions |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249688A (ja) | 2000-03-06 | 2001-09-14 | Kddi Corp | 電話自動受付装置 |
JP2016526205A (ja) | 2013-05-07 | 2016-09-01 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 音声アクティブ化を制御するための方法および装置 |
JP2016536648A (ja) | 2013-09-17 | 2016-11-24 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ボイスアシスタント機能をアクティブにするための検出しきい値を調整するための方法および装置 |
US20170242653A1 (en) | 2016-02-22 | 2017-08-24 | Sonos, Inc. | Voice Control of a Media Playback System |
JP2017525168A (ja) | 2014-06-30 | 2017-08-31 | アップル インコーポレイテッド | リアルタイムのデジタルアシスタントの知識更新 |
US20180182390A1 (en) | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
SE9902229L (sv) | 1999-06-07 | 2001-02-05 | Ericsson Telefon Ab L M | Apparatus and method of controlling a voice controlled operation |
JP2002251235A (ja) | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP4247002B2 (ja) | 2003-01-22 | 2009-04-02 | 富士通株式会社 | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 |
US8140325B2 (en) * | 2007-01-04 | 2012-03-20 | International Business Machines Corporation | Systems and methods for intelligent control of microphones for speech recognition applications |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
NZ581850A (en) * | 2009-08-27 | 2011-12-22 | Eyemagnet Ltd | Informational content scheduling system and method |
US8437455B2 (en) * | 2010-01-12 | 2013-05-07 | American Express Travel Related Services Company, Inc. | System, method and computer program product for globally portable interactive voice response (IVR) systems |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US9721563B2 (en) * | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
AU2013328923A1 (en) * | 2012-10-12 | 2015-04-16 | Hallmark Cards, Incorporated | Context-based interactive plush toy |
US9734151B2 (en) | 2012-10-31 | 2017-08-15 | Tivo Solutions Inc. | Method and system for voice based media search |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US11393461B2 (en) * | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9747900B2 (en) | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US10054327B2 (en) | 2013-08-21 | 2018-08-21 | Honeywell International Inc. | Devices and methods for interacting with an HVAC controller |
MY179900A (en) | 2013-08-29 | 2020-11-19 | Panasonic Ip Corp America | Speech recognition method and speech recognition apparatus |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US9804820B2 (en) | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9082407B1 (en) * | 2014-04-15 | 2015-07-14 | Google Inc. | Systems and methods for providing prompts for voice commands |
WO2015196063A1 (en) * | 2014-06-19 | 2015-12-23 | Robert Bosch Gmbh | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US10789041B2 (en) * | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
JP6514475B2 (ja) | 2014-10-03 | 2019-05-15 | 株式会社Nttドコモ | 対話装置および対話方法 |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
EP3067884B1 (en) * | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
US10097973B2 (en) * | 2015-05-27 | 2018-10-09 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
CN105204743A (zh) * | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
US9542941B1 (en) | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US9792907B2 (en) | 2015-11-24 | 2017-10-17 | Intel IP Corporation | Low resource key phrase detection for wake on voice |
JP2017144521A (ja) | 2016-02-18 | 2017-08-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US9691384B1 (en) * | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10217453B2 (en) | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
US11003417B2 (en) * | 2016-12-15 | 2021-05-11 | Samsung Electronics Co., Ltd. | Speech recognition method and apparatus with activation word based on operating environment of the apparatus |
KR20180084392A (ko) * | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10469755B2 (en) | 2017-05-16 | 2019-11-05 | Google Llc | Storing metadata related to captured images |
US10950228B1 (en) * | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US10546583B2 (en) * | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10586534B1 (en) * | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10636421B2 (en) * | 2017-12-27 | 2020-04-28 | Soundhound, Inc. | Parse prefix-detection in a human-machine interface |
EP3692522A4 (en) * | 2017-12-31 | 2020-11-11 | Midea Group Co., Ltd. | METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES |
TWI677709B (zh) * | 2018-01-09 | 2019-11-21 | 瑞軒科技股份有限公司 | 顯示裝置組件 |
US11164572B2 (en) * | 2018-05-01 | 2021-11-02 | Dell Products, L.P. | Intelligent assistance across voice services |
US20200047687A1 (en) * | 2018-08-10 | 2020-02-13 | SF Motors Inc. | Exterior speech interface for vehicle |
US10929098B2 (en) * | 2018-08-17 | 2021-02-23 | The Toronto-Dominion Bank | Methods and systems for conducting a session over audible and visual interfaces |
KR102523982B1 (ko) | 2018-08-21 | 2023-04-20 | 구글 엘엘씨 | 자동화된 어시스턴트를 호출하기 위한 다이내믹 및/또는 컨텍스트-특정 핫 워드 |
JP6848947B2 (ja) * | 2018-09-27 | 2021-03-24 | 横河電機株式会社 | システム、方法、プログラムおよび記録媒体 |
US11355098B1 (en) * | 2018-12-13 | 2022-06-07 | Amazon Technologies, Inc. | Centralized feedback service for performance of virtual assistant |
DK180649B1 (en) * | 2019-05-31 | 2021-11-11 | Apple Inc | Voice assistant discoverability through on-device targeting and personalization |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
-
2018
- 2018-08-21 KR KR1020207035755A patent/KR102523982B1/ko active IP Right Grant
- 2018-08-21 WO PCT/US2018/047280 patent/WO2020040744A1/en unknown
- 2018-08-21 US US16/622,112 patent/US11423890B2/en active Active
- 2018-08-21 JP JP2020569051A patent/JP7322076B2/ja active Active
- 2018-08-21 EP EP18773683.0A patent/EP3642833B1/en active Active
- 2018-08-21 CN CN201880094489.XA patent/CN112272846A/zh active Pending
-
2022
- 2022-06-16 US US17/842,577 patent/US20220335941A1/en active Pending
- 2022-10-20 JP JP2022168638A patent/JP7418526B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249688A (ja) | 2000-03-06 | 2001-09-14 | Kddi Corp | 電話自動受付装置 |
JP2016526205A (ja) | 2013-05-07 | 2016-09-01 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 音声アクティブ化を制御するための方法および装置 |
JP2016536648A (ja) | 2013-09-17 | 2016-11-24 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ボイスアシスタント機能をアクティブにするための検出しきい値を調整するための方法および装置 |
JP2017525168A (ja) | 2014-06-30 | 2017-08-31 | アップル インコーポレイテッド | リアルタイムのデジタルアシスタントの知識更新 |
US20170242653A1 (en) | 2016-02-22 | 2017-08-24 | Sonos, Inc. | Voice Control of a Media Playback System |
US20180182390A1 (en) | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Also Published As
Publication number | Publication date |
---|---|
US20220335941A1 (en) | 2022-10-20 |
KR102523982B1 (ko) | 2023-04-20 |
JP7322076B2 (ja) | 2023-08-07 |
KR20210008521A (ko) | 2021-01-22 |
JP2023021975A (ja) | 2023-02-14 |
WO2020040744A1 (en) | 2020-02-27 |
EP3642833B1 (en) | 2023-04-12 |
EP3642833A1 (en) | 2020-04-29 |
US20200342866A1 (en) | 2020-10-29 |
US11423890B2 (en) | 2022-08-23 |
JP2021533398A (ja) | 2021-12-02 |
CN112272846A (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7418526B2 (ja) | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード | |
JP7354301B2 (ja) | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 | |
US11810557B2 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
EP3895161B1 (en) | Utilizing pre-event and post-event input streams to engage an automated assistant | |
US11347801B2 (en) | Multi-modal interaction between users, automated assistants, and other computing services | |
JP2023017791A (ja) | アシスタントデバイスのディスプレイにレンダリングするコンテンツの選択 | |
US20240055003A1 (en) | Automated assistant interaction prediction using fusion of visual and audio input | |
US20230215422A1 (en) | Multimodal intent understanding for automated assistant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7418526 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |