JP7186375B2 - 音声処理装置、音声処理方法および音声処理システム - Google Patents
音声処理装置、音声処理方法および音声処理システム Download PDFInfo
- Publication number
- JP7186375B2 JP7186375B2 JP2018066232A JP2018066232A JP7186375B2 JP 7186375 B2 JP7186375 B2 JP 7186375B2 JP 2018066232 A JP2018066232 A JP 2018066232A JP 2018066232 A JP2018066232 A JP 2018066232A JP 7186375 B2 JP7186375 B2 JP 7186375B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- audio
- uttered
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 159
- 238000003672 processing method Methods 0.000 title claims description 11
- 230000005236 sound signal Effects 0.000 claims description 96
- 238000001514 detection method Methods 0.000 claims description 74
- 238000003491 array Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 25
- 238000004891 communication Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000004913 activation Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000003139 buffering effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 206010024796 Logorrhoea Diseases 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R11/02—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R11/02—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
- B60R11/0217—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof for loud-speakers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R11/02—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
- B60R11/0247—Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof for microphones or earphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/025—Arrangements for fixing loudspeaker transducers, e.g. in a box, furniture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R2011/0001—Arrangements for holding or mounting articles, not otherwise provided for characterised by position
- B60R2011/0003—Arrangements for holding or mounting articles, not otherwise provided for characterised by position inside the vehicle
- B60R2011/0005—Dashboard
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R11/00—Arrangements for holding or mounting articles, not otherwise provided for
- B60R2011/0001—Arrangements for holding or mounting articles, not otherwise provided for characterised by position
- B60R2011/0003—Arrangements for holding or mounting articles, not otherwise provided for characterised by position inside the vehicle
- B60R2011/0019—Side or rear panels
- B60R2011/0021—Doors
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Circuit For Audible Band Transducer (AREA)
- Navigation (AREA)
Description
図1~図8を参照して、本開示に係る車両1に搭載可能な音声処理装置100、音声処理方法および音声処理システム100Sの実施の形態1について説明する。
次に図6および図7を参照して、実施の形態1の第1変形例に係る音声制御部140の動作について説明する。図6は、第1変形例の音声制御部140の動作を示す処理ブロック図である。図7は、第1変形例の音声制御部140の動作手順を示すフローチャートである。なお、図3および図4と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。
図8を参照して、実施の形態1の第2変形例に係る音声制御部140の動作について説明する。図8は、第2変形例の音声制御部140の動作を示す処理ブロック図である。なお、図3と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。
次に図9~図12を参照して、本開示に係る車両1に搭載可能な音声処理装置200、音声処理方法および音声処理システム200Sの実施の形態2について説明する。図9は、実施の形態2に係る車両1の上面図である。図10は、音声処理装置200のシステム構成を説明する機能ブロック図である。図11は、音声制御部240の信号処理の動作を示す処理ブロック図である。図12は、音声制御部240の動作手順を示すフローチャートである。なお、実施の形態1と同一または同等部分については、図面等に同一あるいは同等符合を付してその説明を省略あるいは簡略化する。
2 車体
3 インストルメントパネル
20 音声出力装置
21 アンプ
30 車載機器
31 カーオーディオ
32 エアコンディショナー
33 照明装置
34 映像表示装置
35 ナビゲーション装置
40 音声認識サーバ
41 通信インターフェース
42 演算機
43 メモリ
44 ストレージ
100S 音声処理システム
100 音声処理装置
110 通信インターフェース
120 車載機器制御部
130 メモリ
140 音声制御部
141 WuW検出部
142 音声信号バッファ部
143 話者位置検出部
144 CTC部
145 再生音キャンセラ
146 ビームフォーミング処理部
200S 音声処理システム
200 音声処理装置
240 音声制御部
241 WuW検出部
SP1,SP2,SP3,SP4 車載スピーカ
MC1,MC2,MC3,MC4,MC5,MC6 マイク
MC7 WuW検出用マイク
CL クラウド
Claims (12)
- 複数のシートのそれぞれに対応して複数の異なるマイクが配置された車両に搭載される音声処理装置であって、
前記複数の異なるマイクのそれぞれにより収音された所定時間分の音声信号を保持する保持部と、
前記複数の異なるマイクのそれぞれにより収音された音声信号に基づいて、前記車両に乗車している話者が発声する所定ワードの音声の有無を検出するワード検出部と、
前記所定ワードの音声が検出された場合に、前記保持部に保持される前記所定時間分の音声信号のそれぞれの特性に基づいて、前記複数の異なるマイクから前記所定ワードを発声した話者の最も近くに配置されたマイクを話者位置マイクとして特定するマイク特定部と、
前記保持部に保持される前記所定時間分の音声信号と前記話者位置マイクに関する情報とを用いて、前記話者が発声した音声を出力するとともに、前記話者でない乗員が発声した音声を抑圧する音声処理部と、を備える、
音声処理装置。 - 前記所定時間分の音声信号のそれぞれの特性は、前記複数の異なるマイク間の音声信号の時間差を検出して得られる、
請求項1に記載の音声処理装置。 - 前記所定時間分の音声信号のそれぞれの特性は、前記複数の異なるマイクの音声信号ごとの音声波形、周波数、音声レベルを分析して得られる、
請求項1に記載の音声処理装置。 - 前記マイク特定部は、前記ワード検出部からトリガ信号を受信してこの受信時刻を時刻の基準に設定し、前記所定時間分の音声信号のそれぞれ前記基準の時刻に対する時間差に基づき前記所定ワードを発声した話者の空間的な位置検出する、
請求項2に記載の音声処理装置。 - 前記音声処理部の出力音声信号から、前記車両に搭載される音楽再生装置の再生音が前記複数の異なるマイクにより収音された再生音信号を抑圧する再生音キャンセラ、をさらに備える、
請求項1に記載の音声処理装置。 - 前記話者位置マイクにより収音された音声信号の音源に対応する前記話者に、音声信号の指向性を形成するビームフォーミング処理部、をさらに備え、
前記複数の異なるマイクは、それぞれ複数のマイク素子を含んで構成されるマイクアレイである、
請求項1または5に記載の音声処理装置。 - 前記ワード検出部は、
前記複数の異なるマイクのうち特定のマイクにより収音された音声信号に基づいて、前記話者が発声する所定ワードの音声の有無を検出する、
請求項1に記載の音声処理装置。 - 所定の条件を検出した場合に、自装置の作動モードを、前記話者が発声した音声を出力して前記話者でない乗員が発声した音声を抑圧する特定話者音声出力モードから、前記所定ワードの音声の有無を検出する所定ワード検出待機モードに移行する制御部、をさらに備える、
請求項1に記載の音声処理装置。 - 前記ワード検出部は、
前記話者位置マイクにより収音された音声信号に基づいて、前記所定ワードと異なる終了ワードの音声の有無を検出し、
前記制御部は、
前記所定ワードと異なる終了ワードの音声が検出された場合に、前記所定の条件を満たしたとして、前記自装置の作動モードを前記所定ワード検出待機モードに移行する、
請求項8に記載の音声処理装置。 - 前記制御部は、
前記話者が発声した音声の認識結果を取得して一定時間が経過した場合に、前記所定の条件を満たしたとして、前記自装置の作動モードを前記所定ワード検出待機モードに移行する、
請求項8に記載の音声処理装置。 - 複数のシートのそれぞれに対応して複数の異なるマイクが配置された車両に搭載される音声処理装置における音声処理方法であって、
前記複数の異なるマイクのそれぞれにより収音された所定時間分の音声信号を保持部に保持するステップと、
前記複数の異なるマイクのそれぞれにより収音された音声信号に基づいて、前記車両に乗車している話者が発声する所定ワードの音声の有無を検出するステップと、
前記所定ワードの音声が検出された場合に、前記保持部に保持される前記所定時間分の音声信号のそれぞれの特性に基づいて、前記複数の異なるマイクから前記所定ワードを発声した話者の最も近くに配置されたマイクを話者位置マイクとして特定するステップと、
前記保持部に保持される前記所定時間分の音声信号と前記話者位置マイクに関する情報とを用いて、前記話者が発声した音声を出力するとともに、前記話者でない乗員が発声した音声を抑圧するステップと、を有する、
音声処理方法。 - 複数のシートのそれぞれに対応して複数の異なるマイクが配置された車両に搭載される音声処理装置と、前記車両に搭載される車載機器を制御する制御装置とを含む音声処理システムであって、
前記音声処理装置は、
前記複数の異なるマイクのそれぞれにより収音された所定時間分の音声信号を保持部に保持し、
前記複数の異なるマイクのそれぞれにより収音された音声信号に基づいて、前記車両に乗車している話者が発声する所定ワードの音声の有無を検出し、
前記所定ワードの音声が検出された場合に、前記保持部に保持される前記所定時間分の音声信号のそれぞれの特性に基づいて、前記複数の異なるマイクから前記所定ワードを発声した話者の最も近くに配置された前記所定ワードの音声信号を収音したマイクを話者位置マイクとして特定し、
前記保持部に保持される前記所定時間分の音声信号と前記話者位置マイクに関する情報とを用いて、前記話者が発声した音声を出力し、前記話者でない乗員が発声した音声を抑圧し、
前記話者が発声した音声の認識結果を取得し、
前記制御装置は、
前記話者が発声した音声の認識結果に基づいて、前記車載機器の作動を制御する、
音声処理システム。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018066232A JP7186375B2 (ja) | 2018-03-29 | 2018-03-29 | 音声処理装置、音声処理方法および音声処理システム |
PCT/JP2018/045419 WO2019187371A1 (ja) | 2018-03-29 | 2018-12-11 | 音声処理装置、音声処理方法および音声処理システム |
US16/979,714 US11804220B2 (en) | 2018-03-29 | 2018-12-11 | Voice processing device, voice processing method and voice processing system |
EP18913012.3A EP3779973A4 (en) | 2018-03-29 | 2018-12-11 | VOICE PROCESSING DEVICE, METHOD AND SYSTEM |
CN201880091245.6A CN111886647A (zh) | 2018-03-29 | 2018-12-11 | 语音处理装置、语音处理方法和语音处理*** |
JP2022181948A JP7458013B2 (ja) | 2018-03-29 | 2022-11-14 | 音声処理装置、音声処理方法および音声処理システム |
US18/370,162 US20240005919A1 (en) | 2018-03-29 | 2023-09-19 | Voice processing device, voice processing method and voice processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018066232A JP7186375B2 (ja) | 2018-03-29 | 2018-03-29 | 音声処理装置、音声処理方法および音声処理システム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022181948A Division JP7458013B2 (ja) | 2018-03-29 | 2022-11-14 | 音声処理装置、音声処理方法および音声処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019174778A JP2019174778A (ja) | 2019-10-10 |
JP7186375B2 true JP7186375B2 (ja) | 2022-12-09 |
Family
ID=68058722
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018066232A Active JP7186375B2 (ja) | 2018-03-29 | 2018-03-29 | 音声処理装置、音声処理方法および音声処理システム |
JP2022181948A Active JP7458013B2 (ja) | 2018-03-29 | 2022-11-14 | 音声処理装置、音声処理方法および音声処理システム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022181948A Active JP7458013B2 (ja) | 2018-03-29 | 2022-11-14 | 音声処理装置、音声処理方法および音声処理システム |
Country Status (5)
Country | Link |
---|---|
US (2) | US11804220B2 (ja) |
EP (1) | EP3779973A4 (ja) |
JP (2) | JP7186375B2 (ja) |
CN (1) | CN111886647A (ja) |
WO (1) | WO2019187371A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7186375B2 (ja) | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
FR3103618B1 (fr) * | 2019-11-21 | 2021-10-22 | Psa Automobiles Sa | Dispositif pour mettre en œuvre un assistant personnel virtuel dans un véhicule automobile avec contrôle par la voix d’un utilisateur, et véhicule automobile l’incorporant |
JP7151694B2 (ja) * | 2019-11-27 | 2022-10-12 | 井関農機株式会社 | コンバイン |
JP7465700B2 (ja) | 2020-03-27 | 2024-04-11 | 株式会社デンソーテン | 車載装置および車載装置における音声処理方法 |
CN113113005B (zh) * | 2021-03-19 | 2024-06-18 | 大众问问(北京)信息科技有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001051694A (ja) | 1999-08-10 | 2001-02-23 | Fujitsu Ten Ltd | 音声認識装置 |
JP2005055667A (ja) | 2003-08-04 | 2005-03-03 | Sony Corp | 音声処理装置 |
JP2015513704A (ja) | 2012-03-16 | 2015-05-14 | ニュアンス コミュニケーションズ, インコーポレイテッド | ユーザ専用自動発話認識 |
WO2017138934A1 (en) | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6113900U (ja) * | 1984-06-29 | 1986-01-27 | フジテツク株式会社 | エレベ−タの音声応答装置 |
JPS6113900A (ja) | 1984-06-29 | 1986-01-22 | Pioneer Electronic Corp | トランスデユ−サ |
JPH1152976A (ja) * | 1997-07-29 | 1999-02-26 | Nec Home Electron Ltd | 音声認識装置 |
JPH1165586A (ja) | 1997-08-18 | 1999-03-09 | Honda Motor Co Ltd | 車両用音声入力装置 |
JP2000148185A (ja) | 1998-11-13 | 2000-05-26 | Matsushita Electric Ind Co Ltd | 認識装置及び認識方法 |
JP3436184B2 (ja) | 1999-05-13 | 2003-08-11 | 日本電気株式会社 | 多チャンネル入力音声認識装置 |
JP3454190B2 (ja) * | 1999-06-09 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置および方法 |
JP2001075594A (ja) | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
EP1312162B1 (en) * | 2000-08-14 | 2005-01-12 | Clear Audio Ltd. | Voice enhancement system |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
JP4209247B2 (ja) * | 2003-05-02 | 2009-01-14 | アルパイン株式会社 | 音声認識装置および方法 |
EP1562180B1 (en) | 2004-02-06 | 2015-04-01 | Nuance Communications, Inc. | Speech dialogue system and method for controlling an electronic device |
EP1695873B1 (en) * | 2005-02-23 | 2008-07-09 | Harman Becker Automotive Systems GmbH | Vehicle speech recognition system |
US20110054899A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Command and control utilizing content information in a mobile voice-to-speech application |
US20090055180A1 (en) * | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method for optimizing speech recognition in a vehicle |
US20090055178A1 (en) | 2007-08-23 | 2009-02-26 | Coon Bradley S | System and method of controlling personalized settings in a vehicle |
US9779114B2 (en) * | 2011-10-07 | 2017-10-03 | Henk B. Rogers | Media geotagging |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
DE112012006617B4 (de) * | 2012-06-25 | 2023-09-28 | Hyundai Motor Company | Bord-Informationsvorrichtung |
US9620115B2 (en) * | 2013-01-03 | 2017-04-11 | Telenav, Inc. | Content delivery system with barge-in mechanism and method of operation thereof |
US20200294521A1 (en) * | 2013-03-13 | 2020-09-17 | Kopin Corporation | Microphone configurations for eyewear devices, systems, apparatuses, and methods |
US9671864B2 (en) * | 2013-03-21 | 2017-06-06 | Chian Chiu Li | System and methods for providing information |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
JP6376132B2 (ja) * | 2013-09-17 | 2018-08-22 | 日本電気株式会社 | 音声処理システム、車両、音声処理ユニット、ステアリングホイールユニット、音声処理方法、ならびに音声処理プログラム |
US10134395B2 (en) * | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
US9532131B2 (en) * | 2014-02-21 | 2016-12-27 | Apple Inc. | System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device |
EP3040984B1 (en) * | 2015-01-02 | 2022-07-13 | Harman Becker Automotive Systems GmbH | Sound zone arrangment with zonewise speech suppresion |
EP3292703B8 (en) * | 2015-05-15 | 2021-03-10 | Nureva Inc. | System and method for embedding additional information in a sound mask noise signal |
US9913065B2 (en) * | 2015-07-06 | 2018-03-06 | Bose Corporation | Simulating acoustic output at a location corresponding to source position data |
CN108464015B (zh) * | 2015-08-19 | 2020-11-20 | 数字信号处理器调节有限公司 | 麦克风阵列信号处理*** |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
CN107016999B (zh) | 2015-10-16 | 2022-06-14 | 谷歌有限责任公司 | 热词识别 |
KR102476600B1 (ko) * | 2015-10-21 | 2022-12-12 | 삼성전자주식회사 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US10412490B2 (en) * | 2016-02-25 | 2019-09-10 | Dolby Laboratories Licensing Corporation | Multitalker optimised beamforming system and method |
US9997173B2 (en) * | 2016-03-14 | 2018-06-12 | Apple Inc. | System and method for performing automatic gain control using an accelerometer in a headset |
EP3472831B8 (en) * | 2016-06-15 | 2020-07-01 | Cerence Operating Company | Techniques for wake-up word recognition and related systems and methods |
JP2018066232A (ja) | 2016-10-21 | 2018-04-26 | 株式会社Ihi | 埋込金物及びタンクの構築方法 |
US10210863B2 (en) * | 2016-11-02 | 2019-02-19 | Roku, Inc. | Reception of audio commands |
CN106378786B (zh) * | 2016-11-30 | 2018-12-21 | 北京百度网讯科技有限公司 | 基于人工智能的机器人 |
US20180190282A1 (en) * | 2016-12-30 | 2018-07-05 | Qualcomm Incorporated | In-vehicle voice command control |
CN110326307B (zh) * | 2017-03-16 | 2021-06-01 | 松下知识产权经营株式会社 | 声学回声抑制装置以及声学回声抑制方法 |
KR20180118461A (ko) * | 2017-04-21 | 2018-10-31 | 엘지전자 주식회사 | 음성 인식 장치 및 음성 인식 방법 |
KR102352560B1 (ko) * | 2017-06-09 | 2022-01-19 | 현대자동차주식회사 | 차량용 키, 차량, 및 그 제어방법 |
US10966023B2 (en) * | 2017-08-01 | 2021-03-30 | Signify Holding B.V. | Lighting system with remote microphone |
US10504516B2 (en) * | 2017-09-13 | 2019-12-10 | Federal Signal Corporation | Voice control for emergency vehicle |
US10674303B2 (en) * | 2017-09-29 | 2020-06-02 | Apple Inc. | System and method for maintaining accuracy of voice recognition |
US10665234B2 (en) * | 2017-10-18 | 2020-05-26 | Motorola Mobility Llc | Detecting audio trigger phrases for a voice recognition session |
CN107808670B (zh) * | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
US10768697B2 (en) * | 2017-11-02 | 2020-09-08 | Chian Chiu Li | System and method for providing information |
US10805740B1 (en) * | 2017-12-01 | 2020-10-13 | Ross Snyder | Hearing enhancement system and method |
EP4191412A1 (en) * | 2017-12-08 | 2023-06-07 | Google LLC | Signal processing coordination among digital voice assistant computing devices |
US10884104B2 (en) * | 2017-12-20 | 2021-01-05 | Ecolink Intelligent Technology, Inc. | Monitoring device having 360 degree sensing capabilities |
WO2019136383A1 (en) * | 2018-01-05 | 2019-07-11 | Veoneer Us, Inc. | Vehicle microphone activation and/or control systems |
US10657981B1 (en) * | 2018-01-19 | 2020-05-19 | Amazon Technologies, Inc. | Acoustic echo cancellation with loudspeaker canceling beamformer |
KR102115222B1 (ko) * | 2018-01-24 | 2020-05-27 | 삼성전자주식회사 | 사운드를 제어하는 전자 장치 및 그 동작 방법 |
US20190237067A1 (en) * | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10885907B2 (en) * | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
WO2019181758A1 (ja) * | 2018-03-19 | 2019-09-26 | パナソニックIpマネジメント株式会社 | 会話支援装置 |
US10297245B1 (en) * | 2018-03-22 | 2019-05-21 | Cirrus Logic, Inc. | Wind noise reduction with beamforming |
JP7186375B2 (ja) | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
JP7023823B2 (ja) * | 2018-11-16 | 2022-02-22 | アルパイン株式会社 | 車載装置及び音声認識方法 |
CN113327608B (zh) * | 2021-06-03 | 2022-12-09 | 阿波罗智联(北京)科技有限公司 | 针对车辆的语音处理方法、装置、电子设备和介质 |
-
2018
- 2018-03-29 JP JP2018066232A patent/JP7186375B2/ja active Active
- 2018-12-11 EP EP18913012.3A patent/EP3779973A4/en active Pending
- 2018-12-11 US US16/979,714 patent/US11804220B2/en active Active
- 2018-12-11 WO PCT/JP2018/045419 patent/WO2019187371A1/ja active Application Filing
- 2018-12-11 CN CN201880091245.6A patent/CN111886647A/zh active Pending
-
2022
- 2022-11-14 JP JP2022181948A patent/JP7458013B2/ja active Active
-
2023
- 2023-09-19 US US18/370,162 patent/US20240005919A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001051694A (ja) | 1999-08-10 | 2001-02-23 | Fujitsu Ten Ltd | 音声認識装置 |
JP2005055667A (ja) | 2003-08-04 | 2005-03-03 | Sony Corp | 音声処理装置 |
JP2015513704A (ja) | 2012-03-16 | 2015-05-14 | ニュアンス コミュニケーションズ, インコーポレイテッド | ユーザ専用自動発話認識 |
WO2017138934A1 (en) | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
Also Published As
Publication number | Publication date |
---|---|
JP2019174778A (ja) | 2019-10-10 |
US11804220B2 (en) | 2023-10-31 |
US20240005919A1 (en) | 2024-01-04 |
CN111886647A (zh) | 2020-11-03 |
JP7458013B2 (ja) | 2024-03-29 |
EP3779973A4 (en) | 2021-04-21 |
WO2019187371A1 (ja) | 2019-10-03 |
US20210043198A1 (en) | 2021-02-11 |
JP2023011945A (ja) | 2023-01-24 |
EP3779973A1 (en) | 2021-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7186375B2 (ja) | 音声処理装置、音声処理方法および音声処理システム | |
EP3678135B1 (en) | Voice control in a multi-talker and multimedia environment | |
US6889189B2 (en) | Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations | |
US10290300B2 (en) | Text rule multi-accent speech recognition with single acoustic model and automatic accent detection | |
CN109545219A (zh) | 车载语音交互方法、***、设备及计算机可读存储介质 | |
WO2017081960A1 (ja) | 音声認識制御システム | |
JP2001075594A (ja) | 音声認識システム | |
CN109273006B (zh) | 车载***的语音控制方法、车载***、车辆及存储介质 | |
JP2004206063A (ja) | 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物 | |
US11393444B2 (en) | Noise suppressor for a vehicle and noise suppressing method for a vehicle | |
WO2017056706A1 (ja) | 車載音響装置 | |
JP2017069806A (ja) | スピーカアレイ装置 | |
CN102906811B (zh) | 用于调节包括扬声器和麦克风的语音识别***的方法及语音识别*** | |
KR20210151089A (ko) | 차량 시스템의 음성 제어 | |
JP2001013994A (ja) | 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両 | |
JP4561222B2 (ja) | 音声入力装置 | |
JP2020144204A (ja) | 信号処理装置及び信号処理方法 | |
KR20180102914A (ko) | 신경회로망 학습을 통한 노이즈 제거가 적용된 인포테인먼트 시스템 및 그 제어 방법 | |
EP3675512A1 (en) | Techniques for routing audio content to an asymmetric speaker layout within a vehicle | |
CN108538307A (zh) | 用于为音频信号去除干扰的方法和设备以及语音控制设备 | |
US11902767B2 (en) | Combining prerecorded and live performances in a vehicle | |
WO2022059214A1 (ja) | 車載装置及び車載システム | |
US20220324290A1 (en) | Apparatus, system, and method of active acoustic control (aac) | |
US20240212689A1 (en) | Speaker-specific speech filtering for multiple users | |
CN115701632A (zh) | 用于车内声音控制的***、方法、存储介质以及车辆 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7186375 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |