KR950015199A - 음성 인식 방법 및 장치 - Google Patents
음성 인식 방법 및 장치 Download PDFInfo
- Publication number
- KR950015199A KR950015199A KR1019940030146A KR19940030146A KR950015199A KR 950015199 A KR950015199 A KR 950015199A KR 1019940030146 A KR1019940030146 A KR 1019940030146A KR 19940030146 A KR19940030146 A KR 19940030146A KR 950015199 A KR950015199 A KR 950015199A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- recognition
- rhyme
- model
- similarity
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 23
- 230000033764 rhythmic process Effects 0.000 claims abstract 6
- 241000269627 Amphiuma means Species 0.000 claims 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 claims 1
- 229910052709 silver Inorganic materials 0.000 claims 1
- 239000004332 silver Substances 0.000 claims 1
- 230000001413 cellular effect Effects 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 음성인식 시스템에 관한 것이며 인식할 음성은 하나 이상의 단어를 포함한다. 인식은 제1발언과 제2발언의 분석에 기초한다. 본 발명에 따르면 제1발언은 하나 이상의 음성 모형과 비교되어 이 비교 각각에 대한 운율 유사성이 결정된다. 제1발언과 가장 잘 일치하는 음성모형은 하나 이상의 운율 유사성에 기초해서 결정된다. 가장 일치하는 음성모형에 대응하는 운율 유사성은 이 운율 유사성이 제1인식 기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 가장 일치하는 모형과 관련된 하나 이상의 음성모형(여기에는 가장 일치하는 모형이 포함될 수도 있음)과 비교되어 제2발언 운율 유사성이 결정 된다. 하나 이상의 제2발언 운율 유사성은 이것이 제2인식기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 제1인식기준과 제2인식기준이 만족된 경우에 가장 일치하는 음성모형에 대응하는 어구로서 인식된다 본 발명은 개별 단어 인식과 명령 감지를 포함해서 음성인식의 여러 과제들에 적용된다. 본 발명의 예시적 실시예를 셀룰러 전화기로 설명하였지만, 다른 실시예에 대한 것도 논의되어 있다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 예시적 실시예로서 셀룰러 전화기의 실시예,
제2도는 제1도의 음성 인식 시스템의 수치형(digital)신호처리기의 흐름 블럭도,
제3도는 제2도의 의사 결정기(decision maker)블럭의 흐름도,
제4도는 제1도-제3도의 실시예에 의해 실시되는 인식 처리의 예시도,
제5도는 인식기 변수값들과 인식기 성능간의 관계를 나타내는 그래프.
Claims (44)
- 제1발언과 제2발언에 기초해서 하나 이상의 단어를 포함하는 어구를 인식하는 방법으로서, 가. 상기 제1발언을 하나 이상의 음성모형과 비교하여 운율 유사성을 결정하는 단계, 나. 상기 운율 유사성 하나 이상에 기초해서 어떤 음성모형이 제1발언과 가장 일치하는지 결정하는 단계, 다. 상기 가장 일치하는 음성모형과 대응하는 은율 유사성이 제1인식기준을 만족하는지 결정하는 단계, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성모형과 상기 제2발언을 비교하여 제2발언에 대한 운율 유사성을 결정하는 단계, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식 기준을 만족하는지 결정하는 단계, 바. 상기 제1인식기준과 제2인식기준이 만족되는 경우에는 상기 제2발언을 상기 가장 일치하는 음성모형에 대응하는 어구로 인식하는 단계로 이루어진 어구 인식방법,
- 제1항에 있어서, 상기 제1발언의 운율 유사성을 결정하는 단계는 상기 제1발언과 음향 배경을 반영하는 모형을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법
- 제1항에 있어서, 상기 어구는 개별 단어에 해당하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 가장 일치하는 모형과 관련된 어구에 대응하는 음성모형과 상기 가장 일치하는 모형이 서로 동일한 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 어구 인식 방법.
- 제5항에 있어서, 상기 음성모형은 음향 배경도 반영하는 것을 특징으로 하는 어구 인식방법.
- 제5항에 있어서, 상기 소정의 단어는 이용장치(utilization device)에 대한 명령어를 포함하는 것을 특징으로 하는 어구 인식 방법.
- 제1항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 단계가 더 추가되는 것을 특징으로 하는 어구 인식방법.
- 제8항에 있어서, 상기 제1발언을 받아들이는 단계가 더 추가되고, 상기 소정의 시간 기간은 상기 제1발언을 받아들이고 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
- 제8항에 있어서, 상기 제2발언에 대해 독촉을 하는 단계가 더 추가되고, 상기 소정의 시간시간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 제1인식기준과 상기 제2인식기준이 동일한 것을 특징으로 하는 어구 인식 방법.
- 제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성을 제2임계값과 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 단계를 포함하고, 상기 제2인식 기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성이 제2임계값을 만족하는지 결정하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
- 제14항에 있어서, 상기 제1임계값과 제2임계값이 동일한 것을 특징으로 하는 어구 인식방법
- 제1항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
- 제1항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법
- 제1항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법.
- 제1항에 있어서, 상기 단계들은 전기 통신망에서 구현되어 통신망 서비스의 동작을 용이하게 하는 것을 특징으로 하는 어구.
- 제1항에 있어서, 상기 단계드른 컴퓨터에서 구현되어 컴퓨터의 동작을 용이하게 하는 것을 특징으로 하는 어구 인식방법.
- 제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성인식장치로서, 가.제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단, 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식장치.
- 제22항에 있어서, 상기 '가' 수단은 상기 제1 발언과 음향 배경을 반영하는 모형을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 음성모형과, 상기 가장 일치하는 음성모형이 동일한 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 음성 인식 장치.
- 제25항에 있어서, 상기 음성모형은 음향배경도 또한 반영하는 것을 특징으로 하는 음성 인식장치.
- 제25항에 있어서, 상기 소정의 단어는 여용장치에 대한 명령구를 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제22항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 수단을 더 구비하는 것을 특징으로 하는 음성 인식장치
- 제28항에 있어서, 상기 제1발언은 받아들이는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 제1발언을 받고 소정시간 후에 시작하는 것을 특징으로 하는 음성 인식장치.
- 제28항에 있어서, 상기 제2발언에 대해 독촉을 하는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제1인식기준과 상기 제2인식기준에 동일한 것을 특징으로 하는 음성 인식 장치.
- 제22항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 수단은 상기 제2발언 운율 유사성을 제2임계값과 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제1인식기준에 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 수단을 포함하고, 상기 제2인식 기준이 만족하는지 결정하는·수단은 상기 제2발언운율 유사성이 제2임계값을 만족하는지 결정하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
- 제34항에 있어서, 상기 제1임계값과 제2임계값은 동일한 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
- 제22항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식 장치,
- 제22항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식장치.
- 전화기에 있어서, 1) 마이크와 2) 제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성 인식기로서, 가. 제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식기, 3) 상기 인식된 제2발언에 응답해서 전화 동작을 제공하는 전화 회로를 구비하는 전화기.
- 제40항에 있어서, 무선 송수신기와, 상기 전화회로에 의해 제공되는 제어신호들에 응답해서 상기 마이크와 상기 전화회로를 상기 무선 송수신기에 접속 시키는 오디오 처리 수단을 더 구비하는 것을 특징으로 하는 전화기.
- 제40항에 있어서, 상기 마이크는 손잡이가 없는 마이크인 것을 특징으로 하는 전화기.
- 제40항에 있어서, 상기 마이크는 핸드셋 마이크인 것을 특징으로 하는 전화기.
- 제40항에 있어서, 상기 전화기에 결합되어 무선 전화 통신을 제공하는 무선 송수신기를 더 구비하는 것을 특징으로 하는 전화기.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15809693A | 1993-11-24 | 1993-11-24 | |
US158,096 | 1993-11-24 | ||
US158096 | 1993-11-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR950015199A true KR950015199A (ko) | 1995-06-16 |
KR100321011B1 KR100321011B1 (ko) | 2002-06-20 |
Family
ID=22566668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940030146A KR100321011B1 (ko) | 1993-11-24 | 1994-11-17 | 음성인식방법및장치 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5737724A (ko) |
EP (1) | EP0655732B1 (ko) |
JP (1) | JP3363630B2 (ko) |
KR (1) | KR100321011B1 (ko) |
CA (1) | CA2117932C (ko) |
DE (1) | DE69426969T2 (ko) |
ES (1) | ES2156890T3 (ko) |
TW (1) | TW323364B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040001828A (ko) * | 2002-06-28 | 2004-01-07 | 주식회사 케이티 | 음성인식 시스템에서 중복명칭 처리 방법 |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2180392C (en) * | 1995-07-31 | 2001-02-13 | Paul Wesley Cohrs | User selectable multiple threshold criteria for voice recognition |
US5903864A (en) * | 1995-08-30 | 1999-05-11 | Dragon Systems | Speech recognition |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US5950160A (en) | 1996-10-31 | 1999-09-07 | Microsoft Corporation | Method and system for displaying a variable number of alternative words during speech recognition |
US6023676A (en) * | 1996-12-12 | 2000-02-08 | Dspc Israel, Ltd. | Keyword recognition system and method |
US6490561B1 (en) * | 1997-06-25 | 2002-12-03 | Dennis L. Wilson | Continuous speech voice transcription |
DE19754957A1 (de) * | 1997-12-11 | 1999-06-17 | Daimler Chrysler Ag | Verfahren zur Spracherkennung |
US6775652B1 (en) | 1998-06-30 | 2004-08-10 | At&T Corp. | Speech recognition over lossy transmission systems |
FI116991B (fi) * | 1999-01-18 | 2006-04-28 | Nokia Corp | Menetelmä puheen tunnistamisessa, puheentunnistuslaite ja puheella ohjattava langaton viestin |
JP2000244625A (ja) * | 1999-02-23 | 2000-09-08 | Nec Saitama Ltd | 携帯電話機における音声認識起動方法及び音声認識携帯電話装置 |
US6374221B1 (en) | 1999-06-22 | 2002-04-16 | Lucent Technologies Inc. | Automatic retraining of a speech recognizer while using reliable transcripts |
US6941266B1 (en) * | 2000-11-15 | 2005-09-06 | At&T Corp. | Method and system for predicting problematic dialog situations in a task classification system |
AU2002246550A1 (en) * | 2000-11-30 | 2002-08-06 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
US6785650B2 (en) * | 2001-03-16 | 2004-08-31 | International Business Machines Corporation | Hierarchical transcription and display of input speech |
GB2383459B (en) * | 2001-12-20 | 2005-05-18 | Hewlett Packard Co | Speech recognition system and method |
US7003158B1 (en) * | 2002-02-14 | 2006-02-21 | Microsoft Corporation | Handwriting recognition with mixtures of Bayesian networks |
US20040158468A1 (en) * | 2003-02-12 | 2004-08-12 | Aurilab, Llc | Speech recognition with soft pruning |
US7949533B2 (en) * | 2005-02-04 | 2011-05-24 | Vococollect, Inc. | Methods and systems for assessing and improving the performance of a speech recognition system |
US7895039B2 (en) * | 2005-02-04 | 2011-02-22 | Vocollect, Inc. | Methods and systems for optimizing model adaptation for a speech recognition system |
US8200495B2 (en) | 2005-02-04 | 2012-06-12 | Vocollect, Inc. | Methods and systems for considering information about an expected response when performing speech recognition |
US7865362B2 (en) * | 2005-02-04 | 2011-01-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US7827032B2 (en) | 2005-02-04 | 2010-11-02 | Vocollect, Inc. | Methods and systems for adapting a model for a speech recognition system |
US8185400B1 (en) * | 2005-10-07 | 2012-05-22 | At&T Intellectual Property Ii, L.P. | System and method for isolating and processing common dialog cues |
KR100738414B1 (ko) | 2006-02-06 | 2007-07-11 | 삼성전자주식회사 | 텔레매틱스 환경에서 음성 인식의 성능을 향상시키기 위한방법 및 상기 방법을 수행하는 장치 |
EP2005417A2 (en) * | 2006-04-03 | 2008-12-24 | Vocollect, Inc. | Methods and systems for optimizing model adaptation for a speech recognition system |
US7899674B1 (en) * | 2006-08-11 | 2011-03-01 | The United States Of America As Represented By The Secretary Of The Navy | GUI for the semantic normalization of natural language |
US8725492B2 (en) * | 2008-03-05 | 2014-05-13 | Microsoft Corporation | Recognizing multiple semantic items from single utterance |
JP5024154B2 (ja) * | 2008-03-27 | 2012-09-12 | 富士通株式会社 | 関連付け装置、関連付け方法及びコンピュータプログラム |
JP5049930B2 (ja) * | 2008-09-09 | 2012-10-17 | 株式会社日立製作所 | 分散型音声認識システム |
US8965765B2 (en) * | 2008-09-19 | 2015-02-24 | Microsoft Corporation | Structured models of repetition for speech recognition |
US8386251B2 (en) * | 2009-06-08 | 2013-02-26 | Microsoft Corporation | Progressive application of knowledge sources in multistage speech recognition |
US8639513B2 (en) * | 2009-08-05 | 2014-01-28 | Verizon Patent And Licensing Inc. | Automated communication integrator |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
EP2339576B1 (en) | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
JP5533042B2 (ja) * | 2010-03-04 | 2014-06-25 | 富士通株式会社 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
US20150279354A1 (en) * | 2010-05-19 | 2015-10-01 | Google Inc. | Personalization and Latency Reduction for Voice-Activated Commands |
US9118669B2 (en) | 2010-09-30 | 2015-08-25 | Alcatel Lucent | Method and apparatus for voice signature authentication |
US9123339B1 (en) | 2010-11-23 | 2015-09-01 | Google Inc. | Speech recognition using repeated utterances |
TWI412019B (zh) | 2010-12-03 | 2013-10-11 | Ind Tech Res Inst | 聲音事件偵測模組及其方法 |
US8352245B1 (en) | 2010-12-30 | 2013-01-08 | Google Inc. | Adjusting language models |
US8296142B2 (en) | 2011-01-21 | 2012-10-23 | Google Inc. | Speech recognition using dock context |
US8914290B2 (en) | 2011-05-20 | 2014-12-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US9093075B2 (en) | 2012-04-20 | 2015-07-28 | Google Technology Holdings LLC | Recognizing repeated speech in a mobile computing device |
US9978395B2 (en) | 2013-03-15 | 2018-05-22 | Vocollect, Inc. | Method and system for mitigating delay in receiving audio stream during production of sound from audio stream |
WO2015079568A1 (ja) * | 2013-11-29 | 2015-06-04 | 三菱電機株式会社 | 音声認識装置 |
US9899021B1 (en) * | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
WO2015116151A1 (en) * | 2014-01-31 | 2015-08-06 | Hewlett-Packard Development Company, L.P. | Voice input command |
US9842592B2 (en) | 2014-02-12 | 2017-12-12 | Google Inc. | Language models using non-linguistic context |
US9412365B2 (en) | 2014-03-24 | 2016-08-09 | Google Inc. | Enhanced maximum entropy models |
WO2016039847A1 (en) * | 2014-09-11 | 2016-03-17 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup |
GB2535766B (en) * | 2015-02-27 | 2019-06-12 | Imagination Tech Ltd | Low power detection of an activation phrase |
US10134394B2 (en) | 2015-03-20 | 2018-11-20 | Google Llc | Speech recognition using log-linear model |
EP3089159B1 (en) | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
US9978367B2 (en) | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
US10714121B2 (en) | 2016-07-27 | 2020-07-14 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
US10832664B2 (en) | 2016-08-19 | 2020-11-10 | Google Llc | Automated speech recognition using language models that selectively use domain-specific model components |
US10311860B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Language model biasing system |
KR102509821B1 (ko) * | 2017-09-18 | 2023-03-14 | 삼성전자주식회사 | Oos 문장을 생성하는 방법 및 이를 수행하는 장치 |
US10872599B1 (en) * | 2018-06-28 | 2020-12-22 | Amazon Technologies, Inc. | Wakeword training |
WO2020139121A1 (en) * | 2018-12-28 | 2020-07-02 | Ringcentral, Inc., (A Delaware Corporation) | Systems and methods for recognizing a speech of a speaker |
US11830486B2 (en) * | 2020-10-13 | 2023-11-28 | Google Llc | Detecting near matches to a hotword or phrase |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE625775C (de) * | 1933-09-20 | 1936-02-15 | Briggs Mfg Co | Elektrische Punktschweissmaschine |
US4348550A (en) * | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
JPS5879300A (ja) * | 1981-11-06 | 1983-05-13 | 日本電気株式会社 | パタ−ン距離計算方式 |
US4618984A (en) * | 1983-06-08 | 1986-10-21 | International Business Machines Corporation | Adaptive automatic discrete utterance recognition |
NL8500339A (nl) * | 1985-02-07 | 1986-09-01 | Philips Nv | Adaptief responderend systeem. |
US4759068A (en) * | 1985-05-29 | 1988-07-19 | International Business Machines Corporation | Constructing Markov models of words from multiple utterances |
US4827520A (en) * | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
FI97919C (fi) * | 1992-06-05 | 1997-03-10 | Nokia Mobile Phones Ltd | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
US5452397A (en) * | 1992-12-11 | 1995-09-19 | Texas Instruments Incorporated | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list |
-
1994
- 1994-03-30 TW TW083102745A patent/TW323364B/zh active
- 1994-10-12 CA CA002117932A patent/CA2117932C/en not_active Expired - Fee Related
- 1994-11-16 ES ES94308474T patent/ES2156890T3/es not_active Expired - Lifetime
- 1994-11-16 EP EP94308474A patent/EP0655732B1/en not_active Expired - Lifetime
- 1994-11-16 DE DE69426969T patent/DE69426969T2/de not_active Expired - Fee Related
- 1994-11-17 KR KR1019940030146A patent/KR100321011B1/ko not_active IP Right Cessation
- 1994-11-24 JP JP31239794A patent/JP3363630B2/ja not_active Expired - Fee Related
-
1996
- 1996-08-08 US US08/695,140 patent/US5737724A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040001828A (ko) * | 2002-06-28 | 2004-01-07 | 주식회사 케이티 | 음성인식 시스템에서 중복명칭 처리 방법 |
Also Published As
Publication number | Publication date |
---|---|
EP0655732A2 (en) | 1995-05-31 |
KR100321011B1 (ko) | 2002-06-20 |
US5737724A (en) | 1998-04-07 |
CA2117932A1 (en) | 1995-05-25 |
EP0655732B1 (en) | 2001-03-28 |
EP0655732A3 (en) | 1997-06-18 |
DE69426969T2 (de) | 2001-10-25 |
TW323364B (ko) | 1997-12-21 |
CA2117932C (en) | 1998-12-15 |
DE69426969D1 (de) | 2001-05-03 |
JPH07199985A (ja) | 1995-08-04 |
ES2156890T3 (es) | 2001-08-01 |
JP3363630B2 (ja) | 2003-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR950015199A (ko) | 음성 인식 방법 및 장치 | |
KR100984528B1 (ko) | 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법 | |
US7941313B2 (en) | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system | |
US6519479B1 (en) | Spoken user interface for speech-enabled devices | |
US7209880B1 (en) | Systems and methods for dynamic re-configurable speech recognition | |
KR100636317B1 (ko) | 분산 음성 인식 시스템 및 그 방법 | |
US5960393A (en) | User selectable multiple threshold criteria for voice recognition | |
US20050049870A1 (en) | Open vocabulary speech recognition | |
US5842161A (en) | Telecommunications instrument employing variable criteria speech recognition | |
US20040260547A1 (en) | Signal-to-noise mediated speech recognition algorithm | |
EP1220197A2 (en) | Speech recognition method and system | |
US20020178004A1 (en) | Method and apparatus for voice recognition | |
EP0398574A3 (en) | Speech recognition employing key word modeling and non-key word modeling | |
KR20010093334A (ko) | 잡음 신호에서 음성의 엔드포인팅 방법 | |
KR20010093327A (ko) | 음성 인식 제거 체계 | |
US20070129945A1 (en) | Voice quality control for high quality speech reconstruction | |
KR100281582B1 (ko) | 인식기 자원을 효율적으로 사용하는 음성인식 방법 | |
JP2001522070A (ja) | パターン認識 | |
Bou-Ghazale et al. | Hands-free voice activation of personal communication devices | |
Littel et al. | Speech recognition for the Siemens EWSD public exchange | |
Krasinski et al. | Automatic speech recognition for network call routing | |
Lim et al. | Analysis of twin beam generation by frequency doubling in a dual ported resonator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20061226 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |