KR950015199A - 음성 인식 방법 및 장치 - Google Patents

음성 인식 방법 및 장치 Download PDF

Info

Publication number
KR950015199A
KR950015199A KR1019940030146A KR19940030146A KR950015199A KR 950015199 A KR950015199 A KR 950015199A KR 1019940030146 A KR1019940030146 A KR 1019940030146A KR 19940030146 A KR19940030146 A KR 19940030146A KR 950015199 A KR950015199 A KR 950015199A
Authority
KR
South Korea
Prior art keywords
speech
recognition
rhyme
model
similarity
Prior art date
Application number
KR1019940030146A
Other languages
English (en)
Other versions
KR100321011B1 (ko
Inventor
사루프 아탈 비시누
하이미-코헨 라질
비온 로 데이비드
Original Assignee
토마스 에이. 리스테이노
에이티 앤드 티 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 토마스 에이. 리스테이노, 에이티 앤드 티 코포레이션 filed Critical 토마스 에이. 리스테이노
Publication of KR950015199A publication Critical patent/KR950015199A/ko
Application granted granted Critical
Publication of KR100321011B1 publication Critical patent/KR100321011B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 음성인식 시스템에 관한 것이며 인식할 음성은 하나 이상의 단어를 포함한다. 인식은 제1발언과 제2발언의 분석에 기초한다. 본 발명에 따르면 제1발언은 하나 이상의 음성 모형과 비교되어 이 비교 각각에 대한 운율 유사성이 결정된다. 제1발언과 가장 잘 일치하는 음성모형은 하나 이상의 운율 유사성에 기초해서 결정된다. 가장 일치하는 음성모형에 대응하는 운율 유사성은 이 운율 유사성이 제1인식 기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 가장 일치하는 모형과 관련된 하나 이상의 음성모형(여기에는 가장 일치하는 모형이 포함될 수도 있음)과 비교되어 제2발언 운율 유사성이 결정 된다. 하나 이상의 제2발언 운율 유사성은 이것이 제2인식기준을 만족하는지 결정하기 위해 분석된다. 제2발언은 제1인식기준과 제2인식기준이 만족된 경우에 가장 일치하는 음성모형에 대응하는 어구로서 인식된다 본 발명은 개별 단어 인식과 명령 감지를 포함해서 음성인식의 여러 과제들에 적용된다. 본 발명의 예시적 실시예를 셀룰러 전화기로 설명하였지만, 다른 실시예에 대한 것도 논의되어 있다.

Description

음성 인식 방법 및 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 예시적 실시예로서 셀룰러 전화기의 실시예,
제2도는 제1도의 음성 인식 시스템의 수치형(digital)신호처리기의 흐름 블럭도,
제3도는 제2도의 의사 결정기(decision maker)블럭의 흐름도,
제4도는 제1도-제3도의 실시예에 의해 실시되는 인식 처리의 예시도,
제5도는 인식기 변수값들과 인식기 성능간의 관계를 나타내는 그래프.

Claims (44)

  1. 제1발언과 제2발언에 기초해서 하나 이상의 단어를 포함하는 어구를 인식하는 방법으로서, 가. 상기 제1발언을 하나 이상의 음성모형과 비교하여 운율 유사성을 결정하는 단계, 나. 상기 운율 유사성 하나 이상에 기초해서 어떤 음성모형이 제1발언과 가장 일치하는지 결정하는 단계, 다. 상기 가장 일치하는 음성모형과 대응하는 은율 유사성이 제1인식기준을 만족하는지 결정하는 단계, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성모형과 상기 제2발언을 비교하여 제2발언에 대한 운율 유사성을 결정하는 단계, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식 기준을 만족하는지 결정하는 단계, 바. 상기 제1인식기준과 제2인식기준이 만족되는 경우에는 상기 제2발언을 상기 가장 일치하는 음성모형에 대응하는 어구로 인식하는 단계로 이루어진 어구 인식방법,
  2. 제1항에 있어서, 상기 제1발언의 운율 유사성을 결정하는 단계는 상기 제1발언과 음향 배경을 반영하는 모형을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법
  3. 제1항에 있어서, 상기 어구는 개별 단어에 해당하는 것을 특징으로 하는 어구 인식방법.
  4. 제1항에 있어서, 상기 가장 일치하는 모형과 관련된 어구에 대응하는 음성모형과 상기 가장 일치하는 모형이 서로 동일한 것을 특징으로 하는 어구 인식방법.
  5. 제1항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 어구 인식 방법.
  6. 제5항에 있어서, 상기 음성모형은 음향 배경도 반영하는 것을 특징으로 하는 어구 인식방법.
  7. 제5항에 있어서, 상기 소정의 단어는 이용장치(utilization device)에 대한 명령어를 포함하는 것을 특징으로 하는 어구 인식 방법.
  8. 제1항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 단계가 더 추가되는 것을 특징으로 하는 어구 인식방법.
  9. 제8항에 있어서, 상기 제1발언을 받아들이는 단계가 더 추가되고, 상기 소정의 시간 기간은 상기 제1발언을 받아들이고 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
  10. 제8항에 있어서, 상기 제2발언에 대해 독촉을 하는 단계가 더 추가되고, 상기 소정의 시간시간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 어구 인식방법.
  11. 제1항에 있어서, 상기 제1인식기준과 상기 제2인식기준이 동일한 것을 특징으로 하는 어구 인식 방법.
  12. 제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
  13. 제1항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성을 제2임계값과 비교하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
  14. 제1항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 단계는 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 단계를 포함하고, 상기 제2인식 기준이 만족하는지 결정하는 단계는 상기 제2발언 운율 유사성이 제2임계값을 만족하는지 결정하는 단계를 포함하는 것을 특징으로 하는 어구 인식방법.
  15. 제14항에 있어서, 상기 제1임계값과 제2임계값이 동일한 것을 특징으로 하는 어구 인식방법
  16. 제1항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
  17. 제1항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 어구 인식방법.
  18. 제1항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법
  19. 제1항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 어구 인식 방법.
  20. 제1항에 있어서, 상기 단계들은 전기 통신망에서 구현되어 통신망 서비스의 동작을 용이하게 하는 것을 특징으로 하는 어구.
  21. 제1항에 있어서, 상기 단계드른 컴퓨터에서 구현되어 컴퓨터의 동작을 용이하게 하는 것을 특징으로 하는 어구 인식방법.
  22. 제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성인식장치로서, 가.제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단, 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식장치.
  23. 제22항에 있어서, 상기 '가' 수단은 상기 제1 발언과 음향 배경을 반영하는 모형을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
  24. 제22항에 있어서, 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 음성모형과, 상기 가장 일치하는 음성모형이 동일한 것을 특징으로 하는 음성 인식장치.
  25. 제22항에 있어서, 음성모형은 하나 이상의 소정의 단어들을 반영하는 것을 특징으로 하는 음성 인식 장치.
  26. 제25항에 있어서, 상기 음성모형은 음향배경도 또한 반영하는 것을 특징으로 하는 음성 인식장치.
  27. 제25항에 있어서, 상기 소정의 단어는 여용장치에 대한 명령구를 포함하는 것을 특징으로 하는 음성 인식 장치.
  28. 제22항에 있어서, 소정의 시간 기간동안에 상기 제2발언을 받아들이는 수단을 더 구비하는 것을 특징으로 하는 음성 인식장치
  29. 제28항에 있어서, 상기 제1발언은 받아들이는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 제1발언을 받고 소정시간 후에 시작하는 것을 특징으로 하는 음성 인식장치.
  30. 제28항에 있어서, 상기 제2발언에 대해 독촉을 하는 수단을 더 구비하고, 상기 소정의 시간기간은 상기 독촉을 하고 나서 소정 시간뒤에 시작하는 것을 특징으로 하는 음성 인식장치.
  31. 제22항에 있어서, 상기 제1인식기준과 상기 제2인식기준에 동일한 것을 특징으로 하는 음성 인식 장치.
  32. 제22항에 있어서, 상기 제1인식기준이 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성과 제1임계값을 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
  33. 제22항에 있어서, 상기 제2인식기준이 만족하는지 결정하는 수단은 상기 제2발언 운율 유사성을 제2임계값과 비교하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
  34. 제22항에 있어서, 상기 제1인식기준에 만족하는지 결정하는 수단은 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1임계값을 만족하는지 결정하는 수단을 포함하고, 상기 제2인식 기준이 만족하는지 결정하는·수단은 상기 제2발언운율 유사성이 제2임계값을 만족하는지 결정하는 수단을 포함하는 것을 특징으로 하는 음성 인식장치.
  35. 제34항에 있어서, 상기 제1임계값과 제2임계값은 동일한 것을 특징으로 하는 음성 인식장치.
  36. 제22항에 있어서, 상기 제1인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
  37. 제22항에 있어서, 상기 제2인식기준은 인식될 어구에 기초하는 것을 특징으로 하는 음성 인식장치.
  38. 제22항에 있어서, 상기 제1인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식 장치,
  39. 제22항에 있어서, 상기 제2인식기준은 이용장치의 상태에 기초하는 것을 특징으로 하는 음성 인식장치.
  40. 전화기에 있어서, 1) 마이크와 2) 제1발언과 제2발언에 기초해서 하나 이상의 단어들을 포함하는 어구를 인식하는 음성 인식기로서, 가. 제1발언과 하나 이상의 음성모형을 비교하여 운율 유사성을 결정하는 수단, 나. 하나 이상의 운율 유사성에 기초해서 어떤 음성 모형이 상기 제1발언과 가장 일치하는지 결정하는 수단, 다. 상기 가장 일치하는 음성모형에 대응하는 운율 유사성이 제1인식기준을 만족하는지 결정하는 수단, 라. 상기 가장 일치하는 음성모형과 관련된 어구에 대응하는 하나 이상의 음성 모형을 상기 제2발언과 비교하여, 제2발언 운율 유사성을 결정하는 수단, 마. 하나 이상의 상기 제2발언 운율 유사성이 제2인식기준을 만족하는지 결정하는 수단 바. 상기 제1인식기준과 상기 제2인식기준이 만족되는 때에는 상기 제2발언을 상기 가장 일치하는 음성 모형에 대응하는 어구로 인식하는 수단을 구비하는 음성 인식기, 3) 상기 인식된 제2발언에 응답해서 전화 동작을 제공하는 전화 회로를 구비하는 전화기.
  41. 제40항에 있어서, 무선 송수신기와, 상기 전화회로에 의해 제공되는 제어신호들에 응답해서 상기 마이크와 상기 전화회로를 상기 무선 송수신기에 접속 시키는 오디오 처리 수단을 더 구비하는 것을 특징으로 하는 전화기.
  42. 제40항에 있어서, 상기 마이크는 손잡이가 없는 마이크인 것을 특징으로 하는 전화기.
  43. 제40항에 있어서, 상기 마이크는 핸드셋 마이크인 것을 특징으로 하는 전화기.
  44. 제40항에 있어서, 상기 전화기에 결합되어 무선 전화 통신을 제공하는 무선 송수신기를 더 구비하는 것을 특징으로 하는 전화기.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940030146A 1993-11-24 1994-11-17 음성인식방법및장치 KR100321011B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15809693A 1993-11-24 1993-11-24
US158,096 1993-11-24
US158096 1993-11-24

Publications (2)

Publication Number Publication Date
KR950015199A true KR950015199A (ko) 1995-06-16
KR100321011B1 KR100321011B1 (ko) 2002-06-20

Family

ID=22566668

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940030146A KR100321011B1 (ko) 1993-11-24 1994-11-17 음성인식방법및장치

Country Status (8)

Country Link
US (1) US5737724A (ko)
EP (1) EP0655732B1 (ko)
JP (1) JP3363630B2 (ko)
KR (1) KR100321011B1 (ko)
CA (1) CA2117932C (ko)
DE (1) DE69426969T2 (ko)
ES (1) ES2156890T3 (ko)
TW (1) TW323364B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040001828A (ko) * 2002-06-28 2004-01-07 주식회사 케이티 음성인식 시스템에서 중복명칭 처리 방법

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2180392C (en) * 1995-07-31 2001-02-13 Paul Wesley Cohrs User selectable multiple threshold criteria for voice recognition
US5903864A (en) * 1995-08-30 1999-05-11 Dragon Systems Speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
US5950160A (en) 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US6023676A (en) * 1996-12-12 2000-02-08 Dspc Israel, Ltd. Keyword recognition system and method
US6490561B1 (en) * 1997-06-25 2002-12-03 Dennis L. Wilson Continuous speech voice transcription
DE19754957A1 (de) * 1997-12-11 1999-06-17 Daimler Chrysler Ag Verfahren zur Spracherkennung
US6775652B1 (en) 1998-06-30 2004-08-10 At&T Corp. Speech recognition over lossy transmission systems
FI116991B (fi) * 1999-01-18 2006-04-28 Nokia Corp Menetelmä puheen tunnistamisessa, puheentunnistuslaite ja puheella ohjattava langaton viestin
JP2000244625A (ja) * 1999-02-23 2000-09-08 Nec Saitama Ltd 携帯電話機における音声認識起動方法及び音声認識携帯電話装置
US6374221B1 (en) 1999-06-22 2002-04-16 Lucent Technologies Inc. Automatic retraining of a speech recognizer while using reliable transcripts
US6941266B1 (en) * 2000-11-15 2005-09-06 At&T Corp. Method and system for predicting problematic dialog situations in a task classification system
AU2002246550A1 (en) * 2000-11-30 2002-08-06 Enterprise Integration Group, Inc. Method and system for preventing error amplification in natural language dialogues
US6785650B2 (en) * 2001-03-16 2004-08-31 International Business Machines Corporation Hierarchical transcription and display of input speech
GB2383459B (en) * 2001-12-20 2005-05-18 Hewlett Packard Co Speech recognition system and method
US7003158B1 (en) * 2002-02-14 2006-02-21 Microsoft Corporation Handwriting recognition with mixtures of Bayesian networks
US20040158468A1 (en) * 2003-02-12 2004-08-12 Aurilab, Llc Speech recognition with soft pruning
US7949533B2 (en) * 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US7895039B2 (en) * 2005-02-04 2011-02-22 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US8200495B2 (en) 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
US7865362B2 (en) * 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US8185400B1 (en) * 2005-10-07 2012-05-22 At&T Intellectual Property Ii, L.P. System and method for isolating and processing common dialog cues
KR100738414B1 (ko) 2006-02-06 2007-07-11 삼성전자주식회사 텔레매틱스 환경에서 음성 인식의 성능을 향상시키기 위한방법 및 상기 방법을 수행하는 장치
EP2005417A2 (en) * 2006-04-03 2008-12-24 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US7899674B1 (en) * 2006-08-11 2011-03-01 The United States Of America As Represented By The Secretary Of The Navy GUI for the semantic normalization of natural language
US8725492B2 (en) * 2008-03-05 2014-05-13 Microsoft Corporation Recognizing multiple semantic items from single utterance
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
JP5049930B2 (ja) * 2008-09-09 2012-10-17 株式会社日立製作所 分散型音声認識システム
US8965765B2 (en) * 2008-09-19 2015-02-24 Microsoft Corporation Structured models of repetition for speech recognition
US8386251B2 (en) * 2009-06-08 2013-02-26 Microsoft Corporation Progressive application of knowledge sources in multistage speech recognition
US8639513B2 (en) * 2009-08-05 2014-01-28 Verizon Patent And Licensing Inc. Automated communication integrator
US11416214B2 (en) 2009-12-23 2022-08-16 Google Llc Multi-modal input on an electronic device
EP2339576B1 (en) 2009-12-23 2019-08-07 Google LLC Multi-modal input on an electronic device
JP5533042B2 (ja) * 2010-03-04 2014-06-25 富士通株式会社 音声検索装置、音声検索方法、プログラム及び記録媒体
US20150279354A1 (en) * 2010-05-19 2015-10-01 Google Inc. Personalization and Latency Reduction for Voice-Activated Commands
US9118669B2 (en) 2010-09-30 2015-08-25 Alcatel Lucent Method and apparatus for voice signature authentication
US9123339B1 (en) 2010-11-23 2015-09-01 Google Inc. Speech recognition using repeated utterances
TWI412019B (zh) 2010-12-03 2013-10-11 Ind Tech Res Inst 聲音事件偵測模組及其方法
US8352245B1 (en) 2010-12-30 2013-01-08 Google Inc. Adjusting language models
US8296142B2 (en) 2011-01-21 2012-10-23 Google Inc. Speech recognition using dock context
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9093075B2 (en) 2012-04-20 2015-07-28 Google Technology Holdings LLC Recognizing repeated speech in a mobile computing device
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
WO2015079568A1 (ja) * 2013-11-29 2015-06-04 三菱電機株式会社 音声認識装置
US9899021B1 (en) * 2013-12-20 2018-02-20 Amazon Technologies, Inc. Stochastic modeling of user interactions with a detection system
WO2015116151A1 (en) * 2014-01-31 2015-08-06 Hewlett-Packard Development Company, L.P. Voice input command
US9842592B2 (en) 2014-02-12 2017-12-12 Google Inc. Language models using non-linguistic context
US9412365B2 (en) 2014-03-24 2016-08-09 Google Inc. Enhanced maximum entropy models
WO2016039847A1 (en) * 2014-09-11 2016-03-17 Nuance Communications, Inc. Methods and apparatus for unsupervised wakeup
GB2535766B (en) * 2015-02-27 2019-06-12 Imagination Tech Ltd Low power detection of an activation phrase
US10134394B2 (en) 2015-03-20 2018-11-20 Google Llc Speech recognition using log-linear model
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US9978367B2 (en) 2016-03-16 2018-05-22 Google Llc Determining dialog states for language models
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US10832664B2 (en) 2016-08-19 2020-11-10 Google Llc Automated speech recognition using language models that selectively use domain-specific model components
US10311860B2 (en) 2017-02-14 2019-06-04 Google Llc Language model biasing system
KR102509821B1 (ko) * 2017-09-18 2023-03-14 삼성전자주식회사 Oos 문장을 생성하는 방법 및 이를 수행하는 장치
US10872599B1 (en) * 2018-06-28 2020-12-22 Amazon Technologies, Inc. Wakeword training
WO2020139121A1 (en) * 2018-12-28 2020-07-02 Ringcentral, Inc., (A Delaware Corporation) Systems and methods for recognizing a speech of a speaker
US11830486B2 (en) * 2020-10-13 2023-11-28 Google Llc Detecting near matches to a hotword or phrase

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE625775C (de) * 1933-09-20 1936-02-15 Briggs Mfg Co Elektrische Punktschweissmaschine
US4348550A (en) * 1980-06-09 1982-09-07 Bell Telephone Laboratories, Incorporated Spoken word controlled automatic dialer
US4489434A (en) * 1981-10-05 1984-12-18 Exxon Corporation Speech recognition method and apparatus
JPS5879300A (ja) * 1981-11-06 1983-05-13 日本電気株式会社 パタ−ン距離計算方式
US4618984A (en) * 1983-06-08 1986-10-21 International Business Machines Corporation Adaptive automatic discrete utterance recognition
NL8500339A (nl) * 1985-02-07 1986-09-01 Philips Nv Adaptief responderend systeem.
US4759068A (en) * 1985-05-29 1988-07-19 International Business Machines Corporation Constructing Markov models of words from multiple utterances
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
US5452397A (en) * 1992-12-11 1995-09-19 Texas Instruments Incorporated Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040001828A (ko) * 2002-06-28 2004-01-07 주식회사 케이티 음성인식 시스템에서 중복명칭 처리 방법

Also Published As

Publication number Publication date
EP0655732A2 (en) 1995-05-31
KR100321011B1 (ko) 2002-06-20
US5737724A (en) 1998-04-07
CA2117932A1 (en) 1995-05-25
EP0655732B1 (en) 2001-03-28
EP0655732A3 (en) 1997-06-18
DE69426969T2 (de) 2001-10-25
TW323364B (ko) 1997-12-21
CA2117932C (en) 1998-12-15
DE69426969D1 (de) 2001-05-03
JPH07199985A (ja) 1995-08-04
ES2156890T3 (es) 2001-08-01
JP3363630B2 (ja) 2003-01-08

Similar Documents

Publication Publication Date Title
KR950015199A (ko) 음성 인식 방법 및 장치
KR100984528B1 (ko) 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법
US7941313B2 (en) System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US6519479B1 (en) Spoken user interface for speech-enabled devices
US7209880B1 (en) Systems and methods for dynamic re-configurable speech recognition
KR100636317B1 (ko) 분산 음성 인식 시스템 및 그 방법
US5960393A (en) User selectable multiple threshold criteria for voice recognition
US20050049870A1 (en) Open vocabulary speech recognition
US5842161A (en) Telecommunications instrument employing variable criteria speech recognition
US20040260547A1 (en) Signal-to-noise mediated speech recognition algorithm
EP1220197A2 (en) Speech recognition method and system
US20020178004A1 (en) Method and apparatus for voice recognition
EP0398574A3 (en) Speech recognition employing key word modeling and non-key word modeling
KR20010093334A (ko) 잡음 신호에서 음성의 엔드포인팅 방법
KR20010093327A (ko) 음성 인식 제거 체계
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
KR100281582B1 (ko) 인식기 자원을 효율적으로 사용하는 음성인식 방법
JP2001522070A (ja) パターン認識
Bou-Ghazale et al. Hands-free voice activation of personal communication devices
Littel et al. Speech recognition for the Siemens EWSD public exchange
Krasinski et al. Automatic speech recognition for network call routing
Lim et al. Analysis of twin beam generation by frequency doubling in a dual ported resonator

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20061226

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee