KR100651957B1 - 음성 인식에서 무음을 사용한 시스템 - Google Patents
음성 인식에서 무음을 사용한 시스템 Download PDFInfo
- Publication number
- KR100651957B1 KR100651957B1 KR1020007008110A KR20007008110A KR100651957B1 KR 100651957 B1 KR100651957 B1 KR 100651957B1 KR 1020007008110 A KR1020007008110 A KR 1020007008110A KR 20007008110 A KR20007008110 A KR 20007008110A KR 100651957 B1 KR100651957 B1 KR 100651957B1
- Authority
- KR
- South Korea
- Prior art keywords
- silent
- prefix tree
- silence
- branch
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 48
- 230000001419 dependent effect Effects 0.000 claims description 18
- 238000013138 pruning Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 description 18
- 230000007704 transition Effects 0.000 description 18
- 238000012549 training Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/085—Methods for reducing search complexity, pruning
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (41)
- 음성을 지시하는 입력 데이터 스트림에 기초하여 음성을 인식하는 방법에 있어서,노드에 연결된 복수개의 음운 브랜치를 포함하는 프리픽스 트리(Prefix Tree)로서 입력 데이터 스트림에 의해 표시되고 음운을 형성하는 가능 워드를 공급하는 단계--각각의 음운 브랜치는 음운에 대응하고, 상기 복수개의 음운 브랜치는 상기 프리픽스 트리의 입력부의 무음에 대응하는 적어도 하나의 입력 무음 브랜치 및 상기 프리픽스 트리의 출력부의 무음에 대응하는 적어도 하나의 출력 무음 브랜치에 의해 브래킷되는 것임--와;상기 입력 데이터 스트림으로 표시되는 워드를 수신하기 위하여 상기 프리픽스 트리를 수평 이동시키는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 제1항에 있어서, 상기 프리픽스 트리를 수평 이동시키는 단계는,상기 프리픽스 트리의 입력부로부터 상기 프리픽스 트리의 출력부까지 연속하는 복수개의 노드에 스코어를 할당함으로써 프리픽스 트리를 수평 이동시키는 단계--여기서 스코어는 스코어가 할당된 상기 노드에 도달하는 브랜치에 대응하는 음운을 입력 데이터가 표시할 가능성을 지시하는 것임--와;상기 입력 데이터 스트림으로 표시되는 워드와 같이, 임계 레벨을 만족하는 상기 노드에 할당된 스코어를 갖는 상기 프리픽스 트리의 출력부의 무음 노드에 대응하는 N개의 워드를 선택하는 단계를 포함하는 것인 음성 인식 방법.
- 제1항에 있어서, 가능 워드를 공급하는 단계는, 상기 프리픽스 트리의 입력부에서 각각이 노드에서 적어도 하나의 음운 브랜치에 연결되는 복수개의 무음 브랜치를 갖는 프리픽스 트리를 공급하는 단계를 포함하는 것인 음성 인식 방법.
- 제3항에 있어서, 복수개의 무음 브랜치를 갖는 프리픽스 트리를 공급하는 단계는 복수개의 무음 브랜치를 갖는 상기 프리픽스 트리를 제공하는 단계를 포함하는 것이며, 상기 복수개의 무음 브랜치로 표시되는 상기 무음은 문맥에 기초하여 가변하는 것인 음성 인식 방법.
- 제3항에 있어서, 가능 워드를 공급하는 단계는, 상기 프리픽스 트리의 입력부에 복수개의 무음 브랜치를 갖는 프리픽스 트리를 공급하는 단계를 포함하는 것이며, 각각의 무음 브랜치로 표시되는 무음은 무음 브랜치가 연결된 음운에 기초하여 다른 무음 브랜치로 표시되는 음(phone)으로부터 가변하는 것인 음성 인식 방법.
- 제3항에 있어서, 상기 프리픽스 트리를 수평 이동시키는 단계는 입력 데이터가 스코어가 할당될 노드에 도달하는 무음 브랜치에 대응하는 무음을 표시하는 가능성을 나타내는 음운 브랜치와 무음 브랜치 사이에 연결된 노드에 스코어를 할당하는 단계를 포함하는 것인 음성 인식 방법.
- 제6항에 있어서, 상기 프리픽스 트리를 수평 이동시키는 단계는 상기 무음 브랜치와 상기 음운 브랜치 사이에 연결되는 상기 노드에 할당된 스코어에 기초하여 상기 프리픽스 트리로부터 브랜치를 프루닝하는 단계를 포함하는 것인 음성 인식 방법.
- 제7항에 있어서, 상기 프루닝하는 단계는 프루닝 임계 레벨을 만족하도록 스코어가 할당된 노드로부터 나와서 상기 프리픽스 트리 내의 브랜치를 더 수평 이동시키는 것을 중단하는 단계를 포함하는 것인 음성 인식 방법.
- 음성을 지시하는 입력 데이터 스트림에 기초하여 음성을 인식하는 방법에 있어서,무음에 의해 브래킷되고 입력 데이터 스트림으로 표시된 가능 워드를 형성하는 엔트리를 포함하는 사전을 제공하는 단계와;상기 입력 데이터 스트림에 기초하여 상기 입력 데이터 스트림으로 표시되는 워드를 결정하기 위하여 상기 사전을 검색하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 음성을 지시하는 입력 데이터로부터 음성을 인식하는 방법에 있어서,음성 유닛을 표시하는 음성 유닛 모델을 공급하는 단계와;문맥 종속 무음의 무음 모델을 공급하는 단계와;상기 입력 데이터에 기초하고 상기 음성 유닛 모델 및 상기 무음 모델에 기초하여 상기 입력 데이터로 표시될 수 있는 음성 유닛 및 문맥 종속 무음을 선택하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 제10항에 있어서, 상기 음성 유닛 모델을 공급하는 단계 및 상기 무음 모델을 공급하는 단계는, 노드에 연결된 복수개의 음운 브랜치를 포함하는 프리픽스 트리(Prefix Tree)로서 상기 음성 유닛 모델 및 상기 무음 모델을 공급하는 단계를 포함하며, 각각의 음운 브랜치는 음운에 대응하고, 상기 복수개의 음운 브랜치는 상기 프리픽스 트리의 입력부의 무음에 대응하는 적어도 하나의 입력 무음 브랜치 및 상기 프리픽스 트리의 출력부의 무음에 대응하는 적어도 하나의 출력 무음 브랜치에 의해 브래킷되는 것인 음성 인식 방법.
- 제11항에 있어서, 상기 음성 유닛 및 문맥 종속 무음을 선택하는 단계는, 입력 데이터 스트림으로 표시될 수 있는 워드를 입수하기 위하여 상기 프리픽스 트리를 수평 이동시키는 단계를 포함하는 것인 음성 인식 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 컴퓨터에 저장된 구성부를 갖는 컴퓨터 판독 가능한 매체에 있어서,노드에 연결된 음운 브랜치에 대응하는 복수개의 음운을 포함하는 프리픽스 트리(Prefix Tree)를 포함하며, 상기 복수개의 음운 브랜치는 상기 프리픽스 트리의 입력부의 무음에 대응하는 적어도 하나의 입력 무음 브랜치 및 상기 프리픽스 트리의 출력부의 무음에 대응하는 적어도 하나의 출력 무음 브랜치에 의해 브래킷되는 것을 특징으로 하는 것인 컴퓨터 판독 가능한 매체.
- 제19항에 있어서, 상기 구성부는 인식될 음성을 지시하는 입력 데이터 스트림으로 표시될 수 있는 워드를 입수하기 위하여 상기 프리픽스 트리를 수평 이동시키도록 구성된 수평 이동 구성부를 포함하는 것인 컴퓨터 판독 가능한 매체.
- 컴퓨터에 저장된 구성부를 갖는 컴퓨터 판독 가능한 매체에 있어서,인식될 음성을 지시하는 입력 데이터 스트림으로 표시되는 가능 워드를 형성하는 엔트리를 포함하는 사전--상기 엔트리는 무음에 의해 브래킷되는 것임--과;상기 입력 데이터 스트림에 기초하여 상기 입력 데이터 스트림으로 표시된 워드를 결정하기 위하여 상기 사전을 검색하도록 형성된 검색 구성부를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능한 매체.
- 컴퓨터에 저장된 구성부를 갖는 컴퓨터 판독 가능한 매체에 있어서,음성 유닛을 표시하는 복수개의 음성 유닛 모델과;문맥 종속 무음의 복수개의 무음 모델과;인식될 음성을 지시하는 입력 데이터에 기초하고 상기 음성 유닛 및 상기 무음 모델에 기초하여 입력 데이터로 표시된 음성 유닛 및 문맥 종속 무음을 선택하기 위해 형성된 선택 구성부를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능한 매체.
- 삭제
- 삭제
- 삭제
- 삭제
- 컴퓨터에 저장된 데이터 구조를 갖는 컴퓨터 판독 가능한 매체에 있어서,적어도 하나의 입력 무음을 지시하는 데이터를 포함하는 제1 데이터 부분과;복수개의 음운을 지시하는 데이터를 포함하는 제2 데이터 부분과;적어도 하나의 출력 무음을 지시하는 데이터를 포함하는 제3 데이터 부분을 포함하고,상기 제1, 제2 및 제3 데이터 부분은 입력 데이터 스트림을 표시하는 워드를 생성하는 프리픽스 트리(Prefix Tree)를 수평 이동시킬 때 기능에 따라 배치되는 것을 특징으로 하는 컴퓨터 판독 가능한 매체.
- 컴퓨터에 저장된 데이터 구조를 갖는 컴퓨터 판독 가능한 매체에 있어서,입력 데이터 스트림으로 표시되는 가능 워드를 형성하는 엔트리를 갖는 사전을 지시하는 데이터를 포함하는 제1 데이터 부분과;문맥 종속 무음을 지시하는 데이터를 포함하는 제2 데이터 부분을 포함하고,상기 제1 및 제2 데이터 부분은 무음 브래킷 사전으로 기능하며, 음성 인식에 사용되는 경우 입력 데이터 스트림으로 표시되는 워드를 생성하는 것을 특징으로 하는 컴퓨터 판독 가능한 매체.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/026,841 | 1998-02-20 | ||
US09/026,841 US6374219B1 (en) | 1997-09-19 | 1998-02-20 | System for using silence in speech recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010034367A KR20010034367A (ko) | 2001-04-25 |
KR100651957B1 true KR100651957B1 (ko) | 2006-12-01 |
Family
ID=21834100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020007008110A KR100651957B1 (ko) | 1998-02-20 | 1999-02-09 | 음성 인식에서 무음을 사용한 시스템 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6374219B1 (ko) |
EP (1) | EP1055226B1 (ko) |
JP (1) | JP4414088B2 (ko) |
KR (1) | KR100651957B1 (ko) |
CN (1) | CN1205599C (ko) |
CA (1) | CA2315832C (ko) |
WO (1) | WO1999042991A1 (ko) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19635754A1 (de) * | 1996-09-03 | 1998-03-05 | Siemens Ag | Sprachverarbeitungssystem und Verfahren zur Sprachverarbeitung |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6633846B1 (en) | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6615172B1 (en) | 1999-11-12 | 2003-09-02 | Phoenix Solutions, Inc. | Intelligent query engine for processing voice based queries |
US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
WO2004023455A2 (en) * | 2002-09-06 | 2004-03-18 | Voice Signal Technologies, Inc. | Methods, systems, and programming for performing speech recognition |
US7444286B2 (en) | 2001-09-05 | 2008-10-28 | Roth Daniel L | Speech recognition using re-utterance recognition |
US7467089B2 (en) * | 2001-09-05 | 2008-12-16 | Roth Daniel L | Combined speech and handwriting recognition |
US7505911B2 (en) * | 2001-09-05 | 2009-03-17 | Roth Daniel L | Combined speech recognition and sound recording |
US7526431B2 (en) * | 2001-09-05 | 2009-04-28 | Voice Signal Technologies, Inc. | Speech recognition using ambiguous or phone key spelling and/or filtering |
US7809574B2 (en) | 2001-09-05 | 2010-10-05 | Voice Signal Technologies Inc. | Word recognition using choice lists |
US7313526B2 (en) * | 2001-09-05 | 2007-12-25 | Voice Signal Technologies, Inc. | Speech recognition using selectable recognition modes |
US20040064315A1 (en) * | 2002-09-30 | 2004-04-01 | Deisher Michael E. | Acoustic confidence driven front-end preprocessing for speech recognition in adverse environments |
US7389230B1 (en) * | 2003-04-22 | 2008-06-17 | International Business Machines Corporation | System and method for classification of voice signals |
US9117460B2 (en) * | 2004-05-12 | 2015-08-25 | Core Wireless Licensing S.A.R.L. | Detection of end of utterance in speech recognition system |
US8032374B2 (en) * | 2006-12-05 | 2011-10-04 | Electronics And Telecommunications Research Institute | Method and apparatus for recognizing continuous speech using search space restriction based on phoneme recognition |
US8165877B2 (en) * | 2007-08-03 | 2012-04-24 | Microsoft Corporation | Confidence measure generation for speech related searching |
JP4757936B2 (ja) * | 2009-07-23 | 2011-08-24 | Kddi株式会社 | パターン認識方法および装置ならびにパターン認識プログラムおよびその記録媒体 |
US9224384B2 (en) * | 2012-06-06 | 2015-12-29 | Cypress Semiconductor Corporation | Histogram based pre-pruning scheme for active HMMS |
US9514739B2 (en) * | 2012-06-06 | 2016-12-06 | Cypress Semiconductor Corporation | Phoneme score accelerator |
US20140365221A1 (en) * | 2012-07-31 | 2014-12-11 | Novospeech Ltd. | Method and apparatus for speech recognition |
JP6235280B2 (ja) * | 2013-09-19 | 2017-11-22 | 株式会社東芝 | 音声同時処理装置、方法およびプログラム |
US8719032B1 (en) | 2013-12-11 | 2014-05-06 | Jefferson Audio Video Systems, Inc. | Methods for presenting speech blocks from a plurality of audio input data streams to a user in an interface |
US10134425B1 (en) * | 2015-06-29 | 2018-11-20 | Amazon Technologies, Inc. | Direction-based speech endpointing |
US10121471B2 (en) * | 2015-06-29 | 2018-11-06 | Amazon Technologies, Inc. | Language model speech endpointing |
CN105427870B (zh) * | 2015-12-23 | 2019-08-30 | 北京奇虎科技有限公司 | 一种针对停顿的语音识别方法和装置 |
KR102435750B1 (ko) * | 2017-12-14 | 2022-08-25 | 현대자동차주식회사 | 멀티미디어 장치 및 이를 포함하는 차량, 멀티미디어 장치의 방송 청취 방법 |
US11893983B2 (en) * | 2021-06-23 | 2024-02-06 | International Business Machines Corporation | Adding words to a prefix tree for improving speech recognition |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4336421A (en) | 1980-04-08 | 1982-06-22 | Threshold Technology, Inc. | Apparatus and method for recognizing spoken words |
US4977599A (en) * | 1985-05-29 | 1990-12-11 | International Business Machines Corporation | Speech recognition employing a set of Markov models that includes Markov models representing transitions to and from silence |
US4852173A (en) | 1987-10-29 | 1989-07-25 | International Business Machines Corporation | Design and construction of a binary-tree system for language modelling |
US5159637A (en) | 1988-07-27 | 1992-10-27 | Fujitsu Limited | Speech word recognizing apparatus using information indicative of the relative significance of speech features |
US5202952A (en) * | 1990-06-22 | 1993-04-13 | Dragon Systems, Inc. | Large-vocabulary continuous speech prefiltering and processing system |
DE4130632A1 (de) | 1991-09-14 | 1993-03-18 | Philips Patentverwaltung | Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal |
WO1994022131A2 (en) * | 1993-03-25 | 1994-09-29 | British Telecommunications Public Limited Company | Speech recognition with pause detection |
JPH0728487A (ja) * | 1993-03-26 | 1995-01-31 | Texas Instr Inc <Ti> | 音声認識方法 |
US5623609A (en) * | 1993-06-14 | 1997-04-22 | Hal Trust, L.L.C. | Computer system and computer-implemented process for phonology-based automatic speech recognition |
US5794197A (en) * | 1994-01-21 | 1998-08-11 | Micrsoft Corporation | Senone tree representation and evaluation |
ATE208075T1 (de) | 1995-08-18 | 2001-11-15 | Gsbs Dev Corp | Feueralarmsystem |
GB2305288A (en) * | 1995-09-15 | 1997-04-02 | Ibm | Speech recognition system |
US6076056A (en) * | 1997-09-19 | 2000-06-13 | Microsoft Corporation | Speech recognition system for recognizing continuous and isolated speech |
-
1998
- 1998-02-20 US US09/026,841 patent/US6374219B1/en not_active Expired - Lifetime
-
1999
- 1999-02-09 CA CA002315832A patent/CA2315832C/en not_active Expired - Fee Related
- 1999-02-09 EP EP99906851.3A patent/EP1055226B1/en not_active Expired - Lifetime
- 1999-02-09 WO PCT/US1999/002803 patent/WO1999042991A1/en active IP Right Grant
- 1999-02-09 CN CNB998030759A patent/CN1205599C/zh not_active Expired - Lifetime
- 1999-02-09 KR KR1020007008110A patent/KR100651957B1/ko active IP Right Grant
- 1999-02-09 JP JP2000532846A patent/JP4414088B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CA2315832C (en) | 2004-11-16 |
JP2002504719A (ja) | 2002-02-12 |
US6374219B1 (en) | 2002-04-16 |
CN1307715A (zh) | 2001-08-08 |
JP4414088B2 (ja) | 2010-02-10 |
EP1055226B1 (en) | 2017-08-16 |
CN1205599C (zh) | 2005-06-08 |
EP1055226A1 (en) | 2000-11-29 |
WO1999042991A1 (en) | 1999-08-26 |
KR20010034367A (ko) | 2001-04-25 |
CA2315832A1 (en) | 1999-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100651957B1 (ko) | 음성 인식에서 무음을 사용한 시스템 | |
US6076056A (en) | Speech recognition system for recognizing continuous and isolated speech | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
KR100845428B1 (ko) | 휴대용 단말기의 음성 인식 시스템 | |
Jelinek et al. | 25 Continuous speech recognition: Statistical methods | |
EP0664535A2 (en) | Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars | |
EP1557822A1 (en) | Automatic speech recognition adaptation using user corrections | |
EP1139332A9 (en) | Spelling speech recognition apparatus | |
US20050187758A1 (en) | Method of Multilingual Speech Recognition by Reduction to Single-Language Recognizer Engine Components | |
WO2001022400A1 (en) | Iterative speech recognition from multiple feature vectors | |
KR101014086B1 (ko) | 음성 처리 장치 및 방법, 및 기록 매체 | |
CA2247747A1 (en) | Search and rescoring method for a speech recognition system | |
Renals et al. | Start-synchronous search for large vocabulary continuous speech recognition | |
US20030220792A1 (en) | Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded | |
EP0562138A1 (en) | Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary | |
JP2013125144A (ja) | 音声認識装置およびそのプログラム | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
GB2292235A (en) | Word syllabification. | |
Islam | TIMIT Speech Recognition with GMM-HMMs | |
JP2003140683A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JPH04329597A (ja) | 連続音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121019 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131016 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141017 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151016 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161019 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20171018 Year of fee payment: 12 |