KR100718147B1 - 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 - Google Patents
음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 Download PDFInfo
- Publication number
- KR100718147B1 KR100718147B1 KR1020060009868A KR20060009868A KR100718147B1 KR 100718147 B1 KR100718147 B1 KR 100718147B1 KR 1020060009868 A KR1020060009868 A KR 1020060009868A KR 20060009868 A KR20060009868 A KR 20060009868A KR 100718147 B1 KR100718147 B1 KR 100718147B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- dialogue
- dialogue sentence
- generating
- map
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000003213 activating effect Effects 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims 2
- 239000000284 extract Substances 0.000 abstract description 4
- 238000012795 verification Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 5
- 206010025482 malaise Diseases 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 235000021152 breakfast Nutrition 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 206010015958 Eye pain Diseases 0.000 description 1
- 206010033425 Pain in extremity Diseases 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
Description
낟알, 낟가리, 낫놓고 기역자, 병이 낫다, 낮과 밤, 직위가 낮다, 무슨 낯으로 보나, 낱개, 낱낱이, 아기를 낳다, 새끼를 낳다, 배타고 바다에, 배가 아프다, 배가 맛있다, 말타다, 말과 글, 벌에 쏘이다, 벌을 받다, 눈이 안프다, 눈이 온다, 밤이 맛있다, 밤이 어둡다, 다리가 아프다, 다리를 건너다, 아침에 보자, 아침이 맛있다 |
낟(grain) 알(egg) 가리(stack) 낫(sickle) 놓다(put) 기역(kiyok) 자(letter) 낫(recover) 병(sickness) 낮(day) 밤(night ) 낮(low) 직위(position) 낯(face) 보다(see) 낱(piece) 개(unit) 낳(bear) 아기(baby) 새끼(young) 알(egg)* 배(ship) 바다(sea) 배(stomach) 아프다(sick) 배(pear) 맛있다(tasty) 말(horse) 타다(ride) 말(language) 글(writing) 벌(bee) 쏘다(bite) 벌(punishment) 받다(get) 눈(eye) 아프다(sick)* 눈(snow) 오다(come) 밤(chestnut) 맛있다(tasty)* 밤(night) 어둡다(dark) 다리(leg) 아프다(sick)** 다리(bridge) 건너다(cross) 아침(morning) 보다(see)* 아침(breakfast) 맛있다(tasty)** (여기서 *, ** 는 중복을 나타내는 표시) |
낟(grain) - 알(egg) 낟(grain) - 가리(stack) 낫(sickle) - 놓다(put) ... 기역(kiyok) - 자(letter) 병(sickness) - 낫(recover) 낮(day) = 밤(night ) 직위(position) - 낮(low) 낯(face) - 보다(see) 낱(piece) - 개(unit) 아기(baby) - 낳(bear) 새끼(young) - 낳(bear) 알(egg) - 낳(bear) 배(ship) = 바다(sea) 배(stomach) - 아프다(sick) 배(pear) - 맛있다(tasty) 말(horse) - 타다(ride) 말(language) = 글(writing) 벌(bee) - 쏘다(bite) 벌(punishment) - 받다(get) 눈(eye) - 아프다(sick) 눈(snow) - 오다(come) 밤(chestnut) - 맛있다(tasty) 밤(night) - 어둡다(dark) 다리(leg) - 아프다(sick) 다리(bridge) - 건너다(cross) 아침(morning) - 보다(see) 아침(breakfast) - 맛있다(tasty) |
Claims (24)
- 시스템과 사용자간의 대화이력을 저장하는 대화이력 저장부;대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 의미적인 상관도에 따라서 클러스터링하여 구성되며, 상기 대화이력 저장부로부터 제공되는 대화문장을 구성하는 각 단어별로 추출된 의미적인 상관도를 갖는 적어도 하나의 단어들로 이루어지는 제1 후보 그룹을 생성하는 의미 맵;상기 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 음향적인 유사도에 따라서 클러스터링하여 구성되며, 상기 대화이력 저장부로부터 제공되는 대화문장을 구성하는 각 단어 및 상기 제1 후보그룹의 각 단어별로 추출된 음향적인 유사도를 갖는 적어도 하나의 단어들로 이루어지는 제2 후보 그룹을 생성하는 음향 맵; 및상기 제1 후보 그룹과 상기 제2 후보 그룹을 조합하여 문법망을 구성하는 문법망 구성부를 포함하는 것을 특징으로 하는 음성인식용 문법망 생성장치.
- 제1 항에 있어서, 상기 대화이력 저장부는 가장 최근의 대화내용을 저장하며, 저장된 대화내용은 대화가 진행됨에 따라서 갱신되어지는 것을 특징으로 하는 음성인식용 문법망 생성장치.
- 제1 항에 있어서, 상기 의미 맵 및 상기 음향 맵은 상기 대화이력 저장부에 저장된 대화이력 중 가장 최근에 상기 시스템이 인식한 대화문장과 상기 시스템이 발화한 대화문장에 의해 활성화되는 것을 특징으로 하는 음성인식용 문법망 생성장치.
- 제1 항에 있어서, 상기 단어는 각 대화문장을 구성하는 기본요소로서 하나 이상의 음절로 구성된 단어 혹은 단어열이며, 단일한 의미와 단일한 발음의 쌍으로 이루어지는 것을 특징으로 하는 음성인식용 문법망 생성장치.
- 제1 항에 있어서, 상기 대화문장 코퍼스는 시스템과 사용자 사이에 가능한 모든 대화내용을 다양한 사용예를 포함하는 순차적인 대화문장으로 구성하여 데이터베이스화한 것임을 특징으로 하는 음성인식용 문법망 생성장치.
- 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 음향적인 유사도에 따라서 클러스터링하여 구성되는 음향 맵을 생성하는 단계;상기 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 의미적인 상관도에 따라서 클러스터링하여 구성되는 의미 맵을 생성하는 단계;상기 의미 맵을 활성화시켜 시스템과 사용자간에 진행된 대화이력에 포함된 대화문장을 구성하는 각 단어별로 추출된 의미적인 상관도를 갖는 단어들로 이루어지는 제1 후보 그룹을 생성하는 단계;상기 음향 맵을 활성화시켜 상기 대화이력에 포함된 대화문장을 구성하는 각 단어 및 상기 제1 후보 그룹에 포함된 각 단어별로 추출된 음향적인 유사도를 갖는 단어들로 이루어지는 제2 후보 그룹을 생성하는 단계; 및상기 제1 후보 그룹과 상기 제2 후보 그룹을 조합하여 문법망을 구성하는 단계를 포함하는 것을 특징으로 하는 음성인식용 문법망 생성방법.
- 제6 항에 있어서, 상기 의미 맵과 상기 음향 맵은 사용자로부터 음성이 발화될 때마다 활성화되는 것을 특징으로 하는 음성인식용 문법망 생성방법.
- 제6 항에 있어서, 상기 제1 및 제2 후보 그룹은 가장 최근에 상기 시스템이 인식한 대화문장과 상기 시스템이 발화한 대화문장에 포함되는 단어들과 음향적 유사도 및 의미적 상관도를 갖는 단어들로 이루어지는 것을 특징으로 하는 음성인식용 문법망 생성방법.
- 제6 항에 있어서, 상기 단어는 각 대화문장을 구성하는 기본요소로서 하나 이상의 음절로 구성된 단어 혹은 단어열이며 단일한 의미와 단일한 발음의 쌍으로 이루어지는 것을 것을 특징으로 하는 음성인식용 문법망 생성방법.
- 사용자 음성으로부터 특징을 추출하여 특징벡터열을 생성하는 특징추출부;사용자 음성이 발화될 때마다, 가장 최근에 발화된 대화내용을 이용하여 음향 맵과 의미 맵을 활성화시켜 문법망을 생성하는 문법망 생성부;상기 문법망 생성부에서 생성된 문법망을 로딩시키는 로딩부; 및상기 특징추출부로부터 제공되는 특징벡터열을 이용하여 상기 로딩부에서 로딩되는 문법망을 탐색하여, 상기 특징벡터열과 정합되는 단어열로 이루어지는 후보인식문장을 생성하는 탐색부를 포함하는 것을 특징으로 하는 음성인식장치.
- 제10 항에 있어서, 상기 문법망 생성부는시스템과 사용자간의 대화이력을 저장하는 대화이력 저장부;대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 의미적인 상관도에 따라서 클러스터링하여 구성되며, 상기 대화이력 저장부로부터 제공되는 대화문장을 구성하는 각 단어별로 추출된 의미적인 상관도를 갖는 적어도 하나의 단어들로 이루어지는 제1 후보 그룹을 생성하는 의미 맵;상기 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 음향적인 유사도에 따라서 클러스터링하여 구성되며, 상기 대화이력 저장부로부터 제공되는 대화문장을 구성하는 각 단어 및 상기 제1 후보그룹의 각 단어별로 추출된 음향적인 유사도를 갖는 적어도 하나의 단어들로 이루어지는 제2 후보 그룹을 생성하는 음향 맵; 및상기 제1 후보 그룹과 상기 제2 후보 그룹을 조합하여 문법망을 구성하는 문법망 구성부로 이루어지는 것을 특징으로 하는 음성인식장치.
- 제11 항에 있어서, 상기 대화이력 저장부는 가장 최근의 대화내용을 저장하 며, 저장되는 대화내용은 대화가 진행됨에 따라서 갱신되어지는 것을 특징으로 하는 음성인식장치.
- 제11 항에 있어서, 상기 의미 맵 및 상기 음향 맵은 상기 대화이력 저장부에 저장된 대화이력 중 가장 최근에 상기 시스템이 인식한 대화문장과 상기 시스템이 발화한 대화문장에 의해 활성화되는 것을 특징으로 하는 음성인식장치.
- 제11 항에 있어서, 상기 단어는 각 대화문장을 구성하는 기본요소로서 하나 이상의 음절로 구성된 단어 혹은 단어열이며 단일한 의미와 단일한 발음의 쌍으로 이루어지는 것을 특징으로 하는 음성인식장치.
- 제11 항에 있어서, 상기 대화문장 코퍼스는 시스템과 사용자 사이에 가능한 모든 대화내용을 다양한 사용예를 포함하는 순차적인 대화문장으로 구성하여 데이터베이스화한 것임을 특징으로 하는 음성인식장치.
- 사용자 음성으로부터 특징을 추출하여 특징벡터열을 생성하는 단계;사용자 음성이 발화될 때마다, 가장 최근에 발화된 대화내용을 이용하여 음향 맵과 의미 맵을 활성화시켜 문법망을 생성하는 단계;상기 문법망을 로딩시키는 단계; 및상기 사용자 음성의 특징벡터열을 이용하여 상기 로딩된 문법망을 탐색하여, 상기 특징벡터열과 정합되는 단어열로 이루어지는 후보인식문장을 생성하는 단계를 포함하는 것을 특징으로 하는 음성인식방법.
- 제16 항에 있어서, 상기 문법망 생성단계는대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 음향적인 유사도에 따라서 클러스터링하여 구성되는 음향 맵을 생성하는 단계;상기 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 의미적인 상관도에 따라서 클러스터링하여 구성되는 의미 맵을 생성하는 단계;상기 의미 맵을 활성화시켜 시스템과 사용자간에 진행된 대화이력에 포함된 대화문장을 구성하는 각 단어별로 추출된 의미적인 상관도를 갖는 단어들로 이루어지는 제1 후보 그룹을 생성하는 단계;상기 음향 맵을 활성화시켜 상기 대화이력에 포함된 대화문장을 구성하는 각 단어 및 상기 제1 후보 그룹에 포함된 각 단어별로 추출된 음향적인 유사도를 갖는 단어들로 이루어지는 제2 후보 그룹을 생성하는 단계; 및상기 제1 후보 그룹과 상기 제2 후보 그룹을 조합하여 문법망을 구성하는 단계로 이루어지는 것을 특징으로 하는 음성인식방법.
- 제17 항에 있어서, 상기 제1 및 제2 후보 그룹은 가장 최근에 상기 시스템이 인식한 대화문장과 상기 시스템이 발화한 대화문장에 포함되는 단어들과 음향적 유사도 및 의미적 상관도를 갖는 단어들로 이루어지는 것을 특징으로 하는 음성인식 방법.
- 제17 항에 있어서, 상기 단어는 각 대화문장을 구성하는 기본요소로서 하나 이상의 음절로 구성된 단어 혹은 단어열이며 단일한 의미와 단일한 발음의 쌍으로 이루어지는 것을 것을 특징으로 하는 음성인식방법.
- 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 음향적인 유사도에 따라서 클러스터링하여 구성되는 음향 맵을 생성하는 단계;상기 대화문장 코퍼스에 포함되는 대화문장을 구성하는 단어들을 의미적인 상관도에 따라서 클러스터링하여 구성되는 의미 맵을 생성하는 단계;상기 의미 맵을 활성화시켜 시스템과 사용자간에 진행된 대화이력에 포함된 대화문장을 구성하는 각 단어별로 추출된 의미적인 상관도를 갖는 단어들로 이루어지는 제1 후보 그룹을 생성하는 단계;상기 음향 맵을 활성화시켜 상기 대화이력에 포함된 대화문장을 구성하는 각 단어 및 상기 제1 후보 그룹에 포함된 각 단어별로 추출된 음향적인 유사도를 갖는 단어들로 이루어지는 제2 후보 그룹을 생성하는 단계; 및상기 제1 후보 그룹과 상기 제2 후보 그룹을 조합하여 문법망을 구성하는 단계를 포함하는 음성인식용 문법망 생성방법을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 사용자 음성으로부터 특징을 추출하여 특징벡터열을 생성하는 단계;사용자 음성이 발화될 때마다, 가장 최근에 발화된 대화내용을 이용하여 음향 맵과 의미 맵을 활성화시켜 문법망을 생성하는 단계;상기 문법망을 로딩시키는 단계; 및상기 사용자 음성의 특징벡터열을 이용하여 상기 로딩된 문법망을 탐색하여, 상기 특징벡터열과 정합되는 단어열로 이루어지는 후보인식문장을 생성하는 단계를 포함하는 음성인식방법을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 사용자 음성으로부터 특징을 추출하고 특징벡터열을 생성하는 단계;사용자의 대화내용을 사용하여 의미맵과 음향맵을 활성화시켜 문법망을 생성하는 단계; 및상기 특징벡터열을 사용하여 문법망을 탐색하고, 상기 특징벡터열과 정합하는 단어열로 이루어지는 복수개의 후보인식 문장을 생성하는 단계를 포함하는 것을 특징으로 하는 음성인식방법.
- 제22 항에 있어서, 상기 문법망은 상기 의미맵의 활성화에 의해 형성되는 제1 후보그룹과 상기 음성맵의 활성화에 의해 형성되는 제2 후보그룹을 결합하여 생성되는 것을 특징으로 하는 음성인식방법.
- 사용자 음성으로부터 특징을 추출하고 특징벡터열을 생성하는 단계;사용자와 시스템간의 대화내용을 사용하여 의미맵과 음향맵을 활성화시켜 문법망을 생성하는 단계; 및상기 특징벡터열을 사용하여 문법망을 탐색하고, 상기 특징벡터열과 정합하는 단어열로 이루어지는 복수개의 후보인식 문장을 생성하는 단계를 포함하는 음성인식방법을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050009144 | 2005-02-01 | ||
KR20050009144 | 2005-02-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060088512A KR20060088512A (ko) | 2006-08-04 |
KR100718147B1 true KR100718147B1 (ko) | 2007-05-14 |
Family
ID=36757750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060009868A KR100718147B1 (ko) | 2005-02-01 | 2006-02-01 | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7606708B2 (ko) |
KR (1) | KR100718147B1 (ko) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
EP1934971A4 (en) | 2005-08-31 | 2010-10-27 | Voicebox Technologies Inc | DYNAMIC LANGUAGE SCRIPTURE |
US7752152B2 (en) * | 2006-03-17 | 2010-07-06 | Microsoft Corporation | Using predictive user models for language modeling on a personal device with user behavior models based on statistical modeling |
US8032375B2 (en) * | 2006-03-17 | 2011-10-04 | Microsoft Corporation | Using generic predictive models for slot values in language modeling |
US20070239453A1 (en) * | 2006-04-06 | 2007-10-11 | Microsoft Corporation | Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances |
US7689420B2 (en) * | 2006-04-06 | 2010-03-30 | Microsoft Corporation | Personalizing a context-free grammar using a dictation language model |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
CN101075435B (zh) * | 2007-04-19 | 2011-05-18 | 深圳先进技术研究院 | 一种智能聊天***及其实现方法 |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8798983B2 (en) * | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US20110224982A1 (en) * | 2010-03-12 | 2011-09-15 | c/o Microsoft Corporation | Automatic speech recognition based upon information retrieval methods |
US8688453B1 (en) * | 2011-02-28 | 2014-04-01 | Nuance Communications, Inc. | Intent mining via analysis of utterances |
US10957310B1 (en) | 2012-07-23 | 2021-03-23 | Soundhound, Inc. | Integrated programming framework for speech and text understanding with meaning parsing |
US20140324528A1 (en) * | 2013-03-14 | 2014-10-30 | Adaequare Inc. | Computerized System and Method for Determining an Action's Relevance to a Transaction |
KR101905827B1 (ko) * | 2013-06-26 | 2018-10-08 | 한국전자통신연구원 | 연속어 음성 인식 장치 및 방법 |
US11295730B1 (en) | 2014-02-27 | 2022-04-05 | Soundhound, Inc. | Using phonetic variants in a local context to improve natural language understanding |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US9922138B2 (en) | 2015-05-27 | 2018-03-20 | Google Llc | Dynamically updatable offline grammar model for resource-constrained offline device |
US9966073B2 (en) * | 2015-05-27 | 2018-05-08 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US9870196B2 (en) * | 2015-05-27 | 2018-01-16 | Google Llc | Selective aborting of online processing of voice inputs in a voice-enabled electronic device |
US10083697B2 (en) * | 2015-05-27 | 2018-09-25 | Google Llc | Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device |
US9940577B2 (en) * | 2015-07-07 | 2018-04-10 | Adobe Systems Incorporated | Finding semantic parts in images |
US9836527B2 (en) | 2016-02-24 | 2017-12-05 | Google Llc | Customized query-action mappings for an offline grammar model |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
KR102102388B1 (ko) * | 2017-11-20 | 2020-04-21 | 주식회사 마인즈랩 | 학습 문장 생성 시스템 및 이를 이용한 유사 문장 생성 방법 |
CA3101015A1 (en) | 2018-05-23 | 2019-11-28 | Vermeer Manufacturing Company | Shredder for comminuting bulk material |
US10861456B2 (en) * | 2018-09-17 | 2020-12-08 | Adobe Inc. | Generating dialogue responses in end-to-end dialogue systems utilizing a context-dependent additive recurrent neural network |
CN109920432B (zh) * | 2019-03-05 | 2024-06-18 | 联通在线信息科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
US11437026B1 (en) * | 2019-11-04 | 2022-09-06 | Amazon Technologies, Inc. | Personalized alternate utterance generation |
CN111178062B (zh) * | 2019-12-02 | 2023-05-05 | 云知声智能科技股份有限公司 | 一种面向人机交互多轮对话语料的加速标注方法及装置 |
US11915697B2 (en) | 2020-11-11 | 2024-02-27 | Samsung Electronics Co., Ltd. | Electronic device, system and control method thereof |
US20220237632A1 (en) * | 2021-01-22 | 2022-07-28 | EMC IP Holding Company LLC | Opportunity conversion rate calculator |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980013825A (ko) * | 1996-08-03 | 1998-05-15 | 구자홍 | 언어모델 적응기능을 가진 음성인식장치 및 그 제어방법 |
US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
KR20030010979A (ko) * | 2001-07-28 | 2003-02-06 | 삼성전자주식회사 | 의미어단위 모델을 이용한 연속음성인식방법 및 장치 |
US20030110037A1 (en) * | 2001-03-14 | 2003-06-12 | Walker Marilyn A | Automated sentence planning in a task classification system |
US20030187648A1 (en) * | 2002-03-27 | 2003-10-02 | International Business Machines Corporation | Methods and apparatus for generating dialog state conditioned language models |
KR20040028722A (ko) * | 2001-02-28 | 2004-04-03 | 보이스 인사이트 | 정보 시스템 억세스를 위한 자연어 질의 시스템 |
KR20040051350A (ko) * | 2002-12-12 | 2004-06-18 | 한국전자통신연구원 | 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법 |
KR20050049207A (ko) * | 2003-11-21 | 2005-05-25 | 한국전자통신연구원 | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 |
KR20050066805A (ko) * | 2003-12-27 | 2005-06-30 | 주식회사 케이티 | 음절 음성인식기의 음성인식결과 전달 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5615296A (en) * | 1993-11-12 | 1997-03-25 | International Business Machines Corporation | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
US6067520A (en) * | 1995-12-29 | 2000-05-23 | Lee And Li | System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models |
US6167377A (en) * | 1997-03-28 | 2000-12-26 | Dragon Systems, Inc. | Speech recognition language models |
US6154722A (en) * | 1997-12-18 | 2000-11-28 | Apple Computer, Inc. | Method and apparatus for a speech recognition system language model that integrates a finite state grammar probability and an N-gram probability |
US6418431B1 (en) * | 1998-03-30 | 2002-07-09 | Microsoft Corporation | Information retrieval and speech recognition based on language models |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
JP2001005488A (ja) * | 1999-06-18 | 2001-01-12 | Mitsubishi Electric Corp | 音声対話システム |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
KR100342785B1 (ko) | 2000-01-17 | 2002-07-04 | 정명식 | 한국어 문자열간의 전역 유사도 측정 방법 |
US7243069B2 (en) * | 2000-07-28 | 2007-07-10 | International Business Machines Corporation | Speech recognition by automated context creation |
US20020087312A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Computer-implemented conversation buffering method and system |
US6934683B2 (en) * | 2001-01-31 | 2005-08-23 | Microsoft Corporation | Disambiguation language model |
WO2002086864A1 (en) * | 2001-04-18 | 2002-10-31 | Rutgers, The State University Of New Jersey | System and method for adaptive language understanding by computers |
DE10147341B4 (de) * | 2001-09-26 | 2005-05-19 | Voiceobjects Ag | Verfahren und Vorrichtung zum Aufbau einer in einem Computersystem implementierten Dialogsteuerung aus Dialogobjekten sowie zugehöriges Computersystem zur Durchführung einer Dialogsteuerung |
US7177814B2 (en) * | 2002-02-07 | 2007-02-13 | Sap Aktiengesellschaft | Dynamic grammar for voice-enabled applications |
US7584102B2 (en) * | 2002-11-15 | 2009-09-01 | Scansoft, Inc. | Language model for use in speech recognition |
US7299181B2 (en) * | 2004-06-30 | 2007-11-20 | Microsoft Corporation | Homonym processing in the context of voice-activated command systems |
-
2006
- 2006-02-01 KR KR1020060009868A patent/KR100718147B1/ko active IP Right Grant
- 2006-02-01 US US11/344,163 patent/US7606708B2/en not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980013825A (ko) * | 1996-08-03 | 1998-05-15 | 구자홍 | 언어모델 적응기능을 가진 음성인식장치 및 그 제어방법 |
US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
KR20040028722A (ko) * | 2001-02-28 | 2004-04-03 | 보이스 인사이트 | 정보 시스템 억세스를 위한 자연어 질의 시스템 |
US20030110037A1 (en) * | 2001-03-14 | 2003-06-12 | Walker Marilyn A | Automated sentence planning in a task classification system |
KR20030010979A (ko) * | 2001-07-28 | 2003-02-06 | 삼성전자주식회사 | 의미어단위 모델을 이용한 연속음성인식방법 및 장치 |
US20030187648A1 (en) * | 2002-03-27 | 2003-10-02 | International Business Machines Corporation | Methods and apparatus for generating dialog state conditioned language models |
KR20040051350A (ko) * | 2002-12-12 | 2004-06-18 | 한국전자통신연구원 | 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법 |
KR20050049207A (ko) * | 2003-11-21 | 2005-05-25 | 한국전자통신연구원 | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 |
KR20050066805A (ko) * | 2003-12-27 | 2005-06-30 | 주식회사 케이티 | 음절 음성인식기의 음성인식결과 전달 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20060173686A1 (en) | 2006-08-03 |
KR20060088512A (ko) | 2006-08-04 |
US7606708B2 (en) | 2009-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100718147B1 (ko) | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 | |
US9812122B2 (en) | Speech recognition model construction method, speech recognition method, computer system, speech recognition apparatus, program, and recording medium | |
KR100486733B1 (ko) | 음소 결합정보를 이용한 연속 음성인식방법 및 장치 | |
US8214213B1 (en) | Speech recognition based on pronunciation modeling | |
EP0867857B1 (en) | Enrolment in speech recognition | |
KR100755677B1 (ko) | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 | |
KR101153078B1 (ko) | 음성 분류 및 음성 인식을 위한 은닉 조건부 랜덤 필드모델 | |
US10832668B1 (en) | Dynamic speech processing | |
US10515637B1 (en) | Dynamic speech processing | |
US20040210437A1 (en) | Semi-discrete utterance recognizer for carefully articulated speech | |
Smit et al. | Aalto system for the 2017 Arabic multi-genre broadcast challenge | |
Ahmed et al. | Arabic automatic speech recognition enhancement | |
Hieronymus et al. | Spoken language identification using large vocabulary speech recognition | |
Diwakar et al. | Improving speech to text alignment based on repetition detection for dysarthric speech | |
Hwang et al. | Building a highly accurate Mandarin speech recognizer | |
Gauvain et al. | Speech-to-text conversion in French | |
Kurian et al. | Automated Transcription System for MalayalamLanguage | |
Gorniak et al. | Augmenting user interfaces with adaptive speech commands | |
Hwang et al. | Building a highly accurate Mandarin speech recognizer with language-independent technologies and language-dependent modules | |
Udhaykumar et al. | Multilingual speech recognition for information retrieval in Indian context | |
Padmanabhan et al. | Transcription of new speaking styles-Voicemail | |
Colton | Confidence and rejection in automatic speech recognition | |
Demenko et al. | Development of large vocabulary continuous speech recognition for polish | |
Raj et al. | Design and implementation of speech recognition systems | |
Amdal | Learning pronunciation variation: A data-driven approach to rule-based lecxicon adaptation for automatic speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130429 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140429 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150429 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160428 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170427 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180427 Year of fee payment: 12 |