JP2016522903A - 音声を認識するシステムおよび方法 - Google Patents
音声を認識するシステムおよび方法 Download PDFInfo
- Publication number
- JP2016522903A JP2016522903A JP2015552672A JP2015552672A JP2016522903A JP 2016522903 A JP2016522903 A JP 2016522903A JP 2015552672 A JP2015552672 A JP 2015552672A JP 2015552672 A JP2015552672 A JP 2015552672A JP 2016522903 A JP2016522903 A JP 2016522903A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- constraint
- word
- interpretation
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000004044 response Effects 0.000 claims abstract description 3
- 238000012937 correction Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 238000012886 linear function Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 230000003993 interaction Effects 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
S(W|X)=logpθ(W|X)+k
ここで、kは任意の定数である。
S(W|X)∝pθLM(W)pθAM(X|W)
ここで、pθLM(W)は、パラメータθLMを有する単語言語モデルからのスコアであり、pθAM(X|W)は、パラメータθAMを有する音響モデルからのスコアである。単純にするために、以後、必要な場合を除いてパラメータθを省略する。
S’(W|X)∝pθ’LM(W)pθAM(X|W)
ここで、S’(W|X)は変更されたスコアである。
f(X,W,R)=f(W)=αIlength(W)=6+β
である場合、ここで、f(W)という表記は、制約因子がこの場合はXおよびRに依存しないことを示し、αおよびβは制約充足の度合いを表す非負の重みパラメータであり、例えば、
図7Aは、本発明の1つの実施形態による、単語シーケンス制約の下で音声710を解釈するための例示的な方法の概略図を示す。この例では、単語シーケンス制約は、単語数に対する制約714、すなわち、音声が6つの単語を有するという制約を含む。特に、制約714は、解釈の組711全体のスコア712を更新し、解釈の更新されたスコア716を有する更新された組715を生成するのに用いられる。図7Aの例からわかるように、解釈の組全体のスコア716が更新される。
Claims (19)
- 単語のシーケンスを含む音声を認識する方法であって、
音響モデルおよび言語モデルを用いて前記音声の解釈の組を生成することと、
スコアの組を生成するために、解釈ごとに、前記単語のシーケンスを表す解釈の正確さを表すスコアを求めることと、
単語シーケンス制約の下で前記音声を認識するための制約を求めることと、
前記制約との各解釈の整合性に基づいて前記スコアの組を更新することと、
を備え、
前記方法のステップは、プロセッサによって実行される
音声を認識する方法。 - 前記単語シーケンス制約は、
前記単語のシーケンス内の単語数、特定の単語もしくは単語のシーケンスの有無、前記特定の単語の発声の時点、前記単語のシーケンスにおける少なくとも2つの特定の単語の順序、前記単語のシーケンスにおける前記2つの特定の単語の結合もしくは分離、前記音声の入力のトピック、のうちの1つまたは組み合わせを含む
請求項1に記載の方法。 - 前記制約を求めることは、
前記解釈の組の部分組をユーザに通信することと、
前記通信することに応答して前記単語シーケンス制約を受信することと、
前記単語シーケンス制約に基づいて前記制約のタイプを求めることと、
前記タイプに基づいて前記制約を求めることと、
を有する請求項1に記載の方法。 - 前記タイプは、言語タイプであり、
前記制約を求めることは、
前記単語シーケンス制約に基づいて前記言語モデルを更新すること
を有する請求項3に記載の方法。 - 前記単語シーケンス制約は、前記音声のトピックである
請求項4に記載の方法。 - 前記タイプは、音響タイプであり、
前記制約を求めることは、
前記単語シーケンス制約に基づいて前記音響モデルを更新すること
を有する請求項3に記載の方法。 - 前記音響モデルは、前記音声における単語と、前記音響モデルの音響特徴との間のアライメントを含む
請求項6に記載の方法。 - 前記制約は、特定の時間領域内に1つの単語のみが存在することを含む
請求項7に記載の方法。 - 前記タイプは、コンテキストタイプであり、
前記制約を求めることは、
各解釈における特定の単語の有無をテストするスコアリング関数を求めること
を有する請求項3に記載の方法。 - 前記スコアリング関数は、前記特定の単語の存在についてテストし、
前記言語モデルに基づいて前記音声の向きを求めることと、
前記音声の前記向きに従って、前記特定の単語に先行および後続する単語の存在についてのテストで前記スコアリング関数を更新することと、
をさらに備えた請求項9に記載の方法。 - 前記単語シーケンス制約との整合性の度合いを示す制約因子を求めることと、
前記制約因子に基づいて、前記スコアの組を更新するための制約付きのスコアリング関数を求めることと、
をさらに備えた請求項1に記載の方法。 - 前記スコアリング関数S’(W|X)は、
ここで、∝は、比例を示し、W={Wi}N i=1は、前記解釈におけるN個の単語のシーケンスw1,w2,...,wNであり、wiは、位置iにおいて仮定される単語であり、X={xj}T j=1は、前記音響モデルの音響特徴を示し、xjは前記音声の入力の前記音響特徴のj番目のベクトルであり、Tは、音響特徴ベクトルの数であり、関数p(.|..)は、確率であり、Sは、可能性があるアライメントの組であり、R={ri}N i=1は、仮定される単語ごとの前記音声の仮定される時間領域の組であり、riは、単語wiについて仮定される位置であり、f(X,W,R)は、音響シーケンス、単語シーケンスおよびアライメントのうちの1つまたは複数についての前記制約との整合性の度合いを示す数を出力する制約因子である
請求項11に記載の方法。 - 前記単語シーケンス制約を用いて指標関数を求めることと、
制約充足の度合いを求める重みパラメータを用いて、前記指標関数の線形関数として前記制約因子を求めることと、
をさらに備えた請求項12に記載の方法。 - 前記制約は、前記単語のシーケンスのメタデータを含む
請求項1に記載の方法。 - 最大のスコアを有する前記解釈を認識された前記音声として求めること
をさらに備えた請求項1に記載の方法。 - ユーザの音声を認識する方法であって、
前記音声を表す各解釈の正確さを表す対応するスコアの組に関連付けて解釈の組を生成するために、前記音声を認識することと、
反復ごとに、各解釈のスコアが、前記解釈が制約と整合する場合に増大し、前記解釈が前記制約と整合しない場合に減少するように、少なくとも1つの制約の下で前記スコアの組を反復的に更新することと、
を備え、
前記方法のステップは、プロセッサによって実行される
音声を認識する方法。 - 音声を認識するシステムであって、
音声認識モジュールおよび誤り訂正モジュールを実施するプロセッサを備え、
前記音声認識モジュールは、
音響モデルおよび言語モデルを用いて前記音声の入力の解釈の組を生成し、
解釈ごとに、前記音声を表す解釈の正確さを表すスコアを求め、
前記誤り訂正モジュールは、
前記音声を認識するための制約を求め、
前記制約との前記解釈の整合性に基づいて各解釈の前記スコアを更新する
音声を認識するシステム。 - 単語のシーケンスを表す前記音声を受信するためのオーディオインタフェースと、
前記解釈の組の少なくとも部分組を前記ユーザに通信し、前記ユーザから単語シーケンス制約を受信するコントローラと、
をさらに備え、
前記プロセッサは、前記単語シーケンス制約に基づいて前記制約を求める
請求項17に記載のシステム。 - 前記音声を認識する前記システムは、車両のインストゥルメンタルパネルに埋め込まれる
請求項17に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/917,884 US9159317B2 (en) | 2013-06-14 | 2013-06-14 | System and method for recognizing speech |
US13/917,884 | 2013-06-14 | ||
PCT/JP2014/063760 WO2014199803A1 (en) | 2013-06-14 | 2014-05-19 | System and methods for recognizing speech |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016522903A true JP2016522903A (ja) | 2016-08-04 |
JP6203288B2 JP6203288B2 (ja) | 2017-09-27 |
Family
ID=50896382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015552672A Expired - Fee Related JP6203288B2 (ja) | 2013-06-14 | 2014-05-19 | 音声を認識するシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9159317B2 (ja) |
JP (1) | JP6203288B2 (ja) |
CN (1) | CN105283914B (ja) |
DE (1) | DE112014002819B4 (ja) |
WO (1) | WO2014199803A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018043137A1 (ja) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP7507977B2 (ja) | 2020-10-13 | 2024-06-28 | 三菱電機株式会社 | ロングコンテキストエンドツーエンド音声認識システム |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020047A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话*** |
KR20170034227A (ko) * | 2015-09-18 | 2017-03-28 | 삼성전자주식회사 | 음성 인식 장치 및 방법과, 음성 인식을 위한 변환 파라미터 학습 장치 및 방법 |
US9858923B2 (en) * | 2015-09-24 | 2018-01-02 | Intel Corporation | Dynamic adaptation of language models and semantic tracking for automatic speech recognition |
US20170229124A1 (en) * | 2016-02-05 | 2017-08-10 | Google Inc. | Re-recognizing speech with external data sources |
CN107195296B (zh) * | 2016-03-15 | 2021-05-04 | 阿里巴巴集团控股有限公司 | 一种语音识别方法、装置、终端及*** |
EP3739574B1 (en) | 2016-03-23 | 2023-09-13 | Google LLC | Adaptive audio enhancement for multichannel speech recognition |
US10311046B2 (en) * | 2016-09-12 | 2019-06-04 | Conduent Business Services, Llc | System and method for pruning a set of symbol-based sequences by relaxing an independence assumption of the sequences |
CN106875935A (zh) * | 2017-01-22 | 2017-06-20 | 上海云信留客信息科技有限公司 | 语音智能识别清洗方法 |
KR20180087942A (ko) * | 2017-01-26 | 2018-08-03 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN110770819B (zh) * | 2017-06-15 | 2023-05-12 | 北京嘀嘀无限科技发展有限公司 | 语音识别***和方法 |
US10672388B2 (en) * | 2017-12-15 | 2020-06-02 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for open-vocabulary end-to-end speech recognition |
WO2019163242A1 (ja) * | 2018-02-20 | 2019-08-29 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
CN110931000B (zh) * | 2018-09-20 | 2022-08-02 | 杭州海康威视数字技术股份有限公司 | 语音识别的方法和装置 |
KR20220038514A (ko) * | 2019-05-03 | 2022-03-28 | 구글 엘엘씨 | 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화 |
US20210049927A1 (en) * | 2019-08-13 | 2021-02-18 | Vanderbilt University | System, method and computer program product for determining a reading error distance metric |
KR20210044559A (ko) | 2019-10-15 | 2021-04-23 | 삼성전자주식회사 | 출력 토큰 결정 방법 및 장치 |
CN110738989B (zh) * | 2019-10-21 | 2021-12-07 | 浙江大学 | 一种利用多种语言模型的端到端网络学习解决基于地点的语音的自动识别任务的方法 |
KR102577589B1 (ko) * | 2019-10-22 | 2023-09-12 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11462211B2 (en) * | 2020-04-09 | 2022-10-04 | Mitsubishi Electric Research Laboratories, Inc. | System and method for detecting adversarial attacks |
DE102021100765A1 (de) | 2021-01-15 | 2022-07-21 | Dr. Ing. H.C. F. Porsche Aktiengesellschaft | Verfahren, System und Computerprogrammprodukt zur Bestimmung von sicherheitskritischen Ausgabewerten einer technischen Entität |
JP2024512071A (ja) * | 2021-03-26 | 2024-03-18 | グーグル エルエルシー | 自動音声認識のための多言語再スコアリングモデル |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6428699A (en) * | 1987-07-23 | 1989-01-31 | Fujitsu Ltd | Continuous voice recognition system |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US20050187768A1 (en) * | 2004-02-24 | 2005-08-25 | Godden Kurt S. | Dynamic N-best algorithm to reduce recognition errors |
JP2007183516A (ja) * | 2006-01-10 | 2007-07-19 | Nissan Motor Co Ltd | 音声対話装置及び音声認識方法 |
WO2007108500A1 (ja) * | 2006-03-23 | 2007-09-27 | Nec Corporation | 音声認識システム、音声認識方法および音声認識用プログラム |
US20090150156A1 (en) * | 2007-12-11 | 2009-06-11 | Kennewick Michael R | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
JP2012063536A (ja) * | 2010-09-15 | 2012-03-29 | Ntt Docomo Inc | 端末装置、音声認識方法および音声認識プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2126380C (en) * | 1993-07-22 | 1998-07-07 | Wu Chou | Minimum error rate training of combined string models |
US6064959A (en) | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US5960447A (en) | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
US5970460A (en) | 1997-12-05 | 1999-10-19 | Lernout & Hauspie Speech Products N.V. | Speech recognition and editing system |
AU1097300A (en) * | 1998-09-30 | 2000-04-17 | Brian Gladstein | Graphic user interface for navigation in speech recognition system grammars |
US7444286B2 (en) | 2001-09-05 | 2008-10-28 | Roth Daniel L | Speech recognition using re-utterance recognition |
US7747437B2 (en) | 2004-12-16 | 2010-06-29 | Nuance Communications, Inc. | N-best list rescoring in speech recognition |
CA2592861C (en) * | 2004-12-28 | 2015-10-27 | Loquendo S.P.A. | Automatic speech recognition system and method using weighted confidence measure |
US7529678B2 (en) * | 2005-03-30 | 2009-05-05 | International Business Machines Corporation | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system |
US20060293889A1 (en) | 2005-06-27 | 2006-12-28 | Nokia Corporation | Error correction for speech recognition systems |
EP2798635A4 (en) * | 2011-12-26 | 2016-04-27 | Intel Corp | DETERMINING AUDIO AND VISUAL INPUTS OF OCCUPANTS BASED ON A VEHICLE |
US9646604B2 (en) * | 2012-09-15 | 2017-05-09 | Avaya Inc. | System and method for dynamic ASR based on social media |
-
2013
- 2013-06-14 US US13/917,884 patent/US9159317B2/en not_active Expired - Fee Related
-
2014
- 2014-05-19 WO PCT/JP2014/063760 patent/WO2014199803A1/en active Application Filing
- 2014-05-19 JP JP2015552672A patent/JP6203288B2/ja not_active Expired - Fee Related
- 2014-05-19 DE DE112014002819.3T patent/DE112014002819B4/de not_active Expired - Fee Related
- 2014-05-19 CN CN201480033420.8A patent/CN105283914B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6428699A (en) * | 1987-07-23 | 1989-01-31 | Fujitsu Ltd | Continuous voice recognition system |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US20050187768A1 (en) * | 2004-02-24 | 2005-08-25 | Godden Kurt S. | Dynamic N-best algorithm to reduce recognition errors |
JP2007183516A (ja) * | 2006-01-10 | 2007-07-19 | Nissan Motor Co Ltd | 音声対話装置及び音声認識方法 |
WO2007108500A1 (ja) * | 2006-03-23 | 2007-09-27 | Nec Corporation | 音声認識システム、音声認識方法および音声認識用プログラム |
US20090150156A1 (en) * | 2007-12-11 | 2009-06-11 | Kennewick Michael R | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
JP2012063536A (ja) * | 2010-09-15 | 2012-03-29 | Ntt Docomo Inc | 端末装置、音声認識方法および音声認識プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018043137A1 (ja) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP7507977B2 (ja) | 2020-10-13 | 2024-06-28 | 三菱電機株式会社 | ロングコンテキストエンドツーエンド音声認識システム |
Also Published As
Publication number | Publication date |
---|---|
WO2014199803A1 (en) | 2014-12-18 |
US20140372120A1 (en) | 2014-12-18 |
CN105283914B (zh) | 2018-12-28 |
DE112014002819T5 (de) | 2016-03-03 |
US9159317B2 (en) | 2015-10-13 |
JP6203288B2 (ja) | 2017-09-27 |
CN105283914A (zh) | 2016-01-27 |
DE112014002819B4 (de) | 2021-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6203288B2 (ja) | 音声を認識するシステムおよび方法 | |
US9196246B2 (en) | Determining word sequence constraints for low cognitive speech recognition | |
JP5819924B2 (ja) | アジア文字を生成するための認識アーキテクチャ | |
JP5089955B2 (ja) | 音声対話装置 | |
US10037758B2 (en) | Device and method for understanding user intent | |
JP4666648B2 (ja) | 音声応答システム、音声応答プログラム | |
KR100998566B1 (ko) | 음성인식을 이용한 언어 번역 방법 및 장치 | |
US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
KR102390940B1 (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
US20080162137A1 (en) | Speech recognition apparatus and method | |
JP2011503638A (ja) | カーナビゲーションシステムのための自由会話命令分類の改良 | |
JPWO2008108232A1 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP6272496B2 (ja) | 単語のシーケンスを含む音声を認識するための方法及びシステム | |
JP4634156B2 (ja) | 音声対話方法および音声対話装置 | |
KR20210108557A (ko) | 음성 인식률의 향상을 위한 음성 인식 지원 방법 및 시스템 | |
JP2014164261A (ja) | 情報処理装置およびその方法 | |
JP4012228B2 (ja) | 情報入力方法、情報入力装置及び記憶媒体 | |
JP2015099335A (ja) | 情報処理装置およびその方法 | |
KR102605774B1 (ko) | 스마트 글래스 및 이를 포함하는 음성 인식 시스템 | |
WO2009147745A1 (ja) | 検索装置 | |
US11893994B1 (en) | Processing optimization using machine learning | |
US11380308B1 (en) | Natural language processing | |
JPH09258786A (ja) | 調整機能を有する音声認識装置 | |
JP2008083165A (ja) | 音声認識処理プログラム及び音声認識処理方法 | |
JP4565768B2 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6203288 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |