JP4574390B2 - 音声認識方法 - Google Patents
音声認識方法 Download PDFInfo
- Publication number
- JP4574390B2 JP4574390B2 JP2005045618A JP2005045618A JP4574390B2 JP 4574390 B2 JP4574390 B2 JP 4574390B2 JP 2005045618 A JP2005045618 A JP 2005045618A JP 2005045618 A JP2005045618 A JP 2005045618A JP 4574390 B2 JP4574390 B2 JP 4574390B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- voice
- command
- commands
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 62
- 230000000306 recurrent effect Effects 0.000 description 39
- 230000008569 process Effects 0.000 description 29
- 238000012937 correction Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 19
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 5
- 230000001771 impaired effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
Claims (3)
- 第1、第2のボタンを備え、受信した音声を認識してコマンドを得る音声認識装置の音声認識方法であって、
第1の音声を受信する第1の受信工程と、
前記第1の音声を認識し、第1の認識結果として1つまたは2つのコマンドを得る第1の音声認識工程と、
前記第1の認識結果として得られたコマンドを出力する認識結果出力工程と、
前記第1の認識結果が出力された後、第2の音声を受信する第2の受信工程と、
前記認識結果出力工程で1つまたは2つのコマンドが出力され、前記第1、第2のボタンのいずれも押下されなかった場合、前記第1の認識結果として得られたコマンドを正解と確定し、
前記認識結果出力工程で1つまたは2つのコマンドが出力され、前記第1のボタンが2回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを不正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力工程で1つまたは2つのコマンドが出力され、前記第2のボタンが2回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを不正解と確定し、前記第2の音声から第2の認識結果として2つのコマンドを認識し、
前記認識結果出力工程で1つのコマンドが出力され、前記第2のボタンが押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力工程で2つのコマンドが出力され、前記第1のボタンが1回押下され、前記第2の音声が受信されなかった場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを不正解と確定し、2番目のコマンドを正解と確定し、
前記認識結果出力工程で2つのコマンドが出力され、前記第2のボタンが1回押下され、前記第2の音声が受信されなかった場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを正解と確定し、2番目のコマンドを不正解と確定し、
前記認識結果出力工程で2つのコマンドが出力され、前記第1のボタンが1回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを不正解と確定し、2番目のコマンドを正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力工程で2つのコマンドが出力され、前記第2のボタンが1回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを正解と確定し、2番目のコマンドを不正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識する第2の音声認識工程とを備えた音声認識方法。 - 請求項1に記載の音声認識方法をコンピュータに実行させるための制御プログラム。
- 第1、第2のボタンと、
第1の音声を受信する第1の受信手段と、
前記第1の音声を認識し、第1の認識結果として1つまたは2つのコマンドを得る第1の音声認識手段と、
前記第1の認識結果として得られたコマンドを出力する認識結果出力手段と、
前記第1の認識結果が出力された後、第2の音声を受信する第2の受信手段と、
前記認識結果出力手段によって1つまたは2つのコマンドが出力され、前記第1、第2のボタンのいずれも押下されなかった場合、前記第1の認識結果として得られたコマンドを正解と確定し、
前記認識結果出力手段によって1つまたは2つのコマンドが出力され、前記第1のボタンが2回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを不正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力手段によって1つまたは2つのコマンドが出力され、前記第2のボタンが2回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを不正解と確定し、前記第2の音声から第2の認識結果として2つのコマンドを認識し、
前記認識結果出力手段によって1つのコマンドが出力され、前記第2のボタンが押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドを正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力手段によって2つのコマンドが出力され、前記第1のボタンが1回押下され、前記第2の音声が受信されなかった場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを不正解と確定し、2番目のコマンドを正解と確定し、
前記認識結果出力手段によって2つのコマンドが出力され、前記第2のボタンが1回押下され、前記第2の音声が受信されなかった場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを正解と確定し、2番目のコマンドを不正解と確定し、
前記認識結果出力手段によって2つのコマンドが出力され、前記第1のボタンが1回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを不正解と確定し、2番目のコマンドを正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識し、
前記認識結果出力手段によって2つのコマンドが出力され、前記第2のボタンが1回押下され、前記第2の音声が受信された場合、前記第1の認識結果として得られたコマンドのうち1番目のコマンドを正解と確定し、2番目のコマンドを不正解と確定し、前記第2の音声から第2の認識結果として1つのコマンドを認識する第2の音声認識手段とを備えた音声認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005045618A JP4574390B2 (ja) | 2005-02-22 | 2005-02-22 | 音声認識方法 |
US11/352,661 US20060190255A1 (en) | 2005-02-22 | 2006-02-13 | Speech recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005045618A JP4574390B2 (ja) | 2005-02-22 | 2005-02-22 | 音声認識方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006234907A JP2006234907A (ja) | 2006-09-07 |
JP2006234907A5 JP2006234907A5 (ja) | 2008-04-03 |
JP4574390B2 true JP4574390B2 (ja) | 2010-11-04 |
Family
ID=36913913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005045618A Expired - Fee Related JP4574390B2 (ja) | 2005-02-22 | 2005-02-22 | 音声認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060190255A1 (ja) |
JP (1) | JP4574390B2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4734155B2 (ja) * | 2006-03-24 | 2011-07-27 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
DE102006029755A1 (de) * | 2006-06-27 | 2008-01-03 | Deutsche Telekom Ag | Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung |
US8661029B1 (en) * | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
JP2009169139A (ja) * | 2008-01-17 | 2009-07-30 | Alpine Electronics Inc | 音声認識装置 |
CN103957235B (zh) * | 2011-02-21 | 2018-10-23 | 北京奇虎科技有限公司 | 一种拖动图像的传输显示方法和*** |
JP5396426B2 (ja) * | 2011-04-21 | 2014-01-22 | 株式会社Nttドコモ | 音声認識装置、音声認識方法及び音声認識プログラム |
US9188456B2 (en) | 2011-04-25 | 2015-11-17 | Honda Motor Co., Ltd. | System and method of fixing mistakes by going back in an electronic device |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
CN103714048B (zh) * | 2012-09-29 | 2017-07-21 | 国际商业机器公司 | 用于校正文本的方法和*** |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN107221328B (zh) * | 2017-05-25 | 2021-02-19 | 百度在线网络技术(北京)有限公司 | 修改源的定位方法及装置、计算机设备及可读介质 |
US10832678B2 (en) * | 2018-06-08 | 2020-11-10 | International Business Machines Corporation | Filtering audio-based interference from voice commands using interference information |
US10811007B2 (en) * | 2018-06-08 | 2020-10-20 | International Business Machines Corporation | Filtering audio-based interference from voice commands using natural language processing |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01154100A (ja) * | 1987-12-10 | 1989-06-16 | Ricoh Co Ltd | 音声認識結果確認方式 |
JPH01189699A (ja) * | 1988-01-26 | 1989-07-28 | Toshiba Corp | 入力装置 |
JPH0214000A (ja) * | 1988-07-01 | 1990-01-18 | Hitachi Ltd | 音声認識装置 |
JPH0863185A (ja) * | 1994-08-24 | 1996-03-08 | Ricoh Co Ltd | 音声認識装置 |
JPH103295A (ja) * | 1996-06-18 | 1998-01-06 | Brother Ind Ltd | 音声認識装置 |
JP2002140094A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2003029779A (ja) * | 2001-07-18 | 2003-01-31 | Nec Corp | 自動通訳システム及びその方法並びにプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5131045A (en) * | 1990-05-10 | 1992-07-14 | Roth Richard G | Audio-augmented data keying |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US6601027B1 (en) * | 1995-11-13 | 2003-07-29 | Scansoft, Inc. | Position manipulation in speech recognition |
US6282511B1 (en) * | 1996-12-04 | 2001-08-28 | At&T | Voiced interface with hyperlinked information |
US6092044A (en) * | 1997-03-28 | 2000-07-18 | Dragon Systems, Inc. | Pronunciation generation in speech recognition |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
AU2001259446A1 (en) * | 2000-05-02 | 2001-11-12 | Dragon Systems, Inc. | Error correction in speech recognition |
US20030020760A1 (en) * | 2001-07-06 | 2003-01-30 | Kazunori Takatsu | Method for setting a function and a setting item by selectively specifying a position in a tree-structured menu |
US20040210437A1 (en) * | 2003-04-15 | 2004-10-21 | Aurilab, Llc | Semi-discrete utterance recognizer for carefully articulated speech |
JP3890326B2 (ja) * | 2003-11-07 | 2007-03-07 | キヤノン株式会社 | 情報処理装置、情報処理方法ならびに記録媒体、プログラム |
-
2005
- 2005-02-22 JP JP2005045618A patent/JP4574390B2/ja not_active Expired - Fee Related
-
2006
- 2006-02-13 US US11/352,661 patent/US20060190255A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01154100A (ja) * | 1987-12-10 | 1989-06-16 | Ricoh Co Ltd | 音声認識結果確認方式 |
JPH01189699A (ja) * | 1988-01-26 | 1989-07-28 | Toshiba Corp | 入力装置 |
JPH0214000A (ja) * | 1988-07-01 | 1990-01-18 | Hitachi Ltd | 音声認識装置 |
JPH0863185A (ja) * | 1994-08-24 | 1996-03-08 | Ricoh Co Ltd | 音声認識装置 |
JPH103295A (ja) * | 1996-06-18 | 1998-01-06 | Brother Ind Ltd | 音声認識装置 |
JP2002140094A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2003029779A (ja) * | 2001-07-18 | 2003-01-31 | Nec Corp | 自動通訳システム及びその方法並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20060190255A1 (en) | 2006-08-24 |
JP2006234907A (ja) | 2006-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4574390B2 (ja) | 音声認識方法 | |
JP4416643B2 (ja) | マルチモーダル入力方法 | |
US8160881B2 (en) | Human-assisted pronunciation generation | |
US6735565B2 (en) | Select a recognition error by comparing the phonetic | |
JP4867804B2 (ja) | 音声認識装置及び会議システム | |
KR101819459B1 (ko) | 음성 인식 오류 수정을 지원하는 음성 인식 시스템 및 장치 | |
JP2007264471A (ja) | 音声認識装置および音声認識方法 | |
KR20080063471A (ko) | 이동 장치에 대한 조합된 음성 및 교체 입력 양식을 위한정보 입력 방법, 이동 장치 및 사용자 인터페이스 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP2013050742A (ja) | 音声認識装置および音声認識方法 | |
KR101111487B1 (ko) | 영어 학습장치 및 방법 | |
JP2017198790A (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP6499228B2 (ja) | テキスト生成装置、方法、及びプログラム | |
JP2010204442A (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよびプログラム記録媒体 | |
US7761731B2 (en) | Information processing apparatus and information processing method | |
JP4229627B2 (ja) | ディクテーション装置、方法及びプログラム | |
JP2015099335A (ja) | 情報処理装置およびその方法 | |
US20080256071A1 (en) | Method And System For Selection Of Text For Editing | |
JPH0863185A (ja) | 音声認識装置 | |
KR102449962B1 (ko) | 스마트폰 케이스 기반 점자 키보드 시스템 | |
JP2000047683A (ja) | セグメンテーション補助装置及び媒体 | |
CN118098290A (zh) | 朗读评测方法、装置、设备、存储介质及计算机程序产品 | |
JP2020118872A (ja) | 情報入力システム及び方法 | |
CN113920803A (zh) | 一种错误反馈方法、装置、设备及可读存储介质 | |
JP5152016B2 (ja) | 音声認識用辞書作成装置及び音声認識用辞書作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080220 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100525 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100818 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |