JP2005234136A - 音声認識サーバ、音声入力システム、及び、音声入力方法 - Google Patents
音声認識サーバ、音声入力システム、及び、音声入力方法 Download PDFInfo
- Publication number
- JP2005234136A JP2005234136A JP2004041945A JP2004041945A JP2005234136A JP 2005234136 A JP2005234136 A JP 2005234136A JP 2004041945 A JP2004041945 A JP 2004041945A JP 2004041945 A JP2004041945 A JP 2004041945A JP 2005234136 A JP2005234136 A JP 2005234136A
- Authority
- JP
- Japan
- Prior art keywords
- block
- communication terminal
- voice
- speech
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 音声入力システム1は、入力された音声を送信する通信端末10と、この音声を認識する音声認識サーバ20とから構成される。音声認識サーバ20は、入力された音声を受信するとこれを認識し、認識結果から複数のブロック(単語や文節)を作成する。作成されたブロックの内、先頭のブロックが通信端末10宛に送信され、認識結果が正しい場合には、要求に応じて次のブロックが送信される。認識結果が誤っている場合には、通信端末10は、修正候補の送信を音声認識サーバ20に要求する。音声認識サーバ20は、通信端末10にて修正されたブロックを受信すると、当該ブロックを基に後続のブロックを再音声認識し、認識結果を返信する。
【選択図】 図1
Description
通信端末10は、音声入力インタフェース11(音声入力手段に対応)と、認識結果提示部12(要求手段に対応)と、修正候補格納部13と、認識結果修正部14とを備えて構成される。これら各構成部分は、バスを介して各種信号の入出力が可能なように接続されている。通信端末10は、例えば携帯電話である。
音声入力インタフェース11は、ユーザの発した音声を音声信号に変換し、音声認識サーバ20宛に送信する。認識結果提示部12は、音声認識サーバ20からブロック単位で送信される認識結果を受信し、これをユーザに提示する。誤った認識結果を提示した場合には、修正候補の送信を要求してこれを受信し、ユーザに選択を促す。また、認識結果提示部12は、選択された修正候補を修正結果として送信すると共に、受信された認識結果の確定を行う。
認識結果修正部14は、ハードウェアとしての操作ボタンや入力キーにより構成され、ユーザからの指示に従って、誤った認識結果あるいは修正候補が入力音声に合致するように適宜変更を加える。
音声認識サーバ20は、音声認識部21(音声認識手段に対応)と、ディクテーション辞書22と、ブロック制御部23(制御手段に対応)と、修正結果受信部24とを備えて構成される。これら各構成部分は、バスを介して各種信号の入出力が可能なように接続されている。
修正結果受信部24は、通信端末10から送信された修正結果を受信し、これをブロック制御部23に出力する。
まず、図2のフローチャートを参照して、通信端末10側の動作を説明する。通信端末10のユーザの音声が音声入力インタフェース11により入力されると(S1)、ネットワークNを経由して、入力音声が音声認識サーバ20宛に送信される。S2では、入力音声の認識結果は、一括して送信されず、認識結果を構成する複数のブロックのうち、まず、先頭の1ブロックが通信端末10宛に送信される。このブロックの認識結果は、通信端末10のユーザによって確認され、正しく認識されている場合には(S3;Yes)、認識結果の確定が為される(S10)。
なお、T14において、直前のブロックの修正が無い場合には(T14;No)、再認識処理を行う必要がないので、T15及びT3の各処理は省略され、T4以降の処理が実行される。
例えば、上記実施の形態では、通信端末10として携帯電話を例示した。しかし、通信端末10は、これに限らず、PDA(Personal Digital Assistance)やPHSのように通信機能を備えた情報機器であればよく、その用途やサイズによって、本発明の適用対象を限定するものではない。
Claims (4)
- 通信端末にて入力された音声を認識する音声認識手段と、
前記音声認識手段による音声認識結果を複数のブロックに分割して前記通信端末宛に順次送信させると共に、当該通信端末からの要求に応じて、前記複数のブロックのうち、該要求のあったブロックの修正候補を前記通信端末宛に送信させる制御を行う制御手段と
を備えることを特徴とする音声認識サーバ。 - 前記音声認識手段は、前記通信端末から送信された、ブロックの修正結果を使用して、当該ブロックに後続するブロックを再認識し、
前記制御手段は、前記音声認識手段により再認識されたブロックを前記通信端末宛に送信させる制御を行うことを特徴とする請求項1に記載の音声認識サーバ。 - 請求項1に記載の音声認識サーバと、当該音声認識サーバと通信可能に接続された通信端末とを備える音声入力システムであって、
前記通信端末は、
音声を入力して前記音声認識サーバ宛に送信する音声入力手段と、
前記音声認識サーバによる音声認識結果をブロック単位で表示して、ブロックの修正候補の提示を要求する要求手段と
を備えることを特徴とする音声入力システム。 - 通信端末にて入力された音声を認識する音声認識ステップと、
前記音声認識ステップにおける音声認識結果を複数のブロックに分割して前記通信端末宛に送信する認識結果送信ステップと、
当該通信端末からの要求に応じて、前記認識結果送信ステップにて送信された前記複数のブロックのうち、前記要求のあったブロックの修正候補を前記通信端末宛に送信する修正候補送信ステップと
を含むことを特徴とする音声入力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041945A JP4347716B2 (ja) | 2004-02-18 | 2004-02-18 | 音声認識サーバ、音声入力システム、及び、音声入力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004041945A JP4347716B2 (ja) | 2004-02-18 | 2004-02-18 | 音声認識サーバ、音声入力システム、及び、音声入力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234136A true JP2005234136A (ja) | 2005-09-02 |
JP4347716B2 JP4347716B2 (ja) | 2009-10-21 |
Family
ID=35017171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004041945A Expired - Fee Related JP4347716B2 (ja) | 2004-02-18 | 2004-02-18 | 音声認識サーバ、音声入力システム、及び、音声入力方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4347716B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010048890A (ja) * | 2008-08-19 | 2010-03-04 | Ntt Docomo Inc | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム |
JP2010055044A (ja) * | 2008-04-22 | 2010-03-11 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム |
JP2017015097A (ja) * | 2016-10-07 | 2017-01-19 | 兵神装備株式会社 | 回転容積型ポンプの遠隔モニタリングシステム |
-
2004
- 2004-02-18 JP JP2004041945A patent/JP4347716B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010055044A (ja) * | 2008-04-22 | 2010-03-11 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム |
JP4709887B2 (ja) * | 2008-04-22 | 2011-06-29 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム |
TWI427620B (zh) * | 2008-04-22 | 2014-02-21 | Ntt Docomo Inc | A speech recognition result correction device and a speech recognition result correction method, and a speech recognition result correction system |
JP2010048890A (ja) * | 2008-08-19 | 2010-03-04 | Ntt Docomo Inc | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム |
JP2017015097A (ja) * | 2016-10-07 | 2017-01-19 | 兵神装備株式会社 | 回転容積型ポンプの遠隔モニタリングシステム |
Also Published As
Publication number | Publication date |
---|---|
JP4347716B2 (ja) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113900529B (zh) | 移动装置上的模态学习 | |
KR102201937B1 (ko) | 후속 음성 쿼리 예측 | |
KR101255402B1 (ko) | 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기 | |
JP4446312B2 (ja) | 音声認識中に可変数の代替ワードを表示する方法及びシステム | |
KR101109265B1 (ko) | 텍스트 입력 방법 | |
US20160078020A1 (en) | Speech translation apparatus and method | |
US9123339B1 (en) | Speech recognition using repeated utterances | |
JP4680691B2 (ja) | 対話システム | |
US20130282359A1 (en) | Method and apparatus of translating language using voice recognition | |
US7496513B2 (en) | Combined input processing for a computing device | |
WO2014208231A1 (ja) | ローカルな音声認識を行なう音声認識クライアント装置 | |
US20060293889A1 (en) | Error correction for speech recognition systems | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
JPH10187406A (ja) | 音声認識中に認識されたワードをバッファする方法及びシステム | |
US20150149163A1 (en) | Voice input correction | |
US8326597B2 (en) | Translation apparatus, method, and computer program product for detecting language discrepancy | |
JP5688677B2 (ja) | 音声入力支援装置 | |
US11468902B2 (en) | Voice recognition device and voice recognition method | |
JP4347716B2 (ja) | 音声認識サーバ、音声入力システム、及び、音声入力方法 | |
WO2012144525A1 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2012063526A (ja) | 端末装置、音声認識方法および音声認識プログラム | |
KR102373247B1 (ko) | 네트워크를 이용한 사용자 적응 음성 명령 인식 방법 및 그 장치 | |
JP2010197709A (ja) | 音声認識応答方法、音声認識応答システム、及びそのプログラム | |
JPH09230889A (ja) | 音声認識応答装置 | |
EP4095847A1 (en) | Method and apparatus for processing voice recognition result, electronic device, and computer medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090716 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4347716 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |