JP5704686B2 - 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム - Google Patents
音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム Download PDFInfo
- Publication number
- JP5704686B2 JP5704686B2 JP2010217559A JP2010217559A JP5704686B2 JP 5704686 B2 JP5704686 B2 JP 5704686B2 JP 2010217559 A JP2010217559 A JP 2010217559A JP 2010217559 A JP2010217559 A JP 2010217559A JP 5704686 B2 JP5704686 B2 JP 5704686B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- unit
- similar
- speech
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims description 168
- 238000000034 method Methods 0.000 title claims description 50
- 230000015572 biosynthetic process Effects 0.000 claims description 84
- 238000003786 synthesis reaction Methods 0.000 claims description 84
- 230000005540 biological transmission Effects 0.000 claims description 48
- 230000004044 response Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 17
- 238000007726 management method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
(実施の形態1)
端末装置11は、音声受付部111、音声関連情報取得部112、音声関連情報送信部113、候補文字列受信部114、候補文字列出力部115、指示受付部116、候補文字列特定情報送信部117、音声合成結果受信部118、および合成音声出力部119を具備する。
次に、音声翻訳システム1の動作について説明する。まず、端末装置11の動作について、図3のフローチャートを用いて説明する。
(実施の形態2)
次に、音声翻訳装置2の動作について、図9のフローチャートを用いて説明する。図9のフローチャートにおいて、図3または図4のフローチャートと同一のステップの説明を省略する。なお、図9のフローチャートは、図3または図4のフローチャートと同様のステップにより構成されるので、説明を省略する。また、図9のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
2 音声翻訳装置
11 端末装置
12 サーバ装置
111 音声受付部
112 音声関連情報取得部
113 音声関連情報送信部
114 候補文字列受信部
115、202 候補文字列出力部
116 指示受付部
117 候補文字列特定情報送信部
118 音声合成結果受信部
119、204 合成音声出力部
120 固有表現情報格納部
121 音声関連情報受信部
122、201 音声認識部
123 類似音素列取得部
124 類似文字列取得部
125 候補文字列送信部
126 候補文字列特定情報受信部
127、203 機械翻訳部
128 音声合成部
129 音声合成結果送信部
130 制御部
Claims (8)
- 端末装置とサーバ装置とを具備する音声翻訳システムであって、
前記端末装置は、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声、または前記音声受付部が受け付けた音声に関する1以上の特徴量である音声関連情報を取得する音声関連情報取得部と、
前記音声関連情報を前記サーバ装置に送信する音声関連情報送信部と、
前記サーバ装置から2以上の候補文字列を受信する候補文字列受信部と、
前記候補文字列受信部が受信した2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部と、
前記指示受付部が受け付けた指示に対応する候補文字列を特定する候補文字列特定情報を、前記サーバ装置に送信する候補文字列特定情報送信部と、
前記サーバ装置から音声合成結果を受信する音声合成結果受信部と、
前記音声合成結果を用いて音声出力する合成音声出力部とを具備し、
前記サーバ装置は、
音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、
前記音声関連情報を受信する音声関連情報受信部と、
前記音声関連情報を用いて、音声認識し、音素列および音声認識結果の文字列である音声認識文字列を取得する音声認識部と、
前記音声認識部が取得した音素列と前記固有表現情報格納部に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している1以上の音素列を、前記固有表現情報格納部から取得する類似音素列取得部と、
前記類似音素列取得部が取得した1以上の音素列に対応する文字列である1以上の類似文字列を、前記固有表現情報格納部から取得する類似文字列取得部と、
前記音声認識部が取得した音声認識文字列と前記類似文字列取得部が取得した1以上の各類似文字列とを比較し、前記音声認識文字列と一致する文字列が、前記1以上の類似文字列の中に存在するか否かを判断する制御部と、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した1以上の類似文字列である2以上の候補文字列を、前記端末装置に送信する候補文字列送信部と、
前記2以上の候補文字列の送信に対応して、一の候補文字列を特定する情報である候補文字列特定情報を、前記端末装置から受信する候補文字列特定情報受信部と、
前記候補文字列特定情報に対応する候補文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、
前記音声合成結果を前記端末装置に送信する音声合成結果送信部とを具備し、
前記候補文字列送信部は、
前記音声認識部が取得した音声認識文字列と一致する文字列が、前記類似文字列取得部が取得した1以上の類似文字列の中に存在すると前記制御部が判断した場合、前記候補文字列を送信しない音声翻訳システム。 - 前記類似音素列取得部は、
前記音声認識部が取得した音素列と前記固有表現情報格納部に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している2以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した2以上の音素列に対応する文字列である2以上の類似文字列を、前記固有表現情報格納部から取得し、
前記候補文字列送信部は、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した2以上の類似文字列である3以上の候補文字列を、前記端末装置に送信する請求項1記載の音声翻訳システム。 - 音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を音声認識し、音素列および音声認識結果の文字列である音声認識文字列を取得する音声認識部と、
前記音声認識部が取得した音素列と前記固有表現情報格納部に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している1以上の音素列を、前記固有表現情報格納部から取得する類似音素列取得部と、
前記類似音素列取得部が取得した1以上の音素列に対応する文字列である1以上の類似文字列を、前記固有表現情報格納部から取得する類似文字列取得部と、
前記音声認識部が取得した音声認識文字列と前記類似文字列取得部が取得した1以上の各類似文字列とを比較し、前記音声認識文字列と一致する文字列が、前記1以上の類似文字列の中に存在するか否かを判断する制御部と、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した1以上の類似文字列である2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部と、
前記指示受付部が受け付けた指示に対応する一の候補文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、
前記音声合成結果を用いて音声出力する合成音声出力部とを具備し、
前記候補文字列出力部は、
前記音声認識部が取得した文字列と一致する文字列が、前記類似文字列取得部が取得した1以上の類似文字列の中に存在すると前記制御部が判断した場合、前記候補文字列を出力しない音声翻訳装置。 - 前記類似音素列取得部は、
前記音声認識部が取得した音素列と前記固有表現情報格納部に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している2以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した2以上の音素列に対応する文字列である2以上の類似文字列を、前記固有表現情報格納部から取得し、
前記候補文字列出力部は、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した2以上の類似文字列である3以上の候補文字列を出力する請求項3記載の音声翻訳装置。 - 記憶媒体に、
音素列と文字列とを有する2以上の固有表現情報を格納しており、
音声受付部、音声認識部、類似音素列取得部、類似文字列取得部、制御部、候補文字列出力部、指示受付部、機械翻訳部、音声合成部、および合成音声出力部により実現される音声翻訳方法であって、
前記音声受付部が、音声を受け付ける音声受付ステップと、
前記音声認識部が、前記音声受付ステップで受け付けられた音声を音声認識し、音素列および音声認識結果の文字列である音声認識文字列を取得する音声認識ステップと、
前記類似音素列取得部が、前記音声認識ステップで取得された音素列と前記記憶媒体に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している1以上の音素列を、前記記憶媒体から取得する類似音素列取得ステップと、
前記類似文字列取得部が、前記類似音素列取得ステップで取得された1以上の音素列に対応する文字列である1以上の類似文字列を、前記記憶媒体から取得する類似文字列取得ステップと、
前記制御部が、前記音声認識ステップで取得された音声認識文字列と前記類似文字列取得ステップで取得された1以上の各類似文字列とを比較し、前記音声認識文字列と一致する文字列が、前記1以上の類似文字列の中に存在するか否かを判断する制御ステップと、
前記候補文字列出力部が、前記音声認識ステップで取得された音声認識文字列および前記類似文字列取得ステップで取得された1以上の類似文字列である2以上の候補文字列を出力する候補文字列出力ステップと、
前記指示受付部が、前記候補文字列出力ステップで出力された2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付ステップと、
前記機械翻訳部が、前記指示受付ステップで受け付けられた指示に対応する一の候補文字列を翻訳し、翻訳結果を取得する機械翻訳ステップと、
前記音声合成部が、前記機械翻訳ステップで取得された翻訳結果を音声合成し、音声合成結果を取得する音声合成ステップと、
前記合成音声出力部が、前記音声合成結果を用いて音声出力する合成音声出力ステップとを具備し、
前記候補文字列出力ステップにおいて、
前記音声認識ステップで取得された文字列と一致する文字列が、前記類似文字列取得ステップで取得された1以上の類似文字列の中に存在すると前記制御ステップで判断された場合、前記候補文字列を出力しない音声翻訳方法。 - 前記類似音素列取得ステップにおいて、
前記音声認識ステップで取得された音素列と前記記憶媒体に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している2以上の音素列を、前記記憶媒体から取得し、
前記類似文字列取得ステップにおいて、
前記類似音素列取得ステップで取得された2以上の音素列に対応する文字列である2以上の類似文字列を、前記記憶媒体から取得し、
前記候補文字列出力ステップにおいて、
前記音声認識ステップで取得された音声認識文字列および前記類似文字列取得ステップで取得された2以上の類似文字列である3以上の候補文字列を出力する請求項5記載の音声翻訳方法。 - 記憶媒体に、
音素列と文字列とを有する2以上の固有表現情報を格納しており、
コンピュータを、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を音声認識し、音素列を取得する音声認識部と、
前記音声認識部が取得した音素列と前記記憶媒体に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している1以上の音素列を、前記記憶媒体から取得する類似音素列取得部と、
前記類似音素列取得部が取得した1以上の音素列に対応する文字列である1以上の類似文字列を、前記記憶媒体から取得する類似文字列取得部と、
前記音声認識部が取得した音声認識文字列と前記類似文字列取得部が取得した1以上の各類似文字列とを比較し、前記音声認識文字列と一致する文字列が、前記1以上の類似文字列の中に存在するか否かを判断する制御部と、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した1以上の類似文字列である2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部と、
前記指示受付部が受け付けた指示に対応する一の候補文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、
前記音声合成結果を用いて音声出力する合成音声出力部として機能させるためのプログラムであって、
前記候補文字列出力部は、
前記音声認識部が取得した文字列と一致する文字列が、前記類似文字列取得部が取得した1以上の類似文字列の中に存在すると前記制御部が判断した場合、前記候補文字列を出力しないものとして、コンピュータ機能させるためのプログラム。 - 前記類似音素列取得部は、
前記音声認識部が取得した音素列と前記記憶媒体に格納されている2以上の各固有表現情報が有する2以上の音素列との類似度を算出し、当該類似度が所定の条件を満たすほど類似している2以上の音素列を、前記記憶媒体から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した2以上の音素列に対応する文字列である2以上の類似文字列を、前記記憶媒体から取得し、
前記候補文字列出力部は、
前記音声認識部が取得した音声認識文字列および前記類似文字列取得部が取得した2以上の類似文字列である3以上の候補文字列を出力するものとして、コンピュータを機能させるための請求項7記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217559A JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217559A JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073369A JP2012073369A (ja) | 2012-04-12 |
JP5704686B2 true JP5704686B2 (ja) | 2015-04-22 |
Family
ID=46169614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217559A Active JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5704686B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015052743A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
JP2015052745A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031385A (ja) * | 2004-07-15 | 2006-02-02 | Nec Corp | 音声入力による検索システムと方法並びにプログラム |
JP4559946B2 (ja) * | 2005-09-29 | 2010-10-13 | 株式会社東芝 | 入力装置、入力方法および入力プログラム |
JP4393494B2 (ja) * | 2006-09-22 | 2010-01-06 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
JP4271224B2 (ja) * | 2006-09-27 | 2009-06-03 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム |
JP2008243080A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 音声を翻訳する装置、方法およびプログラム |
US8478578B2 (en) * | 2008-01-09 | 2013-07-02 | Fluential, Llc | Mobile speech-to-speech interpretation system |
-
2010
- 2010-09-28 JP JP2010217559A patent/JP5704686B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012073369A (ja) | 2012-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5598998B2 (ja) | 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置 | |
US7552045B2 (en) | Method, apparatus and computer program product for providing flexible text based language identification | |
TWI506982B (zh) | 音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體 | |
US20080126093A1 (en) | Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System | |
KR20090130028A (ko) | 분산 음성 검색을 위한 방법 및 장치 | |
JP6327848B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム | |
US20120221321A1 (en) | Speech translation system, control device, and control method | |
US8131550B2 (en) | Method, apparatus and computer program product for providing improved voice conversion | |
KR20090111825A (ko) | 언어 독립적인 음성 인덱싱 및 검색 방법 및 장치 | |
US20120166176A1 (en) | Speech translation system, dictionary server, and program | |
JP4987682B2 (ja) | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム | |
GB2557714A (en) | Determining phonetic relationships | |
KR20080040960A (ko) | 대응 문형 패턴 기반 자동통역 방법 및 장치 | |
JP2014048506A (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
JPWO2016147342A1 (ja) | 情報提供システム | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
JP5558284B2 (ja) | 音声認識システム、音声認識方法、および音声認識プログラム | |
US7181397B2 (en) | Speech dialog method and system | |
EP3241123B1 (en) | Voice recognition-based dialing | |
JP5704686B2 (ja) | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
CN112614482A (zh) | 移动端外语翻译方法、***及存储介质 | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
CN114586021B (zh) | 信息输出装置、信息输出方法以及记录介质 | |
CN117059076A (zh) | 方言语音识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5704686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |