JP6298806B2 - 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム - Google Patents
音声翻訳システム及びその制御方法、並びに音声翻訳プログラム Download PDFInfo
- Publication number
- JP6298806B2 JP6298806B2 JP2015241459A JP2015241459A JP6298806B2 JP 6298806 B2 JP6298806 B2 JP 6298806B2 JP 2015241459 A JP2015241459 A JP 2015241459A JP 2015241459 A JP2015241459 A JP 2015241459A JP 6298806 B2 JP6298806 B2 JP 6298806B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voice
- unit
- unrecognizable
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図1は、本発明による音声翻訳システムに係るネットワーク構成等の好適な一実施形態を概略的に示すシステムブロック図である。音声翻訳システム100は、ユーザ(発話者、他の発話者)が使用する情報端末10(ユーザ装置)にネットワークNを介して電子的に接続されるサーバ20を備える。
(音声翻訳における音声データベース構築処理1)
図4は、音声翻訳システム100における音声データベース構築を含む処理の一例を示すフローチャートである。かかる音声データベース構築は、音声翻訳システム100による音声翻訳処理の一部を構成する。
図5は、音声翻訳システム100における音声照会を含む処理の一例を示すフローチャートである。かかる音声照会は、音声翻訳システム100による音声翻訳処理の一部を構成する。ここでの処理は、「ユーザ(発話者)」に代えて「ユーザ(他の発話者)」が音声入力を行い、ステップSJ5に代えてステップSJ6の処理を実行すること以外は、図4に示す処理と実質的に同一である。よって、以下、この相違点に関連する処理以外の処理については説明を省略する。また、図5に示す音声翻訳処理は、音声照会処理をユーザ(他の発話者)の音声を認識できなかったとき(音声認識を一旦実行した後)に実行する手順の一例である。
図6は、音声翻訳システム100における音声照会を含む処理の他の一例を示すフローチャートである。かかる音声照会も、音声翻訳システム100による音声翻訳処理の一部を構成する。ここでの処理は、「ユーザ(発話者)」に代えて「ユーザ(他の発話者)」が音声入力(ステップST1)を行い、且つ、ステップSJ5に代えてステップSJ7の処理を実行すること以外は、図4に示す処理と実質的に同一である。よって、以下、この相違点に関連する処理以外の処理については説明を省略する。また、図6に示す音声翻訳処理は、ユーザ(他の発話者)の音声を認識する前に、音声照会処理を実行する手順の一例である。
(音声翻訳における音声データベース構築処理2)
図7は、音声翻訳システム100における音声データベース構築を含む処理の他の一例を示すフローチャートである。かかる音声データベース構築も、音声翻訳システム100による音声翻訳処理の一部を構成する。ここでの処理は、ユーザ(発話者)による音声入力(ステップST1)に先立って、ユーザ(発話者)によるユーザ情報の入力(ステップST0)を実施し、且つ、「認識不可音声」の記憶・蓄積(ステップSJ51)に先立って、「ユーザ情報」の記憶・蓄積を実施すること以外は、図4に示す処理と実質的に同一である。よって、以下、この相違点に関連する処理以外の処理については説明を省略する。
図8は、音声翻訳システム100における音声照会を含む処理の他の一例を示すフローチャートである。かかる音声照会も、音声翻訳システム100による音声翻訳処理の一部を構成する。ここでの処理は、「ユーザ(発話者)」に代えて「ユーザ(他の発話者)」が音声入力を行い、ステップSJ5に代えてステップSJ6の処理を実行すること以外は、図7に示す処理と実質的に同一である。よって、以下、この相違点に関連する処理以外の処理については説明を省略する。また、図8に示す音声翻訳処理は、図5に示す例と同様に、ユーザ(他の発話者)の音声を認識できなかったとき(音声認識を一旦実行した後)に実行する手順の一例である。
図9は、音声翻訳システム100における音声照会を含む処理の他の一例を示すフローチャートである。かかる音声照会も、音声翻訳システム100による音声翻訳処理の一部を構成する。ここでの処理は、「ユーザ(発話者)」に代えて「ユーザ(他の発話者)」が情報入力(ステップST0)及び音声入力(ステップST1)を行い、且つ、ステップSJ5に代えてステップSJ7の処理を実行すること以外は、図7に示す処理と実質的に同一である。よって、以下、この相違点に関連する処理以外の処理については説明を省略する。また、図9に示す音声翻訳処理は、ユーザ(他の発話者)の音声を認識する前に、音声照会処理を実行する手順の一例である。
(音声翻訳における音響モデル生成処理)
図10は、音声翻訳システム100における音響モデル生成(改良)を含む処理の一例を示すフローチャートである。かかる音響モデル生成も、音声翻訳システム100による音声翻訳処理の一部を構成する。
11 プロセッサ
12 記憶資源
13 音声入出力デバイス
14 通信インターフェイス
15 入力デバイス
16 表示デバイス
17 カメラ
20 サーバ(音声翻訳システム)
21 プロセッサ
22 通信インターフェイス
23 記憶資源
100 音声翻訳システム
D20 データベース
L20 モジュール
M20 モデル
N ネットワーク
P10,P20 プログラム
Claims (8)
- 発話者の音声を入力するための音声入力部と、
前記音声入力部に入力された音声の内容を認識する音声認識部と、
前記音声認識部で認識された内容を異なる言語の内容に翻訳する翻訳部と、
前記翻訳部で翻訳された内容の音声を合成する音声合成部と、
前記音声合成部で合成された音声を出力する音声出力部と、
前記音声認識部で認識できなかった認識不可音声を記憶する記憶部と、
を備え、
前記音声認識部は、下記(1)又は(2);
(1)前記記憶部に記憶された前記認識不可音声を、前記発話者とは異なるユーザに聞かせ、該認識不可音声の正しい認識内容を該ユーザから受け取る、
(2)前記記憶部に記憶された前記認識不可音声の正しい認識内容を入力することを、前記発話者とは異なるユーザに依頼し、該認識不可音声の正しい認識内容を該ユーザから受け取る、
の処理を実行し、
前記記憶部は、前記認識不可音声と、該認識不可音声の正しい認識内容を、音声データベースとして記憶し、
前記音声認識部は、前記音声データベースを参照し、前記音声入力部に入力された他の発話者の音声を前記音声データベースに記憶された前記認識不可音声と照合し、該照合結果に基づいて、該音声の正しい認識内容を翻訳部に提供する音声照会処理を実行する、
音声翻訳システム。 - 前記音声認識部は、前記他の発話者の音声を認識できなかったときに、又は、前記他の発話者の音声を認識する前に、前記音声照会処理を実行する、
請求項1記載の音声翻訳システム。 - 前記発話者及び前記他の発話者の属性に関する情報を取得する情報取得部を更に備え、
前記記憶部は、前記認識不可音声、及び、前記正しい認識内容を、前記発話者の属性に関連付けて前記音声データベースとして記憶し、
前記音声認識部は、前記他の発話者の属性を前記音声データベースに記憶された前記属性と照合し、該照合結果に基づいて、前記音声照会処理を実行する、
請求項1又は2記載の音声翻訳システム。 - 前記属性は、前記発話者の年齢若しくは年齢の範囲又は性別である、
請求項3記載の音声翻訳システム。 - 前記音声認識部における前記入力された音声の認識に用いる第1の音響モデルに対して、前記認識不可音声及び該認識不可音声の正しい認識内容を用いた適応処理を実施して第2の音響モデルを生成する音響モデル生成部を更に備える、
請求項1乃至4の何れか記載の音声翻訳システム。 - 前記発話者の属性に関する情報を取得する情報取得部を更に備え、
前記音響モデル生成部は、前記発話者の属性毎に前記第2の音響モデルを生成し、
前記音声認識部は、前記他の発話者の属性に対応した前記第2の音響モデルを用いて前記入力された音声の内容を認識する、
請求項5記載の音声翻訳システム。 - 音声入力部、音声認識部、翻訳部、音声合成部、音声出力部、及び記憶部を備える音声翻訳システムの制御方法であって、
前記音声入力部により、発話者の音声を入力するステップと、
前記音声翻訳部により、前記音声入力部に入力された音声の内容を認識するステップと、
前記翻訳部により、前記音声認識部で認識された内容を異なる言語の内容に翻訳するステップと、
前記音声合成部により、前記翻訳部で翻訳された内容の音声を合成するステップと、
前記音声出力部により、前記音声合成部で合成された音声を出力するステップと、
前記記憶部により、前記音声認識部で認識できなかった認識不可音声を記憶するステップと、
を有し、
前記音声の内容を認識するステップにおいては、下記(1)又は(2);
(1)前記記憶部に記憶された前記認識不可音声を、前記発話者とは異なるユーザに聞かせ、該認識不可音声の正しい認識内容を該ユーザから受け取る、
(2)前記記憶部に記憶された前記認識不可音声の正しい認識内容を入力することを、前記発話者とは異なるユーザに依頼し、該認識不可音声の正しい認識内容を該ユーザから受け取る、
の処理を実行し、
前記記憶するステップにおいては、前記認識不可音声と、該認識不可音声の正しい認識内容を、音声データベースとして記憶し、
前記音声の内容を認識するステップにおいては、さらに、前記音声データベースを参照し、前記音声入力部に入力された他の発話者の音声を前記音声データベースに記憶された前記認識不可音声と照合し、該照合結果に基づいて、該音声の正しい認識内容を前記翻訳部に提供する音声照会処理を実行する、
音声翻訳システムの制御方法。 - コンピュータを、
発話者の音声を入力するための音声入力部、
前記音声入力部に入力された音声の内容を認識する音声認識部、
前記音声認識部で認識された内容を異なる言語の内容に翻訳する翻訳部、
前記翻訳部で翻訳された内容の音声を合成する音声合成部、
前記音声合成部で合成された音声を出力する音声出力部、
前記音声認識部で認識できなかった認識不可音声を記憶する記憶部、
として機能させ、
前記音声認識部に、下記(1)又は(2);
(1)前記記憶部に記憶された前記認識不可音声を、前記発話者とは異なるユーザに聞かせ、該認識不可音声の正しい認識内容を該ユーザから受け取る、
(2)前記記憶部に記憶された前記認識不可音声の正しい認識内容を入力することを、前記発話者とは異なるユーザに依頼し、該認識不可音声の正しい認識内容を該ユーザから受け取る、
の処理を実行させ、
前記記憶部に、前記認識不可音声と、該認識不可音声の正しい認識内容を、音声データベースとして記憶させ、
前記音声認識部に、前記音声データベースを参照し、前記音声入力部に入力された他の発話者の音声を前記音声データベースに記憶された前記認識不可音声と照合し、該照合結果に基づいて、該音声の正しい認識内容を翻訳部に提供する音声照会処理を実行させる、
音声翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015241459A JP6298806B2 (ja) | 2015-12-10 | 2015-12-10 | 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015241459A JP6298806B2 (ja) | 2015-12-10 | 2015-12-10 | 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107098A JP2017107098A (ja) | 2017-06-15 |
JP6298806B2 true JP6298806B2 (ja) | 2018-03-20 |
Family
ID=59060817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015241459A Expired - Fee Related JP6298806B2 (ja) | 2015-12-10 | 2015-12-10 | 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6298806B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06289899A (ja) * | 1993-03-31 | 1994-10-18 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2002049387A (ja) * | 2000-08-04 | 2002-02-15 | Tokai Rika Co Ltd | 音声認識装置 |
JP3862169B2 (ja) * | 2002-12-05 | 2006-12-27 | オムロン株式会社 | 音声認識サービス仲介システムと、それに用いる音声認識マスター参照方法 |
JP5218459B2 (ja) * | 2010-03-25 | 2013-06-26 | アイシン・エィ・ダブリュ株式会社 | 車両用情報端末及びプログラム |
JP2014182049A (ja) * | 2013-03-21 | 2014-09-29 | Panasonic Corp | 車載機器と、それを搭載した自動車 |
JP2015014665A (ja) * | 2013-07-04 | 2015-01-22 | セイコーエプソン株式会社 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
-
2015
- 2015-12-10 JP JP2015241459A patent/JP6298806B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017107098A (ja) | 2017-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3716267B1 (en) | Facilitating end-to-end communications with automated assistants in multiple languages | |
US11049493B2 (en) | Spoken dialog device, spoken dialog method, and recording medium | |
US9437192B2 (en) | Method and device of matching speech input to text | |
KR101689290B1 (ko) | 대화에서 정보를 추출하는 장치 | |
TWI313418B (en) | Multimodal speech-to-speech language translation and display | |
US20130238336A1 (en) | Recognizing speech in multiple languages | |
US11093110B1 (en) | Messaging feedback mechanism | |
US20060253272A1 (en) | Voice prompts for use in speech-to-speech translation system | |
JP2015026057A (ja) | インタラクティブキャラクター基盤の外国語学習装置及び方法 | |
JPWO2005101235A1 (ja) | 対話支援装置 | |
CN109256133A (zh) | 一种语音交互方法、装置、设备及存储介质 | |
CN109543021B (zh) | 一种面向智能机器人的故事数据处理方法及*** | |
Hämäläinen et al. | Multilingual speech recognition for the elderly: The AALFred personal life assistant | |
CN111354362A (zh) | 用于辅助听障者交流的方法和装置 | |
JP6290479B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
WO2017135214A1 (ja) | 音声翻訳システム、音声翻訳方法、及び音声翻訳プログラム | |
JP5998298B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6310950B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6298806B2 (ja) | 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム | |
JP6110539B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6383748B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP2022018724A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP2017182394A (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6198879B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6334589B2 (ja) | 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6298806 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |