JP2002304392A

JP2002304392A - 音声翻訳システム

Info

Publication number: JP2002304392A
Application number: JP2001105349A
Authority: JP
Inventors: Takeshi Matsuda; 猛松田; Atsushi Nishino; 敦士西野; Gruhn Rainer; グルーンライナー; Satoru Nakamura; 哲中村
Original assignee: ATR ONSEI GENGO TSUSHIN KENKYU; ATR Spoken Language Translation Research Laboratories
Current assignee: ATR ONSEI GENGO TSUSHIN KENKYU; ATR Spoken Language Translation Research Laboratories
Priority date: 2001-04-04
Filing date: 2001-04-04
Publication date: 2002-10-18

Abstract

(57)【要約】【構成】互いに異なる言語を母国語（使用言語）とす
る２人の話者が通信ネットワーク４０を介して会話をす
るとき、各々の話者の発話音声は、音声翻訳システム１
０によって取り込まれる。音声翻訳システム１０は、取
り込まれた発話音声に基づいて各々の話者の母国語が特
定し、特定した母国語に基づいて発話音声を翻訳し、そ
して翻訳された合成音声を各々の話者に伝える。【効果】オペレータを介在させることなく、翻訳音声
による会話を成立させることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声翻訳システ
ムに関し、特にたとえば、互いに異なる言語を使用する
２人の話者の間で通信回線を介して行なわれる会話を翻
訳（通訳）する、音声翻訳システムに関する。

【０００２】

【従来技術】従来のこの種の音声翻訳システムとして
は、各々の話者の発話音声に音声認識，言語翻訳および
音声合成の一連の翻訳処理を施し、合成音声を相手方に
伝えるものがあった。

【０００３】

【発明が解決しようとする課題】しかし、従来技術は、
予め決定された２つの言語間での翻訳を前提としてお
り、翻訳先の言語を変更するにはオペレータを介在させ
る必要があった。

【０００４】それゆえに、この発明の主たる目的は、オ
ペレータを介在させることなく任意の言語間で翻訳を行
なうことができる、音声翻訳システムを提供することで
ある。

【０００５】

【課題を解決するための手段】この発明は、互いに異な
る言語を使用する複数の話者の間で通信回線を介して行
なわれる会話を翻訳する音声翻訳システムにおいて、各
々の話者の発話音声を取り込む取り込み手段、発話音声
の特徴を抽出する抽出手段、発話音声の特徴に基づいて
各々の話者の使用言語を特定する特定手段、発話音声の
内容を認識する認識手段、発話音声の内容を特定手段に
よる特定結果に基づいて翻訳する翻訳手段、翻訳手段に
よる翻訳結果に基づいて合成音声を作成する作成手段、
および合成音声を出力する出力手段を備えることを特徴
とする、音声翻訳システムである。

【０００６】

【作用】互いに異なる言語を使用する複数の話者の発話
音声は取り込み手段によって取り込まれる。発話音声の
特徴は抽出手段によって抽出され、特定手段は、抽出さ
れた特徴に基づいて各々の話者の使用言語を特定する。
また、発話音声の内容は認識手段によって認識され、翻
訳手段は、認識された内容を特定手段による特定結果に
基づいて翻訳する。合成手段は翻訳結果に基づいて合成
音声を作成し、作成された合成音声は出力手段によって
出力される。これによって、オペレータが介在すること
なく、各々の話者の間で通信回線を介した会話が成立す
る。

【０００７】好ましくは、各々の話者の電話番号が、電
話番号検出手段によって検出され、各々の話者が属する
国が、当該電話番号に基づいて国検出手段によって検出
される。音声案内手段は、発話音声の取り込みに先立っ
て、検出された国の公用語で音声案内を行なう。このと
き、特定手段は、音声案内に対する返事に基づいて各々
の話者の使用言語を特定する。

【０００８】さらに好ましくは、音声案内に対して返事
がないと、音声案内の言語が変更手段によって変更され
る。音声案内に対して肯定的な返事があると、決定手段
が、現時点の音声案内の言語を返事をした話者の使用言
語として決定する。

【０００９】特定された使用言語を示す使用言語情報を
メモリに格納する場合、翻訳手段はメモリに格納された
使用言語情報に従って翻訳を行なう。

【００１０】発話音声が取り込まれる毎に発話元の使用
言語を特定する場合、発話音声の取り込む毎に特定され
た使用言語情報によってメモリを更新するようにしても
よい。

【００１１】

【発明の効果】この発明によれば、取り込まれた発話音
声の特徴に基づいて各々の話者の使用言語を特定するよ
うにしたため、オペレータが介在しなくても、通信回線
を介して翻訳音声による会話を行なうことができる。

【００１２】この発明の上述の目的，その他の目的，特
徴および利点は、図面を参照して行う以下の実施例の詳
細な説明から一層明らかとなろう。

【００１３】

【実施例】図１を参照して、この実施例の音声翻訳シス
テム１０は、インターネットのような通信ネットワーク
４０に接続される。通信ネットワーク４０には、複数の
電話機２０および３０も接続される。ここで、電話機２
０はたとえば日本国内に設置され、日本国在住の日本人
Ａによって使用される。また、電話機３０はたとえば米
国内に設置され、米国在住のドイツ人Ｂによって使用さ
れる。

【００１４】日本人Ａが音声翻訳システム１０を利用し
てドイツ人Ｂと会話したいとき、日本人Ａは、まず音声
翻訳システム１０にアクセスする。ドイツ人Ｂに対する
発呼処理は音声翻訳システム１０によって行なわれ、ド
イツ人Ｂが応答すると、通話可能状態となる。日本人Ａ
の発話音声は日本語からドイツ語に翻訳され、翻訳され
た合成音声がドイツ人Ｂに伝えられる。逆に、ドイツ人
Ｂの発話音声はドイツ語から日本語に翻訳され、翻訳さ
れた合成音声が日本人Ａに伝えられる。

【００１５】図２を参照して、音声翻訳システム１０
は、統合管理システム１０ａ，データベースサーバ１０
ｂ，複数の音声認識システム１０ｃ，１０ｃ，…，複数
の言語翻訳システム１０ｄ，１０ｄ，…および複数の音
声合成システム１０ｅ，１０ｅ，…およびモデム１０ｆ
からなる。この音声翻訳システム１０は、分散ネットワ
ークによって構成され、音声認識システム１０ｃによる
音声認識，言語翻訳システム１０ｄによる言語翻訳，お
よび音声合成システム１０ｅによる音声合成によって、
発話音声の翻訳が実現される。

【００１６】具体的には、各々の話者（日本人Ａおよび
ドイツ人Ｂ）の発話音声の内容は、音声認識システム１
０ｃによって認識される。音声認識システム１０はま
た、発話音声の特徴を抽出し、発話元の音声母国語（日
本人Ａについては日本語、ドイツ人Ｂについてはドイツ
語），声質および性別を特定する。特定された母国語情
報，声質情報および性別情報は、データベースサーバ１
０ｂに登録される。

【００１７】言語翻訳システム１０ｄは、認識された発
話音声の内容をデータベースサーバ１０ｂに登録された
母国語情報に基づいて翻訳する。日本人Ａについては母
国語情報“日本語”がデータベースサーバ１０ｂに登録
され、日本人Ａについては母国語情報“日本語”がデー
タベースサーバ１０ｂに登録される。このため、日本人
Ａの発話音声の内容は言語翻訳システム１０ｄによって
ドイツ語に翻訳され、また逆にドイツ国人Ｂの発話音声
の内容は言語翻訳システム１０ｄによって日本語に翻訳
される。

【００１８】音声合成システム１０ｅは、言語翻訳シス
テム１０ｄによる翻訳内容とデータベースサーバ１０ｂ
に登録された声質情報および性別情報に基づいて合成音
声を作成し、作成した合成音声を各々の話者に伝える。
日本人Ａが高い声で話す女性であれば、女性らしい口調
でかつキーの高いドイツ語の合成音声がドイツ人Ｂに伝
えられる。また、ドイツＢが低い声で話す男性であれ
ば、男性らしい口調でかつキーの低い日本語の合成音声
が日本人Ａに伝えられる。

【００１９】音声認識システム１０ｃ，言語翻訳システ
ム１０ｄ，音声合成システム１０ｅおよびデータベース
サーバ１０ｂは、統合管理システム１０ａによって管理
される。モデム１０ｆを通してアクセスがあると、統合
管理システム１０がこれらのシステムおよびサーバを制
御し、利用者に翻訳サービスを提供する。統合管理シス
テム１０ａは、具体的には図３〜図８に示すフロー図を
処理する。

【００２０】音声翻訳システム１０へのアクセス要求に
は発呼元の電話番号情報が含まれる。このため、まずス
テップＳ１でアクセス要求から電話番号情報を取得し、
続くステップＳ３では検出された電話番号情報に基づい
て発呼元の国情報を検出する。日本人Ａが電話機２０を
用いて音声翻訳システム１０にアクセスした場合、電話
番号情報には国番号“８１”が含まれる。ステップＳ３
では、この国番号“８１”から発呼元の国を日本と特定
する。ステップＳ５ではこうして得られた発呼元の電話
番号情報および国情報を内部メモリに保持し、ステップ
Ｓ７では、保持された国情報から発呼者の母国語（発呼
者が属する国の公用語）を仮決定する。発呼者が日本人
Ａであるとき、ステップＳ７では日本語が母国語として
仮決定される。

【００２１】ステップＳ９では、仮決定された母国語で
発呼者に音声ガイダンスを行なう。仮決定された母国語
が日本語であれば、“こちらはＡＴＲ音声言語通信研究
所の提供する自動音声翻訳サービスです。あなたがお話
になる言語は日本語ですか？”という内容の合成音声が
発呼者に伝えられる。音声ガイダンスを終えると、ステ
ップＳ１１で発呼者からの音声入力があったかどうか判
断するとともに、ステップＳ１３で所定時間が経過した
かどうか判断する。所定期間内に音声入力がなかったと
きは、発呼者の母国語は仮決定母国語と異なるとみな
し、ステップＳ１５で仮決定母国語をたとえば英語に変
更してからステップＳ９に戻る。ステップＳ９では、変
更された言語すなわち英語による音声ガイダンスが行な
われる。

【００２２】発呼者から音声入力があったときは、音声
認識システム１０ｃを制御してステップＳ１７〜Ｓ２１
の処理を行なう。まずステップＳ１７で、入力された発
話音声の特徴を抽出する。ステップＳ１９では抽出され
た特徴から発話者の母国語，声質および性別を特定し、
特定した母国語情報，声質情報および性別情報を発呼元
の電話番号情報および国情報と関連付けてデータベース
サーバ１０ｂに登録する。ステップＳ２１では、入力さ
れた発話音声を認識して音声ガイダンスに対する返事を
取得する。

【００２３】取得した返事が“はい、そうです”などの
肯定的な返事であれば、ステップＳ２３でＹＥＳと判断
し、ステップＳ３１に進む。これに対して、返事が否定
的であればステップＳ２５に進み、返事から発話者の言
語を決定できるかどうか判断する。返事の内容が単に
“いいえ”であれば、ステップＳ２５でＮＯと判断し、
ステップＳ１５で仮決定母国語を変更してからステップ
Ｓ９に戻る。一方、返事が“いいえ、英語です”のよう
に母国語を決定できる言葉が入っていれば、ステップＳ
２５でＹＥＳと判断し、ステップＳ２７でデータベース
サーバ１０ｂの母国語情報を更新してからステップＳ３
１に進む。

【００２４】ステップＳ３１では通話相手の電話番号の
入力を促す音声ガイダンスを行なう。具体的には、デー
タベースサーバ１０ｂに登録された母国語情報に従う言
語で、“相手先の電話番号を国番号から言ってください
？”との音声メッセージを出力する。ステップＳ３３で
はこの音声メッセージに対して音声入力があったかどう
か判断し、ステップＳ３５では所定期間が経過したかど
うか判断する。発呼者から応答がないまま所定期間が経
過したときは、ステップＳ３５でＹＥＳと判断し、ステ
ップＳ３１に戻る。このため、同じ音声メッセージが再
度出力される。

【００２５】一方、発呼者の発話音声が入力されると、
ステップＳ３３でＹＥＳと判断し、音声認識システム１
０ｃを用いてステップＳ３７〜４１の処理を行なう。ス
テップＳ３７では発話音声の特徴を抽出し、ステップＳ
３９では抽出された特徴から特定した発話者の母国語情
報，声質情報および性別情報をデータベースサーバ１０
ｂに登録する。つまり、データベースサーバ１０ｂに登
録された母国語情報，声質情報および性別情報は、発話
音声が入力される毎に更新される。

【００２６】ステップＳ４１では入力された発話音声を
認識して相手方の電話番号情報を取得し、続くステップ
Ｓ４３では取得した電話番号情報の正当性を判断する。
電話番号情報に国番号が含まれていないような場合、こ
のステップでＮＯと判断され、ステップＳ３１に戻る。
一方、電話番号情報が正当であれば、ステップＳ４５に
進み、電話番号を確認するための音声ガイダンスを行な
う。具体的には、データベースサーバ１０ｂに登録され
た母国語情報に従う言語で、“相手先の電話番号は、○
○○−××××−△△△△△ですね？”との音声メッセ
ージを出力する。

【００２７】ステップＳ４７ではこの音声メッセージに
対して音声入力があったかどうか判断し、ステップＳ４
９では所定期間が経過したかどうか判断する。所定期間
にわたって返事がないときはステップＳ４９でＹＥＳと
判断し、ステップＳ４５に戻る。一方、発呼者から音声
による返事があるとステップＳ４７でＹＥＳと判断し、
音声認識システム１０ｃを用いてステップＳ５１〜５５
の処理を行なう。ステップＳ５１では、返事を形成する
音声から特徴を抽出する。ステップＳ５３では、抽出さ
れた特徴から発話者の母国語情報，声質情報および性別
情報を特定し、特定した情報によってデータベースサー
バ１０ｂを更新する。ステップＳ５３の処理が完了する
と、ステップＳ５５で返事の内容を認識する。

【００２８】ステップＳ５７では認識した音声が肯定的
であるかどうか判断し、“いいえ”のような否定的な返
事であれば、ステップＳ３１に戻る。これによって、電
話番号の入力を案内する音声ガイダンスからの一連の処
理が繰り返される。一方、“はい、そうです”のような
肯定的な返事が取得されたときは、ステップＳ５７から
ステップＳ５９に進み、ステップＳ４１で取得した電話
番号情報から通話相手の国情報を検出する。電話番号情
報に含まれる国番号が“１”であれば、通話相手の属す
る国は米国とされる。続いて、ステップＳ６１で通話相
手の電話番号情報および国情報を内部メモリに保持し、
ステップＳ６３で通話相手の母国語（通話相手が属する
国の公用語）を仮決定する。通話相手の属する国が米国
であれば、通話相手の母国語は英語と仮決定される。

【００２９】ステップＳ６５では、通話相手の名前の入
力を促がす音声ガイダンスを行なう。発呼者には、発呼
者の母国語で“相手先の名前を言ってください？”との
音声メッセージが伝えられる。ステップＳ６７ではこの
音声メッセージに対して音声による返事があったかどう
か判断し、ステップＳ６９では所定期間が経過したかど
うか判断する。返事がないまま所定期間が経過すると、
ステップＳ６９でＹＥＳと判断し、再度の音声ガイダン
スを行なうべくステップＳ６５に戻る。

【００３０】一方、発呼者から返事があったときは、ス
テップＳ６７でＹＥＳと判断し、音声認識システム１０
ｃを用いてステップＳ７１〜７５の処理を行なう。ステ
ップＳ７１では発話音声の特徴を抽出し、ステップＳ７
３では抽出された特徴から特定した母国語情報，声質情
報および性別情報によってデータベースサーバ１０ｂを
更新し、ステップＳ７５では発話音声の認識処理によっ
て通話相手の名前を取得する。

【００３１】こうして通話相手の電話番号情報および名
前の取得が完了すると、ステップＳ７７およびＳ７９で
通話相手がデータベースサーバ１０ｂに登録されていな
いかどうか判別する。具体的には、通話相手の電話番号
情報をキーワードとしてデータベースサーバ１０ｂを検
索し、同じ電話番号情報を発見できたかどうかステップ
Ｓ７９で判断する。電話番号情報を発見できなかったと
きはそのままステップＳ８５に進むが、電話番号情報を
発見できたときは、ステップＳ８１でデータベースサー
バ１０ｂから通話相手の母国語情報を取得し、ステップ
Ｓ８３で通話相手の仮決定母国語を変更してからステッ
プＳ８５に進む。たとえばステップＳ６３で仮決定され
た母国語が英語であり、データベースサーバ１０ｂから
取得された母国語情報がドイツ語であれば、仮決定母国
語が英語からドイツ語に変更される。

【００３２】ステップＳ８５では通話相手への発呼処理
を行ない、ステップＳ８７では回線状態がＯＫかどうか
を、ステップＳ８９では相手方から応答があったかどう
かをそれぞれ判断する。回線状態がビジー（話し中）で
あるか、相手方からの応答がないときは、ステップＳ８
７またはＳ８９からステップＳ１０７に進む。ステップ
Ｓ１０７では、通話不能であることを案内するための音
声ガイダンスを行なう。具体的には、回線状態がビジー
であれば“相手方の電話は使用中です”との音声メッセ
ージが出力され、応答がないときは“相手方からの応答
がありません”との音声メッセージが出力される。これ
に対して発呼者が電話回線を切断すると、ステップＳ１
０９でＹＥＳと判断し、処理を終了する。

【００３３】これに対して、回線状態がＯＫでかつ相手
方から応答があると、ステップＳ８７およびＳ８９でＹ
ＥＳと判断し、ステップＳ９１でサービス案内のための
音声ガイダンスを行なう。このとき、ステップＳ７５で
取得した相手方の名前を用いられる。具体的には、仮決
定された母国語で“こちらはＡＴＲ音声言語通信研究所
の提供する自動音声翻訳サービスです。あなたはシュレ
ーダさんですか？”との音声メッセージが相手方に伝え
られる。

【００３４】ステップＳ９３ではこの音声メッセージに
対して音声による返事があったかどうか判断し、ステッ
プＳ９５では所定期間が経過したかどうか判断する。返
事がないまま所定期間が経過すると、ステップＳ９５で
ＹＥＳと判断し、ステップＳ９７で仮決定母国語を変更
してからステップＳ９１に戻る。一方、相手方から返事
があったときは、ステップＳ９３でＹＥＳと判断し、ス
テップＳ９９で音声認識システム１０ｃを用いて返事の
内容を認識するとともに、ステップＳ１０１で認識した
返事が肯定的であるか肯定的であるかを判断する。

【００３５】ここで、返事が“シュレーダは不在です”
のような否定的な返事であれば、ステップＳ１０１から
ステップＳ１０７に進み、“シュレーダさんは不在だそ
うです”との音声メッセージを発呼者に伝える。これに
対して、返事が“はい、そうです”のような肯定的な返
事であればステップＳ１０１でＹＥＳと判断し、音声認
識システム１０ｃを用いてステップＳ１０３およびＳ１
０５の処理を行なう。ステップＳ１０３では発話音声の
特徴を抽出し、ステップＳ１０５では抽出された特徴か
ら特定した母国語情報，声質情報および性別情報をデー
タベースサーバ１０ｂに登録または更新する。

【００３６】つまり、通話相手がデータベースサーバ１
０ｂに登録済みであれば、特定した母国語情報，声質情
報および性別情報によってデータベースサーバ１０ｂを
更新し、通話相手が未登録であれば、特定した母国語情
報，声質情報および性別情報をステップＳ６１で保持し
た通話相手の電話番号情報および国情報と関連付けてデ
ータベースサーバ１０ｂに登録する。

【００３７】こうして発呼者および通話相手の両方の母
国語が特定され、かつ通話可能状態となると、ステップ
Ｓ１１１でサービス開始を案内するための音声ガイダン
スを行なう。具体的には、“それではお話しください”
との音声メッセージを発呼者および通話相手の両方に伝
える。これによって、双方の会話が開始される。

【００３８】ステップＳ１１３では一方の話者の発話音
声を取り込み、ステップＳ１１５では音声認識システム
１０ｃを用いて発話音声の特徴を抽出する。続くステッ
プＳ１１７では、抽出された特徴に基づいて発話者の母
国語，声質および性別を特定し、特定した母国語情報，
声質情報および性別情報によってデータベースサーバ１
０ｂの登録済み情報を更新する。つまり、会話が開始さ
れた後も、発話音声を入力する毎にデータベースサーバ
１０ｂの母国語情報，声質情報および性別情報が更新さ
れる。

【００３９】ステップＳ１１９では、取り込まれた発話
音声の内容を音声認識システム１０ｃを用いて認識し、
かつ認識した内容を言語翻訳システム１０ｄを用いて他
方の話者の母国語に翻訳する。このとき、翻訳先の言語
は、データベースサーバ１０ｂに登録された他方の話者
の母国語情報によって決定される。

【００４０】翻訳処理が完了すると、音声合成システム
１０ｅを用いてステップＳ１２１およびＳ１２３を処理
する。ステップＳ１２１では翻訳内容の合成音声を作成
し、ステップＳ１２３では作成された合成音声を再生す
る。再生された合成音声は、他方の話者に伝えられる。

【００４１】ステップＳ１２５では、いずれかの話者が
電話回線を切断したかどうか判断し、ＮＯであればステ
ップＳ１１３に戻る。これによって、各々の話者が発話
する毎に発話音声が翻訳され、翻訳された合成音声が相
手方に伝えられる。つまり、翻訳された合成音声を用い
た会話が継続して行なわれる。一方の話者が電話回線を
切断するとステップＳ１２５からステップＳ１２７に進
み、回線の切断を案内する音声ガイダンスが行なわれ
る。つまり、“相手方が電話を切りましたのでサービス
を終了します、ご利用ありがとうございました”との音
声メッセージが他方の話者に伝えられる。これに対し
て、他方の話者が回線を切断すると、ステップＳ１２９
でＹＥＳと判断し、処理を終了する。

【００４２】以上の説明から分かるように、互いに異な
る言語を母国語（使用言語）とする２人の話者が通信ネ
ットワーク４０を介して会話をするとき、各々の話者の
発話音声は、音声翻訳システム１０によって取り込まれ
る。音声翻訳システム１０は、取り込まれた発話音声に
基づいて各々の話者の母国語を特定し、特定した母国語
に基づいて発話音声を翻訳し、そして翻訳された合成音
声を各々の話者に伝える。

【００４３】各々の話者の母国語を特定するとき、まず
電話番号に基づいて各々の話者の属する国が検出され、
検出された国の公用語によって音声案内が行なわれる。
母国語は、この音声案内に対する返事に基づいて特定さ
れる。ただし、検出された国の公用語と話者の母国語と
が一致しない場合もあるため、音声案内に対する返事が
ないときは、音声案内の言語が変更される。音声案内に
対して肯定的な返事があったときは、この現点の音声案
内の言語が母国語として特定される。

【００４４】特定された母国語情報はデータベースサー
バ１０ｂに登録され、言語翻訳はデータベースサーバ１
０ｂに登録された母国語情報に従って行なわれる。ま
た、各々の話者の母国語の特定は、発話音声が取り込ま
れる毎に行なわれる。データベースサーバ１０ｂに登録
された母国語情報は、母国語が特定される毎に更新され
る。

【００４５】したがって、オペレータを介在させなくて
も母国語が異なる話者の間で会話を行なうことができ、
さらに会話の途中での突然の話者の変更にも対応するこ
とができる。

【図面の簡単な説明】

【図１】音声翻訳システムおよび複数の電話機が通信ネ
ットワークに接続された状態を示す図解図である。

【図２】音声翻訳システムの構成の一例を示す図解図で
ある。

【図３】音声翻訳システムの動作の一部を示すフロー図
である。

【図４】音声翻訳システムの動作の他の一部を示すフロ
ー図である。

【図５】音声翻訳システムの動作のその他の一部を示す
フロー図である。

【図６】音声翻訳システムの動作のさらにその他の一部
を示すフロー図である。

【図７】音声翻訳システムの動作の他の一部を示すフロ
ー図である。

【図８】音声翻訳システムの動作のその他の一部を示す
フロー図である。

【符号の説明】

１０…音声翻訳システム１０ａ…統合管理システム１０ｂ…データベースサーバ１０ｃ…音声合成システム１０ｄ…言語翻訳システム１０ｅ…音声認識システム１０ｆ…モデム２０，３０…電話機４０…通信ネットワーク

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 3/00 ５５１Ｃ５３１Ｋ (72)発明者西野敦士京都府相楽郡精華町光台二丁目２番地２株式会社エイ・ティ・アール音声言語通信研究所内 (72)発明者ライナーグルーン京都府相楽郡精華町光台二丁目２番地２株式会社エイ・ティ・アール音声言語通信研究所内 (72)発明者中村哲京都府相楽郡精華町光台二丁目２番地２株式会社エイ・ティ・アール音声言語通信研究所内Ｆターム(参考） 5B091 AA03 CB12 CB32 DA02 5D015 AA06 KK02 KK04 5D045 AB03

Claims

【特許請求の範囲】

【請求項１】互いに異なる言語を使用する複数の話者の
間で通信回線を介して行なわれる会話を翻訳する音声翻
訳システムにおいて、各々の前記話者の発話音声を取り込む取り込み手段、前記発話音声の特徴を抽出する抽出手段、前記発話音声の特徴に基づいて各々の前記話者の使用言
語を特定する特定手段、前記発話音声の内容を認識する認識手段、前記発話音声の内容を前記特定手段による特定結果に基
づいて翻訳する翻訳手段、前記翻訳手段による翻訳結果に基づいて合成音声を作成
する作成手段、および前記合成音声を出力する出力手段
を備えることを特徴とする、音声翻訳システム。
【請求項２】各々の前記話者の電話番号を検出する電話
番号検出手段、前記電話番号に基づいて各々の前記話者が属する国を検
出する国検出手段、および前記国検出手段によって検出
された国の公用語で音声案内をする音声案内手段をさら
に備え、前記特定手段は前記音声案内に対する返事に基づいて前
記使用言語を特定する第１言語特定手段を含む、請求項
１記載の音声翻訳システム。
【請求項３】前記第１言語特定手段は、前記音声案内に
対して返事がないとき前記音声案内の言語を変更する変
更手段、および前記音声案内に対して肯定的な返事があ
ったとき現時点の前記音声案内の言語を前記使用言語と
して決定する決定手段を含む、請求項２記載の音声翻訳
システム。
【請求項４】前記特定手段は前記第１言語特定手段によ
って特定された前記使用言語を示す使用言語情報をメモ
リに格納する格納手段をさらに含み、前記翻訳手段は前記メモリに格納された前記使用言語情
報に従って翻訳を行なう、請求項２または３記載の音声
翻訳システム。
【請求項５】前記特定手段は、前記発話音声が取り込ま
れる毎に発話元の前記使用言語を特定する第２言語特定
手段、および前記第２言語特定手段によって特定された
前記使用言語を示す使用言語情報によって前記メモリを
更新する更新手段をさらに含む、請求項４記載の音声翻
訳システム。