JP2001101187A

JP2001101187A - 翻訳装置および翻訳方法、並びに記録媒体

Info

Publication number: JP2001101187A
Application number: JP27774399A
Authority: JP
Inventors: Hideki Shimomura; 秀樹下村; Kazuhiko Tajima; 和彦田島; Seiichi Aoyanagi; 誠一青柳; Hiroaki Ogawa; 浩明小川
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-09-30
Filing date: 1999-09-30
Publication date: 2001-04-13
Also published as: EP1089193A3; US6952665B1; EP1089193A2

Abstract

(57)【要約】【課題】円滑な対話を行う。【解決手段】音声認識部１では、そこに入力される音
声が音声認識され、その音声認識結果が、機械翻訳部２
に供給される。機械翻訳部２では、音声認識部１からの
音声認識結果が機械翻訳される。これにより、日本語の
ユーザと英語のユーザとの対話が行われている場合にお
いて、対話管理部５は、その対話履歴を記憶し、その対
話履歴や、あらかじめ記憶している知識に基づいて、例
えば、機械翻訳部２の翻訳結果が、対話の流れから、不
自然でないかどうか等を判定する。そして、翻訳結果が
不自然である場合、対話管理部５は、機械翻訳部２に対
して、翻訳結果が不自然である旨を出力し、機械翻訳部
２は、翻訳をやり直す。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、翻訳装置および翻
訳方法、並びに記録媒体に関し、特に、例えば、異なる
言語による発話を行うユーザどうしが、円滑に対話を行
うこと等ができるようにする翻訳装置および翻訳方法、
並びに記録媒体に関する。

【０００２】

【従来の技術】例えば、日本語と英語等の、異なる言語
による発話を行うユーザどうしがコミュニケーションを
図るためのツールとして、音声翻訳システムがある。音
声翻訳システムでは、例えば、日本語の発話が音声認識
され、その音声認識結果が英語に翻訳されて、合成音で
出力されるとともに、英語の発話が音声認識され、その
音声認識結果が日本語に翻訳されて、合成音で出力され
る。従って、英語の話者（ユーザ）は、日本語の話者の
発話を、英語で聞くことができ、また、日本語の話者
は、英語の話者の発話を、日本語で聞くことができ、相
互に、相手の発話を理解して対話を行うことができる。

【０００３】

【発明が解決しようとする課題】ところで、上述のよう
な音声翻訳システムでは、必ずしも、正確な翻訳が行わ
れるとは限らない。そして、正確な翻訳が行われなかっ
た場合には、ユーザどうしの間で、円滑な対話が困難に
なることがある。

【０００４】本発明は、このような状況に鑑みてなされ
たものであり、より正確な翻訳等を行うことができるよ
うにして、円滑な対話を行うこと等ができるようにする
ものである。

【０００５】

【課題を解決するための手段】本発明の翻訳装置は、第
１の言語を第２の言語に翻訳するとともに、第２の言語
を第１の言語に翻訳する翻訳手段と、第１および第２の
言語による対話の履歴である対話履歴を記憶する履歴記
憶手段と、所定の知識を記憶している知識記憶手段と、
対話履歴または所定の知識に基づいて、所定の処理を行
う処理手段とを含むことを特徴とする。

【０００６】処理手段には、対話履歴または所定の知識
に基づいて、入力文に対する応答を生成させることがで
きる。

【０００７】また、処理手段には、対話履歴または所定
の知識に基づいて、翻訳手段による翻訳結果をチェック
させ、そのチェックの結果を、翻訳手段に供給させるこ
とができ、この場合、翻訳手段には、処理手段からの情
報に基づいて、翻訳を行わせることができる。

【０００８】さらに、処理手段には、対話履歴または所
定の知識に基づいて、対話における話題の遷移を検出さ
せ、その検出結果を、翻訳手段に供給させることがで
き、この場合、翻訳手段には、処理手段からの情報に基
づいて、翻訳を行わせることができる。

【０００９】また、処理手段には、対話履歴または所定
の知識に基づいて、翻訳手段による翻訳を補助させるこ
とができる。即ち、例えば、処理手段には、対話履歴ま
たは所定の知識に基づいて、翻訳に必要な情報を取得さ
せ、翻訳手段に供給させることができる。また、処理手
段には、翻訳に必要な情報を取得することができないと
き、翻訳に必要な情報を入力するように、ユーザに要求
させることができる。

【００１０】本発明の翻訳装置には、音声を認識する音
声認識手段をさらに設けることができ、この場合、翻訳
手段には、音声認識手段による音声の認識結果を翻訳さ
せることができる。

【００１１】また、本発明の翻訳装置には、翻訳手段に
よる翻訳結果に対応する合成音を生成する音声合成手段
をさらに設けることができる。

【００１２】本発明の翻訳方法は、第１の言語を第２の
言語に翻訳するとともに、第２の言語を第１の言語に翻
訳する翻訳ステップと、第１および第２の言語による対
話の履歴である対話履歴を記憶する履歴記憶ステップ
と、対話履歴または所定の知識に基づいて、所定の処理
を行う処理ステップとを含むことを特徴とする。

【００１３】本発明の記録媒体は、第１の言語を第２の
言語に翻訳するとともに、第２の言語を第１の言語に翻
訳する翻訳ステップと、第１および第２の言語による対
話の履歴である対話履歴を記憶する履歴記憶ステップ
と、対話履歴または所定の知識に基づいて、所定の処理
を行う処理ステップとを含むプログラムが記録されてい
ることを特徴とする。

【００１４】本発明の翻訳装置および翻訳方法、並びに
記録媒体においては、第１の言語が第２の言語に翻訳さ
れるとともに、第２の言語が第１の言語に翻訳される。
一方、第１および第２の言語による対話の履歴である対
話履歴が記憶され、その対話履歴、または所定の知識に
基づいて、所定の処理が行われる。

【００１５】

【発明の実施の形態】図１は、本発明を適用した音声翻
訳システム（システムとは、複数の装置が論理的に集合
した物をいい、各構成の装置が同一筐体中にあるか否か
は問わない）の一実施の形態の構成例を示している。

【００１６】この音声翻訳システムでは、例えば、日本
語による音声が入力されると、その音声が英語に翻訳さ
れて出力され、また、英語による音声が入力されると、
その音声が日本語に翻訳されて出力されるようになって
おり、これにより、日本語のユーザ（話者）と、英語の
ユーザとが、対話を行うことができるようになってい
る。

【００１７】即ち、音声認識部１には、ユーザが発話し
た音声が入力されるようになっており、音声認識部１
は、入力された音声を音声認識し、その音声認識結果と
してのテキスト、その他付随する情報を、機械翻訳部２
や、表示部４、対話管理部５などに、必要に応じて出力
する。

【００１８】機械翻訳部２は、音声認識部１が出力する
音声認識結果を解析し、入力された音声を、その音声の
言語以外の言語に機械翻訳し（本実施の形態では、日本
語は英語に、英語は日本語に、それぞれ翻訳される）、
その翻訳結果としてのテキスト、その他付随する情報
を、音声合成部３や、表示部４、対話管理部５などに、
必要に応じて出力する。音声合成部３は、機械翻訳部２
や対話管理部５などの出力に基づいて音声合成処理を行
い、これにより、例えば、入力された音声の、他の言語
への翻訳結果としての合成音等を出力する。

【００１９】表示部４は、例えば、液晶ディスプレイ等
で構成され、音声認識部１による音声認識結果や、機械
翻訳部２による機械翻訳結果、対話管理部５が出力する
情報等を、必要に応じて表示する。

【００２０】対話管理部５は、音声認識部１や機械翻訳
部２の出力から、ユーザの発話の内容の意味理解を行
い、その意味理解の結果に基づいて、ユーザどうしの対
話の履歴（対話履歴）を管理する。さらに、対話管理部
５は、例えば、日本語や英語に関する知識を有してお
り、その知識や、さらには、上述の対話履歴に基づい
て、音声認識部１や機械翻訳部２に対し、音声認識や機
械翻訳の補助を行うための情報をフィードバックする等
の各種の処理を行う。また、対話管理部５は、必要なテ
キストを生成し、音声合成部３や、表示部４に、必要に
応じて出力する。

【００２１】以上のように構成される音声翻訳システム
においては、例えば、日本語の音声が入力されると、そ
の音声が、音声認識部１で音声認識され、機械翻訳部２
に供給される。機械翻訳部２では、音声認識部１による
音声認識結果が、英語に機械翻訳され、音声合成部３お
よび対話管理部５に供給される。音声合成部３では、機
械翻訳部２による翻訳結果に対応する合成音が生成され
て出力される。また、英語の音声が入力されると、その
音声が、音声認識部１で音声認識され、機械翻訳部２に
供給される。機械翻訳部２では、音声認識部１による音
声認識結果が、日本語に機械翻訳され、音声合成部３お
よび対話管理部５に供給される。音声合成部３では、機
械翻訳部２による翻訳結果に対応する合成音が生成され
て出力される。

【００２２】従って、図１の音声翻訳システムによれ
ば、英語のユーザは、日本語のユーザによる日本語の発
話を理解し、また、日本語のユーザは、英語のユーザに
よる英語の発話を理解することができ、日本語のユーザ
と、英語のユーザとの間で対話を行うことができる。

【００２３】なお、以上のようにして、日本語のユーザ
と、英語のユーザとの間で対話が行われている場合にお
いて、対話管理部５では、機械翻訳部２による翻訳結果
に基づいて、日本語のユーザと英語のユーザとによる対
話履歴が構成され、その対話履歴や、あらじめ記憶して
いる知識に基づいて、円滑な対話が行われるようにする
ための各種の処理が行われる。

【００２４】次に、図２は、図１の音声認識部１の構成
例を示している。

【００２５】ユーザの発話は、マイク１１に入力され、
マイク１１では、その発話が、電気信号としての音声信
号に変換される。この音声信号は、ＡＤ(Analog Digita
l)変換部１２に供給される。ＡＤ変換部１２では、マイ
ク１１からのアナログ信号である音声信号がサンプリン
グ、量子化され、ディジタル信号である音声データに変
換される。この音声データは、特徴抽出部１３に供給さ
れる。

【００２６】特徴抽出部１３は、ＡＤ変換部１２からの
音声データについて、適当なフレームごとに、例えば、
スペクトルや、線形予測係数、ケプストラム係数、線ス
ペクトル対等の特徴パラメータを抽出し、特徴量バッフ
ァ１４およびマッチング部１５に供給する。特徴量バッ
ファ１４では、特徴抽出部１３からの特徴パラメータが
一時記憶される。

【００２７】マッチング部１５は、特徴量抽出部１３か
らの特徴パラメータ、または特徴量バッファ１４に記憶
された特徴パラメータに基づき、音響モデルデータベー
ス１６、辞書データベース１７、および文法データベー
ス１８を必要に応じて参照しながら、マイク１１に入力
された音声（入力音声）を認識する。

【００２８】即ち、音響モデルデータベース１６は、音
声認識する音声の言語における個々の音素や音節などの
音響的な特徴を表す音響モデルを記憶している。ここ
で、音響モデルとしては、例えば、ＨＭＭ(Hidden Mark
ov Model)などを用いることができる。辞書データベー
ス１７は、認識対象の各単語について、その発音に関す
る情報が記述された単語辞書を記憶している。文法デー
タベース１８は、辞書データベース１７の単語辞書に登
録されている各単語が、どのように連鎖する（つなが
る）かを記述した文法規則を記憶している。ここで、文
法規則としては、例えば、文脈自由文法（ＣＦＧ）や、
統計的な単語連鎖確率（Ｎ−ｇｒａｍ）などに基づく規
則を用いることができる。

【００２９】マッチング部１５は、辞書データベース１
７の単語辞書を参照することにより、音響モデルデータ
ベース１６に記憶されている音響モデルを接続すること
で、単語の音響モデル（単語モデル）を構成する。さら
に、マッチング部１５は、幾つかの単語モデルを、文法
データベース１８に記憶された文法規則を参照すること
により接続し、そのようにして接続された単語モデルを
用いて、特徴パラメータに基づき、例えば、ＨＭＭ法等
によって、マイク１１に入力された音声を認識する。

【００３０】そして、マッチング部１５による音声認識
結果は、例えば、テキスト等で出力される。

【００３１】なお、マッチング部１５は、対話管理部５
から、そこで得られる情報（以下、適宜、対話管理情報
という）を受信することができるようになっており、そ
の対話管理情報に基づいて、精度の高い音声認識を行う
ことができるようになっている。

【００３２】また、マッチング部１５は、入力された音
声を対象として、再度、処理を行うことが必要な場合
は、特徴量バッファ１４に記憶された特徴パラメータを
用いて処理を行うようになっており、これにより、ユー
ザに再度の発話を要求せずに済むようになっている。

【００３３】次に、図３は、図１の機械翻訳部２の構成
例を示している。

【００３４】テキスト解析部２１には、音声認識部１が
出力する音声認識結果としてのテキスト等が、機械翻訳
の対象として入力されるようになっており、テキスト解
析部２１は、辞書データベース２４や解析用文法データ
ベース２５を参照しながら、そのテキストを解析する。

【００３５】即ち、辞書データベース２４には、各単語
の表記や、解析用文法を適用するために必要な品詞情報
などが記述された単語辞書が記憶されている。また、解
析用文法データベース２５には、単語辞書に記述された
各単語の情報に基づいて、単語連鎖に関する制約等が記
述された解析用文法規則が記憶されている。そして、テ
キスト解析部２１は、その単語辞書や解析用文法規則に
基づいて、そこに入力されるテキスト（入力テキスト）
の形態素解析や、構文解析等を行い、その入力テキスト
を構成する単語や構文の情報等の言語情報を抽出する。
ここで、テキスト解析部２１における解析方法として
は、例えば、正規文法や、文脈自由文法、統計的な単語
連鎖確率を用いたものなどがある。

【００３６】テキスト解析部２１で得られた入力テキス
トの解析結果としての言語情報は、言語変換部２２に供
給される。言語変換部２２は、言語変換データベース２
６を参照し、入力テキストの言語の言語情報を、翻訳結
果の言語の言語情報に変換する。

【００３７】即ち、言語変換データベース２６には、入
力言語（言語変換部２２への入力の言語）の言語情報か
ら、出力言語（言語変換部２２からの出力の言語）の言
語情報への変換パターン（テンプレート）や、入力言語
と出力言語との対訳用例およびその対訳用例と入力言語
との間の類似度の計算に用いられるシソーラス等の、言
語情報を変換するための言語変換データが記憶されてい
る。そして、言語変換部２２では、このような言語変換
データに基づいて、入力テキストの言語の言語情報が、
出力言語の言語情報に変換される。

【００３８】言語変換部２２で得られた出力言語の言語
情報は、テキスト生成部２３に供給され、テキスト生成
部２３は、辞書データベース２７および生成用文法デー
タベース２８を参照することにより、出力言語の言語情
報から、入力テキストを出力言語に翻訳したテキストを
生成する。

【００３９】即ち、辞書データベース２７には、出力言
語の文を生成するのに必要な単語の品詞や活用形等の情
報が記述された単語辞書が記憶されており、また、生成
用文法データベース２８には、出力言語の文を生成する
のに必要な単語の活用規則や語順の制約等の生成用文法
規則が記憶されている。そして、テキスト生成部２３
は、これらの単語辞書および生成用文法規則に基づい
て、言語変換部２２からの言語情報を、テキストに変換
して出力する。

【００４０】なお、言語変換部２２は、テキスト解析部
２１の出力に含まれる情報だけでは、入力テキストの言
語の言語情報を、出力言語の言語情報に変換（翻訳）す
るのが困難である場合、翻訳に必要な情報が不足してい
る旨の不完全翻訳情報を、対話管理部５に出力すること
ができるようになっており、これにより、その不足して
いる情報を得て、翻訳を行うことができるようになって
いる。

【００４１】また、言語変換部２２は、対話管理部５か
ら、対話管理情報を受信することができるようになって
おり、その対話管理情報に基づいて、精度の高い翻訳を
行うことができるようになっている。

【００４２】次に、図４は、図１の音声合成部３の構成
例を示している。

【００４３】テキスト解析部３１には、機械翻訳部２が
出力する翻訳結果としてのテキストや、対話管理部５が
出力するテキストが、音声合成処理の対象として入力さ
れるようになっており、テキスト解析部３１は、辞書デ
ータベース３４や解析用文法データベース３５を参照し
ながら、そのテキストを解析する。

【００４４】即ち、辞書データベース３４には、各単語
の品詞情報や、読み、アクセント等の情報が記述された
単語辞書が記憶されており、また、解析用文法データベ
ース３５には、辞書データベース３４の単語辞書に記述
された単語について、単語連鎖に関する制約等の解析用
文法規則が記憶されている。そして、テキスト解析部３
１は、この単語辞書および解析用文法規則に基づいて、
そこに入力されるテキストの形態素解析や構文解析等の
解析を行い、後段の規則合成部３２で行われる規則音声
合成に必要な情報を抽出する。ここで、規則音声合成に
必要な情報としては、例えば、ポーズの位置や、アクセ
ントおよびイントネーションを制御するための情報その
他の韻律情報や、各単語の発音等の音韻情報などがあ
る。

【００４５】テキスト解析部３１で得られた情報は、規
則合成部３２に供給され、規則合成部３２では、音素片
データベース３６を用いて、テキスト解析部３１に入力
されたテキストに対応する合成音の音声データ（ディジ
タルデータ）が生成される。

【００４６】即ち、音素片データベース３６には、例え
ば、ＣＶ(Consonant, Vowel)や、ＶＣＶ、ＣＶＣ等の形
で音素片データが記憶されており、規則合成部３２は、
テキスト解析部３１からの情報に基づいて、必要な音素
片データを接続し、さらに、ポーズ、アクセント、イン
トネーション等を適切に付加することで、テキスト解析
部３１に入力されたテキストに対応する合成音の音声デ
ータを生成する。

【００４７】この音声データは、ＤＡ変換部３３に供給
され、そこで、アナログ信号としての音声信号に変換さ
れる。この音声信号は、図示せぬスピーカに供給され、
これにより、テキスト解析部３１に入力されたテキスト
に対応する合成音が出力される。

【００４８】次に、図５は、図１の対話管理部５の第１
の構成例を示している。

【００４９】テキスト解析部４１には、例えば、機械翻
訳部２が出力する翻訳結果（翻訳文）のテキスト、その
他付随する情報が供給されるようになっており、テキス
ト解析部４１は、その翻訳文の構文構造を、辞書データ
ベース４４および文法データベース４５を参照して解析
する。ここで、本実施の形態では、辞書データベース４
４には日本語と英語の辞書が、文法データベース４５に
は日本語と英語の文法規則が、それぞれ記憶されてお
り、テキスト解析部４１は、機械翻訳部２からの翻訳文
を、その言語に対応する辞書と文法規則を参照して解析
する。

【００５０】なお、機械翻訳部２の出力に、そのテキス
ト解析部２１（図３）において得られる解析結果が含ま
れ、その解析結果を、対話管理部５のテキスト解析部４
１の解析結果として代用することができる場合には、テ
キスト解析部４１における一部または全部の処理を省略
することが可能である。

【００５１】テキスト解析部４１による翻訳文の解析結
果（翻訳文の構文構造）は、意味理解部４２に供給され
る。意味理解部４２は、知識データベース４６や対話履
歴記憶部４７を参照し、テキスト解析部４１が出力する
翻訳文の構文構造に基づいて、その翻訳文の意味を解析
し、その意味理解を行う。即ち、知識データベース４６
には、一般常識や、言語的な知識等の、意味理解を行う
のに用いられる知識が記憶されており、対話履歴記憶部
４７は、音声翻訳システムを介して行われた対話の履歴
（対話履歴）を記憶するようになっている。そして、意
味理解部４２は、これらの知識や対話履歴を、必要に応
じて参照して、翻訳文の意味理解を行う。このように、
知識や対話履歴を参照することにより、いま処理の対象
となっている翻訳文の意味の曖昧さや不完全さを解消
し、意味理解に基づいた精度の高い翻訳を行うことが可
能となる。

【００５２】ここで、意味理解部４２による翻訳文の意
味の解析方法としては、例えば、「自然言語の文法理
論」、郡司隆男著、産業図書に記載されている語彙機能
文法や句構造文法を用いて記述された解析ルールにした
がって、翻訳文を解析し、その意味構造を抽出するもの
等がある。なお、この場合、上述のような解析ルールの
他、各単語について、その意味や文法上の役割を記述し
た辞書が必要となるが、これらの解析ルールや辞書は、
意味理解部４２が内蔵しているものとする。

【００５３】意味理解部４２による翻訳文の意味理解の
結果は、対話制御部４３に供給される。対話制御部４３
は、翻訳文のテキストおよびその意味理解の結果の一部
または全部を、対話履歴記憶部４７に順次供給して記憶
させ、これにより、音声翻訳システムを介して行われた
対話の履歴（対話履歴）を記憶させていく（構成してい
く）。

【００５４】さらに、図５の実施の形態では、対話制御
部４３は、意味理解部４２による翻訳文の意味理解の結
果に基づき、その翻訳文の内容に関連する情報を、知識
データベース４６および対話履歴記憶部４７から検索す
る。そして、対話制御部４３は、その検索の結果、翻訳
文について、既知の事項を検出することができた場合
は、その事項を用い、機械翻訳部２が出力した翻訳文に
対する応答としての応答文を生成するための意味情報や
その他付加情報を生成し、応答文生成部４９に供給す
る。この場合、応答文生成部４９は、生成規則データベ
ース４８に記憶された、例えば単語の活用規則や語順の
制約等の生成用文法規則を参照し、対話制御部４３から
供給される情報を用いて、機械翻訳部２が出力した翻訳
文に対する応答文のテキストを、入力言語で生成し、音
声合成部３に出力する。

【００５５】従って、この場合、入力音声の翻訳結果は
出力されず、対話管理部５で生成された、その入力音声
に対する応答文が、合成音で出力される。

【００５６】一方、対話制御部４３は、翻訳文の内容に
関連する情報の検索の結果、その翻訳文について、既知
の事項を検出することができなかった場合は、翻訳文の
テキスト、その他付随する情報を、音声合成部３に出力
する。

【００５７】従って、この場合、入力音声の翻訳結果に
対応する合成音が出力される。

【００５８】次に、図６のフローチャートを参照して、
図５の対話制御部４３の処理について、さらに説明す
る。

【００５９】対話制御部４３は、意味理解部４２から、
翻訳文の意味理解の結果を受信すると、その翻訳文のテ
キストおよび意味理解の結果を、対話履歴記憶部４７に
供給し、対話履歴として記憶させる。

【００６０】そして、ステップＳ１において、意味理解
部４２による翻訳文の意味理解の結果に基づき、その翻
訳文の内容に関連する情報が、知識データベース４６お
よび対話履歴記憶部４７から検索され、ステップＳ２に
進み、翻訳文の内容に関連する情報を検出することがで
きたかどうかが判定される。ステップＳ２において、翻
訳文の内容に関連する情報を検出することができなかっ
たと判定された場合、ステップＳ３に進み、対話制御部
４３は、翻訳文のテキスト、その他付随する情報を、音
声合成部３に出力する。そして、ステップＳ１に戻り、
意味理解部４２から、次の翻訳文の意味理解の結果が供
給されるのを待って、以下、同様の処理が繰り返され
る。

【００６１】また、ステップＳ２において、翻訳文の内
容に関連する情報を検出することができた判定された場
合、ステップＳ４に進み、その情報を用いて、機械翻訳
部２が出力した翻訳文に対する応答文を生成するための
意味情報やその他付加情報が生成される。さらに、対話
制御部４３は、その応答文を生成するための情報を、応
答文生成部４９に出力し、ステップＳ１に戻る。そし
て、意味理解部４２から、次の翻訳文の意味理解の結果
が供給されるのを待って、以下、同様の処理が繰り返さ
れる。

【００６２】以上の処理によれば、ユーザの発話回数を
減らして、その負担を軽減することができる。

【００６３】即ち、例えば、いま、音声翻訳システムが
時計を有しており、また、知識データベース４６には、
「現在時刻は、時計を参照することで得ることができ
る」旨の知識が記憶されているとする。この場合、例え
ば、日本語のユーザが、「いま何時？」と発話し、機械
翻訳部２において、その翻訳結果として、「What timei
s it now ?」が得られたとすると、対話管理部５では、
その意味理解部４２において、翻訳文「What time is i
t now ?」が、現在時刻を尋ねているものであることが
理解される。さらに、対話制御部４３において、翻訳文
「What time isit now ?」の意味理解の結果に基づき、
その内容に関連する情報として、知識データベース４６
に記憶されている「現在時刻は、時計を参照することで
得ることができる」旨の知識が検索され、その検索結果
に基づいて、音声処理システムが内蔵する時計から現在
時刻が取得される。

【００６４】いま、上述のようにして取得された現在時
刻が、例えば、午後３時であったとすると、対話制御部
４３は、日本語のユーザによる発話「いま何時？」に対
する応答文として、例えば、その発話と同一言語による
文「午後３時です。」を生成するための情報を、応答文
生成部４９に供給する。これにより、応答文生成部４９
では、応答文「午後３時です。」が生成され、音声合成
部３に供給され、音声合成部３では、合成音「午後３時
です。」が生成されて出力される。

【００６５】また、例えば、対話履歴記憶部４７に、対
話履歴として、英語のユーザの名前が「John」である旨
が記憶されているとする。この場合、例えば、日本語の
ユーザが、「あなたの名前は何ですか？」と発話し、機
械翻訳部２において、その翻訳結果として、「What is
your name ?」が得られたとすると、対話管理部５で
は、意味理解部４２において、翻訳文「What is your n
ame ?」が、英語のユーザの名前を尋ねているものであ
ることが理解される。さらに、対話制御部４３におい
て、翻訳文「What is your name ?」の意味理解の結果
に基づき、その内容に関連する情報として、対話履歴記
憶部４７に記憶されている英語のユーザの名前「John」
が検索される。

【００６６】そして、対話制御部４３は、日本語のユー
ザによる発話「あなたの名前は何ですか？」に対する応
答文として、例えば、その発話と同一言語による文「Jo
hnです。」を生成するための情報を、応答文生成部４９
に供給する。これにより、応答文生成部４９では、応答
文「Johnです。」が生成され、音声合成部３に供給さ
れ、音声合成部３では、合成音「Johnです。」が生成さ
れて出力される。

【００６７】以上のように、知識データベース４６や対
話履歴記憶部４７を参照することにより、音声翻訳シス
テムが認識している事項に関する質問については、その
翻訳文を出力し、かつ相手の応答があるのを待って、そ
の応答を翻訳して出力するのではなく、音声翻訳システ
ムにおいて、応答文を生成して出力するようにしたの
で、ユーザの発話回数を減らして、その負担を軽減する
ことができる。

【００６８】次に、図７は、図１の対話管理部５の第２
の構成例を示している。なお、図中、図５における場合
と対応する部分については、同一の符号を付してあり、
以下では、その説明は、適宜省略する。即ち、図７の対
話管理部５は、生成規則データベース４８および応答文
生成部４９が設けられておらず、対話チェック部５１が
新たに設けられている他は、図５における場合と基本的
に同様に構成されている。

【００６９】但し、図７の実施の形態においては（後述
する図９の実施の形態においても同様）、対話制御部４
３は、翻訳文のテキストおよびその意味理解の結果を、
対話履歴記憶部４７に順次供給して記憶させ、これによ
り、音声翻訳システムを介して行われた対話の履歴（対
話履歴）を記憶させていく処理だけを行うようになって
いる。

【００７０】対話チェック部５１には、意味理解部４２
で得られる翻訳文の意味理解の結果が供給されるように
なっており、対話チェック部５１は、意味理解部４２に
よる翻訳文の意味理解の結果に基づき、その翻訳文の内
容に関連する情報を、知識データベース４６および対話
履歴記憶部４７から検索する。さらに、対話制御部４３
は、その検索の結果、対話の流れに対して、翻訳文が不
自然でないかどうかや、対話における話題が変更された
かどうかといった点をチェックする。そして、対話制御
部４３は、翻訳文が不自然である場合には、その旨を表
す対話不整合情報を、対話における話題が変更された場
合には、その変更後の話題を表す話題遷移情報を、それ
ぞれ対話管理情報として、音声認識部１（図２）のマッ
チング部１５や、機械翻訳部２の言語変換部２２に出力
する。

【００７１】次に、図８のフローチャートを参照して、
図７の対話チェック部５１の処理について、さらに説明
する。

【００７２】対話チェック部５１は、意味理解部４２か
ら、翻訳文の意味理解の結果を受信すると、ステップＳ
１１において、その翻訳文の意味理解の結果に基づき、
その翻訳文の内容に関連する情報を、知識データベース
４６および対話履歴記憶部４７から検索する。そして、
ステップＳ１２に進み、ステップＳ１１の検索結果に基
づいて、対話の流れに対して、翻訳文が不自然であるか
どうかが判定され、不自然でないと判定された場合、ス
テップＳ１３をスキップして、ステップＳ１４に進む。

【００７３】また、ステップＳ１２において、対話の流
れに対して、翻訳文が不自然であると判定された場合、
ステップＳ１３に進み、その旨を表す対話不整合情報
が、対話管理情報として、音声認識部１（図２）のマッ
チング部１５および機械翻訳部２（図３）の言語変換部
２２に供給され、ステップＳ１４に進む。

【００７４】ステップＳ１４では、ステップＳ１１の検
索結果に基づいて、対話における話題が変更された（遷
移した）かどうかが判定される。ステップＳ１４におい
て、対話における話題が変更されていないと判定された
場合、ステップＳ１５をスキップして、ステップＳ１１
に戻り、意味理解部４２から、次の翻訳文の意味理解の
結果が供給されるのを待って、以下、同様の処理が繰り
返される。

【００７５】また、ステップＳ１４において、対話にお
ける話題が変更されたと判定された場合、ステップ１５
に進み、その旨を表す話題遷移情報が、対話管理情報と
して、音声認識部１（図２）のマッチング部１５および
機械翻訳部２（図３）の言語変換部２２に供給される。
そして、ステップＳ１１に戻り、意味理解部４２から、
次の翻訳文の意味理解の結果が供給されるのを待って、
以下、同様の処理が繰り返される。

【００７６】以上の処理によれば、音声翻訳システムに
おける音声の認識精度や、機械翻訳の精度を高めること
が可能となる。

【００７７】即ち、例えば、いま、機械翻訳部２におい
て、日本語による発話「はい」に対して、翻訳文「as
h」が得られたとすると、この翻訳文「ash」は、対話管
理部５のテキスト解析部４１および意味理解部４２を介
して、対話チェック部５１に供給される。そして、対話
チェック部５１では、知識データベース４６および対話
履歴記憶部４７を参照することにより、日本語による発
話「はい」に対する翻訳文「ash」が、対話の流れから
考えて、不自然でないかどうかが判定される。

【００７８】いま、対話履歴記憶部４７に、直前の英語
による発話が「Are you fine ?」である旨の対話履歴が
記憶されていたとすると、このような単純疑問文「Are
youfine ?」に対する返事には、「Yes」または「No」が
用いられるのが自然であり（このような知識は、知識デ
ータベース４６に記憶されているとする）、従って、こ
の場合、対話チェック部５１では、翻訳文「ash」は、
対話の流れから、不自然であると判定され、対話不整合
情報が、対話管理情報として、音声認識部１（図２）の
マッチング部１５および機械翻訳部２（図３）の言語変
換部２２に出力される。

【００７９】音声認識部１のマッチング部１５は、対話
不整合情報を受信すると、直前に出力した音声認識結果
が誤っていたものとして、直前に入力された音声に対し
て、他の認識結果の候補を出力する。また、機械翻訳部
２の言語変換部２２も、対話不整合情報を受信すると、
直前に出力した翻訳結果が誤っていたものとして、他の
翻訳結果の候補を出力する。この他の候補は、再び、対
話チェック部５１において処理され、その結果、音声合
成部３においては、最終的に、対話の流れから、自然な
翻訳文（不自然でない翻訳文）が出力されることにな
る。

【００８０】従って、この場合、音声翻訳システムが出
力する翻訳文の精度を高めることができる。

【００８１】なお、上述の場合において、対話チェック
部５１から、音声認識部１のマッチング部１５や、機械
翻訳部２の言語変換部２２に供給する対話不整合情報に
は、単純疑問文に対する返事として、「Yes」や「No」
を用いた発話が行われている可能性が高い旨の情報を含
めることができ、マッチング部１５や言語変換部２２に
は、その情報を考慮して、処理を行わせるようにするこ
とが可能である。

【００８２】また、例えば、対話チェック部５１では、
知識データベース４６および対話履歴記憶部４７を参照
することにより、翻訳文に含まれる単語、および対話履
歴記憶部４７に記憶されている最近の単語の分布（特
に、名詞の分布）が求められ、その分布が、特定の分野
（例えば、医学の分野など）で用いられる単語に偏って
いるかどうかが判定される。対話チェック部５１は、単
語の分布が、特定の分野で用いられる単語に偏っている
場合、対話における話題が、その分野に関するものに遷
移したと認識し、その分野に関する対話が行われている
旨の話題遷移情報を、対話管理情報として、音声認識部
１（図２）のマッチング部１５および機械翻訳部２（図
３）の言語変換部２２に出力する。

【００８３】ここで、一般には、ある特定の単語が繰り
返し発話されている場合には、その単語を中心として、
話題が遷移していることが推測される。

【００８４】音声認識部１のマッチング部１５では、話
題遷移情報を受信すると、その話題遷移情報に含まれる
話題に関する語彙に、特に重みをおいて（あるいは、そ
のような語彙が登録されている辞書を特に用いて）音声
認識が行われる。また、機械翻訳部２の言語変換部２２
でも、話題遷移情報に含まれる話題に関する語彙につい
てのパラメータに重みをおいて機械翻訳が行われる。

【００８５】従って、この場合、音声認識部１における
認識精度や、機械翻訳部２における翻訳精度を向上させ
ることができる。

【００８６】なお、話題遷移情報には、対話における話
題の分野（あるいは、その分野において使用頻度が高い
単語）の他、例えば、対話チェック部５１において求め
られる単語の分布の偏り等の、定量的な情報を含めるこ
とが可能である。

【００８７】次に、図９は、図１の対話管理部５の第３
の構成例を示している。なお、図中、図５における場合
と対応する部分については、同一の符号を付してあり、
以下では、その説明は、適宜省略する。即ち、図９の対
話管理部５は、応答文生成部４９が設けられておらず、
不完全情報判定部６１および質問文生成部６２が新たに
設けられている他は、図５における場合と基本的に同様
に構成されている。

【００８８】不完全情報判定部６１には、機械翻訳部２
（図３）の言語変換部２２が出力する、翻訳に必要な情
報が不足している旨の不完全翻訳情報が供給されるよう
になっており、不完全情報判定部６１は、不完全翻訳情
報を受信した場合、翻訳に必要な情報を、知識データベ
ース４６や対話履歴記憶部４７から検索する。

【００８９】即ち、言語変換部２２は、処理中に、翻訳
を行うことができない情報に陥った場合、処理を中断
し、その処理途中の情報を、不完全翻訳情報に含めて、
不完全情報判定部６１に供給する。不完全情報判定部６
１は、その不完全翻訳情報に基づいて、翻訳に失敗した
箇所や、その失敗の原因を特定し、知識データベース４
６や対話履歴記憶部４７を参照して、その失敗原因を取
り除くための、翻訳に不足している情報（不足情報）を
検索する。

【００９０】そして、不完全情報判定部６１は、不足情
報が得られた場合、その不足情報を、対話管理情報とし
て、機械翻訳部２（図３）の言語変換部２２に供給す
る。この場合、言語変換部２２は、不完全情報判定部６
１からの不足情報を用いて処理を再開する。

【００９１】一方、不足情報が得られなかった場合、不
完全情報判定部６１は、不足情報を得るための質問文を
生成するように、質問文生成部６２に要求する。この場
合、質問文生成部６２は、不完全情報判定部６１の要求
にしたがい、生成規則データベース４８を参照して、不
足情報をユーザに回答してもらうための質問文を、翻訳
に失敗した音声の言語で生成し、音声合成部３に出力す
る。これにより、音声合成部３では、不足情報を得るた
めの質問文に対応する合成音が生成されて出力される。

【００９２】以上のようにして質問文が出力され、その
質問文に対する回答を、ユーザが発話すると、その発話
は、音声認識部１で音声認識され、機械翻訳部２に供給
される。そして、機械翻訳部２では、その音声認識結果
が、その前の音声認識結果に追加され、処理が再開され
る。

【００９３】次に、図１０のフローチャートを参照し
て、図９の不完全情報判定部６１の処理について、さら
に説明する。

【００９４】不完全情報判定部６１は、機械翻訳部２
（図３）の言語変換部２２から、不完全翻訳情報を受信
すると、ステップＳ２１において、その不完全翻訳情報
に基づいて、翻訳に失敗した箇所や、その失敗の原因を
特定し、知識データベース４６や対話履歴記憶部４７を
参照して、その失敗原因を取り除くための、翻訳に不足
している不足情報を検索する。

【００９５】そして、ステップＳ２２に進み、不完全情
報判定部６１は、不足情報が得られたかどうかを判定す
る。ステップＳ２２において、不足情報が得られなかっ
たと判定された場合、ステップＳ２３に進み、不完全情
報判定部６１は、不足情報を得るための質問文を生成す
るように、質問文生成部６２に要求し、処理を終了す
る。この場合、質問文生成部６２では、不足情報をユー
ザに回答してもらうための質問文が生成され、音声合成
部３を介して出力される。

【００９６】一方、ステップＳ２２において、不足情報
が得られたと判定された場合、ステップＳ２４に進み、
不完全情報判定部６１は、その不足情報を、対話管理情
報として、機械翻訳部２（図３）の言語変換部２２に出
力し、処理を終了する。

【００９７】以上の処理によれば、機械翻訳部２におい
て、高精度な翻訳が可能となる。

【００９８】即ち、例えば、いま、日本語のユーザによ
る発話「渡して下さい。」が音声認識され、機械翻訳部
２に供給されたとする。この場合、機械翻訳部２では、
「渡して下さい。」に対する翻訳文について、動詞とし
て、「hand」を使用し、渡す物を表す目的語として、不
自然でない代名詞「it」を使用することまでが決定され
る。しかしながら、元の発話「渡して下さい。」には、
渡す相手を表す目的語の情報が不足しており、このた
め、機械翻訳部２では、「渡して下さい。」に対する完
全な翻訳文を生成することができず、処理が中断する。

【００９９】このように、日本語を英語に翻訳する場合
に、目的語や主語等が不明なため、翻訳文としての英文
を生成することができず、処理が中断した場合、機械翻
訳部２（の言語変換部２２）は、その処理途中の情報、
即ち、いまの場合、動詞「hand」の目的語の決定ができ
ない旨を含む不完全翻訳情報を、対話管理部５の不完全
情報判定部６１に出力する。

【０１００】不完全情報判定部６１は、不完全翻訳情報
を受信すると、その不完全翻訳情報から、機械翻訳部２
の翻訳において、どのような問題が発生しているのかを
理解し、その問題を解消することができるかどうかを、
即ち、ここでは、動詞「hand」の目的語が不足している
という問題を解消することができるかどうかを、知識デ
ータベース４６および対話履歴記憶部４７を参照するこ
とで判定する。

【０１０１】具体的には、例えば、いま、対話履歴記憶
部４７における最近の対話履歴において、ある男性に対
して、何かを渡す旨の発話が記録されている場合には、
不完全情報判定部６１では、上述の動詞「hand」の目的
語は、その男性を表す「him」であることが推定され、
これにより、機械翻訳部２の翻訳において生じている問
題を解消することができると判定される。この場合、不
完全情報判定部６１は、動詞「hand」の目的語は「hi
m」である旨の不足情報を、対話管理情報として、機械
翻訳部２に出力し、機械翻訳部２では、この対話管理情
報を用いて、処理が再開される。

【０１０２】また、上述のような推定を行うことができ
ず、このため、機械翻訳部２の翻訳において生じている
問題を解消することができないと判定された場合には、
不完全情報判定部６１は、動詞「hand」の目的語を、ユ
ーザから得るための質問文を、質問文生成部６２に生成
させる。

【０１０３】即ち、この場合、質問文生成部６２では、
例えば、「目的語は何ですか？」等の、動詞「hand」の
目的語を、ユーザから得るための質問文を生成する。こ
こで、そのような質問文としては、その他、例えば、
「目的語は彼ですか、彼女ですか？」や、「誰に対して
そうするのですか？」等が考えられるが、どのようなパ
ターンの質問文を生成するかは、質問文生成部６２にお
いて、適宜選択するようにすることができる。

【０１０４】質問文生成部６２で得られた質問文は、音
声合成部３に供給され、そこで合成音として出力され
る。いま、例えば、音声合成部３において、質問文「目
的語は何ですか？」に対応する合成音に対して、ユーザ
が、「Johnです。」と発話したとすると、その発話は、
音声認識部１において音声認識され、機械翻訳部２に供
給される。機械翻訳部２では、この音声認識結果「John
です。」が、その前の音声認識結果に追加され、処理が
再開される。即ち、いまの場合、機械翻訳部２では、音
声認識結果「Johnです。」によって、動詞「hand」の目
的語が不足しているという問題が解消され（目的語が、
「John」であることが認識され）、中断していた翻訳処
理が再開され、翻訳文「hand it John.」が生成され
る。

【０１０５】以上のように、機械翻訳部２において、音
声認識部１における音声認識結果だけからでは、完全な
翻訳を行うことができない場合であっても、対話管理部
５における知識や、対話履歴を参照することにより、翻
訳に不足している情報を得て、翻訳を行うことが可能と
なる。さらに、対話管理部５における知識や、対話履歴
を参照しても、翻訳に不足している情報を得ることがで
きない場合には、その情報を得るための質問を出力し、
その質問に対してユーザに応えてもらうことで、翻訳に
不足している情報を得て、翻訳を行うことが可能とな
る。

【０１０６】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
専用のハードウェアとしての音声翻訳システムに組み込
まれているコンピュータや、汎用のコンピュータ等にイ
ンストールされる。

【０１０７】そこで、図１１を参照して、上述した一連
の処理を実行するプログラムをコンピュータにインスト
ールし、コンピュータによって実行可能な状態とするた
めに用いられる、そのプログラムが記録されている記録
媒体について説明する。

【０１０８】プログラムは、図１１（Ａ）に示すよう
に、コンピュータ１０１に内蔵されている記録媒体とし
てのハードディスク１０２や半導体メモリ１０３に予め
記録しておくことができる。

【０１０９】あるいはまた、プログラムは、図１１
（Ｂ）に示すように、フロッピーディスク１１１、CD-R
OM(Compact Disc Read Only Memory)１１２，MO(Magnet
o optical)ディスク１１３，DVD(Digital Versatile Di
sc)１１４、磁気ディスク１１５、半導体メモリ１１６
などの記録媒体に、一時的あるいは永続的に格納（記
録）しておくことができる。このような記録媒体は、い
わゆるパッケージソフトウエアとして提供することがで
きる。

【０１１０】なお、プログラムは、上述したような記録
媒体からコンピュータにインストールする他、図１１
（Ｃ）に示すように、ダウンロードサイト１２１から、
ディジタル衛星放送用の人工衛星１２２を介して、コン
ピュータ１０１に無線で転送したり、LAN(Local Area N
etwork)、インターネットといったネットワーク１３１
を介して、コンピュータ１２３に有線で転送し、コンピ
ュータ１０１において、内蔵するハードディスク１０２
などにインストールすることができる。

【０１１１】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理（例えば、並列処理あるい
はオブジェクトによる処理）も含むものである。

【０１１２】また、プログラムは、１のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。

【０１１３】次に、図１２は、図１１のコンピュータ１
０１の構成例を示している。

【０１１４】コンピュータ１０１は、図１２に示すよう
に、CPU(Central Processing Unit)１４２を内蔵してい
る。CPU１４２には、バス１４１を介して、入出力イン
タフェース１４５が接続されており、CPU１４２は、入
出力インタフェース１４５を介して、ユーザによって、
キーボードやマウス等で構成される入力部１４７が操作
されることにより指令が入力されると、それにしたがっ
て、図１１（Ａ）の半導体メモリ１０３に対応するROM
(Read Only Memory)１４３に格納されているプログラム
を実行する。あるいは、また、CPU１４２は、ハードデ
ィスク１０２に格納されているプログラム、衛星１２２
若しくはネットワーク１３１から転送され、通信部１４
８で受信されてハードディスク１０２にインストールさ
れたプログラム、またはドライブ１４９に装着されたフ
ロッピディスク１１１、CD-ROM１１２、MOディスク１１
３、DVD１１４、若しくは磁気ディスク１１５から読み
出されてハードディスク１０２にインストールされたプ
ログラムを、RAM(Random Access Memory)１４４にロー
ドして実行する。そして、CPU１４２は、その処理結果
を、例えば、入出力インタフェース１４５を介して、LC
D(Liquid CryStal Display)等で構成される表示部１４
６に、必要に応じて出力する。

【０１１５】なお、本実施の形態では、日本語と英語と
の相互の翻訳を行うようにしたが、本発明は、その他の
言語の翻訳を行う場合にも適用可能である。

【０１１６】また、本実施の形態では、音声認識部１に
おいて、音声を認識し、その音声認識結果を、機械翻訳
部２で翻訳するようにしたが、機械翻訳部２には、その
他、例えば、キーボードから入力されたテキストや、文
字認識装置で、手書き文字等を認識して得られるテキス
ト等を対象に翻訳を行わせることが可能である。

【０１１７】さらに、本実施の形態では、翻訳結果を、
合成音で出力するようにしたが、翻訳結果は、テキスト
で表示するようにすることも可能である。

【０１１８】

【発明の効果】本発明の翻訳装置および翻訳方法、並び
に記録媒体によれば、第１の言語が第２の言語に翻訳さ
れるとともに、第２の言語が第１の言語に翻訳される。
一方、第１および第２の言語による対話の履歴である対
話履歴が記憶され、その対話履歴、または所定の知識に
基づいて、所定の処理が行われる。従って、例えば、所
定の処理において、翻訳に必要な情報を得るようにする
こと等により、精度の高い翻訳を行うことが可能とな
る。

【図面の簡単な説明】

【図１】本発明を適用した音声翻訳システムの一実施の
形態の構成例を示すブロック図である。

【図２】音声認識部１の構成例を示すブロック図であ
る。

【図３】機械翻訳部２の構成例を示すブロック図であ
る。

【図４】音声合成部３の構成例を示すブロック図であ
る。

【図５】対話管理部５の第１の構成例を示すブロック図
である。

【図６】図５の対話制御部４３の処理を説明するための
フローチャートである。

【図７】対話管理部５の第２の構成例を示すブロック図
である。

【図８】図７の対話チェック部５１の処理を説明するた
めのフローチャートである。

【図９】対話管理部５の第３の構成例を示すブロック図
である。

【図１０】図９の不完全情報判定部６１の処理を説明す
るためのフローチャートである。

【図１１】本発明を適用した記録媒体を説明するための
図である。

【図１２】図１１のコンピュータ１０１の構成例を示す
ブロック図である。

【符号の説明】

１音声認識部，２機械翻訳部，３音声合成
部，４表示部，５対話管理部，１１マイク
（マイクロフォン），１２ＡＤ変換部，１３特
徴抽出部，１４特徴量バッファ，１５マッチン
グ部，１６音響モデルデータベース，１７辞書
データベース，１８文法データベース，２１テ
キスト解析部，２２言語変換部，２３テキスト
生成部，２４辞書データベース，２５解析用文法
データベース，２６言語変換データベース，２７
辞書データベース，２８生成用文法データベー
ス，３１テキスト解析部，３２規則合成部，３
３ＤＡ変換部，３４辞書データベース，３５解
析用文法データベース，３６音素片データベース，
４１テキスト解析部，４２意味理解部，４３
対話制御部，４４辞書データベース，４５文法
データベース，４６知識データベース，４７対
話履歴記憶部，４８生成規則データベース，４９
応答文生成部，５１対話チェック部，６１不
完全情報判定部，６２質問文生成部，１０１コ
ンピュータ，１０２ハードディスク，１０３半
導体メモリ，１１１フロッピーディスク，１１２
CD-ROM，１１３ MOディスク，１１４ DVD，
１１５磁気ディスク，１１６半導体メモリ，１２
１ダウンロードサイト，１２２衛星，１３１
ネットワーク，１４１バス，１４２ CPU，１４
３ ROM，１４４ RAM，１４５入出力インタフェ
ース，１４６表示部，１４７入力部，１４８
通信部，１４９ドライブ

───────────────────────────────────────────────────── フロントページの続き (72)発明者青柳誠一東京都品川区北品川６丁目７番35号ソニー株式会社内 (72)発明者小川浩明東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 5B091 AA03 BA03 CA12 CA14 CA21 CB12 CB32 CC04 CD13 EA04

Claims

【特許請求の範囲】

【請求項１】第１の言語の入力文を翻訳し、第２の言
語の翻訳文を出力するとともに、前記第２の言語の入力
文を翻訳し、前記第１の言語の翻訳文を出力する翻訳装
置であって、前記第１の言語を前記第２の言語に翻訳するとともに、
前記第２の言語を前記第１の言語に翻訳する翻訳手段
と、前記第１および第２の言語による対話の履歴である対話
履歴を記憶する履歴記憶手段と、所定の知識を記憶している知識記憶手段と、前記対話履歴または所定の知識に基づいて、所定の処理
を行う処理手段とを含むことを特徴とする翻訳装置。
【請求項２】前記処理手段は、前記対話履歴または所
定の知識に基づいて、入力文に対する応答を生成するこ
とを特徴とする請求項１に記載の翻訳装置。
【請求項３】前記処理手段は、前記対話履歴または所
定の知識に基づいて、前記翻訳手段による翻訳結果をチ
ェックし、そのチェックの結果を、前記翻訳手段に供給
し、前記翻訳手段は、前記処理手段からの情報に基づいて、
翻訳を行うことを特徴とする請求項１に記載の翻訳装
置。
【請求項４】前記処理手段は、前記対話履歴または所
定の知識に基づいて、前記対話における話題の遷移を検
出し、その検出結果を、前記翻訳手段に供給し、前記翻訳手段は、前記処理手段からの情報に基づいて、
翻訳を行うことを特徴とする請求項１に記載の翻訳装
置。
【請求項５】前記処理手段は、前記対話履歴または所
定の知識に基づいて、前記翻訳手段による翻訳を補助す
ることを特徴とする請求項１に記載の翻訳装置。
【請求項６】前記処理手段は、前記対話履歴または所
定の知識に基づいて、翻訳に必要な情報を取得し、前記
翻訳手段に供給することを特徴とする請求項５に記載の
翻訳装置。
【請求項７】前記処理手段は、前記翻訳に必要な情報
を取得することができないとき、翻訳に必要な情報を入
力するように、ユーザに要求することを特徴とする請求
項６に記載の翻訳装置。
【請求項８】音声を認識する音声認識手段をさらに含
み、前記翻訳手段は、前記音声認識手段による前記音声の認
識結果を翻訳することを特徴とする請求項１に記載の翻
訳装置。
【請求項９】前記翻訳手段による翻訳結果に対応する
合成音を生成する音声合成手段をさらに含むことを特徴
とする請求項１に記載の翻訳装置。
【請求項１０】第１の言語の入力文を翻訳し、第２の
言語の翻訳文を出力するとともに、前記第２の言語の入
力文を翻訳し、前記第１の言語の翻訳文を出力する翻訳
方法であって、前記第１の言語を前記第２の言語に翻訳するとともに、
前記第２の言語を前記第１の言語に翻訳する翻訳ステッ
プと、前記第１および第２の言語による対話の履歴である対話
履歴を記憶する履歴記憶ステップと、前記対話履歴または所定の知識に基づいて、所定の処理
を行う処理ステップとを含むことを特徴とする翻訳方
法。
【請求項１１】第１の言語の入力文を翻訳し、第２の
言語の翻訳文を出力するとともに、前記第２の言語の入
力文を翻訳し、前記第１の言語の翻訳文を出力する翻訳
処理を、コンピュータに行わせるプログラムが記録され
ている記録媒体であって、前記第１の言語を前記第２の言語に翻訳するとともに、
前記第２の言語を前記第１の言語に翻訳する翻訳ステッ
プと、前記第１および第２の言語による対話の履歴である対話
履歴を記憶する履歴記憶ステップと、前記対話履歴または所定の知識に基づいて、所定の処理
を行う処理ステップとを含むプログラムが記録されてい
ることを特徴とする記録媒体。