JP6334354B2

JP6334354B2 - 機械翻訳装置、方法およびプログラム

Info

Publication number: JP6334354B2
Application number: JP2014202631A
Authority: JP
Inventors: 聡園尾
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2014-09-30
Filing date: 2014-09-30
Publication date: 2018-05-30
Anticipated expiration: 2034-09-30
Also published as: US20160092438A1; JP2016071761A; CN105468585A

Description

本発明の実施形態は、原言語テキストを処理単位に分割し、処理単位毎の翻訳結果の並び順序を制御することで、好適な目的言語テキストを生成する機械翻訳装置、方法およびプログラムに関する。

近年、話し言葉を対象にした自然言語処理技術の開発が進んでいる。例えば、携帯端末を利用して旅行会話の翻訳を行う機械翻訳技術が広く利用されるようになってきた。旅行会話では比較的短い文の発話であることが多く、発話文の入力が完了した後に機械翻訳処理を行っても意図の伝達に支障が生じることはなかった。

一方、講演会や報告会などで一人の話者がある程度のまとまりを持って発話する「独話」と呼ばれる発話形態を翻訳する場合、話者の発話意図の伝達度を高めるために、話者がひとまとまりの発話を話し切るのを待つのではなく、発話の途中であっても機械翻訳処理を漸進的に行う必要がある。このような機械翻訳は、漸進翻訳または同時翻訳と呼ばれる。

同時翻訳では、連続的に入力される発話からなる原言語テキストを適切な処理単位に分割し、目的言語テキストに翻訳する。しかしながら、新聞記事やマニュアルといった校正済みの書き言葉とは異なり、話し言葉では、文（Ｓｅｎｔｅｎｃｅ）や節（Ｃｌａｕｓｅ）の区切りの目安となる句読点（Ｐｕｎｃｔｕａｔｉｏｎ）の情報が利用できず、処理単位を適切に分割することは困難であった。

このような困難さを解消するために、特許文献１では、独話をその構成単位に分割するために、音声による情報の一つである、短い中断である「ポーズ」によって分割された原言語テキストと、その原言語テキストの形態素解析情報を用いて、所定のパターンに応じて分割位置を修正するテキスト分割処理装置が開示されている。

特開２００７−１８０９８号公報

しかし、このように分割された処理単位を漸進的に翻訳するだけでは、文全体としての構文構造を変換することができず、意図の伝達度が低い翻訳結果となってしまう。

例えば、音声発話を音声認識処理し、「アプリの更新はバグの修正が遅れているので来週になりそうです」という原言語テキストが入力された場合を考える。この原言語テキストを解析すると、「アプリの更新は／／バグの修正が遅れているので／／来週になりそうです」の３つの節からなる処理単位に分割される（ここで／／は処理単位の分割位置を表す）。この処理単位を漸進的に翻訳すると、「an update of application // because a bug fixing is late // it will be next week」という翻訳結果を得ることができる。しかしながら、この翻訳結果では、「it」の指す対象が「an update of application(アプリの更新)」なのか「a bug fixing（バグの修正）」なのかが曖昧となり、意図の伝達に支障が生じる。

本開示は、上述の課題を解決するためになされたものであり、独話に代表される連続的な発話に対する同時翻訳において、できる限り同時性を保ちつつ、意図の伝達度を高める様に、原言語テキストの分割処理ならびに翻訳処理を行うことのできる機械翻訳装置を提供することを目的とする。

第１の発明は、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割部と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、前記目的言語テキストを出力する出力部と、を備えた機械翻訳装置である。

第２の発明は、前記処理単位は節である、第１の発明記載の機械翻訳装置である。

第３の発明は、前記解析情報は、前記原言語テキストの形態素解析結果および構文解析結果を含み、前記翻訳順序情報は、現在の処理単位に係る翻訳結果をバッファにため、その出力順序が遅延可能かどうかを示す情報を含み、前記処理単位分割部は、前記形態素解析結果により分割位置を決定する手段、及び前記構文解析結果により前記翻訳順序情報を決定する手段を含み、前記翻訳制御部は、前記翻訳順序情報が遅延可能である場合、現在の翻訳結果の出力を遅延させ、前記翻訳順序情報が遅延不可能である場合、現在の翻訳結果に未出力の翻訳結果を追加して目的言語テキストを生成する手段を含む、第１の発明記載の機械翻訳装置である。

第４の発明は、前記処理単位分割部は、直前に処理された翻訳処理に係る時刻情報と、現在の処理単位に係る時刻情報、との時刻差分情報により、前記翻訳順序情報を修正する手段をさらに含む、第３の発明記載の機械翻訳装置である。

第５の発明は、前記構文解析情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、第３または第４の発明記載の機械翻訳装置である。

第６の発明は、前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、前記翻訳制御部は、前記翻訳順序情報に応答して、現在の翻訳結果に前記音声認識結果修正部によって修正された原言語テキストの翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、第３乃至第５の発明記載の機械翻訳装置である。

第７の発明は、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、前記目的言語テキストを出力する出力工程と、を備えた、コンピュータが実行する機械翻訳方法である。

第８の発明は、機械翻訳装置に、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラムである。

第１実施形態に係る機械翻訳装置１００のブロック図。処理単位分割部１０２のブロック図。解析部２０１における解析結果の例を示す図。教師テキストコーパスの例を示す図。翻訳順序判定部２０４における判定規則ルールの例を示す図。翻訳制御部１０３のブロック図。第１実施形態に係る同時翻訳処理の手順を表すフローチャート。同時翻訳処理における翻訳順序制御の第１具体例を示す図。音声入力に時間遅延が含まれる場合の同時翻訳処理における翻訳順序制御の第２具体例を示す図。音声認識結果に認識誤りが含まれる場合の同時翻訳処理における翻訳順序制御の第３具体例を示す図。

以下、本発明の実施の形態について図面を参照しながら説明する。

ここで、本実施形態では、日本語の原言語文から英語の目的言語文への翻訳を例にして説明するが、翻訳の原言語および目的言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。

図１は、本実施形態に係る機械翻訳装置１００のブロック図である。機械翻訳装置１００は、原言語の音声入力を受け付ける音声認識処理部１０１と、処理単位分割部１０２と、翻訳制御部１０３と、翻訳処理部１０４と、目的言語テキストを出力する出力部１０５と、及び音声認識結果修正部１０６を備える。

音声認識処理部１０１は、機械翻訳装置１００への入力である原言語の音声入力を受け取り、音声認識結果である原言語テキスト、及び音声認識結果の確からしさを表す信頼度を生成する。音声認識処理には、隠れマルコフモデルに基づく手法など、広く一般に知られた手法が適用可能であるので、詳細な説明は省略する。

処理単位分割部１０２は、音声認識処理部１０１から原言語テキストと、翻訳制御部１０３から過去に翻訳された処理単位に関する時刻情報を受け取り、翻訳順序が変更可能かどうかを示す翻訳順序情報を含む、原言語テキストの部分テキスト（部分的な意味のまとまり、例えば節）である処理単位を生成する。

翻訳制御部１０３は、処理単位分割部１０２によって生成された処理単位を受け取り、翻訳処理部１０４を介して翻訳結果である目的言語テキストを生成する。

翻訳処理部１０４は、原言語テキストを受け取り、機械翻訳によって目的言語テキストを生成する。機械翻訳としては、従来から知られている規則ベース翻訳（ＲｕｌｅＢａｓｅｄＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）、用例ベース翻訳（ＥｘａｍｐｌｅＢａｓｅｄＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）、統計翻訳（ＳｔａｔｉｓｔｉｃａｌＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）などが適用可能である。これらは広く一般的に知られているものであるので詳細な説明は省略する。

出力部１０５は、翻訳制御部１０３によって生成された目的言語テキストを出力する。また、音声認識処理部１０１によって認識された原言語テキスト及び信頼度を併せて出力することもできる。さらに、信頼度が一定の閾値以下となる原言語テキスト部分を注釈して提示し、ユーザに音声認識結果の修正を促してもよい。出力方法は、例えば、ディスプレイ装置（図示せず）による画像出力、プリンタ装置（図示せず）による印字出力、音声合成装置（図示せず）による音声出力などのいかなる方法で実行されてもよい。また、これらの出力方法を複数組み込んでおき、必要に応じて切り替えるように構成してもよく、これらの出力方法のうちの２以上を併用してもよい。

音声認識結果修正部１０６は、ユーザの操作に応答し、音声認識結果を修正する機能を有する。修正は、キーボード（図示せず）及びマウス（図示せず）による操作や、音声入力の言い直しによる操作などのいかなる方法で実行されてもよい。さらに、音声認識処理部１０１から修正候補を受け取り、その候補の中のいずれかをユーザが選択してもよい。

図２は処理単位分割部１０２のブロック図である。処理単位分割部１０２は、音声認識処理部１０１から原言語テキストを受け取る解析部２０１と、分割位置判定部２０２と、モデル記憶部２０３と、翻訳順序判定部２０４と、及び処理単位生成部２０５を備える。

解析部２０１は、原言語テキストを形態素単位に区切り品詞情報などを得る形態素解析や、節間の文法的な関係性を得る構文解析によって、解析情報を取得する。例として、図３に入力例３０１「アプリの更新はバグの修正が遅れているので来週になりそうです」に対する解析結果を示す。解析結果３０２において、形態素「ので」の品詞情報が接続詞であり、「バグの修正が遅れているので」を文法的に意味のあるひとまとまり（すなわち、節）とみなし、構文情報として「副詞節―理由」と解析されたことを示している。

分割位置判定部２０２は、上述の解析結果を受け取り、モデル記憶部２０３と照合し、分割位置を判定する。

モデル記憶部２０３は教師テキストコーパスを元に構築された判定モデルが格納されている。図４は、教師テキストコーパスの一例を示すである。教師テキストコーパスは、教師テキストに対して予め分割位置と発話時の時刻情報が付与された教師データ４０１の集合である。教師データ４０１では、教師テキスト文「原材料の納品が遅れているので製品の出荷が遅れそうです」が第１の節「原材料の納品が遅れているので」及び第２の節「製品の出荷が遅れそうです」に分割され、各節を発話した時刻情報が記憶されている。また、モデル記憶部２０３に記憶されるモデルは、条件付き確率場（ＣｏｎｄｉｔｉｏｎａｌＲａｎｄｏｍＦｉｅｌｄ）などの機械学習手法を用いて構築してもよいし、人手によるルールとして構築しても構わない。例えば、人手によるルールの場合、判定モデルのうち、教師データ４０１に対応した判定基準として、「ので」の前後で分割するルールを作成すればよい。

翻訳順序判定部２０４は、分割位置判定部２０２によって分割された処理単位に対して、該当処理単位の翻訳順序が変更可能かどうかを示す翻訳順序情報の判定を行う。図５は翻訳順序判定部２０４における判定規則ルールの例を示す図である。このルールは原言語（日本語）の構文情報と目的言語文の順序情報（すなわち英語への翻訳順序）を示している。

例えば、第１の節「原材料の納品が遅れているので」が処理単位であり、構文情報「副詞節―理由」に該当する場合、図５に示す判定規則を参照し、目的言語文への翻訳順序情報が「後置可」と判定する。さらに、分割判定部２０２は、現在の時刻情報（すなわち、音声認識処理部１０１が原言語の音声入力を受け付けた時刻情報）と、翻訳制御部１０３より受け取った過去に処理された処理単位に関する時刻情報を比較して、上述の翻訳順序情報を修正する機能を有している。

処理単位生成部２０５は、分割位置判定部２０２と翻訳順序判定部２０４の判定結果を受け取り、翻訳順序が変更可能かどうかを示す翻訳順序情報を含む、原言語テキストの部分テキストである処理単位を生成する。

図６は翻訳制御部１０３のブロック図である。翻訳制御部１０３は、受付部６０１と、制御部６０２と、及び翻訳結果バッファ６０３を備える。

受付部６０１は、処理単位分割部１０２から処理単位の原言語テキストを受け取り、翻訳処理部１０４へ入力し、その目的言語テキストの翻訳結果を得る。

制御部６０２は、処理単位の翻訳順序情報を用いて、翻訳順序情報を制御する。具体的には、翻訳順序情報が「後置可」の場合、現在の翻訳結果を翻訳結果バッファ６０３に格納し、翻訳順序情報が「後置不可」の場合、現在の翻訳結果に翻訳結果バッファ６０３に格納された翻訳結果を付け加えることで目的言語テキストを生成する。制御部６０２は、上述の目的言語テキストを出力部１０５へ出力すると同時に、その時点の時刻情報を処理単位分割部１０２へ出力する。

次に、本実施形態に係る機械翻訳装置１００による同時翻訳処理について説明する。図７は、本実施形態に係る同時翻訳処理の全体の流れを示すフローチャートである。

まず、音声認識処理部１０１が原言語による入力を受け付けて、音声認識処理を行う（ステップS７０１）。

次に、解析部２０１が原言語テキストの解析処理を行う（ステップS７０２）。

次に、解析部２０１による解析結果を受け付けて、分割判定部２０２が原言語テキストにおける処理単位の判定を行う（ステップS７０３）。現在の原言語テキストの終端位置が分割位置ではないと判断された場合（ステップS７０３：NO）、音声認識処理（ステップS７０１）に戻る。

現在の原言語テキストの終端位置が分割位置であると判断された場合（ステップS７０３：YES）、翻訳順序判定部２０４において、処理単位の翻訳順序判定を行う（ステップS７０４）。翻訳順序判定によって、該当の処理単位が「後置可」であると判断された場合（ステップS７０４：後置可）、翻訳順序判定部２０４は翻訳順序情報を「後置可」に設定する（ステップS７０５）。また、翻訳順序判定によって、該当の処理単位が「後置不可」であると判断された場合（ステップS７０４：後置不可）、翻訳順序判定部２０４は翻訳順序情報を「後置不可」に設定する（ステップS７０６）。

次に、現在の時刻情報と過去に出力された時刻情報の差分から翻訳間隔（すなわち、時刻差分情報）を算出し、予め定められた閾値と比較を行う（ステップS７０７）。翻訳間隔が閾値以上である場合（ステップS７０７：閾値以上）、翻訳順序判定部２０４は翻訳順序情報を「後置不可」に修正する（ステップS７０８）。

次に、上述の分割位置情報と翻訳順序情報を受け付けて、処理単位生成部２０５が処理単位を生成する（ステップS７０９）。

次に、受付部６０１が上述の処理単位を受け付けて、翻訳処理部１０４が入力された原言語テキストを目的言語へ翻訳し、翻訳結果へ生成する（ステップS７１０）。

次に、上述の翻訳順序情報が後置可であった場合（ステップS７１１：後置可）、制御部６０２が上述の翻訳結果を翻訳結果バッファ６０３へ格納し、音声認識処理（ステップS７０１）に戻る。また、上述の翻訳順序情報が後置不可であった場合（ステップS７１１：後置不可）、制御部６０２が上述の翻訳結果に翻訳結果バッファ６０３に格納されている翻訳結果を付け加え、目的原言語テキストを生成する（ステップS７１２）。

最後に、上述の目的言語テキストを受け付けて、出力部１０５が目的言語による出力処理を行い（ステップS７１３）、処理を終了する。

なお、同図には図示しないが、音声認識結果修正部１０６によって音声認識結果が修正された場合においても処理の全体の流れは同様である。

本実施形態によれば、同時翻訳処理において、連続して入力される原言語テキストに対して適切な処理単位を検出し、処理単位の順序情報に応じて処理単位毎の翻訳結果の並び順序を制御することで、できる限り同時性を保ちつつ、明瞭な翻訳結果を得ることができ、翻訳後の意図の伝達度も高めることができる。

続いて、本実施形態に係る同時翻訳処理の具体例３つを説明する。

（第１具体例）
図８は、同時翻訳処理における翻訳順序制御の第１具体例を示す図である。ここでは、「アプリの更新はバグの修正が遅れているので来週になりそうです」に対応する音声入力が順次なされ、音声認識処理部１０１により正しい原言語テキストが得られた場合の処理を時系列に沿って説明する。

まず、時刻Ｔ１において、処理単位分割部１０２により処理単位８０１「アプリの更新は／／＜翻訳順序情報：後置不可＞」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部１０３は、翻訳処理部１０４によって得られた翻訳結果８０２「an update of applications 」の出力順序が遅延不可と判断し、翻訳結果８０２を出力部１０５へ出力する（時刻Ｔ２）。

次に、時刻Ｔ３において、処理単位分割部１０２により処理単位８０３「バグの修正が遅れているので／／＜翻訳順序情報：後置可＞」を得る。ここで、翻訳順序情報が後置可であることに応答して、翻訳制御部１０３は、翻訳結果の出力を遅延させる（時刻Ｔ４）。

次に、時刻Ｔ５において、処理単位分割部１０２により処理単位８０４「来週になりそうです／／<翻訳順序情報：後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部１０３は、処理単位８０４に対する翻訳結果に翻訳結果バッファ６０３に格納された翻訳結果を追加し、翻訳結果８０５「it will be next week // because a bug fixing is late」を出力する（時刻Ｔ５）。最終的な翻訳結果は、「an update of application // it will be next week // because a bug fixing is late」となる。このように、本実施形態に係る同時翻訳処理では、主節に対する結論部分が先に訳出され、理由を表す副詞節が文全体を修飾するため、曖昧性の低く意図の伝達度が高い翻訳結果を得ることができる。

（第２具体例）
図９は、音声入力に時間遅延が含まれる場合の同時翻訳処理における翻訳順序制御の第２具体例を示す図である。ここでは、音声入力にポーズ、フィラー、言いよどみ等の時間的遅れ要因が含まれる場合の同時翻訳処理について説明する。以下の説明では、時刻情報判定ステップＳ７０７における閾値が２．００秒に設定されているものとする。

まず、時刻Ｔ１において、処理単位分割部１０２により処理単位９０１「アプリの更新は／／＜翻訳順序情報：後置不可＞」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部１０３は、翻訳処理部１０４によって得られた翻訳結果９０２「an update of applications 」を出力する。このときの時刻Ｔ２は０１：００であったとする。

上述の翻訳結果を出力してから次の原言語テキストを得るまでに、音声入力中のポーズ、フィラー、言いよどみ等が原因で時間遅延が発生し、時刻Ｔ３（０３：０５）において処理単位分割処理が行われたとする。この場合、本来の翻訳順序情報（後置可）に基づいて、以降の処理を続けた場合、翻訳結果における時刻遅延が更に増大し、同時性が損なわれてしまう。この問題を解決するために、第２具体例では、時刻情報判定ステップＳ７０７において、直前の翻訳結果を出力時刻情報と現在の時刻情報から翻訳間隔を算出し、閾値と比較することで、翻訳順序情報を修正が行われる。これにより、処理単位９０３「アプリの更新は／／＜翻訳順序情報：後置不可＞」を得て、翻訳結果９０４「because a bug fixing is late」を出力する。

以下同様に、処理単位９０５「来週になりそうです／／<翻訳順序情報：後置不可>」に対応する翻訳結果９０６「it will be next week」を出力し、最終的な翻訳結果「an update of application // because a bug fixing is late // it will be next week」を得る。このように、音声入力に時間遅延が発生した場合においても、同時性を確保することができる。

（第３具体例）
図１０は、音声認識結果に認識誤りが含まれる場合の同時翻訳処理における翻訳順序制御の第３具体例を示す図である。原言語テキストが音声入力に対する音声認識結果である場合、音声認識結果に誤りが含まれていることがあり、同時翻訳の処理途中に音声認識結果を修正しなければならない状況が起こりうる。このような状況では、該当する処理単位の音声認識結果の修正を待たなければ、後続する処理単位の翻訳結果を出力することができず、同時性が損なわれてしまう、という問題があった。

第３具体例では、音声認識処理結果がディスプレイ（不図示）に表示され、発話者（原言語話者）であるユーザが音声認識結果に誤りがあると判断し、音声認識結果を修正する場合の処理について説明する。なお、音声認識処理結果の信頼度もディスプレイに表示されていてもよい。

以下の説明では、時刻Ｔ３において「バグの“種類”が〜」と誤って認識されて、時刻Ｔ７において「バグの“修正”が〜」にキーボード入力によって修正されたものとする。ただし、修正の入力方法はキーボードに限られない。

まず、時刻Ｔ１において、処理単位分割部１０２により処理単位１００１「アプリの更新は／／＜翻訳順序情報：後置不可＞」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部１０３は、翻訳処理部１０４によって得られた翻訳結果１００２「an update of applications 」を出力する。

次に、時刻Ｔ３において、処理単位分割部１０２により認識誤りを含む処理単位１００３「バグの種類が遅れているので／／＜翻訳順序情報：後置可＞」を得る。ここで、翻訳順序情報が後置可であることに応答して、翻訳制御部１０３は、翻訳結果の出力を遅延させる（時刻Ｔ４）。

このとき、処理単位１００３の音声認識信頼度が低いため、ここに認識誤りが含まれると気づいたユーザは、音声認識結果修正部１０６により、認識結果の修正を行うことができる。音声認識結果修正部１０６による修正に応答して、翻訳結果バッファ６０３の該当する翻訳結果をクリアする。

従来技術では、処理単位が漸進的に翻訳されるので、当該処理単位の音声認識結果の修正が終わるまでは後続の音声入力を受け付けることができず、同時性が損なわれてしまっていた。

しかしながら、第３具体例においては、処理単位の出力を非同期に制御することにより、認識結果の修正と後続の音声入力の受け付けを並行して行うことができる。また、認識誤りを含む翻訳結果の出力を遅延させることで、誤って理解されることを回避し、原言語話者の意図の伝達度を高めるという効果も奏する。

次に、時刻Ｔ５において、処理単位分割部１０２により処理単位１００４「来週になりそうです／／<翻訳順序情報：後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部１０３は、翻訳処理部１０４によって得られた翻訳結果１００５「it will be next week」を出力する（時刻Ｔ６）。

次に、時刻Ｔ７において、認識結果の修正処理が完了し、処理単位１００６「バグの修正が遅れているので／／＜翻訳順序情報：後置可＞」を得て、修正済みの翻訳結果１００７「because a bug fixing is late」を出力する（時刻Ｔ８）。このように、音声認識処理結果に認識誤りが含まれる場合においても、同時性を確保しつつ、意図の伝達度の高い同時通訳を実現することができる。

なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

例えば、本実施形態に係る機械翻訳装置をコンピュータで実行可能なプログラムで実現し、このプログラムをコンピュータで読み取り可能な記憶媒体として実現することも可能である。
以下、本願出願当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割部と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、
前記目的言語テキストを出力する出力部と、を備えた機械翻訳装置。
［Ｃ２］
前記処理単位は節である、［Ｃ１］記載の機械翻訳装置。
［Ｃ３］
前記解析情報は、前記原言語テキストの形態素解析結果および構文解析結果を含み、
前記翻訳順序情報は、現在の処理単位に係る翻訳結果をバッファにため、その出力順序が遅延可能かどうかを示す情報を含み、
前記処理単位分割部は、前記形態素解析結果により分割位置を決定する手段、及び前記構文解析結果により前記翻訳順序情報を決定する手段を含み、
前記翻訳制御部は、前記翻訳順序情報が遅延可能である場合、現在の翻訳結果の出力を遅延させ、前記翻訳順序情報が遅延不可能である場合、現在の翻訳結果に未出力の翻訳結果を追加して目的言語テキストを生成する手段を含む、
［Ｃ１］に記載の機械翻訳装置。
［Ｃ４］
前記処理単位分割部は、直前に処理された翻訳処理に係る時刻情報と、現在の処理単位に係る時刻情報、との時刻差分情報により、前記翻訳順序情報を修正する手段をさらに含む、
［Ｃ３］に記載の機械翻訳装置。
［Ｃ５］
前記構文解析情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、［Ｃ３］または［Ｃ４］に記載の機械翻訳装置。
［Ｃ６］
前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、
前記翻訳制御部は、前記翻訳順序情報に応答して、現在の翻訳結果に前記音声認識結果修正部によって修正された原言語テキストの翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、
［Ｃ３］乃至［Ｃ５］に記載の機械翻訳装置。
［Ｃ７］
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、を備えた、コンピュータが実行する機械翻訳方法。
［Ｃ８］
機械翻訳装置に、
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラム。

１００機械翻訳装置
１０１音声認識処理部
１０２処理単位分割部
１０３翻訳制御部
１０４翻訳処理部
１０５出力部
１０６音声認識結果修正部
２０１解析部
２０２分割位置判定部
２０３モデル記憶部
２０４翻訳順序判定部
２０５処理単位生成部
６０１受付部
６０２制御部
６０３翻訳結果バッファ

Claims

逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、
前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割部と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、
前記目的言語テキストを出力する出力部と、
を備えた機械翻訳装置。
前記処理単位は節である、請求項１に記載の機械翻訳装置。
前記処理単位分割部が文法的な解析を行うことは、前記原言語テキストに対して形態素解析および構文解析を行うことを含み、
前記翻訳順序情報は、現在の処理単位に係る翻訳結果が他の処理単位の翻訳結果より後に置かれることが可能かどうかを示し、
前記処理単位分割部は、前記形態素解析の結果により前記処理単位の分割位置を決定する手段、及び、前記構文解析の結果により決定される前記処理単位の前記構文情報で前記構文情報と前記翻訳順序情報との予め定められた関係を参照することにより前記翻訳順序情報を決定する手段を含み、
前記翻訳制御部は、現在の処理単位に係る前記翻訳順序情報が、現在の処理単位に係る翻訳結果が後に置かれることが可能であることを示す場合、現在の翻訳結果の出力をバッファにため、前記翻訳順序情報が、現在の処理単位に係る翻訳結果が後に置かれることが不可であることを示す場合、現在の翻訳結果の後に、前記バッファにためられた以前の処理単位に係る翻訳結果を追加して目的言語テキストを生成する手段を含む、
請求項１に記載の機械翻訳装置。
前記処理単位分割部は、直前に処理された処理単位に係る翻訳処理の時刻情報と、現在の処理単位に係る時刻情報との時刻差分情報を閾値と比較して時間遅延が発生したことを判断することにより、前記時刻差分情報が前記閾値を超える場合、前記翻訳順序情報を、翻訳結果の順序を変更しないように修正する手段をさらに含む、
請求項３に記載の機械翻訳装置。
前記構文情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、請求項３または請求項４に記載の機械翻訳装置。
前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、
前記翻訳制御部は、
前記翻訳順序情報が、処理単位の翻訳結果の順序が変更可能であると示すことに応答して、当該処理単位の翻訳結果をバッファにため、
前記処理単位の認識結果に修正がある場合、前記音声認識結果修正部によって修正された原言語テキストを翻訳し、修正された翻訳結果で前記バッファの内容を置き換え、
現在の処理単位に係る翻訳結果に前記修正された翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、
請求項３乃至５のいずれか一項に記載の機械翻訳装置。
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、
を備えた、コンピュータが実行する機械翻訳方法。
機械翻訳装置に、
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラム。