JP4113204B2

JP4113204B2 - 機械翻訳装置、その方法およびプログラム

Info

Publication number: JP4113204B2
Application number: JP2005183421A
Authority: JP
Inventors: 昌明永田; 邦子齋藤
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2005-06-23
Filing date: 2005-06-23
Publication date: 2008-07-09
Anticipated expiration: 2025-06-23
Also published as: JP2007004446A

Description

本発明は、第１の言語（原言語）の文を該第１の言語とは別の第２の言語（目的言語）の文に翻訳する機械翻訳技術、特に入力された原言語の文を句に分割し、各々の句の対訳となる目的言語の句を列挙し、これを並べ替えることにより目的言語の文を生成する機械翻訳装置において、原言語における句の並びと目的言語における句の並びとの対応関係の確率モデルを用いることにより、目的言語の句の並びをより自然かつ文法的に正しい順とする機械翻訳技術に関するものである。

近年、対訳コーパスから翻訳モデルを学習することで統計的に翻訳を行う統計的機械翻訳（統計翻訳）についての研究が盛んに行われている。辞書や規則を人手で作成する従来の方法に比べて、統計的機械翻訳は、対訳コーパスさえあれば、短期間に低コストで機械翻訳システムを作成できるという利点がある。

統計的機械翻訳は、１９９０年代前半にＩＢＭ研究所においてその基礎が確立された。当時ＩＢＭで考案された翻訳モデルは、単語を翻訳の基本単位としており、一般に「ＩＢＭ翻訳モデル」と呼ばれる。ＩＢＭ翻訳モデルは、特許文献１に詳しく述べられている。

また、統計的機械翻訳では、原言語の文を目的言語への翻訳することを「デコーディング」と呼び、翻訳を実行するプログラムのことを「デコーダ」と呼ぶ。ＩＢＭモデルに基づく翻訳デコーダについては、特許文献２に詳しく述べられている。

近年、単語を翻訳の基本単位とするＩＢＭモデルに対して、１つの単語もしくは２つ以上の連続する単語からなる単語列、即ち句（ｐｈｒａｓｅ）を翻訳の基本単位とする「句に基づく翻訳モデル」が幾つか提案された。句に基づく翻訳モデルは、単語に基づく翻訳モデルに比べて、文脈に基づく訳語選択や局所的な語の並べ替えを表現する能力が高いため、現在の最も優れた統計翻訳モデルとされている。

句に基づく翻訳モデルとしては、「対応付けテンプレート（ａｌｉｇｎｍｅｎｔｔｅｍｐｌａｔｅ）に基づく翻訳」および「統計的な句に基づく翻訳（ｓｔａｔｉｓｔｉｃａｌｐｈｒａｓｅ−ｂａｓｅｄｔｒａｎｓｌａｔｉｏｎ）」が代表的である。

対応付けテンプレートに基づく翻訳は、ドイツのアーヘン工業大学において考案されたもので、非特許文献１に詳しく述べられている。また、統計的な句に基づく翻訳は、米国の南カリフォルニア大学情報科学研究所において考案されたもので、非特許文献２に詳しく述べられている。

ここでは、現在、最も翻訳の精度が高い統計的機械翻訳手法として知られている「統計的な句に基づく翻訳（ｓｔａｔｉｓｔｉｃａｌｐｈｒａｓｅ−ｂａｓｅｄｔｒａｎｓｌａｔｉｏｎ）」について簡単に説明する。

統計的機械翻訳では、原言語ｆが目的言語ｅへ翻訳される確率ｐ（ｅ｜ｆ）を最大とする目的言語の文

を求める。これはベイズの法則によりｐ（ｆ｜ｅ）ｐ（ｅ）を最大化すればよい。

ここで、ｐ（ｅ）を「言語モデル」、ｐ（ｆ｜ｅ）を「翻訳モデル」と呼ぶ。言語モデルは、目的言語の文の尤もらしさを確率として表現するモデルで、一般的には単語ｔｒｉｇｒａｍモデルが用いられる。

統計的な句に基づく翻訳では、翻訳モデルとして次式を使用する。

ここで、

を「句翻訳確率」、ｄ（ａ_i−ｂ_i-1）を「歪み確率」と呼ぶ。

上式においてＩは句の数を表し、原言語の文はＩ個の句の列

に分割される。

は分割されたそれぞれの句、

は

の対訳となる句である。目的言語の文はＩ個の句の列

から構成され、ａ_iは目的言語のｉ番目の句

の左端の単語の位置、ｂ_i-1は目的言語のｉ−１番目の句

の右端の単語の位置を表す。

句翻訳確率は、互いに対訳になっている句（対訳句）の集合を対訳コーパスから統計的な方法で予め求めておき、次式のように、同じ目的言語の句の対訳となる様々な原言語の句の相対頻度から計算する。

歪み確率は、次式によって算出する。ここでαは実験的に決定するパラメータである。

この歪み確率のモデルを図１の例で説明する。ここでは英語から日本語への翻訳の例を考え、原言語の文「ｌａｎｇｕａｇｅｉｓａｍｅａｎｓｏｆｃｏｍｍｕｎｉｃａｔｉｏｎ」が目的言語の文「言話はコミュニケーションの道具である」に翻訳されるとする。例えば、式（４）の指数の肩にある｜α_i−ｂ_i-1−１｜の値を目的言語の３番目の句「の道具」について求めると、この目的言語の句に対応する原言語の句の左端の単語“ａ”の位置は「３」であり、この目的言語の句の直前の句（２番目の句）の右端の単語“ｃｏｍｍｕｎｉｃａｔｉｏｎ”の位置は「６」であるので、｜３−６−１｜＝４となる。

従って、式（４）の歪み確率モデルは、原言話の句と目的言語の句の並びが同じである時に確率が１となり、句の並びの変化が大きければ大きいほど、指数的に小さな確率を割り当てるようになっている。

句に基づく翻訳モデルのもう一つの代表例である翻訳テンプレートに基づく手法において、原言語の句と目的言語の句との対応関係に対して与えられる確率（スコア）も、基本的な考え方は式（４）と同じである。非特許文献１によれば、目的言語のｉ番目の句に対応する原言語の句の最後の単語の位置と、目的言語のｉ−１番目の句に対応する原言語の句の最後の単語の位置との差の絶対値を求め、全ての目的言語の句に関するこの絶対値の総和を対数線形モデルの特徴量とする。
特開平５−１８９４８１号公報（特願平４−１９１７１２号）米国特許第５，５１０，９８１号明細書（１９９６．４．２３）ＦｒａｎｚＪｏｓｅｆＯｃｈａｎｄＨｅｒｍａｎｎＮｅｙ，ＴｈｅＡｌｉｇｎｍｅｎｔＴｅｍｐｌａｔｅＡｐｐｒｏａｃｈｔｏＳｔａｔｉｓｔｉｃａｌＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ，ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ，Ｖｏｌ．３０，Ｎｏ．４，２００４ＰｈｉｌｉｐｐＫｏｅｈｎ，ＦｒａｎｚＪｏｓｅｆＯｃｈａｎｄＤａｎｉｅｌＭａｒｃｕ，ＳｔａｔｉｓｔｉｃａｌＰｈｒａｓｅ−ｂａｓｅｄＴｒａｎｓｌａｔｉｏｎ，ＨＬＴ／ＮＡＡＣＬ−２００４，ｐ．１２７−１３３

従来の句に基づく翻訳における歪み確率のモデルでは、句の並べ替えにおいて、目的言語において隣り合う２つの句に対応する原言語の２つの句の相対的な距離の絶対値しか考慮しない。

例えば、英語は主語・動詞・目的語という語順が基本であり、日本語は主語・目的語・動詞という語順が基本であるので、動詞を含む句と目的語となる名詞を含む句は、英語と日本語では逆順になるが、従来の句に基づく翻訳における歪み確率モデルには、句の種類や正順・逆順という概念はない。

これは従来の統計翻訳の研究が、英語とフランス語の翻訳や英語とドイツ語の翻訳のように、語順が比較的近い言語間の翻訳を対象としており、「原言語と目的言語の句の並びはほとんど同じであり、句の順番を大きく並び替えることに対してペナルティを与えればよい」という非常に単純な発想に基づいて、歪み確率モデルが設計されているためだと考えられる。

従って、従来の句に基づく翻訳における歪み確率モデルは、日本語と英語のような語順が大きく異なる言語間の翻訳にみられる大局的かつ規則的な語句の並び替えを表現する能力が低く、文法的に正しく自然な語順の目的言語の文を生成することが難しいという問題があった。

本発明は、このような事情に鑑みてなされたものであり、原言語から目的言語への翻訳において、句を構成する単語の表記や品詞の情報に基づいて句を分類し、句の並べ替えにおいて句の距離だけでなく正順と逆順を区別するような歪み確率モデル使用することにより、より文法的に正しく自然な語順を有する目的言語の文を生成できる機械翻訳装置を提供することを目的とする。

図２は本発明の機械翻訳装置の原理構成図である。

本発明の機械翻訳装置は、
原言語の句とこれに対応する目的言語の句を多数記憶するとともに、互いに対訳になっている原言語の句と目的言語の句との組について、目的言語の句が原言語の句へ翻訳される確率を求める句翻訳モデル（句翻訳確率計算手段）１と、
原言語の句と目的言語の句との対応関係の尤もらしさを示す歪み確率を、目的言語の隣り合う２つの句に対応する原言語の２つの句の距離の情報とともに少なくとも前後関係の情報を用いて求める歪みモデル（歪み確率計算手段）２と、
目的言語の任意の単語列が生成される確率を求める言語モデル（言語確率計算手段）３と、
入力された原言語の文（品詞付き単語列）を句に分割し、各々の句の対訳となる目的言語の句を句翻訳モデル１から検索し、該検索した目的言語の句を並べ替えることにより目的言語の文を作成し、該作成した目的言語の文の中で、句翻訳モデル１により求められる句翻訳確率と、歪みモデル２により求められる歪み確率と、言語モデル３により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーダ（翻訳デコーディング手段）４と、
を備える。

図３は本発明の機械翻訳装置の原理を説明するためのフローチャートである。

本発明の機械翻訳装置は、翻訳デコーダ４において、まず、図示しないキーボード等から直接入力され又は記憶媒体から読み出されて入力され又は通信媒体を介して他の装置等から入力された原言語の文を句に分割し、全ての句についてその対訳となる目的言語の句を句翻訳モデル１から検索し、これらをメモリに記録して対訳句テーブル５を作成する（ステップｓ１）。

図４は対訳句テーブル５の一例、ここでは図１の翻訳例に対応した例を示すものである。図示するように、原言語の各々の句に対して、一つまたは複数の目的言語の句が列挙される。

以降、この対訳句テーブル５の要素を参照しながら、原言語の文から句を１つ選択し、その対訳となる句を用いて、目的言語の文を左から右へ句を１つ接続するという操作を繰り返すことにより、目的言語の文を作成する。この処理過程の途中の状態を「仮説」と呼び、該仮説は、原言語の文において既に選択された句、選択された句の対訳を接続して生成した目的言語の文、原言語の句と目的言語の句との対応関係などを含む。

まず、初期仮説として、原言語の文において句は全く選択されておらず、かつ、目的言語の文が空集合（φ）である状態の仮説を作成し、これを仮説スタック（ＦＩＦＯメモリ）６に格納する（ステップｓ２）。

次に、仮説スタック６内に仮説がまだあるかどうかを調べる（ステップｓ３）。もし仮説が残っていなければ探索を終了し、翻訳に失敗したことを通知する。もし仮説が残っていれば、次のステップへ進む。

次に、仮説スタック６の先頭の仮説を取り出す（ステップｓ４）。

次に、この仮説が目標状態に達しているか否かを調べる（ステップｓ５）。目標状態とは、原言語の文のおいて句を選択することにより、原言語の全ての単語が目的言語へ翻訳されている状態である。もし目標状態へ達していれば、翻訳は成功であり、目的言語の文を出力して処理を終了する。もし目標状態へ到達していなければ、次のステップへ進む。

次に、この仮説を対訳句テーブル５の要素を参照して展開し、得られた新たな仮説の集合を仮説スタック６へ入れる（ステップｓ６）。仮説を展開するとは、現在の仮説において、原言語の文の中でまだ翻訳されていない部分から句を一つ選択し、その対訳となる目的言語の句を目的言語の文の末尾に接続することである。原言語の文から句を選択する方法は複数あり得るので、複数の仮説が生成される。

次に、仮説に含まれる、原言語の文から選択された句、その対訳となる目的言語の句を並び替えることにより生成された目的言語の文、および、原言語の句と目的言語の句の対応関係を基に、仮説スタック６内の各仮説が表す翻訳の途中の状態の確率を、句翻訳モデル１と歪みモデル２と言語モデル３とから計算し（ステップｓ７）、仮説スタック６内の仮説を前記確率が大きい順にソートし（ステップｓ８）、ステップｓ３へ戻る。

このような構成になっているので、歪みモデル２において、目的言語の隣り合う２つの句に対応する原言語の２つの句の距離および前後関係の情報、さらには句を構成する単語の表記や品詞の情報を用いて歪み確率を計算することにより、２つの句の距離しか用いない従来の歪みモデルに比べて、目的言語の句の並びがより自然かつ文法的に正しい語順となるような機械翻訳装置を構成できる。

図５に翻訳デコーダ４による動作の一例を示す。この例では「ｌａｎｇｕａｇｅｉｓａｍｅａｎｓｏｆｔｒａｎｓｌａｔｉｏｎ」という英語の文が「言語はコミュニケーションの道具である」という日本語の文に翻訳される様子を示している。原言語（英語）の文と目的言語（日本語）の文を含む長方形の枠が一つの仮説を表す。探索空間を表現する木構造の根にある仮説が初期仮説である。図中、太線の矢印で示される経路により、原言語の文から句が一つずつ選択され、それに対応する日本語の句を末尾に一つずつ連接していくことにより、目的言語の文が生成される様子が分かる。

［作用］
従来の句に基づく翻訳における歪みモデルでは、句の並べ替えにおいて、目的言語において隣り合う２つの句に対応する原言語の２つの句の相対的な距離の絶対値しか考慮しないため、日本語と英語のような語順が大きく異なる言語間の翻訳にみられる大局的かつ規則的な語句の並び替えを表現する能力が低く、文法的に正しく自然な語順の目的言語の文を生成することが難しいという問題があった。

本発明は、歪みモデルにおいて、目的言語の隣り合う２つの句に対応する原言語の２つの句の距離および前後関係情報、さらには句を構成する単語の表記や品詞の情報を用いることにより、２つの句の距離しか用いない従来の歪みモデルに比べて、目的言語の句の並びがより自然かつ文法的に正しい語順となるような機械翻訳を実現できる。

本発明によれば、原言語から目的言語への翻訳において、句を構成する単語の表記や品詞の情報に基づいて句を分類し、句の並べ替えにおいて句の距離だけでなく正順と逆順を区別するような歪みモデル使用することにより、より文法的に正しく自然な語順を有する目的言語の文を生成できる機械翻訳を実現できる。

図６は本発明の機械翻訳装置の実施の形態の一例を示すもので、図中、図２と同一構成部分は同一符号をもって表す。即ち、１は句翻訳モデル（句翻訳確率計算手段）、２は歪みモデル（歪み確率計算手段）、３は言語モデル（言語確率計算手段）、４は翻訳デコーダ（翻訳デコーディング手段）、７は品詞付与手段、１１は対訳コーパス、１２は句対応付け手段、１３は句対応付き対訳コーパス、１４は原言語品詞付与手段、１５は目的言語品詞付与手段、１６は句対応・品詞付き対訳コーパス、１７は歪みモデル学習手段である。

以下、図６を参照して、この発明の実施の形態の一例について説明する。

＜句翻訳モデルと言語モデル＞
本発明の実施の形態の一例における句翻訳モデル１は、従来の「統計的な句に基づく翻訳」と同じである。即ち、互いに対訳になっている原言語と目的言語の句を対訳コーパス１１から自動的に抽出し、同じ目的言語の句の対訳となる原言語の句の相対頻度を句翻訳確率とする。

このために、まず原言語から目的言語、目的言語から原言語の両方向について、ＩＢＭ翻訳モデルを用いて対訳文の単語対応を求める。ここで、二つの単語対応付けの積集合（ｉｎｔｅｒｓｅｃｔｉｏｎ）と和集合（ｕｎｉｏｎ）を考えると、両方向で一致している積集合の要素はより信頼できる対応付けである。そこで、積集合の対応点を起点にその近傍の和集合の対応点を加えて対訳句を作る。必要ならば、句が文を矛盾なく覆うという条件の下で、和集合に含まれていない近傍の単語対応をさらに加えて対訳句を作成する。

この対訳句の抽出法および句翻訳確率の計算法については、非特許文献２に詳しく述べられている。

図７に句翻訳モデルの一例を示す。各行が一つの対訳句を表し、一つのレコードは‘｜’で区切られおり、それぞれ、原言語の句、目的言語の句、目的言語から原言語への翻訳確率を表す。

一方、本発明の実施の形態の一例における言語モデル３は、単語ｔｒｉｇｒａｍモデルである。この単語ｔｒｉｇｒａｍモデルは、対訳コーパス１１における目的言語の文から作成してもよいし、他の目的言語のコーパスから作成してもよい。

＜歪みモデル＞
本発明の実施の形態の一例における歪みモデル２は、図６に示すように、対訳コーパス１１と句翻訳モデル１から作成する。

まず対訳コーパス１１の各対訳文に対して、句対応付け手段１２を用いて、句対応を求める。句対応とは、図１に示されているような、原言語の句と目的言語の句の対応のことである。句対応付け手段１２は、句翻訳モデル１を用いて、目的言語の句が原言語の句へ翻訳される確率の全ての句に関する積が最大となるような句対応（Ｖｉｔｅｒｂｉ対応）を動的計画法により求める。

こうして作成した句対応付き対訳コーパス１３に対して、原言語品詞付与手段１４および目的言語品詞付与手段１５を用いて各文に品詞を付与し、句対応・品詞付き対訳コーパス１６を作成する。この句対応・品詞付き対訳コーパス１６から歪みモデル学習手段１７を用いて歪みモデルを学習する。

こうして対訳コーパス１１に対して、句の対応と品詞を付与することにより、目的言語の隣り合う２つの句に対応する原言語の２つの句の距離、前後関係、句を構成する単語の表記・品詞など、様々な情報を利用した歪みモデル２を、相対頻度法により推定することができる。

本発明の実施の形態の一例の歪みモデルでは、目的言語の隣り合う２つの句の後方の句に対応する原言語の句の先頭の単語の品詞を考慮する。また、目的言語の隣り合う２つの句に対応する原言語の２つの句の状態を、以下のような正順（間隙なし）、正順（間隙あり）、逆順（間隙なし）、逆順（間隙あり）の４つの場合に分ける。
・正順（間隙なし）：対応する原言語の２つの句は、目的言語の句と同じ順番で、かつ、連接している。
・正順（間隙あり）：対応する原言語の２つの句は、目的言語の句と同じ順番で、かつ、連接していない。
・逆順（間隙なし）：対応する原言語の２つの句は、目的言語の句とは反対の順番で、かつ、連接している。
・逆順（間隙あり）：対応する原言語の２つの句は、目的言語の句とは反対の順番で、かつ、連接していない。

図８に歪みモデルの一例を示す。各行が一つのレコードを表し、データは‘｜’で区切られている。先頭からそれぞれ、原言語の句の先頭の単語の品詞（図中、ＤＴは冠詞、ＥＸは存在のthrer、ＦＷは外来語）、上記の４つの状態（正順／逆順、間隙あり／なし）、その確率（ｅ−０５は×１０^-5の意）を表している。ここで、正順（間隙なし）、正順（間隙あり）、逆順（間隙なし）、逆順（間隙あり）は、それぞれ「１」、「２」、「−１」、「−２」で表されている。

＜翻訳デコーダの動作＞
本発明の実施の形態の一例において、原言語の文を翻訳する際には、図６に示すように、まず品詞付与手段７により、入力文の各単語に品詞を付与する。この品詞付き単語列を入力として、翻訳デコーダ４は、句翻訳モデル１、歪みモデル２、言語モデル３を用いて、図３で説明したような流れに従い、句翻訳確率と歪み確率と言語モデル確率と積が最大となるような目的言語の文を出力する。

従来の機械翻訳手法における歪みモデルの説明図本発明の機械翻訳装置の原理構成図本発明の機械翻訳装置の原理を説明するためのフローチャート対訳句テーブルの一例を示す説明図翻訳デコーダによる動作の一例を示す説明図本発明の機械翻訳装置の実施の形態の一例を示す構成図句翻訳モデルの一例を示す説明図歪みモデルの一例を示す説明図

符号の説明

１：句翻訳モデル（句翻訳確率計算手段）、２：歪みモデル（歪み確率計算手段）、３：言語モデル（言語確率計算手段）、４：翻訳デコーダ（翻訳デコーディング手段）、５：対訳句テーブル、６：仮説スタック（ＦＩＦＯメモリ）、７：品詞付与手段、１１：対訳コーパス、１２：句対応付け手段、１３：句対応付き対訳コーパス、１４：原言語品詞付与手段、１５：目的言語品詞付与手段、１６：句対応・品詞付き対訳コーパス、１７：歪みモデル学習手段。

Claims

第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する機械翻訳装置であって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報とともに少なくとも第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーディング手段とを備えた
ことを特徴とする機械翻訳装置。
第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する機械翻訳装置であって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の表記の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーディング手段とを備えた
ことを特徴とする機械翻訳装置。
第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する機械翻訳装置であって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の品詞の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第１の言語の文の各単語に品詞を付与する品詞付与手段と、
前記各単語に品詞が付与された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する翻訳デコーディング手段とを備えた
ことを特徴とする機械翻訳装置。
コンピュータを用いて第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する方法であって、
コンピュータは、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報とともに少なくとも第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備え、
前記コンピュータが、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する
ことを特徴とする機械翻訳方法。
コンピュータを用いて第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する方法であって、
コンピュータは、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の表記の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備え、
前記コンピュータが、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する
ことを特徴とする機械翻訳方法。
コンピュータを用いて第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳する方法であって、
コンピュータは、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の品詞の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第１の言語の文の各単語に品詞を付与する品詞付与手段とを備え、
前記コンピュータが、
前記各単語に品詞が付与された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索し、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成し、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力する
ことを特徴とする機械翻訳方法。
コンピュータに第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳させるプログラムであって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報とともに少なくとも第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備えたコンピュータに、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索するステップと、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成するステップと、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力するステップとを実行させる
ことを特徴とする機械翻訳プログラム。
コンピュータに第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳させるプログラムであって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の表記の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段とを備えたコンピュータに、
入力された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索するステップと、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成するステップと、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力するステップとを実行させる
ことを特徴とする機械翻訳プログラム。
コンピュータに第１の言語の文を該第１の言語とは別の第２の言語の文に翻訳させるプログラムであって、
第１の言語の句とこれに対応する第２の言語の句を複数記憶するとともに、互いに対訳になっている第１の言語の句と第２の言語の句との組について、第２の言語の句が第１の言語の句へ翻訳される確率を求める句翻訳確率計算手段と、
第１の言語の句と第２の言語の句との対応関係の尤もらしさを示す歪み確率を、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の距離の情報、第２の言語の隣り合う２つの句に対応する第１の言語の２つの句の前後関係の情報および第１の言語または第２の言語のいずれか一方もしくは両方における句を構成する単語のうちの少なくとも１つの単語の品詞の情報を用いて求める歪み確率計算手段と、
第２の言語の任意の単語列が生成される確率を求める言語確率計算手段と、
入力された第１の言語の文の各単語に品詞を付与する品詞付与手段とを備えたコンピュータに、
前記各単語に品詞が付与された第１の言語の文を句に分割し、各々の句の対訳となる第２の言語の句を前記句翻訳確率計算手段から検索するステップと、
該検索した第２の言語の句を並べ替えることにより第２の言語の文を作成するステップと、
該作成した第２の言語の文の中で、前記句翻訳確率計算手段により求められる句翻訳確率と、前記歪み確率計算手段により求められる歪み確率と、前記言語確率計算手段により求められる言語確率との積が最大となる文を求め、翻訳結果として出力するステップとを実行させる
ことを特徴とする機械翻訳プログラム。