JP6058513B2

JP6058513B2 - 語順並び替え装置、翻訳装置、方法、及びプログラム

Info

Publication number: JP6058513B2
Application number: JP2013206589A
Authority: JP
Inventors: 林　克彦; 克彦林; 克仁須藤; 塚田　元; 元塚田; 鈴木　潤; 潤鈴木; 永田　昌明; 昌明永田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2013-10-01
Filing date: 2013-10-01
Publication date: 2017-01-11
Anticipated expiration: 2033-10-01
Also published as: JP2015072509A

Description

本発明は、語順並び替え装置、翻訳装置、方法、及びプログラムに係り、特に、入力文の語順を並び替える語順並び替え装置、翻訳装置、方法、及びプログラムに関する。

統計的機械翻訳の分野では、日本語と英語のように文の構文構造が異なる言語間での翻訳性能改善が大きな課題となっている。これらの言語対において翻訳性能を劣化させる主な要因は、入力言語文と出力言語文の単語の並びが大きく異なるために生じる長距離の単語並び替え現象にある。

この長距離の単語並び替え問題を効率的に解くため、後単語並び替え手法が提案されている（非特許文献１）。後単語並び替え手法とは、まず機械翻訳装置によって入力言語語順の翻訳結果を出力した後に、独立して単語並び替えを行う技術である。図１３に後単語並び替えによる機械翻訳方式の概念図を示す。

後単語並び替えによる機械翻訳方式では機械翻訳装置と単語並び替え（及び編集）装置で用いるモデルを統計的に学習するためのデータが必要となる。ここで必要となるデータとは、入力言語文と同じ語順となった出力言語文（中間言語文）、及び中間言語文から元の出力言語文を復元するための重要な情報を持つ中間言語構造（中間言語木）のことを指す。非特許文献１の手法において中間言語木は必要ないが、別の手法ではそれを利用することが翻訳性能向上に有効であることが示されている（非特許文献２）。

図３では英語文「I saw a girl with a telescope」と日本語文「私は望遠鏡で少女を見た」を対訳文とした中間言語（英語）データ作成の例を示している。図３の左図に示すように、まず英語文の構文構造（構文木）を自動構文解析装置によって作成する。この木では単語の上には品詞タグが付与され、例えば、「I」という単語には「N」という品詞タグが割り当てられている。品詞タグ「N」には単語「I」が主辞として付与される。品詞タグを付与する文法規則は「N→I」のように表記する。品詞タグよりも上の層では、非終端記号によって、１つ、ないしは２つの品詞または非終端記号が結合されていくことで木構造を形成する。例えば、V(saw)とNP(girl)がまとまりVP(saw)へと結合されている。このようにまとめる文法規則は「VP→V NP」として表記する。

次に、非特許文献３で提案されたルールに基づく手法をその構文木に適用することで、図３の右図に示すような日本語語順の英語文(中間英語文)及び中間英語木を作成する。この手法では図３の左図の木における非終端記号に付随する主辞を必ず後ろにするという操作を行う。例えば、図３の左図のPP(with)→PR(with)NP(telescope)の辺では、PPの主辞となる「with」は「telescope」の前に位置するが、図３の右図ではPP^#→N(telescope)^"a/an"PR(with)のように「with」は「telescope」の後ろに位置する。#は並び替えが行われることを意味するマーキングである。このような変換は日本語が厳密な主辞終端の原則に基づいた構文構造をとるためである。ちなみに上記図３の右図からNP(telescope)→N(telescope)のような単一規則は全て除去している。これは自動構文解析装置を効率化するためであり、よく使われる手段である。また、中間英語文からは冠詞(the、a、an)が消去されており、逆に、日本語の助詞(が、は、を)が挿入されているが、これらは日本語文との単語対応をとりやすくするための操作である。削除された冠詞はそれが先頭に挿入される句を表す品詞ないしは非終端記号にマーキングする。例えば、N(telescope)^"a/an"である。

後単語並び替えによる機械翻訳方式によって日本語から英語への翻訳を行う場合、まず機械翻訳装置によって日本語文を中間英語文へと翻訳する。この機械翻訳装置は句に基づいた統計的機械翻訳手法（非特許文献４）により、日本語文と中間英語文が対となった大量の対訳データから統計的にモデルを学習することで作成することができる。

後単語並び替え手法は、機械翻訳装置によって出力された中間英語文に対して、単語並び替え及び編集を行うことで、英語文を作成するための方法である。非特許文献２の方法ではまず上記図３の右図で示したような中間英語木から自動構文解析装置のモデルを統計的に学習しておく。そして、そのモデルに基づいて、自動構文解析装置は翻訳装置が出力した中間英語文に対して中間英語木を自動推定し、その中間英語木から英語文の単語並びを復元する。また、非特許文献２の方法では削除した冠詞を英語文へと挿入するため、N-gram言語モデルによる編集装置も提案している。非特許文献２の手法は非特許文献１の後単語並び替え手法よりも高い性能を示すことが報告されている。

Katsuhito Sudoh, Xianchao Wu, Kevin Duh, Hajime Tsukada, and Masaaki Nagata. Postordering in statistical machine translation. In Proc. MT Summit, 2011. Isao Goto, Masao Utiyama, and Eiichiro Sumita. Post-ordering by parsing for japaneseenglish statistical machine translation. In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics, pages 311−316, 2012. Hideki Isozaki, Katsuhito Sudoh, Hajime Tsukada, and Kevin Duh. Head finalization: A simple reordering rule for sov languages. In Proceedings of the Joint Fifth Workshop on Statistical Machine Translation and MetricsMATR, pages 244−251, 2010. Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico,Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, et al. Moses:Open source toolkit for statistical machine translation. In Proceedings of the 45th Annual Meeting of the ACL on Interactive Poster and Demonstration Sessions, pages 177−180,2007.

非特許文献２で提案された後単語並び替え及び編集手法では単語並び替えを行うための自動構文解析装置としてチャート型の構文解析装置を利用している。この装置は入力文長ｎに対してО(ｎ^３)相当の計算量を必要とする。さらにその後、冠詞挿入を行うために、N-gram言語モデルによる編集装置を動作させる必要があり、これら一連の処理は多くの計算時間を必要とするという問題がある。

一般にチャート型の構文解析装置では解析時に用いる情報を増やす程、その計算量に影響を与えることが知られている。チャート型の構文解析装置では冠詞挿入の処理を構文解析と同時に扱うことは自明ではなく、仮に同時に扱う手法を提案したとしても、計算量はＯ(ｎ^３)より大きくなる。また、非特許文献２に記載のチャート型自動構文解析装置が用いる統計モデルでは、単語並び替えを行うために効果的な特徴量(素性)を定義することが原理的に困難であるという問題がある。これらの素性を定義する場合、冠詞挿入の問題と同様に計算量Ｏ(ｎ^３)はさらに増加するという問題がある。

本発明では、上記問題点を解決するために成されたものであり、計算量の増大を抑制して、入力文の語順を並べ替えることできる語順並び替え装置、翻訳装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係る語順並び替え装置は、第１言語の語順に並んだ第１言語とは異なる第２言語で記述された入力文に含まれる各単語を格納したバッファと、少なくとも１つの単語の形態素解析結果を表す部分解析木を格納するための少なくとも１つの要素からなるスタックと、前記バッファに格納された先頭の単語を取り出し、前記取り出した単語の形態素解析結果を表す部分解析木を格納した要素を、前記スタックの先頭要素として追加するシフトアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素及び２番目の要素の各々に格納された前記部分解析木を結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースアクションを含む複数のアクションを用いて形成されるアクションの列のうち、初期状態から、前記入力文の形態素解析結果を表す解析木が前記スタックの先頭要素に格納された最終状態までの各状態遷移に対応する前記アクションからなるアクションの列であって、各状態遷移について、遷移前の状態における前記スタックの各要素及び前記バッファの各単語と前記アクションとの組み合わせと、前記アクションを決定するための予め求められたモデルとに基づいて算出されるスコアの合計が最大となるアクションの列を探索する探索部と、前記探索部によって探索されたアクションの列に従って前記最終状態で作成される、前記入力文の形態素解析結果を表す解析木を用いて、前記入力文に含まれる各単語を、前記第２言語の語順に並び替える並び替え部と、を含んで構成されている。

第２の発明に係る語順並び替え方法は、第１言語の語順に並んだ第１言語とは異なる第２言語で記述された入力文に含まれる各単語を格納したバッファと、少なくとも１つの単語の形態素解析結果を表す部分解析木を格納するための少なくとも１つの要素からなるスタックと、探索部と、並び替え部とを含む語順並び替え装置の語順並び替え方法であって、前記探索部は、前記バッファに格納された先頭の単語を取り出し、前記取り出した単語の形態素解析結果を表す部分解析木を格納した要素を、前記スタックの先頭要素として追加するシフトアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素及び２番目の要素の各々に格納された前記部分解析木を結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースアクションを含む複数のアクションを用いて形成されるアクションの列のうち、初期状態から、前記入力文の形態素解析結果を表す解析木が前記スタックの先頭要素に格納された最終状態までの各状態遷移に対応する前記アクションからなるアクションの列であって、各状態遷移について、遷移前の状態における前記スタックの各要素及び前記バッファの各単語と前記アクションとの組み合わせと、前記アクションを決定するための予め求められたモデルとに基づいて算出されるスコアの合計が最大となるアクションの列を探索するステップと、前記並び替え部は、前記探索部によって探索されたアクションの列に従って前記最終状態で作成される、前記入力文の形態素解析結果を表す解析木を用いて、前記入力文に含まれる各単語を、前記第２言語の語順に並び替えるステップと、を含む。

第１の発明及び第２の発明によれば、探索部によりアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションからなるアクションの列を探索し、並び替え部により探索されたアクションの列に従って入力文に含まれる各単語を並び替える。

このように、第１の発明及び第２の発明によれば、シフトアクション及びレデュースアクションを含む複数のアクションで形成されるアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションからなるアクションの列であって、アクションを決定するための予め求められたモデルに基づいて算出されるスコアの合計が最大となるアクションの列を探索し、探索されたアクションの列に従って入力文に含まれる各単語を並び替えることにより、計算量の増大を抑制して、入力文の語順を並び替えることができる。

また、第１の発明において、前記レデュースアクションは、前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素に格納された前記部分解析木を右側とし、取り出した２番目の要素に格納された前記部分解析木を左側として結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースＭＲアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素に格納された前記部分解析木を左側とし、取り出した２番目の要素に格納された前記部分解析木を右側として結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースＳＲアクションを含んでもよい。

また、第１の発明において、前記複数のアクションは、前記スタックの先頭要素に格納されている前記部分解析木に対応する前記少なくとも１つの単語の先頭に冠詞を挿入するように、前記部分解析木を更新する挿入アクション、及び前記スタックの先頭要素に格納されている前記部分解析木に対応する前記少なくとも１つの単語の先頭に冠詞を挿入しないことを示す情報を挿入するように、前記部分解析木を更新する挿入アクションを更に含んでもよい。

第３の発明に係る翻訳装置は、前記第１言語で記述された入力文を、前記第２言語で記述された文に翻訳する翻訳装置において、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するための予め学習された翻訳モデルに基づいて、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳する翻訳部と、請求項１〜請求項３の何れか１項記載の語順並び替え装置と、を含んで構成され、前記語順並び替え装置は、前記翻訳部によって翻訳された、前記第１言語の語順に並んだ前記第２言語で記述された文を、前記第２言語の語順に並び替える。

第４の発明に係る翻訳方法は、翻訳部と、語順並び替え装置とを含み、前記第１言語で記述された入力文を、前記第２言語で記述された文に翻訳する翻訳装置の翻訳方法であって、前記翻訳部は、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するための予め学習された翻訳モデルに基づいて、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するステップと、上記第２の発明に係る語順並び替え方法の各ステップと、を含み、前記語順並び替え方法は、前記翻訳部によって翻訳された、前記第１言語の語順に並んだ前記第２言語で記述された文を、前記第２言語の語順に並び替える。

第３の発明及び第４の発明によれば、第１言語で記述された入力文を、第１言語の語順に並んだ第２言語で記述された文に翻訳し、シフトアクション及びレデュースアクションを含む複数のアクションで形成されるアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションからなるアクションの列であって、アクションを決定するための予め求められたモデルに基づいて算出されるスコアの合計が最大となるアクションの列を探索し、探索されたアクションの列に従って、第１言語の語順に並んだ第２言語で記述された文を並び替えることにより、計算量の増大を抑制して、入力文の翻訳を行うことができる。

また、本発明のプログラムは、コンピュータを、上記の語順並び替え装置、又は翻訳装置を構成する各部として機能させるためのプログラムである。

以上説明したように、本発明の語順並び替え装置、方法、及びプログラムによれば、シフトアクション及びレデュースアクションを含む複数のアクションで形成されるアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションからなるアクションの列であって、アクションを決定するための予め求められたモデルに基づいて算出されるスコアの合計が最大となるアクションの列を探索し、探索されたアクションの列に従って入力文に含まれる各単語を並び替えることにより、計算量の増大を抑制して、入力文の語順を並び替えることができる。

また、本発明の翻訳装置、方法、及びプログラムによれば、第１言語で記述された入力文を、第１言語の語順に並んだ第２言語で記述された文に翻訳し、シフトアクション及びレデュースアクションを含む複数のアクションで形成されるアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションからなるアクションの列であって、アクションを決定するための予め求められたモデルに基づいて算出されるスコアの合計が最大となるアクションの列を探索し、探索されたアクションの列に従って、第１言語の語順に並んだ第２言語で記述された文を並び替えることにより、計算量の増大を抑制して、入力文の翻訳を行うことができる。

バッファの例を示す図である。スタックの例を示す図である。中間英語データ作成の例を示す図である。素性テンプレートの例を示す図である。本発明の実施の形態に係るモデル学習装置の機能的構成を示すブロック図である。本発明の実施の形態に係る翻訳装置の機能的構成を示すブロック図である。本発明の実施の形態に係るモデル学習装置におけるモデル学習処理ルーチンを示すフローチャート図である。本発明の実施の形態に係る翻訳処理ルーチンを示すフローチャート図である。７単語からなる日本語入力文の例を示す図である。日本語語順の中間英語文の例を示す図である。中間英語文から英語出力文が作成された例を示す図である。アクションによる状態の遷移の例を示す図である。後単語並び替えによる機械翻訳方式の概念図である。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜発明の概要＞
本実施の形態におけるシフトレデュース型の語順並び替え方法を用いた翻訳装置は、入力として図１に示すようなバッファを用いて、図２に示すようなスタックに部分解析結果を保持する。また、解析はアクション定義、統計的に学習されたモデル、文法に従って進められる。

シフトレデュース型の語順並び替え方法は状態とアクションという概念を用いることで単語並び替え及び編集処理を進める。この装置は初期状態からステップごとに１つアクションを選択して次の状態へと遷移し、最終状態に至ると解析が完了する。

状態はスタックデータ構造をもち、解析の途中結果をそこに保持する。本実施の形態においては、アクションとしてシフトアクション、挿入アクション、レデュースアクション×２の計４種類のアクションを定義する。シフトアクションとは入力文が積まれたバッファから先頭の単語を取り出し、スタックの先頭へと積む操作である。挿入アクションはスタック先頭要素における部分解析木が覆う単語列の先頭に冠詞を挿入する操作である。レデュースアクションはスタック先頭と２番目要素の部分解析木を結合することでより大きな部分解析木を作る操作である。２種類のレデュースアクションは、２つの部分解析木を並び替えて結合する、または、２つの部分解析木を並び替えないで結合する、という違いを持つ。

ある状態において選択可能なアクションが複数ある場合があり、適切なアクションを選択するために統計モデルを導入する。統計モデルを用いたアクションの選択では、ある状態が持つ部分解析情報から抽出できる素性(特徴量)ベクトルと重みベクトルの内積からスコアを計算する。また、状態、アクション、モデル、素性、及び、それらに付随する必要概念を以下に定義する。

＜状態＞
状態は、

として定義される。ここでｌはステップ数を表す。Ｓはスタックを表す。スタックはその要素ｓ_０，ｓ_１，…を持つ。各スタック要素は部分解析結果となる。ｉはスタック先頭要素ｓ_０の部分解析結果のスパンの左端である。ｊは入力文を積んだバッファの先頭単語の位置を示す。よって、スタック要素ｓ_０のスパンはｉからｊ−１までである。πは予測前状態へのポインタ集合であり、その概念は非特許文献５の方法と同じものである（非特許文献５：Liang Huang and Kenji Sagae. Dynamic programming for linear-time incremental parsing. In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics,pages 1077−1086, 2010.）。

初期状態ｐ_ｓは、

として定義される。ここで、＜ｓ＞は入力文頭に慣習的につける仮想単語とする。また最終状態ｐ_ｔは、

として定義される。ここで、ｍは最終状態に至るまでのステップ回数、ｎは入力文長である。スタック先頭要素ｓ_０は、上記図３の右図で示したような完全な中間英語木となっている。

＜スタック要素の情報＞
各スタック要素は、上記図３の右図で示したような完全な中間英語木を作るための部分解析木を保持する。また、スタック要素ｓは、定義上は最低限度の情報として下記（４）式が表わす要素を持つとする。

ここでＨとはこのスタック要素ｓが持つ部分解析木のルートにある非終端記号または単語の品詞ラベルである。ｈはＨに付随して付けられる主辞単語である。ａは「“the”」、「“a/an”」、「“no articles”」、又はnullが割り当てられる変数を示している。ｗ_leftとｗ_rightは部分解析木が覆う単語列の左端と右端単語をそれぞれ示す。スタック要素ｓのある要素＊を参照する場合、s.＊という記法を用いる。

＜シフトアクション＞
シフトアクションは、バッファの先頭単語を取り出し、スタックに積み、その単語に品詞を割り当てることにより、取り出した単語の形態素解析結果を表す部分解析木を格納した要素を、スタックの先頭要素として追加する操作を行う。下記（５）式は前状態ｐに対して、シフトアクションを適用した際に、次の状態へと進むことを自然演繹法の推論規則で表している。

ここで、ｓ_０は｛Ｘ，ｊ，ｗ_ｊ，ｗ_ｊ，null｝となり、単語ｗ_ｊに品詞Ｘが割り当てられたことを意味する。

＜挿入アクション＞
挿入アクションは、現在の状態が持つスタック先頭要素の部分解析木が覆う単語列の先頭に「“the”」、「“a/an”」、又は「“no articles”」のいずれかを挿入するように、スタックの先頭要素に格納されている部分解析木を更新する操作であり、下記（６）式により表される。なお、「“the”」を挿入する操作、「“a/an”」を挿入する操作、及び「“no articles”」を挿入する操作の各々が別々の挿入アクションとなる。また、「“no articles”」を挿入する操作に対応する挿入アクションが、スタックの先頭要素に格納されている部分解析木に対応する少なくとも１つの単語の先頭に冠詞を挿入しないことを示す情報を挿入するように、部分解析木を更新する挿入アクションの一例である。

ここで、ｓ'_０は｛Ｘ，ｈ，ｗ_ｌｅｆｔ，ｗ_{ｒｉｇｈｔ}，ａ｝であり、ｓ'_０は｛Ｘ，ｈ，ｗ_ｌｅｆｔ，ｗ_{ｒｉｇｈｔ}，ｘ｝（ｉ≦ｈ，ｌｅｆｔ，ｒｉｇｈｔ＜ｊ）であり、Ｉは冠詞が挿入される候補となる品詞ラベル又は非終端記号の集合となる。このアクションを適用するためには条件ｓ'_０．Ｘ∈Ｉ∧（ｓ'_０．ａ≠“ｔｈｅ”∧ｓ'_０．ａ≠“ａ／ａｎ”）を満たす必要がある。これは同じ位置に冠詞を２回以上挿入することを防ぐためである。

＜レデュースアクション＞
レデュースアクションは、レデュースＭＲアクションとレデュースＳＲアクションの２種類を定義する。これらの推論規則は下記（７）式で同一に表記できる。

ここで、ｓ'_０は｛Ｚ，ｈ_０，ｗ_{ｌｅｆｔ０}，ｗ_{ｒｉｇｈｔ０}，ａ_０｝、ｓ'_１は｛Ｙ，ｈ_１，ｗ_{ｌｅｆｔ１}，ｗ_{ｒｉｇｈｔ１}，ａ_１｝とする。レデュースアクションはｓ'_０とｓ'_１とを文法規則Ｘ→ＹＺによって結合し、新たなスタック要素ｓ_０を作りだす。

レデュースＭＲアクションとレデュースＳＲアクションの違いはｓ_０の違いにある。レデュースＭＲアクションは、スタックの先頭要素及び２番目の要素を取り出し、下記（８）式に表すような新たなｓ_０を作りだし、スタックの先頭要素として追加する操作である。

上記（８）式に示す要素ｓ_０は、スタックから取り出した先頭要素に格納された部分解析木を右側とし、取り出した２番目の要素に格納された部分解析木を左側として結合して作成される部分解析木を格納した要素である。

ここで、新たな非終端記号Ｘには右側の非終端記号Ｚに付けられた主辞単語ｗ_ｈ０を付ける。これらがＭＲやＳＲのＲ（Ｒｉｇｈｔ）の命名由来である。レデュースＭＲアクションは非終端記号ＹとＺがカバーする２つの句をそのままの並びで結合する。よって、新たにできる非終端記号Ｘがカバーする句の左端はＹの左端の単語ｗ_{ｌｅｆｔ１}となり、右端はＺの右端の単語ｗ_{ｒｉｇｈｔ０}となる。変数ａにはＹの先頭に挿入された冠詞変数ａ_１がセットされる。

レデュースＳＲアクションは、スタックの先頭要素及び２番目の要素を取り出し、レデュースＭＲアクションとは逆に、文法規則Ｘ^＃→ＹＺによってＹとＺの句を並び替えて結合し、下記（９）式に示すような新たなスタック要素ｓ_０を生成し、スタックの先頭要素として追加する操作である。

上記（８）式に示す要素ｓ_０は、取り出した先頭要素に格納された部分解析木を左側とし、取り出した２番目の要素に格納された部分解析木を右側として結合して作成される部分解析木を格納した要素である。

新たに生成される非終端記号Ｘ^＃の左端はＺの左端単語ｗ_{ｌｅｆｔ０}、右端はＹの右端単語ｗ_{ｒｉｇｈｔ１}となる。変数ａはＺの先頭に挿入された冠詞変数ａ_０に設定される。

なお、レデュースＭＲアクション及びレデュースＳＲアクションは、各々、当該アクションにより結合して生成される部分解析木のルートに付与される非終端記号の種類数だけ存在する。

＜モデル＞
入力文ｘに対して作り出せる中間言語木の集合をУとし、ｙ∈Уとなる中間言語木ｙは、下記（１０）式に示すように、状態とアクションのペアの列ａ^ｍ−１ _０に分解できる。

ここで、ｐ_ｍ−１でアクションａ_ｍ−１をとると最終状態になるとする。この分解のもとでУをАとして表し直す（ａ^ｍ−１ _０∈А）。

シフトレデュース型の解析では、ある状態においてとれるアクションそれぞれについて、統計モデルに基づいた優先度スコアを計算する。解析では下記（１１）式及び下記（１２）式に従って、この優先度スコアの合計ができるだけ高くなる、状態とアクションのペアの列＾ｙをАから探索する。

ここで、ｗ＾は重みベクトル、ｆ＾（ｐ，ａ）は素性ベクトルである。ある状態ｐであるアクションａをとる度合いを示す優先度スコアは、重みベクトルｗ＾とｆ＾（ｐ，ａ）の内積から計算される。上記（１２）式で近似となっているのは、実際には優先度スコアの合計が最大となるアクション列ａ^ｍ−１ _０を探索するのではなく、貪欲的（Ｇｒｅｅｄｙ）に探索を行うためである。ここで、素性ベクトルｆ＾（ｐ，ａ）は、後述する素性テンプレートを用いて、素性テンプレートに記載されている各素性を状態ｐについて求めることにより作成する。

＜素性テンプレート＞
図４に本実施の形態において定義した素性テンプレートを示す。素性テンプレートとは、素性ベクトルｆ＾（ｐ，ａ）の特徴を作り出すための雛形である。ある状態ｐは各スタック要素が下記（１３）式からなる情報を持つとする。

ここで、ＬとＲはそれぞれ、非終端記号または品詞タグＨの左と右の子供となる非終端記号または品詞タグである。ｌとｒは、ＬとＲの主辞単語及び品詞の入力文中でのインデックスである。各状態では、スタックの先頭から３つ要素ｓ_０、ｓ_１、ｓ_２を素性の定義に利用している。また、入力文を溜め込んでいるバッファについては先頭から２つの要素ｑ_０、ｑ_１を素性の定義に利用している。また、○は組み合わせ素性を表現している。図４の下２カラムが非局所素性と呼ばれる素性であり、従来のチャート型自動構文解析装置では定義することが難しい素性である。

＜モデルの学習＞
モデルの学習は、ある入力文ｘが与えられたときにできるだけ良いｙが出力できる重みベクトルｗ＾を学習することである。これは、一般に教師付き学習と呼ばれる手法で行われ、本実施の形態では平均化パーセプトロンを用いる（非特許文献６：Michael Collins and Brian Roark. Incremental parsing with the perceptron algorithm. In Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics,page 111, 2004.）。パーセプトロンの基本的な仕組みは装置からの出力が正解と異なる場合に、正解事例から発火する素性ベクトルを正の向きに、装置の出力事例から発火する素性ベクトルを負の向きにして、重みベクトルに足し合わせることで更新が行われる。結果として、正解事例にはできるだけ正の高いスコアを割り当てるような重みベクトルｗ＾が学習できる。

次に、本発明の実施の形態に係るモデル学習装置の構成について説明する。

＜モデル学習装置の構成＞
本発明の実施の形態に係るモデル学習装置について説明する。図５に示すように、本発明の実施の形態に係るモデル学習装置１００は、ＣＰＵと、ＲＡＭと、後述するモデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このモデル学習装置１００は、機能的には図５に示すように入力部１０と、演算部２０と、出力部５０とを備えている。

入力部１０は、キーボードなどの入力装置から複数の日本語と英語の対訳となっている文対（対訳データ）の集合を受け付ける。なお、入力部１０は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。なお、日本語が第１言語の一例であり、英語が第２言語の一例である。

演算部２０は、対訳データ記憶部２２と、中間目的語作成部２４と、翻訳モデル学習部２６と、翻訳モデル記憶部２８と、バッファ２９と、重みベクトル学習部３０と、スタック３１と、重みベクトル記憶部３２とを備えている。

対訳データ記憶部２２は、入力部１０において受け付けた対訳データの集合が記憶されている。なお、対訳データの集合は、日本語と英語の対訳文が同じ行数の位置に記載されたテキストファイルである。

中間目的語作成部２４は、対訳データ記憶部２２に記憶されている複数の対訳データの各々について、既知の自動構文解析方法、及び上記非特許文献３のルールに基づく手法を用いて、日本語の語順で並んだ英語文（中間英語文）を作成する。具体的には、複数の対訳データの英語文の各々について、既知の方法の自動構文解析方法を用いて、上記図３の左図に示す様な、当該英語文を表す解析木を作成する。そして、作成された英語文を表す解析木に、非特許文献３のルールを適用することで、上記図３の右図に示すような中間英語文を表す中間英語木を作成し、中間英語木に基づいて中間英語文を作成する。

翻訳モデル学習部２６は、対訳データ記憶部２２に記憶されている複数の対訳データの日本語文と、中間目的語作成部２４において複数の対訳データの各々について作成された複数の中間英語文とに基づいて、統計的な翻訳モデルを学習し、出力部５０に出力するとともに翻訳モデル記憶部２８に記憶する。具体的には、複数の対訳データの各々に対する、当該対訳データの日本語の文と、当該対訳データの中間英語文とからなるペアに基づいて、非特許文献４に記載の句に基づいた統計的機械翻訳手法を用いて統計的に翻訳モデルを学習し、出力部５０に出力するとともに翻訳モデル記憶部２８に記憶する。

翻訳モデル記憶部２８には、翻訳モデル学習部２６において学習された翻訳モデルが記憶されている。

バッファ２９では、中間英語文の各単語が、先頭から各要素に格納される。

重みベクトル学習部３０は、対訳データ記憶部２２に記憶されている複数の対訳データの英語文と、中間目的語作成部２４において作成された複数の対訳データの各々に対応する中間英語文とに基づいて、平均化パーセプトロン（非特許文献６）を用いて、重みベクトルｗ＾を学習し、出力部５０に出力するとともに、重みベクトル記憶部３２に記憶する。具体的には、まず、対訳データの各々について、当該対訳データに対応する中間英語文の各単語を先頭からバッファ２９の各要素に格納する。次に、スタック３１が空の状態を初期状態とし、初期状態からバッファ２９に格納されている単語が空になる最終状態まで、取り得る状態とアクションのペアの列を網羅的に求め、バッファ２９の状態、スタック３１の状態、及び素性テンプレートに基づいて、各状態の素性ベクトルを求める。ここで、取り得るアクションとは、上記（６）式の上式を満たす場合には、上記のシフトアクション、挿入アクション、及びレデュースアクションであり、一方、上記（６）式の上式を満たさない場合には、上記のシフトアクション、及びレデュースアクションである。

そして、全ての対訳データについての状態とアクションのペアの列の各々において求められた各状態の素性ベクトルと、対訳データの各々の英語文とに基づいて、上記（１１）式に従って、平均化パーセプトロンを用いて、正解となる状態とアクションのペアの列から算出される優先度スコアの合計が最大となるように重みベクトルｗ＾を学習する。

スタック３１は、重みベクトルｗ＾を学習する際に、対訳データの各々の中間英語文に含まれる少なくとも１つの単語についての部分解析木が、中間解析結果として記憶される。

重みベクトル記憶部３２には、重みベクトル学習部３０において学習された重みベクトルが記憶されている。

次に、本発明の実施の形態に係る翻訳装置の構成について説明する。

＜翻訳装置の構成＞
本発明の実施の形態に係る翻訳装置について説明する。図６に示すように、本発明の実施の形態に係る翻訳装置２００は、ＣＰＵと、ＲＡＭと、後述する翻訳処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この翻訳装置２００は、機能的には図６に示すように入力部２１０と、演算部２２０と、出力部２５０とを備えている。

入力部２１０は、キーボードなどの入力装置から日本語の文を受け付ける。なお、入力部２１０は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。

演算部２２０は、翻訳部２２２と、翻訳モデル記憶部２２４と、バッファ２２５と、探索部２２６と、スタック２２７と、重みベクトル記憶部２２８と、中間目的語木作成部２３０と、並び替え部２３２と、を備えている。

翻訳部２２２は、入力部２１０において入力された日本語の文について、翻訳モデル記憶部２２４に記憶されている翻訳モデルを用いた公知の機械翻訳器により、中間英語文に翻訳する。なお、翻訳の方法は、公知の統計的機械翻訳の技術によって実現すればよく、詳細な説明を省略する。

翻訳モデル記憶部２２４には、モデル学習装置１００において学習された翻訳モデルが記憶されている。

バッファ２２５には、翻訳部２２２において翻訳された中間英語文の各単語が、先頭から各要素に格納される。

探索部２２６は、バッファ２２５に格納された中間英語文の各単語と、重みベクトル記憶部２２８に記憶されている重みベクトルｗ＾とに基づいて、上記（１２）式に従って、スタック２２７が空の状態である初期状態ｐ₀から、中間英語文の形態素結果を表す解析木がスタックの先頭要素に格納された最終状態ｐ_m-1までの各状態遷移に対応するアクションと遷移前の状態とのペアからなる、状態とアクションのペアの列のうち、優先度スコアの合計が最大となる状態とアクションのペアの列を探索する。具体的には、貪欲法を用いて、初期状態ｐ₀から最終状態ｐ_m-1まで、バッファ２９の状態、スタック３１の状態、及び素性テンプレートに基づいて、各状態の素性ベクトルを求めると共に、重みベクトルｗ＾を用いて算出される優先度スコアの合計が最大となるように、上記（１２）式に従って、状態とアクションのペアの列を探索する。

なお、取り得るアクションとは、モデル学習装置１００と同様に、上記（６）式の上式を満たす場合には、上記のシフトアクション、挿入アクション、及びレデュースアクションであり、一方、上記（６）式の上式を満たさない場合には、上記のシフトアクション、及びレデュースアクションである。

また、探索部２２６は、探索された状態とアクションのペアの列に従って、各状態でアクションの操作を行いバッファ２２５及びスタック２２７を繰り返し更新し、最終状態のスタック２２７の先頭要素に基づいて、中間英語木を作成する。

スタック２２７は、重みベクトルｗ＾を学習する際に、対訳データの各々の中間英語文に含まれる少なくとも１つの単語についての部分解析木が、中間解析結果として記憶される。なお、最終状態のスタック２２７の先頭要素に格納されている部分解析木が、中間英語文の形態素解析結果を表す解析木の一例である。

並び替え部２３２は、探索部２２６において作成された中間英語木をバックトラックすることにより、中間英語文の語順を並び替えると共に冠詞を挿入し、英語文に並び替え、出力部２５０に出力する。

＜モデル学習装置の作用＞
次に、本発明の実施の形態に係るモデル学習装置１００の作用について説明する。まず、入力部１０により、日本語と英語の対訳となっている文対（対訳データ）の集合が入力され、対訳データ記憶部２２に記憶される。そして、モデル学習装置１００のＲＯＭに記憶されたプログラムを、ＣＰＵが実行することにより、図７に示すモデル学習処理ルーチンが実行される。

まず、ステップＳ１００では、対訳データ記憶部２２に記憶されている複数の対訳データを読み出す。

次に、ステップＳ１０２では、ステップＳ１００において取得した複数の対訳データの各々について、既知の自動構文解析方法、及び非特許文献３のルールに基づく手法を用いて、当該対訳データの英語文に対する中間英語文を作成する。

次に、ステップＳ１０４では、ステップＳ１００において取得した複数の対訳データの日本語文と、ステップＳ１０２において取得した対訳データの各々の中間英語文とに基づいて、日本語文を中間英語文に翻訳するための統計的な翻訳モデルを学習し、出力部５０に出力するとともに、翻訳モデル記憶部２８に記憶する。

次に、ステップＳ２０６では、ステップＳ１００において取得した複数の対訳データの英語文と、ステップＳ１０２において取得した対訳データの各々に対応する中間英語文とに基づいて、平均化パーセプトロン（非特許文献６）を用いて、重みベクトルｗ＾を学習し、出力部５０に出力するとともに、重みベクトル記憶部２２８に記憶し、処理を終了する。

＜翻訳装置の作用＞
次に、本発明の実施の形態に係る翻訳装置２００の作用について説明する。まず、入力部２１０により、モデル学習装置１００によって学習された翻訳モデルが入力され翻訳モデル記憶部２２４に記憶される。また、モデル学習装置１００によって学習された重みベクトルが入力され重みベクトル記憶部２２８に記憶される。そして、入力部２１０により、日本語で記述された文が入力されると、翻訳装置２００のＲＯＭに記憶されたプログラムを、ＣＰＵが実行することにより、図８に示す翻訳処理ルーチンが実行される。

まず、ステップＳ２００において日本語で記述された入力文を受け付ける。

次に、ステップＳ２０１において、翻訳モデル記憶部２２４に記憶されている翻訳モデルを読み込む。

次に、ステップＳ２０２において、重みベクトル記憶部２２８に記憶されている重みベクトルを読み込む。

次に、ステップＳ２０４において、ステップＳ２００において受け付けた日本語の文について、ステップＳ２０１において取得した翻訳モデルを用いて、中間英語文に翻訳する。

次に、ステップＳ２０６では、ステップＳ２０４において取得した中間英語文の各単語と、ステップＳ２０２において取得した重みベクトルｗ＾とに基づいて、上記（１２）式に従って、スタック２２７が初期状態から最終状態までの各状態遷移に対応するアクションと遷移前の状態とのペアからなる、状態とアクションのペアの列のうち、優先度スコアの合計が最大となる状態とアクションのペアの列を探索する。

次に、ステップ２０８では、ステップＳ２０６において取得した状態とアクションのペアの列に従って、各状態でのアクションの操作を行いバッファ２２５及びスタック２２７を繰り返し更新することにより、ステップＳ２０４において取得した中間英語文について中間英語木を作成する。

次に、ステップＳ２１０では、ステップＳ２０８において取得した中間英語木をバックトラックすることにより、中間英語文の語順を並び替えると共に冠詞を挿入し、英語文に並び替えて、出力部２５０に出力し、処理を終了する。

＜翻訳装置２００の実施例＞
次に、日本語から英語への翻訳を行った実施例について以下説明する。

図９は、入力部２１０において入力される７単語からなる日本語入力文を示しており、図１０は、当該日本語入力文が翻訳部２２２において翻訳された結果である、日本語語順の中間英語文を示している。図１１は、当該日本語入力文に対する英語出力文を示している。

図１２のステップ０の初期状態が示す通り、探索部２２６は、入力となる中間英語文の各単語をバッファ２２５に溜め込み、スタック２２７を空として設定する。ここで、スタック２２７は右側が先頭、バッファ２２５は左側が先頭とする。

図１２のステップ０では、シフトＮアクションをとり、ステップ１へと至る。ステップ１の状態では、バッファ先頭の単語「Ｉ」を取り出してスタック先頭へ追加し、品詞タグ「Ｎ」が割り当てられている。ステップ１でも同様にシフトＷＡアクションをとり、バッファ先頭の単語「ｗａ」を取り出して、スタック先頭へ追加し、品詞タグ「ＷＡ」を割り当てて、ステップ２の状態へと至る。

ステップ２では、レデュースＭＲ−ＮＰアクションをとり、Ｎ（Ｉ）とＷＡ（ｗａ）を結合して、ＮＰ（ｗａ）を作り出している。ステップ３では挿入“no articles”アクションをとり、ＮＰ（ｗａ）からなる単語列（Ｉｗａ）の先頭に冠詞を挿入しないということを決定している。ステップ７まで進み、ステップ７では、レデュースＳＲ−ＰＰアクションによってＮ（telescope）^{“no articles”}とＰＲ（with）を、ＰＰ（with）^＃で結合している。ここで、処理中には明示的な並び替え操作を行わないことに注意するが、上記（１３）式におけるｗ_ｌｅｆｔ、ｗ_{ｒｉｇｈｔ}、ａについては素性ベクトル計算のため内部実装では並び替えを明示的に表現している。

ステップ７以降の処理が進み最終的にはステップ１６の状態へと至り終了する。ステップ１６の状態におけるスタック先頭の木は図３で示した完全な中間英語木と一致する。最後に、この中間英語木をバックトラックしながら図１１で示した英語文に復元することで最終的な翻訳結果が得られる。なお、選択している状態とアクションのペアの列としては、探索部２２６において、中間英語文と、学習された重みベクトルｗ＾とに基づいて、上記（１２）式に従って、優先度スコアの合計が最大となる状態とアクションのペアの列を探索した結果を用いる。

以上説明したように、本発明の実施の形態に係る翻訳装置によれば、日本語で記述された入力文を、日本語の語順に並んだ英語で記述された文に翻訳し、シフトアクション、挿入アクション、及びレデュースアクションを含む複数のアクションで形成されるアクションの列のうち、初期状態から最終状態までの各状態遷移に対応するアクションと状態のペアの列であって、アクションを決定するための予め求められたモデルに基づいて算出される優先度スコアの合計が最大となる状態とアクションのペアの列を探索し、探索された状態とアクションのペアの列に従って、日本語の語順に並んだ英語で記述された文を並び替えることにより、計算量の増大を抑制して、入力文の翻訳を行うことができる。

また、本発明の実施の形態に係る翻訳装置によれば、入力となる中間英語文を左から右へとワンパスで解析することができ、計算量はＯ（ｎ）となる。また、英語文への冠詞挿入操作も解析器の機能として加えようとしても、単語の並び替え及び編集は計算量Ｏ（ｎ）で行うことができる。また、構文解析と冠詞挿入を同時に扱うことができる。

また、統計モデルに単語の並び替えに有効な素性を定義しても、計算量が全く変化しない。この性質により非特許文献２の方法では定義することが困難であった素性を統計モデルに定義することが可能となる。

また、計算量の観点、また、単語並び替え及び編集を同時に行うことなどから、非特許文献２の手法に比べて、高速に動作させることが出来る。実データ上において、平均文長３５程度の中間英語文２０００文を処理する際、１文平均０．０１秒で処理をすることが可能である。非特許文献２の記載において利用している自動構文解析装置では平均１．０秒以上かかり、冠詞挿入のための編集装置の計算時間は平均２．０秒以上かかる。このような単純な見積もりからも、本実施の形態に係る翻訳装置は従来の手法に比べて、極めて高速に動作する。

また、性能の面では、非特許文献２に記載の手法を利用した自動構文解析装置の統計モデルでは定義することが原理的に困難な素性を定義することが出来る。また、この素性を定義したモデルと、取り除いたモデルを用いて実験を行った結果、これらの素性が出来ることで性能が改善できることがわかっている。最終的な実験結果からは非特許文献２に記載の手法よりも高い翻訳精度を達成することができる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

本実施の形態においては、原言語を日本語とし、目的言語を英語とする場合について説明したがこれに限定されるものではなく、文の構文構造が異なる言語ペアであれば、他の言語ペアを、原言語及び目的言語としてもよい。

また、本実施の形態においては、翻訳装置により翻訳する対象を文とする場合について説明したがこの限りでない。例えば、翻訳する対象を句としてもよい。

１０、２１０入力部
２０、２２０演算部
２２対訳データ記憶部
２４中間目的語作成部
２６翻訳モデル学習部
２８、２２４翻訳モデル記憶部
３０重みベクトル学習部
３２、２２８重みベクトル記憶部
５０、２５０出力部
１００モデル学習装置
２００翻訳装置
２２２翻訳部
２９、２２５バッファ
２２６探索部
３１、２２７スタック
２３０中間目的語木作成部
２３２並び替え部

Claims

第１言語の語順に並んだ第１言語とは異なる第２言語で記述された入力文に含まれる各単語を格納したバッファと、
少なくとも１つの単語の形態素解析結果を表す部分解析木を格納するための少なくとも１つの要素からなるスタックと、
前記バッファに格納された先頭の単語を取り出し、前記取り出した単語の形態素解析結果を表す部分解析木を格納した要素を、前記スタックの先頭要素として追加するシフトアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素及び２番目の要素の各々に格納された前記部分解析木を結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースアクションを含む複数のアクションを用いて形成されるアクションの列のうち、
初期状態から、前記入力文の形態素解析結果を表す解析木が前記スタックの先頭要素に格納された最終状態までの各状態遷移に対応する前記アクションからなるアクションの列であって、各状態遷移について、遷移前の状態における前記スタックの各要素及び前記バッファの各単語と前記アクションとの組み合わせと、前記アクションを決定するための予め求められたモデルとに基づいて算出されるスコアの合計が最大となるアクションの列を探索する探索部と、
前記探索部によって探索されたアクションの列に従って前記最終状態で作成される、前記スタックの先頭要素に格納されている部分解析木を、前記入力文の形態素解析結果を表す解析木とし、前記解析木をバックトラックすることにより、前記入力文に含まれる各単語を、前記第２言語の語順に並び替える並び替え部と、
を含む語順並び替え装置。
前記レデュースアクションは、前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素に格納された前記部分解析木を右側とし、取り出した２番目の要素に格納された前記部分解析木を左側として結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースＭＲアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素に格納された前記部分解析木を左側とし、取り出した２番目の要素に格納された前記部分解析木を右側として結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースＳＲアクションを含む請求項１記載の語順並び替え装置。
前記複数のアクションは、前記スタックの先頭要素に格納されている前記部分解析木に対応する前記少なくとも１つの単語の先頭に冠詞を挿入するように、前記部分解析木を更新する挿入アクション、及び前記スタックの先頭要素に格納されている前記部分解析木に対応する前記少なくとも１つの単語の先頭に冠詞を挿入しないことを示す情報を挿入するように、前記部分解析木を更新する挿入アクションを更に含む、請求項１又は２記載の語順並び替え装置。
前記第１言語で記述された入力文を、前記第２言語で記述された文に翻訳する翻訳装置において、
前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するための予め学習された翻訳モデルに基づいて、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳する翻訳部と、
請求項１〜請求項３の何れか１項記載の語順並び替え装置と、
を含み、
前記語順並び替え装置は、前記翻訳部によって翻訳された、前記第１言語の語順に並んだ前記第２言語で記述された文を、前記第２言語の語順に並び替える
翻訳装置。
第１言語の語順に並んだ第１言語とは異なる第２言語で記述された入力文に含まれる各単語を格納したバッファと、少なくとも１つの単語の形態素解析結果を表す部分解析木を格納するための少なくとも１つの要素からなるスタックと、探索部と、並び替え部とを含む語順並び替え装置の語順並び替え方法であって、
前記探索部は、前記バッファに格納された先頭の単語を取り出し、前記取り出した単語の形態素解析結果を表す部分解析木を格納した要素を、前記スタックの先頭要素として追加するシフトアクション、及び前記スタックの先頭要素及び２番目の要素を取り出し、取り出した先頭要素及び２番目の要素の各々に格納された前記部分解析木を結合して作成される前記部分解析木を格納した要素を、前記スタックの先頭要素として追加するレデュースアクションを含む複数のアクションを用いて形成されるアクションの列のうち、
初期状態から、前記入力文の形態素解析結果を表す解析木が前記スタックの先頭要素に格納された最終状態までの各状態遷移に対応する前記アクションからなるアクションの列であって、各状態遷移について、遷移前の状態における前記スタックの各要素及び前記バッファの各単語と前記アクションとの組み合わせと、前記アクションを決定するための予め求められたモデルとに基づいて算出されるスコアの合計が最大となるアクションの列を探索するステップと、
前記並び替え部は、前記探索部によって探索されたアクションの列に従って前記最終状態で作成される、前記スタックの先頭要素に格納されている部分解析木を、前記入力文の形態素解析結果を表す解析木とし、前記解析木をバックトラックすることにより、前記入力文に含まれる各単語を、前記第２言語の語順に並び替えるステップと、
を含む語順並び替え方法。
翻訳部と、語順並び替え装置とを含み、前記第１言語で記述された入力文を、前記第２言語で記述された文に翻訳する翻訳装置の翻訳方法であって、
前記翻訳部は、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するための予め学習された翻訳モデルに基づいて、前記第１言語で記述された入力文を、前記第１言語の語順に並んだ前記第２言語で記述された文に翻訳するステップと、
請求項５記載の語順並び替え方法の各ステップと、
を含み、
前記語順並び替え方法は、前記翻訳部によって翻訳された、前記第１言語の語順に並んだ前記第２言語で記述された文を、前記第２言語の語順に並び替える
翻訳方法。
コンピュータを、請求項１〜請求項３の何れか１項記載の語順並び替え装置の各部として機能させるためのプログラム。
コンピュータを、請求項４記載の翻訳装置の各部として機能させるためのプログラム。