JP4399154B2 - 翻訳装置、及び翻訳プログラム - Google Patents
翻訳装置、及び翻訳プログラム Download PDFInfo
- Publication number
- JP4399154B2 JP4399154B2 JP2002321718A JP2002321718A JP4399154B2 JP 4399154 B2 JP4399154 B2 JP 4399154B2 JP 2002321718 A JP2002321718 A JP 2002321718A JP 2002321718 A JP2002321718 A JP 2002321718A JP 4399154 B2 JP4399154 B2 JP 4399154B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- target language
- pattern
- marker
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
【発明の属する技術分野】
この発明は、原言語で記載されたテキスト文を目的言語に翻訳する機械翻訳システムに係わり、特に翻訳パターンを用いて翻訳を行う翻訳装置、及び翻訳プログラムに関する。
【0002】
【従来の技術】
機械翻訳システムにおいて、機械翻訳では扱いにくい分野特有の特徴的な文を精度良く翻訳する翻訳方式や、ユーザによって機械翻訳システムをカスタマイズすることが可能な翻訳方式として、従来よりパターン翻訳方式が採用されている。このパターン翻訳方式は、原言語の文パターンとその翻訳である目的言語の文パターンとの対応を表す翻訳パターンを用意しておき、原言語で記載されたテキスト文と上記翻訳パターンとを照合して目的言語に翻訳するものである。
【0003】
図5は、日本語から英語に翻訳する際の従来技術による翻訳パターンの一例を示すものである。翻訳パターンは、IDと、原言語パターンと、目的言語パターンとから構成される。原言語パターンでは、矢印“⇒”の左側にこの原言語パターンを置き換える変数が記述され、矢印の右側に入力文と照合する単語、あるいは変数の列が記述される。ここで、鈎括弧“「”、“」”で括られている文字列(“私”、“は”など)が単語を示し、括られていない文字列(“文”、“動詞句”など)が変数を示す。また、コロン“:”の後の数字は、原言語パターンに記述された単語や変数を目的言語パターンから参照するためのインデックスを示す。目的言語パターンは、単語、あるいはインデックスの列で表される。ここで、単語は原言語パターンと同様に鈎括弧で括られており、インデックスは原言語パターンに記述された数字と対応している。
【0004】
例えば、IDが008である翻訳パターンは、入力文に“私”という単語が存在すれば変数“名詞句”で置き換え、目的言語では“I”を生成することを意味する。また、IDが003である翻訳パターンは、変数“を格”で置き換えられた入力文の一部分と変数“動詞句”で置き換えられた入力文の一部分が存在すれば、変数“動詞句”で置き換え、目的言語では原言語パターンの出現順とは逆に、変数“動詞句”、変数“を格”の順に生成することを意味する。
【0005】
図5の翻訳パターンを用いて、
“私は一所懸命英語を勉強する”(例1)
の日本語文を翻訳すると、原言語パターンと照合した結果、図6(a)の構文木が得られ、対応する目的言語パターンに従って変換した結果、図6(b)の生成結果が得られる。そして、最終的に図6(b)の末端の単語列を図の左から出現する順に並べることで、
“I study English hard”(例2)
の翻訳文が得られる。
【0006】
なお、従来では、原言語パターンを一文字の変数で置き換えることによって、翻訳パターンの入れ子構造(木構造)が表現できる翻訳装置が知られている(例えば、特許文献1参照。)。さらに本発明者等は、翻訳テンプレートを使用して翻訳を行う翻訳方法も提案している(例えば、特許文献2参照。)。
【0007】
【特許文献1】
特許第3189186号公報
【0008】
【特許文献2】
特願2002−138930
【0009】
【発明が解決しようとする課題】
ところが、従来のパターン翻訳方式では、目的言語パターンの構成要素は単語、あるいは変数の列で表現されている。そのため、日本語や朝鮮語など語順が自由である言語を原言語とし、かつ英語など語順が固定的な言語を目的言語とした場合には、テキスト文の語順によって翻訳文の語順が変化するという問題が生じる。
【0010】
例えば、前述した図5の翻訳パターンを用いて、上記例1とは語順を変化させた、
“私は英語を一所懸命勉強する”(例3)
の日本語文を翻訳すると、原言語パターンと照合した結果、図7(a)の構文木が得られ、対応する目的言語パターンに従って変換した結果、図7(b)の生成結果が得られる。そして、最終的には、
“I study hard English”(例4)
の翻訳文が得られる。この例4の翻訳文は、翻訳パターンの適用順に応じて英語の語順も変化しており、正確な英語文とは云えない。
【0011】
上記翻訳方式で正確な翻訳文を得るには、例1と例3それぞれの語順に応じた翻訳パターンを用意する必要があるだけでなく、
“一所懸命私は英語を勉強する”や、
“英語を私は一所懸命勉強する”
などの、考えられるすべての語順に対応した翻訳パターンを用意しなければならない。このため、膨大な量の翻訳パターンが必要となってしまう。
【0012】
この発明は上記事情に着目してなされたもので、その目的とするところは、原言語に語順が自由な言語が含まれ、対応する目的言語の語順が固定される場合でも、複数の翻訳パターンを用意することなく正確な翻訳を行えるようにした翻訳装置、翻訳方法及び翻訳プログラムを提供することにある。
【0013】
【課題を解決するための手段】
この発明の一視点に係る翻訳装置は、原言語の構文木を作成するための原言語パターンと、この原言語パターンに対応した目的言語の構文木を作成するための目的言語パターンと、目的言語評価部とから構成された翻訳パターンで、前記目的言語評価部には、語順不定を表すマーカと目的言語の構成要素との対応関係が記載され、前記目的言語パターンには、当該翻訳パターンの目的言語の構成要素に加え他の翻訳パターンの目的言語評価部に記載されたマーカとによる語順が記載された翻訳パターンを記憶した記憶手段と、
原言語で記載されたテキスト文を単語分割する分割手段と、
前記分割手段により分割された単語をもとに前記原言語パターンに従って原言語の構文木を作成する第1の作成手段と、
前記第1の作成手段により作成された原言語の構文木をもとに、前記目的言語評価部に従ってマーカと目的言語の構成要素とを対応付けてマーカテーブルに記憶するとともに、前記目的言語パターンに従い、語順にマーカがある場合には前記マーカテーブルを利用して当該マーカを対応する目的言語の構成要素に置き換えて目的言語の構文木を作成する第2の作成手段と、
前記第2の作成手段により作成された目的言語の構文木に基づいて翻訳文を生成する生成手段とを具備する。
【0014】
したがってこの発明によれば、翻訳文を生成する際に、目的言語評価部に目的言語パターンの構成要素を生成する位置として識別子が記述されていれば、当該識別子により指定された位置に上記構成要素を置換して得られる部分木が埋め込まれる。このため、原言語に語順が自由な言語が含まれ、対応する目的言語の語順が固定される場合でも、複数の翻訳パターンを用意することなく正確な翻訳文を生成することが可能となる。
【0015】
またこの発明は、ユーザの入力操作に応じて、上記目的言語パターンに識別子を含める処理を行う手段をさらに備えることも特徴とする。このような構成を備えることで、翻訳文の語順をユーザが任意に変更することが可能となり、これにより翻訳パターンをカスタマイズすることができる。
【0016】
さらにこの発明は、ユーザの入力操作に応じて、上記目的言語評価部に含まれる上記識別子が表す目的言語の構成要素を特定するための情報を含める処理を行う手段をさらに備えることも特徴とする。このような構成を備えることで、語順が変更する構成要素をユーザが任意に指定することが可能となり、これにより上記同様翻訳パターンをカスタマイズすることができる。
【0017】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態を説明する。
図1は、この発明に係わる翻訳装置の一実施形態を示す機能ブロック図である。
【0018】
この翻訳装置は、入力部1と、プロセッサ2と、記憶部6と、出力部11とを備えている。入力部1は、例えばキーボードにより構成され、ユーザがテキスト文をはじめ、翻訳パターンを構成する要素、例えばマーカやこのマーカが指定する値等を入力するために使用する。
【0019】
記憶部6は、言語別単語辞書記憶エリア7と、対訳辞書記憶エリア8と、翻訳パターン記憶エリア9と、マーカテーブル記憶エリア10とを有する。言語別単語辞書記憶エリア7は、翻訳に使用する複数の言語について、単語と当該単語の品詞等の情報を記憶する。対訳辞書記憶エリア8は、例えば日英対訳の辞書データを記憶する。翻訳パターン記憶エリア9は、原言語を目的言語に翻訳する際に照合する翻訳パターン情報を記憶しており、この翻訳パターンの詳しい構成は後述する。マーカテーブル記憶エリア10は、後述する訳文生成処理部5の指示により、上記翻訳パターンに記述されたインデックスとマーカ及びマーカが指定する値とを対応付けて記憶するものである。
【0020】
プロセッサ2は、CPUやROM、RAM等のコンピュータとしての一般的な構成を備えており、上記ROMに記憶された翻訳プログラムにより指定される処理手順に従って翻訳処理を実行する。この翻訳処理のためにプロセッサ2は、単語分割処理部3と、構文解析処理部4と、訳文生成処理部5とを備えている。
【0021】
単語分割処理部3は、原言語で記載されたテキスト文を、上記言語別単語辞書記憶エリア7に格納された情報に基づいて単語分割を行う。構文解析処理部4は、翻訳パターン記憶エリア9に記憶された翻訳パターンと、上記単語分割処理部3により分割されたテキスト文とを用いて構文の解析を行う。訳文生成処理部5は、上記構文解析処理部4により解析された構文を、上記翻訳パターン記憶エリア9に記憶された翻訳パターンを参照して目的言語に変換する。
【0022】
出力部11は、例えばディスプレイやプリンタにより構成され、上記プロセッサ2の制御の下に、上記訳文生成処理部5により生成された翻訳文等を表示又はプリントアウトする。
【0023】
ところで、上記翻訳パターン記憶エリア9に記憶された翻訳パターンは次のように構成される。図2は、この翻訳パターンの構成の一例を示す図である。
すなわち、翻訳パターンは、識別番号(ID)と、原言語パターンと、目的言語パターンと、目的言語評価部とから構成される。IDは一意となる任意の数字列からなり、各翻訳パターンを特定するために使用される。
【0024】
原言語パターンは、原言語のテキスト文を構文解析するために使用されるもので、この原言語パターンには単語、品詞及び格等が記述される。例えば、図中の矢印“⇒”の左側にはこの原言語パターンを置き換える変数が記述され、矢印の右側にはテキスト文と照合する単語、あるいは変数の列が記述される。ここで、鈎括弧“「”“」”で括られている文字列(“私”、“は”など)が単語を示し、括られていない文字列(“文”、“動詞句”など)が変数を示す。また、コロン“:”の後の数字は、原言語パターンに記述された単語や変数を目的言語パターンから参照するためのインデックスを示す。
【0025】
目的言語パターンは、目的言語の単語、インデックスあるいはマーカの列で表される。このうち単語は、原言語パターンと同様に鈎括弧で括られており、インデックスは原言語パターンに記述された数字と対応している。またマーカは“$”で始まる文字列で表される。このマーカは、目的言語の翻訳文を生成する際の構文を構成する構成要素のうち、位置が変更可能な構成要素に付与される識別子である。
【0026】
目的言語評価部は、マーカとして指定された構成要素の指定位置を表すもので、等号“=”の左辺に生成位置がインデックスとマーカとで指定され、右辺にその位置に生成すべき構成要素がインデックスで示される。
【0027】
例えば、IDが「103」である翻訳パターンの目的言語パターンでは、インデックスが「2」で参照される変数“動詞句”を生成することを意味し、目的言語評価部ではインデックスが「2」で参照される変数“動詞句”から生成された構成要素におけるマーカ“$obj”の位置に、インデックスが1で参照される変数“を格”から生成される構成要素を埋め込むことを意味する。
【0028】
また、IDが「105」である翻訳パターンの目的言語パターンでは、インデックスが「1」で参照される変数“動詞”を生成し、その前後のマーカ“$sbj”、“$obj”、“$adv”で示される位置に他の翻訳パターンで指定される構成要素が埋め込まれることを意味する。
【0029】
次に、以上のように構成された翻訳装置による翻訳手順とその処理内容を説明する。なお、ここでは日本語文の
“私は英語を一所懸命勉強する”
を英文に翻訳する場合を例にとって説明する。
【0030】
ユーザが入力部1から翻訳対象の原言語のテキスト文“私は英語を一所懸命勉強する”を入力すると、プロセッサ2は当該テキスト文を単語分割処理部3に取り込む。単語分割処理部3は、この取り込んだテキスト文を上記言語別単語辞書を参照して単語単位に分割する。
【0031】
例えば、“私/は/英語/を/一所懸命/勉強する”のように分割する。なお、/は単語の区切りを示す。この単語分割の手段としては、例えば形態素解析処理が使われるが、正確に単語認識が可能であれば特に形態素解析処理に限定されるものではなく、他の処理手段を用いてもよい。上記単語分割されたテキスト文は、構文解析処理部4に転送される。
【0032】
構文解析処理部4は、上記単語分割されたテキスト文を、翻訳パターン記憶エリア9に記憶された翻訳パターンの原言語パターンと照合し、テキスト文の構文木を作成する。図3(a)に、作成された構文木を示す。この構文木の各ノードには、上記原言語パターンが一つずつ対応している。ところで、図2に示す原言語パターンは、文脈自由文法の形式で記述されているため、既存の構文解析アルゴリズムを適用することで容易に構文木が作成可能である。文脈自由文法を解析する構文解析アルゴリズムとしては、例えば一般的な文脈自由文法規則が扱え、かつ解析過程の制御の自由度が大きいチャート法が用いられる。上記構文解析処理部4により作成された構文木は、訳文生成処理部5に送られる。
【0033】
訳文生成処理部5は、上記構文解析処理部4から送られた構文木を、上記翻訳パターンの目的言語パターンを参照して目的言語に変換する。図3(b)は、図3(a)に示す原言語の構文木から作成された目的言語の構文木を示す。この訳文生成処理部5では、関数generate()を定義しており、この関数generate()を実行することで原言語の構文木から目的言語の構文木への変換処理が行われる。図4は、この関数generate()を用いた変換処理の手順と内容を示すフローチャートである。以下に、この図4を用いて上記訳文生成処理部5による変換処理動作を説明する。
【0034】
まず訳文生成処理部5は、原言語の根ノードであるSNode[文,ID=101]を呼び出す。ここで、SNode[文,ID=101]は、原言語の構文木のノードを示す構造体であり、変数が“文”、IDが「101」であることを示し、さらに構文木の子ノードへのポインタも有している。この呼び出したSNode[文,ID=101]から、原言語ノードの変数“文”と、翻訳パターンのID=「101」を取得する(ステップS10)。これら取得した情報をもとに、目的言語ノードTNode[文,ID=101]を生成する。ここで、TNode[文,ID=101]は、目的言語の構文木のノードを示す構造体であり、変数が“文”、IDが「101」であることを示し、さらに構文木の子ノードへのポインタも有している。
【0035】
続いて訳文生成処理部5は、ステップS12に移行してここでマーカテーブルが存在するか否かを判定する。ここではまだマーカテーブルが設定されていないのでステップS14に移行する。ステップS14では、目的言語評価部をすべて処理したか否かを判定する。そして、IDが「101」の翻訳パターンには目的言語評価部が無いので、ステップS17に移行する。ステップS17では、目的言語パターンのすべての構成要素について訳文生成処理を行ったか否かを判定する。そして、ここではまだ処理を終了していないので、構成要素の種類ごとの処理を次のように実行する。
【0036】
すなわち、訳文生成処理部5はステップS18、ステップS20及びステップS22により、構成要素が「単語」であるのか、「インデックス」であるのか、さらに「マーカ」であるのかを判定する。いま、ID「101」の目的言語パターンにはインデックス“1”が記述されている。このため、ステップS20からステップS21に移行し、ここでインデックス参照先である原言語ノードSNode[動詞句,ID=102]を呼び出す。そして、このSNode[動詞句,ID=102]と、再帰的に呼び出した関数generate()とから目的言語ノードTNode[動詞句,ID=102]を作成する。そして、この作成したTNode[動詞句,ID=102]をTNode[文,ID=101]の子ノードとして設定する。ここで、訳文生成処理部5は、すべてのノードの処理ごとに関数generate()を再帰的に呼び出す。そして、目的言語パターンのすべての構成要素を処理すると、当該ID「101」の翻訳パターンにおける関数generate()の処理を終了する(ステップS24)。
【0037】
次に訳文生成処理部5は、IDが「102」の翻訳パターンについての関数generate()の処理を行う。なお、上記ID「101」の場合と重複するステップについては説明を省略する。
【0038】
まず訳文生成処理部5は、呼び出した原言語ノードSNode[動詞句,ID=102]の変数“動詞句”とID=102をステップS10で取得し、ステップS11で目的言語ノードTNode[動詞句,ID=102]を作成する。そして、マーカテーブルが存在しなければステップS12からステップS14に移行し、ここで目的言語評価部をすべて処理したか否かを判定する。いまIDが「102」の翻訳パターンには目的言語評価部に位置指定がある。このため訳文生成処理部5は、ステップS15に移行して右辺値のインデックス“1”で参照される原言語ノードSNode[主格,ID=106]を呼び出す。そして、このSNode[主格,ID=106]と再帰的に呼び出した関数generate()とから作成される目的言語ノードTNode[主格,ID=106]を、位置指定の左辺値のインデックス“2”とマーカ“$sbj”とに対応付けてマーカテーブル記憶エリア10に記憶する(ステップS16)。この結果、マーカテーブルは表1に示すエントリを持つことになる。
【0039】
【表1】
【0040】
そうして目的言語評価部をすべて処理すると、訳文生成処理部5はステップS17に移行し、ここで目的言語パターンのすべての構成要素を処理したか否かを判定する。そして、未処理であればステップS18、ステップS20及びステップS22により構成要素の種類を判定する。いま、ID「102」の目的言語パターンにはインデックス“2”が記述されている。このため、訳文生成処理部5はインデックス“2”で参照される原言語ノードSNode[動詞句,ID=103]をステップS21で呼び出す。そして、マーカテーブルにエントリが存在すれば、以下の条件のいずれかを満たすエントリを呼び出す。
目的言語パターンに記述されているインデックスと同じインデックスを持つエントリ(条件1)
インデックスがNULLであり、かつ、現目的言語パターンに存在しないマーカを持つエントリ(条件2)
いま、表1を参照すると、1行目のエントリのインデックスが“2”であり、条件1を満たす。このため、訳文生成処理部5は当該エントリを呼び出す。そして、上記原言語ノードSNode[動詞句,ID=103]からTNode[動詞句,ID=103]を作成し、上記呼び出したエントリをTNode[動詞句,ID=103]に属性情報として設定する。そして、このTNode[動詞句,ID=103]をTNode[動詞句,ID=102]の子ノードに設定する。そして、目的言語パターンのすべての構成要素を処理すると、当該翻訳パターンにおける関数generate()の処理を終了する。
【0041】
次に訳文生成処理部5は、原言語ノードのSNode[動詞句,ID=103]を呼び出す。このとき、属性情報として、前述のようにマーカテーブルのエントリが設定されている。このため訳文生成処理部5は、ステップS13に移行し、ここで上記エントリを取得してインデックス“2”を“NULL”に変更し、マーカテーブル記憶エリア10に再度記憶する。この結果、マーカテーブルは表2に示すエントリを持つことになる。
【0042】
【表2】
【0043】
さらに訳文生成処理部5は、前述の説明と同様に目的言語評価部についてステップS15及びステップS16の処理を行う。この結果、マーカテーブル記憶エリア10は表3に示すエントリを持つことになる。
【0044】
【表3】
【0045】
いま、IDが「103」の翻訳パターンの目的言語パターンには、インデックス“2”が記述されている。このため訳文生成処理部5は、表3のマーカテーブルを参照し、前述の条件1、条件2を満たすエントリが存在するかを判定する。表3の1行目のエントリは、インデックスが“NULL”であり、かつ目的言語パターンにはマーカ“$sbj”は存在しない。このため、前述の条件2を満たす。表3の2行目のエントリは、インデックスが目的言語パターンに記述されているインデックスと同じである。このため、前述の条件1を満たす。
【0046】
したがって訳文生成処理部5は、表3の2つのエントリと、目的言語パターンのインデックス“2”で参照される原言語ノードSNode[動詞句,ID=104]とを呼び出す。そして、この原言語ノードSNode[動詞句,ID=104]と再帰的に呼び出した関数generate()とからTNode[動詞句,ID=104]を作成し、上記呼び出した2つのエントリをTNode[動詞句,ID=104]に属性情報として設定する。そして、このTNode[動詞句,ID=104]をTNode[動詞句,ID=103]の子ノードに設定する(ステップS21)。
【0047】
この処理動作から明らかなように、現在のノードにおける目的言語パターンが指定されたマーカを持たない場合には、現在のノードの子ノードを関数generate()が処理する際に、マーカテーブルのエントリをもとに子ノードをたどることにより、指定されたマーカが記述されている目的言語パターンを探すことができる。辿るべき子ノードが複数ある場合には、例えば最左、深さ優先で子ノードを辿るといった優先順位を予め定めておけばよい。
【0048】
次に訳文生成処理部5は、IDが「105」の翻訳パターンについての関数generate()の処理を行う。原言語ノードSNode[動詞句,ID=105]を呼び出したとき、属性情報としてマーカテーブルのエントリが3つ与えられており、表4に示すエントリがマーカテーブル記憶エリア10に記憶されている(ステップS12)。
【0049】
【表4】
【0050】
いま、IDが「105」である翻訳パターンの目的言語パターンには、マーカ“$sbj”が記述されている。このため訳文生成処理部5は、ステップS22からステップS23に移行し、ここでマーカテーブルのエントリのうちインデックスが“NULL”であり、かつ同じマーカを持つ目的言語ノードを選択する。例えば、表4に示すマーカテーブルでは1行目のエントリが選択され、目的言語ノードTNode[主格,ID=106]を最初の子ノードとして設定する。
【0051】
次に、目的言語パターンにはインデックス“1”が記述されているため、インデックス参照先である原言語ノードSNode[動詞,ID=111]を呼び出し、このSNode[動詞,ID=111]と再帰的に呼び出した関数generate()とから目的言語ノードTNode[動詞,ID=111]を作成する。そして、この作成したTNode[動詞,ID=111]を2番目の子ノードとして設定する(ステップS21)。このとき、表4に示すマーカテーブルのエントリは、いずれも前述の条件1、条件2を満たしていないので、属性情報は設定されない。
【0052】
次の目的言語パターンの構成要素は、マーカ“$obj”であるため、訳文生成処理部5はステップS22からステップS23に移行し、ここで表4のマーカテーブルを参照して目的言語ノードTNode[を格,ID=107]を取得する。そして、このTNode[を格,ID=107]を3番目の子ノードとして設定する。同様に、最後の構成要素はマーカ“$adv”であるため、訳文生成処理部5は表4のマーカテーブルを参照して目的言語ノードTNode[副詞句,ID=110]を4番目の子ノードとして設定する。
【0053】
そうして、目的言語パターンのすべての構成要素についての処理を終了すると、訳文生成処理部5はステップS17からステップS24に移行して、当該翻訳パターンにおける関数generate()の処理を終了する。
【0054】
最後に、原言語ノードSNode[名詞句,ID=108]を呼び出したときの関数generate()の動作を説明する。訳文生成処理部5は、IDが「108」である翻訳パターンの目的言語パターンには単語“I”が記述されているので、ステップS18からステップS19に移行し、ここで再帰的に呼び出した関数generate()により目的言語ノードTNode[「I」,ID=***]を作成し、TNode[名詞句,ID=108]の子ノードとして設定する。そして、当該翻訳パターンにおける関数generate()の処理を終了する(S24)。ここで、ID=「***」は単語を表すノードであることを示している。
【0055】
以上のように訳文生成処理部5は、すべてのノードの処理ごとに関数generate()を再帰的に呼び出す。このため、図3(a)に示す原言語の構文木の根ノードを呼び出して翻訳処理を実行すると、図3(b)に示す目的言語の構文木が生成される。そして、訳文生成処理部5は、この生成された目的言語の構文木(図3(b))を最左、深さ優先で辿ることにより得られる末端の単語を出現順に並べ、これにより翻訳文の表示データを生成する。そして、この生成された翻訳文の表示データを出力部11へ出力し表示させる。この結果出力部11では、翻訳文“I study English hard”が表示される。
【0056】
以上詳述したようにこの実施形態では、原言語で記載されたテキスト文を単語分割し、この単語分割されたテキスト文から原言語パターンに従って構文木を作成する。そして、原言語の構文木から目的言語パターンに従って目的言語の構文木を作成する際に、目的言語評価部によりマーカで指定された構成要素を記憶しておき、目的言語パターンに記述されたマーカの位置に上記記憶された構成要素を配置して翻訳文を生成するようにしたものである。
【0057】
したがってこの実施形態によれば、マーカを設定した目的言語の構成要素を配置する位置を変更することが可能となる。よって、原言語の語順が自由であり、目的言語の語順が固定的な言語であっても、翻訳パターンの適用順序によらずに所定の語順で翻訳文を生成することができる。
【0058】
また上記実施形態では、翻訳パターンの目的言語評価部に変更可能な構成要素を予め特定して翻訳処理を実行するようにしていたが、上記変更可能な構成要素をユーザが設定できるように構成してもよい。すなわち、変更可能な構成要素の入力をユーザに促す設定画面を作成して出力部11に表示する。そして、ユーザが入力部1により入力した情報を上記目的言語評価部に反映させることで実現可能である。
【0059】
同様に上記実施形態では、翻訳パターンの目的言語パターンに記述されたマーカの配置する位置を予め特定して(図2におけるID=105の目的言語パターン)翻訳処理を実行するようにしていたが、上記マーカの位置をユーザが設定できるように構成してもよい。すなわち、マーカにより指定された構成要素の変更を促す設定画面を作成して出力部11に表示する。そして、ユーザが入力部1により入力した情報を上記目的言語パターンに反映させることで実現可能である。このような構成にすることで、上記一定の語順で翻訳文を作成できることに加えて、翻訳方式をカスタマイズすることが可能となる。
【0060】
また上記実施形態では、ROMに記憶された翻訳プログラムをCPUが実行することで翻訳処理を行うように説明したが、上記翻訳プログラムをCD−ROM等の外部記憶媒体から読み込んだり、ネットワーク上のサイトから通信回線を介してダウンロードしてインストールするようにしてもよい。
【0061】
その他、翻訳装置の種類とその構成、辞書の種類とその構成、単語分割処理や構文解析処理の方法、訳文生成処理の制御手順とその内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
【0062】
【発明の効果】
以上詳述したようにこの発明では、原言語の構文木を作成するための原言語パターンと、この原言語パターンに対応した目的言語の構文木を作成するための目的言語パターンと、目的言語評価部とから構成され、かつ上記目的言語パターンには上記目的言語の構文木を表す構成要素のうち位置が変更可能な構成要素を示す識別子が含まれ、上記目的言語評価部には上記識別子が表す目的言語の構成要素を特定するための情報が含まれる翻訳パターンを有し、原言語で記載されたテキスト文を単語分割して、この分割された単語をもとに上記原言語パターンに従って原言語の構文木を作成する。そして、上記作成された原言語の構文木をもとに上記目的言語パターンに従って目的言語の構文木を作成し、この作成された目的言語の構文木の構成要素のうち上記目的言語評価部の識別子が表す構成要素を当該識別子と対応付けて記憶しておく。そして、上記目的言語パターンに上記識別子が存在した場合には、当該識別子に対応付けて記憶された構成要素を置き換えて翻訳文を生成するようにしている。
【0063】
したがってこの発明によれば、原言語に語順が自由な言語が含まれ、対応する目的言語の語順が固定される場合でも、複数の翻訳パターンを用意することなく正確な翻訳を行えるようにした翻訳装置、翻訳方法及び翻訳プログラムを提供することができる。
【図面の簡単な説明】
【図1】この発明に係わる実施形態における翻訳装置の構成を示すブロック図。
【図2】図1に示した翻訳装置における翻訳パターンの一例。
【図3】図1に示した翻訳装置により作成される構文木を示す図。
【図4】訳文生成処理部5で実行される関数generate()の動作を示すフローチャート。
【図5】日本語から英語に翻訳する際の従来技術による翻訳パターンの一例。
【図6】従来技術による翻訳例。
【図7】従来技術による翻訳例。
【符号の説明】
1…入力部
2…プロセッサ
3…単語分割処理部
4…構文解析処理部
5…訳文生成処理部
6…記憶部
7…言語別単語辞書記憶エリア
8…対訳辞書記憶エリア
9…翻訳パターン記憶エリア
10…マーカテーブル記憶エリア
11…出力部
Claims (4)
- 原言語の構文木を作成するための原言語パターンと、この原言語パターンに対応した目的言語の構文木を作成するための目的言語パターンと、目的言語評価部とから構成された翻訳パターンで、前記目的言語評価部には、語順不定を表すマーカと目的言語の構成要素との対応関係が記載され、前記目的言語パターンには、当該翻訳パターンの目的言語の構成要素に加え他の翻訳パターンの目的言語評価部に記載されたマーカとによる語順が記載された翻訳パターンを記憶した記憶手段と、
原言語で記載されたテキスト文を単語分割する分割手段と、
前記分割手段により分割された単語をもとに前記原言語パターンに従って原言語の構文木を作成する第1の作成手段と、
前記第1の作成手段により作成された原言語の構文木をもとに、前記目的言語評価部に従ってマーカと目的言語の構成要素とを対応付けてマーカテーブルに記憶するとともに、前記目的言語パターンに従い、語順にマーカがある場合には前記マーカテーブルを利用して当該マーカを対応する目的言語の構成要素に置き換えて目的言語の構文木を作成する第2の作成手段と、
前記第2の作成手段により作成された目的言語の構文木に基づいて翻訳文を生成する生成手段とを具備したことを特徴とする翻訳装置。 - ユーザの入力操作に応じて前記マーカを前記目的言語パターンに含める処理を行う手段をさらに具備したことを特徴とする請求項1記載の翻訳装置。
- ユーザの入力操作に応じて前記マーカが表す目的言語の構成要素を特定するための情報を前記目的言語評価部に含める処理を行う手段をさらに具備したことを特徴とする請求項1記載の翻訳装置。
- 請求項1乃至3のいずれかに記載の翻訳装置を構成する各手段としてコンピュータを機能させる翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002321718A JP4399154B2 (ja) | 2002-11-05 | 2002-11-05 | 翻訳装置、及び翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002321718A JP4399154B2 (ja) | 2002-11-05 | 2002-11-05 | 翻訳装置、及び翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004157688A JP2004157688A (ja) | 2004-06-03 |
JP4399154B2 true JP4399154B2 (ja) | 2010-01-13 |
Family
ID=32802167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002321718A Expired - Fee Related JP4399154B2 (ja) | 2002-11-05 | 2002-11-05 | 翻訳装置、及び翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4399154B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6496640B2 (ja) * | 2015-09-14 | 2019-04-03 | 株式会社エクサ | Cobolソースコード変換プログラム |
-
2002
- 2002-11-05 JP JP2002321718A patent/JP4399154B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004157688A (ja) | 2004-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6345243B1 (en) | System, method, and product for dynamically propagating translations in a translation-memory system | |
US6345244B1 (en) | System, method, and product for dynamically aligning translations in a translation-memory system | |
US7707026B2 (en) | Multilingual translation memory, translation method, and translation program | |
US6778949B2 (en) | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures | |
JP2892548B2 (ja) | 自動翻訳装置 | |
JP3038079B2 (ja) | 自動翻訳装置 | |
JP2009545077A (ja) | 利用可能なソースデータ及びローカライゼーションの再利用 | |
WO2001082111A2 (en) | Computer-aided reading system and method with cross-language reading wizard | |
JPS6375835A (ja) | 目的コ−ド、プログラム・リスト及び設計文書を生成する装置 | |
US20070011160A1 (en) | Literacy automation software | |
CN111176650B (zh) | 解析器生成方法、检索方法、服务器及存储介质 | |
JPS61255469A (ja) | 言語生成装置 | |
JP5410334B2 (ja) | 語順変換装置、機械翻訳用統計モデル作成装置、機械翻訳装置、語順変換方法、機械翻訳用統計モデル作成方法、機械翻訳方法、プログラム | |
JP4399154B2 (ja) | 翻訳装置、及び翻訳プログラム | |
KR100631086B1 (ko) | Xml을 이용한 텍스트 정규화 방법 및 장치 | |
JPH0877196A (ja) | 文書情報抽出装置 | |
JP3898615B2 (ja) | 短縮語作成支援装置および短縮語作成支援プログラム | |
JP7083473B2 (ja) | 入力支援装置 | |
JP3982726B2 (ja) | 翻訳知識学習装置及び機械翻訳装置 | |
JP6437899B2 (ja) | 文書校正支援装置、文書校正支援方法、および文書校正支援プログラム | |
JP3414319B2 (ja) | データ検索装置、方法及び記録媒体 | |
JP3892227B2 (ja) | 機械翻訳システム | |
CN116384346A (zh) | 基于html格式的文字替换方法、装置、终端和介质 | |
JP2006134051A (ja) | 翻訳装置、翻訳方法およびプログラム | |
CN115705351A (zh) | 一种操作信息确定方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070330 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070417 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070611 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070704 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070720 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090709 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |