JP2004220616A - 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 - Google Patents

3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 Download PDF

Info

Publication number
JP2004220616A
JP2004220616A JP2004006734A JP2004006734A JP2004220616A JP 2004220616 A JP2004220616 A JP 2004220616A JP 2004006734 A JP2004006734 A JP 2004006734A JP 2004006734 A JP2004006734 A JP 2004006734A JP 2004220616 A JP2004220616 A JP 2004220616A
Authority
JP
Japan
Prior art keywords
translation
sentence
screen
original
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004006734A
Other languages
English (en)
Inventor
San Suu Kim
キム、サン、スー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CROSS LANGUAGE Inc
Original Assignee
CROSS LANGUAGE Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CROSS LANGUAGE Inc filed Critical CROSS LANGUAGE Inc
Publication of JP2004220616A publication Critical patent/JP2004220616A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】 2回以上異なる言語に翻訳された翻訳の正しさを簡単にチェックでき、且つ、誤訳の原因を修正して翻訳の精度を向上させることができる機械翻訳装置を提供する。
【解決手段】 入力手段3と、原文を文章単位に分解する文書分析手段12と、辞書データを有する辞書データ記憶手段11と、翻訳エンジン10と、 原文画面と一次翻訳画面と二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、原文と一次翻訳文と少なくとも二次翻訳文のデータの対応する文章に番号を付与し、各対応する文章の桁数を計算し、前記対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示し、ユーザーが原文画面と一次翻訳画面と少なくとも二次翻訳画面のいずれかを次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御し、さらに、ユーザーが原文と一次翻訳文と少なくとも二次翻訳文のいずれかの単語を指定したときに対応する単語を検索して強調表示するようにした表示制御手段13と、を備えた。
【選択図】 図1

Description

本発明は、原文から原文と異なる言語による一次翻訳文に翻訳し、さらに、一次翻訳文から一次翻訳文と異なる言語による二次翻訳文に翻訳するというように、同一の原文から訳出された2つ以上の翻訳文を、原文を含めて3つ以上の対訳画面として同時に表示し、編集可能にする機械翻訳装置に関する。
従来の機械翻訳装置において、たとえば日本語から英語に機械翻訳する場合、機械翻訳装置は機械翻訳を行った後に、画面上に日本文と英文の対訳画面を表示するものはあった。
このような対訳画面を表示する機械翻訳装置において、翻訳の正しさをチェックするには、翻訳者が日本文と英文の対訳画面を見ながら、対応する日本語と英語の文章を一つずつチェックするようにしていた。
一方、翻訳の世界においては、たとえば日本語からフランス語に翻訳する場合に、最初に日本語から英語に翻訳し、次に英語からフランス語に翻訳するように、原文から目的の言語の翻訳文に直接に翻訳できずに、間に他の言語による翻訳文を介在させる必要がある場合がある。
このような場合、従来は日本語から英語に翻訳する機械翻訳装置と、英語からフランス語に翻訳する機械翻訳装置とを使い分けて(物理的に一つの装置であっても別々のソフトウェアプログラムを使い分けて)、最初に日本語から英語に翻訳し、次に英語からフランス語に翻訳するようにしていた。
この場合、機械翻訳装置の画面上には、日本文と英文の対訳画面、および、英文とフランス文の対訳画面がそれぞれ時間を異にして表示される。
従来、このような場合において翻訳の正しさをチェックするには、日本文と英文の対訳画面で英文の翻訳の正しさをチェックし、次に英文とフランス文の対訳画面でフランス文の翻訳の正しさをチェックするようにしていた。
さらに、従来からたとえば日本語からフランス語に翻訳するのに、機械翻訳装置の内部において日本文の構文解析を行った後に、構文の要素の日本語の単語をいったん英語の単語に置き換え、しかる後に英語の単語をフランス語の単語に置き換えてフランス語による翻訳文生成ルールに則ってフランス文を生成することが行われていた。この場合には、機械翻訳装置の画面上には日本文とフランス文の対訳画面のみが表示される。
この場合に翻訳の正しさをチェックするには、日本文とフランス文の対訳画面で直接フランス文の翻訳の正しさをチェックするようにしていた。
先行技術文献
本発明は、同一の原文から訳出された2つ以上の翻訳文を、原文を含めて3つ以上の対訳画面に同時に表示して編集可能にするものである。従来は上述したように2つの対訳画面を同時に表示するものしか無く、本発明は全く新規に想到したものであるため、先行技術文献が存在しない。
しかし、上記たとえば日本語から英語に翻訳する従来の機械翻訳装置において、翻訳の正しさをチェックするためには対訳画面上の日本文と英文を見比べるようにしていたが、日本文と英文の対応する文章を全数逐一チェックしなければならなかった。このため、機械翻訳によって正しく翻訳されている可能性が高いものも含めて翻訳文の全部をチェックすることにより多くの時間と無駄な労力を費やしていた。
これに対して、機械翻訳によって誤訳された可能性が高い部分のみを集中的にチェックできる機械翻訳装置の開発が待たれていた。
そこで、本発明が解決しようとする一つの課題は、一つの言語から他の言語に機械翻訳された結果を、誤訳された可能性が高い部分のみを集中的にチェックできる機械翻訳装置を提供することにある。
一方、上記たとえば日本語からフランス語に英語を介して翻訳し、日本文と英文の対訳画面と、英文とフランス文の対訳画面とを別々の時間に表示せざるを得ない機械翻訳装置では、目的のフランス文の翻訳の正しさをチェックするために英文とフランス文の対訳画面を精密にチェックしても、英文の原文たる日本文が如何なる文章であるかを随時参照することができないため、完全なチェックを行うことは困難であった。同様に、日本文と英文の対訳画面によって英文の正しさを精密にチェックしても、それが結果的にどのようなフランス文に翻訳されたかを知ることができなかった。このような装置では翻訳の正しさをチェックするのはきわめて困難であった。
また、上記したように、たとえば原文たる日本文の構文解析を行った後に、構文の要素たる日本語の単語をいったん英語の単語に変換し、しかる後に英語の単語をフランス語の単語に置き換えてフランス語の翻訳生成ルールに則ってフランス文を生成するようにした機械翻訳装置では、日本文とフランス文の対訳画面を見ただけでは、どのような中間的な翻訳によって誤訳が生じたのかが分からなかったため、適切な翻訳の修正を行うことができず繰り返し誤訳が生じる結果になっていた。
また、この装置は、日本語の単語をいったん英語の単語に置き換えてフランス語の単語に翻訳した時点ではじめて翻訳文の生成ルールを当てはめて文章として構成するため、いったん英語に置き換えた時点で、英語として正しい構文であることをチェックせず、英語として適当な構文であるという観点から英語の単語を選択することができず、結果として不自然な翻訳を行うことがあった。
そこで、本発明が解決しようとするもう一つの課題は、原文を少なくとも一つの言語を介在させて目的の言語の翻訳文に翻訳する場合に、翻訳の正しさを簡単にチェックでき、且つ、誤訳の原因を修正して翻訳の精度を向上させることができる機械翻訳装置を提供することにある。
本発明による 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置は、原文のデータを入力する入力手段と、前記原文のデータに対して、句読点や改行を含む文章の区切を示す区切データを検索し、当該区切データによって原文を文章単位に分解する文書分析手段と、前記原文を被翻訳文として被翻訳文と異なる言語による一次翻訳文へ翻訳する場合の辞書データと、少なくとも前記一次翻訳文を被翻訳文として被翻訳文と異なる言語による二次翻訳文に翻訳する場合の辞書データを有する辞書データ記憶手段と、
前記文章単位に分解された原文のデータを入力し、文章単位ごとに、前記原文を被翻訳文として前記一次翻訳文へ翻訳し、さらに少なくとも前記一次翻訳文を前記二次翻訳文に翻訳する翻訳エンジンと、コンピューター画面上で原文を表示する原文画面と、一次翻訳文を表示する一次翻訳画面と、少なくとも二次翻訳文を表示する二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、前記原文と一次翻訳文と少なくとも二次翻訳文のデータを入力し、前記原文と一次翻訳文と少なくとも二次翻訳文の対応する文章に番号を付与し、各対応する文章の桁数を計算し、前記原文を前記原文画面に、前記一次翻訳文を前記一次翻訳画面に、少なくとも前記二次翻訳文を前記二次翻訳画面にそれぞれ対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示し、カーソルまたはスクロールボタンの信号を検知し、ユーザーが原文画面と一次翻訳画面と少なくとも二次翻訳画面のいずれかを次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御し、さらに、ユーザーが原文と一次翻訳文と少なくとも二次翻訳文のいずれかの単語を指定したときに、前記辞書データ記憶手段から当該単語を検索し、原文または一次翻訳文または少なくとも二次の翻訳文の当該対応する文章において、該当する単語を検索して強調表示するようにした表示制御手段と、を有することを特徴とするものである。
本発明による3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置は、原文のデータを入力する入力手段と、前記原文のデータに対して、句読点や改行を含む文章の区切を示す区切データを検索し、当該区切データによって原文を文章単位に分解する文書分析手段と、前記原文を被翻訳文として原文と異なる言語による一次翻訳文へ翻訳する場合の辞書データと、前記一次翻訳文を被翻訳文として原文の言語による二次翻訳文に翻訳する場合の辞書データを有する辞書データ記憶手段と、前記文章単位に分解された原文のデータを入力し、文章単位ごとに、前記原文を被翻訳文として前記一次翻訳文へ翻訳し、さらに前記一次翻訳文を原文と同一言語の二次翻訳文に翻訳する翻訳エンジンと、コンピューター画面上で原文を表示する原文画面と、一次翻訳文を表示する一次翻訳画面と、二次翻訳文を表示する二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、前記原文と一次翻訳文と二次翻訳文のデータを入力し、前記原文と一次翻訳文と二次翻訳文の対応する文章に番号を付与し、各対応する文章の桁数を計算し、前記原文を前記原文画面に、前記一次翻訳文を前記一次翻訳画面に、前記二次翻訳文を前記二次翻訳画面にそれぞれ対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示し、カーソルまたはスクロールボタンの信号を検知し、ユーザーが原文画面と一次翻訳画面と二次翻訳画面のいずれかを次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御し、さらに、ユーザーが原文と一次翻訳文と二次翻訳文のいずれかの単語を指定したときに、前記辞書データ記憶手段から当該単語を検索し、原文または一次翻訳文または二次の翻訳文の当該対応する文章において、該当する単語を検索して強調表示するようにした表示制御手段と、前記原文と前記二次翻訳文とを照合し、前記原文と前記二次翻訳文の異なる部分を強調表示する照合手段と、を有することを特徴とするものである。
前記原文画面と一次翻訳画面とすくなくとも二次の翻訳画面はいずれもユーザーによって編集可能であり、ユーザーが前記原文画面において原文を修正して再翻訳を指示したときは、前記翻訳エンジンは、修正された原文を前記一次翻訳文へ再翻訳し、さらに前記再翻訳された一次翻訳文を前記少なくとも二次の翻訳文に再翻訳し、前記表示制御手段は、修正された原文を前記原文画面に、再翻訳された前記一次翻訳文を前記一次翻訳画面に、再翻訳された前記少なくとも二次の翻訳文を前記少なくとも二次の翻訳画面に自動的に表示し、ユーザーが前記一次翻訳画面において一次翻訳文を修正して再翻訳を指示したときは、原文から一次翻訳文に翻訳することを抑制するフラグが立てられ、前記翻訳エンジンは、修正された一次翻訳文を前記少なくとも二次の翻訳文に再翻訳し、前記表示制御手段は、前記原文を前記原文画面に、修正された一次翻訳文を前記一次翻訳画面に、再翻訳された前記少なくとも二次の翻訳文を前記少なくとも二次の翻訳画面に自動的に表示する、ようにすることができる。
ユーザーが前記一次翻訳画面において一次翻訳文の所定の単語を指定したときに、前記辞書データ記憶手段から前記単語を二次翻訳文に翻訳する場合の訳語候補を複数個検索して表示し、ユーザーが前記表示された複数の訳語候補のうちのいずれかを指定したときに、前記翻訳エンジンに前記訳語によって少なくとも二次以降の翻訳文を再翻訳させる訳語候補表示手段を有するようにすることができる。
前記訳語候補表示手段は訳語候補のうちユーザーによって所定の訳語が選択された場合は、前記辞書データの当該原語と訳語に対応関係を示す信号を付し、前記翻訳エンジンはそれ以降の翻訳において前記原語に対しては前記対応関係を示す信号を付された訳語を優先的に適用するようにすることができる。
本発明によれば、原文を他の言語を介在させて目的の言語に翻訳させるような場合、たとえば日本語から英語を介してフランス語に翻訳するような場合に、日本語の原文と英語による一次翻訳文とフランス語による二次翻訳文を同時に表示して編集可能にすることができる。これにより、原文と一次翻訳文と二次翻訳文の翻訳の経緯が明白に対照表示され、これによって、最終的な翻訳が不自然な場合に、その原因が原文から一次翻訳文に翻訳されたときに生じたのか、一次翻訳文から二次翻訳文に翻訳されたときに生じたのかを確認することができる。
当該不自然な翻訳の原因が確認できれば、その不自然な翻訳を行った辞書データを修正することにより、それ以降の翻訳精度を向上させていくことができる。
また、本発明によれば、原文を目的の言語による翻訳文に翻訳した場合に、翻訳の正しさを効率よくチェックすることができる。
たとえば本発明によれば、日本語による原文を目的の英文(一次翻訳文)に翻訳した後に、さらに英文を追加的に再度日本文(二次翻訳文)に翻訳することができる。この結果、照合手段により、原文と二次翻訳文(同一言語による文章)を機械的に照合することができ、相違する部分を簡単に抽出することができる。
この相違する部分は、多分に一次翻訳文、すなわち目的の翻訳文の不自然な翻訳に起因することが多く、相違する部分について原文と一次翻訳文をチェックすれば、不自然な翻訳の大部分を修正することができる。
このように、本発明によれば、原文と翻訳文の全数をチェックすることなく、不自然な翻訳の大部分をチェックすることができるので、効率よく不自然な翻訳を除去することができる機械翻訳装置を得ることができる。
以下に本発明の実施の形態について説明する。
図1は本発明の一実施形態による機械翻訳装置のコンピューターにおける構成を示す。
本実施形態による機械翻訳装置1は、出力手段2と、入力手段3と、記憶装置4と、CPU5と、RAM6とを有している。
記憶装置4は、BIOS7と、OS8と、翻訳ソフトウェア9とを記憶している。翻訳ソフトウェア9は、翻訳エンジン10と、辞書データ記憶手段11と、文書分析手段12と、表示制御手段13と、訳語候補表示手段14と、照合手段15とを有している。
上記機械翻訳装置1の各構成手段の作用または処理については機械翻訳装置1の処理の流れの中で説明する。
図2は機械翻訳装置1による処理の流れを示している。
図2において、機械翻訳装置1による処理が開始されると(ステップS11)、機械翻訳装置1はコンピュータの表示装置の画面(コンピューター画面)上に3つの対訳画面を表示する(ステップS12)。3つの対訳画面は、たとえば図3に示すように、原文を表示する原文画面と、原文と異なる言語による一次翻訳文を表示する一次翻訳画面と、一次翻訳文の言語と異なる言語による二次翻訳文を表示する二次翻訳画面である。なお、図3の例においては、原文、一次翻訳文、二次翻訳文はそれぞれ英文、日本文、韓国文とからなるが、むろん言語はこれらに限られない。また、原文と一次翻訳文、一次翻訳文と二次翻訳文がそれぞれ異なる言語であればよいので、原文と二次翻訳文が同一の言語になってもよい。さらに、図3の例では3つの対訳画面が表示されているが、本発明は3つ以上の対訳画面を同時に表示することができる。
また、翻訳の準備の一つとして、辞書データ記憶手段11から使用する言語の辞書データが呼び出されRAM6上に一時的に記憶される。このとき、文書の種類によって辞書データは特殊な翻訳や文字の書式も併せて変換するものであることが好ましい。たとえば、図3は特許出願の文書の例を示しているが、特許出願の文書においては、たとえば"I claim"は「特許請求の範囲」というように特殊な用語に翻訳され、また、たとえば"Patent Number"を「特許番号」に翻訳する際は、「特許番号」の両側にすみ付き括弧を付すというような文字の特殊な書式も辞書データとして有していることが好ましい。
次に、機械翻訳装置1は入力手段3により、原文のデータを入力して翻訳を開始する(ステップS13)。翻訳は、原文から原文と異なる言語による一次翻訳文へ翻訳し、次に一次翻訳文を被翻訳文として二次翻訳文に翻訳する(ステップS14)。
詳細には、翻訳は以下のような処理で行う。
最初に、原文データが入力されると、文書分析手段12が、原文のデータに対して、句読点や改行やスペース等の文章の区切を示す区切データを検索し、当該区切データによって原文を文章単位に分解する。
次に、翻訳エンジン10が上記文書分析手段12によって分解された原文を、文章単位ごとに、原文を被翻訳文として一次翻訳文へ翻訳し、さらに一次翻訳文を二次翻訳文に翻訳する。翻訳に際して、翻訳エンジン10は、文法ルール等を参照し、構文解析を行い、辞書データから訳語を選択し、翻訳文の生成ルールを参照して翻訳文を生成するが、本発明は翻訳エンジンについて特許を取得するものではないため、公知の任意の翻訳エンジンを使用することができる。
次に、機械翻訳装置1は原文、一次翻訳文、二次翻訳文をコンピューター画面上で文章ごとに対比可能に配列表示する(ステップS15)。
「原文、一次翻訳文、二次翻訳文を文章ごとに対比可能に配列表示する」とは、表示制御手段13が、原文画面と一次翻訳画面と二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、前記作成された原文と一次翻訳文と二次翻訳文のデータを入力し、原文と一次翻訳文と二次翻訳文の対応する文章に番号(同一番号)を付与し、原文と一次翻訳文と二次翻訳文の対応する文章のそれぞれの桁数を計算し、原文を原文画面に、一次翻訳文を一次翻訳画面に、二次翻訳文を二次翻訳画面にそれぞれ対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示する。
原文画面と一次翻訳画面と二次翻訳画面の下端部分の処理については、表示制御手段13は、前記配列表示した場合の原文と一次翻訳文と二次翻訳文の各対応する文章の表示される列方向の桁数データ(縦方向の表示位置)を計算し、原文と一次翻訳文と二次翻訳文の対応する文章の列方向の桁数データ(縦方向の表示位置)のいずれかが、その表示される画面の列方向の桁数(画面の下端行の表示位置)を超えるときに、該対応する文章については原文画面と一次翻訳画面と二次翻訳画面の次頁に表示するように制御する。
また、表示制御手段13は、カーソルやスクロールボタンの入力信号を検知し、ユーザーが原文画面と一次翻訳画面と二次翻訳画面のいずれかについて、次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御する。
図4は、以上の「原文、一次翻訳文、二次翻訳文を文章ごとに対比可能に配列表示する」の例を示している。
さらに、表示制御手段13は、ユーザーが原文と一次翻訳文と少なくとも二次翻訳文のいずれかの単語を指定したときは、辞書データ記憶手段11(辞書データ)から当該単語を検索し、原文または一次翻訳文または二次の翻訳文の当該対応する文章において、該当する単語を検索して強調表示する(ステップS16)。図4は、対応する単語を強調表示した例を示している。
本実施形態の機械翻訳装置1は、上記対訳画面において、ユーザーに自由に編集させ、かつ、ユーザーによる編集の結果を学習し、次の翻訳の時の精度の向上に寄与させる。機械翻訳装置1による編集は、大別して自動再翻訳機能と、翻訳学習機能とがある。
自動再翻訳機能は、対訳画面のいずれかの画面の文章を編集して再翻訳を指示すると、その画面以降(翻訳の順番の下流)の画面の翻訳文について自動的に再翻訳する機能である。
すなわち、原文画面と一次翻訳画面と二次翻訳画面はいずれもユーザーによって編集可能であり、ユーザーが原文画面において原文を修正して再翻訳を指示したときは、翻訳エンジン10は、修正された原文を一次翻訳文へ再翻訳し、さらに再翻訳された一次翻訳文を二次翻訳文に再翻訳し、表示制御手段13は、修正された原文を原文画面に、再翻訳された一次翻訳文を一次翻訳画面に、再翻訳された少なくとも二次の翻訳文を二次翻訳画面に自動的に表示し、ユーザーが一次翻訳画面において一次翻訳文を修正して再翻訳を指示したときは、原文から一次翻訳文に翻訳することを抑制するフラグが立てられ、翻訳エンジン10は、修正された一次翻訳文を二次翻訳文に再翻訳し、表示制御手段13は、原文はそのまま原文画面に、修正された一次翻訳文を一次翻訳画面に、再翻訳された二次の翻訳文を二次翻訳画面に自動的に表示するのである。
翻訳学習機能は、図4に示すように、ユーザーが一次翻訳画面において一次翻訳文の所定の単語を指定したときに、訳語候補表示手段14が、辞書データ記憶手段11(辞書データ)から前記単語を二次翻訳文に翻訳する場合の訳語候補を複数個検索して表示し、ユーザーに選択させる(ステップS17)。このとき、ユーザーが訳語候補から訳語を選択する代わりに、ユーザーが独自に入力可能にすることができる。
ユーザーが表示された複数の訳語候補のうちのいずれかを指定したときに、訳語候補表示手段14は、翻訳エンジン10に指定された訳語によって二次翻訳文を再翻訳させる(ステップS18)。このとき、前記自動再翻訳機能により、編集された翻訳文の下流の翻訳文について自動的に再翻訳させることが好ましい。
さらに、訳語候補表示手段14は、訳語候補のうちユーザーによって所定の訳語が選択された場合は、辞書データの当該原語と訳語に対応関係を示す信号(優先度の信号)を付し、翻訳エンジン10はそれ以降の翻訳において前記原語に対しては前記対応関係を示す信号を付された訳語を優先的に適用することにより、ユーザーによって指示された翻訳の方法を学習し、翻訳精度を向上させることができる。
ユーザーによる編集を補助するために、必要に応じて原文、一次翻訳文、二次翻訳文について、スペリングあるいは文法をチェックすることもできる(ステップS19)。
以上の説明は、原文と一次翻訳文と二次翻訳文がそれぞれ異なる言語の場合を念頭に説明したが、次に、原文と二次翻訳文が同一言語になるようにし、これによって原文から一翻訳文への翻訳の正しさを簡単にチェックできるようにした実施形態について以下に説明する。
図5は、原文から目的の言語に翻訳された一次翻訳文の翻訳の正しさを効率よくチェックするための処理の流れを示している。
本実施形態において、機械翻訳が開始されると(ステップS21)、機械翻訳装置1はコンピュータの表示装置の画面(コンピューター画面)上に3つの対訳画面を表示し(ステップS22)、入力手段3により原文のデータが入力され、翻訳が開始される(ステップS23)。
本実施形態における機械翻訳は、原文は目的の言語の一次翻訳文に訳出され(ステップS24)、次に一次翻訳文は原文と同一言語の二次翻訳文に訳し戻される(ステップS25)。
原文と訳出された一次翻訳文と二次翻訳文は、表示制御手段13により対応する文章の文章ごとに対応可能に配列表示される(ステップS26)。
上記「文章ごとに対比可能に配列表示される」というのは、図2の実施形態と同様に、原文と一次翻訳文と二次翻訳文の対応する文章の開始行がコンピューター画面上で同一行に表示され、原文と一次翻訳文と二次翻訳文のいずれかの画面が次頁にスクロールされるときは、原文と一次翻訳文と二次翻訳文の画面が連動して同時に次頁にスクロールされるということである。
本実施形態において特徴的なのは、照合手段15により、原文と二次翻訳文が照合され、相違部分が強調表示されることである(ステップS27)。
図6は、原文と二次翻訳文の相違部分が強調表示された対訳画面の例を示している。このとき、原文と二次翻訳文の相違部分に対応する一次翻訳文の単語(部分)も強調表示される。
本実施形態は、上記対訳画面を表示したところで、さらにユーザーに一次翻訳文を修正させ、学習および再翻訳を行う(ステップS28)。
学習機能は、前述したように、ユーザーに訳語候補から訳語を選択させ、あるいはユーザーに独自に訳語を入力させ、それ以降の翻訳で当該訳語によって翻訳するようにする。
図6の例は、原文の日本文が目的の英文による一次翻訳文に翻訳され、再び日本文による二次翻訳文に訳し戻されている。図6の例では、原文の「先生」が二次翻訳文の「インストラクター」に訳し戻され、相違部分として強調表示されている。相違の原因として、日本文から英文に翻訳されるときに「先生」の訳語、"instructor", "teacher", "professor", "doctor"のうち"instructor"が選択され、それが日本文に訳し戻されるときに「インストラクター」に訳し戻されたことが一目で分かるようになっている。
この場合に、図6に示すように、訳語候補表示手段14により「先生」の訳語候補として"instructor", "teacher", "professor", "doctor"を表示し、ユーザーが訳語"teacher"を選択すれば、原文と二次翻訳文の相違部分が解消することが考えられる。
あるいは、"instructor"を日本文に訳し戻す際に、「先生」と訳させるように辞書データを学習させれば、それ以降の翻訳においては原文と二次翻訳文の相違部分が解消することが考えられる。
なお、特殊な翻訳については、ユーザーに入力させ、辞書データに登録するようにするのが好ましい。
本実施形態において、原文と二次翻訳文が一致する文章については、原文から一次翻訳文そして一次翻訳文から二次翻訳文に忠実に、すなわちもっとも一般的に採用されるであろう訳語によって翻訳している場合が多いので、正しい翻訳である可能性が高い。一方、原文と二次翻訳文が相違する文章は、原文から一次翻訳文に翻訳される際あるいは一次翻訳文から二次翻訳文に翻訳される際に、訳語の候補の選択が相違したことによることが多い。この場合には、一般的な訳語が選択されなかったことが多い。
したがって、本実施形態によれば、原文と二次翻訳文の相違部分について翻訳をチェックすることにより、不自然な翻訳を効率よくチェックすることができる。また、辞書データを学習させることにより、翻訳精度が高い機械翻訳装置を得ることができるようになる。
なお、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づいて種々の変形が可能であり、これらを本発明の範囲から排除するものではない。
本発明の一実施形態による機械翻訳装置のコンピューターにおける構成図。 本発明の一実施形態による機械翻訳装置の処理の流れを示したフローチャート。 対訳画面のコンピューター画面例を示した図。 原文、一次翻訳文、二次翻訳文を文章ごとに対比可能に配列表示するコンピューター画面例を示した図。 本発明の一実施形態による機械翻訳装置の処理の流れを示したフローチャート。 原文と二次翻訳文の相違部分を強調表示したコンピューター画面例を示した図。
符号の説明
1 機械翻訳装置
2 出力手段
3 入力手段
4 記憶装置
5 CPU
6 RAM
7 BIOS
8 OS
9 翻訳ソフトウェア
10 翻訳エンジン
11 辞書データ記憶手段
12 文書分析手段
13 表示制御手段
14 訳語候補表示手段
15 照合手段

Claims (5)

  1. 原文のデータを入力する入力手段と、
    前記原文のデータに対して、句読点や改行を含む文章の区切を示す区切データを検索し、当該区切データによって原文を文章単位に分解する文書分析手段と、
    前記原文を被翻訳文として被翻訳文と異なる言語による一次翻訳文へ翻訳する場合の辞書データと、少なくとも前記一次翻訳文を被翻訳文として被翻訳文と異なる言語による二次翻訳文に翻訳する場合の辞書データを有する辞書データ記憶手段と、
    前記文章単位に分解された原文のデータを入力し、文章単位ごとに、前記原文を被翻訳文として前記一次翻訳文へ翻訳し、さらに少なくとも前記一次翻訳文を前記二次翻訳文に翻訳する翻訳エンジンと、
    コンピューター画面上で原文を表示する原文画面と、一次翻訳文を表示する一次翻訳画面と、少なくとも二次翻訳文を表示する二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、前記原文と一次翻訳文と少なくとも二次翻訳文のデータを入力し、前記原文と一次翻訳文と少なくとも二次翻訳文の対応する文章に番号を付与し、各対応する文章の桁数を計算し、前記原文を前記原文画面に、前記一次翻訳文を前記一次翻訳画面に、少なくとも前記二次翻訳文を前記二次翻訳画面にそれぞれ対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示し、カーソルまたはスクロールボタンの信号を検知し、ユーザーが原文画面と一次翻訳画面と少なくとも二次翻訳画面のいずれかを次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御し、さらに、ユーザーが原文と一次翻訳文と少なくとも二次翻訳文のいずれかの単語を指定したときに、前記辞書データ記憶手段から当該単語を検索し、原文または一次翻訳文または少なくとも二次の翻訳文の当該対応する文章において、該当する単語を検索して強調表示するようにした表示制御手段と、を有することを特徴とする3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置。
  2. 原文のデータを入力する入力手段と、
    前記原文のデータに対して、句読点や改行を含む文章の区切を示す区切データを検索し、当該区切データによって原文を文章単位に分解する文書分析手段と、
    前記原文を被翻訳文として原文と異なる言語による一次翻訳文へ翻訳する場合の辞書データと、前記一次翻訳文を被翻訳文として原文の言語による二次翻訳文に翻訳する場合の辞書データを有する辞書データ記憶手段と、
    前記文章単位に分解された原文のデータを入力し、文章単位ごとに、前記原文を被翻訳文として前記一次翻訳文へ翻訳し、さらに前記一次翻訳文を原文と同一言語の二次翻訳文に翻訳する翻訳エンジンと、
    コンピューター画面上で原文を表示する原文画面と、一次翻訳文を表示する一次翻訳画面と、二次翻訳文を表示する二次翻訳画面のそれぞれの行方向の桁数と列方向の桁数のデータを取得し、前記原文と一次翻訳文と二次翻訳文のデータを入力し、前記原文と一次翻訳文と二次翻訳文の対応する文章に番号を付与し、各対応する文章の桁数を計算し、前記原文を前記原文画面に、前記一次翻訳文を前記一次翻訳画面に、前記二次翻訳文を前記二次翻訳画面にそれぞれ対応する文章の開始行がコンピューター画面上で同一の行となるように配列表示し、カーソルまたはスクロールボタンの信号を検知し、ユーザーが原文画面と一次翻訳画面と二次翻訳画面のいずれかを次頁を表示させようとするときに、原文画面と一次翻訳画面と二次翻訳画面が同時に次頁を表示するように制御し、さらに、ユーザーが原文と一次翻訳文と二次翻訳文のいずれかの単語を指定したときに、前記辞書データ記憶手段から当該単語を検索し、原文または一次翻訳文または二次の翻訳文の当該対応する文章において、該当する単語を検索して強調表示するようにした表示制御手段と、
    前記原文と前記二次翻訳文とを照合し、前記原文と前記二次翻訳文の異なる部分を強調表示する照合手段と、を有することを特徴とする3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置。
  3. 前記原文画面と一次翻訳画面とすくなくとも二次の翻訳画面はいずれもユーザーによって編集可能であり、
    ユーザーが前記原文画面において原文を修正して再翻訳を指示したときは、前記翻訳エンジンは、修正された原文を前記一次翻訳文へ再翻訳し、さらに前記再翻訳された一次翻訳文を前記少なくとも二次の翻訳文に再翻訳し、前記表示制御手段は、修正された原文を前記原文画面に、再翻訳された前記一次翻訳文を前記一次翻訳画面に、再翻訳された前記少なくとも二次の翻訳文を前記少なくとも二次の翻訳画面に自動的に表示し、
    ユーザーが前記一次翻訳画面において一次翻訳文を修正して再翻訳を指示したときは、原文から一次翻訳文に翻訳することを抑制するフラグが立てられ、前記翻訳エンジンは、修正された一次翻訳文を前記少なくとも二次の翻訳文に再翻訳し、前記表示制御手段は、前記原文を前記原文画面に、修正された一次翻訳文を前記一次翻訳画面に、再翻訳された前記少なくとも二次の翻訳文を前記少なくとも二次の翻訳画面に自動的に表示する、ことを特徴とする請求項1または2に記載の3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置。
  4. ユーザーが前記一次翻訳画面において一次翻訳文の所定の単語を指定したときに、前記辞書データ記憶手段から前記単語を二次翻訳文に翻訳する場合の訳語候補を複数個検索して表示し、ユーザーが前記表示された複数の訳語候補のうちのいずれかを指定したときに、前記翻訳エンジンに前記訳語によって少なくとも二次以降の翻訳文を再翻訳させる訳語候補表示手段を有することを特徴とする請求項1〜3のいずれかに記載の3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置。
  5. 前記訳語候補表示手段は訳語候補のうちユーザーによって所定の訳語が選択された場合は、前記辞書データの当該原語と訳語に対応関係を示す信号を付し、前記翻訳エンジンはそれ以降の翻訳において前記原語に対しては前記対応関係を示す信号を付された訳語を優先的に適用することを特徴とする請求項4に記載の3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置。
JP2004006734A 2003-01-14 2004-01-14 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 Pending JP2004220616A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030002448A KR20040065468A (ko) 2003-01-14 2003-01-14 특허문서의 다국어 번역 처리방법 및 이 번역소프트웨어를 기록한 판독 가능한 기록매체

Publications (1)

Publication Number Publication Date
JP2004220616A true JP2004220616A (ja) 2004-08-05

Family

ID=32906496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004006734A Pending JP2004220616A (ja) 2003-01-14 2004-01-14 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置

Country Status (2)

Country Link
JP (1) JP2004220616A (ja)
KR (1) KR20040065468A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011021479A1 (ja) * 2009-08-21 2011-02-24 シャープ株式会社 情報処理装置、表示制御方法、およびプログラム
EP2783300A4 (en) * 2011-11-25 2015-12-23 Google Inc PROVISION OF TRANSLATION SUPPORT IN THE LOCALIZATION OF APPLICATIONS
JP2017151959A (ja) * 2016-02-24 2017-08-31 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science And Technology Co., Ltd. 人工知能に基づく指向翻訳方法及び装置
JP2018195248A (ja) * 2017-05-22 2018-12-06 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末及び翻訳表示方法
CN110476164A (zh) * 2017-04-05 2019-11-19 特斯雷特私人有限公司 语言翻译辅助器
CN111680525A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向差异识别的人机共译方法与***
CN111680527A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于专属机翻引擎训练的人机共译***与方法
CN111680526A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译***与方法
KR20210034867A (ko) * 2019-09-23 2021-03-31 네이버 주식회사 장문 번역 방법 및 시스템

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747427B2 (en) 2005-12-05 2010-06-29 Electronics And Telecommunications Research Institute Apparatus and method for automatic translation customized for documents in restrictive domain
KR100792203B1 (ko) * 2005-12-07 2008-01-08 한국전자통신연구원 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
KR101870729B1 (ko) 2011-09-01 2018-07-20 삼성전자주식회사 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법
EP4044047A1 (en) * 2018-08-29 2022-08-17 IPACTORY, Inc. Patent document creating device, method, computer program, computer-readable recording medium, server and system
CN114035760B (zh) * 2021-11-02 2023-03-24 珠海读书郎软件科技有限公司 一种基于双屏电话手表的翻译显示***及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62181171U (ja) * 1986-05-08 1987-11-17
JPH0188886U (ja) * 1987-11-30 1989-06-12
JPH03205009A (ja) * 1989-07-17 1991-09-06 Emilio Ambasz 伸縮自在のトランク製品

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62181171U (ja) * 1986-05-08 1987-11-17
JPH0188886U (ja) * 1987-11-30 1989-06-12
JPH03205009A (ja) * 1989-07-17 1991-09-06 Emilio Ambasz 伸縮自在のトランク製品

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011021479A1 (ja) * 2009-08-21 2011-02-24 シャープ株式会社 情報処理装置、表示制御方法、およびプログラム
JP2011044023A (ja) * 2009-08-21 2011-03-03 Sharp Corp 情報処理装置、表示制御方法、およびプログラム
CN102625935A (zh) * 2009-08-21 2012-08-01 夏普株式会社 信息处理装置、显示控制方法以及程序
EP2783300A4 (en) * 2011-11-25 2015-12-23 Google Inc PROVISION OF TRANSLATION SUPPORT IN THE LOCALIZATION OF APPLICATIONS
JP2017151959A (ja) * 2016-02-24 2017-08-31 ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science And Technology Co., Ltd. 人工知能に基づく指向翻訳方法及び装置
US10055405B2 (en) 2016-02-24 2018-08-21 Beijing Baidu Netcom Science And Technology Co., Ltd. Computer-implemented directional translation method and apparatus
CN110476164A (zh) * 2017-04-05 2019-11-19 特斯雷特私人有限公司 语言翻译辅助器
JP2018195248A (ja) * 2017-05-22 2018-12-06 パナソニックIpマネジメント株式会社 翻訳表示装置、コンピュータ端末及び翻訳表示方法
KR102280535B1 (ko) * 2019-09-23 2021-07-22 네이버 주식회사 장문 번역 방법 및 시스템
KR20210034867A (ko) * 2019-09-23 2021-03-31 네이버 주식회사 장문 번역 방법 및 시스템
CN111680527A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于专属机翻引擎训练的人机共译***与方法
CN111680526A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译***与方法
CN111680525A (zh) * 2020-06-09 2020-09-18 语联网(武汉)信息技术有限公司 基于逆向差异识别的人机共译方法与***
CN111680526B (zh) * 2020-06-09 2023-09-08 语联网(武汉)信息技术有限公司 基于逆向翻译结果比对的人机交互翻译***与方法
CN111680527B (zh) * 2020-06-09 2023-09-19 语联网(武汉)信息技术有限公司 基于专属机翻引擎训练的人机共译***与方法
CN111680525B (zh) * 2020-06-09 2024-03-26 语联网(武汉)信息技术有限公司 基于逆向差异识别的人机共译方法与***

Also Published As

Publication number Publication date
KR20040065468A (ko) 2004-07-22

Similar Documents

Publication Publication Date Title
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JP5525529B2 (ja) 機械翻訳装置および翻訳プログラム
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP4886244B2 (ja) 機械翻訳装置および機械翻訳プログラム
US7983899B2 (en) Apparatus for and method of analyzing chinese
JP2017151768A (ja) 翻訳プログラム及び情報処理装置
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPS6337471A (ja) 翻訳方法及び装置
JP2870375B2 (ja) 文章訂正装置
JP2007034425A (ja) 翻訳装置、プログラム及び記憶媒体
JPH06124302A (ja) 機械翻訳システム
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JPH0954775A (ja) 翻訳方法及び機械翻訳装置
JPH04158477A (ja) 機械翻訳装置
JPH1166068A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JPS6180360A (ja) 翻訳方式
JPH07122876B2 (ja) 機械翻訳装置
JPH05257969A (ja) 機械翻訳方法および装置
JP3353873B2 (ja) 機械翻訳装置
JP2007034424A (ja) 文書データ処理装置、文書データ処理方法及び文書データ処理プログラム
JPH0444981B2 (ja)
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JPH09269945A (ja) メディア変換方法およびメディア変換装置
JP2007316761A (ja) データ処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060721

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003