JP5525529B2 - 機械翻訳装置および翻訳プログラム - Google Patents

機械翻訳装置および翻訳プログラム Download PDF

Info

Publication number
JP5525529B2
JP5525529B2 JP2011525684A JP2011525684A JP5525529B2 JP 5525529 B2 JP5525529 B2 JP 5525529B2 JP 2011525684 A JP2011525684 A JP 2011525684A JP 2011525684 A JP2011525684 A JP 2011525684A JP 5525529 B2 JP5525529 B2 JP 5525529B2
Authority
JP
Japan
Prior art keywords
translation
dictionary
data
language
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011525684A
Other languages
English (en)
Other versions
JPWO2011016078A1 (ja
Inventor
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JPWO2011016078A1 publication Critical patent/JPWO2011016078A1/ja
Application granted granted Critical
Publication of JP5525529B2 publication Critical patent/JP5525529B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

この発明は、機械翻訳装置および翻訳プログラムに関する。
近年、自然言語処理技術の向上により、異なる言語間の翻訳を行う機械翻訳ソフトが開発され、利用されている。
このような機械翻訳ソフトをコンピュータにインストールした機械翻訳装置が提供される。その機械翻訳装置では、専門用語辞書を含む大規模な辞書データを用いて翻訳を行っている。専門用語辞書を含む大規模辞書データは、原文に含まれる多くの用語・複合語に対して適切な訳語を与える。そして、翻訳文書の全体における訳語の統一性を保証するものである。
また、機械翻訳装置には、専門用語辞書の他にも、ユーザが登録することができるユーザ辞書を備えるものがある。ユーザ辞書は、システム辞書に収録されていない用語を正しく翻訳するために利用される。従って、システム辞書には専門用語に相当する用語を登録することが多い。
一方、機械翻訳ソフトの訳文の非流暢性をカバーするために、翻訳メモリ辞書を利用する翻訳システムが、利用可能になっている。この翻訳メモリ辞書は、システムやユーザが好ましいと判断した文単位で、対訳用として利用される。例えば、学会発表の論文や、特許出願用の明細書などで、比較的多く使われている文章とその訳文を翻訳メモリ辞書に登録しておく。このような翻訳メモリ辞書を参照・利用して翻訳することにより、専門的な表現の多い原文であっても、1文全体で自然な訳文を出力できるようにしている。一般的には、翻訳メモリ辞書に数万文の訳文が予め登録された機械翻訳ソフトが販売されている。
しかしながら、専門用語辞書やユーザ辞書(以下、専門用語辞書等と称する)と、翻訳メモリ辞書とは、それぞれ独立に開発されることが多い。そのため、専門用語辞書等と翻訳メモリ辞書では、矛盾するデータが存在する場合がある。
例えば、翻訳装置の日英翻訳用の専門用語辞書等に、例えば図22(a)のように、用語「音声認識装置」に対し訳語「speech recognition equipment」が登録されているとする。よって、この専門用語辞書等を利用すると、翻訳する原文中に「音声認識装置」という用語が出現すれば、「speech recognition equipment」と翻訳される。
同じ翻訳装置の翻訳メモリ辞書に、図22(b)に示す原文(J1)と訳文(E1)のような対訳が登録されているとする。この翻訳メモリ辞書を利用すると、翻訳する原文(J1)と一致すれば、訳文(E1)が出力される。しかしながら、原文(J1)の用語「音声認識装置」に対し、訳文(E1)では「voice recognizing unit」と訳されていることが分かる。
この専門用語辞書等とこの翻訳メモリ辞書を用いて翻訳を行うと、原文(J1)に一致した文章については翻訳メモリ辞書が参照される。その結果、用語「音声認識装置」に対して訳語「voice recognizing unit」が出力される。また、原文(J1)に一致しない文章では、用語「音声認識装置」が出現すると専門用語辞書等が参照される。その結果、用語「音声認識装置」に対して訳語「speech recognition equipment」が出力される。従って、一文書中に出現する用語「音声認識装置」に対して、訳語「speech recognition equipment」と訳語「voice recognizing unit」の2つの訳語が出力されることになる。このため、機械翻訳装置の特長である、訳語の統一性が損なわれてしまうと言う欠点があった。
出願人は、翻訳結果の整合性をとるための一つの解決手段として、第1単語に対応する第2単語をキャッシュメモリから取得し、取得した第2単語で第1単語を変換した第2単語を置換する規則翻訳部を有する機械翻訳装置を発明している(特許文献1を参照)。しかしながら、特許文献1では、専門用語辞書等と翻訳メモリ辞書の訳語の整合性を取るものではない。
特開2008−176536号公報
本発明は、上記欠点を解決するためになされたものであって、専門用語辞書等と翻訳メモリ辞書を併用しても、文書全体の訳語の統一性を損なわない機械翻訳装置および翻訳プログラムを提供することを目的とする。
上記目的を達成するために、本発明の機械翻訳装置は、第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によって前記第2言語に翻訳すると共に、前記入力原文データを前記翻訳メモリ辞書との照合によって前記第2言語に翻訳する翻訳処理部と、前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳語を対にした訳語データを記憶する第1テーブルと、前記入力原文データの文章の中で前記翻訳メモリ辞書と照合した原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応データを記憶する第2テーブルと、前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳語データとを比較照合し、不整合な訳語の有無を検出した場合、対話不整合データを生成する不整合検査部と、前記不整合検査部で生成した前記対話不整合データを出力し、前記対話不整合データで示される前記不整合な訳語の中から前記専門用語辞書から得た訳語又は前記翻訳メモリ辞書から得訳語のどちらかをユーザに選択させる選択部と、前記選択部により選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳メモリ辞書から得た訳文の前記不整合な訳語を統一するように修正する修正部と、を備えたことを特徴とする。
また、本発明の機械翻訳プログラムは、第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳語を対にした訳語データを記憶する第1テーブルと、前記入力原文データの文章の中で前記翻訳メモリ辞書と照合した原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応データを記憶する第2テーブルと、前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によって前記第2言語の訳文データを作成すると共に、前記翻訳メモリ辞書との照合によって前記第2言語の訳文データを作成する翻訳処理部と、を有する機械翻訳装置の翻訳プログラムであって、前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳語データとを比較照合し、不整合な訳語の有無を検出する機能と、前記不整合な訳語を検出した場合、対話不整合データを生成して、ユーザによって認識可能に出力する機能と、前記対話不整合データで示される前記不整合な訳語の中から前記専門用語辞書から得た訳語又は前記翻訳メモリ辞書から得た訳語のどちらかをユーザに選択させる機能と、前記選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳メモリ辞書から得た訳文の前記不整合な訳語を統一するように修正する機能と、を備えたことを特徴とする。
本発明によれば、専門用語辞書等と翻訳メモリ辞書を併用しても、文書全体の訳語の統一性を損なうことなく、訳語を統一して正しい翻訳を行うことができる。従って、ユーザによる訳語の修正作業を削減することができる。
本発明の第1の実施形態に係る機械翻訳装置を示すブロック図。 第1の実施形態の専門用語辞書の例を示す図。 第1の実施形態の翻訳メモリ辞書の例を示す図。 第1の実施形態の用語対応データの例を示す図。 第1の実施形態の対訳不整合データの例を示す図。 第1の実施形態の処理手順を示したフローチャート。 第1の実施形態の不整合検査結果の出力例を示す図。 本発明の第2の実施形態に係る機械翻訳装置を示すブロック図。 第2の実施形態の原文と訳文の例を示す図。 第2の実施形態の訳語不整合データの出力例を示す図。 第2の実施形態の翻訳メモリ辞書を使った訳文を修正する例を示す図。 第2の実施形態の翻訳メモリ辞書を使った訳文を修正する他の例を示す図。 第2の実施形態の翻訳メモリ辞書を使った訳文の修正・確認を示す図。 第2の実施形態の専門用語辞書を使った訳文を修正する第3の例を示す図。 第2の実施形態の専門用語辞書を使った訳文を修正する第4の例を示す図。 第2の実施形態の専門用語辞書を使った訳文の修正・確認を示す図。 第2の実施形態の訳語修正の他の処理手順を示したフローチャート。 本発明の第4の実施形態に係る機械翻訳装置を示すブロック図。 第4の実施形態に係る修正後の翻訳メモリ辞書を示す図。 第4の実施形態に係る修正後の専門用語辞書を示す図。 訳語不整合チェックを設定するための画面。 専門用語辞書と翻訳メモリ辞書を用いた対応不整合が発生する辞書の一例を示す図。
以下に、本発明の実施形態に係る機械翻訳装置および翻訳プログラムを詳細に説明する。
(第1の実施形態)
第1の実施形態の機械翻訳装置および翻訳プログラムでは、翻訳メモリ辞書との照合により得られた対訳文から訳語の対応情報を取得して、翻訳された用語についての原文と訳語の用語対応データを作成する。そして、最初の基本語辞書を用いた翻訳時に同時に利用される専門用語辞書等の訳語データと、翻訳メモリ辞書との照合により得られた前記用語対応データとの対訳不整合データを検査して出力するものである。なお、本発明の翻訳プログラムをインストールした機械翻訳装置としては、パーソナルコンピュータ、デスクトップコンピュータ、PDA等、いずれのものでも良い。
以下の説明では、翻訳の原文を第1言語とし、翻訳したい目的言語を第2言語とする。ここでは、第1言語として日本語、第2言語として英語を用いた場合の例について説明する。しかしながら、第1言語および第2言語の組み合わせはこれに限るものではなく、フランス語、ドイツ語、イタリア語、中国語、韓国語等、あらゆる言語の組み合わせについて適用することができる。
図1は、第1の実施形態の機械翻訳装置のブロック図である。機械翻訳装置100は、第1言語文書入力部110と、翻訳辞書検索・形態素解析部120と、翻訳メモリ辞書検索部130と、解析・変換・生成部140と、第2言語文書出力部150を有する。これらの処理部によって翻訳処理が実行される。本実施形態では、更に、アライメント抽出部160と、対訳不整合検査部170と、不整合検査出力部180を備えている。これらの処理部によって、翻訳に利用された専門用語辞書と翻訳メモリ辞書との対訳不整合データを検査して、その結果を出力するものである。
また、本実施形態では、翻訳処理時に照合される辞書として、基本語辞書200、専門用語辞書210、翻訳メモリ辞書220、解析・変換・生成辞書230が設けられている。また、各種の作業データを記憶するものとして、解析・変換・生成部140によって作成された第2言語訳文文書データ(以下、単に訳文データと称する)を記憶する第2言語訳文文書データファイル300(以下、単に訳文データファイル300と称する)が設けられている。また、入力原文と専用用語辞書210との照合によって得られた訳語データを記憶する訳語データテーブル310が設けられている。
また、入力原文と翻訳メモリ辞書220との照合によって得られた訳文データを記憶する訳文データテーブル320が設けられている。また、アライメント抽出部160が訳文データから作成した用語対応データを記憶する用語対応データテーブル330が設けられている。更に、対訳不整合検査部170によって作成された対訳不整合データを記憶する対応不整合データテーブル340が設けられている。これらのテーブルは、機械翻訳装置の主記憶装置の作業領域に割り当てられる。また、機械翻訳装置の外部メモリの作業領域に割り当てても良い。
第1言語文書入力部110は、翻訳対象である第1言語の原文テキストデータを入力する装置である。この第1言語文書入力部110は、例えば、キーボード、OCR、イメージスキャナ、原文記憶メモリなど、計算機の一般的な入力装置で構成される。
翻訳辞書検索・形態素解析部120は、第1言語文書入力部110から送られてくる原文テキストデータに対して、基本語辞書200および専門用語辞書210を使って単語辞書を検索した後に、形態素解析処理を行う。この辞書検索・形態素解析手法は、既存の技術を用いて実現して良い。翻訳辞書検索・形態素解析部120は、形態素解析結果を解析・変換・生成部140に出力する。また、翻訳辞書検索・形態素解析部120は、原文テキストデータの単語の中で専門用語辞書210と照合した単語とその訳語を対にして、訳語データテーブル310に記憶する。
翻訳メモリ辞書検索部130は、第1言語文書入力部110から送られてくる原文テキストデータに対して、翻訳メモリ辞書220の検索処理を行う。この検索手法は、既存の技術を用いて実現して良い。翻訳メモリ辞書検索部130は、翻訳メモリ辞書220の検索により原文テキストデータと一致する原文文章があった場合、その訳文データを解析・変換・生成部140へ出力する。また、翻訳メモリ辞書検索部130は、一致した文章データとその訳文データを訳文データテーブル320に記憶する。
解析・変換・生成部140は、翻訳辞書検索・形態素解析部120および翻訳メモリ辞書検索部130からの出力データを受けて、第1言語での構文解析処理、第1言語から第2言語への変換処理、第2言語の生成処理を行う。翻訳メモリ辞書検索部130からの出力結果によっては、構文解析処理、変換処理は省略する場合がある。いずれの場合も、構文解析処理技術、変換処理技術、および訳語生成処理技術は、既存の技術を用いて実現して良い。解析・変換・生成部140は、第2言語に生成した訳文データを訳文データファイル300に記憶する。
第2言語文書出力部150は、訳文データファイル300に記憶される訳文データを読み出して、ユーザに提供するために出力する。この第2言語文書出力部150は、例えば、CRT、液晶ディスプレイ、プリンタなどの一般的な出力装置で構成される。
次に、アライメント抽出部160は、訳文データテーブル320に記憶されている一致した原文文章とその訳文データとを解析し、一致した原文文章中の用語と訳文データ中の訳語との対応関係を抽出する。この対応関係の抽出手法は、既存の技術を用いて実現して良い。アライメント抽出部160は、抽出できた用語・訳語対を用語対応データとして用語対応データテーブル330に記憶する。
対訳不整合検査部170は、訳語データを記憶する訳語データテーブル310の内容と用語対応データテーブル330の内容とを照合し、同じ第1言語の用語に対して異なる第2言語の訳語が存在すると、その結果を対訳不整合データとして対訳不整合データテーブル340に記憶する。
不整合検査出力部180は、対訳不整合データテーブル340に記憶される対訳不整合データを出力する装置である。この不整合検査出力部180は、例えばCRT、液晶ディスプレイ、プリンタなどの一般的な出力装置で構成される。勿論、不整合検査出力部180と第2言語文書出力部150を兼用しても良い。
図2は、訳語データテーブル310に記憶される訳語データの一例を示したものである。訳語データは、例えば「専門辞書用語、訳語、専門辞書名」から構成される。「専門辞書用語」は、第1言語の原文テキストデータ中で専門用語辞書210と照合した単語又は用語である。「訳語」は、専門用語辞書210との照合によって得られた訳語(第2言語)である。「専門辞書名」は、その専門用語辞書210の照合した辞書名を示す。
図2の例では、専門用語辞書210と照合した単語「機械翻訳システム」に対し、その訳語「machine translation system」と、その辞書名「情報」が記憶されている。同様に、単語「音声翻訳装置」に対し、その訳語「speech recognition equipment」と、その辞書名「情報」が記憶されている。
図3は、訳文データテーブル320に記憶される訳文データの一例を示したものである。訳文データは、例えば「原文、訳文、メモリ辞書名、対訳ID」から構成される。そして、「原文」は、原文テキストデータ中で翻訳メモリ辞書220と照合して一致した場合の原文文章そのものである。「訳文」は、翻訳メモリ辞書220から得られた一致した原文文章に対応する訳文である。「メモリ辞書名」は、翻訳メモリ辞書220の辞書名である。「対訳ID」は、訳文データに付された重複しない番号である。「対訳ID」は、以降で利用しない場合は持つ必要がない。
図3では、原文文章「図1は、音声認識装置の認識処理の流れを示すフローチャートである。」に対し、訳文データ「Fig. 1 shows a flow chart of the recognition process in the voice recognizing unit.」の例が記載されている。この場合、メモリ辞書名としては「特許」が設定され、また対訳IDとして「#37」が設定されている。
図4は、用語対応データテーブル330に記憶される用語対応データの一例を示したものである。用語対応データは、例えば「用語、訳語およびメモリ辞書名」から構成される。「用語と訳語」は、アライメント抽出部160によって訳文データテーブル320の「原文」から抽出された用語であり、「訳文」から抽出された対応する訳語である。「メモリ辞書名」は、用語対応データテーブル330の訳文に記憶される翻訳メモリ辞書220の辞書名である。アライメント抽出部160によって生成された用語対応データは、用語対応データテーブル330に記憶される。
図4では、図3に示した訳文データテーブル320の「原文」と「訳文」から抽出した対
応訳語データとして、用語「音声認識装置」とその訳語「voice recognizing unit」と、
用語「認識処理」とその訳語「recognition process」と、用語「フローチャート」とそ
の訳語「flow chart」が例示されている。「メモリ辞書名」は、3 用語とも同じ「特許
」である。

図5は、対訳不整合データテーブル340に記憶される対訳不整合データの一例を示したものである。図5(a),(b)ともに、対訳不整合データは、例えば「用語、専門用語辞書の訳語、専門用語辞書名、翻訳メモリ辞書の訳語、翻訳メモリ辞書名」から構成される。「用語」は、訳語データテーブル310に記憶される訳語データ(図2を参照)と、用語対応データテーブル330に記憶される用語対応データ(図4を参照)との共通する用語である。図5では、「音声認識装置」が共通する用語となる。
「専門用語辞書の訳語」は、訳語データテーブル310から得られた「用語」に対応する訳語である。「専門用語辞書名」は、訳語データテーブル310から得られた「用語」に対応する専門辞書名である。「翻訳メモリ辞書の訳語」は、用語対応データテーブル330から得られた「用語」に対応する訳語である。「翻訳メモリ辞書名」は、用語対応データテーブル330から得られた翻訳メモリ辞書名である。つまり、用語対応データの基となる翻訳メモリ辞書220の「用語」に対応する翻訳メモリ辞書名である。
図5(a)では、共通する用語「音声認識装置」に対応して専門用語辞書210との照合により得られた訳語「speech recognition equipment」と、その専門辞書名「情報」と、翻訳メモリ辞書220との照合によって得られた用語対応データからの訳語「voice recognizing unit」と、そのメモリ辞書名「特許」とを示している。
図5(b)では、図5(a)に「翻訳メモリ辞書の対訳ID」を更に含むものである。この「翻訳メモリ辞書の対訳ID」は、翻訳メモリ辞書220との照合によって一致した原文文章に対応して付与された重複しない対訳IDである。この場合、図3の対話IDと同じID情報「#37」が設定されている。
次に、本実施形態の動作を説明する。○
図6は、本実施形態の機械翻訳装置の処理過程を示したフローチャートである。ここでは、以下の動作を実行する翻訳プログラムが、予め機械翻訳装置にインストールされているとして説明する。
翻訳辞書検索・形態素解析部120は、第1言語文書入力部110からの原文テキストデータを受けて、基本語辞書200、専門用語辞書210を使って単語辞書を検索した後に(ステップS10)、形態素解析処理を行う(ステップS20)。そして、翻訳辞書検索・形態素解析部120は、形態素解析結果を解析・変換・生成部140に出力する。ステップS10で、翻訳辞書検索・形態素解析部120は、原文テキストデータの単語の中で専門用語辞書210と照合した単語とその訳語を対にした訳語データ(図2を参照)を、訳語データテーブル310に記憶する。
また、翻訳メモリ辞書検索部130は、第1言語文書入力部110から送られてくる原文テキストデータに対して、翻訳メモリ辞書220の検索処理を行う(ステップS30)。また、翻訳メモリ辞書検索部130は、原文テキストデータの文章中で翻訳メモリ辞書220との照合で一致した原文文章とそれに対応する訳文データ(図3を参照)を、訳文データテーブル320に記憶する。翻訳メモリ辞書220との照合で一致した原文文章がなければ、翻訳メモリ辞書検索部130からは何も出力されない。
解析・変換・生成部140は、翻訳辞書検索・形態素解析部120および翻訳メモリ辞書検索部130からの出力データを受けて、第1言語での構文解析処理(ステップS40)、第1言語から第2言語への変換処理(ステップS50)、第2言語の生成処理(ステップS60)を行う。解析・変換・生成部140は、第2言語に生成した訳文データを訳文データファイル300に記憶する(ステップS70)。
第2言語文書出力部150は、訳文データファイル300に記憶される訳文データを読み出して、ユーザに提供するために出力する(ステップS80)。
以上の翻訳処理が終了すると、対訳不整合検査部170は訳語データテーブル310に記憶されている訳語データの内容を調べる(ステップS100)。照合した訳語が無ければ、処理を終了する。
また、アライメント抽出部160は、訳文データテーブル320に記憶されている一致した原文文章とその訳文データとを解析し、原文文章中の用語と訳文データ中の訳語との対応関係を抽出する(ステップS110)。対応関係が抽出されなければ、処理を終了する。アライメント抽出部160は、抽出できた用語・訳語対を用語対応データ(図4を参照)として用語対応データテーブル330に記憶する。
次に、対訳不整合検査部170は、訳語データテーブル310に記憶される訳語データと用語対応データテーブル330に記憶された用語対応データとを比較照合し、同じ第1言語の用語に対するもので訳語が異なるものが存在するか否かを調べる。そして、対訳不整合検査部170は、同じ第1言語の用語に対するもので訳語が異なるものがあれば、対応不整合データ(図5を参照)を生成して、対訳不整合データテーブル340に記憶する(ステップS120)。対訳不整合データが無ければ、処理を終了する。そして、不整合検査出力部180は、対訳不整合データファイル340に記憶された対話不整合データをユーザに出力する(ステップS130)。
図7は、不整合検査出力部180による対訳不整合データの出力例である。即ち、図5の対応不整合データに基づいて、用語「音声認識装置」に対し専門用語辞書210との照合で「speech recognition equipment」が出力され、翻訳メモリ辞書220との照合で「voice recognizing unit」が出力されたことが表示されている。
図7(a)では、図5(a)に示した用語「音声認識装置」、専門用語辞書からの訳語「speech recognition equipment」、専門辞書名「情報」、翻訳メモリ辞書からの訳語「voice recognizing unit」、翻訳メモリ辞書名「特許」が順に表示して実現している。これにより、ユーザは、第2言語文書出力部150から出力される訳文データに、訳語の不整合なものがあることが認識できるようになる。
図7(b)では、図5(b)に示した「翻訳メモリ辞書の対訳ID」を利用して、図3の訳文データから「原文」と「訳文」を取り出して、それぞれを下段に表示することで実現している。
このように、本実施形態に係る機械翻訳装置及び翻訳プログラムでは、翻訳に使用している専門用語辞書と翻訳メモリ辞書によって訳語の統一がとれない用語に関する情報を簡単に検知する可能となる。ユーザは、この情報をもとに、専門用語辞書の訳語を変更するか、翻訳メモリ辞書の対訳データを修正して改めて翻訳することにとって、訳語の統一の取れた訳文を得ることができる。
(第2の実施形態)
図8は、第2の実施形態に係る機械翻訳装置を示すブロック図である。この機械翻訳装置は、第1言語文書入力部110と、翻訳辞書検索・形態素解析部120と、翻訳メモリ辞書検索部130と、解析・変換・生成部140と、第2言語文書出力部150に加えて、アライメント抽出部160と、対訳不整合検査部170と、原文訳文データファイル400と、不整合用語選択部410と、訳語修正部420を備えている。第1言語文書入力部110〜対訳不整合検査部170の各構成は、図1に示したものと同じである。
不整合用語選択部410は、図1に示した不整合検査出力部180の機能に加えて、対訳不整合データで示された異なる訳語の中から、ユーザがいずれかを選択することを可能にするものである。不整合用語選択部410は、例えばCRT、液晶ディスプレイ、プリンタなどの一般的な出力装置と、キーボード、マウスなどの一般的な入力装置で構成される。勿論、不整合用語選択部410と第2言語文書出力部150を兼用しても良い。
また、訳語修正部420は、不整合用語選択部410におけるユーザの選択結果に応じて、原文訳文データファイル400に記憶される訳文データを修正するものである。勿論、不整合用語選択部410と、第2言語文書出力部150と、訳語修正部420の機能を1つの装置で実現しても良い。
原文訳文データファイル400は、第1言語の原文テキストデータ、第2言語の訳文データに加えて、専門用語辞書210と照合した全用語データと対応する全訳語データ、翻訳メモリ辞書220との照合により得られた用語対応データを記憶している。
図9は、第2の実施形態における原文訳文データファイル400の一例を示したものである。原文訳文データファイル400は、例えば「番号、原文(第1言語)、および訳文(第2言語)」から構成される。
「原文」は、専門用語辞書210、または翻訳メモリ辞書220を使って翻訳した第1言語の原文を示すものである。そして、専門用語辞書210と照合した用語には<tech id =n name=辞書名>の情報が付与されている。また、翻訳メモリ辞書220から抽出した用語部分には<mem id=m name=辞書名>の情報が付与されている。ここで、n,mは、文中の用語を区別する番号である。nameに続く辞書名は、専門用語辞書名および翻訳メモリ辞書名である。図9の例では、文番号46,79の原文は、図3の原文テキストデータと一部異なる箇所が存在するが、翻訳メモリ辞書220との照合処理では、一部の差異の置換えが可能である。したがって、訳文も差異部分を入れ替えたものを出力することができる。
また、図9の「訳文」は、原文に対応する第2言語の訳文データを示すものである。原文に<tech id=n name=辞書名>および<mem id=m name=辞書名>の情報を付与した用語の訳文にも、同じ情報が付与されている。「訳文」では、専門用語辞書名および翻訳メモリ辞書名は原文と共通するため、省略することができる。
図10は、第2の実施形態の不整合用語選択部410の出力例である。ここでは、図5に示した対訳不整合データに基づいて表示したものである。つまり、図10は、図7(b)に示した対訳不整合データの出力画面に、ユーザによる辞書選択用のボタンが設けられている。これにより、表示された用語に対する訳語として、専門用語辞書210の訳語を使用するか、翻訳メモリ辞書220の訳語を使用するか、ユーザが選択することができる。例えば、選択ボタン450により専門用語辞書の訳語を使用すると指定して「確認」ボタンを押すと、その用語「音声認識装置」とともに、選択結果が訳語修正部420に送られる。
訳語修正部420は、原文訳文データファイル400の中から、用語「音声認識装置」に一致する全データを検索し、対応する訳語が選択結果と異なる場合に、その訳語を選択した辞書の訳語に置換する。
例えば、図10で専門用語辞書210の訳語を使用すると指示した場合、図9の文番号18,24の訳文データは修正する必要はない。一方、文番号46,79の訳文データに対して、訳語修正部420は「voice recognizing unit」を「speech recognition equipment」に置換する処理を施す。
逆に、図10で翻訳メモリ辞書220の訳語を使用すると指示した場合、図9の文番号46,79の訳文データは修正する必要はない。一方、文番号18,24の訳文データに対して、訳語修正部420は「speech recognition equipment 」を「voice recognizing unit」に置換する処理を施す。
この様に、第2の実施形態によれば、訳語修正部420によりユーザの指定した辞書(専門用語辞書又は翻訳メモリ辞書)の訳語に従い訳文データの修正を行うことができる。
次に、図11〜図16は、図10での辞書選択によって訳文データを修正および確認する操作画面を示したものである。
図11は、図10で専門用語辞書210の訳語を使用すると指示した時に、翻訳メモリ辞書220を用いて翻訳された訳文データの修正を確認する表示例である。即ち、訳語修正部420の画面に、翻訳メモリ辞書220との照合で一致した原文文章とその訳文データを示すとともに、その翻訳メモリ辞書220が適用されて翻訳された最初の訳文が表示されている。ここでは、文番号46の原文文章と訳文データを示している。そして、用語「音声認識装置」の訳語は、専門用語辞書210を用いた訳語「speech recognition equipment」に置き換えられている。この場合、修正処理された用語とその訳語にはアンダーラインが付与されて、ユーザが確認し易い画面が提供されている。アンダーライン以外に、色づけ、網掛け等の表示でも構わない。ここでボタン[次へ→]を指示すると、翻訳メモリ辞書220の同じ原文文章が適用された次の訳文データが表示される。
図12は、図11でボタン[次へ→]を指示した結果の表示例である。ここでは、文番号79の原文文章と訳文データを示している。同様に、用語「音声認識装置」の訳語は、専門用語辞書210を用いた訳語「speech recognition equipment」に置き換えられている。ここで、ボタン[←前へ]が指示されると、同じ翻訳メモリ辞書が適用された1つ前の訳文データが表示される。この場合は、図11の表示画面に戻る。
図11又は図12の表示画面で、ボタン[確認]が指示されると、訳文データが修正され、図13の確認画面を経て、元の表示画面に戻る。この場合、ボタン[確認]で一括修正が行われるように設計されている。一括確認の場合、修正対象の訳文データに対し一括して修正が行われる。また、図11又は図12の表示画面で、ボタン[取消]が指示されると、訳文データの修正が取り消され、図10の表示画面に戻る。
図14は、図10で翻訳メモリ辞書220の訳語を使用すると指示した時に、専門用語辞書210の訳語を使った訳文データの修正を確認する表示例である。即ち、訳語修正部420の画面に、専門用語辞書210の対訳データを示すとともに、その専門用語辞書210が適用されて翻訳された最初の訳文が表示されている。ここでは、文番号18の原文文章と訳文データを表示している。そして、用語「音声認識装置」の訳語は、翻訳メモリ辞書220を用いた訳語「voice recognizing unit」に置き換えられている。この場合、修正処理された用語とその訳語にはアンダーラインが付与されて、ユーザが確認し易い画面が提供されている。ここでボタン[次へ→]が指示されると、専門用語辞書210の同じ訳語が適用された次の訳文データが表示される。
図15は、図14でボタン[次へ→]を指示した結果の表示例である。ここでは、文番号24の原文文章と訳文データを示している。同様に、用語「音声認識装置」の訳語は、翻訳メモリ辞書220を用いた訳語「voice recognizing unit」に置き換えられている。ここでボタン[←前へ]が指示されると、同じ専門用語辞書210の訳語が適用された1つ前の訳文データが表示される。この場合は、図14の表示画面に戻る。
図14又は図15の表示画面で、ボタン[確認]が指示されると、訳文データが修正され、図16の確認画面を経て、元の画面表示に戻る。この場合、一括修正が行われるように設計されている。また、図14又は図15の表示画面で、ボタン[取消]が指示されると、訳文データの修正が取り消され、図10の表示画面に戻る。
図17は、第2の実施形態における辞書選択後の他の修正処理を示すフローチャートである。上述の通り、図10の対訳不整合データの検出に基づく辞書選択において、専門用語辞書210の訳語を使用するとした場合に、図11および図12の処理工程を経て翻訳メモリ辞書220のデータを修正していた。また、翻訳メモリ辞書220の訳語を使用するとした場合に、図14および図15の処理工程を経て専門用語辞書210の訳語を修正するとした。図17では、個々の訳文データによって適用したい訳語を選択する場合の、処理を示すものである。
まず、対訳不整合データの検出に基づき、図10の操作画面より、専門用語辞書210の訳語を使用するか、翻訳メモリ辞書220の訳語を使用するかをユーザが選択して指示する(ステップS200)。専門用語辞書210の訳語を使用すると指示した場合は、ステップS210へ進む。また、翻訳メモリ辞書220の訳語を使用すると指示した場合は、ステップS250へ進む。
専門用語辞書210の訳語を使用すると指示した場合は、対訳不整合データに基づいて翻訳メモリ辞書220を適用した訳文データの中から修正すべき訳文データを1つ取り出して、例えば図11のように表示する(ステップS210)。ユーザは、その表示内容を判断して、図11の画面からボタン[確認]、又はボタン[取消]を指示する(ステップS220)。ボタン[確認]が指示されれば、翻訳メモリ辞書による訳文データを修正する(ステップS230)。一方、ボタン[取消]が指示されれば、翻訳メモリ辞書による訳文データの修正は行われない。次に、対訳不整合データに同じ修正を行う訳文データが有るか否かを判断し(ステップS240)、有ればステップS210に戻り、同じ修正処理を繰返し実行する。修正対象の対訳データが無くなれば、処理を終了する。
翻訳メモリ辞書220の訳語を使用すると指示した場合は、専門用語辞書の修正すべき訳語を取り出して、その訳語に修正する(ステップS250)。次に、対訳不整合データに基づいて専門用語辞書の前記訳語の修正に伴って修正すべき訳文データを取り出して、例えば図14のように表示する(ステップS260)。ユーザは、その表示内容を判断して、図14の画面からボタン[確認]、又はボタン[取消]を指示する(ステップS270)。ボタン[確認]が指示されれば、何も処理されずステップS290に進む。一方、ボタン[取消]が指示されれば、修正前の訳文データと原文文章との対を翻訳メモリ辞書220に登録する(ステップS280)。次に、対訳不整合データに同じ対訳データが有るか否かを判断し(ステップS290)、有ればステップS250に戻り、同じ確認処理を繰返し実行する。修正対象の対訳データが無くなれば、処理を終了する。
このように、個々の訳文データによって逐次適用したい訳語を選択して、対応することができる。また、翻訳メモリ辞書220の訳語を使用すると指示した場合は、専門用語辞書210の該当する訳語を修正することで、一括して訳語の修正が可能となる。よって、訳語の修正処理が簡単に行うことができる。また、ボタン[取消]の操作によって、元の訳語を使用した訳文データを翻訳メモリ辞書220に登録することができる。
(第3の実施形態)
第3の実施例は、第2の実施形態の一部を変更したものである。第2の実施形態では、不整合検査・修正のために原文訳文データファイル400を持つ構成としたが、第3の実施形態では図1の訳文データファイル300を採用するものである。そして、第3の実施形態では、図8の不整合用語選択部410の選択結果に応じて、翻訳処理を再実行する方式とする。
即ち、図10の辞書選択で専門用語辞書210の訳語を使用すると指示した場合、翻訳メモリ辞書220の使用が抑制される。そして、再翻訳の過程では、対訳不整合データの内容を参照し、文書全体にわたる用語「音声認識装置」に対して、使用可能な専門用語辞書210による訳語「speech recognition equipment」で翻訳出力されることになる。つまり、翻訳メモリ辞書220による訳語「voice recognizing unit」は出力されないようになる。
一方、図10の辞書選択で翻訳メモリ辞書220の訳語を使用すると指示した場合、専門用語辞書210の使用が抑制される。そして、再翻訳の過程では、対訳不整合データの内容を参照し、文書全体にわたる用語「音声認識装置」に対して、使用可能な翻訳メモリ辞書220による訳語「voice recognizing unit」で翻訳出力されることになる。つまり、専門用語辞書210による訳語「speech recognition equipment」は出力されないようになる。
(第4の実施形態)
第4の実施形態は、第2の実施形態の一部を変更したものである。第2の実施形態では、訳語不整合データを修正するために原文訳文データを原文訳文データファイル400に保持したが、第4の実施形態ではその必要はない。その代わり、図8の不整合用語選択部410の選択結果に応じて、専門用語辞書210又は翻訳メモリ辞書220の訳語又は訳文データを修正し、翻訳処理を再実行するものである。
図18は、第4の実施形態にかかる機械翻訳装置を示すブロック図である。第8図と異なる部分は、訳語修正部を2つに分けて、訳語修正部(A)420Aと、訳語修正部(B)420Bを設けたところである。また、訳文データファイル300を図1と同じ構成としている。そして、訳語修正部420Aは、専門用語辞書210の訳語の修正を行う。また、訳語修正部420Bは、翻訳メモリ辞書220の訳文データの修正を行う。
即ち、対訳不整合データの検出に伴い、不整合用語選択部410で翻訳メモリ辞書220の訳語を使用することが選択されると、訳語修正部420Aは、対訳不整合データの内容をもとに専門用語辞書210の訳語を修正する。一方、不整合用語選択部410で専門用語辞書210の訳語を使用することが選択されると、訳語修正部420Bは、対訳不整合データの内容をもとに翻訳メモリ辞書220の訳文データを修正する。
そして、専門用語辞書210又は翻訳メモリ辞書220の内容を修正した後、改めて第1言語の原文テキストデータを入力して、翻訳辞書検索・形態素解析部120、翻訳メモリ辞書検索部130、解析・変換・生成部140の処理を経て、新たな訳文データを出力する。
図19は、訳語修正部420Bの修正による原文と訳文データを示している。不整合用語選択部410で専門用語辞書210の訳語を使用することが選択された場合、再翻訳の前に、対訳不整合データの内容を参照し、翻訳メモリ辞書220との照合により得られた用語「音声認識装置」の訳語を全て「speech recognition equipment」に修正する。
図20は、訳語修正部420Aの修正による原文と訳語を示している。不整合用語選択部410で翻訳メモリ辞書220を使用することが選択された場合、対訳不整合データの内容を参照し、専門用語辞書210との照合により得られた用語「音声認識装置」の訳語を「voice recognizing unit」に修正する。上述した修正を行った後に、翻訳処理を再実行することにより、訳語の統一が実現できる。
図21は、翻訳開始時に、これまで述べた訳語の不整合データの検査を行うか否かを選択する画面例である。ここで「する」を選択すれば訳語の不整合を検査するが、「しない」を選択すれば訳語の不整合を検査しない。
よって、実施形態の発明によれば、専門用語辞書等と翻訳メモリ辞書を併用しても、文書全体の訳語の統一性を損なうことなく、訳語を統一して正しい翻訳を行うことができる。従って、ユーザによる訳語の修正作業が少することができる。
以上のように、本発明に係る機械翻訳装置および翻訳プログラムは、開発過程やデータの性質の異なる専門用語辞書と翻訳メモリ辞書を併用して翻訳する際、専門用語の訳語が統一されない不具合を、簡単に回避することができる。
110‥第1言語文書入力部
120‥翻訳辞書検索・形態素解析部
130‥翻訳メモリ辞書検索部
140‥解析・変換・生成部
150‥第2言語文書出力部
160‥アライメント抽出部
170‥対訳不整合検査部
180‥不整合検査出力部
200‥基本語辞書
210‥専門用語辞書
220‥翻訳メモリ辞書
230‥解析・変換・生成辞書
300‥訳文データファイル
310‥訳語データテーブル
320‥訳文データテーブル
330‥用語対応データテーブル
340‥対応不整合データテーブル
400‥原文訳文データファイル
410‥不整合用語選択部
420‥訳語修正部
420A‥訳語修正部A
420B‥訳語修正部B

Claims (5)

  1. 第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、
    第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、
    前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によ
    って前記第2言語に翻訳すると共に、前記入力原文データを前記翻訳メモリ辞書との照合
    によって前記第2言語に翻訳する翻訳処理部と、
    前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳
    語を対にした訳語データを記憶する第1テーブルと、
    前記入力原文データの文章の中で前記翻訳メモリ辞書と照合し、かつ、アライメント抽
    出された原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応デ
    ータを記憶する第2テーブルと、
    前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳
    語データとを比較照合し、不整合な訳語を検出した場合、対話不整合データを生成する不
    整合検査部と、
    前記不整合検査部で生成した前記対話不整合データを出力し、前記対話不整合データで
    示される前記不整合な訳語の中から前記専門用語辞書から得た訳語又は前記翻訳メモリ辞
    書から得た訳語のどちらかをユーザに選択させる選択部と、
    前記選択部により選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳
    メモリ辞書から得た訳文の前記不整合な訳語を統一するように修正する修正部と、
    を備えたことを特徴とする機械翻訳装置。
  2. 前記選択部により選択された訳語に従って前記翻訳メモリ辞書又は前記専門用語辞書の
    使用を抑制して、前記選択された訳語の基となる前記専門用語辞書又は前記翻訳メモリ辞
    書を用いて翻訳処理を再実行することを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記修正部により修正された前記専門用語辞書又は修正された前記翻訳メモリ辞書を用
    いて翻訳を再実行することを特徴とする請求項1に記載の機械翻訳装置。
  4. 第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、
    第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、
    前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳
    語を対にした訳語データを記憶する第1テーブルと、
    前記入力原文データの文章の中で前記翻訳メモリ辞書と照合し、かつ、アライメント抽
    出された原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応デ
    ータを記憶する第2テーブルと、
    前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によ
    って前記第2言語の訳文データを作成すると共に、前記翻訳メモリ辞書との照合によって
    前記第2言語の訳文データを作成する翻訳処理部と、
    を有する機械翻訳装置の翻訳プログラムであって、
    前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳
    語データとを比較照合し、不整合な訳語を検出する機能と、
    前記不整合な訳語を検出した場合、対話不整合データを生成して、ユーザによって認識
    可能に出力する機能と、
    前記対話不整合データで示される前記不整合な訳語の中から前記専門用語辞書から得た
    訳語又は前記翻訳メモリ辞書から得た訳語のどちらかをユーザに選択させる機能と、
    前記選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳メモリ辞書か
    ら得た訳文の前記不整合な訳語を統一するように修正する機能と、
    を備えたことを特徴とする翻訳プログラム。
  5. 前記選択された訳語に従って前記翻訳メモリ辞書又は前記専門用語辞書の使用を抑制し
    て、前記選択された訳語の基となる前記専門用語辞書又は前記翻訳メモリ辞書を用いて翻
    訳処理を再実行する機能、又は
    前記修正部により修正された前記専門用語辞書又は修正された前記翻訳メモリ辞書を用
    いて翻訳処理を再実行する機能と、
    を備えたことを特徴とする請求項4に記載の翻訳プログラム。
JP2011525684A 2009-08-04 2009-08-04 機械翻訳装置および翻訳プログラム Expired - Fee Related JP5525529B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/003700 WO2011016078A1 (ja) 2009-08-04 2009-08-04 機械翻訳装置および翻訳プログラム

Publications (2)

Publication Number Publication Date
JPWO2011016078A1 JPWO2011016078A1 (ja) 2013-01-10
JP5525529B2 true JP5525529B2 (ja) 2014-06-18

Family

ID=43544003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011525684A Expired - Fee Related JP5525529B2 (ja) 2009-08-04 2009-08-04 機械翻訳装置および翻訳プログラム

Country Status (3)

Country Link
US (1) US8655641B2 (ja)
JP (1) JP5525529B2 (ja)
WO (1) WO2011016078A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014102992A1 (ja) * 2012-12-28 2014-07-03 株式会社日立製作所 データ加工システムおよびデータ加工方法
GB2513348A (en) * 2013-04-24 2014-10-29 Ibm Translation validation
US20150039286A1 (en) * 2013-07-31 2015-02-05 Xerox Corporation Terminology verification systems and methods for machine translation services for domain-specific texts
JP2015172792A (ja) * 2014-03-11 2015-10-01 株式会社リコー 翻訳システム、情報処理装置、情報処理方法およびプログラム
WO2016048350A1 (en) * 2014-09-26 2016-03-31 Nuance Communications, Inc. Improving automatic speech recognition of multilingual named entities
KR20160105215A (ko) * 2015-02-27 2016-09-06 삼성전자주식회사 텍스트 처리 장치 및 방법
JP2016194822A (ja) * 2015-03-31 2016-11-17 株式会社エクシング サーバシステム及びそのプログラム、並びにエラーチェック方法
US9898460B2 (en) * 2016-01-26 2018-02-20 International Business Machines Corporation Generation of a natural language resource using a parallel corpus
KR102637338B1 (ko) * 2017-01-26 2024-02-16 삼성전자주식회사 번역 보정 방법 및 장치와 번역 시스템
JP7114892B2 (ja) * 2017-12-13 2022-08-09 京セラドキュメントソリューションズ株式会社 画像形成装置
CN113383340A (zh) * 2018-08-29 2021-09-10 艾伊派托利 专利文献撰写装置、方法、计算机程序、计算机可读记录介质、服务器及***
CN110543644B (zh) * 2019-09-04 2023-08-29 语联网(武汉)信息技术有限公司 包含术语翻译的机器翻译方法、装置与电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278964A (ja) * 2001-03-19 2002-09-27 Fujitsu Ltd 翻訳支援装置、方法及び翻訳支援プログラム
JP2006163769A (ja) * 2004-12-07 2006-06-22 Nec Corp 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4218760A (en) * 1976-09-13 1980-08-19 Lexicon Electronic dictionary with plug-in module intelligence
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US7865358B2 (en) * 2000-06-26 2011-01-04 Oracle International Corporation Multi-user functionality for converting data from a first form to a second form
JP2002108858A (ja) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> 機械翻訳方法、機械翻訳装置および記録媒体
JP4330285B2 (ja) * 2001-04-16 2009-09-16 沖電気工業株式会社 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
JP4410486B2 (ja) * 2003-05-12 2010-02-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳装置及びプログラム
US7383542B2 (en) * 2003-06-20 2008-06-03 Microsoft Corporation Adaptive machine translation service
JP2005100335A (ja) * 2003-09-01 2005-04-14 Advanced Telecommunication Research Institute International 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ
US8296127B2 (en) * 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US7882119B2 (en) * 2005-12-22 2011-02-01 Xerox Corporation Document alignment systems for legacy document conversions
US20090326917A1 (en) * 2006-07-17 2009-12-31 Erich Steven Hegenberger Computer-Implemented Translation Tool
KR100837358B1 (ko) * 2006-08-25 2008-06-12 한국전자통신연구원 동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법
US20080098005A1 (en) * 2006-10-19 2008-04-24 Gautam Dharamdas Goradia Interactive community portal that, inter alia, allows members to create, modify, organize, share, and receive well-classified content in any language in one or more formats of database files and the like, and further helps members to learn/teach and/or enjoy from the said content
GB2444084A (en) * 2006-11-23 2008-05-28 Sharp Kk Selecting examples in an example based machine translation system
JP5002271B2 (ja) 2007-01-18 2012-08-15 株式会社東芝 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
US8185377B2 (en) * 2007-08-11 2012-05-22 Microsoft Corporation Diagnostic evaluation of machine translators
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
US8229728B2 (en) * 2008-01-04 2012-07-24 Fluential, Llc Methods for using manual phrase alignment data to generate translation models for statistical machine translation
WO2009129315A1 (en) * 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
KR20100037813A (ko) * 2008-10-02 2010-04-12 삼성전자주식회사 통계적 자동 번역 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278964A (ja) * 2001-03-19 2002-09-27 Fujitsu Ltd 翻訳支援装置、方法及び翻訳支援プログラム
JP2006163769A (ja) * 2004-12-07 2006-06-22 Nec Corp 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Also Published As

Publication number Publication date
US8655641B2 (en) 2014-02-18
WO2011016078A1 (ja) 2011-02-10
US20120136647A1 (en) 2012-05-31
JPWO2011016078A1 (ja) 2013-01-10

Similar Documents

Publication Publication Date Title
JP5525529B2 (ja) 機械翻訳装置および翻訳プログラム
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US8121829B2 (en) Method and apparatus for constructing translation knowledge
JPH08101837A (ja) 機械翻訳装置における翻訳規則学習方法
JP2006276915A (ja) 翻訳処理方法、文書翻訳装置およびプログラム
US11227116B2 (en) Translation device, translation method, and program
Liyanapathirana et al. Sinspell: A comprehensive spelling checker for sinhala
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
Chowdhury et al. Implementation of an optical character reader (ocr) for bengali language
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Lehal A Gurmukhi to Shahmukhi transliteration system
JP2012053858A (ja) 機械翻訳装置及び機械翻訳プログラム
JP4016037B2 (ja) 機械翻訳プログラム、機械翻訳装置
JPS6337471A (ja) 翻訳方法及び装置
JP4881399B2 (ja) 対訳情報作成装置、機械翻訳装置及びプログラム
Bloodgood et al. Acquisition of translation lexicons for historically unwritten languages via bridging loanwords
JP3737817B2 (ja) 表現変換方法及び表現変換装置
Forkel et al. Towards a sustainable handling of interlinear-glossed text in language documentation
JP2006330628A (ja) 自然言語学習支援装置、方法及びプログラム
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
Sinha Automated mining of names using parallel Hindi-English corpus
LIST Please cite as: List, Johann-Mattis and Sims, Nathanial A.(2019): Towards a sustainable handling of inter-linear-glossed text in language documentation.[Preprint under review. Not peer-reviewed]
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JPH09269945A (ja) メディア変換方法およびメディア変換装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130910

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131226

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140411

R151 Written notification of patent or utility model registration

Ref document number: 5525529

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees