JP4076520B2 - 翻訳支援プログラムおよび単語対応付けプログラム - Google Patents

翻訳支援プログラムおよび単語対応付けプログラム Download PDF

Info

Publication number
JP4076520B2
JP4076520B2 JP2004155549A JP2004155549A JP4076520B2 JP 4076520 B2 JP4076520 B2 JP 4076520B2 JP 2004155549 A JP2004155549 A JP 2004155549A JP 2004155549 A JP2004155549 A JP 2004155549A JP 4076520 B2 JP4076520 B2 JP 4076520B2
Authority
JP
Japan
Prior art keywords
translation
word
sentence
language sentence
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004155549A
Other languages
English (en)
Other versions
JP2005339087A (ja
Inventor
顕成 増山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004155549A priority Critical patent/JP4076520B2/ja
Priority to US10/959,723 priority patent/US20050267734A1/en
Publication of JP2005339087A publication Critical patent/JP2005339087A/ja
Application granted granted Critical
Publication of JP4076520B2 publication Critical patent/JP4076520B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は翻訳支援プログラムおよび単語対応付けプログラムに関し、特に、予め登録された複数の翻訳例から翻訳対象文に類似する翻訳例を検索し、翻訳対象文とともに提示して翻訳を支援するための翻訳支援プログラムと、第1の言語文と第1の言語文を翻訳した第2の言語文の文中の単語・句を対応付ける単語対応付けプログラムに関する。
従来、コンピュータによって、翻訳対象である原文(第1の言語文)を他の言語文(第2の言語文)に翻訳する際の支援のための翻訳支援装置として、複数の翻訳例をデータベースに登録しておき、原文に類似する翻訳例を検索し、翻訳対象文とともに利用者に提示するものがある。
このような翻訳支援装置では、翻訳対象の原文が入力されると、翻訳例データベースを検索し、入力された原文に含まれる単語・句に類似する翻訳例を抽出する。翻訳例データベースには、原文と同じ言語の訳例原文と、訳例原文を目的の言語に翻訳した訳例訳文の組で構成される翻訳例が複数記憶されている。そして、検索結果として、原文とともに検索された訳例原文および訳例訳文を対比して表示手段に表示し、翻訳支援を行っていた。このとき、原文と翻訳例の第1の言語文について、互いの文中の対応する単語・句をハイライト表示し、対応関係が把握できるようにしていた。
さらに、原文に対する訳例原文と訳例訳文の対応を容易に把握できるようにするため、翻訳例データベースに翻訳例の第1の言語文と第2の言語文の文中の単語・句の対応関係を示す対応情報を登録しておき、この対応情報を用いて、原文と訳例原文および訳例訳文の文中の対応する単語・句をハイライト表示するとともに、ハイライト表示されている単語・句のうち1つを選択すると対応する単語・句をよりハイライト表示する技術が提案されている(たとえば、特許文献1参照)。
このようなハイライト表示について説明する。図11は、従来の翻訳支援装置における検索結果表示画面の一例である。
従来の翻訳支援装置では、検索キー文(原文)「I have a pen.」901を検索キーとして検索が行われ、検索結果として、訳例原文「I have a pen which I love.」902と、その訳例訳文「私は大好きなペンを持っている」903が検索キー文(原文)901とともに検索結果表示画面900として表示される。そして、検索キー文901、訳例原文902および訳例訳文903の全ての文中に対応する、「have」904a、「have」904bおよび「持」904cと、「pen」905a、「pen」905bおよび「ペン」905cがハイライト表示される。マウス等により、たとえば、「pen」905aを選択すると、「pen」905aとともに、対応する「pen」905bと「ペン」905cがよりハイライトされる。これにより、原文と訳例との対応を容易に把握することができる。
特開2003−330924号公報(段落番号〔0022〕〜〔0047〕、図1)
しかし、従来の翻訳支援装置では、翻訳例データベースには、訳例原文と訳例訳文の翻訳例と、その文中の単語・句の対応関係を示す対応情報の3種類が格納されていた。このように翻訳例に加えて対応情報が格納されるため、データベースの容量が大きくなり、その結果、検索速度が遅くなってしまうという問題点がある。
また、訳例原文と訳例訳文との対応関係は、対応情報に基づいて抽出されるため、対応情報に登録がなければ、対応関係を抽出することはできないという問題点がある。
図12は、従来の翻訳支援装置における翻訳例データベースの登録項目を説明する図である。図の例では、訳例原文「I have a favorite pen.」907と、対応する訳例訳文「私は大好きなペンを持っている。」908が登録されている。そして、対応情報として、互いの文中の単語・句(I−私)909、(have−持)910および(pen−ペン)911の対応関係が対応情報に登録されている。この対応情報によって、検索結果表示画面におけるハイライト表示が可能になる。
しかしながら、たとえば、訳例原文の「favorite」912と訳例訳文の「大好き」913との対応関係が登録されていない場合、検索結果表示画面において(favorite−大好き)の対応関係が表示されない(ハイライト表示されない)。このため、ユーザは、原文と翻訳文の単語・句(favorite−大好き)の関係を容易に把握することができない。特に、訳例原文と訳例訳文の語数が非常に多い場合や複雑な文構造である場合には、ユーザが対応関係を推測するのは容易ではない。
また、従来、対応情報は対訳辞書を用いて登録されており、登録時点で対訳辞書にない単語は対応付けすることができない。一般に、対訳辞書は、翻訳精度を上げるため頻繁に更新される。このため、対訳辞書の更新ごとに再度対応情報の登録を行う必要が生じるという問題点がある。この登録作業が行われない場合、対訳辞書との同期がとれなくなるという問題点もある。
本発明はこのような点に鑑みてなされたものであり、原文と翻訳例の文中における単語・句の対応付けを容易にすることによって翻訳品質を向上させる翻訳支援プログラムを提供することを目的とする。
本発明では上記課題を解決するために、図1に示すような機能を実現するための翻訳支援プログラムが提供される。本発明に係る翻訳支援プログラムは、第1の言語文の翻訳対象文(以下、入力文11とする)に類似する類似翻訳例を検索し、入力文と類似翻訳例の文中の単語・句を対応付けて表示することによって、翻訳を支援するためのものである。この翻訳支援プログラムは、コンピュータを類似翻訳例検索手段1、単語対応付け手段31、およびハイライト制御手段32として機能させ、以下の処理を実行させることができる。
類似翻訳例検索手段1は、第1の言語文の入力文11が入力されると、この入力文11を検索キーとして翻訳例データベース2を検索し、入力文11に類似する類似翻訳例12a、12b、12c、・・・を抽出する。翻訳例記憶手段を構成する翻訳例データベース2には、翻訳例の第1の言語文と、第1の言語文を翻訳した翻訳例の第2の言語文の組が複数格納されている。次に、抽出された類似翻訳例12a、12b、12c、・・・の入力文11に対する類似度を所定の類似度計算方法に基づいて算出し、算出された類似度に従って類似翻訳例を順番に並べる。次に、単語対応付け手段31は、類似翻訳例の第1の言語文の単語・句に対応する訳語を対訳辞書より抽出し、類似翻訳例の第2の言語文と抽出された訳語を照合する。そして、類似翻訳例の第2の言語文の単語・句ごとに、訳語を照合して予め設定された条件が成立するごとに条件に応じて設定された点数を加算して算出された得点を単語類似度とし、単語類似度が高い類似翻訳例の第2の言語文の単語・句を、訳語に対応する類似翻訳例の第1の言語文の単語・句に対応付ける。対訳辞書には、第1の言語文の単語・句に対応する第2の言語文の単語・句が登録されている。次に、ハイライト制御手段32が、単語・句の対応付けに基づいて、類似翻訳例の第1の言語文、類似翻訳例の第2の言語文および入力文11の文中の間で対応する単語・句をハイライト表示する。
このような翻訳支援プログラムをコンピュータに実行させることで、入力文11に類似した類似翻訳例12a、12b、12c・・・が抽出される。抽出された類似翻訳例12a、12b、12c・・・は、所定の類似度計算方法に基づいてそれぞれの類似度が算出され、類似度に従って順番に並べられる。また、各類似翻訳例12a、12b、12c、・・・について、類似翻訳例の第1の言語文と類似翻訳例の第2の言語文の文中の間で単語・句の対応付けが行われる。そして、検索結果の表示では、抽出された類似翻訳例が類似度の順に表示され、それぞれの類似翻訳例12a、12b、12c、・・・は、入力文11と類似翻訳例の第1の言語文と第2の言語文の3つの組で表示され、各文中の対応する単語・句がハイライト表示される。
また、上記課題を解決するために、第1の言語文と第1の言語文を翻訳した第2の言語文の単語・句を対応付ける単語対応付けプログラムにおいて、コンピュータを、第1の言語文と第2の言語文とを入力し、第1の言語文の単語・句ごとに対訳辞書記憶手段に記憶される対訳辞書を検索して訳語を抽出し、第2の言語文の単語・句ごとに訳語を照合して予め設定された条件が成立するごとに条件に応じて設定された点数を加算して算出された得点を単語類似度として、単語類似度が高い第2の言語文の単語・句を、訳語に対応する第1の言語文の単語・句に対応付ける単語対応付け手段、として機能させることを特徴とする単語対応付けプログラムが提供される。
このような単語対応付けプログラムをコンピュータに実行させることで、対訳辞書から第1の言語文の単語・句の訳語が抽出され、抽出された訳語と第2の言語文の単語・句が照合される。そして、第2の言語文の単語・句と、照合により検索されたこの第2の言語文の単語・句に類似する訳語に対応する第1の言語文の単語・句とが対応付けられる。
以上説明したように本発明の翻訳支援プログラムを実行するコンピュータでは、第1の言語文の翻訳対象文と類似する類似翻訳例を検索し、検索結果を表示する際に、類似翻訳例の第1の言語文と第2の言語文の文中の単語・句の対応付けが行われる。これにより、検索結果の表示の際に、翻訳対象文と、類似翻訳例の第1の言語文と第2の言語文の文中の単語・句の対応関係が、最新の対訳辞書を用いた対応付けで表示可能になり、翻訳品質を向上させることができる。また、翻訳例データベースに対応関係を登録した対応情報を格納しなくてすむことから、データベースの容量を小さくできるとともに、類似翻訳例の検索時間を短縮することができるという利点もある。
また、本発明の単語対応付けプログラムを実行するコンピュータでは、第1の言語文と第2の言語文の文中の単語・句の対応付けが対訳辞書に基づいて自動的に行われる。これにより、対訳辞書の更新と同期して対応情報を作成することが可能となる。
以下、本発明の実施の形態を図面を参照して説明する。
本発明は、第1の言語文の翻訳対象文(以下、入力文とする)と類似する翻訳例を翻訳例データベースより検索し、検索された翻訳例の第1の言語文(以下、訳例原文とする)と第2の言語文(以下、訳例訳文とする)を入力文と一緒に表示するとともに、それぞれの文中の対応する単語・句をハイライト表示し、単語・句の対応関係の把握を容易にすることによって、翻訳を支援するものである。
まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
図1は、本発明の実施の形態に適用される発明の概念図である。本発明に係る翻訳支援装置は、本発明の翻訳支援プログラムをコンピュータに実行させることによって、各処理手段が実現される。この翻訳支援装置は、類似翻訳例検索手段1、翻訳例データベース2、検索結果表示手段3、対訳辞書4および登録手段5を具備する。
類似翻訳例検索手段1は、入力文11を検索キーとして翻訳例データベース2を検索し、入力文11に類似する類似翻訳例12a、12b、12c・・・を抽出する。そして、抽出した類似翻訳例12a、12b、12c、・・・の入力文11に対する類似度を所定の類似度計算方法によって算出し、算出された類似度に従って類似翻訳例を順番に並べる。類似度計算方法は、「SCORE」、「RATE」などの手法が知られており、本発明では、いずれかの類似度計算方法を適宜選択するとする。また、翻訳例の並べ替えの判断に用いる類似度計算方法を予め選択しておく。
翻訳例データベース2は、訳例原文と訳例原文を翻訳した訳例訳文の組で構成される翻訳例が複数登録されたデータベースである。
検索結果表示手段3は、検索結果として、類似翻訳例検索手段1が類似度に従って順番に並べた類似翻訳例12a、12b、12c、・・・・と同時に入力文11を表示する。また、入力文11と類似翻訳例の訳例原文と訳例訳文の3つの文において、対応する単語・句をハイライト表示し、さらに、ハイライト表示された単語・句のいずれかが選択されると、残りの文中の対応する単語・句をよりハイライトする。このため、単語対応付け手段31とハイライト制御手段32を有する。
単語対応付け手段31は、検索された類似翻訳例12a、12b、12c、・・・について、それぞれの類似翻訳例の訳例原文と訳例訳文を単語・句に分割する。次に、対訳辞書4を検索して、分割された訳例原文の単語・句に対応する訳語を抽出し、訳例原文の単語・句ごとに訳語リストを作成する。そして、訳例訳文の単語・句と訳語リストを照合し、訳例訳文の単語・句と類似する訳語を探す。たとえば、訳例訳文の単語・句に一致する訳語があれば、所定の点数を付与し、さらに、訳語に予め設定された優先度に応じた点数を加算する。得られた得点が高い訳語が訳例訳文の単語・句との単語類似度が高いと判断される。そして、この訳例訳文の単語・句と、この訳語を有する訳例原文の単語・句とが対応付けられる。なお、訳例訳文の単語・句に対して訳例原文の複数の単語・句が対応付けされる場合、対応付けが確定した訳例原文と訳例訳文の文中の単語・句に近接する側の対応付けを選択する。詳細については、後述する。
ハイライト制御手段32は、類似翻訳例検索手段1によって検出された入力文11と訳例原文の文中の単語・句の対応関係と、単語対応付け手段31によって対応付けされた訳例原文と訳例訳文の文中の単語・句の対応関係に基づき、入力文11と訳例原文と訳例訳文の文中の対応する単語・句をハイライト表示する。この際、3つの文で対応する単語・句のほか、入力文11と訳例原文でのみ対応する単語・句および訳例原文と訳例訳文でのみ対応する単語・句についてもハイライト表示を行う。対応関係を明らかにするため、それぞれのハイライト表示の色を変えてもよい。さらに、ハイライト表示された単語・句の1つがマウス操作などによって選択された場合、選択された単語・句に対応する単語・句を選択された単語・句とともによりハイライトさせる。
このように、検索結果表示手段3によって表示された入力文と訳例原文および訳例訳文のハイライトによって、ユーザは3つの文中の単語・句の対応関係を容易に把握することが可能となる。そして、ハイライト表示を参照して訳例訳文の編集を行って、入力文に対する訳文を作成することができる。
登録手段5は、検索結果表示手段3によって表示された検索結果のうち、ユーザが指定した類似翻訳例の訳文訳例(編集後のもの)と入力文とを新たな訳例原文と訳例訳文とする翻訳例として、翻訳例データベース2に登録する。
このような翻訳支援装置によれば、入力文11を検索キーとして翻訳例データベース2を検索し、いくつかの類似翻訳例12a、12b、12c、・・・が抽出され、類似度に応じて順番に並べられる。そして、各類似翻訳例12a、12b、12c、・・・の訳例原文と訳例訳文の文中の単語・句の対応付けを行う。単語・句の対応付けは、訳例原文の単語・句に対応する訳語を対訳辞書4から抽出し、抽出された訳語と訳語訳文の単語・句とを照合して訳例原文の単語・句に対応する訳例訳文の単語・句を検索して行う。
このようにして、類似度の順に並べられた類似翻訳例と、各類似翻訳例における訳例原文と訳例訳文の単語・句の対応付けが得られる。検索結果の表示では、これらの情報に基づき、入力文と類似翻訳例の訳例原文と訳例訳文の3つの文を1組として、類似度の順番に従って表示する。そして、それぞれの組の入力文、訳例原文および訳例訳文の文中の対応する単語・句は、ハイライト表示される。
以上のように、本発明によれば、翻訳例の訳例原文と訳例訳文の単語・句の対応付けは、翻訳例が類似翻訳例として抽出された後に行われる。このように、検索結果表示の前に対応付けを行うため、最新の対訳辞書によって対応付けができるという利点がある。また、翻訳例データベースには、訳例原文と訳例訳文のみが記憶され、従来のように対応関係情報を必要としないことから、データベースの容量を小さくすることができる。さらに、データベースの容量が小さいことから、類似翻訳例の検索に要する処理時間を短縮することができるという利点もある。なお、対応付けが行われるのは、翻訳例に出現する単語・句についてのみであるので、単語対応付けに要する処理時間はさほど必要としない。
以下、本発明の実施の形態を、第1言語として英語を使用し、第2言語として日本語を使用する翻訳支援装置に適用した場合を例に図面を参照して詳細に説明する。なお、本発明における使用言語は、これらに限定されるものではない。
図2は、本発明の実施の形態の翻訳支援装置のハードウェア構成例を示す図である。
翻訳支援装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス106を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104および入力インタフェース105が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラムが格納される。グラフィック処理装置104には、モニタ107が接続されており、CPU101からの命令に従って画像をモニタ107の画面に表示させる。入力インタフェース105には、キーボード108aやマウス108bが接続されており、キーボード108aやマウス108bから送られてくる信号を、バス106を介してCPU101に送信する。
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
このようなハードウェア構成の翻訳支援装置100が以下に説明する処理機能を実現するための機能ブロックについて説明する。図3は、本発明の実施の形態の翻訳支援装置の機能ブロック図である。
本発明に係る翻訳支援装置100は、類似翻訳例検索部110、類似度計算方法選択部120、ランキング部130、検索結果表示部140、登録部150、翻訳例選択部160および結果出力部170を有する。
類似翻訳例検索部110は、入力文11を入力すると、入力文11を検索キーとして翻訳例データベース2を検索し、入力文11に類似する類似翻訳例をいくつか抽出する。
類似度計算方法選択部120は、類似翻訳例検索部110によって抽出された複数の類似翻訳例をランク付けするための類似度算出方法の選択を判断する。ランク付けするための類似度計算方法は、翻訳支援装置が算出可能な類似度計算方法から任意の方法がユーザによって選択指示されている。
ランキング部130は、類似翻訳例検索部110が抽出した類似翻訳例の入力文11に対する類似度を算出する。類似度計算は、少なくとも類似度計算方法選択部120によって選択が判断されたランク付け用の類似計算方法を含む所定の方法によって行う。そして、算出された類似度に従って、類似翻訳例を並び替え、類似度の高いものから順に並ぶようにする。並び替えに使用される類似度は、類似度計算方法選択部120によって選択されたものを使う。
検索結果表示部140は、ランキング部130によって並び替えられた順番に、類似翻訳例の訳例原文と訳例訳文と、入力文11の3つの文を1組としてモニタ107に表示する。このとき、単語対応付け部141とハイライト制御部142によって、入力文11と、訳例原文と訳例訳文の文中の対応する単語・句がハイライト表示される。単語対応付け部141は、対訳辞書4を用いて、それぞれの類似翻訳例の訳例原文と訳例訳文の文中の単語・句の対応付けを行い、ハイライト制御部142は、対応付けられた訳例原文と訳例訳文および入力文11の文中の単語・句をハイライト表示する。さらに、ハイライト表示された単語・句のうちの1つがユーザによって選択されると、選択された単語・句とともにその単語・句に対応する他の文中の単語・句をよりハイライトして表示する。
登録部150は、モニタ107に表示された検索結果のうち、ユーザが指定した入力文と訳例訳文の組を新たな翻訳例として、翻訳例データベース2に格納する。
翻訳例選択部160は、検索結果表示部140によって表示された複数の検索結果の中から、たとえばマウスなどの指示手段によりユーザが選択した類似翻訳例の訳例訳文の文・句・単語を出力する。
結果出力部170は、翻訳例選択部160の選択した類似翻訳例の訳例訳文を、入力文すなわち翻訳対象文の翻訳結果として出力する。
このような構成の翻訳支援装置100に対して入力文200が入力されたときの動作について説明する。
図4は、本発明の実施の形態の翻訳対象文の入力から類似翻訳例の検索までの処理を示した図である。
翻訳対象文である入力文(図の例では、「I have a pen.」)200が入力されると、類似翻訳例検索部110は、入力文200を検索キーとして、予め多数の翻訳例が格納されている翻訳例データベース2を検索する。ここでは、類似翻訳例として、翻訳例1(210)と翻訳例2(220)が抽出される。翻訳例1(210)は、訳例原文「I have a pen which I love.」211と、訳例訳文「私は大好きなペンを持っています。」212で構成される。また、翻訳例2(220)は、訳例原文「I have a favorite pen.」221と、訳例訳文「私は大好きなペンを持っています。」222で構成される。
こうして抽出された類似翻訳例に関し、類似度が算出される。以下、類似度算出方法として、「SCORE」と「RANK」を用いた場合で説明する。
まず、類似度計算方法選択部120では、検索結果表示のランキングに用いる類似度計算方法を判断する。この例では、類似度計算方法として、「SCORE」と「RANK」が用いられているが、ランキングには「SCORE」を用いるとする。
次に、ランキング部130で翻訳例1(210)と翻訳例2(220)に関する「SCORE」と「RANK」を算出し、ランキングを行う。
「SCORE」は、検索キー文(入力文)と、比較対象文(訳例原文)との間で単語・句が連続して一致する場合に類似度が高くなる類似度算出方法である。類似度[SCORE]は、一致している比較単位(単語・句)の数をNとすると、
[SCORE]= N*(N+1)/2 ・・・(1)
で表される。
たとえば、入力文200と翻訳例1(210)の訳例原文211の場合、[I]、[have]、[a]、[pen]の4つが連続して一致するので、[SCORE]は、4*(4+1)/2=10となる。同様に、入力文200と翻訳例2(220)の訳例原文221の場合、[I]、[have]、[a]の3つが連続して一致する部分の[SCORE]が、3*(3+1)/2=6、[pen]のみが一致する部分の[SCORE]は、1*(1+1)/2=1の計7になる。
「RANK」は、検索キー文(入力文)と、比較対象文(訳例原文)との間で一致する比較単位(単語・句)が全体に占める割合で類似度を表す計算方法である。[RANK]は、一致した比較単位の数をA、検索キー文(入力文)の比較単位の数をB、比較対象文の比較単位の数をCとすると、
[RANK]= (A*2)/(B+C) ・・・(2)
で表される。
たとえば、入力文200と翻訳例1(210)の訳例原文211の場合、[I]、[have]、[a]、[pen]の4つが一致し、全体の比較単位は4+7であるので、[RANK]=4*2/(4+7)=0.72(=72%)となる。同様に、入力文200と翻訳例2(220)の訳例原文221の場合、[I]、[have]、[a]、[pen]の4つが一致し、全体の比較単位は4+5であるので、[RANK]=4*2/(4+5)=0.88(=88%)となる。
この場合、「SCORE」でランキングするので、翻訳例1(210)、翻訳例2(220)の順に並べられる。
次に、検索結果表示部140で検索結果をモニタ107に表示する処理が行われる。
単語対応付け部141では、対訳辞書を参照し、各類似翻訳例の訳例原文と訳例訳文の文中の単語・句の対応付けを行う。図5は、本発明の実施の形態の単語対応付け処理を示した図である。図5は、翻訳例2(220)の場合を示している。
まず、翻訳例2の訳例原文221と訳例訳文222を形態素解析し、単語・句(以下、これをノードと表記する)に分割する。そして、対訳辞書4を検索して訳例原文222のノード単位の訳語を抽出し、訳語リスト230を作成する。図の例では、検索により、「I=私」、「have=持つ」、「favorite=大好き」および「pen=ペン」がリストに登録されている。
そして、訳語対応表240として、横に訳例原文221のノード、縦に訳例訳文222のノードを並べたマトリックスを作成する。そして、訳語と訳例訳文222のノードを照合する。たとえば、訳例原文221の1番目のノード「I」の訳語「私」は、訳例訳文222の1番目のノードと一致するので、これらの交差する欄241に対応(図では、○)が設定され、対応付けが行われる。また、訳例原文221の2番目のノード「have」の訳語「持つ」によって、訳例訳文の7番目のノード「持」が対応付けられる。同様にして、訳例原文221の4番目のノード「favorite」と訳例訳文222の3番目のノード「大好き」と、訳例原文221の5番目のノード「pen」と訳例訳文222の5番目のノード「ペン」が対応付けられる。
なお、訳例原文が日本語、訳例訳文が英語の場合も同じように対応付けが行われる。
以上の処理手順により、訳例原文と訳例訳文の文中のノードの対応関係が判明する。そして、検索結果として、ランキング部130によってランキングされた順に、入力文、訳例原文および訳例訳文の3つの文を組とする翻訳例がモニタ107に表示される。このとき、ハイライト制御部142は、単語対応付け部141の解析した対応関係を用いて、3つの文中の対応するノードをハイライト表示する。
図6は、本発明の実施の形態の検索結果表示画面の一例を示した図である。
検索結果表示画面300には、ランキング部130によるランキングの結果、最もランキングの高い「Rank1」301と、次にランキングの高い「Rank2」302が表示される。それぞれの領域には、算出された類似度(SCORE/RATE)311、312と、入力文321、322と、訳例原文331、332と、訳例訳文341、342が表示されている。図の例では、「Rank1」301には翻訳例1(210)、「Rank2」には翻訳例2(220)が表示される。
さらに、ハイライト制御部142によって、それぞれの文中のノードのうち、他の文と対応するノードが淡くハイライト表示される。図では、ハイライト表示される部分を鎖線、1点鎖線、2点鎖線で囲んで表している。また、それぞれの線種は、入力文、訳例原文および訳例訳文で対応するもの(鎖線)、入力文と訳例原文で対応するもの(1点鎖線)、訳例原文と訳例訳文で対応するもの(2点鎖線)で表している。
たとえば、「Rank1」301では、1点鎖線で囲まれる入力文321の「I」321aと「a」321cは、訳例原文331の「I」331aと「a」331cにそれぞれ対応している。また、鎖線で囲まれる入力文321の「have」321bと「pen」321dは、それぞれ訳例原文331の「have」331bと「pen」331dおよび訳例訳文341の「持」341dと「ペン」341cに対応する。さらに、2点鎖線で囲まれる訳例原文331の「I」331eと「love」331dは、訳例訳文341の「私」341aと「大好き」341bに対応する。
同様に、「Rank2」302では、鎖線で囲まれる入力文322の「I」322a、「have」322b、「pen」322dは、それぞれ訳例原文332の「I」332a、「have」332b、「pen」332e、および訳例訳文342の「私」342a、「持」342d、「ペン」342cに対応する。また、入力文322の「a」322bは訳例原文332の「a」332cと対応し、訳例原文332の「favorite」332dは訳例訳文342の「大好き」342bに対応する。
このように、対応関係のあるノードをハイライト表示することにより、各文の単語・句の対応関係を容易に把握することができるようになる。
また、これらのノードのうちの1つがユーザによって選択されると、ハイライト制御部142は、このノードとこのノードに対応する他の文中のノードをよりハイライトして表示する。たとえば、「pen」321dが選択されると、「pen」321dとともに「pen」331dと「ペン」341cがよりハイライト表示される。これにより、対応関係がより明確になる。
なお、実際の表示画面では、たとえば、ノード部分の表示色を変えるなどによって区別する。
上記の説明では、訳例原文(以下、原文とする)のノードと、そのノードの訳語と一致する訳例訳文(以下、訳文とする)のノードを対応付けるとしたが、訳例原文のノード数が多い場合や、複雑な文構造を有する場合には、訳例原文の1つのノードの訳語に対して複数の訳例訳文のノードが一致する場合があるなど、上記の方法では対応付けが難しい場合がある。そこで、単語の対応付け処理において、ノードごとに単語類似度を算出し、単語類似度に応じて対応付けを行う。
単語類似度は、原文のノードの訳語と訳文のノードとを照合し、予め設定された条件が成立するごとに、条件に応じて設定された点数を加算し、得られた得点によって決まる。たとえば、以下の条件が成立するごとに点数を加算するとする。
(1)原文のノードの訳語と訳文のノードが一致する:10点
(2)原文のノードの訳語のうち最優先の訳語と訳文のノードとが一致する:10点
(3)原文のノードとノードの表記が一致する:3点
そして、得られた得点の高いものと対応付けを行う。
このような単語対応付け処理の処理手順を説明する。図7は、本発明の実施の形態の単語対応付け処理の手順を示したフローチャートである。
原文と訳文とを入力し、処理を開始する。
[ステップS1] 入力した原文と訳文の形態素解析を行い、原文と訳文をノード単位に分割する。
[ステップS2] 原文と訳文のノードでマトリックス(ノードマトリックス)を作成する。
以上の処理手順が実行されることにより、原文と訳文のノードマトリックスが作成される。ここまでの処理手順を具体例で説明する。図8は、本発明の実施の形態の単語対応処理におけるノードマトリックス作成までの処理の一例を示した図である。
図の例では、原文が「これは本です。」で、訳文が「This is a book.」の入力文400を入力し、形態素解析を行う。この場合、原文は「これ/は/本/です/。」に、訳文は「This/is/a/book/.」に分割される。そして、分割されたノードからノードマトリックス410が作成される。図の例では、横方向に訳文のノードが並び、縦方向に原文のノードが並ぶマトリックスが作成されている。
図7に戻って説明する。
[ステップS3] 原文のノード(1単語)を取り出し、対訳辞書を検索して訳語リストを作成する。なお、対訳辞書には、予め訳語ごとに優先度が登録されている。以下の説明では、対訳辞書の順番に優先度が設定されているとする。
[ステップS4] 訳文からノードを取り出して、ステップS3で生成された訳語リストにあるかどうかを調べ、上記の説明の条件に従って得点(単語類似度)を算出する。たとえば、訳文から取り出したノードが訳語リストにあれば、条件(1)により10点を付与する。さらに、対応する訳語が訳語リストの最優先(訳語リストの先頭に登録されている)であれば、条件(2)によりさらに10点を加える。また、原文のノードと訳文のノードの表記が一致するのであれば、条件(3)により3点が付与される。表記の一致は、たとえば「CPU」などのように、どちらの言語でも同じ表記がされるもので発生する。また、条件すべてに合致しない場合、0点になる。
[ステップS5] 現在選択されている原文のノード(訳語に対応する原文のノード)と、訳文のノードとの交点の欄に、ステップS4で算出された得点(単語類似度)を設定する。
[ステップS6] 次の訳文のノードがあるかどうかを判定する。訳文のノードがあれば、ステップS4に戻って、得点算出からの処理を行う。
[ステップS7] 次の原文のノードがあるかどうかを判定する。原文のノードがあれば、ステップS3に戻って、訳語リストの作成からの処理を行う。
以上の処理手順が実行されることにより、ノードマトリックスの各欄に得点(単語類似度)が設定される。ここまでの処理手順を具体例で説明する。図9は、本発明の実施の形態の単語対応処理における単語類似度設定処理の一例を示した図である。
上記説明の処理により、入力文400の原文のノードに対する訳語リスト420が作成される。図の例では、原文の1番目のノード「これ」に対して訳語「this」が検索され、原文の3番目のノード「本」に対して訳語「book」、「copy」、「title」が検索されている。ここでは、「this」と「book」が最優先単語となる。
たとえば、訳文の1番目のノード「this」について、訳語リストを照合すると、「これ」の訳語「this」が該当するので10点が付与される。さらに、「this」は最優先であるので、10点が加算され、計20点の得点が算出される。そこで、原文の1番目のノード「これ」と、訳文の1番目のノード「This」が交差する欄411に得点20が設定される。また、訳文の1番目のノード「this」は、他の原文のノードの訳語リストに存在しないので、以下の欄の得点は0点になる。同様にして、原文の3番目のノード「本」の訳語のうち最優先単語の「book」が訳文の4番目のノード「book」にあるので、原文の3番目のノード「本」と、訳文の4番目のノード「book」が交差する欄412に得点20が設定される。
図7に戻って説明する。
[ステップS8] 得点(単語類似度)が設定されたノードマトリックスを参照し、原文のノードと訳文のノードとの対応付けを行う。得点を参照し、最も高い得点の訳文ノードを対応する原文ノードに対応付ける。図9の例であれば、原文の1番目のノード「これ」は、訳文の1番目のノード「This」と対応付けられる。同様に、原文の3番目のノード「本」と、訳文の4番目のノード「book」が対応付けられる。
[ステップS9] さらに、得点(単語類似度)が同じ訳文ノードが複数発生する場合がある。この場合、複数の原文ノードと訳文ノードのペアのうち、ステップS8によって対応付けが決定した原文ノードと訳文ノードのペアに近いほうのペアを選択する。これまでの説明に用いた例では、単語類似度によって原文ノードと訳文ノードの対応付けを行うことができたが、文によっては、複数の訳文ノードに対し、同じ得点が付与されてしまうケースが発生する。
具体例で説明する。図10は、本発明の実施の形態の単語対応処理における対応付け選択処理の一例を示した図である。
ノードマトリックス500は、原文「彼は本を探しに図書館に行ったが、その本はなかった。」と、訳文「He went to the library to look for the book, but there wasn’t that book.」について、形態素解析を行って作成されたものである。
ここで、原文の3番目のノード501の「本」の訳語「book」と訳文ノードを照合すると、訳文の9番目のノード502の「book」と15番目のノード503の「book」がこれに該当する。そこで、それぞれの訳文ノードと原文の3番目のノード501の交点となる欄504と欄505に同じ得点(△)が設定される。同様に、原文の13番目のノード506の「本」の場合にも、訳文の9番目のノード502の「book」と15番目のノード503の「book」が該当し、それぞれの訳文ノードと原文の13番目のノード506の交点となる欄507と欄508に同じ得点(△)が設定される。
このように、原文の3番目のノード501の「本」について、訳文の9番目のノード502の「book」とのペアと、訳文の15番目のノード503の「book」とのペアの2つのペアが存在する。同じように、原文の13番目のノード506の「本」についても、訳文の9番目のノード502の「book」とのペアと、訳文の15番目のノード503の「book」とのペアが存在する。
一方、同様の手法により、原文の1番目のノード509の「彼」には、訳文の1番目のノード510の「He」が対応し、それ以外に対応する訳文ノードがないことから、原文の1番目のノード509の「彼」と、訳文の1番目のノード510の「He」との対応関係が確定する。同様にして、原文の5番目のノード511の「探し」と、訳文の7番目のノード512の「look for」との対応付けも確定する。
そこで、原文の3番目のノード501の「本」について、対応付けが確定したノードとの関係をみると、訳文の9番目のノード502の「book」との交点にあたる欄504の方が対応付けの確定した原文の1番目のノード509の「彼」と訳文の1番目のノード510の「He」とのペア、および原文の5番目のノード511の「探し」と訳文の7番目のノード512の「look for」とのペアに近接しているので、こちらを選択する。これにより、原文の3番目のノード501の「本」と訳文の9番目のノード502の「book」との対応付けが確定する。さらに、原文の13番目のノード506の「本」については、訳文の9番目のノード502の「book」が前の処理で選択されているので、訳文の15番目のノード503の「book」との対応付けを選択する。これにより、原文の3番目のノード501の「本」と訳文の9番目のノード502の「book」のペアと、原文の13番目のノード506の「本」と訳文の15番目のノード503の「book」のペアとの対応付けが確定する。
なお、原文と訳文のノードの対応関係において、1つの原文のノードに対して複数の訳文のノードが対応付けられる場合、1対1に対応するノードに近接する対応関係の方が確からしいことは、一般に、経験則によって知られている。
以上の処理手順が実行されることにより、原文と訳文のノードの対応関係が確定する。
また、上記の説明では、単語対応付け処理を検索結果表示処理の中で行うとしたが、単語対応付け処理を単独で使用することもできる。たとえば、訳例原文とその訳例原文に対応する訳例訳文とから構成される文書データにおいて、訳例原文と訳例訳文の対応関係を知りたい場合などに、訳例原文と訳例訳文を入力し、単語対応付け処理を実行する。単語対応付け処理は、コンピュータに単語対応付けプログラムを実行させることにより実現する。この場合に実行される単語対応付け処理は、図7に示した単語対応付け処理の処理手順と同じであるので、説明は省略する。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、翻訳支援装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
(付記1) 予め登録された複数の翻訳例から翻訳対象文に類似する翻訳例を検索し、前記翻訳対象文とともに提示して翻訳を支援するための翻訳支援プログラムにおいて、
コンピュータに、
第1の言語文の翻訳対象文を入力し、前記翻訳対象文を検索キーとして、前記第1の言語文と前記第1の言語文を翻訳した第2の言語文の組で構成される翻訳例を記憶する翻訳例記憶手段から前記翻訳対象文に類似する類似翻訳例を検索し、
検索された前記類似翻訳例に関し、前記翻訳対象文に対する類似度を所定の類似度計算方法によって算出し、前記類似度に従って前記類似翻訳例を順番に並べ、
前記類似翻訳例の第1の言語文の単語・句に対応する訳語を対訳辞書より抽出し、前記訳語と前記類似翻訳例の第2の言語文の単語・句を照合して前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句を対応付け、
前記翻訳対象文、前記類似翻訳例の第1の言語文および前記類似翻訳例の第2の言語文の間で対応付けられた単語・句をハイライトして表示する、
処理を実行させることを特徴とする翻訳支援プログラム。
(付記2) 前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句の対応付けを行う際には、
前記類似翻訳例の第1の言語文の単語・句ごとに前記対訳辞書を検索して対応する訳語リストを作成し、
前記類似翻訳例の第2の言語文の単語・句と前記訳語リストに含まれる前記訳語を照合し、
前記類似翻訳例の第2の言語文の単語・句と同じ前記訳語を有する前記類似翻訳例の第1の言語文の単語・句を前記類似翻訳例の第2の言語文の単語・句と対応付けることを特徴とする付記1記載の翻訳支援プログラム。
(付記3) 前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句の対応付けを行う際には、
前記翻訳例の第2の言語文の単語・句ごとに、前記訳語を照合し、照合結果に応じて決められた得点を付与し、
算出された得点を単語類似度とし、前記単語類似度が高い前記類似翻訳例の第2の言語文の文中の単語・句を、前記訳語に対応する前記類似翻訳例の第1の言語文の単語・句に対応付けることを特徴とする付記1記載の翻訳支援プログラム。
(付記4) 前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句の対応付けを行う際には、
前記類似翻訳例の第2の言語文の単語・句と前記訳語を照合して前記訳語と一致する前記類似翻訳例の第2の言語文の単語・句に所定の点数を付与し、
さらに前記訳語ごとに予め設定された優先度に応じた所定の点数を加算する、
ことを特徴とする付記3記載の翻訳支援プログラム。
(付記5) 前記類似翻訳例の第2の言語文の単語・句と前記類似翻訳例の第1の言語文の単語・句の表記が一致する場合に所定の点数が付与されることを特徴とする付記3記載の翻訳支援プログラム。
(付記6) 前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句の対応付けを行う際には、
前記類似翻訳例の第2の言語文の単語・句が複数の前記類似翻訳例の第1の言語文の単語・句と対応付けられる場合、対応付けが確定した前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の単語・句に近接する方との対応付けを選択することを特徴とする付記1記載の翻訳支援プログラム。
(付記7) 第1の言語文と前記第1の言語文を翻訳した第2の言語文の文中の単語・句を対応付ける単語対応付けプログラムにおいて、
コンピュータに、
前記第1の言語文と前記第2の言語文とを入力し、
前記第1の言語文の単語・句ごとに対訳辞書を検索して訳語を抽出し、
前記第2の言語文の単語・句と前記訳語を照合し、
照合結果に応じて前記第2の言語文の単語・句と類似する前記訳語に対応する前記第1の言語文の単語・句を前記第2の言語文の文中の単語・句と対応付ける、
処理を実行させることを特徴とする単語対応付けプログラム。
(付記8) 予め登録された複数の翻訳例から翻訳対象文に類似する翻訳例を検索し、前記翻訳対象文とともに提示して翻訳を支援する翻訳支援方法において、
第1の言語文の翻訳対象文を入力手段で入力し、前記翻訳対象文を検索キーとして、前記第1の言語文と前記第1の言語文を翻訳した第2の言語文の組で構成される翻訳例を記憶する翻訳例記憶手段から類似翻訳例検索手段で前記翻訳対象文に類似する類似翻訳例を検索し、
検索された前記類似翻訳例の前記翻訳対象文に対する類似度を所定の類似度計算方法に基づいてランキング手段で算出し、前記類似度に従って前記類似翻訳例を順番に並べ、
単語対応付け手段で、前記類似翻訳例の第1の言語文の単語・句に対応する訳語を対訳辞書より抽出し、前記訳語と前記類似翻訳例の第2の言語文の単語・句を照合して前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句を対応付け、
前記翻訳対象文、前記類似翻訳例の第1の言語文および前記類似翻訳例の第2の言語文の間で対応付けられている単語・句をハイライトして表示する、
ことを特徴とする翻訳支援方法。
(付記9) 予め登録された複数の翻訳例から翻訳対象文に類似する翻訳例を検索し、前記翻訳対象文とともに提示して翻訳を支援する翻訳支援装置において、
第1の言語文と前記第1の言語文を翻訳した第2の言語文の組で構成される翻訳例を記憶する翻訳例記憶手段と、
前記第1の言語文と前記第2の言語文に含まれる単語・句に関する対訳辞書を記憶する対訳辞書記憶手段と、
前記第1の言語文の翻訳対象文を入力し、前記翻訳対象文を検索キーとして、前記翻訳例記憶手段から前記翻訳対象文に類似する類似翻訳例を検索する類似翻訳例検索手段と、
検索された類似翻訳例の前記翻訳対象文に対する類似度を所定の類似度計算方法に基づいて算出して前記類似翻訳例を前記類似度に従って順番に並べるランキング手段と、
前記類似翻訳例の第1の言語文の単語・句に対応する訳語を対訳辞書より抽出し、前記訳語と前記類似翻訳例の第2の言語文の単語・句を照合して前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の文中の単語・句を対応付けする単語対応付け手段と、
前記翻訳対象文、前記類似翻訳例の第1の言語文および前記類似翻訳例の第2の言語文の間で対応付けられている単語・句をハイライトして表示する検索結果表示手段と、
ハイライト表示されている前記翻訳対象文、前記類似翻訳例の第1の言語文および前記類似翻訳例の単語・句のうちの1つが選択されると、前記選択された単語・句と対応する他の2つの単語・句をよりハイライトして表示するハイライト制御手段と、
を具備することを特徴とする翻訳支援装置。
本発明の実施の形態に適用される発明の概念図である。 本発明の実施の形態の翻訳支援装置のハードウェア構成例を示す図である。 本発明の実施の形態の翻訳支援装置の機能ブロック図である。 本発明の実施の形態の翻訳対象文の入力から類似翻訳例の検索までの処理を示した図である。 本発明の実施の形態の単語対応付け処理を示した図である。 本発明の実施の形態の検索結果表示画面の一例を示した図である。 本発明の実施の形態の単語対応付け処理の手順を示したフローチャートである。 本発明の実施の形態の単語対応処理におけるノードマトリックス作成までの処理の一例を示した図である。 本発明の実施の形態の単語対応処理における単語類似度設定処理の一例を示した図である。 本発明の実施の形態の単語対応処理における対応付け選択処理の一例を示した図である。 従来の翻訳支援装置における検索結果表示画面の一例である。 従来の翻訳支援装置における翻訳例データベースの登録項目を説明する図である。
符号の説明
1 類似翻訳例検索手段
2 翻訳例データベース
3 検索結果表示手段
4 対訳辞書
5 登録手段
11 入力文
12a、12b、12c 類似翻訳例
13 訳例原文、訳例訳文

Claims (4)

  1. 予め登録された複数の翻訳例から翻訳対象文に類似する翻訳例を検索し、前記翻訳対象文とともに提示して翻訳を支援するための翻訳支援プログラムにおいて、
    コンピュータ
    第1の言語文の翻訳対象文を入力し、前記翻訳対象文を検索キーとして、前記第1の言語文と前記第1の言語文を翻訳した第2の言語文の組で構成される翻訳例を記憶する翻訳例記憶手段から前記翻訳対象文に類似する類似翻訳例を検索し、検索された前記類似翻訳例に関し、前記翻訳対象文に対する類似度を所定の類似度計算方法によって算出し、前記類似度に従って前記類似翻訳例を順番に並べる類似翻訳例検索手段
    前記類似翻訳例の第1の言語文の単語・句に対応する訳語を対訳辞書より抽出し、前記類似翻訳例の第2の言語文の単語・句ごとに、前記訳語を照合して予め設定された条件が成立するごとに条件に応じて設定された点数を加算して算出された得点を単語類似度とし、前記単語類似度が高い前記類似翻訳例の第の言語文の単語・句を、前記訳語に対応する前記類似翻訳例の第の言語文の単語・句対応付ける単語対応付け手段
    前記翻訳対象文、前記類似翻訳例の第1の言語文および前記類似翻訳例の第2の言語文の間で対応付けられた単語・句をハイライトしてモニタに表示するハイライト制御手段
    として機能させることを特徴とする翻訳支援プログラム。
  2. 前記単語対応付け手段が前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の単語・句の対応付けを行う際には、
    前記類似翻訳例の第1の言語文の単語・句と、前記類似翻訳例の第2の言語文の単語・句とのマトリックスを作成し、
    前記対訳辞書を検索して前記類似翻訳例の第1の言語文の単語・句ごとに対応する訳語リストを作成し、
    前記類似翻訳例の第2の言語文の単語・句と前記訳語リストに含まれる前記訳語を照合して前記単語類似度を算出し、前記類似翻訳例の第2の言語文の単語・句と前記訳語に対応する前記類似翻訳例の第1の言語文の単語・句とに対応する前記マトリックス上の交点の欄に前記単語類似度を設定し
    前記単語類似度が設定された前記マトリックスを参照し、最も高い単語類似度が設定される前記類似翻訳例の第1の言語文の単語・句前記類似翻訳例の第2の言語文の単語・句と対応付けることを特徴とする請求項1記載の翻訳支援プログラム。
  3. 前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の単語・句の対応付けを行う際には、
    前記類似翻訳例の第2の言語文の単語・句が複数の前記類似翻訳例の第1の言語文の単語・句と対応付けられる場合、対応付けが確定した前記類似翻訳例の第1の言語文と前記類似翻訳例の第2の言語文の単語・句に近接する対応付けを選択することを特徴とする請求項1記載の翻訳支援プログラム。
  4. 第1の言語文と前記第1の言語文を翻訳した第2の言語文の単語・句を対応付ける単語対応付けプログラムにおいて、
    コンピュータを、
    前記第1の言語文と前記第2の言語文とを入力し、前記第1の言語文の単語・句ごとに対訳辞書記憶手段に記憶される対訳辞書を検索して訳語を抽出し、前記第2の言語文の単語・句ごとに前記訳語を照合して予め設定された条件が成立するごとに条件に応じて設定された点数を加算して算出された得点を単語類似度として、前記単語類似度が高い前記第2の言語文の単語・句を、前記訳語に対応する前記第1の言語文の単語・句に対応付ける単語対応付け手段、
    として機能させることを特徴とする単語対応付けプログラム。
JP2004155549A 2004-05-26 2004-05-26 翻訳支援プログラムおよび単語対応付けプログラム Expired - Fee Related JP4076520B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004155549A JP4076520B2 (ja) 2004-05-26 2004-05-26 翻訳支援プログラムおよび単語対応付けプログラム
US10/959,723 US20050267734A1 (en) 2004-05-26 2004-10-06 Translation support program and word association program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004155549A JP4076520B2 (ja) 2004-05-26 2004-05-26 翻訳支援プログラムおよび単語対応付けプログラム

Publications (2)

Publication Number Publication Date
JP2005339087A JP2005339087A (ja) 2005-12-08
JP4076520B2 true JP4076520B2 (ja) 2008-04-16

Family

ID=35426526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004155549A Expired - Fee Related JP4076520B2 (ja) 2004-05-26 2004-05-26 翻訳支援プログラムおよび単語対応付けプログラム

Country Status (2)

Country Link
US (1) US20050267734A1 (ja)
JP (1) JP4076520B2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007517278A (ja) * 2003-11-14 2007-06-28 スピーチギア,インコーポレイティド トランスレータ用フレーズコンストラクタ
WO2006092744A1 (en) * 2005-03-03 2006-09-08 Barend Petrus Wolvaardt Language information system
US20060200464A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation Method and system for generating a document summary
JP4263181B2 (ja) * 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4058057B2 (ja) * 2005-04-26 2008-03-05 株式会社東芝 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JP4064413B2 (ja) * 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US7725306B2 (en) * 2006-06-28 2010-05-25 Microsoft Corporation Efficient phrase pair extraction from bilingual word alignments
US7877251B2 (en) * 2007-05-07 2011-01-25 Microsoft Corporation Document translation system
WO2009004723A1 (ja) 2007-07-04 2009-01-08 Fujitsu Limited 翻訳支援プログラム、翻訳支援装置および翻訳支援方法
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
AT506623A1 (de) * 2008-04-03 2009-10-15 Fts Computertechnik Gmbh Verfahren zur sicheren dynamischen bandbreitenallokation in tt-ethernet
JP5257189B2 (ja) * 2009-03-25 2013-08-07 富士通株式会社 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法
US8577909B1 (en) 2009-05-15 2013-11-05 Google Inc. Query translation using bilingual search refinements
US8577910B1 (en) 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
US8572109B1 (en) 2009-05-15 2013-10-29 Google Inc. Query translation quality confidence
US8538957B1 (en) * 2009-06-03 2013-09-17 Google Inc. Validating translations using visual similarity between visual media search results
WO2011146934A2 (en) 2010-05-21 2011-11-24 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
GB2494100B (en) * 2011-07-11 2015-03-11 Moshe Link Language learning system
US9087046B2 (en) * 2012-09-18 2015-07-21 Abbyy Development Llc Swiping action for displaying a translation of a textual image
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US10140293B2 (en) 2015-05-18 2018-11-27 Google Llc Coordinated user word selection for translation and obtaining of contextual information for the selected word
US9778929B2 (en) 2015-05-29 2017-10-03 Microsoft Technology Licensing, Llc Automated efficient translation context delivery
WO2017160746A1 (en) * 2016-03-14 2017-09-21 Yakyapp Corporation Devices, systems, and methods for selectively providing contextual language translation
CN107329961A (zh) * 2017-07-03 2017-11-07 西安市邦尼翻译有限公司 一种云翻译记忆库快速增量式模糊匹配的方法
JP6885318B2 (ja) * 2017-12-15 2021-06-16 京セラドキュメントソリューションズ株式会社 画像処理装置
CN113383340A (zh) * 2018-08-29 2021-09-10 艾伊派托利 专利文献撰写装置、方法、计算机程序、计算机可读记录介质、服务器及***
RU2767965C2 (ru) * 2019-06-19 2022-03-22 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для перевода исходной фразы на первом языке целевой фразой на втором языке
US11487837B2 (en) * 2019-09-24 2022-11-01 Searchmetrics Gmbh Method for summarizing multimodal content from webpages
US11392770B2 (en) * 2019-12-11 2022-07-19 Microsoft Technology Licensing, Llc Sentence similarity scoring using neural network distillation

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3066274B2 (ja) * 1995-01-12 2000-07-17 シャープ株式会社 機械翻訳装置
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
JP3161942B2 (ja) * 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置
JP3695191B2 (ja) * 1998-12-25 2005-09-14 日本電気株式会社 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体
US6862566B2 (en) * 2000-03-10 2005-03-01 Matushita Electric Industrial Co., Ltd. Method and apparatus for converting an expression using key words
US7483828B2 (en) * 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US20030061022A1 (en) * 2001-09-21 2003-03-27 Reinders James R. Display of translations in an interleaved fashion with variable spacing
JP3656907B2 (ja) * 2002-05-09 2005-06-08 富士通株式会社 翻訳支援装置
US20030236658A1 (en) * 2002-06-24 2003-12-25 Lloyd Yam System, method and computer program product for translating information
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system

Also Published As

Publication number Publication date
JP2005339087A (ja) 2005-12-08
US20050267734A1 (en) 2005-12-01

Similar Documents

Publication Publication Date Title
JP4076520B2 (ja) 翻訳支援プログラムおよび単語対応付けプログラム
JP4997966B2 (ja) 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法
JPH07282063A (ja) 機械翻訳装置
JPH09114852A (ja) 情報検索装置
JP2010225077A (ja) 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法
JP2002251401A (ja) 文書検索装置および方法ならびに記憶媒体
JPH1011424A (ja) 文章作成支援装置
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP5259764B2 (ja) 拾い読み支援システム、拾い読み支援方法及びプログラム
JP2958390B2 (ja) 情報検索装置および方法
JPH10340271A (ja) 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JP2868256B2 (ja) プログラム編集装置
JP3160897B2 (ja) 機械翻訳装置
JP3378267B2 (ja) 機械翻訳装置
JPH1139333A (ja) 文書検索装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH10293761A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JPH04281558A (ja) 文書検索方法および装置
JPH08153112A (ja) 文書作成装置及び文書作成方法
JPH06266759A (ja) 単語連語翻訳装置
JP2009080777A (ja) 機械翻訳装置及び機械翻訳プログラム
JPH03122768A (ja) 索引付け支援装置
JPH07160720A (ja) 機械で読み取り可能な情報の翻訳を支援し、効率化する装置及びその方法
JPH04137170A (ja) 機械翻訳装置
JPH04138564A (ja) 文章読解支援装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070828

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees