JP4100637B2 - 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法 - Google Patents

翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法 Download PDF

Info

Publication number
JP4100637B2
JP4100637B2 JP2005355001A JP2005355001A JP4100637B2 JP 4100637 B2 JP4100637 B2 JP 4100637B2 JP 2005355001 A JP2005355001 A JP 2005355001A JP 2005355001 A JP2005355001 A JP 2005355001A JP 4100637 B2 JP4100637 B2 JP 4100637B2
Authority
JP
Japan
Prior art keywords
translation
key
record
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005355001A
Other languages
English (en)
Other versions
JP2007157062A (ja
Inventor
永寿 赤羽
祐美 池座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2005355001A priority Critical patent/JP4100637B2/ja
Priority to CNB2006101484055A priority patent/CN100552674C/zh
Priority to US11/608,368 priority patent/US7548845B2/en
Publication of JP2007157062A publication Critical patent/JP2007157062A/ja
Application granted granted Critical
Publication of JP4100637B2 publication Critical patent/JP4100637B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

本発明は、翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法に関する。特に本発明は、過去の翻訳結果を利用することにより新規の翻訳を支援する装置、方法、プログラム及び翻訳支援サービス提供方法に関する。
異なる言語による同一の文章を対応させて記憶管理する例文データベースを備える機械翻訳システム(特許文献1)、第1言語の質問文とその第2言語の翻訳質問文とを対にして記憶するデータベースを備える通訳装置(特許文献2)、相互の翻訳である第1言語と第2言語の単語を関連付けるデータベースを生成する方法(特許文献3)が知られている。これらによれば、翻訳に要する時間及び使用者の労力等を削減することができる。
特開2004−220266号公報 特開2000−90087号公報 特表2004−535617号公報
ところで、過去の訳文を取り出して翻訳に利用する翻訳装置は、データベースに蓄積される訳文が増加した場合、検索対象が増加するので、最適な訳文を取り出すまでの時間が長くなる。従って、この翻訳装置は、新規の翻訳時において利用できる適切な過去の訳文を、大量の過去の訳文の中から高速に決定できることが要求される。
そこで本発明は、上記の課題を解決することのできる装置、方法、プログラム及び翻訳支援サービス提供方法を提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明においては、過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つ記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択する装置であって、前記入力されたテキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメントに分割された原文を所定の変換規則に基づいて符号化したものである入力キーを生成する、第1キー生成部と、前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを取得する、取得部と、前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを検索する、キー検索部と、前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数をカウントする、第1カウント部と、前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に利用する翻訳記録を決定する、決定部とを備える装置、当該装置を用いた翻訳支援サービス提供方法、当該装置としてコンピュータを機能させるプログラムを提供する。
また、本発明においては、過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つ記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択する方法であって、原文と、原文を翻訳した結果得られた訳文との組を、翻訳セグメントごとに前記複数の翻訳記録の1つとして格納する、格納段階と、 使用者から入力された前記入力されたテキスト内の翻訳セグメントのそれぞれについて当該記翻訳セグメント毎に分割された原文を所定の変換規則に基づいて符号化したものである入力キーを生成する、第1キー生成段階と、前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを取得する、取得段階と、前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを検索する、キー検索段階と、前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数をカウントする、第1カウント段階と、前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に用いる翻訳記録を決定する、決定段階と、決定した前記翻訳記録を用いて前記入力されたテキストを翻訳する、翻訳段階とを備える方法を提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、新規の翻訳時において利用できる適切な過去の翻訳記録を、高速に決定することができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明の実施形態に係る翻訳支援装置10の構成を示す。翻訳支援装置10は、格納部21と、入力部22と、第1キー生成部23と、第2キー生成部24と、取得部25と、キー検索部26と、第1カウント部27と、決定部28と、翻訳部29と、出力部30とを備える。翻訳支援装置10は、新規に入力されたテキストの翻訳に利用する適切な翻訳記録ファイル11を高速に決定する。
翻訳記録ファイル11は、本発明に係る翻訳記録の一例であり、過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組を少なくとも1つ記憶するファイルである。なお、翻訳記録ファイル11は、これに代えて、当該翻訳記録ファイル11に含まれる情報と同一情報が登録されたデータベース、又は、当該翻訳記録ファイル11に含まれる情報と同一情報を所定の物理領域に記憶したメモリ等であってよい。
翻訳記録ファイル11は、既に翻訳が完了した翻訳プロジェクト毎に生成される。翻訳プロジェクトは、複数の翻訳セグメントが集合した単位であり、例えば、翻訳対象となる1冊の製品マニュアル等といった単位である。また、複数の翻訳記録ファイル11のそれぞれは、翻訳の対象等が示されたメタ情報を更に記憶してよい。
格納部21は、複数の翻訳記録ファイル11および、翻訳記録ファイル11のそれぞれに対応した翻訳記録キーテーブル12を格納する。
入力部22は、翻訳対象となる原文のテキストデータである原文テキストを入力する。また、入力部22は、翻訳記録ファイル11を選択するための条件情報を入力してもよい。条件情報を入力する場合、入力部22は、メタ情報に含まれる属性情報を指定する条件情報、例えば、翻訳の対象等を入力する。入力部22は、入力した原文テキストを第1キー生成部23、決定部28及び翻訳部29に供給する。また、入力部22は、入力した条件情報を取得部25に供給する。
第1キー生成部23は、入力された原文テキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメント毎に分割された原文を所定の変換規則に基づいて符号化したものである入力キーを生成する。
この場合において、所定の変換規則は、一例として、異なる翻訳セグメントから生成された2つの入力キー同士を比較した場合には、当該2つの入力キーは多くの場合において異なる値となり、同一の翻訳セグメントから生成された2つの入力キー同士を比較した場合には、当該2つの入力キーは常に同じ値となる、という変換規則である。このような変換規則によれば、任意の2つの入力キーが同一であるか否かを判断することにより、それぞれの元となる翻訳セグメント毎に原文が一致しているか否かを推定することができる。従って、翻訳支援装置10は、上記所定の変換規則を用いて簡易な符号構成の入力キーを生成することにより、翻訳セグメント毎に原文が一致しているか否かを、高速に検索することができる。
第1キー生成部23は、生成した入力キーを、さらに所定の分類規則に従って分類して、分類を示すタイプ情報を生成してもよい。第1キー生成部23は、それぞれの入力キーをキー検索部26に供給する。また、第1キー生成部23は、入力キーを分類した場合には、タイプ情報をそれぞれの入力キーに対応させてキー検索部26に供給する。
第2キー生成部24は、新規の翻訳に先立って、複数の翻訳記録ファイル11のそれぞれを読み出して、当該翻訳記録ファイル11内の翻訳セグメントのそれぞれについて、翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化した翻訳記録キーを生成する。また、第2キー生成部24は、翻訳が完了して翻訳記録ファイル11を格納部21に格納する時に、翻訳記録キーを生成して翻訳記録ファイル11とともに登録してもよい。
この場合において所定の変換規則は、入力キーの生成の規則と同一である。従って、入力キーと翻訳記録キーとが一致するか否かを判断することにより、元の翻訳セグメント毎に分割された原文が原文テキストと同一であるか否かを推定することができる。
そして、第2キー生成部24は、複数の翻訳記録ファイル11のそれぞれに対応して、メタ情報と、それぞれの翻訳セグメントについての翻訳記録キーと格納した翻訳記録キーテーブル12を作成する。第2キー生成部24は、作成した翻訳記録キーテーブル12を格納部21に記憶させる。
さらに、第2キー生成部24は、生成した翻訳記録キーを、入力キーと同一の分類規則に従って分類してもよい。第2キー生成部24は、翻訳記録キーが分類されている場合には、例えば、翻訳記録キーをタイプ毎に並べ替えをして翻訳記録キーテーブル12に格納するとともに、例えば各タイプの先頭位置を示すポインタを翻訳記録キーテーブル12のヘッダ等に付加する。
取得部25は、新規の翻訳時において、複数の翻訳記録ファイル11のそれぞれに対応付けて、当該翻訳記録ファイル11内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを取得して、キー検索部26に供給する。本実施形態においては、取得部25は、翻訳記録ファイル11のそれぞれについて、格納部21に格納された翻訳記録キーテーブル12の中から翻訳記録キーを読み出す。なお、取得部25は、条件情報に応じて翻訳記録キーテーブル12を選択して、選択された翻訳記録キーテーブル12の中から翻訳記録キーを取得してもよい。例えば、取得部25は、それぞれの翻訳記録キーテーブル12のメタ情報を参照して、条件情報と一致する属性を有する翻訳記録キーテーブル12を選択し、選択した翻訳記録キーテーブル12から翻訳記録キーを読み出してもよい。また、取得部25は、全ての翻訳記録キーテーブル12を選択して、選択された全ての翻訳記録キーテーブル12の中から翻訳記録キーを取得してもよい。
キー検索部26は、複数の翻訳記録ファイル11のそれぞれについて、それぞれの入力キーと一致する翻訳記録キーが存在するか否かを検索する。本実施形態においては、キー検索部26は、複数の翻訳記録ファイル11のそれぞれについて翻訳記録キーテーブル12から読み出した翻訳記録キーの中に、入力キーと一致する翻訳記録キーが存在するか否かを検索する。これにより、キー検索部26は、原文テキストに含まれている翻訳セグメントと一致すると推定できる翻訳セグメントが、翻訳記録ファイル11に含まれているか否かを検索することができる。
また、キー検索部26は、入力キー及び翻訳記録キーが分類されている場合には、タイプ情報により翻訳記録キーを絞り込んだ後に、入力キーと一致する翻訳記録キーが存在するか否かを検索してよい。これにより、キー検索部26は、より高速に検索することができる。
また、キー検索部26は、条件情報に応じて翻訳記録キーテーブル12が選別されている場合には、使用者から指定された条件情報と一致するメタ情報を有する翻訳記録キーテーブル12から読み出した翻訳記録キーの中に、それぞれの入力キーと一致する翻訳記録キーが存在するか否かを検索する。これにより、検索する翻訳記録ファイル11の数を減らすことができ、短期間で検索結果を得ることができる。
第1カウント部27は、キー検索部26による検索結果を参照して、複数の翻訳記録ファイル11のそれぞれについて、一致する翻訳記録キーが存在する入力キーの数をカウントする。すなわち、第1カウント部27は、原文テキストの翻訳セグメントと一致すると推定される翻訳セグメントの数を示すカウント値を、翻訳記録ファイル11のそれぞれに対応させて出力する。
決定部28は、第1カウント部27による複数の翻訳記録ファイル11のそれぞれについてのカウント結果に基づいて、入力された原文テキストの翻訳に用いる翻訳記録ファイル11を決定する。すなわち、決定部28は、格納部21に記憶された複数の翻訳記録ファイル11の中から、原文テキストの翻訳に利用するのに適した翻訳記録ファイル11を、第1カウント部27が生成したカウント値に基づき決定する。これにより、決定部28は、原文テキスト内の翻訳セグメントと同一又は類似する原文を有する翻訳記録ファイル11を出力する。決定部28は、決定した翻訳記録ファイル11を翻訳部29に供給する。
翻訳部29は、決定部28により決定された翻訳記録ファイル11を用いて、原文テキストを翻訳する場合における支援処理を行う。一例として、翻訳部29は、決定された翻訳記録ファイル11を原文テキストとともに表示する。そして、翻訳部29は、使用者の指示に応じて、原文テキスト内の翻訳セグメントのうち決定部28により決定された翻訳記録ファイル11に記憶された原文と同一または類似の原文に係る翻訳セグメントを、翻訳記録ファイル11に記憶された原文に対応する訳文を用いて翻訳する。
出力部30は、翻訳部29の支援に基づき翻訳された原文テキストの訳文を出力する。そして、出力部30は、原文テキストの原文及び訳文に基づき新たな翻訳記録ファイル11を生成して、格納部21に格納する。なお、この場合において、第2キー生成部24は、翻訳記録ファイル11の生成とともに翻訳記録キーを生成して、格納部21に格納してもよい。
翻訳支援装置10によれば、文章を値に変換した入力キー及び翻訳記録キーを用いて文章同士の一致性を判断することにより、類似した翻訳記録ファイル11を検索するので、原文テキストの翻訳に利用するのに適した翻訳記録ファイル11を高速に決定することができる。
図2は、翻訳記録ファイル11の構成の一例を示す。翻訳記録ファイル11は、メタ情報と、文章の翻訳の単位である翻訳セグメント毎に分割された原文および訳文とを含む。メタ情報は、当該翻訳記録ファイル11の属性が記述された情報であり、属性情報として、例えば、翻訳記録ファイル11に格納された翻訳の対象、分野、翻訳者、翻訳日、および翻訳日時の少なくとも1つを含む。翻訳記録ファイル11は、翻訳セグメント単位で原文と訳文とを一対にして記憶する。例えば、1文の原文に対して1文の訳文が対応する場合には、当該1文の原文及び1文の訳文が1つの翻訳セグメントとなる。また、2文の原文に対して1文の訳文が対応する場合は、例えば、当該原文2文及び対応する1文の訳文が1つの翻訳セグメントとなり、或いは、原文2文のそれぞれに同一の訳文が対応した2つの翻訳セグメントとなる。
図3は、翻訳記録キーテーブル12の一例を示す。第2キー生成部24は、翻訳記録ファイル11毎に、翻訳記録キーテーブル12を生成する。翻訳記録キーテーブル12は、メタ情報と、複数の翻訳記録キーとを含む。翻訳記録キーテーブル12は、翻訳記録キーをタイプ毎に並び替えて格納し、各タイプの先頭の翻訳記録キーの位置を例えばヘッダに格納してよい。これにより、キー検索部26は、翻訳記録キーを高速に検索することができる。なお、翻訳記録キーテーブル12は、それぞれ翻訳記録キーのタイプを示すタイプ情報を、翻訳記録キーに対応させて格納してもよい。
図4は、第1キー生成部23及び第2キー生成部24における、入力キー又は翻訳記録キーの生成動作とともにタイプ分類動作のフローの一例を示す。まず、第1キー生成部23及び第2キー生成部24は、入力された原文テキスト又は翻訳記録ファイル11内の翻訳セグメント毎に分割された原文に含まれる各単語の先頭から予め定められた文字数分ずつを選択してこれらを連結した文字列に基づいて入力キー又は翻訳記録キーを生成する(S11)。第1キー生成部23及び第2キー生成部24は、例えば、翻訳セグメント毎に分割された原文に含まれている各単語のうち、所定文字数以上(例えば3文字以上)の単語の先頭の1文字を抽出し、抽出した文字を連結することにより入力キー又は翻訳記録キーを生成する。
第1キー生成部23及び第2キー生成部24は、翻訳セグメント毎に分割された原文に含まれる単語の数が予め定められた単語数以下の場合に各単語の先頭から予め定められた第1の文字数分ずつを選択してこれらを連結した文字列に基づいて入力キーおよび翻訳記録キーを生成してもよい。そして、翻訳セグメント毎に分割された原文に含まれる単語の数が予め定められた単語数を超える場合に各単語の先頭から第1の文字数より小さい第2の文字数分ずつを選択してこれらを連結した文字列に基づいて入力キーおよび翻訳記録キーを生成してよい。第1キー生成部23及び第2キー生成部24は、一例として、1セグメントが6個以下の単語で構成されていれば単語の先頭から2文字を連結し、1セグメントが6個より多い単語で構成されていれば単語の先頭の1文字を連結した入力キーおよび翻訳記録キーを生成する。これにより、翻訳セグメント毎に分割された原文の単語数が少ない場合であっても、他の翻訳セグメントとの識別性を高くすることができる。
これに代えて、第1キー生成部23及び第2キー生成部24は、単語の末尾から予め定められた文字数を抽出して、これらを連結した入力キー又は翻訳記録キーを生成してもよいし、単語の中央部分等の所定の文字位置から予め定められた文字数を抽出して、これらを連結した入力キー又は翻訳記録キーを生成してもよい。
また、第1キー生成部23及び第2キー生成部24は、翻訳セグメント毎に分割された原文に含まれる単語のうち、所定の文字数より短い単語からは文字を抽出せず、また、抽出すべき文字が予め定められた文字(数字、記号等)である場合には当該文字を抽出せずに、入力キー又は翻訳記録キーを生成してもよい。また、第1キー生成部23及び第2キー生成部24は、上記の方法で文字が抽出できない場合には、その翻訳セグメントは通常の文章ではないので、その翻訳セグメント毎に分割された原文の全てを入力キー又は翻訳記録キーとしてもよい。
次に、第1キー生成部23及び第2キー生成部24は、生成した入力キー又は翻訳記録キーをタイプ毎に分類する(S12)。第1キー生成部23及び第2キー生成部24は、例えば、入力キー又は翻訳記録キーを文字数により分類し、また、特殊文字が含まれているか否かで分類する。第1キー生成部23及び第2キー生成部24は、当該分類を終了すると、入力キー又は翻訳記録キー、及び、分類結果を示すタイプ情報を出力する。
以上のステップS12及びS13により、第1キー生成部23及び第2キー生成部24によれば、同一又は類似の翻訳セグメントであるか否かを容易に判断するための入力キー及び翻訳記録キー、並びに、検索を高速にするタイプ情報を、簡易に生成することができる。
図5及び図6は、本実施形態に係る翻訳支援装置10における、原文テキストが入力されてから、入力キー及び翻訳記録キーが一致する翻訳セグメントのカウント値を出力するまでの動作のフローを示す。
まず、入力部22は、原文テキストを入力する(S21)。次に、入力部22は、使用者により指定された条件を、条件情報として入力する(S22)。入力部22は、一例として、メタ情報に含まれる属性情報を指定する条件情報、例えば、翻訳の対象、分野、翻訳者、翻訳日または翻訳日時といった情報を、条件情報として入力する。次に、取得部25は、格納部21に格納された複数の翻訳記録ファイル11のそれぞれを参照して、使用者により指定された条件と一致する翻訳記録ファイル11を特定する(S23)。なお、取得部25は、これに代えて、翻訳記録キーテーブル12を参照して、翻訳記録キーテーブル12を特定してもよい。次に、取得部25は、特定した複数(例えばN個。Nは1以上の整数。)の翻訳記録ファイル11のそれぞれについての翻訳記録キーテーブル12を、格納部21から取得する(S24)。
次に、第1カウント部27は、特定したN個の翻訳記録ファイル11のそれぞれについてのカウント値P[1]〜P[N]の値を0にクリアする(S25)。カウント値P[1]〜P[N]は、翻訳記録ファイル11のそれぞれについての、入力キーに一致する翻訳記録キーの数を示す。なお、カウント値P[1]〜P[N]は、1つの翻訳記録ファイル11内において、1つの入力キーに対して複数の翻訳記録キーが重複して一致した場合には、例えば1だけ増加される。次に、第1キー生成部23は、変数Xに1を代入する(S26)。次に、第1キー生成部23は、変数Wに1を代入する(S27)。次に、第1キー生成部23は、原文テキストにおけるW番目の翻訳セグメントについての入力キーを生成する(S31)。次に、第1キー生成部23は、生成した入力キーについてのタイプ情報を生成する(S32)。
次に、キー検索部26は、N個の翻訳記録キーテーブル12のうちのX番目の翻訳記録キーテーブル12を参照して、入力キーとタイプ情報が一致する翻訳記録キーを抽出する(S33)。次に、キー検索部26は、ステップS28で抽出した翻訳記録キーの中に、入力キーと一致する翻訳記録キーが存在するか否かを検出する(S34)。
次に、キー検索部26は、ステップS33の処理において入力キーと一致する翻訳記録キーが検出されたか否かを判断する(S35)。第1カウント部27は、一致する翻訳記録キーが検出された場合には(S35のYes)、P[X]に(1+P[X])を代入することにより、X番目の翻訳記録ファイル11についてのカウント値を1増加する(S36)。キー検索部26は、一致する翻訳記録キーが検出されなかった場合(S35のNo)又はステップS36の処理を終えた場合には、原文テキストの最後の翻訳セグメントまで処理が終了したか否かを判断する(S37)。原文テキストの最後の翻訳セグメントまで処理が終了していない場合には(S37のNo)、変数Wに(W+1)を代入し(S38)、ステップS31に処理を戻る。これにより、原文テキストの次の翻訳セグメントにおける入力キーについて、一致する翻訳記録キーが検出される。
そして、翻訳支援装置10は、ステップS37において原文テキストの最後のセグメントまで処理が終了した場合には(S37のYes)、ステップS31〜S37のループ処理を抜ける。ステップS31〜S37の処理により、翻訳支援装置10は、X番目の翻訳記録ファイル11についてのカウント値P[X]を算出することができる。
最後の翻訳セグメントまで処理が終了した場合には(S37のYes)、次に、変数XがN以上であるか否かを判断する(S41)。変数XがN以上でない場合には(S41のNo)、変数Xに(X+1)を代入し(S42)、ステップS27に処理を戻る。翻訳支援装置10は、ステップS27〜S42のループ処理を繰り返すことにより、原文テキストの各翻訳セグメントが翻訳記録ファイル11にヒットした回数を、翻訳記録ファイル11毎について累計したカウント値P[1]〜P[N]を求めることができる。
そして、最後の翻訳記録ファイル11まで処理が終了した場合には(S41のYes)、次に、第1カウント部27は、特定したN個の翻訳記録ファイル11についてのカウント値P[1]〜P[N]を決定部28に出力する(S43)。以上のステップS21〜S43の処理により、第1カウント部27は、入力キーに一致する翻訳記録キーの数を示すカウント値P[1]〜P[N]を、翻訳記録ファイル11のそれぞれに対応させて、決定部28へ出力することができる。
図7は、本実施形態に係る決定部28の構成を示す。決定部28は、一例として、第1選択部41と、第2カウント部42と、第2選択部43とを有してよい。第1選択部41は、一致する翻訳記録キーが存在する入力キーの数の割合が大きいものから順番に、予め定められた個数の翻訳記録ファイル11を選択する。第1選択部41は、例えば、複数の翻訳記録ファイル11のそれぞれの翻訳セグメント数に対するカウント値Pの割合であるヒット率を算出し、当該ヒット率の上位の所定個を選択する。第1選択部41は、例えば、複数の翻訳記録ファイル11のそれぞれについてのヒット率を、原文テキストに含まれている翻訳セグメント数に対するカウント値Pの割合としてもよい。また、第1選択部41は、ヒット率ではなく単にヒットした個数の上位の所定個を選択してもよい。そして、第1選択部41は、選択したヒット率に対応する翻訳記録ファイル11を格納部21から読み出して第2カウント部42に出力する。
第2カウント部42は、第1選択部41により選択された翻訳記録ファイル11のそれぞれについて、入力された原文テキスト内の翻訳セグメントのそれぞれと同一または類似の原文が記憶された翻訳記録ファイル11内の翻訳セグメントの数をカウントする。第2カウント部42は、一例として、完全マッチング数、又は、翻訳セグメントについての構文木を生成し、構文木のノード同士が同一又は類似する数をカウントする。第2選択部43は、第2カウント部42によるカウント結果に基づいて、入力された原文テキストの翻訳に用いるべき翻訳記録ファイル11を選択する。そして、第2選択部43は、選択した翻訳記録ファイル11を翻訳部29に出力する。
図8および図9は、本実施形態に係る決定部28の動作のフローを示す。まず、第1選択部41は、カウントP[1]〜P[N]を入力する(S51)。次に、第1選択部41は、カウントP[1]〜P[N]に基づき、対応するN個の翻訳記録ファイル11毎のヒット率を算出する(S52)。次に、第1選択部41は、N個の翻訳記録ファイル11のうち、ヒット率が高いM個の翻訳記録ファイル11を選択する(S53)。なお、Mは、Nより小さい1以上の整数である。ステップS53において、第1選択部41は、ヒット率が所定のしきい値以上の翻訳記録ファイル11を選択してもよい。また、ヒット率に代えて、ヒットする個数がしきい値以上の翻訳記録ファイル11を選択してもよい。
次に、第2カウント部42は、選択したM個の翻訳記録ファイル11のそれぞれについてのカウント値Q[1]〜Q[M]の値を0にクリアする(S54)。カウント値Q[1]〜Q[M]は、翻訳記録ファイル11のそれぞれについての、原文テキストと同一又は類似する翻訳セグメントの数を示す。次に、第2カウント部42は、変数Yに1を代入する(S55)。次に、第2カウント部42は、原文テキストにおけるY番目の翻訳セグメント毎に分割された原文を取得する(S56)。
次に、第2カウント部42は、変数Zに1を代入する(S61)。次に、第2カウント部42は、M個の翻訳記録ファイル11のうちのZ番目の翻訳記録ファイル11を検索して、原文テキストにおけるY番目の翻訳セグメントと同一又は類似する翻訳セグメントが存在するか否かを検出する(S62)。すなわち、第2カウント部42は、ステップS62において、当該Y番目の翻訳セグメントと同一の翻訳セグメント、又は、当該Y番目の翻訳セグメントを翻訳する場合に利用ができる程度の一致性を有する翻訳セグメントを、Z番目の翻訳記録ファイル11から検出する。
次に、第2カウント部42は、ステップS62の処理において同一又は類似する翻訳セグメントが検出されたか否かを判断する(S63)。第2カウント部42は、同一又は類似する翻訳セグメントが検出された場合には(S63のYes)、Q[Z]に(1+Q[Z])を代入することにより、Z番目の翻訳記録ファイル11についてのカウント値を1増加する(S64)。第2カウント部42は、同一又は類似する翻訳セグメントが検出されなかった場合(S63のNo)又はステップS64の処理を終えた場合には、変数ZがM以上であるか否かを判断する(S65)。変数ZがM以上でない場合には(S65のNo)、変数Zに(Z+1)を代入し(S66)、ステップS62に処理を戻る。
そして、決定部28は、ステップS65において変数ZがM以上である場合には(S65のYes)、ステップS62〜S66のループ処理を抜ける。ステップS62〜S66のループ処理により、決定部28は、M個の翻訳記録ファイル11のうち、原文テキストにおけるY番目の翻訳セグメントと同一又は類似する翻訳セグメントを有する翻訳記録ファイル11について、カウント値を1増加させることができる。
次に、第2カウント部42は、原文テキストの最後の翻訳セグメントまで処理が終了したか否かを判断する(S71)。最後の翻訳セグメントまで処理が終了していない場合には(S71のNo)、変数Yに(Y+1)を代入し(S72)、ステップS56に処理を戻る。
そして、最後の翻訳セグメントまで処理が終了した場合には(S72のYes)、第2カウント部42は、選択したM個の翻訳記録ファイル11についてのカウント値Q[1]〜Q[M]を、原文テキストの翻訳に用いる翻訳記録ファイル11を決定する(S73)。第2カウント部42は、例えば、カウント値が大きい翻訳記録ファイル11を選択する。そして、第2選択部43は、決定した翻訳記録ファイル11を翻訳部29に出力する。以上のステップS51〜S73の処理により、決定部28は、翻訳に利用ができる翻訳記録ファイル11を決定して、翻訳部29に供給することができる。
翻訳支援装置10によれば、多数の翻訳記録ファイル11の中から入力キー及び翻訳記録キーを用いて原文テキストと近似する複数の翻訳記録ファイル11に絞り込んだ後、翻訳セグメント毎に分割された原文同士を直接比較して、翻訳に利用することができる翻訳記録ファイル11を抽出する。このように翻訳支援装置10は、大まかな検索を行った後に詳細な検索を行うので、高速且つ的確な翻訳記録ファイル11を決定することができる。
図10は、本実施形態の変形例に係る決定部28の構成を示す。本変形例は、本実施形態と略同一の構成を採るので、図10における図7と略同一の機能を有する構成要素には同一の符号を付けるとともに、以下本実施形態との相違点を除き説明を省略する。
本変形例に係る決定部28は、第1選択部41と、抽出部51と、第3選択部52とを有する。
抽出部51は、第1選択部41により選択された翻訳記録ファイル11から、入力された原文テキスト内の翻訳セグメントのそれぞれと同一または類似の原文が記憶された翻訳セグメントを抽出して新たな翻訳記録ファイル11を生成する。第3選択部52は、抽出部51により生成された新たな翻訳記録ファイル11を、以後の翻訳に用いる複数の翻訳記録ファイル11に加えるべき翻訳記録ファイル11として選択する。
図11および図12は、本変形例に係る決定部28の動作のフローを示す。図11および図12に示す変形例に係る決定部28の動作フローは、以下に示す点を除くと略同一である。従って、以下、本変形例に係る決定部28の動作フローについては、ステップS81及びステップS82を除き説明を省略する。
ステップS81において、第3選択部52は、同一又は類似する翻訳セグメントが検出された場合には(S63のYes)、検出された翻訳セグメント毎の原文及び訳文を、例えば内部メモリ等に登録する。そして、ステップS82において、第3選択部52は、登録された翻訳セグメント毎の原文及び訳文を用いて新たな翻訳記録ファイル11を生成し、翻訳に用いる翻訳記録ファイル11として翻訳部29に出力する。本変形例によれば、翻訳対象である原文テキストと同一又は類似する文章が、複数の翻訳記録ファイル11に対して分散している場合等であっても、これらを集めて1つの翻訳記録ファイル11として利用することができる。
図13は、本発明の実施形態に係るコンピュータ1900のハードウェア構成の一例を示す。本実施形態に係るコンピュータ1900は、ホスト・コントローラ2082により相互に接続されるCPU2000、RAM2020、グラフィック・コントローラ2075、及び表示装置2080を有するCPU周辺部と、入出力コントローラ2084によりホスト・コントローラ2082に接続される通信インターフェイス2030、ハードディスクドライブ2040、及びCD−ROMドライブ2060を有する入出力部と、入出力コントローラ2084に接続されるROM2010、フレキシブルディスク・ドライブ2050、及び入出力チップ2070を有するレガシー入出力部とを備える。
ホスト・コントローラ2082は、RAM2020と、高い転送レートでRAM2020をアクセスするCPU2000及びグラフィック・コントローラ2075とを接続する。CPU2000は、ROM2010及びRAM2020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ2075は、CPU2000等がRAM2020内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置2080上に表示させる。これに代えて、グラフィック・コントローラ2075は、CPU2000等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ2084は、ホスト・コントローラ2082と、比較的高速な入出力装置である通信インターフェイス2030、ハードディスクドライブ2040、CD−ROMドライブ2060を接続する。通信インターフェイス2030は、ネットワークを介して他の装置と通信する。ハードディスクドライブ2040は、コンピュータ1900内のCPU2000が使用するプログラム及びデータを格納する。CD−ROMドライブ2060は、CD−ROM2095からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。
また、入出力コントローラ2084には、ROM2010と、フレキシブルディスク・ドライブ2050、及び入出力チップ2070の比較的低速な入出力装置とが接続される。ROM2010は、コンピュータ1900が起動時に実行するブート・プログラムや、コンピュータ1900のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ2050は、フレキシブルディスク2090からプログラム又はデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。入出力チップ2070は、フレキシブルディスク・ドライブ2050や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
RAM2020を介してハードディスクドライブ2040に提供されるプログラムは、フレキシブルディスク2090、CD−ROM2095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM2020を介してコンピュータ1900内のハードディスクドライブ2040にインストールされ、CPU2000において実行される。
また、コンピュータ1900にインストールされ、コンピュータ1900を翻訳支援装置10として機能させるプログラムは、格納部21として機能する格納モジュールと、入力部22として機能する入力モジュールと、第1キー生成部23として機能する第1キー生成モジュールと、第2キー生成部24として機能する第2キー生成モジュールと、取得部25として機能する取得モジュールと、キー検索部26として機能するキー検索モジュールと、第1カウント部27として機能する第1カウントモジュールと、決定部28として機能する決定モジュールと、翻訳部29として機能する翻訳モジュールと、出力部30として機能する出力モジュールとを備える。これらのプログラム又はモジュールは、CPU2000等に働きかけて、コンピュータ1900を、格納部21と、入力部22と、第1キー生成部23と、第2キー生成部24と、取得部25と、キー検索部26と、第1カウント部27と、決定部28と、翻訳部29と、出力部30としてそれぞれ機能させる。
以上に示したプログラム又はモジュールは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク2090、CD−ROM2095の他に、DVDやCD等の光学記録媒体、MO等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1900に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
本発明の実施形態に係る翻訳支援装置10の構成を示す。 翻訳記録ファイル11の構成の一例を示す。 翻訳記録キーテーブル12の一例を示す。 第1キー生成部23及び第2キー生成部24における、入力キー又は翻訳記録キーの生成動作とともにタイプ分類動作のフローの一例を示す。 本実施形態に係る翻訳支援装置10における、原文テキストが入力されてから、入力キー及び翻訳記録キーが一致する翻訳セグメントのカウント値を出力するまでの動作のフローを示す。 図5に続く動作のフローを示す。 本実施形態に係る決定部28の構成を示す。 本実施形態に係る決定部28の動作のフローを示す。 図8に続く動作のフローを示す。 本実施形態の変形例に係る決定部28の構成を示す。 本変形例に係る決定部28の動作のフローを示す。 図12に続く動作のフローを示す。 本発明の実施形態に係るコンピュータ1900のハードウェア構成の一例を示す。
符号の説明
10 翻訳支援装置
11 翻訳記録ファイル
12 翻訳記録キーテーブル
21 格納部
22 入力部
23 第1キー生成部
24 第2キー生成部
25 取得部
26 キー検索部
27 第1カウント部
28 決定部
29 翻訳部
30 出力部
41 第1選択部
42 第2カウント部
43 第2選択部
51 抽出部
52 第3選択部
1900 コンピュータ
2000 CPU
2010 ROM
2020 RAM
2030 通信インターフェイス
2040 ハードディスクドライブ
2050 フレキシブルディスク・ドライブ
2060 CD−ROMドライブ
2070 入出力チップ
2075 グラフィック・コントローラ
2080 表示装置
2082 ホスト・コントローラ
2084 入出力コントローラ
2090 フレキシブルディスク
2095 CD−ROM

Claims (13)

  1. 過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つ記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択する装置であって、
    前記入力されたテキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメントに分割された原文を所定の変換規則に基づいて符号化したものである入力キーを生成する、第1キー生成部と、
    前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを取得する、取得部と、
    前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを検索する、キー検索部と、
    前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数をカウントする、第1カウント部と、
    前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に利用する翻訳記録を決定する、決定部と
    を備える装置。
  2. 前記複数の翻訳記録のそれぞれを読み出して、当該翻訳記録内の翻訳セグメントのそれぞれについて、当該翻訳セグメントに分割された原文を前記所定の変換規則に基づいて符号化した翻訳記録キーを生成する、第2キー生成部を更に備える、請求項1に記載の装置。
  3. 前記第2キー生成部は、前記複数の翻訳記録のそれぞれに対応付けて、それぞれの前記翻訳セグメントについての翻訳記録キーを格納した翻訳記録キーテーブルを生成し、
    前記キー検索部は、前記複数の翻訳記録のそれぞれについて、前記翻訳記録キーテーブルから読み出した翻訳記録キーの中に、前記入力キーと一致する翻訳記録キーが存在するか否かを検索する、
    請求項2に記載の装置。
  4. 前記第2キー生成部は、それぞれの前記翻訳記録キーに対して当該翻訳記録キーの値に基づくタイプ情報を割り当て、前記複数の翻訳記録のそれぞれに対応付けて、それぞれの前記翻訳セグメントについて前記翻訳記録キーを前記タイプ情報に基づき分類して格納した翻訳記録キーテーブルを生成し、
    前記第1キー生成部は、前記入力されたテキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメントに分割された原文を前記所定の変換規則に基づいて符号化した入力キーおよび前記入力キーの値に基づくタイプ情報を生成し、
    前記検索部は、前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが、前記翻訳記録キーテーブルにおいて前記入力キーと同一のタイプ情報に基づき分類された翻訳記録キーの中に存在するか否かを検索する、
    請求項3に記載の装置。
  5. 前記複数の翻訳記録のそれぞれは、当該翻訳記録に格納された翻訳の対象、分野、翻訳者、翻訳日、および翻訳日時の少なくとも1つを含むメタ情報を更に記憶しており、
    前記第2キー生成部は、前記複数の翻訳記録のそれぞれに対応付けて、前記メタ情報と、少なくとも1つの前記翻訳記録キーとを格納した翻訳記録キーテーブルを作成し、
    前記キー検索部は、使用者から指定された条件と一致するメタ情報を有する翻訳記録キーテーブルから読み出した翻訳記録キーの中に、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを検索する、
    請求項3に記載の装置。
  6. 前記第1キー生成部は、前記入力されたテキスト内の前記翻訳セグメント毎に分割された原文に含まれる各単語の先頭から予め定められた文字数分ずつを選択してこれらを連結した文字列に基づいて入力キーを生成し、
    前記第2キー生成部は、前記複数の翻訳記録のそれぞれ対応付けて、当該翻訳記録内の前記翻訳セグメント毎に分割された原文に含まれる各単語の先頭から前記予め定められた文字数分ずつを選択してこれらを連結した文字列に基づいて翻訳記録キーを生成する、
    請求項2に記載の装置。
  7. 前記第1キー生成部および前記第2キー生成部は、前記翻訳セグメント毎に分割された原文に含まれる単語の数が予め定められた単語数以下の場合に、各単語の先頭から予め定められた第1の文字数分ずつを選択してこれらを連結した文字列に基づいて入力キーおよび翻訳記録キーを生成し、前記翻訳セグメント毎に分割された原文に含まれる単語の数が前記予め定められた単語数を超える場合に、各単語の先頭から前記第1の文字数より小さい第2の文字数分ずつを選択してこれらを連結した文字列に基づいて入力キーおよび翻訳記録キーを生成する、請求項6に記載の装置。
  8. 前記決定部は、
    前記一致する翻訳記録キーが存在する入力キーの数の割合が大きいものから順番に、予め定められた個数の翻訳記録を選択する、第1選択部と、
    前記第1選択部により選択された前記翻訳記録のそれぞれについて、前記入力されたテキスト内の翻訳セグメントのそれぞれと同一または類似の原文が記憶された当該翻訳記録内の翻訳セグメントの数をカウントする、第2カウント部と、
    前記第2カウント部によるカウント結果に基づいて、前記入力されたテキストの翻訳に用いるべき翻訳記録を選択する、第2選択部と
    を有する請求項1に記載の装置。
  9. 前記決定部は、
    前記一致する翻訳記録キーが存在する入力キーの数の割合が大きいものから順番に、予め定められた個数の翻訳記録を選択する、第1選択部と、
    前記第1選択部により選択された前記翻訳記録から、前記入力されたテキスト内の翻訳セグメントのそれぞれと同一または類似の原文が記憶された翻訳セグメントを抽出して新たな翻訳記録を生成する、抽出部と、
    前記新たな翻訳記録を、以後の翻訳に用いる前記複数の翻訳記録に加えるべき翻訳記録として選択する、第3選択部と
    を有する請求項1に記載の装置。
  10. 前記入力されたテキスト内の翻訳セグメントのうち前記決定部により決定された前記翻訳記録に記憶された原文と同一または類似の原文に係る翻訳セグメントを、前記翻訳記録に記憶された前記原文に対応する訳文を用いて翻訳する、翻訳部を更に備える、請求項1に記載の装置。
  11. 過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つ記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択するコンピュータにより翻訳支援サービスを提供する方法であって、
    前記入力されたテキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメント毎に分割された原文を所定の変換規則に基づいて符号化したものである入力キーを前記コンピュータにより実現される第1キー生成部により生成する、第1キー生成段階と、
    前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを前記コンピュータにより実現される取得部により取得する、取得段階と、
    前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを前記コンピュータにより実現されるキー検索部により検索する、キー検索段階と、
    前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数を前記コンピュータにより実現される第1カウント部によりカウントする、第1カウント段階と、
    前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に用いる翻訳記録を前記コンピュータにより実現される決定部により決定する、決定段階と
    を備える翻訳支援サービス提供方法。
  12. 過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つ記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択する装置としてコンピュータを機能させるプログラムであって、
    前記コンピュータを、
    前記入力されたテキスト内の翻訳セグメントのそれぞれについて、当該翻訳セグメント毎に分割された原文を所定の変換規則に基づいて符号化したものである入力キーを生成する、第1キー生成部と、
    前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを取得する、取得部と、
    前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを検索するキー検索部と、
    前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数をカウントする、第1カウント部と、
    前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に用いる翻訳記録を決定する、決定部として
    機能させるプログラム。
  13. 過去に翻訳した結果について、テキストを翻訳する単位である翻訳セグメント毎に分割された原文と当該原文に対応する訳文とからなる組をそれぞれが少なくとも1つコンピュータに記憶した、複数の翻訳記録の中から、新規に入力されたテキストの翻訳に利用する翻訳記録を選択する方法であって、
    原文と、原文を翻訳した結果得られた訳文との組を、翻訳セグメントごとに前記複数の翻訳記録の1つとして前記コンピュータにより実現される格納部により格納する、格納段階と、
    使用者から入力された前記入力されたテキスト内の翻訳セグメントのそれぞれについて当該記翻訳セグメント毎に分割された原文を所定の変換規則に基づいて符号化したものである入力キーを前記コンピュータにより実現される第1キー生成部により生成する、第1キー生成段階と、
    前記複数の翻訳記録のそれぞれに対応付けて、当該翻訳記録内の翻訳セグメント毎に分割された原文を前記所定の変換規則に基づいて符号化したものである翻訳記録キーを前記コンピュータにより実現される取得部により取得する、取得段階と、
    前記複数の翻訳記録のそれぞれについて、それぞれの前記入力キーと一致する翻訳記録キーが存在するか否かを前記コンピュータにより実現されるキー検索部により検索する、キー検索段階と、
    前記複数の翻訳記録のそれぞれについて、前記一致する翻訳記録キーが存在する入力キーの数を前記コンピュータにより実現される第1カウント部によりカウントする、第1カウント段階と、
    前記複数の翻訳記録のそれぞれについての前記カウント結果に基づいて、前記入力されたテキストの翻訳に用いる翻訳記録を前記コンピュータにより実現される決定部により決定する、決定段階と、
    決定した前記翻訳記録を用いて前記入力されたテキストを前記コンピュータにより実現される翻訳部により翻訳する、翻訳段階と
    を備える方法。
JP2005355001A 2005-12-08 2005-12-08 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法 Expired - Fee Related JP4100637B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005355001A JP4100637B2 (ja) 2005-12-08 2005-12-08 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法
CNB2006101484055A CN100552674C (zh) 2005-12-08 2006-11-14 用于翻译的装置及方法
US11/608,368 US7548845B2 (en) 2005-12-08 2006-12-08 Apparatus, method, and program product for translation and method of providing translation support service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005355001A JP4100637B2 (ja) 2005-12-08 2005-12-08 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法

Publications (2)

Publication Number Publication Date
JP2007157062A JP2007157062A (ja) 2007-06-21
JP4100637B2 true JP4100637B2 (ja) 2008-06-11

Family

ID=38130641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005355001A Expired - Fee Related JP4100637B2 (ja) 2005-12-08 2005-12-08 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法

Country Status (3)

Country Link
US (1) US7548845B2 (ja)
JP (1) JP4100637B2 (ja)
CN (1) CN100552674C (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043562A1 (en) * 2007-08-08 2009-02-12 Vinay Vishwas Peshave Method and apparatus for receiving and displaying a short message in a user preferred language
US8504582B2 (en) * 2008-12-31 2013-08-06 Ebay, Inc. System and methods for unit of measurement conversion and search query expansion
JP4868191B2 (ja) 2010-03-29 2012-02-01 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4898934B2 (ja) 2010-03-29 2012-03-21 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP4995950B2 (ja) * 2010-07-28 2012-08-08 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
CN102375824B (zh) * 2010-08-12 2014-10-22 富士通株式会社 获取内容彼此相对应的多种语言文本的装置和方法
US9213695B2 (en) * 2012-02-06 2015-12-15 Language Line Services, Inc. Bridge from machine language interpretation to human language interpretation
JP6481957B2 (ja) * 2014-08-20 2019-03-13 富士ゼロックス株式会社 画像処理装置およびプログラム
CN106156008B (zh) * 2015-04-07 2019-07-09 阿里巴巴集团控股有限公司 信息的翻译方法和装置
CN105138521B (zh) * 2015-08-27 2017-12-22 武汉传神信息技术有限公司 一种翻译行业风险项目通用推荐译员方法
CN109783826B (zh) * 2019-01-15 2023-11-21 四川译讯信息科技有限公司 一种文档自动翻译方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5469354A (en) * 1989-06-14 1995-11-21 Hitachi, Ltd. Document data processing method and apparatus for document retrieval
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
AU5969896A (en) * 1995-06-07 1996-12-30 International Language Engineering Corporation Machine assisted translation tools
CN1063559C (zh) * 1995-07-26 2001-03-21 深圳科智语言信息处理有限公司北京分公司 德汉翻译***的词法分析方法
JPH10293765A (ja) 1997-04-21 1998-11-04 Sharp Corp 対訳例文検索装置
JP3715413B2 (ja) 1997-08-19 2005-11-09 富士通株式会社 類似文書検索装置および類似文書検索方法
CN1652107A (zh) * 1998-06-04 2005-08-10 松下电器产业株式会社 语言变换规则产生装置、语言变换装置及程序记录媒体
JP3993319B2 (ja) 1998-09-08 2007-10-17 松下電器産業株式会社 通訳装置及び通訳装置の機能を発揮させるプログラムを記録した記録媒体
US20030083860A1 (en) 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US7096179B2 (en) * 2001-08-15 2006-08-22 Siemens Corporate Research, Inc. Text-based automatic content classification and grouping
JP4427273B2 (ja) 2002-07-10 2010-03-03 三菱重工業株式会社 構造体の製造方法とその装置
JP2004220266A (ja) 2003-01-14 2004-08-05 Cross Language Inc 機械翻訳装置および機械翻訳方法
JP3906820B2 (ja) 2003-04-23 2007-04-18 日本電気株式会社 翻訳支援装置および翻訳支援プログラム
CN100555270C (zh) * 2004-01-13 2009-10-28 中国科学院计算技术研究所 一种机器翻译自动评测方法及其***

Also Published As

Publication number Publication date
JP2007157062A (ja) 2007-06-21
CN100552674C (zh) 2009-10-21
US7548845B2 (en) 2009-06-16
CN1979467A (zh) 2007-06-13
US20070150259A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
JP4100637B2 (ja) 翻訳のための装置、方法、プログラム及び翻訳支援サービス提供方法
JP4251652B2 (ja) 検索装置、検索プログラムおよび検索方法
US8239188B2 (en) Example based translation apparatus, translation method, and translation program
JP5138046B2 (ja) 検索システム、検索方法およびプログラム
US20060241934A1 (en) Apparatus and method for translating Japanese into Chinese, and computer program product therefor
JP6447161B2 (ja) 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法
JP2015026350A (ja) 情報処理システム、情報処理方法、および情報処理プログラム
CN101933017B (zh) 文件检索装置、文件检索***和文件检索方法
JP5355483B2 (ja) 略語完全語復元装置とその方法と、プログラム
JP5780036B2 (ja) 抽出プログラム、抽出方法及び抽出装置
JP2009205357A (ja) 中国語の品詞を判定する装置、方法およびプログラム
JP5869948B2 (ja) パッセージ分割方法、装置、及びプログラム
JP7176233B2 (ja) 検索方法、検索プログラムおよび検索装置
JP2014235664A (ja) 情報検索装置および情報検索方法
JP2002251412A (ja) 文書検索装置および方法ならびに記憶媒体
KR20080082985A (ko) 데이터 파일 조작 방법 및 장치
JP5803481B2 (ja) 情報処理装置及び情報処理プログラム
JP2020166501A (ja) 分割モデル生成システム、テキスト分割装置および分割モデル生成方法
JP4274490B2 (ja) 検索装置、検索プログラムおよび検索方法
JP2002251401A (ja) 文書検索装置および方法ならびに記憶媒体
JP4840885B2 (ja) 検索装置、検索プログラムおよび検索方法
JP5998779B2 (ja) 検索装置、検索方法、及びプログラム
JP2018180808A (ja) 解析プログラム、解析方法および解析装置
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
JP2001312517A (ja) インデクス生成装置及び文書検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080311

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080314

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

LAPS Cancellation because of no payment of annual fees