JPH08101836A - 機械翻訳の学習方法 - Google Patents

機械翻訳の学習方法

Info

Publication number
JPH08101836A
JPH08101836A JP6238085A JP23808594A JPH08101836A JP H08101836 A JPH08101836 A JP H08101836A JP 6238085 A JP6238085 A JP 6238085A JP 23808594 A JP23808594 A JP 23808594A JP H08101836 A JPH08101836 A JP H08101836A
Authority
JP
Japan
Prior art keywords
translated
word
translation
dictionary
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6238085A
Other languages
English (en)
Other versions
JP3960562B2 (ja
Inventor
Kimito Takeda
公人 武田
Yoshimi Saito
佳美 齋藤
Hideki Hirakawa
秀樹 平川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23808594A priority Critical patent/JP3960562B2/ja
Priority to US08/538,417 priority patent/US5826220A/en
Publication of JPH08101836A publication Critical patent/JPH08101836A/ja
Application granted granted Critical
Publication of JP3960562B2 publication Critical patent/JP3960562B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 訳し分けされて翻訳された訳語の学習方法に
おいて、語彙規則が異なる見出し語に対して学習された
結果が、別の語彙規則が適用された訳語に影響を与えな
い学習方法を提供する。 【構成】 構文、意味解析によって決定された語彙規則
に一致した訳語候補を辞書から読みだしてオペレータに
呈示する手段と、オペレータが最も適切である訳語を選
択する手段と、この選択された訳語とその訳語に対応す
る見出し語及び適用された語彙規則の最初に記憶されて
いる訳語とを対応付けて記憶する手段と、以降の翻訳に
おいて、見出し語に対応する訳語が語彙規則に対応する
最初の訳語と一致する場合に、対応付けて記憶されてい
る選択された訳語に入れ替える手段とを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、コンピュータを利用し
て第1の言語を第2の言語に翻訳する機械翻訳の過程で
第2の言語となった訳語を学習する機械翻訳の学習方法
に関するものである。
【0002】
【従来の技術】近年、コンピュータを利用して原文を自
動的に機械翻訳し、その訳文を求める機械翻訳システム
が注目されている。例えば日本語文を入力してその英訳
文を求めたり、また英語文を入力してその和訳文を求め
たりする自然言語の機械翻訳システムの開発が種々試み
られている。
【0003】この種の装置は、基本的には入力原文を形
態素解析や構文解析等して、例えば(語句)等の所定の
処理単位に区分する。そして上記処理単位毎に翻訳辞書
を検索して各処理単位に対応した訳語(訳語句)を求
め、これらの訳語(訳語句)を所定の訳文規則に従って
結合してその訳文を求める如く構成されている。
【0004】ところが、自然言語に対する意味解釈技術
が十分に確立されていない為、上記機械翻訳によって適
切な訳文を確実に得ることは甚だ困難である。具体的に
は、例えば(find)なる単語が(わかる、感じる、
見付け出す、解く、見破る、暴露する、発見する、判決
する)等の訳語を持つように、1つの原語が複数の訳語
候補を持つことが多くある。これ故、どの訳語を選択す
るかによって訳文の言語表現が大きく変化し、訳文の意
味的ニュアンスにずれが生じ易い。
【0005】そこで従来は、この訳語のずれを解消する
為に、上記各処理単位(原語)に対する複数の訳語候補
をオペレータに呈示し、オペレータが最も適切である訳
語を選択できる。この選択された訳語を学習することで
以後、同じ原語が出現したとき優先されるように構成さ
れている。訳語の学習方法としては、原語と選択された
訳語をペアにして記憶する方法、選択された訳語を辞書
上で先頭に並び替える方法、全ての訳語に対して語彙規
則と訳語に番号をつけてその番号を記憶する方法等が知
られている。例えば、選択された訳語を最新使用訳語と
して他と区別する情報を記憶する方法が特開昭63−3
14676号公報に示されている。
【0006】然しながら、機械翻訳の辞書には、原語に
対応する訳語を記憶しているだけでなく、例えば、動詞
の目的語によって訳語を訳し分ける語彙規則を記憶して
いる。この辞書の場合は、翻訳規則毎に訳語が記憶され
ている。この辞書を使って翻訳した訳語の学習方法とし
て、原語と選択された訳語をペアにして記憶する方法、
選択された訳語を辞書上で先頭に並び替える方法及び選
択された訳語を最新使用訳語として他と区別する情報を
記憶する方法を適用すると、原語に対して1つの訳語し
か記憶できないため、翻訳規則を使って訳し分けされた
訳語が学習辞書を反映することによって意図しない訳語
に変更されてしまう。
【0007】例えば、「take」の訳語として、「と
る、得る、持って行く、連れて行く、つかむ、握る、抱
く、捕らえる、負かす、獲得する、買う、予約する、受
ける、採用する、使用する、利用する、引用する、携帯
する、かかる、引き受ける、呈する、雇う、引き継ぐ、
取り除く、脱ぐ、離陸する、離れる、似る、持ち上げ
る、取り上げる、始める、取り出す、入る、旅行、旅、
乗る、……」等が記憶され、また、「take」にはな
にも学習されていない状態とする。この状態で、「Th
e child took my arm.」を翻訳す
ると、「子供は私の腕をとりました。」と出力されるこ
とになる。ここで、「とる」を他の訳語「握る」に変更
すると、「take:握る」と学習される。次に「ta
ke:握る」が学習されている状態で、「The ch
ild took a bus.」を翻訳すると、「子
供はバスを握りました。」と先に学習された「握る」が
学習される。このため、同様に「握る」を適切な「乗
る」に変更すると、「take:乗る」が学習される。
ここで再度、「The child took a b
ath.」を翻訳すると、同様に、意図しない訳語「乗
る」が出力される。このように、原語に対して1つの訳
語しか記憶できないと、目的語等により、訳し分けが必
要な文においては適切な訳を得ることが困難になる。
【0008】これを解決する為に、全ての訳語に対して
語彙規則と訳語の番号をつけて、その番号を記憶する方
法がある。原語に依存しない語彙規則ごとに訳語に番号
が付けられているので、訳し分けされた訳語の学習には
有効である。しかしながら、この方法は語彙規則と訳語
の番号をユニークにする必要があり、機械翻訳で使用す
る辞書を変更することができない。また、辞書が修正さ
れた場合には学習辞書の全て番号を新しい番号に付け替
える必要がある。
【0009】
【発明が解決しようとする課題】従来の機械翻訳の学習
方法にあっては、語彙規則を使って訳し分けされている
訳語に対しては、語彙規則と訳語の番号を記憶する方法
が有効な手段であったが、この方法は語彙規則または訳
語の順番が変更されないことを前提としている。
【0010】然しながら、機械翻訳の辞書は、語彙の追
加、訳語の追加、翻訳規則の追加などによって翻訳され
る訳文をより自然にするため、翻訳辞書の修正は不可欠
である。
【0011】本発明は、上述のような事情を考慮してな
されたもので、一つの見出し語に対して複数の語彙規則
と、その語彙規則に対応する一つ以上の訳語を記憶する
辞書を用いて翻訳をする機械翻訳方法において、語彙規
則ごとに訳語を簡単に学習できる方法を提供することを
目的とする。
【0012】
【課題を解決するための手段】上記目的を達成するた
め、本願の第1発明は、一つの見出し語に対して複数の
語彙規則と、その語彙規則に対応する一つ以上の訳語を
記憶する辞書を用いて入力原語を機械翻訳して訳語を得
る繰り返しの過程で訳語を学習する機械翻訳の学習方法
において、語彙規則に一致する訳語を辞書から読みだし
て表示し、表示された訳語の中から選択された訳語を得
るとともに、この選択された訳語とその訳語に対応する
見出し語及び適用された語彙規則の最初に記憶されてい
る訳語とを対応付けて記憶させておき、以降の翻訳にお
いて、見出し語に対応する訳語が語彙規則に対応する最
初に出力される訳語と一致する場合に、対応付けて記憶
されている選択された訳語に入れ替えることで訳し分け
された訳語を学習することを特徴とする。
【0013】本願の第2発明は、一つの見出し語に対し
て複数の語彙規則と、その語彙規則に対応する一つ以上
の訳語を記憶する辞書を用いて入力原語を機械翻訳して
訳語を得る繰り返しの過程で訳語を学習する機械翻訳の
学習方法において、語彙規則に一致する訳語を辞書から
読みだして表示し、表示された訳語の中に適切な訳語が
ない場合に訳語を入力するとともに、入力された訳語と
その訳語に対応する見出し語及び適用された語彙規則の
最初に記憶されている訳語とを対応付けて記憶させてお
き、以降の翻訳において、見出し語に対応する訳語が語
彙規則に対応する最初に出力される訳語と一致する場合
に、対応付けて記憶されている入力された訳語に入れ替
えることで訳し分けされた訳語を学習することを特徴と
する。
【0014】
【作用】本願の第1発明によれば、見出し語が等しい単
語に対して、構文、意味解析によって決定された語彙規
則ごとに別々の訳語を記憶することができるので、語彙
規則が異なる見出し語に対して学習された結果が、別の
語彙規則が適用された機械翻訳を行える。
【0015】本願の第2発明によれば、見出し語が等し
い単語に対して、構文、意味解析によって決定された語
彙規則ごとに別々の訳語を新たに追加することができる
ので、語彙規則が異なる見出し語に対して学習された結
果が、別の語彙規則が適用された訳語に影響しない機械
翻訳を行える。
【0016】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明する。
【0017】図1は、本発明の一実施例に係る概略構成
を示している。
【0018】図1において、1はキーボード等からなる
入力部である。この入力部1等から入力された英語文は
翻訳処理に供せられる原文として原文記憶部2に格納さ
れる。
【0019】翻訳部4は、編集制御部3の制御の下で翻
訳辞書部5に予め格納されている翻訳処理の為の知識情
報を用い、上記原文記憶部2に格納された原文を順次所
定の処理単位で機械翻訳する。
【0020】尚、翻訳辞書部5に格納された知識情報
は、例えば規則・不規則変化辞書5a、単語辞書5b、
接続可能品詞列5c、係り受け辞書5d、訳語学習辞書
5eからなる。例えば、単語辞書5bは、見出し語、品
詞、訳語、活用形、語彙規則が格納されている。図3に
語彙規則の一例を示す。図3(a)〜(c)はそれぞれ
次のことを意味している。(a)takeの目的語がt
ripならば「旅行する」という意味である。(b)t
akeの目的語の意味マーカが「乗物」ならば「乗る」
という意味である。(c)takeの目的語がbath
ならば「入る」という意味である。この語彙規則を用い
て、「I take a bus.」を解析する場合に
ついて説明する。入力された原文は、図3(d)の原文
の構文構造が求められ、この構文構造の点線で囲んだ部
分構造に図3(b)の規則が適用され、takeは「乗
る」という意味であると決定される。
【0021】このような知識情報を用いて上記原文を機
械翻訳して求められた訳文である日本語文は、これを得
た原文に対応付け管理されて順次訳文記憶部6に格納さ
れる。
【0022】しかして編集制御部3は、表示制御部7を
駆動して前記原文記憶部2に格納された英語文、および
訳文記憶部6に記憶された日本語文を相互に対応付けて
表示部8にて同時表示され、その訳文の後編集処理に供
している。この後編集処理は、前記入力部1から入力さ
れる制御情報に従って、後述するように、例えば前記翻
訳辞書部5に格納される訳語学習辞書5eを更新する。
学習辞書制御部9は、他の訳語に変更する制御情報を入
力部1から受取り、選択された訳語または追加された訳
語情報を訳語学習辞書5eに記憶する。
【0023】このような後編集処理が施されて完成され
た前記原文(英語文)に対する訳文(日本語文)が、印
刷部10にて出力される。
【0024】図4はこのように構成された実施例装置の
基本的な動作シーケンスを示すものである。編集制御部
3はこのような動作シーケンスに従って、翻訳部4から
与えられる翻訳終了の情報や前記入力部1から入力され
る各種のキー情報を判定し、対話的にその翻訳・編集処
理を制御する。
【0025】即ち、編集制御部3は、翻訳部4における
翻訳処理状態を監視し(ステップA)、翻訳部4におけ
る一つの原文の翻訳処理の終了を検出したとき、その翻
訳処理によって求められた訳文を前記訳文記憶部6に格
納すると共に、その訳文を原文に対応させて表示部8に
表示する(ステップB)。
【0026】また翻訳部4において翻訳処理が継続中、
或いは翻訳処理が行われていない場合には、編集制御部
3は前記入力部1から入力されるキー情報を判定してい
る(ステップC,D,E,F)。そして、その入力キー
情報が「翻訳指示キー」である場合(ステップC)、編
集制御部3は前記原文記憶部2に格納された入力原文を
翻訳部4に与え、その翻訳処理を開始させる(ステップ
G)。
【0027】また入力キー情報が「文字キー」である場
合には(ステップD)、その文字キーが示す文字コード
を入力バッファに格納し(ステップH)、その文字コー
ドを前記原文記憶部2に格納すると共に、その文字パタ
ーンを前記表示部8に表示する(ステップI)。この入
力バッファに格納された文字コードの各文字パターン表
示によって、前記入力部1から入力された原文が表示さ
れることになる。
【0028】更に入力キー情報が「編集キー」である場
合には(ステップE)、その編集キーに対応した編集処
理が前記訳文に対して実行される(ステップJ)。同様
にして入力キー情報が「機能キー」である場合には(ス
テップF)、その機能キーに対応した処理が実行される
(ステップK)。
【0029】そしてキー情報の入力がない場合、或いは
入力キー情報が上述した「キー」以外のものである場合
には、その他の処理、例えば前記訳文記憶部6に得られ
た訳文の印刷出力等が行われる。
【0030】このような編集制御部3の動作シーケンス
により、例えばオペレータがキーボードの前記文字入力
用キー群1aを操作して文字入力すると、その文字情報
は入力バッファに順次セットされ、翻訳処理の供せられ
る原文として原文記憶部2に順に格納される(ステップ
D,H)。そしてその入力原文が表示部8に表示される
(ステップI)。
【0031】しかして文字入力の任意の時点、例えば1
文の入力終了時点で翻訳指示キー1bを操作すると、そ
のキー入力情報に従って上記入力バッファに格納された
入力原文に対する翻訳処理が開始される(ステップC,
G)。そしてその翻訳処理が終了すると、これによって
求められた訳文が前記表示部8に表示されることになる
(ステップA,B)。
【0032】尚、入力原文の修正等の編集が必要な場合
には、文字入力用キー群1aの操作による原文入力の途
中で、例えば前記カーソル制御キー群1eを操作してそ
の修正箇所にカーソルを合せ、訂正・挿入・削除・移動
等の編集キー群1cを操作することによって、その編集
処理が実行される(ステップE,J)。
【0033】このようにして機械翻訳処理の基本的動作
が制御される。
【0034】ところで前記原文の翻訳処理は、例えば次
のようにして実行される。
【0035】図4はその処理シーケンスの一例を示すも
のである。
【0036】翻訳部5では、先ず翻訳処理対象とする原
文の言語的形態を前記規則・不規則変化辞書5aを用い
て解析する(ステップP)。この形態解析によって、例
えば活用変化を生じた原語がその原形(基本形)に変換
される。
【0037】次に上記の如く形態解析された原文の各原
語に対して、前記単語辞書5bを用いて品詞情報、訳し
分け規則、訳語等の情報が求められる(ステップQ)。
この処理は、上記原語を見出し語として前記単語辞書5
bを検索することによって行われる。
【0038】しかる後、辞書検索された情報に従ってそ
の訳語候補の接続可能性が検証される(ステップR)。
この検証は、前記接続不可能品詞規則5cを参照して行
われ、矛盾のない構文解析結果(言語の品詞列の並び)
が得られるまで繰り返して行われる。この構文解析によ
って、原文を構成する原語の品詞の並び構造や、その係
り受け関係、時制の形態等が求められることになる。
【0039】その後、この構文解析された原文の構造
を、前記係り受け辞書5dを用いて訳文の構造に変換す
る(ステップS)。次に変換された訳文構造の各単語に
学習された訳語が存在するか訳語学習辞書5eを参照す
る(ステップT)。訳語学習辞書に記憶される訳語があ
るときは第1訳語と学習されている訳語とを入れ替えた
後、訳語候補の並びからなる訳文を生成する(ステップ
U)。この際、前記原文の構文解析結果に従って、各訳
語候補を活用変形および語尾変形処理し、訳文を適切な
言語表現とする。
【0040】このような翻訳処理によって求められた前
記原文に対する訳文が、前記訳文記憶部6に格納される
と共に、その原文に対応して表示される。
【0041】ところでこのようにして求められた訳文
と、その訳文を得た原文が前記表示部8に表示される
と、ここで利用者は適切な訳語が選択されているか訳文
をチェックする。適切な訳文が選択されていない場合の
編集処理は次のようにして行われる。前記表示部8の画
面上で、適切でない訳語をカーソルによって指示し、訳
語キーを押す。この操作によってカーソルが指示する単
語の訳語を訳文記憶部6から取り出して表示する。利用
者は一覧表の形で表示された訳語から適切な訳語を選択
または新たな訳語を登録する。この選択させた訳語また
は追加登録された訳語は学習辞書制御部9を介して翻訳
辞書部5の中の訳語学習辞書5eに記憶される。
【0042】尚、編集処理には訳語の選択機能の他に、
辞書表示、辞書登録、辞書削除、文字挿入、削除、移
動、複写などが操作された編集キーに対応して実現され
ている。このような各種の機能を利用して前述した訳文
に対する訳語修正などの後処理が対話的に行われる。
【0043】以上が本装置が基本的に持つ翻訳処理機能
である。ここで本装置が特徴とするところは、上記訳文
中の不適切な訳語を修正するとき、語彙規則が適用され
て訳し分けされている訳語ごとに学習できるようにした
点にある。
【0044】即ち、本装置は、例えば、「The ch
ild took my arm.」を翻訳すると、
「子供は私の腕をとりました。」と出力された状態で、
「とる」を「握る」に変更すると、「take:とる:
握る」と学習する。語彙規則が適用されて訳し分けされ
る最初に記憶される訳語(この場合は、「とる」)と選
択された訳語(「握る」)及び見出し語の3つをペアに
して記憶する。この様に学習することによって、「Th
e child took a bus.」を翻訳した
場合には、適用される語彙規則の最初に記憶される訳語
(この場合は、「入る」)が不一致となるため、学習さ
れた結果は反映されず、「子供はバスに乗りました。」
を得ることができる。
【0045】同様に、対応した語彙規則に訳語を登録す
る場合には、訳語を選択する変わりにキーボードから登
録する訳語を入力するだけで、同じ方法で学習すること
ができる。「The child took a bu
s.」の「take」の訳語に「乗車する」が登録され
た場合は、「take:乗る:乗車する」と学習する。
これによって、適用される語彙規則の最初に記憶される
訳語(この場合は、「乗る」)が一致するため、「子供
はバスに乗車しました。」を得ることができる。
【0046】この学習方法によれば、語彙規則の最初の
訳語を変更しなければ辞書の修正の影響を受けることが
ない。
【0047】図6及び図7はその処理シーケンスを示す
ものであり、その流れを前記例を参照しながら説明す
る。
【0048】今、「The child took m
y arm.」なる原文がキーボードから入力され、翻
訳要求がなされると翻訳処理が行われる(ステップ60
1)。翻訳処理の概要は図4を基に説明したのでここで
は省略する。また、ここでの説明は、動詞「take」
の目的語の違いによって異なる語彙規則が適用される例
について説明する。
【0049】見出し語を参照するカウンターiをクリア
する(ステップ602)。
【0050】i番目の見出し語を取り出す(ステップ6
03)。学習辞書は見出し語をキーとして高速な検索が
できる構成になっているため、学習辞書に該当する単語
が記憶されているかの検索キーとして見出し語を取り出
す。
【0051】取り出したi番目の見出し語が学習辞書に
有るかサーチする(ステップ604)。見出し語が一致
した場合には、一致した学習辞書の位置をjに設定する
(ステップ605)。学習辞書のj番目の適用された語
彙規則の最初に記憶される訳語を取り出し8ステップ6
06)、i番目の見出し語に対応する最初の訳語と比較
する(ステップ607)。例文においては、i番目の見
出し語に対応する最初の訳語は、「とる」である。不一
致の場合は、ステップ604に戻り、学習辞書のサーチ
を継続する。
【0052】一致する場合は、訳語追加マークが付いて
いるか調べ(ステップ608)、訳語追加マークがオフ
の場合は、i番目の見出し語に対する訳語の順番を学習
辞書に記憶されている選択された訳語が最初になるよう
に入れ替える(ステップ609)。訳語追加マークがオ
ンの場合には、学習辞書のj番目の適用された語彙規則
の最初に記憶される訳語の前に登録する訳語を追加する
(ステップ610)。
【0053】見出し語または語彙規則の最初の訳語が不
一致の場合は見出し語を取り出すカウンターiを加算す
る(ステップ611)。翻訳した文の最後の見出し語ま
で、学習辞書と比較したか検査し、未比較の見出し語が
ある場合は、ステップ603に戻り学習辞書のサーチを
継続する(ステップ612)。全ての見出し語に対して
学習辞書のサーチが終了したら、訳文を生成する(ステ
ップ613)。
【0054】ここからの説明は、「take」に学習さ
れた訳語が記憶されていない状態とする。このため、前
記ステップでは訳語の入れ替えは発生せず、「子供は私
の腕をとりました。」と出力される(ステップ61
4)。
【0055】次に表示された訳文を見て、「とる」の訳
語を「握る」に変更する流れを説明する。まず、オペレ
ータは「取る」にカーソルを移動して(ステップ61
5)、訳語キーを押す(ステップ616)。この操作に
より、この文においての「take」の適用された語彙
規則に該当する訳語の一覧が表示される(ステップ61
7)。ここで、適切な訳語がある場合は選択する(ステ
ップ618)。
【0056】ステップ615〜617はオペレータとの
会話であるので、図8に表示例を示し、詳細な説明は省
略する。
【0057】ここで、他の訳語が選択された場合は、見
出し語、適用された語彙規則の最初の訳語および選択さ
れた訳語を取り出す(ステップ619)。例文におい
て、「とる」が「握る」に変更されたとすると、「ta
ke:とる:握る」が学習データとして得られる。ここ
では詳細な説明を省略するが、この他、見出し語の品
詞、訳語の活用形などを一緒に学習しても良い。
【0058】得られた見出し語、適用された語彙規則の
最初の訳語および選択訳語を訳語学習辞書に記憶する
(ステップ620)。学習辞書に記憶する方法として
は、見出し語、適用された語彙規則の最初の訳語が一致
する場合には、選択された訳語のみ入れ替え、一致しな
い場合には、所定の場所に追加する。実施例において
は、一致した場合は選択された訳語に入れ替える例で説
明したが、複数の訳語を記憶できるような構成にして、
学習辞書から選択された訳語を取り出す場合に、登録の
逆順に出力するようにすることもできる。
【0059】次に、この様に学習された状態で、同じ例
文を翻訳するとステップ604において、見出し語が一
致し、ステップ607で適用された語彙規則の最初の訳
語が一致するので、ステップ609で「とる」が「握
る」に入れ替えられ、訳文として、「子供は私の腕を握
りました。」が得られる。
【0060】しかしながら、「The child t
ook a bus.」なる例文を翻訳した場合は、ス
テップ604では見出し語が一致するが、ステップ60
7では、適用された語彙規則の最初の訳語(「乗る」)
と学習辞書に記憶される適用された語彙規則の最初の訳
語(「とる」)が不一致となり、訳語の入れ替えは発生
しない。よって訳文としては、「子供はバスに乗りまし
た。」が出力される。
【0061】次に対応した語彙規則に訳語を登録する場
合について説明する。ステップ617で訳語の一覧表が
表示されて、その訳語の中に適切な訳語がない場合は、
訳語を選択する代りに、登録キーを押す。この操作によ
って、訳語の入力モードに切り替わり、オペレータは、
追加する訳語を入力する(ステップ621)。例えば、
前記、「The child took a bu
s.」の訳文として、「子供はバスに乗りました。」が
出力されるが、「take」の訳語を「乗車する」にし
たい場合には、登録キーを押して、「乗車する」と訳語
を入力する。
【0062】この操作によって、見出し語、適用された
語彙規則の最初の訳語および入力訳語から、「tak
e:乗る:乗車する」を学習データとして得る(ステッ
プ622)。
【0063】取り出された、見出し語、適用された語彙
規則の最初の訳語および入力訳語を訳語学習辞書に記憶
する(ステップ623)。学習辞書に記憶する方法とし
ては、選択された訳語と異なり、見出し語、適用された
語彙規則の最初の訳語が一致する場合には、入力された
訳語を最初に取り出される位置に追加する。一致しない
場合には、選択された場合と同様に所定の場所に追加す
る。訳語を追加した場合は、選択した訳語と区別するマ
ークを付けて記憶する。
【0064】例文においては、「take:乗る:乗車
する」と学習する。これによって、ステップ607で適
用される語彙規則の最初に記憶される訳語(この場合
は、「乗る」)が一致するため、ステップ608で訳語
追加マークが付けられている「乗車する」)が訳語の最
初に追加され、「子供はバスに乗車しました。」を得る
ことができる。
【0065】このように本装置によれば、構文、意味解
析によって決定された語彙規則ごとに別々の訳語を記憶
又は新たに追加することができるので、学習された結果
が別の語彙規則が適用された訳語に影響することがな
い。
【0066】更に、翻訳される訳文をより自然にするた
めになされる語彙の追加、訳語の追加、翻訳規則の追加
などの翻訳辞書の修正に対しても影響することがない。
【0067】尚、本発明は上述した実施例に限定される
ものではない。ここでは英語文から日本語文への機械翻
訳について説明したが、他の自然言語間の機械翻訳にも
同様に適用することができる。また、訳語の一覧表示か
ら選択キーまたは登録キーで語彙規則に対して訳語の選
択または登録をする例で実施例を説明したが、訳語の一
覧表を表示させた時に削除キーを押すことで、学習され
た訳語を同様に削除することができる。要するに本発明
は、その要旨を逸脱しない範囲で種々変形して実施する
ことができる。
【0068】
【発明の効果】本発明によれば、複数の語彙規則とその
語彙規則に対応する一つ以上の訳語を記憶する辞書を用
いて翻訳する機械翻訳方法において、構文、意味解析に
よって決定された語彙規則に一致した訳語候補を辞書か
ら読みだしてオペレータに呈示し、オペレータが最も適
切である訳語を選択したときに、その選択された訳語お
よび適用された語彙規則の最初に記憶されている訳語と
を一緒に記憶することによって、以降の翻訳において、
同じ語彙規則が適用された場合にのみ学習効果がある学
習方法を実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る機械翻訳装置の概略構
成図である。
【図2】同実施例におけるキーボードの構成例を示す図
である。
【図3】同実施例における単語辞書の語彙規則の一例を
示す図である。
【図4】同実施例における基本的な動作シーケンスを示
すフローチャートである。
【図5】同実施例における翻訳処理の動作シーケンスを
示すフローチャートである。
【図6】同実施例における訳語の学習の動作シーケンス
の一部を示すフローチャートである。
【図7】同実施例における訳語の学習の動作シーケンス
の他の一部を示すフローチャートである。
【図8】同実施例における訳語選択の表示例を示す図で
ある。
【符号の説明】
1 入力部 2 原文記憶部 3 編集制御部 4 翻訳部 5 翻訳辞書部 6 訳文記憶部 7 表示制御部 8 表示部 9 学習辞書制御部 10 印刷部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 一つの見出し語に対して複数の語彙規則
    と、その語彙規則に対応する一つ以上の訳語を記憶する
    辞書を用いて入力原語を機械翻訳して訳語を得る繰り返
    しの過程で訳語を学習する機械翻訳の学習方法におい
    て、 語彙規則に一致する訳語を辞書から読みだして表示し、
    表示された訳語の中から選択された訳語を得るととも
    に、この選択された訳語とその訳語に対応する見出し語
    及び適用された語彙規則の最初に記憶されている訳語と
    を対応付けて記憶させておき、以降の翻訳において、見
    出し語に対応する訳語が語彙規則に対応する最初に出力
    される訳語と一致する場合に、対応付けて記憶されてい
    る選択された訳語に入れ替えることで訳し分けされた訳
    語を学習することを特徴とする機械翻訳の学習方法。
  2. 【請求項2】 一つの見出し語に対して複数の語彙規則
    と、その語彙規則に対応する一つ以上の訳語を記憶する
    辞書を用いて入力原語を機械翻訳して訳語を得る繰り返
    しの過程で訳語を学習する機械翻訳の学習方法におい
    て、 語彙規則に一致する訳語を辞書から読みだして表示し、
    表示された訳語の中に適切な訳語がない場合に訳語を入
    力するとともに、入力された訳語とその訳語に対応する
    見出し語及び適用された語彙規則の最初に記憶されてい
    る訳語とを対応付けて記憶させておき、以降の翻訳にお
    いて、見出し語に対応する訳語が語彙規則に対応する最
    初に出力される訳語と一致する場合に、対応付けて記憶
    されている入力された訳語に入れ替えることで訳し分け
    された訳語を学習することを特徴とする機械翻訳の学習
    方法。
JP23808594A 1994-09-30 1994-09-30 機械翻訳の学習方法 Expired - Lifetime JP3960562B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP23808594A JP3960562B2 (ja) 1994-09-30 1994-09-30 機械翻訳の学習方法
US08/538,417 US5826220A (en) 1994-09-30 1995-10-02 Translation word learning scheme for machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23808594A JP3960562B2 (ja) 1994-09-30 1994-09-30 機械翻訳の学習方法

Publications (2)

Publication Number Publication Date
JPH08101836A true JPH08101836A (ja) 1996-04-16
JP3960562B2 JP3960562B2 (ja) 2007-08-15

Family

ID=17024944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23808594A Expired - Lifetime JP3960562B2 (ja) 1994-09-30 1994-09-30 機械翻訳の学習方法

Country Status (2)

Country Link
US (1) US5826220A (ja)
JP (1) JP3960562B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295964B2 (en) 2002-08-22 2007-11-13 Kabushiki Kaisha Toshiba Apparatus and method for selecting a translation word of an original word by using a target language document database

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0720106A3 (en) * 1994-12-28 1997-07-23 Canon Kk Device and method for generating natural language information from information defined by concepts
JP2987099B2 (ja) * 1996-03-27 1999-12-06 株式会社日立国際ビジネス 文書作成支援システム及び用語辞書
US6298158B1 (en) * 1997-09-25 2001-10-02 Babylon, Ltd. Recognition and translation system and method
US6192332B1 (en) * 1998-04-06 2001-02-20 Mitsubishi Electric Research Laboratories, Inc. Adaptive electronic phrase book
US6345244B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically aligning translations in a translation-memory system
US6345243B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically propagating translations in a translation-memory system
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US20030061022A1 (en) * 2001-09-21 2003-03-27 Reinders James R. Display of translations in an interleaved fashion with variable spacing
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
ATE330287T1 (de) * 2002-04-12 2006-07-15 Targit As Verfahren zur verarbeitung von mehrsprachigen abfragen
JP4355138B2 (ja) * 2002-12-13 2009-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳サーバ、コラボレーションサーバ及びプログラム
US7318022B2 (en) * 2003-06-12 2008-01-08 Microsoft Corporation Method and apparatus for training a translation disambiguation classifier
AU2004202391A1 (en) * 2003-06-20 2005-01-13 Microsoft Corporation Adaptive machine translation
US7383542B2 (en) * 2003-06-20 2008-06-03 Microsoft Corporation Adaptive machine translation service
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE202005022113U1 (de) 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
JP4301515B2 (ja) * 2005-01-04 2009-07-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 文章表示方法、情報処理装置、情報処理システム、プログラム
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US10319252B2 (en) * 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US20090326917A1 (en) * 2006-07-17 2009-12-31 Erich Steven Hegenberger Computer-Implemented Translation Tool
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US7983897B2 (en) * 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
WO2008123081A1 (ja) * 2007-03-27 2008-10-16 Nec Corporation 文字データ処理方法、コンピュータプログラム及び文字データ処理システム
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
WO2008146583A1 (ja) * 2007-05-23 2008-12-04 Nec Corporation 辞書登録システム、辞書登録方法および辞書登録プログラム
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
JP4985689B2 (ja) * 2009-03-30 2012-07-25 ブラザー工業株式会社 印刷装置
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US9053098B2 (en) * 2010-01-14 2015-06-09 Abbyy Development Llc Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8352243B2 (en) 2010-05-18 2013-01-08 Hai-Shan Jang Multi-language translator for specific fields of knowledge
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
CN105808527A (zh) * 2016-02-24 2016-07-27 北京百度网讯科技有限公司 基于人工智能的定向翻译方法及装置
US10769386B2 (en) * 2017-12-05 2020-09-08 Sap Se Terminology proposal engine for determining target language equivalents

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6470871A (en) * 1987-09-11 1989-03-16 Hitachi Ltd Maintenance system for word order relation dictionary
JPH01233668A (ja) * 1988-03-15 1989-09-19 Matsushita Electric Ind Co Ltd 機械翻訳機
JPH05204968A (ja) * 1992-01-13 1993-08-13 Nec Corp 訳語選択装置
JPH05298349A (ja) * 1992-04-20 1993-11-12 Hitachi Ltd 共起関係知識学習方法、そのシステム、並びに共起関係辞書およびその利用方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
GB2199170A (en) * 1986-11-28 1988-06-29 Sharp Kk Translation apparatus
JPS63223962A (ja) * 1987-03-13 1988-09-19 Hitachi Ltd 翻訳装置
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
JPH02140868A (ja) * 1988-11-22 1990-05-30 Toshiba Corp 機械翻訳システム
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JP2880601B2 (ja) * 1992-01-22 1999-04-12 シャープ株式会社 言語処理装置
JP3038079B2 (ja) * 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
US5373442A (en) * 1992-05-29 1994-12-13 Sharp Kabushiki Kaisha Electronic translating apparatus having pre-editing learning capability

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6470871A (en) * 1987-09-11 1989-03-16 Hitachi Ltd Maintenance system for word order relation dictionary
JPH01233668A (ja) * 1988-03-15 1989-09-19 Matsushita Electric Ind Co Ltd 機械翻訳機
JPH05204968A (ja) * 1992-01-13 1993-08-13 Nec Corp 訳語選択装置
JPH05298349A (ja) * 1992-04-20 1993-11-12 Hitachi Ltd 共起関係知識学習方法、そのシステム、並びに共起関係辞書およびその利用方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295964B2 (en) 2002-08-22 2007-11-13 Kabushiki Kaisha Toshiba Apparatus and method for selecting a translation word of an original word by using a target language document database
US7526423B2 (en) 2002-08-22 2009-04-28 Kabushiki Kaisha Toshiba Apparatus and method for selecting a translation word of an original word by using a target language document database

Also Published As

Publication number Publication date
US5826220A (en) 1998-10-20
JP3960562B2 (ja) 2007-08-15

Similar Documents

Publication Publication Date Title
JPH08101836A (ja) 機械翻訳の学習方法
US4821230A (en) Machine translation system
US4502128A (en) Translation between natural languages
US5528491A (en) Apparatus and method for automated natural language translation
US4964044A (en) Machine translation system including semantic information indicative of plural and singular terms
US4805132A (en) Machine translation system
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
Van Halteren et al. Linguistic Exploitation of Syntactic Databases: The Use of the Nijmegen LDB Program
KR900008402B1 (ko) 기계번역장치
JP3657338B2 (ja) 翻訳装置
JP4007630B2 (ja) 対訳例文登録装置
JP4043176B2 (ja) 自然言語処理装置
JPH04167063A (ja) 機械翻訳方法及び機械翻訳装置
JPH0550778B2 (ja)
JPS62163174A (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置
JPS6320570A (ja) 機械翻訳システム
JPS6244876A (ja) 機械翻訳装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH03218566A (ja) 機械翻訳装置
JPH04257064A (ja) 要約情報抽出装置
JPH0442706B2 (ja)
JPS62180465A (ja) 仮名漢字変換方式
JPH0434644A (ja) 機械翻訳システム
JPS62163170A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040120

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040326

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140525

Year of fee payment: 7

EXPY Cancellation because of completion of term