JP2870279B2 - 訳語選択装置 - Google Patents

訳語選択装置

Info

Publication number
JP2870279B2
JP2870279B2 JP4003977A JP397792A JP2870279B2 JP 2870279 B2 JP2870279 B2 JP 2870279B2 JP 4003977 A JP4003977 A JP 4003977A JP 397792 A JP397792 A JP 397792A JP 2870279 B2 JP2870279 B2 JP 2870279B2
Authority
JP
Japan
Prior art keywords
expression
translation
word
input
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4003977A
Other languages
English (en)
Other versions
JPH05204968A (ja
Inventor
伸一 土井
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP4003977A priority Critical patent/JP2870279B2/ja
Publication of JPH05204968A publication Critical patent/JPH05204968A/ja
Application granted granted Critical
Publication of JP2870279B2 publication Critical patent/JP2870279B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、対訳辞書を用いて入力
源言語表現を解析し対応する目的言語表現を出力する機
械翻訳システムにおける訳語選択装置に関する。
【0002】
【従来の技術】翻訳とは源言語Aの入力表現を解析し、
この入力表現に対応する目的言語Bの表現を出力するこ
とであるが、一般に言語A中の単語表現aと言語B中の
単語表現b、すなわち訳語との対応は1対1ではない。
従って翻訳の際には、言語A中の単語表現aに対応する
言語B中の訳語b1〜bnの中から、単語表現aの出現
環境に応じて最も適切なものを選択する必要がある。
【0003】現在の機械翻訳システムでは基本的に、
「ある表現に対する言語構造上の制約を対訳辞書・文法
内にあらかじめ記述しておき、これらを入力表現に適用
することにより訳語を選択する」という訳語選択方式を
採用している。図4に、この訳語選択方式で用いられる
ある見出し語aに対する対訳辞書の構成を示す。言語A
の部分表現A’が入力され、部分表現A’中の単語表現
aに対する訳語を決定する際には、見出し語aをキーと
してこの辞書が選択され、対応する訳語群b1〜bnの
中から、付随する制約条件ci1〜cimi を部分表現
A’が充足する訳語biが、適切な訳語として選択され
る。
【0004】例えば用言に対する訳語選択においては、
この制約条件は主として必須格要素に対する意味制約と
して記述される。図5に例として、英語の動詞”tak
e”に対する英日対訳辞書の一部分を示す。この対訳辞
書を持つ英日機械翻訳システムに ”Take this medicine.” という文が入力された場合には、「主語が人」(文が命
令文のため主語は”you”に相当)「直接目的語が
薬」という条件に合致して”take”の訳語として”
飲む”が選択され、全体の訳が「この薬を飲みなさ
い。」に決定される。
【0005】一方このような従来からの訳語選択方式に
対して、最近では 1)隅田・飯田/用例主導型機械翻訳、情報処理学会自
然言語処理研究会、82−5 2)佐藤/MBT1:実例に基づく訳語選択、人工知能
学会誌、Vol.6,No.4 3)佐藤/MBT2:実例に基づく翻訳における複数翻
訳例の組合わせ利用、人工知能学会誌、Vol.6,N
o6 (いずれも1991)など、事例に基づく翻訳という手
法も提案されている。事例に基づく翻訳とは、実際に人
間が翻訳した対訳事例をあらかじめ蓄積しておき、その
対訳事例データベースから、入力に対して最も似た事例
をシソーラスなどを用いて検索し、その事例をもとに翻
訳する手法である。図6に、その構成を示す。対訳事例
データベース24には、人間が翻訳した事例があらかじ
め蓄積されている。また、入力と最も似た事例を決定す
るために入力−事例間でシソーラス25を用いて計算す
る距離があらかじめ定義されている。事例に基づく翻訳
手段21は、入力11である源言語表現を受けとると、
源言語表現のある部分表現に対して、対訳事例データベ
ース24の中からその部分表現との距離が最も近い事例
を類似事例検索手段22によって検索して最も似た対訳
事例とし、得られた対訳事例に事例入力適合手段23に
よって入力に適合するように修正を加えて翻訳結果の部
分表現とし、部分表現を合成した目的言語表現を出力1
2とする。
【0006】この事例に基づく翻訳手法は、制約記述に
よる訳語選択とは異なり、対訳事例データベースから入
力と完全に一致するものではなく入力に似た対訳事例を
検索するので、必ず何らかの翻訳結果を出力することを
特徴とする。
【0007】
【発明が解決しようとする課題】しかしながら、前述の
形式の訳語選択方式には、「入力部分表現A’中の単語
表現aに対応する訳語群b1〜bnの中に、付随する制
約条件を部分表現A’が充足する訳語が複数存在する場
合には、その中のいずれが最も適切かを決定できない」
「入力部分表現A’中の単語表現aに対応する訳語群b
1〜bnに付随する制約条件を部分表現A’がいずれも
充足しない場合には、解析がその時点で失敗してしま
う」という問題点が存在する。理想的には、単語表現a
に対応する訳語群b1〜bnに付随する制約条件がすべ
て排他的で、かつその和集合が単語表現aの出現環境を
すべてカバーしているならば、単語表現aを含むいかな
る入力に対しても必ず唯一の訳語が対応するが、実際に
はこのような形での条件の記述は不可能である。
【0008】また前述の、事例に基づく翻訳手法を実現
するためには大規模な対訳事例データベースが必要であ
る。そして、この目的に十分な量の対訳テキストの収集
は困難であり、またたとえ収集できたとしてもこれを自
動的に分析して構造的に対応付ける手段は存在しない
し、人手で行うとすると大きな時間とコストを要する。
また従来のシステムに対する知見を活用する形で応用は
考えられていない。
【0009】以上説明した通り、制約記述による訳語選
択方式には「入力部分表現A’中の単語表現aに対する
訳語群b1〜bnの中に、付随する制約条件を部分表現
A’が充足する訳語が複数存在する場合には、その中の
いずれが最も適切かを決定できない」「入力部分表現
A’中の単語表現aに対応する訳語群b1〜bnに付属
する制約条件を部分表現A’がいずれも充足しない場合
には、解析がその時点で失敗してしまう」という問題点
が存在する。一方事例に基づく翻訳手法には、対訳事例
データベースの作成が困難で、従来技術を活用する形で
の実際的な応用は提案されていないという欠点がある。
【0010】本発明の目的は、対訳辞書中の各訳語ごと
に制約条件に加えて源言語表現の用例を付記しておくこ
とにより、制約だけでは訳語が選択できない際の補償機
能として事例に基づく翻訳の機能を用いて最も適切な訳
語を選択するという、制約記述による訳語選択方式と事
例に基づく翻訳手法の両者の長所を活かした訳語選択装
置を提供することにある。
【0011】
【課題を解決するための手段】第1の発明の訳語選択装
置は、各訳語ごとに当該訳語を選択するための制約条件
と源言語表現の用例を記述した訳語辞書と、表現の集合
からある特定の表現と最も類似した表現を検索する類似
表現検索手段と、入力表現中のある単語表現に対する訳
語決定の際、前記対訳辞書中の当該単語表現に一致する
見出し語に対する訳語に記述された制約条件を当該入力
表現に適用し、付随する制約条件を当該入力表現が充足
する訳語を最も適切な訳語として選択するとともに、付
随する制約条件を当該入力表現が充足する訳語が複数存
在する場合に、付随する制約条件を当該入力表現が充足
する訳語にそれぞれ記述された源言語表現の用例から、
当該入力表現中の当該単語表現を含む適当な部分表現と
最も類似した用例を前記類似表現検索手段により検索
し、当該用例が記述された訳語を最も適切な訳語として
選択する訳語選択手段と、入力源言語表現を言語解析し
て部分表現に分解して部分表現の集合を生成し、前記訳
語選択手段に送るとともに、前記訳語選択手段から受け
とった訳語の集合から目的言語表現を生成し、出力する
機械翻訳手段を備えることを特徴とする。
【0012】第2の発明の訳語選択装置は、各訳語ごと
に当該訳語を選択するための制約条件と源言語表現の用
例を記述した対訳辞書と、表現の集合からある特定の表
現と最も類似した表現を検索する類似表現検索手段と、
入力表現中のある単語表現に対する訳語決定の際、前記
対訳辞書中の当該単語表現に一致する見出し語に対する
訳語に記述された制約条件を当該入力表現に適用し、付
随する制約条件を当該入力表現が充足する訳語を最も適
切な訳語として選択するとともに、当該入力表現がいず
れの制約条件も充足しない場合に、当該見出し語に対す
る訳語にそれぞれ記述された源言語表現の用例から、当
該入力表現中の当該単語表現を含む適当な部分表現と最
も類似した用例を前記類似表現検索手段により検索し、
当該用例が記述された訳語を最も適切な訳語として選択
する訳語選択手段と、入力源言語表現を言語解析して部
分表現に分解して部分表現の集合を生成し、前記訳語選
択手段に送るとともに、前記訳語選択手段から受けとっ
た訳語の集合から目的言語表現を生成し、出力する機械
翻訳手段を備えることを特徴とする。
【0013】
【作用】本発明の訳語選択装置は、機械翻訳手段が入力
源言語表現を受けとり、入力表現を言語解析して部分表
現に分解して部分表現の集合を生成し、訳語選択手段に
送る。訳語選択手段は対訳辞書を参照し、必要ならば類
似表現検索手段を使用して受けとった部分表現中の単語
表現に対する訳語を決定し、機械翻訳手段に送る。機械
翻訳手段は受けとった訳語の集合から目的言語表現を生
成し、出力する。
【0014】対訳辞書には、辞書作成時に各訳語ごとに
制約条件に加えて用例を付記しておく。
【0015】類似表現検索手段は、用例の集合から、あ
る特定の部分表現と最も類似した用例を検索する。最も
類似した用例の決定に用いる入力表現−用例間の距離の
計算法には、従来の事例に基づく翻訳手法と同様のシソ
ーラスを用いる方法の他に、各表現の意味を素性と素性
値のペアの集合として記述しておき、値が一致する素性
の数をカウントする方法など、様々なものがある。
【0016】
【実施例】次に、図1から図3を参照して本発明の実施
例について説明する。
【0017】図1は第1及び第2の本発明の一実施例を
示すブロック図、図2は本発明の訳語選択装置で用い
る、ある見出し語aに対する対訳辞書の構成を示す図、
図3は英語の動詞”take”に対する英日対訳辞書の
例を示した図である。
【0018】図1において、機械翻訳手段1は源言語表
現を入力11として受けとり、入力表現を言語解析して
部分表現に分解して部分表現の集合を生成し、訳語選択
手段2に送る。
【0019】訳語選択手段2は対訳辞書3を参照して、
受けとった部分表現中の単語表現に対する訳語を決定す
る。
【0020】対訳辞書3には、図2に示すように、見出
し語aに対する訳語biに対して、制約条件ci1〜c
imi と用例ei1〜eili を記述しておく。用例の
数は、最低限1例あればよい。記述する用例の例を図3
に示す。
【0021】単語表現aを含む部分表現A’が入力され
た場合には、訳語選択手段2は、見出し語aをキーとし
て図2に示した対訳辞書を参照し、従来の技術で述べた
制約記述による訳語選択方式と同様に、単語表現aに対
応する訳語群b1〜bnに付随する制約条件を部分表現
A’に適用する。部分表現A’が充足する制約条件がc
i1〜cimi のみの場合には、訳語biを適切な訳語
として選択する。
【0022】第1の発明では、単語表現aに対応する訳
語群b1〜bnに付随する制約条件の中に、単語表現a
を含む部分表現A’が充足する制約条件が複数存在する
場合に、訳語選択手段2は類似表現検索手段4を使用し
て、その制約条件を伴う訳語群に付記された用例の中か
ら、部分表現A’と最も類似した用例を検索し、その用
例ejkが付記された訳語bjを最も適切な訳語として
選択する。
【0023】第2の発明では、単語表現aに対応する訳
語群b1〜bnに付随する制約条件を、単語表現aを含
む部分表現A’がいずれも充足しない場合に、訳語選択
手段2は類似表現検索手段4を使用して、単語表現aに
対応する訳語群b1〜bnに付記された用例の中から、
部分表現A’と最も類似した用例を検索し、その用例e
jkが付記された訳語bjを最も適切な訳語として選択
する。
【0024】この決定された訳語は訳語選択手段2から
機械翻訳手段1に送られ、機械翻訳手段1は受けとった
訳語の集合から目的言語表現を生成し、出力12とす
る。
【0025】なお第1の発明と第2の発明は異なった場
合に適用されるものであり、両者は自由に組み合わせて
用いることができる。また辞書に付記する用例は両発明
に共通して使用できる。
【0026】
【発明の効果】以上説明した通り、本発明によれば、従
来からの制約記述による訳語選択方式と事例に基づく翻
訳手法の両者の長所を活用する訳語選択装置を実現でき
る。すなわち、対訳辞書に用例を付記することによって
必ずいずれかの訳語が選択されることを保証して、制約
記述による訳語選択方式の欠点をカバーすることができ
る。また「使用した事例との距離という形で翻訳結果に
信頼度を付与することができる」という事例に基づく翻
訳手法の長所を組み込むことも可能である。
【0027】一方事例に基づく翻訳手法には「対訳事例
データベースの作成が困難」という欠点があったが、本
発明の訳語選択装置においては、対訳事例を用意する必
要はなく、対訳辞書作成時に源言語の用例を少なくとも
1例付記するだけでよいので、この形での辞書の作成は
困難ではない。特に既存の英和・和英等の辞書を参考に
して対訳辞書を作成する場合には、辞書中の用例をその
まま利用すれば良い。また、ユーザが辞書に新しい単語
もしくは既存の単語に対する新しい訳語を登録する際に
源言語の用例を少なくとも1例付記することを義務づけ
たとしても、ユーザは具体例を基に登録すると考えられ
るので、ユーザの負担の増加は大きくはない。これに加
えてこの方式は、対訳辞書中に用例が記述されているた
め、辞書が人間にも見やすいという効果も持つ。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】本発明で使用する、ある見出し語aに対する対
訳辞書の構成を示した図である。
【図3】本発明で使用する対訳辞書の構成の例を、英語
の動詞”take”に対する英日対訳辞書の形で示した
図である。
【図4】従来技術の制約記述による訳語選択方式で使用
する、ある見出し語aに対する対訳辞書の構成を示した
図である。
【図5】従来技術の制約記述による訳語選択方式で使用
する対訳辞書の構成の例を、英語の動詞”take”に
対する英日対訳辞書の形で示した図である。
【図6】従来技術の事例に基づく翻訳手法の一実施例を
示すブロック図である。
【符号の説明】
1 機械翻訳手段 2 訳語選択手段 3 対訳辞書 4 類似表現検索手段 11 入力 12 出力 21 事例に基づく翻訳手段 22 類似事例検索手段 23 事例入力適合手段 24 対訳事例データベース 25 シソーラス
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−219165(JP,A) 特開 平3−276367(JP,A) 実開 平1−135567(JP,U) 中村直人,「用例検索翻訳支援システ ム」,情報処理学会第38回全国大会講演 論文集(▲I▼),p.357−P.358 (1989) 土井伸一,村木一至,「辞書に事例を 付記することによる訳語選択・意味選択 機能の強化」,情報処理学会第44回全国 大会講演論文集(▲III▼),p. 3.111−p.3.112(1992.2) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 各訳語ごとに当該訳語を選択するための
    制約条件と源言語表現の用例を記述した対訳辞書と、 表現の集合からある特定の表現と最も類似した表現を検
    索する類似表現検索手段と、 入力表現中のある単語表現に対する訳語決定の際、前記
    対訳辞書中の当該単語表現に一致する見出し語に対する
    訳語に記述された制約条件を当該入力表現に適用し、付
    随する制約条件を当該入力表現が充足する訳語を最も適
    切な訳語として選択するとともに、付随する制約条件を
    当該入力表現が充足する訳語が複数存在する場合に、付
    随する制約条件を当該入力表現が充足する訳語にそれぞ
    れ記述された源言語表現の用例から、当該入力表現中の
    当該単語表現を含む適当な部分表現と最も類似した用例
    を前記類似表現検索手段により検索し、当該用例が記述
    された訳語を最も適切な訳語として選択する訳語選択手
    段と、 入力源言語表現を言語解析して部分表現に分解して部分
    表現の集合を生成し、前記訳語選択手段に送るととも
    に、前記訳語選択手段から受けとった訳語の集合から目
    的言語表現を生成し、出力する機械翻訳手段を備えるこ
    とを特徴とする訳語選択装置。
  2. 【請求項2】 各訳語ごとに当該訳語を選択するための
    制約条件と源言語表現の用例を記述した対訳辞書と、 表現の集合からある特定の表現と最も類似した表現を検
    索する類似表現検索手段と、 入力表現中のある単語表現に対する訳語決定の際、前記
    対訳辞書中の当該単語表現に一致する見出し語に対する
    訳語に記述された制約条件を当該入力表現に適用し、付
    随する制約条件を当該入力表現が充足する訳語を最も適
    切な訳語として選択するとともに、当該入力表現がいず
    れの制約条件も充足しない場合に、当該見出し語に対す
    る訳語にそれぞれ記述された源言語表現の用例から、当
    該入力表現中の当該単語表現を含む適当な部分表現と最
    も類似した用例を前記類似表現検索手段により検索し、
    当該用例が記述された訳語を最も適切な訳語として選択
    する訳語選択手段と、 入力源言語表現を言語解析して部分表現に分解して部分
    表現の集合を生成し、前記訳語選択手段に送るととも
    に、前記訳語選択手段から受けとった訳語の集合から目
    的言語表現を生成し、出力する機械翻訳手段を備えるこ
    とを特徴とする訳語選択装置。
JP4003977A 1992-01-13 1992-01-13 訳語選択装置 Expired - Lifetime JP2870279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4003977A JP2870279B2 (ja) 1992-01-13 1992-01-13 訳語選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4003977A JP2870279B2 (ja) 1992-01-13 1992-01-13 訳語選択装置

Publications (2)

Publication Number Publication Date
JPH05204968A JPH05204968A (ja) 1993-08-13
JP2870279B2 true JP2870279B2 (ja) 1999-03-17

Family

ID=11572115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4003977A Expired - Lifetime JP2870279B2 (ja) 1992-01-13 1992-01-13 訳語選択装置

Country Status (1)

Country Link
JP (1) JP2870279B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141381A (ja) * 1993-11-19 1995-06-02 Sharp Corp 電子辞書表示装置
JP3960562B2 (ja) * 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法
JP2000242642A (ja) * 1999-02-18 2000-09-08 Sony Corp 翻訳処理方法及び翻訳処理装置
JP5747508B2 (ja) * 2011-01-05 2015-07-15 富士ゼロックス株式会社 対訳情報検索装置、翻訳装置及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村直人,「用例検索翻訳支援システム」,情報処理学会第38回全国大会講演論文集(▲I▼),p.357−P.358(1989)
土井伸一,村木一至,「辞書に事例を付記することによる訳語選択・意味選択機能の強化」,情報処理学会第44回全国大会講演論文集(▲III▼),p.3.111−p.3.112(1992.2)

Also Published As

Publication number Publication date
JPH05204968A (ja) 1993-08-13

Similar Documents

Publication Publication Date Title
Mihalcea et al. Senselearner: Minimally supervised word sense disambiguation for all words in open text
US5267156A (en) Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
US6965857B1 (en) Method and apparatus for deriving information from written text
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP3015223B2 (ja) 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
JP2609173B2 (ja) 用例主導型機械翻訳方法
JP2870279B2 (ja) 訳語選択装置
Aker et al. An extensible multilingual open source lemmatizer
JP2870278B2 (ja) 語義選択装置
JPS62191967A (ja) 文脈処理装置
JP3113257B2 (ja) 機械翻訳装置
JP3236027B2 (ja) 機械翻訳装置
JP2749954B2 (ja) 自然言語解析装置
Smith et al. The value of parsing as feature generation for gene mention recognition
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2938897B2 (ja) 文書作成処理装置
JP2915113B2 (ja) 自然言語自動翻訳方式
JP2947554B2 (ja) 機械翻訳装置
JP2901977B2 (ja) 翻訳装置
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
Ranta Machine translation and type theory
JPH09146959A (ja) 機械翻訳システム
JPH0439706B2 (ja)