JPH07249044A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07249044A
JPH07249044A JP6068004A JP6800494A JPH07249044A JP H07249044 A JPH07249044 A JP H07249044A JP 6068004 A JP6068004 A JP 6068004A JP 6800494 A JP6800494 A JP 6800494A JP H07249044 A JPH07249044 A JP H07249044A
Authority
JP
Japan
Prior art keywords
sentence
occurrence
dictionary
translation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6068004A
Other languages
English (en)
Inventor
Shogo Shibata
昇吾 柴田
Tsuyoshi Yagisawa
津義 八木沢
Kazue Kaneko
和恵 金子
Makoto Hirota
誠 廣田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6068004A priority Critical patent/JPH07249044A/ja
Publication of JPH07249044A publication Critical patent/JPH07249044A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文を翻訳する際の単語間の共起関係の考慮
が、効率的且つ的確に行える機械翻訳装置を提供する。 【構成】 入力文12(図4(a))は、形態素に解析
され(図4(b))、構文構造が解析され(図4
(c))、共起関係にある語句が取り出され、該語句の
構成単語の語義、並びに該語義に対応する英単語および
該英単語の品詞や語義、および前記語句の対訳等が特定
され(図4(d))、前記構成単語以外の単語の対訳語
が決定され、英語の構文構造に変換され(図4
(e))、翻訳文が生成される(図4(f))。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原言語の文を目標言語
の文に翻訳する機械翻訳装置に関する。
【0002】
【従来の技術】従来、コンピュータで自然言語を翻訳す
る場合には、自然言語ゆえのあいまい性が翻訳結果の精
度を悪化させる大きな原因となることが広く知られてい
る。
【0003】例えば、日本語の「買う」の語義は、基本
的には、「代金を支払って自分のものにする」ことであ
るが、「高く評価する」ことや「恨みやひんしゅくを受
ける」ことを表現する場合にも用いられる。このような
単語の多義性を原因とする翻訳のあいまい性は、文中の
単語数の増加とともに指数的に増大する。例えば、原言
語(翻訳元言語)の1つの単語の語義数を10として、
そのような単語が2つ並べば、単純に言って、10の自
乗で、100のあいまい性ができる。
【0004】ところが、実際には、原言語の複数の単語
が、目標言語(翻訳先言語)の1つの単語に対応する場
合やその逆の場合もあるので、翻訳のあいまい性は更に
増大することになる。また、例えば、日本語と英語のよ
うに、その語彙のみならず言語間の構造の差異が大きな
場合には、その翻訳のあいまい性は更に大きなものとな
る。
【0005】以上のような様々な要因の組み合わせによ
る前記あいまい性の増大に対抗するために、従来の機械
翻訳装置においては、単語間の共起関係を考慮して対訳
を決める手法が用いられている。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の機械翻訳装置においては、翻訳過程が、(1)原言語
の文の解析、(2)原言語から目標言語への変換、および
(3)目標言語の文の生成、の3段階にモジュール化され
ており、通常、前記原言語の文の解析は解析用辞書を用
いて行われ、前記原言語から目標言語への変換は翻訳用
辞書を用いて行われるため、異なった辞書で単語間の共
起を取り扱わざるを得なかった。例えば、「成果をあげ
る」という和文を英文に翻訳する場合には、各単語「成
果」および「上げる」の語義を解析用辞書を用いて決定
した後に、翻訳用辞書(和英辞書)を用いて、前記決定
された日本語語義に対応する英語対訳語義の中から適合
する英単語を選び出さなければならなかった。
【0007】このため上述したあいまい性を一挙に解消
することができず、全ての可能性を考慮するために、処
理が複雑且つ非効率的になり、更には、異なった辞書で
共起を扱うために、共起の整合性が取れなくなるおそれ
があった。
【0008】本発明は、上記問題点を解決するためにな
されたもので、文を翻訳する際の単語間の共起関係の考
慮が、効率的且つ的確に行える機械翻訳装置を提供する
ことを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、原言語の文の構文を解析する構文解析手
段を有し、原言語の文を目標言語の文に翻訳する機械翻
訳装置において、共起条件に関する情報を記憶する共起
条件辞書と、前記構文解析手段における構文解析結果か
ら前記共起条件辞書を用いて共起条件を検索すると共に
共起関係にある原言語の語句の対訳を決定する共起条件
検索手段とを設けたことを特徴とする機械翻訳装置を提
供する。
【0010】また、前記共起条件辞書は、共起関係にあ
る各単語の語義と、該各単語に対応する目標言語の単
語、および該目標言語の単語の品詞および語義とを保持
することが好ましい。
【0011】また、前記共起条件検索手段は、共起関係
にある原言語の単語の語義並びに該単語に対応する目標
言語の対訳の品詞及び語義を決定することが好ましい。
【0012】また、同じ目的を達成するために、本発明
は、原言語の文を保持する原文保持手段と、前記原言語
の文の形態素を解析する形態素解析手段と、前記原言語
の文の構文を解析する構文解析手段と、共起条件に関す
る情報を記憶する共起条件辞書と、前記構文解析手段に
おける構文解析結果から前記共起条件辞書を用いて共起
条件を検索すると共に共起関係にある原言語の語句の対
訳を決定する共起条件検索手段と、前記原言語の文の意
味を解析する意味解析手段と、原言語と目標言語との対
訳辞書を格納する翻訳辞書と、前記翻訳辞書から前記原
言語の文の単語に対応する目標言語の単語を取り出す翻
訳辞書検索手段と、前記原言語の文の構文的構造を前記
目標言語の構文的構造に変換する構造変換手段と、前記
構造変換手段における変換結果から目標言語の文を組み
上げる翻訳文生成手段と、前記翻訳文生成手段により生
成された文を保持する翻訳文保持手段とを備えたことを
特徴とする機械翻訳装置を提供する。
【0013】
【作用】請求項1の機械翻訳装置によれば、原言語の文
は、構文構造が解析され、共起条件辞書を用いて共起条
件が検索されると共に共起関係にある原言語の語句の対
訳が決定される。
【0014】請求項2の機械翻訳装置によれば、共起条
件辞書には、共起関係にある各単語の語義と、該各単語
に対応する目標言語の単語、および該目標言語の単語の
品詞および語義とが保持される。
【0015】請求項3の機械翻訳装置によれば、共起関
係にある原言語の単語の語義並びに該単語に対応する目
標言語の対訳の品詞及び語義が決定される。
【0016】請求項4の機械翻訳装置によれば、原言語
の文は、形態素が解析され、構文構造が解析され、共起
条件辞書を用いて共起条件が検索されると共に共起関係
にある原言語の語句の対訳が決定され、意味が解析さ
れ、翻訳辞書から文の単語に対応する目標言語の単語が
取り出され、目標言語の構文的構造に変換され、目標言
語の文に組み上げられる。
【0017】
【実施例】以下、図面を参照して、本発明の実施例を説
明する。
【0018】図1は、本発明の一実施例に係る機械翻訳
装置の概略構成を示すブロック図である。
【0019】同図において、1は、例えばキーボードや
マウスによって構成され、翻訳しようとする原文を入力
するための入力装置、2は、ROM(リードオンリメモ
リ)、若しくはRAM(ランダムアクセスメモリ)、又
はその組み合わせ、あるいはディスク装置によって構成
される記憶装置、3は、本実施例装置の動作を制御する
CPU(中央制御装置)、4は入力装置1により入力さ
れた原文、あるいはその翻訳文等をディスプレイ上に表
示し、又は前記翻訳文等を印刷して出力する出力装置で
ある。なお、入力装置1としては、ディスクの読み取り
装置や光学式の読み取り装置を用いてもよい。
【0020】また、図2に示すように、記憶装置2に
は、入力装置1から入力された原文(翻訳元言語である
原言語の文)を保持する原文保持部2a、共起条件に関
する情報を記憶する共起条件辞書2b、原言語と目標言
語との対情報である対訳辞書を格納する翻訳辞書2c、
および翻訳文生成部3gにおいて生成された翻訳文を保
持する翻訳文保持部2dが格納され、CPU3は、原文
保持部2aに保持された原文を形態素に解析する形態素
解析部3a、形態素解析部3aにおける解析結果から、
原文の構文的な構造を解析する構文解析部3b、共起条
件辞書2bを検索して、前記構文解析部3における解析
結果から、共起関係にある単語を抽出する共起条件検索
部3c、原文の意味的な関係を明らかにする意味解析部
3d、翻訳辞書2cを検索して、意味解析部3dにおけ
る解析結果に対訳付けを行う翻訳辞書検索部3e、原言
語の構文構造を、目標言語の構文構造に変換する構造変
換部3f、構造変換部3fにおける変換結果から、翻訳
文を生成する翻訳文生成部3gを構成する。
【0021】なお、図2には図示されていないが、記憶
装置2には、形態素解析部3b、構文解析部3c、およ
び意味解析部3dにおいて用いられる解析用辞書、並び
に英単語の語義を記憶する英語辞書や日本語単語の語義
を記憶する日本語辞書が格納されている。
【0022】次に、図3乃至図6を参照して、本実施例
装置の動作を説明する。
【0023】図3は、本実施例装置が行う翻訳処理手順
を示すフローチャート、図4は、同装置が行う翻訳処理
の過程でディスプレイ(出力装置4)上に表示される表
示例を示す図である。
【0024】まず、ステップS1において、入力装置1
から入力されると、原文保持部2aに保持された「彼が
成果を上げた。」という入力文12がディスプレイ上に
表示される(図4(a))。次に、入力文12は、形態
素解析部3aにおいて、形態素解析されて(ステップS
2)、図4(b)に示すように形態素解析結果13がデ
ィスプレイ上に表示される。次に、該解析結果13を用
いて、構文解析部3bにより、前記入力文12の構文が
解析されて(ステップS3)、図4(c)に示すような
構文解析結果14がディスプレイ上に表示される。この
解析結果14においては、「彼が」および「成果」が、
それぞれ、「上げた」に係っていることが示されてい
る。
【0025】次に、共起条件検索部3cは、構文解析結
果14の中に共起関係にある構成要素があるか否かを、
共起条件辞書2bを検索して判定する(ステップS
4)。図5は、共起条件辞書2bの記憶内容の一例を示
す図であり、この記憶内容例15において、各記憶内容
1,2,3は、それぞれ、見出し、日本語語義部、およ
び英語語義部の3つの項目から構成されている。共起条
件検索部3cは、このような共起条件辞書2bを検索し
て、入力文12においては、「彼(が)」と「上げる」
との間には共起関係はなく、「成果(を)」と「上げ
る」が、図3の記憶内容2と一致するので、共起関係に
ある(YES)と判定する。共起関係がないときは、図
4(d)に示す結果15aがディスプレイ上に表示され
る。
【0026】一方、共起関係があるときは、共起条件検
索部3cは、前記記憶内容2の日本語語義部に予め格納
されたデータから、入力文12の「成果」は名詞であ
り、図6に示す日本語辞書内に格納された「成果」とい
う見出し語の中で、語義番号「004」が付された「で
きあがった(よい)結果」という語義であることを特定
し、「上げる」は動詞であり、前記見出し語「上げる」
の中で、語義番号「018」が付された「良い結果を得
られる。」という語義であることを特定する(ステップ
S5)。更に、共起条件検索部3cは、前記記憶内容2
の英語語義部に予め格納されたデータから、「上げる」
の対訳語「produce」が他動詞(vt.) であり、前記英語
辞書に格納された見出し語「produce」の中で、語義番
号「005」の語義であることを特定し、「成果」の対
訳語「result」が、名詞(n.)であり、前記英語辞書に格
納された見出し語「result」の中で、語義番号「00
3」の語義であることを特定し、また、上記「result」
は、連体修飾に形容詞(adj.)「good」が必要で、複数
形、無冠詞で用いられることを特定して、「成果を上げ
る」の対訳が、「produce good results」であることを
特定する(ステップS6)。そして、ステップS4〜S
6の処理結果15bが、図4(d)に示すように、ディ
スプレイ上に表示される。
【0027】上述したような、共起条件検索部3cにお
ける処理を終えた後に、意味解析部3dにより原文の意
味解析が行われ(ステップS7)、翻訳辞書検索部3e
により共起関係にある語以外の語の対訳付けが行われ
(ステップS8)、構造変換部3fにより、日本語の構
文構造が、図4(e)に示すような英語の意味表現16
に変換されてディスプレイ上に表示され(ステップS
9)、該意味表現16から、翻訳文生成部3gにより図
4(f)に示すような翻訳文17が生成されてディスプ
レイ上に表示され(ステップS10)、該生成された翻
訳文17が翻訳文保持部2dにおいて保持される。
【0028】従来の翻訳処理では、ステップS7の意味
解析処理において、例えば、上記「上げる」の語義を、
図6に示す日本語辞書の複数の語義文から特定し、更
に、ステップS8の未決定の対訳決定処理において、前
記特定された語義の対訳を、図7に示す和英辞書の英語
対訳語義の複数の候補の中から選び出さなければならな
い。
【0029】これに対し、本実施例によれば、ステップ
S4において、構文解析終了直後に原言語の単語の共起
を考慮するので、原文の解析処理を簡略化することがで
きる。また、ステップS5およびS6において、共起関
係にある各単語の語義と、該各単語に対応する目標言語
の単語、および該目標言語の単語の品詞や語義等が格納
された共起条件辞書を用いることにより、原文語義およ
び目標言語の対訳の決定を行うので、訳語抽出処理、お
よび訳語選択処理を簡略化することができ、更に、解析
辞書と翻訳辞書との共起の整合性がとれなくなるという
問題を解消することができる。
【0030】なお、上述した実施例においては、和文か
ら英文への翻訳例を説明したが、単語の共起はあらゆる
言語に共通な現象と考えられるので、本発明は、あらゆ
る言語から他のあらゆる言語への翻訳に適用し得るもの
である。
【0031】また、上記実施例においては、共起関係に
ある語が抽出された場合に、自動的に共起条件辞書を用
いての翻訳が行われていたが、該共起条件辞書による翻
訳を行うか、又は逐語的に通常に翻訳するかを、メニュ
ー等を用いて、対話的に制御できるようにしてもよい。
【0032】また、上記実施例においては、名詞と動詞
とが格助詞を介して接続する共起を扱ったが、これに限
られるものではなく、名詞と名詞、形容詞と名詞、ある
いは副詞と動詞等、あらゆる品詞間の二項関係の共起に
適用してもよいし、更には、2つの単語の間のみなら
ず、3つ以上の単語の共起関係を考慮してもよい。
【0033】また、上記実施例においては、日本語の1
単語が英語の1単語に対応するものとして共起を取り扱
ったが、例えば、「心(に)描く」という2語の日本語
の単語を「imagine」という1語の英単語に置き換える
場合のように、複数の単語が数の異なる単語へと翻訳さ
れるような共起に適用してもよい。
【0034】また、上記実施例においては、慣用表現的
な共起関係を扱っていたが、これに限らず、例えば、
「本(を)買う」のような使用頻度の高い表現を予め登
録しておけば、翻訳精度と翻訳速度を向上させることも
できる。
【0035】
【発明の効果】以上詳述したように、請求項1又は4の
機械翻訳装置によれば、原言語の文は、構文構造が解析
され、共起条件辞書を用いて共起条件が検索されると共
に共起関係にある原言語の語句の対訳が決定されるの
で、共起関係を、解析の浅い段階で考慮でき、原文の解
析処理を簡略化することができる。また、共起関係を単
一の辞書で取り扱うことができ、共起の整合性が取れな
くなるという問題を解消することができる。
【0036】請求項2の機械翻訳装置によれば、共起条
件辞書には、共起関係にある各単語の語義と、該各単語
に対応する目標言語の単語、および該目標言語の単語の
品詞および語義とが保持されるので、訳語抽出処理、お
よび訳語選択処理を簡略化することができる。
【0037】請求項3の機械翻訳装置によれば、共起関
係にある原言語の単語の語義並びに該単語に対応する目
標言語の対訳の品詞及び語義が決定されるので、簡略化
された処理により、的確な訳語選択を行うことができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例に係る機械翻訳装置の概略構
成を示すブロック図である。
【図2】図1の装置の記憶装置2、およびCPU3の詳
細を示す図である。
【図3】図1の装置による翻訳処理手順を示すフローチ
ャートである。
【図4】図1の装置による翻訳処理の一例を示す図であ
る。
【図5】図1の装置の共起条件辞書4の記憶内容の一例
を示す図である。
【図6】図1の装置の日本語辞書の記憶内容の一例を示
す図である。
【図7】図1の装置の翻訳辞書7の記憶内容の一例を示
す図である。
【符号の説明】
1 入力装置 2 記憶装置 2a 原文保持部(原文保持手段) 2b 共起条件辞書 2c 翻訳辞書 2d 翻訳文保持部(翻訳文保持手段) 3 CPU 3a 形態素解析部(形態素解析手段) 3b 構文解析部(構文解析手段) 3c 共起条件検索部(共起条件検索手段) 3d 意味解析部(意味解析手段) 3e 翻訳辞書検索部(翻訳辞書検索手段) 3f 構造変換部(構造変換手段) 3g 翻訳文生成部(翻訳文生成手段)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 廣田 誠 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 原言語の文の構文を解析する構文解析手
    段を有し、原言語の文を目標言語の文に翻訳する機械翻
    訳装置において、共起条件に関する情報を記憶する共起
    条件辞書と、前記構文解析手段における構文解析結果か
    ら前記共起条件辞書を用いて共起条件を検索すると共に
    共起関係にある原言語の語句の対訳を決定する共起条件
    検索手段とを設けたことを特徴とする機械翻訳装置。
  2. 【請求項2】 前記共起条件辞書は、共起関係にある各
    単語の語義と、該各単語に対応する目標言語の単語、お
    よび該目標言語の単語の品詞および語義とを保持するこ
    とを特徴とする請求項1記載の機械翻訳装置。
  3. 【請求項3】 前記共起条件検索手段は、共起関係にあ
    る原言語の単語の語義並びに該単語に対応する目標言語
    の対訳の品詞及び語義を決定することを特徴とする請求
    項2記載の機械翻訳装置。
  4. 【請求項4】 原言語の文を保持する原文保持手段と、
    前記原言語の文の形態素を解析する形態素解析手段と、
    前記原言語の文の構文を解析する構文解析手段と、共起
    条件に関する情報を記憶する共起条件辞書と、前記構文
    解析手段における構文解析結果から前記共起条件辞書を
    用いて共起条件を検索すると共に共起関係にある原言語
    の語句の対訳を決定する共起条件検索手段と、前記原言
    語の文の意味を解析する意味解析手段と、原言語と目標
    言語との対訳辞書を格納する翻訳辞書と、前記翻訳辞書
    から前記原言語の文の単語に対応する目標言語の単語を
    取り出す翻訳辞書検索手段と、前記原言語の文の構文的
    構造を前記目標言語の構文的構造に変換する構造変換手
    段と、前記構造変換手段における変換結果から目標言語
    の文を組み上げる翻訳文生成手段と、前記翻訳文生成手
    段により生成された文を保持する翻訳文保持手段とを備
    えたことを特徴とする機械翻訳装置。
JP6068004A 1994-03-11 1994-03-11 機械翻訳装置 Pending JPH07249044A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6068004A JPH07249044A (ja) 1994-03-11 1994-03-11 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6068004A JPH07249044A (ja) 1994-03-11 1994-03-11 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07249044A true JPH07249044A (ja) 1995-09-26

Family

ID=13361297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6068004A Pending JPH07249044A (ja) 1994-03-11 1994-03-11 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07249044A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146961A (ja) * 1995-11-24 1997-06-06 Nec Corp 標準文書作成方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146961A (ja) * 1995-11-24 1997-06-06 Nec Corp 標準文書作成方式

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
JPH0644296A (ja) 機械翻訳装置
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPS61163467A (ja) 機械翻訳システム
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP4304268B2 (ja) 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム
JP2815714B2 (ja) 翻訳装置
JPH05120324A (ja) 言語処理方式
Pinnis et al. Tilde MT platform for developing client specific MT solutions
Hirakawa et al. EJ/JE Machine Translation System ASTRANSAC—Extensions toward Personalization
JPH07249044A (ja) 機械翻訳装置
Jolly et al. A broad coverage of corpus for understanding translation divergences
JP4088681B2 (ja) 複数言語入力での言語処理装置
JP2521435B2 (ja) 日本語生成装置
JP2002269085A (ja) 機械翻訳装置及び方法
Zhang et al. Paraphrasing spoken Chinese using a paraphrase corpus
JPH0561902A (ja) 機械翻訳システム
JP2715875B2 (ja) 多言語要約生成装置
Chaudhary et al. A Study of Transliteration Approaches
JP2719453B2 (ja) 機械翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
JPH05225232A (ja) テキスト自動前編集装置
JP3313810B2 (ja) アスペクト処理装置
JPH04130577A (ja) 自然言語処理装置
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置