JP3313810B2 - アスペクト処理装置 - Google Patents

アスペクト処理装置

Info

Publication number
JP3313810B2
JP3313810B2 JP09295393A JP9295393A JP3313810B2 JP 3313810 B2 JP3313810 B2 JP 3313810B2 JP 09295393 A JP09295393 A JP 09295393A JP 9295393 A JP9295393 A JP 9295393A JP 3313810 B2 JP3313810 B2 JP 3313810B2
Authority
JP
Japan
Prior art keywords
language
dictionary
meaning
symbol
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09295393A
Other languages
English (en)
Other versions
JPH06309352A (ja
Inventor
俊桔 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP09295393A priority Critical patent/JP3313810B2/ja
Priority to TW82105193A priority patent/TW231351B/zh
Publication of JPH06309352A publication Critical patent/JPH06309352A/ja
Application granted granted Critical
Publication of JP3313810B2 publication Critical patent/JP3313810B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、多国言語翻訳装置及び
方法に関し、特にアスペクトの多義性を解決し、適用可
能なアスペクト処理方法及びその装置に関する。
【0002】
【従来の技術】本発明に関する技術や技術上の問題点に
ついては、あまり広くは知られていなため、本発明に直
接関係する従来の技術を説明するに先立ち、本発明に間
接的に関係する部分をも含めて、機械翻訳そのものにつ
きその概略の説明をする。まず、ここにいう機械翻訳と
は、電子計算機という電気、電子的なもの、そしてハー
ドでなくソフト的なものをもその構成要素とする自動翻
訳機による自動翻訳という概念である。
【0003】そして、我国(日本)におけるこの技術に
ついての文献としては、例えば 1.「機械翻訳」、共立出版、野村浩郷、田中穂積著 2.「機械翻訳」、オーム社、電子情報通信学会編 牧
野武則著 3.「情報処理学会自然言語研究会資料63-2,61-2 」
(アスペクト処理方面) 4.「日本語動詞のアスペクト」、むぎ書房、金田一春
彦著 5.「機械翻訳サミット」、オーム社、長真 真他編集 がある。
【0004】さて、機械翻訳の一般的方法であるが、以
下のようなものである。基本的には「直接」、「変
換」、「中間言語」等の方式に分けられる。このうち、
「中間言語」方式は目下実験中であり、「直接」方式で
は意味、構文が似る言葉(例えば、同じアルタイ語族の
中でも、環日本海言語を構成するとされる日本語と韓国
語)の間の翻訳だけに応じられる状態であり、一般には
「変換」方式による。この「変換」方式を採用している
機械翻訳システムでは、その内容は大よそ解析、変換及
び生成の三段階に分けられる。解析とは、他の言語への
翻訳の対象となる原始言語の意味及び構文構造について
その内容を解析することである。変換とは、自然言語間
のギャップを調整するものである。生成とは、目的言語
の構文構造に基づき訳文(目的言語)を作ることであ
る。
【0005】さて解析処理において、英語や、ラテン語
等のヨーロッパ語族ではスペースにより単語と単語を区
別可能であるため、単語の識別についての問題は少な
い。この一方、たとえば、中国語族、アルタイ語族など
の単語間にこれを区別する記号や空所がない、いわゆる
べた書きをなす言語では、単漢字か単語かの語の切り出
し(形態素解析)が大切な課題となる。このため普通は
これらのべた書き言語に対して最長一致法を採用し、形
態素ごとに切り出し、この上で解析する。その際の主語
述語の認識は、各言語とも名詞は述語にならず、動詞は
主語にならず、更に各言語とも例えば主語になりえる単
語は「Ich」、「Du」、「I」、「他」、「私」等
おおよそ定まっていること、また、主語や述語の文中で
の位置は各言語によっておおよそ定まっていること、更
にまた日本語においては「は」、「が」等の特定の助詞
がつくことが多いことや、特に会話(話し言葉)を文章
化した台詞等の短い文章では主語が省略されることがあ
ること等各言語固有の特徴も利用される。結局、文章の
主語、述語の認識を含む文章の構造、文章の示す時や動
作の内容に注意しつつ辞書を引き双方の言語の単語を対
応させ、その際双方の言語固有の特徴にも注意を払うと
いう人が行う翻訳作業と基本的には異ならない。
【0006】なお、ここに「自然言語」とは、スワヒリ
語、アラブ語、マレー語、ドイツ語、日本語、中国語等
人々が通常若しくはその日常の生活に現実にそして普通
に使用している言語をいい、記号論理学で使用されてい
るメタ言語、電子計算機で使用されるプログラム言語や
機械語(マシン語)はもとより、エスペラント、ヴォラ
ピック、イド等の人工的な国際補助語は包含されない。
【0007】また、「最長一致法」とは、あらかじめ辞
書に格納されている単語と文章中の文字とを比較して文
章中の単語を切り出すものであるが、この場合第1に音
節若しくは字数等の多い単語を優先し、第2に前方にあ
る単語を優先するものである。従って、中国語ワードプ
ロセッサー、日本語ワードプロセッサー等における入力
された音節文字や音素記号からの漢字変換に採用されて
いる技術である。ただし、これらのいわば基本的な技術
は既に各方面で実用化若しくは試用され、現に本願出願
人の成果も前掲の「機械翻訳サミット」195頁に紹介
されている状態であるため、これ以上の説明は省略す
る。
【0008】ところで、機械翻訳には多くの問題点があ
る。例えば、一番基本となる辞書の作成一つとっても日
本語、英語、中国語を比較した場合に、各国語特有の活
用、用語法、多義性(言葉をかえて言うならば不確定
性)等があり、このため各言語の単語が一対一に対応し
ていない。固有の特徴として日本語では敬語が特に有名
である。もちやん、ドイツ語における「Du」と「Si
e」の使い分け、英語における「sir」等各国語とも
多少はあるが、日本語は特にはなはだしい。これを後に
本発明の対象とするアスペクトの説明に使用する「死」
という語を例にとって示すならば、人が死んだ場合、天
皇なら「崩御」、皇族や貴族なら「薨去」、その他の人
なら「逝去」であり、身内の者のことを言うときには
「死去」等である。また、助詞や助動詞は敬語に伴って
使用が変化するが、これは英語の前置詞、中国語の介詞
等にはないか、あってもわずかである。
【0009】次に、各言語は多少の多義性若しくは不確
定性あるいは不正確性を有している。日本語の例でいう
なら、人はいったん死んだら絶対に生き返らないため、
「死」という語は時間的には過去の事象、動作のみあら
わすはずであるが、「彼はとうとう死んでしまっ
た。」、「彼はとっくに死んでしまった。」、「彼は今
死んだ。」等、完了、過去完了、現在的な使用方法もな
される。また、動作のみならず「死んでいる。」という
過去の動作の結果としての現在の状態をも表す。更に、
「九死に一生を得る」、「瀕死の重傷」、「決死隊」、
「死語」等における「死」は「人の死」とは別の意味を
有するようになっている。例えば「死語」の「死」は、
「現在使用されていない、何等の意味を有さない若しく
は何の役にも立たない」という意味である。これが「来
る」、「行く」等の取り消しや逆動作やその一時中止の
動作が可能、また動作そのものに継続性がある単語にな
ると、更に複雑となる。更にまた、各言語とも多少とも
非論理性を有する。日本語では「水を沸かす」と言わず
にその結果たる「湯」を使用して「湯を沸かす」と言う
等である。これらの特異性、非論理性の存在は中国語、
英語でも同様である。品詞一つとっても、英語の前置詞
や冠詞の存在、名詞や動詞の単数、複数の使いわけ、中
国語の前置詞、後置詞、否定詞、指定詞の存在、それ以
前に多数の漢字の存在、また各国語固有の活用やその不
規則性等である。しかも、かかる不規則性は各言語とも
日常使用される単語に多い。
【0010】従って、現在のところこれらを完全に反映
した上で機械翻訳をなすのは困難であり、これらの困難
性のうち重要な点の解決を図ることによりいかに経済的
に質のよい翻訳文を得られるようにするか、あるいはい
かに経済的に多国言語の翻訳に使用しえるか等が技術的
課題となっており、また質のよい翻訳文を得るために
は、最終的には人が見直し、チェックするのが実情であ
る。
【0011】従って、また本明細書で後に示す本発明の
技術的特徴を説明するために例示若しくは使用する中国
語、英語、日本語の翻訳文若しくは対照文も厳密には不
正確性若しくは人が通常使用しない用語法がありえる点
は御了解願いたい。以上のもとで、本発明が直接関係す
るアスペクト(aspect)についての従来の技術について
説明する。
【0012】本発明は、アスペクト(aspect)処理の方
法そしてそのための装置に関するものである。以下、ア
スペクトとこれに密接関係するテンス(tense)について
説明する。そして、これは各国語に共通し、また各国語
が使用されるに際して重要な意味内容を有し、また役割
を担うため機械翻訳でも重要視されているものである。
【0013】自然言語においては、事件が行われる際の
主語、主体、事件とその述語、動作等との時間関係を表
示する方法には、テンス(tense)とアスペクト(aspct)
の二つがある。テンスとは、事件が発生する時間と話す
時間との相対関係を指すものである。例えば、現在形、
過去形、未来形などがある。テンスは、語族や言語毎に
異なる手段で表わされる。例えば、下記の例に示すよう
に、英語と日本語は主に動詞の語尾の変化により、中国
語では、「昨日」という時間を表す副詞とされる「昨
日」のみでテンスを表わす。
【0014】なお、ここに動詞とは、本発明に係るアス
ペクト処理という面からいった場合には、事件、主体、
主語等の動作や発生をあらわす単語という意味であり、
言語学、国語学あるいは英語学等上の動詞とは必ずしも
一致しない場合がある。また、同じく副詞とは、「alre
ady 」、「もう」、「まだ」等同じく動詞をアスペクト
の面から修飾する、あるいは事件等の生じた時間やその
事件の継続状態を解説する単語という意味であり、これ
また必ずしも言語学等上の副詞とは一致しない場合があ
る。なお、このことは英語における日本語にはない助動
詞の存在等各国語の品詞の内容の相違、英語で動詞「ha
ve(持つ)」が本来の持つという動作の他に現在完了を
表す記号的に使用される等各国語固有の使用方法、「デ
ートする」等英語や日本語で名詞が動詞的に使用される
こと、各国語とも「昨日」等名詞が動作のなされた時間
をあらわすため副詞的な作用を有すること等のためある
程度さけられないものである。
【0015】以下に、日本語、中国語、英語でこのテン
スを具体的に示す。 (例1)過去形の表現 日本語:彼は昨日学校へ行った。 中国語:他昨日去学校。 英語:He went to school yesterday. 次に、アスペクトについて説明する。
【0016】アスペクトとは、事件、主体、主語の発生
時間、動作時間に基づいて、その進行の如何、状況を表
わすものである。例えば、完了、継続、反復などがあ
る。一般的に、自然言語は独自のアスペクト記号及び関
連共起(co-occurred 、動詞、アスペクト記号以外でア
スペクトの多義性を解決するのに役立つもの。)、形態
素(morphology、中国語では複数の漢字の組み合わせで
まとまった意味を持ちうる最小の単位。英語、日本語で
は単語に相当する。例えば、副詞「昨日」、「yesterda
y 」等)によりアスペクトを表わす。但し、アスペクト
記号はその意味に以下のような多義性があり、ひいては
不確定性が生じるもととなる。このため、処理対象の文
のアスペクト意味を正確に解析するためには、文中のア
スペクト意味に影響を及ぼす他の要素をも同時に考える
必要がある。なお、本明細書においては、一つの文のア
スペクトを、文アスペクト(sentential aspect)と定義
する。
【0017】以下に、日本語、中国語、英語でこのアス
ペクトを具体的に示す。 (例2)日本語のアスペクト記号:「ている」 可能アスペクト意味:進行、状態、反復、経験など 日本語の例文 文アスペクト (1)雨が降っている。 (進行) (2)彼は毎日本を読んでいる。 (反復) (3)彼は死んでいる。 (状態) なお、日本語では、この他のアスペクト記号として「て
くる」等がある。
【0018】中国語のアスペクト記号:″了″ 可能アスペクト意味:完成、終了、経験など 中国語の例文 文アスペクト (1)他讀了書。 (完成) (2)他死了。 (終了) (3)他己經看了書。 (経験) なお、中国語では、この他のアスペクト記号として
「過」等がある。
【0019】英語のアスペクト記号:″have+P.
P.″ 可能アスペクト意味:完成、経験など 英語の例文 文アスペクト (1)I have eaten my lunch. (完成) (2)I have been to Japan twice.(経験) なお、英語では、この他のアスペクト記号として「be+
V-ing」がある。
【0020】したがって、機械翻訳においては、翻訳の
対象とする自然言語たる原始言語のアスペクト記号の意
味の多義性を適切に解決しないと、翻訳結果が悪くな
る。極簡単な具体例を示すならば、上記中国語例文中
「他死了」は、既述のように「死」という簡単な動作、
事件であるにもかかわらず文そのものとしては(状態)
と(完了)のアスペクトを持ちえ、日本語に翻訳すると
「彼は死んだ。」と「彼は死んでしまっている。」の2
通りが考えられる。このため、この程度の短い例文1つ
のみではさして問題がないが、多少複雑な動作内容かつ
もう少し長い文章となるとその意味内容に種々の解釈が
生じえることとなり、そう簡単にはいかなくなる。とこ
ろで、例えば、日本情報処理学会の自然言語処理48−
4(1985)に掲載されているように、従来日本語の
アスペクト意味は、図10に示すように状態、継続、動
作、意志、結果、反復、起動、完了の八つの素性(基本
要素,primitive feature)に分けられている。また、ア
スペクト素性の組み合わせにより、日本語の動詞は図9
の動詞アスペクト分類辞書に示すように8種類に分類さ
れている。なお、ここにアスペクト素性の前に付された
「+」はこの素性がある、「−」はこの素性がないこと
を表す。例えば、図9の動詞「ある」、「できる」に対
応するA「+state,+cont」は状態と継続との二素性を
持っていることを表す。なお、ここに、「+」及び
「−」は結合演算でのアスペクトの増減に用いられる。
また、各アスペクト記号のアスペクト素性の組み合わせ
は図11のアスペクト意味辞書のように整理され、語句
のアスペクト素性の組み合わせの間の結合演算規則及び
アスペクト解釈規則も定められている。ここに、演算ル
ールは、{副詞があればそれに応じてアスペクト素性
の付加、消去を行う。2つのアスペクト素性の束を演
算し、付加、消去を行う。前記を左(文章の先とい
う意味である。従って日本語、中国語では方位、位置、
方向という面からは上や左もありえる。)から右(文章
の後)へくり返し行うことにより、原則としてアスペク
ト素性を消去するものであり、この後消去されていない
アスペクト素性を1つの束としてまとめて解釈する。}
というものである。この際の解釈ルールを図13に示
す。なお、これらについては、日本情報処理学会の「自
然言語処理48-4」(1985年3月27日)、野垣内 出他二
名共著 「動詞意味素性の付加による日本語文アスペク
トの解析および翻訳について」等にて記載され、また説
明されているいわば公知のものであるため、ここでこれ
以上の説明は省略する。また目的言語のアスペクト記号
を生成するために、翻訳言語間の差異を検討し、参照資
料としてのアスペクト変換テーブルも製作されている。
その従来例の一としては、日本情報処理学会の「自然言
語処理48-4」の「はじめに」に掲載されている日英機械
翻訳システム(方法)を用いるものである。図8は該シ
ステムのアスペクト処理流れを示すものである。以下本
図をもとにこれを説明する。例えば、図17に示すよう
な日本語解析処理を行った中間形式の解析木について、
まず図9の動詞分類辞書を参照し、動詞「読む」のアス
ペクト素性の組み合わせA「−state,+act,+cont, +
compl 」(−状態,+動作,+継続,+完了)を取り出
す(S10)。なお、これらの動詞アスペクト素性は図
10に示すように定義されている。続けて、図11のア
スペクト意味辞書を参照し、一文の左(最初)から右
(最後)までのそれぞれのアスペクト記号のアスペクト
素性の組み合わせB[i],(ここに、i=1,…,n
と可能な数だけ採りえる。)、本文ではB[1]=「て
いる」=「+state,+cont」(+状態,+継続)を取り
出す(S20)。動詞以外にアスペクト意味に影響を及
ぼし得る形態素、例えば、副詞などがあるか否かを判断
する(S30)。もし、動詞以外に、アスペクト意味に
影響し得る形態素Cがないと判断すると(S30)、動
詞アスペクト素性組み合わせAを各アスペクト記号素性
組み合わせBと結合ルールにのっとっての演算をする
(S60)。ただし、本文では、「すでに」という他形
態素があるためこれが検出されることとなる(S3
0)。このため、図6に示すような他形態素アスペクト
意味辞書を参照し、「すでに」のアスペクト意味の基本
素性組み合わせC i ,(ここに、i=1,…,m)
を取り出す(S40)。上記取り出されたアスペクト意
味の基本素性組み合わせC i ,(i=1,... ,
m)をそれに対応する動詞アスペクト素性組み合わせA
と、または、各アスペクト記号素性組み合わせBi ,
(i=1,... ,n)と結合ルールにのっとっての演算
を行ってから(S50)、動詞アスペクト素性組み合わ
せAを各アスペクト記号素性組み合わせBと結合ルール
の演算をする(S60)。上記の結合ルールにのっとっ
ての演算を行った結果を、図13の解釈規則辞書に示す
解釈ルールと照合演算をなしたならば、この文のアスペ
クト意味が得られる(S70)。最後に、図14の変換
規則辞書に示す変換規則を参照し、目的言語のアスペク
ト記号を決めてから、アスペクトの処理を終える(S8
0)。この結果、「He has already read that book.」
という英文が得られる。他の例文「今日も雪が降り続い
ている。」では、上述した演算方法及び参照辞書によ
り、図12に示す演算過程を経て、反復状態アスペクト
と解釈されるようになる。その結果、現在進行完成式と
判定され、この文章の英語の機械翻訳の結果は「Now,it
has been snowing.」となる。ただし、勿論厳密には英
国人、米国人は「Now 」と「has been snowing」とが一
の文章に並存するような文章構成とすることはありえな
いため、最終的には人手により適切な英訳がなされるこ
ととなるが、これについては既に説明したとおりであ
る。
【0021】
【発明が解決しようとする課題】しかしながら、上記の
従来例のアスペクト処理方法に不可欠のアスペクト組み
合わせの結合演算規則、解釈規則、及び変換規則等は全
て処理対象の言語に依存する。このため、一旦機械翻訳
システムの処理対象言語が変更されると、これらの関連
規則もそれに応じて変更する必要がある。更に、原始言
語をその翻訳を目指す言語たる目的言語に変換するとき
には、日本語の動詞には英語の動詞と異なり過去形がな
い等もとの言語に存在する関連規則をそのまま利用する
ことはできないことが多いので、改めて解析しなおさな
ければならない。またこれが、機械翻訳の開発効率が向
上しない一因でもある。更にまた、共通のアスペクトを
認知できる表現が欠けているので、n国語用の機械翻訳
装置の場合には、中国語の各方言間、ポルトガル語とス
ペイン語等非常に類縁関係の近い言語を除き、原則とし
てアスペクト素性辞書、動詞アスペクト分類辞書、アス
ペクト記号辞書、他形態素アスペクト辞書などを各n個
と、n(n−1)個の結合演算規則、及び変換規則を準
備しなければならず、高価、不経済、非効率的となる。
【0022】本発明は、以上の課題に鑑み、各国語共通
のアスペクト意味表現形式を見つけ、各言語毎に必要と
する各種の辞書及び規則を最低限にして、多国言語機械
翻訳を大幅に効率を向上させるアスペクト処理方法及び
その装置を提供することを目的としてなされたものであ
る。
【0023】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明においては、目的言語のアスペクト
記号を求めるために、原始言語の文アスペクト情報に基
づいて、原始言語の動詞アスペクト分類、アスペクト記
号並びに「状況」、「解釈」及び「共起要素」の形式表
現による可能アスペクト意味を登録(あらかじめの格納
による永久記憶)している原始言語アスペクト記号辞書
部と、目的言語の動詞アスペクト分類、アスペクト記号
並びに「状況」、「解釈」及び「共起要素」の形式表現
による可能アスペクト意味解釈を登録している目的言語
アスペクト記号辞書部と、動詞及びアスペクト記号のほ
かにアスペクト意味に影響し得る形態素、品詞(単語を
意義、作用、形態から分類した構文上の意味。例えば日
本語における名詞、動詞、形容詞、形容動詞、副詞等)
及び「可能解釈i」(ここに、i=1,2,3,…と可
能な解釈の数だけ採りえる整数)の形式表現による可能
アスペクト解釈を登録している原始言語他形態素アスペ
クト辞書部と、原始言語の変換条件のアスペクト意味組
み合わせと目的言語のアスペクト意味組み合わせとの対
で「状況」、「解釈」及び「共起要素」の形式表現によ
るアスペクト意味変換規則を登録しているアスペクト意
味変換辞書部と、解析木における動詞ノードの動詞アス
ペクト分類及びアスペクト記号を検索要素として、前記
原始言語アスペクト記号辞書部内を参照し、すべての可
能な「状況」、「解釈」及び「共起要素」アスペクト意
味組み合わせを取り出す原始言語アスペクト記号情報抽
出部と、動詞及びアスペクト記号以外の形態素、品詞を
検索要素として、前記原始言語他形態素アスペクト辞書
部内を参照し可能アスペクト意味制限の組み合わせを取
り出すアスペクト意味制限条件抽出部と、上記取り出さ
れたアスペクト意味制限条件に基づいて同一化手法によ
り上記の可能アスペクト意味の組み合わせの中からあり
えないアスペクト意味を削除する同一化部と、同一化さ
れた可能アスペクト意味組み合わせを検索要素として前
記アスペクト意味変換辞書部内を参照し目的言語のアス
ペクト意味組み合わせを獲得する変換部と、目的言語の
動詞分類及び上記のアスペクト意味組み合わせを検索要
素として前記目的言語アスペクト記号辞書部内を参照
し、対応する目的言語アスペクト記号及び共起要素を獲
得する目的言語アスペクト記号抽出部とを有することを
特徴とするアスペクト処理装置としている。
【0024】
【作用】本発明に係るアスペクト処理装置は上記構成に
よって、原始言語から目的言語への機械翻訳に際してア
スペクト処理部を介して原始言語のアスペクトを目的言
語のアスペクトに変換する処理を行う。具体的には、以
下の作用をなす。原始言語アスペクト記号辞書部には、
目的言語のアスペクト記号を求めるために、原始言語の
文アスペクト情報に基づいて、原始言語の動詞アスペク
ト分類、アスペクト記号並びに「状況」、「解釈」及び
「共起要素」の形式表現による可能アスペクト意味が登
録されている。
【0025】目的言語アスペクト記号辞書部には、目的
言語の動詞アスペクト分類、アスペクト記号並びに「状
況」、「解釈」及び「共起要素」の形式表現による可能
アスペクト意味解釈が登録されている。なお、「状
況」、「解釈」及び「共起要素」の具体的内容について
は実施例にて説明する。原始言語他形態素アスペクト辞
書部には、動詞及びアスペクト記号のほかにアスペクト
意味に影響し得る形態素、品詞及び「可能解釈i」(こ
こに、i=1,2,3,…と可能な数だけ採りえる。例
えば「可能解釈1」、「可能解釈2」、…)の形式表現
による可能アスペクト解釈が登録されている。
【0026】アスペクト意味変換辞書部には、原始言語
の変換条件のアスペクト意味組み合わせと目的言語のア
スペクト意味組み合わせとが対で「状況」、「解釈」及
び「共起要素」の形式表現によるアスペクト意味変換規
則が登録されている。原始言語アスペクト記号情報抽出
部が、解析木における動詞ノードの動詞アスペクト分類
及びアスペクト記号を検索要素として、前記原始言語ア
スペクト記号辞書部内を参照し、すべての可能な「状
況」、「解釈」及び「共起要素」アスペクト意味組み合
わせを取り出す。
【0027】アスペクト意味制限条件抽出部が、動詞及
びアスペクト記号以外の形態素、品詞を検索要素とし
て、前記原始言語他形態素アスペクト辞書部内を参照し
可能アスペクト意味制限の組み合わせを取り出す。同一
化部が、上記取り出されたアスペクト意味制限条件に基
づいて同一化手法により上記の可能アスペクト意味の組
み合わせの中からありえないアスペクト意味を削除す
る。
【0028】目的言語アスペクト記号抽出部が、同一化
された可能アスペクト意味組み合わせを検索要素として
前記アスペクト意味変換辞書部内を参照し目的言語のア
スペクト意味組み合わせを獲得する変換部と、目的言語
の動詞分類及び上記アスペクト意味組み合わせを検索要
素として前記目的言語アスペクト記号辞書部内を参照
し、対応する目的言語アスペクト記号及び共起要素を獲
得する。
【0029】
【実施例】本発明を実施例に基づいて説明するに先立
ち、本発明の立脚する法則について説明する。Mr.
C.Smith(C.スミス氏)がLinguistics and Phi
losophy (言語学及び哲学(意訳))の論文集(198
6年2月)により提案した「A speaker-based approac
h to aspect 」(話す者からのアスペクトへの提言(意
訳))から分かるように、どの言語でも自然言語のアス
ペクトの意味は、図15に示す状況(situation ) によ
り分類できる。かつ、各種類の状況の性質は、基本的に
は完了相(perfectivity) 及び未完了相(imperfectivi
ty)の二種類しかを持っていない。しかし、アスペクト
の意味をこのように分類すれば、細かく分類していない
ので、アスペクトを認知処理するときに、アスペクトの
意味の多義性が発生し易い。アスペクトの多義性を解決
するために、Mr.B.Comire (B.コミレ氏)がケン
ブリッジ大学の論文集(1976年)により提案した
「Aspect:An introduction to the study of aspect
and related problem 」(アスペクトとこれに関連する
問題への探究への紹介(意訳))は上記の完了及び未完
了の性質について、解釈という概念を導入の上で、図1
6に示すように完了という性質を完了(perfective)、
終了(telic)及び経験(experience)というふうに、未
完了という性質を試し(delimitative)、開始(incept
ive ) 、反復(repeative)というふうにもっと細かく分
類した。(そして、これが特許請求の範囲に使用した
「状況」の意味、内容である。)すると、上記図15に
示すアスペクトの状況分類の状況及び図16に示す本来
は日本語、英語用のものを中国語にも適用しうるよう補
足した結果である細分化された解釈を日本語、英語、中
国語等語族の類縁関係を大きく越える(ウラル−アルタ
イ−古アジア語族系、インド−ヨーロッパ語族系、中国
語族)各言語の、そしてその他の各自然言語の文のアス
ペクトの共通表現にすることができるようになった。そ
して、ここにいう解釈が特許請求の範囲にいう解釈であ
る。本発明は、更に文の共起要素(動詞及びアスペクト
記号の他に文のアスペクト意味を解釈し、また目的言語
のアスペクト記号を生成する際にはその参考となるも
の。)例えば、副詞、その他助詞等によりアスペクト意
味の多義性を解決できることを発見したので、この共起
要素の有無をも考慮して上記のアスペクト意味の共通表
現に加えたものである。また本発明は、多数のアスペク
ト記号を連用して多数のアスペクト意味の組み合わせが
生じたときに、これに対応して、言語間のアスペクト表
現の差異を参照するためのアスペクト変換辞書を準備す
ることにより各言語共通のアスペクト表現を採用したた
め、アスペクト意味変換辞書の方向性(対象とする言
語)がなくなる。
【0030】以下、以上のことを日本文を主に、例文を
参照しつつ説明する。今、従来の技術で示した例文「彼
はすでに本を読んでいる。」を例にとるならば、「読
む」と「ている」だけからならば、文のアスペクトとし
ては「進行」、「反復」、「状態」、「反復状態」等が
ありえるが、副詞「すでに」があるため、「反復状
態」、「進行」、「反復」は除外される。このため、副
詞「すでに」が文のアスペクト内容の理解に大きな役割
を担うのがわかる。
【0031】また、もしこの際この文章が「彼は毎日本
を読んでいる。」と「すでに」のかわりに同じく副詞の
「毎日」が入っているならば、この「毎日」のために文
アスペクトの素性は「反復状態」以外にありえないこと
となる。このため、「すでに」のような純然たる副詞の
みならず、「今日」「毎日」というような本来は名詞で
ある語がアスペクトに大きな影響を及ぼすのがわかる。
この他「やっと」、「とうとう」、「昨日から」、「3
月1日」等の具体的期日をあげられよう。例えば、「3
月1日」はこれ以前の日からみれば未来、未来完了とな
り、これ以後の日からみれば過去、過去完了、継続等と
なる。
【0032】副詞以外の例を示すならば、助詞をあげら
れる。ここに、助詞とはある言葉について、その言葉と
他の言葉の関係を示したり、限定・接続・感動などの意
味を表したりするものをいう。ここの助詞は日本語では
「が」、「を」、「に」、「で」、等であり、英語では
preposition に相当し、「in」、「on」、「from」等で
あり、中国語では介詞を指し、「從」、「到」、
「給」、「在」等である。
【0033】さて、各国語とも、助詞は格をもってい
る。例えば、日本語の「で」は、「位置」格、「道具」
格等を有している。さて、本発明ではこれらの格意味に
よりアスペクト意味の多義性を解決することができるこ
とをも発明の上、これをとり入れている。例えば、「彼
は去年から失業している」という文のアスペクト意味は
“進行”、“反復”、“状態”、“習慣”などがある。
しかしこの文での「から」という副詞の格意味は「time
from」(時間 …から)なので、上記の文のアスペク
ト意味を“状態”に解釈することができる。したがっ
て、上記の文の中国語の訳文は「他從去年一直失業著」
(He has been losing his job since lastyear)であ
る。「他從去年正在失業著」(He was losing his job
from last year)というような誤訳の防止がはかれる。
【0034】他の例文を示すなら、「私は今から君が昨
日まで私にしてやってきたことは不問にする。」という
多少複雑な文では「今」と「昨日」という2つの本来は
名詞であるが副詞として作用する語があるから、このう
ち「昨日」の方は後の方にある助詞「は」で、文全体と
してのアスペクトの意味は有されないのがわかる。以上
は、原始言語を中心にした説明であるが、これをもとに
目的言語を生成する場合にも、その言語固有のアスペク
ト共起要素を文に組み込むことによりアスペクトの表現
が正確となる。上記日本文の「今から」の部分の英訳文
で具体的に示せば、「From now on 」である。
【0035】他の例文を示すならば、翻訳文が日本文で
ある場合の現在までに事件が完了しその結果が今日継続
している動作であるならば、副詞「とっくに」、「すで
に」がある。また、会話を示す記号「 」は、その内部
で独立した文アスペクトを有する。また英訳での「Oh,y
es」、「but 」、ドイツ語の「Ja」、「aber」、日本語
の「なるほど」、「しかし」という品詞間の呼応では両
品詞に関係する部分の文アスペクトは同じであるのが原
則である。そして、以上説明したことは各国言語に共通
にみられる現象である。
【0036】以下、本発明を実施例に基づいてより具体
的かつ詳細に説明する。図1は本発明に係るアスペクト
処理装置の一実施例の構成を示すものである。本図に示
すアスペクト処理装置は、入力部100、原始言語解析
中間構造生成部200、解析用辞書部250、変換部3
00、変換辞書部350、アスペクト処理部400、原
始言語アスペクト記号辞書部450、原始言語他形態素
アスペクト辞書部451、アスペクト意味変換辞書部4
52、目的言語アスペクト記号辞書部453、目的言語
生成部500、生成用辞書550、出力部600及びバ
ッファ700を備えている。入力部100はキーボード
などからなり、使用者が解析しようとする原始言語を入
力するものである。原始言語解析中間構造生成部200
は入力された文について解析用辞書部250内を参照し
て、構文及び意味の解析を行い、原始言語に依存する中
間構造を獲得してから、これをバッファ700に記憶す
る。変換部300はバッファ700から中間構造を取り
出し、変換辞書部350を参照して、原始言語の構文及
び意味に依存する中間構造を目的言語に依存する中間構
造に変換し、原始言語及び目的言語の動詞アスペクト分
類を判定してから、変換結果をバッファ700に記憶す
る。アスペクト処理部400はバッファ700から目的
言語に依存する中間構造を取り出してから、原始言語ア
スペクト記号辞書部450、原始言語他形態素アスペク
ト辞書部451、アスペクト意味変換辞書部452、目
的言語アスペクト記号辞書部453を参照し、原始言語
に依存するアスペクト記号及び関連要素を目的言語に依
存するアスペクト記号及び関連要素に変換する。そし
て、変換された結果をバッファ700に記憶する。この
際のアスペクト処理部400の詳細な処理流れを図2に
示す。原始言語アスペクト記号辞書部450、目的言語
アスペクト記号辞書部453、原始言語他形態素アスペ
クト辞書部451、アスペクト意味変換辞書部452の
構造をそれぞれ図4、図5、図6、図7に示す。目的言
語生成部500は、生成用辞書部550を参照して、目
的言語を生成し、その翻訳結果をバッファ700に記憶
する。最後に、翻訳結果を印刷機、CRTなどの出力部
600により出力する。
【0037】なお、ここにアスペクト処理するときに参
照する原始言語アスペクト記号辞書部450、原始言語
他形態素アスペクト辞書部451、アスペクト意味変換
辞書部452、目的言語アスペクト記号辞書部453な
どの内容は予め作成された上でレジスタに登録(永久記
憶)されている。この際、原始言語アスペクト記号辞書
部450及び原始言語他形態素アスペクト辞書部451
の内容は言語自身の意味や構文などの情報により作成さ
れたものである。
【0038】以下には、原始言語アスペクト記号辞書部
450に格納されているデータ構造をCプログラム言語
で実現しているのを示す。 int mrknum=16;/目的言語アスペクト記号数/ typedef struct aspmarker{ char poss-interpre 8 80 ; }ASPMARKER;/可能アスペクト意味の構造/ typedef struct sourceasp{ ASPMARKER marker mrknum ; }SOURCEASP;/各アスペクト記号の構造/ SOURCEASP sourceasp_data 5 ;/5種類の動詞アスペクト/ 次に、上記各部のアスペクト処理に際しての動作の内容
を具体的に説明するに先立ち、その説明で使用する技術
用語についてあまり一般的ではないので当業者にとり周
知なものもあるが定義若しくは内容をあらかじめ説明し
ておく。
【0039】原始言語解析中間構造部生成部の生成対象
たる「中間構造」とは、依存構造や概念構造などからな
り、これらは機械翻訳処理の専門用語であり、システム
の演算方法にしたがって、任意に依存構造や概念構造を
選択したり、作成したりすることができるものである。
通常、中間構造は多くの情報を属性値に隠し、構造をよ
り簡単にする。したがって、より少ない規則だけで、中
間構造の変換を行うことが可能となるものである。更
に、中間構造は処理対象の言語とは無関係に、機械翻訳
の演算方法にて処理しえるものである。例えば、「私は
学校へ行く」という簡単な文を対象に日中機械翻訳での
原始言語と目的言語との中間構造を図18に示す。図1
8のような簡単な中間構造で原始言語の中間構造の変換
処理(構造変換、概念変換、訳語選択など)を行えば、
目的言語の中間構造となる。なお、後に説明する実施例
での原始言語あるいは目的言語の中間構造はいずれも同
じ構造(例えば木構造)とされ、各自の意味や構文など
の情報を格納するものとしている。
【0040】「解析木」とは、機械翻訳、自然言語処理
の分野では、木構造で言語の処理結果を表示したものを
いう。「同一化」手法(unification)とは、プログラム
言語に用いられる同一化手法と同じであり、同一化演算
を利用して索引値(インデックス値)により関連のある
辞書内を参照し、機械翻訳処理に必要な関連ある値を求
めるものである。例えば、(a、b、xx)を(a、
b、A)、(a、b、B)、(a、b、C)、(b、
c、R)、(b、c、S)、(c、d、A)及び(d、
f、K)という知識データベース(辞書)と同一化演算
をすると、xxという変数の値として(a、b)に対応
するA、B、Cが得られる。
【0041】「マッチング手法」とは、条件を比較し、
一致するものがあれば該変換値に置換する演算である。
もし、一致するものがない場合には、マッチングの演算
失敗となる。以下、アスペクト処理部400における処
理流れを図2、3を参照しつつ説明する。なお、処理流
れ図は一文を対象としたものである。まず初期値として
処理に必要のある変数部A、B、C、D、Eを全て0
(空集合)に設定する(S401)。ここでは変数部A
は動詞アスペクト分類を格納する。変数部BはB[i]
(ここに、i=1、…、n)より構成され、各B[i
は木構造で処理対象の言語の文の処理結果を表示した解
析木に出現するすべてのアスペクト記号の集合を格納す
る。変数部Cは各国語共通の意味表現たる「状況」、
「解釈」及び「共起要素」の形式表現による可能アスペ
クト意味の集合を格納する。変数部Dはアスペクト制限
条件を格納する。変数部Eはアスペクト意味を格納す
る。次に、原始言語解析木から動詞のアスペクト分類を
取り出し、取り出された値を変数部Aに格納する(S4
10)。本実施例では、入力された原始言語の文につい
て左から右まで出現した原始言語のすべてのアスペクト
記号を図17のように動詞ノードに格納しているので、
動詞ノードからすべてのアスペクト記号を取り出し順に
各B[i に格納する(S420)。続けて、上記A部
の動詞アスペクト分類とB部のすべてのアスペクト記号
B[i の内容を検索要素として、原始言語アスペクト
記号辞書部450を参照して、「状況」、「解釈」及び
「共起要素」の形式表現による可能なアスペクト意味の
集合を取り出し(S430)、その結果を変数部Cに格
納する。その後、解析木から動詞ノード以外の形態素ノ
ードを取り出し、取り出された形態素及び品詞を検索要
素として、原始言語他形態素アスペクト辞書部451を
参照して、そのアスペクト意味制限条件を取り出し、取
り出された各アスペクト意味制限条件毎にこれを変数部
Dの各D[i に格納する(S440)と共に、変数i
の初期値を1に設定する(S450)。その後、上記取
り出されたアスペクト意味制限条件を格納するD部の各
D[i は空集合(0、すなわち何も取り出されていな
い)か否かを判断する(S460)。空集合でない場合
には、同一化手法により、アスペクト意味制限条件部D
の各D[i についてその内容に合う可能アスペクト意
味部Cの値C[1 k を取り出し、取り出されたC
1 k によりC 1 1 を設定してから、C 1
C j ,(j=2,... ,m)を空集合に設定する
(S470)。iを1加算してから(S480)、可能
アスペクト意味を抽出するための処理(S460〜S4
80)を繰り返し行う。もし、D[i の値が空集合で
あれば、C[i 1 ,(i=1,... ,n)の値によ
りアスペクト意味部Eの各値E[i を設定する(S4
90)。そして、図7のアスペクト意味変換辞書部45
2を参照し、マッチング手法によりE[i の内容をア
スペクト意味変換辞書部452の変換条件と比較し、一
致する変換条件の対応変換結果を取り出し、アスペクト
意味部Eの各E[i 内の内容を修正する(S50
0)。目的言語の動詞分類及びアスペクト意味部Eの各
E[i の内容を検索要素として、目的言語アスペクト
記号辞書部453を参照して、目的言語アスペクト記号
及び共起要素を取り出し、目的言語生成部の生成に利用
されるように動詞ノードに格納する。これで、アスペク
ト処理部の処理を終える。
【0042】「彼はすでにその本を読んでいる。」とい
う原始言語を例として、図1、図2及び図3を参照しな
がら、本発明のアスペクト処理装置のアスペクト処理を
説明する。上記の原始言語が入力部100により入力さ
れると、原始言語解析中間構造生成部200を介して、
原始言語に依存する中間構造が得られる。この中間構造
について変換用辞書部350を参照し変換部300の処
理を行ってから、図17に示すような中間結果が得られ
る。この後、図2のアスペクト処理部400の処理に入
る。図2において、まず変数A、B、C、D、Eの初期
値を全て0に設定する(S401)。次に、図17の動
詞「読む」ノードの原始言語の動詞アスペクト分類VJ
及び目的言語の動詞アスペクト分類VCを取り出して、
それぞれ変数A及びTに設定する。すると、A=action
(動き), T=activity(動作)になる。入力された文
には一つのアスペクト ている しかないので、B 1
=「ている」となり,B 2 ,B 3 ,... ,な
どは空集合になる(S420)。そして上記のA及びB
1 の値により原始言語アスペクト記号辞書部450
内を検索し、図4に示すように、下記の「状況」、「解
釈」及び「共起要素」の形式表現による可能アスペクト
意味集合Cを取り出す(S430)。
【0043】C 1 1 =(Activity, repeative
−) (動作,反復−) C 1 2 =(Activity, progressive −)(動作,
進歩的−) C 1 3 =(State, experience −) (状態,
経験−) C 1 4 =(State, nonprogressive −)(状態,
非進歩的−) C 1 5 =(State, perfective −) (状態,
完了−) C 1 6 =(Habitual, habitual−) (常習的,
学習的−) そして、入力された文において、動詞以外の要素、例え
ば、「彼」、「本」、「すでに」などの形態素及び品詞
により、原始言語他形態素アスペクト辞書部451内を
検索し、図6に示すように、下記のアスペクト意味制限
条件部Dを取り出す(S440)。
【0044】D 1 ={perfective} ({完了}) 続けて、可能アスペクト意味を抽出するために、まず変
数iの初期値を1に設定してから(S450)、アスペ
クト制限条件部DのD i 内は空集合であるか否かを
判断する(S460)。アスペクト制限条件部DのD
i 内は空集合ではないと判定すると、同一化演算を行
い(S470)、下記の「状況」、「解釈」及び「共起
要素」の形式表現による可能アスペクト意味集合Cが得
られる。
【0045】C 1 1 =(State perfective−)
(状態,完了−) C 1 2 =() C 1 3 =() C 1 4 =() C 1 5 =() C 1 6 =() それから、変数iを1加算した後(S480)、D 2
は空集合であるか否かの判断を行う(S460)。D
2 は空集合であるので、C i 1 ,(i=1,
…)により、E内の各E i を設定する(S49
0)。E i は下記のようになる。
【0046】 E 1 =(State perfective−) (状態,完了−) E 2 =() : : : そして、アスペクト意味変換辞書部452を参照し、ア
スペクト意味部E内のE 1 の内容と一致する変換条
件がないので、変換結果を獲得できないものと判断す
る。このため、E i を修正しない。目的言語の対応
動詞分類Tはactivity(動作)であるので、activity
(動作)及び(State perfective−)(状態,完了−)
により、目的言語アスペクト記号辞書部453内を検索
し、「了,−」という変換結果が得られる。そのうちの
「−」は共起要素がない事を示す。目的言語生成部50
0内を介して上記のアスペクトの処理結果「了,−」に
より、生成用辞書部550内を参照し、「他己經讀了那
本書」という中国語文に翻訳するようになる。最後に出
力部600により翻訳結果を出力する。
【0047】この処理例では、翻訳文として意味内容を
理解する面からわかり易いものを選定したためアスペク
ト意味変換辞書部452を利用しなかったので、次にア
スペクト意味変換辞書部452の具体的作用について説
明する。図7に示すようにアスペクト意味変換辞書部4
52の主な作用は、多数のアスペクトを連用するときに
生じる多義性を解決するものである。例えば、日本語文
によくみかけられる「てしまっている」等の動詞と助動
詞を連用する文型はアスペクト意味を解析するときに状
況及び解釈の変換に際しては多義性の問題が起こり易
い。このため、従来以上にアスペクト素性を的確に演算
するために、処理対象の言語について特に演算規則とし
てアスペクト意味変換辞書を作ったものである。本実施
例では、production-type(マッチング条件→変換結果と
いう形をproduction-type と称する)の意味変換規則、
照合演算、置換演算を採用する。なお、この演算規則は
処理対象の言語に応じて特殊のものとする必要がないた
め、実施しやすい上に、翻訳効率がよくなる。従って、
上記「してしまっている」があるような場合にはアスペ
クト意味変換辞書部452を利用して、「てしまってい
る」に対応する原始言語変換条件に対応する目的言語ア
スペクト意味を取り出し、これより目的言語の動詞等を
決定すれば、アスペクト意味を適切に処理できる上に、
翻訳品質も向上できる。
【0048】以下、これについて説明する。たとえば、
「彼は本を読んでしまっている」という例では、図7に
示しているアスペクト意味変換辞書部452を参照の
上、(activity,telic,-)(活動, 終了-)+(activity,st
ate,-)( 活動, 状態-)→(activity,telic,-)( 活動, 終
了,-) という変換規則を翻訳処理につけ加える。さて、
「彼は本を読んでしまっている」という文には、「しま
う」と「ている」という二つのアスペクト記号があるの
で、そのままでは(activity,telic,-)及び(activity,
state,-)の二つの連用のアスペクト意味が得られる。も
しも、この状態でこの二連用のアスペクト意味について
これ以上の処理をしないと、悪くて、不正確な翻訳結果
(″*″という記号で表示する)となる可能性が大き
い。しかし、この変換規則によって更に処理を行った結
果、下記のように高い品質の翻訳文が得られることとな
る。
【0049】(日本語)彼は本を読んでしまっている。 (中国語*)他讀完著書。(activity,telic)+(activ
ity,state ) (He has been reading the book over.) (中国語)他讀完書。(activity,telic) (英語)He read the book over.
【0050】
【発明の効果】以上説明したように本発明は文の共起要
素によりアスペクト意味の多義性を解決できることに注
目してなされたものである。このため、各自然言語に対
して、動詞アスペクト分類及び関連の表層(関係する分
の表現の構造)のアスペクト記号により、可能なアスペ
クト意味を解析可能とし、また可能なアスペクト意味辞
書の作成も可能としたものである。また、アスペクトに
影響し得るほかの要素、例えば、副詞、助詞(日本語に
おける純然たる助詞の他に「おいて」等を含み、中国語
における介詞、英語におけるpreposition 等)なども解
析できるし、他形態素アスペクト辞書も作成できる。と
ころで、原始言語アスペクト記号辞書及び原始言語他形
態素アスペクト辞書の二辞書の情報は言語自身の意味や
構文等の情報により作り出され、しかも各国語で独自に
作成されえるため、処理対象言語の変更に従って変更す
る必要もない。また本発明は、多数のアスペクト記号を
連用して多数のアスペクト意味の組み合わせが生じたと
きには、各言語間のアスペクト表現の差異を参照するた
めのアスペクト変換辞書を参照することにより各言語共
通のアスペクト表現を採用することとしたため、上記ア
スペクト意味変換辞書の言語による特有性がなくなる。
すなわち、原始言語と目的言語を変えても、このアスペ
クト意味変換辞書を変更する必要がない。このため、n
種類言語用の機械翻訳装置を作る場合には、n種類の可
能アスペクト意味辞書、他形態素アスペクト辞書、及び
n(n−1)/2のアスペクト変換辞書を準備すればよ
いこととなる。すなわち、従来の各言語に依存する演
算、解釈及び変換規則の問題点をいっぺんに若しくは共
通に解決することが可能となる。
【0051】具体的には下記の効果がある。 (1)アスペクト意味も考慮しているので、機械翻訳の
質が向上する。 (2)アスペクトを処理する際に、目的言語のアスペク
ト記号及び関連共起要素をも同時に生成可能であるた
め、各言語間のアスペクトの差異を解決しえ、機械翻訳
の質が向上する。
【0052】(3)アスペクト意味を一つの共通の形式
表現により表わすため、アスペクト意味を解析する際
に、必要とする関連データは翻訳の対象となる言語に無
関係に設定可能であり、このため、処理対象言語のアス
ペクト記号辞書及びアスペクト意味変換辞書を変更する
ことにより容易に他の言語に応用できる。更に、参照用
すべき辞書及び規則の数が減少し、翻訳装置も安価とな
る。
【0053】(4)機械翻訳の質が大幅に向上するた
め、人による後編集の必要性が低下する。このため、機
械翻訳の自動性、翻訳作業の効率も向上する。
【図面の簡単な説明】
【図1】本発明に係るアスペクト処理装置の一実施例の
構成図である。
【図2】上記実施例におけるアスペクト処理装置の動作
流れ図である。
【図3】上記実施例におけるアスペクト処理装置の動作
流れ図である。
【図4】上記実施例における原始言語アスペクト記号辞
書部内の辞書のデータ構造の様子を示す図である。
【図5】上記実施例における目的言語アスペクト記号辞
書部の辞書のデータ構造の様子を示す図である。
【図6】上記実施例における原始言語他形態素アスペク
ト辞書のデータ構造の様子を示す図である。
【図7】上記実施例におけるアスペクト変換辞書部の辞
書のデータ構造の様子を示す図である。
【図8】従来技術に係るアスペクト処理装置の動作流れ
図である。
【図9】従来技術に係る動詞アスペクト分類用辞書の構
成の様子を示す図である。
【図10】従来技術に係るアスペクトの八つの素性の説
明図である。
【図11】従来技術に係るアスペクト記号意味辞書の構
成の様子を示す図である。
【図12】従来技術に係るアスペクト処理装置の動作の
基本的構成を示す図である。
【図13】従来技術に係る解釈規則辞書の構成の様子を
示す図である。
【図14】従来技術に係るる変換規則辞書の構成の様子
を示す図である。
【図15】本発明に係る状況分類及び関連解釈の内容を
示す図である。
【図16】本発明に係るアスペクト解釈分類の内容を示
す図である。
【図17】本発明の上記実施例における原始言語解析結
果の木構造を示す図である。
【図18】中国語文及び日本文における中間構造の例で
ある。
【符号の説明】
100 入力部 200 原始言語解析中間構造生成部 250 解析用辞書 300 変換部 400 アスペクト処理部 450 原始言語アスペクト記号辞書 451 原始言語他形態素アスペクト辞書 452 アスペクト意味変換辞書 453 目的言語アスペクト記号辞書 500 目的言語生成部 550 生成用辞書 600 出力部 700 バッファ

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 目的言語のアスペクト記号を求めるため
    に、原始言語の文アスペクト情報に基づいて、原始言語
    の動詞アスペクト分類、アスペクト記号並びに「状
    況」、「解釈」及び「共起要素」の形式表現による可能
    アスペクト意味を登録している原始言語アスペクト記号
    辞書部と、目的言語の動詞アスペクト分類、アスペクト
    記号並びに「状況」、「解釈」及び「共起要素」の形式
    表現による可能アスペクト意味解釈を登録している目的
    言語アスペクト記号辞書部と、動詞及びアスペクト記号
    のほかにアスペクト意味に影響し得る形態素、品詞及び
    「可能解釈i」(ここに、i=1,2,3,…と可能な
    解釈の数だけ採りえる整数)の形式表現による可能アス
    ペクト解釈を登録している原始言語他形態素アスペクト
    辞書部と、原始言語の変換条件のアスペクト意味組み合
    わせと目的言語のアスペクト意味組み合わせとの対で
    「状況」、「解釈」及び「共起要素」の形式表現による
    アスペクト意味変換規則を登録しているアスペクト意味
    変換辞書部と、解析木における動詞ノードの動詞アスペ
    クト分類及びアスペクト記号を検索要素として、前記原
    始言語アスペクト記号辞書部内を参照し、すべての可能
    な「状況」、「解釈」及び「共起要素」アスペクト意味
    組み合わせを取り出す原始言語アスペクト記号情報抽出
    部と、動詞及びアスペクト記号以外の形態素、品詞を検
    索要素として、前記原始言語他形態素アスペクト辞書部
    内を参照し可能アスペクト意味制限の組み合わせを取り
    出すアスペクト意味制限条件抽出部と、上記取り出され
    たアスペクト意味制限条件に基づいて同一化手法により
    上記の可能アスペクト意味の組み合わせの中からありえ
    ないアスペクト意味を削除する同一化部と、同一化され
    た可能アスペクト意味組み合わせを検索要素として前記
    アスペクト意味変換辞書部内を参照し目的言語のアスペ
    クト意味組み合わせを獲得する変換部と、目的言語の動
    詞分類及び上記のアスペクト意味組み合わせを検索要素
    として前記目的言語アスペクト記号辞書部内を参照し、
    対応する目的言語アスペクト記号及び共起要素を獲得す
    る目的言語アスペクト記号抽出部とを有することを特徴
    とするアスペクト処理装置。
JP09295393A 1993-04-20 1993-04-20 アスペクト処理装置 Expired - Fee Related JP3313810B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP09295393A JP3313810B2 (ja) 1993-04-20 1993-04-20 アスペクト処理装置
TW82105193A TW231351B (en) 1993-04-20 1993-06-29 Processing method and device for aspect

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09295393A JP3313810B2 (ja) 1993-04-20 1993-04-20 アスペクト処理装置

Publications (2)

Publication Number Publication Date
JPH06309352A JPH06309352A (ja) 1994-11-04
JP3313810B2 true JP3313810B2 (ja) 2002-08-12

Family

ID=14068829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09295393A Expired - Fee Related JP3313810B2 (ja) 1993-04-20 1993-04-20 アスペクト処理装置

Country Status (2)

Country Link
JP (1) JP3313810B2 (ja)
TW (1) TW231351B (ja)

Also Published As

Publication number Publication date
JPH06309352A (ja) 1994-11-04
TW231351B (en) 1994-10-01

Similar Documents

Publication Publication Date Title
JP2814634B2 (ja) 機械翻訳装置
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
Lyons A review of Thai–English machine translation
JPH05120324A (ja) 言語処理方式
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3313810B2 (ja) アスペクト処理装置
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0414386B2 (ja)
JPH0561902A (ja) 機械翻訳システム
JP2521435B2 (ja) 日本語生成装置
Vasuki et al. English to Tamil machine translation system using parallel corpus
Chaudhary et al. A Study of Transliteration Approaches
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS6180360A (ja) 翻訳方式
JP3692711B2 (ja) 機械翻訳装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP2000029882A (ja) 要約文作成装置
Skadiņa et al. Comprehension Assistant for Languages of Baltic States
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
JPH11259474A (ja) 機械翻訳装置及び機械翻訳方法
JPH04130577A (ja) 自然言語処理装置
JP2001125898A (ja) 言語解析処理の方法、システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees