JPH09146959A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH09146959A
JPH09146959A JP7329679A JP32967995A JPH09146959A JP H09146959 A JPH09146959 A JP H09146959A JP 7329679 A JP7329679 A JP 7329679A JP 32967995 A JP32967995 A JP 32967995A JP H09146959 A JPH09146959 A JP H09146959A
Authority
JP
Japan
Prior art keywords
expression
pair
phrase
syntax
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7329679A
Other languages
English (en)
Inventor
Tadayuki Tsunashima
督之 綱島
Fumito Masui
文人 桝井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7329679A priority Critical patent/JPH09146959A/ja
Publication of JPH09146959A publication Critical patent/JPH09146959A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【解決手段】 英文中に含まれるas対の直前、間、直後
に含まれる語句をキー項目として、直喩表現部分や慣用
表現部分を1まとまりにして訳等を表示したテーブル化
データを利用する。 【効果】 as対を含む直喩表現や慣用表現を一括して翻
訳し、より高品質の訳文を出力できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された英文を
適切な日本文に自動的に翻訳して出力する機械翻訳シス
テムに関する。
【0002】
【従来の技術】大量の文献を情報処理装置により自動的
に翻訳するための機械翻訳システムが様々な分野で利用
されている。このような機械翻訳システムでは、翻訳対
象となる言語の特有の用法を考慮した翻訳手法が採用さ
れる。例えば、英文では、as…asを使用したいわゆる比
較構造の文が多用される。この部分の翻訳を効率的に行
うために次のような技術が紹介されている(文献名
「比較構造の特性を利用した英日機械翻訳処理の検討
第31頁〜第38頁」)。ここでは、as…as構文のas対
に挟まれる共通項の特性を抽出する。更に、as…as構文
の左側の範囲と右側の範囲を決定し、as…as構文の比較
構造の特性を生かして右辺構造の基底構造を復元する。
こうして、as…as構文の統語構造に依存し構造解析によ
って意味を把握する。
【0003】
【発明が解決しようとする課題】ところで、上記のよう
な従来の機械翻訳システムには次のような解決すべき課
題があった。英文中にはas…as構文と同種の形態でas対
を用いて「〜のように〜だ」という直喩表現がしばしば
用いられる。ところが、従来のシステムでは、例えば、
“Heis as busy as bee. ”の場合、「ハチが忙しいよ
うに、彼は忙しい。」となってしまって適切な翻訳とな
らない。正しくは「彼は、ハチのように忙しい。」のよ
うに翻訳されることが好ましい。
【0004】一方、これ以外にもas…as構文の表現の中
で慣用的に使用される、いわゆる慣用表現が存在する。
この慣用表現には慣用表現と類似する用法を持つ表現に
ついては必ずしも従来のシステムでは十分対応できな
い。例えば、“They have as much fun as usual. ”と
いう英文が与えられたとき、「彼らは、いつもの同じく
らい楽しんでいる。」といった翻訳が出力されてしま
う。正しくは「彼らは、いつもと同じように楽しんでい
る。」のようになるべきである。
【0005】
【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈構成1〉入力された英文を解析して日本文に自動的に
翻訳して出力するものにおいて、入力された英文の構文
を解析する形態素解析部と、英文に使用されるas対を使
用した構文のうち、直喩表現に該当するものを、as対に
挟まれる共通項の語句と、as対の直後にある右辺の語句
と、その直喩表現部分を一まとまりに見た場合の品詞と
用法と訳を含む付与情報とを対応付けた直喩参照テーブ
ルと、入力された英文中のas対構文を検出し、そのas対
に挟まれる共通項の語句と、as対の直後にある右辺の語
句とをキー項目にして直喩参照テーブルを参照し、その
as対構文が直喩表現の場合には、その直喩表現部分を一
まとまりにして、対応する訳を決定する直喩処理部とを
備える。
【0006】〈説明〉as対とは、英文中でas…as構文を
使用した部分のことをいう。as対に挟まれる語句とは、
最初のasと後ろのasの間に挟まる語句のことをい
う。形態素解析部は、少なくとも単語の切りわけ及び語
彙情報の付与を行なう機能をもつ。直喩表現とは、一般
のas対の用法とは異なり、「〜のように〜だ」と翻訳す
べきような表現をいう。直喩表現部分を一まとまりに見
た場合の品詞や訳をテーブル化して、それを参照するよ
うにしたのは、直喩表現部分は、一括して1語の単語と
同様に取り扱って翻訳したほうが処理上、効果的だから
である。
【0007】〈構成2〉入力された英文を解析して日本
文に自動的に翻訳して出力するものにおいて、入力され
た英文の構文を解析する形態素解析部と、英文に使用さ
れるas対を使用した構文のうち、慣用表現に該当するも
のを、as対の直前にある左辺の語句と、as対に挟まれる
共通項の語句と、as対の直後にある右辺の語句と、その
慣用表現の文内で機能する語句の範囲と、その慣用表現
部分を一まとまりに見た場合の品詞と用法と訳を含む付
与情報とを対応付けた慣用表現テーブルと、入力された
英文中のas対構文を検出し、そのas対の直前にある左辺
の語句と、as対に挟まれる共通項の語句と、as対の直後
にある右辺の語句とをキー項目にして慣用表現テーブル
を参照し、そのas対構文が慣用表現の場合には、その慣
用表現部分を一まとまりにして、対応する訳を決定する
慣用表現処理部とを備える。
【0008】〈説明〉慣用表現とは、as対を使用してい
ても、特定の語句を伴うことにより、一般のas対を用い
た表現と全く異なる訳となるような表現部分をいう。ま
た、この慣用表現には、慣用表現に類似する用法を持つ
表現も含むものとする。このような表現の翻訳のため
に、慣用表現テーブルを利用して、as対とともに特定の
語句を伴って現れるものを、as対の特定の位置に出現す
る特定の語句を手掛かりにして検出し、その表現部分を
1語の単語と同様に扱って翻訳した。
【0009】〈構成3〉入力された英文中のas対構文を
検出し、そのas対の直前にある左辺の語句と、as対に挟
まれる共通項の語句と、as対の直後にある右辺の語句と
をキー項目にして、直喩参照テーブルと慣用表現テーブ
ルを参照し、そのas対構文が直喩表現の場合には、その
直喩表現部分を一まとまりにして、そのas対構文が慣用
表現の場合には、その慣用表現部分を一まとまりにし
て、対応する訳を決定するas対慣用化表現処理部とを備
える。
【0010】〈説明〉構成1や2では、直喩表現も慣用
表現もas対表現の検出に付随して処理される。そこで、
構成1と2の機能を同時に併せ持つas対慣用化表現処理
部を設けて同時処理を可能にした。
【0011】〈構成4〉入力された英文を解析して他の
言語に自動的に翻訳して出力するものにおいて、入力さ
れた英文の構文を解析する形態素解析部と、英文に使用
される相関接続詞を使用した構文を、相関接続詞ごとに
特定された近接する語句と、その相関接続詞を含む表現
の文内で機能する語句の範囲と、その相関接続詞を含む
表現部分を一まとまりに見た場合の品詞と用法と訳を含
む付与情報とを対応付けた相関接続詞表現テーブルと、
入力された英文中の相関接続詞を使用した構文を検出
し、その相関接続詞ごとに特定された近接する語句をキ
ー項目にして相関接続詞表現テーブルを参照し、相関接
続詞を使用した構文の場合には、その部分を一まとまり
にして、対応する訳を決定する相関接続詞処理部とを備
える。
【0012】〈説明〉as対のみならず、英文中には、so
A as B 、more A than B 、less A than B、such A th
an B 、rather A than B 、not only A but B…といっ
た相関接続詞を使用した慣用的表現がいくつか存在す
る。このような構文では、いずれの場合にも相関接続詞
に近接した一定の語句との関係で、一定の訳が決まる。
そこで、相関接続詞にも、as対を含む構文と同様の方法
を適用した。また、英文から日本語のみならず他の言語
への翻訳についても同様の取扱いができる。そこで、こ
の構成は、英語以外の他の言語への翻訳に適用するよう
にした。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 〈具体例1〉図1は、本発明によるシステムの具体例1
に関するブロック図である。図のシステムは、入力部1
と、形態素解析部2と、形態素解析辞書3と、直喩処理
部4と、直喩参照テーブル5と、解析部6と、解析辞書
7と、変換部8と、変換辞書9と、生成部10と、生成
辞書11と、形態素生成部12と、形態素生成辞書13
と、出力部14とから構成される。
【0014】入力部1は、翻訳対象の英文を読み込む。
形態素解析部2は、読み込まれた英文について形態素解
析辞書3を用いて単語の分割及び分割した単語の品詞、
用法、訳等の情報を付与する処理を行う。直喩処理部4
は、形態素解析結果に基づいて直喩参照テーブル5を用
いてas…as構文における直喩表現の用法、訳を決定する
処理を行う。as…as構文の直喩表現は、as対に挟まれる
共通項の語句とas対の後方にある右辺の語句との関係に
より表現される。そこで、この2つの語句を手がかりに
してas…as構文の中から直喩を表す表現を自動的に選択
し、直喩表現部分のみを一まとまりに変換し、後の処理
過程において簡単に扱えるようにする。直喩処理部4
は、その処理を行う。なお、この直喩参照テーブル5
は、直喩表現として使用されるas…as構文の、as対に挟
まれる共通項の語句と、as対の後方にある右辺の語句を
キー項目に格納し、更にこのキー項目に対応付けて、直
喩表現部分を一まとまりに扱った場合に付与される品
詞、用法、訳といった付与情報を、付与情報項目に格納
している。
【0015】解析部6は、形態素解析結果及び直喩処理
結果に基づいて解析辞書7を用いて構文の解析を行う。
変換部8は解析結果に基づいて変換辞書9を用いて英文
を日本文に変換する。生成部10は変換結果に基づいて
生成辞書11を用いて生成すべき日本語の単語、活用形
態及びその語順を決定する処理を行う。形態素生成部1
2は生成結果に基づいて形態素生成辞書13を用いて日
本語の自然な文としての形を整える。出力部14は整え
られた文を出力する。
【0016】図2は、上述した直喩参照テーブル5の構
成例を示す説明図である。直喩参照テーブル5は、検索
するときのキーとなる情報を格納してあるキー項目51
と、キー項目に対応付けられてキー項目に合致した場合
に付与される情報を格納してある付与情報項目52から
構成されている。キー項目51は、as…as構文中のas対
に挟まれる共通項のキーとなる語句を格納してある共通
項53と、as対の後方にある右辺のキーとなる語句を格
納してある右辺54から構成されている。付与情報項目
52は、キー項目に対応付けられてキー項目に格納して
ある語句に合致した場合に付与する情報で、品詞、用
法、訳の情報が格納してある、それぞれ品詞55の欄、
用法56の欄、訳57の欄から構成されている。例え
ば、キー項目51の共通項53の欄には“busy”、右辺
54の欄には“bee ”が存在し、これに対応する付与情
報項目52には品詞55の欄に「形容詞」、用法56の
欄に「叙述」、訳57の欄に「ハチのように忙しい」が
記述されている。
【0017】〈具体例1の動作〉図3は、具体例1のシ
ステムによる動作フローチャートである。この図を用い
て、as…as構文の直喩表現を処理する直喩処理部4の動
作を説明する。 ステップS1:入力された英文がas…asを含んでいる場
合に、この英文からas対に挟まれる共通項の語句及び、
as対の後方にある右辺の語句を抽出する。例えば、入力
された英文が“He is as busy as bee. ”の場合、共通
項の語句として“busy”、右辺の語句として“bee ”を
抽出することになる。 ステップS2:ステップS1で抽出されたデータである
共通項の語句及び右辺の語句をキーとして直喩参照テー
ブル5を探索する。例えば、上記英文において抽出した
共通項の語句“busy”と右辺の語句“bee ”をキーとし
て直喩参照テーブル5を検索することになる。
【0018】ステップS3:直喩参照テーブル5の検索
により、付与情報項目の有無を判定する。この判定によ
って、付与情報項目がなければ、直喩表現処理を終了す
る。また、付与情報項目が存在すれば、該当する付与情
報項目から付与情報を得る。例えば、品詞「形容詞」、
用法「叙述」、訳「ハチのように忙しい」という付与情
報を得ることになる。 ステップS4:形態素解析の結果のas対、as対に挟まれ
る共通項の語句、及びas対の後方にある右辺の語句をま
とめて一つのノードに変換する。例えば、上記英文の
“He isas busy as bee. ”では、as対、共通項の語
句、及び右辺の語句をまとめて一つのノードに変換する
ことにより、“He is [as_busy_as_bee ]. ”とい
う構造とする。
【0019】ステップS5:ステップS4でまとめたノ
ードにステップS3で抽出した付与情報を付与する。例
えば、上記ステップ4で得られた一つにまとめたノード
“[as_busy_as_bee ]”には、ステップS3で得ら
れた品詞「形容詞」、用法「叙述」、訳「ハチのように
忙しい」という付与情報を付与する。これで、直喩処理
部4による処理を終了し、直喩表現部分は一まとまりと
して扱われ、以下解析部6、変換部8、生成部10、形
態素生成部12と進んでいき、最終的に英文“He is as
busy as bee. ”に対する日本文「彼はハチのように忙
しい。」が得られる。なお、上記の例では、直喩表現を
処理する機構として直喩処理部4と直喩参照テーブル5
を用いて説明したが、この直喩参照テーブル5に直喩デ
ータを追加したり、削除することにより利用者の望む直
喩表現の処理も可能となる。
【0020】〈具体例1の効果〉以上の具体例1からな
る機械翻訳システムは、特に、英文のas…as構文中の直
喩表現に対して、直喩表現となるas対に挟まれる共通項
の語句とas対の後方にある右辺の語句をキー項目として
格納し、更にこのキー項目に対応付けて直喩表現部分を
一まとまりにした場合に付与される品詞、用法、訳の付
与情報も合わせて格納している直喩参照テーブルを用い
て、as…as構文の中から直喩を表す表現を自動的に選択
し、直喩表現部分のみを一まとまりに変換する直喩処理
部が備えられたものとなっている。また、直喩表現部分
のみを一まとまりに変換しているので、後の処理過程に
おいて直喩表現が一般の形容詞や副詞と同様に簡単に扱
える。
【0021】そして、この直喩処理部を設けることによ
り、as…as構文の中から直喩を表す表現を自動的に選択
し直喩表現部分のみを一まとまりに変換するようにして
いることから、英文の中のas…as構文と同種の形態とし
て表現される「〜のように〜だ」という直喩表現につい
ても、適切な日本文表現に確実に変換できるようになる
という効果が得られる。
【0022】〈具体例2〉図4は、本発明によるシステ
ムの具体例2に関するブロック図である。このシステム
は、図1に示した直喩処理部4と直喩参照テーブル5
を、それぞれ慣用表現処理部19と慣用表現参照テーブ
ル20とに置き換えたものである。入力部1は、翻訳対
象の英文を読み込む。形態素解析部2は、読み込まれた
英文について形態素解析辞書3を用いて単語の分割及び
分割した単語の品詞、用法、訳等の情報を付与する処理
を行う。慣用表現処理部19は、形態素解析結果に基づ
いて慣用表現参照テーブル20を用いてas…as構文の慣
用表現または慣用表現に類似する用法を持つ表現の用
法、訳を決定する処理を行う。
【0023】as…as構文の慣用表現または慣用表現に類
似する用法を持つ表現は、as対とともに特定の位置に特
定の語句を伴って現れ、関連する複数の語句が、文内で
簡便な用法として機能している。そこで、as対の特定の
位置に出現する特定の語句を手がかりにして、as…as構
文の慣用表現または慣用表現に類似する用法を持つ表現
を自動的に選択し関連のある部分を一まとまりに変換
し、後の処理過程において簡単に扱えるようにする。慣
用表現処理部19はその処理を行う。なお、この慣用表
現参照テーブル5は、as…as構文の慣用表現または慣用
表現に類似する用法を持つ表現の、as対の直前にある左
辺の語句、as対に挟まれる共通項の語句、as対の直後に
ある右辺の語句をキー項目に格納し、更にこのキー項目
に対応付けて、as…as構文の慣用表現または慣用表現に
類似する用法を持つ表現の、文内で機能する範囲を示す
機能範囲、文内で機能する部分を一まとまりとして扱っ
た場合に付与されるまとまり部分の用法及び訳といった
付与情報を、付与情報項目に格納している。
【0024】解析部6は、形態素解析結果及び慣用表現
処理結果に基づいて解析辞書7を用いて構文の解析を行
う。変換部8は、解析結果に基づいて変換辞書9を用い
て英文を日本文に変換する。生成部10は、変換結果に
基づいて生成辞書11を用いて生成すべき日本語の単
語、活用形態及びその語順を決定する処理を行う。形態
素生成部12は、生成結果に基づいて形態素生成辞書1
3を用いて日本語の自然な文としての形を整える。出力
部14は整えられた文を出力する。
【0025】図5は、上述した慣用表現参照テーブル2
0の構成例を示す説明図である。慣用表現参照テーブル
20は、検索するときのキーとなる情報を格納してある
キー項目21と、キー項目に対応付けられて、キー項目
に合致した場合に付与される情報を格納してある付与情
報項目22から構成されている。キー項目21は、左辺
語句23、共通項語句24、右辺語句25から構成され
ている。左辺語句23は、as…as構文中のas対の直前に
ある左辺のキーとなる語句を格納してある。共通項語句
24は、as…as構文中のas対に挟まれる共通項のキーと
なる語句を格納してある。右辺語句25は、as…as構文
中のas対の直後にある右辺のキーとなる語句を格納して
ある。左辺語句23及び右辺語句25は、構成する語句
が名詞、動詞、助動詞等の場合に名詞の複数形による語
句または語尾の変化、動詞の主語が3人称になったり、
時制が過去、完了等になることによる語句または語尾の
変化、助動詞の時制が過去、完了等になることによる語
句の変化等の活用をすることにより形態の変化する語句
に対して「()」を付けて表し、形態が変化してもキー
項目との照合が行えるようにしてある。
【0026】また、各語句の欄に特定の語句指定がない
場合には、「空白」にしておく。付与情報項目22は、
キー項目21に対応付けられてキー項目21に格納して
ある条件に合致した場合に付与される情報が格納されて
おり、機能範囲26、用法27及び訳28から構成され
ている。機能範囲26は、as…as構文の慣用表現または
慣用表現に類似する用法を持つ表現の文内で機能する範
囲を、キー項目の左辺語句、共通項語句、右辺語句に対
応させて、左辺だけで機能する場合には左、共通項だけ
で機能する場合には共、右辺だけで機能する場合には
右、左辺と共通項で機能する場合には左+共、共通項と
右辺で機能する場合には共+右、左辺と共通項と右辺で
機能する場合には左+共+右という略語で記述し格納し
てある。用法27は、機能範囲で記述してある部分を一
まとまりとして扱った場合の文内での機能を格納してあ
る。訳28は、機能範囲で記述してある部分を一まとま
りとして扱った場合の訳を格納してある。
【0027】例えば、“as…as usual”の慣用表現参照
テーブルの情報は、キー項目21の左辺語句23の欄は
空白、共通項語句24の欄は空白、右辺語句25の欄は
“usual ”がそれぞれ格納してありこれに対応する付与
情報項目22には、機能範囲26の欄に「右」、用法2
7の欄に「副詞」、訳28の欄に「いつもと同じよう
に」がそれぞれ格納してある。また、例えば“as soon
as possible ”の慣用表現参照テーブルの情報は、キー
項目21の左辺語句23の欄は空白、共通項語句24の
欄は“soon”、右辺語句25の欄は“possible”がそれ
ぞれ格納してありこれに対応する付与情報項目22に
は、機能範囲26の欄に「共+右」、用法27の欄に
「副詞」、訳28の欄に「できるだけ早く」がそれぞれ
格納してある。
【0028】また、例えば“as soon as”の慣用表現参
照テーブルの情報は、キー項目21の左辺語句23の欄
は空白、共通項語句24の欄は“soon”、右辺語句25
の欄は空白がそれぞれ格納してありこれに対応する付与
情報項目22には、機能範囲26の欄に「共」、用法2
7の欄に「従属接続詞」、訳28の欄に「とすぐに」が
それぞれ格納してある。また、例えば“as…as can be
”の慣用表現参照テーブルの情報は、キー項目21の
左辺語句23の欄は空白、共通項語句24の欄は空白、
右辺語句25の欄は“(can)(be) ”がそれぞれ格納して
ありこれに対応する付与情報項目22には、機能範囲2
6の欄に「右」、用法27の欄に「副詞」、訳28の欄
に「この上なく」がそれぞれ格納してある。ここで、右
辺語句25の欄の“(can)(be) ”の記述において“()”
が付いている語句については、その語句が主語に3人称
が来たために′s がついたり、時制が過去あるいは完了
になったため活用し、変化した場合にも対応するための
記述である。この例では、“(can) ”は、“could ”に
変化しても、“(be)”は、“is”、“are ”、“am”に
変化しても対応可能である。
【0029】〈具体例2の動作〉図6は、具体例2のシ
ステムによる動作フローチャートである。この図を用い
て、as…as構文の慣用表現または慣用表現に類似する用
法を持つ表現を処理する慣用表現処理部19の動作を説
明する。 ステップS1:入力された英文がas…asを含んでいる場
合に、この英文からas対の左にある左辺の語句、as対に
挟まれる共通項の語句、as対の右にある右辺の語句を抽
出する。
【0030】ステップS2:ステップS1で抽出した左
辺、共通項、右辺のそれぞれの語句をキーとして慣用表
現参照テーブル20と照合する。このとき、左辺及び右
辺の語句は、活用することにより語句が変形している場
合があるので、この場合には活用している左辺、右辺の
語句を(原形)に変換して照合する。 ステップS3:ステップS2の照合により、慣用表現参
照テーブル20中のデータの有無を判定する。この判定
により、検索されたデータが存在しなければ慣用表現処
理を終了する。また、データが存在すれば、該当する付
与情報項目22から付与情報を得る。
【0031】ステップS4:付与情報項目22から得た
付与情報の中で、機能範囲26の情報をチェックし、こ
の機能範囲に構造をまとめる。 ステップS5:ステップS4でまとめた機能単位に、付
与情報項目22の用法27、訳28の情報を付与する。
これで、慣用表現処理部19の処理を終了し、as…as構
文の慣用表現または慣用表現に類似する用法を持つ表現
において、慣用表現として特殊に機能する部分は一まと
まりにして簡単に扱うことが可能となる。以下、解析部
6、変換部8、生成部10、形態素生成部12と進んで
いき、日本文を生成する。
【0032】〈例文の処理〉以下では、この慣用表現処
理部の動作例を例文を用いて説明する。例えば、入力さ
れた英文が慣用表現に類似する用法を持つ“as…as usu
al”表現を含む“They have as much fun as usual. ”
の場合には、図6のステップS1で左辺の語句として
“have”、共通項の語句として“much fun”、右辺の語
句として“usual ”が抽出される。次に、ステップS2
で抽出した語句をキーとして慣用表現参照テーブル20
を照合する。キーとなる左辺語句、共通項語句、右辺語
句は、“have”,“much fun”,“usual ”である。こ
の照合により、左辺語句、共通項語句、右辺語句
が“”,“”,“usual ”の慣用表現参照テーブル20
のデータが、照合により検索される。
【0033】次に、ステップS3で慣用表現参照テーブ
ル20のデータの有無が判定される。この場合には、検
索されたデータが存在するので対応する付与情報項目か
ら付与情報として、付与情報項目22の機能範囲26か
ら「右」、用法27から「副詞」、訳28から「いつも
と同じように」をそれぞれ抽出する。次に、ステップS
4で抽出した付与情報項目22の機能範囲26の情報を
チェックし、この機能範囲に構造をまとめる。この例で
は、付与情報項目22の機能範囲26の情報は、「右」
であるから、“They have as much fun as usual. ”の
入力英文は“they have much fun[as as usual ]. ”
となる。
【0034】次に、ステップS5で機能範囲にまとめた
機能単位に付与情報項目22の用法で、訳28の情報を
付与する。この例では、ステップS4で得た[as as us
ual]という機能単位にステップS3で得た付与情報項
目22の用法27の情報「副詞」、及び訳28の情報
「いつもと同じように」を付与する。これで、慣用表現
処理部を終了し、as…as構文の慣用表現に類似する用法
を持つ“as as usual ”表現において、慣用表現として
特殊に機能する部分は一まとまりにして簡単に扱えるこ
とが可能となり、以下解析部6、変換部8、生成部1
0、形態素生成部12と進んでいき、最終的に英文“Th
ey have as much fun as usual. ”に対する日本文「彼
らは、いつもと同じように楽しんでいる。」が得られ
る。
【0035】また、例えば入力された英文が慣用表現で
ある“as soon as possible ”表現を含む“He came as
soon as possible.”の場合には、ステップS1で左辺
の語句として“came”、共通項の語句として“soon”、
右辺の語句として“possible”が抽出される。次に、ス
テップS2で抽出した語句をキーとして慣用表現参照テ
ーブル20を照合する。左辺の語句は、原形に直され
“(come)”となり、キーとなる左辺語句、共通項語句、
右辺語句は、“(come)”,“soon”,“possible”であ
る。この照合により、左辺語句、共通項語句、右辺語句
が“”,“soon”,“possible”の慣用表現参照テーブ
ルのデータの照合により検索される。次に、ステップS
3で慣用表現参照テーブルのデータの有無が判定され
る。
【0036】この場合には、検索されたデータが存在す
るので対応する付与情報項目から付与情報として、付与
情報項目22の機能範囲26から「共+右」、用法27
から「副詞」、訳28から「できるだけ早く」をそれぞ
れ抽出する。次に、ステップS4で抽出した付与情報項
目22の機能範囲26の情報をチェックし、この機能範
囲に構造をまとめる。この例では、付与情報項目22の
機能範囲26の情報は、「共+右」であるから、“He c
ame as soon as possible.”の入力英文は“Hecame [a
s soon as possible ]. ”となる。次に、ステップS
5で機能範囲にまとめた機能単位に付与情報項目22の
用法27、訳28の情報を付与する。
【0037】この例では、ステップS4で得た[as soo
n as possible ]という機能単位にステップS3で得た
付与情報項目22の用法27の情報「副詞」、及び訳2
8の情報「できるだけ早く」を付与する。これで、慣用
表現処理部を終了し、as…as構文の慣用表現において、
慣用表現として特殊に機能する部分は一まとまりにして
簡単に扱えることが可能となり、以下解析部、変換部、
生成部、形態素生成部と進んでいき、最終的に英文“He
came as soon as possible.”に対する日本文「彼は、
できるだけ早く来た。」が得られる。
【0038】また、入力された英文が慣用表現である
“as soon as”表現を含む“He wentout as soon as he
saw me. ”の場合には、ステップS1で左辺の語句と
して“out ”、共通項の語句として“soon”、右辺の語
句として“he”が抽出される。次に、ステップS2で抽
出した語句をキーとして慣用表現参照テーブル20を照
合する。キーとなる左辺語句、共通項語句、右辺語句
は、“out ”,“soon”,“he”である。この照合によ
り、左辺語句、共通項語句、右辺語句が“”,“soo
n”,“”の慣用表現参照テーブルのデータが照合によ
り検索される。次に、ステップS3で慣用表現参照テー
ブルのデータの有無が判定される。
【0039】この場合には、検索されたデータが存在す
るので対応する付与情報項目から付与情報として、付与
情報項目22の機能範囲26から「共」、用法27から
「従属接続詞」、訳28から「とすぐに」をそれぞれ抽
出する。次に、ステップS4で抽出した付与情報項目2
2の機能範囲26の情報をチェックし、この機能範囲に
構造をまとめる。この例では、付与情報項目22の機能
範囲26の情報は、「共」であるから、“He went out
as soon as he saw me. ”の入力英文は“He went out
[as soon as] he saw me. ”となる。次に、ステップ
S5で機能範囲にまとめた機能単位に付与情報項目22
の用法27、訳28の情報を付与する。
【0040】この例では、ステップS4で得た[as soo
n as]という機能単位にステップS3で得た付与情報項
目22の用法27の情報「従属接続詞」、及び訳28の
情報「とすぐに」を付与する。これで、慣用表現処理部
を終了し、as…as構文の慣用表現において、慣用表現と
して特殊に機能する部分は一まとまりにして簡単に扱え
ることが可能となり、以下解析部、変換部、生成部、形
態素生成部と進んでいき、最終的に英文“He went out
as soon as he saw me. ”に対する日本文「彼は私を見
るとすぐに出ていった。」が得られる。
【0041】また、入力された英文が慣用表現である
“as as can be”表現を含む“I am as tired as can b
e.”の場合には、ステップS1で左辺の語句として“a
m”、共通項の語句として“tired ”、右辺の語句とし
て“can ”が抽出される。次に、ステップS2で抽出し
た語句をキーとして慣用表現参照テーブルを照合する。
左辺の語句は原形に直され“(be)”となり、キーとなる
左辺語句、共通項語句、右辺語句は、“(be)”,“tire
d ”,“can ”である。この照合により、左辺語句、共
通項語句、右辺語句が“”,“”,“(can)(be) ”の慣
用表現参照テーブルのデータが照合データとして抽出さ
れるが、右辺語句に“(be)”が無いので、もう一度原文
の右辺語句の“can ”の後ろにある語句を抽出し照合処
理を行う。
【0042】この場合には、“can ”の後ろに“(be)”
があるので、マッチングし、照合データとし
て“”,“”,“(can)(be) ”の慣用表現参照テーブル
のデータが検索される。次に、ステップ3で慣用表現参
照テーブルのデータの有無が判定される。この場合に
は、検索されたデータが存在するので対応する付与情報
項目から付与情報として付与情報項目22の機能範囲2
6から「右」、用法27から「副詞」、訳28から「こ
の上なく」をそれぞれ抽出する。次に、ステップS4で
抽出した付与情報項目22の機能範囲26の情報をチェ
ックし、この機能範囲に構造をまとめる。この例では、
付与情報項目22の機能範囲26の情報は、「右」であ
るから、“I am as tired as can be.”の入力英文は
“I am tired[as as (can)(be) ]. ”となる。
【0043】次に、ステップS5で機能範囲にまとめた
機能単位に付与情報項目22の用法27、訳28の情報
を付与する。この例では、ステップS4で得た[as as
(can)(be) ]という機能単位にステップS3で得た付与
情報項目22の用法27の情報「副詞」、及び訳28の
情報「この上なく」を付与する。これで、慣用表現処理
部を終了し、as…as構文の慣用表現または慣用表現に類
似する用法を持つ表現において、慣用表現として特殊に
機能する部分は一まとまりにして簡単に扱えることが可
能となり、以下解析部、変換部、生成部、形態素生成部
と進んでいき、最終的に英文“I am as tired as can b
e.”に対する日本文「私は、この上なく疲れていま
す。」が得られる。
【0044】これにより、as…as構文の慣用表現または
慣用表現に類似する用法を持つ表現の運用管理を柔軟に
行えるようになるという効果が得られる。なお、上記の
例ではas…as構文の慣用表現または慣用表現に類似する
用法を持つ表現を処理する機構として慣用表現処理部と
慣用表現参照テーブルを用いて説明したが、この慣用表
現参照テーブルにデータを追加、削除、編集することに
より利用者の望むas…as構文の慣用表現または慣用表現
に類似する用法を持つ表現の処理が可能となる。
【0045】〈具体例2の効果〉上述した具体例2から
成る機械翻訳システムは、特に、as…as構文の慣用表現
または慣用表現に類似する用法を持つ表現に対して、as
…as構文の慣用表現または慣用表現に類似する用法を持
つ表現の、as対の左にある左辺の語句、as対に挟まれる
共通項の語句、as対の右にある右辺の語句をキー項目に
格納し、更にこのキー項目に対応付けてas…as構文の慣
用表現または慣用表現に類似する用法を持つ表現の、文
内で機能する範囲を示す機能範囲、文内で機能する部分
を一まとまりに扱った場合に付与されるまとまり部分の
用法及び訳といった付与情報を、付与情報項目に格納し
ている慣用表現テーブルを用いて、as…as構文の慣用表
現または慣用表現に類似する用法を持つ表現を自動的に
選択し関連のある部分を一まとまりに変換し、この一ま
とまりの部分の用法及び訳の付与情報を付与する。ま
た、as…as構文の慣用表現または慣用表現に類似する用
法を持つ表現の関連のある部分を一まとまりに変換して
いるので、その結果が後の処理過程において簡単に扱え
る。そして、慣用表現処理部を設けることにより、as…
as構文の慣用表現に類似する用法を持つ表現の機械翻訳
システム上でのメインテナンスも簡単になり、柔軟な運
用が可能となる。
【0046】〈具体例3〉図7には、本発明によるシス
テムの具体例3のブロック図を示す。この図のシステム
は、具体例1と具体例2の直喩処理部4や慣用表現処理
部19等を一体化したas…as慣用化表現処理部30を設
けている。その他の構成は具体例1や具体例2のものと
同一であって、重複する説明は省略する。
【0047】図8には、そのas…as慣用化表現処理部3
0のブロック図を示す。即ち、ここには直喩表現処理部
31、直喩表現参照テーブル32、慣用表現処理部3
3、慣用表現参照テーブル34が一体に設けられてい
る。即ち、この具体例のように、具体例1と具体例2の
as…as対に関する処理を行うための機能ブロックを併せ
持つようにすれば各種の表現に対して柔軟に対応できる
翻訳システムが構成される。直喩表現処理部31や慣用
表現処理部33の動作は具体例1あるいは具体例2に説
明したものと全く同様であり、また直喩表現参照テーブ
ル32や慣用表現参照テーブル34もこれまで説明した
例と全く同様のものでよい。
【0048】なお、本発明は上記のようなas対を使用し
た構文だけでなく、英文で慣用的に使用されている相関
接続詞にも広く適用できる。例えば、so A as B 、more
A than B 、less A than B 、such A than B 、rather
A than B 、not only A butB…といった相関接続詞
も、その直前や間、直後に出現する一定の語句と共に1
まとまりの意味を構成する。従って、具体例2と全く同
様の手法によって高品質の翻訳が可能となる。また、日
本語を仏語、中国語等の他の言語に置き換えることも可
能であり、広く高品質の翻訳が可能になる。
【図面の簡単な説明】
【図1】本発明によるシステムの具体例1のブロック図
である。
【図2】直喩参照テーブルの構成例説明図である。
【図3】具体例1のシステムによる動作フローチャート
である。
【図4】本発明によるシステムの具体例2のブロック図
である。
【図5】慣用表現参照テーブルの構成例説明図である。
【図6】具体例2のシステムによる動作フローチャート
である。
【図7】本発明によるシステムの具体例3のブロック図
である。
【図8】as…as慣用化表現処理部のブロック図である。
【符号の説明】
1 入力部 2 形態素解析部 3 形態素解析辞書 4 直喩処理部 5 直喩参照テーブル 6 解析部 7 解析辞書 8 変換部 9 変換辞書 10 生成部 11 生成辞書 12 形態素生成部 13 形態素生成辞書 14 出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された英文を解析して日本文に自動
    的に翻訳して出力するものにおいて、 入力された英文の構文を解析する形態素解析部と、 英文に使用されるas対を使用した構文のうち、直喩表現
    に該当するものを、as対に挟まれる共通項の語句と、as
    対の直後にある右辺の語句と、その直喩表現部分を一ま
    とまりに見た場合の品詞と用法と訳を含む付与情報とを
    対応付けた直喩参照テーブルと、 入力された英文中のas対構文を検出し、そのas対に挟ま
    れる共通項の語句と、as対の直後にある右辺の語句とを
    キー項目にして前記直喩参照テーブルを参照し、そのas
    対構文が直喩表現の場合には、その直喩表現部分を一ま
    とまりにして、対応する訳を決定する直喩処理部とを備
    えたことを特徴とする機械翻訳システム。
  2. 【請求項2】 入力された英文を解析して日本文に自動
    的に翻訳して出力するものにおいて、 入力された英文の構文を解析する形態素解析部と、 英文に使用されるas対を使用した構文のうち、慣用表現
    に該当するものを、as対の直前にある左辺の語句と、as
    対に挟まれる共通項の語句と、as対の直後にある右辺の
    語句と、その慣用表現の文内で機能する語句の範囲と、
    その慣用表現部分を一まとまりに見た場合の品詞と用法
    と訳を含む付与情報とを対応付けた慣用表現テーブル
    と、 入力された英文中のas対構文を検出し、そのas対の直前
    にある左辺の語句と、as対に挟まれる共通項の語句と、
    as対の直後にある右辺の語句とをキー項目にして前記慣
    用表現テーブルを参照し、そのas対構文が慣用表現の場
    合には、その慣用表現部分を一まとまりにして、対応す
    る訳を決定する慣用表現処理部とを備えたことを特徴と
    する機械翻訳システム。
  3. 【請求項3】 入力された英文中のas対構文を検出し、 そのas対の直前にある左辺の語句と、as対に挟まれる共
    通項の語句と、as対の直後にある右辺の語句とをキー項
    目にして、 直喩参照テーブルと慣用表現テーブルを参照し、 そのas対構文が直喩表現の場合には、その直喩表現部分
    を一まとまりにして、 そのas対構文が慣用表現の場合には、その慣用表現部分
    を一まとまりにして、対応する訳を決定するas対慣用化
    表現処理部とを備えたことを特徴とする請求項1または
    2記載の機械翻訳システム。
  4. 【請求項4】 入力された英文を解析して他の言語に自
    動的に翻訳して出力するものにおいて、 入力された英文の構文を解析する形態素解析部と、 英文に使用される相関接続詞を使用した構文を、相関接
    続詞ごとに特定された近接する語句と、その相関接続詞
    を含む表現の文内で機能する語句の範囲と、その相関接
    続詞を含む表現部分を一まとまりに見た場合の品詞と用
    法と訳を含む付与情報とを対応付けた相関接続詞表現テ
    ーブルと、 入力された英文中の相関接続詞を使用した構文を検出
    し、その相関接続詞ごとに特定された近接する語句をキ
    ー項目にして前記相関接続詞表現テーブルを参照し、相
    関接続詞を使用した構文の場合には、その部分を一まと
    まりにして、対応する訳を決定する相関接続詞処理部と
    を備えたことを特徴とする機械翻訳システム。
JP7329679A 1995-11-24 1995-11-24 機械翻訳システム Pending JPH09146959A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7329679A JPH09146959A (ja) 1995-11-24 1995-11-24 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7329679A JPH09146959A (ja) 1995-11-24 1995-11-24 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH09146959A true JPH09146959A (ja) 1997-06-06

Family

ID=18224060

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7329679A Pending JPH09146959A (ja) 1995-11-24 1995-11-24 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH09146959A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US5774845A (en) Information extraction processor
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2814634B2 (ja) 機械翻訳装置
JPH0644296A (ja) 機械翻訳装置
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
EP1497752A2 (en) Machine translation
JPH02165378A (ja) 機械翻訳システム
JPH09146959A (ja) 機械翻訳システム
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP4039205B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JP3892227B2 (ja) 機械翻訳システム
JPH10105552A (ja) 機械翻訳システム
JPS6386071A (ja) 自然言語翻訳方式
JPH0668134A (ja) 翻訳用例ベース利用翻訳方式
JPH0962682A (ja) 英文解析システム
JPH02208775A (ja) 機械翻訳方式
JP2004086919A (ja) 機械翻訳システム
JPH02294779A (ja) 機械翻訳システム
JPS60247787A (ja) 文章変換装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0756926A (ja) 中日機械翻訳における離合詞処理方式
JPH0443462A (ja) 翻訳後校正支援システム