JP2719453B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2719453B2
JP2719453B2 JP3043477A JP4347791A JP2719453B2 JP 2719453 B2 JP2719453 B2 JP 2719453B2 JP 3043477 A JP3043477 A JP 3043477A JP 4347791 A JP4347791 A JP 4347791A JP 2719453 B2 JP2719453 B2 JP 2719453B2
Authority
JP
Japan
Prior art keywords
speech
symbol
phrase
sentence
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3043477A
Other languages
English (en)
Other versions
JPH04280369A (ja
Inventor
秀造 釘宮
徳行 平井
陽士 福持
いち子 佐田
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3043477A priority Critical patent/JP2719453B2/ja
Publication of JPH04280369A publication Critical patent/JPH04280369A/ja
Application granted granted Critical
Publication of JP2719453B2 publication Critical patent/JP2719453B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳装置に関する。
【0002】
【従来の技術】従来の機械翻訳装置は、形態素解析部に
よりキーボードから入力されたソース言語の文章を所定
の辞書を用いて形態素に分割して各形態素の品詞を得
て、構文解析部により形態素解析部で形態素に分割され
た文章を所定の辞書と所定の文法規則とを用いて解析し
て文章の構文構造を得る。更に、変換部により構文解析
部で得られた構文構造をターゲット言語の文章の構文構
造に変換し、翻訳文生成部により変換部で得られた構文
構造に基づいてターゲット言語の文章を生成するように
構成されている。
【0003】機械翻訳は、翻訳手順により2つの方式に
大別される。
【0004】1つは、ソース言語及びターゲット言語の
どちらにも依存しない概念(中間言語と呼ぶ)まで解析
し、そこから文脈生成、意味生成、構文生成、形態素生
成と進み、翻訳文を得るピボット方式である。
【0005】他の1つは、形態素解析、構文解析、意味
解析及び文脈解析のうち、いずれかまでの解析を行って
原文の内部構造を得て翻訳文を生成するトランスファー
方式である。
【0006】
【発明が解決しようとする課題】上述した従来の機械翻
訳装置では、構文解析部が、形態素解析の結果得られた
品詞から辞書と文法規則とを用いて構文解析を行うとき
に、可能なあらゆる構文構造を組み立てて、その結果に
基づいて変換部と翻訳文生成部により複数の翻訳文が得
られるように構成されているので、ユーザは複数の翻訳
結果の中から正しいものを選択する必要があり、そのた
めに選択という煩わしい作業を行わなければならず、ま
た最終的な翻訳結果を得るまでに長時間を要するという
問題点がある。
【0007】本発明は、上記従来の機械翻訳装置におけ
る問題点に鑑み、正しい翻訳結果を迅速に得ることを可
能とする機械翻訳装置を提供することにある。
【0008】
【課題を解決するための手段】本発明は、形態素に分割
されたソース言語で記載された文章の構文構造を解析す
る構文解析手段と、文章に含まれるフレーズの品詞を指
定する品詞指定記号を文章に付加する記号付加手段と、
付加された品詞指定記号を検出する記号検出手段と、品
詞指定記号が検出されたときにフレーズに含まれる単語
数をカウントし、品詞指定記号によって指定されたフレ
ーズの品詞と単語数とを記憶する記憶手段とを備えてお
り、構文解析手段は、記憶手段に記憶された単語数でフ
レーズを判断し、記憶手段に記憶された品詞を判断され
フレーズの品詞として構文構造を解析することを特徴
とする機械翻訳装置を提供する。
【0009】
【作用】ソース言語で記載された文章に含まれるフレー
ズの品詞を指定するため、予め記号付加手段によってソ
ース言語で記載された文章に品詞指定記号を付加する。
そしてソース言語の文章を形態素に分割して各形態素の
品詞を得るときに記号検出手段がソース言語で記載され
た文章中に品詞指定記号を検出するとフレーズに含まれ
る単語数をカウントし、記憶手段は品詞指定記号が指定
するフレーズの品詞及び単語数を記憶する。構文解析手
段は、記憶手段に記憶された単語数でフレーズを判断
し、記憶手段に記憶された品詞を判断されたフレーズの
品詞として構文構造を解析してターゲット言語による構
文構造を得る。
【0010】
【実施例】以下、図面を参照して本発明の機械翻訳装置
における実施例を詳述する。
【0011】図1は、本発明における機械翻訳装置の主
要部である翻訳モジュールの動作を示すフロ−チャ−ト
である。
【0012】図2は、図1の翻訳モジュールの機能的な
構成を示す。
【0013】翻訳モジュール10は、機能的には原文を、
辞書を用いて形態素に分割して各形態素の品詞を得る形
態素解析部11、形態素解析部11により形態素に分割され
た文章を辞書と文法規則とを用いて解析して文章の構文
構造を得る構文解析部12、構文解析部12で得られた構文
構造をターゲット言語の構文構造に変換する変換部13、
変換部13によって得られた構文構造に基づいて翻訳文を
生成する翻訳文生成部14により構成されている。
【0014】図3に翻訳モジュール10の具体的な構成を
示す。
【0015】翻訳CPU15は、翻訳プログラムに基づい
て図2の各機能を実現する。メモリ16には所定の翻訳プ
ログラムが格納されており、バス17により翻訳CPU15
に接続されている。
【0016】バッファA〜Eは、翻訳手順の各段階で各
種のデータを格納するためのものであり全てバス17に接
続されている。また、モジュール10が参照する辞書・規
則メモリ18はバス17に接続されている。
【0017】図4は、本実施例における機械翻訳装置の
一構成例を示すブロック図である。図に示すように、本
実施例の機械翻訳装置は、メインCPU(中央処理装
置)、19、メインメモリ20、CRT(カソード・レイ・
チューブ)21、キーボード22、翻訳モジュール10及び翻
訳モジュール10に接続されており翻訳用の辞書、文法規
則、木構造変換規則などが格納された辞書・規則メモリ
18により構成されている。上記の各構成部分は全てバス
23によって接続されている。
【0018】翻訳モジュール10は、ソース言語の文章
(原文)が入力されると、それを翻訳してターゲット言
語の文章(翻訳文)を出力する。
【0019】キーボード22から原文が入力されると、C
PU19はそれを翻訳モジュール10に送る。翻訳モジュー
ル10は原文を受け取ると、辞書・規則メモリ18に格納さ
れている辞書、文法規則及び木構造変換規則などを用い
て、後述するようにターゲット言語に翻訳する。
【0020】翻訳結果は、メインメモリ20に一旦記憶さ
れると共にCRT21に表示される。図5は、翻訳モジュ
ール10における翻訳手順を示す。
【0021】図に示すように、翻訳モジュール10におけ
る翻訳手順は各レベルに分解できる。原文が与えられる
と、翻訳モジュール10は、レベルL1の辞書引き、レベ
ルL2の形態素解析、レベルL3の構文解析、・・・ のよ
うに翻訳手順を進める。
【0022】ここで図5に示す各解析について説明す
る。
【0023】(a)辞書引きおよび形態素解析(L1,
L2) 辞書・規則メモリ18に格納された辞書を引き、原文を各
形態素列(単語列)に分割し、各単語の品詞などの文法
情報及び訳語を得、更に時制、人称、数などを解析す
る。
【0024】(b)構文解析(L3) 単語間の係り受けなどの文章の構造(構造解析木)を決
定する。
【0025】(c)意味解析(L4) 複数の構文解析の結果から意味的に正しいものとそうで
ないものとを判別する。
【0026】(d)文脈解析(L5) 話題を理解し、省略や曖昧さを取り去る。
【0027】本実施例の翻訳モジュール10は、トランス
ファー方式の機械翻訳を行うもので、少なくとも上記レ
ベルL3の構文解析のレベルまでを行うものとする。
【0028】次に、図6を参照して、フレーズの品詞指
定は行わずに英語を日本語に翻訳する場合の動作を説明
する。
【0029】キーボード21(図4参照)より入力され、
翻訳モジュール10に与えられた原文、例えば「This is
a pen.」は、図6に示すような形でバッファAに格納さ
れる。 辞書引き形態素解析部11(図2参照)は、バッ
ファAに格納された原文の各単語の訳語などの情報を辞
書・規則メモリ18の辞書を用いて取得し、その結果をバ
ッファBに格納する。例えば得られた情報の一部である
品詞情報は、表1のような形でバッファBに格納され
る。
【0030】
【表1】
【0031】ここで、「this」は多品詞語であるが、そ
の品詞は構文解析部12によって一意に決定される。構文
解析部12では、辞書・規則メモリ18の辞書と文法規則に
基づいて各単語間の係り受け関係を表す構造解析木(図
7)が決定されて、バッファCに格納される。
【0032】上記の構造解析木は、具体的には次のよう
にして決定される。
【0033】まず、辞書・規則メモリ18の文法規則か
ら、 文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 という規則が得られる。ここで例えば、1つ目の規則は
「文とは、主部と述部とからできている」ということを
表している。以下、この規則に従って構造解析木が決定
される。
【0034】変換部13では、構文解析部12と同様に辞書
・規則メモリ18の木構造変換規則を用いて、原文に対す
る構造解析木(図7)の構造が、図8に示すような日本
文に対する構造に変換される。得られた結果はバッファ
Dに格納される。
【0035】翻訳文生成部14は、得られた日本文字「こ
れ ペン である。」に適切な助詞「は」や助動詞をつ
け、「これはペンである。」という日本語の形にしてバ
ッファEに格納する。このバッファEに格納された翻訳
文は翻訳モジュール10から出力されてメインメモリ20に
格納されると共にCRT21に表示される。
【0036】次に、フレーズの品詞を指定して英語を日
本語に翻訳する場合の動作を、図1のフローチャートを
用いて説明する。
【0037】この実施例では、フレーズの品詞を指定す
るための品詞指定記号として、品詞の種類とフレーズの
始点とを表す表2のフレーズ品詞指定開始記号”[”
と、フレーズの終点を表すフレーズ品詞指定終了記
号”]”とを用いる。
【0038】
【表2】
【0039】表2について説明すると、1はこの記号で
始まるフレーズを名詞と指定するためのものであり、同
様に2は動詞、3は形容詞、4は副詞とそれぞれ指定す
るための記号である。ユーザは原文をキーボード22を操
作して入力する際、このような記号を原文中に挿入する
ことによってフレーズの品詞を指定する。
【0040】キーボード22とCPU19とは品詞指定記号
を原文に付加するための記号付加手段として機能し、ユ
ーザはキーボード22を操作して品詞指定記号を含ませる
ことができる。
【0041】以下、例文としてThe price increased 20
% d _[the previous year].という文章を入力したとき
の翻訳モジュール10の動作を図1を参照して詳述する。
【0042】翻訳モジュール10は、この原文を受け取る
とそれをバッファAに格納する(ステップS1)。
【0043】次に、形態素解析部11は、記号検出手段と
して動作し、まず単語位置を示すポインタが先頭の単語
「The 」を指すように0にセットする(ステップS
2)。
【0044】そして現在ポイントされている単語の先頭
がフレーズ品詞指定開始記号か否かを判別し(ステップ
S3)、品詞指定開始記号でないときはフレーズ品詞指
定終了記号か否かを判別する(ステップS4)。
【0045】上記ステップS4における判別の結果、品
詞指定終了記号でない場合には、現在ポイントされてい
る単語「The 」をその単語位置「0」と共にバッファB
に表3に示すような形で格納する(ステップS5)。そ
の後、さらに次の単語があるか否かを判別し(ステップ
S6)、単語がまだある場合には単語位置ポインタを1
つ増加させて(ステップS7)から、上記ステップS3
に戻って同様の処理を行う。その結果、バッファBに
は、「The priceincreased 20% 」までが格納される。
【0046】
【表3】
【0047】単語位置ポインタが単語位置「4」まで進
みステップS3の処理に入ると、現在の単語「d _[th
e」の先頭が品詞指定開始記号であるため、指定された
品詞「副詞」と、単語位置「4」とを表4に示すような
形でバッファFに格納し(ステップS9及びS10)、
更に品詞指定終了記号「]」までの単語数をカウント
し、その数「3」をバッファFに格納する(ステップS
11)。
【0048】
【表4】
【0049】そして形態素解析部11は品詞指定開始記号
を削除した単語をバッファBに格納し(ステップS1
2)、上記ステップS6に移って残りの単語がある否か
を判別する。
【0050】単語位置ポインタが単語位置「6」まで進
むと、単語「year」の処理になる。形態素解析部11はス
テップS3で品詞指定開始記号か否かを判別するが、開
始記号ではないのでステップS4に進み、品詞指定終了
記号か否かを判別する。そして現在ポイントされている
単語「year] 」の最後が品詞指定終了記号であるため、
それを削除した単語をバッファBに格納する(ステップ
S8)。
【0051】このようにステップS3〜S12までの処
理を繰り返して文末までの単語をバッファBに格納する
と、形態素解析部11はステップS6からステップS13
に進み、バッファBに格納されている見出し語に対して
辞書引きを行い、各見出し語に対して品詞および単語数
の情報を付加し、表5に示すような形でバッファBに格
納する。
【0052】
【表5】
【0053】次に、形態素解析部11はバッファFに格納
されている情報(表4)をバッファBに加え、その結
果、単語位置「4」の単語「the 」は、辞書引きの結果
では「冠詞」という品詞を持っていたが、バッファFの
情報により、単語位置「4」には単語数「3」の品詞
「副詞」が追加される。従ってバッファBには最終的に
表6に示すような情報が格納されることになる。
【0054】なお、ここで単語数が「3」となっている
のは、「the previous year 」という3つの単語を一つ
のイディオムとして扱い、構文解析のとき、この3つの
単語を一つの「副詞」として処理できるようにするため
である。
【0055】
【表6】
【0056】構文解析部12は辞書・規則メモリ18の内容
を参照し、バッファBに格納された各単語の品詞情報に
もとづいて構文構造を決定する。そして構文解析部12は
品詞決定手段として機能し、「the previos year」の品
詞を「副詞」と決定して図9に示すような構文構造木を
作成し、その結果をバッファCに格納する。
【0057】変換部13はこの構文構造木をもとに、辞書
・規則メモリ18の木構造変換規則を用いて日本語の構文
構造木を求め、その結果をバッファDに格納する。
【0058】翻訳文生成部14はバッファDに格納された
情報をもとに、翻訳文を生成し、最終的に「価格は前年
20%増大した。」という翻訳文を出力する。この翻訳
結果はメインメモリ20に格納されると共にCRT21に表
示される。
【0059】原文中の「the previos year」に「副詞」
という品詞指定が行われなかったとすると、「the prev
ios year」は、通常の構文解析では「名詞句」となるの
で、構文構造を図9のような一つの文に組み立てること
はできず、構文解析は失敗となって翻訳文は「価格は2
0%増大した|前年」のように分割された文章となる
が、本発明の機械翻訳装置によれば、上述のように「th
e previos year」に対して品詞指定を行うことができ、
「the previos year」は「副詞」として扱われるので、
正しい翻訳文「価格は前年20%増大した。」が容易に
得られる。
【0060】
【発明の効果】本発明の機械翻訳装置は、形態素に分割
されたソース言語で記載された文章の構文構造を解析す
る構文解析手段と、文章に含まれるフレーズの品詞を指
定する品詞指定記号を文章に付加する記号付加手段と、
付加された品詞指定記号を検出する記号検出手段と、品
詞指定記号が検出されたときにフレーズに含まれる単語
数をカウントし、品詞指定記号によって指定されたフレ
ーズの品詞と単語数とを記憶する記憶手段とを備えてお
り、構文解析手段は、記憶手段に記憶された単語数でフ
レーズを判断し、記憶手段に記憶された品詞を判断され
フレーズの品詞として構文構造を解析するので、フレ
ーズの判断とフレーズの品詞の特定が容易となり構文解
析のときに候補を減らすことができ、処理時間の短縮が
可能になり、その結果、無駄な構文解析を行なわずに正
しい翻訳結果が迅速に得られる。
【図面の簡単な説明】
【図1】本発明による品詞指定機能を有する機械翻訳装
置を構成する翻訳モジュールの動作を説明するためのフ
ローチャートである。
【図2】図1の翻訳モジュールを有する品詞指定機能を
有する機械翻訳装置の構成を示す図である。
【図3】図2の翻訳モジュールの具体的なブロック図で
ある。
【図4】図2の品詞指定機能を有する機械翻訳装置の全
体を示すブロック図である。
【図5】図2の機械翻訳装置による機械翻訳における手
順をレベルに分解して示す説明図である。
【図6】図2の翻訳モジュールを構成するバッファAの
内容を示す説明図である。
【図7】図2の翻訳モジュールにおける構文解析の結果
を表す図である。
【図8】図2の翻訳モジュールにおける木構造変換の結
果を表す図である。
【図9】図2の翻訳モジュールにおける構文解析の結果
を表す図である。
【符号の説明】
10 翻訳モジュール 11 辞書引き形態素解析部 12 構文解析部 13 変換部 14 翻訳文生成部 15 翻訳CPU 16 翻訳プログラムメモリ 17,23 バス 18 辞書・規則メモリ A〜E バッファ 19 メインCPU 20 メインメモリ 21 CRT 22 キーボード
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐田 いち子 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 九津見 毅 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 電子通信学会論文誌、Vol.J64− D、No.9、高松忍、西田富士夫、 「動詞パターンと格構造に基づく英日機 械翻訳」、P.815−P.822、(1981. 9) bit別冊 機械翻訳、鈴木等、「英 日機械翻訳システム DUET−E /J」、P.167−P.172、共立出版 (1988.9)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】形態素に分割されたソース言語で記載され
    た文章の構文構造を解析する構文解析手段と、前記文章
    に含まれるフレーズの品詞を指定する品詞指定記号を該
    文章に付加する記号付加手段と、前記付加された品詞指
    定記号を検出する記号検出手段と、前記品詞指定記号が
    検出されたときに当該フレーズに含まれる単語数をカウ
    ントし、当該品詞指定記号によって指定された前記フレ
    ーズの品詞と単語数とを記憶する記憶手段とを備えてお
    り、前記構文解析手段は、前記記憶手段に記憶された
    語数で前記フレーズを判断し、当該記憶手段に記憶され
    た品詞を当該判断されたフレーズの品詞として前記構文
    構造を解析することを特徴とする機械翻訳装置。
  2. 【請求項2】前記品詞指定記号は前記フレーズが名詞、
    動詞、形容詞、副詞のうちの一つであることを示す記号
    及び該フレーズの始点または終点を示す記号を含んでい
    ることを特徴とする請求項1に記載の機械翻訳装置。
JP3043477A 1991-03-08 1991-03-08 機械翻訳装置 Expired - Fee Related JP2719453B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3043477A JP2719453B2 (ja) 1991-03-08 1991-03-08 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3043477A JP2719453B2 (ja) 1991-03-08 1991-03-08 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH04280369A JPH04280369A (ja) 1992-10-06
JP2719453B2 true JP2719453B2 (ja) 1998-02-25

Family

ID=12664804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3043477A Expired - Fee Related JP2719453B2 (ja) 1991-03-08 1991-03-08 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2719453B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
bit別冊 機械翻訳、鈴木等、「英日機械翻訳システム DUET−E/J」、P.167−P.172、共立出版 (1988.9)
電子通信学会論文誌、Vol.J64−D、No.9、高松忍、西田富士夫、「動詞パターンと格構造に基づく英日機械翻訳」、P.815−P.822、(1981.9)

Also Published As

Publication number Publication date
JPH04280369A (ja) 1992-10-06

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JP3220560B2 (ja) 機械翻訳装置
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JP2815714B2 (ja) 翻訳装置
US5065318A (en) Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0261763A (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP2632806B2 (ja) 言語解析装置
JP2752025B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
KR100413966B1 (ko) 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법
JP3233800B2 (ja) 機械翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
JP2947554B2 (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH0332105B2 (ja)
JPH0673134B2 (ja) 機械翻訳システム
JPH04130577A (ja) 自然言語処理装置
JPH05181901A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH05158971A (ja) 機械翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JPH04296969A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081114

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091114

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees