JPH07182342A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07182342A
JPH07182342A JP5328893A JP32889393A JPH07182342A JP H07182342 A JPH07182342 A JP H07182342A JP 5328893 A JP5328893 A JP 5328893A JP 32889393 A JP32889393 A JP 32889393A JP H07182342 A JPH07182342 A JP H07182342A
Authority
JP
Japan
Prior art keywords
list
noun
sentence
dictionary
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5328893A
Other languages
English (en)
Inventor
Hidezo Kugimiya
秀造 釘宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5328893A priority Critical patent/JPH07182342A/ja
Publication of JPH07182342A publication Critical patent/JPH07182342A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 入力文から、特定の文法規則に基づく構造を
持つ名詞句のリストを作成することができる機械翻訳装
置の提供。リストを参照することによりユーザ辞書への
登録を容易にする。 【構成】 抽出される名詞句の構成が抽出指定バッファ
14に記憶される。CPU1により、入力文から、抽出
指定バッファ14に記憶された構成の名詞句が抽出さ
れ、抽出された名詞句からなるリストが作成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力文に対し、解析・
変換・生成等の処理を行って翻訳文を出力する機械翻訳
装置に関するものである。
【0002】
【従来の技術】従来の機械翻訳装置においては、翻訳用
の辞書を用いて入力文の構文を解析し、目的の言語の構
文構造に変換した後、得られた構文構造に従って訳語を
生成することにより翻訳文を得ている。
【0003】このような機械翻訳装置では、入力文の全
てを目的とする言語に翻訳してしまうため、ある特定の
分野においてのみ使われる専門用語などが入力文中にあ
る場合、それら専門用語を翻訳すると返って翻訳文の意
味が読み取りにくくなって有効な翻訳処理が実現できな
かった。
【0004】例えば、英語文から日本語文への翻訳にお
いて、複合名詞句の構造を持つ専門用語 "gearbox modu
le" を、それを構成する個々の名詞“gearbox"と "modu
le"に分割してそれぞれを日本語に翻訳した結果、分か
りにくい翻訳文( 例えば「ギアボックス構成要素」) を
出力することがあった。
【0005】この問題を解決するため、入力文中の特定
の文法構造をもつ部分を原文のまま出力することを可能
にした機械翻訳装置(特開平3−222065号公報)
が提案されている。
【0006】
【発明が解決しようとする課題】ところが、この機械翻
訳装置によれば、従来に比べて分かり易い翻訳文を出力
することが可能であるが、入力文中の特定の文法構造を
もつ部分は原文のままであるため、出力されたものは翻
訳文としては不完全なものであるという問題点を有して
いる。
【0007】そこで、この特定の文法構造をもつ部分を
目的言語に翻訳して出力するためには、ユーザ辞書に登
録する必要がある。ユーザ辞書に登録する方法として
は、翻訳を行う際、登録の必要な単語が現れるたびに1
つずつ登録していく方法と、翻訳実行時には登録が必要
な単語の見出しリストだけを作成しておき、後でまとめ
て登録する方法とがある。このうち、後者の方法の方が
ユーザの作業効率が良いと考えられる。
【0008】本発明は、上記問題点に鑑み、入力文から
特定の文法規則に基づく構造を持つ部分を自動的に抽出
し、抽出された部分をユーザ辞書に登録するための見出
しリストを作成することができる機械翻訳装置を提供す
ることを目的としている。
【0009】
【課題を解決するための手段】本発明の請求項1に記載
の機械翻訳装置は上記課題を解決するために、入力文に
対し、解析・変換・訳語生成を行なうことにより翻訳文
を出力する機械翻訳装置において、抽出される名詞句の
構成が記憶される記憶手段、例えばメモリと、入力文の
解析時に上記記憶手段に記憶された構成の名詞句を抽出
して、抽出された名詞句からなるリストを作成するリス
ト作成手段と、作成されたリストが記憶されるリスト記
憶手段とを有することを特徴としている。
【0010】本発明の請求項2に記載の機械翻訳装置
は、請求項1の構成に加えて、上記抽出される名詞句の
構成がユーザにより指定される名詞句指定手段を有して
いることを特徴としている。
【0011】また、本発明の請求項3に記載の機械翻訳
装置は、請求項1の構成に加えて、作成されたリストの
内容を、所定の規則に基づき並べ換えると共に重複する
ものは1つにする整理手段を有することを特徴としてい
る。
【0012】
【作用】上記の構成により、機械翻訳装置に入力された
入力文は、まず解析が行なわれる。この解析時に、記憶
手段に記憶された構成を有する名詞句が、リスト作成手
段により抽出され、抽出された名詞句からなるリストが
作成される。作成されたリストはリスト記憶手段に記憶
され、必要に応じて出力される。
【0013】このリストを参照することにより、ユーザ
はリストに挙げられた名詞句の訳をユーザ辞書に登録す
ることができる。
【0014】一方、解析後の入力文に対し変換・訳語生
成が行なわれ、入力文に対応する翻訳文が出力される。
【0015】また、上記の抽出される名詞句の構成は、
名詞句指定手段によりユーザから指定されるように構成
してもよい。これにより、入力文に応じた名詞句のリス
トが作成され、ユーザの用途に応じた翻訳結果が得られ
る。
【0016】さらに、作成されたリストの内容は、整理
手段により所定の規則に基づき並べ換えられると共に重
複するものは1つにするように構成されているので、見
やすいリストになると共に、ユーザ辞書に重複して登録
されることがなくなる。
【0017】
【実施例】本発明の一実施例について図1ないし図4に
基づいて説明すれば、以下の通りである。尚、本発明は
この実施例に限られるものではない。
【0018】本実施例に係る機械翻訳装置は、図1に示
すように、翻訳処理を行う中央処理装置(CPU)1
と、各種処理のためのプログラム等が格納されるプログ
ラムメモリ2と、入出力文を記憶したり各種レジスタメ
モリとして利用されるバッファメモリ7と、入出力文及
びユーザへの提示等の表示を行うCRT表示装置3と、
入力文の入力および各種制御を行うためのキーボード4
と、入力文(原文)の出力文(翻訳文)への翻訳を実行
する翻訳モジュール5とを備えており、該翻訳モジュー
ル5には、翻訳のための各種規則と辞書が記録された辞
書・規則メモリ6が接続されている。また、上記各構成
要素はデータバス、アドレスバス及び制御バスからなる
バス(共通母線)8により相互に接続されている。尚、
上記CPU1はリスト作成手段及び名詞句指定手段の役
割を有している。
【0019】次に、上記翻訳モジュール5の具体的な構
成を説明する。
【0020】翻訳モジュール5は、図2に示すように、
入力文に使用されている言語であるソース言語が入力さ
れる辞書引き形態素解析部9、並びに辞書引き形態素解
析部9から順次接続されている構文解析部10、変換部
11、及び出力文に使用される言語であるターゲット言
語を生成する生成部12の4部分からなる。
【0021】辞書引き形態素解析部9では、入力文は各
形態素(単語列)に分割され、辞書引きが行なわれると
共に、各単語に対する品詞などの文法情報及び訳語が得
られ、更に時制・人称・数なども解析される。
【0022】構文解析部10では、後述するように単語
間の係受けなどの文章の構造(構造解析木)が決定され
る。
【0023】変換部11では、構文解析部10で得られ
た文章構造がターゲット言語の文章構造に変換される。
【0024】生成部12では、変換部11で得られた文
章構造に従って訳文を生成する。
【0025】表1は、本実施例で解析に用いる文法規則
の一部であり、この文法規則に対応する適用プログラム
との関係を示している。これは、前記辞書・規則メモリ
6の中に記憶されている各種規則類の中の1つである。
【0026】
【表1】
【0027】表中、(a)は、文は名詞句と動詞句とか
らできていることを表す。(b)は、名詞句は冠詞と名
詞句1とからできていることを表す。(c)は、名詞句
は冠詞と名詞とからできていることを表す。(d)は、
動詞句は動詞と名詞句からできていることを表す。
(e)は、名詞句1は名詞と名詞からできていることを
表す。(f)は、名詞句1は名詞と名詞と名詞とからで
きていることを表す。(g)は、名詞句1は形容詞と名
詞からできていることを表す。これら、各文法規則に対
応して適用プログラム(a)〜(g)が設定されてい
る。
【0028】以下、図4のフローチャートを参照して、
本発明の具体的な処理動作を説明する。
【0029】まず、例えば英語文から日本語文に翻訳す
る場合において、入力文として、 The system requires a gearbox module. が入力されたものと仮定する。
【0030】ここで、ユーザは前記表1に記載されてい
る文法規則を参照して複合名詞自動抽出処理を行うか否
かを、キーボード4に含まれている機能キー等を用いて
指定する。この情報はバッファメモリ7内の抽出モード
フラグ13に0(複合名詞自動抽出を行なわない)又は
1(複合名詞自動抽出を行なう)の値として蓄えられ
る。
【0031】先ず、ユーザが複合名詞自動抽出処理を指
定すると(S1)、次に、ユーザは自動抽出を行なう複
合名詞のタイプをキーボード4の機能キー等で指定する
(S2)。これは、予め決められた自動抽出の対象とな
る複合名詞のタイプから選択するものであり、例えばタ
イプ1は名詞が3個以上連続する名詞句を自動抽出、タ
イプ2は名詞が2個以上連続する名詞句を自動抽出、タ
イプ3は名詞が2個以上連続する名詞句の他に形容詞+
1個以上の名詞からなる名詞句も自動抽出する、などと
設定している。
【0032】ユーザが指定したタイプはバッファメモリ
7の抽出指定バッファ14(記憶手段)に、1、2、3
…といった値で蓄えられる。
【0033】なお、ここでは自動抽出の対象となる複合
名詞のタイプをユーザが指定することとしたが、ユーザ
が指定しない場合は、例えば、タイプ2の複合名詞を自
動抽出の対象として処理を行なうように設定しておくよ
うな実現方法も可能である。
【0034】入力された原文は、プログラムメモリ2に
格納されている入力プログラムによりバッファメモリ7
内の所定の領域に記憶された後(S3)、辞書引き形態
素解析部9において、辞書・規則メモリ6を用いて辞書
引き、形態素解析が行なわれる(S4)。これにより、
原文に対し次の表2に示すような、単語、品詞及び訳語
に関する辞書引き情報が導入される。
【0035】
【表2】
【0036】次に、構文解析部10において、表1の文
法規則を用いて構文解析が行なわれ、入力文に対して適
用すべき文法規則が調べられる(S5)。適用すべき文
法規則があればその文法規則が適用される(S6)。そ
して、文法規則の適用が成功したか否かが調べられ(S
7)、失敗した場合はS5へ戻って他に適用すべき文法
規則がないかどうかが調べられる。成功した場合は部分
木構造が作られる(S8)。
【0037】例えば、入力文の"The system"の部分は、 文法規則(c) : 名詞句→冠詞+名詞 が適用されて名詞句にまとまり、 また、"a gearbox module"の部分は、 文法規則(e) : 名詞句1→名詞+名詞 文法規則(b) : 名詞句→冠詞+名詞句1 が適用されて名詞句にまとまる。
【0038】部分木構造が作成されると、S8で求めた
文法規則に対応する適用プログラムが励起される(S
9)。
【0039】例えば、文法規則(e) が適用されるとき
は、対応する適用プログラム(e) が励起される。プログ
ラム(e) は、S2で指定された抽出指定バッファ14
の、自動抽出の対象となっている複合名詞のタイプの値
を調べ、複合名詞のタイプが2(連続する2個以上の名
詞からなる名詞句を自動抽出する)または3(連続する
2個以上の名詞からなる名詞句、及び、形容詞+連続す
る1個以上の名詞からなる名詞句を自動抽出する)であ
れば、文法規則(e) の右辺にある2つの名詞をバッファ
メモリ7の見出しリスト15(リスト記憶手段)に格納
する。すなわち、図4の"gearbox" と"module"の2つの
単語を見出しリスト15に格納する。適用プログラム
(e) は、例えば、自動抽出対象の複合名詞のタイプが1
(連続する3個以上の名詞からなる名詞句を自動抽出す
る)の場合はどの単語も見出しリストに格納しない。
【0040】S5からS9までの処理が、適用すべき規
則がなくなるまで繰り返される。
【0041】このようにして構文解析が終了すると図3
に示すような解析結果の構造が得られ、同時に、次の表
3に示すような見出しリストが得られる。
【0042】
【表3】
【0043】適用すべき規則がなくなると、構文解析が
成功したか否かが調べられる(S10)。構文解析が成
功したかどうかは、図3に示すような一文全体が文の木
構造になるかどうかで判断される。
【0044】S10で構文解析が成功したと判断された
場合は、生成部12において訳語生成が行なわれる(S
11)。即ち、上記の例では「システムは、ギアボック
ス構成要素を必要とする。」という訳文が生成される。
【0045】さらに、他に文がないかどうかが調べられ
(S13)、入力文があればS3へ戻る。
【0046】一方、S10において構文解析が失敗した
場合は、失敗したことを表示し、作成された部分木構造
の範囲内で訳文生成を行なう、エラー処理が行なわれた
(S12)後、S13へ進む。
【0047】S13において他に入力文がなければ、整
理手段であるCPU1により見出しリストのソート/マ
ージ処理を行なう(S14)。つまり、見出しリストの
内容を見出しのアルファベット順に並べ替え、同一見出
しが複数個ある場合は1つだけを残して他は削除する。
これにより見出しリストの内容が整理され、効率のよい
ものとなる。こうして全処理を終了する。
【0048】この後、ユーザは作成された見出しリスト
を参照して、見出しリスト中の必要な名詞句に対し適切
な訳のユーザ辞書登録を行なう。その結果、例えば前記
例文は、「システムは、ギアボックスモジュールを必要
とする。」という正しい訳文に翻訳されるようになる。
【0049】以上のように、本発明によれば、入力文の
構文解析時に所定の文法規則が適用されたとき、その文
法規則に対応して設けられた適用プログラムにより、入
力文における特定の構造の複合名詞を自動的に抽出し
て、抽出された複合名詞の見出しリストを作成すること
ができる。従って、この見出しリストを参照してユーザ
は容易にユーザ辞書登録を行なうことができる。
【0050】また、抽出される複合名詞のタイプを予め
ユーザが指定することができるので、ユーザの用途に応
じた抽出が行なえる。
【0051】更に、自動抽出を行なうか否かを予め設定
できるので、ユーザ辞書登録を行なう必要のない場合な
ど、見出しリストを作成することなく翻訳が行なわれる
ので、ユーザの用途に合わせて装置の効率的な使用が可
能になる。
【0052】
【発明の効果】本発明の機械翻訳装置は、以上のよう
に、抽出される名詞句の構成が記憶される記憶手段と、
入力文の解析時に上記記憶手段に記憶された構成の名詞
句を抽出して、抽出された名詞句からなるリストを作成
するリスト作成手段と、作成されたリストが記憶される
リスト記憶手段とを有する構成である。
【0053】それゆえ、リスト作成手段によって特定の
構成を有する名詞句のリストが作成されるので、ユーザ
は必要に応じこれらの名詞句の訳語をユーザ辞書に登録
することができる。従って、特定分野において用いられ
る専門用語等のユーザ辞書への登録が簡単に行なえるの
で、良質の翻訳文が得られると共に使い勝手のよい装置
が得られるという効果を奏する。
【0054】また、本発明の機械翻訳装置は更に、抽出
される名詞句の構成がユーザにより指定される名詞句指
定手段を有している。これにより、上記効果に加えて入
力文に応じた名詞句のリストが作成され、ユーザの用途
に応じた翻訳結果が得られるという効果を奏する。
【0055】さらに、本発明の機械翻訳装置は、作成さ
れたリストの内容を所定の規則に基づき並べ換えると共
に、重複するものは1つにする整理手段を有している。
それゆえ、リストが見やすいものになると共に、リスト
に挙げられた名詞句がユーザ辞書に重複して登録される
ことがなくなるという効果も併せて奏する。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の構成を示すブロック図
である。
【図2】翻訳モジュールの構成を示すブロック図であ
る。
【図3】実施例における例文の構造解析木を示す説明図
である。
【図4】本発明の翻訳処理手順を示すフローチャートで
ある。
【符号の説明】
1 CPU(リスト作成手段、名詞句指定手段、整理
手段) 2 プログラムメモリ 5 翻訳モジュール 6 辞書・規則メモリ 7 バッファメモリ 13 抽出モードフラグ 14 抽出指定バッファ(記憶手段) 15 見出しリスト(リスト記憶手段)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力文に対し、解析・変換・訳語生成を行
    なうことにより翻訳文を出力する機械翻訳装置におい
    て、 抽出される名詞句の構成が記憶される記憶手段と、 入力文の解析時に上記記憶手段に記憶された構成の名詞
    句を抽出して、抽出された名詞句からなるリストを作成
    するリスト作成手段と、 作成されたリストが記憶されるリスト記憶手段とを有す
    ることを特徴とする機械翻訳装置。
  2. 【請求項2】上記抽出される名詞句の構成がユーザによ
    り指定される名詞句指定手段を有していることを特徴と
    する請求項1記載の機械翻訳装置。
  3. 【請求項3】作成されたリストの内容を、所定の規則に
    基づき並べ換えると共に重複するものは1つにする整理
    手段を有することを特徴とする請求項1記載の機械翻訳
    装置。
JP5328893A 1993-12-24 1993-12-24 機械翻訳装置 Pending JPH07182342A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5328893A JPH07182342A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5328893A JPH07182342A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07182342A true JPH07182342A (ja) 1995-07-21

Family

ID=18215277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5328893A Pending JPH07182342A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07182342A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475005B2 (en) 2003-03-17 2009-01-06 International Business Machines Corporation Translation system, dictionary updating server, translation method, and program and recording medium for use therein

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475005B2 (en) 2003-03-17 2009-01-06 International Business Machines Corporation Translation system, dictionary updating server, translation method, and program and recording medium for use therein

Similar Documents

Publication Publication Date Title
US5644774A (en) Machine translation system having idiom processing function
JP3220560B2 (ja) 機械翻訳装置
JP2892548B2 (ja) 自動翻訳装置
US4833611A (en) Machine translation system
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
EP0357344B1 (en) Computer assisted language translating machine
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0351022B2 (ja)
JPH0332106B2 (ja)
JPH07182342A (ja) 機械翻訳装置
JPS6190269A (ja) 翻訳方式
JPS6337471A (ja) 翻訳方法及び装置
JP2715419B2 (ja) 翻訳装置
JPS62163174A (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP2871300B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JPH05225232A (ja) テキスト自動前編集装置
JPS63136265A (ja) 機械翻訳装置
JPH0635964A (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH04296969A (ja) 機械翻訳装置
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH0822468A (ja) 機械翻訳装置
JPH09204429A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 12

Free format text: PAYMENT UNTIL: 20080725

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 13

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 13

Free format text: PAYMENT UNTIL: 20090725

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 14

Free format text: PAYMENT UNTIL: 20100725

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100725

Year of fee payment: 14

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 15

Free format text: PAYMENT UNTIL: 20110725

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 16

LAPS Cancellation because of no payment of annual fees