JP3038079B2 - 自動翻訳装置 - Google Patents

自動翻訳装置

Info

Publication number
JP3038079B2
JP3038079B2 JP4109695A JP10969592A JP3038079B2 JP 3038079 B2 JP3038079 B2 JP 3038079B2 JP 4109695 A JP4109695 A JP 4109695A JP 10969592 A JP10969592 A JP 10969592A JP 3038079 B2 JP3038079 B2 JP 3038079B2
Authority
JP
Japan
Prior art keywords
translation
word
storage means
auxiliary verb
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4109695A
Other languages
English (en)
Other versions
JPH05303590A (ja
Inventor
徳行 平井
秀造 釘宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4109695A priority Critical patent/JP3038079B2/ja
Priority to US08/051,874 priority patent/US5373441A/en
Publication of JPH05303590A publication Critical patent/JPH05303590A/ja
Application granted granted Critical
Publication of JP3038079B2 publication Critical patent/JP3038079B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/02Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
    • G06F15/025Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application
    • G06F15/0283Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application for data storage and retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は言語を自動的に翻訳す
るための装置に関する。
【0002】
【従来の技術】一般的に自動翻訳装置においては、ソー
ス言語(たとえば英語)で書かれたソーステキストを読
込み、形態素解析を行なった上、翻訳用の辞書を引い
て、各単語に対する品詞などの文法情報およびターゲッ
ト言語の対応する訳語を得、時制・人称・数などを解析
する処理がまず行なわれる。この後形態素解析の結果
と、そのソース言語について予め用意された規則とを用
いてソース言語の内部構造を得、このソース言語の内部
構造を変換規則を用いてターゲット言語の内部構造に変
換する。変換された内部構造に従い、形態素解析の際の
辞書引き処理によって得られた訳語などを用いてターゲ
ット言語の翻訳文が生成される。
【0003】適切なターゲット言語の翻訳を得るために
は、ターゲット言語の訳語を適切に選ぶことが重要であ
る。このような訳語の選択について、従来から次のよう
な問題点が指摘されている。
【0004】たとえば英語においては、助動詞について
次のような問題点がある。助動詞の場合には、動詞や名
詞など他の品詞と異なり、使用されている周囲の条件に
より訳語が変化することが多い。周囲の条件とはたとえ
ば、その単語を含む文が肯定文であるか否定文である
か、あるいは平叙文であるか疑問文であるかという文の
種類なを意味する。このように助動詞の場合には周囲の
条件により訳文が変化するために、単純な訳語設定では
副作用が大きく、適切な翻訳を得ることは難しい。たと
えば「may 」のみならば「〜するかもしれない」と訳せ
ばよいのに対し、「may not」の場合には「〜してはい
けない」と訳さなければならない。そのため、英語の助
動詞には単純に訳語を設定して翻訳すると適切な結果が
得られない。
【0005】このような問題点を解決するために、訳語
に対して予め優先順位を割当て、訳出の場合にはこの優
先順位に従って複数の訳語を表示して、適切なものを操
作者によって選択させるものがあった。このような技術
の一例は特開昭61−90272号公報に開示されてい
る。
【0006】さらにこの技術を改良したものとして、操
作者の選択結果を学習して優先順位を逐次更新すること
により、表示される順序を、選択結果に応じて変えるも
のがあった。そのような技術はたとえば特開昭63−1
36265号公報に開示されている。
【0007】
【発明が解決しようとする課題】しかし、このように訳
語に対して優先順位を割当て、この優先順位に従って表
示または選択を行なう場合には、翻訳対象によっては表
示される訳語の順序や、選択結果が妥当なものとならな
い場合がある。
【0008】たとえば英語の助動詞「shall 」について
考えると、肯定・平叙文で主語が一人称の場合には「〜
するだろう」、それ以外の場合には「〜することになっ
ている」などと訳出される。しかし特許関連の文献を翻
訳する場合には、この助動詞「shall 」については「〜
すべき」と訳出した方が良い場合がほとんどである。そ
の反面、通常の文献では前述のように訳す方が適切な場
合が多い。
【0009】これに対して従来装置のように優先順位を
各訳語に固定的に割当てる場合には、この助動詞が出現
するたびに適切な訳語を操作者が指定して置換える必要
がある。また選択結果を学習し、その結果に従って訳語
の表示順序を変える場合にも、少なくとも特許関連の文
献などの特殊な分野の文献を翻訳する場合には、何回か
の選択作業を行なわなければ学習結果が反映されず、そ
れまでは選択作業を行なわなければならないという問題
点があった。また、特許関係の文献の翻訳の際に得られ
た学習結果も、他の分野の文献の翻訳を行なったり、装
置の電源を切断したりすることによって失われてしま
い、次回、この特許関係など特殊な分野の文献の翻訳を
行なう場合には、改めて適切な訳語の指定を行なわなけ
ればならないという問題点があった。
【0010】それゆえに請求項1に記載の発明の目的
は、助動詞という、その使用される文の種類によって訳
語を変化させなければならない単語を含むソーステキス
トの翻訳をより適切に行なうことができる自動翻訳装置
を提供することである。
【0011】請求項2に記載の発明の目的は、助動詞と
いう、その使用される文の種類によって訳語を変化させ
なければならない単語を含む、同一分野又は同一傾向の
ソーステキストの翻訳を、より容易かつより適切に行な
うことができる自動翻訳装置を提供することである。
【0012】請求項3に記載の発明の目的は、助動詞と
いう、その使用される文の種類によって訳語を変化させ
なければならない単語を含む、複数の分野または複数種
類の傾向のソーステキストの翻訳を、より容易かつより
適切に行なうことができる自動翻訳装置を提供すること
である。
【0013】
【課題を解決するための手段】請求項1に記載の自動翻
訳装置は、各々が、ソース言語の助動詞と、助動詞が出
現する文の種類と、文の種類に対して助動詞が訳出され
るターゲット言語の訳語とからなる、複数個の訳出組合
わせを入力するための手操作可能な入力手段と、入力手
段により入力される訳出組合わせを記憶するための記憶
手段と、各々が、ソース言語の見出し単語と、見出し単
語が一般的に訳出されるターゲット言語の一般的訳語と
を含む複数個の見出し組を含む、機械可読な形式で予め
準備された翻訳用辞書と、処理対象のソーステキストを
順次読込み、記憶手段を参照して、ソーステキストの各
単語と、ソーステキストの文の種類とが、記憶手段に記
憶された訳出組合わせのいずれかに含まれる助動詞及び
文の種類に一致するか否かを検出するための検出手段
と、検出手段により一致が検出された単語は、一致が検
出された訳出組合わせに含まれる訳語によって訳出し、
一致が検出されない単語は、翻訳用辞書を参照して対応
の見出し組に含まれる一般的訳語に訳出するための訳出
手段とを含む。
【0014】請求項2に記載の自動翻訳装置は、請求項
1に記載の装置であって、各々が複数個の訳出組合わせ
を個別にに記憶するための複数個の不揮発性記憶手段を
含む。
【0015】さらに請求項3に記載の自動翻訳装置は、
入力手段を用いて操作者により入力される各訳出組合わ
せを、複数個の不揮発性記憶手段のいずれかに、操作者
の指示に応答して選択的に格納するための選択的格納手
段と、検出手段が参照する記憶手段を、複数個の不揮発
性記憶手段のいずれから選択するかを指定するための選
択手段とを含む。
【0016】
【作用】請求項1に記載の自動翻訳装置では、入力手段
により入力された訳出組合わせが記憶手段に格納され
る。ソーステキストの翻訳時、ソーステキストに含まれ
る各助動詞につき、その出現する文の種類を含めて記憶
手段に訳出組合わせとして格納されているか否かが検出
手段により検出される。格納されている場合にはその訳
出組合わせに含まれる訳語によって訳出がされ、格納さ
れていない場合には翻訳用辞書に含まれる一般的訳語に
よって訳出がされる。
【0017】請求項2に記載の自動翻訳装置では、記憶
手段が不揮発性記憶手段を含むために、一旦入力された
訳出用組合わせは自動翻訳装置の電源が一旦切断された
後でも失われない。したがって、同一分野または同一傾
向のソーステキストを翻訳する際に、改めて訳出組合わ
せを入力する必要はない。
【0018】請求項3に記載の自動翻訳装置では、記憶
手段は複数個の不揮発性記憶手段を含む。入力手段によ
って入力される訳出組合わせは、選択的格納手段によっ
て予め指定された特定の不揮発性記憶手段に格納され
る。そして翻訳時には、選択手段により選択された特定
の不揮発性記憶手段が翻訳用辞書に先立って参照されて
ソーステキストの所定の品詞の各単語のターゲット言語
への訳出が行なわれる。
【0019】
【実施例】以下、本発明を、一実施例に基づいて詳細に
説明する。なお、以下の実施例では英語から日本語への
機械翻訳について説明するが、本発明はこれに限定され
るわけではなく、日本語から英語、あるいは英語以外の
言語と日本語との相互の翻訳、あるいは日本語以外の言
語間の相互の翻訳にも同様に適用できる。
【0020】図1は、本発明の一実施例に係る機械翻訳
装置のブロック図である。図1を参照して、この機械翻
訳装置は、翻訳ユーザインタフェースモジュール1と、
翻訳モジュール2と、翻訳用の辞書、文法規則、木構造
変換規則テーブルなどを格納した辞書・規則3と、翻訳
用メモリ4と、翻訳ユーザインタフェースモジュール1
に接続されたCRT(陰極線表示管)5およびキーボー
ド6と、翻訳ユーザインタフェースモジュール1に接続
された文書ファイル8と、翻訳ユーザインタフェースモ
ジュール1に接続されたプリンタ7とを含む。
【0021】図2を参照して、翻訳ユーザインタフェー
スモジュール1は、主としてキーボード6を介して行な
われるユーザによるキー入力などからなる外部からの要
求を読取り、以下に説明する各モジュールを呼出すため
のコントロール部9を含む。翻訳ユーザインタフェース
モジュール1はさらに、いずれもコントロール部9に接
続された翻訳部10と、ソース言語エディタ11と、タ
ーゲット言語エディタ12と、文書入出力モジュール1
3と、環境設定モジュール14と、助動詞訳設定モジュ
ール15と、学習モジュール16と、オプション辞書選
択モジュール17と、辞書メンテナンスモジュール18
と、原文チェックモジュール19と、印字モジュール2
0とを含む。
【0022】図1に示される翻訳モジュール2は、図1
のメモリ4に格納された原文21を読込み、辞書引き・
形態素解析を行なうための辞書引き・形態素解析部22
と、辞書引き・形態素解析部22の処理結果に基づいて
構文解析を行ない、ソース言語による原文21の内部構
造(木構造など)を得るための構文解析部23と、得ら
れた内部構造を、辞書・規則3(図1参照)に含まれる
木構造変換規則テーブルを参照してターゲット言語の内
部構造に変換するための変換部24と、変換されたター
ゲット言語の内部構造に基づいて、ターゲット言語の翻
訳文26を生成するための生成部25とを含む。
【0023】再び図1を参照して、キーボード6は、ユ
ーザの手操作に従って翻訳ユーザインタフェースモジュ
ール1に対して様々なコマンドや、辞書・規則3のメン
テナンスのための情報などを与えるためのものである。
辞書・規則3は、前述のように翻訳用の辞書・文法規
則、木構造変換規則テーブルなどを格納するためのもの
である。辞書・規則3に含まれる辞書としては、ユーザ
辞書・専門辞書・学習辞書などがあり、これらの辞書の
オプションを選択するための処理は図2に示されるオプ
ション辞書選択モジュール17によって行なわれる。ま
たこれら各辞書の見出しの登録・削除などの辞書メンテ
ナンスは、図2に示される辞書メンテナンスモジュール
18によって行なわれる。
【0024】図2を参照して、翻訳部10は、図1に示
される翻訳モジュール2を呼出すためのものである。文
書ファイル入出力モジュール13は、図1に示される文
書ファイル8との間で原文、翻訳文の入出力を行なうた
めのものである。学習モジュール16、辞書メンテナン
スモジュール18は、辞書・規則3に含まれる各辞書を
操作するためのものである。図1に示されるメモリ4上
には、英語の助動詞につき、その出現する環境に応じて
どのような日本語の訳語をあてるかを示す情報を格納す
るための内部バッファが確保される。そして、図2に示
される助動詞訳設定モジュール15は、図1に示される
キーボード6およびCRT5を利用してユーザが利用し
たこの原語の単語、その出現条件、訳語の組合わせをこ
の内部バッファに記憶させるためのものである。
【0025】この機械翻訳装置は、概略以下のように動
作する。まず、英語の各助動詞につき、それらがどのよ
うな条件で出現するかに応じ、どのような訳語を割当て
るかを指定するための、助動詞訳設定モジュール15の
動作につき図4を参照して説明する。
【0026】まず助動詞の訳し分けに必要な条件につき
説明する。本実施例では、条件1として肯定/否定、条
件2として平叙/疑問を設け、この2種類の条件によっ
て出現条件を分類し、訳語の選択をしている。1つの助
動詞の出現条件は、(肯定・平叙)、(肯定・疑問)、
(否定・平叙)、(否定・疑問)の4つの場合に分類さ
れる。
【0027】本実施例では、各助動詞ごとに、上述の4
種類の条件に対して1つの訳語を指定するようにした。
そして、各々の助動詞と条件との組に対して1つの訳語
を収めるためのバッファを、図1に示されるメモリ4上
に用意した。
【0028】メモリ4上に用意された内部バッファのデ
ータ構造は次の表1に示されるようなものである。
【0029】
【表1】
【0030】表1中で、アルファベットの大文字で表わ
した語は、内部バッファ自体に特定の訳語が記憶されて
いるわけではなく、このアルファベット大文字で示され
るフラグに従い、予め定められた処理をすることが定め
られていることを示す。ここでは、フラグ「SYSTE
DEPEND」は「システムの訳し分けに従う」を
示す。すなわち、このフラグが入っている場合には従来
と同じ処理を行なう。またフラグ「YAKUSHUTU
SINAI」の場合には、「この助動詞の訳を出さな
い」ということを示す。すなわち、対応する訳語をNU
LL文字列として生成することを示す。
【0031】図4を参照して、訳出組合わせ(助動詞・
条件・訳語)は、次のようにしてユーザによって指定さ
れる。
【0032】まずステップ27で、いずれの助動詞につ
いてその訳語を設定するかにつき、助動詞の選択をする
処理が行なわれる。このときの表示例が図6に示されて
いる。図6を参照して、この表示画面には、ソース言語
(本実施例の場合には英語)で使用されている助動詞の
一覧が、見出し40として表示される。ユーザは、指定
しようとする助動詞上にカーソルを合わせ、キーボード
のリターンキー(図示せず)を押圧する。これによりカ
ーソルが設定された助動詞が選択される。
【0033】続いて図4を参照して、ステップ28,2
9で、2つの条件(平叙/疑問)(否定/肯定)につい
ての指定が行なわれる。このときの表示画面は図7に示
されるようになる。図7を参照して、表示画面には、第
1の条件41と第2の条件42の組合わせが4通り示さ
れており、各組合わせに対して設定訳語43がそれぞれ
1つずつ表示されている。図7においては、表1の「訳
語」としてフラグ「SYSTEM DEPEND」が設
定されているものに対しては「システム設定訳語」と表
示され、フラグ「YAHUDHUTU SINAI」が
設定されているものには「<訳出しない>」が表示され
ている。そして、設定訳語のうちの、対応する条件の組
合わせに対応する部分にカーソルを設定してリターンキ
ーを押圧することにより条件の選択が終了する。図7に
示される例の場合には、条件として否定・平叙文が指定
されたことになる。
【0034】続いて再び図4を参照して、ステップ30
により、予めシステムで用意した訳語候補が表示され
る。このときの表示の様子は図8に示されている。図8
を参照して、表示画面には、指定された条件と現在の設
定訳語(現在の例の場合には「システム設定訳語」とな
っている)などを示す見出し44が表示され、その下方
にシステムで用意した訳語候補45が表示されている。
【0035】続いてステップ31で、ステップ30で表
示された訳語候補のうち、ユーザが希望する1つの訳語
を選択する処理が行なわれる。この選択は、図8に示さ
れる表示状態で、カーソルを選択訳語上に設定し、リタ
ーンキーを押圧することにより行なわれる。
【0036】再び図4を参照して、ステップ32で、選
択された助動詞と、その助動詞につき指定された出現条
件(上述の例では否定/平叙)と、選択された訳語
(「べきでない」)が、1つの訳出組合わせとして助動
詞訳設定用バッファにセットされる。このステップ32
の処理が行なわれることにより、1つの助動詞について
訳語を設定する処理が終了する。設定の結果表示は図9
に示される様になり、「否定/平叙文」についての設定
訳語が「べきでない」と表示される。
【0037】以上のステップ27〜32の処理を、訳語
を設定しようとする助動詞およびその出現条件のすべて
について行なうことにより、助動詞訳設定用バッファが
完成する。この助動詞訳設定用バッファを用いて、実際
の翻訳が以下のように行なわれる。
【0038】図3を参照して、まず原文21(図1の文
書ファイル8から読出され、メモリ4に格納されてい
る)は、辞書引き・形態素解析部22によって形態素解
析が行なわれる。すなわち、図1の辞書・規則3に含ま
れる翻訳用辞書を引き、原文21に含まれる各単語に対
し、品詞などの文法情報や訳語を得、時制・人称・数な
どを解析する処理が行なわれる。
【0039】続いて構文解析部23により、辞書引き・
形態素解析部22の出力と、辞書・規則3(図1参照)
に含まれる文法規則とを用いて、ソース言語の内部構造
が得られる。
【0040】そして図3の変換部24は、構文解析部2
3によって得られたソース言語の内部構造を、辞書・規
則3(図1参照)に含まれる木構造変換規則テーブルを
参照しながらターゲット言語の内部構造に変換して生成
部25に与える。
【0041】生成部25は、辞書・規則3(図1参照)
に含まれるターゲット言語生成用の基本辞書と、図1の
メモリ4に準備された、本発明の特徴である助動詞訳設
定用バッファとを参照しながら、ターゲット言語の内部
構造から、各単語に訳語を割当てて翻訳文26を生成す
る。このときの訳語の選択に、本発明の特徴がある。以
下、図5を参照して訳語の割当てについての処理を説明
する。なお、説明の簡単化のために、以下の説明では、
翻訳対象とれなっている単語が助動詞であることは既に
判明しているものとし、その単語につきどのような訳語
を割当てるかについての処理のみ説明する。
【0042】図5を参照して、まずステップ33で、処
理対象となっている助動詞を特定する処理が行なわれ
る。
【0043】続いてステップ34で、解析中の文の用法
を参照する。すなわち、処理対象となっている助動詞が
出現している文が肯定か否定か(条件1)、平叙文か疑
問文か(条件2)が調べられる。
【0044】ステップ35で、ステップ33、34によ
って特定された助動詞および出現条件に当てはまる訳出
の組合わせが、助動詞訳設定用バッファに存在するかど
うかを調べるために、助動詞訳設定用バッファを参照す
る処理が行なわれる。
【0045】ステップ36では、ステップ35の参照処
理の結果、該当する助動詞および条件に対し、その訳語
が設定されているか否かについての判断が行なわれる。
設定されている場合にはステップ37でその訳出組合わ
せから訳語を取出す処理が行なわれ、設定されていない
場合にはステップ38で、基本辞書から訳語を取出して
割当てる処理がそれぞれ行なわれる。
【0046】ステップ39で、翻訳文生成用のバッファ
に、ステップ37または38で取出された訳語を設定す
る処理が行なわれる。
【0047】このように英語における助動詞につき、そ
の出現条件に合わせて訳語をユーザが予め設定しておく
と、以下のような翻訳を行なうことができる。まず、
「shall 」という訳語に対し、基本辞書のシステム設定
訳語が「〜ことになっている」となっているものとす
る。これを前述のように「否定/平叙」の場合には「〜
べきでない」と訳するように設定したものとする。そし
て、以下の英文を翻訳する場合を考える。
【0048】You shall not copy this software. これをシステム設定訳語を用いて翻訳すれば「あなた
は、このソフトウェアをコピーしないことになっていま
す。」と訳されてしまい、原文の意味が正確には翻訳文
には表わされていない。これに対し、助動詞訳設定用バ
ッファにセットされた訳出組合わせてを用いれば、上述
の英文は「あなたは、このソフトウェアをコピーするべ
きではありません。」と訳され、より原文の意味に近く
なる。このように、予め図4に示されるような処理をす
ることによって助動詞訳設定用バッファに助動詞と、そ
の出現条件と、その出現条件を満足したときに割当てら
れる訳語とからなる訳出組合わせを準備しておくことに
より、原文に含まれる助動詞に対し、ユーザの指定した
訳出を行なうことができる。したがってユーザの指定
を、分野によって適した訳が行なわれるように予め準備
しておくことにより、特定の分野、傾向の文献をより適
切に翻訳することが可能となる。
【0049】なお、上述の説明ではユーザによる助動詞
訳語の設定は、メモリ4上に準備された助動詞訳設定用
バッファに行なわれている。メモリ4がDRAM(Dyna
micRandom Access Memory)であれば、装置の電源を切
ることにより、バックアップがされていない限り助動詞
訳設定用バッファの内容は失われてしまう。そこで、辞
書・規則などが格納された記憶装置3にこの助動詞訳設
定用バッファの内容を保存しておき、翻訳モジュール2
を呼出す前にこの助動詞訳設定用バッファをメモリ4上
に読出しておけば、上述の説明の動作をそのまま行なう
ことができる。この場合、助動詞訳設定用バッファは、
メモリ4上の連続した領域にとることができる。なぜな
らば、このバッファは特定のデータ構造は持っている
が、その内部にはポインタなどによる別領域へのインデ
クスが含まれないからである。したがってこのバッファ
としては、具体的にはたとえば配列などを用いることが
できる。
【0050】このように助動詞訳設定用バッファを連続
領域とすることができるために、メモリ4と辞書・規則
を格納する記憶装置3との間のデータの受渡しの処理は
ブロック転送で行なうことができる。すなわち、助動詞
訳設定用バッファの内容の保存は、その構造を保持した
ままメモリ4から記憶装置3上のファイルにブロック転
送して書出すことによって行なわれる。また記憶装置3
からの読出は、ファイルから読出した内容をメモリ4上
に確保された助動詞訳設定用バッファエリアにブロック
転送してそのまま書込めばよい。ファイル内にはメモリ
上の構造がそのまま保存されているからである。
【0051】このような処理は、従来行なわれているフ
ァイルの取扱いの一般的処理をそのまま適用できる。
【0052】また、助動詞訳設定用バッファの構造をよ
り複雑とすることもできるし、ファイル内にはメモリと
別の構造でもって助動詞訳設定用のデータを保持するこ
とも考えられる。しかしこの場合にも、バッファの持つ
情報の訳出組合わせとして本質的なものは(助動詞、出
現条件、訳語)とからなる訳出組合わせである。この訳
出組合わせを復元可能な構造であれば、ファイルの保存
形式はどのようなものであってもよい。このようなメモ
リ・ファイル間のデータのやりとりは、たとえば既存の
エディタ、ワードプロセッサ、データベースなどで利用
されている技術を用いて容易に実現することができる。
【0053】また、記憶装置3には、助動詞訳設定用情
報のファイルを予め複数設けておくこともできる。各フ
ァイルには、ファイル登録時に、キーボードを用いその
内容に応じてユーザの指示した名前を付けて登録してお
く。各ファイルごとにその内容を別々に準備しておく。
そして、ファイルから助動詞訳設定用情報を読出すさい
に、これら複数のファイルのうちから最も適当なものを
選んで読出し、メモリ4に展開することができる。この
ように複数のファイルを設け、各ファイルごとに特定の
分野、傾向の文献を翻訳するために適切な訳出組合わせ
の組を保存しておくことにより、様々な分野、傾向の文
献につき、一般的な訳語を用いた場合と異なりより適切
な訳語を用いて翻訳をすることが可能となる。
【0054】ファイル名の指定は、ユーザがキーボード
6を用いて行なってもよいし、既にユーザ辞書が選択さ
れている場合には、このユーザ辞書に予め対応付けされ
たファイルの名前を自動的に指示するような選択方法も
可能である。これはたとえば、ユーザ辞書の名前に拡張
詞を付加することによって助動詞訳設定用ファイルの名
前とする、などの方法によって実現することができる。
【0055】なお、図10は、英語の代表的な3つの助
動詞「may ,can ,shall 」につき、上述の4つの場合
につき、どのような訳語を割当てるかを示す訳語候補の
一覧である。もちろん、図10に示されるのは一例にす
ぎず、これ以外にも各ユーザが経験に応じて適切な訳語
を設定していくことが可能である。
【0056】
【発明の効果】以上のように請求項1に記載の自動翻訳
装置では、ソーステキストの翻訳時、ソーステキストに
含まれる単語が、その出現する文の種類も含めて記憶手
段に訳出組合わせとして格納されているか否かが検出手
段により検出される。格納されている場合にはその訳出
組合わせに含まれる訳語によって訳出がされ、格納され
ていない場合には翻訳用辞書に含まれる一般的訳語によ
って訳出がされる。そのために、予め入力手段を用い
て、一般的訳語では不適当に訳出されると思われる助動
詞につき、その出現する文の種類およびその文書種類に
おいて最も適当と考えられる訳語とともに訳出組合わせ
として予め記憶手段に格納しておけば、翻訳用辞書のみ
を用いた場合よりもその訳出の単語を適切なものにする
ことができる。その結果、助動詞という、その使用され
文の種類によって訳語を変化させなければならない単
語を含むソーステキストの翻訳をより適切に行なうこと
ができる。
【0057】請求項2に記載の自動翻訳装置では、ソー
ステキストの翻訳時、ソーステキストに含まれる各単語
が、その出現する文の種類も含めて記憶手段に訳出組合
わせとして格納されているか否かが検出手段により検出
される。格納されている場合にはその訳出組合わせに含
まれる訳語によって訳出がされ、格納されていない場合
には翻訳用辞書に含まれる一般的訳語によって訳出がさ
れる。そのために、予め入力手段を用いて、一般的訳語
では不適当に訳出されると思われる助動詞につき、その
出現する文の種類およびその文の種類に照らして最も適
当と考えられる訳語とともに訳出組合わせとして予め記
憶手段に格納しておけば、翻訳用辞書のみを用いた場合
よりもその訳出の単語を適切なものにすることができ
る。さらに、同一分野または同一傾向のソーステキスト
を翻訳する際に、適当な訳出組合わせを改めて入力する
必要がなく、継続的に記憶手段の内容を保持し更新して
いくことができる。その結果、助動詞という、その使用
される文の種類によって訳語を変化させなければならな
い単語を含む、同一分野または同一傾向のソーステキス
トの翻訳を、より容易かつより適切に行なうことができ
る。
【0058】請求項3に記載の自動翻訳装置では、ソー
ステキストの翻訳時、ソーステキストに含まれる各単語
が、その出現する文の種類も含めて、選択された不揮発
性記憶手段に訳出組合わせとして格納されているか否か
が検出手段により検出される。格納されている場合には
その訳出組合わせに含まれる訳語によって訳出がされ、
格納されていない場合には翻訳用辞書に含まれる一般的
訳語によって訳出がされる。そのために、予め入力手段
を用いて、一般的訳語では不適当に訳出されると思われ
る助動詞につき、その出現する文の種類およびその文の
種類に照らして最も適当と考えられる訳語とともに訳出
組合わせとして予め様々の分野または傾向に対して複数
準備された不揮発性記憶手段に格納しておけば、翻訳用
辞書のみを用いた場合よりもその訳出の単語を適切なも
のにすることができる。さらに、同一分野または同一傾
向のソーステキストを翻訳する際に、対応する不揮発性
記憶状態を選択するだけでよく、適当な訳出組合わせを
改めて入力する必要がない。そのために、各不揮発性記
憶手段の格納内容を継続的に保持し更新していくことが
できる。その結果、助動詞という、その使用される文の
種類によって訳語を変化させなければならない単語を含
む、複数の分野または複数種類の傾向のソーステキスト
の翻訳を、より容易かつより適切に行なうことができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の機械翻訳装置のブロック図
である。
【図2】翻訳ユーザインタフェースモジュールのブロッ
ク図である。
【図3】翻訳モジュールのブロック図である。
【図4】助動詞訳設定用バッファ作成処理のフローチャ
ートである。
【図5】翻訳文生成の際の助動詞の訳語割当て処理を示
すフローチャートである。
【図6】助動詞選択画面を示す模式図である。
【図7】条件指定画面を示す模式図である。
【図8】訳語設定画面を示す模式図である。
【図9】訳語選択語の条件選択画面の模式図である。
【図10】英語における代表的な3つの助動詞と、その
出現条件とによって割当てられる訳語候補を示す模式図
である。
【符号の説明】
1 翻訳ユーザインタフェースモジュール 2 翻訳モジュール 3 不揮発性記憶装置 4 メモリ 6 キーボード 9 コントロール部 15 助動詞訳設定モジュール
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−219165(JP,A) 特開 昭63−49881(JP,A) 特開 平3−222069(JP,A) 特開 平3−222067(JP,A) 特開 平2−64767(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/28

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】各々が、ソース言語の助動詞と、助動詞が
    出願する文の種類と、各文の種類に対して前記助動詞が
    訳出されるターゲット言語の訳語とからなる、複数個の
    訳出組合わせを入力するための手操作可能な入力手段
    と、 前記入力手段により入力される訳出組合わせを記憶する
    ための記憶手段と、 各々が、前記ソース言語の見出し単語と、前記見出し単
    語が一般的に訳出されるターゲット言語の一般的訳語と
    を含む複数個の見出し組を含む、機会可読な形式で予め
    準備された翻訳用辞書と、 処理対象のソーステキストを順次読込み、前記記憶手段
    を参照して、前記処理対象のソーステキストの各単語
    と、前記処理対象のソーステキストの文の種類とが、前
    記記憶手段に記憶された訳出組合せわのいずれかに含ま
    れる助動詞及び文の種類に一致するか否かを検出するた
    めの検出手段と、 前記検出手段により一致が検出された単語は、一致が検
    出された前記訳出組合わせに含まれる前記訳語によって
    訳出し、一致が検出されない単語は、前記翻訳用辞書を
    参照して対応の見出し組に含まれる一般的訳文に訳出す
    るための訳出手段とを含む、自動翻訳装置。
  2. 【請求項2】前記記憶手段は、不揮発性記憶手段を含
    む、請求項1に記載の自動翻訳装置。
  3. 【請求項3】各々が複数個の前記訳出組合わせを個別に
    記憶するための複数個の前記不揮発性記憶手段と、 前記入力手段を用いて操作者により入力される各前記訳
    出組合わせを、前記複数個の不揮発性記憶手段のいずれ
    かに、操作者の指示に応答して選択的に格納するための
    選択的格納手段と、 前記検出手段が参照する前記記憶手段を、前記複数個の
    不揮発性記憶手段のいずれから選択するかを指定するた
    めの選択手段とをさらに含む、請求項2に記載の自動翻
    訳装置。
JP4109695A 1992-04-28 1992-04-28 自動翻訳装置 Expired - Fee Related JP3038079B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4109695A JP3038079B2 (ja) 1992-04-28 1992-04-28 自動翻訳装置
US08/051,874 US5373441A (en) 1992-04-28 1993-04-26 Automatic translating apparatus and a method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4109695A JP3038079B2 (ja) 1992-04-28 1992-04-28 自動翻訳装置

Publications (2)

Publication Number Publication Date
JPH05303590A JPH05303590A (ja) 1993-11-16
JP3038079B2 true JP3038079B2 (ja) 2000-05-08

Family

ID=14516861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4109695A Expired - Fee Related JP3038079B2 (ja) 1992-04-28 1992-04-28 自動翻訳装置

Country Status (2)

Country Link
US (1) US5373441A (ja)
JP (1) JP3038079B2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05314175A (ja) * 1992-05-13 1993-11-26 Ricoh Co Ltd 対訳画像形成装置
US5500796A (en) * 1993-07-22 1996-03-19 General Electric Company Method for extracting open-issue data from textual specifications using natural language text processing
CH686984A5 (de) * 1993-09-07 1996-08-15 Max Hugentobler Elektronisches Uebersetzungsgeraet.
JP3408291B2 (ja) * 1993-09-20 2003-05-19 株式会社東芝 辞書作成支援装置
JP3960562B2 (ja) * 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法
US5812818A (en) * 1994-11-17 1998-09-22 Transfax Inc. Apparatus and method for translating facsimile text transmission
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
US6993471B1 (en) * 1995-11-13 2006-01-31 America Online, Inc. Integrated multilingual browser
US5884247A (en) * 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
US7672829B2 (en) * 1997-03-04 2010-03-02 Hiroshi Ishikura Pivot translation method and system
US6385586B1 (en) * 1999-01-28 2002-05-07 International Business Machines Corporation Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices
US6301554B1 (en) 1999-09-23 2001-10-09 Wordstream, Inc. Language translation using a constrained grammar in the form of structured sentences formed according to pre-defined grammar templates
JP2003532194A (ja) 2000-04-24 2003-10-28 マイクロソフト コーポレイション 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法
US6910818B2 (en) * 2001-04-30 2005-06-28 Microsoft Corporation Keyboard with improved function and editing sections
US7016933B2 (en) 2001-09-20 2006-03-21 International Business Machines Corporation Translation and substitution of transmitted environmental data
US20060253205A1 (en) * 2005-05-09 2006-11-09 Michael Gardiner Method and apparatus for tabular process control
US20100292983A1 (en) * 2008-01-10 2010-11-18 Takashi Onishi Machine translation apparatus and machine translation method
JP4935869B2 (ja) * 2009-08-07 2012-05-23 カシオ計算機株式会社 電子機器及びプログラム
US8508787B2 (en) * 2009-11-23 2013-08-13 Xerox Corporation System and method for automatic translation of documents scanned by multifunctional printer machines
JP5449633B1 (ja) * 2013-03-22 2014-03-19 パナソニック株式会社 広告翻訳装置、広告表示装置、および広告翻訳方法
US10394938B2 (en) * 2014-04-30 2019-08-27 MBTE Holdings Sweden AB Visual searching and navigation
JP7012240B2 (ja) * 2017-02-02 2022-01-28 ランゲージ ディスカバリー エルティーディー 多言語交流システムおよびメッセージ送信方法
US10936635B2 (en) * 2018-10-08 2021-03-02 International Business Machines Corporation Context-based generation of semantically-similar phrases
KR102485647B1 (ko) * 2021-05-18 2023-01-05 김장호 구분 알고리즘을 이용한 조동사 영어 학습 방법 및 시스템

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS62219165A (ja) * 1986-03-20 1987-09-26 Fujitsu Ltd 機械翻訳における訳語選択処理方式
JPS6349881A (ja) * 1986-08-19 1988-03-02 Ricoh Co Ltd 翻訳装置
GB2197510A (en) * 1986-10-27 1988-05-18 Sharp Kk Translation apparatus
JPH0264767A (ja) * 1988-08-31 1990-03-05 Nec Corp 辞書ファイル装置
JPH02281372A (ja) * 1989-04-24 1990-11-19 Sharp Corp 機械翻訳装置における挿入副詞句処理方法
JPH03222069A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置
JPH03222067A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置
JPH04158477A (ja) * 1990-10-23 1992-06-01 Matsushita Electric Ind Co Ltd 機械翻訳装置

Also Published As

Publication number Publication date
US5373441A (en) 1994-12-13
JPH05303590A (ja) 1993-11-16

Similar Documents

Publication Publication Date Title
JP3038079B2 (ja) 自動翻訳装置
US5214583A (en) Machine language translation system which produces consistent translated words
GB2177525A (en) Bilingual translation system with self intelligence
US20060218495A1 (en) Document processing device
JP2838984B2 (ja) 汎用参照装置
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JPH0612548B2 (ja) 文書処理装置
JP2715419B2 (ja) 翻訳装置
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2928515B2 (ja) 訳語出力装置
JPH0561902A (ja) 機械翻訳システム
JP2752977B2 (ja) 機械翻訳方法
JP2859882B2 (ja) 機械翻訳装置
JP2002132764A (ja) 機械翻訳前処理装置
JP3147947B2 (ja) 機械翻訳装置
JP2747281B2 (ja) 辞書登録方法
JP2938897B2 (ja) 文書作成処理装置
JPH04174069A (ja) 言語理解支援装置
JPH09274615A (ja) 文体変換装置
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JPS6320569A (ja) 機械翻訳装置
JPS61260367A (ja) 機械翻訳システム
JP3353873B2 (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH06236399A (ja) 翻訳機能付きワードプロセッサ

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080225

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090225

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees