JPS63136264A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPS63136264A
JPS63136264A JP61284487A JP28448786A JPS63136264A JP S63136264 A JPS63136264 A JP S63136264A JP 61284487 A JP61284487 A JP 61284487A JP 28448786 A JP28448786 A JP 28448786A JP S63136264 A JPS63136264 A JP S63136264A
Authority
JP
Japan
Prior art keywords
word
unknown
translation
words
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61284487A
Other languages
English (en)
Inventor
Shinobu Shiotani
塩谷 忍
Hitoshi Suzuki
等 鈴木
Youji Fukumochi
福持 陽士
Shinji Tokunaga
徳永 信治
Hidezo Kugimiya
釘宮 秀造
Ichiko Sada
いち子 佐田
Noriyuki Hirai
平井 徳行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61284487A priority Critical patent/JPS63136264A/ja
Priority to GB08727868A priority patent/GB2199170A/en
Publication of JPS63136264A publication Critical patent/JPS63136264A/ja
Priority to US07/474,245 priority patent/US5010486A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は機械翻訳装置に関し、翻訳処理に入る以前に、
入力文中に存在する未知語(翻訳用辞書に記載されてい
ない単語で、入力ミスによって綴りが誤って入力された
単語も含む)を一括して検索し、その結果全未知語数、
出現位置等の情報と共に編集し、未知語リストを出力す
る様にした装置に関するものである。
〈従来技術〉 従来の翻訳装置では、入力文(原文)ヲ、逐次、翻訳処
理にかける段階でしか入力文中に存在する未知語の検出
ができなかった。このため、■ 対話形底で翻訳してい
る場合、未知語を検出する毎に翻訳処理が中断され、逐
一、ユーザー辞書等に登録する必要があり、翻訳作業の
流れが滞ると共に、操作上のロスが発生する。
■ −話形式で翻訳している場合、未知語を含む入力文
は正確に翻訳されて旨ないか、或いは全く翻訳されない
ままで残り、結果を確認した後、再度、翻訳処理を実施
しなければならない。
等の欠点があった。
■についてさらに述べれば、対話形式での翻訳の場合、
任意の文に対して翻訳指示を出すと、翻灰処理が実行さ
れ、辞書引き、形態素解析の段階で未知語が検出される
。従って、それ以降の処理継続が不可能となり、翻訳処
理が停止する。オペレータは、それに対して、未知語を
ユーザー辞書に登録する等の対策を施した後、再度、翻
訳指示を出さなくてはならない。
■についてさらに述べれば、−話形式の翻訳の場合、翻
訳指示が出された文章の各文に対して翻訳処理を行うこ
とになるが、未知語を内在する文に対しては、先に述べ
た対話形式翻訳と同様の理由により、その文の翻訳を停
止し、次の文の翻訳に移る。一括翻訳が終了した後、オ
ペレータは、文章中に含まれる未知語を、逐次、ユーザ
ー辞書に登録し、未知語が原因となって翻訳できなかっ
た文を探し出して、再度、翻訳指示を出さなくてはなら
なかった。
上述した如く、再度翻訳指示音用すことによる時間的損
失及び未知語が原因となって翻訳されなかった文を探し
出すことによる時間的損失等が、オペレータによる翻訳
作業のスムーズな流れを阻害していた。
〈発明の目的〉 本発明は、翻訳処理に入る以前に入力文中に存在する全
ての未知語を検出する機械翻訳装置を提供し、ユーザー
辞書への一括登録全可能にすることによって、作業全体
が見通し易くし、作業時間の短縮化全針ることを目的と
する。
〈実施例〉 以下、本発明の構成を図面を参照しつつ説明する。
第1図は、本発明を実施することができる翻訳装置の構
成を示すブロック図である。翻訳処理などの処理を行う
中央処理装置(C,PU)IK関連して、当該CPU 
Iで処理を行うためのプログラムなどがストアされるメ
インメモリ2、翻訳処理に必要な表示2行うための表示
装置(CRT)3、翻訳処理に必要な入力を行うための
キーボード4が設けられている。又、システムによって
は、入力装置として光学的文字読取装置(OCR,)も
用いられる。さらに、翻訳処理過程に必要な情報がスト
アされる翻訳モジュール5、および翻訳用の辞書1文法
規則、構造変換規則テーブル6が備えられている。
前記翻訳用辞書には、基本的な語粟を記載した基本語辞
書、専門的な語粟を記載した専門用語辞書、ユーザーが
独自に語粟を登録したユーザー辞書等がある。
次に一般的な機械翻訳処理の手順について説明する。
第2図は機械翻訳処理の要部ブロック図の例である。処
理はおおむねSl→S2→s3→S4→S5の方向に進
む。辞書引きおよび形態素解析(Sl)では翻訳用の辞
書を引き、各単語に対する品詞などの文法情報、訳語を
得るとともに、時制・人称・数などを解析する。構文解
析(S2)では、ンース言語で書かれた入力文を文法規
則などをもとに解析し、単語間の係り受けなどを含め、
文章の構造を決定する。文章によって複数の解が存在す
る場合がある。
意味解析(S3)では、構文解析の結果が意味的に正し
いか否かを検証する。構文解析の結果が複数ある場合は
、意味解析によって最も妥当性のある解釈を選択する。
意味解析のレベルは、翻訳システムが有する意味処理用
辞書の内容、および解析結果の内部表現などによって異
なる。また、構文解析と意味解析とを有機的に結合した
方式も見られる。
変換(S4)では、ンース言語の解析によって得られた
データ構造(多くは構造)をターゲット言語のデータ構
造に変換する。
生成(S5)では、変換部でできたターゲット言語のデ
ータ構造をもとにして、ターゲット言語によって表現さ
れた文章を生成する。一般的には、この文章が翻訳処理
の結果、得られる訳文となる。
第8図は一括未知語検索処理のフローチャートである。
以下、当該フローチャートに従って説明を行う。
ここで、対象となる入力文が既に機械翻訳装置に読み込
まれ、当該内容は前記表示装置3に表示されているとす
る。
S、ステップで、検索開始文の位置指定を行う。
上述した位置指定処理は、通常、オペレータが前記表示
装置3の表示内容を参考にし、カーソルを移動させるこ
と等により成される。
そして、文章全てを検索対象とする場合は、文章の先頭
にカーソルを置く。
次の82ステツプで、以下の一括未知語検索機能を開始
(スタート)させるための開始キーを入力する。
前記開始キーには前記キーボード4に設けられているフ
ァンクションキー等が割当てられる。
続いて、S3ステツプから主な処理に入り、対象となる
入力文が終了したか否かを判断(チェック)する。
前記S3ステツプで入力文が終了したと判断された場合
には、S15ステツプに進む。この部分は後述する。
他方、前記S3ステツプで入力文が終了せず残存部分が
ある七判断された場合には、S4ステツプに移行する。
当該S4ステツプでは、1文を処理用バッファに読み込
む(READ)処理を行う。
そして、前記1文に対して未知語検索を行う。
一般的には、先頭の単語から、順次、翻訳辞書と照合し
ていく。
S5ステツプで、検索対象となる単語が終了したか否か
を判断する。
ここで、検索対象となる単語が終了した場合は、次の文
を読み込むために83ステツプへ分岐する。
そして、前記S5ステツプで単語が終了しないと判断さ
れたときには、S6ステツプに移行し、検索対象となる
1単語を特定する。
次に、S7ステップで、特定された単語について各種翻
訳辞書の内容と照合を行う。
翻訳辞書には複数のものが考えられるが、本機能の開始
以前にオペレータによって予め適切な各種辞書が選択さ
れているとする。
S8乃至Sloステップに辞書との照合処理が記載され
ている。
S8ステツプの変化形処理は、例えば、英語の複数形、
三人称単数現在形、過去形、過去分詞形。
現在分詞形等、ある言葉の基本形(原形)から原生ずる
変化形までも含めた辞書照合に対応するものである。又
、処理のレベルをもっと深めて、例えば、接頭辞、接尾
辞までも含めた照合も可能である。
S9ステツプ及び510ステツプは、例えば英語の固有
名詞的記法に関する処理である。
固有名詞は当然のことなから未知語となる確率が高い。
例えば、“Tanaka ”  という単語を考えたと
き、これが翻訳辞書に存在しなかった場合、これを未知
語扱いとして、後述する未知語リストに加えるか、或い
は固有名詞と推定して、取り敢えず、未知語として取り
扱わないかの2種類の考え方がある。これらのいずれか
一方を選択するために、フラグを設け、本機能の開始以
前にオペレータが設定するものとする。前者を選択する
場合は” Tanaka ’ k “日中”としてユー
ザー辞書に登録する。これは、きめ細かい訳文が必要な
ときと考えられる。他方、後者を選択する場合は’ T
anaka”は名詞の” Tanaka ’として訳出
するだけでも十分に訳文の用途に適合するときと考えら
れる。固有名詞の推定方法は機械翻訳装置によって異な
るが、本機能の固有名詞処理には、各機械翻訳装置の有
する固有名詞推定アルゴリズムを用いることができる。
前記S9ステツプで前記フラグのオン又はオフを判断し
、オン(= Yes )であれば固有名詞と推定した単
語を未知語として扱う処理を行う(S+。
ステップ)。
前記S9ステツプで前記フラグがオフ(=No)と判断
されると、直接、S11ステツプに進み、ここで、未知
語の判定を行う。
判定結果によって、S12ステツプからSI3→S14
ステップと進む処理と、当該512ステツプから前記S
5ステツプに復帰し、次の対象単語の処理を始める処理
と分岐する。
前記S13ステツプで、その単語の綴り、出現位置等の
情報を結果バッファに書き加え、次のSl+ステップで
、入力文中の未知語を明示するために、当該単語に未知
語マークを挿入する。
前記S14ステツプは、入力文の表示或いはプリントア
ウトにて未知語を探し易くするものであって、機械翻訳
装置によっては当該S14ステツグの処理を省略するこ
とも当然可能である。
以上の処理が進められ、前記S3ステツプで全ての文の
処理が終了したと判断されればS15ステツプに進む。
前記S+sステップでは、結果バッファの内容(未知語
の累計データ)を分類、整理し、見易い形式に編集して
未知語リスIf作成する。これには単語の出現件数のカ
ウント、文中の出現位置の明示、綴りのアルファベット
順ソート(分類)等が考えられる。
続< SI6ステツプでは、前記未知語リスト’を前記
CRT表示装置3に出力する。この出力は印字装置で行
うこともできる。
上述した流れによって本機能の一連の処理が完結する。
第4図は本機能を実行した場合の一表示例を示すもので
ある。
同図の表示例では” parchessi ’ なる単
語が翻訳辞書に存在せず未知語となっている。そして、
前記s+4ステップの未知語マーク米で囲まれている。
又、訳文エリアには未知語検出を明示するためのコメン
ト「米付きの単語は辞書にあり1せん」が表示されてい
る。
第5図に他の表示例を示す。
この表示例では、beginers”がスペルミスのた
め(本来はbeginners” )、未知語として検
索されている。又、前述の如く、固有名詞処理のフラグ
を利用して、例文中のRASIC”も未知語として扱う
ことが可能なことも言うまでもない。
第6図は未知語リストの一例である。綴りはアルファベ
ット順にソートされ、それが出現した文の番号9文頭か
ら何番目の単語であったか等の情報、及び未知語の総件
数、異なり件数等がリストアツブされている。又、用途
によっては、アルファベット順ンートの代わりに、出現
順(文番号の順)或いは個数の多い順等でリストするこ
とももちろん可能である。
この未知語リスif用いてユーザー辞書登録を行えば、
効率の高い翻訳作業を実施することが可能となる。又、
ユーザー辞書登録時に未知語リストを呼び出し、その英
文綴り部分を利用する様にすれば、手入力が減少し、登
録作業の負担を軽減できる。
本実施例によれば、まず翻訳処理に先立ち、文章に内在
する全ての未知語を一括して検索し、その結果を未知語
の数、未知語の存在位置等の有益な情報と共に編集し、
オペレータに報知するから、ユーザー辞書登録等の対策
が一括して行え、よって、作業の流れの効率化が図れる
と共に、使い易さも得られる。
上記実施例は英日翻訳を例にとって説明したが、機械翻
訳装置にとって未知語という概念はソース言語に拘わら
ず共通のものがあり、英日翻訳に止まらず、日英翻訳、
さらには他の言語ベアにも適用できることは明らかであ
る。
く効 果〉 以上の様に本発明によれば、入力文に対して翻訳処理を
行う機械翻訳装置において、翻訳処理を実行する前に、
入力文を構成する各単語について翻訳辞書との照合を行
う照合手段と、前記照合結果に基づいて、当該辞書に存
在しない単語を出力する出力手段を具備するから、下記
の効果を得る。
(イ)入力文中の単語で翻訳辞書中に存在しない未知語
をユーザー辞書に登録する作業が一括して行え、作業効
率が向上する。
(ロ)事前に未知語の出現箇所、個数等がわかるので、
ユーザー辞書登録時の訳語決定の参考となり、その結果
、良質の翻訳文が得られる。
ヒ9一括未知語検索→ユーザー辞書登録→翻訳処理の様
に作業を分割できるので、複数の者による作業、即ち、
作業レベルに応じた分業が可能となる。
に)入力文が英文等の場合、一括未知語検索の機能レベ
ルを変化させると、大文字を含んで構成される固有名詞
等も未知語としてリストアンプでき、それらをユーザー
登録することによってきめ細かい訳文が得られる。
(イ)一括未知語検索時に未知語としてリストアツブさ
れたものを何らかの手段で記憶しておき、ユーザー辞書
登録時に前記未知語を呼び出す様にすれば、登録時の効
率が上がる。
(へ) 入力ミスも未知語となるので、事前にミス修正
が可能となる。
【図面の簡単な説明】
第1図は機械翻訳装置のブロック図、第2図は翻訳処理
を説明するための図、第3図は一括未知語検索処理を示
すフローチャート、第4図及び第5図は未知語の表示例
、第6図は未知語のリストを示す図である。 1・・・CPU、2・・・メインメモリー、3・・・C
RT。 4・・・キーボード、5・・・翻訳モジュール、6・・
・テーブル。 代理人 弁理士 杉 山 毅 至(他!名)ジ 第1図       6 第2− 第4 図 第 5図

Claims (1)

  1. 【特許請求の範囲】 1、入力文に対して翻訳処理を行う機械翻訳装置におい
    て、 翻訳処理を実行する前に、入力文を構成する各単語につ
    いて翻訳用辞書との照合を行う照合手段と、 前記照合結果に基づいて、当該辞書に存在しない単語を
    出力する出力手段とを具備することを特徴とする機械翻
    訳装置。 2、前記出力手段は表示手段であることを特徴とする特
    許請求の範囲第1項記載の機械翻訳装置。 3、前記出力手段は印字手段であることを特徴とする特
    許請求の範囲第1項記載の機械翻訳装置。
JP61284487A 1986-11-28 1986-11-28 機械翻訳装置 Pending JPS63136264A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61284487A JPS63136264A (ja) 1986-11-28 1986-11-28 機械翻訳装置
GB08727868A GB2199170A (en) 1986-11-28 1987-11-27 Translation apparatus
US07/474,245 US5010486A (en) 1986-11-28 1990-02-05 System and method for language translation including replacement of a selected word for future translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61284487A JPS63136264A (ja) 1986-11-28 1986-11-28 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPS63136264A true JPS63136264A (ja) 1988-06-08

Family

ID=17679151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61284487A Pending JPS63136264A (ja) 1986-11-28 1986-11-28 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPS63136264A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142865A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 機械翻訳方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58175076A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 自然言語処理装置
JPS6154565A (ja) * 1984-08-24 1986-03-18 Hitachi Ltd 多品詞訳語の校正方法
JPS61173379A (ja) * 1985-01-29 1986-08-05 Brother Ind Ltd スペルチエツク装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58175076A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 自然言語処理装置
JPS6154565A (ja) * 1984-08-24 1986-03-18 Hitachi Ltd 多品詞訳語の校正方法
JPS61173379A (ja) * 1985-01-29 1986-08-05 Brother Ind Ltd スペルチエツク装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142865A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 機械翻訳方法

Similar Documents

Publication Publication Date Title
US5640575A (en) Method and apparatus of translation based on patterns
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
EP0180888A2 (en) Method and apparatus for natural language processing
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
US6876963B1 (en) Machine translation method and apparatus capable of automatically switching dictionaries
GB2234614A (en) Machine translation apparatus
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
US4860206A (en) Translation system allowing user designation of postpositional words
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPS63136264A (ja) 機械翻訳装置
JP2621999B2 (ja) 文書処理装置
JPH0561902A (ja) 機械翻訳システム
JPH05151256A (ja) 機械翻訳方法および機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH07200592A (ja) 文章処理装置
JPS6320567A (ja) 翻訳装置
JPH05113993A (ja) 辞書登録方式
JPH09231226A (ja) 機械翻訳用辞書メンテナンス装置
JPS62140165A (ja) 仮名漢字変換方式
JPH0973460A (ja) 文書検索装置