JPH10340264A - Machine translation device and computer-readable recording medium where machine translation processing program is recorded - Google Patents

Machine translation device and computer-readable recording medium where machine translation processing program is recorded

Info

Publication number
JPH10340264A
JPH10340264A JP9148834A JP14883497A JPH10340264A JP H10340264 A JPH10340264 A JP H10340264A JP 9148834 A JP9148834 A JP 9148834A JP 14883497 A JP14883497 A JP 14883497A JP H10340264 A JPH10340264 A JP H10340264A
Authority
JP
Japan
Prior art keywords
rewriting
language
machine translation
colloquial
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9148834A
Other languages
Japanese (ja)
Inventor
Seiko Yoshiyama
盛子 吉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9148834A priority Critical patent/JPH10340264A/en
Publication of JPH10340264A publication Critical patent/JPH10340264A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a correct translation result without requiring pre-editing by a user even if a document is written in a colloquial style including abbreviations. SOLUTION: An English text, which is inputted through an input part 10 is stored temporarily in a text storage area 41. Translation is performed normally by sentences, so the English text stored in the area 41 is sectioned into sentences and stored in an input buffer area 42. Then, when the user instructs that colloquial abbreviations are to be rewritten into correct notation, a CPU 30 performs retrieval from a colloquial rewriting dictionary 62 where proper notations corresponding to abbreviations used in colloquial documents are registered. When a corresponding character string is found, it is judged whether or not there are spaces right before and after it and when so, the abbreviation to be rewritten is regarded and rewritten into the proper notation, but when not corresponding character string is not rewritten. Then, a morpheme analysis is taken to divide the sentence into words.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、第一言語を第二言
語に翻訳する機械翻訳装置、及びその機械翻訳装置を動
作させる機械翻訳処理プログラムを記録したコンピュー
タ読み取り可能な記録媒体に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for translating a first language into a second language, and a computer-readable recording medium storing a machine translation processing program for operating the machine translation device. .

【0002】[0002]

【従来の技術】従来の機械翻訳装置、及び機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体から前記プログラムを読み込むことにより機械翻訳
装置として動作するコンピュータ(以下、機械翻訳装置
等と称する)においては、口語体で表記された入力文を
翻訳した場合に、適切な翻訳結果が得られないことが多
かった。
2. Description of the Related Art A conventional machine translation apparatus and a computer which operates as a machine translation apparatus by reading the program from a computer-readable recording medium storing a machine translation processing program (hereinafter referred to as a machine translation apparatus). Often, when translating an input sentence written in colloquial style, an appropriate translation result could not be obtained.

【0003】例えば、"It's going to be colder in Ja
nuary." という英語の入力文であれば、「1月はもっと
寒くなるだろう。」という翻訳結果を得ることができる
が、前記英文中の"going to"を、その口語体である"gon
na" という略語表記で入力した場合の英文、"It's gonn
a be colder in January."では、上述のような翻訳結果
が得られず、"gonna" が翻訳辞書にもユーザー辞書にも
登録されていない単語(以下、未知語と呼ぶ)と認識さ
れるばかりでなく、入力文中の係り受け等の内部構造
(構文)を正しく解析できないために、解析中の内部構
造自体が崩壊して、奇怪な翻訳文が生成される危険があ
った。
[0003] For example, "It's going to be colder in Ja
With the English input sentence "nuary.", you can get the translation result of "It will be colder in January." However, "going to" in the above English sentence is replaced by its spoken word "gon"
"It's gonn"
"a be colder in January." does not provide the translation result as described above, and only recognizes "gonna" as a word that is not registered in the translation dictionary or user dictionary (hereinafter referred to as unknown word). In addition, since the internal structure (syntax) such as the dependency in the input sentence cannot be correctly analyzed, there is a risk that the internal structure itself being analyzed is collapsed and a strange translation is generated.

【0004】[0004]

【発明が解決しようとする課題】ところで、近年、ネッ
トワーク環境の充実によって、電子メールによる通信や
インターネット等のホームページ等の情報(以下、電子
メール等と称する)を活用する機会が急増してきてお
り、これらの電子メール等は、文章の作成の便宜から口
語体で書かれたものが多い。したがって、これらの電子
メール等を活用したい者は、その内容を理解するために
これらを自身の母国語に翻訳する必要性から、口語体で
書かれた電子メール等を翻訳する機会が多くなってき
た。
By the way, in recent years, due to the enhancement of the network environment, opportunities for utilizing information such as communication by electronic mail and homepages such as the Internet (hereinafter referred to as electronic mail, etc.) have been rapidly increasing. These e-mails and the like are often written in colloquial style for the convenience of writing sentences. Therefore, those who want to use these e-mails etc. have more opportunities to translate e-mails etc. written in colloquial language because they need to translate them into their own native language to understand the contents. .

【0005】しかしながら、上述したように、前記従来
の機械翻訳装置等は、翻訳されるべき入力文が正式な表
記で入力されていることが前提となって構成されてお
り、上述したような略語表記を含む口語体で書かれた文
章を正しく翻訳することができなかった。
However, as described above, the conventional machine translation apparatus and the like are configured on the premise that an input sentence to be translated is input in a formal notation. Texts written in colloquial style, including notation, could not be translated correctly.

【0006】本発明は上述した問題点を解決するために
なされたものであり、略語表記を含む口語体で書かれた
文章であっても、翻訳処理前のユーザー自身の手による
編集を必要とすることなく、正しい翻訳結果が得られる
機械翻訳装置、及びその機械翻訳装置を動作させる機械
翻訳処理プログラムを記録したコンピュータ読み取り可
能な記録媒体を提供することを目的としている。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and even if a sentence is written in a colloquial style including abbreviations, it must be edited by the user himself before the translation process. It is an object of the present invention to provide a machine translation device that can obtain a correct translation result without any error, and a computer-readable recording medium that records a machine translation processing program for operating the machine translation device.

【0007】[0007]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の機械翻訳装置は、第一言
語を入力するための入力部と、入力された第一言語を単
語に分割するための形態素解析部と、第一言語を解析す
るための構文解析部と、解析された第一言語の構文を第
二言語の構文に変換し、得られた第2言語の構文から第
二言語の翻訳文を生成するための翻訳文生成部と、前記
各部における処理のために用いられる辞書と、生成され
た第二言語の翻訳文を出力するための出力部とを備え、
さらに、前記辞書は、翻訳処理されるべき単語が口語で
用いられる略語である場合に、これを正式な表記に書き
換えるための口語書き換え辞書を備えており、この口語
書き換え辞書を参照することにより、入力文中にある口
語体の略語を本来の正しい表記に書き換えた後に翻訳を
行う。
In order to achieve this object, a machine translation apparatus according to a first aspect of the present invention comprises: an input unit for inputting a first language; A morphological analysis unit for dividing into words, a syntax analysis unit for analyzing the first language, and a syntax of the second language obtained by converting the analyzed syntax of the first language into a syntax of the second language A translation sentence generation unit for generating a translation sentence of the second language from, a dictionary used for processing in each of the units, and an output unit for outputting the generated translation of the second language,
Further, the dictionary is provided with a spoken word rewriting dictionary for rewriting the word to be translated in the case where the word to be translated is an abbreviation used in a spoken language, by referring to the spoken word rewriting dictionary, Translation is performed after rewriting the abbreviations of the colloquial style in the input sentence to the original correct notation.

【0008】請求項2に記載の機械翻訳装置は、前記略
語を前記口語書き換え辞書を参照して正式な表記に書き
換える処理を行うか否かをユーザーが選択するための口
語書き換え指示手段を備えており、ユーザーは、この口
語書き換え手段により、本機械翻訳装置において前記略
語から正式な表記への書き換え処理を行うか否かを選択
する。
A machine translation apparatus according to a second aspect of the present invention includes a spoken word rewriting instruction means for allowing a user to select whether or not to perform processing for rewriting the abbreviation into a formal notation with reference to the spoken word rewriting dictionary. The user uses the spoken word rewriting means to select whether or not to perform the rewriting process from the abbreviation to the formal notation in the machine translation device.

【0009】請求項3に記載の機械翻訳装置は、前記口
語書き換え指示手段によって前記書き換え処理が指示さ
れた場合には、翻訳対象文書中の、口語書き換え辞書に
登録された単語を、正式な表記に書き換える口語書き換
え手段を備えており、前記口語書き換え指示手段により
ユーザーから前記書き換え処理が指示された場合に、前
記口語書き換え手段は、該当する口語体の略語を、前記
口語書き換え辞書を参照しながら、前記略語を正式な表
記に書き換える。
According to a third aspect of the present invention, when the rewriting process is instructed by the spoken language rewriting instructing means, a word registered in the spoken language rewriting dictionary in the translation target document is formalized. In the case where the rewriting process is instructed by the user by the spoken word rewriting instruction means, the spoken word rewriting means refers to the spoken word rewriting dictionary, referring to the abbreviations of the spoken language in question. Rewrite the abbreviations into formal notations.

【0010】請求項4に記載の機械翻訳装置は、前記口
語書き換え指示手段によって前記書き換え処理が指示さ
れた場合であっても、前記略語が書き換えすべきでない
単語であった場合は書き換えを行うことなく出力する口
語書き換え禁止手段を備えており、前記口語書き換え指
示手段によって書き換えが指示された場合でも、翻訳対
象入力文中に、書き換えてはならない略語表記がある場
合には、口語書き換え禁止手段により、書き換えを行わ
ずに出力するため、不適切な書き換えが防止される。
According to a fourth aspect of the present invention, even when the rewriting processing is instructed by the spoken word rewriting instructing means, if the abbreviation is a word that should not be rewritten, the machine translation apparatus performs rewriting. It is provided with a spoken word rewriting prohibiting means for outputting without rewriting, even if rewriting is instructed by the spoken word rewriting instructing means, if there is an abbreviation notation that must not be rewritten in the translation target input sentence, Output without rewriting prevents improper rewriting.

【0011】請求項5に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、入
力された第一言語を単語に分割するための形態素解析手
順と、前記第一言語の構文を解析するための構文解析手
順と、解析された第一言語の構文を第二言語の構文に変
換し、得られた第二言語の構文から第二言語の翻訳文を
生成するための翻訳文生成手順とを機械翻訳装置に実行
させるためのプログラムを記録し、さらに、翻訳処理さ
れるべき単語が口語で用いられる略語である場合に、こ
れを正式な表記に書き換えるために、口語書き換え辞書
を参照しながら、前記略語を正式な表記に書き換える口
語書き換え手順を機械翻訳装置に実行させるためのプロ
グラムを記録しており、口語書き換え辞書を参照しなが
ら、翻訳対象入力文中にある口語の略語を正式な表記に
書き換える。
According to a fifth aspect of the present invention, there is provided a computer-readable recording medium storing a machine translation processing program, comprising: a morphological analysis procedure for dividing an input first language into words; And a translated sentence generating step for converting the parsed first language syntax into a second language syntax and generating a second language translated sentence from the obtained second language syntax If the word to be translated is an abbreviation used in colloquial language, refer to the colloquial rewriting dictionary to rewrite the word into a formal notation. While recording a program for causing the machine translator to execute a colloquial rewriting procedure for rewriting the abbreviation into a formal notation, inputting the translation target while referring to the colloquial rewriting dictionary It rewrites the colloquial abbreviations that are in the formal notation.

【0012】請求項6に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、ま
た、前記書き換え処理を行うか否かをユーザーが選択す
るための口語書き換え指示プログラムを備えており、そ
の口語書き換え指示プログラムによって、ユーザーが前
記書き換え処理を選択した場合に、前記書き換え処理が
実行される。
[0012] A computer-readable recording medium storing the machine translation processing program according to claim 6 further comprises a colloquial rewriting instruction program for allowing a user to select whether or not to perform the rewriting processing. The rewriting process is executed when the user selects the rewriting process according to the spoken language rewriting instruction program.

【0013】請求項7に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、前
記口語書き換え指示プログラムで前記書き換え処理が指
示された場合に、翻訳対象入力文中の該当する口語体の
略語を正式な表記に書き換える口語書き換えプログラム
を記録しており、ユーザーが書き換え処理を指示したと
きに限り前記書き換え処理を行う。
A computer-readable recording medium recording the machine translation processing program according to claim 7, wherein the abbreviation of the corresponding spoken word in the input sentence to be translated is provided when the rewriting processing is instructed by the spoken language rewriting instruction program. Is written in a formal notation, and the rewriting process is performed only when the user instructs the rewriting process.

【0014】請求項8に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、さ
らに、前記口語書き換え指示プログラムによって書き換
え処理が指示された場合であっても、その略語が書き換
えすべきでないものである場合には書き換えを行わない
口語書き換え禁止プログラムを記録しており、不適切な
書き換えを防ぐ。
In a computer-readable recording medium storing the machine translation processing program according to claim 8, the abbreviations should be rewritten even when the rewriting processing is instructed by the spoken language rewriting instruction program. If it is not, a collation rewriting prohibition program that does not perform rewriting is recorded, and inappropriate rewriting is prevented.

【0015】[0015]

【発明の実施の形態】以下、本発明を具体化した一つの
実施の形態を、第一言語を日本語、第二言語を英語とし
た場合を例にとり説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below, taking as an example the case where the first language is Japanese and the second language is English.

【0016】本実施の形態の機械翻訳装置の構成を図1
に示す。この図に示すように、本機械翻訳装置は、日本
語文を入力するためのキーボード等からなる入力部10
と、本機械翻訳装置において入力の英文を翻訳処理して
出力の日本語文を生成させるための各種の処理を、コン
ピュータ等の中央処理装置(CPU)において処理可能
なプログラムの形式で記憶し、さらに、前記処理に供さ
れる辞書データを記憶するROM50と、生成した翻訳
結果の英語をCRTに表示したり、プリンタから印刷す
るための出力部20と、作業用メモリ領域として用いら
れるRAM40と、前記翻訳処理に供される辞書等を記
憶する外部記憶装置(HDD)60とを、装置全体を制
御するための中央処理装置であるCPU30に接続して
構成される。
FIG. 1 shows the configuration of a machine translation apparatus according to the present embodiment.
Shown in As shown in the figure, the machine translation apparatus has an input unit 10 such as a keyboard for inputting Japanese sentences.
And various processing for translating an input English sentence and generating an output Japanese sentence in the machine translation apparatus are stored in a form of a program that can be processed by a central processing unit (CPU) such as a computer. A ROM 50 for storing dictionary data to be provided to the processing, an output unit 20 for displaying the generated English translation results on a CRT or printing from a printer, and a RAM 40 used as a working memory area. An external storage device (HDD) 60 for storing a dictionary or the like provided for translation processing is connected to a CPU 30 which is a central processing unit for controlling the entire device.

【0017】前記RAM40は、前記入力部10により
入力された英文を記憶するためのテキスト記憶領域41
と、前記入力英文を翻訳処理に供するために1文毎に分
割して記憶する入力バッファ領域42と、翻訳結果の日
本語文を記憶するための出力バッファ領域43とを備え
ている。
The RAM 40 has a text storage area 41 for storing the English sentence input by the input unit 10.
And an input buffer area 42 for dividing and storing the input English sentence for each sentence for translation processing, and an output buffer area 43 for storing a translated Japanese sentence.

【0018】前記ROM50には、図3のフローチャー
トで示すプログラム、すなわち、英文を日本語文に翻訳
する翻訳プログラム51と、前記翻訳プログラム51が
その処理の実行において参照する翻訳辞書57とが記録
されている。
The ROM 50 stores a program shown in the flowchart of FIG. 3, that is, a translation program 51 for translating an English sentence into a Japanese sentence, and a translation dictionary 57 which the translation program 51 refers to in executing the processing. I have.

【0019】前記翻訳プログラム51は、入力された前
記英文を形態素解析するための形態素解析部52と、英
文の係り受けなどの構文を解析する構文解析部53と、
その解析結果に基づいて前記英文の構文を日本語の構文
に変換する構文変換部54と、その構文変換部54によ
り生成された変換結果を基に日本語の構文を生成するこ
とにより日本語文を生成する構文生成部55と、生成さ
れた日本語文に対して活用変化などの調整を行って、入
力の英文の和訳に対応する最終的な翻訳結果の日本語文
を生成する形態素生成部56とを備えている。尚、構文
変換部54、構文生成部55及び形態素生成部56が本
発明の翻訳文生成部を構成する。
The translation program 51 includes a morphological analyzer 52 for morphologically analyzing the input English sentence, a syntax analyzer 53 for analyzing a syntax such as a dependency of the English sentence,
A syntax conversion unit 54 that converts the English sentence syntax into a Japanese syntax based on the analysis result, and a Japanese sentence is generated by generating a Japanese syntax based on the conversion result generated by the syntax conversion unit 54. The generated syntax generation unit 55 and the morpheme generation unit 56 that adjusts the generated Japanese sentence such as inflection change and generates a final translated Japanese sentence corresponding to the Japanese translation of the input English sentence Have. Note that the syntax converter 54, the syntax generator 55, and the morpheme generator 56 constitute a translated sentence generator of the present invention.

【0020】前記CPU30には、また、外部記憶装置
(HDD)60が接続されており、前記翻訳辞書57と
共に任意に使用されるユーザー辞書61、及び口語体文
章に用いられる略語表現に対応する正式な表記が登録さ
れた口語書き換え辞書62が格納されており、これらは
共にユーザーが前記入力部10を介して任意に編集可能
に構成されている。
An external storage device (HDD) 60 is also connected to the CPU 30, and a user dictionary 61 used arbitrarily together with the translation dictionary 57, and a formal expression corresponding to an abbreviation used in spoken text. A spoken word rewriting dictionary 62 in which notations are registered is stored, and both of them are configured to be arbitrarily editable by the user via the input unit 10.

【0021】図3は、ROM50に記憶された前記プロ
グラムの動作を示すフローチャートである。
FIG. 3 is a flow chart showing the operation of the program stored in the ROM 50.

【0022】まず、口語体で書かれた電子メール等のフ
ァイルを読み込むか、またはキーボード等から入力する
ことにより、翻訳対象文が入力されると(S1、Sはス
テップを示す。以下同様)、入力された英文は、一時的
にテキスト記憶領域41に記憶される(S2)。通常、
翻訳は1文単位で行うので、テキスト記憶領域41に記
憶された英文は1文毎に区切られて入力バッファ領域4
2に記憶される(S3)。そして、ユーザーが、口語の
略語を正しい表記に書き換える処理を行うことを指示す
ると(S4:Yes)、口語書き換え辞書を検索し(S
5)、そこで該当する文字列が検索されれば(S6:Y
es)、次に書き換えを行っても良いか否かを確かめる
(S7)。
First, when a sentence to be translated is input by reading a file such as an e-mail written in a colloquial style or by inputting from a keyboard or the like (S1 and S indicate steps, the same applies hereinafter). The English sentence is temporarily stored in the text storage area 41 (S2). Normal,
Since the translation is performed in units of one sentence, the English sentences stored in the text storage area 41 are delimited for each sentence, and
2 (S3). Then, when the user instructs to perform the process of rewriting the abbreviation of the spoken language to the correct notation (S4: Yes), the user searches the spoken language rewriting dictionary (S4).
5) If a corresponding character string is searched there (S6: Y
es) Next, it is confirmed whether or not rewriting can be performed (S7).

【0023】通常、文章中において、略語はそれ自体で
一つの単語として取り扱われ、直前及び直後にスペース
がつけられることから、書き換えるべき略語と一致する
文字列が文章中にあり、かつその文字列の前後にスペー
スがある場合には、その文字列は書き換えるべき略語で
ある蓋然性が高い。これに対し、ある略語と一致する文
字列が文章中にあっても、その文字列の前後にスペース
がなく、アルファベットや数字等他の文字列がある場合
には、その文字列は、ある単語の一部である蓋然性が高
く、その文字列に書き換え処理を施すことによってかえ
って翻訳対象文を破壊してしまうことになる。
Usually, in a sentence, an abbreviation is treated as a single word by itself, and spaces are added immediately before and after the abbreviation. Therefore, a character string matching the abbreviation to be rewritten exists in the sentence, and If there is a space before and after, the character string is likely to be an abbreviation to be rewritten. On the other hand, even if a character string that matches a certain abbreviation is in a sentence, if there is no space before and after that character string and there are other character strings such as alphabets and numbers, the character string is It is highly probable that the sentence to be translated is destroyed by rewriting the character string.

【0024】したがって、前記S7の処理は、前記S6
の処理において該当する文字列が発見された場合に、そ
の直前及び直後にスペースがあるか否かを判定し、スペ
ースがある場合には(S7:Yes)、書き換えるべき
略語と見なしてS8の処理により正式表記への書き換え
を行い、スペースがない場合には(S7:No)、該当
する文字列は書き換えを行わない。
Therefore, the processing in S7 is performed in S6
When the corresponding character string is found in the processing of (3), it is determined whether or not there is a space immediately before and after the character string. If there is a space (S7: Yes), it is regarded as an abbreviation to be rewritten and the processing of S8 is performed. Is rewritten to the formal notation, and if there is no space (S7: No), the corresponding character string is not rewritten.

【0025】その後、S9において、形態素解析して単
語に分割する。
After that, in S9, morphological analysis is performed to divide the words into words.

【0026】ユーザーが略語の書き換え処理を指示しな
かったり(S4:No)、口語書き換え辞書に該当する
単語が見つからなかったり(S6:No)、あるいは直
前及び直後に文字列が続いている場合(S7:Yes)
は、書き換えは行われず、すぐにS9の形態素解析の処
理に入る。
When the user does not instruct the abbreviation rewriting process (S4: No), no corresponding word is found in the spoken word rewriting dictionary (S6: No), or when a character string continues immediately before and after (S6: No) S7: Yes)
Is not rewritten, and immediately enters the morphological analysis processing of S9.

【0027】S9の形態素解析で単語に区切った後、S
10において構文解析を行い、単語を句にまとめ上げて
係り受けなどの解析をし、英語の構文を、2分木構造デ
ータ等の所定の構造データに変換する。そして、S11
において、解析結果である英語の構造データを日本語の
構造データに変換し、単語には訳を当てる。次に、S1
2において、日本語の構造データから日本語文を生成
し、S13において活用変化などの語尾変化を行って、
S14において日本語の翻訳結果を出力する。
After dividing into words by the morphological analysis in S9, S
At 10, a syntactic analysis is performed, the words are grouped into phrases, the dependency is analyzed, and the English syntax is converted into predetermined structure data such as binary tree structure data. And S11
In the above, the English structural data that is the analysis result is converted into Japanese structural data, and the words are translated. Next, S1
In S2, a Japanese sentence is generated from the Japanese structural data, and in S13, a ending change such as a utilization change is performed.
In step S14, the Japanese translation result is output.

【0028】以下、前記構成の機械翻訳装置の動作を、
具体例を用いて説明する。
Hereinafter, the operation of the machine translation apparatus having the above configuration will be described.
This will be described using a specific example.

【0029】図2は、前記口語書き換え辞書62のデー
タ構成を示す図である。この図が示すように、口語の略
語と正式な表記とが対になって登録されている。この口
語書き換え辞書62は、HDD60に格納されており、
ユーザーが任意に登録・削除等の編集を行うことができ
る。
FIG. 2 is a diagram showing the data structure of the spoken language rewriting dictionary 62. As shown in this figure, abbreviations of spoken language and formal notation are registered in pairs. The colloquial rewriting dictionary 62 is stored in the HDD 60,
The user can arbitrarily edit such as registration and deletion.

【0030】図4は、翻訳対象の入力電子メールの一例
である。この電子メールのファイルを読み込むと(S
1)、全文がテキスト記憶領域41に一時的に記憶され
る(S2)。そして、改行コードやピリオド、コロ
ン(:)など、あらかじめ設定された文区切り記号に従
って、1文毎に区切って入力バッファ領域42に記憶さ
れる(S3)。
FIG. 4 shows an example of an input electronic mail to be translated. When this e-mail file is read (S
1) The entire sentence is temporarily stored in the text storage area 41 (S2). Then, each sentence is divided and stored in the input buffer area 42 in accordance with a preset sentence delimiter such as a line feed code, a period, and a colon (:) (S3).

【0031】図5は、1文毎に区切られて英文表示枠に
表示された結果を示す図である。この図が示すように、
図4のファイルは4文に区切られている。
FIG. 5 is a diagram showing the results displayed in the English sentence display frame divided for each sentence. As this figure shows,
The file of FIG. 4 is divided into four sentences.

【0032】ここで、ユーザーが口語の略語を正しい表
記に書き換えるように指示を与えると(S4)、図2の
口語書き換え辞書を検索し(S5)、その結果、"Pre
z"、"gonna"、及び"CU" の3つの略語が検索される(S
6:Yes)。
Here, when the user gives an instruction to rewrite the abbreviation of the spoken language into the correct notation (S4), the colloquial rewriting dictionary of FIG. 2 is searched (S5), and as a result, "Pre
The three abbreviations "z", "gonna" and "CU" are searched (S
6: Yes).

【0033】さらに、これらの単語の前後がスペースに
なっていることから書き換え処理を行ってもよいと判断
して(S7:Yes)、"Prez"を "President"に、"gon
na"を"going to"に、"CU"を "See you"に書き換える
(S8)。
Further, it is determined that rewriting may be performed because spaces before and after these words are present (S7: Yes), and "Prez" is set to "President" and "gon" to "gon".
Rewrite “na” to “going to” and “CU” to “See you” (S8).

【0034】一方、例えば、文章中に"ICU" や"CU2538"
のような、直前もしくは直後にアルファベットや数字等
の文字列が存在する場合にあっては(S7:No)、た
とえ"CU"が検索されても書き換えは行わない。なぜな
ら、それらはまとめて一つの単語であり、一部分だけを
書き換えても意味がないばかりか、間違った翻訳結果を
出すことになるからである。
On the other hand, for example, "ICU" or "CU2538"
In the case where a character string such as an alphabet or a number exists immediately before or immediately after (S7: No), rewriting is not performed even if "CU" is searched. This is because they are one word at a time, and rewriting only part of them is not only meaningless but also gives incorrect translation results.

【0035】図6は、書き換えが行われた後の結果を示
す図である。書き換えられた後の英文はそのあと形態素
解析されて単語に区切られ、構文解析で単語が句にまと
められた後、係り受け等の解析が行われる。その後、構
文変換で単語には対訳が当てられ、英語の構造データが
日本語の構造データに変換される。そして構文生成で日
本語文が生成されて、形態素生成で活用変化などの語尾
変化を行った後、最終的に日本語の翻訳結果が出力され
る(S9〜S14)。
FIG. 6 is a diagram showing a result after rewriting is performed. The rewritten English sentence is then morphologically analyzed and divided into words. After the words are compiled into phrases by syntax analysis, dependency analysis is performed. Thereafter, the words are translated in the syntax conversion, and the English structural data is converted into Japanese structural data. Then, a Japanese sentence is generated by syntax generation, and an inflection such as inflection change is performed by morpheme generation, and finally, a Japanese translation result is output (S9 to S14).

【0036】尚、本実施形態の機械翻訳装置は、口語書
き換え辞書、口語書き換え指示プログラム、口語書き換
えプログラム、及び口語書き換え禁止プログラム等を含
む機械翻訳処理プログラムがROMに予め格納されて構
成されていたが、本発明は必ずしもこれに限定されるも
のではない。例えば、これらのプログラムをフロッピー
ディスクやCD−ROM等の、コンピュータ読み取り可
能な記録媒体に記録し、コンピュータに付属または接続
した読み取り装置により読み取って、コンピュータにイ
ンストールさせることにより、そのコンピュータを上述
の実施の形態の機械翻訳装置と同様に動作させることが
できる。また、前記プログラムを、有線もしくは無線回
線を介して外部情報処理装置よりコンピュータに読み込
んで動作させることもできる。この場合、前記フロッピ
ーディスクやCD−ROMや、外部情報処理装置の当該
プログラムを格納したメモリが本発明のコンピュータ読
み取り可能な記録媒体を構成する。
The machine translation apparatus according to the present embodiment is configured such that a machine translation processing program including a spoken language rewriting dictionary, a spoken language rewriting instruction program, a spoken language rewriting program, a spoken language rewriting prohibition program, and the like are stored in a ROM in advance. However, the present invention is not necessarily limited to this. For example, these programs are recorded on a computer-readable recording medium such as a floppy disk or a CD-ROM, read by a reading device attached to or connected to the computer, and installed in the computer, whereby the computer is executed as described above. Can be operated in the same manner as the machine translation device of the embodiment. Further, the program may be read from an external information processing device into a computer via a wired or wireless line and operated. In this case, the floppy disk, the CD-ROM, or the memory of the external information processing device that stores the program constitutes the computer-readable recording medium of the present invention.

【0037】[0037]

【発明の効果】以上に説明したことから明らかなよう
に、本発明の請求項1に記載の機械翻訳装置によれば、
口語書き換え辞書を備えることによって、略語表記を含
む口語体で書かれた文章であっても、翻訳処理前のユー
ザー自身の手による編集を必要とすることなく、正しい
翻訳結果が得られる機械翻訳装置を提供することがで
き、さらに、前記口語書き換え辞書は、口語の略語及び
それに対応する正式表記のデータをユーザーが任意に登
録したり削除したりすることもできる。
As is apparent from the above description, according to the machine translation apparatus according to the first aspect of the present invention,
By providing a colloquial rewriting dictionary, a machine translation device that can obtain correct translation results even for sentences written in colloquial style including abbreviations without requiring editing by the user himself before translation processing In addition, the colloquial rewriting dictionary may allow the user to arbitrarily register or delete the abbreviations of the colloquial language and the data of the formal notation corresponding thereto.

【0038】請求項2に記載の機械翻訳装置によれば、
前記口語書き換え辞書を参照して前記略語を正しい表記
に書き換える処理を行うか否かをユーザーが選択するこ
とにより、口語文が含まれない定型文書を翻訳する際
に、前記書き換え処理を経る必要がないため、あらゆる
タイプの文章を高速に翻訳処理することができる。
According to the machine translation device of the second aspect,
When the user selects whether or not to perform the process of rewriting the abbreviation to the correct notation by referring to the colloquial rewriting dictionary, there is no need to go through the rewriting process when translating a standard document that does not include colloquial sentences. Therefore, all types of sentences can be translated at high speed.

【0039】請求項3に記載の機械翻訳装置によれば、
前記書き換えが処理指示された場合には、翻訳対象文書
中に存在する口語書き換え辞書に登録された略語を正式
な表記に書き換えることにより、略語表記を含む口語体
で書かれた文章であっても、翻訳処理前のユーザー自身
の手による編集を必要とすることなく、正しい翻訳結果
が得られる機械翻訳装置を提供することができる。
According to the machine translation device of the third aspect,
If the rewriting is instructed to process, by rewriting the abbreviations registered in the colloquial rewriting dictionary present in the translation target document to a formal notation, even if the sentence is written in a colloquial style including the abbreviation notation, It is possible to provide a machine translation apparatus that can obtain a correct translation result without requiring editing by the user himself before the translation processing.

【0040】請求項4に記載の機械翻訳装置によれば、
書き換え処理が指示された場合でも、書き換えてはいけ
ない場合には書き換えを行わないようにして、不適切な
書き換えを避けることができる。
According to the machine translation device of the fourth aspect,
Even when rewriting processing is instructed, if rewriting should not be performed, rewriting is not performed, and inappropriate rewriting can be avoided.

【0041】請求項5に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、その記録媒体を用いてプログラムを実行することに
より、略語表記を含む口語体で書かれた文章であって
も、翻訳処理前のユーザー自身の手による編集を必要と
することなく、正しい翻訳結果が得られると共に、口語
の略語及びそれに対応する正式表記のデータをユーザー
が任意に登録したり、削除したりすることができる。
According to a computer-readable recording medium on which the machine translation processing program according to claim 5 is recorded, by executing the program using the recording medium, a sentence written in a colloquial style including abbreviations is obtained. Even if there is a translation process, correct translation results can be obtained without the need for editing by the user himself before the translation process, and the user can arbitrarily register or delete spoken abbreviations and corresponding formal notation data Or you can.

【0042】請求項6に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、その記録媒体を用いてプログラムを実行することに
より、前記口語書き換え辞書を参照して前記略語を正し
い表記に書き換える処理を行うか否かをユーザーが選択
することができるため、口語文が含まれない定型文書を
翻訳する際に、前記書き換え処理を経る必要がなく、あ
らゆるタイプの文章を高速に翻訳処理することができ
る。
According to a computer-readable recording medium on which the machine translation processing program according to claim 6 is recorded, by executing the program using the recording medium, the abbreviation is referred to by referring to the spoken word rewriting dictionary. Since the user can select whether or not to perform a process of rewriting to a correct notation, when translating a standard document that does not include a colloquial sentence, there is no need to go through the rewriting process, and all types of sentences can be translated at high speed. Can be processed.

【0043】請求項7に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、その記録媒体を用いてプログラムを実行することに
より、前記書き換えが処理指示された場合には、翻訳対
象文書中に存在する口語書き換え辞書に登録された略語
を正式な表記に書き換えることにより、略語表記を含む
口語体で書かれた文章であっても、翻訳処理前のユーザ
ー自身の手による編集を必要とすることなく、正しい翻
訳結果が得られる機械翻訳装置を提供することができ
る。
According to a computer-readable recording medium on which the machine translation processing program according to claim 7 is recorded, by executing the program using the recording medium, when the rewriting is instructed, By rewriting abbreviations registered in the spoken word rewriting dictionary that exists in the translation target document to formal notation, even if the sentence is written in colloquial style including abbreviation notation, it can be edited by the user himself before translation processing. A machine translation device that can obtain a correct translation result without requiring it can be provided.

【0044】請求項8に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、その記録媒体を用いてプログラムを実行することに
より、書き換え処理が指示された場合でも、書き換えて
はいけない場合には書き換えを行わないようにして、不
適切な書き換えを避けることができる。
According to the computer-readable recording medium on which the machine translation processing program described in claim 8 is recorded, the program is executed using the recording medium, so that even if rewriting processing is instructed, the program is rewritten. If it is not possible, rewriting is not performed and inappropriate rewriting can be avoided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態の機械翻訳装置の構成を示すブロ
ック図である。
FIG. 1 is a block diagram illustrating a configuration of a machine translation device according to an embodiment.

【図2】口語書き換え辞書の内部データの構成を示す図
である。
FIG. 2 is a diagram showing a configuration of internal data of a colloquial rewriting dictionary.

【図3】本実施の形態の翻訳処理の流れを示すフローチ
ャートである。
FIG. 3 is a flowchart illustrating a flow of a translation process according to the present embodiment.

【図4】翻訳対象の電子メールの一例を示す図である。FIG. 4 is a diagram showing an example of an electronic mail to be translated.

【図5】前記電子メールに対する書き換え処理の一段階
を示す図である。
FIG. 5 is a diagram showing one stage of a rewriting process for the electronic mail.

【図6】前記電子メールに対する書き換え処理の結果を
示す図である。
FIG. 6 is a diagram showing a result of a rewriting process for the electronic mail.

【符号の説明】[Explanation of symbols]

10 入力部 20 出力部 50 ROM 52 形態素解析部 53 構文解析部 54 構文変換部 55 構文生成部 56 形態素生成部 57 翻訳辞書 62 口語書き換え辞書 DESCRIPTION OF SYMBOLS 10 Input part 20 Output part 50 ROM52 Morphological analysis part 53 Syntax analysis part 54 Syntax conversion part 55 Syntax generation part 56 Morphological generation part 57 Translation dictionary 62 Colloquial rewriting dictionary

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 第一言語を入力するための入力部と、入
力された第一言語を単語に分割するための形態素解析部
と、前記第一言語の構文を解析するための構文解析部
と、解析された第一言語の構文を第二言語の構文に変換
し、得られた第二言語の構文から第二言語の翻訳文を生
成するための翻訳文生成部と、前記各部における処理の
ために用いられる辞書と、生成された第二言語の翻訳文
を出力するための出力部とを備える機械翻訳装置におい
て、 前記辞書は、翻訳処理されるべき単語が口語で用いられ
る略語である場合に、これを正式な表記に書き換えるた
めの口語書き換え辞書を備えることを特徴とする機械翻
訳装置。
1. An input unit for inputting a first language, a morphological analysis unit for dividing the input first language into words, and a syntax analysis unit for analyzing a syntax of the first language. A translated sentence generating unit for converting the analyzed syntax of the first language into a syntax of the second language, and generating a translated sentence of the second language from the obtained syntax of the second language, A machine translation device comprising: a dictionary used for translation; and an output unit for outputting the generated translation of the second language, wherein the dictionary is an abbreviation used in colloquial words to be translated. And a colloquial rewriting dictionary for rewriting this into formal notation.
【請求項2】 前記略語を前記口語書き換え辞書を参照
して正式な表記に書き換える処理を行うか否かをユーザ
ーが選択するための口語書き換え指示手段を備えること
を特徴とする請求項1に記載の機械翻訳装置。
2. The system according to claim 1, further comprising a spoken word rewriting instructing means for allowing a user to select whether or not to perform a process of rewriting the abbreviation into a formal notation by referring to the spoken word rewriting dictionary. Machine translation equipment.
【請求項3】 前記口語書き換え指示手段によって前記
書き換え処理が指示された場合には、翻訳対象文書中
の、口語書き換え辞書に登録された単語を、正式な表記
に書き換える口語書き換え手段を備えることを特徴とす
る請求項2に記載の機械翻訳装置。
3. When the rewriting process is instructed by the spoken word rewriting instructing means, a spoken word rewriting means for rewriting a word registered in the spoken word rewriting dictionary in the document to be translated into a formal notation is provided. 3. The machine translation device according to claim 2, wherein:
【請求項4】 前記口語書き換え指示手段によって前記
書き換え処理が指示された場合であっても、前記略語が
書き換えすべきでない単語であった場合は書き換えを行
うことなく出力する口語書き換え禁止手段を備えること
を特徴とする請求項3に記載の機械翻訳装置。
4. A colloquy rewriting prohibition unit that outputs without rewriting if the abbreviation is a word that should not be rewritten, even when the rewriting process is instructed by the colloquy rewriting instructing unit. 4. The machine translation apparatus according to claim 3, wherein:
【請求項5】 入力された第一言語を単語に分割するた
めの形態素解析手順と、前記第一言語の構文を解析する
ための構文解析手順と、解析された第一言語の構文を第
二言語の構文に変換し、得られた第二言語の構文から第
二言語の翻訳文を生成するための翻訳文生成手順とを機
械翻訳装置に実行させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体であって、 翻訳処理されるべき単語が口語で用いられる略語である
場合に、これを正式な表記に書き換えるために、口語書
き換え辞書を参照しながら、前記略語を正式な表記に書
き換える口語書き換え手順を機械翻訳装置に実行させる
ためのプログラムを記録したことを特徴とする、機械翻
訳処理プログラムを記録したコンピュータ読み取り可能
な記録媒体。
5. A morphological analysis procedure for dividing the input first language into words, a syntax analysis procedure for analyzing the syntax of the first language, and a syntax analysis procedure for analyzing the syntax of the first language. A computer-readable recording which records a program for causing a machine translation apparatus to execute a translation generation procedure for generating a translation of a second language from the obtained syntax of a second language after conversion into a language syntax. If the word to be translated is a medium and is an abbreviation used in a spoken language, in order to rewrite the word into a formal notation, referring to a colloquial rewriting dictionary, the abbreviation is rewritten into a formal notation. A computer-readable recording medium on which a machine translation processing program is recorded, wherein a program for causing a machine translation apparatus to execute a procedure is recorded.
【請求項6】 前記略語を前記口語書き換え辞書を参照
して正式な表記に書き換える処理を行うか否かをユーザ
ーが選択するための口語書き換え指示プログラムを記録
したことを特徴とする、請求項5に記載の機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体。
6. A colloquial rewriting instruction program for allowing a user to select whether or not to perform a process of rewriting the abbreviation into a formal notation with reference to the colloquial rewriting dictionary is recorded. A computer-readable recording medium on which the machine translation processing program described in 1 above is recorded.
【請求項7】 前記口語書き換え指示プログラムによっ
て前記書き換え処理が指示された場合に、翻訳対象文書
中の、口語書き換え辞書に登録された単語を、正式な表
記に書き換える口語書き換えプログラムを記録したこと
を特徴とする、請求項6に記載の機械翻訳処理プログラ
ムを記録したコンピュータ読み取り可能な記録媒体。
7. A spoken word rewriting program for rewriting words registered in a spoken word rewriting dictionary in a translation target document into a formal notation when the rewriting process is instructed by the spoken word rewriting instruction program. A computer-readable recording medium recording the machine translation processing program according to claim 6.
【請求項8】 前記口語書き換えプログラムは、前記口
語書き換え指示プログラムによって前記書き換え処理が
指示された場合であっても、前記略語が書き換えすべき
でない単語であった場合は書き換えを行うことなく出力
する口語書き換え禁止プログラムを備えることを特徴と
する、請求項7に記載の機械翻訳処理プログラムを記録
したコンピュータ読み取り可能な記録媒体。
8. The colloquial rewriting program outputs the abbreviation without rewriting if the abbreviation is a word that should not be rewritten, even when the rewriting process is instructed by the colloquial rewriting instruction program. A computer-readable recording medium storing the machine translation processing program according to claim 7, comprising a spoken language rewriting prohibition program.
JP9148834A 1997-06-06 1997-06-06 Machine translation device and computer-readable recording medium where machine translation processing program is recorded Pending JPH10340264A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9148834A JPH10340264A (en) 1997-06-06 1997-06-06 Machine translation device and computer-readable recording medium where machine translation processing program is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9148834A JPH10340264A (en) 1997-06-06 1997-06-06 Machine translation device and computer-readable recording medium where machine translation processing program is recorded

Publications (1)

Publication Number Publication Date
JPH10340264A true JPH10340264A (en) 1998-12-22

Family

ID=15461784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9148834A Pending JPH10340264A (en) 1997-06-06 1997-06-06 Machine translation device and computer-readable recording medium where machine translation processing program is recorded

Country Status (1)

Country Link
JP (1) JPH10340264A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024564A (en) * 2014-07-17 2016-02-08 富士通株式会社 Translation original text correction support apparatus, support method and program
JP2016149019A (en) * 2015-02-12 2016-08-18 セイコーソリューションズ株式会社 Order management system, electronic apparatus and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024564A (en) * 2014-07-17 2016-02-08 富士通株式会社 Translation original text correction support apparatus, support method and program
JP2016149019A (en) * 2015-02-12 2016-08-18 セイコーソリューションズ株式会社 Order management system, electronic apparatus and program

Similar Documents

Publication Publication Date Title
JP3377290B2 (en) Machine translation device with idiom processing function
JPH09259127A (en) Translation device
JPH0644296A (en) Machine translating system
JPH0535783A (en) Translating device for document with typographical information
JPH10340264A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded
JP2632806B2 (en) Language analyzer
JP2715419B2 (en) Translation equipment
JP3197110B2 (en) Natural language analyzer and machine translator
JP3692711B2 (en) Machine translation device
JPH0561902A (en) Mechanical translation system
JP3680489B2 (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program
JP3389313B2 (en) Machine translation equipment
JPH1173413A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded
JPS63136265A (en) Mechanical translating device
JPH11265381A (en) Method and device for converting language and recording medium for programming and recording the method
JP3233800B2 (en) Machine translation equipment
JP3048793B2 (en) Character converter
JPH10340266A (en) Machine translation device, and computer-readable recording medium where machine translation processing program is recorded
JP3353873B2 (en) Machine translation equipment
JP2002132763A (en) Device and method for rewriting original text
JPH05225232A (en) Automatic text pre-editor
JPH0550778B2 (en)
JPH10134054A (en) Document preparation support device
JPH10134055A (en) Document preparation support device and medium storing document preparation support program
JPH1166072A (en) Machine translation device and computer readable recording medium with recorded machine translation processing program