JPH09179868A - Translation correspondence support system - Google Patents

Translation correspondence support system

Info

Publication number
JPH09179868A
JPH09179868A JP7340145A JP34014595A JPH09179868A JP H09179868 A JPH09179868 A JP H09179868A JP 7340145 A JP7340145 A JP 7340145A JP 34014595 A JP34014595 A JP 34014595A JP H09179868 A JPH09179868 A JP H09179868A
Authority
JP
Japan
Prior art keywords
correspondence
sentence
language
text
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7340145A
Other languages
Japanese (ja)
Other versions
JP3311567B2 (en
Inventor
Takefumi Yamazaki
毅文 山崎
Masahiko Haruno
雅彦 春野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP34014595A priority Critical patent/JP3311567B2/en
Publication of JPH09179868A publication Critical patent/JPH09179868A/en
Application granted granted Critical
Publication of JP3311567B2 publication Critical patent/JP3311567B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily make a translation correspond and confirm, correct, and delete the correspondence relation. SOLUTION: A translation correspondence computing mechanism 10 inputs a Japanese sentence text file 20 and an English sentence text file 21 of its translation, and finds and outputs pairs of Japanese sentences and English sentences in correspondence relation to a correspondence relation file 22. A correspondence relation display mechanism 11 inputs the Japanese sentence text file 20, English sentence text file 21, and correspondence relation file 22 and displays the Japanese sentences, English sentences, and their correspondence relations on the display screen of a graphical terminal 3 by using a graphical interface. A correspondence relation correcting mechanism 12 confirms, deletes, and adds correspondence relations as a user operates a mouse cursor and a mouse button.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、機械翻訳、知識ベース
システム等の自然言語システムに係わり、詳しくは、対
訳テキストから知識を自動的に学習するシステムに好適
な計算機による対訳文対応付け支援システムに関すもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language system such as a machine translation system or a knowledge base system, and more specifically, a computer-aided parallel sentence correspondence support system suitable for a system for automatically learning knowledge from parallel texts. It is related to.

【0002】[0002]

【従来の技術】従来の計算機による対訳文対応付け支援
システムは、対応付けを取る対象の2カ国語のテキスト
を画面上に表示し、その画面を参照しながら、対応する
ペアを入力できるような環境を提供することにより行っ
ていた。例えば、図2で示すように、別個のウィンドウ
(ウィンドウ1、ウィンドウ2)上に日本語、英語のテ
キストを別々に表示し、該テキスト中の対応するペアを
別ウィンドウ(ウィンドウ3)であるエデイタ上で入力
編集できるような環境を提供することで、対訳文の対応
付け支援を行っていた。
2. Description of the Related Art A conventional computer-based bilingual text matching support system displays texts in two languages to be matched on a screen and allows input of a corresponding pair while referring to the screen. It was done by providing the environment. For example, as shown in FIG. 2, Japanese and English texts are separately displayed in separate windows (window 1 and window 2), and the corresponding pairs in the texts are edited in another window (window 3). By providing an environment in which input and editing can be performed above, the support for associating bilingual sentences was performed.

【0003】[0003]

【発明が解決しようとする課題】上記従来技術は、計算
機を利用せずに紙上で対応付けをすることに比べると、
対訳文の対応付け作成に要する時間を短縮できるが、次
のような課題を有していた。即ち、従来の支援システム
では、対応ペアを入力する場合、あるいは、既に入力さ
れたペアを確認/修正する場合、日本語文テキスト、英
語文テキスト、対応関係ウィンドウと3つの画面を別々
に見る必要があり、対応関係を直感的に入力できるよう
なインタフェースでなかったため、対応関係の入力/確
認/修正、大変な労力を要し、また、対応付けは、一か
らユーザが行なうこととなるので、実際には対応付け作
成に大変な時間を要していた。
The above-mentioned prior arts are, in comparison with the correspondence on paper without using a computer,
Although it is possible to reduce the time required to create the correspondence of the bilingual sentences, there are the following problems. That is, in the conventional support system, when inputting a corresponding pair, or confirming / correcting an already input pair, it is necessary to separately view the Japanese sentence text, the English sentence text, the correspondence window and the three screens. However, since the interface is not an interface that allows intuitive input of correspondence, it requires a great deal of labor for inputting / confirming / correcting the correspondence, and since the user must perform the correspondence from scratch, Took a long time to create the correspondence.

【0004】本発明の目的は、上記の問題点を解決すべ
く、対訳テキストが与えられた時に、対訳文の対応付け
を計算機上で簡単に行える対訳文対応付け支援システム
を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a bilingual sentence associating support system capable of easily associating a bilingual sentence with a computer when a bilingual text is given in order to solve the above problems. .

【0005】[0005]

【課題を解決するための手段】本発明の対訳文対応付け
支援システムは、2ヶ国語の対応テキストを入力し、対
応関係にある一方の言語の文と他方の言語の文のペアを
求める対訳文対応付け計算機構と、前記求まった対応関
係にある一方の言語の文と他方の言語の文のペアをグラ
フィカルなインタフェースを用いて表示する対応関係表
示機構と、前記表示された一方の言語の文と他方の言語
の文の対応関係を、利用者の指示に応じて修正する対応
関係修正機構とを有することを要旨とする。
The bilingual sentence association support system of the present invention inputs bilingual corresponding texts and obtains a pair of sentences in one language and another sentence in a corresponding relationship. A sentence correspondence calculation mechanism, a correspondence relation display mechanism for displaying a pair of sentences of one language and a sentence of the other language in the obtained correspondence relation by using a graphical interface, and a correspondence relation display mechanism of the one displayed language. It is a gist to have a correspondence correction mechanism that corrects the correspondence between a sentence and a sentence in the other language according to a user's instruction.

【0006】このように、対応付けが直接入力可能なグ
ラフィカルインタフェースの提供により、対応関係の削
除/修正/確認の簡単化を実現し、また、対訳文対応付
け計算機構を組み込むことにより、対応付け作成に要す
る時間の大幅な短縮が実現できる。ユーザは、グラフィ
カル端末上に表示された一方の言語の文と他方の言語の
文の対応関係の確認/修正/削除を、マウス操作で簡単
に行うことが可能になる。
As described above, by providing the graphical interface in which the correspondence can be directly input, simplification of deletion / correction / confirmation of the correspondence is realized, and by incorporating the parallel translation text correspondence calculation mechanism, the correspondence is associated. The time required for creation can be greatly reduced. The user can easily confirm / correct / delete the correspondence between the sentence in one language and the sentence in the other language displayed on the graphical terminal by operating the mouse.

【0007】[0007]

【発明の実施の形態】以下、図面を用いて本発明の一実
施例を説明する。なお、実施例では、対応テキストは日
本語文テキストと英語テキストとする。
DETAILED DESCRIPTION OF THE INVENTION An embodiment of the present invention will be described below with reference to the drawings. In the embodiment, the corresponding texts are Japanese texts and English texts.

【0008】図1は、本発明の一実施例に係わる対訳文
対応付け支援システムの概略構成を示すブロック図であ
る。本対訳文対応付け支援システムは、対訳文対応付け
計算機構10、対応関係表示機構11及び対応関係修正
機構12からなる支援装置本体(CPU等)1と、日本
語文テキストファイル20、英文テキストファイル2
1、対応関係ファイル22等を格納する外部記憶装置群
2、支援装置本体1と利用者のインタフェース機能をは
たすグラフィ端末3などで構成される。
FIG. 1 is a block diagram showing a schematic configuration of a bilingual sentence association support system according to an embodiment of the present invention. This bilingual sentence association support system includes a support device body (CPU or the like) 1 including a bilingual sentence association calculation mechanism 10, a correspondence display mechanism 11, and a correspondence correction mechanism 12, a Japanese text file 20, and an English text file 2.
1, an external storage device group 2 for storing the correspondence relationship file 22 and the like, a support device main body 1 and a graphic terminal 3 for providing a user interface function.

【0009】図1の構成において、対訳文対応付け計算
機構10は、日本語文テキストファイル20とその対訳
の英語文テキストファイル21とを入力として、対応関
係にある日本語文と英語文のペアを対応関係ファイル2
2に出力する。対応関係表示機構11は、対応関係ファ
イル22及び対応関係にある日本語文テキストファイル
20と英語文テキストファイル21を入力として、対応
関係にある日本語文と英語文のペアをグラフィカル端末
3に表示する。対応関係修正機構12は、前記対応関係
表示機構11で表示された対応関係を、グラフィカル端
末3上で利用者が修正するのに支援する。以下に、各機
構10、11、12の構成/動作を詳述する。
In the configuration of FIG. 1, the parallel translation sentence correspondence calculation mechanism 10 inputs a Japanese sentence text file 20 and an English sentence text file 21 of the parallel translation, and associates a pair of corresponding Japanese sentence and English sentence. Relationship file 2
Output to 2. The correspondence display mechanism 11 receives the correspondence file 22 and the corresponding Japanese text file 20 and English text file 21 as input, and displays the corresponding Japanese and English pairs on the graphical terminal 3. The correspondence correction mechanism 12 assists the user in correcting the correspondence displayed on the correspondence display mechanism 11 on the graphical terminal 3. The configuration / operation of each mechanism 10, 11, 12 will be described in detail below.

【0010】〈対訳文対応付け計算機構10〉対訳文対
応付け計算機構10は、入力として与えられた日本語文
テキスト、英語文テキストを解析し、統計情報と辞書情
報に基づいて得られる日本語単語、英語単語の訳語対を
基に、対応する日本語文、英語文のペアを出力する。ま
ず、統計情報と辞書情報を用いて、日本語単語、英語単
語の訳語対を求める。次に、対応する訳語対が、対応テ
キスト中の日本文、英語文に出現する回数をカウント
し、その数が十分大きいペアを、対応関係のあるペアと
する。
<Bilingual sentence correspondence calculation mechanism 10> The parallel translation sentence correspondence calculation mechanism 10 analyzes the Japanese sentence text and the English sentence text given as inputs, and obtains Japanese words based on statistical information and dictionary information. , Based on the translation pairs of English words, output the corresponding Japanese / English sentence pairs. First, using the statistical information and the dictionary information, the translation pairs of Japanese words and English words are obtained. Next, the number of times the corresponding translated word pair appears in the Japanese sentence and the English sentence in the corresponding text is counted, and a pair having a sufficiently large number is set as a pair having a corresponding relation.

【0011】図3に、対訳文対応付け計算機構10の一
実施例の構成図を示す。本対訳文対応付け計算機構10
は対応テキスト入力部101、形態素解析部102、類
似度計算部103、文対応推定部104、後処理部10
5、対応関係出力部106、単語対ファイル107、及
び既存の対訳辞書108からなる。
FIG. 3 is a block diagram showing an embodiment of the parallel translation sentence correspondence calculation mechanism 10. Book translation calculator 10
Is a corresponding text input unit 101, a morphological analysis unit 102, a similarity calculation unit 103, a sentence correspondence estimation unit 104, and a post-processing unit 10.
5, a correspondence output unit 106, a word pair file 107, and an existing bilingual dictionary 108.

【0012】対応テキスト入力部101は、日本語文テ
キストファイル20とその対訳の英語文テキストファイ
ル21を入力する。形態素解析部102は、入力された
日本語文テキストと英語文テキストのそれぞれについて
形態素解析を行い、必要な品詞の単語だけを選び出す。
以後の対応付けでは、ここで取り出された単語だけが利
用される。また、入力された日英テキスト中の文数から
初期的な文対応可能関係が作られる。この初期的関係で
は、それぞれのテキストの先頭、終末同士は対応し、そ
れ以外の対応関係には幅を持たせる。対応の幅は、テキ
ストの両端では小さく、テキストの中央には近いほど大
きく取る。図4に、この対応可能関係の例を示す。対応
の幅はテキストの両端では小さく、テキストの中央に近
いほど大きくなっている。対応可能関係の数は日本語の
文数だけある。
Corresponding text input unit 101 inputs Japanese sentence text file 20 and its translated English sentence text file 21. The morpheme analysis unit 102 performs morpheme analysis on each of the input Japanese sentence text and English sentence text, and selects only the necessary part-of-speech word.
In the subsequent correspondence, only the words extracted here are used. An initial sentence correspondence relationship is created from the number of sentences in the input Japanese-English text. In this initial relationship, the beginning and end of each text correspond to each other, and other correspondences have a width. The width of the correspondence is small at both ends of the text and large as it is close to the center of the text. FIG. 4 shows an example of this correspondence possibility. The width of the correspondence is small at both ends of the text, and increases toward the center of the text. There are as many correspondence relationships as there are Japanese sentences.

【0013】類似度計算部103は、形態素解析結果か
ら両言語の単語の対応可能関係を算出し、その相互情報
量を求め、更に統計的検定(t−test)により信性
的の高い単語対を選択して、単語対ファイル17に格納
する。いま、対応ペアi中j番目の日本語単語をJij
対応ペアi中k番目の英語単語をEikとする。また、N
(Jij)を単語Jijが現われる対応ペア数とする。ただ
し、1つの出現単語が複数のペアで二重に数えられない
ように管理する。この時、対応ペアi中の日、英の単語
ij、Eikの類似度は、以下の相互情報量I(Jij、E
ik)で与えられる。ここで、Prは確率、nはペアの総
数(即ち日本語テキストの文数)である。
The similarity calculator 103 calculates a correspondence relationship between words in both languages from the result of morphological analysis, obtains mutual information between them, and further uses a statistical test (t-test) to obtain highly reliable word pairs. Is selected and stored in the word pair file 17. Now, the j-th Japanese word in the corresponding pair i is J ij ,
The kth English word in the corresponding pair i is E ik . Also, N
Let (J ij ) be the number of corresponding pairs in which the word J ij appears. However, one occurrence word is managed so as not to be counted twice in a plurality of pairs. At this time, the similarity between the Japanese and English words J ij and E ik in the corresponding pair i is the mutual information I (J ij , E) below.
ik ). Here, Pr is a probability and n is the total number of pairs (that is, the number of sentences in Japanese text).

【0014】[0014]

【数1】 [Equation 1]

【0015】この相互情報量は、単語対Jij、Eikの出
現の割合を表わしており、これを利用することで日英の
単語の近さを計ることができる。ただし、相互情報量は
頻度の低い単語に対しても大きくなることがあるが、こ
れは統計的に信頼性が低い。そこで、類似度計算部10
3では、統計的検定(t−test)を合わせて行い、
信頼的の高い単語対のものだけを取り出す。この相互情
報量を取る操作を、図4に示したような、対応可能関係
中に含まれる(必要な品詞を持つ)全ての貯語の組合せ
について行なう。
This mutual information represents the rate of appearance of word pairs J ij and E ik , and by using this, the closeness of Japanese and English words can be measured. However, the mutual information can be large even for infrequent words, but this is statistically unreliable. Therefore, the similarity calculation unit 10
In 3, the statistical test (t-test) was performed together,
Only retrieve those with reliable word pairs. This operation of obtaining the mutual information amount is performed for all combinations of stored words (having a necessary part of speech) included in the correspondence relationship as shown in FIG.

【0016】文対応推定部104は、類似度計算部10
3で得られた単語対と既存の対訳辞書108を用いて、
日本文iと英文jの対応が支持される回数をカウント
し、所定の閾値にて文対応可能関係を絞り込む。具体的
には、該文対応推定部104では、以下のステップで日
本文iと英文jの対応が支持される回数を数えていく。
ここで、st、dicは外部から与えられるパラメータ
で、それぞれ統計、対訳辞書でサポートされた時に加え
る点数である。通常は、stをdicより大きく取る。 ステップ1:相互情報量の大きかった単語ペア順に、こ
の操作を適用する。即ち、日本文iと英文jにそのペア
が含まれ、かつ、日本文iの対応ペアに含まれる英文で
他にその英単語を含むものが無ければ、日本文iと英文
jの組合せにstを加える。なお、このステップに非公
差の条件を加えることも可能である。 ステップ2:日本文iと英文jに対訳辞書の単語ペアが
含まれ、かつ、日本文iの対応ペアに含まれる英文で他
にその英単語を含むものが無ければ、日本文iと英文j
の組せにdicを加える。 ステップ3:ステップ1、2である閾値を越えた対応
は、確実な対応として確定する(この対応をアンカーと
呼ぶ)。次の繰り返しへの入力としてアンカーの列から
近しい文対応可能関係を構成する。2つのアンカーに挟
まれる部分の対応可能関係は幅を持つが、その幅はアン
カーに近いほど小さく、アンカーの中央に近いほど大き
く取る。
The sentence correspondence estimation unit 104 includes a similarity calculation unit 10.
Using the word pairs obtained in No. 3 and the existing bilingual dictionary 108,
The number of times the correspondence between the Japanese sentence i and the English sentence j is supported is counted, and the sentence correspondence possible relationship is narrowed down by a predetermined threshold value. Specifically, the sentence correspondence estimation unit 104 counts the number of times the correspondence between the Japanese sentence i and the English sentence j is supported in the following steps.
Here, st and dic are parameters given from the outside, and are scores added when supported by statistics and bilingual dictionaries, respectively. Usually, st is set larger than dic. Step 1: This operation is applied in the order of word pairs with the largest mutual information. That is, if the Japanese sentence i and the English sentence j include the pair and there is no other English sentence included in the corresponding pair of the Japanese sentence i including the English word, the combination of the Japanese sentence i and the English sentence j is st. Add. It is also possible to add a non-tolerance condition to this step. Step 2: If the Japanese sentence i and the English sentence j include a word pair in the bilingual dictionary, and there is no other English sentence included in the corresponding pair of the Japanese sentence i including the English word, the Japanese sentence i and the English sentence j.
Add dic to the set. Step 3: Correspondences exceeding the thresholds of Steps 1 and 2 are confirmed as reliable correspondences (this correspondence is called an anchor). Construct a close sentence-correspondence relationship from a row of anchors as input to the next iteration. The correspondence between the portions sandwiched by the two anchors has a width, but the width is smaller as it is closer to the anchor and larger as it is closer to the center of the anchor.

【0017】以上の類似度計算部103および文対応推
定部104の処理を文対応可能関係が収束するまで繰り
返す。これにより、入力された日英テキスト間の文対応
関係を得ることが出来る。
The processes of the similarity calculation unit 103 and the sentence correspondence estimation unit 104 described above are repeated until the sentence correspondence possibility relationship converges. As a result, it is possible to obtain the sentence correspondence between the input Japanese and English texts.

【0018】後処理部105は、収束した文対応可能関
係から所定の支持回数を持つ文対応ペアを選択する。即
ち、文対応可能関係では、支持回数の低い日本文は多く
の対応英文を持つ。そこで後処理部105では、それら
の対応に支持回数の有意な差がある場合には、多くの支
持回数をもつ文だけを対応関係として選び、どの対応の
支持回数も小さい場合は、その日本文は対応英文を持た
ないと判断する。対応関係出力部106は、後処理部1
05で選択された日英文対応ペアを対応関係ファイル2
2へ出力する。
The post-processing unit 105 selects a sentence correspondence pair having a predetermined support frequency from the converged sentence correspondence correspondence relationship. That is, in the sentence correspondence relationship, a Japanese sentence with a low support frequency has many corresponding English sentences. Therefore, in the post-processing unit 105, when there is a significant difference in the number of support times between the correspondences, only a sentence having a large number of support times is selected as a correspondence relationship, and when the support frequency of any correspondence is small, the Japanese sentence is It is determined that there is no corresponding English sentence. The correspondence output unit 106 is the post-processing unit 1.
Correspondence file 2 for the English-Japanese correspondence pair selected in 05
Output to 2.

【0019】〈対応関係表示機構11〉対応関係表示機
構11は、日本語文テキストファイル20とその対訳の
英語文テキストファイル21及び対応関係ファイル22
を入力して、グラフィカル端末3上に、対応関係にある
日本語文と英語文のペアをグラフィカルなインタフェー
スを用いて表示する。
<Correspondence Relationship Display Mechanism 11> The correspondence relationship display mechanism 11 includes a Japanese sentence text file 20, an English sentence text file 21 of its parallel translation, and a correspondence relationship file 22.
Is input to display a pair of corresponding Japanese and English sentences on the graphical terminal 3 using a graphical interface.

【0020】図5は、対応関係表示機構11の一実施例
の構成図であり、全体ウィンドウ描画モジュール11
1、日本文テキスト及びノード描画モジュール112、
スクロールバー描画モジュール114、及び対応関係描
画モジュール115から構成される。
FIG. 5 is a block diagram of an embodiment of the correspondence display mechanism 11, showing the whole window drawing module 11.
1, Japanese text and node drawing module 112,
It is composed of a scroll bar drawing module 114 and a correspondence drawing module 115.

【0021】まず、全体ウィンドウ描画モジュール11
1は、表示に使う全体のウィンドウの大きさを決定し、
端末3の表示面に描画する。次に、日本文テキスト及び
ノード描画モジュール112では、日本語テキストファ
イル20を入力として、表示面上の上記描画された全体
ウィンドウの左側に、日本文テキストと文番号、及び、
各文に対応するノードを表わす図形(例えば、円)を描
画する。同様に、英語文テキスト及びノード描画モジュ
ール113では、英語文テキストファイル21を入力と
して、全体ウィンドウの右側に、英語文テキストと文番
号、及び、各文に対応するノードを表わす図形(例え
ば、円)を描画する。次に、スクロールバー描画モジュ
ール114は、全体ウィンドウの右端に、日本文テキス
トと英語文テキストの両者をスクロールできるように、
スクロールバーを描画する。最後に、対応関係描画モジ
ュール115は、対応関係ファイル22を入力として、
対応関係のある日本語文/英語文のノード間に図形(例
えば直線)を描画する。なお、これらの各モジュール
は、一般的なGUI(graphic user interface)言語、
例えば、Tcl/Tk(johnK.Ousterhout「Tcl and t
he Tk Toolkit」Addisson-Wesley)を用いて実現で
きる。
First, the whole window drawing module 11
1 determines the size of the entire window used for display,
Drawing on the display surface of the terminal 3. Next, in the Japanese text and node drawing module 112, the Japanese text file 20 is input, and the Japanese text and the sentence number are displayed on the left side of the entire window drawn on the display surface, and
A figure (for example, a circle) representing a node corresponding to each sentence is drawn. Similarly, in the English sentence text and node drawing module 113, the English sentence text file 21 is input, and on the right side of the entire window, the English sentence text and the sentence number, and a graphic representing a node corresponding to each sentence (for example, a circle). ) Is drawn. Next, the scroll bar drawing module 114 can scroll both Japanese text and English text at the right end of the entire window.
Draw the scroll bar. Finally, the correspondence drawing module 115 receives the correspondence file 22 as an input,
A figure (for example, a straight line) is drawn between nodes of a Japanese sentence / English sentence having a correspondence relationship. Note that each of these modules uses a general GUI (graphic user interface) language,
For example, Tcl / Tk (john K. Ousterhout "Tcl and t
he Tk Tooolkit "Addisson-Wesley).

【0022】本対応関係表示機構11の実行により、最
終的に端末3の表示面には、図6で示すような日本語テ
キストと英語テキスト、日本語文英語文対応関係、及
び、スクロールバーが表示される。
By executing the correspondence display mechanism 11, finally, on the display surface of the terminal 3, the Japanese text and the English text, the Japanese-English correspondence, and the scroll bar as shown in FIG. 6 are displayed. To be done.

【0023】〈対応関係修正機構12〉対応関係修正機
構12は、端末3の表示面上に表示された対応関係を、
利用者の指示に従って修正する。
<Correspondence Correction Mechanism 12> The correspondence correction mechanism 12 changes the correspondence displayed on the display surface of the terminal 3 into
Correct according to the user's instructions.

【0024】図7は、対応関係修正機構12の一実施例
の構成図で、確認モジュール121、削除モジュール1
22、及び追加描画モジュール123の3つのモジュー
ルから構成される。各モジュールは、端末3の利用者が
操作するマウスによるイベント処理を扱う。各モジュー
ル121、122、123が行なうイベント処理の手順
を、各々、図8、図9、図10に示す。
FIG. 7 is a block diagram of an embodiment of the correspondence correction mechanism 12, which includes a confirmation module 121 and a deletion module 1.
22 and an additional drawing module 123. Each module handles event processing by a mouse operated by the user of the terminal 3. The procedure of event processing performed by each module 121, 122, 123 is shown in FIGS. 8, 9 and 10, respectively.

【0025】確認モジュール121では、図6の対応関
係表示例において、マウスカーソルがノード間を結ぶ図
形(ここでは直線)上に入った状態で(ステップ121
1)、マウスのボタン(例えば左ボタン)が押された時
(ステップ1212)、マウスカーソル上にある線の属
性(例えば、線の色)を変更する(ステップ121
3)。
In the confirmation module 121, in the correspondence display example of FIG. 6, with the mouse cursor placed on a figure (a straight line in this case) connecting nodes (step 121)
1) When the mouse button (for example, the left button) is pressed (step 1212), the attribute (for example, line color) of the line on the mouse cursor is changed (step 121).
3).

【0026】削除モジュール122では、同様に図6の
対応関係表示例において、マウスカーソルがノード間を
結ぶ図形(ここでは直線)上に入った状態(ステップ1
221)で、マウスのボタン(例えば中ボタン)が押さ
れた時(ステップ1222)、マウスカーソル上にある
線を削除する(ステップ1223)。
Similarly, in the deletion module 122, in the correspondence display example of FIG. 6, the state where the mouse cursor is on a figure (a straight line in this case) connecting nodes (step 1)
221), when the mouse button (for example, the middle button) is pressed (step 1222), the line on the mouse cursor is deleted (step 1223).

【0027】追加描画モジュール123では、同様に図
6の対応関係表示例において、まず、マウスカーソルが
日本語文テキスト側にあるノードに入った状態で(ステ
ップ1231)、マウスのボタン(例えば左ボタン)が
押された時(ステップ1232)、新たに描画する線の
出発点が特定され、次に、マウスカーソルが英語テキス
ト側にあるノードに入った状態で(ステップ123
3)、マウスのボタン(例えば中ボタン)が押された時
(ステップ1234)、描画する線の到達点が特定さ
れ、両ノード間に新たに関係を表わす線が描画される
(ステップ1235)。
Similarly, in the additional drawing module 123, in the correspondence display example of FIG. 6, first, with the mouse cursor in a node on the Japanese sentence text side (step 1231), the mouse button (eg left button) When is pressed (step 1232), the starting point of the line to be newly drawn is specified, and then the mouse cursor enters the node on the English text side (step 123).
3) When the mouse button (for example, the middle button) is pressed (step 1234), the arrival point of the line to be drawn is specified, and a line representing a new relationship is drawn between both nodes (step 1235).

【0028】本対応関係修正機構12の各モジュール
も、前記対応関係表示機構11と同様に、一般的なGU
I言語、例えば、Tcl/Tkを用いて実現できる。特
に、上記のようなイベント処理は、Tcl/Tkを用い
ると、容易に実現できる。
Like the correspondence display mechanism 11, each module of the correspondence correction mechanism 12 is also a general GU.
It can be realized by using I language, for example, Tcl / Tk. In particular, the event processing as described above can be easily realized by using Tcl / Tk.

【0029】以上、本対訳文対応付け支援システムの主
要機構の構成/動作を説明した。以下に、本支援システ
ムを用いた、対応付け手順の例を示す。
The configuration / operation of the main mechanism of the bilingual text association support system has been described above. Below, an example of the association procedure using this support system is shown.

【0030】(1) まず、対応付け対象の日本語記事、
英語記事を選択し、日本語文テキストファイル20、英
語文テキストファイル21を生成する。なお、日本語文
テキスト及びその対訳の英語文テキストを直接入力する
ことでもよい。
(1) First, the Japanese article to be associated,
An English article is selected and a Japanese sentence text file 20 and an English sentence text file 21 are generated. The Japanese text and its parallel English text may be directly input.

【0031】(2) 対訳文対応付け計算機構10を走行
し、自動的に日本語文と英語文の対応付けを求め、対応
関係ファイル22を生成する。
(2) The parallel translation sentence correspondence calculation mechanism 10 is run to automatically find the correspondence between the Japanese sentence and the English sentence, and generate the correspondence relation file 22.

【0032】(3) 対応関係表示機構11を実行し、フ
ァイル20、21の日本語記事と英語記事、及び対応関
係ファイル22に基づいて両記事の対応関係をグラフィ
カル端末3上に表示する。即ち、(2)で対応付けられた
関係は、文番号ノード間に線を描画することで表わされ
る(図6)。
(3) The correspondence display mechanism 11 is executed to display the correspondence between both articles on the graphical terminal 3 based on the Japanese and English articles of the files 20 and 21, and the correspondence file 22. That is, the relationship associated in (2) is represented by drawing a line between the sentence number nodes (FIG. 6).

【0033】(4) 端末3の利用者は、対応関係修正機
構12の支援のもとに、3で描画された対応関係を正し
いかどうかを確認する。即ち、マウス操作により、確認
済のものは確認のマークを付け、正しくないものは削除
し、足りないものは追加する。具体的には、図11乃至
図12に示すようなマウス操作を行う。まず、正しいと
確認された対応関係は、該関係を表わす線上に、マウス
カーソルを移動し、マウスの左ボタンをクリックする
(図11)。すると、従来の線が例えば色変化し、この
線はユーザによる確認済の線であることが明示的に示さ
れる。正しくないと判定された対応関係は、該関係を表
わす線上にマウスのカーソルを移動し、マウスの中ボタ
ンをクリックする(図12)。すると、従来の線が削除
する。また、新たに文間の関係を追加する場合は、ま
ず、関係があると判断した一方の言語の文の文番号ノー
ドに、マウスのカーソルを移動し、マウスの左ボタンを
クリックし(図13の手順1)、次に、対応関係にある
もう一方の言語の文番号ノードに、マウスのカーソルを
移動し、マウスの中ボタンをクリックすることで(図1
3の手順2)、新たに、2つの文番号ノード間に線が描
画される(図13の手順3)。
(4) The user of the terminal 3 confirms, with the support of the correspondence correction mechanism 12, whether the correspondence drawn in 3 is correct. That is, by operating the mouse, the confirmed ones are marked for confirmation, the incorrect ones are deleted, and the missing ones are added. Specifically, the mouse operation as shown in FIGS. 11 to 12 is performed. First, for the correspondence relationship confirmed to be correct, move the mouse cursor onto the line representing the relationship and click the left button of the mouse (FIG. 11). Then, for example, the color of the conventional line is changed, and it is explicitly indicated that the line has been confirmed by the user. For the correspondence determined to be incorrect, move the cursor of the mouse on the line representing the relation and click the middle button of the mouse (FIG. 12). Then, the conventional line is deleted. To add a new sentence relation, first move the mouse cursor to the sentence number node of the sentence in one language that is determined to have a relation, and click the left mouse button (see FIG. 13). Procedure 1), then move the cursor of the mouse to the sentence number node of the other language in the correspondence and click the middle button of the mouse (Fig. 1).
3), a line is newly drawn between two sentence number nodes (procedure 3 in FIG. 13).

【0034】(5) 全体対応関係の確認が終了するま
で、(4)の操作を繰り返す。こうして、全対応関係が確
認されたなら、対応関係ファイル22内の削除・追加の
あった対応関係を同様に削除・追加する。
(5) The operation of (4) is repeated until the confirmation of the overall correspondence is completed. In this way, if all the correspondence relationships are confirmed, the correspondence relationships that have been deleted / added in the correspondence relationship file 22 are similarly deleted / added.

【0035】以上、実施例の説明では、対応付け対象を
日本語文テキストとその対訳の英語文テキストとした
が、勿論、本発明の対訳文対応付け支援システムは、日
英に限らず、一般に2ヶ国語の対応テキストに利用でき
ることは云うまでもない。
In the above description of the embodiment, the correspondence target is the Japanese text and the English text of its parallel translation, but of course, the parallel translation correspondence support system of the present invention is not limited to Japanese and English, but generally 2 Needless to say, it can be used for texts in various languages.

【0036】[0036]

【発明の効果】以上説明したように、本発明の対訳文対
応付け支援システムによれば、2ケ国語の対応テキスト
から、自動的に対訳文の対応関係を得て、グラフィカル
端末上に、該対応関係にある対訳文のペアを表示し、こ
の表示された対応関係の確認、修正、削除を、グラフィ
カルなインタフェースを用いて行なうので、従来手法に
よる対訳対応付けに比べて、対訳の対応付けされた対訳
文ペアの生成に要する時間を大幅に短縮することができ
る。
As described above, according to the bilingual text association support system of the present invention, the bilingual text correspondence is automatically obtained from the bilingual texts, and the bilingual text correspondence is displayed on the graphical terminal. A pair of bilingual sentences that have a correspondence relationship is displayed, and the displayed correspondence relationship is confirmed, corrected, and deleted using a graphical interface. It is possible to significantly reduce the time required to generate a translated text pair.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の対訳文対応付け支援システムの全体構
成図である。
FIG. 1 is an overall configuration diagram of a parallel translation sentence association support system of the present invention.

【図2】従来手法による対訳文対応付け支援を説明する
図である。
FIG. 2 is a diagram illustrating bilingual text association support by a conventional method.

【図3】図1の対訳文対応付け計算機構の一実施例の構
成図である。
FIG. 3 is a configuration diagram of an embodiment of a parallel translation sentence association calculation mechanism of FIG.

【図4】文対応ペアを説明する図である。FIG. 4 is a diagram illustrating a sentence correspondence pair.

【図5】図1の対応関係表示機構の一実施例の構成図で
ある。
5 is a configuration diagram of an embodiment of the correspondence display mechanism of FIG.

【図6】対応関係表示機構によって実現される表示例を
示す図である。
FIG. 6 is a diagram showing a display example realized by a correspondence display mechanism.

【図7】図1の対応関係修正機構の一実施例の構成図で
ある。
7 is a configuration diagram of an embodiment of the correspondence correction mechanism of FIG.

【図8】対応関係修正機構における確認モジュールのイ
ベント処理の一例を示す図である。
FIG. 8 is a diagram showing an example of event processing of a confirmation module in the correspondence correction mechanism.

【図9】対応関係修正機構における削除描画モジュール
のイベント処理の一例を示す図である。
FIG. 9 is a diagram showing an example of event processing of a deletion drawing module in the correspondence correction mechanism.

【図10】対応関係修正機構における追加描画モジュー
ルのイベント処理の一例を示す図である。
FIG. 10 is a diagram showing an example of event processing of an additional drawing module in the correspondence correction mechanism.

【図11】本発明における対応関係の確認の具体例を示
す図である。
FIG. 11 is a diagram showing a specific example of confirmation of correspondence in the present invention.

【図12】本発明における対応関係の削除の具体例を示
す図である。
FIG. 12 is a diagram showing a specific example of deletion of correspondence in the present invention.

【図13】本発明における対応関係の追加の具体例を示
す図である。
FIG. 13 is a diagram showing a specific example of adding a correspondence relationship in the present invention.

【符号の説明】[Explanation of symbols]

1 対訳文対応付け支援装置本体 2 外部記憶装置群 3 グラフィカル端末 10 対訳文対応付け計算機構 11 対応関係表示機構 12 対応関係修正機構 20 日本語文テキストファイル 21 英語文テキストファイル 22 対応関係ファイル 1 parallel text correspondence support device main body 2 external storage device group 3 graphical terminal 10 parallel text correspondence calculation mechanism 11 correspondence display mechanism 12 correspondence correction mechanism 20 Japanese text file 21 English text file 22 correspondence file

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 2ヶ国語の対応テキストを入力し、対応
関係にある一方の言語の文と他方の言語の文のペアを求
める対訳文対応付け計算機構と、前記求まった対応関係
にある一方の言語の文と他方の言語の文のペアをグラフ
ィカルなインタフェースを用いて表示する対応関係表示
機構と、前記表示された一方の言語の文と他方の言語の
文の対応関係を、利用者の指示に応じて修正する対応関
係修正機構とを有することを特徴とする対訳文対応付け
支援システム。
1. A bilingual sentence correspondence calculation mechanism for inputting corresponding texts in two languages and obtaining a pair of a sentence of one language and a sentence of the other language having a correspondence relation, and one of the correspondence relations obtained as described above. The correspondence display mechanism for displaying a pair of a sentence in one language and a sentence in the other language using a graphical interface, and the correspondence between the displayed sentence in one language and the sentence in the other language, A parallel translation sentence correspondence support system, comprising: a correspondence relation correcting mechanism that corrects according to an instruction.
【請求項2】 請求項1記載の対訳文対応付け支援シス
テムにおいて、対訳文対応付け計算機構は、2カ国語の
対応テキストを入力する入力手段と、入力された各テキ
ストを形態素解析する形態素解析手段と、形態素解析結
果から対応可能関係を算出し、相互情報量を求め、更に
統計的検定により単語対を選択する類似度計算手段と、
選択された単語対に、あらかじめ用意された対訳辞書を
用いて、一方の言語の文と他方の言語の文の対応が支持
される回数をカウントし、所定の閾値にて文対応可能関
係を絞り込む文対応推定手段と、絞り込まれた文対応可
能関係に対して、所定の支持回数を持つ文対応ペアを選
択する後処理手段と、選択された文対応ペアを最終結果
として出力する出力手段とを有することを特徴とする対
訳文対応付け支援システム。
2. The bilingual sentence association support system according to claim 1, wherein the bilingual sentence association calculation mechanism is an input means for inputting corresponding texts in two languages, and a morphological analysis for morphologically analyzing each input text. Means and a similarity calculation means for calculating a correspondence relationship from the morphological analysis result, obtaining mutual information, and further selecting a word pair by a statistical test,
Using the prepared bilingual dictionary for the selected word pair, the number of times that the correspondence between the sentence in one language and the sentence in the other language is supported is counted, and the sentence correspondence possibility relationship is narrowed down by a predetermined threshold value. Sentence correspondence estimation means, post-processing means for selecting a sentence correspondence pair having a predetermined number of support times for the narrowed sentence correspondence possibility relationship, and output means for outputting the selected sentence correspondence pair as a final result. A parallel translation correspondence support system characterized by having.
【請求項3】 請求項1もしくは2記載の対訳文対応付
け支援システムにおいて、対応関係表示機構は、表示に
使う全体のウィンドウの大きさを決定し描画する第1描
画モジュールと、ウィンドウの一方の側に一方の言語の
テキスト中の文と当該各文に対応するノードを描画する
第2描画モジュールと、ウィンドウの他方の側に他方の
言語のテキスト中の文と当該各文に対応するノードを描
画する第3描画モジュールと、対応関係にある両言語の
文のノード間に所定の図形を描画する第4描画モジュー
ルと、ウィンドウの一方あるいは他方の端にスクロール
バーを描画する第5描画モジュールとを有することを特
徴とする対訳文対応付け支援システム。
3. The bilingual text association support system according to claim 1, wherein the correspondence display mechanism determines the size of the entire window used for display and draws the first drawing module, and one of the windows. A second drawing module for drawing a sentence in the text of one language and a node corresponding to each sentence on one side, and a sentence in the text of the other language and a node corresponding to each sentence on the other side of the window. A third drawing module for drawing, a fourth drawing module for drawing a predetermined figure between nodes of sentences in both languages having a corresponding relationship, and a fifth drawing module for drawing a scroll bar at one or the other end of the window A parallel translation sentence correspondence support system characterized by having.
【請求項4】 請求項3記載の対訳文対応付け支援シス
テムにおいて、対応関係修正機構は、マウスカーソルと
マウスのボタン操作に応じて、所定ノード間を結ぶ図形
の表示属性を変更する確認モジュールと、所定ノード間
を結ぶ図形を削除する削除モジュールと、所定ノード間
に新たに所定図形を追加する追加モジュール有すること
を特徴とする対訳文対応付け支援システム。
4. The parallel translation sentence correspondence support system according to claim 3, wherein the correspondence correction mechanism changes a display attribute of a graphic connecting predetermined nodes in accordance with a mouse cursor and a mouse button operation. A parallel translation sentence association support system, comprising: a deletion module for deleting a graphic connecting predetermined nodes and an addition module for newly adding a predetermined graphic between predetermined nodes.
JP34014595A 1995-12-27 1995-12-27 Bilingual sentence association device Expired - Fee Related JP3311567B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34014595A JP3311567B2 (en) 1995-12-27 1995-12-27 Bilingual sentence association device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34014595A JP3311567B2 (en) 1995-12-27 1995-12-27 Bilingual sentence association device

Publications (2)

Publication Number Publication Date
JPH09179868A true JPH09179868A (en) 1997-07-11
JP3311567B2 JP3311567B2 (en) 2002-08-05

Family

ID=18334163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34014595A Expired - Fee Related JP3311567B2 (en) 1995-12-27 1995-12-27 Bilingual sentence association device

Country Status (1)

Country Link
JP (1) JP3311567B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004107203A1 (en) * 2003-05-30 2004-12-09 Fujitsu Limited Translated sentence correlation device
US8214198B2 (en) 2007-07-04 2012-07-03 Fujitsu Limited Translation supporting program, apparatus, and method
JP2015092309A (en) * 2013-11-08 2015-05-14 富士ゼロックス株式会社 Information processing device and information processing program
EP2933708A1 (en) 2014-04-17 2015-10-21 Fujitsu Limited Read determining device and method
CN111191473A (en) * 2019-12-31 2020-05-22 深圳市优必选科技股份有限公司 Translation text file obtaining method and device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004107203A1 (en) * 2003-05-30 2004-12-09 Fujitsu Limited Translated sentence correlation device
US7308398B2 (en) 2003-05-30 2007-12-11 Fujitsu Limited Translation correlation device
US8214198B2 (en) 2007-07-04 2012-07-03 Fujitsu Limited Translation supporting program, apparatus, and method
JP5083317B2 (en) * 2007-07-04 2012-11-28 富士通株式会社 Translation support program, translation support apparatus, and translation support method
JP2015092309A (en) * 2013-11-08 2015-05-14 富士ゼロックス株式会社 Information processing device and information processing program
EP2933708A1 (en) 2014-04-17 2015-10-21 Fujitsu Limited Read determining device and method
US9740930B2 (en) 2014-04-17 2017-08-22 Fujitsu Limited Read determining device and method
CN111191473A (en) * 2019-12-31 2020-05-22 深圳市优必选科技股份有限公司 Translation text file obtaining method and device
CN111191473B (en) * 2019-12-31 2024-05-03 深圳市优必选科技股份有限公司 Method and device for acquiring translation text file

Also Published As

Publication number Publication date
JP3311567B2 (en) 2002-08-05

Similar Documents

Publication Publication Date Title
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US8005662B2 (en) Translation method, translation output method and storage medium, program, and computer used therewith
JPS62163173A (en) Mechanical translating device
US11163806B2 (en) Obtaining candidates for a relationship type and its label
US20040243394A1 (en) Natural language processing apparatus, natural language processing method, and natural language processing program
JPS61255469A (en) Language generating device
CN114141384A (en) Method, apparatus and medium for retrieving medical data
JPH09179868A (en) Translation correspondence support system
JPH11328166A (en) Character input device and computer-readable recording medium where character input processing program is recorded
JP2000040085A (en) Method and device for post-processing for japanese morpheme analytic processing
JP3139658B2 (en) Document display method
JP2008027290A (en) Creation support method and equipment for japanese sentence
JP2974698B2 (en) Editing / learning device for relations between words in a machine translation device
JP2621999B2 (en) Document processing device
JPH04673A (en) Method and device for registering compound word
JPH0743728B2 (en) Summary sentence generation method
JP2000330984A (en) Device and method for processing document
JP2004264960A (en) Example-based sentence translation device and computer program
JP3041002B2 (en) Kana-kanji conversion method and kana-kanji conversion device
JPH10149364A (en) Word selection device and storage medium
JP2001318918A (en) Translation device and its method
JP2004326461A (en) Apparatus and method for recognizing proper name
JPH05101094A (en) Dictionary retrieval control method
JPH0612453A (en) Unknown word extracting and registering device
CN113986022A (en) Display method and device and electronic equipment

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees