JPH10105555A - Translation-with-original example sentence retrieving device - Google Patents

Translation-with-original example sentence retrieving device

Info

Publication number
JPH10105555A
JPH10105555A JP8254206A JP25420696A JPH10105555A JP H10105555 A JPH10105555 A JP H10105555A JP 8254206 A JP8254206 A JP 8254206A JP 25420696 A JP25420696 A JP 25420696A JP H10105555 A JPH10105555 A JP H10105555A
Authority
JP
Japan
Prior art keywords
keyword
search
sentence
example sentence
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8254206A
Other languages
Japanese (ja)
Inventor
Shinji Tokunaga
信治 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8254206A priority Critical patent/JPH10105555A/en
Publication of JPH10105555A publication Critical patent/JPH10105555A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To more preferentially perform the retrieval and display of an example sentence required for a user by weighting keywords while storing the important degrees of keywords for each part of speech, and performing retrieval while considering the important degrees of keywords. SOLUTION: A morpheme analysis part 2 analyzes a retrieval request sentence into morphemes while using a morpheme analytic dictionary 6, and a keyword extracting part 3 extracts the keyword from the words of the morpheme analyzed results while using a keyword dictionary 7. In this case, the part of speech is provided from the keyword dictionary 7 for keyword weighting as well. At a keyword weighting part 11, the keyword is weighted corresponding to the part of speech. A retrieval part 4 finds the example sentence including all the provided keywords or one part of them out of a translation-with-original example sentence data base 8. A keyword weighting processing part 12 determines the order of outputting while considering the weight provided by the keyword weighting part 11. Thus, when preparing the sentence in the other language, the more effective example sentence is more preferentially retrieved and displayed and sentence preparation work is facilitated.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、自国語と他国語の
対訳例文を参照して、自国語でない言語の文を作成する
際に、所望の文に近い文を例文として表示するために対
訳例文を検索する対訳例文検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a bilingual translation for displaying a sentence close to a desired sentence as an example sentence when creating a sentence in a language other than the native language with reference to a bilingual example sentence in a native language and another language. The present invention relates to a bilingual example sentence search device that searches for example sentences.

【0002】[0002]

【従来の技術】他国語の文書の作成の際、通常は辞書で
訳語を調べると共に、そこに記載されている用例文を参
照するなどして作成する。またメモリに用例文を蓄積し
て検索可能とすることにより、このような例文を容易に
検索する手法が従来からある。
2. Description of the Related Art When a document in another language is created, usually, a translated word is looked up in a dictionary, and an example sentence described therein is referred to. Conventionally, there is a method of easily searching for such example sentences by accumulating the example sentences in a memory so as to be searchable.

【0003】例えば、「私は英語が好きです。」に対応
する英文を作成したい場合に、「好き」と入力すると、
「好き」に対応する訳語を含む例文がいくつか表示さ
れ、それを参考にして英文を作成することができる。ま
た、単語を複数入力して、その複数の単語に対応する訳
語が含まれる例文を表示させるものもある。
For example, if you want to create an English sentence corresponding to "I like English."
Several example sentences including the translation corresponding to "like" are displayed, and the English sentence can be created by referring to the example sentences. In some cases, a plurality of words are input and an example sentence including a translation corresponding to the plurality of words is displayed.

【0004】さらには、入力として単語を入力するので
はなく、文を入力し、その文から自動的にキーワードを
抽出して抽出されたキーワードから検索を行うものがあ
る。
[0004] Further, instead of inputting a word as an input, there is a type in which a sentence is input, a keyword is automatically extracted from the sentence, and a search is performed from the extracted keyword.

【0005】特開昭57−27367号公報ではキーワ
ードを入力して、そのキーワードが含まれる用例を検索
する。また、特開平3−276367号公報では、似た
対訳用例を検索し、それに対して何らかの処理を施し翻
訳を行う用例主導タイプの機械翻訳システムを提案して
いる。
In Japanese Patent Laid-Open Publication No. 57-27367, a keyword is input and an example containing the keyword is searched. Japanese Patent Laid-Open Publication No. Hei 3-276369 proposes an example-driven machine translation system that searches for similar bilingual translation examples, performs some processing on them, and translates them.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、一般に
商用化されている機械翻訳システムや、上記用例主導タ
イプの機械翻訳システムでは、処理量が大きい上、現状
では、翻訳精度があまり期待できない。そこで、あくま
で類似対訳用例を提示するのみで、ユーザがそれを参考
に独自で他国語を作文をする対訳例文検索装置について
考える。
However, a machine translation system that is generally commercialized or a machine translation system of the above-mentioned example-driven type requires a large amount of processing and currently cannot expect much translation accuracy. Therefore, consider a parallel translation example sentence search apparatus that merely presents a similar translation example and allows the user to independently compose in another language with reference to the similar translation example.

【0007】従来、他国語文を作文する時、予め、自国
語で概要を書くことが多い。そして、その自国語文の単
語の内、いくつかの語について、辞書で訳語や用例を調
べて、それを参考に他国語文を作る。これを支援するシ
ステムは、自国語文を自動で形態素解析し、切り出され
た各単語の中から必要なキーワードを探し、そのキーワ
ードもしくは、そのキーワードの異表記や同義語で、用
例検索するシステムが考えられる。いわゆる検索システ
ムのように、キーワードもしくは、キーワードとその論
理式を入れるようでは、一般の人には使いにくい。
Conventionally, when writing a sentence in another language, an outline is often written in advance in its own language. Then, for some of the words in the native language sentence, a dictionary is searched for translations and examples, and a foreign language sentence is created with reference to the translated words and examples. A system that supports this would be a system that automatically morphologically analyzes the sentence in its own language, searches for the necessary keywords from the extracted words, and searches for examples using the keywords or different notations or synonyms of the keywords. Can be It is difficult for ordinary people to use a keyword or a keyword and its logical expression as in a so-called search system.

【0008】さらに、他国語作成の際に、動詞や助動詞
など他国語文の文体を決定したりする語の対訳例文を最
優先で知りたく、代名詞など平易なものは、普通、辞書
でも調べない。
[0008] Furthermore, when creating a foreign language, it is necessary to give the highest priority to a bilingual example sentence of a word such as a verb or an auxiliary verb that determines the style of a foreign language sentence. .

【0009】例えば、日本語ネイティブの英語作成を考
える。 「私はあなたに感謝の手紙を送るだろう。」 (I will send you a letter of appreciation.) 「送る」(send)が目的語を2つとることができるのか
など、「送る」の例文、また、「感謝の」はどういうか
などを、例文に頼りたい。しかし、「私」「あなた」の
例文は、まず、不要である。
For example, consider the creation of English native to Japanese. "I will send you a letter of appreciation." Examples of "send", such as whether "send" can take two objects. Also, I want to rely on example sentences for what "thank you" is. However, the example sentences of "I" and "you" are unnecessary first.

【0010】そこで、請求項1に係る発明では、品詞に
より、検索のキーワードの重みを変えることにより、ユ
ーザの必要とする例文をより優先して検索表示すること
が可能となる。
Therefore, in the invention according to the first aspect, by changing the weight of the search keyword depending on the part of speech, it is possible to search and display the example sentence required by the user with higher priority.

【0011】請求項2に係る発明では、同じ品詞でも、
個々の語により、重みを変えたい場合に対応するため、
優先してもらいたくない語を設定することが可能とな
る。
In the invention according to claim 2, even if the same part of speech is used,
To deal with the case where you want to change the weight for each word,
It is possible to set words that you do not want to be prioritized.

【0012】例えば、名詞でも、上記の「感謝」(appr
eciation)は、例文が欲しいが、「机」(desk)など
は、まず、不要である。これらを、予め、設定しておく
ことで、ユーザの欲している例文が、より優先して検索
表示することが可能となる。
[0012] For example, even in the case of a noun,
eciation) wants an example sentence, but a "desk" is unnecessary first. By setting these in advance, the example sentence desired by the user can be searched and displayed with higher priority.

【0013】また、これらの、あまり必要としない語
を、個別に設定することが可能となる。語学力があるユ
ーザと、そうでないユーザとで、自由に設定が変更でき
るため、ユーザレベルにあった検索が可能となる。
In addition, it is possible to individually set these words that are not required much. Since the settings can be freely changed between a user who has language skills and a user who does not have language skills, a search suitable for the user level can be performed.

【0014】請求項3に係る発明では、キーワード同士
の距離、出現順を考慮することが可能である。例えば、
「彼が手を上げた。」と入力して「荷物を棚に上げて、
手を洗った。」が出るよりは、「A君が手を上げた。」
というような、「手」と「上げる」の2つのキーワード
の順番が同じものを、より優先して出すのが望ましい。
In the invention according to claim 3, it is possible to consider the distance between keywords and the order of appearance. For example,
Enter "He raised his hand."
I washed my hands. "A raised his hand."
It is desirable to give a higher priority to two keywords having the same order of “hand” and “raise”.

【0015】また、「電源を入れる。」と、入力すれ
ば、「電源」と「入れる」が、離れた「電源ユニットを
購入したので、機械に入れた。」より、より近い位置に
出現する「電源をすぐ入れて下さい。」の方が望まし
い。請求項3に係る発明では、これらを考慮できる。
If the user inputs "turn on the power.", "Turn on" and "turn on" appear at a position closer to the remote location than "the power supply unit has been purchased and turned on the machine.""Please turn on the power immediately." In the invention according to claim 3, these can be considered.

【0016】次に、複数の手助けしてもらいたい箇所を
持った検索要求文、つまり、複数の対訳例文が見たいキ
ーワードを含んだ要求文が入力された場合について考え
る。
Next, consider a case where a search request sentence having a plurality of parts to be assisted, that is, a request sentence including a keyword for which a plurality of parallel translation example sentences are desired to be viewed is input.

【0017】例えば、「理科と社会と算数を勉強する」
を入力し、30の対訳例文を表示するシステムで、「理
科」と「社会」を2つ含んだ例文が、30以上あった場
合、「算数」1つ含んだ例文がデータベースにあって
も、表示されない。そこで、請求項4に係る発明では、
これらを配慮して、データベースにある限り、全キーワ
ードの例文を、出力範囲内に表示することができる。
For example, "Study science, society and arithmetic"
Is input, and if there are 30 or more example sentences containing "Science" and "Society" in the system that displays 30 bilingual example sentences, even if there is one example sentence containing "Arithmetic" in the database, Do not show. Therefore, in the invention according to claim 4,
With these considerations in mind, example sentences for all keywords can be displayed within the output range as long as they are in the database.

【0018】請求項5に係る発明では、検索された例文
の、どこが一致したために検索されたのか、一目でわか
るように、キーワード別に色をわけるなどして表示した
り、同義語で一致した場合と、完全一致した場合とが一
目でわかるように、区別表示したりするのを、選択可能
となる。
In the invention according to claim 5, when the searched example sentence is displayed in a different color for each keyword so that it can be seen at a glance, or when the same sentence is matched by a synonym. Can be selected so as to be distinguished at a glance from the case where they completely match.

【0019】[0019]

【課題を解決するための手段】本発明の請求項1によれ
ば、第1の言語と第2の言語による対訳例文と、キーワ
ード辞書とを持った対訳例文データベースと、第1の言
語による検索要求文を入力する検索要求文入力手段と、
前記検索要求文を形態素辞書を用いて形態素解析する手
段と、前記キーワード辞書を用いて検索要求文の形態素
解析結果からキーワードを抽出するキーワード抽出手段
と、前記対訳例文データベースの中から検索要求文のキ
ーワードもしくはその同義語が含まれている例文を抽出
する検索手段と、抽出された対訳文を表示する表示手段
を持った対訳例文検索装置において、品詞毎にキーワー
ドの重要度を記憶し、キーワードの重みづけを行うキー
ワード重み付け手段と、前記検索手段において、前記キ
ーワード重み付け手段によるキーワードの重要度を考慮
した検索を行う重み処理手段とを具備することにより上
記課題を解決する。
According to the first aspect of the present invention, a bilingual example sentence database having a bilingual example sentence in a first language and a second language, a keyword translation dictionary, and a search in the first language Search request sentence input means for inputting a request sentence,
Means for morphologically analyzing the search request sentence using a morphological dictionary, keyword extracting means for extracting a keyword from a morphological analysis result of the search request sentence using the keyword dictionary, and a search request sentence from the bilingual example sentence database. In a bilingual example sentence search device having a search means for extracting an example sentence containing a keyword or a synonym thereof and a display means for displaying the extracted parallel sentence, the importance of the keyword is stored for each part of speech, The above object is achieved by providing a keyword weighting means for performing weighting, and a weight processing means for performing a search in the search means in consideration of the importance of a keyword by the keyword weighting means.

【0020】本発明の請求項2によれば、平易な語を記
憶しておく平易語記憶手段と、前記平易語記憶手段を修
正する平易語編集手段と、前記平易語記憶手段に登録さ
れた語の重みを下げるキーワード重み付け手段と、前記
検索手段において、前記キーワード重み付け手段による
キーワードの重要度を考慮した検索を行う重み処理手段
とを具備することにより上記課題を解決する。
According to the second aspect of the present invention, the plain word storage means for storing plain words, the plain word editing means for modifying the plain word storage means, and the plain word stored in the plain word storage means are provided. The above object is achieved by providing a keyword weighting means for lowering the weight of a word and a weight processing means for performing a search in the search means in consideration of the importance of a keyword by the keyword weighting means.

【0021】本発明の請求項3によれば、キーワード同
士の距離および出現順を認識するキーワード位置検出手
段と、前記キーワード位置検出手段の結果により、検索
の重み付けを行うキーワード重み付け手段と、前記検索
手段において、前記キーワード重み付け手段によるキー
ワードの重要度を考慮した検索を行う重み処理手段とを
具備することにより上記課題を解決する。
According to claim 3 of the present invention, keyword position detecting means for recognizing the distance between keywords and the order of appearance, keyword weighting means for performing search weighting based on the result of the keyword position detecting means, The above object is achieved by providing a weighting means for performing a search in consideration of the importance of a keyword by the keyword weighting means.

【0022】本発明の請求項4によれば、検索結果を表
示する際、出力表示領域内に、すべてのキーワードに対
する対訳例文が含まれるように出力する出力調整手段を
具備するにより上記課題を解決する。
According to the fourth aspect of the present invention, the above problem is solved by providing an output adjusting means for outputting, when displaying a search result, a bilingual example sentence for all keywords in an output display area. I do.

【0023】本発明の請求項5によれば、検索要求文中
のキーワードと対訳例文中の対応するキーワードを対応
表示するか、対訳例文中のキーワードが完全一致か、同
義語による一致かで区別表示するかを選択する特徴表示
選択手段と、選択したモードを記憶するフラグとを具備
し、前記フラグに基づいてキーワードの特徴表示を行う
ことにより上記課題を解決する。
According to the fifth aspect of the present invention, the keyword in the search request sentence and the corresponding keyword in the bilingual example sentence are displayed correspondingly, or the keyword in the bilingual example sentence is completely matched or distinguished according to the synonymous match. The above object is attained by providing a feature display selecting means for selecting whether or not to do so, and a flag for storing the selected mode, and displaying the feature of the keyword based on the flag.

【0024】[0024]

【発明の実施の形態】この発明の文書検索装置につい
て、図面を用いて詳細に説明する。図1は本発明による
例文検索装置の構成の一例である。1は検索要求入力
部、2は形態素解析部、3は検索要求キーワード抽出
部、4は検索部、5は表示部、6は形態素辞書、7はキ
ーワード辞書、8は対訳例文データベース、9はキーワ
ード位置検出部、10は出力調整部、11はキーワード
重み付け部、12はキーワード重み処理部、13は平易
語記憶部、14は平易語編集部、15は特徴表示選択
部、16は特徴表示モードフラグである。これらの構成
は基本的にコンピュータなどによって構成されるもので
あり、図示しないCPU(制御部)が各構成を制御す
る。各構成については後に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A document retrieval apparatus according to the present invention will be described in detail with reference to the drawings. FIG. 1 shows an example of the configuration of an example sentence search device according to the present invention. 1 is a search request input unit, 2 is a morphological analysis unit, 3 is a search request keyword extraction unit, 4 is a search unit, 5 is a display unit, 6 is a morphological dictionary, 7 is a keyword dictionary, 8 is a bilingual example sentence database, and 9 is a keyword. Position detection unit, 10 is an output adjustment unit, 11 is a keyword weighting unit, 12 is a keyword weight processing unit, 13 is a plain word storage unit, 14 is a plain word editing unit, 15 is a feature display selection unit, and 16 is a feature display mode flag. It is. These components are basically configured by a computer or the like, and a CPU (control unit) (not shown) controls each component. Each configuration will be described later.

【0025】図2のフローチャートを参照しながら、本
発明装置の動作を具体的に説明する。この例では自国語
を日本語、他国語を英語とした場合で説明する。
The operation of the apparatus according to the present invention will be specifically described with reference to the flowchart of FIG. In this example, the case where the native language is Japanese and the other language is English will be described.

【0026】ステップS1(以下単にS1とする)にお
いて、対訳例文の検索を行なうか、平易語の登録、削除
等の編集を行なうか、処理を終了するかを、選択する。
対訳例文検索を行なう場合、S2へ、平易語の編集を行
なう場合、S14へ進む。終了する場合は、システムを
終了する。
In step S1 (hereinafter simply referred to as S1), a selection is made as to whether to search for a bilingual example sentence, to edit plain word registration or deletion, or to end the processing.
If a bilingual example sentence search is to be performed, the process proceeds to S2. If a plain word is edited, the process proceeds to S14. If so, shut down the system.

【0027】S2では、検索結果を表示する際、キーワ
ード毎に色を変えたり、アンダーラインの種類を変えた
りして、表示するか(図6)、キーワードとの完全一致
か、同義語または異表記での一致かを区別表示するか
(図7)、もしくは、こういったことを一切行なわない
かを、特徴表示選択部15で選択し、特徴表示モードフ
ラグ16に記憶する。
In step S2, when the search result is displayed, the color is changed for each keyword, the type of underline is changed, and the search result is displayed (FIG. 6). The feature display selection unit 15 selects whether the notation is matched or not (FIG. 7), or whether such display is not performed at all, and stores it in the feature display mode flag 16.

【0028】S3では、検索要求入力部1において検索
要求を入力する。入力手段は、かな漢字変換、文字認識
など、どんな手段を用いてもかまわない。
In S3, a search request is input in the search request input unit 1. As the input means, any means such as kana-kanji conversion and character recognition may be used.

【0029】S4では、形態素解析部2において、形態
素解析辞書6に登録されている語で単語を認識する。特
に、アルゴリズムは規定しない。従来から用いられてい
る一般的な形態素解析手段を用いる。
In S4, the morphological analysis unit 2 recognizes a word from the words registered in the morphological analysis dictionary 6. In particular, no algorithm is specified. A general morphological analysis unit used conventionally is used.

【0030】S5では、キーワード抽出部3で、キーワ
ード辞書7を用いて、検索要求文のS4での形態素解析
結果の単語中からキーワードを抽出する。対訳例文デー
タベース8に登録されている例文のキーワードも、キー
ワード辞書7に登録されている語の1つ以上から成って
いるので、前記抽出された語がキーワードである。S8
での、キーワード重み付けのために、品詞もキーワード
辞書7から得ておく。
In S5, the keyword extraction unit 3 extracts a keyword from the words of the morphological analysis result in S4 of the search request sentence, using the keyword dictionary 7. Since the keywords of the example sentences registered in the bilingual example sentence database 8 also consist of one or more words registered in the keyword dictionary 7, the extracted words are keywords. S8
Is also obtained from the keyword dictionary 7 for the purpose of weighting keywords.

【0031】S6では、キーワードの出現位置をキーワ
ード位置検出部9で検出する。前出の例文で説明する。
In step S6, the keyword position detection unit 9 detects the appearance position of the keyword. This is explained in the example sentence above.

【0032】「彼が手を上げた。」と入力されたとき、
形態素解析部で、 「彼」 「が」 「手」 「を」 「上げた」 代名詞 助詞 名詞 助詞 動詞 と解析される。このうち、 「彼」 「手」 「上げた」 代名詞 名詞 動詞 がキーワード辞書7に登録されており、キーワードとし
て抽出されたとする。キーワードが、この順に出現した
ことを、また、「彼」と「手」の間には「が」1単語が
あったこと、「手」と「上げた」の間には「を」1単語
があったことを、検索部4に送る。
When "He raised his hand" was input,
In the morphological analyzer, it is analyzed as "he", "ga", "hand", "wo", "raised", pronoun, particle, noun, particle, verb. Of these, "he", "hand" and "raised" pronoun noun verb is registered in the keyword dictionary 7 and is extracted as a keyword. It means that the keyword appeared in this order, that there was one word "ga" between "he" and "hand", and that one word "wa" between "hand" and "raised" Is sent to the search unit 4.

【0033】また、同様に「電源を入れる。」では、
「電源」と「入れる」がキーワードで、この順に出現し
たことを、「電源」と「入れる」の間には「を」1単語
があったことを、検索部4に送る。
Similarly, "turn on the power."
“Power” and “turn on” are keywords, and the fact that they appear in this order and the fact that there is one word “を” between “power” and “turn on” are sent to the search unit 4.

【0034】S7では、キーワード重み付け部11で平
易語記憶部13をチェックし、S8の重み付けで利用す
る。平易語記憶部13の英語部(図3に示す)が、対訳
例文の英語側にその語が出現する時のみ、その語を平易
語として処理の対象とする。
At S7, the keyword weighting unit 11 checks the plain word storage unit 13 and uses it for weighting at S8. Only when the English word (shown in FIG. 3) of the plain word storage unit 13 appears on the English side of the bilingual example sentence, the word is processed as a plain word.

【0035】例えば、図3に示す「犬」では、英語部は
「dog」となっているため、日本語キーワードが「犬」
であっても、それが「スパイ」の意味で使用されてい
て、「spy」が英語文のどこかに現れる場合は、対象と
しない。つまり、平易語扱いしない。これは、日本語単
語と英語単語の対応(例では「犬」と「spy」)をとっ
ているわけではないが、これで十分である。もっとも、
対応を予め取っておいてもよい。
For example, in the case of "dog" shown in FIG. 3, since the English part is "dog", the Japanese keyword is "dog".
Even if it is used in the meaning of "spy" and "spy" appears anywhere in the English sentence, it is not included. That is, they are not treated as plain words. This does not correspond to Japanese words and English words ("dog" and "spy" in the example), but this is sufficient. However,
A response may be taken in advance.

【0036】S8において、キーワード重み付け部11
で品詞によりキーワードに重み付けする。例えば、動
詞、形容詞などの用言、助動詞などの文末様相表現は優
先度“Aランク”、名詞などは“Bランク”、代名詞な
どは“Cランク”とする。また、S7で確認した平易語
記憶部13にあるものは、無条件で“Cランク”とす
る。図9に対応させて記憶する例を示す。
At S8, the keyword weighting unit 11
Weights keywords by part of speech. For example, a verb, an adjective, or the like, a sentence-end modal expression such as an auxiliary verb has a priority "A rank", a noun or the like has "B rank", and a pronoun or the like has a "C rank". Those in the plain word storage unit 13 confirmed in S7 are unconditionally set to “C rank”. FIG. 9 shows an example of storing in correspondence with FIG.

【0037】S9では、検索部4で、S5で得られた検
索要求のキーワードが全部もしくは一部、含まれている
例文を、対訳例文データベース8から捜し出す。全キー
ワードが一致した例文、以降、より多くキーワードが一
致した例文を得る。
In S9, the search unit 4 searches the bilingual example sentence database 8 for an example sentence including all or a part of the keyword of the search request obtained in S5. An example sentence in which all keywords match, and thereafter, an example sentence in which more keywords match are obtained.

【0038】さらに、キーワード辞書7内に図11に示
すような同義語テーブルを備え、全く同一のキーワード
ではないが、ほぼ同義としてキーワード抽出してよいと
思われる単語を記憶しておき、同義語による検索も行
う。ここで同義語により検索されたものについては同義
語であることを示すフラグを付与する。
Further, a synonym table as shown in FIG. 11 is provided in the keyword dictionary 7, and words that are not completely the same but are considered to be almost synonymous to be extracted as a keyword are stored. Search by. Here, a flag indicating that the word is searched for a synonym is added.

【0039】S10において、S9の結果に対して、キ
ーワード重み処理部12で、S8で得た重みを加味して
出力順を決定する。例えば、Aランクの語、1つ含む場
合は10点、Bランクは5点、Cランクは1点として合
計点を計算し、それが大きいものから表示部5へ送る。
At S10, the output order is determined by the keyword weighting unit 12 in consideration of the weight obtained at S8 with respect to the result at S9. For example, the total score is calculated by assuming that the word of the rank A is 1, the score is 10 when the word is included, the score is 5 for the rank B, and the score is 1 for the rank C.

【0040】前出の例文において計算すると、「私はあ
なたに感謝の手紙を送るだろう。」を要求文とした場合
では、「私はあなたに手紙を買った。」では、「私」と
「あなた」は代名詞だから1点ずつ、「手紙」が名詞で
5点、合計7点となる。また、「彼女にはがきを送っ
た。」では、「送る」が動詞で10点と、一致キーワー
ドは少ないが優先される。つまり、「彼女にはがきを送
った。」が先に出力される。
Calculating in the above example sentence, if the request sentence is "I will send a letter of thanks to you", "I bought a letter to you." Since "you" is a pronoun, "letter" has 5 nouns, one point at a time, and a total of 7 points. In "Send a postcard to her", "Send" is a verb with 10 points, and priority is given to a small number of matching keywords. That is, "She sent a postcard to her" is output first.

【0041】さらに、S6で得たキーワード出現位置も
加味する。「彼が手を上げた。」と入力した場合、「荷
物を棚に上げて、手を洗った。」と「A君が手を上げ
た。」では、「手」と「上げる」の2つのキーワードで
得点も同じであるが単語の出現順番が同じ後者を優先す
る(図10(a))。
Further, the keyword appearance position obtained in S6 is also taken into account. When he inputs "He raised his hand.", "He lifted his hand and washed his hand." And "A raised his hand." The latter, which has the same score for the two keywords but the same order of appearance of the words, is prioritized (FIG. 10A).

【0042】また、「電源を入れる。」と、入力した場
合、「電源ユニットを購入したので、機械に入れた。」
と「電源をすぐ入れて下さい。」では、「電源」と「入
れる」の2つのキーワードで得点も同じであるが、要求
文は、間に「を」の1単語であり、「電源ユニットを購
入したので、機械に入れた。」では、「ユニット」
「を」「購入し」「た」「ので」「機械」「に」の7単
語である。一方、「電源をすぐ入れて下さい。」では、
「を」「すぐ」の2単語であるので、「電源をすぐ入れ
て下さい。」の方が、より要求文に近いと判断し、優先
する(図10(b)。
When "Power on." Is input, "The power supply unit has been purchased and the power supply unit has been turned on."
And "Turn on the power immediately", the score is the same for the two keywords "power" and "turn on", but the request sentence is one word between "" and " I bought it and put it in the machine. "
These are seven words, "", "purchase", "ta", "so", "machine", and "ni". On the other hand, "Please turn on the power immediately."
Since there are two words "" and "immediately", "Please turn on the power immediately" is determined to be closer to the request sentence and has priority (FIG. 10B).

【0043】S11において、出力調整部10で、S1
0の結果を表示部5で表示する前に、検索要求文の全キ
ーワードに対応する対訳例文が出力表示領域内に表示す
ることができない場合、同じキーワードで、多く出てい
る例文を削って、出ていないキーワードの例文の代表を
表示するか(図4)、代表を表示しておいて、必要に応
じて全体を見れるように(図5)する。
In S11, the output adjusting unit 10 sets S1
Before the result of 0 is displayed on the display unit 5, if the translation example sentence corresponding to all the keywords of the search request sentence cannot be displayed in the output display area, the example sentence with the same keyword that is frequently output is deleted. Either a representative of the example sentence of the keyword not appearing is displayed (FIG. 4), or the representative is displayed so that the entire sentence can be viewed as needed (FIG. 5).

【0044】図4、図5では、例えば、出力表示領域の
出力個数が30対訳であり、「本」と「読む」のキーワ
ード2個一致の例文が30個以上である場合、出力表示
領域を使いきってしまうところを、「本」と「読む」の
例文は28個とし、「先生」と「学校」の例文を表示す
るようにしたものである。図5では「+」表示を押すと
別ウインドウで「先生」や「学校」の例文を全文、表示
するようになっている。
In FIGS. 4 and 5, for example, if the number of outputs in the output display area is 30 bilingual, and if there are 30 or more example sentences that match two keywords of “book” and “read”, the output display area is changed. In this example, 28 examples of "book" and "read" are used, and example sentences of "teacher" and "school" are displayed. In FIG. 5, when "+" is displayed, all sentences of "teacher" and "school" are displayed in a separate window.

【0045】S12では、特徴表示モードフラグ16を
確認して、検索要求文のキーワードを、キーワード別に
区別して特徴表示(色やアンダーラインを使用)し、検
索結果の例文にも、検索要求文のキーワードと対応した
特徴表示をする(図6)。
In step S12, the feature display mode flag 16 is checked, and the keywords of the search request sentence are distinguished and displayed for each keyword (using color and underline). A feature corresponding to the keyword is displayed (FIG. 6).

【0046】または、検索結果の、検索要求文のキーワ
ードが含まれている箇所に特徴表示(色やアンダーライ
ンを使用)し、検索要求文のキーワードの同義語または
異表記が含まれている箇所に別の特徴表示(別の色やア
ンダーラインを使用)する。
Alternatively, a feature is displayed (using a color or an underline) in a portion of the search result where the keyword of the search request sentence is included, and a portion where a synonym or a different expression of the keyword of the search request sentence is included Display a different feature (using a different color or underline).

【0047】図7では、「本」は、検索要求文のキーワ
ードであるので、アンダーラインを、「教師」は、検索
要求文のキーワード「先生」の同義語なので、波線アン
ダーラインを付けてある。または、上記のような表示を
しないか、いずれかを特徴表示選択部15により選択し
S13に送る。
In FIG. 7, “book” is a keyword of the search request sentence, and is underlined, and “teacher” is a synonym of the keyword “teacher” of the search request sentence, so a wavy underline is added. . Alternatively, the above-mentioned display is not performed, or one of them is selected by the feature display selection unit 15 and sent to S13.

【0048】S13では送られてきた対訳例文データを
表示部5に表示する。この時、対訳例文データベース8
の中に持っている出典を分かるように、図8のように表
示してもよい。図8では出典により、区別表示し(この
場合は番号のアンダーラインを変えている)カーソル行
の例文の出典を最下部に詳細表示している。
In S 13, the sentence data of the translated example sentence is displayed on the display unit 5. At this time, the bilingual example sentence database 8
8 may be displayed so that the source possessed by the user can be understood. In FIG. 8, the source of the example sentence of the cursor line is distinguished and displayed according to the source (in this case, the underline of the number is changed), and the source is displayed in detail at the bottom.

【0049】また、S12において選択されたモードに
よる表示を行う。ユーザは、表示された対訳例文の英文
を参考にし、一部、変更などをして、必要な英文を作成
し、S1に戻る。
Further, display is performed in the mode selected in S12. The user creates a necessary English sentence by referring to the displayed English sentence of the bilingual example sentence, making a part or change, and returns to S1.

【0050】S14では、図3に例示するような、平易
語記憶部13の内容を、平易語編集部14で修正する。
図3は、自国語キーワードが「犬」で、その訳語が「do
g」の場合は、平易だから、キーワードの重みを下げ
る。また、自国語キーワードが「子供」で、その訳語が
「child」または「kid」のときは、平易だから、キーワ
ードの重みを下げる、ということである。さらに、自国
語キーワードが「テレビ」の場合、その訳語が何であろ
うと、平易だから、キーワードの重みを下げる、という
ことを意味する。
In S14, the contents of the plain word storage unit 13 as exemplified in FIG.
Figure 3 shows that the native language keyword is "dog" and its translation is "do
In the case of "g", the weight of the keyword is reduced because it is simple. When the native language keyword is "child" and the translated word is "child" or "kid", the weight of the keyword is reduced because it is plain. Furthermore, if the native language keyword is "television", it means that the weight of the keyword is reduced because the translation is easy, whatever the translation.

【0051】編集は、図3のような画面を表示して、ユ
ーザが追加、削除できるようにしてもいいし、図3のよ
うに、学年による必須単語を予め設定させて、その中で
修正するようにしておいても良い。S15において、S
14で修正されたデータを平易語記憶部13に記憶し、
S1へ戻り、処理を繰り返す。以上のような処理によ
り、ユーザの要求にあった例文を検索、表示することが
可能となる。
For editing, a screen as shown in FIG. 3 may be displayed so that the user can add or delete the data. Alternatively, as shown in FIG. You may do so. In S15, S
The data corrected in 14 is stored in the plain word storage unit 13,
Returning to S1, the process is repeated. Through the above-described processing, it becomes possible to search for and display an example sentence requested by the user.

【0052】[0052]

【発明の効果】以上詳述したことから明らかなように、
この発明によれば、他国語文の作成の際に、より役立つ
対訳例文を、より優先して検索表示するため、作文作業
が容易になる。また、これをユーザ毎に設定できるた
め、ユーザの語学レベルに合わせて利用できる。
As is clear from the above description,
According to the present invention, a bilingual example sentence is more preferentially searched for and displayed when a foreign language sentence is created, thereby facilitating composition work. Also, since this can be set for each user, it can be used according to the language level of the user.

【0053】さらに、処理量の大きい本格的な構文解析
や意味解析なしに、キーワード出現順やキーワード間の
距離を判断し、より的確な役立つ類似用例が出力され
る。データベースにある限り、全キーワードの例文を、
出力表示領域内に表示することができるため、一度の検
索操作で欲する対訳例文をすべて見れるので、操作の手
間が軽減される。
Further, the order of appearance of keywords and the distance between keywords are determined without a full-scale syntax analysis or semantic analysis requiring a large amount of processing, and a more useful similar example is output. As long as it is in the database, all keyword examples are
Since it can be displayed in the output display area, all the desired translation examples can be seen by one search operation, so that the operation time is reduced.

【0054】また、検索された例文の、どこが一致した
ために検索されたのか、一目でわかる、また、同義語で
一致した場合と、完全一致した場合とが一目でわかるた
め、作文の参考にする文を検索結果から探す場合に、便
利である。
Further, it is possible to know at a glance where in the searched example sentence the match was found because of the match, and it is also possible to see at a glance whether the match was made with a synonym and the case where the match was completely made, so that the composition sentence is referred to. This is convenient when searching for sentences from search results.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】本発明の一実施形態の動作を示すフローチャー
トである。
FIG. 2 is a flowchart showing the operation of one embodiment of the present invention.

【図3】平易語リストの編集画面の例を示す図である。FIG. 3 is a diagram showing an example of an easy word list editing screen.

【図4】全キーワードに対応する用例を表示する画面例
を示す図である。
FIG. 4 is a diagram showing an example of a screen displaying an example corresponding to all keywords.

【図5】全キーワードに対応する用例を表示する画面例
を示す図である。
FIG. 5 is a diagram showing an example of a screen displaying an example corresponding to all keywords.

【図6】対応するキーワードを特徴表示する画面例を示
す図である。
FIG. 6 is a diagram showing an example of a screen for characteristically displaying a corresponding keyword.

【図7】同義語により対応したキーワードを特徴表示す
る画面例を示す図である。
FIG. 7 is a diagram showing an example of a screen for characteristically displaying a keyword corresponding to a synonym.

【図8】用例の出典を表示する画面例を示す図である。FIG. 8 is a diagram illustrating an example of a screen displaying a source of an example.

【図9】品詞によるキーワード重みづけデータの記憶例
を示す図である。
FIG. 9 is a diagram illustrating a storage example of keyword weighting data based on part of speech.

【図10】本発明によるキーワード重みづけの算出例を
示す図である。
FIG. 10 is a diagram illustrating a calculation example of keyword weighting according to the present invention.

【図11】本発明における同義語テーブルの例を示す図
である。
FIG. 11 is a diagram illustrating an example of a synonym table according to the present invention.

【符合の説明】 1 検索要求入力部 2 形態素解析部 3 検索要求キーワード抽出部 4 検索部 5 表示部 6 形態素辞書 7 キーワード辞書 8 対訳例文データベース 9 キーワード位置検出部 10 出力調整部 11 キーワード重み付け部 12 キーワード重み処理部 13 平易語記憶部 14 平易語編集部 15 特徴表示選択部 16 特徴表示モードフラグ[Description of Signs] 1 search request input unit 2 morphological analysis unit 3 search request keyword extraction unit 4 search unit 5 display unit 6 morphological dictionary 7 keyword dictionary 8 bilingual example sentence database 9 keyword position detection unit 10 output adjustment unit 11 keyword weighting unit 12 Keyword weight processing unit 13 Simple word storage unit 14 Simple word editing unit 15 Feature display selection unit 16 Feature display mode flag

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 第1の言語と第2の言語による対訳例文
と、キーワード辞書とを持った対訳例文データベース
と、 第1の言語による検索要求文を入力する検索要求文入力
手段と、 前記検索要求文を形態素辞書を用いて形態素解析する手
段と、 前記キーワード辞書を用いて検索要求文の形態素解析結
果からキーワードを抽出するキーワード抽出手段と、 前記対訳例文データベースの中から検索要求文のキーワ
ードもしくはその同義語が含まれている例文を抽出する
検索手段と、 抽出された対訳文を表示する表示手段を持った対訳例文
検索装置において、 品詞毎にキーワードの重要度を記憶し、キーワードの重
みづけを行うキーワード重み付け手段と、 前記検索手段において、前記キーワード重み付け手段に
よるキーワードの重要度を考慮した検索を行う重み処理
手段とを具備することを特徴とした対訳例文検索装置。
1. A bilingual example sentence database having a bilingual example sentence in a first language and a second language, a bilingual example sentence database having a keyword dictionary, search request sentence input means for inputting a search request sentence in a first language, and the search Means for morphologically analyzing the request sentence using a morphological dictionary; keyword extracting means for extracting a keyword from a morphological analysis result of the search request sentence using the keyword dictionary; In a bilingual example sentence search device having a search means for extracting an example sentence containing the synonym and a display means for displaying the extracted translated sentence, the importance of the keyword is stored for each part of speech, and the weighting of the keyword is performed. Keyword weighting means for performing the following, and the search means considers the importance of the keyword by the keyword weighting means. Search translated example sentence search apparatus characterized by comprising a weight processing unit for performing.
【請求項2】 平易な語を記憶しておく平易語記憶手段
と、 前記平易語記憶手段を修正する平易語編集手段と、 前記平易語記憶手段に登録された語の重みを下げるキー
ワード重み付け手段と、 前記検索手段において、前記キーワード重み付け手段に
よるキーワードの重要度を考慮した検索を行う重み処理
手段とを具備することを特徴とした前記請求項1記載の
対訳例文検索装置。
2. An easy word storage means for storing an easy word, an easy word editing means for modifying the easy word storage means, and a keyword weighting means for reducing a weight of a word registered in the easy word storage means. 2. The bilingual example sentence search device according to claim 1, wherein the search means comprises: a weight processing means for performing a search in consideration of the importance of the keyword by the keyword weighting means.
【請求項3】 キーワード同士の距離および出現順を認
識するキーワード位置検出手段と、 前記キーワード位置検出手段の結果により、検索の重み
付けを行うキーワード重み付け手段と、 前記検索手段において、前記キーワード重み付け手段に
よるキーワードの重要度を考慮した検索を行う重み処理
手段とを具備することを特徴とした前記請求項1または
2記載の対訳例文検索装置。
3. A keyword position detecting means for recognizing a distance between keywords and an order of appearance; a keyword weighting means for performing a search weighting based on a result of the keyword position detecting means; 3. The bilingual example sentence search device according to claim 1, further comprising a weight processing unit for performing a search in consideration of the importance of the keyword.
【請求項4】 検索結果を表示する際、出力表示領域内
に、すべてのキーワードに対する対訳例文が含まれるよ
うに出力する出力調整手段を具備することを特徴とした
前記請求項1乃至3記載の対訳例文検索装置。
4. The apparatus according to claim 1, further comprising output adjustment means for outputting, when displaying a search result, a bilingual example sentence for all keywords in an output display area. A bilingual example sentence search device.
【請求項5】 検索要求文中のキーワードと対訳例文中
の対応するキーワードを対応表示するか、対訳例文中の
キーワードが完全一致か、同義語による一致かで区別表
示するかを選択する特徴表示選択手段と、 選択したモードを記憶するフラグとを具備し、 前記フラグに基づいてキーワードの特徴表示を行うこと
を特徴とする前記請求項1乃至4記載の対訳例文検索装
置。
5. A feature display selection for selecting whether the keyword in the search request sentence and the corresponding keyword in the bilingual example sentence are displayed in correspondence, or whether the keyword in the bilingual example sentence is completely matched or distinguished according to a synonymous match. 5. The bilingual example sentence search device according to claim 1, further comprising: means for storing a selected mode, and a feature display of a keyword based on the flag.
JP8254206A 1996-09-26 1996-09-26 Translation-with-original example sentence retrieving device Pending JPH10105555A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8254206A JPH10105555A (en) 1996-09-26 1996-09-26 Translation-with-original example sentence retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8254206A JPH10105555A (en) 1996-09-26 1996-09-26 Translation-with-original example sentence retrieving device

Publications (1)

Publication Number Publication Date
JPH10105555A true JPH10105555A (en) 1998-04-24

Family

ID=17261738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8254206A Pending JPH10105555A (en) 1996-09-26 1996-09-26 Translation-with-original example sentence retrieving device

Country Status (1)

Country Link
JP (1) JPH10105555A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1400901A3 (en) * 2002-09-19 2004-06-30 Microsoft Corporation Method and system for retrieving confirming sentences
JP2006344010A (en) * 2005-06-09 2006-12-21 Fuji Xerox Co Ltd Document retrieval device
US7403889B2 (en) 2002-12-26 2008-07-22 Casio Computer Co., Ltd. Electronic dictionary with example sentences
JP2010266970A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Device and method for retrieving information, dictionary preparing device and program
JP2010266971A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Terminal equipment
JP2010267247A (en) * 2010-02-08 2010-11-25 Ntt Data Corp Device and method for retrieving information, terminal equipment, and program
JP2016091269A (en) * 2014-11-04 2016-05-23 株式会社東芝 Foreign-language sentence generation support apparatus, method and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149887A (en) * 1992-11-10 1994-05-31 Nippon Telegr & Teleph Corp <Ntt> Text type data base device
JPH0785101A (en) * 1993-09-20 1995-03-31 Fujitsu F I P Kk Keyword extract processing unit
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149887A (en) * 1992-11-10 1994-05-31 Nippon Telegr & Teleph Corp <Ntt> Text type data base device
JPH0785101A (en) * 1993-09-20 1995-03-31 Fujitsu F I P Kk Keyword extract processing unit
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1400901A3 (en) * 2002-09-19 2004-06-30 Microsoft Corporation Method and system for retrieving confirming sentences
US7403889B2 (en) 2002-12-26 2008-07-22 Casio Computer Co., Ltd. Electronic dictionary with example sentences
JP2006344010A (en) * 2005-06-09 2006-12-21 Fuji Xerox Co Ltd Document retrieval device
JP4640591B2 (en) * 2005-06-09 2011-03-02 富士ゼロックス株式会社 Document search device
JP2010266970A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Device and method for retrieving information, dictionary preparing device and program
JP2010266971A (en) * 2009-05-12 2010-11-25 Ntt Data Corp Terminal equipment
JP2010267247A (en) * 2010-02-08 2010-11-25 Ntt Data Corp Device and method for retrieving information, terminal equipment, and program
JP2016091269A (en) * 2014-11-04 2016-05-23 株式会社東芝 Foreign-language sentence generation support apparatus, method and program
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program

Similar Documents

Publication Publication Date Title
JPH05314166A (en) Electronic dictionary and dictionary retrieval device
JPH05120324A (en) Language processing system
JPH10105555A (en) Translation-with-original example sentence retrieving device
JP2003006191A (en) Device and method for supporting preparation of foreign language document and program recording medium
JP2003178087A (en) Retrieval device and method for electronic foreign language dictionary
JP2009059290A (en) Device, method, and program for supporting preparation of foreign language document
JP3013388B2 (en) Linguistic information retrieval device
JPH01214963A (en) Device for consulting dictionary
Patton Review of Am Faclair Beag online Gaelic-English Dictionary
JPH05101094A (en) Dictionary retrieval control method
JP2819765B2 (en) Foreign language electronic dictionary search method
Patton Bauer, Michael and Robertson, William. Am Faclair Beag online Gae-lic-English dictionary. http://www. faclair. info
JP2819766B2 (en) Foreign language electronic dictionary search method
JP5338482B2 (en) Chinese sentence example search device and program
JP3253311B2 (en) Language processing apparatus and language processing method
Ornan A morphological, syntactic and semantic search engine for Hebrew texts
JPH03129568A (en) Document processor
JPH0830624A (en) Decoding supporting device
JP2020160112A (en) Electronic apparatus, text display method, and program
JP2000242643A (en) Device and method for supporting english sentence preparation and storage medium
JP2001318917A (en) Example retrieval type second language composition aiding device
JPH0421171A (en) Supporting device for understanding context
JPH08235186A (en) Machine translation system
JPH06187329A (en) Natural language processor
JP2009059291A (en) Device, method, and program for supporting retrieval of translation word