JP2002197086A - Natural language conversion system - Google Patents

Natural language conversion system

Info

Publication number
JP2002197086A
JP2002197086A JP2001351637A JP2001351637A JP2002197086A JP 2002197086 A JP2002197086 A JP 2002197086A JP 2001351637 A JP2001351637 A JP 2001351637A JP 2001351637 A JP2001351637 A JP 2001351637A JP 2002197086 A JP2002197086 A JP 2002197086A
Authority
JP
Japan
Prior art keywords
target language
language
vocabulary
speech
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001351637A
Other languages
Japanese (ja)
Other versions
JP4313967B2 (en
Inventor
Masako Tamura
真子 田村
Shinichi Doi
伸一 土井
Shinichiro Kamei
真一郎 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001351637A priority Critical patent/JP4313967B2/en
Publication of JP2002197086A publication Critical patent/JP2002197086A/en
Application granted granted Critical
Publication of JP4313967B2 publication Critical patent/JP4313967B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve quality of a conversion result of an original in which plural languages are mixed into a objective language sentence by enabling conversion of a objective language vocaburary in the original into a proper part of speech. SOLUTION: A translation knowledge base part 6 stores correspondence among original language phrase structural information, part-of-speech information of the objective language vocaburary and part-of-speech information of objective language corresponding to an original language phrase. An original analyzing part 1 recognizes a phrase including the objective language vocaburary in the original by using an original language part of a translation dictionary part 2 and estimates the part of speech of the meaning of the objective language vocabulary in the original language based on the contents of a functional word of the phrase. An objective language vocaburary holding part 3 acquires the part of speech of the objective language vocaburary in the objective language by retrieving an objective language dictionary part 4. A translation generating part 5 acquires a proper part of speech of the objective language vocaburary by retrieving the bilingual knowledge base part 6 based on an estimation result of the part of speech and a retrieval result of a dictionary, acquires the objective language expression of the proper part of speech with the same language source as the objective language vocaburary by retrieving the objective language dictionary part 4 based on the proper part of speech and generates translation by using the objective language expression.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ある自然言語(原
言語)から他の自然言語(目的言語)への変換を行う自
然言語変換システムに関し、特に複数言語混じり文であ
る原文(主として原言語によって記述された文)を訳文
(目的言語によって記述された文。目的言語文とも表記
する)に変換する自然言語変換システムに関する。な
お、「複数言語混じり文である原文」とは、原言語によ
る語彙と共に目的言語による語彙(目的言語語彙)を含
む原文を意味する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language conversion system for converting a certain natural language (source language) into another natural language (target language), and more particularly to an original sentence which is a sentence mixed with a plurality of languages (mainly a source language). The present invention relates to a natural language conversion system for converting a sentence described in a target language into a translated sentence (a sentence described in a target language, also referred to as a target language sentence). The “original sentence that is a mixed sentence of a plurality of languages” means an original sentence that includes a vocabulary in the target language (a target language vocabulary) together with a vocabulary in the original language.

【0002】[0002]

【従来の技術】従来より、複数言語混じり文である原文
を目的言語文に変換する自然言語変換システムは、原文
に目的言語語彙が混じっている際にも目的言語の変換結
果(目的言語文)の質が落ちないようにすることを目的
として採用・開発されている。
2. Description of the Related Art Conventionally, a natural language conversion system for converting an original sentence, which is a mixed sentence of a plurality of languages, into a target language sentence, has a target language conversion result (target language sentence) even when the original sentence contains a target language vocabulary. Has been adopted and developed with the aim of keeping the quality of

【0003】例えば、特開平3−63764号公報で
は、原文に直接入力された目的言語語彙(原則として原
言語による語彙で構成された原文に挿入されている目的
言語語彙)に対して目的言語辞書を引き、その目的言語
語彙が未登録語として扱われることを防ぐことにより、
正しい目的言語文への変換を実現できるシステムが、提
案されている。
For example, Japanese Patent Laid-Open Publication No. Hei 3-63764 discloses a target language dictionary that is directly input to a source sentence (in principle, a target language vocabulary inserted into a source sentence composed of vocabularies in the source language). To prevent the target language vocabulary from being treated as an unregistered word,
A system that can realize conversion into a correct target language sentence has been proposed.

【0004】[0004]

【発明が解決しようとする課題】上記のように、従来技
術では、自然言語の変換用辞書の他に目的言語辞書を備
えて、原文に目的言語語彙が直接入力された際に目的言
語辞書を引くことで原文中の該目的言語語彙が未登録語
として扱われることを防ぎ、適切な目的言語文への変換
を可能ならしめていた。
As described above, in the prior art, a target language dictionary is provided in addition to the natural language conversion dictionary, and the target language dictionary is used when the target language vocabulary is directly input into the original text. This prevents the target language vocabulary in the original sentence from being treated as an unregistered word, and enables conversion to an appropriate target language sentence.

【0005】しかし、従来技術では、原文に直接入力さ
れた目的言語語彙が、その直前または直後の原言語の語
彙(機能語)と組み合わさって句をなすことが推定され
た場合に、その句全体から見て該目的言語語彙の実際の
品詞が適切であるかどうかの判断は行われていなかっ
た。
[0005] However, in the prior art, when it is estimated that a target language vocabulary directly input in a source sentence is combined with a vocabulary (functional word) of the source language immediately before or after the target language vocabulary, the phrase is assumed to be a phrase. It has not been determined whether or not the actual part of speech of the target language vocabulary as a whole is appropriate.

【0006】例えば、日本語から英語への変換を行う自
然言語変換システムにおいて、「frequentに起
こる」という入力があった場合を考える。この場合に、
「frequent」の英語としての品詞は形容詞であ
るが、「frequentに」全体は機能語の「に」の
存在によって日本語としての副詞句となるので、英語の
訳文においては「frequentに」を「frequ
ently」という副詞で訳出する必要がある。しかし
ながら、上記の従来技術では、このような必要性に対応
することができなかった。
For example, consider a case in which a natural language conversion system that converts Japanese into English receives an input “occurs in frequency”. In this case,
The part-of-speech in English of “frequency” is an adjective, but the entire “frequency” is an adverbial phrase in Japanese due to the presence of the functional word “ni”, so in the English translation, “frequency” is replaced by “ frequ
It needs to be translated with the adverb "ently". However, the above-mentioned conventional technology cannot meet such a need.

【0007】本発明の目的は、上述の点に鑑み、複数言
語混じり文である原文を目的言語文に変換する場合にお
いて、原文中に直接入力された目的言語語彙がそれを含
む句の単位といったより広範な範囲から見て目的言語文
で求められる品詞であるかどうかの判断を行い、該目的
言語語彙が目的言語文で求められる品詞でない場合には
求められる(適正な)品詞の目的言語語彙に置き換えて
目的言語文を生成することができる自然言語変換システ
ムを提供することにある。なお、ここでいう「品詞」と
は、日本語における「サ変(サ行変格活用)語幹」のよ
うな屈折形に関する種別を示す情報を含むものとする。
SUMMARY OF THE INVENTION In view of the above, an object of the present invention is to convert an original sentence, which is a sentence mixed with a plurality of languages, into a target language sentence. A judgment is made as to whether or not the part-of-speech required by the target language sentence from a wider range. If the target language vocabulary is not the part of speech required by the target language sentence, the target language vocabulary of the (proper) part-of-speech required To provide a natural language conversion system capable of generating a target language sentence by replacing It is to be noted that the “part of speech” here includes information indicating a type related to a refraction form, such as “sa-change (sa-line transformation utilization) stem” in Japanese.

【0008】[0008]

【課題を解決するための手段】本発明の自然言語変換シ
ステムは、原言語を目的言語に翻訳するための情報を保
持する翻訳辞書部と、同語源の単語の情報を含む目的言
語の情報を保持する目的言語辞書部と、原言語句構成情
報と目的言語語彙品詞情報と原言語句対応目的言語品詞
情報との対応を格納する対訳知識ベース部と、前記翻訳
辞書部の原言語部分を参照して原文を形態素に分割し、
該原文に直接入力された目的言語語彙を該原文から切り
出し、前記翻訳辞書部の原言語部分を用いて該目的言語
語彙を含む句を認識し、該句の機能語の内容に基づいて
該目的言語語彙の原言語における品詞を推定する原文解
析部と、前記原文解析部から原文に直接入力された目的
言語語彙を受け取り、前記目的言語辞書部を検索して該
目的言語語彙の目的言語における品詞を取得する目的言
語語彙保持部と、前記原文解析部から原文中の目的言語
語彙の品詞推定結果を受け取り、前記目的言語語彙保持
部から該原文中の該目的言語語彙の辞書検索結果を受け
取り、該品詞推定結果と該辞書検索結果とを合わせた情
報によって前記対訳知識ベース部を検索して該目的言語
語彙の適正品詞を取得し、該目的言語語彙の表層と該適
正品詞とをキーにして前記目的言語辞書部を検索して該
目的言語語彙と同語源の該適正品詞の目的言語表現を取
得し、該目的言語表現を使用して訳文を生成する訳文生
成部とを有することを特徴とする。
SUMMARY OF THE INVENTION A natural language conversion system according to the present invention includes a translation dictionary unit for storing information for translating a source language into a target language, and target language information including word information of the same word source. Refer to the target language dictionary part to hold, the bilingual knowledge base part storing the correspondence between the source language phrase configuration information, the target language vocabulary part-of-speech information, and the target language part-of-speech information corresponding to the source language phrase, and refer to the source language part of the translation dictionary part. To divide the source text into morphemes,
The target language vocabulary directly input to the original sentence is cut out from the original sentence, a phrase including the target language vocabulary is recognized using the source language portion of the translation dictionary unit, and the target language vocabulary is determined based on the contents of the functional words of the phrase. A source sentence analysis unit for estimating the part of speech in the source language of the language vocabulary; receiving a target language vocabulary directly input to the source sentence from the source sentence analysis unit; searching the target language dictionary unit for a part of speech in the target language of the target language vocabulary Receiving the target language vocabulary holding unit, the part-of-speech estimation result of the target language vocabulary in the original sentence from the source sentence analysis unit, receiving the dictionary search result of the target language vocabulary in the original sentence from the target language vocabulary holding unit, The bilingual knowledge base part is searched by the information combining the part-of-speech estimation result and the dictionary search result to obtain a proper part-of-speech of the target language vocabulary, and a surface layer of the target language vocabulary and the proper part-of-speech are used as keys. The target language dictionary unit to obtain the target language vocabulary and the target linguistic expression of the proper part of speech of the same lexical origin, and a translated sentence generation unit that generates a translated sentence using the target language expression. And

【0009】また、本発明の自然言語変換システムは、
前記対訳知識ベース部の検索結果として得られた適正品
詞をキーとする前記目的言語辞書部の検索において原文
中の目的言語語彙と同語源の該適正品詞の目的言語表現
が得られなかった場合に、前記翻訳辞書部を検索して訳
文に使用する目的言語表現を取得する前記訳文生成部を
有することを特徴とする。
Further, the natural language conversion system of the present invention comprises:
If the target language dictionary unit search using the proper part of speech obtained as a search result of the bilingual knowledge base unit as a key fails to obtain the target language vocabulary in the original sentence and the target language expression of the proper part of speech of the same word source And a translation generation unit that searches the translation dictionary unit and acquires a target language expression used for a translation.

【0010】また、本発明の自然言語変換システムは、
前記対訳知識ベース部の検索結果として得られた適正品
詞をキーとする前記目的言語辞書部の検索において原文
中の目的言語語彙と同語源の該適正品詞の目的言語表現
が得られなかった場合に、前記翻訳辞書部の目的語部分
を検索して訳文に使用する目的言語表現を取得する前記
訳文生成部を有することを特徴とする。
Further, the natural language conversion system of the present invention comprises:
If the target language dictionary unit search using the proper part of speech obtained as a search result of the bilingual knowledge base unit as a key fails to obtain the target language vocabulary in the original sentence and the target language expression of the proper part of speech of the same word source And a translation generating unit that retrieves a target language expression used in a translated sentence by searching for a target word part of the translation dictionary unit.

【0011】また、本発明の自然言語変換システムは、
原言語での目的言語を起源とする外来語とその外来語に
対応する目的言語表現とを格納する外来語目的言語対応
知識ベース部と、原文中に入力された原言語表記の目的
言語起源の語彙を切り出し、該語彙をキーにして前記外
来語目的言語対応知識ベース部を検索して該語彙に対応
する目的言語表現を取得し、該目的言語表現によって目
的言語起源の該語彙を置き換えて該目的言語表現を目的
言語語彙として該原文の解析を行う前記原文解析部とを
有することを特徴とする。
Further, the natural language conversion system of the present invention comprises:
A foreign language target language support knowledge base unit that stores foreign words originating from the target language in the source language and target language expressions corresponding to the foreign words, and a target language origin of the source language notation input in the original text The vocabulary is cut out, the foreign language target language corresponding knowledge base unit is searched using the vocabulary as a key, a target language expression corresponding to the vocabulary is obtained, and the vocabulary of the target language origin is replaced by the target language expression. A source language analysis unit that analyzes the source text using a target language expression as a target language vocabulary.

【0012】本発明の自然言語変換方法は、原言語語彙
と目的言語語彙の混在した原文から目的言語語彙を切だ
し、前記原文中の前記目的言語語彙を含む句の機能語の
内容から前記目的言語語彙の原言語における品詞を推定
し、前記目的言語語彙の表層と前記推定された品詞とを
キーとして、同語源の単語の情報を含む目的言語の情報
を保持する目的言語辞書部を検索し、前記目的言語語彙
と同語源の前記推定された品詞の目的言語表現を取得す
ることを特徴とする。
In the natural language conversion method according to the present invention, a target language vocabulary is cut out from a source text in which a source language vocabulary and a target language vocabulary are mixed, and the target language vocabulary is extracted from the contents of function words of a phrase including the target language vocabulary in the original text. Estimating the part of speech in the source language of the linguistic vocabulary, and searching the target language dictionary unit holding information of the target language including information on words of the same source, using the surface of the target language vocabulary and the estimated part of speech as keys, Acquiring the target language expression of the estimated part of speech having the same lexical origin as the target language vocabulary.

【0013】また、本発明の自然言語変換方法は、前記
目的言語表現を使用し、前記原文の前記目的言語による
訳文を生成することを特徴とする。
Further, the natural language conversion method according to the present invention is characterized in that a translation of the original sentence in the target language is generated using the target language expression.

【0014】また、本発明の自然言語変換方法は、前記
目的言語辞書部の検索の結果、前記目的言語語彙と同語
源の前記推定された品詞の目的言語表現を取得すること
ができなかった場合に、前記原言語を前記目的言語に翻
訳する情報を保持する翻訳辞書部を検索し、前記目的言
語表現を得ることを特徴とする。
In the natural language conversion method according to the present invention, the target language dictionary part may not be able to obtain the target language expression of the estimated part of speech having the same lexical origin as the target language vocabulary. Preferably, a translation dictionary unit holding information for translating the source language into the target language is searched to obtain the target language expression.

【0015】また、本発明の自然言語変換方法は、前記
目的言語辞書部の検索の結果、前記目的言語語彙と同語
源の前記推定された品詞の目的言語表現を取得すること
ができなかった場合に、前記原言語を前記目的言語に翻
訳する情報を保持する翻訳辞書部の目的言語部分を検索
し、前記目的言語表現を得ることを特徴とする。
In the natural language conversion method according to the present invention, the target language dictionary part may not be able to acquire the target language expression of the estimated part of speech having the same lexical origin as the result of the search of the target language dictionary. Preferably, a target language portion of a translation dictionary unit that holds information for translating the source language into the target language is searched to obtain the target language expression.

【0016】また、本発明の自然言語変換方法は、前記
目的言語辞書部の検索の結果、前記目的言語語彙と同語
源の前記推定された品詞の目的言語表現を取得すること
ができなかった場合に、前記原言語を前記目的言語に翻
訳する情報を保持する翻訳辞書部の目的言語部分を検索
して前記目的言語語彙に翻訳される原言語見出しを得
て、前記原言語見出しで再度前記翻訳辞書部を検索して
得られる目的言語訳語の中で、品詞が前記推定された品
詞と一致するものを前記目的言語表現とすることを特徴
とする。
In the natural language conversion method according to the present invention, the search of the target language dictionary unit may fail to obtain the target language expression of the estimated part of speech having the same language as the target language vocabulary. Searching a target language portion of a translation dictionary unit that holds information for translating the source language into the target language to obtain a source language heading translated into the target language vocabulary; Among the target language translations obtained by searching the dictionary part, a word whose part of speech matches the estimated part of speech is set as the target language expression.

【0017】[0017]

【発明の実施の形態】次に、本発明について図面を参照
して説明する。
Next, the present invention will be described with reference to the drawings.

【0018】(1)第1の実施の形態 図1は、本発明の自然言語変換システムの第1の実施の
形態の構成を示すブロック図である。
(1) First Embodiment FIG. 1 is a block diagram showing a configuration of a first embodiment of a natural language conversion system according to the present invention.

【0019】本形態の自然言語変換システムは、原文解
析部1と、翻訳辞書部2と、目的言語語彙保持部3と、
目的言語辞書部4と、訳文生成部5と、対訳知識ベース
部6とを含んで構成されている(構成要素間にはデータ
線12,13,15,34,35,52,54,および
56が存在する)。
The natural language conversion system according to the present embodiment includes an original sentence analysis unit 1, a translation dictionary unit 2, a target language vocabulary holding unit 3,
It includes a target language dictionary unit 4, a translation generation unit 5, and a bilingual knowledge base unit 6 (data lines 12, 13, 15, 34, 35, 52, 54, and 56 between components). Exists).

【0020】図2(a)〜(g)は、本形態の自然言語
変換システムの具体的な動作を説明するための図であ
る。
FIGS. 2A to 2G are diagrams for explaining the specific operation of the natural language conversion system according to the present embodiment.

【0021】図3は、対訳知識ベース部6の構成と具体
的な内容とを示す図である。この図に示すように、対訳
知識ベース部6は、原言語における「機能語と該機能語
と共に句を構成する語(日本語においては一般的に「自
立語」と呼ばれる)の原言語における品詞との組み合わ
せ」を示す原言語句構成情報60(該機能語を示す情報
を機能語情報62といい、該句を構成する機能語以外の
語(日本語では自立語)の品詞を示す情報を品詞情報6
1という)と、該句中の機能語以外の語が目的言語語彙
である場合の該目的言語語彙の目的言語における品詞を
示す目的言語語彙品詞情報63と、該句に対応する目的
言語表現の目的言語における品詞を示す原言語句対応目
的言語品詞情報64とを、対応させて格納している知識
ベースである。
FIG. 3 is a diagram showing the configuration of the bilingual knowledge base unit 6 and its specific contents. As shown in this figure, the bilingual knowledge base unit 6 determines the part-of-speech in the source language of a “functional word and a word that forms a phrase together with the functional word (generally called“ independent word ”in Japanese)” in the source language. (Information indicating the function word is referred to as function word information 62, and information indicating the part of speech of a word other than the function word constituting the phrase (independent in Japanese) is referred to as “function word information 62”). Part of speech information 6
1), the target language vocabulary part-of-speech information 63 indicating the part of speech in the target language of the target language vocabulary when a word other than the function word in the phrase is the target language vocabulary, and the target language expression corresponding to the phrase. This is a knowledge base that stores source language phrase corresponding target language part of speech information 64 indicating the part of speech in the target language in association with each other.

【0022】図4は、本形態の自然言語変換システムの
処理を示す流れ図である。この処理は、形態素単位分割
ステップ401と、目的言語語彙切出しステップ402
と、品詞推定ステップ403と、目的言語辞書部検索ス
テップ404と、目的言語品詞辞書検索結果設定ステッ
プ405と、不存在印辞書検索結果設定ステップ406
と、適正品詞取得ステップ407と、適正品詞目的言語
表現取得ステップ408と、該目的言語表現使用訳文生
成ステップ409とからなる。
FIG. 4 is a flowchart showing the processing of the natural language conversion system of the present embodiment. This processing includes a morpheme unit division step 401 and a target language vocabulary extraction step 402
, Part-of-speech estimation step 403, target language dictionary part search step 404, target language part-of-speech dictionary search result setting step 405, and non-existence mark dictionary search result setting step 406.
And a proper part-of-speech acquisition step 407, a proper part-of-speech target language expression acquisition step 408, and a target language expression use translated sentence generation step 409.

【0023】次に、図1〜図4を参照して、具体例を挙
げながら本実施例の自然言語変換システムの動作を説明
する。
Next, the operation of the natural language conversion system according to the present embodiment will be described with reference to FIGS.

【0024】この例では、原言語が日本語で目的言語が
英語である場合について説明する。しかし、他の言語対
(原言語と目的言語との対)においても全く同じ構成で
同じ効果を持つ自然言語変換システムを実現できること
はいうまでもない。
In this example, a case where the source language is Japanese and the target language is English will be described. However, it goes without saying that a natural language conversion system having exactly the same configuration and the same effect can be realized in other language pairs (pairs of the source language and the target language).

【0025】原文解析部1は、自然言語変換における原
文(目的言語語彙を含む原文)を入力すると、以下の
〜に示すような処理を行う。
When an original sentence (original sentence including a target language vocabulary) in natural language conversion is input, the original sentence analyzing section 1 performs the following processing.

【0026】 まず、原言語を目的言語に翻訳するた
めの情報を保持する翻訳辞書部2の原言語部分をデータ
線12を介して参照して形態素解析を行い、該原文を翻
訳辞書部2の原言語部分を用いて形態素の単位に分割す
る(ステップ401)。
First, morphological analysis is performed by referring to the source language part of the translation dictionary unit 2 that holds information for translating the source language into the target language via the data line 12, and It is divided into morpheme units using the source language part (step 401).

【0027】 次に、該原文に直接入力された目的言
語語彙を該原文から切り出し(ステップ402)、翻訳
辞書部2の原言語部分を用いて該目的言語語彙の原言語
における品詞を推定する(ステップ403)。すなわ
ち、該目的言語語彙を機能語以外の語(日本語であれば
自立語)として含む句(該目的言語語彙とそれに隣接す
る(直前または直後に存在する)機能語とからなる句)
を抽出し、該句中の機能語の解析に基づいて該目的言語
語彙の原言語における品詞(該目的言語語彙を原言語の
語彙として取り扱う際の品詞)を推定する。
Next, the target language vocabulary directly input to the source sentence is cut out from the original sentence (step 402), and the part of speech of the target language vocabulary in the source language is estimated using the source language part of the translation dictionary unit 2 (step 402). Step 403). That is, a phrase including the target language vocabulary as a word other than a functional word (independent word in Japanese) (a phrase including the target language vocabulary and a functional word adjacent thereto (present immediately before or immediately after))
Is extracted, and the part of speech in the source language of the target language vocabulary (part of speech when the target language vocabulary is treated as the source language vocabulary) is estimated based on the analysis of the functional words in the phrase.

【0028】 該原文から切り出した該目的言語語彙
をデータ線13を介して目的言語語彙保持部3に送信す
る。
The target language vocabulary cut out from the original sentence is transmitted to the target language vocabulary holding unit 3 via the data line 13.

【0029】 また、該目的言語語彙の品詞推定結果
を該原文の形態素分割結果に付与して、その解析結果
(該品詞推定結果が付与された形態素分割結果)をデー
タ線15を介して訳文生成部5に送信する。
Further, the part-of-speech estimation result of the target language vocabulary is added to the morpheme division result of the original sentence, and the analysis result (the morpheme division result to which the part-of-speech estimation result is added) is generated via the data line 15 to generate a translated sentence. Transmit to the unit 5.

【0030】図2(a)は、目的言語語彙を含む原文の
例を示す図である。
FIG. 2A shows an example of an original sentence including a target language vocabulary.

【0031】図2(b)は、原文解析部1により図2
(a)の原文が形態素分割された結果を示す図である。
FIG. 2B shows the contents of FIG.
FIG. 9A is a diagram showing a result of morpheme division of the original sentence of FIG.

【0032】図2(c)は、原文解析部1により原文
(図2(a)の原文)中に直接入力された目的言語語彙
として検出されたデータ(目的言語語彙に該当するf
requent)を示す図である。
FIG. 2C shows data (f corresponding to the target language vocabulary) detected as the target language vocabulary directly input into the original sentence (the original sentence of FIG. 2A) by the original sentence analyzer 1.
FIG.

【0033】図2(b)では、図2(a)の「地震がf
requentに起こる。」が、「地震」,「が」,
「目的言語語彙(frequent)」,「に」,
「起こる」,および「。」と形態素単位に分割されてい
る。このうち、図2(c)に示すような「freque
nt」が、目的言語語彙として抽出される。このデータ
(目的言語語彙)は、データ線13を介して、目的言語
語彙保持部3に送信される。
In FIG. 2B, "Earthquake f
happens on request. ”Means“ earthquake ”,“ ga ”,
“Target language vocabulary (frequency)”, “ni”,
It is divided into morpheme units such as "occurs" and ".". Of these, "frequency" as shown in FIG.
nt ”is extracted as the target language vocabulary. This data (target language vocabulary) is transmitted to the target language vocabulary holding unit 3 via the data line 13.

【0034】図2(d)は、データ線15を介して訳文
生成部5に送信されるデータ(解析結果)の例を示す図
である。このデータは、図2(c)の目的言語語彙(f
requent)を含む句(frequentに)の機
能語に該当する「に」をキーにして翻訳辞書部2が検索
され、「に」の直前に接続し得る語(該句を構成する機
能語以外の語(日本語では自立語))の原言語(ここで
は日本語)における品詞が推定され、該推定品詞の情報
が「に」の直前に現れている目的言語語彙に付与された
ものである。図2(d)の例においては、原文中の「f
requent」の品詞は、助詞または形容動詞語尾の
「に」の直前にあることから、名詞,サ変語幹,および
形容動詞語幹のいずれかであると推定されている。
FIG. 2D is a diagram showing an example of data (analysis result) transmitted to the translation generation unit 5 via the data line 15. This data is obtained from the target language vocabulary (f) shown in FIG.
The translation dictionary unit 2 is searched by using “ni” corresponding to a function word of a phrase (request) including “request” as a key, and a word that can be connected immediately before “ni” (a word other than a functional word constituting the phrase) The part of speech in the source language (here, Japanese) of the word (independent word in Japanese)) is estimated, and the information of the estimated part of speech is added to the target language vocabulary appearing immediately before “ni”. In the example of FIG. 2D, “f” in the original text
The part of speech of “request” is immediately before the particle or the adjective verb ending “ni”, and is therefore presumed to be one of a noun, a sa-variable stem, and an adjective verb stem.

【0035】目的言語語彙保持部3は、原文解析部1か
ら目的言語語彙を受け取り、以下の〜に示す処理を
行う。
The target language vocabulary holding unit 3 receives the target language vocabulary from the original sentence analysis unit 1 and performs the following processes (1) to (4).

【0036】 原文解析部1から受け取った目的言語
語彙をキーにして、データ線34を介し目的言語辞書部
4(目的言語の情報を保持する辞書部)を検索する(ス
テップ404)。
Using the target language vocabulary received from the original sentence analysis unit 1 as a key, the target language dictionary unit 4 (dictionary unit holding information on the target language) is searched through the data line 34 (step 404).

【0037】 の検索で目的言語辞書部4に該目的
言語語彙が存在した場合には、該目的言語語彙の目的言
語における品詞を示す辞書検索結果を該目的言語語彙に
付与する(ステップ405)。
If the target language vocabulary exists in the target language dictionary unit 4 in the search of, a dictionary search result indicating the part of speech of the target language vocabulary in the target language is assigned to the target language vocabulary (step 405).

【0038】 一方、の検索で目的言語辞書部4に
該目的言語語彙が存在しなかった場合には、「存在しな
いという印」を示す辞書検索結果を該目的言語語彙に付
与する(ステップ406)。
On the other hand, if the target language vocabulary does not exist in the target language dictionary unit 4 in the search, a dictionary search result indicating “indicating that the target language does not exist” is given to the target language vocabulary (step 406). .

【0039】 またはの辞書検索結果が付与され
た該目的言語語彙をデータ線35を介して訳文生成部5
に送信する。
Alternatively, the target language vocabulary to which the dictionary search result has been added is translated via the data line 35 into the translated sentence generator 5.
Send to

【0040】図2(e)は、図2(a)の原文中の目的
言語語彙の「frequent」が目的言語辞書部4に
存在する場合に、データ線35を介して訳文生成部5に
送信されるデータを示す図である。ここで、「品詞:形
容詞」が辞書検索結果に該当する。
FIG. 2E shows a case where the target language vocabulary “frequency” in the original sentence of FIG. 2A is present in the target language dictionary unit 4 and transmitted to the translated sentence generation unit 5 via the data line 35. FIG. 7 is a diagram showing data to be performed. Here, “part of speech: adjective” corresponds to the dictionary search result.

【0041】訳文生成部5は、原文解析部1から該原文
の解析結果(該原文中の該目的言語語彙の品詞推定結果
を含む解析結果)を受け取り、目的言語語彙保持部3か
ら該原文中の目的言語語彙の辞書検索結果を受け取り、
以下の〜に示す処理を行う。なお、辞書検索結果が
「存在しないという印」である場合(ステップ406参
照)には、以下の処理は行われず、該目的言語語彙を未
登録語とする処理(従来と同様の処理)が行われる。
The translated sentence generating unit 5 receives the analysis result of the original sentence from the original sentence analyzing unit 1 (the analysis result including the part-of-speech estimation result of the target language vocabulary in the original sentence), and receives the analysis result of the original sentence from the target language vocabulary holding unit 3. Receiving the dictionary search result of the target language vocabulary of
The following processes are performed. If the dictionary search result is a “non-existent mark” (see step 406), the following processing is not performed, and processing for setting the target language vocabulary as an unregistered word (the same processing as in the past) is performed. Will be

【0042】 該品詞推定結果と該辞書検索結果とを
合わせて、その合成情報に基づいてデータ線56を介し
て対訳知識ベース部6を検索し、該目的言語語彙を含む
該句を目的言語に訳出する際の品詞(原言語句対応目的
言語品詞情報64によって示される品詞)をデータ線5
6を介して取得する(ステップ407)。なお、このよ
うにして取得された品詞を該目的言語語彙の「適正品
詞」と呼ぶ。
The part-of-speech estimation result and the dictionary search result are combined, and the bilingual knowledge base unit 6 is searched via the data line 56 based on the synthesized information, and the phrase including the target language vocabulary is set as the target language. The part of speech at the time of translation (the part of speech indicated by the target language part of speech information 64 corresponding to the source language phrase) is represented by a data line 5.
6 (step 407). Note that the part of speech acquired in this way is referred to as “appropriate part of speech” of the target language vocabulary.

【0043】すなわち、図3に示すような対訳知識ベー
ス部6に対して、まず原文解析部1で推定された原文中
の該目的言語語彙の品詞をキーにして品詞情報61を検
索する。続いて、該目的言語語彙と共に句を構成する機
能語をキーにして機能語情報62を検索する。さらに、
目的言語語彙保持部3で得られた原文中の目的言語語彙
の目的言語における品詞をキーにして目的言語語彙品詞
情報63を検索する。そして、これら全ての検索結果の
組み合わせにより特定される原言語句対応目的言語品詞
情報64の品詞によって、該目的言語語彙と該機能語と
の組み合わせ(句)に対応する目的言語表現(語または
句)の品詞(適正品詞)を得る。
That is, the part-of-speech information 61 is searched for the bilingual knowledge base unit 6 as shown in FIG. 3 using the part of speech of the target language vocabulary in the original sentence estimated by the original sentence analysis unit 1 as a key. Subsequently, the function word information 62 is searched using the function words constituting the phrase together with the target language vocabulary as a key. further,
The target language vocabulary part-of-speech information 63 is searched using the part of speech in the target language of the target language vocabulary in the original sentence obtained by the target language vocabulary holding unit 3 as a key. The target language expression (word or phrase) corresponding to the combination (phrase) of the target language vocabulary and the functional word is obtained by the part of speech of the target language part of speech information 64 corresponding to the source language phrase specified by the combination of all these search results. ) (Part of speech).

【0044】 ここで、の検索結果の適正品詞が目
的言語語彙保持部3から受けとった原文中の該目的言語
語彙の実際の品詞(目的言語における品詞)と異なって
いる場合には、該目的言語語彙の表層と該適正品詞とを
キーにして目的言語辞書部4を検索し、該目的言語語彙
と同語源の語彙のうちで該適正品詞に該当する品詞の目
的言語表現をデータ線54を介して取得する(ステップ
408)。なお、適正品詞と実際の品詞とが同一である
場合には、該目的言語語彙を「目的言語表現」として以
下のステップ409の処理を行う。
If the proper part of speech of the search result is different from the actual part of speech (part of speech in the target language) of the target language vocabulary in the original sentence received from the target language vocabulary holding unit 3, The target language dictionary unit 4 is searched using the surface layer of the vocabulary and the appropriate part of speech as a key, and the target language expression of the part of speech corresponding to the appropriate part of speech in the vocabulary of the same language as the target language vocabulary is transmitted via the data line 54. (Step 408). If the proper part of speech is the same as the actual part of speech, the processing of the following step 409 is performed with the target language vocabulary being “target language expression”.

【0045】 最後に、原言語から目的言語への単語
変換の後に、でデータ線54を介して得た目的言語表
現を原文中の元の該目的言語語彙と置き換え、原言語か
ら目的言語への構文変換や、主語と述語との数素性の調
整等を行って訳文を生成する(適正品詞の目的言語表現
を使用して訳文を生成する)(ステップ409)。
Finally, after word conversion from the source language to the target language, the target language expression obtained via the data line 54 is replaced with the original target language vocabulary in the source text, and the source language is converted to the target language. A translated sentence is generated by syntactic conversion, adjustment of the numerical primality of the subject and the predicate, etc. (a translated sentence is generated using the target linguistic expression of a proper part of speech) (step 409).

【0046】図2(d)で示すように、図2(a)の原
文中の目的言語語彙の「frequent」はその直後
の語彙が助詞または形容動詞語尾の「に」であることか
ら「名詞」,「サ変語幹」,および「形容動詞語幹」の
いずれかである。
As shown in FIG. 2D, the target language vocabulary “frequency” in the original sentence of FIG. 2A is “noun” because the vocabulary immediately after it is a particle or an adjective verb ending “ni”. "," Sa strange stem ", and" adjective verb stem ".

【0047】また、図2(e)で示すように、該目的言
語語彙を目的言語辞書部4で辞書引きした結果(辞書検
索結果)として得られた品詞は「形容詞」である。
As shown in FIG. 2 (e), the part of speech obtained as a result (dictionary search result) of the target language vocabulary being looked up by the target language dictionary unit 4 is an "adjective".

【0048】これらの組み合わせによって、図3に示す
ような対訳知識ベース部6を検索すると、該組み合わせ
に対応する目的言語の品詞(適正品詞)は「副詞」であ
ることが分かる。
When the bilingual knowledge base 6 as shown in FIG. 3 is searched by using these combinations, it is found that the part of speech (proper part of speech) of the target language corresponding to the combination is an “adverb”.

【0049】すなわち、図3に示す対訳知識ベース部6
の具体的な内容を参照すると、品詞情報61における
「形容動詞語幹」と機能語情報62における「に」と目
的言語語彙品詞情報63における「形容詞」とに対応す
る原言語句対応目的言語品詞情報64は「副詞」である
ことが分かる(図3中の◎を付したエントリを参照のこ
と)。
That is, the bilingual knowledge base unit 6 shown in FIG.
When referring to the specific contents of the target language part-of-speech information corresponding to the source language phrase corresponding to “adjective verb stem” in part-of-speech information 61, “ni” in functional word information 62, and “adjective” in target language vocabulary part-of-speech information 63 It can be seen that 64 is an “adverb” (see the entry marked with ◎ in FIG. 3).

【0050】そこで、訳文生成部5は、原言語から目的
言語への単語変換の後に、データ線54を介して目的言
語辞書部4を検索し、「frequent」と同語源の
「frequently」という副詞を得て、これを元
の「frequent」と置き換えて、原言語から目的
言語への構文変換や主語と述語との数素性の調整等を行
って訳文の生成を完成させる。
Therefore, the translated sentence generation unit 5 searches the target language dictionary unit 4 via the data line 54 after the word conversion from the source language to the target language, and finds an adverb of "frequency" and the same word source "frequency". Then, this is replaced with the original "frequency", and the syntax conversion from the source language to the target language, the numerical primality of the subject and the predicate are adjusted, and the generation of the translated sentence is completed.

【0051】図2(f)は、図2(a)の原文の自立語
部分を目的言語の単語(語彙)に変換した直後のデータ
を示す図である。
FIG. 2F is a diagram showing data immediately after the independent word portion of the original sentence of FIG. 2A is converted into a word (vocabulary) of the target language.

【0052】図2(f)において、鍵括弧『』は、その
中の語彙が未確定であることを示しており、該語彙をそ
の直後の丸括弧()内の品詞(適正品詞)の語彙(目的
言語表現)に置き換えることを指示するという意味を持
つ。
In FIG. 2 (f), the brackets "" indicate that the vocabulary in the brackets is undetermined, and the vocabulary is replaced with the vocabulary of the part of speech (proper part of speech) in parentheses () immediately after the brackets. (Target linguistic expression).

【0053】図2(g)は、未確定であった「freq
uent」を副詞形の「frequently」に置き
換え、さらに構文変換や主語と述語との数素性の調整等
を行って完成させた訳文を示す図である。
FIG. 2 (g) shows the undetermined “freq
FIG. 13 is a diagram showing a translated sentence completed by replacing “uent” with an adverb form “frequency” and further performing syntax conversion, adjusting the numerical features of the subject and the predicate, and the like.

【0054】このように、本発明によると、原文中に目
的言語語彙が現れた場合に、その目的言語語彙を含む句
全体から目的言語文で生成すべき該目的言語語彙の品詞
が推定されるので、従来技術の自然言語変換システム
(複数言語混じり文である原文から目的言語文への言語
変換を行う自然言語変換システム)に比べて翻訳結果
(訳文)の質が向上する。
As described above, according to the present invention, when the target language vocabulary appears in the original sentence, the part of speech of the target language vocabulary to be generated in the target language sentence is estimated from the entire phrase including the target language vocabulary. Therefore, the quality of the translation result (translated sentence) is improved as compared with a conventional natural language conversion system (a natural language conversion system that performs language conversion from an original sentence that is a mixture of multiple languages to a target language sentence).

【0055】(2) 第2の実施の形態 図1は、本発明の自然言語変換システムの第2の実施の
形態の構成を示すブロック図でもある。このように、第
2の実施の形態も第1の実施の形態と同様の構成によっ
て実現される。ただし、第2の実施の形態の自然言語変
換システムにおける訳文生成部5は、対訳知識ベース部
6の検索結果として得られた適正品詞をキーとする目的
言語辞書部4の検索において原文中の目的言語語彙と同
語源の該適正品詞の目的言語表現が得られなかった場合
に、翻訳辞書部2を検索して訳文に使用する目的言語表
現を取得する。
(2) Second Embodiment FIG. 1 is also a block diagram showing a configuration of a natural language conversion system according to a second embodiment of the present invention. Thus, the second embodiment is also realized by the same configuration as the first embodiment. However, in the natural language conversion system according to the second embodiment, the translated sentence generating unit 5 uses the proper part of speech obtained as a search result of the bilingual knowledge base unit 6 as a key to search the target language dictionary unit 4 for a target in the original sentence. If the target linguistic expression of the proper part of speech having the same linguistic vocabulary as the linguistic vocabulary cannot be obtained, the translation dictionary unit 2 is searched to obtain the target linguistic expression used for the translated sentence.

【0056】図5(a)〜(g)および図6は、本形態
の自然言語変換システムの具体的な動作を説明するため
の図である。
FIGS. 5A to 5G and FIG. 6 are diagrams for explaining the specific operation of the natural language conversion system according to the present embodiment.

【0057】次に、以上のような特徴を有する第2の実
施の形態の自然言語変換システムの動作(主として本形
態に特有の動作)について説明する。
Next, the operation of the natural language conversion system according to the second embodiment having the above-described features (mainly the operation unique to this embodiment) will be described.

【0058】ここでは、訳文生成部5が対訳知識ベース
部6の検索結果として得られた適正品詞をキーとして目
的言語辞書部4を検索した結果、原文中の目的言語語彙
と同語源の該適正品詞の語彙(目的言語表現)が得られ
なかった場合の動作について、具体例を挙げて説明す
る。
Here, as a result of the translated sentence generation unit 5 searching the target language dictionary unit 4 using the appropriate part of speech obtained as a search result of the bilingual knowledge base unit 6 as a key, the target language vocabulary in the original sentence and the appropriate The operation when the vocabulary of the part of speech (target language expression) is not obtained will be described with a specific example.

【0059】例えば、図5(a)のような「空港にac
cessする。」という原文の入力があった場合には、
図2に示す例に対する処理と同様に、原文解析部1によ
って、図5(b)で示すように「空港」,「に」,「目
的言語語彙(access)」,「する」,およ
び「。」に形態素分割され、図5(c)で示すように
「access」が目的言語語彙として切り出される。
For example, as shown in FIG.
ess. ),
As in the process for the example shown in FIG. 2, the original sentence analysis unit 1 generates “airport”, “ni”, “target language vocabulary (access)”, “do”, and “do” as shown in FIG. ”, And“ access ”is cut out as a target language vocabulary as shown in FIG.

【0060】原文解析部1は、図5(d)で示すよう
に、図5(a)の原文を解析する。この場合には、目的
言語語彙「access」の品詞としてはその直後の機
能語「する」から「サ変語幹」であることが推定され、
このデータ(目的言語語彙「access」の品詞推定
結果「サ変語幹」)は訳文生成部5に送信される。
The original sentence analyzer 1 analyzes the original sentence shown in FIG. 5A as shown in FIG. 5D. In this case, the part-of-speech of the target language vocabulary “access” is presumed to be “sa strange stem” from the function word “suru” immediately after that,
This data (the part-of-speech estimation result of the target language vocabulary “access” “sa-variable stem”) is transmitted to the translation generation unit 5.

【0061】一方、図5(e)で示すように、目的言語
語彙保持部3による目的言語辞書部4の検索によって、
目的言語語彙「access」の目的言語としての品詞
は名詞であることが分かり、そのデータ(辞書検索結
果)は訳文生成部5に送信される。
On the other hand, as shown in FIG. 5E, the search of the target language dictionary unit 4 by the target language vocabulary holding unit 3
The part of speech as the target language of the target language vocabulary “access” is found to be a noun, and its data (dictionary search result) is transmitted to the translated sentence generation unit 5.

【0062】訳文生成部5は、目的言語語彙「acce
ss」の品詞推定結果である「サ変語幹」と、該目的言
語語彙の直後の機能語の「する」と、目的言語語彙保持
部3で得られた「access」の辞書検索結果の「名
詞」との組み合わせをキーにして、対訳知識ベース部6
を検索する。そして、その検索結果として、対訳知識ベ
ース部6内の原言語句対応目的言語品詞情報64から
「access」を動詞句として訳出すべきというデー
タ(適正品詞が「動詞」であること)を得る(図3中の
○を付したエントリを参照のこと)。
The translated sentence generation unit 5 generates the target language vocabulary “acce
“ss”, which is the result of the part-of-speech estimation of “ss”, “do”, which is the function word immediately after the target language vocabulary, and “noun”, which is the dictionary search result of “access” obtained by the target language vocabulary holding unit 3 Using the combination of
Search for. Then, as the search result, data indicating that “access” should be translated as a verb phrase from the source language phrase corresponding target language part-of-speech information 64 in the bilingual knowledge base 6 (the proper part of speech is “verb”) is obtained ( (See the entry marked with a circle in FIG. 3).

【0063】図5(f)は、図5(a)の原文の自立語
部分を目的言語の単語(語彙)に変換したデータを示す
図である。図5(f)中の鍵括弧『』は、図2に示す例
と同様に、その中の語彙が未確定であることを表し、該
語彙をその直後の丸括弧()内の品詞(適正品詞)の語
彙(目的言語表現)に置き換えることを指示している。
FIG. 5 (f) is a diagram showing data obtained by converting the independent word portion of the original sentence of FIG. 5 (a) into a word (vocabulary) of the target language. The parentheses “” in FIG. 5F indicate that the vocabulary in them is undetermined, as in the example shown in FIG. 2, and the vocabulary is indicated by the part of speech (appropriate Vocabulary (target language expression).

【0064】そこで、訳文生成部5は、「acces
s」の動詞形を得るために、目的言語辞書部4を検索す
る。このとき、「access」と同語源の動詞の語彙
が目的言語辞書部4からは得られなかったとする。この
場合に、訳文生成部5はデータ線52を介して翻訳辞書
部2を検索する。
Then, the translated sentence generation unit 5 sets “acces
In order to obtain the verb form of "s", the target language dictionary unit 4 is searched. At this time, it is assumed that the vocabulary of the verb having the same origin as “access” cannot be obtained from the target language dictionary unit 4. In this case, the translated sentence generation unit 5 searches the translation dictionary unit 2 via the data line 52.

【0065】この例の場合には、訳文生成部5は、名詞
の「access」を翻訳辞書部2の目的言語部分で検
索し、次に、それに繋がっている原言語見出しのうち品
詞がサ変語幹のものを検索する。さらに、該原言語見出
しに繋がっている目的言語のうち動詞句である「get
access」を検出し、その動詞句を適正品詞の目
的言語表現として、図5(g)に示すような訳文を生成
する。
In the case of this example, the translated sentence generation unit 5 searches for the noun “access” in the target language part of the translation dictionary unit 2 and then finds that the part of speech of the source language heading connected to it is Search for things. Further, the verb phrase “get” in the target language connected to the source language heading
access ”is detected, and a translation as shown in FIG. 5 (g) is generated using the verb phrase as a target linguistic expression of a proper part of speech.

【0066】図6は、翻訳辞書部2の論理的構造の一例
を示す図である。
FIG. 6 is a diagram showing an example of the logical structure of the translation dictionary unit 2.

【0067】図6で、矢印は訳文生成部5の検索の過程
を辿っていることを表す。また、「*」は任意の文字列
を示しており、この場合には、品詞がサ変語幹である任
意の見出しという意味で用いられている。
In FIG. 6, the arrow indicates that the translation sentence generation unit 5 is following the search process. In addition, "*" indicates an arbitrary character string, and in this case, the part of speech is used to mean an arbitrary heading whose stem is a variable stem.

【0068】このように、本発明によると、原文中で目
的言語語彙として検出された語彙に対して、適正品詞の
目的言語表現が目的言語辞書部4で検出できない場合に
も、翻訳辞書部2を目的言語部分から辿って検索するこ
とにより、適正品詞の目的言語表現を検出することがで
きる。
As described above, according to the present invention, even if the target language expression of a proper part of speech cannot be detected by the target language dictionary unit 4 for the vocabulary detected as the target language vocabulary in the original text, Is searched from the target language portion, the target language expression of the appropriate part of speech can be detected.

【0069】(3) 第3の実施の形態 図7は、本発明の自然言語変換システムの第3の実施の
形態の構成を示すブロック図である。
(3) Third Embodiment FIG. 7 is a block diagram showing a configuration of a natural language conversion system according to a third embodiment of the present invention.

【0070】本形態の自然言語変換システムは、図1に
示す自然言語変換システムの構成に加えて、外来語目的
言語対応知識ベース部7およびデータ線17を含んで構
成されている。
The natural language conversion system according to the present embodiment includes a foreign language target language correspondence knowledge base unit 7 and a data line 17 in addition to the configuration of the natural language conversion system shown in FIG.

【0071】図8は、外来語目的言語対応知識ベース部
7の構成および具体的な内容を示す図である。
FIG. 8 is a diagram showing the configuration and specific contents of the foreign language target language correspondence knowledge base unit 7. As shown in FIG.

【0072】外来語目的言語対応知識ベース部7は、原
言語での目的言語を起源とする外来語とその外来語に対
応する目的言語表現とを格納する知識ベースである。例
えば、図8に示すように、日本語における英語起源のカ
タカナ語(外来語)とそれに対応する英語表現との対応
を記述したもの等が該当する。
The foreign language target language correspondence knowledge base unit 7 is a knowledge base for storing foreign words originating from the target language in the source language and target language expressions corresponding to the foreign words. For example, as shown in FIG. 8, a description of the correspondence between Japanese Katakana (origin word) of English origin and the corresponding English expression is applicable.

【0073】このような外来語目的言語対応知識ベース
部7には、言語Aに言語Bの読みを付与し、それを言語
Bから言語Aの方向で検索できるように加工したものが
ある。例えば、日本語の外来語とそれに対応する英語表
現とを例にとると、英語の「computer」をカタ
カナ読みした「コンピュータ」と「コンピューター」
は、図8で示しているように、外来語目的言語対応知識
ベース部7の上では、「コンピュータ」および「コンピ
ューター」のそれぞれから「computer」が検索
できるように加工してある。
Some of the foreign language target language correspondence knowledge base units 7 are provided with the reading of the language B added to the language A and processed so as to be searchable in the direction from the language B to the language A. For example, taking a Japanese foreign word and its corresponding English expression as an example, “computer” and “computer” that read katakana from “computer” in English
As shown in FIG. 8, is processed on the foreign language target language correspondence knowledge base unit 7 so that “computer” can be searched from “computer” and “computer”.

【0074】図9(a)〜(g)は、本形態の自然言語
変換システムの具体的な動作を説明するための図であ
る。
FIGS. 9A to 9G are diagrams for explaining specific operations of the natural language conversion system according to the present embodiment.

【0075】次に、本形態の自然言語変換システムの動
作(主として本形態に特有の動作)について、図7〜図
9を用いて例を挙げながら具体的に説明する。
Next, the operation of the natural language conversion system according to the present embodiment (mainly the operation peculiar to the present embodiment) will be specifically described with reference to FIGS.

【0076】ここでも、第1の実施の形態での説明と同
様に、原言語が日本語で目的言語が英語である場合を例
にとって説明する。
Here, as in the description of the first embodiment, a case where the source language is Japanese and the target language is English will be described as an example.

【0077】図9(a)に示すような「システムをイン
ストールする。」という原文の入力があったとする。
Assume that an original sentence "Install the system" as shown in FIG.

【0078】原文解析部1は、第1の実施の形態につい
て説明した場合と同様に、翻訳辞書部2をデータ線12
を介して参照し該原文を形態素単位に分割する。
The original sentence analyzing unit 1 connects the translation dictionary unit 2 to the data line 12 as in the case described in the first embodiment.
And divides the original sentence into morpheme units.

【0079】原文解析部1は、この分割後の形態素解析
において未登録語(翻訳辞書部2の原言語部分に存在し
ない語彙)を検出した場合には、その未登録語が目的言
語起源の外来語(原言語表記の目的言語起源の語彙)で
あるか否かを何らかの基準(例えば、日本語が原文であ
る場合にはカタカナ表記であること)によって判定す
る。
When the original sentence analysis unit 1 detects an unregistered word (a vocabulary that does not exist in the source language part of the translation dictionary unit 2) in the morphological analysis after the division, the unregistered word is converted into a foreign language originating in the target language. Whether the word is a word (a vocabulary of the source language notation of the source language notation) is determined based on some criterion (for example, if Japanese is the original text, it should be written in katakana).

【0080】さらに、原文解析部1は、その未登録語が
目的言語起源の外来語であると判断すると、その未登録
語を目的言語起源の外来語として切り出し、この外来語
をキーとして外来語目的言語対応知識ベース部7を検索
し、該外来語に対応する目的言語表現を取得し、その目
的言語表現で該未登録語(該外来語)を置き換える。
Further, when the original sentence analysis unit 1 determines that the unregistered word is a foreign word originating in the target language, the original sentence analysis unit 1 cuts out the unregistered word as a foreign word originating in the target language, and uses this foreign word as a key to input the foreign word. The target language corresponding knowledge base unit 7 is searched to obtain a target language expression corresponding to the foreign language, and the target language expression replaces the unregistered word (the foreign word).

【0081】その上で、原文解析部1は、該目的言語表
現を目的言語語彙として、第1の実施の形態で説明した
と同様に、該原文の解析を行う。
Then, the original sentence analysis unit 1 analyzes the original sentence using the target language expression as the target language vocabulary in the same manner as described in the first embodiment.

【0082】図9に示す例では、原文解析部1は、図9
(a)の原文中の「インストール」が翻訳辞書部2に見
出しとして登録されていなかった場合に、「インストー
ル」がカタカナ表記であることから「インストール」を
目的言語起源の外来語(原言語表記の目的言語起源の語
彙)として切り出し、これをキーとして外来語目的言語
対応知識ベース部7を検索し、「インストール」に対応
する目的言語表現として「install」を得て、図
9(a)の原文中の「インストール」を「instal
l」に置き換える。
In the example shown in FIG. 9, the original sentence analyzing unit 1
In the case where “install” in the original sentence of (a) is not registered as a heading in the translation dictionary unit 2, since “install” is in katakana notation, “install” is a foreign word originating in the target language (original language notation). (A vocabulary derived from the target language), and using this as a key to search the foreign language target language correspondence knowledge base unit 7 to obtain “install” as the target language expression corresponding to “install”, "Install" in the original text to "install
l ”.

【0083】したがって、原文解析部1による形態素分
割の分割結果は、図9(b)で示しているような結果と
なる。
Accordingly, the result of the morpheme division by the original sentence analysis unit 1 is as shown in FIG. 9B.

【0084】後は、第1の実施の形態における処理と同
様に、図9(c)で示すように「install」が目
的言語語彙として切り出され、図9(d)に示すように
該目的言語語彙の品詞が推定される。
Thereafter, similarly to the processing in the first embodiment, “install” is cut out as a target language vocabulary as shown in FIG. 9C, and the target language vocabulary is cut out as shown in FIG. The part of speech of the vocabulary is estimated.

【0085】目的言語語彙保持部3および訳文生成部5
は、第1の実施の形態で説明したと同様の処理を行う。
Target language vocabulary storage unit 3 and translated sentence generation unit 5
Performs the same processing as described in the first embodiment.

【0086】すなわち、図9の例では、目的言語語彙保
持部3は、原文解析部1から図9(c)のデータをデー
タ線13を介して受け取り、目的言語辞書部4を検索し
て図9(e)の辞書検索結果を得る。
That is, in the example of FIG. 9, the target language vocabulary holding unit 3 receives the data of FIG. 9C from the original sentence analyzing unit 1 through the data line 13 and searches the target language dictionary unit 4 to retrieve the data. The dictionary search result of 9 (e) is obtained.

【0087】また、訳文生成部5は、原文解析部1から
図9(d)のデータを受け取り、目的言語語彙保持部3
から図9(e)のデータを受け取り、両データを基にし
て対訳知識ベース部6を検索して、「installす
る」を動詞句として訳出すべきというデータを得て、図
9(f)に示すように原文中の自立語部分を目的言語の
単語に変換する。
The translated sentence generation unit 5 receives the data shown in FIG. 9D from the original sentence analysis unit 1 and converts the data into the target language vocabulary storage unit 3.
9 (e), the bilingual knowledge base 6 is searched based on both data to obtain data indicating that "install" should be translated as a verb phrase. As shown, the independent word part in the original sentence is converted into a word in the target language.

【0088】さらに、訳文生成部5は、該原文中の目的
言語語彙である「install」が図9(e)で示す
ように動詞であるので、構文変換等を行って図9(g)
に示すような訳文を生成する。
Further, since the target language vocabulary “install” in the original sentence is a verb as shown in FIG.
The translation as shown in is generated.

【0089】このように、本発明によると、原文中に原
言語で表記された目的言語起源の未登録語が入力された
場合にも、原言語表記の目的言語起源の語彙に対応する
目的言語表現を格納した外来語目的言語対応知識ベース
部7を参照して、該未登録語と対応する目的言語表現を
得て、原文中に直接入力された目的言語語彙と同様に該
未登録語(該目的言語表現に置き換えられた未登録語)
を扱うことができる。
As described above, according to the present invention, even when an unregistered word of the target language origin written in the source language is input in the original text, the target language corresponding to the vocabulary of the target language origin of the source language notation is input. The target language expression corresponding to the unregistered word is obtained by referring to the foreign language target language correspondence knowledge base unit 7 in which the expression is stored, and the unregistered word (like the target language vocabulary directly input in the original text) is obtained. Unregistered words replaced with the target language expression)
Can be handled.

【0090】[0090]

【実施例】次に、本発明の自然言語変換システムを実施
する際の具体的なコンピュータシステムのハードウェア
構成の例について説明する。
Next, an example of a specific hardware configuration of a computer system when implementing the natural language conversion system of the present invention will be described.

【0091】(1)第1の実施例 第1の実施例として、先に述べた本発明の第1の実施の
形態および第2の実施の形態に対応する実施例について
説明する。
(1) First Example As a first example, an example corresponding to the above-described first and second embodiments of the present invention will be described.

【0092】図10は、上述した第1の実施の形態およ
び第2の実施の形態の自然言語変換システムを実施する
際の具体的なコンピュータシステムのハードウェア構成
の一例を示すブロック図である。
FIG. 10 is a block diagram showing an example of a specific hardware configuration of a computer system when implementing the natural language conversion systems according to the first and second embodiments.

【0093】このコンピュータシステムは、CPU(C
entral Processing Unit)10
1と、メモリ102と、自然言語変換メモリ103と、
入力装置104と、翻訳辞書部105と、目的言語辞書
部106と、対訳知識ベース部107と、表示装置10
8とを含んで構成されている。また、各構成要素は、C
PU101によって制御されるバス109に接続されて
いる。
This computer system has a CPU (C
central Processing Unit) 10
1, a memory 102, a natural language conversion memory 103,
Input device 104, translation dictionary unit 105, target language dictionary unit 106, bilingual knowledge base unit 107, display device 10
8 is included. Each component is represented by C
It is connected to a bus 109 controlled by the PU 101.

【0094】入力装置104は、キーボードやマウス等
の装置で実現される。この入力装置104による入力
は、図1における原文解析部1に対して外部から流入し
ている矢線に対応している。
The input device 104 is realized by a device such as a keyboard and a mouse. The input by the input device 104 corresponds to the arrow flowing from the outside into the original sentence analysis unit 1 in FIG.

【0095】表示装置108は、CRT(Cathod
e Ray Tube)ディスプレイ等の装置で実現さ
れる。この表示装置108による出力(表示)は、図1
における訳文生成部5から外部に流出している矢線に対
応している。
The display device 108 is a CRT (Cathod).
e Ray Tube) is realized by a device such as a display. The output (display) by the display device 108 is shown in FIG.
Corresponds to the arrow flowing out from the translation generation unit 5 to the outside.

【0096】翻訳辞書部105,目的言語辞書部10
6,および対訳知識ベース部107は、それぞれ、図1
中の翻訳辞書部2,目的言語辞書部4,および対訳知識
ベース部6に対応している。これらの各部の内容は、磁
気ディスク装置等に格納されている。
Translation dictionary unit 105, target language dictionary unit 10
6 and the bilingual knowledge base unit 107 respectively
It corresponds to the translation dictionary unit 2, the target language dictionary unit 4, and the bilingual knowledge base unit 6 in the middle. The contents of these units are stored in a magnetic disk device or the like.

【0097】メモリ102は、オペレーティング・シス
テム等のシステムプログラムを格納すると共に、ワーク
エリアとしても使用される。
The memory 102 stores a system program such as an operating system and is also used as a work area.

【0098】自然言語変換メモリ103は、本コンピュ
ータシステムを本発明の自然言語変換システムとして機
能させるためのプログラムを記憶するメモリであり、フ
ロッピィディスク媒体やRAM(Random Acc
ess Memory)カードや磁気ディスク装置等で
構成されている。
The natural language conversion memory 103 is a memory for storing a program for causing the present computer system to function as the natural language conversion system of the present invention, and includes a floppy disk medium and a random access memory (RAM).
ESS Memory) cards, magnetic disk devices, and the like.

【0099】この自然言語変換メモリ103には、図1
中の原文解析部1,目的言語語彙保持部3,および訳文
生成部5に相当する機能を果たすプログラムが、CPU
101によって読取り可能なコードとして記憶されてい
る。
The natural language conversion memory 103 has the configuration shown in FIG.
A program that performs functions corresponding to the original sentence analysis unit 1, target language vocabulary holding unit 3, and translated sentence generation unit 5 is executed by a CPU.
It is stored as a code that can be read by 101.

【0100】CPU101は、このようなプログラムを
バス109を介して読み取り、先に説明した図1中の原
文解析部1,目的言語語彙保持部3,および訳文生成部
5による所定の処理を実行する。
The CPU 101 reads such a program via the bus 109, and executes predetermined processing by the above-described original sentence analysis unit 1, target language vocabulary holding unit 3, and translated sentence generation unit 5 in FIG. .

【0101】(2) 第2の実施例 第2の実施例として、先に述べた本発明の第3の実施の
形態に対応する実施例について説明する。
(2) Second Example As a second example, an example corresponding to the above-described third embodiment of the present invention will be described.

【0102】図11は、上述した第3の実施の形態の自
然言語変換システムを実施する際の具体的なコンピュー
タシステムのハードウェア構成の一例を示すブロック図
である。
FIG. 11 is a block diagram showing an example of a specific hardware configuration of a computer system for implementing the natural language conversion system according to the third embodiment.

【0103】このコンピュータシステムは、CPU10
1と、メモリ102と、自然言語変換メモリ103と、
入力装置104と、翻訳辞書部105と、目的言語辞書
部106と、対訳知識ベース部107と、表示装置10
8と、外来語目的言語対応知識ベース部110とを含ん
で構成されている。また、各構成要素は、CPU101
によって制御されるバス109に接続されている。
This computer system has a CPU 10
1, a memory 102, a natural language conversion memory 103,
Input device 104, translation dictionary unit 105, target language dictionary unit 106, bilingual knowledge base unit 107, display device 10
8 and a foreign language target language correspondence knowledge base unit 110. Also, each component is the CPU 101
Connected to a bus 109 controlled by

【0104】入力装置104は、キーボードやマウス等
の装置で実現される。この入力装置104による入力
は、図7における原文解析部1に対して外部から流入し
ている矢線に対応している。
The input device 104 is realized by a device such as a keyboard and a mouse. The input by the input device 104 corresponds to the arrow flowing from the outside into the original sentence analysis unit 1 in FIG.

【0105】表示装置108は、CRTディスプレイ等
の装置で実現される。この表示装置108による出力
(表示)は、図7における訳文生成部5から外部に流出
している矢線に対応している。
The display device 108 is realized by a device such as a CRT display. The output (display) by the display device 108 corresponds to the arrow flowing out of the translation generation unit 5 in FIG.

【0106】翻訳辞書部105,目的言語辞書部10
6,対訳知識ベース部107,および外来語目的言語対
応知識ベース部110は、それぞれ、図7中の翻訳辞書
部2,目的言語辞書部4,対訳知識ベース部6,および
外来語目的言語対応知識ベース部7に対応している。こ
れらの各部の内容は、磁気ディスク装置等に格納されて
いる。
The translation dictionary unit 105 and the target language dictionary unit 10
6, the bilingual knowledge base unit 107 and the foreign language target language corresponding knowledge base unit 110 are respectively a translation dictionary unit 2, a target language dictionary unit 4, a bilingual knowledge base unit 6, and a foreign language target language corresponding knowledge in FIG. It corresponds to the base unit 7. The contents of these units are stored in a magnetic disk device or the like.

【0107】メモリ102は、オペレーティング・シス
テム等のシステムプログラムを格納すると共に、ワーク
エリアとしても使用される。
The memory 102 stores a system program such as an operating system and is also used as a work area.

【0108】自然言語変換メモリ103は、本コンピュ
ータシステムを本発明の自然言語変換システムとして機
能させるためのプログラムを記憶するメモリであり、フ
ロッピィディスク媒体やRAMカードや磁気ディスク装
置等で構成されている。
The natural language conversion memory 103 is a memory for storing a program for causing the computer system to function as the natural language conversion system of the present invention, and is constituted by a floppy disk medium, a RAM card, a magnetic disk device, or the like. .

【0109】この自然言語変換メモリ103には、図7
中の原文解析部1,目的言語語彙保持部3,および訳文
生成部5に相当する機能を果たすプログラムが、CPU
101によって読取り可能なコードとして記憶されてい
る。
The natural language conversion memory 103 has the configuration shown in FIG.
A program that performs functions corresponding to the original sentence analysis unit 1, target language vocabulary holding unit 3, and translated sentence generation unit 5 is executed by a CPU.
It is stored as a code that can be read by 101.

【0110】CPU101は、このようなプログラムを
バス109を介して読み取り、先に説明した図7中の原
文解析部1,目的言語語彙保持部3,および訳文生成部
5による所定の処理を実行する。
The CPU 101 reads such a program via the bus 109, and executes predetermined processing by the above-described original sentence analysis unit 1, target language vocabulary holding unit 3, and translated sentence generation unit 5 in FIG. .

【0111】[0111]

【発明の効果】以上説明したように、本発明の自然言語
変換システムは、対訳知識ベース部を備え、原文に直接
入力された目的言語語彙が出現する場合に該目的言語語
彙とそれに隣接する原言語の機能語との組み合わせ
(句)といったより広範な単位を考慮して変換を行うこ
とにより、該目的言語語彙が最終の目的言語文において
期待される品詞と異なっている場合にも、該目的言語語
彙を求められる(適正な)品詞に変換して訳文を生成す
ることができ、複数言語混じり文である原文の目的言語
文への変換結果の質を向上させることができるという効
果を有する。
As described above, the natural language conversion system of the present invention includes the bilingual knowledge base unit, and when a target language vocabulary directly input in an original text appears, the target language vocabulary and an adjacent source vocabulary are used. By performing conversion taking into account a wider range of units such as combinations (phrases) with functional words of the language, even if the target language vocabulary is different from the expected part of speech in the final target language sentence, It is possible to generate a translated sentence by converting a linguistic vocabulary into a required (appropriate) part of speech, and this has the effect of improving the quality of the result of conversion of the original sentence, which is a mixed sentence of multiple languages, into the target language sentence.

【0112】また、本発明の自然言語の変換システムで
は、外来語目的言語対応知識ベース部を備え、原文中に
原言語表記の目的言語起源の語彙が入力された場合に、
該語彙をキーにした外来語目的言語対応知識ベース部の
検索によって該語彙に対応する目的言語表現を取得する
ことにより、原文中に入力された原言語表記の目的言語
起源の語彙が未登録語として扱われることを回避する可
能性が高くなり、「原言語で表記された目的言語起源の
語彙が翻訳辞書部の原言語見出しと登録されていない場
合に正しい翻訳結果が得られない」という問題点を解決
することができるという効果がある。
Further, the natural language conversion system of the present invention includes a foreign language target language correspondence knowledge base unit, and when a vocabulary of the target language origin of the source language notation is input in the original text,
By acquiring the target language expression corresponding to the vocabulary by searching the foreign language target language supporting knowledge base unit using the vocabulary as a key, the vocabulary of the target language origin of the source language notation input in the original text is an unregistered word. There is a high possibility of avoiding being treated as, and the problem is that if the vocabulary of the target language written in the source language is not registered as the source language heading in the translation dictionary part, a correct translation result will not be obtained. There is an effect that the point can be solved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の自然言語変換システムの第1または
第2の実施の形態の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a first or second embodiment of a natural language conversion system of the present invention.

【図2】 本発明の自然言語変換システムの第1の実施
の形態の動作を説明するための図である。
FIG. 2 is a diagram for explaining an operation of the first embodiment of the natural language conversion system of the present invention.

【図3】 図1中の対訳知識ベース部の構成および具体
的な内容を示す図である。
FIG. 3 is a diagram showing a configuration and specific contents of a bilingual knowledge base unit in FIG. 1;

【図4】 本発明の自然言語変換システムの第1の実施
の形態の処理を示す流れ図である。
FIG. 4 is a flowchart showing processing of the first embodiment of the natural language conversion system of the present invention.

【図5】 本発明の自然言語変換システムの第2の実施
の形態の動作を説明するための図である。
FIG. 5 is a diagram for explaining the operation of the second embodiment of the natural language conversion system of the present invention.

【図6】 本発明の自然言語変換システムの第2の実施
の形態の動作を説明するための図である。
FIG. 6 is a diagram for explaining an operation of the second embodiment of the natural language conversion system of the present invention.

【図7】 本発明の自然言語変換システムの第3の実施
の形態の構成を示すブロック図である。
FIG. 7 is a block diagram showing a configuration of a third embodiment of the natural language conversion system of the present invention.

【図8】 本発明の自然言語変換システムの第3の実施
の形態の動作を説明するための図である。
FIG. 8 is a diagram for explaining the operation of the third embodiment of the natural language conversion system according to the present invention.

【図9】 本発明の自然言語変換システムの第3の実施
の形態の動作を説明するための図である。
FIG. 9 is a diagram for explaining the operation of the third embodiment of the natural language conversion system of the present invention.

【図10】 本発明の自然言語変換システムの第1の実
施例を説明するためのブロック図である。
FIG. 10 is a block diagram for explaining a first embodiment of the natural language conversion system of the present invention.

【図11】 本発明の自然言語変換システムの第2の実
施例を説明するためのブロック図である。
FIG. 11 is a block diagram for explaining a second embodiment of the natural language conversion system of the present invention.

【符号の説明】[Explanation of symbols]

1 原文解析部 2 翻訳辞書部 3 目的言語語彙保持部 4 目的言語辞書部 5 訳文生成部 6 対訳知識ベース部 7 外来語目的言語対応知識ベース部 12,13,15,17,34,35,52,54,5
6 データ線 60 原言語句構成情報 61 品詞情報 62 機能語情報 63 目的言語語彙品詞情報 64 原言語句対応目的言語品詞情報 101 CPU 102 メモリ 103 自然言語変換メモリ 104 入力装置 105 翻訳辞書部 106 目的言語辞書部 107 対訳知識ベース部 108 表示装置 109 バス 110 外来語目的言語対応知識ベース部
DESCRIPTION OF SYMBOLS 1 Original sentence analysis part 2 Translation dictionary part 3 Target language vocabulary holding part 4 Target language dictionary part 5 Translation sentence generation part 6 Bilingual knowledge base part 7 Foreign language target language correspondence knowledge base part 12,13,15,17,34,35,52 , 54,5
6 Data Line 60 Source Language Phrase Composition Information 61 Part-of-Speech Information 62 Functional Word Information 63 Target Language Vocabulary Part-of-Speech Information 64 Source Language Phrase Target Part-of-Speech Information 101 CPU 102 Memory 103 Natural Language Conversion Memory 104 Input Device 105 Translation Dictionary Unit 106 Target Language Dictionary unit 107 Bilingual knowledge base unit 108 Display device 109 Bus 110 Foreign language target language support knowledge base unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 亀井 真一郎 東京都港区芝五丁目7番1号 日本電気株 式会社内 Fターム(参考) 5B091 AA06 BA02 CA02 CA26 CC02 CC15  ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Shinichiro Kamei 5-7-1 Shiba, Minato-ku, Tokyo F-term within NEC Corporation 5B091 AA06 BA02 CA02 CA26 CC02 CC15

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 原言語を目的言語に翻訳するための情報
を保持する翻訳辞書部と、 同語源の単語の情報を含む目的言語の情報を保持する目
的言語辞書部と、 原言語句構成情報と目的言語語彙品詞情報と原言語句対
応目的言語品詞情報との対応を格納する対訳知識ベース
部と、 前記翻訳辞書部の原言語部分を参照して原文を形態素に
分割し、該原文に直接入力された目的言語語彙を該原文
から切り出し、前記翻訳辞書部の原言語部分を用いて該
目的言語語彙を含む句を認識し、該句の機能語の内容に
基づいて該目的言語語彙の原言語における品詞を推定す
る原文解析部と、 前記原文解析部から原文に直接入力された目的言語語彙
を受け取り、前記目的言語辞書部を検索して該目的言語
語彙の目的言語における品詞を取得する目的言語語彙保
持部と、 前記原文解析部から原文中の目的言語語彙の品詞推定結
果を受け取り、前記目的言語語彙保持部から該原文中の
該目的言語語彙の辞書検索結果を受け取り、該品詞推定
結果と該辞書検索結果とを合わせた情報によって前記対
訳知識ベース部を検索して該目的言語語彙の適正品詞を
取得し、該目的言語語彙の表層と該適正品詞とをキーに
して前記目的言語辞書部を検索して該目的言語語彙と同
語源の該適正品詞の目的言語表現を取得し、該目的言語
表現を使用して訳文を生成する訳文生成部とを有するこ
とを特徴とする自然言語変換システム。
1. A translation dictionary unit for holding information for translating a source language into a target language, a target language dictionary unit for holding target language information including word information of the same word source, and source language phrase configuration information A bilingual knowledge base unit for storing correspondence between the target language vocabulary part-of-speech information and the target language part-of-speech information, and a source language part of the translation dictionary part, dividing the original sentence into morphemes, and directly The input target language vocabulary is cut out from the original sentence, a phrase including the target language vocabulary is recognized using the source language portion of the translation dictionary unit, and the source language vocabulary is identified based on the contents of the functional words of the phrase. An original sentence analysis unit for estimating a part of speech in a language, a target language vocabulary directly input to the original sentence from the original text analysis unit, and a purpose of obtaining the part of speech in the target language of the target language vocabulary by searching the target language dictionary unit Language vocabulary retention Receiving the part-of-speech estimation result of the target language vocabulary in the original sentence from the original sentence analysis unit, receiving the dictionary search result of the target language vocabulary in the original sentence from the target language vocabulary holding unit, and obtaining the part-of-speech estimation result and the dictionary search By searching the bilingual knowledge base based on the information combined with the result and acquiring the proper part of speech of the target language vocabulary, searching the target language dictionary using the surface layer of the target language vocabulary and the proper part of speech as keys A target language expression of the proper part of speech having the same language source as the target language vocabulary, and a translated sentence generation unit for generating a translated sentence using the target language expression.
【請求項2】 前記対訳知識ベース部の検索結果として
得られた適正品詞をキーとする前記目的言語辞書部の検
索において原文中の目的言語語彙と同語源の該適正品詞
の目的言語表現が得られなかった場合に、前記翻訳辞書
部を検索して訳文に使用する目的言語表現を取得する前
記訳文生成部を有することを特徴とする請求項1記載の
自然言語変換システム。
2. A search of the target language dictionary unit using a proper part of speech obtained as a search result of the bilingual knowledge base unit as a key, to obtain a target language vocabulary in an original sentence and a target language expression of the proper part of speech having the same word source. 2. The natural language conversion system according to claim 1, further comprising: the translation generation unit that searches the translation dictionary unit and acquires a target language expression to be used for a translation when the translation is not performed.
【請求項3】 前記対訳知識ベース部の検索結果として
得られた適正品詞をキーとする前記目的言語辞書部の検
索において原文中の目的言語語彙と同語源の該適正品詞
の目的言語表現が得られなかった場合に、前記翻訳辞書
部の目的語部分を検索して訳文に使用する目的言語表現
を取得する前記訳文生成部を有することを特徴とする請
求項1記載の自然言語変換システム。
3. A search of the target language dictionary unit using a proper part of speech obtained as a search result of the bilingual knowledge base unit as a key to obtain a target language vocabulary in an original sentence and a target language expression of the proper part of speech having the same word source. 2. The natural language conversion system according to claim 1, further comprising the translation generation unit that retrieves an object part of the translation dictionary unit and acquires a target language expression used for a translation when the translation is not performed.
【請求項4】 原言語での目的言語を起源とする外来語
とその外来語に対応する目的言語表現とを格納する外来
語目的言語対応知識ベース部と、 原文中に入力された原言語表記の目的言語起源の語彙を
切り出し、該語彙をキーにして前記外来語目的言語対応
知識ベース部を検索して該語彙に対応する目的言語表現
を取得し、該目的言語表現によって目的言語起源の該語
彙を置き換えて該目的言語表現を目的言語語彙として該
原文の解析を行う前記原文解析部とを有することを特徴
とする請求項1または請求項2または請求項3記載の自
然言語変換システム。
4. A foreign language target language correspondence knowledge base unit for storing a foreign language originating from a target language in a source language and a target language expression corresponding to the foreign language, and a source language notation input in the original text The vocabulary of the target language origin is extracted, the foreign language target language correspondence knowledge base part is searched using the vocabulary as a key, and the target language expression corresponding to the vocabulary is acquired. 4. The natural language conversion system according to claim 1, further comprising: the original sentence analysis unit that analyzes the original sentence by replacing the vocabulary with the target language expression as a target language vocabulary.
【請求項5】 原言語語彙と目的言語語彙の混在した原
文から目的言語語彙を切だし、 前記原文中の前記目的言語語彙を含む句の機能語の内容
から前記目的言語語彙の原言語における品詞を推定し、 前記目的言語語彙の表層と前記推定された品詞とをキー
として、同語源の単語の情報を含む目的言語の情報を保
持する目的言語辞書部を検索し、前記目的言語語彙と同
語源の前記推定された品詞の目的言語表現を取得するこ
とを特徴とする自然言語変換方法。
5. A target language vocabulary is extracted from a source text in which a source language vocabulary and a target language vocabulary are mixed, and the part of speech of the target language vocabulary in the source language is determined from the contents of functional words of a phrase including the target language vocabulary in the source text. Using the surface of the target language vocabulary and the estimated part-of-speech as a key, a target language dictionary unit that holds target language information including word information of the same word source is searched, and the target language vocabulary is searched. A natural language conversion method, characterized by acquiring a target language expression of the estimated part of speech of a word source.
【請求項6】 前記目的言語表現を使用し、前記原文の
前記目的言語による訳文を生成することを特徴とする請
求項5記載の自然言語変換方法。
6. The natural language conversion method according to claim 5, wherein a translated sentence of the original sentence in the target language is generated using the target language expression.
【請求項7】 前記目的言語辞書部の検索の結果、前記
目的言語語彙と同語源の前記推定された品詞の目的言語
表現を取得することができなかった場合に、前記原言語
を前記目的言語に翻訳する情報を保持する翻訳辞書部を
検索し、前記目的言語表現を得ることを特徴とする請求
項5または請求項6記載の自然言語変換方法。
7. When the target language dictionary unit fails to obtain a target language expression of the estimated part of speech having the same lexical origin as the target language vocabulary, the source language is set to the target language. 7. The natural language conversion method according to claim 5, wherein a translation dictionary unit that holds information to be translated is searched to obtain the target language expression.
【請求項8】 前記目的言語辞書部の検索の結果、前記
目的言語語彙と同語源の前記推定された品詞の目的言語
表現を取得することができなかった場合に、前記原言語
を前記目的言語に翻訳する情報を保持する翻訳辞書部の
目的言語部分を検索し、前記目的言語表現を得ることを
特徴とする請求項5または請求項6記載の自然言語変換
方法。
8. When the target language dictionary unit fails to acquire the target language expression of the estimated part of speech having the same lexical origin as the target language vocabulary as a result of the search, the source language is set to the target language. 7. The natural language conversion method according to claim 5, wherein a target language portion of a translation dictionary unit holding information to be translated is retrieved to obtain the target language expression.
【請求項9】 前記目的言語辞書部の検索の結果、前記
目的言語語彙と同語源の前記推定された品詞の目的言語
表現を取得することができなかった場合に、前記原言語
を前記目的言語に翻訳する情報を保持する翻訳辞書部の
目的言語部分を検索して前記目的言語語彙に翻訳される
原言語見出しを得て、前記原言語見出しで再度前記翻訳
辞書部を検索して得られる目的言語訳語の中で、品詞が
前記推定された品詞と一致するものを前記目的言語表現
とすることを特徴とする請求項5または請求項6記載の
自然言語変換方法。
9. When the target language dictionary unit cannot retrieve the target language expression of the estimated part of speech having the same lexical origin as the target language vocabulary as a result of the search, the source language is set to the target language. An object obtained by searching a target language part of a translation dictionary unit holding information to be translated into a target language vocabulary to be translated into the target language vocabulary and re-searching the translation dictionary unit with the source language heading 7. The natural language conversion method according to claim 5, wherein, of the linguistic translations, a part of speech that matches the estimated part of speech is used as the target language expression.
JP2001351637A 2001-11-16 2001-11-16 Natural language conversion system Expired - Fee Related JP4313967B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001351637A JP4313967B2 (en) 2001-11-16 2001-11-16 Natural language conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001351637A JP4313967B2 (en) 2001-11-16 2001-11-16 Natural language conversion system

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP23595496A Division JP3267168B2 (en) 1996-08-19 1996-08-19 Natural language conversion system

Publications (2)

Publication Number Publication Date
JP2002197086A true JP2002197086A (en) 2002-07-12
JP4313967B2 JP4313967B2 (en) 2009-08-12

Family

ID=19163922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001351637A Expired - Fee Related JP4313967B2 (en) 2001-11-16 2001-11-16 Natural language conversion system

Country Status (1)

Country Link
JP (1) JP4313967B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311423C (en) * 2003-08-11 2007-04-18 索尼电子有限公司 System and method for performing speech recognition by utilizing a multi-language dictionary

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102214562B1 (en) * 2020-06-29 2021-02-08 이강희 Translation system for global communicate in online communication space

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311423C (en) * 2003-08-11 2007-04-18 索尼电子有限公司 System and method for performing speech recognition by utilizing a multi-language dictionary

Also Published As

Publication number Publication date
JP4313967B2 (en) 2009-08-12

Similar Documents

Publication Publication Date Title
US7630880B2 (en) Japanese virtual dictionary
JP4256891B2 (en) Technology to improve machine translation accuracy
US6535842B1 (en) Automatic bilingual translation memory system
JP5100770B2 (en) Word classification method in kanji sentences
KR20030094632A (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
JP2002197086A (en) Natural language conversion system
JP3267168B2 (en) Natural language conversion system
WO2009139240A1 (en) Information processing device, information processing method, and recording medium
JPS62191967A (en) Context processor
JP2719453B2 (en) Machine translation equipment
JPH0561902A (en) Mechanical translation system
JP3244286B2 (en) Translation processing device
JP2752025B2 (en) Machine translation equipment
JP2947554B2 (en) Machine translation equipment
JP2009009583A (en) Method for segmenting non-segmented text using syntactic parse
JPH05225232A (en) Automatic text pre-editor
JPH04296969A (en) Mechanical translation device
JPH1063664A (en) Method and device for translating natural language
JPH02208775A (en) Machine translation system
JPH09330318A (en) System and method for machine translation
JPH11259473A (en) Machine translation system and machine translating method
JPH06332938A (en) Natural language analyzing device and machine translation device
JPH02110771A (en) Electronic translation device
JPS60247787A (en) Document converting device
JP2005018350A (en) Translation processing system, translation processing method and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050301

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050407

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050413

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070117

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090401

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140522

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees