JP2009223704A - Translation device and program - Google Patents

Translation device and program Download PDF

Info

Publication number
JP2009223704A
JP2009223704A JP2008068601A JP2008068601A JP2009223704A JP 2009223704 A JP2009223704 A JP 2009223704A JP 2008068601 A JP2008068601 A JP 2008068601A JP 2008068601 A JP2008068601 A JP 2008068601A JP 2009223704 A JP2009223704 A JP 2009223704A
Authority
JP
Japan
Prior art keywords
morpheme
sentence
clause
translation
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008068601A
Other languages
Japanese (ja)
Inventor
Kumi Fujiwara
久美 藤原
Tsuguaki Ryu
紹明 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2008068601A priority Critical patent/JP2009223704A/en
Publication of JP2009223704A publication Critical patent/JP2009223704A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a translation device and translation program capable of improving the translation accuracy of a sentence including an attached word belonging to a declinable word whose word form changes or a connective word connected to a declinable word. <P>SOLUTION: The translation device is provided with: an acquiring means for acquiring morphemes constituting a first sentence represented in a first language and parts of speech of the morphemes; a retrieving means for retrieving morphemes constituting a clause from the morphemes acquired by the acquiring means on the basis of a rule for determining the configuration of the clause, by using parts of speech of morphemes obtained from words constituting the clause, which represents at least one meaning by connecting one or more among a declinable word which is an independent word directly representing the meaning of the word and in which the form of the word changes by conjugation, an attached word belonging to the declinable word being an independent word and a connective word connected to the declinable word; and a translating means for using the clause composed of the morphemes retrieved by the retrieving means to translate a first sentence into a second sentence represented in a second language. This can not only easily retrieve a clause but also improve the accuracy of translating a sentence including a clause. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、翻訳装置及び翻訳プログラムに関する。   The present invention relates to a translation apparatus and a translation program.

従来より、例えば、形態素等の文を構成するトークンの品詞を解析する場合に、解析対象とするトークンの前及び後のトークンのいずれか1つ以上の品詞に基づいて精度良く品詞を解析できる言語解析システムが知られている(例えば、特許文献1)。   Conventionally, for example, when analyzing the part of speech of a token constituting a sentence such as a morpheme, a language that can accurately analyze the part of speech based on one or more part of speech of the token before or after the token to be analyzed An analysis system is known (for example, Patent Document 1).

この言語解析システムは、所定の言語で表された文を、例えば、形態素等のトークンに分割する分割手段と、分割手段が分割したトークンに対応する品詞を記憶した記憶手段と、記憶手段が記憶した品詞を参照することで分割手段が分割したトークンの品詞を取得する品詞取得手段と、1つのトークンに対して品詞取得手段が得る品詞が2以上存在する場合に、当該トークンの前及び後に位置するトークンのいずれか1以上の品詞に基づいて、当該トークンから取得した2以上の品詞から1つの品詞を選択する品詞選択手段とを備えている。   This language analysis system includes a dividing unit that divides a sentence expressed in a predetermined language into tokens such as morphemes, a storage unit that stores parts of speech corresponding to tokens divided by the dividing unit, and a storage unit stores If there are two or more part-of-speech acquisition means for obtaining the part-of-speech of the token divided by the division means by referring to the part-of-speech, and the position before and after the token when there are two or more parts-of-speech obtained by the part-of-speech acquisition means Part of speech selection means for selecting one part of speech from two or more parts of speech acquired from the token based on any one or more parts of speech of

特開2004−78990号公報JP 2004-78990 A

本発明の目的は、活用により語の形態が変化する用言に付属する付属語又は用言に接続する接続語を含む文の翻訳精度を向上できる翻訳装置及び翻訳プログラムを提供することにある。   An object of the present invention is to provide a translation apparatus and a translation program capable of improving the translation accuracy of a sentence including an attached word attached to a predicate whose word form changes by use or a connected word connected to the predicate.

本発明に係る翻訳装置は、第1の言語で表す第1の文を構成する形態素及び形態素の品詞を形態素解析により取得する取得手段と、自ら語の意味を表す自立語であると共に、活用により語の形態が変化する用言と、自立語である用言に付属する付属語及び用言に接続する接続語のいずれか1つ以上とが連結して少なくとも1つの意味を表す節の構成を、節から得られる形態素及び形態素の品詞のいずれか1つ以上を用いて定める規則を記憶すると共に、第1の言語で表す第1の例文と、第1の例文を第2の言語へ翻訳した第2の例文とを節に基づいて関連付けて記憶する記憶手段と、記憶手段が記憶する節の構成を定める規則に基づいて、取得手段が取得した形態素から節を構成する形態素を検索する検索手段と、検索手段が検索した形態素が構成する第1の言語で表す節に基づいて関連付けて記憶手段が記憶する第1の例文と第2の例文とを用いて、第1の文を第2の言語で表す第2の文に翻訳する翻訳手段とを備えることを特徴としている。   The translation device according to the present invention is an acquisition unit that acquires the morpheme and the part of speech of the morpheme constituting the first sentence expressed in the first language by morphological analysis, and is a self-supporting word that expresses the meaning of the word. A clause configuration in which at least one meaning is connected by connecting at least one of an appendage attached to a predicate that is a self-supporting word and a conjunctive word connected to the predicate. , Storing rules that are defined using one or more of morphemes obtained from clauses and parts of speech of morphemes, and the first example sentence expressed in the first language and the first example sentence translated into the second language Storage means for associating and storing a second example sentence based on a clause, and search means for searching for a morpheme that constitutes a clause from morphemes acquired by the acquisition means, based on a rule that defines the configuration of the clause stored in the storage means And the morpheme searched by the search means Translating the first sentence into a second sentence expressed in the second language using the first example sentence and the second example sentence stored in association with each other based on the clause expressed in the first language constituting It is characterized by providing the translation means to do.

上記構成において、記憶手段は、形態素の品詞を修正する修正方法を、修正方法を適用する形態素及び形態素の品詞のいずれか1つ以上を用いて定める規則を記憶し、検索手段は、記憶手段が記憶する修正方法を定める規則に基づいて、取得手段が取得した形態素の品詞から修正方法を適用する形態素の品詞を検索し、検索手段が検索した形態素の品詞を、規則が定める修正方法に従って修正する修正手段を更に備え、翻訳手段は、修正手段が修正した形態素の品詞に基づいて、第1の文を第2の文に翻訳する構成を採用できる。   In the above configuration, the storage means stores a rule that determines a correction method for correcting a morpheme part of speech using one or more of a morpheme to which the correction method is applied and a morpheme part of speech. Based on the rules defining the correction method to be stored, the morpheme part of speech to which the correction method is applied is searched from the morpheme part of speech acquired by the acquisition unit, and the morpheme part of speech searched by the search unit is corrected according to the correction method defined by the rule. The translation unit may further include a correction unit, and the translation unit may be configured to translate the first sentence into the second sentence based on the part of speech of the morpheme corrected by the correction unit.

上記構成において、修正方法を定める規則は、2以上の形態素の結合及び2以上の形態素への分割のいずれか1つ以上により形態素を修正すると共に、修正した形態素の品詞を定めることで修正方法を定める構成を採用できる。   In the above configuration, the rule for determining the correction method is to correct the correction method by correcting the morpheme by any one or more of the combination of two or more morphemes and the division into two or more morphemes, and by defining the part of speech of the corrected morpheme. The determined configuration can be adopted.

上記構成において、修正方法を定める規則は、修正方法を適用する形態素及び形態素の品詞のいずれか1つ以上を用いて修正方法を適用する形態素を定める構成を採用できる。   In the above configuration, the rule that determines the correction method may employ a configuration that determines the morpheme to which the correction method is applied using any one or more of the morpheme to which the correction method is applied and the part of speech of the morpheme.

上記構成において、取得手段は、節を構成する用言の基本的な形態である基本形を取得し、翻訳手段は、第1の文を構成する活用した形態素の取得手段が取得した基本形に基づいて翻訳する構成を採用できる。   In the above configuration, the obtaining means obtains a basic form that is a basic form of the prescription constituting the clause, and the translating means is based on the basic form obtained by the utilizing means for obtaining the morpheme that makes up the first sentence. A translation structure can be adopted.

上記構成において、節を定める規則は、節を構成する用言の品詞を節の品詞と定め、記憶手段は、第1の言語で表す第1の例文と、第1の例文を第2の言語へ翻訳した第2の例文とを、例文を構成する節の品詞に基づいて関連付けて記憶し、翻訳手段は、検索手段が検索した節の規則が定める品詞に基づいて記憶手段が関連付けて記憶する第1の例文と第2の例文とを用いて翻訳する構成を採用できる。   In the above configuration, the rule for defining the clause defines the part of speech of the predicate constituting the clause as the part of speech of the clause, and the storage means sets the first example sentence represented in the first language and the first example sentence to the second language. The second example sentence translated into the sentence is stored in association with the part-of-speech constituting the example sentence, and the translation unit stores the relation in association with the part-of-speech determined by the clause rule retrieved by the retrieval unit. A configuration can be adopted in which translation is performed using the first example sentence and the second example sentence.

上記構成において、取得手段が取得した第1の文を構成する形態素と第1の例文を構成する形態素とに基づいて、第1の文と第1の例文とが類似する程度を表す指標を算出する算出手段と、算出手段が算出した指標に基づいて記憶手段が記憶する第1の例文と第2の例文とを選択する選択手段とを更に備え、翻訳手段は、選択手段が選択した第1の例文と第2の例文とを用いて翻訳する構成を採用できる。   In the above configuration, an index representing the degree of similarity between the first sentence and the first example sentence is calculated based on the morpheme constituting the first sentence and the morpheme constituting the first example sentence acquired by the acquisition unit. And a selecting unit that selects the first example sentence and the second example sentence stored in the storage unit based on the index calculated by the calculating unit, and the translating unit includes the first example selected by the selecting unit. A configuration of translating using the example sentence and the second example sentence can be employed.

上記構成において、記憶手段は、第1の言語で用いられる形態素と形態素の品詞とを関連付けて記憶し、取得手段は、第1の入力文から取得した形態素と記憶手段が関連付けて記憶する品詞を取得し、修正方法を定める規則は、修正方法に基づいて修正した形態素の品詞を定め、修正した形態素は、記憶手段の記憶する品詞を取得手段が取得していない未得の形態素に接続する形態素、未得の形態素に付属する形態素、及び未得の形態素を目的語とする形態素のいずれか1つ以上である構成を採用できる。   In the above configuration, the storage means stores the morpheme used in the first language and the part of speech of the morpheme in association with each other, and the acquisition means stores the part of speech stored in association with the morpheme acquired from the first input sentence and the storage means. The rule for obtaining and determining the correction method determines the part of speech of the morpheme corrected based on the correction method, and the corrected morpheme connects the part of speech stored in the storage unit to the unacquired morpheme that the acquisition unit has not acquired. Further, it is possible to adopt a configuration that is one or more of a morpheme attached to an unobtained morpheme and a morpheme whose object is an unobtained morpheme.

本発明に係る翻訳プログラムは、第1の言語で表す第1の文を構成する形態素及び形態素の品詞を形態素解析により取得する取得手段と、自ら語の意味を表す自立語であると共に、活用により語の形態が変化する用言と、自立語である用言に付属する付属語及び用言に接続する接続語のいずれか1つ以上とが連結して少なくとも1つの意味を表す節の構成を、節から得られる形態素及び形態素の品詞のいずれか1つ以上を用いて定める規則を記憶すると共に、第1の言語で表す第1の例文と、第1の例文を第2の言語へ翻訳した第2の例文とを節に基づいて関連付けて記憶する記憶手段と、記憶手段が記憶する節の構成を定める規則に基づいて、取得手段が取得した形態素から節を構成する形態素を検索する検索手段と、検索手段が検索した形態素が構成する第1の言語で表す節に基づいて関連付けて記憶手段が記憶する第1の例文と第2の例文とを用いて、第1の文を第2の言語で表す第2の文に翻訳する翻訳手段として機能させることを特徴としている。   The translation program according to the present invention is an acquisition means for acquiring the morpheme and the part of speech of the morpheme constituting the first sentence expressed in the first language by morpheme analysis, and is an independent word representing the meaning of the word itself. A clause configuration in which at least one meaning is connected by connecting at least one of an appendage attached to a predicate that is a self-supporting word and a conjunctive word connected to the predicate. , Storing rules that are defined using one or more of morphemes obtained from clauses and parts of speech of morphemes, and the first example sentence expressed in the first language and the first example sentence translated into the second language Storage means for associating and storing a second example sentence based on a clause, and search means for searching for a morpheme that constitutes a clause from morphemes acquired by the acquisition means, based on a rule that defines the configuration of the clause stored in the storage means And the search means searched A second sentence representing the first sentence in the second language using the first example sentence and the second example sentence stored in association with each other based on the clause represented in the first language constituted by the element. It is characterized by functioning as a translation means for translating into sentences.

請求項1の構成によれば、節の構成を形態素又は形態素の品詞により定める規則に基づいて、1の意味を表す一連の語である節を構成する形態素を検索すると共に、検索した節に基づいて関連付けた例文を用いて翻訳するため、文から節を容易に検索できるだけでなく、節を含む文の翻訳の精度が向上する。   According to the configuration of claim 1, the morpheme constituting the clause, which is a series of words representing the meaning of one, is searched based on the rules that determine the structure of the clause by the morpheme or the part of speech of the morpheme. Therefore, not only can clauses be easily searched from sentences, but also the accuracy of translation of sentences containing clauses is improved.

請求項2の構成によれば、修正方法を形態素又は形態素の品詞により定める規則に基づいて修正の対象とする形態素の品詞を検索して翻訳するため、容易に修正の対象を検索できるだけでなく、翻訳の精度が向上する。   According to the configuration of claim 2, in order to search and translate the part of speech of the morpheme to be corrected based on the rules that determine the correction method based on the morpheme or the part of speech of the morpheme, not only can the target of the correction be easily searched, Improves translation accuracy.

請求項3の構成によれば、結合及び分割のいずれか1つ以上により形態素を修正するだけでなく、修正した形態素の品詞に基づいて翻訳するため、精度良く翻訳できる。   According to the configuration of the third aspect, not only the morpheme is corrected by any one or more of combination and division, but also the translation is performed based on the part of speech of the corrected morpheme, so that the translation can be performed with high accuracy.

請求項4の構成によれば、形態素及び形態素の品詞の少なくとも1つ以上により修正の対象とする形態素を定めるため、効率良く修正の対象を検索して修正できる。   According to the configuration of the fourth aspect, since the morpheme to be corrected is determined by at least one of the morpheme and the part of speech of the morpheme, the correction target can be efficiently searched and corrected.

請求項5の構成によれば、節を構成する形態素の基本形に基づいて翻訳するため、活用した形態素で構成される文であっても精度良く翻訳できる。   According to the structure of Claim 5, since it translates based on the basic form of the morpheme which comprises a clause, even the sentence comprised by the utilized morpheme can be translated accurately.

請求項6の構成によれば、1の意味を有する一連の語である節の品詞に基づいて翻訳するため、効率的かつ精度良く例文を用いて翻訳できる。   According to the configuration of the sixth aspect, the translation is performed based on the part of speech of the clause which is a series of words having one meaning, so that the translation can be performed efficiently and accurately using the example sentence.

請求項7の構成によれば、翻訳対象とする第1の文を構成する形態素に基づいて算出される指標を用いて例文を選択して翻訳するため、精度良く翻訳できる。   According to the structure of Claim 7, since an example sentence is selected and translated using the parameter | index calculated based on the morpheme which comprises the 1st sentence made into a translation object, it can translate with high precision.

請求項8の構成によれば、品詞を取得していない未得の形態素、未得の形態素に接続する形態素、未得の形態素に付属する形態素、及び未得の形態素を目的語とする形態素のいずれか1つ以上の品詞を定める規則に基づいて形態素の品詞を修正して翻訳するため、未得の品詞を有する形態素で構成された文であっても精度良く翻訳できる。   According to the configuration of claim 8, the morpheme that has not obtained the part of speech, the morpheme connected to the unobtained morpheme, the morpheme attached to the unobtained morpheme, and the morpheme whose object is the unobtained morpheme Since a morpheme part-of-speech is corrected and translated based on a rule that defines at least one part-of-speech, a sentence composed of morphemes having unacquired part-of-speech can be translated with high accuracy.

請求項9の構成によれば、節の構成を形態素又は形態素の品詞により定める規則に基づいて、1の意味を表す一連の語である節を構成する形態素を検索すると共に、検索した節に基づいて関連付けた例文を用いて翻訳するため、文から節を容易に検索できるだけでなく、節を含む文の翻訳の精度が向上する。   According to the configuration of claim 9, the morpheme constituting the clause, which is a series of words representing one meaning, is searched based on the rules that determine the structure of the clause by the morpheme or the part of speech of the morpheme. Therefore, not only can clauses be easily searched from sentences, but also the accuracy of translation of sentences containing clauses is improved.

以下、本発明の最良の実施形態について、添付図面を参照しつつ説明する。   DESCRIPTION OF EXEMPLARY EMBODIMENTS Embodiments of the invention will be described below with reference to the accompanying drawings.

図1は、本発明の翻訳装置で構成される翻訳システムの一実施形態を示すシステム構成図である。   FIG. 1 is a system configuration diagram showing an embodiment of a translation system constituted by the translation apparatus of the present invention.

図1に示す翻訳システム10は、通信網100、翻訳装置1000、端末装置2000、表示装置2100及び、入力装置2200で構成される。   The translation system 10 shown in FIG. 1 includes a communication network 100, a translation device 1000, a terminal device 2000, a display device 2100, and an input device 2200.

通信網100は、例えば、LAN(Local Area Network )、WAN(Wide Area Network)、MAN(Metropolitan Area Network)、又は公衆回線網で構成され、翻訳装置1000及び端末装置2000を通信可能に接続する。   The communication network 100 includes, for example, a LAN (Local Area Network), a WAN (Wide Area Network), a MAN (Metropolitan Area Network), or a public line network, and connects the translation apparatus 1000 and the terminal apparatus 2000 so that they can communicate with each other.

翻訳装置1000は、例えば、パーソナル・コンピュータで構成され、通信網100に接続している。翻訳装置1000は、後述する翻訳処理を実行する。これにより、翻訳装置1000は、第1の言語で表された第1の文(以下、入力文ともいう)を、第2の言語で表された第2の文(以下、出力文ともいう)に翻訳する。   The translation apparatus 1000 is composed of, for example, a personal computer and is connected to the communication network 100. The translation apparatus 1000 executes a translation process described later. As a result, the translation apparatus 1000 converts the first sentence expressed in the first language (hereinafter also referred to as an input sentence) into the second sentence expressed in the second language (hereinafter also referred to as an output sentence). Translate to

本実施例において、言語は、中国語、日本語、及び英語等の自然言語のみならず、エスペラント等の人工言語を含むとして説明する。   In this embodiment, the language is described as including not only natural languages such as Chinese, Japanese, and English but also artificial languages such as Esperanto.

また、本実施例では、第1の言語は日本語であり、かつ第2の言語は中国語であるとして説明を行う。しかしこれに限定される訳ではなく、例えば、第1の言語は中国語であり、かつ第2の言語は日本語であるように、第1の言語と第2の言語とが相違すれば良い。   In the present embodiment, the description will be made assuming that the first language is Japanese and the second language is Chinese. However, the present invention is not limited to this. For example, the first language and the second language may be different such that the first language is Chinese and the second language is Japanese. .

ここで図2を参照して、翻訳装置1000が実行する翻訳処理について概説する。図2は、翻訳装置1000が実行する翻訳処理の一例を概説するための図である。   Here, with reference to FIG. 2, the translation processing executed by the translation apparatus 1000 will be outlined. FIG. 2 is a diagram for outlining an example of the translation process executed by the translation apparatus 1000.

先ず、翻訳装置1000は、後述する受信処理を実行する。これにより、翻訳装置1000は、通信網100を介して接続する端末装置2000から第1の文を受信する。   First, translation apparatus 1000 executes a reception process described later. As a result, the translation apparatus 1000 receives the first sentence from the terminal apparatus 2000 connected via the communication network 100.

具体例として、翻訳装置1000が受信した第1の文は、「大きな犬が走っている」という文であるという例を挙げて説明する。   As a specific example, the first sentence received by the translation apparatus 1000 will be described with reference to an example in which it is a sentence “a big dog is running”.

第1の文を受信した後に、翻訳装置1000は、後述する取得処理を実行する。これにより、翻訳装置1000は、第1の文を形態素解析する。つまり、翻訳装置1000は、第1の文を形態素に分割する。尚、形態素解析処理は、奈良先端科学技術大学院大学のChaSen(茶筌) を用いて実行できるため、詳細についての説明を省略する。   After receiving the first sentence, translation apparatus 1000 executes an acquisition process to be described later. Thereby, the translation apparatus 1000 performs a morphological analysis on the first sentence. That is, translation apparatus 1000 divides the first sentence into morphemes. Note that the morphological analysis process can be executed using ChaSen of Nara Institute of Science and Technology, so detailed explanation is omitted.

具体例に説明すると、翻訳装置1000は、「大きな犬が走っている」という第1の文から、連体詞である形態素「大きな」、名詞である「犬」、助詞である「が」、動詞であり自立語である「走っ」、助詞であり接続助詞である「て」、及び動詞であり自立語でない(つまり、付属語である)「いる」という形態素を取得する。   More specifically, the translation apparatus 1000 starts with the first sentence “a big dog is running”, the morpheme “big”, the noun “dog”, the particle “ga”, and the verb. The morpheme is “run”, which is a self-supporting word, “te”, which is a particle and connection particle, and “is” which is a verb and is not a self-supporting word (that is, an adjunct).

その後、翻訳装置1000は、後述する検索処理を実行する。これにより、翻訳装置1000は、節の構成を定める規則(以下単に、節規則という)に基づいて節を構成する形態素を検索する。   Thereafter, the translation apparatus 1000 executes a search process described later. Thereby, translation apparatus 1000 searches for a morpheme that constitutes a clause based on a rule that defines the configuration of the clause (hereinafter simply referred to as clause rule).

ここで、節とは、自ら語の意味を表す自立語であると共に、活用により語の形態が変化する用言と、自立語である用言に付属する付属語及び用言に接続する接続語のいずれか1つ以上とが連結して少なくとも1つの意味を表す一連の語をいう。   Here, a clause is a self-supporting word that represents the meaning of the word itself, a prescription that changes the form of the word as a result of its use, and an attached word that is attached to the self-supporting word and a connection word that connects to the word. A series of words connected with any one or more of the above to represent at least one meaning.

尚、その語の意味を自ら表す語を自立語といい、自立語に付属する語を付属語という。また、用言とは、形容詞、形容動詞、及び動詞を含む。   A word that expresses the meaning of the word is called an independent word, and a word attached to the independent word is called an attached word. The terminology includes adjectives, adjective verbs, and verbs.

更に、節規則は、節の構成を定める規則をいう。節規則は、節を構成する語から得られる形態素及び前記形態素の品詞のいずれか1つ以上を用いて構成を定める規則である。   Furthermore, the section rule is a rule that defines the structure of the section. The clause rule is a rule that determines the configuration using at least one of a morpheme obtained from words constituting the clause and a part of speech of the morpheme.

具体的に説明すると、翻訳装置1000は、自立語であると共に用言である動詞と、動詞に接続する接続語である接続助詞と、動詞に従属する従属語である動詞とで構成される節の構造を定義する節規則に基づいて、「走っている」という節を構成する形態素を検索する。   Specifically, the translation apparatus 1000 includes a verb that is an independent word and a predicate, a connection particle that is a connection word connected to the verb, and a verb that is a subordinate term subordinate to the verb. Based on the clause rules that define the structure of, we search for the morphemes that make up the “running” clause.

尚、検索した「走っている」という節を構成する形態素は、自立語である用言の形態素「走っ」と、形態素「走っ」に接続する接続語の形態素「て」と、形態素「走っ」に従属する従属語の形態素「いる」である。   Note that the morphemes that make up the searched “running” clause are the independent morpheme “run”, the morpheme “te” connected to the morpheme “run”, and the morpheme “run”. The morpheme of the subordinate term that depends on is “is”.

次に、翻訳装置1000は、後述する置換処理を実行する。これにより、翻訳装置1000は、検索した形態素を節に置換すると共に、置換した節に関する節構造を生成する。   Next, the translation apparatus 1000 performs a replacement process described later. Thus, translation apparatus 1000 replaces the searched morpheme with a clause and generates a clause structure related to the replaced clause.

尚、節構造とは、節と節の品詞と節を構成する形態素の基本形とを構造的に関連付けた情報をいう。また、基本形とは、節を構成する用言の基本的な形態をいう。   The clause structure refers to information in which a clause, a part of speech of the clause, and a basic form of a morpheme constituting the clause are structurally related. The basic form means a basic form of the predicates constituting the clause.

更に、節の品詞は、節を構成する用言の品詞とする。よって、動詞である用言で構成される節の品詞は動詞であるため、動詞で構成される節を動詞節という。同様に、形容詞で構成される節を形容詞節といい、形容動詞で構成される節を形容動詞節という。   Furthermore, the part of speech of the clause is the part of speech of the predicate constituting the clause. Therefore, since the part of speech of a clause composed of a verbal noun is a verb, a clause composed of a verb is called a verb clause. Similarly, a clause composed of adjectives is called an adjective clause, and a clause composed of adjective verbs is called an adjective verb clause.

具体例として、翻訳装置1000は、形態素「走っ」、「て」、及び「いる」を、節「走っている」に置換する。また、翻訳装置1000は、節「走っている」の品詞を、節を構成する形態素「走っ」の品詞「動詞」及び「自立」とする。   As a specific example, translation apparatus 1000 replaces morphemes “running”, “te”, and “is” with clause “running”. Moreover, the translation apparatus 1000 sets the part of speech of the clause “running” as the part of speech “verb” and “independence” of the morpheme “run” constituting the clause.

これにより、翻訳装置1000は、節「走っている」と、節の品詞「動詞」及び「自立」と、節を構成する形態素「走っ」の基本形「走る」とを関連付けて節構造「走っている[走る/動詞-自立 て/助詞-接続助詞 いる/動詞-非自立]/動詞-自立」を生成する。尚、形態素の基本形は、形態素解析で得られた形態素の基本形を用いる。   As a result, the translation apparatus 1000 associates the clause “running”, the part of speech “verb” and “independence” with the basic form “run” of the morpheme “run” constituting the clause, Is [run / verb-independent] / particle-connecting particle is / verb-independent] / verb-independent. The basic form of the morpheme is the basic form of the morpheme obtained by the morpheme analysis.

その後、翻訳装置1000は、後述する実翻訳処理を実行する。これにより、翻訳装置1000は、記憶部1300が記憶する単語対訳辞書、及び例文対訳辞書と、検索した形態素が構成する節及び節構造とを用いて、第1の文を第2の言語で表す第2の文に翻訳する。   Thereafter, the translation apparatus 1000 performs an actual translation process described later. Accordingly, the translation apparatus 1000 represents the first sentence in the second language using the word parallel translation dictionary and the example sentence parallel translation dictionary stored in the storage unit 1300, and the clauses and clause structures formed by the searched morphemes. Translate to second sentence.

尚、単語対訳辞書とは、第1の言語の単語(以下単に、第1の単語という)とその単語の第2の言語による訳語(以下単に、第2の単語という)とを関連付けた情報をいう。   The word bilingual dictionary is information that associates a word in the first language (hereinafter simply referred to as the first word) and a translation of the word in the second language (hereinafter simply referred to as the second word). Say.

具体的に説明すると、翻訳装置1000は、節構造が表す形態素「走って」の基本形「走る」に関連付けた第2の言語の単語を単語対訳辞書から取得して、「走っている」という節を翻訳する。   More specifically, the translation apparatus 1000 acquires a word in the second language associated with the basic form “run” of the morpheme “run” represented by the clause structure from the word parallel translation dictionary, and obtains the clause “run”. Translate.

更に、例文対訳辞書とは、第1の言語で表した第1の例文と、第1の例文を第2の言語へ翻訳した第2の例文とを、例文を構成する形態素の品詞とに基づいて関連付けた情報をいう。   Furthermore, the example sentence parallel translation dictionary is based on the first example sentence expressed in the first language, the second example sentence translated from the first example sentence into the second language, and the part of speech of the morpheme constituting the example sentence. Information associated with

翻訳装置1000が実行する例文対訳辞書を用いた翻訳については、実施例3において詳細に説明するため、本実施例においては、具体的な説明を省略する。   Since the translation using the example sentence parallel translation dictionary executed by the translation apparatus 1000 will be described in detail in the third embodiment, a specific description thereof will be omitted in the present embodiment.

次に図3を参照して、翻訳装置1000の構成について説明する。図3は、翻訳装置1000の一構成例を表す機能ブロック図である。   Next, the configuration of translation apparatus 1000 will be described with reference to FIG. FIG. 3 is a functional block diagram illustrating a configuration example of the translation apparatus 1000.

図3に示す翻訳装置1000は、受信部1100、取得部1200、記憶部1300、検索部1400、置換部1500、修正部1600、実翻訳部1700、及び送信部1800で構成される。   3 includes a reception unit 1100, an acquisition unit 1200, a storage unit 1300, a search unit 1400, a replacement unit 1500, a correction unit 1600, an actual translation unit 1700, and a transmission unit 1800.

取得部1200、検索部1400、置換部1500、修正部1600、及び実翻訳部1700が有する機能は、翻訳装置1000が実行するソフトウェア制御により実現される。   The functions of the acquisition unit 1200, the search unit 1400, the replacement unit 1500, the correction unit 1600, and the actual translation unit 1700 are realized by software control executed by the translation apparatus 1000.

ここで図4を参照して、ソフトウェア制御を実行するために用いる翻訳装置1000のハードウェア構成について説明する。図4は、ソフトウェア制御を実行するために用いる翻訳装置1000のハードウェア構成の一例を表す図である。   Here, with reference to FIG. 4, the hardware configuration of the translation apparatus 1000 used for executing the software control will be described. FIG. 4 is a diagram illustrating an example of a hardware configuration of translation apparatus 1000 used for executing software control.

翻訳装置1000は、例えば、CPU(Central Processing Unit)等の演算部1010、EPROM(Erasable Programmable Read-Only Memory)又はEEPROM(Electrically Erasable Programmable Read-Only Memory)等の読み出し専用メモリであるROM1020(Read-Only Memory )、DRAM(Dynamic Random Access Memory)又はSRAM(Static RAM)等の揮発性メモリ及びNVRAM(Non Volatile RAM)等の不揮発性メモリで構成されるRAM1030(Random Access Memory)、並びにハードディスク等で構成される外部記憶部1040で構成され、演算部1010、ROM1020、RAM1030、及び外部記憶部1040は互いにバス1050によって接続している。   The translation apparatus 1000 includes, for example, a calculation unit 1010 such as a CPU (Central Processing Unit), a ROM 1020 (Read-Only Memory) such as an EP (Erasable Programmable Read-Only Memory) or an EEPROM (Electrically Erasable Programmable Read-Only Memory). RAM 1030 (Random Access Memory) composed of volatile memory such as Only Memory), DRAM (Dynamic Random Access Memory) or SRAM (Static RAM) and nonvolatile memory such as NVRAM (Non Volatile RAM), and hard disk The operation unit 1010, the ROM 1020, the RAM 1030, and the external storage unit 1040 are connected to each other via a bus 1050.

ソフトウェア制御は、演算部1010が、ROM1020又は外部記憶部1040に格納したプログラムを読み込み、読み込んだプログラムに従って演算を行うことにより実現される。なお、RAM1030には、演算結果のデータが書き込まれ、特にNVRAMには、電源オフ時にバックアップが必要なデータが保存される。   Software control is realized by the calculation unit 1010 reading a program stored in the ROM 1020 or the external storage unit 1040 and performing calculation according to the read program. Note that operation result data is written in the RAM 1030. In particular, the NVRAM stores data that needs to be backed up when the power is turned off.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明を行う。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

受信部1100は、例えば、ネットワーク・アダプタで構成され、通信網100及び取得部1200に接続している。受信部1100は、受信処理を実行することで、第1の文を受信する。   The receiving unit 1100 is constituted by a network adapter, for example, and is connected to the communication network 100 and the acquiring unit 1200. The receiving unit 1100 receives the first sentence by executing the receiving process.

ここで、受信部1100が実行する受信処理について説明する。   Here, the reception process executed by the reception unit 1100 will be described.

先ず、受信部1100は、通信網100を介して接続する端末装置2000から、第1の文を受信する。次に、受信部1100は、受信した第1の文を取得部1200へ出力する。その後、受信部1100は、受信処理の実行を終了する。   First, the receiving unit 1100 receives the first sentence from the terminal device 2000 connected via the communication network 100. Next, the reception unit 1100 outputs the received first sentence to the acquisition unit 1200. Thereafter, the reception unit 1100 ends the execution of the reception process.

取得部1200は、受信部1100及び記憶部1300に接続している。取得部1200は、取得処理を実行する。これによって、取得部1200は、第1の言語で表す第1の文を構成する形態素、形態素の品詞、及び形態素の基本形を取得する。   The acquisition unit 1200 is connected to the reception unit 1100 and the storage unit 1300. The acquisition unit 1200 executes acquisition processing. Thereby, the acquisition unit 1200 acquires the morpheme, the part of speech of the morpheme, and the basic form of the morpheme constituting the first sentence expressed in the first language.

ここで、取得部1200が実行する取得処理について説明する。   Here, an acquisition process executed by the acquisition unit 1200 will be described.

先ず、取得部1200は、受信部1100から第1の入力文を取得する。次に、取得部1200は、形態素解析処理を実行する。   First, the acquisition unit 1200 acquires a first input sentence from the reception unit 1100. Next, the acquisition unit 1200 executes a morphological analysis process.

尚、この形態素解析処理は、記憶部1300が記憶する形態素を第1の入力文から取得すると共に、取得した形態素と記憶部1300が関連付けて記憶する品詞及び基本形を取得する処理である。   The morpheme analysis process is a process of acquiring the morpheme stored in the storage unit 1300 from the first input sentence, and acquiring the part of speech and the basic form stored in association with the acquired morpheme and the storage unit 1300.

また、取得部1200は、形態素解析処理を実行することで、記憶部1300が記憶する品詞を取得できなかった場合には、原則、未知語という品詞を形態素の品詞とする。尚、未知語という品詞を有する形態素を、以下単に、未得の形態素ともいう。   In addition, when the acquisition unit 1200 cannot acquire the part of speech stored in the storage unit 1300 by executing the morphological analysis process, in principle, the part of speech of an unknown word is used as the part of speech of the morpheme. A morpheme having a part of speech as an unknown word is also simply referred to as an unacquired morpheme hereinafter.

但し、取得部1200は、記憶部1300が記憶する品詞を取得できなかった場合であっても、形態素が記号である場合には、「記号」という品詞を、形態素解析の実行により形態素の品詞とする。特に、形態素がアルファベットの記号である場合には、「アルファベット」という品詞をも形態素の品詞とする。   However, even if the acquisition unit 1200 cannot acquire the part of speech stored in the storage unit 1300, if the morpheme is a symbol, the acquisition unit 1200 converts the part of speech “symbol” into the morpheme part of speech by performing morphological analysis. To do. In particular, when the morpheme is an alphabetic symbol, the part of speech “alphabet” is also used as the part of speech of the morpheme.

形態素解析処理の実行を終了した後に、取得部1200は、記憶部1300へ、取得した形態素と形態素の品詞及び基本形と第1の文における形態素の位置とを関連付けて保存する。   After completing the execution of the morpheme analysis process, the acquisition unit 1200 stores the acquired morpheme, the part of speech and basic form of the morpheme, and the position of the morpheme in the first sentence in association with each other.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明を行う。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

記憶部1300は、例えば、RAM1030又は外部記憶部1040で構成され、取得部1200、検索部1400、置換部1500、修正部1600、及び実翻訳部1700に接続している。   The storage unit 1300 includes, for example, a RAM 1030 or an external storage unit 1040, and is connected to the acquisition unit 1200, the search unit 1400, the replacement unit 1500, the correction unit 1600, and the actual translation unit 1700.

記憶部1300は、上記及び下記の各種情報を記憶する。特に、記憶部1300は、節の構成を定める節規則及び形態素の品詞を修正する修正方法を定める修正規則、単語対訳辞書、及び例文対訳辞書、並びに形態素辞書とを記憶する。   The storage unit 1300 stores various information described above and below. In particular, the storage unit 1300 stores clause rules that determine the structure of clauses, correction rules that determine a correction method for correcting the part of speech of a morpheme, a word parallel translation dictionary, an example sentence parallel translation dictionary, and a morpheme dictionary.

尚、形態素辞書とは、取得部1200が形態素解析を実行する際に使用する辞書である。形態素辞書は、第1の言語で使用する形態素と形態素の品詞と形態素の基本形とを関連付けた情報をいう。   The morpheme dictionary is a dictionary used when the acquisition unit 1200 executes morpheme analysis. The morpheme dictionary is information that associates the morpheme used in the first language, the part of speech of the morpheme, and the basic form of the morpheme.

ここで、記憶部1300が記憶する節規則について説明する。   Here, the clause rules stored in the storage unit 1300 will be described.

節規則は、節を構成する語から得られる形態素及び形態素の品詞のいずれか1つ以上を用いて節の構成を定める規則と、節を構成する用言の品詞を節の品詞と定める規則とで構成される。   Clause rules are rules that determine the structure of a clause using one or more of the morphemes and morpheme parts of speech obtained from the words that constitute the clause, and rules that define the part of speech of the clause that constitutes the clause as the part of speech of the clause. Consists of.

ここで、表1を参照して、記憶部1300が記憶する節規則について説明する。表1は、記憶部1300が記憶する節規則の一例を示す表である。   Here, the clause rules stored in the storage unit 1300 will be described with reference to Table 1. Table 1 is a table showing an example of clause rules stored in the storage unit 1300.

Figure 2009223704
Figure 2009223704

表1は、構成フィールド、種類フィールド、及び品詞フィールドを有する。構成フィールドは、形態素及び形態素の品詞のいずれか1つ以上により節の構成を定める規則を保存する。種類フィールドは、同一レコードの構成フィールドに保存した規則の種類を保存する。品詞フィールドは、同一レコードに保存した規則が構成を表す節の品詞を、節を構成する用言の品詞として定める規則を保存する。   Table 1 has a configuration field, a type field, and a part of speech field. The configuration field stores a rule that defines the configuration of the clause by one or more of the morpheme and the part of speech of the morpheme. The type field stores the type of rule stored in the configuration field of the same record. The part-of-speech field stores a rule that defines the part-of-speech of the clause represented by the rule stored in the same record as the part-of-speech of the prescription constituting the clause.

具体的に説明すると、規則の種類は、定義する節の品詞に基づいて定める。よって、本実施例においては、動詞節を定義する規則の種類を「VP」とし、形容詞節を定義する規則の種類を「ADP」とする。   More specifically, the type of rule is determined based on the part of speech of the clause to be defined. Therefore, in this embodiment, the type of rule that defines a verb clause is “VP”, and the type of rule that defines an adjective clause is “ADP”.

また、構成を表す規則は、節の構成を他の規則の種類の名称と、節を構成する形態素又は形態素の品詞とにより再帰的に節の構成を定めることができる。この規則は、再帰的に定めた節の品詞を、他の規則で定める節の品詞として定める。   In addition, the rule representing the configuration can recursively determine the configuration of the clause by the name of another rule type and the morpheme constituting the clause or the part of speech of the morpheme. This rule defines the part of speech defined recursively as the part of speech of a section defined by another rule.

具体的に説明すると、第3行のレコードは、第2行のレコードが保存する「VP」という名称と、形態素の品詞である助詞とを用いて再帰的に節の構成を定める規則を保存する。   More specifically, the record on the third line stores a rule for recursively defining the structure of a clause using the name “VP” stored in the record on the second line and a particle that is a morpheme part of speech. .

つまり、第3行のレコードは、第2行のレコードが保存する種類「VP」の規則が定める節の構成「自立語である動詞αと動詞αに接尾する動詞β」を用いて、「自立語である動詞αと動詞αに接尾する動詞βと、更に、動詞αに付属する助詞」という節の構成を定める規則を保存する。   In other words, the record on the third line is “self-supporting” using the clause composition “verb α which is an independent word and verb β suffixing the verb α” defined by the rule of the type “VP” stored in the second line record. The rules that define the composition of the phrase “verb α, which is the word, verb β which suffixes the verb α, and further, the particle attached to the verb α” are stored.

次に、図5を参照して、修正規則が定める修正方法について概説する。図5は、修正規則が定める修正方法について概説するための図である。   Next, with reference to FIG. 5, the correction method defined by the correction rule will be outlined. FIG. 5 is a diagram for explaining an outline of the correction method defined by the correction rule.

図5においては、「Aだけ」という第1の文(つまり、入力文)を例に挙げて説明する。   In FIG. 5, the first sentence “that is, only A” (that is, the input sentence) will be described as an example.

「Aだけ」という第1の文は、翻訳装置1000が実行する取得処理によって、「A」、「だ」、及び「け」の計3つの形態素に分割される場合と、「A」及び「だけ」の計2つの形態素に分割される場合とが存在する。   The first sentence “A only” is divided into a total of three morphemes “A”, “da”, and “ke” by the acquisition process executed by the translation apparatus 1000, and “A” and “A”. There are cases where it is divided into two morphemes.

また、計2つの形態素に分割される場合であっても、記号の形態素「A」と動詞の形態素「だけ(抱け)」とに分割される場合と、記号の形態素「A」と助詞の形態素「だけ」とに分割される場合とが存在する。   Even if it is divided into two morphemes in total, it is divided into a symbol morpheme “A” and a verb morpheme “only (hold)”, a symbol morpheme “A” and a particle morpheme There are cases where it is divided into “only”.

本実施例においては、例えば、過去に計測した統計的な情報、又は第1の文が使用される分野等に基づいて、第1の文が、計2つの形態素「A」と助詞の形態素「だけ」で構成されると予め判断される。   In the present embodiment, for example, based on statistical information measured in the past or a field in which the first sentence is used, the first sentence is composed of a total of two morphemes “A” and a particle morpheme “ It is determined in advance that it is composed of “only”.

よって、修正規則は、このような場合等を想定して、「A」、「だ」、及び「け」の計3つに分割された形態素、並びに、計2つの形態素「A」と動詞の形態素「だけ(抱け)」を、計2つの形態素「A」と助詞の形態素「だけ」とに修正する方法を定めるとして説明する。   Therefore, the correction rule assumes such a case, and the morpheme divided into a total of three of “A”, “da”, and “ke”, and a total of two morphemes “A” and a verb A description will be given assuming that a method of correcting a morpheme “only” (embracing) into a total of two morphemes “A” and a particle morpheme “only” is defined.

つまり、翻訳装置1000は、修正処理を実行することで、「Aだけ」という第1の文から取得した形態素を、修正規則に基づいて形態素を形態素「A」と助詞の形態素「だけ」とに修正する。   In other words, the translation apparatus 1000 executes the correction process to convert the morpheme acquired from the first sentence “only A” into the morpheme “A” and the morpheme “only” of the particle based on the correction rule. Correct it.

次に、記憶部1300が記憶する修正規則について説明する。記憶部1300が記憶する修正規則は、形態素の品詞を修正する修正方法を、修正方法を適用する形態素及び形態素の品詞のいずれか1つ以上を用いて定める規則と、2以上の形態素の結合及び2以上の形態素への分割のいずれか1つ以上により形態素を修正する修正方法を定める規則と、修正した形態素の品詞を定める規則とで構成される。   Next, the correction rules stored in the storage unit 1300 will be described. The correction rule stored in the storage unit 1300 includes a rule that determines a correction method for correcting a part of speech of a morpheme using one or more of a morpheme and a part of speech of the morpheme to which the correction method is applied, and a combination of two or more morphemes and It comprises a rule that determines a correction method for correcting a morpheme by any one or more of division into two or more morphemes, and a rule that determines the part of speech of the corrected morpheme.

よって、表2を参照して、記憶部1300が記憶する修正規則について説明する。表2は、記憶部1300が記憶する修正規則の一例を示す表である。   Therefore, the correction rules stored in the storage unit 1300 will be described with reference to Table 2. Table 2 is a table showing an example of the correction rules stored in the storage unit 1300.

Figure 2009223704
Figure 2009223704

表2は、対象フィールド、種類フィールド、品詞フィールド、及び形態素フィールドを有している。対象フィールドは、修正方法を適用する形態素を定める規則を保存する。   Table 2 has a target field, a type field, a part of speech field, and a morpheme field. The target field stores a rule that defines a morpheme to which the correction method is applied.

種類フィールドは、同一レコードが保存する規則の種類を保存する。品詞フィールドは、同一レコードが保存する規則が定める方法で修正した形態素の品詞を定める規則を保存する。   The type field stores the type of rule stored by the same record. The part-of-speech field stores a rule that determines the part-of-speech of a morpheme that has been modified by the method defined by the rule stored by the same record.

形態素フィールドは、同一レコードが保存する規則が定める修正対象とする形態素を結合又は分割により修正する修正方法を定める規則を保存する。   The morpheme field stores a rule that defines a correction method for correcting a morpheme to be corrected by a rule stored by the same record by combining or dividing.

具体的に説明すると、第1レコードは、「記号」及び「アルファベット」の品詞を有する形態素と、助動詞の形態素「だ」と、終助詞「け」とで構成される一連の語は、「記号」及び「アルファベット」の形態素と、「記号」及び「アルファベット」の形態素に付属する副助詞の形態素「だけ」とに修正する修正方法を定める規則を保存する。   More specifically, the first record includes a morpheme having parts of speech of “symbol” and “alphabet”, a morpheme “da” of an auxiliary verb, and a final particle “ke”. ”And“ Alphabet ”morphemes, and rules that determine how to correct the morphemes of“ subjects ”and“ Alphabet ”morphemes attached to the morpheme“ only ”.

詳細に説明すると、第1レコードは、助動詞の形態素「だ」と終助詞「け」との2つの形態素を結合することにより形態素「だけ」へと修正する修正方法を定めると共に、修正した形態素「だけ」の品詞を副助詞と定める規則を保存する。   More specifically, the first record defines a correction method for correcting to a morpheme “only” by combining two morphemes of the auxiliary verb morpheme “da” and the final particle “ke”, and the corrected morpheme “ Preserve the rule that defines the “only” part of speech as an auxiliary particle.

同様に、第10レコードは、「未知語」の品詞を有する未得の形態素と、助動詞の形態素「な」と、連体詞の形態素「どの」とで構成される一連の語は、未得の形態素と、未得の形態素に付属する副助詞の形態素「など」及び助詞「の」とに修正する修正方法を定める規則を保存する。   Similarly, the tenth record includes a series of words composed of an unacquired morpheme having an unknown word part of speech, an auxiliary verb morpheme “na”, and a conjunction verb morpheme “what”. And a rule that defines a correction method for correcting the morpheme “etc.” and the particle “no” of the auxiliary particle attached to the unobtained morpheme.

詳細に説明すると、第10レコードは、連体詞の形態素「どの」を分割することにより2つの形態素「ど」と「の」とに修正した後に、形態素「な」と「ど」とを結合することにより形態素「など」へと修正する修正方法を定めると共に、修正した形態素「など」と「の」の品詞を定める規則を保存する。   To explain in detail, the tenth record combines two morphemes “DO” and “NO” by dividing the morpheme “DO” by combining the morpheme “NA” and “DO”. The correction method for correcting the morpheme “etc.” to the morpheme “etc.” and the rules for defining the part of speech of the modified morpheme “etc.” and “no” are stored.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明を行う。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

検索部1400は、記憶部1300に接続している。検索部1400は、後述する検索処理を実行する。   The search unit 1400 is connected to the storage unit 1300. The search unit 1400 executes a search process described later.

これによって、検索部1400は、節規則に基づいて、取得部1200が取得した形態素から節を構成する形態素を検索する。また、検索部1400は、修正規則に基づいて、取得部1200が取得した形態素の品詞から修正方法を適用する形態素の品詞を検索する。   As a result, the search unit 1400 searches for morphemes constituting a node from the morphemes acquired by the acquisition unit 1200 based on the clause rules. Further, the search unit 1400 searches the morpheme part of speech to which the correction method is applied from the morpheme part of speech acquired by the acquisition unit 1200 based on the correction rule.

ここで図6を参照して、検索部1400が実行する検索処理について説明する。図6は、検索部1400が実行する検索処理の一例を表すフローチャートである。   Here, with reference to FIG. 6, a search process executed by the search unit 1400 will be described. FIG. 6 is a flowchart illustrating an example of search processing executed by the search unit 1400.

先ず、検索部1400は、記憶部1300から、節規則及び修正規則を取得する(ステップST0001)。次に、検索部1400は、記憶部1300に未処理の形態素が存在するか否かを判断する(ステップST0002)。検索部1400は、未処理の形態素が存在すると判断する場合にはステップST0003の処理を実行し、そうでない場合には検索処理の実行を終了する。   First, search unit 1400 acquires clause rules and correction rules from storage unit 1300 (step ST0001). Next, search section 1400 determines whether or not an unprocessed morpheme exists in storage section 1300 (step ST0002). If it is determined that there is an unprocessed morpheme, search unit 1400 executes the process of step ST0003, and otherwise ends the search process.

ステップST0002において、検索部1400は、未処理の形態素が存在すると判断した場合には、記憶部1300から、未処理形態素の内で最先の位置の形態素と形態素の品詞とを取得する(ステップST0003)。   In step ST0002, when it is determined that there is an unprocessed morpheme, search unit 1400 acquires the morpheme at the earliest position and the part of speech of the morpheme from storage unit 1300 (step ST0003). ).

次に、検索部1400は、取得した一連の形態素に適合する節規則又は修正規則が存在するか否かを判断する(ステップST0004)。検索部1400は、適合する節規則又は修正規則が存在すると判断した場合にはステップST0005の処理を実行し、そうでない場合にはステップST0002に戻り上記処理を繰り返す。   Next, search section 1400 determines whether there is a clause rule or a correction rule that matches the acquired series of morphemes (step ST0004). If it is determined that there is a matching clause rule or correction rule, search section 1400 executes the process of step ST0005, otherwise returns to step ST0002 and repeats the above process.

ステップST0004において、検索部1400は、適合する節規則又は修正規則が存在すると判断した場合には、記憶部1300へ、適合した形態素又は適合した品詞の第1の文における位置(以下単に、適合位置という)と適合した規則の種類の名称(以下単に、適合規則名という)と適合する節規則(以下単に、適合規則という)とを関連付けて保存する(ステップST0005)。その後、検索部1400は、ステップST0002に戻り上記処理を繰り返す。   In step ST0004, if the search unit 1400 determines that there is a matching clause rule or correction rule, the search unit 1400 stores in the storage unit 1300 the position of the matched morpheme or the matched part of speech in the first sentence (hereinafter simply referred to as the matched position). And the name of the rule type that conforms (hereinafter simply referred to as the conforming rule name) and the matching clause rule (hereinafter simply referred to as the conforming rule) are stored in association with each other (step ST0005). Thereafter, search section 1400 returns to step ST0002 and repeats the above processing.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明を行う。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

置換部1500は、記憶部1300に接続している。置換部1500は、置換処理を実行する。これによって、置換部1500は、検索部1400が検索した形態素を、節規則が定める構成の節に置換する。   The replacement unit 1500 is connected to the storage unit 1300. The replacement unit 1500 performs a replacement process. As a result, the replacement unit 1500 replaces the morpheme searched by the search unit 1400 with a clause having a configuration defined by the clause rule.

ここで図7を参照して、置換部1500が実行する置換処理について説明する。図7は、置換部1500が実行する置換処理の一例を表すフローチャートである。   Here, with reference to FIG. 7, a replacement process executed by the replacement unit 1500 will be described. FIG. 7 is a flowchart illustrating an example of replacement processing executed by the replacement unit 1500.

先ず、置換部1500は、記憶部1300から、規則名に基づいて適合した節規則を取得する(ステップST0101)。次に、置換部1500は、記憶部1300から節規則と関係付けた適合位置を取得する(ステップST0102)。   First, replacement section 1500 acquires a clause rule that matches based on the rule name from storage section 1300 (step ST0101). Next, replacement section 1500 acquires a matching position associated with the clause rule from storage section 1300 (step ST0102).

その後、置換部1500は、適合位置と適合規則とに基づいて規則に適合した形態素を節に置換する(ステップST0103)。次に、置換部1500は、記憶部1300が記憶する表1から適合規則が定める節の品詞を取得する(ステップST0104)。   After that, replacement section 1500 replaces the morpheme that conforms to the rule with the clause based on the matching position and the matching rule (step ST0103). Next, replacement section 1500 acquires the part of speech of the clause determined by the matching rule from Table 1 stored in storage section 1300 (step ST0104).

次に、置換部1500は、記憶部1300から、節を構成する形態素に関連付けた基本形を取得する(ステップST0105)。その後、置換部1500は、記憶部1300から節を構成する形態素に関連付けた品詞を取得する(ステップST0106)。   Next, replacement section 1500 acquires a basic form associated with the morphemes constituting the clause from storage section 1300 (step ST0105). After that, replacement section 1500 acquires the part of speech associated with the morpheme constituting the clause from storage section 1300 (step ST0106).

次に、置換部1500は、節を構成する形態素、形態素の基本形及び品詞、並びに節の品詞を用いて節構造を生成する(ステップST0107)。その後、置換部1500は、記憶部1300へ、生成した節構造を保存する(ステップST0108)。その後、置換部1500は、置換処理の実行を終了する。   Next, replacement section 1500 generates a clause structure using the morpheme constituting the clause, the basic form and part of speech of the morpheme, and the part of speech of the clause (step ST0107). After that, replacement section 1500 stores the generated clause structure in storage section 1300 (step ST0108). Thereafter, the replacement unit 1500 ends the execution of the replacement process.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明する。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

修正部1600は、記憶部1300に接続する。修正部1600は、修正処理を実行する。これにより、修正部1600は、検索部1400が検索した形態素の品詞を、修正規則が定める修正方法によって修正する。   The correction unit 1600 is connected to the storage unit 1300. The correction unit 1600 executes correction processing. As a result, the correction unit 1600 corrects the part of speech of the morpheme searched by the search unit 1400 by the correction method defined by the correction rule.

ここで図8を参照して、修正部1600が実行する修正処理について説明する。図8は、修正部1600が実行する修正処理の一例を表すフローチャートである。   Here, with reference to FIG. 8, the correction process executed by the correction unit 1600 will be described. FIG. 8 is a flowchart illustrating an example of correction processing executed by the correction unit 1600.

先ず、修正部1600は、記憶部1300から、規則名に基づいて適合した修正規則を取得する(ステップST0201)。次に、修正部1600は、記憶部1300から、修正規則と関係付けた適合位置を取得する(ステップST0202)。   First, the correction unit 1600 acquires a correction rule adapted based on the rule name from the storage unit 1300 (step ST0201). Next, the correction unit 1600 obtains the matching position associated with the correction rule from the storage unit 1300 (step ST0202).

その後、修正部1600は、適合位置と適合規則とに基づいて形態素を分割又は結合して修正する(ステップST0203)。次に、修正部1600は、適合規則が定める形態素の品詞へ、修正した形態素の品詞を修正する(ステップST0204)。   After that, correcting section 1600 divides or combines the morphemes based on the matching position and the matching rules to correct (step ST0203). Next, the correcting unit 1600 corrects the part of speech of the corrected morpheme to the part of speech of the morpheme defined by the matching rule (step ST0204).

その後、修正部1600は、記憶部1300に、修正後の形態素及び品詞を保存する(ステップST0205)。次に、修正部1600は、修正処理の実行を終了する。   After that, the correcting unit 1600 stores the corrected morpheme and part of speech in the storage unit 1300 (step ST0205). Next, the correction unit 1600 ends the execution of the correction process.

ここで図3に戻り、翻訳装置1000の構成について引き続き説明を行う。   Here, returning to FIG. 3, the configuration of the translation apparatus 1000 will be described.

実翻訳部1700は、記憶部1300及び送信部1800に接続する。実翻訳部1700は、実翻訳処理を実行する。これによって、実翻訳部1700は、検索部1400が検索した形態素が構成する節と関連付けて記憶部1300が記憶する第2の言語で表す節を用いて、第1の文を第2の言語で表す第2の文に翻訳する。   The actual translation unit 1700 is connected to the storage unit 1300 and the transmission unit 1800. The actual translation unit 1700 executes actual translation processing. As a result, the actual translation unit 1700 uses the clause expressed in the second language stored in the storage unit 1300 in association with the clause formed by the morpheme searched by the search unit 1400, and the first sentence in the second language. Translate to second sentence to represent.

特に、実翻訳部1700は、修正部1600が修正した形態素の品詞に基づいて、第1の文を第2の文に翻訳する。また、実翻訳部1700は、置換部1500が生成した節構造を用いることで、第1の文を構成する活用した形態素の取得部1200が取得した基本形に基づいて翻訳する。   In particular, the actual translation unit 1700 translates the first sentence into the second sentence based on the part of speech of the morpheme corrected by the correction unit 1600. In addition, the actual translation unit 1700 uses the clause structure generated by the replacement unit 1500 to translate based on the basic form acquired by the acquired morpheme acquisition unit 1200 constituting the first sentence.

更に、実翻訳部1700は、検索部1400が検索した節の節規則が定める品詞に基づいて記憶部1300が関連付けて記憶する第1の例文と第2の例文とを用いて翻訳する。   Further, the actual translation unit 1700 translates using the first example sentence and the second example sentence stored in association with each other by the storage unit 1300 based on the part of speech defined by the clause rules of the clause searched by the search unit 1400.

ここで、実翻訳部1700が実行する実翻訳処理の一例について説明する。   Here, an example of actual translation processing executed by the actual translation unit 1700 will be described.

先ず、実翻訳部1700は、記憶部1300から、第1の文を構成する形態素及び形態素の品詞、並びに節構造を取得する。   First, the actual translation unit 1700 acquires from the storage unit 1300 the morpheme that forms the first sentence, the part of speech of the morpheme, and the clause structure.

次に、実翻訳部1700は、記憶部1300が記憶する例文対訳辞書に利用可能な例文が存在するか否かを判断する。   Next, the actual translation unit 1700 determines whether there is an available example sentence in the example sentence parallel translation dictionary stored in the storage unit 1300.

具体的には、実翻訳部1700は、検索部1400が検索した形態素が構成する第1の言語で表す節に基づいて関連付けて記憶部1300が記憶する第1の例文と第2の例文とを取得する。   Specifically, the actual translation unit 1700 associates the first example sentence and the second example sentence stored in the storage unit 1300 in association with the clauses expressed in the first language formed by the morphemes searched by the search unit 1400. get.

尚、実翻訳部1700がする利用可能な例文が存在するか否かの判断は、後述する実施例3において説明する判断とほぼ同様であるため、説明を省略する。   The determination as to whether or not there is an example sentence that can be used by the actual translation unit 1700 is substantially the same as the determination described in the third embodiment, which will be described later.

ここで、実翻訳部1700は、利用可能な例文が存在すると判断した場合には例文を用いて翻訳し、そうでない場合には直接的に第1の文を翻訳する。   Here, the actual translation unit 1700 translates using an example sentence when it is determined that there is an available example sentence, and translates the first sentence directly when not.

具体的には、実翻訳部1700は、取得した第1の文を構成する形態素が表す単語及び形態素の品詞と関連付けて記憶する第2の文を構成する単語を、記憶部1300が記憶する単語対訳辞書から検索して第2の文に翻訳する。   Specifically, the actual translation unit 1700 is a word stored in the storage unit 1300, which is a word that forms a second sentence that is stored in association with a word that is represented by the morpheme that forms the acquired first sentence and the part of speech of the morpheme. Search from the bilingual dictionary and translate it into the second sentence.

特に、実翻訳部1700は、節を構成する用言については、節構造から基本形を取得し、取得した基本形に基づいて第2の文に翻訳する。   In particular, the actual translation unit 1700 acquires the basic form from the clause structure for the predicates constituting the section, and translates it into a second sentence based on the acquired basic form.

また、利用可能な例文が存在すると判断した場合には、上記の翻訳処理に加え、実翻訳部1700は、取得した第1の文を構成する節を、第1文を構成する節に対応する第1の例文を構成する第1の節と関連付けて記憶する第2の例文を構成する節に翻訳する。   If it is determined that there is an example sentence that can be used, in addition to the above-described translation processing, the actual translation unit 1700 corresponds to the clause that constitutes the first sentence, the clause that constitutes the acquired first sentence. It translates into the section which constitutes the 2nd example sentence memorized in association with the 1st section which constitutes the 1st example sentence.

次に、実翻訳部1700は、翻訳して得た第2の文を送信部1800へ出力する。その後、実翻訳部1700は、実翻訳処理の実行を終了する。   Next, actual translation section 1700 outputs the second sentence obtained by translation to transmission section 1800. Thereafter, the actual translation unit 1700 ends the execution of the actual translation process.

送信部1800は、例えば、ネットワーク・コントローラで構成され、通信網100及び実翻訳部1700に接続している。送信部1800は、送信処理を実行することで、実翻訳部1700が翻訳した第2の文を通信網100を介して端末装置2000へ送信する。   The transmission unit 1800 is constituted by a network controller, for example, and is connected to the communication network 100 and the actual translation unit 1700. The transmission unit 1800 transmits the second sentence translated by the actual translation unit 1700 to the terminal device 2000 via the communication network 100 by executing a transmission process.

次に、図9を参照して、翻訳装置1000が実行する翻訳処理について説明する。図9は、翻訳装置1000が実行する翻訳処理の一例を表すフローチャートである。   Next, the translation process executed by the translation apparatus 1000 will be described with reference to FIG. FIG. 9 is a flowchart illustrating an example of translation processing executed by the translation apparatus 1000.

先ず、翻訳装置1000は、第1の文を受信する受信処理を実行する(ステップST0301)。次に、翻訳装置1000は、第1の文から形態素と形態素の品詞を取得する取得処理を実行する(ステップST0302)。   First, translation apparatus 1000 executes a reception process for receiving the first sentence (step ST0301). Next, translation apparatus 1000 executes an acquisition process for acquiring morphemes and parts of speech of morphemes from the first sentence (step ST0302).

その後、翻訳装置1000は、節の構成又は修正方法を定める規則に基づいて、節を構成する又は修正対象とする形態素又は形態素の品詞を検索する検索処理を実行する(ステップST0303)。   After that, translation apparatus 1000 executes a search process for searching for a morpheme or a part of speech of a morpheme that constitutes a clause or is a correction target based on a rule that defines a clause configuration or a correction method (step ST0303).

次に、翻訳装置1000は、節の構成を定める規則に基づいて形態素を節に置換する置換処理を実行する(ステップST0304)。その後、翻訳装置1000は、規則が定める修正方法を適用して形態素及び形態素の品詞を修正する修正処理を実行する(ステップST0305)。   Next, translation apparatus 1000 executes replacement processing for replacing a morpheme with a clause based on a rule that defines the structure of the clause (step ST0304). After that, translation apparatus 1000 executes a correction process for correcting the morpheme and the part of speech of the morpheme by applying the correction method defined by the rule (step ST0305).

尚、本実施例において、翻訳装置1000は、ステップST0304の処理と、ステップST0305の処理とを並列的に実行するとして説明するが、これに限定される訳ではなく、直列的に実行する構成を採用できる。   In this embodiment, the translation apparatus 1000 is described as executing the process of step ST0304 and the process of step ST0305 in parallel. However, the present invention is not limited to this, and a configuration in which the process is executed in series is described. Can be adopted.

次に、翻訳装置1000は、第1の文を構成する置換した節及び修正した形態素に基づいて、第1の文を第2の文に翻訳する実翻訳処理を実行する(ステップST0306)。   Next, translation apparatus 1000 executes actual translation processing for translating the first sentence into the second sentence based on the replaced clause and the modified morpheme constituting the first sentence (step ST0306).

その後、翻訳装置1000は、第2の文を端末装置2000へ送信する送信処理を実行する(ステップST0307)。次に、翻訳装置1000は、翻訳処理の実行を終了する。   After that, translation apparatus 1000 executes a transmission process for transmitting the second sentence to terminal apparatus 2000 (step ST0307). Next, translation apparatus 1000 ends the execution of the translation process.

ここで図1に戻り、翻訳システム10の構成について引き続き説明する。   Here, returning to FIG. 1, the configuration of the translation system 10 will be described.

端末装置2000は、例えば、パーソナル・コンピュータで構成され、通信網100、表示装置2100、及び入力装置2200に接続している。端末装置2000は、端末処理を実行する。   The terminal device 2000 is configured by a personal computer, for example, and is connected to the communication network 100, the display device 2100, and the input device 2200. The terminal device 2000 executes terminal processing.

これにより、端末装置2000は、入力装置2200が入力した第1の文を翻訳装置1000へ通信網100を介して送信する。その後、端末装置2000は、送信した第1の文を翻訳した第2の文を翻訳装置1000から受信する。次に、端末装置2000は、受信した第2の文を表す画像を表示装置2100へ出力することで、第2の文を表示するよう表示装置2100を制御する。   As a result, the terminal device 2000 transmits the first sentence input by the input device 2200 to the translation device 1000 via the communication network 100. Thereafter, the terminal device 2000 receives from the translation device 1000 a second sentence obtained by translating the transmitted first sentence. Next, the terminal device 2000 controls the display device 2100 to display the second sentence by outputting an image representing the received second sentence to the display device 2100.

表示装置2100は、例えば、液晶ディスプレイ、プラズマディスプレイ、又はCRT(Cathode Ray Tube)で構成され、端末装置2000に接続している。表示装置2100は、端末装置2000に制御されて第2の文を表示する。尚、表示装置2100は、端末装置2000に制御されて第1の文をも表示する構成を採用できる。   The display device 2100 is composed of, for example, a liquid crystal display, a plasma display, or a CRT (Cathode Ray Tube), and is connected to the terminal device 2000. The display device 2100 is controlled by the terminal device 2000 to display the second sentence. Note that the display device 2100 can be configured to display the first sentence under the control of the terminal device 2000.

入力装置2200は、例えば、キーボード、ポインティング・ディバイス(以下単に、マウスという)、又はタッチパネルで構成され、端末装置2000に接続している。入力装置2200は、端末装置2000へ第1の文を入力する。   The input device 2200 includes, for example, a keyboard, a pointing device (hereinafter simply referred to as a mouse), or a touch panel, and is connected to the terminal device 2000. The input device 2200 inputs the first sentence to the terminal device 2000.

本実施例において、翻訳装置1000は、端末装置2000から第1の文を受信した後に、第1の文を翻訳した第2の文を端末装置2000へ送信するとして説明したが、これに限定される訳ではない。   In the present embodiment, the translation apparatus 1000 has been described as transmitting the second sentence obtained by translating the first sentence to the terminal apparatus 2000 after receiving the first sentence from the terminal apparatus 2000. However, the present invention is not limited to this. It doesn't mean.

例えば、翻訳装置1000は、例えば、キーボードで構成される入力装置が入力する第1の文を取得した後に、例えば、液晶ディスプレイで構成される表示装置が第1の文を翻訳した第2の文を表示するよう制御する構成を採用できる。   For example, the translation device 1000 acquires, for example, a first sentence input by an input device configured with a keyboard, and then, for example, a second sentence in which a display device configured with a liquid crystal display translates the first sentence. It is possible to adopt a configuration for controlling to display

本実施例においては、取得部1200が取得手段に相当し、記憶部1300が記憶手段に相当し、検索部1400が検索手段に相当し、修正部1600が修正手段に相当し、実翻訳部1700が翻訳手段に相当する。   In this embodiment, the acquisition unit 1200 corresponds to the acquisition unit, the storage unit 1300 corresponds to the storage unit, the search unit 1400 corresponds to the search unit, the correction unit 1600 corresponds to the correction unit, and the actual translation unit 1700. Corresponds to a translation means.

第2の実施例においては、サ行変格活用する動詞(以下単に、サ変動詞という)を含む節に基づいて第1の文を第2の文に翻訳する翻訳装置について説明する。   In the second embodiment, a translation apparatus for translating a first sentence into a second sentence based on a clause including a verb (hereinafter, simply referred to as a “sa variation”) to be used for the Sa line modification will be described.

尚、実施例2で説明する翻訳システムは、実施例1で説明した翻訳システム10と同様の構成であるため、以下、実施例1で使用した装置番号を使用して説明を行う。尚、翻訳システムの構成についての説明は省略する。   Since the translation system described in the second embodiment has the same configuration as the translation system 10 described in the first embodiment, the description will be given below using the device number used in the first embodiment. A description of the configuration of the translation system is omitted.

先ず、図10を参照して、翻訳装置1000がサ変動詞で構成される第1の文を翻訳するために実行する翻訳処理について概説する。図10は、翻訳装置3000がサ変動詞で構成される第1の文を翻訳するために実行する翻訳処理の一例を概説するための図である。   First, with reference to FIG. 10, the translation processing executed by the translation apparatus 1000 to translate a first sentence composed of sub-variables will be outlined. FIG. 10 is a diagram for explaining an example of a translation process executed by the translation device 3000 for translating the first sentence composed of the sub-variables.

図10においては、「彼は翻訳装置を発明した」という第1の文(つまり、入力文)を例に挙げて説明する。   In FIG. 10, the first sentence (that is, the input sentence) “He invented the translation device” will be described as an example.

先ず、翻訳装置1000は、基本形が「する」であるサ変動詞「し」を含む第1の文を取得する。次に、翻訳装置1000は、第1の文に対して取得処理を実行する。これにより、翻訳装置1000は、第1の文を構成する形態素を取得する。   First, translation apparatus 1000 obtains a first sentence that includes a sub-variable “shi” whose basic form is “do”. Next, the translation apparatus 1000 performs an acquisition process on the first sentence. Thereby, the translation apparatus 1000 acquires the morpheme which comprises a 1st sentence.

具体的に説明すると、翻訳装置1000は、名詞の形態素「発明」、サ変動詞の形態素「し」、及び助動詞の形態素「た」等を取得する。   More specifically, the translation apparatus 1000 acquires a morpheme “invention” of a noun, a morpheme “shi” of a safari verb, and a morpheme “ta” of an auxiliary verb.

次に、翻訳装置1000は、検索処理を実行する。これにより、翻訳装置1000は、サ変接続する名詞の形態素と自立語であるサ変動詞の形態素とサ変動詞に従属する自動詞の形態素とで構成される節の構成を定める規則に基づいて、「発明する」という節を検索する。   Next, the translation apparatus 1000 executes a search process. As a result, the translation apparatus 1000 “invents” based on a rule that defines the configuration of a clause composed of a morpheme of a noun to be connected to a safari, a morpheme of a safari verb that is an independent word, and an intransitive morpheme subordinate to the safari verb. "Is searched.

その後、翻訳装置1000は、置換処理を実行する。これにより、翻訳装置1000は、サ変接続する名詞の形態素「発明」、自立語であるサ変動詞の「し」、及びサ変動詞に従属する助動詞の形態素「た」を、節「発明した」に置換する。   Thereafter, the translation apparatus 1000 performs a replacement process. As a result, the translation apparatus 1000 replaces the morpheme “invention” of the noun to be connected to the safari, the “sashi” of the safari verb that is an independent word, and the morpheme “ta” of the auxiliary verb that is subordinate to the safari verb with the section “invented”. To do.

次に、翻訳装置1000は、実翻訳処理を実行する。これにより、翻訳装置1000は、記憶部1300が、記憶する単語対訳辞書及び節対訳辞書を用いて、第1の文を第2の文へ翻訳する。   Next, the translation apparatus 1000 executes actual translation processing. Thereby, the translation apparatus 1000 translates a 1st sentence into a 2nd sentence using the memory | storage part 1300 using the word parallel translation dictionary and clause parallel translation dictionary which it memorize | stores.

具体的には、翻訳装置1000は、サ変動詞に接続する名詞の形態素「発明」と、サ変動詞の形態素「す」の基本形「する」とを、別々に単語対訳辞書を用いて翻訳するのではなく、「発明する」という1つの節を節対訳辞書を用いて翻訳する。   Specifically, the translation apparatus 1000 does not separately translate the morpheme “invention” of the noun connected to the sub-variant and the basic form “s” of the sub-morphic morpheme “su” using the word bilingual dictionary. Instead, one section "invent" is translated using a clause bilingual dictionary.

よって、翻訳装置1000は、サ変動詞である第1の単語「する」を翻訳した第2の単語「做」と、サ変動詞に接続する第1の単語「発明」翻訳した第2の単語とを用いて翻訳するのではなく、第1の節「発明する」を翻訳した第2の節を用いて翻訳する。   Therefore, the translation device 1000 translates the second word “做” obtained by translating the first word “to” that is a sub-variable and the second word translated “invention” connected to the sub-variable. Instead of translating using, translate using the second section translated from the first section “Invent”.

つまり、サ変動詞は、サ変動詞に接続する名詞と共に使用されることで、接続する名詞を動詞化する。よって、本実施例において、翻訳装置1000は、サ変動詞に接続する名詞とサ変動詞とを別々に翻訳するのではなく、サ変動詞に接続する名詞とサ変動詞とを節に置換した後に、置換した節を翻訳する構成を採用する。   In other words, the sa variation is used together with a noun connected to the sa variation, thereby converting the connected noun into a verb. Therefore, in the present embodiment, the translation apparatus 1000 does not translate the noun and the sub-variable connected to the sub-variant separately, but instead replaces the noun and the sub-verb connected to the sub-variant with a clause. Use a structure that translates clauses.

第3の実施例においては、第1の文と第1の例文とが類似する程度を表す指標(以下単に、類似度という)に基づいて選択した第1の例文と第2の例文とを用いて翻訳する翻訳装置について説明する。   In the third embodiment, the first example sentence and the second example sentence selected based on an index indicating the degree of similarity between the first sentence and the first example sentence (hereinafter simply referred to as similarity) are used. A translation apparatus for translating will be described.

実施例3で説明する翻訳システム30は、通信網300、翻訳装置3000、端末装置4000、表示装置4100、及び入力装置4200で構成される。   The translation system 30 described in the third embodiment includes a communication network 300, a translation device 3000, a terminal device 4000, a display device 4100, and an input device 4200.

実施例3で説明する翻訳システム30、通信網300、翻訳装置3000、端末装置4000、表示装置4100、及び入力装置4200の構成は、実施例1で説明する翻訳システム10、通信網100、翻訳装置1000、端末装置2000、表示装置2100、及び入力装置2200の構成と同様であるため、以下主に、相違点について説明を行う。   The configuration of the translation system 30, the communication network 300, the translation device 3000, the terminal device 4000, the display device 4100, and the input device 4200 described in the third embodiment is the same as the translation system 10, the communication network 100, and the translation device described in the first embodiment. 1000, the terminal device 2000, the display device 2100, and the input device 2200 are similar in configuration to each other, and the differences will be mainly described below.

先ず、図11を参照して、翻訳装置3000が第1の例文と第2の例文とを選択する際に用いる類似度について説明する。図11は、翻訳装置3000が第1の例文と第2の例文とを選択する際に用いる類似度の一例について説明するための図である。   First, with reference to FIG. 11, the similarity used when the translation apparatus 3000 selects a first example sentence and a second example sentence will be described. FIG. 11 is a diagram for explaining an example of the similarity used when the translation device 3000 selects the first example sentence and the second example sentence.

本実施例において、翻訳装置3000は、第1の例文を構成する形態素であり、かつ入力文である第1の文をも構成する形態素の、第1の例文を構成する形態素に占める割合を類似度として算出するとして説明する。   In this embodiment, translation apparatus 3000 is similar to the morpheme that constitutes the first example sentence and the morpheme that constitutes the first sentence as the input sentence. It is assumed that the degree is calculated.

しかし、これに限定される訳ではなく、例えば、翻訳装置3000は、第1の例文を構成する節であり、かつ入力文である第1の文をも構成する節の、第1の例文を構成する節に占める割合を類似度として算出する構成を採用できる。   However, the translation device 3000 is not limited to this example. For example, the translation device 3000 reads the first example sentence of the section that constitutes the first example sentence and also constitutes the first sentence that is the input sentence. It is possible to adopt a configuration in which the proportion of the nodes constituting the node is calculated as a similarity.

具体例として、図11に示すように、第1の文(つまり、入力文)が「選ばれた犬が取った」という文であり、第1の例文が「選ばれた人が取る」という文である場合を例に挙げて説明する。   As a specific example, as shown in FIG. 11, the first sentence (that is, the input sentence) is a sentence “the selected dog took”, and the first example sentence is “the selected person takes”. A case where it is a sentence will be described as an example.

第1の文は、「選ば」、「れ」、「た」、「犬」、「が」、「取っ」、及び「た」という形態素で構成される。   The first sentence is composed of morphemes of “choice”, “re”, “ta”, “dog”, “ga”, “take”, and “ta”.

一方、第1の例文は、「選ば」、「れ」、「た」、「人」、「が」、「取」、及び「る」という計7つの形態素で構成される。   On the other hand, the first example sentence is composed of a total of seven morphemes: “choice”, “re”, “ta”, “person”, “ga”, “take”, and “ru”.

ここで、第1の例文を構成する形態素の内で、形態素「人」及び「る」は第1の文を構成する形態素と一致しないが、残り5つの形態素は一致する。   Here, among the morphemes constituting the first example sentence, the morphemes “people” and “ru” do not match the morphemes constituting the first sentence, but the remaining five morphemes match.

よって、翻訳装置3000は、類似度を「5/7」(つまり、「0.71」)と算出する。尚、翻訳装置3000は、記憶部3300が記憶する他の第1の例文についても同様に、入力文である第1の文との類似度を算出する。   Therefore, translation apparatus 3000 calculates the similarity as “5/7” (that is, “0.71”). Similarly, translation apparatus 3000 calculates the similarity to the first sentence that is the input sentence for the other first example sentences stored in storage unit 3300 as well.

ここで図12を参照して、実施例3において、翻訳装置3000が実行する翻訳処理について概説する。図12は、実施例3において、翻訳装置3000が実行する翻訳処理の一例について概説するための図である。   Here, with reference to FIG. 12, the translation processing executed by the translation apparatus 3000 in the third embodiment will be outlined. FIG. 12 is a diagram for outlining an example of the translation process executed by the translation device 3000 in the third embodiment.

先ず、翻訳装置3000は、「選ばれた犬が取った」という入力文である第1の文を受信する。   First, translation apparatus 3000 receives a first sentence that is an input sentence “The selected dog took”.

次に、翻訳装置3000は、規則に基づいて節を構成する形態素又は修正対象とする形態素の品詞を検索する検索処理、検索した形態素の品詞を修正する修正処理、及び検索した形態素を節に置換する置換処理を実行する。   Next, the translation device 3000 searches for a morpheme constituting a clause or a part of speech of a morpheme to be corrected based on a rule, a correction process for correcting the part of speech of the searched morpheme, and replaces the searched morpheme with a clause Execute the replacement process.

これにより、翻訳装置3000は、「選ばれた」、「犬」、「が」、及び「取った」という形態素及び節を取得する。   As a result, the translation device 3000 acquires morphemes and clauses “selected”, “dog”, “ga”, and “taken”.

次に、翻訳装置3000は、入力文である第1の文と第1の例文との類似度を算出する算出処理、及び類似度に基づいて翻訳に用いる第1の例文と第2の例文とを選択する選択処理を実行する。   Next, the translation device 3000 calculates a similarity between the first sentence as the input sentence and the first example sentence, and the first example sentence and the second example sentence used for translation based on the degree of similarity. A selection process for selecting is executed.

これにより、翻訳装置3000は、算出処理で算出した類似度が最も高い第1の例文「選ばれた人が取る」という例文と第1の例文を翻訳した第2の例文とを選択する。   Thereby, translation apparatus 3000 selects the first example sentence “selected person takes” having the highest similarity calculated in the calculation process and the second example sentence translated from the first example sentence.

尚、第1の例文を構成する形態素及び節は、第2の例文を構成する形態素及び節と、形態素及び節が表す意味に基づいて関連付けて記憶部1300に保存されている。   Note that the morphemes and clauses constituting the first example sentence are stored in the storage unit 1300 in association with the morphemes and clauses constituting the second example sentence based on the meanings represented by the morphemes and clauses.

その後、翻訳装置3000は、第1の例文及び第2の例文と、第1の文を構成する形態素及び節とを用いて、第1の文を第2の文へ翻訳する実翻訳処理を実行する。   Thereafter, the translation device 3000 executes an actual translation process for translating the first sentence into the second sentence using the first example sentence and the second example sentence, and the morphemes and clauses constituting the first sentence. To do.

具体的には、翻訳装置3000は、入力文である第1の文を構成する第1の単語「犬」が第1の例文を構成する形態素「人」と異なると判断する。次に、翻訳装置3000は、第1の単語「犬」と関連付けて記憶する第2の単語「狗」を、単語対訳辞書から検索する。   Specifically, translation apparatus 3000 determines that the first word “dog” constituting the first sentence that is the input sentence is different from the morpheme “person” constituting the first example sentence. Next, the translation apparatus 3000 searches the word bilingual dictionary for the second word “狗” stored in association with the first word “dog”.

その後、翻訳装置3000は、第1の単語「犬」を第2の単語「狗」に翻訳すると共に、第1の文と第1の例文とに共通する形態素及び節を、共通する形態素及び節に関連付けて第2の例文の形態素及び節に翻訳する。   After that, the translation device 3000 translates the first word “dog” into the second word “狗”, and converts morphemes and clauses common to the first sentence and the first example sentence into common morphemes and clauses. And translated into morphemes and clauses of the second example sentence.

ここで図13を参照して、実施例3における翻訳装置3000の構成について説明する。図13は、実施例3における翻訳装置3000の一構成例を表す機能ブロック図である。   Here, with reference to FIG. 13, the structure of the translation apparatus 3000 in Example 3 is demonstrated. FIG. 13 is a functional block diagram illustrating a configuration example of the translation apparatus 3000 according to the third embodiment.

翻訳装置3000は、受信部3100、取得部3200、記憶部3300、検索部3400、置換部3500、修正部3600、実翻訳部3700、及び送信部3800のみならず、算出部3610及び選択部3620を備える点で、実施例1の翻訳装置1000と異なる。   The translation device 3000 includes not only a reception unit 3100, an acquisition unit 3200, a storage unit 3300, a search unit 3400, a replacement unit 3500, a modification unit 3600, an actual translation unit 3700, and a transmission unit 3800, but also a calculation unit 3610 and a selection unit 3620. It differs from the translation apparatus 1000 of Example 1 by the point provided.

受信部3100、取得部3200、記憶部3300、検索部3400、置換部3500、修正部3600、実翻訳部3700、及び送信部3800の有する機能及び構成は、実施例1で説明した受信部1100、取得部1200、記憶部1300、検索部1400、置換部1500、修正部1600、実翻訳部1700、及び送信部1800とほぼ同様であるため、説明を省略する。   The functions and configurations of the reception unit 3100, the acquisition unit 3200, the storage unit 3300, the search unit 3400, the replacement unit 3500, the modification unit 3600, the actual translation unit 3700, and the transmission unit 3800 are the same as those of the reception unit 1100 described in the first embodiment. Since the acquisition unit 1200, the storage unit 1300, the search unit 1400, the replacement unit 1500, the correction unit 1600, the actual translation unit 1700, and the transmission unit 1800 are substantially the same, description thereof is omitted.

算出部3610及び選択部3620が有する機能は、翻訳装置3000が実行するソフトウェア制御により実現される。ソフトウェア制御を実行するために用いる翻訳装置3000のハードウェア構成は、実施例1で説明した翻訳装置1000のハードウェア構成とほぼ同様であるため、説明を省略する。   The functions of the calculation unit 3610 and the selection unit 3620 are realized by software control executed by the translation device 3000. The hardware configuration of the translation apparatus 3000 used for executing the software control is substantially the same as the hardware configuration of the translation apparatus 1000 described in the first embodiment, and thus the description thereof is omitted.

算出部3610は、記憶部3300に接続する。算出部3610は、算出処理を実行する。これにより、算出部3610は、取得部3200が取得した第1の文を構成する形態素と第1の例文を構成する形態素とに基づいて、第1の文と第1の例文とが類似する程度を表す指標(つまり、類似度)を算出する。   The calculation unit 3610 is connected to the storage unit 3300. The calculation unit 3610 executes calculation processing. Thereby, the calculation unit 3610 is based on the morpheme that configures the first sentence acquired by the acquisition unit 3200 and the morpheme that configures the first example sentence, to the extent that the first sentence and the first example sentence are similar. An index (that is, the similarity) representing the is calculated.

ここで図14を参照して、算出部3610が実行する算出処理について説明する。図14は、算出部3610が実行する算出処理の一例を表すフローチャートである。   Here, the calculation process executed by the calculation unit 3610 will be described with reference to FIG. FIG. 14 is a flowchart illustrating an example of calculation processing executed by the calculation unit 3610.

先ず、算出部3610は、記憶部3300から、取得部3200が取得した第1の文の形態素を取得する(ステップST0401)。次に、算出部3610は、記憶部3300から、第1の例文の形態素を取得する(ステップST0402)。   First, calculation unit 3610 acquires the morpheme of the first sentence acquired by acquisition unit 3200 from storage unit 3300 (step ST0401). Next, calculation unit 3610 acquires the morpheme of the first example sentence from storage unit 3300 (step ST0402).

その後、算出部3610は、カウンタ変数の値を「0」として初期化する(ステップST0403)。次に、算出部3610は、第1の例文を構成する未処理の形態素が存在するか否かを判断する(ステップST0404)。算出部3610は、未処理の形態素が存在すると判断する場合にはステップST0405の処理を、そうでない場合にはステップST0408の処理を実行する。   Thereafter, calculation unit 3610 initializes the value of the counter variable as “0” (step ST0403). Next, calculation unit 3610 determines whether or not there is an unprocessed morpheme constituting the first example sentence (step ST0404). If it is determined that there is an unprocessed morpheme, calculation unit 3610 performs the process of step ST0405, and otherwise performs the process of step ST0408.

ステップST0404において、算出部3610は、未処理の形態素が存在すると判断した場合には、未処理の形態素の内1つを、処理対象とする(ステップST0405)。尚、処理対象とする形態素を、以下単に、処理対象形態素という。   In Step ST0404, when the calculation unit 3610 determines that an unprocessed morpheme exists, the calculation unit 3610 sets one of the unprocessed morphemes as a processing target (Step ST0405). The morpheme to be processed is hereinafter simply referred to as a process target morpheme.

次に、算出部3610は、処理対象形態素が第1の文を構成する形態素に含まれるか否かを判断する(ステップST0406)。算出部3610は、処理対象形態素が第1の文を構成する形態素に含まれると判断する場合にはステップST0407の処理を、そうでない場合にはステップST0404に戻り上記処理を繰り返す。   Next, calculation unit 3610 determines whether or not the processing target morpheme is included in the morphemes constituting the first sentence (step ST0406). If it is determined that the morpheme to be processed is included in the morpheme constituting the first sentence, calculation unit 3610 returns to step ST0404 and repeats the above process.

ステップST0406において、算出部3610は、処理対象形態素が第1の文を構成する形態素に含まれると判断した場合には、カウンタ変数の値を値「1」だけインクリメントする(ステップST0407)。その後、算出部3610は、ステップST0404に戻り上記処理を繰り返す。   In step ST0406, when the calculation unit 3610 determines that the processing target morpheme is included in the morpheme constituting the first sentence, the calculation unit 3610 increments the value of the counter variable by the value “1” (step ST0407). Thereafter, calculation unit 3610 returns to step ST0404 and repeats the above processing.

ステップST0404において、算出部3610は、未処理の形態素が存在しないと判断した場合には、カウンタ変数の値を、第1の例文を構成する形態素の総数で除算することで、類似度を算出する(ステップST0408)。   In Step ST0404, when the calculation unit 3610 determines that there is no unprocessed morpheme, the calculation unit 3610 calculates the similarity by dividing the value of the counter variable by the total number of morphemes constituting the first example sentence. (Step ST0408).

その後、算出部3610は、類似度と第1の例文とを関連付けて記憶部3300へ保存する(ステップST0409)。次に、算出部3610は、算出処理の実行を終了する。   Thereafter, calculation unit 3610 associates the similarity with the first example sentence and stores them in storage unit 3300 (step ST0409). Next, the calculation unit 3610 ends the execution of the calculation process.

ここで、図13に戻り、翻訳装置3000の構成について引き続き説明を行う。   Here, returning to FIG. 13, the configuration of the translation apparatus 3000 will be described.

選択部3620は、記憶部3300及び実翻訳部3700に接続する。選択部3620は、選択処理を実行する。これにより、選択部3620は、算出部3610が算出した指標(つまり、類似度)に基づいて記憶部3300が記憶する第1の例文と第2の例文とを選択する。   The selection unit 3620 is connected to the storage unit 3300 and the actual translation unit 3700. The selection unit 3620 executes a selection process. Thus, the selection unit 3620 selects the first example sentence and the second example sentence stored in the storage unit 3300 based on the index (that is, the similarity) calculated by the calculation unit 3610.

ここで、選択部3620が実行する選択処理の一例について説明する。   Here, an example of the selection process executed by the selection unit 3620 will be described.

先ず、選択部3620は、記憶部3300が記憶する類似度を参照する。次に、算出部3610は、参照した類似度の内で、最も値が大きい類似度と関連付けて記憶部3300が記憶する第1の例文を選択する。   First, the selection unit 3620 refers to the similarity stored in the storage unit 3300. Next, the calculation unit 3610 selects the first example sentence stored in the storage unit 3300 in association with the similarity having the largest value among the referenced similarities.

その後、選択部3620は、選択した第1の例文を取得する。次に、算出部3610は、選択した第1の例文と関連付けて記憶部3300が記憶する第2の例文を取得する。   Thereafter, the selection unit 3620 acquires the selected first example sentence. Next, calculation unit 3610 acquires the second example sentence stored in storage unit 3300 in association with the selected first example sentence.

その後、選択部3620は、選択した第1の例文と第2の例文とを関連付けて実翻訳部3700へ出力する。次に、算出部3610は、算出処理の実行を終了する。   After that, the selection unit 3620 associates the selected first example sentence and the second example sentence, and outputs them to the actual translation unit 3700. Next, the calculation unit 3610 ends the execution of the calculation process.

実翻訳部3700は、記憶部3300及び送信部3800のみならず、選択部3620にも接続する点で、実施例1の実翻訳部1700と異なる。   The actual translation unit 3700 differs from the actual translation unit 1700 of the first embodiment in that it is connected not only to the storage unit 3300 and the transmission unit 3800 but also to the selection unit 3620.

実翻訳部3700は、実翻訳処理を実行する。これにより、実翻訳部3700は、選択部3620が選択した第1の例文と第2の例文とを取得すると共に、取得した第1の例文と第2の例文とを用いて翻訳する点で、実施例1で説明した実翻訳部1700と異なる。   The actual translation unit 3700 executes actual translation processing. Thereby, the actual translation unit 3700 acquires the first example sentence and the second example sentence selected by the selection unit 3620 and translates them using the acquired first example sentence and second example sentence. This differs from the actual translation unit 1700 described in the first embodiment.

ここで、図15を参照して、実施例3において、翻訳装置3000が実行する翻訳処理について説明する。図15は、実施例3において、翻訳装置3000が実行する翻訳処理の一例を表すフローチャートである。   Here, with reference to FIG. 15, the translation process performed by the translation apparatus 3000 in the third embodiment will be described. FIG. 15 is a flowchart illustrating an example of a translation process executed by the translation device 3000 in the third embodiment.

先ず、翻訳装置3000は、ステップ0501からST0505の処理を実行する(ステップ0501からST0505)。尚、ステップ0501からST0505の処理は、図9を参照して説明したステップSTST0301からST0305の処理とほぼ同様であるため、説明を省略する。   First, translation apparatus 3000 executes the processing from step 0501 to ST0505 (step 0501 to ST0505). Note that the processing from step 0501 to ST0505 is substantially the same as the processing from step STST0301 to ST0305 described with reference to FIG.

ステップ0505を実行した後に、翻訳装置3000は、入力文である第1の文と第1の例文との類似度を算出する算出処理を実行する(ステップST0506)。次に、翻訳装置3000は、類似度に基づいて翻訳に用いる第1の例文を選択する選択処理を実行する(ステップST0507)。   After executing step 0505, translation apparatus 3000 executes a calculation process for calculating the degree of similarity between the first sentence as the input sentence and the first example sentence (step ST0506). Next, translation apparatus 3000 executes a selection process for selecting the first example sentence used for translation based on the degree of similarity (step ST0507).

その後、翻訳装置3000は、ステップST0508及びST0509の処理を実行する(ステップ0508及びST0509)。その後、翻訳装置3000は、翻訳処理の実行を終了する。尚、ステップST0508及びST0509の処理は、図9を参照して説明したステップST0306及びST0307の処理とほぼ同様であるため、説明を省略する。   After that, translation apparatus 3000 executes the processes of steps ST0508 and ST0509 (steps 0508 and ST0509). Thereafter, the translation device 3000 ends the translation process. Note that the processing in steps ST0508 and ST0509 is substantially the same as the processing in steps ST0306 and ST0307 described with reference to FIG.

本実施例においては、取得部3200が取得手段に相当し、記憶部3300が記憶手段に相当し、検索部3400が検索手段に相当し、修正部3600が修正手段に相当し、算出部3610が算出手段に相当し、選択部3620が選択手段に相当し、実翻訳部3700が翻訳手段に相当する。   In this embodiment, the acquisition unit 3200 corresponds to the acquisition unit, the storage unit 3300 corresponds to the storage unit, the search unit 3400 corresponds to the search unit, the correction unit 3600 corresponds to the correction unit, and the calculation unit 3610 The selection unit 3620 corresponds to the selection unit, and the actual translation unit 3700 corresponds to the translation unit.

翻訳装置1000及び3000は、演算部がROM及びRAMの少なくともひとつに格納されたプログラムを実行することによって実現される。また、このプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供できる。   Translation apparatuses 1000 and 3000 are realized by an arithmetic unit executing a program stored in at least one of ROM and RAM. Further, this program can be provided by being stored and distributed in a magnetic disk, an optical disk, a semiconductor memory, or other recording medium, or distributed via a network.

以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。   Although the preferred embodiments of the present invention have been described in detail above, the present invention is not limited to the specific embodiments, and various modifications, within the scope of the gist of the present invention described in the claims, It can be changed.

本発明の翻訳装置で構成される翻訳システムの一実施形態を示すシステム構成図である。It is a system configuration figure showing one embodiment of a translation system constituted by a translation device of the present invention. 翻訳装置が実行する翻訳処理の一例を概説するための図である。It is a figure for outlining an example of the translation process which a translation apparatus performs. 翻訳装置の一構成例を表す機能ブロック図である。It is a functional block diagram showing the example of 1 structure of a translation apparatus. 翻訳装置のハードウェア構成の一例を表す図である。It is a figure showing an example of the hardware constitutions of a translation apparatus. 修正規則が定める修正方法について概説するための図である。It is a figure for giving an outline about the correction method which a correction rule defines. 検索部が実行する検索処理の一例を表すフローチャートである。It is a flowchart showing an example of the search process which a search part performs. 置換部が実行する置換処理の一例を表すフローチャートである。It is a flowchart showing an example of the replacement process which a replacement part performs. 修正部が実行する修正処理の一例を表すフローチャートである。It is a flowchart showing an example of the correction process which a correction part performs. 翻訳装置が実行する翻訳処理の一例を表すフローチャートである。It is a flowchart showing an example of the translation process which a translation apparatus performs. 翻訳装置がサ変動詞で構成される第1の文を翻訳するために実行する翻訳処理の一例を概説するための図である。It is a figure for outlining an example of the translation process performed in order that a translation apparatus may translate the 1st sentence comprised by a sub-variable. 翻訳装置が第1の例文と第2の例文とを選択する際に用いる類似度の一例について説明するための図である。It is a figure for demonstrating an example of the similarity used when a translation apparatus selects a 1st example sentence and a 2nd example sentence. 実施例3において、翻訳装置が実行する翻訳処理の一例について概説するための図である。In Example 3, it is a figure for outlining an example of the translation process which a translation apparatus performs. 実施例3における翻訳装置の一構成例を表す機能ブロック図である。FIG. 10 is a functional block diagram illustrating a configuration example of a translation apparatus according to a third embodiment. 算出部が実行する算出処理の一例を表すフローチャートである。It is a flowchart showing an example of the calculation process which a calculation part performs. 実施例3において、翻訳装置が実行する翻訳処理の一例を表すフローチャートである。In Example 3, it is a flowchart showing an example of the translation process which a translation apparatus performs.

符号の説明Explanation of symbols

10…翻訳システム 100…通信網
1000…翻訳装置 1010…演算部
1020…ROM 1030…RAM
1040…外部記憶部 1050…バス
1100…受信部 1200…取得部(取得手段)
1300…記憶部(記憶手段) 1400…検索部(検索手段)
1500…置換部 1600…修正部(修正手段)
1700…実翻訳部(翻訳手段) 1800…送信部
2000…端末装置 2100…表示装置
2200…入力装置 300…通信網
3000…翻訳装置 3100…受信部
3200…取得部(取得手段) 3300…記憶部(記憶手段)
3400…検索部(検索手段) 3500…置換部
3600…修正部(修正手段) 3610…算出部(算出手段)
3620…選択部(選択手段) 3700…実翻訳部(翻訳手段)
3800…送信部
10 ... Translation system 100 ... Communication network
1000 ... Translation device 1010 ... Calculation unit
1020 ... ROM 1030 ... RAM
1040 ... External storage unit 1050 ... Bus
1100: Reception unit 1200 ... Acquisition unit (acquisition means)
1300: Storage unit (storage unit) 1400: Search unit (search unit)
1500 ... replacement unit 1600 ... correction unit (correction means)
1700 ... Actual translation unit (translation means) 1800 ... Transmission unit
2000 ... Terminal device 2100 ... Display device
2200 ... Input device 300 ... Communication network
3000 ... Translation device 3100 ... Receiver
3200 ... Acquisition unit (acquisition means) 3300 ... Storage unit (storage means)
3400 ... Search unit (search means) 3500 ... Replacement unit
3600: Correction unit (correction unit) 3610 ... Calculation unit (calculation unit)
3620 ... selection unit (selection unit) 3700 ... actual translation unit (translation unit)
3800: Transmitter

Claims (9)

前記第1の言語で表す第1の文を構成する形態素及び前記形態素の品詞を形態素解析により取得する取得手段と、
自ら語の意味を表す自立語であると共に、活用により語の形態が変化する用言と、前記自立語である用言に付属する付属語及び前記用言に接続する接続語のいずれか1つ以上とが連結して少なくとも1つの意味を表す節の構成を、前記節から得られる形態素及び前記形態素の品詞のいずれか1つ以上を用いて定める規則を記憶すると共に、前記第1の言語で表す第1の例文と、前記第1の例文を前記第2の言語へ翻訳した第2の例文とを前記節に基づいて関連付けて記憶する記憶手段と、
前記記憶手段が記憶する節の構成を定める規則に基づいて、前記取得手段が取得した形態素から前記節を構成する形態素を検索する検索手段と、
前記検索手段が検索した形態素が構成する前記第1の言語で表す節に基づいて関連付けて前記記憶手段が記憶する前記第1の例文と前記第2の例文とを用いて、前記第1の文を第2の言語で表す第2の文に翻訳する翻訳手段とを備えることを特徴とする翻訳装置。
Acquisition means for acquiring a morpheme constituting the first sentence expressed in the first language and a part of speech of the morpheme by morphological analysis;
A self-supporting word that expresses the meaning of the word itself, and one of a predicate that changes the form of the word due to its use, an appendix attached to the self-supporting word, and a connection word connected to the word In the first language, the above is connected to store rules that define at least one meaning of the clause structure using at least one of the morpheme obtained from the clause and the part of speech of the morpheme. Storage means for storing a first example sentence to be represented and a second example sentence obtained by translating the first example sentence into the second language in association with each other based on the clause;
Search means for searching for a morpheme constituting the clause from morphemes acquired by the acquisition means, based on a rule that defines the configuration of the clause stored by the storage means;
The first sentence using the first example sentence and the second example sentence stored in the storage means in association with each other based on the clause expressed in the first language formed by the morpheme searched by the search means. A translation device comprising: translation means for translating the text into a second sentence expressed in a second language.
前記記憶手段は、前記形態素の品詞を修正する修正方法を、前記修正方法を適用する形態素及び前記形態素の品詞のいずれか1つ以上を用いて定める規則を記憶し、
前記検索手段は、前記記憶手段が記憶する修正方法を定める規則に基づいて、前記取得手段が取得した形態素の品詞から前記修正方法を適用する形態素の品詞を検索し、
前記検索手段が検索した形態素の品詞を、前記規則が定める修正方法に従って修正する修正手段を更に備え、
前記翻訳手段は、前記修正手段が修正した形態素の品詞に基づいて、前記第1の文を前記第2の文に翻訳することを特徴とする請求項1に記載の翻訳装置。
The storage means stores a rule for determining a correction method for correcting the part of speech of the morpheme using any one or more of the morpheme to which the correction method is applied and the part of speech of the morpheme,
The search unit searches for a morpheme part of speech to which the correction method is applied from a morpheme part of speech acquired by the acquisition unit based on a rule defining a correction method stored in the storage unit,
A correction means for correcting the part of speech of the morpheme searched by the search means according to a correction method defined by the rule;
The translation apparatus according to claim 1, wherein the translation unit translates the first sentence into the second sentence based on a morphological part of speech corrected by the correction unit.
前記修正方法を定める規則は、2以上の形態素の結合及び2以上の形態素への分割のいずれか1つ以上により前記形態素を修正すると共に、修正した前記形態素の品詞を定めることで修正方法を定めることを特徴とする請求項2に記載の翻訳装置。   The rule for determining the correction method determines the correction method by correcting the morpheme by any one or more of the combination of two or more morphemes and the division into two or more morphemes, and by defining the part of speech of the corrected morpheme. The translation apparatus according to claim 2, wherein: 前記修正方法を定める規則は、前記修正方法を適用する形態素及び前記形態素の品詞のいずれか1つ以上を用いて前記修正方法を適用する形態素を定めることを特徴とする請求項3に記載の翻訳装置。   4. The translation according to claim 3, wherein the rule for determining the correction method determines a morpheme to which the correction method is applied using at least one of a morpheme to which the correction method is applied and a part of speech of the morpheme. apparatus. 前記取得手段は、前記節を構成する用言の基本的な形態である基本形を取得し、
前記翻訳手段は、前記第1の文を構成する活用した形態素の前記取得手段が取得した基本形に基づいて翻訳することを特徴とする請求項4のいずれかに記載の翻訳装置。
The acquisition means acquires a basic form that is a basic form of the prescription constituting the clause,
5. The translation apparatus according to claim 4, wherein the translation unit translates based on the basic form acquired by the acquisition unit of the utilized morpheme constituting the first sentence.
前記節を定める規則は、前記節を構成する用言の品詞を前記節の品詞と定め、
前記記憶手段は、前記第1の言語で表す第1の例文と、前記第1の例文を前記第2の言語へ翻訳した第2の例文とを、前記例文を構成する節の品詞に基づいて関連付けて記憶し、
前記翻訳手段は、前記検索手段が検索した節の前記規則が定める品詞に基づいて前記記憶手段が関連付けて記憶する前記第1の例文と前記第2の例文とを用いて翻訳することを特徴とする請求項5のいずれかに記載の翻訳装置。
The rules defining the clauses define the part of speech of the predicates constituting the clause as the part of speech of the clause,
The storage means includes a first example sentence expressed in the first language and a second example sentence obtained by translating the first example sentence into the second language, based on the part of speech of the clause constituting the example sentence. Remember and associate
The translation means translates using the first example sentence and the second example sentence stored in association with the storage means based on the part of speech defined by the rule of the clause searched by the search means. The translation device according to claim 5.
前記取得手段が取得した前記第1の文を構成する形態素と前記第1の例文を構成する形態素とに基づいて、前記第1の文と前記第1の例文とが類似する程度を表す指標を算出する算出手段と、
前記算出手段が算出した指標に基づいて前記記憶手段が記憶する第1の例文と第2の例文とを選択する選択手段とを更に備え、
前記翻訳手段は、前記選択手段が選択した第1の例文と第2の例文とを用いて翻訳することを特徴とする請求項6に記載の翻訳装置。
An index representing the degree of similarity between the first sentence and the first example sentence based on the morpheme constituting the first sentence and the morpheme constituting the first example sentence acquired by the acquisition unit. A calculating means for calculating;
A selection means for selecting a first example sentence and a second example sentence stored in the storage means based on the index calculated by the calculation means;
The translation apparatus according to claim 6, wherein the translation unit translates the first example sentence and the second example sentence selected by the selection unit.
前記記憶手段は、前記第1の言語で用いられる形態素と前記形態素の品詞とを関連付けて記憶し、
前記取得手段は、前記第1の入力文から取得した形態素と前記記憶手段が関連付けて記憶する品詞を取得し、
前記修正方法を定める規則は、前記修正方法に基づいて修正した前記形態素の品詞を定め、
修正した前記形態素は、前記記憶手段の記憶する品詞を前記取得手段が取得していない未得の形態素に接続する形態素、前記未得の形態素に付属する形態素、及び前記未得の形態素を目的語とする形態素のいずれか1つ以上であることを特徴とする請求項6又は7に記載の翻訳装置。
The storage means stores a morpheme used in the first language and a part of speech of the morpheme in association with each other,
The acquisition means acquires a morpheme acquired from the first input sentence and a part of speech stored in association with the storage means;
The rule for determining the correction method defines a part of speech of the morpheme corrected based on the correction method,
The modified morpheme includes a morpheme that connects a part of speech stored in the storage unit to an unacquired morpheme that is not acquired by the acquisition unit, a morpheme that is attached to the unobtained morpheme, and an object of the unacquired morpheme The translation device according to claim 6, wherein the translation device is any one or more of morphemes.
コンピュータを、
前記第1の言語で表す第1の文を構成する形態素及び前記形態素の品詞を形態素解析により取得する取得手段と、
自ら語の意味を表す自立語であると共に、活用により語の形態が変化する用言と、前記自立語である用言に付属する付属語及び前記用言に接続する接続語のいずれか1つ以上とが連結して少なくとも1つの意味を表す節の構成を、前記節から得られる形態素及び前記形態素の品詞のいずれか1つ以上を用いて定める規則を記憶すると共に、前記第1の言語で表す第1の例文と、前記第1の例文を前記第2の言語へ翻訳した第2の例文とを前記節に基づいて関連付けて記憶する記憶手段と、
前記記憶手段が記憶する節の構成を定める規則に基づいて、前記取得手段が取得した形態素から前記節を構成する形態素を検索する検索手段と、
前記検索手段が検索した形態素が構成する前記第1の言語で表す節に基づいて関連付けて前記記憶手段が記憶する前記第1の例文と前記第2の例文とを用いて、前記第1の文を第2の言語で表す第2の文に翻訳する翻訳手段として機能させることを特徴とする翻訳プログラム。
Computer
Acquisition means for acquiring a morpheme constituting the first sentence expressed in the first language and a part of speech of the morpheme by morphological analysis;
A self-supporting word that expresses the meaning of the word itself, and one of a predicate that changes the form of the word due to its use, an appendix attached to the self-supporting word, and a connection word connected to the word In the first language, the above is connected to store rules that define at least one meaning of the clause structure using at least one of the morpheme obtained from the clause and the part of speech of the morpheme. Storage means for storing a first example sentence to be represented and a second example sentence obtained by translating the first example sentence into the second language in association with each other based on the clause;
Search means for searching for a morpheme constituting the clause from morphemes acquired by the acquisition means, based on a rule that defines the configuration of the clause stored by the storage means;
The first sentence using the first example sentence and the second example sentence stored in the storage means in association with each other based on the clause expressed in the first language formed by the morpheme searched by the search means. A translation program that functions as a translation means for translating a text into a second sentence expressed in a second language.
JP2008068601A 2008-03-17 2008-03-17 Translation device and program Pending JP2009223704A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008068601A JP2009223704A (en) 2008-03-17 2008-03-17 Translation device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008068601A JP2009223704A (en) 2008-03-17 2008-03-17 Translation device and program

Publications (1)

Publication Number Publication Date
JP2009223704A true JP2009223704A (en) 2009-10-01

Family

ID=41240392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008068601A Pending JP2009223704A (en) 2008-03-17 2008-03-17 Translation device and program

Country Status (1)

Country Link
JP (1) JP2009223704A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598222A (en) * 2019-09-12 2019-12-20 北京金山数字娱乐科技有限公司 Language processing method and device, and training method and device of language processing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598222A (en) * 2019-09-12 2019-12-20 北京金山数字娱乐科技有限公司 Language processing method and device, and training method and device of language processing system
CN110598222B (en) * 2019-09-12 2023-05-30 北京金山数字娱乐科技有限公司 Language processing method and device, training method and device of language processing system

Similar Documents

Publication Publication Date Title
US7630880B2 (en) Japanese virtual dictionary
US8041557B2 (en) Word translation device, translation method, and computer readable medium
KR101500617B1 (en) Method and system for Context-sensitive Spelling Correction Rules using Korean WordNet
JP4319860B2 (en) Method and apparatus for developing a transfer dictionary for use in a transfer-based machine translation system
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JP2008276517A (en) Device and method for evaluating translation and program
CN110678868B (en) Translation support system, translation support apparatus, translation support method, and computer-readable medium
JP5007977B2 (en) Machine translation apparatus, machine translation method, and program
Siklósi et al. Context-aware correction of spelling errors in Hungarian medical documents
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
Scherrer et al. Natural Language Processing for the Swiss German Dialect Area.
Aasha et al. Machine translation from English to Malayalam using transfer approach
JP2010244385A (en) Machine translation device, machine translation method, and program
JP4078376B2 (en) Machine translation system and program
JP2009223704A (en) Translation device and program
JP2007206796A (en) Character processing system, method thereof, program thereof, and recording medium
JP2006127405A (en) Method for carrying out alignment of bilingual parallel text and executable program in computer
JP2009157900A (en) Parallel translation sentence extracting device and parallel translation sentence extracting method
JP2006024114A (en) Mechanical translation device and mechanical translation computer program
KR100322743B1 (en) Morphological analysis method and apparatus used in text-to-speech synthesizer
Debbarma et al. Morphological Analyzer for Kokborok
KR102143158B1 (en) Information processing system using Korean parcing
JP2004264960A (en) Example-based sentence translation device and computer program
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program
KR20130042822A (en) Translation apparatus and method using phrase level translation examples in a pattern-based machine translator