JP2015170094A - Translation device and translation method - Google Patents
Translation device and translation method Download PDFInfo
- Publication number
- JP2015170094A JP2015170094A JP2014044002A JP2014044002A JP2015170094A JP 2015170094 A JP2015170094 A JP 2015170094A JP 2014044002 A JP2014044002 A JP 2014044002A JP 2014044002 A JP2014044002 A JP 2014044002A JP 2015170094 A JP2015170094 A JP 2015170094A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- category
- sentence
- input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、文章を翻訳する翻訳装置及び翻訳方法に関する。 The present invention relates to a translation apparatus and a translation method for translating a sentence.
機械翻訳サービスは、言語の確からしさや、翻訳の確からしさを基に、最も適切さの度合いが高い翻訳結果を求めて訳文を生成している。特許文献1では、翻訳対象文の特徴を示す翻訳対象特徴ベクトルを作成すると共に専門分野文の特徴を示す専門分野特徴ベクトルを作成し、これらから翻訳対象文の各専門分野への帰属可能性を推定し、その推定に基づいて翻訳に適した専門辞書データを選択する技術が提案されている。 The machine translation service generates a translation by obtaining a translation result having the highest degree of appropriateness based on the certainty of the language and the certainty of the translation. In Patent Document 1, a translation target feature vector indicating the characteristics of the translation target sentence is created, and a specialized field feature vector indicating the characteristics of the specialized field sentence is created. A technique for estimating and selecting specialized dictionary data suitable for translation based on the estimation has been proposed.
しかしながら、翻訳対象となる各文章のみからでは、文章が属するカテゴリ(分野)を判断できず、十分に適切に翻訳を行えない場合がある。例えば、翻訳対象の文章が「お体の状態はいかがですか?」というものである場合を考える。本文章は、例えば、一般的な機械翻訳エンジンでは、「How is state of body?」等と翻訳される。しかしながら、上記の文章が、例えば、医療分野での会話に係るものであった場合、必ずしも上記の翻訳は適切ではない。上記の文章は、例えば、医療辞書データベースを有する翻訳エンジンでは、「How is condition of body?」等と翻訳される。このように、会話の背景によっては、一般的な機械翻訳エンジンより、特定の分野の辞書データベースを有する翻訳エンジンを用いて翻訳することが望ましい。しかし、上記の文章だけでは、医療分野に特化した翻訳を行えばよいかどうか十分に判断することは難しい。 However, the category (field) to which the sentence belongs cannot be determined only from each sentence to be translated, and the translation may not be performed adequately. For example, consider a case where a sentence to be translated is "How is your body?" The main body chapter is translated as “How is state of body?”, For example, in a general machine translation engine. However, if the above sentence relates to a conversation in the medical field, for example, the above translation is not necessarily appropriate. For example, the above sentence is translated as “How is condition of body?” Or the like in a translation engine having a medical dictionary database. Thus, depending on the background of conversation, it is desirable to translate using a translation engine having a dictionary database in a specific field rather than a general machine translation engine. However, it is difficult to sufficiently determine whether or not it is only necessary to perform translation specialized for the medical field by using the above sentence alone.
本発明は、上記の問題点に鑑みてなされたものであり、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、当該文章を適切に翻訳することができる翻訳装置及び翻訳方法を提供することを目的とする。 The present invention has been made in view of the above problems, and even when it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, the sentence is appropriately It is an object of the present invention to provide a translation apparatus and a translation method that can translate.
上記の目的を達成するために、本発明に係る翻訳装置は、カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、翻訳対象となる第1の言語による文章を入力する入力手段と、入力手段によって入力された文章に基づいて、当該文章のカテゴリを判定する判定手段と、判定手段によってカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報でカテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、判定手段によってカテゴリが判定されない場合には、カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新手段と、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力手段によって入力された文章を第1の言語から第2の言語に翻訳する翻訳手段と、翻訳手段によって翻訳された文章を出力する出力手段と、を備える。 In order to achieve the above object, a translation apparatus according to the present invention includes dictionary holding means for holding a plurality of dictionaries used for translation in association with a category, and category information for specifying a category of a sentence to be translated. A category information holding means for holding; an input means for inputting a sentence in a first language to be translated; a determining means for determining a category of the sentence based on a sentence input by the input means; and a determining means When the category is determined, the category information held by the category information holding unit is updated with the category information for specifying the determined category. When the category is not determined by the determining unit, the category information holding unit The update means that keeps the category information that is held, and the category information holding means Translation means for translating a sentence input by the input means from the first language to the second language using a dictionary associated with the category specified by the category information and held in the dictionary holding means. Output means for outputting a sentence translated by the translation means.
本発明に係る翻訳装置では、入力された翻訳対象の文章からカテゴリの判定が行われる。カテゴリの判定が行われた場合には、判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。一方、カテゴリの判定が行われなかった場合には、それ以前に入力された文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。即ち、本発明に係る翻訳装置では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本発明に係る翻訳装置によれば、上記の場合であっても、文章を適切に翻訳することができる。 In the translation apparatus according to the present invention, the category is determined from the input sentence to be translated. When the category is determined, translation is performed using a dictionary associated with the determined category. On the other hand, if the category is not determined, translation is performed using a dictionary associated with the category determined based on the sentence input before that. That is, in the translation device according to the present invention, even if it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, it is determined based on a series of sentences such as conversations. Translation is performed using a dictionary associated with the category. Therefore, according to the translation apparatus according to the present invention, it is possible to appropriately translate a sentence even in the above case.
判定手段は、機械学習により、入力手段によって入力された文章がカテゴリに属する度合いを推定し、当該度合いに基づいて当該文章のカテゴリを判定することとしてもよい。この構成によれば、カテゴリを判定できるか否かを含めて、適切にカテゴリを判定することができる。これにより、文章をより適切に翻訳することができる。 The determination means may estimate the degree to which the text input by the input means belongs to a category by machine learning, and determine the category of the text based on the degree. According to this configuration, it is possible to appropriately determine the category including whether or not the category can be determined. Thereby, a sentence can be translated more appropriately.
入力手段は、翻訳対象となる第2の言語による文章を入力し、翻訳手段は、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力手段によって入力された文章を第2の言語から第1の言語に翻訳する、こととしてもよい。この構成によれば、例えば、適切な翻訳が行われた上で、異なる言語での会話を可能とすることができる。 The input means inputs sentences in the second language to be translated, and the translation means is associated with the category specified by the category information held by the category information holding means and held in the dictionary holding means. The sentence input by the input means may be translated from the second language into the first language using the existing dictionary. According to this configuration, for example, a conversation in a different language can be performed after appropriate translation is performed.
翻訳手段は、翻訳対象となる文章を、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに応じて予め設定されたルールに基づいて変換し、変換した文章を翻訳することとしてもよい。この構成によれば、翻訳された文章をより適切なものとすることができる。 The translation unit may convert the sentence to be translated based on a rule set in advance according to the category specified by the category information held by the category information holding unit, and may translate the converted sentence. . According to this configuration, the translated sentence can be made more appropriate.
ところで、本発明は、上記のように翻訳装置の発明として記述できる他に、以下のように翻訳方法の発明としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。 By the way, the present invention can be described as an invention of a translation apparatus as described below, in addition to the invention of a translation apparatus as described above. This is substantially the same invention only in different categories, and has the same operations and effects.
即ち、本発明に係る翻訳方法は、カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、を備える翻訳装置の動作方法である翻訳方法であって、翻訳対象となる第1の言語による文章を入力する入力ステップと、入力ステップにおいて入力された文章に基づいて、当該文章のカテゴリを判定する判定ステップと、判定ステップにおいてカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報でカテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、判定ステップにおいてカテゴリが判定されない場合には、カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新ステップと、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力ステップにおいて入力された文章を第1の言語から第2の言語に翻訳する翻訳ステップと、翻訳ステップにおいて翻訳された文章を出力する出力ステップと、を含む。 That is, the translation method according to the present invention includes a dictionary holding unit that holds a plurality of dictionaries used for translation in association with a category, and a category information holding unit that holds category information for specifying a category of a sentence to be translated. A translation method that is an operation method of a translation apparatus comprising: an input step for inputting a sentence in a first language to be translated; and a category of the sentence based on the sentence input in the input step And when the category is determined in the determination step, the category information held by the category information holding means is updated with the category information for specifying the determined category, and the category is not determined in the determination step Keeps the category information held by the category information holding means. Using the dictionary stored in the dictionary holding unit in association with the category specified by the update step and the category information held by the category information holding unit, the sentence input in the input step is converted into the first language. A translation step for translating the text into the second language, and an output step for outputting the text translated in the translation step.
本発明では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本発明によれば、上記の場合であっても、文章を適切に翻訳することができる。 In the present invention, even if it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, it is associated with a category determined based on a series of sentences such as conversation. A dictionary is used for translation. Therefore, according to the present invention, even in the above case, the sentence can be appropriately translated.
以下、図面と共に本発明に係る翻訳装置及び翻訳方法の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。 Hereinafter, embodiments of a translation apparatus and a translation method according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.
図1に本実施形態に係る翻訳装置10を示す。翻訳装置10は、翻訳対象となる文章を入力し、当該文章を翻訳(機械翻訳)して、翻訳された文章を出力する装置である。即ち、翻訳装置10は、翻訳サービスを提供する装置である。例えば、翻訳装置10は、ユーザ端末20と移動体通信網あるいはインターネット等の通信網を介して接続されている。翻訳装置10は、ユーザ端末20から翻訳対象となる文章を受信し、ユーザ端末20に対して翻訳された文章を送信する。
FIG. 1 shows a
翻訳装置10は、複数の一連の文章を順次、翻訳する。また、翻訳装置10は、第1の言語による文章を第2の言語に翻訳すると共に、その逆の第2の言語による文章を第1の言語に翻訳することとしてもよい。例えば、翻訳装置10は、日本語による文章を英語に翻訳すると共に、英語による文章を日本語に翻訳することとしてもよい。具体的には、翻訳装置10は、図2に示すようなユーザ30a,30b同士の一連の会話を翻訳する。
The
ユーザ端末20は、通信網を介して翻訳装置10と通信を行うことができる装置であり、例えば、スマートフォン、携帯電話機又はPC(Personal Computer)に相当する。ユーザ端末20は、翻訳装置10との間でセッションを確立して、翻訳対象の文章を入力して翻訳装置10に送信する。また、ユーザ端末20は、文章をどの言語からどの言語に翻訳するかを示す翻訳方向情報(例えば、日本語から英語への翻訳であることを示す情報)を入力して、文章の送信と合わせて当該情報を翻訳装置10に送信することとしてもよい。ユーザ端末20と翻訳装置10とのセッションは、セッションID等で一意に識別され、翻訳装置10では、どのユーザ端末20から翻訳対象の文章が送信されたか把握することができる。
The
ユーザ端末20は、例えば、ユーザからの音声を入力し、音声を音声認識して文章とすることで翻訳対象の文章を入力する。音声認識は、従来から用いられている音声認識技術が用いられて行われる。あるいは、ユーザ端末20は、入力した音声を翻訳装置10に送信し、翻訳装置10側で音声認識が行われてもよい。あるいは、翻訳装置10とは別の音声認識サーバで音声認識が行われてもよい。その場合、ユーザ端末20は、音声認識サーバに音声を送信し、音声認識サーバから音声認識結果である文章を受信する。翻訳対象の文章は、音声による入力以外でも、ユーザがユーザ端末20のボタンを操作すること等によって入力されてもよい。
The
また、ユーザ端末20は、翻訳方向情報をユーザの操作に基づいて入力する。この入力は、例えば、図3に示すようなインタフェースにより行われる。図3は、ユーザ端末20が備えるタッチパネルの表示画面21を示している。この表示画面21には、翻訳方向情報を入力するためのボタン21a,21bが設けられている。例えば、ユーザが「話す」と記載されたボタン21aをタッチしてから発話すると、発話に基づく文章と共に日本語を英語に翻訳することを示す翻訳方向情報が入力される。また、ユーザが「Speak」と記載されたボタン21bをタッチしてから発話すると、発話に基づく文章と共に英語を日本語に翻訳することを示す翻訳方向情報が入力される。
Moreover, the
また、ユーザ端末20は、翻訳装置10から翻訳結果の文章を受信する。ユーザ端末20は、受信した翻訳結果の文章をタッチパネルの表示画面21に表示する。これにより、ユーザが翻訳結果を認識することができる。この際、図3に示すように、ユーザから入力された文章(翻訳対象の文章)21cと、当該文章の翻訳後の文章21dとを合わせて表示することとしてもよい。また、英語から日本語からの翻訳に関する文章を右側からの吹き出し21eの中に表示し、日本語から英語からの翻訳に関する文章を左側からの吹き出し21fの中に表示することとしてもよい。
Further, the
引き続いて、本実施形態に係る翻訳装置10の機能構成について説明する。図1に示すように翻訳装置10は、翻訳エンジン群11と、入力部12と、判定部13と、更新部15と、カテゴリ情報保持部14と、翻訳エンジン振り分け部16と、自動入力補正部17と、出力部18とを備えて構成される。これらの構成要素のうち、判定部13と、更新部15と、カテゴリ情報保持部14と、翻訳エンジン振り分け部16と、自動入力補正部17とは、カテゴリ推定・振り分けプログラムによって実現されることができる。
Subsequently, the functional configuration of the
翻訳エンジン群11は、翻訳装置10に入力された文章の翻訳処理を行う機能手段群である。翻訳エンジン群11は、複数の翻訳エンジン110a〜110d(翻訳エンジンA〜D)を含んで構成されている。後述するように翻訳装置10に入力された文章は、翻訳エンジン群11に含まれる複数の翻訳エンジン110(翻訳エンジン110a〜110dの総称)の何れかに入力される。各翻訳エンジン110は、入力した文章を翻訳して出力部18に出力する。
The
翻訳エンジン110は、処理部111(処理部111a〜111dの総称)と、翻訳辞書112(翻訳辞書112a〜112dの総称)とを備えて構成される。翻訳辞書112は、翻訳に用いられる辞書の情報を保持する辞書保持手段である。翻訳辞書112が保持する辞書の情報は、例えば、翻訳元の言語の単語と翻訳後の言語の単語との対応付けを示す情報であり、従来の機械翻訳で用いられる辞書と同様ものであってもよい。また、翻訳辞書112が保持する辞書は、翻訳エンジン110に応じたカテゴリに対応付けられている。カテゴリとは、翻訳対象の文章が属する分野(専門分野)を示すものであり、例えば、「医療」、「金融」、「科学(技術)」等がある。翻訳辞書112は、予め翻訳装置10の管理者等によって予め用意される。
The translation engine 110 includes a processing unit 111 (generic name for the processing units 111a to 111d) and a translation dictionary 112 (generic name for the
例えば、翻訳エンジン110a(翻訳エンジンA)が備える翻訳辞書112aは、特別の分野に係るカテゴリではなく、一般的な文章を翻訳するための基本翻訳辞書を保持する。なお、基本翻訳辞書を用いて翻訳した場合、言語の確からしさや、翻訳の確からしさを基に、最も確からしさの確率の高い翻訳結果である訳文を生成する。このため、医療、金融、科学技術等の専門性のある入力文の翻訳精度は必ずしも適切とは言えず、違和感のある翻訳結果となるおそれがある。
For example, the
翻訳エンジン110b(翻訳エンジンB)が備える翻訳辞書112bは、「医療」のカテゴリに係る医療翻訳辞書を保持する。翻訳エンジン110c(翻訳エンジンC)が備える翻訳辞書112cは、「金融」のカテゴリに係る金融翻訳辞書を保持する。翻訳エンジン110d(翻訳エンジンD)が備える翻訳辞書112dは、「科学」のカテゴリに係る科学翻訳辞書を保持する。
The translation dictionary 112b included in the
処理部111は、翻訳辞書112を用いて、翻訳エンジン110に入力された文章を第1の言語から第2の言語に翻訳する翻訳手段である。処理部111は、複数の言語間での翻訳(上記の第1の言語及び第2の言語の何れか一方、又は両方が複数である)が行えることとしてもよい。その場合、翻訳エンジン110には、翻訳対象の文章と合わせて翻訳方向情報も入力され、翻訳方向情報によって示される言語間の方向で翻訳が行われる。処理部111は、例えば、従来の機械翻訳と同様の技術により実現される。なお、処理部111は、翻訳エンジン110毎に異なるものであってもよいし、翻訳エンジン110間で共通化されていてもよい。 The processing unit 111 is a translation unit that translates the text input to the translation engine 110 from the first language to the second language using the translation dictionary 112. The processing unit 111 may perform translation between a plurality of languages (any one or both of the first language and the second language described above). In that case, translation direction information is also input to the translation engine 110 together with the text to be translated, and translation is performed in the direction between languages indicated by the translation direction information. For example, the processing unit 111 is realized by a technique similar to that of conventional machine translation. Note that the processing unit 111 may be different for each translation engine 110 or may be shared among the translation engines 110.
なお、各翻訳エンジン110は、必ずしも、翻訳装置10の各翻訳エンジン110以外の構成要素と同様の装置によって実現されている必要はない。各翻訳エンジン110と、翻訳装置10の各翻訳エンジン110以外の構成要素とは別体の装置として構成されていてもよい。即ち、翻訳装置10は、複数のコンピュータからなるコンピュータシステムによって構成されていてもよい。
Note that each translation engine 110 is not necessarily realized by a device similar to the constituent elements of the
入力部12は、翻訳対象となる文章を入力する入力手段である。具体的には、入力部12は、ユーザ端末20と翻訳装置10との間のセッションを確立して、当該セッションを介してユーザ端末20から翻訳対象となる文章を受信することで文章を入力する。翻訳装置10では、セッションIDによりセッションを把握することができ、これにより何れのユーザ端末20から情報を入力したかを把握することができる。また、上述したようにユーザ端末20から音声を受信して、当該音声を音声認識して文章を取得することとしてもよい。また、翻訳装置10が複数の翻訳を実行できる場合には、入力部12は、翻訳方向情報を入力することとしてもよい。翻訳方向情報には、翻訳対象の文章の言語(入力言語)を示す情報、及び翻訳後の文章の言語(翻訳言語)を示す情報が含まれる。本実施形態における以下の処理は、入力言語及び翻訳言語に基づいて行われる。即ち、翻訳前の文章に対しては入力言語毎の処理を行い、入力言語から翻訳言語への翻訳が行われる。入力部12は、当該情報も翻訳対象となる文章と合わせてユーザ端末20から受信する。入力部12は、入力した情報を判定部13に出力する。
The
判定部13は、入力部12から入力された文章に基づいて、当該文章のカテゴリを判定する判定手段である。例えば、判定部13は、機械学習により、入力部12から入力された文章がカテゴリに属する度合いを推定し、当該度合いに基づいて当該文章のカテゴリを判定する。本実施形態では、判定する文章のカテゴリを推定ラベルと呼ぶ。また、文章がカテゴリに属する度合いを確信度と呼ぶ。例えば、判定部13による判定によって、入力された文章である入力文が「内科はどちらですか?」というものであった場合、推定ラベルが「医療」、確信度が78%といった出力がなされる。
The
本実施形態に係る判定部13を実現するため、予めカテゴリに対応付いた文章を収集する。カテゴリに対応付けられた正解データ(サンプルデータ)として教師あり機械学習を行い、学習データベース(学習モデル)を得る。機械学習のロジックは、例えば、汎用SVM(Support Vector Machine)を用いることができる。判定部13は、入力部12から入力された文章を学習データベースに基づく識別器に入力して、当該識別器によってカテゴリを判定する。
In order to implement the
具体的には、判定部13は、入力部12から入力した入力文の形態素解析を行う。形態素解析は、汎用の形態素解析エンジンを活用して行うことができる。例えば、入力文が「病名を教えて」というものであった場合、「病院(名詞)/を(助詞)/教え(動詞)/て(助詞)」との形態素解析の結果が得られる。形態素解析の結果中の「/」は形態素の区切りであり、括弧は各形態素の品詞を示す。続いて、判定部13は、形態素解析結果から、各形態素についてSVMの入力データである素性IDを生成する。具体的には、判定部13は、各形態素を素性IDに変換する。判定部13は、形態素と素性IDとの対応関係を予め記憶しており、当該対応関係に基づいて上記の変形を行う。例えば、「病院」との形態素は素性IDを「1」に、「教え」との形態素は素性IDを「2」に変換する。
Specifically, the
判定部13は、得られたSVMの入力データを用いてSVMにより推定ラベル及び確信度を出力(生成)する。上記は、汎用のSVMエンジンロジックを活用して行うことができる。なお、複数の推定ラベルを推定するため、マルチクラスSVM推定を行ってもよいし、推定ラベル毎の学習データベースを用いることとしてもよい。判定部13は、判定結果を示す推定ラベル及び確信度を示す情報を更新部15に出力する。また、判定部13は、入力部12から入力された情報を翻訳エンジン振り分け部16に出力する。
The
なお、判定部13は、機械学習によって得られた学習データベースに基づく識別器を利用できればよく、必ずしも翻訳装置10において機械学習が行われる必要はない。その場合、翻訳装置10は上記の機械学習を行った装置から、学習データベースを示す情報を予め取得しておく。また、判定部13は、SVMにより上記の判定を行うこととしているが、その他の手法、例えば、パターン認識の手法等を用いることとしてもよい。また、判定部13は、上記の機械学習以外の方法によって、文章からカテゴリを判定してもよい。
Note that the
カテゴリ情報保持部14は、翻訳対象となる文章の推定ラベルを特定するカテゴリ情報を保持するカテゴリ情報保持手段である。具体的には、カテゴリ情報保持部14は、セッションIDとカテゴリ情報とを対応付けて保持する。カテゴリ情報保持部14は、更新部15からの更新の指示を受け付けて上記の情報の更新を行う。また、カテゴリ情報保持部14は、翻訳エンジン振り分け部16から翻訳エンジン振り分け部16から保持された情報の問い合わせを受け付け、カテゴリ情報を返信する。カテゴリ情報保持部14は、同一セッションIDに対して、予め設定された一定時間、情報の更新や問い合わせがない場合、セッション別に保持している情報を開放(消去)する。また、セッションが切断された場合にも同様に解放してもよい。
The category
更新部15は、判定部13によって推定ラベルが判定された場合には、判定された推定ラベルを特定するカテゴリ情報でカテゴリ情報保持部14によって保持されるカテゴリ情報を更新すると共に、判定部13によって推定ラベルが判定されない場合には、カテゴリ情報保持部14によって保持されるカテゴリ情報を保持させたままとする更新手段である。
When the
具体的には、更新部15は、判定部13から入力された推定ラベル及び確信度を示す情報に基づいて、判定部13によって推定ラベルが判定されているか否か(文章からのカテゴリの判定が可能であったか否か)を判断する。更新部15は、確信度と予め設定された閾値とを比較して上記の判断を行う。例えば、更新部15は、確信度が閾値を上回っていたら、判定部13によって推定ラベルが判定されていると判断する。更新部15は、確信度が閾値を下回っていたら、判定部13によって推定ラベルが判定されていない(文章が特定のカテゴリに属するものではない)と判断する。この判断を行うための閾値は、図4の確信度判定パターン表に示すように推定ラベル毎に設定されていてもよい。
Specifically, the
更新部15は、推定ラベルが判定されていると判断すると、当該推定ラベルを特定するカテゴリ情報をカテゴリ情報保持部14に入力して、カテゴリ情報保持部14に保持されるカテゴリ情報を更新する。この更新は、入力された文章に係るセッションIDに対応付けられて保持されているカテゴリ情報に対して行われる。カテゴリ情報保持部14に保持されるカテゴリ情報がなかった場合には、更新部15から入力されたカテゴリ情報が新たに保持される。更新部15は、推定ラベルが判定されていないと判断すると、カテゴリ情報の更新を行わない(この場合、特段の処理は行われない)。
When the
翻訳エンジン振り分け部16は、判定部13から入力された文章を翻訳する翻訳エンジン110の振り分けを行う翻訳手段の一機能である。翻訳エンジン振り分け部16は、カテゴリ情報保持部14によって保持されるカテゴリ情報に基づいて上記の振り分けを行う。この振り分けの処理は、更新部15による上記の処理が終了した後で行われる。
The translation
具体的には、翻訳エンジン振り分け部16は、図5の翻訳エンジン振り分けパターン表に示すような、推定ラベルと翻訳エンジン110を特定する翻訳エンジン番号とが対応付けられた情報を予め記憶している。また、図5に示すように、この情報には、入力言語及び翻訳言語の組み合わせも合わせて対応付けられていてもよい。翻訳エンジン振り分け部16は、判定部13から文章が入力されると、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報を参照する。具体的には、翻訳エンジン振り分け部16は、カテゴリ情報保持部14に対して、入力された文章に係るセッションIDと共にカテゴリ問い合わせ要求を行って、カテゴリ情報保持部14からカテゴリ情報を取得してもよい。翻訳エンジン振り分け部16は、図5の翻訳エンジン振り分けパターン表において、参照したカテゴリ情報によって示される推定ラベルに対応付けられている翻訳エンジン番号で特定される翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。なお、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報がない場合には、翻訳エンジン振り分け部16は、予め設定された翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。例えば、図5における推定ラベル「その他」に対応付けられた翻訳エンジン番号で特定される翻訳エンジン110(例えば、一般的な文章を翻訳するための翻訳辞書112aを備える翻訳エンジン110a(翻訳エンジンA))を振り分け先の翻訳エンジン110として決定する。
Specifically, the translation
また、判定部13から、翻訳方向情報として入力言語及び翻訳言語を示す情報が入力されている場合には、更にそれらの組み合わせに対応付けられている翻訳エンジン番号で特定される翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。
Further, when information indicating the input language and the translation language is input as the translation direction information from the
翻訳エンジン振り分け部16は、振り分け先の翻訳エンジン110に翻訳対象の文章を出力する。翻訳エンジン110が別の装置によって構成されている場合には、翻訳エンジン番号に翻訳エンジン110を構成するサーバのIPアドレスを対応付けておき、当該IPアドレス宛に翻訳対象の文章を送信する。また、翻訳エンジン番号自体をIPアドレスにしておいてもよい。また、翻訳エンジン振り分け部16は、翻訳方向情報として入力言語及び翻訳言語を示す情報を合わせて翻訳エンジン110に出力してもよい。
The translation
翻訳エンジン振り分け部16は、翻訳エンジン110に翻訳対象の文章を出力する前に自動入力補正部17に当該文章を補正させてもよい。その場合、翻訳エンジン振り分け部16は、自動入力補正部17による補正後の文章を翻訳エンジン110に出力する。
The translation
自動入力補正部17は、翻訳エンジン振り分け部16から入力した翻訳対象となる文章を、カテゴリ情報保持部14によって保持されるカテゴリ情報によって特定される推定ラベルに応じて予め設定されたルールに基づいて変換する翻訳手段の一機能である。
The automatic
入力文のカテゴリ推定がされた場合、適切な翻訳エンジン110を選択することが可能である。しかし、更にカテゴリ別に入力文を標準的な言い回しに補正し、翻訳エンジン110に入力することで、よりカテゴリ別に正確な翻訳結果を導出し、訳質を向上させることが可能である。例えば、図6に医療で頭が非常に痛いと主張する場合の入力文の例を示す。しかしながら、「頭痛でぎんぎんする」といった入力文のように、入力の形式によっては誤訳されてしまう。自動入力補正部17では、カテゴリに応じて入力文を標準的なフレーズに補正する。
When the category of the input sentence is estimated, an appropriate translation engine 110 can be selected. However, by further correcting the input sentence for each category into a standard wording and inputting it to the translation engine 110, it is possible to derive a more accurate translation result for each category and improve the translation quality. For example, FIG. 6 shows an example of an input sentence when it is claimed that the head is very painful in medical treatment. However, depending on the input format, it may be mistranslated, such as an input sentence such as “I'll be angry with a headache”. The automatic
自動入力補正部17は、推定ラベルと文章を変換(補正)するルールとが対応付けられた情報を予め記憶している。自動入力補正部17は、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報を参照する。自動入力補正部17は、参照したカテゴリ情報に対応付けられて記憶しているルールに従って文章の変換(補正)を行う。
The automatic
以下では、「医療」カテゴリにおける変換の例について説明する。自動入力補正部17は、まず、入力文から、入力文がカテゴリ内で何を意味しているかを示すPカテゴリを推定する。この推定には、例えば、Pカテゴリを推定するために予め機械学習によって作成された学習データベースが用いられる。機械学習に用いられる正解データ(サンプルデータ)としては、例えば、Pカテゴリに対応付けられた文章である。例えば、入力文に「〜が鈍く痛い」「〜が波打つように痛い」「〜が締め付けられるように痛い」「〜が割れるように痛い」とのフレーズが含まれている場合には、Pカテゴリは、「(病状・)痛み:高」と推定される。
Hereinafter, an example of conversion in the “medical” category will be described. First, the automatic
続いて、自動入力補正部17は、入力文から、Pカテゴリの対象を示すEカテゴリを推定する。自動入力補正部17は、予めPカテゴリ毎にEカテゴリの候補となる単語を辞書(E推定辞書)として記憶しておく。図7にE推定辞書の例を示す。図7に示す例では、「痛み:高」とのPカテゴリに対するEカテゴリの候補となる単語が対応付けられている。自動入力補正部17は、入力文中に、推定されたPカテゴリに対応付けられたEカテゴリの候補となる単語が含まれているか否か判断する。Eカテゴリの候補となる単語が含まれていた場合、自動入力補正部17は、当該単語を、Eカテゴリを示す単語として抽出する。例えば、図8に示すように入力文が「頭が鈍く痛い」、Pカテゴリが「痛み:高」だった場合、Eカテゴリは「頭」とされる。
Subsequently, the automatic
続いて、自動入力補正部17は、カテゴリ(推定ラベル)、Pカテゴリ及びEカテゴリから標準的なフレーズを生成する。入力文に基づいて、Pカテゴリの対象を示すEカテゴリを推定する。自動入力補正部17は、予めカテゴリ及びPカテゴリ毎に標準フレーズを記憶しておく。図9にカテゴリ及びPカテゴリ毎に記憶される標準フレーズの例を示す。記憶されている標準フレーズには、単語が入力される部分が含まれている。図9の例では、当該部分を「〜」で示す。
Subsequently, the automatic
自動入力補正部17は、上記によって決定(推定)されたカテゴリ及びPカテゴリの組み合わせに対応付けられて記憶される標準フレーズを抽出する。自動入力補正部17は、抽出した標準フレーズの単語が入力される部分に、Eカテゴリを挿入し、標準的なフレーズを完成させる。例えば、図10に示すように、カテゴリが「医療」、Pカテゴリが「痛み:高」、Eカテゴリが「頭」であった場合、抽出される標準フレーズは「〜が鋭く痛いです。」となり、生成される標準的なフレーズは「頭が鋭く痛いです。」となる。
The automatic
自動入力補正部17は、生成した標準的なフレーズを、補正後の文章として翻訳エンジン振り分け部16に出力する。このように入力文を標準的なフレーズに自動補正すると、(機械)翻訳エンジン110は、入力した意味に応じて最適な翻訳結果を出力することができる。また、このように自動補正を行った場合には、翻訳結果の文章と合わせて自動補正した文章をユーザ端末20に送信して、ユーザに自動補正した結果を通知することとしてもよい。
The automatic
出力部18は、翻訳エンジン110によって翻訳された文章を出力する出力手段である。具体的には、出力部18は、ユーザ端末20と翻訳装置10との間のセッションを介してユーザ端末20に翻訳後の文章を送信することで文章を出力する。ユーザ端末20によって受信された文章は、上述したようにユーザ端末20において表示等の出力が行われる。以上が、本実施形態に係る翻訳装置10の機能構成である。
The
図11に本実施形態に係る翻訳装置10のハードウェア構成を示す。図11に示すように翻訳装置10は、CPU(Central Processing Unit)101、主記憶装置であるRAM(RandomAccess Memory)102及びROM(Read Only Memory)103、通信を行うための通信モジュール104、並びにハードディスク等の補助記憶装置105等のハードウェアを備えるコンピュータを含むものとして構成される。これらの構成要素がプログラム等により動作することにより、上述した翻訳装置10の機能が発揮される。以上が、本実施形態に係る翻訳装置10の構成である。
FIG. 11 shows a hardware configuration of the
引き続いて、図12〜図14のフローチャートを用いて、本実施形態に係る翻訳装置10の動作方法(翻訳装置10で実行される処理)である翻訳方法を説明する。図12のフローチャートを用いて翻訳方法の全体について説明する。本処理では、まず、翻訳対象の文章である入力文が、ユーザ端末20から翻訳装置10に送信される。翻訳装置10では、入力部12によって入力文が受信される(S01、入力ステップ)。入力された文章は、入力部12から判定部13に出力される。
Subsequently, a translation method, which is an operation method of the
続いて、判定部13によって、入力文に基づいて推定ラベルの判定が行われる(S02、判定ステップ)。この判定処理を図13のフローチャートを用いて説明する。まず、入力文に対して形態素解析が実施される(S21)。続いて、形態素解析結果から、各形態素についてSVMの入力データである素性IDが生成される(S22)。続いて、得られたSVMの入力データが用いられてマルチクラスSVM推定が行われる(S23)。当該推定により得られた、推定ラベル及び確信度が出力(生成)される(S24)。推定ラベル及び確信度を示す情報は、判定部13から更新部15に出力される。また、入力部12から入力された情報は、判定部13から翻訳エンジン振り分け部16に出力される。
Subsequently, the
図12に戻り、続いて、更新部15によって、判定部13によって推定ラベルが判定されているか否かが判断される(S03、更新ステップ)。この判断は、具体的には、確信度と予め設定された閾値とが比較されて行われる。確信度が閾値を上回っていたら、推定ラベルが判定されていると判断される(S03のYES)。この場合、更新部15によって、当該推定ラベルを特定するカテゴリ情報がカテゴリ情報保持部14に入力されて、カテゴリ情報保持部14に保持されるカテゴリ情報が更新される(S04、更新ステップ)。一方で、確信度が閾値を下回っていたら、推定ラベルが判定されていないと判断される(S03のNO)。この場合は、上記の更新処理は行われない。
Returning to FIG. 12, subsequently, the updating
続いて(S04又はS03のNOの後)、翻訳エンジン振り分け部16から自動入力補正部17に入力文が出力される。続いて、自動入力補正部17によって、入力文が、カテゴリ情報保持部14によって保持されるカテゴリ情報によって特定される推定ラベルに応じて予め設定されたルールに基づいて補正(変換)される(S05、翻訳ステップ)。この補正処理を図14のフローチャートを用いて説明する。まず、機械学習によって作成された学習データベースに基づいて、入力文からPカテゴリが推定される(S51)。続いて、E推定辞書が用いられて、入力文からEカテゴリが推定される(S52)。続いて、予め記憶されたカテゴリ及びPカテゴリ毎の標準フレーズに基づいて、カテゴリ(推定ラベル)、Pカテゴリ及びEカテゴリから標準的なフレーズが、補正後の文章として生成される(S53)。補正後の文章は、自動入力補正部17から翻訳エンジン振り分け部16に出力される。
Subsequently (after NO in S04 or S03), the input sentence is output from the translation
図12に戻り、続いて、翻訳エンジン振り分け部16によって、カテゴリ情報保持部14によって保持されるカテゴリ情報に基づいて、翻訳対象の文章(補正後の文章)を翻訳する翻訳エンジン110の振り分けが行われる(S06、翻訳ステップ)。この振り分けは、予め記憶された、推定ラベルと翻訳エンジン番号とが対応付けられた情報に基づいて行われる。翻訳対象の文章(補正後の文章)は、翻訳エンジン振り分け部16から振り分け先の翻訳エンジン110に出力される。
Returning to FIG. 12, subsequently, the translation
続いて、振り分け先の翻訳エンジン110によって、文章が入力され、翻訳エンジン110が備える翻訳辞書112が用いられて当該文章の翻訳が行われる(S07、翻訳ステップ)。翻訳後の文章は、翻訳エンジン110から出力部18に出力される。続いて、出力部18によって、翻訳後の文章がユーザ端末20に対して送信される(S08、出力ステップ)。ユーザ端末20では、翻訳後の文章が受信されて、表示等のユーザが認識できる形式での出力が行われる。以上が、本実施形態に係る翻訳装置10で実行される処理である翻訳方法である。
Subsequently, the distribution destination translation engine 110 inputs a sentence, and the translation dictionary 112 provided in the translation engine 110 is used to translate the sentence (S07, translation step). The translated text is output from the translation engine 110 to the
上記の処理は、ユーザ端末20から入力文が送信される度に行われる。従って、一連の入力文に対して翻訳が行われる。上述したように本実施形態では、入力文からカテゴリの判定が行われる。カテゴリの判定が行われた場合には、判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。一方、カテゴリの判定が行われなかった(入力文が特定のカテゴリに属するものではないと判定された)場合には、それ以前の入力文に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。即ち、本実施形態では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本実施形態によれば、上記の場合であっても、文章を適切に翻訳することができる。医療、金融、科学技術等の専門性のある入力文の翻訳に適する、最適な翻訳エンジンを選択することが可能であり、翻訳結果の質を向上させることができる。また、特定のカテゴリの辞書を基本辞書とは独立に拡張できるため、コンシューマ向けの翻訳精度に影響を与えることがない。
The above process is performed every time an input sentence is transmitted from the
具体的には、図2に示す例のように、例えば、「頭が波打つように痛い」との文章によりカテゴリが「医療」と判定された後は、新たにカテゴリが判定される迄は「医療」の翻訳辞書が用いられて翻訳が行われる。従って、その後の「状態はいかがですか?」との、何れのカテゴリに属するか判定ができない文章であっても、「医療」の翻訳辞書が用いられて適切に翻訳が行われる。 Specifically, as in the example illustrated in FIG. 2, for example, after the category is determined as “medical” based on the sentence “the head hurts like undulating”, until the category is newly determined, Translation is performed using a medical dictionary. Accordingly, even if it is a sentence that cannot be determined as to which category, “How is the state?” After that, the “medical” translation dictionary is used for appropriate translation.
また、本実施形態のようにカテゴリの判定は、機械学習により行うこととしてもよい。この構成によれば、カテゴリを判定できるか否かを含めて、適切にカテゴリを判定することができる。これにより、文章をより適切に翻訳することができる。 Further, as in the present embodiment, the category determination may be performed by machine learning. According to this configuration, it is possible to appropriately determine the category including whether or not the category can be determined. Thereby, a sentence can be translated more appropriately.
また、本実施形態のように、第1の言語による文章を第2の言語に翻訳すると共に、その逆の第2の言語による文章を第1の言語に翻訳することとしてもよい。例えば、図2に示すように、一連の翻訳対象の文章に、日本語から英語へ翻訳する文章と日本語から英語へ翻訳する文章とが含まれていてもよい。この場合は、片方向でカテゴリ(例えば、「医療」)を判定した場合、逆方向への会話翻訳にも当該カテゴリ(例えば、「医療」)を自動で適用することができる。これにより、適切な翻訳が行われた上で、異なる言語での双方向での会話を可能とすることができる。なお、必ずしも逆方向への翻訳を行える必要はなく、片方向での翻訳のみを行えるものであってもよい。 Further, as in the present embodiment, the sentence in the first language may be translated into the second language, and the sentence in the opposite second language may be translated into the first language. For example, as shown in FIG. 2, a series of sentences to be translated may include a sentence translated from Japanese to English and a sentence translated from Japanese to English. In this case, when the category (for example, “medical”) is determined in one direction, the category (for example, “medical”) can be automatically applied to the conversation translation in the reverse direction. Thereby, it is possible to perform two-way conversation in different languages after appropriate translation. Note that it is not always necessary to perform translation in the reverse direction, and translation in only one direction may be performed.
また、本実施形態のように入力文の自動補正を行うこととしてもよい。この構成によれば、上述したように翻訳された文章をより適切なものとすることができる。但し、入力文を自動補正する必要がない場合については、必ずしも入力文の自動補正を行う必要はない。 Moreover, it is good also as performing an automatic correction | amendment of an input sentence like this embodiment. According to this configuration, the sentence translated as described above can be made more appropriate. However, when it is not necessary to automatically correct the input sentence, it is not always necessary to automatically correct the input sentence.
なお、本実施形態では、翻訳装置10は、ユーザ端末20と通信を行って入力文及び翻訳後の文章を送受信する構成となっていた。しかしながら、ユーザ端末20等のユーザに用いられる端末に、翻訳装置10の機能が備えられていてもよい。その場合、当該端末が本発明の一実施形態に係る翻訳装置となる。また、当該端末が、翻訳装置10の一部の機能を備えていてもよい。
In the present embodiment, the
また、本実施形態のようにカテゴリ情報の更新を行うのは、会話翻訳等の一定の場合のみに行われるようにしてもよい。この場合、当該一定の場合以外は、文章毎にカテゴリを判定して、判定したカテゴリに応じた翻訳を行う(本実施形態の場合、それ以前のカテゴリ判定の結果は利用しない)。会話翻訳である場合は、翻訳処理の前に会話翻訳である旨を翻訳装置10に入力することとしてもよい。あるいは、逆方向の翻訳要求が同一セッションIDで存在した場合(例えば、それ以前に日本語から英語への翻訳を行っており、英語から日本語への翻訳要求があった場合)に、会話翻訳であると設定してもよい。
Further, the category information may be updated as in the present embodiment only in certain cases such as conversation translation. In this case, except for the fixed case, the category is determined for each sentence, and translation according to the determined category is performed (in the case of the present embodiment, the previous category determination result is not used). In the case of conversational translation, it may be input to the
10…翻訳装置、11…翻訳エンジン群、110(110a〜110d)…翻訳エンジン、111(111a〜111d)…処理部、112(112a〜112d)…翻訳辞書、12…入力部、13…判定部、14…カテゴリ情報保持部、15…更新部、16…翻訳エンジン振り分け部、17…自動入力補正部、18…出力部、101…CPU、102…RAM、103…ROM、104…通信モジュール、105…補助記憶装置、20…ユーザ端末。
DESCRIPTION OF
Claims (5)
翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、
翻訳対象となる第1の言語による文章を入力する入力手段と、
前記入力手段によって入力された文章に基づいて、当該文章のカテゴリを判定する判定手段と、
前記判定手段によってカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報で前記カテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、前記判定手段によってカテゴリが判定されない場合には、前記カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新手段と、
前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力手段によって入力された文章を第1の言語から第2の言語に翻訳する翻訳手段と、
前記翻訳手段によって翻訳された文章を出力する出力手段と、
を備える翻訳装置。 Dictionary holding means for holding a plurality of dictionaries used for translation in association with categories;
Category information holding means for holding category information for specifying a category of a sentence to be translated;
An input means for inputting a sentence in a first language to be translated;
Determination means for determining a category of the sentence based on the sentence input by the input means;
When the category is determined by the determination unit, the category information held by the category information holding unit is updated with the category information that identifies the determined category, and the category is not determined by the determination unit. Updating means for keeping the category information held by the category information holding means;
Using the dictionary held in the dictionary holding means in association with the category specified by the category information held by the category information holding means, the sentence input by the input means is read from the first language. Translation means for translating into a second language;
Output means for outputting sentences translated by the translation means;
A translation device comprising:
前記翻訳手段は、前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力手段によって入力された文章を第2の言語から第1の言語に翻訳する、請求項1又は2に記載の翻訳装置。 The input means inputs a sentence in a second language to be translated,
The translation unit associates a sentence input by the input unit with a dictionary that is associated with the category specified by the category information held by the category information holding unit and is held by the dictionary holding unit. The translation device according to claim 1, wherein the translation device translates the second language into the first language.
翻訳対象となる第1の言語による文章を入力する入力ステップと、
前記入力ステップにおいて入力された文章に基づいて、当該文章のカテゴリを判定する判定ステップと、
前記判定ステップにおいてカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報で前記カテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、前記判定ステップにおいてカテゴリが判定されない場合には、前記カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新ステップと、
前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力ステップにおいて入力された文章を第1の言語から第2の言語に翻訳する翻訳ステップと、
前記翻訳ステップにおいて翻訳された文章を出力する出力ステップと、
を含む翻訳方法。 An operation method of a translation apparatus comprising: a dictionary holding unit that holds a plurality of dictionaries used in translation in association with a category; and a category information holding unit that holds category information that specifies a category of a sentence to be translated. A translation method,
An input step for inputting a sentence in a first language to be translated;
A determination step of determining a category of the sentence based on the sentence input in the input step;
When the category is determined in the determination step, the category information held by the category information holding unit is updated with the category information specifying the determined category, and when the category is not determined in the determination step An update step for keeping the category information held by the category information holding means;
Using the dictionary held in the dictionary holding unit in association with the category specified by the category information held by the category information holding unit, the sentence input in the input step is read from the first language. A translation step for translating into a second language;
An output step of outputting the sentence translated in the translation step;
Translation method including
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014044002A JP6306376B2 (en) | 2014-03-06 | 2014-03-06 | Translation apparatus and translation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014044002A JP6306376B2 (en) | 2014-03-06 | 2014-03-06 | Translation apparatus and translation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015170094A true JP2015170094A (en) | 2015-09-28 |
JP6306376B2 JP6306376B2 (en) | 2018-04-04 |
Family
ID=54202795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014044002A Active JP6306376B2 (en) | 2014-03-06 | 2014-03-06 | Translation apparatus and translation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6306376B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776583A (en) * | 2015-11-24 | 2017-05-31 | 株式会社Ntt都科摩 | Machine translation evaluation method and apparatus and machine translation method and equipment |
KR20190004790A (en) * | 2016-05-06 | 2019-01-14 | 이베이 인크. | Technique using meta information when translating an artificial neural network machine |
JP2019139629A (en) * | 2018-02-14 | 2019-08-22 | 株式会社Nttドコモ | Machine translation device, translation learned model and determination learned model |
JP2020501228A (en) * | 2016-11-04 | 2020-01-16 | グーグル エルエルシー | Implicit bridging of machine learning tasks |
KR20220105551A (en) * | 2021-01-20 | 2022-07-27 | 주식회사 한글과컴퓨터 | Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof |
JP2022188810A (en) * | 2021-06-10 | 2022-12-22 | Scalably株式会社 | Information processing apparatus and information processing program |
KR102628304B1 (en) * | 2023-06-29 | 2024-01-24 | 주식회사 멜로우컴퍼니 | Device for correcting original text of image using natural language processing processor |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273294A (en) * | 2000-03-27 | 2001-10-05 | Toshiba Corp | Method, system and server for translation, recording medium and information transmitting medium |
JP2002108858A (en) * | 2000-09-20 | 2002-04-12 | Internatl Business Mach Corp <Ibm> | Machine translation method, machine translation system and recording medium |
JP2002183134A (en) * | 2000-12-18 | 2002-06-28 | Logo Vista Corp | Translating device |
JP2003122748A (en) * | 2001-10-16 | 2003-04-25 | Chisso Corp | Automatic translation pre-processing system, pre- processing method, program for pre-processing or recording medium in which the same program is recorded |
JP2004280316A (en) * | 2003-03-14 | 2004-10-07 | Fuji Xerox Co Ltd | Field determination device and language processor |
-
2014
- 2014-03-06 JP JP2014044002A patent/JP6306376B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273294A (en) * | 2000-03-27 | 2001-10-05 | Toshiba Corp | Method, system and server for translation, recording medium and information transmitting medium |
JP2002108858A (en) * | 2000-09-20 | 2002-04-12 | Internatl Business Mach Corp <Ibm> | Machine translation method, machine translation system and recording medium |
JP2002183134A (en) * | 2000-12-18 | 2002-06-28 | Logo Vista Corp | Translating device |
JP2003122748A (en) * | 2001-10-16 | 2003-04-25 | Chisso Corp | Automatic translation pre-processing system, pre- processing method, program for pre-processing or recording medium in which the same program is recorded |
JP2004280316A (en) * | 2003-03-14 | 2004-10-07 | Fuji Xerox Co Ltd | Field determination device and language processor |
Non-Patent Citations (2)
Title |
---|
河合 敦夫: "意味属性の学習結果にもとづく文書自動分類方式", 情報処理学会論文誌, vol. 第33巻第9号, JPN6017026857, 15 September 1992 (1992-09-15), JP, pages 1114 - 1122, ISSN: 0003602956 * |
鈴木 伸哉 外3名: "ドメイン依存知識を動的に切り替える固有表現抽出手法について", 言語処理学会第8回年次大会発表論文集 PROCEEDINGS OF THE EIGHTH ANNUAL MEETING OF THE ASSOCIATION FO, JPN6017026859, 18 March 2002 (2002-03-18), JP, pages 1 - 4, ISSN: 0003602957 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776583A (en) * | 2015-11-24 | 2017-05-31 | 株式会社Ntt都科摩 | Machine translation evaluation method and apparatus and machine translation method and equipment |
JP2017097882A (en) * | 2015-11-24 | 2017-06-01 | 株式会社Nttドコモ | Machine translation evaluation method and device, and machine translation method and device |
KR102463567B1 (en) * | 2016-05-06 | 2022-11-07 | 이베이 인크. | Using meta-information in neural machine translation |
KR20220017001A (en) * | 2016-05-06 | 2022-02-10 | 이베이 인크. | Using meta-information in neural machine translation |
US11783197B2 (en) | 2016-05-06 | 2023-10-10 | Ebay Inc. | Using meta-information in neural machine translation |
KR102206588B1 (en) * | 2016-05-06 | 2021-01-22 | 이베이 인크. | Techniques for using meta information in machine translation of artificial neural networks |
KR20210019562A (en) * | 2016-05-06 | 2021-02-22 | 이베이 인크. | Using meta-information in neural machine translation |
US11238348B2 (en) | 2016-05-06 | 2022-02-01 | Ebay Inc. | Using meta-information in neural machine translation |
KR102357322B1 (en) * | 2016-05-06 | 2022-02-08 | 이베이 인크. | Using meta-information in neural machine translation |
KR20190004790A (en) * | 2016-05-06 | 2019-01-14 | 이베이 인크. | Technique using meta information when translating an artificial neural network machine |
JP2020501228A (en) * | 2016-11-04 | 2020-01-16 | グーグル エルエルシー | Implicit bridging of machine learning tasks |
JP7122835B2 (en) | 2018-02-14 | 2022-08-22 | 株式会社Nttドコモ | Machine translation device, translation trained model and judgment trained model |
JP2019139629A (en) * | 2018-02-14 | 2019-08-22 | 株式会社Nttドコモ | Machine translation device, translation learned model and determination learned model |
KR20220105551A (en) * | 2021-01-20 | 2022-07-27 | 주식회사 한글과컴퓨터 | Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof |
KR102523806B1 (en) * | 2021-01-20 | 2023-04-21 | 주식회사 한글과컴퓨터 | Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof |
JP2022188810A (en) * | 2021-06-10 | 2022-12-22 | Scalably株式会社 | Information processing apparatus and information processing program |
KR102628304B1 (en) * | 2023-06-29 | 2024-01-24 | 주식회사 멜로우컴퍼니 | Device for correcting original text of image using natural language processing processor |
Also Published As
Publication number | Publication date |
---|---|
JP6306376B2 (en) | 2018-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6306376B2 (en) | Translation apparatus and translation method | |
JP7063932B2 (en) | Appropriate agent automation assistant call | |
US11915692B2 (en) | Facilitating end-to-end communications with automated assistants in multiple languages | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US9317501B2 (en) | Data security system for natural language translation | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US11295092B2 (en) | Automatic post-editing model for neural machine translation | |
JP2017058673A (en) | Dialog processing apparatus and method, and intelligent dialog processing system | |
CN112262430A (en) | Automatically determining language for speech recognition of a spoken utterance received via an automated assistant interface | |
US11093110B1 (en) | Messaging feedback mechanism | |
KR20130123037A (en) | Apparatus and method for providing two-way automatic interpretation and tranlating service | |
CN106713111B (en) | Processing method for adding friends, terminal and server | |
US11942091B2 (en) | Alphanumeric sequence biasing for automatic speech recognition using a grammar and a speller finite state transducer | |
JP2018197924A (en) | Information processing apparatus, interactive processing method, and interactive processing program | |
KR20190074508A (en) | Method for crowdsourcing data of chat model for chatbot | |
KR20210051523A (en) | Dialogue system by automatic domain classfication | |
JP5901694B2 (en) | Dictionary database management device, API server, dictionary database management method, and dictionary database management program | |
JP2010257085A (en) | Retrieval device, retrieval method, and retrieval program | |
JP6985311B2 (en) | Dialogue implementation programs, devices and methods that control response utterance generation by aizuchi determination | |
US12039286B2 (en) | Automatic post-editing model for generated natural language text | |
JP7406921B2 (en) | Information processing device, information processing method and program | |
JP6298806B2 (en) | Speech translation system, control method therefor, and speech translation program | |
Accame et al. | Transliteration of Contact Names and/or Other Data Using an Automated Assistant | |
JP2023007014A (en) | Response system, response method, and response program | |
JP2023171109A (en) | Learning device, estimation device, learning method, estimation method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6306376 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |