JP2018005368A - Output mode determination system - Google Patents
Output mode determination system Download PDFInfo
- Publication number
- JP2018005368A JP2018005368A JP2016128444A JP2016128444A JP2018005368A JP 2018005368 A JP2018005368 A JP 2018005368A JP 2016128444 A JP2016128444 A JP 2016128444A JP 2016128444 A JP2016128444 A JP 2016128444A JP 2018005368 A JP2018005368 A JP 2018005368A
- Authority
- JP
- Japan
- Prior art keywords
- input
- sentence
- input sentence
- output mode
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、翻訳結果の出力態様を決定する出力態様決定システムに関する。 The present invention relates to an output mode determination system that determines an output mode of a translation result.
特許文献1には、入力文の翻訳文を表示する際、入力文に含まれる単語の翻訳結果を順番に出力した後、入力文に含まれるすべての単語の翻訳結果を出力する翻訳装置が開示されている。この翻訳装置によれば、翻訳処理の途中であっても単語の翻訳結果が出力されるので、すべての単語の翻訳結果が出力されるまで待たずとも会話を進めることができる可能性がある。
入力文の情報を過不足なく伝えるという観点からは、入力文全体についての翻訳結果を出力することが好ましい。しかし、たとえば、入力文が長いと翻訳文の内容を把握するのに時間が掛かり、入力文の内容が複雑だと翻訳精度が低下する。入力文に含まれる単語についての翻訳結果を出力すれば、翻訳結果の把握に掛かる時間の短縮、翻訳精度の向上が期待できる。ただしこの場合には、入力文の情報を過不足なく伝えることができない可能性がある。 From the viewpoint of transmitting information of the input sentence without excess or deficiency, it is preferable to output the translation result for the entire input sentence. However, for example, if the input sentence is long, it takes time to grasp the contents of the translated sentence. If the contents of the input sentence are complicated, the translation accuracy decreases. If the translation result for the words included in the input sentence is output, it can be expected to shorten the time required for grasping the translation result and improve the translation accuracy. However, in this case, there is a possibility that information of the input sentence cannot be transmitted without excess or deficiency.
このように入力文全体についての翻訳結果を出力する場合と、入力文に含まれる単語についての翻訳結果を出力する場合とでは、それぞれメリット、デメリットがあり、いずれの出力態様が適切であるかは、状況によって異なる。特許文献1に記載された翻訳装置は、入力文に含まれる単語の翻訳結果を順番に出力した後に、入力文に含まれるすべての単語の翻訳結果を出力する。この場合、適切でない方の出力態様での翻訳結果も必ず出力されてしまう。そのため、翻訳結果の把握に必ずしも適切な出力になっていない。
There are advantages and disadvantages in the case of outputting the translation result for the entire input sentence and the case of outputting the translation result for the words included in the input sentence as described above. Which output mode is appropriate? It depends on the situation. The translation apparatus described in
本発明は、上記課題に鑑みてなされたものであり、翻訳における適切な出力態様を決定することが可能な出力態様決定システムを提供することである。 This invention is made | formed in view of the said subject, and is providing the output mode determination system which can determine the suitable output mode in translation.
本発明の一態様に係る出力態様決定システムは、翻訳の対象である入力文を入力する入力手段と、入力文に含まれる単語についての翻訳結果を出力する単語出力、および、入力文全体についての翻訳結果を出力する文出力、のいずれの出力が行われるべきかを、入力手段によって入力された入力文に基づいて決定する決定手段と、を備える。 An output mode determination system according to an aspect of the present invention includes an input unit that inputs an input sentence to be translated, a word output that outputs a translation result for a word included in the input sentence, and an entire input sentence Determining means for determining which output of the sentence output for outputting the translation result is to be performed based on the input sentence input by the input means;
翻訳結果の出力態様として、単語出力が適切であるか文出力が適切であるかは、翻訳の対象である入力文の特徴に依存し得る。上記の出力態様決定システムでは、単語出力および文出力のいずれの出力が行われるべきかが入力文に基づいて決定される。よって、適切な出力態様を決定することができる。 Whether the word output is appropriate or the sentence output is appropriate as the output form of the translation result may depend on the characteristics of the input sentence to be translated. In the output mode determination system, it is determined based on the input sentence which of the word output and the sentence output should be performed. Therefore, an appropriate output mode can be determined.
出力態様決定システムは、決定手段の決定結果に従って入力手段によって入力された入力文を翻訳する翻訳手段と、翻訳手段による翻訳結果を出力する出力手段をさらに備えてもよい。これにより、適切な出力態様での翻訳結果を出力することができる。 The output mode determination system may further include a translation unit that translates the input sentence input by the input unit according to the determination result of the determination unit, and an output unit that outputs the translation result by the translation unit. Thereby, the translation result in an appropriate output mode can be output.
出力態様決定システムは、入力手段によって過去に入力された入力文を記憶する記憶手段をさらに備え、決定手段は、入力手段によって入力された入力文と、記憶手段に記憶された過去に入力された入力文とを比較し、その比較結果に基づいて決定を行ってもよい。これにより、入力文が過去の入力文と比較してどのような文であるかという入力文の特徴に基づいて上述の決定を行うことができる。また、入力文が入力されるたびに、予め定められた文として記憶手段に記憶される文の数が増加する。その結果、より多くの種類の予め定められた入力文を上述の比較に用いることで、より適切な比較結果を得ることができるようになる。 The output mode determination system further includes storage means for storing an input sentence input in the past by the input means, and the determination means inputs the input sentence input by the input means and the past input stored in the storage means. The input sentence may be compared and a determination may be made based on the comparison result. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence such as what kind of sentence the input sentence is compared with the past input sentence. Each time an input sentence is input, the number of sentences stored in the storage unit as a predetermined sentence increases. As a result, more appropriate comparison results can be obtained by using more types of predetermined input sentences for the above-described comparison.
決定手段は、入力文に含まれる単語の品詞を特定し、その特定結果に基づいて決定を行ってもよい。これにより、入力文にどのような品詞の単語が含まれているかという入力文の特徴に基づいて上述の決定を行うことができる。 The determining means may identify a part of speech of a word included in the input sentence and make a determination based on the identification result. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence such as what kind of part of speech is included in the input sentence.
決定手段は、入力文が予め定められた品詞の単語から構成されているか否かに応じて決定を行ってもよい。これにより、入力文がどのような品詞の単語から構成されているかという入力文の特徴に基づいて上述の決定を行うことができる。 The determining means may make a determination depending on whether or not the input sentence is composed of words having a predetermined part of speech. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence, such as what kind of part of speech the input sentence is composed of.
決定手段は、入力手段によって入力された入力文全体についての翻訳結果を取得し、さらに、取得した翻訳結果の入力文の言語への再翻訳結果を取得し、入力手段によって入力された入力文と、取得した再翻訳結果との類似度を算出し、算出した類似度に基づいて決定を行ってもよい。これにより、翻訳および再翻訳がされた場合に入力文と再翻訳文との類似度がどの程度であるかという入力文の特徴に基づいて上述の決定を行うことができる。 The determining means acquires a translation result for the entire input sentence input by the input means, further acquires a retranslation result of the acquired translation result into the language of the input sentence, and the input sentence input by the input means Alternatively, the similarity with the acquired retranslation result may be calculated, and the determination may be performed based on the calculated similarity. Thereby, when translation and retranslation are carried out, the above-mentioned determination can be made based on the characteristics of the input sentence such as the degree of similarity between the input sentence and the retranslated sentence.
本発明によれば、入力文の特徴から、翻訳における適切な出力態様を決定することが可能になる。 According to the present invention, it is possible to determine an appropriate output mode in translation from the characteristics of an input sentence.
以下、本発明の実施形態について、図面を参照しながら説明する。なお、図面の説明において同一要素には同一符号を付し、重複する説明は省略する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant descriptions are omitted.
初めに、実施形態に係る出力態様決定システムの概要を説明する。出力態様決定システムは、入力文を入力文の言語とは別の言語へ翻訳する際の翻訳結果の出力態様を決定する。翻訳結果の出力態様としては、単語出力および文出力がある。単語出力では、入力文に含まれる単語についての翻訳結果が出力される。この場合の翻訳は、単語ごと(単語単位の)翻訳(単語翻訳)である。文出力では、入力文全体についての翻訳結果が出力される。この場合の翻訳は、翻訳前の文全体の意味と、翻訳後の文全体の意味とが一致するように行われる翻訳(文翻訳)である。出力態様決定システムは、翻訳の対象となる入力文の翻訳結果の出力態様として単語出力および文出力のいずれの出力態様がより適切であるかを決定する。 First, an outline of the output mode determination system according to the embodiment will be described. The output mode determination system determines the output mode of the translation result when the input sentence is translated into a language different from the language of the input sentence. As output modes of translation results, there are word output and sentence output. In the word output, the translation result for the word included in the input sentence is output. The translation in this case is a word-by-word (word unit) translation (word translation). In the sentence output, the translation result for the entire input sentence is output. Translation in this case is translation (sentence translation) performed so that the meaning of the whole sentence before translation matches the meaning of the whole sentence after translation. The output mode determination system determines which output mode of word output or sentence output is more appropriate as the output mode of the translation result of the input sentence to be translated.
図1は、出力態様決定システムの決定結果に従う翻訳結果の出力態様の例を示す図である。図2は、翻訳システムの概略構成を示す図である。図1に示される例では、入力文の言語(以下、「入力言語」と言う場合もある)が英語であり、翻訳結果の言語(以下、「翻訳言語」という場合もある)が日本語である。入力言語および翻訳言語(この例では英語および日本語)の指定は、端末装置60の取得部62(後述)がユーザ操作を受け付けることによって行われてよい。
FIG. 1 is a diagram illustrating an example of an output mode of a translation result according to a determination result of the output mode determination system. FIG. 2 is a diagram showing a schematic configuration of the translation system. In the example shown in FIG. 1, the language of the input sentence (hereinafter also referred to as “input language”) is English, and the language of the translation result (hereinafter also referred to as “translation language”) is Japanese. is there. The designation of the input language and the translation language (English and Japanese in this example) may be performed when an acquisition unit 62 (described later) of the
まず、端末装置60について説明する。図2に示されるように、端末装置60は、その機能ブロックとして、通信部61と、取得部62と、表示部63とを含む。
First, the
通信部61は、出力態様決定システム1の決定装置10の通信部11と通信を行う部分である。通信部61は、後述の取得部62によって取得された入力文を通信部11に送信する。また、通信部61は、出力態様決定システム1によって決定された出力態様に従う翻訳結果を、通信部11から受信する。
The
取得部62は、入力文を取得する部分である。たとえば、ユーザUが発した音声から、入力文が取得される。その場合には、取得部62は、ユーザUが発した音声に対して音声認識処理を実行することによって、ユーザUが発した音声を文字情報に変換し、変換後の文字情報を入力文として取得する。文字情報の例はテキストデータである。音声を文字情報に変換するために、取得部62は、ユーザUが発した音声に対して音声認識処理を実行可能に構成される。音声認識処理の手法はとくに限定されず公知の種々の手法を用いてよい。なお、入力部の取得は、上述のような音声認識処理を用いた手法に限定されない。たとえば、ユーザUが端末装置60を操作して文字情報を入力した場合には、その文字情報が入力文として取得される。その際、予め用意された文字情報が選択されることによって、文字情報が入力されてもよい。取得部62は、ユーザUによる端末装置60の操作(ユーザ操作)を受け付ける部分でもある。
The
表示部63は、翻訳結果を出力する(表示する)部分である。表示部63による翻訳結果の出力の例は、次に端末装置60の動作概要を説明した後に、図1を参照して説明する。表示部63は、タッチパネルで構成されていてもよく、その場合、表示部63がユーザ操作を受け付けることもできる。
The
端末装置60の動作概要を説明する。まず、端末装置60において、出力態様決定システム1の機能を利用するためのアプリケーションが起動されているものとする。端末装置60の取得部62によって取得された入力文は、通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、出力態様決定システム1において利用可能になる。このとき、入力文とともに、入力言語および翻訳言語を指定するための言語情報(この例では、入力言語が英語であり、翻訳言語が日本語であることを特定するための情報)も、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。出力態様決定システム1では、後に図2以降を参照して詳述する原理により、入力文の翻訳結果の出力態様が決定され、当該出力態様に従う翻訳結果が作成される。出力態様の決定結果および翻訳結果は、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。端末装置60の通信部61が受信した決定結果に従って、表示部63が、翻訳結果を表示する。
An outline of the operation of the
具体的に、図1の左側には、翻訳結果の出力態様が文出力である場合の、表示部63による表示結果の例が示される。この例では、ユーザUが端末装置60に対して「Excuse me」という英語の音声V1を発する(発話を行う)。すると、その翻訳結果が、画面D1のように表示される。具体的に、画面D1には、入力文である「Excuse me」という英文の全体についての翻訳結果である「すみません」という日本語の文が、入力文とともに表示される。
Specifically, an example of a display result by the
図1の右側には、翻訳結果の出力態様が単語出力である場合の、表示部63による表示結果の例が示される。この例では、ユーザUが端末装置60に対して「Can’t I buy the goods first and come back with my passport later?」という英語の音声V2を発する。すると、その翻訳結果が、画面D2のように表示される。具体的に、画面D2には、入力文である「Can’t I buy the goods first and come back with my passport later?」という英文に含まれる単語のうちの、「Buy」、「Goods」、「Comeback」、「With」、「Passport」、「Later」という単語についてのそれぞれの翻訳結果である「買う」、「商品」、「戻る」、「一緒に」、「パスポート」、「後程」という日本語の単語が、入力文に含まれる上述の単語とともに表示される。なお、単語出力において出力される単語は、複数の単語で構成されるフレーズであってもよい。この例では、「Come Back」という「Come」および「Back」の2つの単語で構成されるフレーズが出力されている。このように予め設定された特定の複数の単語で構成されるフレーズも、単語として扱うこととしてもよい。
The right side of FIG. 1 shows an example of a display result by the
本実施形態では、画面D2に表示されている単語のうち、一部の単語が削除されてもよい。たとえば、ユーザUは、画面D2に表示する必要のない単語を選択することによって、選択した単語を画面D2から削除することができる。画面D2が表示部63のタッチパネルによって表示されている場合には、ユーザUは、画面D2に表示された単語をスワイプすることによってその単語を画面D2から削除することができる。削除された単語の情報は、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、出力態様決定システム1において利用可能となる。この削除された単語の情報の用途については詳述する。
In the present embodiment, some of the words displayed on the screen D2 may be deleted. For example, the user U can delete a selected word from the screen D2 by selecting a word that does not need to be displayed on the screen D2. When the screen D2 is displayed on the touch panel of the
また、画面D2に表示されている単語のうちの重要な単語を、表示部63が強調表示してもよい。強調表示の例は、文字の書式や色の変更などであってよい。いずれの単語が重要な単語であり強調表示されるべきであるかは、後述の原理により出力態様決定システム1において決定され、出力態様の決定結果および翻訳結果とともに、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。
Further, the
次に、図2を参照して、出力態様決定システム1の詳細について説明する。出力態様決定システム1は、決定装置10と、形態素解析器20と、単語抽出装置30と、機械翻訳装置40と、ログDB50とを含む。
Next, the details of the output
出力態様決定システム1では、決定装置10が、形態素解析器20、単語抽出装置30、機械翻訳装置40及びログDB50と協働することによって、翻訳結果の出力態様を入力文に基づいて決定する。決定装置10、形態素解析器20、単語抽出装置30、機械翻訳装置40およびログDB50の各要素は、要素間で互いに情報を送受信可能なように構成されている。
In the output
決定装置10は、その機能ブロックとして、通信部11と、品詞数取得部12と、ログ一致数取得部13と、類似度取得部14と、出力態様選択部15とを含む。
The
通信部11は、翻訳の対象である入力文を入力する部分(入力手段)である。具体的に、通信部11は、端末装置60の通信部61と通信を行い、端末装置60から送信される入力文(ユーザUが発した音声に対応する文字情報)および言語情報(入力言語および翻訳言語を指定するための情報)を受信する。
The
通信部11は、受信した入力文に基づいて出力態様決定システム1によって決定された出力態様に従う翻訳結果を、端末装置60の通信部61に送信して出力する部分(出力手段)でもある。
The
通信部11によって入力された入力文および言語情報は、まず、決定装置10から形態素解析器20に送られる。形態素解析器20は、決定装置10から送られた入力文に対して、入力言語での形態素解析を実行する。形態素解析の手法はとくに限定されず公知の種々の手法を用いてよい。形態素解析が実行されることにより、入力文を構成する単語および各単語の品詞が特定される。この特定結果(形態素解析による解析結果)は、形態素解析器20から決定装置10に送られる。
The input sentence and language information input by the
形態素解析器20から送られた解析結果を用いて、決定装置10では、品詞数取得部12、ログ一致数取得部13および類似度取得部14が、入力文をさらに解析する。この解析は、入力文がどのような特徴を有しているかということを特定するための解析である。これは、翻訳結果の出力態様として、単語出力および文出力のいずれの出力態様がより適切であるかは、入力文の特徴に依存し得る、という知見に基づいて行われるものである。品詞数取得部12、ログ一致数取得部13および類似度取得部14による入力文の解析は、記憶手段としてのログDB50に記憶されたデータテーブルを用いて行われるので、ここでまず、ログDB50について説明する。
Using the analysis result sent from the
図3は、ログDB50に記憶されるデータテーブルの例を示す図である。このデータテーブル50aは、「発話日時」と、「入力文」と、「出力態様」と、「過去の発話回数」と、「機械翻訳文」と、「再翻訳文」と、「入力文‐再翻訳文類似度」とを対応付けて記述している。
FIG. 3 is a diagram illustrating an example of a data table stored in the
「発話日時」は、入力文が入力された日時である。この日時は、端末装置60の取得部62がユーザUの発話を取得した日時であってもよいし、決定装置10の通信部11が端末装置60の通信部61から送信された入力文を受信した日時であってもよい。発話日時の情報は、たとえば決定装置10の通信部11からログDB50に送られることによって、データテーブル50aに追加される。
“Speaking date” is the date and time when the input sentence was input. This date and time may be the date and time when the
なお、データテーブル50aに記述される入力文は、端末装置60のユーザUの発話に対応する入力文に限定されない。出力態様決定システム1を利用可能な端末装置は端末装置60の他にも多く存在し、それら複数の端末装置のそれぞれのユーザの発話に対応する入力文が、データテーブル50aに集約され得る。その場合、データテーブル50aは、さらに、各発話日時における入力文と、ユーザ(たとえばユーザの携帯している端末装置の識別子)とを対応付けて記述する。これにより、データテーブル50aは、「発話日時」、「入力文」などの各項目を、ユーザごとに記述することもできる。
The input sentence described in the data table 50 a is not limited to the input sentence corresponding to the utterance of the user U of the
データテーブル50aにおける「入力文」は、これまでに(過去に)通信部11によって入力された入力文である。この例では入力言語は日本語であり、「いらっしゃいませ」などの日本語が入力文となっている。入力文の情報は、たとえば決定装置10の通信部11からログDB50に送られることによって、データテーブル50aに追加される。
The “input sentence” in the data table 50a is an input sentence that has been input by the
「出力態様」は、対応する入力文に基づいて出力態様決定システム1により決定された翻訳結果の出力態様(文出力または単語出力)を示す。なお、図中、「文」は文出力を、「単語」は単語出力を意味している。出力態様の情報は、たとえば決定装置10の出力態様選択部15(後述)からログDB50に送られることによって、データテーブル50aに追加される。
The “output mode” indicates the output mode (sentence output or word output) of the translation result determined by the output
「過去の発話回数」は、対応する入力文と一致する文が、過去に通信部11によって入力された回数を示す。過去の発話回数の情報は、通信部11によって入力された入力文と一致する文がデータテーブル50aに入力文として存在しない場合には当該入力文がはじめて入力されたものであるとして「1」に設定される。一致する文がすでにデータテーブル50aに入力文として存在している場合には、すでに存在している入力文の過去の発話回数にさらに1を加えた値に設定される。
“Past number of utterances” indicates the number of times a sentence that matches the corresponding input sentence has been input by the
「機械翻訳文」は、対応する入力文全体についての翻訳結果である。この例では翻訳言語は英語であり、「May I help you?」などの英語が翻訳結果となっている。機械翻訳文の情報は、たとえば決定装置10の類似度取得部14(後述)からログDB50に送られることによって、データテーブル50aに追加される。
“Machine translation” is a translation result for the entire corresponding input sentence. In this example, the translation language is English, and English such as “May I help you?” Is the translation result. The information of the machine translation sentence is added to the data table 50a by being sent to the
「再翻訳文」は、「機械翻訳文」全体についての入力言語への再翻訳結果である。この例では入力言語は日本語であるので、「いらっしゃいませ」などの日本語が再翻訳結果となっている。再翻訳結果の情報は、たとえば決定装置10の類似度取得部14からログDB50に送られることによって、データテーブル50aに追加される。
The “retranslated sentence” is a result of retranslating the entire “machine translated sentence” into the input language. In this example, the input language is Japanese, so Japanese such as “I welcome” is the retranslation result. The information on the retranslation result is added to the data table 50a by being sent to the
「入力文‐再翻訳文類似度」は、「入力文」と「再翻訳文」との類似度である。この例では、類似度としてコサイン類似度が用いられており、類似度は最大で1である。たとえば、入力文「いらっしゃいませ」全体についての再翻訳文は「いらっしゃいませ」であり、入力文と一致するので、類似度は「1」と最も高くなっている。一方、入力文「お使いの携帯電話の機種は何ですか?」全体についての再翻訳文は「新型携帯電話を使うのは何ですか?」であり、入力文と再翻訳文とで異なる部分が少なくないので、類似度は「0.3」と比較的低くなっている。入力文‐再翻訳文類似度の情報は、たとえば決定装置10の類似度取得部14からログDB50に送られることによって、データテーブル50aに追加される。なお、単語出力が出力態様として決定された場合のその出力態様での翻訳結果も、データテーブル50aは、入力文と対応付けて記述していてもよい。そのような翻訳結果の情報は、たとえば決定装置10の出力態様選択部15からログDB50に送られることによって、データテーブル50aに追加される。
The “input sentence-retranslation sentence similarity” is the similarity between the “input sentence” and the “retranslation sentence”. In this example, cosine similarity is used as the similarity, and the maximum similarity is 1. For example, the re-translated sentence for the entire input sentence “Issurasaisei” is “Isurasaisei”, which matches the input sentence, so the similarity is highest as “1”. On the other hand, the retranslation sentence for the input sentence “What is your mobile phone model?” Is “What is the new mobile phone used for?”, And the input sentence differs from the retranslation sentence. Since there are not many parts, the similarity is relatively low at “0.3”. The information on the input sentence-retranslated sentence similarity is added to the data table 50a by being sent from the
再び図2に戻り、品詞数取得部12は、通信部11によって入力された入力文に含まれる品詞の数を取得する部分である。ここで言う入力文に含まれる品詞の数は、入力文に含まれる単語を品詞の種類ごとにカウントした場合の、各品詞におけるカウント数である。具体的に、品詞数取得部12は、形態素解析器20の解析結果を用いて、入力文に含まれる単語の品詞のうちの予め定められた品詞(所定品詞)の単語の数をカウントする。所定品詞の例は、名詞および動詞であり、この理由については後に出力態様選択部15の機能を説明する際に説明する。なお、品詞数取得部12は、入力文に含まれる名詞の数および動詞の数のそれぞれをカウントするだけでなく、名詞の数および動詞の数の合計の数をカウントしてもよい。品詞数取得部12が入力文に含まれる品詞の数を取得することによって、入力文にどのような品詞の単語がどの程度の数含まれているかという入力文の特徴が特定される。
Returning to FIG. 2 again, the part-of-
ログ一致数取得部13は、通信部11によって入力された入力文と一致する文が過去に通信部11によって入力された回数(ログ一致回数)を取得する部分である。ログ一致数は、ログDB50に記憶されたデータテーブル50a(図3)によって記述されている「過去の発話回数」であってよい。したがって、ログ一致数取得部13は、データテーブル50a内の、通信部11によって入力された入力文に対応する過去の発話回数を、ログ一致数として取得することができる。
The log matching
類似度取得部14は、通信部11によって入力された入力文と、入力文と、当該入力文についての再翻訳結果との類似度を取得する部分である。具体的に、まず、類似度取得部14は、機械翻訳装置40を用いて、入力文全体の翻訳結果を取得する。そのため、通信部11によって入力された入力文は、決定装置10から機械翻訳装置40に送られる。機械翻訳装置40は、決定装置10から送られた入力文全体に対して、入力言語から翻訳言語への機械翻訳を実行する。機械翻訳の手法はとくに限定されず、種々の公知の手法を用いてよい。機械翻訳装置40による入力文全体についての翻訳結果(図3の「機械翻訳文」に相当)は、決定装置10に送られてもよい。次に、類似度取得部14は、再び機械翻訳装置40を用いて、機械翻訳装置40による翻訳結果全体の入力言語への再翻訳結果を取得する。具体的に、機械翻訳装置40は、先の機械翻訳の実行によって得られた翻訳結果全体に対して、翻訳言語から入力言語への機械翻訳を実行する。機械翻訳装置40による翻訳結果全体についての再翻訳結果(図3の「再翻訳文」に相当)は、決定装置10に送られる。
The
次に、類似度取得部14は、通信部11によって入力された入力文と、機械翻訳装置40を用いて取得した再翻訳結果との類似度を算出する。どのような類似度を用いるかはとくに限定されないが、たとえばコサイン類似度を用いることができる。この場合、類似度取得部14は、入力文および再翻訳結果(再翻訳文)の少なくとも一方に含まれる単語の数を次元の数とするベクトルを、入力文および再翻訳文のそれぞれについて生成する。ベクトルの各次元の要素の値は、たとえば、入力文の場合には、入力文に含まれる単語に対応する要素の値を1とし、入力文に含まれない単語に対応する要素の値を0とする。再翻訳文の場合には、再翻訳文に含まれる単語に対応する要素の値を1とし、再翻訳文に含まれない単語に対応する要素の値を0とする。そして、類似度取得部14は、入力文のベクトルおよび再翻訳文のベクトルのなす角度のコサインの値を、コサイン類似度として算出する。類似度としてコサイン類似度を用いる場合、類似度の上限値は1である。
Next, the
出力態様選択部15は、品詞数取得部12、ログ一致数取得部13および類似度取得部14の解析結果に基づいて、翻訳結果の出力態様を選択する部分である。出力態様選択部15は、翻訳結果の表示方法を選択する部分とも言える。なお、本実施形態では、出力態様選択部15は、品詞数取得部12、ログ一致数取得部13および類似度取得部14の各解析結果のうち2つ以上の解析結果の組み合わせを考慮して翻訳結果の出力態様を選択する。その場合、各解析結果のうちのいずれかの解析結果が他の解析結果に優先される。たとえば後に図5を参照して説明する例では、ログ一致数取得部13の解析結果が最も優先される。次いで、品詞数取得部12の解析結果のうち入力文に含まれる品詞が名詞または動詞のみの場合か否かという解析結果が、他の解析結果よりも優先される。また、類似度取得部14の解析結果が、ログ一致数取得部13による解析結果および品詞数取得部12の解析結果のうち入力文に含まれる名詞および/又は動詞の数が所定品詞数以下であるか否かという解析結果よりも優先される。ただし、ここで重要なことは、いかにして、品詞数取得部12、ログ一致数取得部13および類似度取得部14の解析結果のそれぞれについて、単語出力および文出力のいずれの出力態様が適切であるかを個別に判断することである。以下、これについて説明する。
The output
まず、出力態様選択部15は、品詞数取得部12によって取得された所定品詞の数に基づいて、出力態様を選択することができる。たとえば、品詞数取得部12によって取得された所定品詞の数が予め定められた品詞数(後述の図5のN2に相当)より大きい場合、出力態様選択部15は、出力態様として単語出力を選択するとよい。先に説明したように、品詞数は、入力文に含まれる名詞の数とすることができる。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文の内容が専門的な商品の説明を行うものである場合には入力文に多くの名詞が含まれるという特徴がある。その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があり、翻訳結果の出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見である。また、先に説明したように、品詞数は、入力文に含まれる動詞の数であってよい。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文が長文または複文のような複雑な文である場合には入力文に多くの動詞が含まれるという特徴がある。その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があり、翻訳における出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見である。この知見に基づけば、逆に、品詞数取得部12によって取得された所定品詞の数が予め定められた品詞数以下の場合、出力態様選択部15は、出力態様として文出力を選択するとよい。
First, the output
また、出力態様選択部15は、ログ一致数取得部13によって取得されたログ一致数に基づいて出力態様を選択することができる。具体的に、ログ一致数が予め定められたログ一致数(後述の図5のN1に相当)以上の場合、出力態様選択部15は、通信部11によって入力された入力文と一致する過去の文について出力態様決定システム1によって決定された出力態様を選択する。先に図3を参照して説明したように、ログDB50に記憶されるデータテーブル50aは、入力文と、対応する入力文に基づいて出力態様決定システム1により決定された翻訳結果の出力態様とを対応付けて記述している。このようなデータテーブル50aを参照することによって、出力態様選択部15は上述の選択を行うことができる。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文と同一の文が過去に多数入力されている場合には入力文が繰り返し入力され同じ翻訳結果が繰り返し出力された文であるという特徴がある。その結果、ユーザはその入力文についての翻訳結果の翻訳精度に満足している可能性があり、翻訳結果の出力態様としては、過去と同じ出力態様が適切と考えられる、という知見である。
Further, the output
また、出力態様選択部15は、類似度取得部14によって取得された類似度に基づいて出力態様を選択する。具体的に、類似度取得部14によって取得された類似度が予め定められた類似度(後述の図5のN3に相当)以上の場合、出力態様選択部15は、出力態様として文出力を選択する。これは、類似度が高い場合には入力文全体の翻訳精度も高くなるので、翻訳における出力態様としては、文出力が適切である、という知見に基づく。この知見に基づけば、逆に、類似度取得部14によって取得された類似度が予め定められた類似度未満の場合、出力態様選択部15は、出力態様として単語出力を選択する。
In addition, the output
ここで、翻訳における出力態様として単語出力を選択した場合、出力態様選択部15は、単語抽出装置30を用いて、入力文に含まれる一部の単語を抽出して、抽出した単語のみの翻訳結果を出力してもよい。単語抽出装置30では、抽出部31が、単語DB32に予め記憶されている単語を、入力文から抽出する。単語DB32は、たとえば、さまざまな単語に国名、値段、色といった属性を付与してそれらの単語を管理する属性テーブルを格納している。属性にはその単語の品詞が含まれてもよい。このような属性が指定されて、指定された属性の単語が抽出される。属性の指定は、たとえば端末装置60のユーザ操作によって行うことができる。具体的に、端末装置60において、属性を指定するためのユーザ操作を取得部62が受け付け、その情報(属性指定情報)が通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。属性指定情報は、入力文および言語情報とともに送信されてもよい。送信された属性指定情報は、決定装置10から単語抽出装置30に送られ、それによって、抽出部31は、属性指定情報により指定された属性の単語を単語DB32から抽出する。なお、上述の属性は、出力態様決定システム1において予め設定された指定情報にしたがって指定されてもよく、その場合には、上述の属性の指定のための端末装置60のユーザ操作は不要である。属性を指定して単語を抽出することで、たとえば、特定の業界でよく用いられる単語が抽出されやすくなったり、特定のユーザがよく用いる単語が抽出されやすくなったりする。属性として品詞が指定される場合には、指定された品詞(たとえば名詞、動詞など)に係る単語のみが抽出されるようになる。抽出部31により単語DB32から抽出された単語は、単語抽出装置30から決定装置10に送られ、出力態様選択部15が取得する。
Here, when word output is selected as the output mode in translation, the output
抽出部31は、単語の出現回数などから統計的に判断して、単語を抽出してもよい。たとえば、抽出部31は、ログDB50に記憶されたデータテーブル50a(図3)中の入力文に含まれる各単語の出現回数をそれぞれカウントし、カウント数の多い単語を抽出してもよい。各単語の出現回数のカウントは、先に説明した形態素解析器20の解析結果を用いて行うことができる。各単語の出現回数のカウント結果は単語DB32に記憶されてよく、その場合には、単語DB32の属性テーブルは、各単語と、単語の出現数とを対応付けて記憶することになる。
The
また、先に図1の右側の画面D2を例に挙げて説明したように、単語出力において表示部63によって表示された単語であって、ユーザ操作によって削除された単語の情報が、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。この削除された単語の情報は、決定装置10から単語抽出装置30に送られ、単語DB32が記憶してもよい。つまり、単語DB32は、ユーザ操作によって削除された単語の情報のフィードバックを受ける。具体的に、単語DB32は、各単語とその削除回数とを対応付けて記憶しており、フィードバックが行われる都度、その単語の削除回数を増加させる。削除回数の多い単語は、表示部63による表示の必要性が低いと考えられる。そのため、抽出部31は、削除回数が一定数以上の単語については、単語DB32からは抽出しないようにしてもよい。
Further, as described above by taking the screen D2 on the right side of FIG. 1 as an example, information on the word displayed by the
同じく先に説明したように、画面D2に表示されている単語のうちの重要な単語を、端末装置60の表示部63が強調表示してもよい。ここで、画面D2に表示されている単語のうちいずれの単語が重要な単語であるかを判断する手法の例について説明する。
Similarly, as described above, the
第一の手法は、同一のユーザによって繰り返し発話された単語であるか否かに基づいて、重要な単語を判断するという手法である。この判断は、出力態様決定システム1の決定装置10の出力態様選択部15によって行われる。具体的に、先に説明したようにデータテーブル50aが「発話日時」、「入力文」などの各項目をユーザごとに区別して記述できるようになっているので、まず、出力態様選択部15は、データテーブル50aから、入力文の送信元の端末装置60のユーザの直近の発話日時の「入力文」を抽出する。そして、出力態様選択部15は、通信部11によって入力された入力文に含まれる単語が、抽出した「入力文」に含まれるか否かを判断する。通信部11によって入力された入力文に含まれる単語が、抽出した「入力文」に含まれている場合、出力態様選択部15は、その単語を、同一のユーザによって繰り返し発話された単語であると判断することができる。
The first method is a method of determining an important word based on whether or not the word is spoken repeatedly by the same user. This determination is performed by the output
第二の手法は、通信部11によって入力された入力文における単語列中の句同士のかかり受けを解析することによって、重要な単語を判断するという手法である。この解析手法としては、たとえば特開2009−122937号公報に開示された手法を用いることができる。
The second method is a method of determining an important word by analyzing the reception of phrases in a word string in an input sentence input by the
たとえば上述のような第一および第二の手法を用いた出力態様選択部15による判断結果が、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。その結果、先に説明したように、画面D2に表示されている単語のうちの重要な単語を、表示部63が強調表示することができる。
For example, the determination result by the output
再び出力態様選択部15の説明に戻る。出力態様選択部15は、先に説明した品詞数取得部12によって取得された品詞数および類似度取得部14によって取得された類似度に基づく判断に優先して、入力文に含まれる品詞が名詞または動詞のみの場合には、出力態様として単語出力を選択する。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文に含まれる単語の品詞が名詞または動詞のみである場合には、ユーザにとって重要な単語が直近の翻訳結果に含まれていなかったためユーザが再度ユーザにとって重要な単語のみを発話しているといった可能性、つまり入力文がユーザにとって重要な単語のみで構成されるという特徴がある。その結果、出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見に基づく。この知見に基づけば、逆に、入力文に含まれる単語の品詞が名詞または動詞のみでない場合、出力態様選択部15は、出力態様として、文出力を選択してもよい。なお、入力文に含まれる品詞が名詞または動詞のみの場合の単語出力では、入力文に含まれるすべての単語が翻訳されることになる。
Returning to the description of the output
出力態様選択部15が翻訳結果の出力態様を選択することによって、決定装置10では、翻訳結果の出力態様が決定される。そのため、品詞数取得部12、ログ一致数取得部13、類似度取得部14および出力態様選択部15が、翻訳結果の出力態様として単語出力および文出力のいずれの出力が行われるべきか否かを入力文に基づいて決定する決定手段を構成する。
When the output
また、出力態様決定システム1では、決定された翻訳結果の出力態様に従って、入力文の翻訳が行われる。この翻訳は、たとえば決定装置10の出力態様選択部15が、機械翻訳装置40を翻訳手段として用いることによって行われる。すなわち、単語出力の場合には、通信部11によって入力された入力文に含まれる単語のうちの、出力態様選択部15が単語抽出装置30を用いて抽出した単語が、決定装置10から機械翻訳装置40に送られ、機械翻訳装置40は送られた単語を翻訳する。文出力の場合には、通信部11によって入力された入力文全体が、決定装置10から機械翻訳装置40に送られ、機械翻訳装置40は送られた入力文全体を翻訳する。機械翻訳装置40による翻訳結果は、決定装置10に送られる。なお、類似度取得部14によってすでに入力文全体の翻訳が機械翻訳装置40によって行われその翻訳結果を出力態様選択部15が取得している場合には、あらためて入力文全体の翻訳を機械翻訳装置40が行う必要がないので機械翻訳装置40による翻訳処理を省略してよい。また、上述のようにログ一致数取得部13の解析結果に応じて過去と同じ出力態様が選択される場合には、ログDB50に記憶されたデータテーブル50aに含まれる、過去に行なわれた同じ入力文全体についての機械翻訳文を翻訳結果として取得することができる。この場合にも、機械翻訳装置40による翻訳処理を省略できる。さらにデータテーブル50aが単語出力での翻訳結果も入力文と対応付けて記述していれば、上述の単語抽出装置30を用いて抽出された単語の機械翻訳装置40による翻訳処理も省略できる。出力態様選択部15が機械翻訳装置40を用いて得た翻訳結果は、決定装置10の通信部11から端末装置60の通信部61に送信される。端末装置60の通信部61が受信した翻訳結果は、表示部63によって表示される。翻訳結果の表示の例は、先に図1を参照して説明したとおりである。
Further, in the output
図4は、決定装置10、形態素解析器20、単語抽出装置30、機械翻訳装置40およびログDB50(以下、ここでは決定装置10等と言う)のハードウェア構成の例を示す図である。図4に示されるように、決定装置10等は、物理的には、1または複数のCPU(Central Processing Unit)101、主記憶装置であるRAM(Random Access Memory)102およびROM(Read Only Memory)103、データ送受信デバイスである通信モジュール104、半導体メモリなどの補助記憶装置105、ユーザ操作の入力を受け付ける入力装置106、ディスプレイといった出力装置107などを備えるコンピュータとして構成され得る。先に図2を参照して説明した決定装置10等の各機能は、たとえば、CPU101、RAM102などのハードウェア上に1または複数の所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104、入力装置106、出力装置107などを動作させるとともに、RAM102および補助記憶装置105におけるデータの読み出しおよび書き込みを行うことで実現することができる。
FIG. 4 is a diagram illustrating an example of the hardware configuration of the
図5は、出力態様決定システム1において実行される処理の一例を示すフローチャートである。このフローチャートの処理は、たとえば、端末装置60において出力態様決定システム1を利用するためのアプリケーションが起動されているときに、ユーザUが発話を行うことによって実行される。
FIG. 5 is a flowchart illustrating an example of processing executed in the output
ステップS1において、出力態様決定システム1では、入力文が取得される。具体的に、端末装置60の取得部62が、ユーザUが発した音声に対応する入力文を取得する。そして、端末装置60の通信部61が、取得部62によって取得された入力文を、出力態様決定システム1の決定装置10の通信部11に送信する。さらに、決定装置10の通信部11が、端末装置60の通信部61から送信された入力文を受信する。
In step S1, the output
ステップS2において、形態素解析が実行される。具体的に、形態素解析器20が、先のステップS1で入力された入力文に対して形態素解析を行う。
In step S2, morphological analysis is performed. Specifically, the
ステップS3において、ログ一致数が予め定められたログ一致数N1以上であるか否かが判断される。具体的に、決定装置10のログ一致数取得部13が、ログDB50に記憶されたデータテーブル50aから、先のステップS1で入力された入力文と一致する入力文の過去の発話回数(図3参照)をログ一致数として取得する。なお、データテーブル50aに一致する入力文がない場合には、先に説明したようにデータテーブル50aにおいて発話回数が1に設定されるので、ログ一致数=1としてこのステップS3の処理が行われる。ログ一致数がN1以上である場合(ステップS3:YES)、ステップS11に処理が進められる。そうでない場合(ステップS3:NO)、ステップS4に処理が進められる。
In step S3, whether the log number of matches is predetermined log matches the number N 1 or more is determined. Specifically, the log matching
ステップS4において、入力文に含まれる品詞が名詞または動詞のみであるか否かが判断される。具体的に、決定装置10の出力態様選択部15が、先のステップS2で行われた形態素解析の解析結果を用いて、先のステップS1で入力された入力文に含まれるすべての単語の品詞が、名詞または動詞のみであるか否かを判断する。入力文に含まれる品詞が名詞または動詞のみの場合(ステップS4:YES)、ステップS9に処理が進められる。そうでない場合(ステップS4:NO)、ステップS5に処理が進められる。
In step S4, it is determined whether or not the part of speech included in the input sentence is only a noun or a verb. Specifically, the output
ステップS5において、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数N2以下であるか否かが判断される。具体的に、決定装置10の品詞数取得部12が、先のステップS2での形態素解析の解析結果を用いて、先のステップS1で入力された入力文に含まれる名詞の数および動詞の数をそれぞれカウントして取得する。そして、出力態様選択部15が、品詞数取得部12によって取得された名詞の数および動詞の数の少なくとも一方がN2以下であるか否かを判断する。なお、予め定められた品詞数N2は、名詞に対して定められる場合と、動詞に対して定められる場合とで異なる値であってもよい。入力文に含まれる名詞の数または動詞の数がN2以下の場合(ステップS5:YES)、ステップS6およびステップS7に処理が進められる。そうでない場合(ステップS5:NO)、ステップS8に処理が進められる。
In step S5, the noun and / or whether the number of verbs is less part of speech the number N 2 of predetermined included in the input sentence is determined. Specifically, the part-of-speech
ステップS6において、機械翻訳が実施される。具体的に、決定装置10の類似度取得部14が、機械翻訳装置40を用いて、先のステップS1で入力された入力文全体についての翻訳結果を取得する。さらに、類似度取得部14が、機械翻訳装置40を用いて、取得した翻訳結果全体についての再翻訳結果をさらに取得する。
In step S6, machine translation is performed. Specifically, using the
ステップS7において、類似度が予め定められた類似度N3以上であるか否かが判断される。具体的に、決定装置10の類似度取得部14が、先のステップS1で入力された入力文と、先のステップS6で取得された再翻訳結果とを比較することによって類似度を取得する。類似度の例は上述のコサイン類似度である。そして、出力態様選択部15が、類似度取得部14によって取得された類似度がN3以上であるか否かを判断する。類似度がN3以上の場合(ステップS7:YES)、ステップS10に処理が進められる。そうでない場合(ステップS7:NO)、ステップS8に処理が進められる。
In step S7, whether the degree of similarity is predetermined similarity N 3 or more is determined. Specifically, the
ステップS8において、翻訳結果を単語出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN1未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されておらず(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数がN2より大きいので(ステップS5:NO)、入力文の翻訳における出力態様として単語出力を選択する。このように出力態様として単語出力を選択するのは、先に説明した知見に基づいて、名詞または動詞以外の品詞が入力文に含まれるという点で出力態様として文出力を選択してよいが(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数より大きいという点で出力態様として単語出力を選択するとよい(ステップS5:NO)という理由による。ステップS8の処理が完了した後、ステップS12に処理が進められる。
In step S8, it is determined that the translation result should be output as a word. That is, the output
ステップS9においては、翻訳結果を単語出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN1未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されているので(ステップS4:YES)、入力文の翻訳における出力態様として単語出力を選択する。このように出力態様として単語出力を選択するのは、先に説明したように、入力文に含まれる品詞が名詞または動詞のみであるという点で、品詞数に基づく判断(ステップS5)、類似度に基づく判断(ステップS7)に優先して、出力態様として単語出力を選択するためである。ただし、先に説明したように、このステップS9での単語出力では、翻訳対象は、ステップS1で入力された入力文に含まれるすべての単語であるので、図5において、ステップS9を、先に説明したステップS8と区別して図示している。
In step S9, it is determined that the translation result should be output as a word. That is, the output
ステップS10においては、翻訳結果を文出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN1未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されておらず(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数がN2以下であり(ステップS5:YES)、入力文と再翻訳結果との類似度がN3以上であるので(ステップS7:YES)、入力文の翻訳における出力態様として文出力を選択する。このように出力態様として文出力を選択する理由は、先に説明した知見に基づいて、名詞または動詞以外の品詞が入力文に含まれるという点で出力態様として文出力を選択してよいが(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数より以下であるという点でも出力態様として文出力を選択するとよく(ステップS5:YES)、さらに、類似度も予め定められた類似度以上であるという点で出力態様として文出力を選択する(ステップS7:YES)という理由による。
In step S10, it is determined that the translation result should be output as a sentence. That is, the output
ステップS11においては、翻訳結果の出力態様が過去と同じ出力態様に決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN1以上であるので(ステップS3:YES)、先に説明したようにログDB50に記憶されたデータテーブル50aを参照して、翻訳結果の出力態様として過去と同じ出力態様を選択する。このように出力態様を選択するのは、先に説明したように、入力文と同一の文が過去に多数入力されているという点で、品詞に基づく判断(ステップS4、S5)、類似度に基づく判断(ステップS7)に優先して、出力態様として過去と同じ出力態様を選択するためである。
In step S11, the output form of the translation result is determined to be the same output form as the past. That is, the output
上述のステップS8およびステップS9の処理が完了した後は、ステップS12〜S14に処理が進められる。上述のステップS10の処理が完了した後は、ステップS12をスキップしてステップS13およびステップS14に処理が進められる。上述のステップS11の処理が完了した後は、ステップS12の処理が必要な場合にはステップS12の処理を実行した後に、ステップS12の処理が不要な場合にはステップS12をスキップして、ステップS13およびステップS14に処理が進められる。ステップS12の処理が必要な場合とは、データテーブル50aが単語出力での翻訳結果を含んでおらず、単語抽出装置30を用いて抽出された単語の機械翻訳装置40による翻訳処理が必要な場合である。
After the process of step S8 and step S9 is completed, the process proceeds to steps S12 to S14. After the process of step S10 is completed, step S12 is skipped and the process proceeds to steps S13 and S14. After the process of step S11 is completed, after the process of step S12 is executed if the process of step S12 is necessary, the process of step S12 is skipped if the process of step S12 is unnecessary. Then, the process proceeds to step S14. The case where the process of step S12 is necessary means that the data table 50a does not include the translation result in the word output, and the translation process by the
ステップS12において、決定結果に従って機械翻訳が実施される。具体的に、決定装置10の出力態様選択部15が、単語抽出装置30を用いて、先のステップS1で入力された入力文から、翻訳対象となる単語を抽出する。そして、出力態様選択部15は、機械翻訳装置40を用いて、抽出した単語についての翻訳結果を取得する。
In step S12, machine translation is performed according to the determination result. Specifically, the output
ステップS13において、決定結果に従って翻訳結果が出力される。具体的に、先のステップS8またはステップS9の処理が実行された場合には、決定装置10の通信部11が、先のステップS12で取得された翻訳結果(入力文に含まれる単語についての翻訳結果)を端末装置60の通信部61に送信する。先のステップS10の処理が実行された場合には、決定装置10の通信部11が、先のステップS6で取得された翻訳結果(入力文全体についての翻訳結果)を端末装置60の通信部61に送信する。先のステップS11の処理が実行された場合には、決定装置10の通信部が、ログDB50に記憶されたデータテーブル50aに含まれる、過去に行なわれた同じ入力文についての翻訳結果を端末装置60の通信部61に送信する。ただし先に説明したようにステップS12の処理が必要な場合には、ステップS12で取得された翻訳結果が端末装置60の通信部61に送信される。そして、端末装置60の表示部63が、翻訳結果を出力する。先に説明したように、単語出力の場合には表示部63によって表示された翻訳結果に含まれる一部の単語がユーザ操作によって削除され得るので、単語が削除された場合には、削除された単語の情報が端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、決定装置10からログDB50に送られることによってフィードバックされる。
In step S13, the translation result is output according to the determination result. Specifically, when the process of the previous step S8 or step S9 is executed, the
ステップS14において、ログDB、単語DBが更新される。たとえば、先のステップS1において取得された入力文が、通信部11からログDB50に送られることによって、データテーブル50aが更新される。先のステップS6で取得された入力文全体についての翻訳結果および再翻訳結果が、類似度取得部14からログDB50に送られることによって、データテーブル50aが更新される。ステップS7で取得され用いられた類似度が、類似度取得部14からログDB50に送られることによって、データテーブル50aが更新される。ステップS8〜S10で決定された出力態様の情報が、出力態様選択部15からログDB50に送られることによって、データテーブル50aが更新される。また、たとえば、先のステップS12で削除された単語の情報が、決定装置10から単語抽出装置30に送られることによって、単語DB32が更新される。
In step S14, the log DB and the word DB are updated. For example, the
以上説明した出力態様決定システム1によれば、翻訳結果の出力態様として、単語出力が適切であるか文出力が適切であるかは翻訳の対象である入力文の特徴に依存し得るという知見に基づいて、単語出力および文出力のいずれの出力が行われるべきかが入力文に基づいて決定される(ステップS3〜S11)。よって、入力文の特徴から、翻訳における適切な出力態様を決定することができる。
According to the output
また、上述の決定結果に従って入力文が翻訳され(ステップS6、S12)、翻訳結果が出力される(ステップS13)。これにより、適切な出力態様での翻訳結果を出力することができる。その結果、たとえば、入力文全体機械翻訳した場合に翻訳精度が得られにくい長文や崩れた文章においては、単語翻訳とすることで、より適切な翻訳結果が出力される。したがって、翻訳によるコミュニケーションにおいて、コミュニケーションのスピードが遅くなってしまうといった支障が生じることを抑制できる。 Further, the input sentence is translated according to the above determination result (steps S6 and S12), and the translation result is output (step S13). Thereby, the translation result in an appropriate output mode can be output. As a result, for example, in the case of a long sentence or a broken sentence in which translation accuracy is difficult to be obtained when the entire input sentence is machine-translated, a more appropriate translation result is output by using word translation. Therefore, it is possible to suppress the occurrence of a problem that the communication speed is slow in communication by translation.
上述の決定は、入力された入力文と、過去に入力された入力文とを比較し、その比較結果に基づいて行われる(ステップS3)。たとえば、入力された入力文と一致する入力文が過去に入力された回数(ログ一致回数)が予め定められたログ一致数N1以上である場合には、翻訳結果の出力態様が過去と同じ出力態様に決定される(ステップS11)。これにより、たとえば、同一の入力文が繰り返し入力され同じ翻訳結果が繰り返し出力された文であるという入力文の特徴があり、その結果、ユーザはその入力文についての翻訳結果の翻訳精度に満足している可能性があるので、翻訳結果の出力態様としては、過去と同じ出力態様が適切である、という知見に従ったより適切な出力態様を決定できる。また、入力文が入力されるたびに、ログDB50に記憶されたデータテーブル50a中の入力文の数(入力文の種類、および、過去の発話回数(ログ一致数))が増加する。その結果、より多くの種類の予め定められた入力文を上述の比較に用いることで、より適切な比較結果を得ることができるようになる。すなわち、実際にユーザによって入力されたさまざまな入力文を上述の比較に用いることで、ユーザに適した翻訳結果の出力態様を決定することができるようになる。さらに、過去と同じ出力態様が選択された場合には、過去の翻訳結果がそのまま利用できるので、品詞や類似度に基づいて出力態様を決定する処理(ステップS4〜S10)や、それらの決定結果に従って機械翻訳を実行する処理(ステップS12)を省略し、決定装置10の処理負担を軽減することもできる。
The above-described determination is performed based on the comparison result by comparing the input sentence that has been input with the input sentence that has been input in the past (step S3). For example, if the input sentence that matches the entered input sentence is the past number entered in the (log number of coincidences) log matches the number N 1 or more predetermined, the output mode of translation result is the same as the past The output mode is determined (step S11). Thus, for example, there is a feature of an input sentence that the same input sentence is repeatedly input and the same translation result is repeatedly output. As a result, the user is satisfied with the translation accuracy of the translation result for the input sentence. Therefore, it is possible to determine a more appropriate output mode in accordance with the knowledge that the same output mode as the past is appropriate as the output mode of the translation result. Each time an input sentence is input, the number of input sentences (type of input sentence and the number of past utterances (number of log matches)) in the data table 50a stored in the
上述の決定は、入力文に含まれる単語の品詞が特定され、その特定結果に基づいて行われる(ステップS4、S5)。たとえば、入力文に含まれる単語の品詞のうち、名詞および/または動詞の数が予め定められた品詞数N2以下の場合には、文出力すべきと決定される可能性が高められる(ステップS5:YES、ステップS10)。これにより、たとえば、入力文の内容が専門的な商品の説明を行うものである場合には入力文に多くの名詞が含まれるという特徴があり、その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があるので、翻訳結果の出力態様としては、文出力よりも単語出力の方が適切である、という知見、および/または、入力文が長文または複文のような複雑な文である場合には入力文に多くの動詞が含まれるという特徴があり、その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があるので、翻訳における出力態様としては、文出力よりも単語出力の方が適切である、という知見に従ったより適切な出力態様を決定できる。 The above-mentioned determination is performed based on the part of speech of the word included in the input sentence and the identification result (steps S4 and S5). For example, if the number of nouns and / or verbs is less than or equal to a predetermined number of parts of speech N 2 among the parts of speech of words included in the input sentence, the possibility that the sentence should be output is increased (step S5: YES, step S10). As a result, for example, when the content of the input sentence explains a specialized product, there is a feature that the input sentence contains many nouns, and as a result, the translation when the entire input sentence is translated Since the accuracy tends to be low, the knowledge that word output is more appropriate than sentence output as the output form of translation results and / or the input sentence is a complex sentence such as a long sentence or compound sentence In some cases, there is a feature that many verbs are included in the input sentence, and as a result, the translation accuracy tends to be low when the entire input sentence is translated. A more appropriate output mode can be determined in accordance with the knowledge that word output is more appropriate.
また、上述の決定は、入力文が予め定められた品詞の単語から構成されているか否かに応じて行われる(ステップS4)。たとえば、入力文が名詞または動詞の単語のみで構成されている場合には、単語出力すべきと決定される(ステップS4:YES、ステップS9)。これにより、入力文に含まれる単語の品詞が名詞または動詞のみである場合には、ユーザにとって重要な単語が直近の翻訳結果に含まれていなかったためユーザが再度ユーザにとって重要な単語のみを発話しているといった可能性、つまり入力文がユーザにとって重要な単語のみで構成されるという特徴があり、出力態様としては、文出力よりも単語出力の方が適切である、という知見に従ったより適切な出力態様を決定することができる。 In addition, the above-described determination is performed depending on whether or not the input sentence is composed of words with a predetermined part of speech (step S4). For example, when the input sentence is composed only of noun or verb words, it is determined that the word should be output (step S4: YES, step S9). As a result, when the part of speech of the word included in the input sentence is only a noun or a verb, the word important for the user is not included in the latest translation result, so the user speaks only the word important for the user again. There is a feature that the input sentence is composed only of words that are important to the user, and the output mode is more appropriate according to the knowledge that word output is more appropriate than sentence output The output mode can be determined.
上述の決定は、入力文全体についての翻訳結果を取得し、さらに、取得した翻訳結果の入力文の言語への再翻訳結果を取得し(ステップS6)、入力文と、取得した再翻訳結果との類似度を算出し、算出した類似度に基づいて行われてもよい(ステップS7)。たとえば、類似度が予め定められた類似度N3以上の場合には、文出力すべきと決定される(ステップS7:YES、ステップS10)。これにより、類似度が高い場合には入力文全体の翻訳精度も高くなるので、翻訳における出力態様としては、文出力が適切である、という知見に従ったより適切な出力態様を決定することができる。 The above-mentioned determination acquires the translation result for the entire input sentence, further acquires the retranslation result of the acquired translation result into the language of the input sentence (step S6), and the input sentence, the acquired retranslation result, The similarity may be calculated based on the calculated similarity (step S7). For example, if the similarity is a similarity N 3 than the predetermined is determined to be text output (Step S7: YES, step S10). As a result, when the degree of similarity is high, the translation accuracy of the entire input sentence is also increased. Therefore, a more appropriate output mode according to the knowledge that the sentence output is appropriate can be determined as an output mode in translation. .
また、単語出力が行われた場合には、削除された単語の情報が、単語抽出装置30の単語DB32にフィードバックされる(ステップS14)。これにより、ユーザが翻訳結果として出力しなくてよいと考える単語が抽出されにくくなるので、結果として、ユーザが翻訳結果として出力されるべきであると考える重要な単語が抽出されやすくなる。この効果は、出力態様決定システム1による翻訳の機能が使用され続け、繰り返しフィードバックが行われることによって高められる。
When the word output is performed, the deleted word information is fed back to the
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではない。たとえば、上記実施形態では、出力態様の決定は、ログ一致数(ステップS3)、入力文に含まれる品詞の数(ステップS4、S5)、入力文と再翻訳結果との類似度(ステップS7)のすべての解析結果を考慮して行われていたが、品詞の数の解析結果または類似度の解析結果のみに基づいて出力態様が決定されてもよい。 Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment. For example, in the above embodiment, the output mode is determined by the number of log matches (step S3), the number of parts of speech included in the input sentence (steps S4 and S5), and the similarity between the input sentence and the retranslation result (step S7). However, the output mode may be determined based on only the analysis result of the number of parts of speech or the analysis result of the similarity.
入力文に含まれる品詞の数のみに基づいて出力態様を決定するときは、たとえば、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数N2より大きいの場合には単語出力すべきと決定し、そうでない場合には文出力すべきと決定してよい。類似度のみに基づいて出力態様を決定するときは、たとえば、類似度が予め定められた類似度N3以上の場合には文出力すべきと決定し、そうでない場合には単語出力すべきと決定してよい。 When determining the output mode based only on the number of parts of speech included in the input sentence, for example, when the number of nouns and / or verbs included in the input sentence is larger than a predetermined number of parts of speech N 2 It may be determined that it should be output, otherwise it should be determined that a sentence should be output. When determining the output mode based only on the similarity, for example, it is determined that the sentence should be output when the similarity is equal to or higher than a predetermined similarity N 3, and the word should be output otherwise. You may decide.
なお、上記実施形態では、出力態様決定システムが、決定した出力態様に従う翻訳結果を取得し、その翻訳結果が端末装置に送信される例について説明したが、本発明に係る出力態様決定システムでは、少なくとも出力態様が決定されればよく、翻訳結果の取得は必須ではない。 In the above embodiment, the output mode determination system has described an example in which the translation result according to the determined output mode is acquired and the translation result is transmitted to the terminal device. However, in the output mode determination system according to the present invention, It is sufficient that at least the output mode is determined, and acquisition of the translation result is not essential.
1…出力態様決定システム、11…通信部(入力手段)、12…品詞数取得部(決定手段)、13…ログ一致数取得部(決定手段)、14…類似度取得部(決定手段)、15…出力態様選択部(決定手段)、40…機械翻訳装置(翻訳手段)、50…ログDB(記憶手段)。
DESCRIPTION OF
Claims (6)
前記入力文に含まれる単語についての翻訳結果を出力する単語出力、および、前記入力文全体についての翻訳結果を出力する文出力、のいずれの出力が行われるべきかを、前記入力手段によって入力された入力文に基づいて決定する決定手段と、
を備える、
出力態様決定システム。 An input means for inputting an input sentence to be translated;
The input means inputs whether a word output that outputs a translation result for a word included in the input sentence or a sentence output that outputs a translation result for the entire input sentence is to be performed. Determining means for determining based on the input sentence;
Comprising
Output mode determination system.
前記翻訳手段による翻訳結果を出力する出力手段をさらに備える、
請求項1に記載の出力態様決定システム。 Translation means for translating the input sentence input by the input means according to the determination result of the determination means;
Further comprising output means for outputting a translation result by the translation means,
The output mode determination system according to claim 1.
前記決定手段は、前記入力手段によって入力された入力文と、前記記憶手段に記憶された前記過去に入力された入力文とを比較し、その比較結果に基づいて前記決定を行う、
請求項1または2に記載の出力態様決定システム。 Storage means for storing input sentences previously input by the input means;
The determination unit compares the input sentence input by the input unit with the input sentence input in the past stored in the storage unit, and performs the determination based on the comparison result.
The output mode determination system according to claim 1 or 2.
請求項1または2に記載の出力態様決定システム。 The determining means specifies a part of speech of a word included in the input sentence, and performs the determination based on the specifying result;
The output mode determination system according to claim 1 or 2.
請求項4に記載の出力態様決定システム。 The determining means performs the determination according to whether or not the input sentence is composed of words of a predetermined part of speech.
The output mode determination system according to claim 4.
請求項1〜5のいずれか1項に記載の出力態様決定システム。 The determination unit acquires a translation result for the entire input sentence input by the input unit, further acquires a retranslation result of the acquired translation result into the language of the input sentence, and is input by the input unit Calculating the similarity between the input sentence and the acquired retranslation result, and making the determination based on the calculated similarity,
The output mode determination system according to any one of claims 1 to 5.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016128444A JP2018005368A (en) | 2016-06-29 | 2016-06-29 | Output mode determination system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016128444A JP2018005368A (en) | 2016-06-29 | 2016-06-29 | Output mode determination system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018005368A true JP2018005368A (en) | 2018-01-11 |
Family
ID=60946338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016128444A Pending JP2018005368A (en) | 2016-06-29 | 2016-06-29 | Output mode determination system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018005368A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020009261A1 (en) * | 2018-07-02 | 2020-01-09 | 엘지전자 주식회사 | Digital device capable of voice recognition and control method thereof |
-
2016
- 2016-06-29 JP JP2016128444A patent/JP2018005368A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020009261A1 (en) * | 2018-07-02 | 2020-01-09 | 엘지전자 주식회사 | Digital device capable of voice recognition and control method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110678859B (en) | Display device | |
US9754592B2 (en) | Methods and systems for speech-enabling a human-to-machine interface | |
JP4058071B2 (en) | Example translation device, example translation method, and example translation program | |
US7047195B2 (en) | Speech translation device and computer readable medium | |
WO2018157789A1 (en) | Speech recognition method, computer, storage medium, and electronic apparatus | |
US20160162466A1 (en) | Intelligent system that dynamically improves its knowledge and code-base for natural language understanding | |
US20140350934A1 (en) | Systems and Methods for Voice Identification | |
US20160267902A1 (en) | Speech recognition using a foreign word grammar | |
CN107844470B (en) | Voice data processing method and equipment thereof | |
EP2887229A2 (en) | Communication support apparatus, communication support method and computer program product | |
US20150019200A1 (en) | Socially derived translation profiles to enhance translation quality of social content using a machine translation | |
US20220261545A1 (en) | Systems and methods for producing a semantic representation of a document | |
US10366173B2 (en) | Device and method of simultaneous interpretation based on real-time extraction of interpretation unit | |
US11403470B2 (en) | Translation device | |
CN113302683B (en) | Multi-tone word prediction method, disambiguation method, device, apparatus, and computer-readable storage medium | |
WO2020178856A1 (en) | A chatbot system using asynchronous dialog state machine | |
WO2022022049A1 (en) | Long difficult text sentence compression method and apparatus, computer device, and storage medium | |
JP2012159969A (en) | Machine translation device, method and program | |
JP5901694B2 (en) | Dictionary database management device, API server, dictionary database management method, and dictionary database management program | |
CN112149403A (en) | Method and device for determining confidential text | |
JP2018005368A (en) | Output mode determination system | |
JP5300576B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM | |
JP2004240859A (en) | Paraphrasing system | |
CN110599028B (en) | Text positioning method, device, equipment and storage medium | |
CN111813989A (en) | Information processing method, device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160630 |