JP2018005368A - Output mode determination system - Google Patents

Output mode determination system Download PDF

Info

Publication number
JP2018005368A
JP2018005368A JP2016128444A JP2016128444A JP2018005368A JP 2018005368 A JP2018005368 A JP 2018005368A JP 2016128444 A JP2016128444 A JP 2016128444A JP 2016128444 A JP2016128444 A JP 2016128444A JP 2018005368 A JP2018005368 A JP 2018005368A
Authority
JP
Japan
Prior art keywords
input
sentence
input sentence
output mode
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016128444A
Other languages
Japanese (ja)
Inventor
彩恵 田上
Sae Tagami
彩恵 田上
佳徳 礒田
Keitoku Isoda
佳徳 礒田
森永 康夫
Yasuo Morinaga
康夫 森永
公亮 角野
Kosuke Kadono
公亮 角野
祐貴 千々和
Yuki Chijiwa
祐貴 千々和
遼 山下
Ryo Yamashita
遼 山下
有理佳 片桐
Yurika Katagiri
有理佳 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Nippon Telegraph and Telephone Corp
Original Assignee
NTT Docomo Inc
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc, Nippon Telegraph and Telephone Corp filed Critical NTT Docomo Inc
Priority to JP2016128444A priority Critical patent/JP2018005368A/en
Publication of JP2018005368A publication Critical patent/JP2018005368A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an output mode determination system capable of determining a suitable output mode in translation.SOLUTION: An output mode determination system 1 includes: a communication unit 11 for inputting an input sentence, i.e. a translation object; and an output mode selection unit 15 for determining, on the basis of the input sentence input by the input means, which output should be performed, word output to output a translation result of a word included in the input sentence or sentence output to output a translation result of the whole input sentence.SELECTED DRAWING: Figure 2

Description

本発明は、翻訳結果の出力態様を決定する出力態様決定システムに関する。   The present invention relates to an output mode determination system that determines an output mode of a translation result.

特許文献1には、入力文の翻訳文を表示する際、入力文に含まれる単語の翻訳結果を順番に出力した後、入力文に含まれるすべての単語の翻訳結果を出力する翻訳装置が開示されている。この翻訳装置によれば、翻訳処理の途中であっても単語の翻訳結果が出力されるので、すべての単語の翻訳結果が出力されるまで待たずとも会話を進めることができる可能性がある。   Patent Document 1 discloses a translation device that, when displaying a translated sentence of an input sentence, sequentially outputs the translation results of words included in the input sentence and then outputs the translation results of all words included in the input sentence. Has been. According to this translation apparatus, since the translation result of the word is output even during the translation process, there is a possibility that the conversation can be advanced without waiting until the translation result of all the words is output.

特開2003−216607号公報JP 2003-216607 A

入力文の情報を過不足なく伝えるという観点からは、入力文全体についての翻訳結果を出力することが好ましい。しかし、たとえば、入力文が長いと翻訳文の内容を把握するのに時間が掛かり、入力文の内容が複雑だと翻訳精度が低下する。入力文に含まれる単語についての翻訳結果を出力すれば、翻訳結果の把握に掛かる時間の短縮、翻訳精度の向上が期待できる。ただしこの場合には、入力文の情報を過不足なく伝えることができない可能性がある。   From the viewpoint of transmitting information of the input sentence without excess or deficiency, it is preferable to output the translation result for the entire input sentence. However, for example, if the input sentence is long, it takes time to grasp the contents of the translated sentence. If the contents of the input sentence are complicated, the translation accuracy decreases. If the translation result for the words included in the input sentence is output, it can be expected to shorten the time required for grasping the translation result and improve the translation accuracy. However, in this case, there is a possibility that information of the input sentence cannot be transmitted without excess or deficiency.

このように入力文全体についての翻訳結果を出力する場合と、入力文に含まれる単語についての翻訳結果を出力する場合とでは、それぞれメリット、デメリットがあり、いずれの出力態様が適切であるかは、状況によって異なる。特許文献1に記載された翻訳装置は、入力文に含まれる単語の翻訳結果を順番に出力した後に、入力文に含まれるすべての単語の翻訳結果を出力する。この場合、適切でない方の出力態様での翻訳結果も必ず出力されてしまう。そのため、翻訳結果の把握に必ずしも適切な出力になっていない。   There are advantages and disadvantages in the case of outputting the translation result for the entire input sentence and the case of outputting the translation result for the words included in the input sentence as described above. Which output mode is appropriate? It depends on the situation. The translation apparatus described in Patent Literature 1 outputs the translation results of all words included in the input sentence after sequentially outputting the translation results of the words included in the input sentence. In this case, a translation result in an inappropriate output mode is always output. Therefore, the output is not always appropriate for grasping the translation result.

本発明は、上記課題に鑑みてなされたものであり、翻訳における適切な出力態様を決定することが可能な出力態様決定システムを提供することである。   This invention is made | formed in view of the said subject, and is providing the output mode determination system which can determine the suitable output mode in translation.

本発明の一態様に係る出力態様決定システムは、翻訳の対象である入力文を入力する入力手段と、入力文に含まれる単語についての翻訳結果を出力する単語出力、および、入力文全体についての翻訳結果を出力する文出力、のいずれの出力が行われるべきかを、入力手段によって入力された入力文に基づいて決定する決定手段と、を備える。   An output mode determination system according to an aspect of the present invention includes an input unit that inputs an input sentence to be translated, a word output that outputs a translation result for a word included in the input sentence, and an entire input sentence Determining means for determining which output of the sentence output for outputting the translation result is to be performed based on the input sentence input by the input means;

翻訳結果の出力態様として、単語出力が適切であるか文出力が適切であるかは、翻訳の対象である入力文の特徴に依存し得る。上記の出力態様決定システムでは、単語出力および文出力のいずれの出力が行われるべきかが入力文に基づいて決定される。よって、適切な出力態様を決定することができる。   Whether the word output is appropriate or the sentence output is appropriate as the output form of the translation result may depend on the characteristics of the input sentence to be translated. In the output mode determination system, it is determined based on the input sentence which of the word output and the sentence output should be performed. Therefore, an appropriate output mode can be determined.

出力態様決定システムは、決定手段の決定結果に従って入力手段によって入力された入力文を翻訳する翻訳手段と、翻訳手段による翻訳結果を出力する出力手段をさらに備えてもよい。これにより、適切な出力態様での翻訳結果を出力することができる。   The output mode determination system may further include a translation unit that translates the input sentence input by the input unit according to the determination result of the determination unit, and an output unit that outputs the translation result by the translation unit. Thereby, the translation result in an appropriate output mode can be output.

出力態様決定システムは、入力手段によって過去に入力された入力文を記憶する記憶手段をさらに備え、決定手段は、入力手段によって入力された入力文と、記憶手段に記憶された過去に入力された入力文とを比較し、その比較結果に基づいて決定を行ってもよい。これにより、入力文が過去の入力文と比較してどのような文であるかという入力文の特徴に基づいて上述の決定を行うことができる。また、入力文が入力されるたびに、予め定められた文として記憶手段に記憶される文の数が増加する。その結果、より多くの種類の予め定められた入力文を上述の比較に用いることで、より適切な比較結果を得ることができるようになる。   The output mode determination system further includes storage means for storing an input sentence input in the past by the input means, and the determination means inputs the input sentence input by the input means and the past input stored in the storage means. The input sentence may be compared and a determination may be made based on the comparison result. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence such as what kind of sentence the input sentence is compared with the past input sentence. Each time an input sentence is input, the number of sentences stored in the storage unit as a predetermined sentence increases. As a result, more appropriate comparison results can be obtained by using more types of predetermined input sentences for the above-described comparison.

決定手段は、入力文に含まれる単語の品詞を特定し、その特定結果に基づいて決定を行ってもよい。これにより、入力文にどのような品詞の単語が含まれているかという入力文の特徴に基づいて上述の決定を行うことができる。   The determining means may identify a part of speech of a word included in the input sentence and make a determination based on the identification result. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence such as what kind of part of speech is included in the input sentence.

決定手段は、入力文が予め定められた品詞の単語から構成されているか否かに応じて決定を行ってもよい。これにより、入力文がどのような品詞の単語から構成されているかという入力文の特徴に基づいて上述の決定を行うことができる。   The determining means may make a determination depending on whether or not the input sentence is composed of words having a predetermined part of speech. Thereby, the above-mentioned determination can be performed based on the feature of the input sentence, such as what kind of part of speech the input sentence is composed of.

決定手段は、入力手段によって入力された入力文全体についての翻訳結果を取得し、さらに、取得した翻訳結果の入力文の言語への再翻訳結果を取得し、入力手段によって入力された入力文と、取得した再翻訳結果との類似度を算出し、算出した類似度に基づいて決定を行ってもよい。これにより、翻訳および再翻訳がされた場合に入力文と再翻訳文との類似度がどの程度であるかという入力文の特徴に基づいて上述の決定を行うことができる。   The determining means acquires a translation result for the entire input sentence input by the input means, further acquires a retranslation result of the acquired translation result into the language of the input sentence, and the input sentence input by the input means Alternatively, the similarity with the acquired retranslation result may be calculated, and the determination may be performed based on the calculated similarity. Thereby, when translation and retranslation are carried out, the above-mentioned determination can be made based on the characteristics of the input sentence such as the degree of similarity between the input sentence and the retranslated sentence.

本発明によれば、入力文の特徴から、翻訳における適切な出力態様を決定することが可能になる。   According to the present invention, it is possible to determine an appropriate output mode in translation from the characteristics of an input sentence.

出力態様決定システムの決定結果に従って出力される翻訳結果の例を示す図である。It is a figure which shows the example of the translation result output according to the determination result of an output mode determination system. 翻訳システムの概略構成を示す図である。It is a figure which shows schematic structure of a translation system. ログDBの例を示す図である。It is a figure which shows the example of log DB. 決定装置10等のハードウェア構成の例を示す図である。It is a figure which shows the example of hardware constitutions, such as the determination apparatus. 翻訳システムにおいて実行される処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process performed in a translation system.

以下、本発明の実施形態について、図面を参照しながら説明する。なお、図面の説明において同一要素には同一符号を付し、重複する説明は省略する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant descriptions are omitted.

初めに、実施形態に係る出力態様決定システムの概要を説明する。出力態様決定システムは、入力文を入力文の言語とは別の言語へ翻訳する際の翻訳結果の出力態様を決定する。翻訳結果の出力態様としては、単語出力および文出力がある。単語出力では、入力文に含まれる単語についての翻訳結果が出力される。この場合の翻訳は、単語ごと(単語単位の)翻訳(単語翻訳)である。文出力では、入力文全体についての翻訳結果が出力される。この場合の翻訳は、翻訳前の文全体の意味と、翻訳後の文全体の意味とが一致するように行われる翻訳(文翻訳)である。出力態様決定システムは、翻訳の対象となる入力文の翻訳結果の出力態様として単語出力および文出力のいずれの出力態様がより適切であるかを決定する。   First, an outline of the output mode determination system according to the embodiment will be described. The output mode determination system determines the output mode of the translation result when the input sentence is translated into a language different from the language of the input sentence. As output modes of translation results, there are word output and sentence output. In the word output, the translation result for the word included in the input sentence is output. The translation in this case is a word-by-word (word unit) translation (word translation). In the sentence output, the translation result for the entire input sentence is output. Translation in this case is translation (sentence translation) performed so that the meaning of the whole sentence before translation matches the meaning of the whole sentence after translation. The output mode determination system determines which output mode of word output or sentence output is more appropriate as the output mode of the translation result of the input sentence to be translated.

図1は、出力態様決定システムの決定結果に従う翻訳結果の出力態様の例を示す図である。図2は、翻訳システムの概略構成を示す図である。図1に示される例では、入力文の言語(以下、「入力言語」と言う場合もある)が英語であり、翻訳結果の言語(以下、「翻訳言語」という場合もある)が日本語である。入力言語および翻訳言語(この例では英語および日本語)の指定は、端末装置60の取得部62(後述)がユーザ操作を受け付けることによって行われてよい。   FIG. 1 is a diagram illustrating an example of an output mode of a translation result according to a determination result of the output mode determination system. FIG. 2 is a diagram showing a schematic configuration of the translation system. In the example shown in FIG. 1, the language of the input sentence (hereinafter also referred to as “input language”) is English, and the language of the translation result (hereinafter also referred to as “translation language”) is Japanese. is there. The designation of the input language and the translation language (English and Japanese in this example) may be performed when an acquisition unit 62 (described later) of the terminal device 60 receives a user operation.

まず、端末装置60について説明する。図2に示されるように、端末装置60は、その機能ブロックとして、通信部61と、取得部62と、表示部63とを含む。   First, the terminal device 60 will be described. As illustrated in FIG. 2, the terminal device 60 includes a communication unit 61, an acquisition unit 62, and a display unit 63 as functional blocks.

通信部61は、出力態様決定システム1の決定装置10の通信部11と通信を行う部分である。通信部61は、後述の取得部62によって取得された入力文を通信部11に送信する。また、通信部61は、出力態様決定システム1によって決定された出力態様に従う翻訳結果を、通信部11から受信する。   The communication unit 61 is a part that communicates with the communication unit 11 of the determination device 10 of the output mode determination system 1. The communication unit 61 transmits the input sentence acquired by the acquisition unit 62 described later to the communication unit 11. Further, the communication unit 61 receives the translation result according to the output mode determined by the output mode determination system 1 from the communication unit 11.

取得部62は、入力文を取得する部分である。たとえば、ユーザUが発した音声から、入力文が取得される。その場合には、取得部62は、ユーザUが発した音声に対して音声認識処理を実行することによって、ユーザUが発した音声を文字情報に変換し、変換後の文字情報を入力文として取得する。文字情報の例はテキストデータである。音声を文字情報に変換するために、取得部62は、ユーザUが発した音声に対して音声認識処理を実行可能に構成される。音声認識処理の手法はとくに限定されず公知の種々の手法を用いてよい。なお、入力部の取得は、上述のような音声認識処理を用いた手法に限定されない。たとえば、ユーザUが端末装置60を操作して文字情報を入力した場合には、その文字情報が入力文として取得される。その際、予め用意された文字情報が選択されることによって、文字情報が入力されてもよい。取得部62は、ユーザUによる端末装置60の操作(ユーザ操作)を受け付ける部分でもある。   The acquisition unit 62 is a part that acquires an input sentence. For example, an input sentence is acquired from the voice uttered by the user U. In that case, the acquisition unit 62 converts the voice uttered by the user U into character information by executing voice recognition processing on the voice uttered by the user U, and uses the converted character information as an input sentence. get. An example of character information is text data. In order to convert the voice into character information, the acquisition unit 62 is configured to be able to perform voice recognition processing on the voice uttered by the user U. The voice recognition processing technique is not particularly limited, and various known techniques may be used. The acquisition of the input unit is not limited to the method using the voice recognition process as described above. For example, when the user U operates the terminal device 60 and inputs character information, the character information is acquired as an input sentence. At this time, the character information may be input by selecting character information prepared in advance. The acquisition unit 62 is also a part that receives an operation (user operation) of the terminal device 60 by the user U.

表示部63は、翻訳結果を出力する(表示する)部分である。表示部63による翻訳結果の出力の例は、次に端末装置60の動作概要を説明した後に、図1を参照して説明する。表示部63は、タッチパネルで構成されていてもよく、その場合、表示部63がユーザ操作を受け付けることもできる。   The display unit 63 is a part that outputs (displays) the translation result. An example of the translation result output by the display unit 63 will be described with reference to FIG. The display unit 63 may be configured with a touch panel. In this case, the display unit 63 can accept a user operation.

端末装置60の動作概要を説明する。まず、端末装置60において、出力態様決定システム1の機能を利用するためのアプリケーションが起動されているものとする。端末装置60の取得部62によって取得された入力文は、通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、出力態様決定システム1において利用可能になる。このとき、入力文とともに、入力言語および翻訳言語を指定するための言語情報(この例では、入力言語が英語であり、翻訳言語が日本語であることを特定するための情報)も、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。出力態様決定システム1では、後に図2以降を参照して詳述する原理により、入力文の翻訳結果の出力態様が決定され、当該出力態様に従う翻訳結果が作成される。出力態様の決定結果および翻訳結果は、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。端末装置60の通信部61が受信した決定結果に従って、表示部63が、翻訳結果を表示する。   An outline of the operation of the terminal device 60 will be described. First, it is assumed that an application for using the function of the output mode determination system 1 is activated in the terminal device 60. The input sentence acquired by the acquisition unit 62 of the terminal device 60 is transmitted from the communication unit 61 to the communication unit 11 of the determination device 10 of the output mode determination system 1 and can be used in the output mode determination system 1. At this time, together with the input sentence, language information for specifying the input language and the translation language (in this example, information for specifying that the input language is English and the translation language is Japanese) is also used for the terminal device. The data is transmitted from 60 communication units 61 to the communication unit 11 of the determination device 10 of the output mode determination system 1. In the output mode determination system 1, the output mode of the translation result of the input sentence is determined based on the principle described in detail later with reference to FIG. 2 and subsequent, and the translation result according to the output mode is created. The output mode determination result and the translation result are transmitted from the communication unit 11 of the determination device 10 of the output mode determination system 1 to the communication unit 61 of the terminal device 60. In accordance with the determination result received by the communication unit 61 of the terminal device 60, the display unit 63 displays the translation result.

具体的に、図1の左側には、翻訳結果の出力態様が文出力である場合の、表示部63による表示結果の例が示される。この例では、ユーザUが端末装置60に対して「Excuse me」という英語の音声V1を発する(発話を行う)。すると、その翻訳結果が、画面D1のように表示される。具体的に、画面D1には、入力文である「Excuse me」という英文の全体についての翻訳結果である「すみません」という日本語の文が、入力文とともに表示される。   Specifically, an example of a display result by the display unit 63 when the output result of the translation result is a sentence output is shown on the left side of FIG. In this example, the user U utters the English voice V1 “Excuse me” to the terminal device 60 (speaks). Then, the translation result is displayed like a screen D1. Specifically, the Japanese sentence “I'm sorry” that is the translation result of the entire English sentence “Excuse me” that is the input sentence is displayed along with the input sentence on the screen D1.

図1の右側には、翻訳結果の出力態様が単語出力である場合の、表示部63による表示結果の例が示される。この例では、ユーザUが端末装置60に対して「Can’t I buy the goods first and come back with my passport later?」という英語の音声V2を発する。すると、その翻訳結果が、画面D2のように表示される。具体的に、画面D2には、入力文である「Can’t I buy the goods first and come back with my passport later?」という英文に含まれる単語のうちの、「Buy」、「Goods」、「Comeback」、「With」、「Passport」、「Later」という単語についてのそれぞれの翻訳結果である「買う」、「商品」、「戻る」、「一緒に」、「パスポート」、「後程」という日本語の単語が、入力文に含まれる上述の単語とともに表示される。なお、単語出力において出力される単語は、複数の単語で構成されるフレーズであってもよい。この例では、「Come Back」という「Come」および「Back」の2つの単語で構成されるフレーズが出力されている。このように予め設定された特定の複数の単語で構成されるフレーズも、単語として扱うこととしてもよい。   The right side of FIG. 1 shows an example of a display result by the display unit 63 when the output result of the translation result is word output. In this example, the user U utters an English voice V2 “Ca n’t buy the goods first and come back with my passport later?” To the terminal device 60. Then, the translation result is displayed like a screen D2. Specifically, the screen D2 includes “Buy”, “Goods”, “Good”, among the words included in the input sentence “Can't I buy the goods first and come back with my passport later?” "Buy", "Product", "Back", "Together", "Passport", "Later" in Japan, the translation results for the words "Comeback", "With", "Passport", "Later" The words of the word are displayed together with the above-mentioned words included in the input sentence. Note that the word output in the word output may be a phrase composed of a plurality of words. In this example, a phrase composed of two words “Come” and “Back”, which is “Come Back”, is output. A phrase composed of a plurality of specific words set in advance as described above may be handled as a word.

本実施形態では、画面D2に表示されている単語のうち、一部の単語が削除されてもよい。たとえば、ユーザUは、画面D2に表示する必要のない単語を選択することによって、選択した単語を画面D2から削除することができる。画面D2が表示部63のタッチパネルによって表示されている場合には、ユーザUは、画面D2に表示された単語をスワイプすることによってその単語を画面D2から削除することができる。削除された単語の情報は、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、出力態様決定システム1において利用可能となる。この削除された単語の情報の用途については詳述する。   In the present embodiment, some of the words displayed on the screen D2 may be deleted. For example, the user U can delete a selected word from the screen D2 by selecting a word that does not need to be displayed on the screen D2. When the screen D2 is displayed on the touch panel of the display unit 63, the user U can delete the word from the screen D2 by swiping the word displayed on the screen D2. The deleted word information is transmitted from the communication unit 61 of the terminal device 60 to the communication unit 11 of the determination device 10 of the output mode determination system 1 and can be used in the output mode determination system 1. The use of the deleted word information will be described in detail.

また、画面D2に表示されている単語のうちの重要な単語を、表示部63が強調表示してもよい。強調表示の例は、文字の書式や色の変更などであってよい。いずれの単語が重要な単語であり強調表示されるべきであるかは、後述の原理により出力態様決定システム1において決定され、出力態様の決定結果および翻訳結果とともに、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。   Further, the display unit 63 may highlight important words among the words displayed on the screen D2. An example of highlighting may be a change in character format or color. Which word is an important word and should be highlighted is determined in the output mode determination system 1 according to the principle described later, and together with the output mode determination result and the translation result, the determination device of the output mode determination system 1 The data is transmitted from the ten communication units 11 to the communication unit 61 of the terminal device 60.

次に、図2を参照して、出力態様決定システム1の詳細について説明する。出力態様決定システム1は、決定装置10と、形態素解析器20と、単語抽出装置30と、機械翻訳装置40と、ログDB50とを含む。   Next, the details of the output mode determination system 1 will be described with reference to FIG. The output mode determination system 1 includes a determination device 10, a morphological analyzer 20, a word extraction device 30, a machine translation device 40, and a log DB 50.

出力態様決定システム1では、決定装置10が、形態素解析器20、単語抽出装置30、機械翻訳装置40及びログDB50と協働することによって、翻訳結果の出力態様を入力文に基づいて決定する。決定装置10、形態素解析器20、単語抽出装置30、機械翻訳装置40およびログDB50の各要素は、要素間で互いに情報を送受信可能なように構成されている。   In the output mode determination system 1, the determination device 10 determines the output mode of the translation result based on the input sentence by cooperating with the morphological analyzer 20, the word extraction device 30, the machine translation device 40, and the log DB 50. Each element of the determination device 10, the morphological analyzer 20, the word extraction device 30, the machine translation device 40, and the log DB 50 is configured so that information can be transmitted and received between the elements.

決定装置10は、その機能ブロックとして、通信部11と、品詞数取得部12と、ログ一致数取得部13と、類似度取得部14と、出力態様選択部15とを含む。   The determination device 10 includes a communication unit 11, a part-of-speech number acquisition unit 12, a log match number acquisition unit 13, a similarity acquisition unit 14, and an output mode selection unit 15 as functional blocks.

通信部11は、翻訳の対象である入力文を入力する部分(入力手段)である。具体的に、通信部11は、端末装置60の通信部61と通信を行い、端末装置60から送信される入力文(ユーザUが発した音声に対応する文字情報)および言語情報(入力言語および翻訳言語を指定するための情報)を受信する。   The communication unit 11 is a part (input means) for inputting an input sentence to be translated. Specifically, the communication unit 11 communicates with the communication unit 61 of the terminal device 60 to input text (character information corresponding to the voice uttered by the user U) and language information (input language and text) transmitted from the terminal device 60. Information for designating the translation language) is received.

通信部11は、受信した入力文に基づいて出力態様決定システム1によって決定された出力態様に従う翻訳結果を、端末装置60の通信部61に送信して出力する部分(出力手段)でもある。   The communication unit 11 is also a part (output unit) that transmits the translation result according to the output mode determined by the output mode determination system 1 based on the received input sentence to the communication unit 61 of the terminal device 60 and outputs it.

通信部11によって入力された入力文および言語情報は、まず、決定装置10から形態素解析器20に送られる。形態素解析器20は、決定装置10から送られた入力文に対して、入力言語での形態素解析を実行する。形態素解析の手法はとくに限定されず公知の種々の手法を用いてよい。形態素解析が実行されることにより、入力文を構成する単語および各単語の品詞が特定される。この特定結果(形態素解析による解析結果)は、形態素解析器20から決定装置10に送られる。   The input sentence and language information input by the communication unit 11 are first sent from the determination device 10 to the morphological analyzer 20. The morpheme analyzer 20 performs morpheme analysis in the input language on the input sentence sent from the determination device 10. The method of morphological analysis is not particularly limited, and various known methods may be used. By executing the morphological analysis, the words constituting the input sentence and the part of speech of each word are specified. This identification result (analysis result by morpheme analysis) is sent from the morpheme analyzer 20 to the determination device 10.

形態素解析器20から送られた解析結果を用いて、決定装置10では、品詞数取得部12、ログ一致数取得部13および類似度取得部14が、入力文をさらに解析する。この解析は、入力文がどのような特徴を有しているかということを特定するための解析である。これは、翻訳結果の出力態様として、単語出力および文出力のいずれの出力態様がより適切であるかは、入力文の特徴に依存し得る、という知見に基づいて行われるものである。品詞数取得部12、ログ一致数取得部13および類似度取得部14による入力文の解析は、記憶手段としてのログDB50に記憶されたデータテーブルを用いて行われるので、ここでまず、ログDB50について説明する。   Using the analysis result sent from the morpheme analyzer 20, in the determination device 10, the part-of-speech number acquisition unit 12, the log match number acquisition unit 13, and the similarity acquisition unit 14 further analyze the input sentence. This analysis is an analysis for specifying what characteristics the input sentence has. This is based on the knowledge that which output mode of word output and sentence output is more appropriate as the output mode of the translation result can depend on the characteristics of the input sentence. The input sentence analysis by the part-of-speech number acquisition unit 12, the log coincidence number acquisition unit 13 and the similarity acquisition unit 14 is performed using a data table stored in the log DB 50 as a storage unit. Will be described.

図3は、ログDB50に記憶されるデータテーブルの例を示す図である。このデータテーブル50aは、「発話日時」と、「入力文」と、「出力態様」と、「過去の発話回数」と、「機械翻訳文」と、「再翻訳文」と、「入力文‐再翻訳文類似度」とを対応付けて記述している。   FIG. 3 is a diagram illustrating an example of a data table stored in the log DB 50. This data table 50a includes “utterance date / time”, “input sentence”, “output mode”, “past number of utterances”, “machine translation sentence”, “retranslation sentence”, “input sentence— "Retranslated sentence similarity" is described in association with each other.

「発話日時」は、入力文が入力された日時である。この日時は、端末装置60の取得部62がユーザUの発話を取得した日時であってもよいし、決定装置10の通信部11が端末装置60の通信部61から送信された入力文を受信した日時であってもよい。発話日時の情報は、たとえば決定装置10の通信部11からログDB50に送られることによって、データテーブル50aに追加される。   “Speaking date” is the date and time when the input sentence was input. This date and time may be the date and time when the acquisition unit 62 of the terminal device 60 acquires the utterance of the user U, or the communication unit 11 of the determination device 10 receives the input sentence transmitted from the communication unit 61 of the terminal device 60. It may be the date and time. The information on the utterance date and time is added to the data table 50a by being sent from the communication unit 11 of the determination apparatus 10 to the log DB 50, for example.

なお、データテーブル50aに記述される入力文は、端末装置60のユーザUの発話に対応する入力文に限定されない。出力態様決定システム1を利用可能な端末装置は端末装置60の他にも多く存在し、それら複数の端末装置のそれぞれのユーザの発話に対応する入力文が、データテーブル50aに集約され得る。その場合、データテーブル50aは、さらに、各発話日時における入力文と、ユーザ(たとえばユーザの携帯している端末装置の識別子)とを対応付けて記述する。これにより、データテーブル50aは、「発話日時」、「入力文」などの各項目を、ユーザごとに記述することもできる。   The input sentence described in the data table 50 a is not limited to the input sentence corresponding to the utterance of the user U of the terminal device 60. There are many terminal devices that can use the output mode determination system 1 in addition to the terminal device 60, and input sentences corresponding to the utterances of the users of the plurality of terminal devices can be aggregated in the data table 50a. In this case, the data table 50a further describes the input sentence at each utterance date and time and the user (for example, the identifier of the terminal device carried by the user) in association with each other. Thereby, the data table 50a can also describe each item, such as "utterance date" and "input sentence" for every user.

データテーブル50aにおける「入力文」は、これまでに(過去に)通信部11によって入力された入力文である。この例では入力言語は日本語であり、「いらっしゃいませ」などの日本語が入力文となっている。入力文の情報は、たとえば決定装置10の通信部11からログDB50に送られることによって、データテーブル50aに追加される。   The “input sentence” in the data table 50a is an input sentence that has been input by the communication unit 11 so far (in the past). In this example, the input language is Japanese, and Japanese such as “I welcome” is the input sentence. The information of the input sentence is added to the data table 50a by being sent from the communication unit 11 of the determination apparatus 10 to the log DB 50, for example.

「出力態様」は、対応する入力文に基づいて出力態様決定システム1により決定された翻訳結果の出力態様(文出力または単語出力)を示す。なお、図中、「文」は文出力を、「単語」は単語出力を意味している。出力態様の情報は、たとえば決定装置10の出力態様選択部15(後述)からログDB50に送られることによって、データテーブル50aに追加される。   The “output mode” indicates the output mode (sentence output or word output) of the translation result determined by the output mode determination system 1 based on the corresponding input sentence. In the figure, “sentence” means sentence output, and “word” means word output. The output mode information is added to the data table 50a by being sent to the log DB 50 from, for example, an output mode selection unit 15 (described later) of the determination apparatus 10.

「過去の発話回数」は、対応する入力文と一致する文が、過去に通信部11によって入力された回数を示す。過去の発話回数の情報は、通信部11によって入力された入力文と一致する文がデータテーブル50aに入力文として存在しない場合には当該入力文がはじめて入力されたものであるとして「1」に設定される。一致する文がすでにデータテーブル50aに入力文として存在している場合には、すでに存在している入力文の過去の発話回数にさらに1を加えた値に設定される。   “Past number of utterances” indicates the number of times a sentence that matches the corresponding input sentence has been input by the communication unit 11 in the past. Information on the number of utterances in the past is set to “1” because the input sentence is input for the first time when there is no input sentence in the data table 50 a that matches the input sentence input by the communication unit 11. Is set. When a matching sentence already exists as an input sentence in the data table 50a, a value obtained by adding 1 to the past number of utterances of the existing input sentence is set.

「機械翻訳文」は、対応する入力文全体についての翻訳結果である。この例では翻訳言語は英語であり、「May I help you?」などの英語が翻訳結果となっている。機械翻訳文の情報は、たとえば決定装置10の類似度取得部14(後述)からログDB50に送られることによって、データテーブル50aに追加される。   “Machine translation” is a translation result for the entire corresponding input sentence. In this example, the translation language is English, and English such as “May I help you?” Is the translation result. The information of the machine translation sentence is added to the data table 50a by being sent to the log DB 50 from the similarity acquisition unit 14 (described later) of the determination device 10, for example.

「再翻訳文」は、「機械翻訳文」全体についての入力言語への再翻訳結果である。この例では入力言語は日本語であるので、「いらっしゃいませ」などの日本語が再翻訳結果となっている。再翻訳結果の情報は、たとえば決定装置10の類似度取得部14からログDB50に送られることによって、データテーブル50aに追加される。   The “retranslated sentence” is a result of retranslating the entire “machine translated sentence” into the input language. In this example, the input language is Japanese, so Japanese such as “I welcome” is the retranslation result. The information on the retranslation result is added to the data table 50a by being sent to the log DB 50 from the similarity obtaining unit 14 of the determination device 10, for example.

「入力文‐再翻訳文類似度」は、「入力文」と「再翻訳文」との類似度である。この例では、類似度としてコサイン類似度が用いられており、類似度は最大で1である。たとえば、入力文「いらっしゃいませ」全体についての再翻訳文は「いらっしゃいませ」であり、入力文と一致するので、類似度は「1」と最も高くなっている。一方、入力文「お使いの携帯電話の機種は何ですか?」全体についての再翻訳文は「新型携帯電話を使うのは何ですか?」であり、入力文と再翻訳文とで異なる部分が少なくないので、類似度は「0.3」と比較的低くなっている。入力文‐再翻訳文類似度の情報は、たとえば決定装置10の類似度取得部14からログDB50に送られることによって、データテーブル50aに追加される。なお、単語出力が出力態様として決定された場合のその出力態様での翻訳結果も、データテーブル50aは、入力文と対応付けて記述していてもよい。そのような翻訳結果の情報は、たとえば決定装置10の出力態様選択部15からログDB50に送られることによって、データテーブル50aに追加される。   The “input sentence-retranslation sentence similarity” is the similarity between the “input sentence” and the “retranslation sentence”. In this example, cosine similarity is used as the similarity, and the maximum similarity is 1. For example, the re-translated sentence for the entire input sentence “Issurasaisei” is “Isurasaisei”, which matches the input sentence, so the similarity is highest as “1”. On the other hand, the retranslation sentence for the input sentence “What is your mobile phone model?” Is “What is the new mobile phone used for?”, And the input sentence differs from the retranslation sentence. Since there are not many parts, the similarity is relatively low at “0.3”. The information on the input sentence-retranslated sentence similarity is added to the data table 50a by being sent from the similarity acquisition unit 14 of the determination apparatus 10 to the log DB 50, for example. Note that the translation result in the output mode when the word output is determined as the output mode may also be described in the data table 50a in association with the input sentence. Such information of the translation result is added to the data table 50a by being sent from the output mode selection unit 15 of the determination apparatus 10 to the log DB 50, for example.

再び図2に戻り、品詞数取得部12は、通信部11によって入力された入力文に含まれる品詞の数を取得する部分である。ここで言う入力文に含まれる品詞の数は、入力文に含まれる単語を品詞の種類ごとにカウントした場合の、各品詞におけるカウント数である。具体的に、品詞数取得部12は、形態素解析器20の解析結果を用いて、入力文に含まれる単語の品詞のうちの予め定められた品詞(所定品詞)の単語の数をカウントする。所定品詞の例は、名詞および動詞であり、この理由については後に出力態様選択部15の機能を説明する際に説明する。なお、品詞数取得部12は、入力文に含まれる名詞の数および動詞の数のそれぞれをカウントするだけでなく、名詞の数および動詞の数の合計の数をカウントしてもよい。品詞数取得部12が入力文に含まれる品詞の数を取得することによって、入力文にどのような品詞の単語がどの程度の数含まれているかという入力文の特徴が特定される。   Returning to FIG. 2 again, the part-of-speech acquisition unit 12 is a part that acquires the number of parts-of-speech included in the input sentence input by the communication unit 11. The number of parts of speech included in the input sentence referred to here is a count number in each part of speech when the words included in the input sentence are counted for each type of part of speech. Specifically, the part-of-speech acquisition unit 12 counts the number of words having a predetermined part-of-speech (predetermined part-of-speech) among the parts of speech of words included in the input sentence, using the analysis result of the morphological analyzer 20. Examples of the predetermined parts of speech are nouns and verbs. The reason for this will be described later when the function of the output mode selection unit 15 is described. The part-of-speech acquisition unit 12 may count not only the number of nouns and the number of verbs included in the input sentence, but also the total number of nouns and verbs. The part-of-speech acquisition unit 12 acquires the number of parts-of-speech included in the input sentence, thereby specifying the characteristics of the input sentence such as what part-of-speech word is included in the input sentence.

ログ一致数取得部13は、通信部11によって入力された入力文と一致する文が過去に通信部11によって入力された回数(ログ一致回数)を取得する部分である。ログ一致数は、ログDB50に記憶されたデータテーブル50a(図3)によって記述されている「過去の発話回数」であってよい。したがって、ログ一致数取得部13は、データテーブル50a内の、通信部11によって入力された入力文に対応する過去の発話回数を、ログ一致数として取得することができる。   The log matching number acquisition unit 13 is a part that acquires the number of times (log matching number) that a sentence that matches the input sentence input by the communication unit 11 has been input by the communication unit 11 in the past. The number of log matches may be “the number of utterances in the past” described by the data table 50 a (FIG. 3) stored in the log DB 50. Therefore, the log matching number acquisition unit 13 can acquire the past number of utterances corresponding to the input sentence input by the communication unit 11 in the data table 50a as the log matching number.

類似度取得部14は、通信部11によって入力された入力文と、入力文と、当該入力文についての再翻訳結果との類似度を取得する部分である。具体的に、まず、類似度取得部14は、機械翻訳装置40を用いて、入力文全体の翻訳結果を取得する。そのため、通信部11によって入力された入力文は、決定装置10から機械翻訳装置40に送られる。機械翻訳装置40は、決定装置10から送られた入力文全体に対して、入力言語から翻訳言語への機械翻訳を実行する。機械翻訳の手法はとくに限定されず、種々の公知の手法を用いてよい。機械翻訳装置40による入力文全体についての翻訳結果(図3の「機械翻訳文」に相当)は、決定装置10に送られてもよい。次に、類似度取得部14は、再び機械翻訳装置40を用いて、機械翻訳装置40による翻訳結果全体の入力言語への再翻訳結果を取得する。具体的に、機械翻訳装置40は、先の機械翻訳の実行によって得られた翻訳結果全体に対して、翻訳言語から入力言語への機械翻訳を実行する。機械翻訳装置40による翻訳結果全体についての再翻訳結果(図3の「再翻訳文」に相当)は、決定装置10に送られる。   The similarity acquisition unit 14 is a part that acquires the similarity between the input sentence input by the communication unit 11, the input sentence, and the retranslation result of the input sentence. Specifically, first, the similarity acquisition unit 14 acquires a translation result of the entire input sentence using the machine translation device 40. Therefore, the input sentence input by the communication unit 11 is sent from the determination device 10 to the machine translation device 40. The machine translation device 40 performs machine translation from the input language to the translation language on the entire input sentence sent from the determination device 10. The method of machine translation is not particularly limited, and various known methods may be used. The translation result (corresponding to the “machine translated sentence” in FIG. 3) for the entire input sentence by the machine translation apparatus 40 may be sent to the determination apparatus 10. Next, the similarity acquisition unit 14 uses the machine translation device 40 again to obtain a retranslation result of the entire translation result by the machine translation device 40 into the input language. Specifically, the machine translation device 40 performs machine translation from the translation language to the input language on the entire translation result obtained by executing the previous machine translation. The retranslation result (corresponding to the “retranslated sentence” in FIG. 3) for the entire translation result by the machine translation device 40 is sent to the determination device 10.

次に、類似度取得部14は、通信部11によって入力された入力文と、機械翻訳装置40を用いて取得した再翻訳結果との類似度を算出する。どのような類似度を用いるかはとくに限定されないが、たとえばコサイン類似度を用いることができる。この場合、類似度取得部14は、入力文および再翻訳結果(再翻訳文)の少なくとも一方に含まれる単語の数を次元の数とするベクトルを、入力文および再翻訳文のそれぞれについて生成する。ベクトルの各次元の要素の値は、たとえば、入力文の場合には、入力文に含まれる単語に対応する要素の値を1とし、入力文に含まれない単語に対応する要素の値を0とする。再翻訳文の場合には、再翻訳文に含まれる単語に対応する要素の値を1とし、再翻訳文に含まれない単語に対応する要素の値を0とする。そして、類似度取得部14は、入力文のベクトルおよび再翻訳文のベクトルのなす角度のコサインの値を、コサイン類似度として算出する。類似度としてコサイン類似度を用いる場合、類似度の上限値は1である。   Next, the similarity acquisition unit 14 calculates the similarity between the input sentence input by the communication unit 11 and the retranslation result acquired using the machine translation device 40. Although what kind of similarity is used is not particularly limited, for example, cosine similarity can be used. In this case, the similarity acquisition unit 14 generates a vector having the number of words included in at least one of the input sentence and the retranslation result (retranslation sentence) for each of the input sentence and the retranslation sentence. . For example, in the case of an input sentence, the value of an element in each dimension of the vector is 1 for an element corresponding to a word included in the input sentence, and 0 for an element corresponding to a word not included in the input sentence. And In the case of a retranslated sentence, the value of an element corresponding to a word included in the retranslated sentence is set to 1, and the value of an element corresponding to a word not included in the retranslated sentence is set to 0. Then, the similarity acquisition unit 14 calculates the cosine value of the angle formed by the vector of the input sentence and the vector of the retranslated sentence as the cosine similarity. When the cosine similarity is used as the similarity, the upper limit value of the similarity is 1.

出力態様選択部15は、品詞数取得部12、ログ一致数取得部13および類似度取得部14の解析結果に基づいて、翻訳結果の出力態様を選択する部分である。出力態様選択部15は、翻訳結果の表示方法を選択する部分とも言える。なお、本実施形態では、出力態様選択部15は、品詞数取得部12、ログ一致数取得部13および類似度取得部14の各解析結果のうち2つ以上の解析結果の組み合わせを考慮して翻訳結果の出力態様を選択する。その場合、各解析結果のうちのいずれかの解析結果が他の解析結果に優先される。たとえば後に図5を参照して説明する例では、ログ一致数取得部13の解析結果が最も優先される。次いで、品詞数取得部12の解析結果のうち入力文に含まれる品詞が名詞または動詞のみの場合か否かという解析結果が、他の解析結果よりも優先される。また、類似度取得部14の解析結果が、ログ一致数取得部13による解析結果および品詞数取得部12の解析結果のうち入力文に含まれる名詞および/又は動詞の数が所定品詞数以下であるか否かという解析結果よりも優先される。ただし、ここで重要なことは、いかにして、品詞数取得部12、ログ一致数取得部13および類似度取得部14の解析結果のそれぞれについて、単語出力および文出力のいずれの出力態様が適切であるかを個別に判断することである。以下、これについて説明する。   The output mode selection unit 15 is a part that selects the output mode of the translation result based on the analysis results of the part-of-speech number acquisition unit 12, the log match number acquisition unit 13, and the similarity acquisition unit 14. The output mode selection unit 15 can also be said to be a part for selecting a translation result display method. In the present embodiment, the output mode selection unit 15 considers a combination of two or more analysis results among the analysis results of the part-of-speech number acquisition unit 12, the log match number acquisition unit 13, and the similarity acquisition unit 14. Select the output mode of the translation result. In that case, any one of the analysis results is prioritized over the other analysis results. For example, in the example described later with reference to FIG. 5, the analysis result of the log match number acquisition unit 13 is given the highest priority. Next, the analysis result indicating whether or not the part of speech included in the input sentence is only a noun or a verb among the analysis results of the part of speech acquisition unit 12 is prioritized over the other analysis results. Further, the analysis result of the similarity acquisition unit 14 indicates that the number of nouns and / or verbs included in the input sentence among the analysis result of the log match number acquisition unit 13 and the analysis result of the part of speech acquisition unit 12 is equal to or less than the predetermined number of parts of speech. It takes priority over the analysis result of whether or not there is. However, what is important here is how to properly output either word output or sentence output for each of the analysis results of the part-of-speech number acquisition unit 12, the log match number acquisition unit 13, and the similarity acquisition unit 14. It is to judge whether it is. This will be described below.

まず、出力態様選択部15は、品詞数取得部12によって取得された所定品詞の数に基づいて、出力態様を選択することができる。たとえば、品詞数取得部12によって取得された所定品詞の数が予め定められた品詞数(後述の図5のNに相当)より大きい場合、出力態様選択部15は、出力態様として単語出力を選択するとよい。先に説明したように、品詞数は、入力文に含まれる名詞の数とすることができる。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文の内容が専門的な商品の説明を行うものである場合には入力文に多くの名詞が含まれるという特徴がある。その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があり、翻訳結果の出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見である。また、先に説明したように、品詞数は、入力文に含まれる動詞の数であってよい。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文が長文または複文のような複雑な文である場合には入力文に多くの動詞が含まれるという特徴がある。その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があり、翻訳における出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見である。この知見に基づけば、逆に、品詞数取得部12によって取得された所定品詞の数が予め定められた品詞数以下の場合、出力態様選択部15は、出力態様として文出力を選択するとよい。 First, the output mode selection unit 15 can select an output mode based on the number of predetermined parts of speech acquired by the part of speech number acquisition unit 12. For example, when the number of predetermined parts of speech acquired by the part of speech number acquisition unit 12 is larger than a predetermined number of parts of speech (corresponding to N 2 in FIG. 5 described later), the output mode selection unit 15 outputs a word output as the output mode. It is good to choose. As described above, the number of parts of speech can be the number of nouns included in the input sentence. The reason for providing such selection criteria is based on the following knowledge. That is, for example, when the content of the input sentence is to explain specialized products, there is a feature that the input sentence includes many nouns. As a result, there is a tendency that the translation accuracy tends to be low when the entire input sentence is translated, and the word output is considered more appropriate than the sentence output as the output form of the translation result. As described above, the number of parts of speech may be the number of verbs included in the input sentence. The reason for providing such selection criteria is based on the following knowledge. That is, for example, when the input sentence is a complex sentence such as a long sentence or a compound sentence, there is a characteristic that many verbs are included in the input sentence. As a result, there is a tendency that the translation accuracy tends to be low when the entire input sentence is translated, and it is a knowledge that word output is considered more appropriate than sentence output as an output mode in translation. Based on this knowledge, conversely, when the number of predetermined parts of speech acquired by the part of speech number acquisition unit 12 is equal to or less than a predetermined number of parts of speech, the output mode selection unit 15 may select sentence output as the output mode.

また、出力態様選択部15は、ログ一致数取得部13によって取得されたログ一致数に基づいて出力態様を選択することができる。具体的に、ログ一致数が予め定められたログ一致数(後述の図5のNに相当)以上の場合、出力態様選択部15は、通信部11によって入力された入力文と一致する過去の文について出力態様決定システム1によって決定された出力態様を選択する。先に図3を参照して説明したように、ログDB50に記憶されるデータテーブル50aは、入力文と、対応する入力文に基づいて出力態様決定システム1により決定された翻訳結果の出力態様とを対応付けて記述している。このようなデータテーブル50aを参照することによって、出力態様選択部15は上述の選択を行うことができる。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文と同一の文が過去に多数入力されている場合には入力文が繰り返し入力され同じ翻訳結果が繰り返し出力された文であるという特徴がある。その結果、ユーザはその入力文についての翻訳結果の翻訳精度に満足している可能性があり、翻訳結果の出力態様としては、過去と同じ出力態様が適切と考えられる、という知見である。 Further, the output mode selection unit 15 can select the output mode based on the log match number acquired by the log match number acquisition unit 13. Specifically, when the log number of matches is above a predetermined log match count (corresponding to N 1 of FIG. 5 described later), the output mode selecting section 15, past that matches the input sentence input by the communication unit 11 The output mode determined by the output mode determination system 1 is selected. As described above with reference to FIG. 3, the data table 50a stored in the log DB 50 includes the input sentence and the output form of the translation result determined by the output form determination system 1 based on the corresponding input sentence. Are described in association with each other. By referring to such a data table 50a, the output mode selection unit 15 can perform the above selection. The reason for providing such selection criteria is based on the following knowledge. That is, for example, when many sentences identical to the input sentence have been input in the past, the input sentence is repeatedly input and the same translation result is repeatedly output. As a result, there is a possibility that the user may be satisfied with the translation accuracy of the translation result for the input sentence, and the knowledge that the same output mode as the past is considered appropriate as the output mode of the translation result.

また、出力態様選択部15は、類似度取得部14によって取得された類似度に基づいて出力態様を選択する。具体的に、類似度取得部14によって取得された類似度が予め定められた類似度(後述の図5のNに相当)以上の場合、出力態様選択部15は、出力態様として文出力を選択する。これは、類似度が高い場合には入力文全体の翻訳精度も高くなるので、翻訳における出力態様としては、文出力が適切である、という知見に基づく。この知見に基づけば、逆に、類似度取得部14によって取得された類似度が予め定められた類似度未満の場合、出力態様選択部15は、出力態様として単語出力を選択する。 In addition, the output mode selection unit 15 selects an output mode based on the similarity acquired by the similarity acquisition unit 14. Specifically, when the above degree of similarity is similarity predetermined acquired by similarity degree acquiring section 14 (corresponding to N 3 of FIG. 5 described later), the output mode selecting section 15, a sentence as an output mode select. This is based on the knowledge that the sentence output is appropriate as an output mode in translation because the translation accuracy of the entire input sentence is high when the similarity is high. On the contrary, if the similarity acquired by the similarity acquisition unit 14 is less than a predetermined similarity, the output mode selection unit 15 selects word output as the output mode.

ここで、翻訳における出力態様として単語出力を選択した場合、出力態様選択部15は、単語抽出装置30を用いて、入力文に含まれる一部の単語を抽出して、抽出した単語のみの翻訳結果を出力してもよい。単語抽出装置30では、抽出部31が、単語DB32に予め記憶されている単語を、入力文から抽出する。単語DB32は、たとえば、さまざまな単語に国名、値段、色といった属性を付与してそれらの単語を管理する属性テーブルを格納している。属性にはその単語の品詞が含まれてもよい。このような属性が指定されて、指定された属性の単語が抽出される。属性の指定は、たとえば端末装置60のユーザ操作によって行うことができる。具体的に、端末装置60において、属性を指定するためのユーザ操作を取得部62が受け付け、その情報(属性指定情報)が通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。属性指定情報は、入力文および言語情報とともに送信されてもよい。送信された属性指定情報は、決定装置10から単語抽出装置30に送られ、それによって、抽出部31は、属性指定情報により指定された属性の単語を単語DB32から抽出する。なお、上述の属性は、出力態様決定システム1において予め設定された指定情報にしたがって指定されてもよく、その場合には、上述の属性の指定のための端末装置60のユーザ操作は不要である。属性を指定して単語を抽出することで、たとえば、特定の業界でよく用いられる単語が抽出されやすくなったり、特定のユーザがよく用いる単語が抽出されやすくなったりする。属性として品詞が指定される場合には、指定された品詞(たとえば名詞、動詞など)に係る単語のみが抽出されるようになる。抽出部31により単語DB32から抽出された単語は、単語抽出装置30から決定装置10に送られ、出力態様選択部15が取得する。   Here, when word output is selected as the output mode in translation, the output mode selection unit 15 uses the word extraction device 30 to extract some words included in the input sentence, and translates only the extracted words. The result may be output. In the word extraction device 30, the extraction unit 31 extracts words stored in advance in the word DB 32 from the input sentence. The word DB 32 stores, for example, an attribute table for managing various words by assigning attributes such as country name, price, and color to various words. The attribute may include the part of speech of the word. Such an attribute is designated, and a word having the designated attribute is extracted. The designation of the attribute can be performed by a user operation of the terminal device 60, for example. Specifically, in the terminal device 60, the acquisition unit 62 receives a user operation for designating an attribute, and the information (attribute designation information) is transferred from the communication unit 61 to the communication unit 11 of the determination device 10 of the output mode determination system 1. Sent. The attribute designation information may be transmitted together with the input sentence and language information. The transmitted attribute designation information is sent from the determination device 10 to the word extraction device 30, whereby the extraction unit 31 extracts a word having the attribute designated by the attribute designation information from the word DB 32. In addition, the above-mentioned attribute may be specified according to the specification information preset in the output mode determination system 1, and in that case, the user operation of the terminal device 60 for specifying the above-mentioned attribute is unnecessary. . By specifying the attribute and extracting the word, for example, a word often used in a specific industry is easily extracted, or a word frequently used by a specific user is easily extracted. When a part of speech is specified as an attribute, only words related to the specified part of speech (for example, noun, verb, etc.) are extracted. The word extracted from the word DB 32 by the extraction unit 31 is sent from the word extraction device 30 to the determination device 10 and is acquired by the output mode selection unit 15.

抽出部31は、単語の出現回数などから統計的に判断して、単語を抽出してもよい。たとえば、抽出部31は、ログDB50に記憶されたデータテーブル50a(図3)中の入力文に含まれる各単語の出現回数をそれぞれカウントし、カウント数の多い単語を抽出してもよい。各単語の出現回数のカウントは、先に説明した形態素解析器20の解析結果を用いて行うことができる。各単語の出現回数のカウント結果は単語DB32に記憶されてよく、その場合には、単語DB32の属性テーブルは、各単語と、単語の出現数とを対応付けて記憶することになる。   The extraction unit 31 may extract a word based on statistical determination based on the number of appearances of the word. For example, the extraction unit 31 may count the number of appearances of each word included in the input sentence in the data table 50a (FIG. 3) stored in the log DB 50, and extract a word with a large count number. Counting the number of appearances of each word can be performed using the analysis result of the morphological analyzer 20 described above. The count result of the number of appearances of each word may be stored in the word DB 32. In this case, the attribute table of the word DB 32 stores each word and the number of occurrences of the word in association with each other.

また、先に図1の右側の画面D2を例に挙げて説明したように、単語出力において表示部63によって表示された単語であって、ユーザ操作によって削除された単語の情報が、端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信される。この削除された単語の情報は、決定装置10から単語抽出装置30に送られ、単語DB32が記憶してもよい。つまり、単語DB32は、ユーザ操作によって削除された単語の情報のフィードバックを受ける。具体的に、単語DB32は、各単語とその削除回数とを対応付けて記憶しており、フィードバックが行われる都度、その単語の削除回数を増加させる。削除回数の多い単語は、表示部63による表示の必要性が低いと考えられる。そのため、抽出部31は、削除回数が一定数以上の単語については、単語DB32からは抽出しないようにしてもよい。   Further, as described above by taking the screen D2 on the right side of FIG. 1 as an example, information on the word displayed by the display unit 63 in the word output and deleted by the user operation is the terminal device 60. Is transmitted from the communication unit 61 to the communication unit 11 of the determination device 10 of the output mode determination system 1. The deleted word information may be sent from the determination device 10 to the word extraction device 30 and stored in the word DB 32. That is, the word DB 32 receives feedback of information on words deleted by user operations. Specifically, the word DB 32 stores each word and the number of deletions in association with each other, and increases the number of deletions of the word each time feedback is performed. Words with a large number of deletions are considered to be less necessary to be displayed by the display unit 63. Therefore, the extraction unit 31 may not extract words from the word DB 32 for words that have a certain number of deletions.

同じく先に説明したように、画面D2に表示されている単語のうちの重要な単語を、端末装置60の表示部63が強調表示してもよい。ここで、画面D2に表示されている単語のうちいずれの単語が重要な単語であるかを判断する手法の例について説明する。   Similarly, as described above, the display unit 63 of the terminal device 60 may highlight an important word among the words displayed on the screen D2. Here, an example of a technique for determining which of the words displayed on the screen D2 is an important word will be described.

第一の手法は、同一のユーザによって繰り返し発話された単語であるか否かに基づいて、重要な単語を判断するという手法である。この判断は、出力態様決定システム1の決定装置10の出力態様選択部15によって行われる。具体的に、先に説明したようにデータテーブル50aが「発話日時」、「入力文」などの各項目をユーザごとに区別して記述できるようになっているので、まず、出力態様選択部15は、データテーブル50aから、入力文の送信元の端末装置60のユーザの直近の発話日時の「入力文」を抽出する。そして、出力態様選択部15は、通信部11によって入力された入力文に含まれる単語が、抽出した「入力文」に含まれるか否かを判断する。通信部11によって入力された入力文に含まれる単語が、抽出した「入力文」に含まれている場合、出力態様選択部15は、その単語を、同一のユーザによって繰り返し発話された単語であると判断することができる。   The first method is a method of determining an important word based on whether or not the word is spoken repeatedly by the same user. This determination is performed by the output mode selection unit 15 of the determination device 10 of the output mode determination system 1. Specifically, as described above, the data table 50a can describe each item such as “utterance date” and “input sentence” separately for each user. From the data table 50a, the “input sentence” of the latest utterance date and time of the user of the terminal device 60 that is the transmission source of the input sentence is extracted. Then, the output mode selection unit 15 determines whether a word included in the input sentence input by the communication unit 11 is included in the extracted “input sentence”. When a word included in the input sentence input by the communication unit 11 is included in the extracted “input sentence”, the output mode selection unit 15 is a word repeatedly uttered by the same user. It can be judged.

第二の手法は、通信部11によって入力された入力文における単語列中の句同士のかかり受けを解析することによって、重要な単語を判断するという手法である。この解析手法としては、たとえば特開2009−122937号公報に開示された手法を用いることができる。   The second method is a method of determining an important word by analyzing the reception of phrases in a word string in an input sentence input by the communication unit 11. As this analysis method, for example, the method disclosed in Japanese Patent Application Laid-Open No. 2009-122937 can be used.

たとえば上述のような第一および第二の手法を用いた出力態様選択部15による判断結果が、出力態様決定システム1の決定装置10の通信部11から端末装置60の通信部61に送信される。その結果、先に説明したように、画面D2に表示されている単語のうちの重要な単語を、表示部63が強調表示することができる。   For example, the determination result by the output mode selection unit 15 using the first and second methods as described above is transmitted from the communication unit 11 of the determination device 10 of the output mode determination system 1 to the communication unit 61 of the terminal device 60. . As a result, as described above, the display unit 63 can highlight important words among the words displayed on the screen D2.

再び出力態様選択部15の説明に戻る。出力態様選択部15は、先に説明した品詞数取得部12によって取得された品詞数および類似度取得部14によって取得された類似度に基づく判断に優先して、入力文に含まれる品詞が名詞または動詞のみの場合には、出力態様として単語出力を選択する。このような選択基準を設ける理由は、次の知見に基づく。つまり、たとえば、入力文に含まれる単語の品詞が名詞または動詞のみである場合には、ユーザにとって重要な単語が直近の翻訳結果に含まれていなかったためユーザが再度ユーザにとって重要な単語のみを発話しているといった可能性、つまり入力文がユーザにとって重要な単語のみで構成されるという特徴がある。その結果、出力態様としては、文出力よりも単語出力の方が適切と考えられる、という知見に基づく。この知見に基づけば、逆に、入力文に含まれる単語の品詞が名詞または動詞のみでない場合、出力態様選択部15は、出力態様として、文出力を選択してもよい。なお、入力文に含まれる品詞が名詞または動詞のみの場合の単語出力では、入力文に含まれるすべての単語が翻訳されることになる。   Returning to the description of the output mode selection unit 15 again. The output mode selection unit 15 prioritizes the determination based on the number of parts of speech acquired by the part of speech acquisition unit 12 described above and the similarity acquired by the similarity acquisition unit 14, and the part of speech included in the input sentence is a noun. Alternatively, in the case of only a verb, word output is selected as the output mode. The reason for providing such selection criteria is based on the following knowledge. That is, for example, if the part of speech of a word included in the input sentence is only a noun or a verb, the word important for the user is not included in the latest translation result, so the user speaks only the word important for the user again. There is a feature that the input sentence is composed only of words important to the user. As a result, the output mode is based on the knowledge that word output is considered more appropriate than sentence output. Based on this knowledge, conversely, when the part of speech of a word included in the input sentence is not only a noun or a verb, the output mode selection unit 15 may select a sentence output as the output mode. Note that in the word output when the part of speech included in the input sentence is only a noun or a verb, all the words included in the input sentence are translated.

出力態様選択部15が翻訳結果の出力態様を選択することによって、決定装置10では、翻訳結果の出力態様が決定される。そのため、品詞数取得部12、ログ一致数取得部13、類似度取得部14および出力態様選択部15が、翻訳結果の出力態様として単語出力および文出力のいずれの出力が行われるべきか否かを入力文に基づいて決定する決定手段を構成する。   When the output mode selection unit 15 selects the output mode of the translation result, the determination device 10 determines the output mode of the translation result. Therefore, whether the part-of-speech number acquisition unit 12, the log coincidence number acquisition unit 13, the similarity acquisition unit 14, and the output mode selection unit 15 should output either word output or sentence output as the output mode of the translation result. Is determined based on the input sentence.

また、出力態様決定システム1では、決定された翻訳結果の出力態様に従って、入力文の翻訳が行われる。この翻訳は、たとえば決定装置10の出力態様選択部15が、機械翻訳装置40を翻訳手段として用いることによって行われる。すなわち、単語出力の場合には、通信部11によって入力された入力文に含まれる単語のうちの、出力態様選択部15が単語抽出装置30を用いて抽出した単語が、決定装置10から機械翻訳装置40に送られ、機械翻訳装置40は送られた単語を翻訳する。文出力の場合には、通信部11によって入力された入力文全体が、決定装置10から機械翻訳装置40に送られ、機械翻訳装置40は送られた入力文全体を翻訳する。機械翻訳装置40による翻訳結果は、決定装置10に送られる。なお、類似度取得部14によってすでに入力文全体の翻訳が機械翻訳装置40によって行われその翻訳結果を出力態様選択部15が取得している場合には、あらためて入力文全体の翻訳を機械翻訳装置40が行う必要がないので機械翻訳装置40による翻訳処理を省略してよい。また、上述のようにログ一致数取得部13の解析結果に応じて過去と同じ出力態様が選択される場合には、ログDB50に記憶されたデータテーブル50aに含まれる、過去に行なわれた同じ入力文全体についての機械翻訳文を翻訳結果として取得することができる。この場合にも、機械翻訳装置40による翻訳処理を省略できる。さらにデータテーブル50aが単語出力での翻訳結果も入力文と対応付けて記述していれば、上述の単語抽出装置30を用いて抽出された単語の機械翻訳装置40による翻訳処理も省略できる。出力態様選択部15が機械翻訳装置40を用いて得た翻訳結果は、決定装置10の通信部11から端末装置60の通信部61に送信される。端末装置60の通信部61が受信した翻訳結果は、表示部63によって表示される。翻訳結果の表示の例は、先に図1を参照して説明したとおりである。   Further, in the output mode determination system 1, the input sentence is translated according to the output mode of the determined translation result. This translation is performed, for example, when the output mode selection unit 15 of the determination device 10 uses the machine translation device 40 as translation means. That is, in the case of word output, among the words included in the input sentence input by the communication unit 11, the words extracted by the output mode selection unit 15 using the word extraction device 30 are machine translated from the determination device 10. The machine translation device 40 translates the sent word. In the case of sentence output, the entire input sentence input by the communication unit 11 is sent from the determination apparatus 10 to the machine translation apparatus 40, and the machine translation apparatus 40 translates the entire input sentence sent. The result of translation by the machine translation device 40 is sent to the determination device 10. If the translation acquisition unit 14 has already translated the entire input sentence by the machine translation apparatus 40 and the output mode selection unit 15 has acquired the translation result, the machine translation apparatus again translates the entire input sentence. 40 does not need to be performed, the translation processing by the machine translation device 40 may be omitted. In addition, when the same output mode as the past is selected according to the analysis result of the log coincidence number acquisition unit 13 as described above, the same operation performed in the past included in the data table 50a stored in the log DB 50 is performed. A machine translation for the entire input sentence can be acquired as a translation result. Also in this case, the translation process by the machine translation device 40 can be omitted. Furthermore, if the data table 50a describes the translation result in the word output in association with the input sentence, the translation processing by the machine translation device 40 of the word extracted using the word extraction device 30 can be omitted. The translation result obtained by the output mode selection unit 15 using the machine translation device 40 is transmitted from the communication unit 11 of the determination device 10 to the communication unit 61 of the terminal device 60. The translation result received by the communication unit 61 of the terminal device 60 is displayed by the display unit 63. An example of displaying the translation result is as described above with reference to FIG.

図4は、決定装置10、形態素解析器20、単語抽出装置30、機械翻訳装置40およびログDB50(以下、ここでは決定装置10等と言う)のハードウェア構成の例を示す図である。図4に示されるように、決定装置10等は、物理的には、1または複数のCPU(Central Processing Unit)101、主記憶装置であるRAM(Random Access Memory)102およびROM(Read Only Memory)103、データ送受信デバイスである通信モジュール104、半導体メモリなどの補助記憶装置105、ユーザ操作の入力を受け付ける入力装置106、ディスプレイといった出力装置107などを備えるコンピュータとして構成され得る。先に図2を参照して説明した決定装置10等の各機能は、たとえば、CPU101、RAM102などのハードウェア上に1または複数の所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104、入力装置106、出力装置107などを動作させるとともに、RAM102および補助記憶装置105におけるデータの読み出しおよび書き込みを行うことで実現することができる。   FIG. 4 is a diagram illustrating an example of the hardware configuration of the determination device 10, the morphological analyzer 20, the word extraction device 30, the machine translation device 40, and the log DB 50 (hereinafter referred to as the determination device 10). As shown in FIG. 4, the determination device 10 or the like physically includes one or a plurality of CPUs (Central Processing Units) 101, a RAM (Random Access Memory) 102 as a main storage device, and a ROM (Read Only Memory). 103, a communication module 104 that is a data transmission / reception device, an auxiliary storage device 105 such as a semiconductor memory, an input device 106 that receives an input of a user operation, an output device 107 such as a display, and the like. Each function of the determination apparatus 10 and the like described above with reference to FIG. 2 is controlled under the control of the CPU 101 by, for example, reading one or a plurality of predetermined computer software on the hardware such as the CPU 101 and the RAM 102. Thus, the communication module 104, the input device 106, the output device 107, and the like are operated, and data is read and written in the RAM 102 and the auxiliary storage device 105.

図5は、出力態様決定システム1において実行される処理の一例を示すフローチャートである。このフローチャートの処理は、たとえば、端末装置60において出力態様決定システム1を利用するためのアプリケーションが起動されているときに、ユーザUが発話を行うことによって実行される。   FIG. 5 is a flowchart illustrating an example of processing executed in the output mode determination system 1. The process of this flowchart is executed when the user U speaks when an application for using the output mode determination system 1 is activated in the terminal device 60, for example.

ステップS1において、出力態様決定システム1では、入力文が取得される。具体的に、端末装置60の取得部62が、ユーザUが発した音声に対応する入力文を取得する。そして、端末装置60の通信部61が、取得部62によって取得された入力文を、出力態様決定システム1の決定装置10の通信部11に送信する。さらに、決定装置10の通信部11が、端末装置60の通信部61から送信された入力文を受信する。   In step S1, the output mode determination system 1 acquires an input sentence. Specifically, the acquisition unit 62 of the terminal device 60 acquires an input sentence corresponding to the voice uttered by the user U. And the communication part 61 of the terminal device 60 transmits the input sentence acquired by the acquisition part 62 to the communication part 11 of the determination apparatus 10 of the output mode determination system 1. Further, the communication unit 11 of the determination device 10 receives the input sentence transmitted from the communication unit 61 of the terminal device 60.

ステップS2において、形態素解析が実行される。具体的に、形態素解析器20が、先のステップS1で入力された入力文に対して形態素解析を行う。   In step S2, morphological analysis is performed. Specifically, the morpheme analyzer 20 performs morpheme analysis on the input sentence input in the previous step S1.

ステップS3において、ログ一致数が予め定められたログ一致数N以上であるか否かが判断される。具体的に、決定装置10のログ一致数取得部13が、ログDB50に記憶されたデータテーブル50aから、先のステップS1で入力された入力文と一致する入力文の過去の発話回数(図3参照)をログ一致数として取得する。なお、データテーブル50aに一致する入力文がない場合には、先に説明したようにデータテーブル50aにおいて発話回数が1に設定されるので、ログ一致数=1としてこのステップS3の処理が行われる。ログ一致数がN以上である場合(ステップS3:YES)、ステップS11に処理が進められる。そうでない場合(ステップS3:NO)、ステップS4に処理が進められる。 In step S3, whether the log number of matches is predetermined log matches the number N 1 or more is determined. Specifically, the log matching number acquisition unit 13 of the determination device 10 determines the past number of utterances of the input sentence that matches the input sentence input in the previous step S1 from the data table 50a stored in the log DB 50 (FIG. 3). Reference) is acquired as the number of log matches. If there is no input sentence that matches the data table 50a, the number of utterances is set to 1 in the data table 50a as described above, so the processing in step S3 is performed with the number of log matches = 1. . If the number of log matches is N 1 or more (step S3: YES), the process proceeds to step S11. If not (step S3: NO), the process proceeds to step S4.

ステップS4において、入力文に含まれる品詞が名詞または動詞のみであるか否かが判断される。具体的に、決定装置10の出力態様選択部15が、先のステップS2で行われた形態素解析の解析結果を用いて、先のステップS1で入力された入力文に含まれるすべての単語の品詞が、名詞または動詞のみであるか否かを判断する。入力文に含まれる品詞が名詞または動詞のみの場合(ステップS4:YES)、ステップS9に処理が進められる。そうでない場合(ステップS4:NO)、ステップS5に処理が進められる。   In step S4, it is determined whether or not the part of speech included in the input sentence is only a noun or a verb. Specifically, the output mode selection unit 15 of the determination apparatus 10 uses the analysis result of the morphological analysis performed in the previous step S2, and the part of speech of all words included in the input sentence input in the previous step S1. To determine if it is only a noun or verb. If the part of speech included in the input sentence is only a noun or a verb (step S4: YES), the process proceeds to step S9. Otherwise (step S4: NO), the process proceeds to step S5.

ステップS5において、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数N以下であるか否かが判断される。具体的に、決定装置10の品詞数取得部12が、先のステップS2での形態素解析の解析結果を用いて、先のステップS1で入力された入力文に含まれる名詞の数および動詞の数をそれぞれカウントして取得する。そして、出力態様選択部15が、品詞数取得部12によって取得された名詞の数および動詞の数の少なくとも一方がN以下であるか否かを判断する。なお、予め定められた品詞数Nは、名詞に対して定められる場合と、動詞に対して定められる場合とで異なる値であってもよい。入力文に含まれる名詞の数または動詞の数がN以下の場合(ステップS5:YES)、ステップS6およびステップS7に処理が進められる。そうでない場合(ステップS5:NO)、ステップS8に処理が進められる。 In step S5, the noun and / or whether the number of verbs is less part of speech the number N 2 of predetermined included in the input sentence is determined. Specifically, the part-of-speech number acquisition unit 12 of the determination device 10 uses the analysis result of the morphological analysis in the previous step S2, and the number of nouns and the number of verbs included in the input sentence input in the previous step S1. Is counted and acquired. Then, the output mode selection unit 15 determines whether at least one of the number of nouns and the number of verbs acquired by the part-of-speech acquisition unit 12 is N 2 or less. Note that the predetermined part-of-speech number N 2 may be different depending on whether it is determined for a noun or a verb. If the number of nouns or verbs included in the input sentence is N 2 or less (step S5: YES), the process proceeds to step S6 and step S7. Otherwise (step S5: NO), the process proceeds to step S8.

ステップS6において、機械翻訳が実施される。具体的に、決定装置10の類似度取得部14が、機械翻訳装置40を用いて、先のステップS1で入力された入力文全体についての翻訳結果を取得する。さらに、類似度取得部14が、機械翻訳装置40を用いて、取得した翻訳結果全体についての再翻訳結果をさらに取得する。   In step S6, machine translation is performed. Specifically, using the machine translation device 40, the similarity acquisition unit 14 of the determination device 10 acquires a translation result for the entire input sentence input in the previous step S1. Further, using the machine translation device 40, the similarity acquisition unit 14 further acquires a retranslation result for the entire acquired translation result.

ステップS7において、類似度が予め定められた類似度N以上であるか否かが判断される。具体的に、決定装置10の類似度取得部14が、先のステップS1で入力された入力文と、先のステップS6で取得された再翻訳結果とを比較することによって類似度を取得する。類似度の例は上述のコサイン類似度である。そして、出力態様選択部15が、類似度取得部14によって取得された類似度がN以上であるか否かを判断する。類似度がN以上の場合(ステップS7:YES)、ステップS10に処理が進められる。そうでない場合(ステップS7:NO)、ステップS8に処理が進められる。 In step S7, whether the degree of similarity is predetermined similarity N 3 or more is determined. Specifically, the similarity acquisition unit 14 of the determination apparatus 10 acquires the similarity by comparing the input sentence input in the previous step S1 with the retranslation result acquired in the previous step S6. An example of the similarity is the above-mentioned cosine similarity. Then, the output mode selecting section 15, degree of similarity acquired by the similarity degree acquiring section 14 determines whether or not N 3 or more. When the similarity is N 3 or more (step S7: YES), the process proceeds to step S10. Otherwise (step S7: NO), the process proceeds to step S8.

ステップS8において、翻訳結果を単語出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されておらず(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数がNより大きいので(ステップS5:NO)、入力文の翻訳における出力態様として単語出力を選択する。このように出力態様として単語出力を選択するのは、先に説明した知見に基づいて、名詞または動詞以外の品詞が入力文に含まれるという点で出力態様として文出力を選択してよいが(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数より大きいという点で出力態様として単語出力を選択するとよい(ステップS5:NO)という理由による。ステップS8の処理が完了した後、ステップS12に処理が進められる。 In step S8, it is determined that the translation result should be output as a word. That is, the output mode selecting section 15 of the determination unit 10, the log number of matches for the entered input sentence in the previous step S1 is less than N 1 (Step S3: NO), the input sentence is composed of only a noun or a verb If not (step S4: NO) and the number of nouns and / or verbs included in the input sentence is greater than N 2 (step S5: NO), word output is selected as the output mode in the translation of the input sentence. Although the word output is selected as the output mode in this way, the sentence output may be selected as the output mode in that the part of speech other than the noun or the verb is included in the input sentence based on the knowledge described above ( This is because the word output may be selected as the output mode in that the number of nouns and / or verbs included in the input sentence is larger than the predetermined number of parts of speech (step S5: NO). After the process of step S8 is completed, the process proceeds to step S12.

ステップS9においては、翻訳結果を単語出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されているので(ステップS4:YES)、入力文の翻訳における出力態様として単語出力を選択する。このように出力態様として単語出力を選択するのは、先に説明したように、入力文に含まれる品詞が名詞または動詞のみであるという点で、品詞数に基づく判断(ステップS5)、類似度に基づく判断(ステップS7)に優先して、出力態様として単語出力を選択するためである。ただし、先に説明したように、このステップS9での単語出力では、翻訳対象は、ステップS1で入力された入力文に含まれるすべての単語であるので、図5において、ステップS9を、先に説明したステップS8と区別して図示している。 In step S9, it is determined that the translation result should be output as a word. That is, the output mode selecting section 15 of the determination unit 10, the log number of matches for the entered input sentence in the previous step S1 is less than N 1 (Step S3: NO), the input sentence is composed of only a noun or a verb (Step S4: YES), the word output is selected as the output mode in the translation of the input sentence. As described above, the word output is selected as the output mode in this way because the part of speech included in the input sentence is only a noun or a verb, based on the number of parts of speech (step S5), similarity This is because the word output is selected as the output mode in preference to the determination based on (step S7). However, as described above, in the word output in step S9, because the translation target is all the words included in the input sentence input in step S1, step S9 in FIG. It is shown separately from step S8 described.

ステップS10においては、翻訳結果を文出力すべきと決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN未満であり(ステップS3:NO)、入力文が名詞または動詞のみで構成されておらず(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数がN以下であり(ステップS5:YES)、入力文と再翻訳結果との類似度がN以上であるので(ステップS7:YES)、入力文の翻訳における出力態様として文出力を選択する。このように出力態様として文出力を選択する理由は、先に説明した知見に基づいて、名詞または動詞以外の品詞が入力文に含まれるという点で出力態様として文出力を選択してよいが(ステップS4:NO)、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数より以下であるという点でも出力態様として文出力を選択するとよく(ステップS5:YES)、さらに、類似度も予め定められた類似度以上であるという点で出力態様として文出力を選択する(ステップS7:YES)という理由による。 In step S10, it is determined that the translation result should be output as a sentence. That is, the output mode selecting section 15 of the determination unit 10, the log number of matches for the entered input sentence in the previous step S1 is less than N 1 (Step S3: NO), the input sentence is composed of only a noun or a verb (Step S4: NO), the number of nouns and / or verbs included in the input sentence is N 2 or less (Step S5: YES), and the similarity between the input sentence and the retranslation result is N 3 or more. Therefore (step S7: YES), the sentence output is selected as the output mode in the translation of the input sentence. The reason for selecting the sentence output as the output mode in this way is that the sentence output may be selected as the output mode in that the part of speech other than the noun or the verb is included in the input sentence based on the knowledge described above ( Step S4: NO), sentence output may be selected as an output mode also in that the number of nouns and / or verbs included in the input sentence is less than the predetermined number of parts of speech (step S5: YES), This is because the sentence output is selected as the output mode in that the similarity is equal to or higher than a predetermined similarity (step S7: YES).

ステップS11においては、翻訳結果の出力態様が過去と同じ出力態様に決定される。すなわち、決定装置10の出力態様選択部15は、先のステップS1において入力された入力文についてのログ一致数がN以上であるので(ステップS3:YES)、先に説明したようにログDB50に記憶されたデータテーブル50aを参照して、翻訳結果の出力態様として過去と同じ出力態様を選択する。このように出力態様を選択するのは、先に説明したように、入力文と同一の文が過去に多数入力されているという点で、品詞に基づく判断(ステップS4、S5)、類似度に基づく判断(ステップS7)に優先して、出力態様として過去と同じ出力態様を選択するためである。 In step S11, the output form of the translation result is determined to be the same output form as the past. That is, the output mode selection unit 15 of the determination apparatus 10 has a log DB 50 as described above because the number of log matches for the input sentence input in the previous step S1 is N 1 or more (step S3: YES). The same output mode as the past is selected as the output mode of the translation result. The output mode is selected in this way, as described above, because many sentences identical to the input sentence have been input in the past, the judgment based on the part of speech (steps S4 and S5), and the similarity This is because the same output mode as the past is selected as the output mode in preference to the determination based on (step S7).

上述のステップS8およびステップS9の処理が完了した後は、ステップS12〜S14に処理が進められる。上述のステップS10の処理が完了した後は、ステップS12をスキップしてステップS13およびステップS14に処理が進められる。上述のステップS11の処理が完了した後は、ステップS12の処理が必要な場合にはステップS12の処理を実行した後に、ステップS12の処理が不要な場合にはステップS12をスキップして、ステップS13およびステップS14に処理が進められる。ステップS12の処理が必要な場合とは、データテーブル50aが単語出力での翻訳結果を含んでおらず、単語抽出装置30を用いて抽出された単語の機械翻訳装置40による翻訳処理が必要な場合である。   After the process of step S8 and step S9 is completed, the process proceeds to steps S12 to S14. After the process of step S10 is completed, step S12 is skipped and the process proceeds to steps S13 and S14. After the process of step S11 is completed, after the process of step S12 is executed if the process of step S12 is necessary, the process of step S12 is skipped if the process of step S12 is unnecessary. Then, the process proceeds to step S14. The case where the process of step S12 is necessary means that the data table 50a does not include the translation result in the word output, and the translation process by the machine translation device 40 of the word extracted using the word extraction device 30 is necessary. It is.

ステップS12において、決定結果に従って機械翻訳が実施される。具体的に、決定装置10の出力態様選択部15が、単語抽出装置30を用いて、先のステップS1で入力された入力文から、翻訳対象となる単語を抽出する。そして、出力態様選択部15は、機械翻訳装置40を用いて、抽出した単語についての翻訳結果を取得する。   In step S12, machine translation is performed according to the determination result. Specifically, the output mode selection unit 15 of the determination device 10 uses the word extraction device 30 to extract a word to be translated from the input sentence input in the previous step S1. And the output mode selection part 15 acquires the translation result about the extracted word using the machine translation apparatus 40. FIG.

ステップS13において、決定結果に従って翻訳結果が出力される。具体的に、先のステップS8またはステップS9の処理が実行された場合には、決定装置10の通信部11が、先のステップS12で取得された翻訳結果(入力文に含まれる単語についての翻訳結果)を端末装置60の通信部61に送信する。先のステップS10の処理が実行された場合には、決定装置10の通信部11が、先のステップS6で取得された翻訳結果(入力文全体についての翻訳結果)を端末装置60の通信部61に送信する。先のステップS11の処理が実行された場合には、決定装置10の通信部が、ログDB50に記憶されたデータテーブル50aに含まれる、過去に行なわれた同じ入力文についての翻訳結果を端末装置60の通信部61に送信する。ただし先に説明したようにステップS12の処理が必要な場合には、ステップS12で取得された翻訳結果が端末装置60の通信部61に送信される。そして、端末装置60の表示部63が、翻訳結果を出力する。先に説明したように、単語出力の場合には表示部63によって表示された翻訳結果に含まれる一部の単語がユーザ操作によって削除され得るので、単語が削除された場合には、削除された単語の情報が端末装置60の通信部61から出力態様決定システム1の決定装置10の通信部11に送信され、決定装置10からログDB50に送られることによってフィードバックされる。   In step S13, the translation result is output according to the determination result. Specifically, when the process of the previous step S8 or step S9 is executed, the communication unit 11 of the determination device 10 performs the translation result (translation on the word included in the input sentence) acquired in the previous step S12. Result) is transmitted to the communication unit 61 of the terminal device 60. When the process of previous step S10 is executed, the communication unit 11 of the determination device 10 uses the translation result (translation result for the entire input sentence) acquired in the previous step S6 to the communication unit 61 of the terminal device 60. Send to. When the processing of the previous step S11 is executed, the communication unit of the determination device 10 displays the translation result for the same input sentence that has been performed in the past included in the data table 50a stored in the log DB 50 as a terminal device. 60 to the communication unit 61. However, as described above, when the process in step S12 is necessary, the translation result acquired in step S12 is transmitted to the communication unit 61 of the terminal device 60. And the display part 63 of the terminal device 60 outputs a translation result. As described above, in the case of word output, some words included in the translation result displayed by the display unit 63 can be deleted by a user operation. Therefore, when a word is deleted, it is deleted. The word information is transmitted from the communication unit 61 of the terminal device 60 to the communication unit 11 of the determination device 10 of the output mode determination system 1 and fed back by being sent from the determination device 10 to the log DB 50.

ステップS14において、ログDB、単語DBが更新される。たとえば、先のステップS1において取得された入力文が、通信部11からログDB50に送られることによって、データテーブル50aが更新される。先のステップS6で取得された入力文全体についての翻訳結果および再翻訳結果が、類似度取得部14からログDB50に送られることによって、データテーブル50aが更新される。ステップS7で取得され用いられた類似度が、類似度取得部14からログDB50に送られることによって、データテーブル50aが更新される。ステップS8〜S10で決定された出力態様の情報が、出力態様選択部15からログDB50に送られることによって、データテーブル50aが更新される。また、たとえば、先のステップS12で削除された単語の情報が、決定装置10から単語抽出装置30に送られることによって、単語DB32が更新される。   In step S14, the log DB and the word DB are updated. For example, the data sentence 50a is updated by sending the input sentence acquired in the previous step S1 from the communication unit 11 to the log DB 50. The translation result and the retranslation result for the entire input sentence acquired in the previous step S6 are sent from the similarity acquisition unit 14 to the log DB 50, whereby the data table 50a is updated. The similarity acquired and used in step S7 is sent from the similarity acquisition unit 14 to the log DB 50, whereby the data table 50a is updated. Information on the output mode determined in steps S8 to S10 is sent from the output mode selection unit 15 to the log DB 50, whereby the data table 50a is updated. Further, for example, the word DB 32 is updated by sending the information of the word deleted in the previous step S12 from the determining device 10 to the word extracting device 30.

以上説明した出力態様決定システム1によれば、翻訳結果の出力態様として、単語出力が適切であるか文出力が適切であるかは翻訳の対象である入力文の特徴に依存し得るという知見に基づいて、単語出力および文出力のいずれの出力が行われるべきかが入力文に基づいて決定される(ステップS3〜S11)。よって、入力文の特徴から、翻訳における適切な出力態様を決定することができる。   According to the output mode determination system 1 described above, whether the word output or the sentence output is appropriate as the output mode of the translation result can depend on the characteristics of the input sentence to be translated. Based on the input sentence, it is determined which of the word output and the sentence output should be performed (steps S3 to S11). Therefore, an appropriate output mode in translation can be determined from the features of the input sentence.

また、上述の決定結果に従って入力文が翻訳され(ステップS6、S12)、翻訳結果が出力される(ステップS13)。これにより、適切な出力態様での翻訳結果を出力することができる。その結果、たとえば、入力文全体機械翻訳した場合に翻訳精度が得られにくい長文や崩れた文章においては、単語翻訳とすることで、より適切な翻訳結果が出力される。したがって、翻訳によるコミュニケーションにおいて、コミュニケーションのスピードが遅くなってしまうといった支障が生じることを抑制できる。   Further, the input sentence is translated according to the above determination result (steps S6 and S12), and the translation result is output (step S13). Thereby, the translation result in an appropriate output mode can be output. As a result, for example, in the case of a long sentence or a broken sentence in which translation accuracy is difficult to be obtained when the entire input sentence is machine-translated, a more appropriate translation result is output by using word translation. Therefore, it is possible to suppress the occurrence of a problem that the communication speed is slow in communication by translation.

上述の決定は、入力された入力文と、過去に入力された入力文とを比較し、その比較結果に基づいて行われる(ステップS3)。たとえば、入力された入力文と一致する入力文が過去に入力された回数(ログ一致回数)が予め定められたログ一致数N以上である場合には、翻訳結果の出力態様が過去と同じ出力態様に決定される(ステップS11)。これにより、たとえば、同一の入力文が繰り返し入力され同じ翻訳結果が繰り返し出力された文であるという入力文の特徴があり、その結果、ユーザはその入力文についての翻訳結果の翻訳精度に満足している可能性があるので、翻訳結果の出力態様としては、過去と同じ出力態様が適切である、という知見に従ったより適切な出力態様を決定できる。また、入力文が入力されるたびに、ログDB50に記憶されたデータテーブル50a中の入力文の数(入力文の種類、および、過去の発話回数(ログ一致数))が増加する。その結果、より多くの種類の予め定められた入力文を上述の比較に用いることで、より適切な比較結果を得ることができるようになる。すなわち、実際にユーザによって入力されたさまざまな入力文を上述の比較に用いることで、ユーザに適した翻訳結果の出力態様を決定することができるようになる。さらに、過去と同じ出力態様が選択された場合には、過去の翻訳結果がそのまま利用できるので、品詞や類似度に基づいて出力態様を決定する処理(ステップS4〜S10)や、それらの決定結果に従って機械翻訳を実行する処理(ステップS12)を省略し、決定装置10の処理負担を軽減することもできる。 The above-described determination is performed based on the comparison result by comparing the input sentence that has been input with the input sentence that has been input in the past (step S3). For example, if the input sentence that matches the entered input sentence is the past number entered in the (log number of coincidences) log matches the number N 1 or more predetermined, the output mode of translation result is the same as the past The output mode is determined (step S11). Thus, for example, there is a feature of an input sentence that the same input sentence is repeatedly input and the same translation result is repeatedly output. As a result, the user is satisfied with the translation accuracy of the translation result for the input sentence. Therefore, it is possible to determine a more appropriate output mode in accordance with the knowledge that the same output mode as the past is appropriate as the output mode of the translation result. Each time an input sentence is input, the number of input sentences (type of input sentence and the number of past utterances (number of log matches)) in the data table 50a stored in the log DB 50 increases. As a result, more appropriate comparison results can be obtained by using more types of predetermined input sentences for the above-described comparison. That is, by using various input sentences actually input by the user for the above-described comparison, it is possible to determine the output mode of the translation result suitable for the user. Furthermore, when the same output mode as the past is selected, the past translation result can be used as it is, so the process of determining the output mode based on the part of speech and the similarity (steps S4 to S10), and the determination results thereof Accordingly, the process of executing machine translation (step S12) can be omitted, and the processing load on the determination apparatus 10 can be reduced.

上述の決定は、入力文に含まれる単語の品詞が特定され、その特定結果に基づいて行われる(ステップS4、S5)。たとえば、入力文に含まれる単語の品詞のうち、名詞および/または動詞の数が予め定められた品詞数N以下の場合には、文出力すべきと決定される可能性が高められる(ステップS5:YES、ステップS10)。これにより、たとえば、入力文の内容が専門的な商品の説明を行うものである場合には入力文に多くの名詞が含まれるという特徴があり、その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があるので、翻訳結果の出力態様としては、文出力よりも単語出力の方が適切である、という知見、および/または、入力文が長文または複文のような複雑な文である場合には入力文に多くの動詞が含まれるという特徴があり、その結果、入力文全体を翻訳した場合の翻訳精度が低くなる傾向があるので、翻訳における出力態様としては、文出力よりも単語出力の方が適切である、という知見に従ったより適切な出力態様を決定できる。 The above-mentioned determination is performed based on the part of speech of the word included in the input sentence and the identification result (steps S4 and S5). For example, if the number of nouns and / or verbs is less than or equal to a predetermined number of parts of speech N 2 among the parts of speech of words included in the input sentence, the possibility that the sentence should be output is increased (step S5: YES, step S10). As a result, for example, when the content of the input sentence explains a specialized product, there is a feature that the input sentence contains many nouns, and as a result, the translation when the entire input sentence is translated Since the accuracy tends to be low, the knowledge that word output is more appropriate than sentence output as the output form of translation results and / or the input sentence is a complex sentence such as a long sentence or compound sentence In some cases, there is a feature that many verbs are included in the input sentence, and as a result, the translation accuracy tends to be low when the entire input sentence is translated. A more appropriate output mode can be determined in accordance with the knowledge that word output is more appropriate.

また、上述の決定は、入力文が予め定められた品詞の単語から構成されているか否かに応じて行われる(ステップS4)。たとえば、入力文が名詞または動詞の単語のみで構成されている場合には、単語出力すべきと決定される(ステップS4:YES、ステップS9)。これにより、入力文に含まれる単語の品詞が名詞または動詞のみである場合には、ユーザにとって重要な単語が直近の翻訳結果に含まれていなかったためユーザが再度ユーザにとって重要な単語のみを発話しているといった可能性、つまり入力文がユーザにとって重要な単語のみで構成されるという特徴があり、出力態様としては、文出力よりも単語出力の方が適切である、という知見に従ったより適切な出力態様を決定することができる。   In addition, the above-described determination is performed depending on whether or not the input sentence is composed of words with a predetermined part of speech (step S4). For example, when the input sentence is composed only of noun or verb words, it is determined that the word should be output (step S4: YES, step S9). As a result, when the part of speech of the word included in the input sentence is only a noun or a verb, the word important for the user is not included in the latest translation result, so the user speaks only the word important for the user again. There is a feature that the input sentence is composed only of words that are important to the user, and the output mode is more appropriate according to the knowledge that word output is more appropriate than sentence output The output mode can be determined.

上述の決定は、入力文全体についての翻訳結果を取得し、さらに、取得した翻訳結果の入力文の言語への再翻訳結果を取得し(ステップS6)、入力文と、取得した再翻訳結果との類似度を算出し、算出した類似度に基づいて行われてもよい(ステップS7)。たとえば、類似度が予め定められた類似度N以上の場合には、文出力すべきと決定される(ステップS7:YES、ステップS10)。これにより、類似度が高い場合には入力文全体の翻訳精度も高くなるので、翻訳における出力態様としては、文出力が適切である、という知見に従ったより適切な出力態様を決定することができる。 The above-mentioned determination acquires the translation result for the entire input sentence, further acquires the retranslation result of the acquired translation result into the language of the input sentence (step S6), and the input sentence, the acquired retranslation result, The similarity may be calculated based on the calculated similarity (step S7). For example, if the similarity is a similarity N 3 than the predetermined is determined to be text output (Step S7: YES, step S10). As a result, when the degree of similarity is high, the translation accuracy of the entire input sentence is also increased. Therefore, a more appropriate output mode according to the knowledge that the sentence output is appropriate can be determined as an output mode in translation. .

また、単語出力が行われた場合には、削除された単語の情報が、単語抽出装置30の単語DB32にフィードバックされる(ステップS14)。これにより、ユーザが翻訳結果として出力しなくてよいと考える単語が抽出されにくくなるので、結果として、ユーザが翻訳結果として出力されるべきであると考える重要な単語が抽出されやすくなる。この効果は、出力態様決定システム1による翻訳の機能が使用され続け、繰り返しフィードバックが行われることによって高められる。   When the word output is performed, the deleted word information is fed back to the word DB 32 of the word extracting device 30 (step S14). This makes it difficult to extract words that the user does not need to output as translation results, and as a result, it is easy to extract important words that the user should output as translation results. This effect is enhanced by continuing to use the function of translation by the output mode determination system 1 and repeatedly performing feedback.

以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではない。たとえば、上記実施形態では、出力態様の決定は、ログ一致数(ステップS3)、入力文に含まれる品詞の数(ステップS4、S5)、入力文と再翻訳結果との類似度(ステップS7)のすべての解析結果を考慮して行われていたが、品詞の数の解析結果または類似度の解析結果のみに基づいて出力態様が決定されてもよい。   Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment. For example, in the above embodiment, the output mode is determined by the number of log matches (step S3), the number of parts of speech included in the input sentence (steps S4 and S5), and the similarity between the input sentence and the retranslation result (step S7). However, the output mode may be determined based on only the analysis result of the number of parts of speech or the analysis result of the similarity.

入力文に含まれる品詞の数のみに基づいて出力態様を決定するときは、たとえば、入力文に含まれる名詞および/または動詞の数が予め定められた品詞数Nより大きいの場合には単語出力すべきと決定し、そうでない場合には文出力すべきと決定してよい。類似度のみに基づいて出力態様を決定するときは、たとえば、類似度が予め定められた類似度N以上の場合には文出力すべきと決定し、そうでない場合には単語出力すべきと決定してよい。 When determining the output mode based only on the number of parts of speech included in the input sentence, for example, when the number of nouns and / or verbs included in the input sentence is larger than a predetermined number of parts of speech N 2 It may be determined that it should be output, otherwise it should be determined that a sentence should be output. When determining the output mode based only on the similarity, for example, it is determined that the sentence should be output when the similarity is equal to or higher than a predetermined similarity N 3, and the word should be output otherwise. You may decide.

なお、上記実施形態では、出力態様決定システムが、決定した出力態様に従う翻訳結果を取得し、その翻訳結果が端末装置に送信される例について説明したが、本発明に係る出力態様決定システムでは、少なくとも出力態様が決定されればよく、翻訳結果の取得は必須ではない。   In the above embodiment, the output mode determination system has described an example in which the translation result according to the determined output mode is acquired and the translation result is transmitted to the terminal device. However, in the output mode determination system according to the present invention, It is sufficient that at least the output mode is determined, and acquisition of the translation result is not essential.

1…出力態様決定システム、11…通信部(入力手段)、12…品詞数取得部(決定手段)、13…ログ一致数取得部(決定手段)、14…類似度取得部(決定手段)、15…出力態様選択部(決定手段)、40…機械翻訳装置(翻訳手段)、50…ログDB(記憶手段)。   DESCRIPTION OF SYMBOLS 1 ... Output mode determination system, 11 ... Communication part (input means), 12 ... Part-of-speech number acquisition part (determination means), 13 ... Log matching number acquisition part (determination means), 14 ... Similarity acquisition part (determination means), 15 ... Output mode selection unit (determination means), 40 ... Machine translation device (translation means), 50 ... Log DB (storage means).

Claims (6)

翻訳の対象である入力文を入力する入力手段と、
前記入力文に含まれる単語についての翻訳結果を出力する単語出力、および、前記入力文全体についての翻訳結果を出力する文出力、のいずれの出力が行われるべきかを、前記入力手段によって入力された入力文に基づいて決定する決定手段と、
を備える、
出力態様決定システム。
An input means for inputting an input sentence to be translated;
The input means inputs whether a word output that outputs a translation result for a word included in the input sentence or a sentence output that outputs a translation result for the entire input sentence is to be performed. Determining means for determining based on the input sentence;
Comprising
Output mode determination system.
前記決定手段の決定結果に従って前記入力手段によって入力された入力文を翻訳する翻訳手段と、
前記翻訳手段による翻訳結果を出力する出力手段をさらに備える、
請求項1に記載の出力態様決定システム。
Translation means for translating the input sentence input by the input means according to the determination result of the determination means;
Further comprising output means for outputting a translation result by the translation means,
The output mode determination system according to claim 1.
前記入力手段によって過去に入力された入力文を記憶する記憶手段をさらに備え、
前記決定手段は、前記入力手段によって入力された入力文と、前記記憶手段に記憶された前記過去に入力された入力文とを比較し、その比較結果に基づいて前記決定を行う、
請求項1または2に記載の出力態様決定システム。
Storage means for storing input sentences previously input by the input means;
The determination unit compares the input sentence input by the input unit with the input sentence input in the past stored in the storage unit, and performs the determination based on the comparison result.
The output mode determination system according to claim 1 or 2.
前記決定手段は、前記入力文に含まれる単語の品詞を特定し、その特定結果に基づいて前記決定を行う、
請求項1または2に記載の出力態様決定システム。
The determining means specifies a part of speech of a word included in the input sentence, and performs the determination based on the specifying result;
The output mode determination system according to claim 1 or 2.
前記決定手段は、前記入力文が予め定められた品詞の単語から構成されているか否かに応じて前記決定を行う、
請求項4に記載の出力態様決定システム。
The determining means performs the determination according to whether or not the input sentence is composed of words of a predetermined part of speech.
The output mode determination system according to claim 4.
前記決定手段は、前記入力手段によって入力された入力文全体についての翻訳結果を取得し、さらに、取得した前記翻訳結果の前記入力文の言語への再翻訳結果を取得し、前記入力手段によって入力された入力文と、取得した再翻訳結果との類似度を算出し、算出した類似度に基づいて前記決定を行う、
請求項1〜5のいずれか1項に記載の出力態様決定システム。
The determination unit acquires a translation result for the entire input sentence input by the input unit, further acquires a retranslation result of the acquired translation result into the language of the input sentence, and is input by the input unit Calculating the similarity between the input sentence and the acquired retranslation result, and making the determination based on the calculated similarity,
The output mode determination system according to any one of claims 1 to 5.
JP2016128444A 2016-06-29 2016-06-29 Output mode determination system Pending JP2018005368A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016128444A JP2018005368A (en) 2016-06-29 2016-06-29 Output mode determination system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016128444A JP2018005368A (en) 2016-06-29 2016-06-29 Output mode determination system

Publications (1)

Publication Number Publication Date
JP2018005368A true JP2018005368A (en) 2018-01-11

Family

ID=60946338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016128444A Pending JP2018005368A (en) 2016-06-29 2016-06-29 Output mode determination system

Country Status (1)

Country Link
JP (1) JP2018005368A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020009261A1 (en) * 2018-07-02 2020-01-09 엘지전자 주식회사 Digital device capable of voice recognition and control method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020009261A1 (en) * 2018-07-02 2020-01-09 엘지전자 주식회사 Digital device capable of voice recognition and control method thereof

Similar Documents

Publication Publication Date Title
CN110678859B (en) Display device
US9754592B2 (en) Methods and systems for speech-enabling a human-to-machine interface
JP4058071B2 (en) Example translation device, example translation method, and example translation program
US7047195B2 (en) Speech translation device and computer readable medium
WO2018157789A1 (en) Speech recognition method, computer, storage medium, and electronic apparatus
US20160162466A1 (en) Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
US20140350934A1 (en) Systems and Methods for Voice Identification
US20160267902A1 (en) Speech recognition using a foreign word grammar
CN107844470B (en) Voice data processing method and equipment thereof
EP2887229A2 (en) Communication support apparatus, communication support method and computer program product
US20150019200A1 (en) Socially derived translation profiles to enhance translation quality of social content using a machine translation
US20220261545A1 (en) Systems and methods for producing a semantic representation of a document
US10366173B2 (en) Device and method of simultaneous interpretation based on real-time extraction of interpretation unit
US11403470B2 (en) Translation device
CN113302683B (en) Multi-tone word prediction method, disambiguation method, device, apparatus, and computer-readable storage medium
WO2020178856A1 (en) A chatbot system using asynchronous dialog state machine
WO2022022049A1 (en) Long difficult text sentence compression method and apparatus, computer device, and storage medium
JP2012159969A (en) Machine translation device, method and program
JP5901694B2 (en) Dictionary database management device, API server, dictionary database management method, and dictionary database management program
CN112149403A (en) Method and device for determining confidential text
JP2018005368A (en) Output mode determination system
JP5300576B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP2004240859A (en) Paraphrasing system
CN110599028B (en) Text positioning method, device, equipment and storage medium
CN111813989A (en) Information processing method, device and storage medium

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160630