JP4986549B2 - 電子機器、その制御方法、および、翻訳文出力用プログラム - Google Patents

電子機器、その制御方法、および、翻訳文出力用プログラム Download PDF

Info

Publication number
JP4986549B2
JP4986549B2 JP2006240641A JP2006240641A JP4986549B2 JP 4986549 B2 JP4986549 B2 JP 4986549B2 JP 2006240641 A JP2006240641 A JP 2006240641A JP 2006240641 A JP2006240641 A JP 2006240641A JP 4986549 B2 JP4986549 B2 JP 4986549B2
Authority
JP
Japan
Prior art keywords
language
word
translation
sentence
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006240641A
Other languages
English (en)
Other versions
JP2008065469A (ja
Inventor
英康 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006240641A priority Critical patent/JP4986549B2/ja
Publication of JP2008065469A publication Critical patent/JP2008065469A/ja
Application granted granted Critical
Publication of JP4986549B2 publication Critical patent/JP4986549B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

本発明は、電子機器に関し、特に、翻訳結果として多言語混在文を出力することができる電子機器、その制御方法、および、翻訳文出力用プログラムに関する。
従来から、異なる言語で会話をする人たちの間でのコミュニケーションを円滑にするためのツールの一つとして翻訳機が利用されてきた。そして、このような翻訳機に関して、種々の技術が開示されてきている。
なお、異なる言語を使う人たちの間で会話がなされる場合、その場のすべての人が理解できるように、お互いの言語を混在させた文(以下、多言語混在文と呼ぶ)が利用される場合がある。
そして、翻訳機において多言語混在文を扱う技術についても、種々開示されている。
たとえば、特許文献1には、原語(原文が記述された言語または原文が主として対応する言語)と目的言語(翻訳文が記述される言語または翻訳文が主に対応する言語)が混在する原文を翻訳する際に、ユーザから原語で記述された部分と目的言語で記述された部分を指定する情報の入力を受付け、当該情報に応じて、部分毎に使用する辞書を選択する技術が開示されている。
また、特許文献2には、目的言語の単語が混在した原文の翻訳において、原文中の当該目的言語の単語について、原語における品詞を推定し、当該推定結果に基づいて目的言語における適正な品詞を取得し、そして、取得した適正な品詞で表現することにより、多言語混在文を目的言語に従った適切な翻訳文へと翻訳する技術が開示されている。
特開平10−63668号公報 特開平9−179866号公報
従来の翻訳機では、翻訳の結果として多言語混在文を出力するものはなかった。なお、目的言語において対応する単語を検索できないために、翻訳文において原文の中の一部の単語を原語のままで含めることによって、結果として多言語混在文が出力されることはあった。
しかしながら、このようにして出力される多言語混在文が翻訳文としてコミュニケーションの相手に提示されても、原語のまま提示された単語は当該相手には理解されない可能性が高い。
本発明は、かかる実情に鑑み考え出されたものであり、その目的は、翻訳文として有用な多言語混在文を出力することができる電子機器、その制御方法、および、翻訳文出力用プログラムを提供することである。
本発明に従った電子機器は、翻訳文を出力する手段を備えた電子機器において、原言語の複数の単語を含む原文を入力する原文入力手段と、複数の言語の辞書を記憶する翻訳辞書記憶手段と、複数の言語の文法規則を記憶する文法規則記憶手段と、前記原文入力手段により入力された原文に対して解析を行なうことにより、前記原文を構文解析する、原文解析手段と、翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する文法言語設定手段と、前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する翻訳言語設定手段と、前記文法言語設定手段において設定された目的言語の文法規則を前記文法規則記憶手段より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する文法変換手段と、前記文法変換手段により構文成分の順序を変換された文から、前記翻訳言語設定手段により設定された構文成分と一致する構文成分を検索する変換単語検索手段と、前記変換単語検索手段により検索された構文成分に対して設定された翻訳言語を前記翻訳言語設定手段から取得し、当該構文成分を構成する単語を該翻訳言語に翻訳した単語を前記翻訳辞書記憶手段から検索して取得して、前記文法変換手段により変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記文法変換手段により変換された文の中の単語であって前記翻訳言語設定手段に設定されていない単語を前記目的言語の単語に置き換える単語変換手段と、前記単語変換手段によって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力手段とを備えることを特徴とする。
また、本発明に従った電子機器は、前記原文入力手段から入力された原文を他の言語の中間言語からなる文に翻訳し、該翻訳文を原文として前記原文解析手段に入力する中間言語生成手段をさらに備えることが好ましい。
また、本発明に従った電子機器は、前記出力手段により出力された翻訳文を、当該翻訳文において使用された文法の言語である目的言語、および、当該翻訳文における構文成分ごとの翻訳言語のパターンに対応させて記憶する翻訳履歴記憶手段を更に備え、前記文法言語設定手段は、前記翻訳履歴記憶手段において目的言語として記憶されている各言語の記憶回数に基づいて目的言語を設定し、前記翻訳言語設定手段は、前記翻訳履歴記憶手段において前記翻訳言語のパターンとして記憶されている各パターンの記憶回数に基づいて構文成分ごとの翻訳言語のパターンを設定することが好ましい。
また、本発明に従った電子機器は、前記出力手段に出力された翻訳文を、当該翻訳文に含まれる単語を異なる言語の単語に変更するように修正して、前記出力手段に出力させる、単語変更手段をさらに備えることが好ましい。
また、本発明に従った電子機器では、前記翻訳文中の前記単語変更手段による変更前の単語と変更後の単語と変更回数を互いに関連付けて記憶する変更単語履歴記憶手段をさらに備えることが好ましい。
また、本発明に従った電子機器では、前記単語変更手段は、前記原文入力手段により入力された原文に含まれる単語であって、前記変換単語履歴記憶手段に記憶された前記変換前の単語と一致し、かつ、前記変換回数が所定の値よりも多い単語を、前記変換単語履歴記憶手段において前記変換前の単語に関連付けられて記憶されている前記変換後の単語に変更することが好ましい。
本発明に従った電子機器の制御方法は、翻訳文を出力する電子機器の制御方法であって、原言語の複数の単語を含む原文を入力する入力ステップと、複数の言語の辞書を記憶する第1の記憶ステップと、複数の言語の文法規則を記憶する第2の記憶ステップと、前記入力ステップで入力した原文を解析することにより、前記原文を構文解析する、解析ステップと、翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する第1の設定ステップと、前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する第2の設定ステップと、前記第1の設定ステップで設定した目的言語の文法規則を前記第2の記憶ステップにおいて記憶した文法規則より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する第1の変換ステップと、前記第1の変換ステップにより構文成分の順序を変換された文から、前記第2の設定ステップにより設定された構文成分と一致する構文成分を検索する検索ステップと、前記検索ステップにより検索された構文成分に対して設定された翻訳言語を前記第2の設定ステップにおける設定内容から取得し、当該構文成分を構成する単語を前記第1の記憶ステップで記憶した辞書から検索して取得して、前記第1の変換ステップにより変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記第1の変換ステップにより変換された文の中の単語であって前記第2の設定ステップにおいて言語を設定されていない単語を前記目的言語の単語に置き換える第2の変換ステップと、前記第2の変換ステップによって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力ステップとを備えることを特徴とする。
本発明に従った翻訳文出力用プログラムは、電子機器に翻訳文を出力させるためのプログラムであって、前記電子機器に、原言語の複数の単語を含む原文を入力する入力ステップと、複数の言語の辞書を記憶する第1の記憶ステップと、複数の言語の文法規則を記憶する第2の記憶ステップと、前記入力ステップで入力した原文を解析することにより、前記原文を構文解析する、解析ステップと、翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する第1の設定ステップと、前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する第2の設定ステップと、前記第1の設定ステップで設定した目的言語の文法規則を前記第2の記憶ステップにおいて記憶した文法規則より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する第1の変換ステップと、前記第1の変換ステップにより構文成分の順序を変換された文から、前記第2の設定ステップにより設定された構文成分と一致する構文成分を検索する検索ステップと、前記検索ステップにより検索された構文成分に対して設定された翻訳言語を前記第2の設定ステップにおける設定内容から取得し、当該構文成分を構成する単語を前記第1の記憶ステップで記憶した辞書から検索して取得して、前記第1の変換ステップにより変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記第1の変換ステップにより変換された文の中の単語であって前記第2の設定ステップにおいて言語を設定されていない単語を前記目的言語の単語に置き換える第2の変換ステップと、前記第2の変換ステップによって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力ステップとを実行させることを特徴とする。
本発明によれば、翻訳文は、目的言語の文法規則に従い、基本的に目的言語の単語で記述されるが、原文の単語に対応する単語であって翻訳単語設定手段において設定がなされている単語については当該設定がなされている言語(翻訳言語)で記述される。
これにより、翻訳文では、基本的に目的言語の文法規則に従って記述されながらも、目的言語以外の言語で記述された方が良いと考えられる単語は、そのように言語を設定されて記述される。したがって、翻訳文を出力する場合、目的言語において難易度の高いと考えられる単語はコミュニケーションの場に居るより多くの人が理解できる言語で記述するように翻訳文を作成する等の対処が可能となる。このことから、本発明に従って出力される翻訳文は、コミュニケーションの場に居るより多くの人にその内容を理解されるものとなり、有用なものと言える。
以下、本発明に従った電子機器の一実施の形態を、図面を参照しつつ詳細に説明する。
図1は、本実施の形態の電子機器のハードウェア構成を模式的に示す図である。
電子機器1は、CPU(Central Processing Unit)10、記憶装置20、表示装置30、スピーカ40、キーボード50、および、翻訳モジュール60を含む。電子機器1では、これらの各構成要素は、バス70を介して接続されている。CPU10は、電子機器1の動作を全体的に制御する。記憶装置20は、後述するように種々の情報を記憶する。表示装置30は、たとえば液晶ディスプレイなどによって構成される。スピーカ40は、音声を出力する。電子機器1では、キーボード50を操作されることによって、種々の情報が入力される。翻訳モジュール60は、キーボード50などを介して入力された文に対する翻訳処理を実行する。
図2は、電子機器1における、翻訳処理に関する機能構成を示すブロック図である。
翻訳モジュール60は、記憶装置20に記憶された情報を利用することによって、入力部100から入力された文に対して翻訳処理を行なう。また、翻訳モジュール60は、翻訳処理の結果である翻訳文を、出力部200において出力する。入力部100は、たとえばキーボード50によって構成される。なお、入力部100は、電子機器1に適宜備えられたマイク(図示略)によって構成されてもよい。つまり、翻訳モジュール60は、当該マイクを介して入力された音声に対して音声認識を行ない、当該認識結果に基づいて得られた文に対して翻訳処理を行なってもよい。
出力部200は、表示装置30および/またはスピーカ40から構成される。つまり、翻訳モジュール60は、翻訳処理の結果を、表示装置30に表示させてもよいし、スピーカ40から音声として出力してもよい。
記憶装置20は、翻訳履歴記憶部201、使用単語記憶部202、文法言語設定記憶部203、翻訳単語設定記憶部204、翻訳単語パターン記憶部205、および、辞書メモリ210を含む。
翻訳履歴記憶部201は、たとえば図3に示すように、電子機器1における翻訳処理に関する履歴を記憶する。具体的には、電子機器1に入力された文(入力文)と、当該入力文の翻訳結果として出力した文(出力文)と、目的言語の文法であって出力文が従う文法(出力文法)と、翻訳処理において使用した翻訳パターンとを互いに関連付けて記憶する。図3に示された翻訳履歴において、出力文法および翻訳パターンは、使用された文法およびパターンに対応した番号で記憶されている。図3における出力文法と番号との対応関係を、表1に示す。
Figure 0004986549
表1から理解されるように、電子機器1では、出力文法が日本語である場合には、番号0が利用され、出力文法が中国語である場合には、番号1が利用され、出力文法が英語である場合には、番号2が利用される。
図3における翻訳パターンと番号との対応関係を、表2に示す。
Figure 0004986549
表2において、Sは、入力文の主語を意味し、Vは、入力文の述語を意味し、Oは、入力文の目的語を意味し、そして、Cは、入力文の補語を意味する。つまり、たとえば、パターン番号0に従って翻訳処理が行なわれた場合、入力文の主語は、中国語の単語を使って翻訳され、入力文の述語および目的語は、英語の単語を使って翻訳される。また、たとえば、パターン番号18に従って翻訳処理が行なわれた場合、入力文の主語および述語は、英語の単語を使って翻訳され、入力文の目的語および補語は、中国語の単語を使って翻訳される。
表1に示した文法パターンおよび表2に示した翻訳パターンは、翻訳単語パターン記憶部205に記憶される。
使用単語記憶部202は、入力文に含まれる単語が、出力文においてどのように翻訳されたかを示す情報を記憶する。使用単語記憶部202に記憶される情報を、図4に模式的に示す。
図4を参照して、使用単語記憶部202では、入力文に含まれる単語(入力単語)と、入力単語に対して過去の出力文で使用された単語(翻訳候補)、および、各翻訳候補が過去の出力文において使用された回数が、互いに関連付けられて記憶されている。たとえば、「私は」という入力単語に対して、上段に中国語の翻訳候補である「我」がその使用回数(28回)とともに記憶され、さらに、下段に英語の翻訳候補である「I」がその使用回数(3回)とともに記憶されている。
文法言語設定記憶部203は、これから実行される翻訳処理において使用する文法の種類(目的言語)を記憶している。翻訳単語設定記憶部204は、これから実行される翻訳処理において、出力文において使用される単語の言語(翻訳言語)を、出力文の構文成分ごとに記憶している。翻訳単語設定記憶部204の記憶内容の一例を表3に示す。
Figure 0004986549
表3に示された例では、次回の翻訳処理において、入力文の主語および述語は中国語の単語によって構成され、出力文の目的語および補語は英語によって構成されることが示されている。なお、翻訳単語設定記憶部204には、表2を参照して説明したパターン番号が記憶されていてもよい。
辞書メモリ210は、翻訳辞書211、文法規則212、および、基本構造変換規則213を記憶している。
翻訳モジュール60では、言語設定部61において、これから実行する翻訳処理における出力文法を特定する情報が記憶されている。
解析部62は、入力文から前編集記号を取除いた後、辞書(翻訳辞書211)を引いて入力文を各形態素に分割し、時制・人称・数などを得る辞書引き・形態素解析を行なう。さらに、解析部62は、単語間の係り受けなどの文法構造(構文解析木)を決定する。
そして、文法変換部63は、解析部62で決定された構文解析木を目的言語(文法言語設定記憶部203に記憶された言語)での構文解析木に変換する。これにより、入力文を構成する単語は、目的言語での構文に従って並べられている。
そして、単語変換部64は、目的言語での構文に従って並べられた入力文の各単語を、翻訳辞書211を用いて、異なる言語の単語に入れ替える。
翻訳制御部65は、解析部62、文法変換部63、および、単語変換部64の動作を制御する。そして、翻訳制御部65は、単語変換部64が単語の変換を行なった文を、出力文として出力部200へ出力する。
図5および図6は、電子機器1における翻訳処理の内容を説明するためのフローチャートである。以下、電子機器1における翻訳処理の内容について説明する。
まず図5を参照して、電子機器1に対して電力が供給され、翻訳モードへの設定がなされると、ステップSA1において、文法言語設定処理が行なわれる。図7に、文法言語設定処理のサブルーチンのフローチャートを示す。
図7を参照して、文法言語設定処理では、翻訳モジュール60は、ステップSB1で、文法言語設定記憶部203において、目的言語を特定する情報が記憶されているか否かを判断する。そして、記憶されていると判断すると、処理をステップSA1にリターンさせる。一方、記憶されていないと判断すると、ステップSB2に処理を進める。
ステップSB2では、翻訳モジュール60は、翻訳履歴記憶部201に少なくとも1組のデータが記憶されているか否かを判断する。そして、記憶されていると判断するとステップSB3に処理を進め、記憶されていないと判断するとステップSB4に処理を進める。
ステップSB4では、翻訳モジュール60は、表示装置30に、出力文法を特定するための情報(目的言語を特定する情報)の入力を促すメッセージを表示し、そして、入力された出力文法を取得し、ステップSB5に処理を進める。一方、ステップSB3では、翻訳モジュール60は、翻訳履歴文法単語設定処理を実行する。図8に、この処理のサブルーチンのフローチャートを示す。
図8を参照して、翻訳モジュール60は、翻訳履歴文法単語設定処理において、まずステップSC1で、翻訳履歴記憶部201のデータを取得し、次に、ステップSC2で、使用された回数が最も多い出力文法を取得して、ステップSB3に処理をリターンさせる。なお、ステップSC2では、翻訳履歴記憶部201に記憶されている翻訳履歴の中で、出力文法ごとに入力文の数を計算し、その数が最も大きい出力文法を、最も使用されている出力文法と決定して、その文法番号を取得する処理を行なっている。
再度図7を参照して、翻訳モジュール60は、ステップSB3の処理を終えると、処理をステップSB5に進める。ステップSB5では、翻訳モジュール60は、文法言語設定記憶部203に、ステップSB4またはステップSB3において取得した出力文法を、文法言語設定記憶部203に記憶させて処理をステップSA1にリターンさせる。
再度図5を参照して、文法言語設定処理の次には、翻訳モジュール60は、ステップSA2で、翻訳単語設定処理を行なう。ここで、翻訳単語設定処理のサブルーチンのフローチャートである図9を参照して、この処理の内容を説明する。
図9を参照して、翻訳モジュール60は、まずステップSE1で、翻訳単語設定記憶部204に情報が記憶されているか否かを判断する。そして、記憶されていると判断すると、そのまま処理をステップSA2に処理をリターンさせる。一方、記憶されていないと判断すると、ステップSE2に進める。
ステップSE2では、翻訳モジュール60は、翻訳履歴記憶部201に情報が記憶されているか否かを判断し、記憶されていると判断するとステップSE3に処理を進め、記憶されていないと判断すると、ステップSE4に処理を進める。
ここで、ステップSE3における翻訳履歴単語設定処理の内容を、この処理のサブルーチンのフローチャートである図10を参照して説明する。
図10を参照して、ステップSF1では、翻訳モジュール60は、翻訳履歴記憶部201に記憶されたデータを取得し、そして、ステップSF2で、使用されている回数が最も多い翻訳パターンを取得して、ステップSE3に処理をリターンさせる。再度図9を参照して、ステップSE3の後、処理はステップSE7に進められる。なお、ステップSF2では、翻訳履歴記憶部201に記憶されている翻訳履歴の中で、翻訳パターンの数値ごとに入力文の数を計算し、入力文の数が最も大きい翻訳パターンを、最も使用されている翻訳パターンと決定して、その翻訳パターンの番号を取得する処理を行なっている。
一方、ステップSE4では、ユーザからの、入力文の翻訳を構文成分(主語、述語、目的語、補語等)単位で行なうか否かの情報の入力を受付ける。そして、構文成分単位で翻訳を行なう旨の情報が入力されたと判断すると、ステップSE6に処理を進め、構文成分単位では行なわない旨の情報が入力されたと判断すると、ステップSE5に処理を進める。
ステップSE6では、ユーザからの、構文成分ごとの翻訳言語の入力を受付け、ステップSE7に処理を進める。また、ステップSE5では、入力文を構成する各単語に対して、どのような区分で翻訳言語を設定するか、および、各区分に対する翻訳言語の設定内容の入力を受付けて、ステップSE7に処理を進める。
ステップSE7では、翻訳モジュール60は、ステップSE3、ステップSE5、または、ステップSE6において取得した設定内容を、翻訳単語設定記憶部204に記憶させて、ステップSE2に処理を戻す。
再度図5を参照して、翻訳単語設定処理の後、翻訳モジュール60は、ステップSE3で、翻訳の対象となる入力文が入力されているか否かを判断し、入力されていると判断するとステップSA5に処理を進める。また、入力されていないと判断すると、ステップSA4で、入力文の入力を受付けた後、ステップSA5に処理を進める。
ステップSA5では、翻訳モジュール60は、入力文に対する解析処理を実行し、ステップSA6に処理を進める。なお、ここで言う解析処理とは、入力文に対する形態素解析、構文解析、意味解析、および、文脈解析を含む。そして、これらの解析により、翻訳モジュール60は、入力文中の各単語についての単語種類とその品詞および成分を得るため、結果として、入力文についての原語の内部構造を得る。
ステップSA6では、翻訳モジュール60は、文法言語設定記憶部203に格納された情報を取得し、ステップSA7に処理を進める。
ステップSA7では、翻訳モジュール60は、文法言語設定記憶部203に格納された言語が中国語であるか否かを判断し、そうであると判断すると、ステップSA11に処理を進め、そうではないと判断すると、ステップSA8に処理を進める。
ステップSA8では、翻訳モジュール60は、文法言語設定記憶部203に格納された言語が英語であるか否かを判断し、そうであると判断するとステップSA10に処理を進め、そうではないと判断すると、ステップSA9に処理を進める。
ステップSA9では、翻訳モジュール60は、文法言語設定記憶部203に格納された言語を目的言語とした翻訳処理を適宜実行し、処理を終了する。なお、本実施の形態では、目的言語が中国語または英語である場合の処理内容についてのみ、詳細に説明する。
図6を参照して、ステップSA10では、翻訳モジュール60は、辞書メモリ210の文法規則212から、英語の文法規則を取得して、ステップSA12に処理を進める。
また、ステップSA11では、翻訳モジュール60は、辞書メモリ210の文法規則212から、中国語の文法規則を取得して、ステップSA12に処理を進める。
ステップSA12では、翻訳モジュール60は、ステップSA10またはステップSA11で取得した文法規則に従って、入力文における単語の順番を目的言語の文法規則に基づいて並び替える。
ステップSA12における文法変換処理について、入力文が日本語で記載され、かつ、目的言語が英語である場合の具体例を用いて説明する。入力文の一例として、「私は飛行機で中国に行きます」を挙げる。この入力文は、ステップSA5の解析処理において、「[私は][飛行機で][中国に][行きます]」というように、単語レベルまで分解され、構文を解析されている。このように、日本語の文法規則に従って並べられた単語が、文法変換処理では、目的言語(英語)の文法規則に従って、並べ替えられる。具体的には、「[私は][行きます][中国に][飛行機で]」とされる。なお、ある言語の文法規則に従って並べられた単語を、他の言語の文法規則に従って並べ替える技術については、周知の技術を利用できるため、ここでは詳細な説明を繰返さない。
ステップSA12の文法変換処理の後、翻訳モジュール60は、ステップSA13で、翻訳単語設定記憶部204に格納されたデータを取得して、ステップSA14に処理を進める。
ステップSA14では、単語変換処理を実行する。ここで、この処理の内容を、この処理のサブルーチンのフローチャートである図11を参照して、詳細に説明する。
図11を参照して、単語変換処理では、まずステップSG1で、翻訳モジュール60は、翻訳単語設定記憶部204において、各単語の翻訳を構文成分(主語、述語等)の単位で行なうように設定されているか否かを判断し、そのように設定されていると判断するとステップSG2に処理を進め、そうではないと判断するとステップSG3に処理を進める。
ステップSG3では、翻訳モジュール60は、ステップSE5において受付けた区分および翻訳言語で入力文を翻訳し、ステップSG4に処理を進める。
ステップSG2では、入力文に含まれる単語を、構文の成分ごとに翻訳単語設定記憶部204に記憶された翻訳言語において対応する単語に変換して、ステップSG4に処理を進める。
ステップSG4では、翻訳単語補正処理を実行する。なお、この処理の内容を、この処理のサブルーチンのフローチャートである図12を参照して、詳細に説明する。
図12を参照して、翻訳単語補正処理では、翻訳モジュール60は、まずステップSH1で、使用単語記憶部202に格納されたデータを取得し、ステップSH2に処理を進める。
ステップSH2では、翻訳モジュール60は、入力文に含まれる単語の中で、使用単語記憶部202においてデータが記憶されている場合、当該単語を、使用単語記憶部202において最も使用回数が多い言語の単語に変換して、処理をステップSG4にリターンさせる。なお、ステップSH2の処理を、入力文に「中国に」という日本語の単語が含まれる場合を用いて具体的に説明する。図4を参照して、使用単語記憶部202では、「中国に」という入力単語に対して、「中国」という中国語の翻訳候補と、「China」という英語の翻訳候補が記憶されている。これらの翻訳候補の使用回数を比較すると、前者よりも後者の方が多い。このことから、ステップSH2では、「中国に」という日本語の単語が入力文に含まれていた場合、当該単語は、英語の「China」に変換される。
再度図11を参照して、ステップSG4における翻訳単語補正処理が終了すると、翻訳モジュール60は、ステップSA14に処理をリターンさせる。
再度図6を参照して、ステップSA14の処理の後、翻訳モジュール60は、ステップSA15では、(ステップSA12で文法変換処理を施された)入力文の各単語が目的言語の中の対応する単語または使用単語記憶部202において使用回数が最も多いとされた言語の単語に変換されることによって生成された文(翻訳文)を、出力部200で出力する。
次に、翻訳モジュール60は、ステップSA16において、ステップSA15において出力した翻訳文に対する、別言語に翻訳したい単語の指定、および、当該別言語の選択を受付ける。
そして、翻訳モジュール60は、ステップSA17において、ステップSA16において受付けた情報に基づいて翻訳文を修正し、出力部200に再度出力する。
なお、翻訳モジュール60は、ここでの修正内容を記憶装置20に適宜記憶しても良い。具体的には、表4に変更履歴情報として示すように、別言語に翻訳したいと指定された単語(変更前の単語)と、上記ように選択された別言語における変更前の単語に対応した単語(変更後の単語)と、変更前の単語に対応した入力文中の単語(原文中の単語)と、ステップSA17における変更前の単語から変更後の単語への変更回数とが、互いに関連付けられて記憶されても良い。
Figure 0004986549
つまり、翻訳モジュール60は、入力文中の「私は」(日本語)という単語に対応した「我」(中国語)という単語を含む翻訳文に対して、ステップSA16において、「我」が指定されて上記の別言語として「英語」が選択された場合には、ステップSA17で、「我」(中国語)を「I」(英語)に変更するように翻訳文を修正するとともに、変更履歴情報中の「我」から「I」への変更についての変更回数の欄の数値を「1」加算更新する。
また、翻訳モジュール60は、ステップSH2において、入力文に使用単語記憶部202の入力単語の欄で記憶される単語が含まれているときに当該単語を対応する翻訳候補の中で最も使用回数の多い翻訳候補の欄に記憶された単語に翻訳するのに加えて、入力文に変更履歴情報中の「原文中の単語」の欄に記憶された単語が含まれているときに当該単語を対応する「変更後の単語」に翻訳する処理を行なっても良い。
そして、翻訳モジュール60は、ステップSA18において、翻訳履歴記憶部201に、ステップSA4で受付けた入力文、ステップSA17で出力した翻訳文、ステップSA6で取得した文法言語設定記憶部203における設定内容(出力文法)、および、ステップSG1で取得した翻訳単語設定記憶部204における設定内容(出力成分)を互いに関連付けて翻訳履歴記憶部201に記憶させる。
そして、ステップSA19において、翻訳モジュール60は、ステップSA17において出力した翻訳文において使用した単語を、使用単語記憶部202に記憶させる。なお、翻訳文において使用した単語についての使用回数も、適宜カウントアップする。
以上説明した本実施の形態では、電子機器1において、入力部100を介して入力された文が、翻訳モジュール60において翻訳処理を施されて出力文(翻訳文)とされて、出力部200において出力される。翻訳モジュール60は、入力文に対して、言語設定部61において目的言語を設定し、解析部62において入力文中の各単語の品詞の分析や成分の分析を行ない、文法変換部63において目的言語の文法規則に対応した順序で単語を並べ替え、さらに、単語変換部64において、入力文の単語ごとに言語が記憶されているかどうか(使用単語記憶部202にデータが記憶されているか否か)を判断し、記憶されていると判断すると、その内容に基づいて単語を置き換える。
なお、以上説明した本実施の形態では、電子機器1は、図13に示されるように、入力部100を介して入力された入力文が解析部62に入力される前に入力される中間言語生成部62Aをさらに備えるように構成されても良い。なお、中間言語生成部62Aは、当該入力文を原語および目的言語のいずれにも依存しない概念である中間言語まで解析(翻訳)し、得られた中間言語を解析部62に入力する。この場合、解析部62は、中間言語で記述された入力文に対して構文解析を行ないかつ構文解析木を生成し、そして、中間言語の構文解析木を目的言語の構文解析木に変換する。具体的には、ステップSA12において、翻訳モジュール60は、中間言語に変換された入力文における単語の順番を、目的言語の文法規則に従った順番に並べ替える。このように、入力文を中間言語に変換してから目的言語に翻訳することにより、電子機器1における翻訳処理を簡略化できる。
以上説明した本実施の形態において、入力部100により原文入力手段が構成されている。また、辞書メモリ210により翻訳辞書記憶手段および文法規則記憶手段が構成されている。また、解析部62により原文解析手段が構成され、文法言語設定記憶部203により文法言語設定手段が構成され、使用単語記憶部202および翻訳単語設定記憶部204により翻訳単語設定手段が構成されている。
なお、本明細書において、単語種類とは、言語における個々の単語の種類を意味する。たとえば、「私」「飛行機」「買い物」は、それぞれ、互いに異なる単語種類である。
また、本明細書において、翻訳単語設定記憶部204は、表3を参照して説明したように入力文における構文成分と対応した翻訳言語を記憶しているが、これに限らず、入力部における品詞(名詞、動詞、形容詞、副詞、等)と対応した翻訳言語を記憶していても良い。
また、本実施の形態において、文法変換部63により文法変換手段が構成され、(図12を参照して説明した翻訳単語補正処理において使用単語記憶部202の中から入力文に含まれる単語と同じ単語に関するデータを取得する)翻訳モジュール60の翻訳制御部65により変換単語検索手段が構成され、単語変換部64により単語変換手段が構成され、そして、出力部200により出力手段が構成される。
また、本実施の形態では、上記した中間言語生成部62Aにより中間言語生成手段が構成され、翻訳履歴記憶部201により翻訳履歴記憶手段が構成されている。
今回開示された各実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の一実施形態である電子機器のハードウェア構成を模式的に示す図である。 図1の電子機器における翻訳処理に関連する部分のブロック構成を模式的に示す図である。 図2の翻訳履歴記憶部の記憶内容を模式的に示す図である。 図2の使用単語記憶部の記憶内容を模式的に示す図である。 図1の電子機器において実行される翻訳処理のフローチャートである。 図1の電子機器において実行される翻訳処理のフローチャートである。 図5の文法言語設定処理のサブルーチンのフローチャートである。 図7の翻訳履歴文法単語設定処理のサブルーチンのフローチャートである。 図5の翻訳単語設定処理のサブルーチンのフローチャートである。 図9の翻訳履歴単語設定処理のサブルーチンのフローチャートである。 図6の単語変換処理のサブルーチンのフローチャートである。 図11の翻訳単語補正処理のサブルーチンのフローチャートである。 図1の電子機器の変形例における、翻訳処理に関連する部分のブロック構成を模式的に示す図である。
符号の説明
1 電子機器、10 CPU、20 記憶装置、30 表示装置、40 スピーカ、50 キーボード、60 翻訳モジュール、61 言語設定部、62 解析部、63 文法変換部、64 単語変換部、65 翻訳制御部、70 バス、100 入力部、200 出力部、201 翻訳履歴記憶部、202 使用単語記憶部、203 文法言語設定記憶部、204 翻訳単語設定記憶部、205 翻訳単語パターン記憶部、210 辞書メモリ、211 翻訳辞書、212 文法規則、213 基本構造変換規則。

Claims (8)

  1. 翻訳文を出力する手段を備えた電子機器において、
    原言語の複数の単語を含む原文を入力する原文入力手段と、
    複数の言語の辞書を記憶する翻訳辞書記憶手段と、
    複数の言語の文法規則を記憶する文法規則記憶手段と、
    前記原文入力手段により入力された原文に対して解析を行なうことにより、前記原文を構文解析する、原文解析手段と、
    翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する文法言語設定手段と、
    前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する翻訳言語設定手段と、
    前記文法言語設定手段において設定された目的言語の文法規則を前記文法規則記憶手段より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する文法変換手段と、
    前記文法変換手段により構文成分の順序を変換された文から、前記翻訳言語設定手段により設定された構文成分と一致する構文成分を検索する変換単語検索手段と、
    前記変換単語検索手段により検索された構文成分に対して設定された翻訳言語を前記翻訳言語設定手段から取得し、当該構文成分を構成する単語を該翻訳言語に翻訳した単語を前記翻訳辞書記憶手段から検索して取得して、前記文法変換手段により変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記文法変換手段により変換された文の中の単語であって前記翻訳言語設定手段に設定されていない単語を前記目的言語の単語に置き換える単語変換手段と、
    前記単語変換手段によって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力手段とを備えることを特徴とする電子機器。
  2. 前記原文入力手段から入力された原文を他の言語の中間言語からなる文に翻訳し、該翻訳文を原文として前記原文解析手段に入力する中間言語生成手段をさらに備えることを特徴とする請求項1に記載の電子機器。
  3. 前記出力手段により出力された翻訳文を、当該翻訳文において使用された文法の言語である目的言語、および、当該翻訳文における構文成分ごとの翻訳言語のパターンに対応させて記憶する翻訳履歴記憶手段を更に備え、
    前記文法言語設定手段は、前記翻訳履歴記憶手段において目的言語として記憶されている各言語の記憶回数に基づいて目的言語を設定し、
    前記翻訳言語設定手段は、前記翻訳履歴記憶手段において前記翻訳言語のパターンとして記憶されている各パターンの記憶回数に基づいて構文成分ごとの翻訳言語のパターンを設定することを特徴とする請求項1または請求項2に記載の電子機器。
  4. 前記出力手段に出力された翻訳文を、当該翻訳文に含まれる単語を異なる言語の単語に変更するように修正して、前記出力手段に出力させる、単語変更手段をさらに備えることを特徴とする請求項1から請求項のいずれかに記載の電子機器。
  5. 前記翻訳文中の前記単語変更手段による変更前の単語と、前記変更前の単語に対応する原文中の単語と、前記単語変更手段による変更後の単語と、前記変更前の単語から前記変更後への変更回数を互いに関連付けて記憶する変更単語履歴記憶手段をさらに備えることを特徴とする請求項に記載の電子機器。
  6. 前記単語変更手段は、前記原文入力手段により入力された原文に含まれる単語であって、前記変換単語履歴記憶手段に記憶された前記変換前の単語に対応する原文中の単語と一致し、かつ、前記変換回数が所定の値よりも多い単語を、前記変換単語履歴記憶手段において前記変換前の単語に関連付けられて記憶されている前記変換後の単語に変更することを特徴とする請求項に記載の電子機器。
  7. 翻訳文を出力する電子機器の制御方法であって、
    原言語の複数の単語を含む原文を入力する入力ステップと、
    複数の言語の辞書を記憶する第1の記憶ステップと、
    複数の言語の文法規則を記憶する第2の記憶ステップと、
    前記入力ステップで入力した原文を解析することにより、前記原文を構文解析する、解析ステップと、
    翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する第1の設定ステップと、
    前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する第2の設定ステップと、
    前記第1の設定ステップで設定した目的言語の文法規則を前記第2の記憶ステップにおいて記憶した文法規則より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する第1の変換ステップと、
    前記第1の変換ステップにより構文成分の順序を変換された文から、前記第2の設定ステップにより設定された構文成分と一致する構文成分を検索する検索ステップと、
    前記検索ステップにより検索された構文成分に対して設定された翻訳言語を前記第2の設定ステップにおける設定内容から取得し、当該構文成分を構成する単語を前記第1の記憶ステップで記憶した辞書から検索して取得して、前記第1の変換ステップにより変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記第1の変換ステップにより変換された文の中の単語であって前記第2の設定ステップにおいて言語を設定されていない単語を前記目的言語の単語に置き換える第2の変換ステップと、
    前記第2の変換ステップによって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力ステップとを備えることを特徴とする電子機器の制御方法。
  8. 電子機器に翻訳文を出力させるためのプログラムであって、
    前記電子機器に、
    原言語の複数の単語を含む原文を入力する入力ステップと、
    複数の言語の辞書を記憶する第1の記憶ステップと、
    複数の言語の文法規則を記憶する第2の記憶ステップと、
    前記入力ステップで入力した原文を解析することにより、前記原文を構文解析する、解析ステップと、
    翻訳文が従う文法規則が対応する前記原言語とは異なる目的言語を設定する第1の設定ステップと、
    前記原言語および前記目的言語とは異なる言語であって、構文成分に対して翻訳する言語を設定する第2の設定ステップと、
    前記第1の設定ステップで設定した目的言語の文法規則を前記第2の記憶ステップにおいて記憶した文法規則より取得し、取得した該文法規則に基づき、原文中の構文成分の順序を変換する第1の変換ステップと、
    前記第1の変換ステップにより構文成分の順序を変換された文から、前記第2の設定ステップにより設定された構文成分と一致する構文成分を検索する検索ステップと、
    前記検索ステップにより検索された構文成分に対して設定された翻訳言語を前記第2の設定ステップにおける設定内容から取得し、当該構文成分を構成する単語を前記第1の記憶ステップで記憶した辞書から検索して取得して、前記第1の変換ステップにより変換された文の中の構文成分を構成する単語を翻訳言語の単語に置き換え、さらに、前記第1の変換ステップにより変換された文の中の単語であって前記第2の設定ステップにおいて言語を設定されていない単語を前記目的言語の単語に置き換える第2の変換ステップと、
    前記第2の変換ステップによって翻訳言語または目的言語に単語を置き換えられた多言語混在文を翻訳文として出力する出力ステップとを実行させることを特徴とする翻訳文出力用プログラム。
JP2006240641A 2006-09-05 2006-09-05 電子機器、その制御方法、および、翻訳文出力用プログラム Expired - Fee Related JP4986549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006240641A JP4986549B2 (ja) 2006-09-05 2006-09-05 電子機器、その制御方法、および、翻訳文出力用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006240641A JP4986549B2 (ja) 2006-09-05 2006-09-05 電子機器、その制御方法、および、翻訳文出力用プログラム

Publications (2)

Publication Number Publication Date
JP2008065469A JP2008065469A (ja) 2008-03-21
JP4986549B2 true JP4986549B2 (ja) 2012-07-25

Family

ID=39288152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006240641A Expired - Fee Related JP4986549B2 (ja) 2006-09-05 2006-09-05 電子機器、その制御方法、および、翻訳文出力用プログラム

Country Status (1)

Country Link
JP (1) JP4986549B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5137107B2 (ja) * 2007-05-25 2013-02-06 シャープ株式会社 電子機器、その制御方法、および、翻訳文出力用プログラム
CN113591494B (zh) * 2021-06-30 2024-06-07 中山大学 一种基于多粒度语义对齐的多语言通用翻译方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0225973A (ja) * 1988-07-15 1990-01-29 Casio Comput Co Ltd 機械翻訳装置
JPH04309171A (ja) * 1991-04-08 1992-10-30 Matsushita Electric Ind Co Ltd 機械翻訳装置および方法
JPH06318230A (ja) * 1993-05-06 1994-11-15 Sharp Corp 機械翻訳装置
JPH08101839A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳システム
JP3405491B2 (ja) * 1995-06-30 2003-05-12 シャープ株式会社 機械翻訳装置
JPH09212505A (ja) * 1996-01-30 1997-08-15 Canon Inc 文書処理装置および方法
JPH11265382A (ja) * 1998-03-18 1999-09-28 Omron Corp 翻訳装置、翻訳装置の訳語表示方法および訳語表示プログラムを記憶した媒体
JP3949356B2 (ja) * 2000-07-12 2007-07-25 三菱電機株式会社 音声対話システム
JP2003140854A (ja) * 2001-11-02 2003-05-16 Fuji Xerox Co Ltd 文書の印刷方針作成方法、文書の印刷方法、文書の印刷方針作成プログラムおよび文書の印刷プログラム
JP2005050156A (ja) * 2003-07-29 2005-02-24 Toshiyuki Tani コンテンツの置換方法及びシステム

Also Published As

Publication number Publication date
JP2008065469A (ja) 2008-03-21

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
JP2017510924A (ja) 機械翻訳システムおよび機械翻訳方法
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
WO2000013102A1 (fr) Dispositif et procede pour le traitement du langage naturel
JP4986549B2 (ja) 電子機器、その制御方法、および、翻訳文出力用プログラム
JP5137107B2 (ja) 電子機器、その制御方法、および、翻訳文出力用プログラム
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4869281B2 (ja) 機械翻訳装置、プログラム及び方法
JP2632806B2 (ja) 言語解析装置
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPH0561902A (ja) 機械翻訳システム
KR100481453B1 (ko) 동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム
JPH09160920A (ja) 機械翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JPH0550778B2 (ja)
JP5746921B2 (ja) 機械翻訳装置、方法及びプログラム
JPH03222069A (ja) 機械翻訳装置
JPH09146951A (ja) 言語解析システムおよび方法
JP2009003648A (ja) 電子機器、その制御方法、および、その制御プログラム
JP2006065542A (ja) 機械翻訳方法
JP2004086919A (ja) 機械翻訳システム
JP2004199519A (ja) 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120424

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees