JP6334354B2 - 機械翻訳装置、方法およびプログラム - Google Patents

機械翻訳装置、方法およびプログラム Download PDF

Info

Publication number
JP6334354B2
JP6334354B2 JP2014202631A JP2014202631A JP6334354B2 JP 6334354 B2 JP6334354 B2 JP 6334354B2 JP 2014202631 A JP2014202631 A JP 2014202631A JP 2014202631 A JP2014202631 A JP 2014202631A JP 6334354 B2 JP6334354 B2 JP 6334354B2
Authority
JP
Japan
Prior art keywords
translation
processing unit
result
unit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014202631A
Other languages
English (en)
Other versions
JP2016071761A (ja
Inventor
聡 園尾
聡 園尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014202631A priority Critical patent/JP6334354B2/ja
Priority to US14/853,039 priority patent/US20160092438A1/en
Priority to CN201510633868.XA priority patent/CN105468585A/zh
Publication of JP2016071761A publication Critical patent/JP2016071761A/ja
Application granted granted Critical
Publication of JP6334354B2 publication Critical patent/JP6334354B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)

Description

本発明の実施形態は、原言語テキストを処理単位に分割し、処理単位毎の翻訳結果の並び順序を制御することで、好適な目的言語テキストを生成する機械翻訳装置、方法およびプログラムに関する。
近年、話し言葉を対象にした自然言語処理技術の開発が進んでいる。例えば、携帯端末を利用して旅行会話の翻訳を行う機械翻訳技術が広く利用されるようになってきた。旅行会話では比較的短い文の発話であることが多く、発話文の入力が完了した後に機械翻訳処理を行っても意図の伝達に支障が生じることはなかった。
一方、講演会や報告会などで一人の話者がある程度のまとまりを持って発話する「独話」と呼ばれる発話形態を翻訳する場合、話者の発話意図の伝達度を高めるために、話者がひとまとまりの発話を話し切るのを待つのではなく、発話の途中であっても機械翻訳処理を漸進的に行う必要がある。このような機械翻訳は、漸進翻訳または同時翻訳と呼ばれる。
同時翻訳では、連続的に入力される発話からなる原言語テキストを適切な処理単位に分割し、目的言語テキストに翻訳する。しかしながら、新聞記事やマニュアルといった校正済みの書き言葉とは異なり、話し言葉では、文(Sentence)や節(Clause)の区切りの目安となる句読点(Punctuation)の情報が利用できず、処理単位を適切に分割することは困難であった。
このような困難さを解消するために、特許文献1では、独話をその構成単位に分割するために、音声による情報の一つである、短い中断である「ポーズ」によって分割された原言語テキストと、その原言語テキストの形態素解析情報を用いて、所定のパターンに応じて分割位置を修正するテキスト分割処理装置が開示されている。
特開2007−18098号公報
しかし、このように分割された処理単位を漸進的に翻訳するだけでは、文全体としての構文構造を変換することができず、意図の伝達度が低い翻訳結果となってしまう。
例えば、音声発話を音声認識処理し、「アプリの更新はバグの修正が遅れているので来週になりそうです」という原言語テキストが入力された場合を考える。この原言語テキストを解析すると、「アプリの更新は//バグの修正が遅れているので//来週になりそうです」の3つの節からなる処理単位に分割される(ここで//は処理単位の分割位置を表す)。この処理単位を漸進的に翻訳すると、「an update of application // because a bug fixing is late // it will be next week」という翻訳結果を得ることができる。しかしながら、この翻訳結果では、「it」の指す対象が「an update of application(アプリの更新)」なのか「a bug fixing(バグの修正)」なのかが曖昧となり、意図の伝達に支障が生じる。
本開示は、上述の課題を解決するためになされたものであり、独話に代表される連続的な発話に対する同時翻訳において、できる限り同時性を保ちつつ、意図の伝達度を高める様に、原言語テキストの分割処理ならびに翻訳処理を行うことのできる機械翻訳装置を提供することを目的とする。
第1の発明は、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割部と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、前記目的言語テキストを出力する出力部と、を備えた機械翻訳装置である。
第2の発明は、前記処理単位は節である、第1の発明記載の機械翻訳装置である。
第3の発明は、前記解析情報は、前記原言語テキストの形態素解析結果および構文解析結果を含み、前記翻訳順序情報は、現在の処理単位に係る翻訳結果をバッファにため、その出力順序が遅延可能かどうかを示す情報を含み、前記処理単位分割部は、前記形態素解析結果により分割位置を決定する手段、及び前記構文解析結果により前記翻訳順序情報を決定する手段を含み、前記翻訳制御部は、前記翻訳順序情報が遅延可能である場合、現在の翻訳結果の出力を遅延させ、前記翻訳順序情報が遅延不可能である場合、現在の翻訳結果に未出力の翻訳結果を追加して目的言語テキストを生成する手段を含む、第1の発明記載の機械翻訳装置である。
第4の発明は、前記処理単位分割部は、直前に処理された翻訳処理に係る時刻情報と、現在の処理単位に係る時刻情報、との時刻差分情報により、前記翻訳順序情報を修正する手段をさらに含む、第3の発明記載の機械翻訳装置である。
第5の発明は、前記構文解析情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、第3または第4の発明記載の機械翻訳装置である。
第6の発明は、前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、前記翻訳制御部は、前記翻訳順序情報に応答して、現在の翻訳結果に前記音声認識結果修正部によって修正された原言語テキストの翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、第3乃至第5の発明記載の機械翻訳装置である。
第7の発明は、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、前記目的言語テキストを出力する出力工程と、を備えた、コンピュータが実行する機械翻訳方法である。
第8の発明は、機械翻訳装置に、逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラムである。
第1実施形態に係る機械翻訳装置100のブロック図。 処理単位分割部102のブロック図。 解析部201における解析結果の例を示す図。 教師テキストコーパスの例を示す図。 翻訳順序判定部204における判定規則ルールの例を示す図。 翻訳制御部103のブロック図。 第1実施形態に係る同時翻訳処理の手順を表すフローチャート。 同時翻訳処理における翻訳順序制御の第1具体例を示す図。 音声入力に時間遅延が含まれる場合の同時翻訳処理における翻訳順序制御の第2具体例を示す図。 音声認識結果に認識誤りが含まれる場合の同時翻訳処理における翻訳順序制御の第3具体例を示す図。
以下、本発明の実施の形態について図面を参照しながら説明する。
ここで、本実施形態では、日本語の原言語文から英語の目的言語文への翻訳を例にして説明するが、翻訳の原言語および目的言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。
図1は、本実施形態に係る機械翻訳装置100のブロック図である。機械翻訳装置100は、原言語の音声入力を受け付ける音声認識処理部101と、処理単位分割部102と、翻訳制御部103と、翻訳処理部104と、目的言語テキストを出力する出力部105と、及び音声認識結果修正部106を備える。
音声認識処理部101は、機械翻訳装置100への入力である原言語の音声入力を受け取り、音声認識結果である原言語テキスト、及び音声認識結果の確からしさを表す信頼度を生成する。音声認識処理には、隠れマルコフモデルに基づく手法など、広く一般に知られた手法が適用可能であるので、詳細な説明は省略する。
処理単位分割部102は、音声認識処理部101から原言語テキストと、翻訳制御部103から過去に翻訳された処理単位に関する時刻情報を受け取り、翻訳順序が変更可能かどうかを示す翻訳順序情報を含む、原言語テキストの部分テキスト(部分的な意味のまとまり、例えば節)である処理単位を生成する。
翻訳制御部103は、処理単位分割部102によって生成された処理単位を受け取り、翻訳処理部104を介して翻訳結果である目的言語テキストを生成する。
翻訳処理部104は、原言語テキストを受け取り、機械翻訳によって目的言語テキストを生成する。機械翻訳としては、従来から知られている規則ベース翻訳(Rule Based Machine Translation)、用例ベース翻訳(Example Based Machine Translation)、統計翻訳(Statistical Machine Translation)などが適用可能である。これらは広く一般的に知られているものであるので詳細な説明は省略する。
出力部105は、翻訳制御部103によって生成された目的言語テキストを出力する。また、音声認識処理部101によって認識された原言語テキスト及び信頼度を併せて出力することもできる。さらに、信頼度が一定の閾値以下となる原言語テキスト部分を注釈して提示し、ユーザに音声認識結果の修正を促してもよい。出力方法は、例えば、ディスプレイ装置(図示せず)による画像出力、プリンタ装置(図示せず)による印字出力、音声合成装置(図示せず)による音声出力などのいかなる方法で実行されてもよい。また、これらの出力方法を複数組み込んでおき、必要に応じて切り替えるように構成してもよく、これらの出力方法のうちの2以上を併用してもよい。
音声認識結果修正部106は、ユーザの操作に応答し、音声認識結果を修正する機能を有する。修正は、キーボード(図示せず)及びマウス(図示せず)による操作や、音声入力の言い直しによる操作などのいかなる方法で実行されてもよい。さらに、音声認識処理部101から修正候補を受け取り、その候補の中のいずれかをユーザが選択してもよい。
図2は処理単位分割部102のブロック図である。処理単位分割部102は、音声認識処理部101から原言語テキストを受け取る解析部201と、分割位置判定部202と、モデル記憶部203と、翻訳順序判定部204と、及び処理単位生成部205を備える。
解析部201は、原言語テキストを形態素単位に区切り品詞情報などを得る形態素解析や、節間の文法的な関係性を得る構文解析によって、解析情報を取得する。例として、図3に入力例301「アプリの更新はバグの修正が遅れているので来週になりそうです」に対する解析結果を示す。解析結果302において、形態素「ので」の品詞情報が接続詞であり、「バグの修正が遅れているので」を文法的に意味のあるひとまとまり(すなわち、節)とみなし、構文情報として「副詞節―理由」と解析されたことを示している。
分割位置判定部202は、上述の解析結果を受け取り、モデル記憶部203と照合し、分割位置を判定する。
モデル記憶部203は教師テキストコーパスを元に構築された判定モデルが格納されている。図4は、教師テキストコーパスの一例を示すである。教師テキストコーパスは、教師テキストに対して予め分割位置と発話時の時刻情報が付与された教師データ401の集合である。教師データ401では、教師テキスト文「原材料の納品が遅れているので製品の出荷が遅れそうです」が第1の節「原材料の納品が遅れているので」及び第2の節「製品の出荷が遅れそうです」に分割され、各節を発話した時刻情報が記憶されている。また、モデル記憶部203に記憶されるモデルは、条件付き確率場(Conditional Random Field)などの機械学習手法を用いて構築してもよいし、人手によるルールとして構築しても構わない。例えば、人手によるルールの場合、判定モデルのうち、教師データ401に対応した判定基準として、「ので」の前後で分割するルールを作成すればよい。
翻訳順序判定部204は、分割位置判定部202によって分割された処理単位に対して、該当処理単位の翻訳順序が変更可能かどうかを示す翻訳順序情報の判定を行う。図5は翻訳順序判定部204における判定規則ルールの例を示す図である。このルールは原言語(日本語)の構文情報と目的言語文の順序情報(すなわち英語への翻訳順序)を示している。
例えば、第1の節「原材料の納品が遅れているので」が処理単位であり、構文情報「副詞節―理由」に該当する場合、図5に示す判定規則を参照し、目的言語文への翻訳順序情報が「後置可」と判定する。さらに、分割判定部202は、現在の時刻情報(すなわち、音声認識処理部101が原言語の音声入力を受け付けた時刻情報)と、翻訳制御部103より受け取った過去に処理された処理単位に関する時刻情報を比較して、上述の翻訳順序情報を修正する機能を有している。
処理単位生成部205は、分割位置判定部202と翻訳順序判定部204の判定結果を受け取り、翻訳順序が変更可能かどうかを示す翻訳順序情報を含む、原言語テキストの部分テキストである処理単位を生成する。
図6は翻訳制御部103のブロック図である。翻訳制御部103は、受付部601と、制御部602と、及び翻訳結果バッファ603を備える。
受付部601は、処理単位分割部102から処理単位の原言語テキストを受け取り、翻訳処理部104へ入力し、その目的言語テキストの翻訳結果を得る。
制御部602は、処理単位の翻訳順序情報を用いて、翻訳順序情報を制御する。具体的には、翻訳順序情報が「後置可」の場合、現在の翻訳結果を翻訳結果バッファ603に格納し、翻訳順序情報が「後置不可」の場合、現在の翻訳結果に翻訳結果バッファ603に格納された翻訳結果を付け加えることで目的言語テキストを生成する。制御部602は、上述の目的言語テキストを出力部105へ出力すると同時に、その時点の時刻情報を処理単位分割部102へ出力する。
次に、本実施形態に係る機械翻訳装置100による同時翻訳処理について説明する。図7は、本実施形態に係る同時翻訳処理の全体の流れを示すフローチャートである。
まず、音声認識処理部101が原言語による入力を受け付けて、音声認識処理を行う(ステップS701)。
次に、解析部201が原言語テキストの解析処理を行う(ステップS702)。
次に、解析部201による解析結果を受け付けて、分割判定部202が原言語テキストにおける処理単位の判定を行う(ステップS703)。現在の原言語テキストの終端位置が分割位置ではないと判断された場合(ステップS703:NO)、音声認識処理(ステップS701)に戻る。
現在の原言語テキストの終端位置が分割位置であると判断された場合(ステップS703:YES)、翻訳順序判定部204において、処理単位の翻訳順序判定を行う(ステップS704)。翻訳順序判定によって、該当の処理単位が「後置可」であると判断された場合(ステップS704:後置可)、翻訳順序判定部204は翻訳順序情報を「後置可」に設定する(ステップS705)。また、翻訳順序判定によって、該当の処理単位が「後置不可」であると判断された場合(ステップS704:後置不可)、翻訳順序判定部204は翻訳順序情報を「後置不可」に設定する(ステップS706)。
次に、現在の時刻情報と過去に出力された時刻情報の差分から翻訳間隔(すなわち、時刻差分情報)を算出し、予め定められた閾値と比較を行う(ステップS707)。翻訳間隔が閾値以上である場合(ステップS707:閾値以上)、翻訳順序判定部204は翻訳順序情報を「後置不可」に修正する(ステップS708)。
次に、上述の分割位置情報と翻訳順序情報を受け付けて、処理単位生成部205が処理単位を生成する(ステップS709)。
次に、受付部601が上述の処理単位を受け付けて、翻訳処理部104が入力された原言語テキストを目的言語へ翻訳し、翻訳結果へ生成する(ステップS710)。
次に、上述の翻訳順序情報が後置可であった場合(ステップS711:後置可)、制御部602が上述の翻訳結果を翻訳結果バッファ603へ格納し、音声認識処理(ステップS701)に戻る。また、上述の翻訳順序情報が後置不可であった場合(ステップS711:後置不可)、制御部602が上述の翻訳結果に翻訳結果バッファ603に格納されている翻訳結果を付け加え、目的原言語テキストを生成する(ステップS712)。
最後に、上述の目的言語テキストを受け付けて、出力部105が目的言語による出力処理を行い(ステップS713)、処理を終了する。
なお、同図には図示しないが、音声認識結果修正部106によって音声認識結果が修正された場合においても処理の全体の流れは同様である。
本実施形態によれば、同時翻訳処理において、連続して入力される原言語テキストに対して適切な処理単位を検出し、処理単位の順序情報に応じて処理単位毎の翻訳結果の並び順序を制御することで、できる限り同時性を保ちつつ、明瞭な翻訳結果を得ることができ、翻訳後の意図の伝達度も高めることができる。
続いて、本実施形態に係る同時翻訳処理の具体例3つを説明する。
(第1具体例)
図8は、同時翻訳処理における翻訳順序制御の第1具体例を示す図である。ここでは、「アプリの更新はバグの修正が遅れているので来週になりそうです」に対応する音声入力が順次なされ、音声認識処理部101により正しい原言語テキストが得られた場合の処理を時系列に沿って説明する。
まず、時刻T1において、処理単位分割部102により処理単位801「アプリの更新は//<翻訳順序情報:後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部103は、翻訳処理部104によって得られた翻訳結果802「an update of applications 」の出力順序が遅延不可と判断し、翻訳結果802を出力部105へ出力する(時刻T2)。
次に、時刻T3において、処理単位分割部102により処理単位803「バグの修正が遅れているので//<翻訳順序情報:後置可>」を得る。ここで、翻訳順序情報が後置可であることに応答して、翻訳制御部103は、翻訳結果の出力を遅延させる(時刻T4)。
次に、時刻T5において、処理単位分割部102により処理単位804「来週になりそうです//<翻訳順序情報:後置不可>」を得る。ここで、翻訳順序情報が後置可であるので、翻訳制御部103は、処理単位804に対する翻訳結果に翻訳結果バッファ603に格納された翻訳結果を追加し、翻訳結果805「it will be next week // because a bug fixing is late」を出力する(時刻T5)。最終的な翻訳結果は、「an update of application // it will be next week // because a bug fixing is late」となる。このように、本実施形態に係る同時翻訳処理では、主節に対する結論部分が先に訳出され、理由を表す副詞節が文全体を修飾するため、曖昧性の低く意図の伝達度が高い翻訳結果を得ることができる。
(第2具体例)
図9は、音声入力に時間遅延が含まれる場合の同時翻訳処理における翻訳順序制御の第2具体例を示す図である。ここでは、音声入力にポーズ、フィラー、言いよどみ等の時間的遅れ要因が含まれる場合の同時翻訳処理について説明する。以下の説明では、時刻情報判定ステップS707における閾値が2.00秒に設定されているものとする。
まず、時刻T1において、処理単位分割部102により処理単位901「アプリの更新は//<翻訳順序情報:後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部103は、翻訳処理部104によって得られた翻訳結果902「an update of applications 」を出力する。このときの時刻T2は01:00であったとする。
上述の翻訳結果を出力してから次の原言語テキストを得るまでに、音声入力中のポーズ、フィラー、言いよどみ等が原因で時間遅延が発生し、時刻T3(03:05)において処理単位分割処理が行われたとする。この場合、本来の翻訳順序情報(後置可)に基づいて、以降の処理を続けた場合、翻訳結果における時刻遅延が更に増大し、同時性が損なわれてしまう。この問題を解決するために、第2具体例では、時刻情報判定ステップS707において、直前の翻訳結果を出力時刻情報と現在の時刻情報から翻訳間隔を算出し、閾値と比較することで、翻訳順序情報を修正が行われる。これにより、処理単位903「アプリの更新は//<翻訳順序情報:後置可>」を得て、翻訳結果904「because a bug fixing is late」を出力する。
以下同様に、処理単位905「来週になりそうです//<翻訳順序情報:後置不可>」に対応する翻訳結果906「it will be next week」を出力し、最終的な翻訳結果「an update of application // because a bug fixing is late // it will be next week」を得る。このように、音声入力に時間遅延が発生した場合においても、同時性を確保することができる。
(第3具体例)
図10は、音声認識結果に認識誤りが含まれる場合の同時翻訳処理における翻訳順序制御の第3具体例を示す図である。原言語テキストが音声入力に対する音声認識結果である場合、音声認識結果に誤りが含まれていることがあり、同時翻訳の処理途中に音声認識結果を修正しなければならない状況が起こりうる。このような状況では、該当する処理単位の音声認識結果の修正を待たなければ、後続する処理単位の翻訳結果を出力することができず、同時性が損なわれてしまう、という問題があった。
第3具体例では、音声認識処理結果がディスプレイ(不図示)に表示され、発話者(原言語話者)であるユーザが音声認識結果に誤りがあると判断し、音声認識結果を修正する場合の処理について説明する。なお、音声認識処理結果の信頼度もディスプレイに表示されていてもよい。
以下の説明では、時刻T3において「バグの“種類”が〜」と誤って認識されて、時刻T7において「バグの“修正”が〜」にキーボード入力によって修正されたものとする。ただし、修正の入力方法はキーボードに限られない。
まず、時刻T1において、処理単位分割部102により処理単位1001「アプリの更新は//<翻訳順序情報:後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部103は、翻訳処理部104によって得られた翻訳結果1002「an update of applications 」を出力する。
次に、時刻T3において、処理単位分割部102により認識誤りを含む処理単位1003「バグの種類が遅れているので//<翻訳順序情報:後置可>」を得る。ここで、翻訳順序情報が後置可であることに応答して、翻訳制御部103は、翻訳結果の出力を遅延させる(時刻T4)。
このとき、処理単位1003の音声認識信頼度が低いため、ここに認識誤りが含まれると気づいたユーザは、音声認識結果修正部106により、認識結果の修正を行うことができる。音声認識結果修正部106による修正に応答して、翻訳結果バッファ603の該当する翻訳結果をクリアする。
従来技術では、処理単位が漸進的に翻訳されるので、当該処理単位の音声認識結果の修正が終わるまでは後続の音声入力を受け付けることができず、同時性が損なわれてしまっていた。
しかしながら、第3具体例においては、処理単位の出力を非同期に制御することにより、認識結果の修正と後続の音声入力の受け付けを並行して行うことができる。また、認識誤りを含む翻訳結果の出力を遅延させることで、誤って理解されることを回避し、原言語話者の意図の伝達度を高めるという効果も奏する。
次に、時刻T5において、処理単位分割部102により処理単位1004「来週になりそうです//<翻訳順序情報:後置不可>」を得る。ここで、翻訳順序情報が後置不可であるので、翻訳制御部103は、翻訳処理部104によって得られた翻訳結果1005「it will be next week」を出力する(時刻T6)。
次に、時刻T7において、認識結果の修正処理が完了し、処理単位1006「バグの修正が遅れているので//<翻訳順序情報:後置可>」を得て、修正済みの翻訳結果1007「because a bug fixing is late」を出力する(時刻T8)。このように、音声認識処理結果に認識誤りが含まれる場合においても、同時性を確保しつつ、意図の伝達度の高い同時通訳を実現することができる。
なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
例えば、本実施形態に係る機械翻訳装置をコンピュータで実行可能なプログラムで実現し、このプログラムをコンピュータで読み取り可能な記憶媒体として実現することも可能である。
以下、本願出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割部と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、
前記目的言語テキストを出力する出力部と、を備えた機械翻訳装置。
[C2]
前記処理単位は節である、[C1]記載の機械翻訳装置。
[C3]
前記解析情報は、前記原言語テキストの形態素解析結果および構文解析結果を含み、
前記翻訳順序情報は、現在の処理単位に係る翻訳結果をバッファにため、その出力順序が遅延可能かどうかを示す情報を含み、
前記処理単位分割部は、前記形態素解析結果により分割位置を決定する手段、及び前記構文解析結果により前記翻訳順序情報を決定する手段を含み、
前記翻訳制御部は、前記翻訳順序情報が遅延可能である場合、現在の翻訳結果の出力を遅延させ、前記翻訳順序情報が遅延不可能である場合、現在の翻訳結果に未出力の翻訳結果を追加して目的言語テキストを生成する手段を含む、
[C1]に記載の機械翻訳装置。
[C4]
前記処理単位分割部は、直前に処理された翻訳処理に係る時刻情報と、現在の処理単位に係る時刻情報、との時刻差分情報により、前記翻訳順序情報を修正する手段をさらに含む、
[C3]に記載の機械翻訳装置。
[C5]
前記構文解析情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、[C3]または[C4]に記載の機械翻訳装置。
[C6]
前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、
前記翻訳制御部は、前記翻訳順序情報に応答して、現在の翻訳結果に前記音声認識結果修正部によって修正された原言語テキストの翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、
[C3]乃至[C5]に記載の機械翻訳装置。
[C7]
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、を備えた、コンピュータが実行する機械翻訳方法。
[C8]
機械翻訳装置に、
逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
前記原言語テキスト中に含まれる解析情報により、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその翻訳順序情報を決定する処理単位分割工程と、
前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラム。
100 機械翻訳装置
101 音声認識処理部
102 処理単位分割部
103 翻訳制御部
104 翻訳処理部
105 出力部
106 音声認識結果修正部
201 解析部
202 分割位置判定部
203 モデル記憶部
204 翻訳順序判定部
205 処理単位生成部
601 受付部
602 制御部
603 翻訳結果バッファ

Claims (8)

  1. 逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理部と、
    前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割部と、
    前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理部と、
    前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御部と、
    前記目的言語テキストを出力する出力部と、
    を備えた機械翻訳装置。
  2. 前記処理単位は節である、請求項1記載の機械翻訳装置。
  3. 前記処理単位分割部が文法的な解析を行うことは、前記原言語テキストに対して形態素解析および構文解析を行うことを含み、
    前記翻訳順序情報は、現在の処理単位に係る翻訳結果が他の処理単位の翻訳結果より後に置かれることが可能かどうかを示
    前記処理単位分割部は、前記形態素解析結果により前記処理単位の分割位置を決定する手段、及び前記構文解析結果により決定される前記処理単位の前記構文情報で前記構文情報と前記翻訳順序情報との予め定められた関係を参照することにより前記翻訳順序情報を決定する手段を含み、
    前記翻訳制御部は、現在の処理単位に係る前記翻訳順序情報が、現在の処理単位に係る翻訳結果が後に置かれることが可能であることを示す場合、現在の翻訳結果の出力をバッファにため、前記翻訳順序情報が、現在の処理単位に係る翻訳結果が後に置かれることが可であることを示す場合、現在の翻訳結果の後、前記バッファにためられた以前の処理単位に係る翻訳結果を追加して目的言語テキストを生成する手段を含む、
    請求項1に記載の機械翻訳装置。
  4. 前記処理単位分割部は、直前に処理された処理単位に係る翻訳処理時刻情報と、現在の処理単位に係る時刻情報との時刻差分情報を閾値と比較して時間遅延が発生したことを判断することにより、前記時刻差分情報が前記閾値を超える場合、前記翻訳順序情報を、翻訳結果の順序を変更しないように修正する手段をさらに含む、
    請求項3に記載の機械翻訳装置。
  5. 前記構文情報は、前記分割位置によって分割された原言語テキストが従属節として該当するかどうかを示す節情報を含む、請求項3または請求項4に記載の機械翻訳装置。
  6. 前記音声認識処理部の認識結果を修正する音声認識結果修正部をさらに含み、
    前記翻訳制御部は、
    前記翻訳順序情報が、処理単位の翻訳結果の順序が変更可能であると示すことに応答して、当該処理単位の翻訳結果をバッファにため、
    前記処理単位の認識結果に修正がある場合、前記音声認識結果修正部によって修正された原言語テキストを翻訳し、修正された翻訳結果で前記バッファの内容を置き換え、
    現在の処理単位に係る翻訳結果に前記修正された翻訳結果を追加して目的原言語テキストを生成する手段をさらに含む、
    請求項3乃至5のいずれか一項に記載の機械翻訳装置。
  7. 逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
    前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割工程と、
    前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
    前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
    前記目的言語テキストを出力する出力工程と、
    を備えた、コンピュータが実行する機械翻訳方法。
  8. 機械翻訳装置に、
    逐次的に入力される原言語の音声入力を受けて、音声認識処理結果である原言語テキストを生成する音声認識処理工程と、
    前記原言語テキストに対して文法的な解析を行うことにより、前記原言語テキストの部分的な意味のまとまりである処理単位の分割位置及びその処理単位の構文情報を決定し、前記処理単位の翻訳結果の順序が他の処理単位の翻訳結果に対して変更可能かどうかを示す翻訳順序情報を、前記構文情報と前記翻訳順序情報との予め定められた関係に基づいて決定する処理単位分割工程と、
    前記処理単位を逐次的に目的言語へ翻訳処理を実行して翻訳結果を得る翻訳処理工程と、
    前記処理単位毎の翻訳結果を、前記翻訳順序情報に基づいて並べた目的言語テキストを生成する翻訳制御工程と、
    前記目的言語テキストを出力する出力工程と、を実現させるための機械翻訳プログラム。
JP2014202631A 2014-09-30 2014-09-30 機械翻訳装置、方法およびプログラム Active JP6334354B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014202631A JP6334354B2 (ja) 2014-09-30 2014-09-30 機械翻訳装置、方法およびプログラム
US14/853,039 US20160092438A1 (en) 2014-09-30 2015-09-14 Machine translation apparatus, machine translation method and program product for machine translation
CN201510633868.XA CN105468585A (zh) 2014-09-30 2015-09-29 机器翻译装置和机器翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014202631A JP6334354B2 (ja) 2014-09-30 2014-09-30 機械翻訳装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016071761A JP2016071761A (ja) 2016-05-09
JP6334354B2 true JP6334354B2 (ja) 2018-05-30

Family

ID=55584612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014202631A Active JP6334354B2 (ja) 2014-09-30 2014-09-30 機械翻訳装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20160092438A1 (ja)
JP (1) JP6334354B2 (ja)
CN (1) CN105468585A (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6470097B2 (ja) * 2015-04-22 2019-02-13 株式会社東芝 通訳装置、方法およびプログラム
KR102195627B1 (ko) * 2015-11-17 2020-12-28 삼성전자주식회사 통역 모델 생성 장치 및 방법과, 자동 통역 장치 및 방법
US11030407B2 (en) * 2016-01-28 2021-06-08 Rakuten, Inc. Computer system, method and program for performing multilingual named entity recognition model transfer
JP2017167805A (ja) 2016-03-16 2017-09-21 株式会社東芝 表示支援装置、方法およびプログラム
US10339224B2 (en) 2016-07-13 2019-07-02 Fujitsu Social Science Laboratory Limited Speech recognition and translation terminal, method and non-transitory computer readable medium
JP6678545B2 (ja) * 2016-09-12 2020-04-08 株式会社東芝 修正システム、修正方法及びプログラム
CN107632980B (zh) * 2017-08-03 2020-10-27 北京搜狗科技发展有限公司 语音翻译方法和装置、用于语音翻译的装置
JP7197259B2 (ja) * 2017-08-25 2022-12-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理方法、情報処理装置およびプログラム
CN110245358B (zh) * 2018-03-09 2024-02-02 北京搜狗科技发展有限公司 一种机器翻译方法及相关装置
CN112055876A (zh) * 2018-04-27 2020-12-08 语享路有限责任公司 利用语音识别技术的多方对话记录/输出方法及用于其的装置
CN109582982A (zh) * 2018-12-17 2019-04-05 北京百度网讯科技有限公司 用于翻译语音的方法和装置
CN109992753B (zh) * 2019-03-22 2023-09-08 维沃移动通信有限公司 一种翻译处理方法及终端设备
CN112037768A (zh) * 2019-05-14 2020-12-04 北京三星通信技术研究有限公司 语音翻译方法、装置、电子设备及计算机可读存储介质
WO2020240905A1 (ja) * 2019-05-31 2020-12-03 株式会社Abelon 音声処理装置、音声の対のコーパスの生産方法、およびプログラムを記録した記録媒体
CN112395889A (zh) * 2019-08-01 2021-02-23 林超伦 机器同步翻译
US11328132B2 (en) * 2019-09-09 2022-05-10 International Business Machines Corporation Translation engine suggestion via targeted probes
KR20210032809A (ko) 2019-09-17 2021-03-25 삼성전자주식회사 동시 통역 방법 및 장치
CN110826345B (zh) * 2019-11-14 2023-09-05 北京香侬慧语科技有限责任公司 一种机器翻译方法和装置
CN111178090A (zh) * 2019-12-05 2020-05-19 语联网(武汉)信息技术有限公司 一种用于企业名称翻译的方法及***
CN113076760B (zh) * 2020-01-03 2024-01-26 阿里巴巴集团控股有限公司 翻译、商品检索方法、装置、电子设备及计算机存储介质
JP2023514158A (ja) * 2020-02-06 2023-04-05 グーグル エルエルシー オーディオストリームの安定したリアルタイム翻訳
US11367447B2 (en) * 2020-06-09 2022-06-21 At&T Intellectual Property I, L.P. System and method for digital content development using a natural language interface
KR20220042509A (ko) * 2020-09-28 2022-04-05 주식회사 아모센스 음성 처리 장치 및 이의 작동 방법
CN112735417B (zh) * 2020-12-29 2024-04-26 中国科学技术大学 语音翻译方法、电子设备、计算机可读存储介质
CN112784612B (zh) * 2021-01-26 2023-12-22 浙江香侬慧语科技有限责任公司 基于迭代修改的同步机器翻译的方法、装置、介质及设备
CN112818710A (zh) * 2021-02-05 2021-05-18 中译语通科技股份有限公司 一种异步网络机器翻译请求的处理方法、装置
CN112929633A (zh) * 2021-02-07 2021-06-08 北京有竹居网络技术有限公司 一种同声传译接收设备及方法
US20240111967A1 (en) * 2021-02-24 2024-04-04 National Institute Of Information And Communications Technology Simultaneous translation device and computer program
US20220293098A1 (en) * 2021-03-15 2022-09-15 Lenovo (Singapore) Pte. Ltd. Dialect correction and training
JP2022152805A (ja) * 2021-03-29 2022-10-12 国立研究開発法人情報通信研究機構 同時翻訳システム及び方法
CN113642333A (zh) * 2021-08-18 2021-11-12 北京百度网讯科技有限公司 显示方法和装置、语义单元检测模型的训练方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
US6463404B1 (en) * 1997-08-08 2002-10-08 British Telecommunications Public Limited Company Translation
JP2001117920A (ja) * 1999-10-15 2001-04-27 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
JP2007018098A (ja) * 2005-07-05 2007-01-25 Advanced Telecommunication Research Institute International テキスト分割処理装置及びコンピュータプログラム
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
JP4047885B2 (ja) * 2005-10-27 2008-02-13 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
JP4791984B2 (ja) * 2007-02-27 2011-10-12 株式会社東芝 入力された音声を処理する装置、方法およびプログラム
JP5112116B2 (ja) * 2008-03-07 2013-01-09 株式会社東芝 機械翻訳する装置、方法およびプログラム
US20100121630A1 (en) * 2008-11-07 2010-05-13 Lingupedia Investments S. A R. L. Language processing systems and methods
KR101762866B1 (ko) * 2010-11-05 2017-08-16 에스케이플래닛 주식회사 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
JP6150268B2 (ja) * 2012-08-31 2017-06-21 国立研究開発法人情報通信研究機構 単語登録装置及びそのためのコンピュータプログラム

Also Published As

Publication number Publication date
US20160092438A1 (en) 2016-03-31
JP2016071761A (ja) 2016-05-09
CN105468585A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
JP6334354B2 (ja) 機械翻訳装置、方法およびプログラム
US8626486B2 (en) Automatic spelling correction for machine translation
US11847425B2 (en) Machine translation system for entertainment and media
US9170994B2 (en) Machine translation apparatus, method and computer readable medium
KR102375115B1 (ko) 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화
US20060048055A1 (en) Fault-tolerant romanized input method for non-roman characters
JP6471074B2 (ja) 機械翻訳装置、方法及びプログラム
US20150186355A1 (en) Adaptive parser-centric text normalization
JP2009140503A (ja) 音声翻訳方法及び装置
US9984689B1 (en) Apparatus and method for correcting pronunciation by contextual recognition
US20180143974A1 (en) Translation on demand with gap filling
CN103474069A (zh) 用于融合多个语音识别***的识别结果的方法及***
US20160314116A1 (en) Interpretation apparatus and method
JP2019121241A (ja) 翻訳装置、翻訳方法、及びプログラム
CN113225612B (zh) 字幕生成方法、装置、计算机可读存储介质及电子设备
Niehues et al. Dynamic Transcription for Low-Latency Speech Translation.
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
KR20180039371A (ko) 자동 통역 시스템
KR101621154B1 (ko) 소셜 텍스트를 위한 철자 오류 교정 방법 및 장치
JP2012018201A (ja) テキスト補正方法及び認識方法
KR20170055630A (ko) 다국어 번역 방법
JP5623380B2 (ja) 誤り文修正装置、誤り文修正方法およびプログラム
Batista et al. Extending automatic transcripts in a unified data representation towards a prosodic-based metadata annotation and evaluation
KR20140079543A (ko) 자동 통번역 장치
KR20110066467A (ko) 요소화 언어모델을 이용한 번역 오류 후처리 보정 방법 및 장치

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20170220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170306

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20170306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180426

R151 Written notification of patent or utility model registration

Ref document number: 6334354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350