JP3870722B2 - 翻訳装置、記録媒体 - Google Patents
翻訳装置、記録媒体 Download PDFInfo
- Publication number
- JP3870722B2 JP3870722B2 JP2001167615A JP2001167615A JP3870722B2 JP 3870722 B2 JP3870722 B2 JP 3870722B2 JP 2001167615 A JP2001167615 A JP 2001167615A JP 2001167615 A JP2001167615 A JP 2001167615A JP 3870722 B2 JP3870722 B2 JP 3870722B2
- Authority
- JP
- Japan
- Prior art keywords
- example sentence
- translation
- word
- sentence template
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、音声翻訳装置、及び記録媒体に関し、特に、海外旅行用携帯翻訳機などに好適な発話誘導型の音声翻訳装置、及びこれを実現するための記録媒体に関する。
【0002】
【従来の技術】
従来の翻訳装置には、大きく分けて二種類の翻訳装置がある。1種類目の翻訳装置は任意の入力文を翻訳する装置であり、2種類目の翻訳装置は、あらかじめ用意された対訳例文を場面やキーワードによって検索して翻訳する装置である。
【0003】
第1の任意の入力文を翻訳する翻訳装置として、テキストを対象としたものでは、すでに多くの機械翻訳システムが実用化されている。翻訳方式としては、辞書と文法規則に基づいて翻訳を行うルールベース翻訳が広く採用されている。しかし、文法規則でうまく扱えない文章表現(言語現象)が新たに現れた場合に規則の記述が難しいため、用例を利用した用例ベース翻訳の研究もされている。
【0004】
一方、音声を対象とした翻訳装置の場合は、まず音声認識が正しくなされないと正しい翻訳結果が得られないという問題がある。この問題を解決するため、例えば特開平08-328585では、入力された音声と用例データベース中のすべての用例との言語的類似度を計算することにより、複数の音声認識結果候補の中から正解を選ぶ方法が示されている。
【0005】
第2のあらかじめ用意された対訳例文を検索する方法の翻訳装置として、例えば、特開昭56-88564に、カテゴリーを指定すると例文が表示され、例文の中から文を選択すると選択した例文の翻訳文が音声出力される携帯型の翻訳装置が記載されている。
【0006】
【発明が解決しようとする課題】
海外旅行中は、依頼や質問などの比較的決まりきった内容の、短い会話のやりとりを他人とする場面が多い。しかし、旅行という非日常的な場面であるために、話者の発話意図に対して、具体的に話す内容、表現、あるいは単語が母国語でもすぐに思いつかない場合が少なくない。このため、第1の任意の入力文を翻訳する翻訳装置では、入力する文章をすぐに思いつかないため、旅行中の外国語会話を支援するという目的を充分に達成できない場合がある。例えば、飛行機から降りて機内預かりの手荷物を受け取る場所を尋ねたり、手荷物引き換え証を係員に提示したりする際に、「アメリカン航空121便の手荷物受取所はどこですか。」「私の荷物が出てきません。これが手荷物引換証です。」といった日本文が完全な形ですぐに頭に浮かぶとは限らない。母国語である日本語の通じる相手と直接会話をする場合は、相手の反応を見ながら「乗るときに預けた荷物は...えーと、どこで...便名?アメリカンの121便です。」「荷物が出てこないんですけど...手荷物引換証?ああ、乗るときにもらった控えですか?えーと、これです。」などというやりとりで通じるかもしれないが、機械翻訳で外国語に訳す場合は、「アメリカン航空121便の手荷物受取所はどこですか。」「私の荷物が出てきません。これが手荷物引換証です。」のような完全な文が入力されないとうまく訳すことができない。また、母国語で話す場合と違って、「便名はなんですか」「手荷物引換証を見せてください」などと相手に聞き返されても理解できないので、はじめから十分な情報を含む文を相手に伝える必要がある。
【0007】
一方、第2のあらかじめ用意された対訳例文を検索する翻訳装置は、このような任意文入力の問題点を回避することができる。また、処理が単純であるため、携帯型の翻訳機として実現しやすい。しかし、場面別に分類された例文をメニュー選択によって検索する従来の方法では、例文数が多くなると、何度も選択ボタンを押して場面の絞り込みを繰り返すか、1つの場面に対して数多くある例文をスクロール表示させる必要があるため、使いたい例文を見つけるまでに時間がかかるという問題がある。また、1つの例文について単語の置き換え候補をスクロール等の手段で探す従来の方法では単語の置き換え候補数を多くした場合に操作性が良くないという問題がある。例えば、前述の手荷物受取所の場所を尋ねる例では、「日本航空753便の手荷物受取所はどこですか。」という例文を見つけた後、スクロールしたりボタンを押したりして便名を「アメリカン航空121便」に置き換えるのは面倒である。
【0008】
本発明の目的は、ユーザの発話意図に適した例文テンプレートを表示してユーザの発話を誘導することにより、例文検索型の翻訳装置の利点と任意文入力型の翻訳装置の利点を兼ね備えた翻訳装置を実現することにある。
【0009】
【課題を解決するための手段】
上記課題を解決するため、翻訳装置において、複数の例文テンプレートを記憶する例文ファイルと、入力された音声を認識する音声認識部と、上記音声に類似した例文テンプレート中の語句を上記音声に基づいて置換して翻訳する手段と、翻訳文を音声出力する音声出力部または、翻訳文を表示するディスプレイを有するものとする。また、コンピュータ読みとり可能な記録媒体であって、第1の音声を音声認識手段によって認識するステップと、上記第1の音声と関連づけられた例文テンプレートを検索してディスプレイに表示するステップと、第2の音声を上記音声認識手段によって認識するステップと、上記検索された例文テンプレート中の語句を上記第2の音声に基づいて置換して翻訳するステップと、翻訳結果を痔巣プレイに表示、又は、音声出力するステップとが記録されたものとする。
【0010】
例えば、翻訳装置では、あらかじめ用意された例文を検索する翻訳装置であって、例文ファイルに記憶する例文を、語句の置き換えが可能な部分(以下スロットという)を含む例文テンプレートとして記述しておく。 例文テンプレートにはスロットに関する情報として、そのスロットに現われうる語句の分類コード(例えば場所、日付等の情報)と代表例を記述する。各例文テンプレートにはキーワード(例えば、予約、飛行機、チケット等の情報)を付与する。キーワードには具体的な単語だけでなく、分類コードも記述できるものとする。
【0011】
本発明の翻訳装置の単語辞書には、音声入力されたキーワードで例文テンプレートを検索するための情報として、単語の発音情報と分類コードを記述する。また、テンプレート翻訳を行なうための情報として、見出しの文法情報、訳語、および訳語の文法情報を記述する。
例文テンプレートを検索するための手段としては、音声で入力されたキーワードを認識する単語認識手段と、認識した単語およびその分類コードがキーワード情報に記述されている例文テンプレートを検索する手段と、複数の例文テンプレートを画面に表示する手段とを設ける。
【0012】
テンプレート翻訳を行なうための手段としては、音声で入力された文に対して、複数の例文テンプレートの中から類似度が高い例文テンプレートを選択する文音声認識手段と、単語辞書の音韻情報を参照してスロットに挿入された語句を認識する単語音声認識手段と、単語辞書および翻訳規則を参照してスロットに挿入された語句の訳語および語形を決定する手段と、例文テンプレートの訳文情報とスロットに挿入された語句の訳を組み合わせて訳文を生成する手段とを設ける。
【0013】
ユーザが単語を音声入力すると、単語辞書の音韻情報を参照することによって入力された単語および分類コードを認識する。そしてこれらがキーワード情報に記述されている例文テンプレートを検索し、画面に表示する。例文テンプレートには例文に含まれるスロットに関する情報として、そのスロットに現われうる語句の代表例が記述されている。従って、例文テンプレートを画面に表示する際には、スロットに代表例が挿入された状態で表示する。
【0014】
画面に1つ以上の例文テンプレートが表示されている状態で、例文テンプレートのスロットにユーザの所望の語句を挿入した文を音声入力する。すると、画面に表示されている例文テンプレートのうち、類似度が高い例文テンプレートに基づいて音声入力文の翻訳を実行し、訳文を表示する。例えば、ユーザが「電話」という単語を音声で入力すると、「電話」という単語がキーワード情報に記述されている例文テンプレートを検索する。画面には「[電話]はどこですか」「[市内電話]のかけ方を教えてください」「[日本]に[コレクトコール]をかけたい」などの例文テンプレートが表示される。下線部はスロットを表す。ユーザは画面をスクロールしながら使えそうな例文を探す。使えそうな例文、例えば「[日本]に[コレクトコール]をかけたい」を見つけたら、「カナダに国際電話をかけたい」という文を音声で入力する。すると、翻訳機は、「[日本]に[コレクトコール]をかけたい」という例文テンプレートを使ったことを認識するとともに、「日本」「コレクトコール」が「カナダ」「国際電話」に置換されたことを認識し、テンプレート翻訳を実行する。
【0015】
【発明の実施の形態】
本発明の実施例を図1から図14までを用いて説明する。本実施例は、日本語を母国語とする利用者が英語圏を旅行するための携帯型の音声翻訳装置である。本音声翻訳装置は、ユーザがキーワードを音声入力すると例文テンプレートを検索して表示する。ユーザが例文テンプレートの置き換え可能な単語を別の単語に置き換えてしゃべると、どの例文テンプレートを使って何という単語に置き換えたかを認識し、入力文に対する訳文を表示・発声する。
【0016】
次に、本実施例の翻訳機の外観を説明する。図1は本発明の一実施例である音声翻訳装置の外観および初期画面を示す図である。音声翻訳装置101は、表示画面102、電源スイッチ103、リセットボタン104、訳文を音声出力するためのスピーカー105、例文検索のキーワードを音声入力するためのマイク106、例文検索・翻訳・訳文発声等を指示するための実行ボタン107、前の画面に戻るための「戻る」ボタン108、画面上を前後左右に移動するためのスクロールボタン109〜112を備えている。
【0017】
次に、本実施例の翻訳記のハードウエア構成を説明する。図2は、本音声翻訳装置のハードウエア構成を示す。本音声翻訳装置は、装置の制御と音声認識、翻訳、音声合成処理を行うためのCPU201、音声入力装置202、音声出力装置203、単語辞書204、例文ファイル205、メモリ206によって構成されている。メモリ206には、制御プログラム261、単語音声認識プログラム262、文音声認識プログラム263、テンプレート翻訳プログラム264、音声出力プログラム265、画面表示プログラム266が記憶されている。
【0018】
次に、例文ファイルの内容を説明する。
【0019】
図6に例文ファイルの内容を示す。例文ファイルには、各例文テンプレートについて、例文番号601、基本例文番号602、詳細例文番号603、キーワード604、原文テンプレート605、原文テンプレートの発音を記述した発音情報606、訳文テンプレート607、訳文テンプレートの発音を記述した訳文発音情報608、スロット情報609が記述されている。スロット情報609には、スロット数6091が記述され、各スロットについて、スロットに入る語句の代表例6092、代表例の訳6093、代表例の訳の発音情報6094、スロットにどのような語句が入るかを記述した意味情報6095、訳文におけるスロット部分の文法特徴(冠詞、単複等)を記述した文法情報6096が記述されている。
【0020】
例文には「予約したい」のような基本例文と、「一番早く乗れる便を探してください。」のような詳細例文がある。基本例文に対しては、それに対応する詳細例文の例文番号が詳細例文番号603に記述されている。詳細例文に対しては、それに対応する基本例文の例文番号が基本例文番号602に記述されている。
【0021】
キーワードで例文を検索すると、基本例文が上の方に表示される。ユーザが「予約したい」を選択して詳細例文の表示を指示すると、「一番早く乗れる便を探してください。」などの詳細例文が表示される。原文テンプレート605および訳文テンプレート607において、置き換え可能な語句はスロットになっている。
【0022】
画面に表示する際には、原文テンプレートのスロットに代表例6092の単語を埋め込んで表示する。ユーザが単語の置き換えをせずに訳文の表示や発声を指示した場合は、訳文に代表例の訳6093を埋め込んで表示し、訳文発音情報608に代表例の訳の発音情報6094を埋め込んで発声する。
【0023】
スロットの意味情報6095の記述は、「往復切符;片道切符;切符」のように単語を列挙してもよいし、「<場所>」のように分類コードを使って記述してもよい。どのような単語にも置き換え可能な場合は条件を記述しない。
【0024】
キーワード604に「<場所>」のような分類コードが記述されている例文は、その分類コードを持つすべての単語から検索される。例えば、ユーザが「郵便局」、「バス停」、または「銀行」など、「<場所>」という分類コードを持つ単語をキーワードとして入力すると、例文1356「一番近い<S1>はどこですか」が検索・表示される。
【0025】
次に、単語辞書の内容について説明する。図7に単語辞書の内容を示す。単語辞書には各単語項目について、単語番号701、見出し702、読み703、発音情報704、文法情報705、分類コード706、訳語707、訳語の発音情報708、訳語の文法情報709、例文番号710が記述されている。「<場所>」などの分類コードを見出しとするレコードの例文番号710は、その分類コードをキーワードとする例文の例文番号である。
【0026】
次に、本実施例の音声翻訳装置の動作について説明する。図3は、本音声翻訳装置の動作の概要を示すフローチャートである。電源ボタン103を押すと(301)、メモリ206のプログラムが起動され、表示画面101に初期画面が表示される(302)。初期画面が表示されている状態でマイク106を通して音声が入力されると、キーワード音声認識を行う(303)。
【0027】
次にキーワード音声認識について図4を参照しながら説明する。まず、単語が音声入力されると(402)、単語辞書204を参照し、隠れマルコフモデル(HMM)などの音声認識アルゴリズムにより、単語音声認識を行い(403)、単語候補を画面に表示する(404)。
【0028】
図8を用いて単語候補表示画面の例を説明する。単語候補表示画面では、一行目に第1候補のかな表記、二行目以降に第1候補から第10候補までの単語候補を表示する。初めは第1候補の単語が反転表示されているが、前後左右スクロールキーを使うことにより、反転表示される単語が前後左右に移動する。これにより、ユーザは意図した単語を選択することができる。図8で画面に表示されていない第4候補以下は、下スクロールキーで画面をスクロールさせることによって見ることができる。単語候補は、同音異義語がある場合は同音異義語を1行に表示し、同音異義語がない場合は対訳を表示する。単語候補の先頭に付いている「*」は例文検索のキーワードであることを示す。
ユーザが意図した単語を選択して実行ボタンを押すと(405)、その単語を例文検索のキーワードとして確定し(408)、キーワード認識処理を終了する(409)。ユーザが意図する単語が単語候補にない場合は、かな表記の一行目を選んで実行ボタンを押すことにより、かなレベルで入力単語を修正し(406)、再度単語辞書検索を行うことができる(407)。また、「もどる」ボタンを押すことにより、キーワード音声入力受付の状態に戻ることもできる。
【0029】
なお、単語候補表示画面は、キーワード音声認識結果をユーザが確認するためのものだが、単語候補と共に訳語が表示されるので、対訳辞書として使うこともできる。また、訳語を選択して実行ボタンを押すと発音を発声するようにすることもできる。同音異義語の場合は単語候補表示画面では訳語が表示されないが、同音異義語の中から単語を選択して実行ボタンを押すと、次の画面で訳語と例文が表示されるようにすることもできる。
【0030】
次に、例文検索について説明する。入力単語が確定したら、単語辞書204において、入力単語の例文番号710に記載されている番号の例文を例文ファイル205より取り出し(304)、画面に表示する(305)。単語辞書において分類コード706が記述されている単語については、その分類コードをキーワードとする例文も検索する。例えば、入力単語「銀行」に対して、「銀行」をキーワードとする例文に加えて、<場所><機関>という分類コードをキーワードとする例文も検索する。<場所>という分類コードをキーワードとする例文の番号は、「<場所>」を見出しとする単語辞書レコードの例文番号710に記載されている。
【0031】
図9に「予約」をキーワードとして例文検索した場合の例文表示画面の例を示す。図9において、901は検索された例文である。例文表示画面には、1行目に単語の辞書見出しと訳語が表示され、2行目以降に検索された例文の先頭の3文が表示される。4行目以降の例文は、スクロールキーで画面をスクロールさせることによって見ることができる。文頭に★がついている例文は基本例文であることを示す。例文表示画面では、原文テンプレートのスロットに代表例607を埋め込んだものを表示し、アンダーラインで置き換え可能な語句であることを示す。図10において、「ダラス」「マイアミ」「14日」は置き換え可能な語句である。
【0032】
次に、例文絞り込みについて説明する。検索例文のうち、画面に入りきらない部分は上下左右のスクロールキーを使って見ることができるが、例文数が多い場合は、さらにキーワードを追加して例文を絞り込むことができるようにする。これによって、例文が探しやすくなる。ユーザが例文絞り込みをしたい場合は、スクロールボタンで画面の1行目に表示されているキーワードを選択して(反転表示させて)実行ボタンを押す。次に、追加キーワードを音声入力すると、前述のキーワード音声認識を実行し(307)、例文の絞り込みを行い(308)、絞り込み例文を表示する(309)。図9は「予約」をキーワードとする例文検索結果であり、図10は「フライト」で例文を絞り込んだ結果である。絞り込み結果を見てユーザが「もどる」ボタンを押すと絞り込み前の例文を表示する(311)。
【0033】
なお、置き換え可能な語句のない例文を選択する場合は、スクロールキーによるカーソル移動で例文を選択してもよい(312〜314)。例文を選択して実行キーを押すと、翻訳が実行される(322)。
【0034】
次に、詳細例文表示について説明する。スクロールキーで例文を選択する際に、例文そのものではなく基本例文の文頭についている★を選択して実行キーを押すと、関連する詳細例文が表示される(314)。例えば、図9の例文表示画面において、3行目の「予約したい」を選択して実行キーを押すと翻訳結果が表示され、「予約したい」の左側についている★を選択して実行キーを押すと、図12に示すような「予約したい」の詳細例文が表示される。
【0035】
次に、文音声認識について説明する。例文表示画面を見ながらユーザが文を発声すると(315)、文音声認識を実行する(316)。文音声認識は、例えば「確率モデルによる音声認識」(電子情報通信学会, 1988)pp46-50に記載されているHMMによるオートマトン制御連続単語音声認識アルゴリズムによって行う。
【0036】
図5に、文音声認識処理のフローを示す。まず、画面に表示されている例文テンプレートに対して、図14のような有限状態オートマトンを作成する。図14は、「一番近い<s1>はどこですか」という例文テンプレートに対して作られる有限状態オートマトンである。図14において、1401と1402は「イチバンチカイ」「ワドコデスカ」という発音情報から作成されるHMM(隠れマルコフモデル)である。原文テンプレートの部分のモデルは、例文ファイルに記載されている発音情報606に基づいて作成する(502)。
【0037】
スロット部分のモデルは、スロットに入りうる単語の発音情報に基づいて作成する。これにはまず、例文ファイルのスロット情報609の意味情報6095を参照することにより(504)、単語辞書登録語のうち、どの単語がスロットに入り得るかを認識する。スロットに入りうる単語は、スロットの意味情報6095において単語が列挙されている場合は列挙されている単語(505)、分類コードが指定されている場合は指定された分類コードを持つ単語(506)、何も指定されていない場合は単語辞書登録語(507)、とする。それぞれの単語のモデルは、単語辞書に記載されている単語の発音情報704に基づいて作成する(508)。
【0038】
画面に表示されている例文テンプレートについて有限状態オートマトンを作成したら(509)、 HMMによるオートマトン制御連続単語音声認識アルゴリズムによって入力文の音声認識を行い、各スロットについて、上位10語をスロット候補語として記憶する(510)。
【0039】
なお、例文テンプレートを見ながら発話する際に、スロットの前後やスロットを含む文節の直後にポーズが入る場合があるので、各例文テンプレートに対して、文全体に対する有限状態オートマトンだけでなく、ポーズが入りそうな場所で区切ったフレーズの有限状態オートマトンも作成すると、より高い認識精度を得ることができる。例えば、上記の例では、図14に示した「イチバンチカイバステイワドコデスカ」などの他に、「イチバンチカイ」「バステイ」「ワドコデスカ」「バステイワ」「ドコデスカ」などの有限状態オートマトンも作成し、そのフレーズを含む例文テンプレートに対応付けておく。さらに、ポーズを積極的に取り入れて、「イチバンチカイ」でポーズが入った場合に、「一番近い<s1>はどこですか」の「一番近い」の部分と一致することを表示し、ユーザが確認後、続きを言うように誘導することも考えられる。
【0040】
本実施例では単語辞書登録語の範囲でスロット挿入語を認識しているが、すべての単語をあらかじめ辞書に登録しておくことはできない。特に固有名詞や土地の名物などの名詞は、旅行会話で重要であるにもかかわらず、単語辞書でカバーしきれない。しかしながら、ユーザがそのような語を使いたい場合は、原語でその単語を知っているケースが多く、単語だけなら何とかそれに近い発音ができる場合が多い。そこで、特定のボタンを押しながらスロットの部分の語句を音声入力すると、当該スロット部分についてはユーザが入力したそのままの音を訳文に埋め込んで出力することが考えられる。前述のように、フレーズに対応する有限状態オートマトンを作成してそのフレーズを含む例文テンプレートに対応付けておく方法を採用すれば、特定ボタンを押してしゃべった部分の前後のフレーズから例文テンプレートを特定することができる。これにより、例えば、「[このアトラクション]は何分待ちですか」という例文テンプレートを使って「Back to the futureは何分待ちですか」と発話することが可能となる。また、「私の名前は<s1>です」における<s1>のような特定のスロットに関しては、ユーザが入力したそのままの音を訳文のスロット部分に埋め込むようにすることもできる。
【0041】
本実施例では、音声入力文と比較する対象として、画面に表示されている例文テンプレートに限定しているが、キーワードで検索された例文テンプレート全体としてもよい。また、ユーザがあらかじめ選んだ例文テンプレートや最近使った例文テンプレートを「ユーザ例文ファイル」に記憶しておき、これを比較対象としてもよい。
【0042】
フレーズに対応する有限状態オートマトンを作成して、そのフレーズを含む例文テンプレートに対応付けておく方法を採用した場合には、例文テンプレート表示の際に、音声入力すべき範囲を波線等でマークし、文全体をしゃべらなくてよいことを知らせるようにすることも考えられる。この方法によれば使い勝手がよくなる。例えば、「一番早く乗れる便を探してください」という文であれば、「一番早く乗れる便を探して」あるいは「一番早く乗れる便」など、短く言うようにして、音声入力の手間が省ける。
【0043】
次に、文認識結果表示・訂正について説明する。文音声認識結果は、認識した例文テンプレートにカーソル移動し、スロットの単語を代表例から入力単語に置き換えることによって示す(317)。例えば、図10の例文表示画面が表示されている状態でユーザが「シカゴからシアトルまでの17日の片道切符が欲しい」と音声入力し、正しく文音声認識がされると、図11の画面が表示される。文認識結果を見て、ユーザは「もどる」ボタンを押して文入力をやり直すか(318)、文認識結果を必要に応じて訂正する(319)。例文テンプレートの選択が正しくない場合は、スクロールキーで別の文を選択すると、その例文テンプレートを使ってスロット部の単語認識をやり直す。スロット部の単語認識が正しくない場合は、スクロールキーでスロットを選択して実行ボタンを押すと文認識時に記憶しておいたスロット候補語が表示される。スロット候補語の中に正しいものがあれば、スクロールキーで選択して実行ボタンを押すことによって選択する。
【0044】
次に、翻訳について説明する。音声入力文と一致する文を確定したら実行ボタンを押すことによって翻訳を指示する(320〜321)。基本例文を音声入力で選択し、文頭の★を選択して実行ボタンを押すことで詳細例文を見ることも可能である(321)。テンプレート翻訳は、例文テンプレートの訳文にスロット部の語句の訳を埋め込むことによって行う(322)。例文テンプレートには訳文におけるスロットの文法情報6096が記述されている。これと単語辞書204の訳語の文法情報709を参照することにより、スロット部分の訳語の冠詞や単複などを決定する。例えば、「不定冠詞、単数形」と指定されたスロットに「語頭母音」という文法情報が記述された単語モappleモを埋め込む場合は不定冠詞モanモを付け、「無冠詞、複数形」と指定されたスロットにモcandyモという単語を埋め込む場合は複数形モcandiesモを埋め込む。
【0045】
翻訳結果表示ステップ(323)では、図13に示す翻訳結果表示画面を表示する。ユーザの指示(324)が「もどる」ボタンであれば翻訳実行前に表示した例文を表示し(325)、訳文を選択して実行ボタンであれば訳文を発声し(326)、原文を選択して実行ボタンであれば次の発話用の例文を表示する(327)。次の発話用の例文として表示する例文は、先に翻訳した文が基本例文である場合はその詳細例文であり、先に翻訳した文が詳細例文である場合は翻訳実行前に表示した例文である。これは、同じキーワードで検索された詳細例文のセットは関連する例文であり、これらの例文の中から複数の文を続けて使う可能性があると考えられるからである。代案としては、キーワードの中でも「ホテル」「フロント」「買い物」など、場面に関するものを「場面情報」としてキーワードとは別の情報として各例文テンプレートに付与しておき、場面情報が共通の例文だけを次の発話用の例文として表示することが考えられる。さらに、新たにキーワード検索を行った場合にも場面情報が直前に使った例文と一致するものを優先的に上の方に表示したり、リセットするまで同じ場面が続くことにして場面情報で例文を絞って表示することが考えられる。
【0046】
本実施例では、対訳例文テンプレートを利用してテンプレート翻訳を行っているが、例文テンプレートの真の目的は、ユーザの発話を誘導することにある。したがって、翻訳処理については、辞書と文法規則による機械翻訳で行うことも考えられる。その場合は、例文テンプレートは必ずしも対訳である必要はなく、入力言語の例文テンプレートだけでよい。
【0047】
以上、携帯型の音声翻訳装置としての実施例を述べたが、本発明は、上述のような翻訳装置を実現するための図3,図4,及び図5に記載されたフローが記録された記録媒体であってもかまわない。このような記録媒体としては、音声入力された語句を音声認識手段によって認識するステップと、この語句と関連づけられた例文テンプレートを例文ファイル中から検索するステップと、検索された例文ファイルをディスプレイに表示するステップと、表示された例文テンプレートに基づいて、ユーザが発話した文章を認識するステップと、認識した文章と検索された例文テンプレートを比較して、もっとも似ているものを認識するステップと、似ている例文テンプレート中の語句のうち置換可能な語句をユーザが発話した文章に基づいて置換して翻訳するステップと、翻訳結果をディスプレイに表示又は、音声出力するステップとが記録されたコンピュータ読みとり可能な記録媒体が考えられる。
【0048】
また、他の形の翻訳装置では別のユーザインタフェースが考えうる。例えば、病院・役所・ホテルなどの窓口に備える音声翻訳装置では、画面をタッチパネルとし、スロット部分に指を触れて置き換え単語のみを発声するといったことが考えられる。また、本実施例では、表示画面が小さいことと片手で持って使うことを考慮して、キーワード音声入力で例文テンプレート検索を行うようにしたが、場面や発話意図(質問、依頼、説明等)で例文テンプレートを分類し、メニューの表示・選択で絞っていくことも可能である。
【0049】
本実施例では、日本語から英語への翻訳を行う音声翻訳装置について説明したが、他の言語対にも応用可能である。また、本実施例では、対訳例文テンプレートにおいて、原文テンプレートに対して認識用の情報、訳文テンプレートに対して生成用の情報を記述するようにしているが、両方の言語のテンプレートに対して認識用の情報と生成用の情報を記述するようにすれば、双方向に翻訳を実行するようにすることも可能である。双方向の翻訳を行う場合は、本実施例で基本例文と詳細例文を対応付けたのと同様の方法で、質問文の例文テンプレートに回答の例文テンプレートを対応付けることが有効である。
【0050】
【発明の効果】
本発明によれば、音声入力されたキーワードからユーザの発話意図に適した例文テンプレートをすばやく検索し、ユーザの発話を誘導することができる。ユーザは例文テンプレートを見ながらしゃべるので、言いたいことを完全な文の形で楽に言うことができるし、例文テンプレートのスロットには思った通りの任意の語句を入れてしゃべることができるので、単語置換の煩わしさがない。これにより、例文検索型の翻訳装置の利点と任意文入力型の翻訳装置の利点を兼ね備えた翻訳装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の音声翻訳装置の実施例の外観および初期画面を示す図である。
【図2】本発明の音声翻訳装置の実施例の構成を示すブロック図である。
【図3】本発明の音声翻訳装置の実施例の動作を示すフローチャートである。
【図4】単語音声認識の手順を示すフローチャートである。
【図5】入力文音声認識の手順を示すフローチャートである。
【図6】例文ファイルの内容を示す図である。
【図7】単語辞書の内容を示す図である。
【図8】単語候補表示ステップにおける画面表示例を示す図である。
【図9】例文表示ステップにおける画面表示例を示す図である。
【図10】絞り込み例文表示ステップにおける画面表示例を示す図である。
【図11】文認識結果表示ステップにおける画面表示例を示す図である。
【図12】詳細例文表示ステップにおけるの画面表示例を示す図である。
【図13】翻訳結果表示ステップにおけるの画面表示例を示す図である。
【図14】例文テンプレートに対する有限状態オートマトンの例を示す図である。
【符号の説明】
201:CPU
202:音声入力装置
203:音声出力装置
204:単語辞書
205:例文ファイル
206:メモリ
261:制御プログラム
262:単語音声認識プログラム
263:文音声認識プログラム
264:テンプレート翻訳プログラム
265:音声出力プログラム
266:画面表示プログラム。
Claims (9)
- CPUと、音声入力部と、ディスプレイと、例文テンプレートをその発音情報と対応付けて格納する例文ファイルおよび単語をその発音情報と対応付けて格納する単語辞書を記憶する記憶手段とを有する翻訳装置における翻訳方法であって、
前記ディスプレイに、前記例文ファイルに格納された例文テンプレートであって、置換可能部分を含み、発音情報が予めメモリに格納された例文テンプレートを表示する第1のステップと、
前記音声入力部から音声入力を受け付ける第2のステップと、
前記CPUにおいて、
前記記憶手段に格納された、前記表示された例文テンプレートの発音情報と該例文テンプレートの置換可能部分に入り得る単語の発音情報とを用いて生成される音声モデルと前記音声入力とを比較して前記置換可能部分に対応する音声入力部分を含めた例文テンプレートを前記音声入力の認識結果とする第3のステップと、
該音声入力部分の認識結果を出力する第4のステップと、
該認識結果を翻訳して出力する第5のステップとを有することを特徴とする翻訳方法。 - 請求項1記載の翻訳方法であって、
前記第1のステップにおいて、複数の前記例文テンプレートを表示し、
前記第3のステップにおいて、前記音声入力を前記表示された複数の例文テンプレートの発音情報と比較して、該音声入力に対応する例文テンプレートを特定することを特徴とする翻訳方法。 - 請求項1記載の翻訳方法であって、
前記第1のステップにおいて、前記例文テンプレートの置換可能部分に挿入される語句の特徴を示す情報を表示し、
前記第3のステップにおいて、前記音声入力部分の認識を、前記単語辞書のうち前記表示された語句の特徴に該当する単語の発音情報を用いて行うことを特徴とする翻訳方法。 - 翻訳装置であって、
置換可能部分を含む例文テンプレートとその発音情報を含む例文ファイル、および複数の単語とその音声情報を格納する単語辞書を記憶するメモリと、
前記メモリに格納された、前記例文テンプレートと前記置換可能部分についての情報を表示するディスプレイと、
音声入力を受け付ける入力部と、
CPUとを有し、
該CPUは、前記メモリに格納された、前記表示された例文テンプレートの発音情報と該例文テンプレートの置換可能部分に入り得る単語の発音情報とを用いて生成される音声モデルと前記音声入力とを比較して前記置換可能部分に対応する音声入力部分を含めた例文テンプレートを前記音声入力の認識結果とし、該認識結果を翻訳して出力することを特徴とする翻訳装置。 - 請求項4記載の翻訳装置であって、
前記ディスプレイは、複数の前記例文テンプレートを表示し、
前記CPUは、前記音声入力を前記表示された複数の例文テンプレートの発音情報と比較して、該音声入力に対応する例文テンプレートを特定することを特徴とする翻訳装置。 - 請求項4記載の翻訳装置であって、
前記ディスプレイは、前記例文テンプレートの置換可能部分に挿入される語句の特徴を示す情報を表示し、
前記CPUは、前記音声入力部分の認識を、前記単語辞書のうち前記表示された語句の特徴に該当する単語の発音情報を用いて行うことを特徴とする翻訳装置。 - プログラム記憶媒体であって、処理部と、音声入力部と、ディスプレイと、例文テンプレートをその発音情報と対応付けて格納する例文ファイルおよび単語をその発音情報と対応付けて格納する単語辞書を記憶する記憶手段とを有する翻訳装置に、
前記ディスプレイに、前記例文ファイルに格納された例文テンプレートであって、置換可能部分を含み、発音情報が予めメモリに格納された例文テンプレートを表示する第1のステップと、
前記音声入力部から音声入力を受け付ける第2のステップと、
前記処理部において、前記記憶手段に格納された、前記表示された例文テンプレートの発音情報と該例文テンプレートの置換可能部分に入り得る単語の発音情報とを用いて生成される音声モデルと前記音声入力とを比較して前記置換可能部分に対応する音声入力部分を含めた例文テンプレートを前記音声入力の認識結果とする第3のステップと、該認識結果を翻訳して該翻訳結果を出力する第4のステップと、
を実行させることを特徴とするプログラムを格納するプログラム記憶媒体。 - 請求項7記載のプログラム記憶媒体であって、前記プログラムは、
前記第1のステップにおいて、複数の前記例文テンプレートを表示させ、
前記第3のステップにおいて、前記音声入力を前記表示された複数の例文テンプレートの発音情報と比較して、該音声入力に対応する例文テンプレートを特定させることを特徴とするプログラム記憶媒体。 - 請求項7記載のプログラム記憶媒体であって、前記プログラムは、
前記第1のステップにおいて、前記例文テンプレートの置換可能部分に挿入される語句の特徴を示す情報を表示させ、
前記第3のステップにおいて、前記音声入力部分の認識を、前記単語辞書のうち前記表示された語句の特徴に該当する単語の発音情報を用いて行わせることを特徴とするプログラム記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001167615A JP3870722B2 (ja) | 2001-06-04 | 2001-06-04 | 翻訳装置、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001167615A JP3870722B2 (ja) | 2001-06-04 | 2001-06-04 | 翻訳装置、記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00166999A Division JP3822990B2 (ja) | 1999-01-07 | 1999-01-07 | 翻訳装置、記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002014957A JP2002014957A (ja) | 2002-01-18 |
JP2002014957A5 JP2002014957A5 (ja) | 2006-02-09 |
JP3870722B2 true JP3870722B2 (ja) | 2007-01-24 |
Family
ID=19009976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001167615A Expired - Lifetime JP3870722B2 (ja) | 2001-06-04 | 2001-06-04 | 翻訳装置、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3870722B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10198557B2 (en) * | 2013-09-30 | 2019-02-05 | Koninklijke Philips N.V. | System and method for content-based medical macro sorting and search system |
JP6334589B2 (ja) * | 2016-03-30 | 2018-05-30 | 株式会社リクルートライフスタイル | 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム |
CN112818707B (zh) * | 2021-01-19 | 2024-02-27 | 传神语联网网络科技股份有限公司 | 基于逆向文本共识的多翻引擎协作语音翻译***与方法 |
-
2001
- 2001-06-04 JP JP2001167615A patent/JP3870722B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002014957A (ja) | 2002-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3822990B2 (ja) | 翻訳装置、記録媒体 | |
US11972227B2 (en) | Lexicon development via shared translation database | |
US9753918B2 (en) | Lexicon development via shared translation database | |
JP3962767B2 (ja) | 対話支援装置 | |
JP4135307B2 (ja) | 音声通訳サービス方法および音声通訳サーバ | |
US20080133245A1 (en) | Methods for speech-to-speech translation | |
EP1330816B1 (en) | Language independent voice-based user interface | |
JP5121252B2 (ja) | 原言語による音声を目的言語に翻訳する装置、方法およびプログラム | |
JP3962766B2 (ja) | 対話支援装置 | |
EP2849178A2 (en) | Enhanced speech-to-speech translation system and method | |
EP2274742A1 (en) | System and methods for maintaining speech-to-speech translation in the field | |
JP2005150841A (ja) | 情報処理方法及び情報処理装置 | |
JP2008083855A (ja) | 機械翻訳を行う装置、システム、方法およびプログラム | |
JP2015153108A (ja) | 音声会話支援装置、及び音声会話支援方法及びプログラム | |
JP2010048953A (ja) | 対話文生成装置 | |
CA2613154A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
JP3526101B2 (ja) | 音声認識装置 | |
JP3870722B2 (ja) | 翻訳装置、記録媒体 | |
Zong et al. | Toward practical spoken language translation | |
WO2009151868A2 (en) | System and methods for maintaining speech-to-speech translation in the field | |
EP3742301A1 (en) | Information processing device and information processing method | |
JP2004118720A (ja) | 翻訳装置、翻訳方法及び翻訳プログラム | |
KR100777569B1 (ko) | 멀티모달을 이용한 음성 인식 방법 및 그 장치 | |
Matsui et al. | An experimental multilingual speech translation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060418 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060418 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060704 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061009 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091027 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101027 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111027 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121027 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121027 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131027 Year of fee payment: 7 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |