JP6334589B2 - 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム - Google Patents

定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム Download PDF

Info

Publication number
JP6334589B2
JP6334589B2 JP2016068614A JP2016068614A JP6334589B2 JP 6334589 B2 JP6334589 B2 JP 6334589B2 JP 2016068614 A JP2016068614 A JP 2016068614A JP 2016068614 A JP2016068614 A JP 2016068614A JP 6334589 B2 JP6334589 B2 JP 6334589B2
Authority
JP
Japan
Prior art keywords
language
content
phrase
speaker
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016068614A
Other languages
English (en)
Other versions
JP2017182452A (ja
Inventor
千春 宇賀神
千春 宇賀神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RECRUIT LIFESTYLE CO., LTD.
Original Assignee
RECRUIT LIFESTYLE CO., LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RECRUIT LIFESTYLE CO., LTD. filed Critical RECRUIT LIFESTYLE CO., LTD.
Priority to JP2016068614A priority Critical patent/JP6334589B2/ja
Publication of JP2017182452A publication Critical patent/JP2017182452A/ja
Application granted granted Critical
Publication of JP6334589B2 publication Critical patent/JP6334589B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Description

本発明は、定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラムに関する。
例えば、外国旅行においては、現地での会話が不安材料となる。そこで、互いに異なる言語を話す人同士の会話によるコミュニケーションを支援するため、指さし会話帳(登録商標)と呼ばれる紙媒体やそのアプリケーションソフトウェア(以下単に「アプリ」という)が知られている(例えば非特許文献1)。
このアプリには、話者が遭遇し得るシチュエーション毎に、よく話される基本的な複数の会話フレーズが第1言語(例えば日本語)と第2言語(例えば英語)で併記された定型フレーズ集が用意されている。話者は、画面表示されたそれらの定型フレーズのなかから、遭遇した場面や質問したい内容に応じた会話フレーズを第1言語で探し出し、併記された第2言語で話者自ら発声するか、テキストをタップして第2言語によるネイティブ音声を再生出力することにより、相手に意志を伝えることができる。
旅の指さし会話帳アプリ「YUBISASHI」22か国以上対応(無料)[平成28年3月28日検索]、インターネット<URL:http://www.yubisashi.com/あなたと一緒に旅するアプリ>
しかし、上記従来のアプリでは、沢山の定型フレーズのなかから目的の会話フレーズを探し出すのに時間がかかることがあり、そうなると円滑な会話が妨げられてしまう。また、そもそも、目的の会話フレーズが定型フレーズ集に掲載又は収納されていないこともある。例えば、店舗の従業員等が外国人客を接客するような状況では、その店舗でよく発話される特有の会話フレーズ(例えば、店舗のシステムの説明や推奨品等)が存在し得るが、既成の(出来合いの)定型フレーズ集には、そのような店舗毎の特有な会話フレーズが収納されていることは滅多にない。
そこで、本発明は、かかる事情に鑑みてなされたものであり、話者がよく使用する独自の定型フレーズを作成して登録することにより、話者同士の円滑な会話によるコミュニケーションを支援することができる定型フレーズ作成装置、会話支援装置、及び会話支援プログラムを提供することを目的とする。
上記課題を解決するため、本発明の一態様による定型フレーズ作成装置は、話者の第1言語による音声を入力するための入力部と、入力音声の内容を第1言語とは異なる第2言語の内容に翻訳する翻訳部と、話者の指示に基づいて第2言語による翻訳結果を第1言語の内容に逆翻訳する逆翻訳部と、入力音声の内容と第2言語による翻訳結果を表示する対訳表示部と、話者の指示に基づいて入力音声の内容と第2言語による翻訳結果の組を定型フレーズとして登録する登録部とを備える。より具体的には、表示部が、話者の指示を入力するためのボタンを表示するように構成してもよい。なお、「フレーズ」には、文、節、句、語、及び数字が含まれ、また、それらに付随して画像又は記号が含まれていてもよい。
また、定型フレーズのひな型を表示するひな型表示部を更に備え、翻訳部が、話者の指示に基づいて、ひな型を用いて、入力音声の内容を第1言語とは異なる第2言語の内容に翻訳しても好適である。
さらに、本発明の一態様による会話支援装置は、本発明による定型フレーズ作成装置と、複数の定型フレーズを含む定型フレーズ集を保持する記憶部と、定型フレーズを表示するフレーズ表示部と、定型フレーズにおける第2言語による翻訳結果を音声で出力する出力部とを備える。
また、本発明の一態様による定型フレーズ作成プログラムは、コンピュータ(単数又は単一種に限られず、複数又は複数種でもよい;以下同様)を、話者の第1言語による音声を入力するための入力部と、入力音声の内容を第1言語とは異なる第2言語の内容に翻訳する翻訳部と、話者の指示に基づいて第2言語による翻訳結果を第1言語の内容に逆翻訳する逆翻訳部と、入力音声の内容と第2言語による翻訳結果を表示する対訳表示部と、話者の指示に基づいて入力音声の内容と第2言語による翻訳結果の組を定型フレーズとして登録する登録部として機能させるものである。
また、本発明の一態様による会話支援プログラムは、コンピュータ(単数又は単一種に限られず、複数又は複数種でもよい;以下同様)を、話者の第1言語による音声を入力するための入力部と、入力音声の内容を第1言語とは異なる第2言語の内容に翻訳する翻訳部と、話者の指示に基づいて第2言語による翻訳結果を第1言語の内容に逆翻訳する逆翻訳部と、入力音声の内容と第2言語による翻訳結果を表示する対訳表示部と、話者の指示に基づいて入力音声の内容と第2言語による翻訳結果の組を定型フレーズとして登録する登録部と、複数の定型フレーズを含む定型フレーズ集を保持する記憶部と、定型フレーズを表示するフレーズ表示部と、定型フレーズにおける第2言語による翻訳結果を音声で出力する出力部として機能させるものである。
本発明によれば、音声入力した第1言語による会話フレーズの内容を、音声翻訳処理によって第2言語の内容に翻訳し、さらに、それを必要に応じて第1言語の内容に逆翻訳して表示することにより、話者は、その第2言語への翻訳結果の当否を判断することができる。その結果、第2言語への翻訳結果が妥当である場合、その第1言語による入力音声の内容と第2言語による翻訳結果の組を1つの定型フレーズとして作成し、実際の会話に先立って、定型フレーズ集に予め登録しておくことができる。従って、話者は会話の場面において、所望の会話フレーズを定型フレーズ集のなかから、的確かつ簡易に探し出して利用することが可能となり、これにより、話者同士の円滑な会話によるコミュニケーションを支援することができる。
本発明による定型フレーズ作成装置を含む会話支援装置に係るネットワーク構成等の好適な一実施形態を概略的に示すシステムブロック図である。 本発明による定型フレーズ作成装置を含む会話支援装置の好適な一実施形態における処理の流れ(一部)の一例を示すフローチャートである。 (A)乃至(D)は、情報端末における表示画面の遷移の一例を示す平面図である。 (A)及び(D)は、情報端末における表示画面の遷移の一例を示す平面図である。
以下、本発明の実施の形態について詳細に説明する。なお、以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施の形態を採用することが可能であり、かかる実施の形態も本発明の範囲に含まれる。またさらに、必要に応じて示す上下左右等の位置関係は、特に断らない限り、図示の表示に基づくものとする。さらにまた、図面における各種の寸法比率は、その図示の比率に限定されるものではない。
(装置構成)
図1は、本発明による定型フレーズ作成装置を含む会話支援装置に係るネットワーク構成等の好適な一実施形態を概略的に示すシステムブロック図である。この例において、会話支援装置100は、話者が使用する情報端末10にネットワークNを介して電子的に接続されるサーバ20を備える(但し、これに限定されない)。
情報端末10は、例えば、タッチパネル等のユーザインターフェイス及び視認性が高いディスプレイを採用する。また、ここでの情報端末10は、ネットワークNとの通信機能を有するスマートフォンに代表される携帯電話を含む可搬型のタブレット型端末装置である。さらに、情報端末10は、プロセッサ11、記憶資源12、音声入出力デバイス13、通信インターフェイス14、入力デバイス15、表示デバイス16、及びカメラ17を備えている。また、情報端末10は、インストールされた会話支援アプリ(本発明の一実施形態による会話支援プログラムの少なくとも一部)が動作することにより、本発明の一実施形態による定型フレーズ作成装置を含む会話支援装置の一部又は全部として機能するものである。
プロセッサ11は、算術論理演算ユニット及び各種レジスタ(プログラムカウンタ、データレジスタ、命令レジスタ、汎用レジスタ等)から構成される。また、プロセッサ11は、記憶資源12に格納されているプログラムP10の1つである会話支援アプリを解釈及び実行し、各種処理を行う。このプログラムP10としての会話支援アプリは、例えばサーバ20からネットワークNを通じて配信可能なものであり、手動で又は自動でインストール及びアップデートされてもよい。
なお、ネットワークNは、例えば、有線ネットワーク(近距離通信網(LAN)、広域通信網(WAN)、又は付加価値通信網(VAN)等)と無線ネットワーク(移動通信網、衛星通信網、ブルートゥース(Bluetooth(登録商標))、WiFi(Wireless Fidelity)、HSDPA(High Speed Downlink Packet Access)等)が混在して構成される通信網である。
記憶資源12は、物理デバイス(例えば、半導体メモリ等のコンピュータ読み取り可能な記録媒体)の記憶領域が提供する論理デバイスであり、情報端末10の処理に用いられるオペレーティングシステム(OS)プログラム、ドライバプログラム、各種データ等を格納する。ドライバプログラムとしては、例えば、音声入出力デバイス13を制御するための入出力デバイスドライバプログラム、入力デバイス15を制御するための入力デバイスドライバプログラム、表示デバイス16を制御するための表示デバイスドライバプログラム等が挙げられる。さらに、音声入出力デバイス13は、例えば、一般的なマイクロフォン、及びサウンドデータを再生可能なサウンドプレイヤである。
通信インターフェイス14は、例えばサーバ20との接続インターフェイスを提供するものであり、無線通信インターフェイス及び/又は有線通信インターフェイスから構成される。また、入力デバイス15は、例えば、表示デバイス16に表示されるアイコン、ボタン、仮想キーボード、テキスト等のタップ動作による入力操作を受け付けるインターフェイスを提供するものであり、タッチパネルの他、情報端末10に外付けされる各種入力装置を例示することができる。
表示デバイス16は、画像表示インターフェイスとして各種の情報を話者に提供するものであり、例えば、有機ELディスプレイ、液晶ディスプレイ、CRTディスプレイ等が挙げられる。また、カメラ17は、種々の被写体の静止画や動画を撮像するためのものである。
サーバ20は、例えば、演算処理能力の高いホストコンピュータによって構成され、そのホストコンピュータにおいて所定のサーバ用プログラムが動作することにより、サーバ機能を発現するものであり、例えば、音声翻訳処理に必要な音声認識サーバ、翻訳サーバ、及び音声合成サーバとして機能する単数又は複数のホストコンピュータから構成される(図示においては単数で示すが、これに限定されない)。そして、各サーバ20は、プロセッサ21、通信インターフェイス22、及び記憶資源23を備える。
プロセッサ21は、算術演算、論理演算、ビット演算等を処理する算術論理演算ユニット及び各種レジスタ(プログラムカウンタ、データレジスタ、命令レジスタ、汎用レジスタ等)から構成され、記憶資源23に格納されているプログラムP20を解釈及び実行し、所定の演算処理結果を出力する。また、通信インターフェイス22は、ネットワークNを介して情報端末10に接続するためのハードウェアモジュールであり、例えば、ISDNモデム、ADSLモデム、ケーブルモデム、光モデム、ソフトモデム等の変調復調装置である。
記憶資源23は、例えば、物理デバイス(ディスクドライブ又は半導体メモリ等のコンピュータ読み取り可能な記録媒体等)の記憶領域が提供する論理デバイスであり、それぞれ単数又は複数のプログラムP20、各種モジュールL20、各種データベースD20、及び各種モデルM20が格納されている。また、記憶資源23には、予め用意された複数の定型フレーズ、入力音声の履歴データ、各種設定用のデータ等も記憶されている。
プログラムP20は、サーバ20のメインプログラムである上述したサーバ用プログラム等である。また、各種モジュールL20は、情報端末10から送信されてくる要求及び情報に係る一連の情報処理を行うため、プログラムP10の動作中に適宜呼び出されて実行されるソフトウェアモジュール(モジュール化されたサブプログラム)である。かかるモジュールL20としては、音声認識モジュール、翻訳モジュール、音声合成モジュール等が挙げられる。
また、各種データベースD20としては、音声翻訳処理のために必要な各種コーパス(例えば、少なくとも2つの言語(第1言語と第2言語)を含む複数言語についての、音声コーパス、文字(語彙)コーパス、辞書、対訳辞書、対訳コーパス等)の各データベース、音声データベース、話者(会話支援アプリのユーザ等)に関する情報を管理するための管理用データベース、複数の定型フレーズを含む定型フレーズ集としてのテキスト及び音声データベース等が挙げられる。また、各種モデルM20としては、音声認識に使用する音響モデルや言語モデル等が挙げられる。このとおり、記憶資源23は、「記憶部」として機能する。
(第1実施形態)
以上のとおり構成された会話支援装置100における処理操作及び動作の一例について、以下に説明する。図2は、会話支援装置100における処理の流れ(の一部)の一例を示すフローチャートである。また、図3(A)乃至(D)は、情報端末における表示画面の遷移の一例を示す平面図である。なお、ここでは、日本語(第1言語)を話す店員(店舗の従業員)が英語(第2言語)を話す外国人の客を接客する際に使用する会話フレーズを定型フレーズとして作成する場面を想定する(但し、言語やシチュエーションはこれに限定されない)。
まず、店員が当該会話支援アプリを起動する(ステップSU1)と、サーバ20のプロセッサ21及び情報端末10のプロセッサ11により、情報端末10の表示デバイス16に、客の言語を選択するための言語選択画面が表示される(図3(A);ステップSJ1)。この言語選択画面には、客に言語を尋ねることを店員に促すための日本語のテキストT1、客に言語を尋ねる旨の英語のテキストT2、及び、想定される複数の代表的な言語(ここでは、英語、中国語(例えば書体により2種類)、ハングル語)を示す言語ボタン31が表示される。さらにその下方には、言語選択画面を閉じて会話支援アプリを終了するためのキャンセルボタンB1も表示される。なお、この画面は、店員と客が音声翻訳によって実際に会話を行う場面を想定したものである。
ここでは、実際の会話の前に予め定型フレーズを作成するので、店員が客の言語として英語を選択するようにする。客の言語が選択されると、サーバ20のプロセッサ21及び情報端末10のプロセッサ11により、ホーム画面として、日本語と英語の音声入力待機画面が表示デバイス16に表示される(図3(B);ステップSJ2)。この音声入力待機画面には、店員と客の言語の何れを発話するかを問う日本語のテキストT3、並びに、日本語の音声入力を行うための入力ボタン32a及び英語の音声入力を行うための入力ボタン32bが表示される。
また、この音声入力待機画面には、予め設定されている複数の質問定型文のリスト表示を選択するためのお声がけボタン33、対話者の言語を手動で選択するための言語選択ボタン34、それまでになされた音声入力内容の履歴表示を選択するための履歴ボタン35、予め用意された複数の定型フレーズを含む定型フレーズ集を表示し、それらのなかから所望の定型フレーズを選択して会話を進めることができるサジェスト機能を実行するためのサジェストボタン36、及び当該会話支援アプリの各種設定を行うための設定ボタン37も表示される。
次に、図3(B)に示す音声入力待機画面において、店員が日本語の入力ボタン32aをタップして日本語の音声入力を選択すると、店員の日本語による発話内容を受け付ける音声入力画面となる(図3(C))。この音声入力画面が表示されると、音声入出力デバイス13からの音声入力が可能な状態となる。また、この音声入力画面には、店員の音声入力を促すテキストT2、音声入力状態にあることを示すマイク図案38、及びテキスト入力へ切り替えるための入力切替ボタンB2が表示される。さらに、この音声入力画面にも、キャンセルボタンB1が表示され、これをタップすることにより、会話支援アプリを終了するか、音声入力待機画面(図3(B))へ戻って音声入力をやり直すことができる。
この状態で、店員が、よく使う会話フレーズ(例えば「申し訳ございません。満席ですのでこちらで少々おまちください。」といったフレーズ)を発話する(ステップSU2)と、テキストT2とともに、その声量の大小を模式的に且つ動的に表す多重円形図案39が表示され、音声入力レベルが話者へ視覚的にフィードバックされる。それから、発話が終了してマイク図案38がタップされると、プロセッサ11は、発話内容の受け付けを終了する。情報端末10のプロセッサ11は、その音声入力に基づいて音声信号を生成し、その音声信号を通信インターフェイス14及びネットワークNを通してサーバ20へ送信する。このとおり、情報端末10自体、又はプロセッサ11及び音声入出力デバイス13が「入力部」として機能する。
次に、サーバ20のプロセッサ21は、通信インターフェイス22を通してその音声信号を受信し、音声認識処理を行う。このとき、プロセッサ21は、記憶資源23から、必要なモジュールL20、データベースD20、及びモデルM20(音声認識モジュール、日本語音声コーパス、音響モデル、言語モデル等)を呼び出し、入力音声の「音」を「読み」(文字)へ変換する。このとおり、プロセッサ21、又は、サーバ20が全体として「音声認識サーバ」として機能する。また、プロセッサ21は、認識された内容を、音声入力の履歴データとして、記憶資源23に(必要に応じて適宜のデータベースに)記憶する。
続いて、プロセッサ21は、認識された音声の「読み」(文字)を複数の他言語に翻訳する多言語翻訳処理へ移行する。ここでは、相手の言語として英語が選択されているので、プロセッサ21は、記憶資源23から、必要なモジュールL20及びデータベースD20(翻訳モジュール、日本語文字コーパス、日本語辞書、英語辞書、日本語/英語対訳辞書、日本語/英語対訳コーパス等)を呼び出し、認識結果である入力音声の「読み」(文字列)を適切に並び替えて日本語の句、節、文等へ変換し、その変換結果に対応する英語を抽出し、それらを英語の文法に従って並び替えて自然な英語の句、節、文等へと変換する。このとおり、プロセッサ21は、入力音声の内容を第1言語(日本語)とは異なる第2言語(英語)の内容に翻訳する「翻訳部」としても機能し、サーバ20は、全体として「翻訳サーバ」としても機能する。なお、入力音声が正確に認識されなかった場合には、音声の再入力を行うことができる(図示省略)。また、プロセッサ21は、それらの日本語及び英語の句、節、文等を、記憶資源23に記憶しておくこともできる。
また、この翻訳処理中に、プロセッサ21は、入力音声の認識結果(入力音声の内容)を、情報端末10に送信し、プロセッサ11は、その認識結果を、図3(D)に示す翻訳処理中画面に、日本語のテキストT5として表示する。なお、このテキストT5としては、入力音声の認識結果をそのまま表示してもよいし、予め記憶資源23に記憶されている日本語の会話コーパスのなかから、実際の入力音声の内容に対応するものを呼び出して表示してもよい。また、この翻訳処理中画面には、翻訳処理中であることを示す日本語のテキストT6、及び、処理中であることを表すため円弧の一部が回動するように表示される環状図案40も表示される(ここまでステップSJ3)。
次に、多言語翻訳処理が完了すると、プロセッサ21は、音声合成処理へ移行する(ステップSJ4)。このとき、プロセッサ21は、記憶資源23から、必要なモジュールL20、データベースD20、及びモデルM20(音声合成モジュール、英語音声コーパス、音響モデル、言語モデル等)を呼び出し、翻訳結果である英語の句、節、文等を自然な音声に変換する。このとおり、プロセッサ21は、「音声合成部」としても機能し、サーバ20は、全体として「音声合成サーバ」としても機能する。
次いで、プロセッサ21は、英語による翻訳結果(対応する英語の会話コーパスでもよい)に基づいてテキスト表示用のテキスト信号を生成し、情報端末10へ送信する。そのテキスト信号を受信したプロセッサ11は、図3(D)の翻訳中画面に表示した日本語のテキストT5と、その英語による翻訳結果(対訳)のテキストT6を、図4(A)に示す翻訳結果表示画面に表示する。また、この翻訳結果表示画面には、テキストT5で示す内容が客に伝わることを説明するための日本語のテキストT7も表示される。このとおり、プロセッサ11,21及び表示デバイス16が、「対訳表示部」として機能する。
また、この翻訳結果表示画面には、話者が操作可能な各種ボタンが表示される。すなわち、テキストT5,T6の間の画面領域には、図3(B)のホーム画面へ戻るためのチェックボタンB3、及び、英語による翻訳結果のテキストT6の内容を日本語に逆翻訳するための逆翻訳ボタンB4が表示される。さらに、この翻訳結果表示画面には、翻訳結果の誤りを報告するための誤訳通知ボタンB5、対訳のテキストT6の内容を再生するための音声出力ボタンB6、及び、図3(C)の音声入力画面に戻って発話をやり直すための再入力ボタンB7も表示される(ここまでステップSJ5)。
(逆翻訳)
ここで、話者は、テキストT6で示される英語による翻訳結果の当否が不明な場合、その内容を日本語へ逆翻訳して、その妥当性を判断することができる。すなわち、店員が逆翻訳ボタンB4をタップ(ステップSU3;話者の指示)すると、情報端末10のプロセッサ11からその選択信号を受信したプロセッサ21は、上述した多言語翻訳処理により、英語による翻訳結果のテキストT6の内容を日本語に逆翻訳し、その日本語による逆翻訳結果のテキストT8を、入力音声の内容のテキストT5とともに、図4(B)に示す逆翻訳結果表示画面に表示する(ステップSJ6)。このとおり、プロセッサ21は、第2言語(英語)による翻訳結果を第1言語(日本語)の内容に逆翻訳する「逆翻訳部」としても機能する。
この逆翻訳結果表示画面には、図4(A)に示す翻訳結果表示画面を再表示するための戻るボタンB8とともに、テキストT5で示される日本語による入力音声の内容とテキストT6で示される英語による翻訳結果の組を定型フレーズとして登録するための登録ボタンB9が表示される。すなわち、店員は、テキストT5で示される日本語による入力音声の内容と、テキストT8で示される日本語による逆翻訳結果は、若干の表現の違い(「少々」と「しばらく」)を含むものの同義であるから、テキストT6で示される英語による翻訳結果が適当(翻訳の精度又は適合性が高い)と判断し、登録ボタンB9をタップすることにより、これらの日本語と英語の内容を定型フレーズとして登録することができる。
(定型フレーズ登録)
こうして、店員が登録ボタンB9をタップ(ステップSU4;話者の指示)すると、情報端末10のプロセッサ11からその選択信号を受信したプロセッサ21は、データベースD20の1つである定型フレーズ集へアクセスし、テキストT5で示される日本語による入力音声の内容とテキストT6で示される英語による翻訳結果(会話フレーズ)の組を、その定型フレーズ集に登録(記憶保持)する。このとおり、プロセッサ21は、「登録部」としても機能する。また、プロセッサ21は、その登録された定型フレーズを含む定型フレーズの一覧の表示信号を情報端末10へ送信し、それを受信したプロセッサ11は、その定型フレーズ集を例えば図4(C)に示す定型フレーズ集一覧画面に表示する(ステップSJ7)。このとおり、プロセッサ11,21は、「フレーズ表示部」としても機能する。
この定型フレーズ集一覧画面は、図3(B)に示すサジェストボタン36をタップしたときに表示される画面と同一である(但し、異なっていてももちろんよい)。また、定型フレーズ集の構成は特に制限されず、定型フレーズ集一覧画面には、例えば、適宜の複数の見出しタブR1〜R4等(例えば、「最近追加されたフレーズ」、「接客初動」、「挨拶」、「注文」、「推奨」等)毎に、複数の定型フレーズのテキストT40〜T46が区分けして表示される。これらの各定型フレーズにおいては、日本語と英語の内容(例えばテキストT5,T6)併記されている。また、各見出しタブR1〜R4に収納された定型フレーズは、例えば、所望の見出しタブR1〜R4をタップしたり、話者が表示デバイス16の画面をワイプしたりして切り替える(めくる)ことにより、閲覧することができる。さらに、図示を省略するが、各定型フレーズを例えば長押し等の操作で選択して、削除したり、見出しタブR1〜R4間で適宜移動させたりすることもできる。
また、所望のフレーズを例えばタップすることにより、先に合成された英語の音声を再生出力することもできる。この場合、プロセッサ21は、合成された音声に基づいて音声出力用の音声信号を生成し、情報端末10へ送信する。その音声信号を受信したプロセッサ11は、音声入出力デバイス13(出力部)を用いて、テキストT5の内容の音声を出力する(読み上げる)。これらの操作の後、店員は、チェックボタンB3をタップすることにより図3(B)のホーム画面へ戻る、或いは、当該アプリを適宜終了することができる(ステップSU5)。
なお、図4(A)に示す翻訳結果表示画面に表示される他のボタンを選択してタップした場合の処理の概要は以下のとおりである。
(誤訳通知)
日本語による逆翻訳結果を確認し、英語の翻訳結果の精度が不十分又は誤訳であると判断した店員は、誤訳通知ボタンB5をタップすることにより、その旨をサーバ20に通報することができる。この場合、プロセッサ21は、その英語の翻訳結果が誤りであることを、先に記憶資源23に記憶しておいた入力音声の内容に関連付けて記憶する。
(音声出力)
また、日本語による逆翻訳結果を確認し、英語の翻訳結果が正確又は妥当であると判断した店員は、音声出力ボタンB6をタップすることにより、上述した音声出力と同様の処理により、英語による翻訳結果のテキストT5の内容を再生することができる。
(再入力)
また、逆翻訳結果を確認することなく、或いは、確認した後、店員は、再入力ボタンB7をタップすることにより、図3(C)の音声入力画面に戻って発話をやり直すこともできる。
(第2実施形態)
第2実施形態における処理は、図3(B)に示す音声入力画面を表示(ステップSJ2)した後で、発話(ステップSU1)する前に、話者が図3(B)に示すサジェストボタン36をタップして定型フレーズ集を一旦表示させ、それに含まれる定型フレーズのひな型のなかから所望のひな型を選択すること以外は、第1実施形態における処理と同様である。
すなわち、定型フレーズ集には、所定のひな型(例えば接客の場面では、「申し訳ございません。〜ください。」「本日のおすすめメニューは〜になります。」、「〜の営業時間は〜です。」といったひな型フレーズ)が用意されており、それらは、例えば図4(D)に示すひな形フレーズ集一覧画面に表示される。このひな型フレーズ集の構成も特に制限されず、ひな形フレーズ集一覧画面には、例えば、適宜の複数の見出しタブH1〜H4等(例えば、「最近使用されたフレーズ」、「接客初動」、「挨拶」、「注文」、「推奨」等)毎に、複数のひな型フレーズのテキストH40〜H46が区分けして表示される。このとおり、プロセッサ11,21及び表示デバイス16が、「ひな型表示部」としても機能する。
店員が、発話(ステップSU2)の前に、所望のひな型フレーズをタップ等により選択すると、図3(B)のホーム画面へ戻り(チェックボタンB3をタップしてから戻るようにしてもよい)、選択したひな型フレーズに対応した内容を発話すると、プロセッサ21は、そのひな型フレーズに沿った各種コーパスを用いて翻訳処理を行う(ステップSJ3〜SJ5)。
以上のように構成された定型フレーズ作成装置を含む会話支援装置100、並びに、定型フレーズ作成プログラム及び会話支援プログラムによれば、音声入力した日本語(第1言語)による会話フレーズの内容を、音声翻訳処理によって英語(第2言語)の内容に翻訳し、さらに、それを必要に応じて日本語の内容に逆翻訳して表示する。これにより、店員(話者)は、その英語への翻訳結果の当否を判断することができる。
その結果、英語への翻訳結果が妥当である場合、その日本語による入力音声の内容と英語による翻訳結果の組(例えばテキストT5,T6)を1つの定型フレーズとして作成し、実際の会話に先立って、定型フレーズ集に予め登録しておくことができる。従って、話者は会話の場面において、所望の会話フレーズを定型フレーズ集のなかから、的確かつ簡易に探し出して利用することが可能となり、これにより、話者同士の円滑な会話によるコミュニケーションを支援することができる。また、入力音声の翻訳処理の前に、ひな型フレーズを選択することにより、翻訳の精度を高めて、定型フレーズの作成をより簡易に、かつ、より効率的に行うことができる利点がある。
なお、上述したとおり、上記の各実施形態は、本発明を説明するための一例であり、本発明をその実施形態に限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、様々な変形が可能である。例えば、当業者であれば、実施形態で述べたリソース(ハードウェア資源又はソフトウェア資源)を均等物に置換することが可能であり、そのような置換も本発明の範囲に含まれる。
また、例えば発話した入力音声の内容が単語の如く短い場合には、逆翻訳が必要ない場合もあり得ることから、図4(A)に示す翻訳結果表示画面にも、登録ボタンB9を表示するようにしてもよい。さらに、図2に示すフローの例えばステップSJ3において、ステップSJ6の逆翻訳処理を予め行っておき、逆翻訳ボタンB4がタップされた場合、ステップSJ6においては逆翻訳結果の表示のみ行ってもよい。すなわち、この場合、逆翻訳処理を事前に行っておき、話者の指示があった場合にのみ、逆翻訳結果を表示するようにしてもよい。またさらに、図2に示すフローのステップSJ3,SJ5間で音声合成処理(ステップSJ4)を行わず、ステップSU3において音声出力ボタンB6がタップされた場合に、音声合成処理を行ってもよい。
また、音声認識、翻訳、音声合成等の各処理をサーバ20によって実行する例について記載したが、これらの処理を情報端末10において実行するように構成してもよい。この場合、それらの処理に用いるモジュールL20は、情報端末10の記憶資源12に保存されていてもよい。さらに、音声データベースであるデータベースD20、及び/又は、音響モデル等のモデルM20も、情報端末10の記憶資源12に保存されていてもよい。このとおり、定型フレーズ作成装置は、ネットワークN及びサーバ20を備えなくてもよい。また、情報端末10とネットワークNとの間には、両者間の通信プロトコルを変換するゲートウェイサーバ等が介在してももちろんよい。また、情報端末10は、携帯型装置に限らず、例えば、デスクトップ型パソコン、ノート型パソコン、タブレット型パソコン、ラップトップ型パソコン等でもよい。
本発明によれば、話者同士の円滑な会話によるコミュニケーションを支援することができるので、本発明は、例えば、互いの言語を理解できない人同士の会話に関するサービスの提供分野における、プログラム、装置、システム、及び方法の設計、製造、提供、販売等の活動に広く利用することができる。
10 情報端末
11 プロセッサ
12 記憶資源
13 音声入出力デバイス
14 通信インターフェイス
15 入力デバイス
16 表示デバイス
17 カメラ
20 サーバ
21 プロセッサ
22 通信インターフェイス
23 記憶資源
31 言語ボタン
32a,32b 入力ボタン
33 お声がけボタン
34 言語選択ボタン
35 履歴ボタン
36 サジェストボタン
37 設定ボタン
38 マイク図案
39 多重円形図案
40 環状図案
100 会話支援装置
B1 キャンセルボタン
B2 入力切替ボタン
B3 チェックボタン
B4 逆翻訳ボタン
B5 誤訳通知ボタン
B6 音声出力ボタン
B7 再入力ボタン
B8 戻るボタン
B9 登録ボタン
D20 データベース
H1〜H4 見出しタブ
H40〜H46 ひな型フレーズのテキスト
L20 モジュール
M20 モデル
N ネットワーク
P10,P20 プログラム
R1〜R4 見出しタブ
T1〜T8 テキスト
T40〜T46 定型フレーズのテキスト

Claims (6)

  1. 話者の第1言語による音声を入力するための入力部と、
    入力音声の内容を前記第1言語とは異なる第2言語の内容に翻訳する翻訳部と、
    前記話者による逆翻訳の指示に基づいて、前記第2言語による翻訳結果を前記第1言語の内容に逆翻訳する逆翻訳部と、
    前記話者が、前記入力音声の内容と前記第2言語による翻訳結果を視認可能なように、該入力音声の内容と該第2言語による翻訳結果を同一画面に表示し、かつ、前記話者が、前記入力音声の内容と前記第2の言語による逆翻訳結果を視認可能なように、該入力音声の内容と該第2の言語による逆翻訳結果を同一画面に表示する対訳表示部と、
    前記入力音声の内容と前記逆翻訳結果から前記翻訳結果が適当であると判断した前記話者による登録の指示に基づいて、前記入力音声の内容と前記第2言語による翻訳結果の組を定型フレーズとして登録する登録部と、
    前記定型フレーズのひな型を表示するひな型表示部と、
    を備え、
    前記翻訳部は、前記話者によって、前記定型フレーズのひな型のなかから、文言の一部が省略された特定のひな型のフレーズが選択され、かつ、前記話者によって該特定のひな型のフレーズにおいて省略された文言の一部を補充した内容の音声が入力されたときに、該音声の内容を、前記選択された特定のひな型のフレーズに沿ったコーパスを用いて、前記第1言語とは異なる第2言語の内容に翻訳する、
    定型フレーズ作成装置。
  2. 前記表示部は、前記話者による逆翻訳の指示を入力するためのボタン、及び、前記話者による登録の指示を入力するためのボタンを表示する、
    請求項1記載の定型フレーズ作成装置。
  3. 前記表示部は、複数の前記ひな型のフレーズを含むひな形フレーズ集一覧画面を表示し、該ひな形フレーズ集一覧画面には、適宜の複数の見出し毎に、複数のひな型のフレーズのテキストが区分けして表示される、
    請求項1又は2記載の定型フレーズ作成装置。
  4. 請求項1乃至3の何れか記載の定型フレーズ作成装置と、
    複数の前記定型フレーズを含む定型フレーズ集を保持する記憶部と、
    前記定型フレーズを表示するフレーズ表示部と、
    前記定型フレーズにおける前記第2言語による翻訳結果を音声で出力する出力部と、
    を備える会話支援装置。
  5. コンピュータを、
    話者の第1言語による音声を入力するための入力部、
    入力音声の内容を前記第1言語とは異なる第2言語の内容に翻訳する翻訳部、
    前記話者による逆翻訳の指示に基づいて、前記第2言語による翻訳結果を前記第1言語の内容に逆翻訳する逆翻訳部、
    前記話者が、前記入力音声の内容と前記第2言語による翻訳結果を視認可能なように、該入力音声の内容と該第2言語による翻訳結果を同一画面に表示し、かつ、前記話者が、前記入力音声の内容と前記第2の言語による逆翻訳結果を視認可能なように、該入力音声の内容と該第2の言語による逆翻訳結果を同一画面に表示する対訳表示部、
    前記入力音声の内容と前記逆翻訳結果から前記翻訳結果が適当であると判断した前記話者による登録の指示に基づいて、前記入力音声の内容と前記第2言語による翻訳結果の組を定型フレーズとして登録する登録部、及び
    前記定型フレーズのひな型を表示するひな型表示部
    として機能させ、
    前記翻訳部は、前記話者によって、前記定型フレーズのひな型のなかから、文言の一部が省略された特定のひな型のフレーズが選択され、かつ、前記話者によって該特定のひな型のフレーズにおいて省略された文言の一部を補充した内容の音声が入力されたときに、該音声の内容を、前記選択された特定のひな型のフレーズに沿ったコーパスを用いて、前記第1言語とは異なる第2言語の内容に翻訳する、
    定型フレーズ作成プログラム。
  6. コンピュータを、
    話者の第1言語による音声を入力するための入力部、
    入力音声の内容を前記第1言語とは異なる第2言語の内容に翻訳する翻訳部、
    前記話者による逆翻訳の指示に基づいて、前記第2言語による翻訳結果を前記第1言語の内容に逆翻訳する逆翻訳部、
    前記話者が、前記入力音声の内容と前記第2言語による翻訳結果を視認可能なように、該入力音声の内容と該第2言語による翻訳結果を同一画面に表示し、かつ、前記話者が、前記入力音声の内容と前記第2の言語による逆翻訳結果を視認可能なように、該入力音声の内容と該第2の言語による逆翻訳結果を同一画面に表示する対訳表示部、
    前記入力音声の内容と前記逆翻訳結果から前記翻訳結果が適当であると判断した前記話者による登録の指示に基づいて、前記入力音声の内容と前記第2言語による翻訳結果の組を定型フレーズとして登録する登録部、
    前記定型フレーズのひな型を表示するひな型表示部、
    複数の前記定型フレーズを含む定型フレーズ集を保持する記憶部、
    前記定型フレーズを表示するフレーズ表示部、及び
    前記定型フレーズにおける前記第2言語による翻訳結果を音声で出力する出力部、
    として機能させ、
    前記翻訳部は、前記話者によって、前記定型フレーズのひな型のなかから、文言の一部が省略された特定のひな型のフレーズが選択され、かつ、前記話者によって該特定のひな型のフレーズにおいて省略された文言の一部を補充した内容の音声が入力されたときに、該音声の内容を、前記選択された特定のひな型のフレーズに沿ったコーパスを用いて、前記第1言語とは異なる第2言語の内容に翻訳する、
    会話支援プログラム。
JP2016068614A 2016-03-30 2016-03-30 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム Expired - Fee Related JP6334589B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016068614A JP6334589B2 (ja) 2016-03-30 2016-03-30 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016068614A JP6334589B2 (ja) 2016-03-30 2016-03-30 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017182452A JP2017182452A (ja) 2017-10-05
JP6334589B2 true JP6334589B2 (ja) 2018-05-30

Family

ID=60006175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016068614A Expired - Fee Related JP6334589B2 (ja) 2016-03-30 2016-03-30 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6334589B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11580994B2 (en) * 2020-01-30 2023-02-14 Google Llc Speech recognition

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3870722B2 (ja) * 2001-06-04 2007-01-24 株式会社日立製作所 翻訳装置、記録媒体

Also Published As

Publication number Publication date
JP2017182452A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
US20200410174A1 (en) Translating Languages
US9355094B2 (en) Motion responsive user interface for realtime language translation
US20140035823A1 (en) Dynamic Context-Based Language Determination
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
CN111462740A (zh) 非语音字母语言的话音辅助应用原型测试的话音命令匹配
JP6141483B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
CN107632982B (zh) 语音控制外语翻译设备用的方法和装置
JP6290479B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
WO2017135214A1 (ja) 音声翻訳システム、音声翻訳方法、及び音声翻訳プログラム
JP6250209B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6334589B2 (ja) 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム
JP6353860B2 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6310950B2 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP5998298B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6110539B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6198879B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6383748B2 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
WO2017086434A1 (ja) 音声翻訳プログラム、音声翻訳装置、及びその制御方法
JP6174746B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6147387B1 (ja) 音声翻訳システム、その制御方法および音声翻訳プログラム
JP6298806B2 (ja) 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170308

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20170714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180302

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180426

R150 Certificate of patent or registration of utility model

Ref document number: 6334589

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees