JP6238181B1 - 拡声装置およびその制御方法 - Google Patents

拡声装置およびその制御方法 Download PDF

Info

Publication number
JP6238181B1
JP6238181B1 JP2016196992A JP2016196992A JP6238181B1 JP 6238181 B1 JP6238181 B1 JP 6238181B1 JP 2016196992 A JP2016196992 A JP 2016196992A JP 2016196992 A JP2016196992 A JP 2016196992A JP 6238181 B1 JP6238181 B1 JP 6238181B1
Authority
JP
Japan
Prior art keywords
voice
speech
output
original
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016196992A
Other languages
English (en)
Other versions
JP2018060043A (ja
Inventor
良彦 竹井
良彦 竹井
好男 一柳
好男 一柳
明夫 上杉
明夫 上杉
功二 森
功二 森
和之 田中
和之 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2016196992A priority Critical patent/JP6238181B1/ja
Application granted granted Critical
Publication of JP6238181B1 publication Critical patent/JP6238181B1/ja
Publication of JP2018060043A publication Critical patent/JP2018060043A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Machine Translation (AREA)
  • Alarm Systems (AREA)

Abstract

【課題】ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とをユーザが適宜に切り替えて出力できるようにする。【解決手段】ユーザが発話した音声を収音するマイク3と、マイクで収音した原音声を録音する録音部31と、原音声に対応する原言語の合成音声および他言語の合成音声を取得する合成音声取得部26と、原音声、原言語の合成音声および他言語の合成音声をスピーカから出力する音声出力部27と、ユーザ設定情報に基づいて、原言語の音声として原音声と原言語の合成音声とのいずれかを出力するように制御する出力制御部36と、を備える。【選択図】図3

Description

本発明は、ユーザが発話した音声を出力する拡声装置およびその制御方法に関するものである。
災害時などの避難の誘導、警備のための案内や誘導、業務の指示などに関するメッセージを多数の人物に同時に報知するため、ユーザが発話した音声を増幅して出力する拡声装置が使用されている。
一方、空港、駅、ホテル、観光地などでは外国人旅行者が多数滞在し、また、工場、倉庫、工事現場などでは外国人労働者が多数働いており、このように外国人が多数滞在する場所では、必要なメッセージを外国人に理解可能な外国語の音声で報知することが望まれる。
このような必要なメッセージを外国語の音声で報知することに関する技術として、従来、複数のメッセージの候補を予め登録しておき、その複数のメッセージの候補の中から適切なメッセージをユーザが選択することで、選択されたメッセージに対応する外国語の音声が出力されるようにした技術が知られている(特許文献1参照)。
特開2014−044349号公報
しかしながら、前記従来の技術では、予め登録されたメッセージの中から適切なものを選択して出力するものであるため、現場が想定外の状況で、登録されたメッセージの中に現場の状況に適したものがない場合には、役に立たないという問題があり、現場の状況に応じた適宜なメッセージを外国語の音声で出力することができる構成が望まれる。
また、ユーザが発話した音声を録音して、その音声を外国語の音声とともに繰り返し出力するようにするとよい。このとき、現場の状況などに応じて、録音した原音声をそのまま出力することが望ましい場合や、原音声の音声認識により取得した文字情報から生成した合成音声を出力することが望ましい場合がある。例えば、緊急時の避難誘導で緊迫感を出す必要がある場合には、原音声をそのまま出力することが望ましいが、通常時の案内では、違和感をなくすため、各言語の音声を合成音声で統一することが望ましい。
そこで、本発明は、現場の状況などに応じて、ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とをユーザが適宜に切り替えて出力することができる拡声装置およびその制御方法を提供することを主な目的とする。
本発明の拡声装置は、ユーザが発話した音声を出力する拡声装置であって、ユーザが発話した音声を収音するマイクと、前記マイクで収音した原音声を録音する録音部と、前記原音声に対応する原言語の合成音声および他言語の合成音声を取得する合成音声取得部と、前記原音声、前記原言語の合成音声および前記他言語の合成音声をスピーカから出力する音声出力部と、ユーザ設定情報に基づいて、原言語の音声として前記原音声と前記原言語の合成音声とのいずれかを出力するように制御する出力制御部と、を備える構成とする。
また、本発明の制御方法は、ユーザが発話した音声を出力する拡声装置の制御方法であって、ユーザが発話した音声をマイクで収音し、前記マイクで収音した原音声を録音し、原言語の音声として前記原音声が選択されている場合には、前記原音声をスピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力し、前記原言語の音声として合成音声が選択されている場合には、前記原音声に対応する原言語の合成音声を取得して、その原言語の合成音声を前記スピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力する構成とする。
本発明によれば、原言語の音声として、ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とのいずれかを、現場の状況などに応じてユーザが適宜に切り換えて出力することができる。
本実施形態に係る拡声装置1の側面図 拡声装置1の概略構成を示すブロック図 制御部6で行われる処理の概略を示す説明図 表示入力パネル9に表示される定型文表示画面を示す説明図 表示入力パネル9に表示される出力音声設定画面を示す説明図 表示入力パネル9に表示されるギャップ設定画面を示す説明図 再生時の音声の出力状況を示す説明図 拡声装置1の動作手順を示すフロー図 音声出力(ST114)での動作手順を示すフロー図 音声出力(ST114)での動作手順を示すフロー図 音声出力(ST114)での動作手順を示すフロー図
前記課題を解決するためになされた第1の発明は、ユーザが発話した音声を出力する拡声装置であって、ユーザが発話した音声を収音するマイクと、前記マイクで収音した原音声を録音する録音部と、前記原音声に対応する原言語の合成音声および他言語の合成音声を取得する合成音声取得部と、前記原音声、前記原言語の合成音声および前記他言語の合成音声をスピーカから出力する音声出力部と、ユーザ設定情報に基づいて、原言語の音声として前記原音声と前記原言語の合成音声とのいずれかを出力するように制御する出力制御部と、を備える構成とする。
これによると、原言語の音声として、ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とのいずれかを、現場の状況などに応じてユーザが適宜に切り換えて出力することができる。
また、第2の発明は、前記出力制御部は、前記合成音声を出力する場合に、ユーザ設定情報に基づいて、女性合成音声と男性合成音声とのいずれかを出力するように制御する構成とする。
これによると、現場の状況などに応じてユーザが適宜に性別を切り換えて合成音声を出力することができるため、ユーザの利便性を高めることができる。
また、第3の発明は、前記出力制御部は、前記原言語の音声に続けて、ユーザが指定した順番で複数の前記他言語の合成音声を出力するように制御する構成とする。
これによると、現場に滞在する外国人の割合などに応じて、他言語の合成音声を出力させる順番をユーザが指定することができるため、ユーザの利便性を高めることができる。
また、第4の発明は、前記音声出力部は、前記原言語の音声および前記他言語の音声を出力する際に、各言語の音声の間に、ユーザが指定した長さの無音期間を挿入する構成とする。
これによると、各言語の音声が聞き取りやすくなる。
また、第5の発明は、さらに、前記原音声の特徴情報を取得する音声解析部と、前記原音声および前記他言語の合成音声を出力する場合に、前記原音声と前記他言語の合成音声とで音声の特徴を一致させる処理を行う音声調整部と、を備える構成とする。
これによると、拡声装置から連続して出力される音声(原音声および多言語の合成音声)の特徴が共通化されるので、聴く人物に与える違和感を低減することができる。
また、第6の発明は、前記音声調整部は、前記原音声と前記他言語の合成音声とで、音声の性別、テンポ、音量および高さの少なくとも一つを一致させる構成とする。
これによると、拡声装置から連続して出力される音声(原音声および多言語の合成音声)の特徴が共通化されるので、聴く人物に与える違和感を低減することができる。
また、第7の発明は、ユーザが発話した音声を出力する拡声装置の制御方法であって、ユーザが発話した音声をマイクで収音し、前記マイクで収音した原音声を録音し、原言語の音声として前記原音声が選択されている場合には、前記原音声をスピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力し、前記原言語の音声として合成音声が選択されている場合には、前記原音声に対応する原言語の合成音声を取得して、その原言語の合成音声を前記スピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力する構成とする。
これによると、第1の発明と同様に、ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とをユーザが適宜に切り替えて出力することができる。
以下、本発明の実施の形態を、図面を参照しながら説明する。
図1は、本実施形態に係る拡声装置1の側面図である。
この拡声装置1では、筐体2の内部に、マイク3と、音声切換部5と、制御部6と、アンプ7と、スピーカ8と、表示入力パネル9と、が収容されている。また、筐体2の下部には、ユーザが把持するグリップ10が取り付けられている。筐体2におけるスピーカ8の前側には、円錐形状のホーン部11が設けられている。なお、筐体2の内部には電池(図示せず)も収容されている。
マイク3は、ユーザが発話する音声を収音する。
制御部6は、マイク3で収音した原音声を録音する処理や、録音した原音声を文字情報に変換する処理(音声認識)や、原音声の文字情報(原文)と類似する定型文を探し出す処理(検索)や、定型文の文字情報から合成音声を生成する処理(音声合成)や、合成音声や原音声を再生する処理などを行う。
音声切換部5は、メガホンモード(第1の動作モード)での音声パス(音声の経路)と、翻訳モード(第2の動作モード)での音声パスとを切り換える。アンプ7は、音声切換部5から出力される音声を増幅する。スピーカ8は、アンプ7で増幅された音声を出力する。
メガホンモードでは、マイク3で収音した原音声をそのままアンプ7で増幅してスピーカ8で出力する。翻訳モードでは、マイク3で収音した原音声を制御部6に入力して、制御部6で生成した合成音声や原音声をアンプ7で増幅してスピーカ8で出力する。
筐体2の側面には、モード切換スイッチ12が設けられている。このモード切換スイッチ12は、メガホンモードと翻訳モードとを切り換えるものであり、モード切換スイッチ12の操作に応じて、音声切換部5においてメガホンモードでの音声パスと翻訳モードでの音声パスとが切り換えられる。
表示入力パネル9(表示部、入力部)は、タッチパネルと液晶ディスプレイとを組み合わせた、いわゆるタッチパネルディスプレイで構成され、画面を上向きにした状態で、筐体2の上部に形成された凸部18に収容されている。
凸部18の側面には電源スイッチ13が設けられている。
グリップ10の手前側には、録音スイッチ14と、音量調整スイッチ15とが設けられている。グリップ10の逆側には、出力スイッチ16と、ロックスイッチ17と、が設けられている。ユーザは、一方の手でグリップ10を把持した状態で、その手の親指で録音スイッチを操作し、また、人差し指で出力スイッチを操作することができる。
録音スイッチ14は、マイク3で収音した音声の録音を指示するものである。音量調整スイッチ15は、スピーカ8から出力される音声の音量を調整するものである。
出力スイッチ16は、メガホンモードでは、アンプ7を動作させる操作を行うものとなり、出力スイッチ16を押下すると、マイク3で収音された原音声がアンプ7で増幅して出力される。一方、翻訳モードでは、出力スイッチ16は、アンプ7を動作させるとともに音声の再生を制御部6に指示する操作を行うものとなり、出力スイッチ16を押下すると、制御部6で音声が再生されて、その音声がアンプ7で増幅されて出力される。このとき、出力スイッチ16を押下し続けることで、音声が繰返し再生される。
ロックスイッチ17は、出力スイッチ16を押下状態に保持するものである。これにより、出力スイッチ16をユーザが押下し続けなくても音声の出力を継続させることができる。
なお、モード切換スイッチ12はロッカースイッチであり、録音スイッチ14および出力スイッチ16は押ボタンスイッチであり、音量調整スイッチ15はロータリースイッチである。
次に、拡声装置1の概略構成について説明する。図2は、拡声装置1の概略構成を示すブロック図である。図3は、制御部6で行われる処理の概略を示す説明図である。
モード切換スイッチ12の信号が音声切換部5に入力される。この音声切換部5は、モード切換スイッチ12の操作に応じて、メガホンモードでの音声パスと翻訳モードでの音声パスとを切り換えるものであり、入力切換部21と、出力切換部22と、を備えている。入力切換部21では、マイク3から出力される音声を、出力切換部22側および制御部6側のいずれかに出力する。出力切換部22では、入力切換部21および制御部6のいずれかから入力される音声をアンプ7側に出力する。
音声切換部5と制御部6との間にはレベル調整部23が設けられている。このレベル調整部23では、音声切換部5の入力切換部21から出力される音声のレベルが調整される。
音量調整スイッチ15の信号が音量調整部24に入力される。この音量調整部24は、音声切換部5とアンプ7との間に設けられている。この音量調整部24では、音量調整スイッチ15の操作に応じて、音声切換部5の出力切換部22から出力される音声の音量が調整される。
出力スイッチ16の信号がアンプ7に入力される。出力スイッチ16は、アンプ7への給電を断続するスイッチとして機能し、メガホンモードにおいて出力スイッチ16が押下されると、アンプ7が通電して音声出力状態となり、マイク3から入力される原音声がアンプ7で増幅されて出力される。一方、翻訳モードにおいて出力スイッチ16が押下されると、アンプ7が通電して音声出力状態になるとともに、再生部35で音声が再生されて、再生部35から出力される音声がアンプ7で増幅されて出力される。
記憶部25は、制御部6において、ユーザが発話する音声を録音した原音声や、原音声の音声認識により取得した原文や、定型文の文字情報から変換された合成音声を一時記憶する。また、記憶部25は、定型文データベースを記憶する。この定型文データベースには、多数の定型文が登録されている。
また、記憶部25は、表示入力パネル9に表示された設定画面上でユーザが入力した情報をユーザ設定情報として記憶する。本実施形態では、ユーザ設定情報として、原言語の音声として原音声を出力するか否かに関する情報や、合成音声の性別(女性または男性)に関する情報や、複数の他言語(英語、中国語など)の音声を出力する順番に関する情報が記憶される。
制御部6は、録音部31と、音声認識部32と、検索部33と、音声合成部34と、再生部35と、出力制御部36と、音声解析部37と、音声調整部38と、を備えている。この制御部6は、プロセッサで構成され、制御部6の各部は、記憶部25に記憶されたプログラムを実行することで実現される。
なお、音声認識部32、検索部33、および音声合成部34で合成音声取得部26が構成される。また、再生部35、アンプ7およびスピーカ8で音声出力部27が構成される(図3参照)。
この制御部6には、モード切換スイッチ12の信号、録音スイッチ14の信号、および出力スイッチ16の信号が入力される。
録音部31は、レベル調整部23から出力される原音声を録音する。この録音処理では、音声信号(アナログ信号)を音声データにA/D変換して記憶部25に記憶させる。録音部31では、録音スイッチ14が押下されると、録音処理が開始され、録音スイッチ14がリリースされると、録音処理を終了する。
音声認識部32は、録音部31で録音された原音声を文字情報に変換する音声認識を行い、この音声認識結果として、原文(原音声の文字情報)を取得する。この原文は記憶部25に一時記憶される。
検索部33は、定型文データベースに登録された原言語(例えば、日本語)の定型文の中から、原文と類似度が最も高い定型文を探し出す(図3参照)。
音声合成部34は、原言語の定型文を定型文データベースから取得して、その原言語(例えば、日本語)の定型文の文字情報から音声合成により原言語の合成音声を生成する。他言語の定型文を定型文データベースから取得して、その他言語(例えば、英語、中国語など)の定型文の文字情報から音声合成により他言語の合成音声を生成する。この音声合成部34で生成した合成音声は記憶部25に一時記憶される。
出力制御部36は、出力スイッチ16が押下されると、音声の出力を開始し、出力スイッチ16がリリースされると、音声の出力を停止するように制御する。このとき、出力制御部36は、検索部33で取得した原言語の定型文およびこれに対応する他言語の定型文の音声合成を音声合成部34に指示し、さらに、音声合成部34で生成した合成音声の再生を再生部35に指示する(図3参照)。また、出力制御部36は、ユーザ設定情報に基づいて、原言語の音声に続けて、ユーザが指定した順番で複数の他言語の合成音声を出力するように、音声合成部34および再生部35に指示する。
また、出力制御部36は、ユーザ設定情報に基づいて、原言語の音声として原音声と原言語(例えば、日本語)の合成音声とのいずれかを出力するように制御する。ここで、原音声を出力する場合には、原音声を記憶部25から取得して、原音声の再生を再生部35に指示する(図3参照)。一方、原言語の合成音声を出力する場合には、原言語の定型文を記憶部25から取得して、原言語の定型文の音声合成を音声合成部34に指示し、さらに、音声合成部34で生成した原言語の合成音声の再生を再生部35に指示する(図3参照)。
なお、原音声を出力する場合には、マイク3で収音されたユーザの発話した音声(例えば、「こちらで物資を配ります。」)そのものが出力されるが、原言語の合成音声を出力する場合には、記憶部25に記憶される原言語の定型文から、ユーザの発話した音声に類似度が最も高い定型文(例えば、「こちらで物資を配布しております。」)を取得し、この定型文の音声合成が出力されるので、ユーザが実際に発話した音声の内容と多少異なる可能性がある。
また、出力制御部36は、合成音声を出力する場合に、ユーザ設定情報に基づいて、女性合成音声と男性合成音声とのいずれかを出力するように制御する。女性合成音声を出力する場合には、女性音声合成を生成するように音声合成部34に指示し、男性合成音声を出力する場合には、男性合成音声を生成するように音声合成部34に指示する。
再生部35は、録音部31で録音された原音声、および音声合成部34で生成した合成音声を再生する。この再生処理では、原音声および合成音声のデータを音声信号(アナログ信号)にD/A変換する処理が行われる。なお、原音声および合成音声は記憶部25に一時記憶されており、出力スイッチ16が押下されている状態では、原言語の音声(原音声または合成音声)および他言語の合成音声が所定の順番で連続して繰り返し再生される。
また、再生部35は、原言語の音声(原音声または合成音声)および他言語の音声を出力する際に、各言語の音声の間に、ユーザが指定した長さのギャップ(無音期間)を挿入する。このギャップ(無音期間)も、ユーザの指定に基づいてユーザ設定情報として記憶しておき、出力制御部36から再生部35に通知させるようにするとよい。
音声解析部37は、記憶部25から原音声を取得して、原音声の特徴情報を取得する。本実施形態では、原音声の特徴情報として、性別(男声または女声)、テンポ(スピード)、音量、高さ(トーン)に関する情報を取得する。
音声調整部38は、原音声と他言語の合成音声とを出力する場合に、原音声と合成音声との間で音声の特徴を一致させる処理を行う。本実施形態では、音声の特徴として、性別(男声または女声)、テンポ(スピード)、音量、高さ(トーン)の少なくともいずれかに関する調整を行う。
また、本実施形態では、合成音声を原音声に合わせるモードと、原音声を合成音声に合わせるモードとがあり、いずれかのモードをユーザが選択することができる。合成音声を原音声に合わせるモードでは、合成音声の性別、テンポ、音量および高さが原音声に一致するように、音声合成部34において、原音声の特徴情報に基づいて合成音声を生成する。原音声を合成音声に合わせるモードでは、合成音声の初期設定で採用されている標準的なテンポ、音量、高さに原音声が一致するように、原音声を音声変換する。
このように原音声と合成音声とで音声の特徴を一致させるようにすると、拡声装置1から連続して出力される音声(原音声および合成音声)の特徴が共通化されるので、聴く人物に与える違和感を低減することができる。
次に、表示入力パネル9に表示される定型文表示画面について説明する。図4は、定型文表示画面を示す説明図である。
この定型文表示画面には、定型文表示部41が設けられている。本実施形態では、検索部33において、ユーザが発話した原音声の音声認識により生成される原文と類似度が最も高い定型文が検索され、ここで見つかった原言語(日本語)の定型文が、定型文表示部41に表示される。
また、この定型文表示画面には、再生順序表示部42が設けられている。この再生順序表示部42には、ユーザ設定情報に基づいて、原言語(日本語)および他言語(英語、中国語、韓国語など)の再生順序が表示される。また、再生順序表示部42には、国旗アイコン43が設けられており、この国旗アイコン43を操作することで、他言語の文字情報が定型文表示部41に表示される。なお、ユーザによる再生順序の設定は設定画面(図示せず)で行われる。
この定型文表示画面が表示されている状態で出力スイッチ16を押下すると、この定型文表示画面に表示された定型文に関する原言語の音声および他言語の音声が、再生順序表示部42に表示された順序で出力される。
次に、表示入力パネル9に表示される出力音声設定画面について説明する。図5は、出力音声設定画面を示す説明図である。
この出力音声設定画面には、出力音声選択部51が設けられている。この出力音声選択部51には、2つのラジオボタン52が設けられており、このラジオボタン52の操作により、女性合成音声を出力するモードと、男性合成音声を出力するモードとのいずれかをユーザが選択することができる。また、出力音声選択部51には、チェックボックス53が設けられており、このチェックボックス53の操作により、原言語(日本語)の音声において原音声を優先して出力するか否かをユーザが選択することができる。
また、この出力音声設定画面には、音声調整選択部54が設けられている。この音声調整選択部54には、チェックボックス55が設けられており、このチェックボックス55の操作により、音声調整を行うか否かをユーザが選択することができる。また、音声調整選択部54には、2つのラジオボタン56が設けられており、このラジオボタン56の操作により、音声調整時に合成音声を原音声に合わせるか、原音声を合成音声に合わせるかをユーザが選択することができる。
また、この出力音声設定画面には、キャンセルボタン57と、OKボタン58とが設けられている。キャンセルボタン57を操作すると、出力音声選択部51および音声調整選択部54でユーザが選択した内容を破棄して、設定メニュー画面(図示せず)に戻る。OKボタン58を操作すると、出力音声選択部51および音声調整選択部54でユーザが選択した内容で記憶部25のユーザ設定情報が更新されて、設定メニュー画面(図示せず)に戻る。
このように本実施形態では、原言語の音声として、ユーザが発話した音声を録音した原音声と、原音声に対応する定型文の文字情報から音声合成された合成音声とのいずれかをユーザが選択して出力することができる。例えば、緊急時の避難誘導で緊迫感を出す必要がある場合には、原音声を出力するように設定するとよい。また、通常時の案内では、違和感をなくすため、原言語の音声として合成音声を選択して、各言語の音声を合成音声で統一するとよい。
また、本実施形態では、合成音声の性別(男声または女声)をユーザが選択することができる。このため、使用状況に適した性別の合成音声を出力することができる。例えば、緊急時の避難誘導で緊迫感を出す必要がある場合には男性の声を選択するとよく、また、通常時の案内などの場合には女性の声を選択するとよい。
また、本実施形態では、音声調整を行うか否かをユーザが選択することができ、さらに、合成音声を原音声に合わせるか、原音声を合成音声に合わせるかをユーザが選択することができる。このため、使用状況に適した音声を出力することができる。例えば、原音声が早口である場合には、聞き取りやすいように、原音声のテンポを遅くしたり、また、逆に、緊急を要する場面では、緊迫感が損なわれないように、合成音声を原音声に合わせて合成音声のテンポを速くしたりすることができる。
次に、表示入力パネル9に表示されるギャップ設定画面について説明する。図6は、ギャップ設定画面を示す説明図である。
このギャップ設定画面には、複数のラジオボタン61が設けられており、このラジオボタン61の操作により、音声を出力する際に各言語の音声の間に挿入されるギャップ(無音期間)の長さ(ギャップ時間)をユーザが選択することができる。図6に示す例では、ラジオボタン61が4つ設けられており、0.5秒、1.0秒、2.0秒および3.0秒のいずれかを選択することができる。
また、このギャップ設定画面には、キャンセルボタン62と、OKボタン63とが設けられている。キャンセルボタン62を操作すると、ユーザが選択した内容を破棄して、設定メニュー画面(図示せず)に戻る。OKボタン63を操作すると、ユーザが選択した内容で記憶部25のユーザ設定情報が更新されて、設定メニュー画面(図示せず)に戻る。
次に、再生時の音声の出力状況について説明する。図7は、再生時の音声の出力状況を示す説明図である。
本実施形態では、原音声を優先して出力するか否か、および女性および男性のいずれの合成音声を出力するかをユーザが選択することができ、この情報がユーザ設定情報として記憶部25に記憶され、音声を出力する際には、ユーザ設定情報に基づいて、必要な音声合成処理を行って、各言語の音声が順に出力される。なお、図7は、原言語として日本語、他言語として英語および中国語を選択した例である。
ここで、原音声を優先し、かつ、女性合成音声を出力するように設定されている場合には、図7(A)に示すように、原音声(日本語)、英語の女性合成音声、中国語の女性合成音声が順に出力される。また、原音声を優先し、かつ、男性合成音声を出力するように設定されている場合には、図7(B)に示すように、原音声(日本語)、英語の男性合成音声、中国語の男性合成音声が順に出力される。
また、原音声を優先せず、かつ、女性合成音声を出力するように設定されている場合には、図7(C)に示すように、日本語の女性合成音声、英語の女性合成音声、中国語の女性合成音声が順に出力される。また、原音声を優先せず、かつ、男性合成音声を出力するように設定されている場合には、図7(D)に示すように、日本語の男性合成音声、英語の男性合成音声、中国語の男性合成音声が順に出力される。
また、各言語の音声を出力する際には、各言語の音声の間に、ユーザが指定した長さのギャップ(無音期間)が挿入される。このため、各言語の音声が聞き取りやすくなる。
次に、拡声装置1の動作について説明する。図8は、拡声装置1の動作手順を示すフロー図である。
拡声装置1では、まず、モード切換スイッチ12が翻訳モードの状態でない、すなわち、メガホンモードの状態であれば(ST101でNo)、音声切換部5が、マイク3で収音した原音声をそのまま出力する状態となり、ここで、出力スイッチ16が押下されると(ST102でYes)、アンプ7が音声出力状態となり、原音声の出力を開始する(ST103)。このとき、ユーザが発話した原音声がそのままアンプ7で増幅されてスピーカ8から出力される。そして、出力スイッチ16が戻されると(ST104でYes)、原音声の出力を停止する(ST105)。なお、出力スイッチ16が押下されていない場合には(ST102でNo)、特別な動作は行われない。
一方、モード切換スイッチ12が翻訳モードの状態である場合には(ST101でYes)、次に、制御部6において、録音スイッチ14が押下されているか否かを判定する(ST106)。ここで、録音スイッチ14が押下されている場合には(ST106でYes)、録音部31において、マイク3で収音した原音声を録音する処理を開始する(ST107)。このとき、バイブレーションや通知音で、録音が開始されたことをユーザに通知するようにしてもよい。そして、録音スイッチ14が戻されると(ST108でYes)、録音を停止する(ST109)。
次に、音声認識部32において、録音した原音声を文字情報に変換する音声認識が行われる(ST110)。次に、検索部33において、原文(原音声の文字情報)に最も類似する定型文を探し出す検索が行われる(ST111)。そして、検索部33で見つかった定型文を表示する定型文表示画面(図4参照)を表示入力パネル9に表示する(ST112)。
次に、出力スイッチ16が押下されているか否かを判定する(ST113)。ここで、出力スイッチ16が押下されている場合には(ST113でYes)、音声合成部34において、定型文から合成音声を生成し、再生部35において、合成音声を再生する処理が開始され、合成音声がスピーカ8から出力される(ST114)。このとき、再生部35において、各言語の音声が順に繰り返し再生される。そして、出力スイッチ16が戻されると(ST115でYes)、音声の出力を停止する(ST116)。
次に、音声出力(ST114)での動作手順について説明する。図9、図10および図11は、音声出力(ST114)での動作手順を示すフロー図である。なお、ここでは、原言語として日本語、他言語を英語および中国語とした例を示す。
音声出力(ST114)では、まず、図9に示すように、制御部6において、ユーザ設定情報に基づいて、音声調整を行う設定であるか否かを判定する(ST201)。
ここで、音声調整を行う設定でない場合には(ST201でNo)、次に、原音声を優先して出力する設定か否かを判定する(ST202)。ここで、原音声を優先して出力する設定である場合には(ST202でYes)、次に、女性合成音声を出力する設定か否かを判定する(ST203)。
ここで、女性合成音声を出力する設定である場合には(ST203でYes)、まず、記憶部25から原音声を取得して、音声出力部27において原音声を出力する(ST204)。ついで、ユーザが出力対象として指定した定型文の英語テキスト(英語の文字情報)を定型文データベースから取得して、音声合成部34において英語テキストから女性合成音声を生成して、音声出力部27において女性合成音声を出力する(ST205)。ついで、定型文データベースから中国語テキスト(中国語の文字情報)を取得して、その中国語テキストから女性合成音声を生成して出力する(ST206)。
一方、女性合成音声を出力する設定でない、すなわち、男性合成音声を出力する設定である場合には(ST203でNo)、まず、記憶部25から原音声を取得して、その原音声を出力する(ST207)。ついで、定型文データベースから英語テキストを取得して、その英語テキストから男性合成音声を生成して出力する(ST208)。ついで、定型文データベースから中国語テキストを取得して、その中国語テキストから男性合成音声を生成して出力する(ST209)。
また、原音声を優先して出力する設定でない場合には(ST202でNo)、図10に示すように、次に、女性合成音声を出力する設定か否かを判定する(ST210)。
ここで、女性合成音声を出力する設定である場合には(ST210でYes)、まず、ユーザが出力対象として指定した定型文の日本語テキスト(日本語の文字情報)を定型文データベースから取得して、その日本語テキストから女性合成音声を生成して出力する(ST211)。ついで、定型文データベースから英語テキストを取得して、その英語テキストから女性合成音声を生成して出力する(ST212)。ついで、定型文データベースから中国語テキストを取得して、その中国語テキストから女性合成音声を生成して出力する(ST213)。
一方、女性合成音声を出力する設定でない、すなわち、男性合成音声を出力する設定である場合には(ST210でNo)、まず、ユーザが出力対象として指定した定型文の日本語テキストを定型文データベースから取得して、その日本語テキストから男性合成音声を生成して出力する(ST214)。ついで、定型文データベースから英語テキストを取得して、その英語テキストから男性合成音声を生成して出力する(ST215)。ついで、定型文データベースから中国語テキストを取得して、その中国語テキストから男性合成音声を生成して出力する(ST216)。
また、図9に示したように、音声調整を行う設定である場合には(ST201でYes)、図11に示すように、次に、音声解析部37において、原音声の特徴(性別、テンポ、音量および高さ)を検出する(ST217)。
次に、音声調整部38において、ユーザ設定情報に基づいて、合成音声を原音声に合わせる設定であるか否かを判定する(ST218)。
ここで、合成音声を原音声に合わせる設定である場合には(ST218でYes)、まず、記憶部25から原音声を取得して、音声出力部27において原音声を出力する(ST219)。ついで、定型文データベースから英語テキストを取得して、音声合成部34において、原音声の性別、テンポ、音量および高さに合うように、英語テキストから合成音声を生成して、音声出力部27において合成音声を出力する(ST220)。ついで、定型文データベースから中国語テキストを取得して、その中国語テキストから原音声の性別、テンポ、音量および高さに合うように合成音声を生成して、その合成音声を出力する(ST221)。
一方、合成音声を原音声に合わせる設定でない、すなわち、原音声を合成音声に合わせる設定である場合には(ST218でNo)、記憶部25から原音声情報を取得して、合成音声に関する初期設定で採用されている標準のテンポ、音量および高さになるように原音声を変換して、その原音声を出力する(ST222)。ついで、定型文データベースから英語テキストを取得して、その英語テキストから、原音声の性別で合成音声を生成して、その合成音声する出力する(ST223)。ついで、定型文データベースから中国語テキストを取得して、その中国語テキストから、原音声の性別で合成音声を生成して、その合成音声を出力する(ST224)。
なお、本実施形態では、原音声を合成音声に合わせる設定である場合に、性別以外の特徴(テンポ、音量および高さ)が、合成音声に関する初期設定で採用されている標準の音声生成条件に合うように原音声の音声調整を行うようにして、性別に関しては、原音声の性別で合成音声を生成するようにしたが、原音声の音声変換により、初期設定の性別(例えば女性)や、ユーザが指定した性別の音声に変換するようにしてもよい。この場合、他言語(英語、中国語)の合成音声も、初期設定の性別やユーザが指定した性別で生成するようにする。
また、音声の特徴を原音声と合成音声とで一致させるために、合成音声を原音声に合わせたり、原音声を合成音声に合わせたりするようにしたが、原音声および合成音声の双方を、所定の特徴の音声に合わせるようにしてもよい。
以上のように、本出願において開示する技術の例示として、実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、変更、置き換え、付加、省略などを行った実施形態にも適用できる。また、上記の実施形態で説明した各構成要素を組み合わせて、新たな実施形態とすることも可能である。
例えば、前記の実施形態では、ユーザが発話する音声の音声認識により取得した原文と類似度の高い原言語(日本語)の定型文を検索して、その原言語の定型文に対応する他言語の定型文を取得して、その他言語の定型文から他言語の合成音声を生成するようにしたが、翻訳エンジンを用いて原文を翻訳することで他言語の文章を取得して、その他言語の文章から他言語の合成音声を生成するようにしてもよい。
また、前記の実施形態では、合成音声取得(音声認識、検索、音声合成)、音声解析、および音声調整などの各処理を拡声装置1で行うようにしたが、拡声装置1から必要な情報(例えば原音声)をサーバ装置に送信して、サーバ装置において、前記の各処理の全てあるいは一部を行うようにしてもよい。また、前記の翻訳エンジンを用いた文字翻訳をサーバ装置に行わせるようにしてもよい。
本発明に係る拡声装置およびその制御方法は、現場の状況などに応じて、ユーザが発話した音声を録音した原音声と、その原音声から生成される原言語の合成音声とをユーザが適宜に切り替えて出力することができる効果を有し、ユーザが発話した音声を出力する拡声装置およびその制御方法などとして有用である。
1 拡声装置
3 マイク
6 制御部
7 アンプ
8 スピーカ
14 録音スイッチ
16 出力スイッチ
25 記憶部
26 合成音声取得部
27 音声出力部
31 録音部
32 音声認識部
33 検索部
34 音声合成部
35 再生部
36 出力制御部
37 音声解析部
38 音声調整部

Claims (7)

  1. ユーザが発話した音声を出力する拡声装置であって、
    ユーザが発話した音声を収音するマイクと、
    前記マイクで収音した原音声を録音する録音部と、
    前記原音声に対応する原言語の合成音声および他言語の合成音声を取得する合成音声取得部と、
    前記原音声、前記原言語の合成音声および前記他言語の合成音声をスピーカから出力する音声出力部と、
    ユーザ設定情報に基づいて、原言語の音声として前記原音声と前記原言語の合成音声とのいずれかを出力するように制御する出力制御部と、
    を備えることを特徴とする拡声装置。
  2. 前記出力制御部は、前記合成音声を出力する場合に、ユーザ設定情報に基づいて、女性合成音声と男性合成音声とのいずれかを出力するように制御することを特徴とする請求項1に記載の拡声装置。
  3. 前記出力制御部は、前記原言語の音声に続けて、ユーザが指定した順番で複数の前記他言語の合成音声を出力するように制御することを特徴とする請求項1または請求項2に記載の拡声装置。
  4. 前記音声出力部は、前記原言語の音声および前記他言語の音声を出力する際に、各言語の音声の間に、ユーザが指定した長さの無音期間を挿入することを特徴とする請求項1から請求項3のいずれかに記載の拡声装置。
  5. さらに、前記原音声の特徴情報を取得する音声解析部と、
    前記原音声および前記他言語の合成音声を出力する場合に、前記原音声と前記他言語の合成音声とで音声の特徴を一致させる処理を行う音声調整部と、を備えることを特徴とする請求項1から請求項4のいずれかに記載の拡声装置。
  6. 前記音声調整部は、前記原音声と前記他言語の合成音声とで、音声の性別、テンポ、音量および高さの少なくとも一つを一致させることを特徴とする請求項5に記載の拡声装置。
  7. ユーザが発話した音声を出力する拡声装置の制御方法であって、
    ユーザが発話した音声をマイクで収音し、
    前記マイクで収音した原音声を録音し、
    原言語の音声として前記原音声が選択されている場合には、前記原音声をスピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力し、
    前記原言語の音声として合成音声が選択されている場合には、前記原音声に対応する原言語の合成音声を取得して、その原言語の合成音声を前記スピーカから出力し、続いて、前記原音声に対応する他言語の合成音声を取得して、その他言語の合成音声を前記スピーカから出力することを特徴とする制御方法。
JP2016196992A 2016-10-05 2016-10-05 拡声装置およびその制御方法 Active JP6238181B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016196992A JP6238181B1 (ja) 2016-10-05 2016-10-05 拡声装置およびその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016196992A JP6238181B1 (ja) 2016-10-05 2016-10-05 拡声装置およびその制御方法

Publications (2)

Publication Number Publication Date
JP6238181B1 true JP6238181B1 (ja) 2017-11-29
JP2018060043A JP2018060043A (ja) 2018-04-12

Family

ID=60477105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016196992A Active JP6238181B1 (ja) 2016-10-05 2016-10-05 拡声装置およびその制御方法

Country Status (1)

Country Link
JP (1) JP6238181B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019176301A (ja) * 2018-03-28 2019-10-10 株式会社日立国際電気 同報無線システム、及び音声メッセージの再生方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6624747B2 (ja) * 2018-03-20 2019-12-25 クオリティソフト株式会社 音声伝達システム
JP7199872B2 (ja) 2018-08-10 2023-01-06 ナブテスコ株式会社 多言語音声案内装置および多言語音声案内方法
CN109117235B (zh) 2018-08-24 2019-11-05 腾讯科技(深圳)有限公司 一种业务数据处理方法、装置以及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916602A (ja) * 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
JP2001256223A (ja) * 2000-03-14 2001-09-21 Brother Ind Ltd 自動翻訳装置
JP2009186820A (ja) * 2008-02-07 2009-08-20 Hitachi Ltd 音声処理システム、音声処理プログラム及び音声処理方法
JP2014044349A (ja) * 2012-08-28 2014-03-13 Edison Hardware Kk 多言語再生装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916602A (ja) * 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
JP2001256223A (ja) * 2000-03-14 2001-09-21 Brother Ind Ltd 自動翻訳装置
JP2009186820A (ja) * 2008-02-07 2009-08-20 Hitachi Ltd 音声処理システム、音声処理プログラム及び音声処理方法
JP2014044349A (ja) * 2012-08-28 2014-03-13 Edison Hardware Kk 多言語再生装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"[ビジネスの裏側]まるでドラえもんの道具!!世界初、パナのメガホン型翻訳機・・・成田空港の試験配備に", 産経WEST, JPN6017036492, 28 November 2015 (2015-11-28), JP *
"日本語を英語・中国語・韓国語に一挙に翻訳、メガホンヤク。翻訳技術のいま。, [online]", TBSラジオ, JPN6017036496, 7 September 2016 (2016-09-07), JP *
"首都圏鉄道駅初!メガホン型多言語翻訳機「メガホンヤク」羽田空港国際線ターミナル駅に試験導入, [online]", KEIKYU GROUP NEWS RELEASE, JPN6017036494, 28 September 2016 (2016-09-28), JP *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019176301A (ja) * 2018-03-28 2019-10-10 株式会社日立国際電気 同報無線システム、及び音声メッセージの再生方法
JP7143102B2 (ja) 2018-03-28 2022-09-28 株式会社日立国際電気 同報無線システム、及び音声メッセージの再生方法

Also Published As

Publication number Publication date
JP2018060043A (ja) 2018-04-12

Similar Documents

Publication Publication Date Title
JP6238181B1 (ja) 拡声装置およびその制御方法
JP5225847B2 (ja) 情報処理端末、音楽情報生成方法、およびプログラム
JP2008032825A (ja) 発言者表示システム、発言者表示方法および発言者表示プログラム
TW200824408A (en) Methods and systems for information retrieval during communication, and machine readable medium thereof
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP6820504B2 (ja) 翻訳装置、その制御方法およびプログラム
JP2001145167A (ja) 情報通信端末
JP2020113150A (ja) 音声翻訳対話システム
JP6273560B1 (ja) 拡声装置およびその制御方法
JP6650636B1 (ja) 翻訳装置、その制御方法およびプログラム
WO1997037344A1 (fr) Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal
JP6628157B2 (ja) 翻訳装置、その制御方法およびプログラム
JP6269771B1 (ja) 翻訳装置、拡声装置、およびその制御方法
JP2007286376A (ja) 音声案内システム
JP6269701B2 (ja) 拡声装置および拡声方法
JP2013164642A (ja) 検索手段制御装置、検索結果出力装置及びプログラム
JP4175141B2 (ja) 音声認識機能を有する番組情報表示装置
JP2019012920A (ja) プロジェクタ付き拡声装置
JP4516943B2 (ja) カラオケ歌唱補助システム
JP6735491B2 (ja) 音声出力装置および音声出力方法
JP2005210497A (ja) 携帯情報端末
JP6274234B2 (ja) 拡声装置およびその制御方法
JP2004134942A (ja) 携帯電話装置
JP3389258B2 (ja) 文章読み上げ装置
JP5242856B1 (ja) 音楽再生プログラム及び音楽再生システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171020

R151 Written notification of patent or utility model registration

Ref document number: 6238181

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151