JP6830933B2 - 通信システム及び音声配信方法 - Google Patents

通信システム及び音声配信方法 Download PDF

Info

Publication number
JP6830933B2
JP6830933B2 JP2018152775A JP2018152775A JP6830933B2 JP 6830933 B2 JP6830933 B2 JP 6830933B2 JP 2018152775 A JP2018152775 A JP 2018152775A JP 2018152775 A JP2018152775 A JP 2018152775A JP 6830933 B2 JP6830933 B2 JP 6830933B2
Authority
JP
Japan
Prior art keywords
voice
user
information
service server
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018152775A
Other languages
English (en)
Other versions
JP2020028061A (ja
Inventor
理 大鷹
理 大鷹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Corp filed Critical SoftBank Corp
Priority to JP2018152775A priority Critical patent/JP6830933B2/ja
Publication of JP2020028061A publication Critical patent/JP2020028061A/ja
Application granted granted Critical
Publication of JP6830933B2 publication Critical patent/JP6830933B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、録音音声を聞くことができる通信システム、及び、音声配信方法に関する。
従来、あるユーザが録音した音声を後で視聴可能なサービスがあり、電話機における留守番電話サービスなどが最たるものであるといえる。現在においては、多くのユーザが自身の携帯端末(例えば、スマートフォン)を保持し、ネットワーク上の録音を視聴することができるサービスを利用している。また、特許文献1には、ある端末で録音した音声を、他の端末で再生することができる伝言通信システムが開示されている。
特開2011−234287号公報
ところで、各ユーザの端末に固有の情報を用いて録音を聴くシステムの場合、他のユーザは、録音されている音声を聴くことができない。例えば、あるユーザAが何らかの災害に巻き込まれて、他のユーザBに自身の無事を伝えるために録音メッセージを残したとする。この場合、ユーザBは自身の端末から録音メッセージを聴いて、ユーザAの無事を認識することができるものの、ユーザAと親しいユーザCはユーザAの無事を認識することができないという問題があった。
そこで、本発明は上記問題に鑑みて成されたものであり、ユーザ固有の情報を用いて録音メッセージを聴くことができるシステムにおいて、他のユーザでもその録音メッセージを聴くことができる通信システム及び音声配信方法を提供することを目的とする。
上記課題を解決するために、本発明の一態様に係る通信システムは、録音されている音声の再生を要求する音声入力を受け付ける音声入力受付部と、音声入力受付部を介して受け付けた音声入力に基づく指示を、ユーザの電話番号を認証情報として、登録されている音声をユーザの端末に送信する音声サービスを実行する音声サービスサーバに送信する第1送信部と、音声サービスサーバから音声情報を受信する第1受信部と、第1受信部が受信した音声情報を出力する出力部と、を備える情報処理端末と、音声入力に基づく指示を受信する第2受信部と、情報処理端末を示す識別情報と、当該情報処理端末に対応付けられているユーザを示すユーザ情報とが対応付けられた対応情報と、ユーザ毎に対応付けて録音された音声情報を記憶する記憶部と、対応情報を参照して、第2受信部が受信した音声入力に基づく指示を送信した情報処理端末に対応付けられているユーザを特定する特定部と、特定したユーザに対応付けられた音声情報を記憶部から抽出する抽出部と、抽出部が抽出した音声情報を情報処理端末に送信する第2送信部と、を備える音声サービスサーバと、を備える。
上記課題を解決するために、本発明の一態様に係る音声配信方法は、情報処理端末と、登録されている音声をユーザの端末に送信する音声サービスを実行する音声サービスサーバとを含む通信システムにおける音声配信方法であって、音声サービスサーバは、情報処理端末を示す識別情報と、当該情報処理端末に対応付けられているユーザを示すユーザ情報とが対応付けられた対応情報と、ユーザ毎に対応付けて録音された音声情報を記憶する記憶部を備え、情報処理端末が、録音されている音声の再生を要求する音声入力を受け付ける音声入力受付ステップと、情報処理端末が、音声入力受付ステップにおいて受け付けた音声入力に基づく指示を、ユーザの電話番号を認証情報として、音声サービスサーバに送信する第1送信ステップと、音声サービスサーバが、音声入力に基づく指示を受信する第1受信ステップと、音声サービスサーバが、対応情報を参照して、第2受信ステップが受信した音声入力に基づく指示を送信した情報処理端末に対応付けられているユーザを特定する特定ステップと、音声サービスサーバが、特定したユーザに対応付けられた音声情報を記憶部から抽出する抽出ステップと、音声サービスサーバが、抽出ステップにおいて抽出した音声情報を情報処理端末に送信する第2送信ステップと、情報処理端末が、音声サービスサーバから音声情報を受信する第2受信ステップと、情報処理端末が、第2受信ステップが受信した音声情報を出力する出力ステップと、を含む。
上記通信システムにおいて、情報処理端末は、ユーザの端末から、音声サービスサーバへのアクセス要求を受け付けるアクセス要求受付部を更に備え、第1送信部は、アクセス要求を音声サービスサーバに送信し、第2受信部は、アクセス要求を受信し、第2送信部は、音声サービスサーバは、アクセス要求に基づいて認証情報の入力を要求する要求フォームを送信し、第1受信部は、要求フォームを受信し、第1送信部は、要求フォームをユーザの端末に送信し、ユーザの端末は、アクセス要求をユーザから受け付ける入力部と、アクセス要求を情報処理端末に送信する第3送信部と、要求フォームを受信する第3受信部と、要求フォームに対して入力部を介してユーザから認証情報を受け付け、第3送信部は、認証情報を情報処理端末に送信し、第1受信部は、認証情報を受信し、第1送信部は、認証情報を、音声サービスサーバに送信し、第2受信部は、認証情報を受信し、音声サービスサーバは、音声サービスサーバは、ユーザを示す識別情報と、情報処理端末とを、対応付けて対応情報に登録する登録部を備えることとしてもよい。
上記通信システムにおいて、認証情報は、ユーザの端末の電話番号であることとしてもよい。
上記通信システムにおいて、音声サービスサーバは、情報処理端末に対して、登録を行ったユーザに対応付けられた音声情報にアクセスするアクセス権を発行する発行部を備え、第2送信部は、アクセス権を情報処理端末に送信し、第1受信部は、アクセス権を受信し、情報処理端末は、アクセス権を、音声サービスサーバを利用するためのアプリケーションに付与することとしてもよい。
上記通信システムにおいて、入力部は、複数のユーザの端末の連絡先の入力を受け付け、第3送信部は、複数のユーザの端末の連絡先を情報処理端末に送信し、第1受信部は、複数のユーザの端末の連絡先を受信し、第1送信部は、複数のユーザの端末の連絡先を音声サービスサーバに送信し、登録部は、対応情報において、ユーザを示す識別情報に対応付けて、複数のユーザの端末の連絡先を登録し、音声サービスサーバは、ユーザに対応付けて、新たな音声が記憶されると、当該ユーザに対応付けられた1以上のユーザの連絡先に対して、音声が記憶されたことを示す情報を通知する通知部を備えることとしてもよい。
本発明の一態様に係る通信システムにおいては、ユーザの端末以外に、情報処理端末も、音声サービスサーバに登録された音声を報知することができる。
通信システムの構成例を示す図である。 音声サービスサーバの構成例を示すブロック図である。 情報処理端末の構成例を示すブロック図である。 携帯端末の構成例を示すブロック図である。 ユーザ音声情報の構成例を示すデータ概念図である。 通信システムにおけるユーザ登録時のやり取りを示すシーケンス図である。 通信システムにおいて、音声が登録される際のやり取りを示すシーケンス図である。 音声サービスサーバのユーザ登録を行う際の動作を示すフローチャートである。 音声サービスサーバの、音声が登録された際の動作を示すフローチャートである。 情報処理装置の動作を示すフローチャートである。
<実施形態>
本発明の一実施形態について、図面を参照しながら説明する。
本発明に係る音声サービスサーバ100は、図1に示すように、音声サービスサーバ100と、情報処理端末200とを含み、ネットワーク300を介して互いに通信可能に接続されている。また、音声サービスサーバ100には、音声サービスサーバ100が提供するサービスを利用するユーザ10a、10b、10cを含んでよく、それぞれのユーザは自身の携帯端末400a、400b、400cを保持している。各携帯端末400a、400b、400cは、音声サービスサーバ100及び情報処理端末200と、ネットワーク300を介して、もしくは、ネットワーク300を介さず直接に、通信可能に接続されている。
従来の通信システムにおいては、一人のユーザに対して録音されたメッセージは、その一人のユーザのみが自身の携帯端末を用いてしか聞くことができなかった。これは、ユーザの携帯端末に紐づけられた電話番号を認証用の情報として用いているためである。これに対して、本実施の形態においては、その一人のユーザ以外のユーザでも録音されたメッセージを聴くことができる。
本実施の形態に係る通信システム1によれば、あるユーザ10a(例えば、父親)が、何らかの災害に巻き込まれたとする。このような場合に、何らかの連絡を知り合いのユーザ10b(例えば、母親)に対して、自身の無事を伝えるべくメッセージを残すことが考えられる。例えば、図1においては、ユーザ10aが、自身の携帯端末400aから、ユーザ10bに対して、「ママへ 無事です。○○体育館に避難しています。」というメッセージを残したとする。当該メッセージは、例えば、メッセージを管理する音声サービスサーバ100に記録される。
すると、音声サービスサーバ100からユーザ10bの携帯端末400bに対して、録音がある旨を通知する。この通知を受けて、ユーザ10bは、自身の携帯端末400bを用いて、音声サービスサーバ100にアクセスして、録音されている音声メッセージを聴くことができる。
一方で、音声サービスサーバ100は、ユーザ10cの携帯端末400cに対しても、ユーザ10bに対する録音がある旨を通知する。この通知を受けて、ユーザ10bは、情報処理端末200に音声の内容の教示を依頼する。例えば、図1に示すように、ユーザ10cがユーザ10bの子供である場合に、「ママの録音教えて?」と音声による指示を出す。すると、情報処理端末200は、その内容をネットワーク300を介して、音声サービスサーバ100に対して送信する。すると、音声サービスサーバ100は、ユーザ10bに対して登録されている録音を特定し、情報処理端末200に送信する。
すると、情報処理端末200は、受信した録音の音声を再生する。これによって、ユーザ10bではないユーザ10cであっても、ユーザ10bに対してなされた録音の内容を聴くことができる。これによって、ユーザ10cもユーザ10aの状態を認識することができるようになる。
以下、このような処理を実現するための通信システム1の構成について詳細に説明する。
(システム構成)
図1に示すように、通信システム1は、音声サービスサーバ100と情報処理端末200とを含む。音声サービスサーバ100は、情報処理端末200と、ネットワーク300を介して互いに通信可能に接続されている。また、通信システム1において、各ユーザの携帯端末400a、400b、400cもネットワーク300に接続可能であり、音声サービスサーバ100と通信可能に接続されている。
音声サービスサーバ100は、ユーザ毎に、当該ユーザに対して依頼された録音音声を記録し、要求があった場合に、その録音音声を送信するサービスを行う機能を有するサーバ装置である。音声サービスサーバ100は、例えば、PC、コンピュータシステム、サーバ装置などにより実現することができるが、これらに限定するものではない。
情報処理端末200は、ユーザに対して音声による報知ができるものであれば、どのようなものあってもよく、例えば、スマートスピーカー、AIスピーカー等により実現することができるが、これらに限定するものではない。
携帯端末400(400a、400b、400c)は、ユーザが保有する端末装置であり、例えば、携帯電話機、スマートフォン等により実現することができるが、音声サービスサーバ100と通信ができれば、他の装置であってもよく、例えば、PC、タブレット端末などであってもよい。
ネットワーク300は、音声サービスサーバ100と各種の機器との間を相互に接続させるためのネットワークであり、例えば、無線ネットワークや有線ネットワークである。具体的には、ネットワーク300は、ワイヤレスLAN(wireless LAN:WLAN)や広域ネットワーク(wide area network:WAN)、ISDNs(integrated service digital networks)、無線LANs、LTE(long term evolution)、LTE−Advanced、第4世代(4G)、第5世代(5G)、CDMA(code division multiple access)、WCDMA(登録商標)、イーサネット(登録商標)などである。
また、ネットワーク300は、これらの例に限られず、例えば、公衆交換電話網(Public Switched Telephone Network:PSTN)やブルートゥース(Bluetooth(登録商標))、ブルートゥースローエナジー(Bluetooth Low Energy)、光回線、ADSL(Asymmetric Digital Subscriber Line)回線、衛星通信網などであってもよく、どのようなネットワークであってもよい。ネットワーク300は、ユーザの住居に備えられる場合には、ホームネットワークと呼称されることもある。
また、ネットワーク300は、例えば、NB−IoT(Narrow Band IoT)や、eMTC(enhanced Machine Type Communication)であってもよい。なお、NB−IoTやeMTCは、IoT向けの無線通信方式であり、低コスト、低消費電力で長距離通信が可能なネットワークである。
また、ネットワーク300は、これらの組み合わせであってもよい。また、ネットワーク300は、これらの例を組み合わせた複数の異なるネットワークを含むものであってもよい。例えば、ネットワーク300は、LTEによる無線ネットワークと、閉域網であるイントラネットなどの有線ネットワークとを含むものであってもよい。
(音声サービスサーバ100の構成例)
図2は、音声サービスサーバ100の構成例を示すブロック図である。図2に示すように、音声サービスサーバ100は、例えば、受信部110と、記憶部120と、制御部130と、送信部140と、を備える。
受信部110は、ネットワーク300を介して、各種の情報処理装置(携帯端末400)から音声情報を受信したり、ユーザの携帯端末400から音声の配信を情報処理端末200に対して設定するための要求を受け付けたりする通信インターフェースである。受信部110は、録音音声の登録要求に係る情報や、音声の配信を情報処理端末200に対して設定するための要求情報を受信すると、制御部130に伝達する。
記憶部120は、音声サービスサーバ100が動作するうえで必要とする各種プログラムや各種データを記憶する機能を有する。記憶部120は、例えば、HDD、SSD、フラッシュメモリなど各種の記憶媒体により実現される。なお、音声サービスサーバ100は、プログラムを記憶部120に記憶し、当該プログラムを実行して、制御部130が、当該制御部130に含まれる各部としての処理を実行してもよい。当該プログラムは、音声サービスサーバ100に、制御部130が実行する各機能を実現させる。記憶部120は、録音音声の登録要求を受け付けて、その録音音声を、対応するユーザに対応付けて記憶するプログラムや、ユーザから登録されている録音音声の配信要求を受けて、配信するプログラムや、録音音声の配信先として情報処理端末200を登録するためのプログラムを記憶している。記憶部120は、ユーザ音声情報121を記憶している。ユーザ音声情報121の詳細については後述する。また、記憶部120は、ユーザ音声情報121とは別に、ユーザIDと電話番号とを対応付けた情報を保持している。
制御部130は、音声サービスサーバ100の各部を制御するものであり、例えば、中央処理装置(CPU)やマイクロプロセッサ、ASIC、FPGAなどであってもよい。なお、制御部130は、これらの例に限られず、どのようなものであってもよい。
制御部130は、ユーザ登録部131と、音声登録部132と、特定部133と、抽出部134と、音声配信部135とを備える。
ユーザ登録部131は、ユーザ登録を行う機能を有する。ここでいうユーザ登録とは、どのユーザに対して成された録音を登録するのか、その録音を聴くことができるユーザ(機器)が誰であるかを、ユーザの携帯端末400と通信することによる登録する。また、ユーザ登録部131は、その際に、ユーザ本人の携帯端末400以外の機器でもその録音を聴くことができるようにするために、当該携帯端末400以外の機器の認証処理も実行する。
音声登録部132は、ユーザの携帯端末400から、ユーザに対する音声の登録の要求を受け付けて、当該ユーザに対応付けて、録音音声を、記憶部120のユーザ音声情報121に記憶する。
特定部133は、音声入力を送信した情報処理端末200に対応付けられているユーザであって、音声入力により特定されるユーザを、ユーザ音声情報121を参照して特定する機能を有する。ここで、音声入力を送信した情報処理端末200とは、ユーザから音声による指示を受け付けた場合に、その指示の内容を送信した情報処理端末200のことをいう。なお、情報処理端末200は、音声サービスサーバ100に対して直接音声入力を送信してもよいし、他の装置(例えば、音声を解析する装置)を介しても送信することとしてもよい。
抽出部134は、特定部133が特定したユーザに対応付けられている録音音声を、記憶部120(ユーザ音声情報121)から抽出する機能を有する。
音声配信部135は、抽出部134が抽出した音声を、音声入力を送信した情報処理端末に対して、送信部140に配信する(送信する)よう指示する機能を有する。
送信部140は、制御部130(音声配信部135)からの指示に従って、情報処理端末200に録音音声を送信する機能を有する通信インターフェースである。
以上が、音声サービスサーバ100の構成例である。
(情報処理端末200の構成例)
図3は、情報処理端末200の構成例を示すブロック図である。情報処理端末200は、受信部210と、記憶部220と、スピーカー230と、マイク240と、送信部250と、を備える。
受信部110は、音声サービスサーバ100から、音声情報を、ネットワーク300を介して受信する機能を有する通信インターフェースである。受信部110は、受信した音声情報を、記憶部220又はスピーカー230に伝達する。
記憶部220は、情報処理端末200が動作上必要とする各種プログラム、データを記憶する機能を有する。記憶部220は、例えば、例えば、HDD、SSD、フラッシュメモリなど各種の記憶媒体により実現される。記憶部220は、例えば、音声サービスサーバ100から配信された音声情報を記憶する。
スピーカー230は、音声サービスサーバ100から送信された音声情報に基づく音声を報知する。
マイク240は、周囲の音、ユーザが発した音声を集音するマイクである。マイク240は、集音した音を、デジタル信号に変換して、送信部250に、音声サービスサーバ100に送信するように指示する。
送信部250は、マイク240から伝達された音声を示すデジタル信号を、ネットワーク300を介して、音声サービスサーバ100に送信する機能を有する通信インターフェースである。
以上が、情報処理端末200の構成の説明である。
(携帯端末400(400a、400b、400c)の構成例)
図4は、携帯端末400の構成例を示すブロック図である。携帯端末400は、受信部410と、記憶部420と、入力部430と、出力部440と、送信部450と、制御部460とを備える。
受信部410は、音声サービスサーバ100を含む他の装置から、ネットワーク300を介して情報を受信する機能を有する通信インターフェースである。受信部110は、受信した情報を、制御部460に伝達する。
記憶部420は、携帯端末400が動作上必要とする各種プログラム、データを記憶する機能を有する。記憶部220は、例えば、HDD、SSD、フラッシュメモリなど各種の記憶媒体により実現される。
入力部430は、ユーザからの入力を受け付ける機能を有する。入力部320は、例えば、タッチパネルにより実現することができるが、タッチパネルに限定するものではない。入力部430は、ユーザから受け付けた入力内容を制御部460に伝達する。入力部430は、音声による入力を受け付けるものであってもよく、その場合、入力部430は、マイクロフォンにより実現することができる。
出力部440は、制御部460からの指示にしたがって、情報を出力する機能を有する。出力部440は、例えば、モニターやスピーカー等により実現することができる。出力部440は、モニターである場合には、文字や画像により、情報を出力し、スピーカーである場合には、音声により情報を出力することができる。出力部440は、例えば、音声サービスサーバ100から伝達された音声情報に基づく音声を出力することができる。
送信部450は、制御部460からの指示にしたがって、指定された情報を、指定先の機器等に、送信する機能を有する通信インターフェースである。送信部450は、例えば、音声サービスサーバ100にユーザ登録(情報処理端末200の登録)をする際に、認証情報を送信する。当該認証情報は、ユーザから受け付けた認証用の情報としての携帯端末400の電話番号を含み、その他に、通信システム1上での携帯端末400を保持するユーザのユーザIDや、当該ユーザに対する録音があった場合に、その録音があったことを通知する関連連絡先の情報も含まれてよい。
制御部460は、携帯端末400の各部を制御するものであり、例えば、中央処理装置(CPU)やマイクロプロセッサ、ASIC、FPGAなどであってもよい。なお、制御部460は、これらの例に限られず、どのようなものであってもよい。制御部460は、入力部430から入力されたユーザの指示に従って、指示内容に沿った処理を実行する。また、制御部460は、受信部410から伝達された情報の処理を実行する。
以上が、携帯端末400の構成の説明である。
(ユーザ音声情報121の構成例)
図5は、音声サービスサーバ100の記憶部120に記憶されているユーザ音声情報121の構成例を示すデータ概念図である。図5に示すように、ユーザ音声情報121は、ユーザID501と、電話番号502と、関連連絡先503と、機器ID504と、音声メッセージ505とが対応付けられた情報である。
ユーザID501は、通信システム1を利用する各ユーザを、音声サービスサーバ100が認識するための識別情報である。
電話番号502は、対応するユーザID501が示すユーザが保持する携帯端末400の電話番号を示す情報である。
関連連絡先503は、対応するユーザID501に対して音声メッセージ505が登録された場合に、音声メッセージが登録された旨を通知する連絡先を示す情報である。関連連絡先503には、例えば、電話番号やメールアドレスが登録される。音声メッセージが登録された旨の通知は、音声、メールのいずれで実行されてもよい。なお、電話番号が登録されている場合であってメールにより通知を行う場合、電話番号を利用したショートメッセージサービスにより通知を行うことができる。また、メールアドレスが登録されている場合であって音声により通知を行う場合、VOIP(Voice Over Internet Protocol)通信により通知を行うことができる。
機器ID504は、音声メッセージ505で示される音声の送信先として、ユーザID501で示されるユーザの携帯端末400以外の機器を指定する場合の機器を一意に特定可能な識別情報である。機器ID504には、ここでは、情報処理端末200のID(もしくは、情報処理端末200に対して付与したアクセストークンの情報)が登録される。
音声メッセージ505は、ユーザID501に対して、他のユーザが残した録音の音声を示す情報である。これは、音声のデジタルデータそのものであってもよいし、当該デジタルデータを示す識別情報であってもよい。
ユーザ音声情報121があることにより、音声サービスサーバ100は、録音の配信先として、ユーザの携帯端末400以外の機器への配信も可能となる。
(通信システム1の動作)
図6は、通信システム1において、ユーザ登録をする際の、各装置間のやり取りの様子を示すシーケンス図である。ここでいうユーザ登録は、情報処理端末200に対する録音音声の配信を可能とするための登録であり、言い換えれば、情報処理端末200の登録処理であるともいえる。
図6に示すように、ユーザは、自身の携帯端末400から、認証ページへのアクセス要求を情報処理端末200に送信する(ステップS601)。
情報処理端末200は、アクセス要求を受信すると、そのアクセス要求を音声サービスサーバ100に送信する(ステップS602)。
音声サービスサーバ100は、情報処理端末200を経由して、携帯端末400からの認証ページへのアクセス要求を受信すると、認証ページの情報を、携帯端末400に送信する(ステップS603)。
携帯端末400は、認証ページの情報を受信すると、当該情報を表示する。ユーザは、認証ページの内容を確認して、必要となる各種の情報を入力する。当該情報には、ユーザ自身の携帯端末400の電話番号が含まれる。なお、携帯端末400は、この認証を行う際には、自動で必要な情報が、音声サービスサーバ100に送信されるように構成して、ユーザによる入力の手間を省くこととしてもよい。携帯端末400は、入力された認証情報を、音声サービスサーバ100に送信する(ステップS604)。
音声サービスサーバ100は、認証情報を受け付けて認証を実行し、アクセストークンを発行する(ステップS605)。アクセストークンは、音声サービスサーバ100へのアクセス許可を与えるものであり、保持していることにより、音声サービスサーバ100が提供するサービスを享受することができる権利であるということができる。音声サービスサーバ100は、発行したアクセストークンを、携帯端末400からのアクセス要求を中継した情報処理端末200に対して送信する(ステップS606)。
情報処理端末200は、アクセストークンを受信すると、これを記憶する(ステップS607)。これにより、以降、情報処理端末200は、携帯端末400のユーザに対して成された録音の情報を、音声サービスサーバ100から取得して報知することができるようになる。
次に、音声サービスサーバ100に音声が登録された場合の通信システム1の動作を説明する。図7は、通信システム1において、音声が登録された際の、各装置間のやり取りの様子を示すシーケンス図である。図7においては、図1に示したように、ユーザ10aがユーザ10bに対して録音の伝言をする場合の例を示している。
図7に示すように、携帯端末400aは、ユーザ10aからの入力を受け付けて、ユーザ10bに対するストレージに録音音声を登録する。即ち、携帯端末400aは、ユーザから受け付けた音声を、音声サービスサーバ100にユーザ10bに対応付けて記憶する要求と共に送信する(ステップS701)。
当該要求を受け付けた音声サービスサーバ100は、ユーザ10bに対する音声として、ユーザ音声情報121に登録する。そして、音声サービスサーバ100はその際に、対応する関連連絡先を特定する(ステップS702)。
関連連絡先を特定すると、その1以上の関連連絡先に宛てて、音声サービスサーバ100は、音声が登録されたことを通知する(ステップS703)。ここでは、関連連絡先として、携帯端末400a、400b、400cとが登録されていたとする。したがって、音声サービスサーバ100は、音声の登録がされたことを、携帯端末400a、400b、400cに通知する。
この通知を受信すると、携帯端末400bや携帯端末400cのユーザ10bやユーザ10cは、ユーザ10bに対する録音があることを認識する。このとき、ユーザ10bは自身の携帯端末400bから音声サービスサーバ100にアクセスして録音音声を聴くことができる。一方、ユーザ10cは自身の携帯端末400cからでは、ユーザ10bに対する録音音声を聴くことはできない。
そこで、ユーザ10cは、情報処理端末200に対して、音声でユーザ10bに対する録音音声の再生を指示し、情報処理端末200は、当該音声入力を受け付ける(ステップS704)。すると、情報処理端末200は、ユーザ10bの録音音声の要求を、記憶しているアクセストークンとともに、音声サービスサーバ100に送信する(ステップS705)。
音声サービスサーバ100は、当該要求を受け付けて、ユーザ10bに対する録音音声を再生する権限であるアクセストークンが付与されていることを確認して、情報処理端末200に対して、ユーザ10bに対して録音されている録音音声を、送信する(ステップS706)。
情報処理端末200は、録音音声を受信すると、その録音音声を再生(出力)する(ステップS707)。これにより、ユーザ10bに関係の近い他のユーザも情報処理端末200を介して、ユーザ10bに対するメッセージを聴くことができる。したがって、例えば、ユーザ10bと近しい、ユーザ10aからのメッセージを、同様にユーザ10bと近しい、ユーザ10cも聞くことができる。
(音声サービスサーバ100の動作例)
図8は、図6における動作を実現するための音声サービスサーバ100の動作例を示すフローチャートである。図8は、音声サービスサーバ100において、情報処理端末200が、あるユーザに対してされた録音音声の再生を可能とするようにするための処理を示している。図8に示す処理は、音声サービスサーバ100が、情報処理端末200または携帯端末400から信号を受信した際の動作である。
図8に示すように、音声サービスサーバ100のユーザ登録部131は、情報処理端末200を介して、携帯端末400からの認証ページへのアクセス要求を受信したか否かを判定する(ステップS801)。認証ページへのアクセス要求を受信していない場合には(ステップS801のNO)、ステップS803の処理に移行する。
認証ページへのアクセス要求を受信していた場合には(ステップS801のYES)、ユーザ登録部131は、送信部140に、認証ページの情報を、携帯端末400に送信し(ステップS802)、処理を終了する。
一方で、音声サービスサーバ100のユーザ登録部131は、携帯端末400から、認証情報を受け付けたか否かを判定する(ステップS803)。
認証情報を受け付けていた場合に(ステップS803のYES)、ユーザ登録部131は、受信した認証情報に含まれる情報に基づいて認証を実行する。具体的には、認証情報に含まれるユーザIDと電話番号の情報とが、予め記憶部120に記憶されている情報と同一であるかどうかに基づいて認証を行う。そして、ユーザ登録部131は、認証に成功するとアクセストークンを発行する(ステップS804)。その後に、ユーザ登録部131は、発行したアクセストークンを、認証ページへのアクセス要求を送信した情報処理端末200に送信する(ステップS805)。
また、ユーザ登録部131は、認証情報で示されるユーザIDと、電話番号と、関連連絡先を、ユーザ音声情報121に追加登録することで更新し(ステップS806)、処理を終了する。なお、認証情報を受け付けていない場合には(ステップS803のNO)、処理を終了する。
これにより、音声サービスサーバ100は、ユーザIDに対応するユーザの携帯端末400以外に、情報処理端末200に対しても録音音声を送信することができる。これにより、ユーザIDに対応するユーザ以外でも、録音音声を聴くことができる。
図9は、図7に示すやり取りを実現するための音声サービスサーバ100の動作を示すフローチャートである。
音声サービスサーバ100は、ユーザの携帯端末400等から、音声の録音の依頼があるとする。当該依頼を受けて、音声サービスサーバ100の音声登録部132は、送信されてきた音声を、ユーザの携帯端末400から指定されたユーザに対応付けて、ユーザ音声情報121に登録する。
音声サービスサーバ100の制御部130は、新たな録音音声の登録があるか否かを判定する(ステップS901)。特定部133は、新たな録音音声があると判定した場合に(ステップS901のYES)、その録音音声が登録された音声メッセージ505に対応するユーザ音声情報121のユーザID501を特定する(ステップS902)。
特定部133は、特定したユーザID501に対応する関連連絡先503を特定する(ステップS903)。そして、特定部133は、特定した関連連絡先に対して、ステップS902において特定したユーザに対する録音がある旨を通知するよう、送信部140に指示する。送信部140は、当該指示に基づき、指定された各関連連絡先503を宛先とした、録音がある旨を示すメッセージを送信する(ステップS904)。
一方、新たな録音音声の登録がない場合(ステップS901のNO)であって、録音音声の送信依頼を受け付けているか否かを判定する(ステップS905)。当該送信依頼には、どのユーザの録音音声を要求しているのかを示す情報を含む。録音音声の送信依頼を受け付けている場合には(ステップS905のYES)、音声配信部135は、録音音声を要求してきた機器がユーザ自身の携帯端末400である場合には、その電話番号がサービス上で登録されている電話番号と一致している場合に、録音音声を送信する(ステップS906)。また、録音音声の要求を送信する機器が情報処理端末200である場合に、録音音声を要求する音声を解析して、当該要求とともに送信されてきたアクセストークンが、音声サービスサーバ100が付与したアクセストークンである場合に、指定されているユーザに対して登録されている録音音声を、情報処理端末200に送信する(ステップS906)。なお、録音音声の送信依頼を受けて付けていない場合には(ステップS905のNO)、ステップS901の処理に戻る。
これにより、情報処理端末200も音声サービスサーバ100が保持するユーザの録音音声を取得して報知することができる。
図10は、情報処理端末200の動作を示すフローチャートである。情報処理端末200のマイク240がユーザからの音声指示を受け付けたか否かを判定する(ステップS1001)。これは、例えば、マイク240が集音した音声の中に、人間の音声の周波数領域の音が含まれているか否かによって行うことができる。
ユーザからの音声指示があった場合に(ステップS1001のYES)、送信部250は、音声指示内容を音声サービスサーバ100に送信する(ステップS1002)。
一方、ユーザからの音声指示がない場合であって(ステップS1001のNO)、ステップS1003の処理に進む。録音音声を受信部210が受信しているときには(ステップS1003のYES)、スピーカー230は、受信した録音音声に基づく音声を報知する(ステップS1004)。録音音声を受信していない場合には(ステップS1003のNO)、ステップS1001に戻る。
これにより、情報処理端末200が、録音音声を報知することができる。
(補足)
上記実施形態に係る装置は、上記実施形態に限定されるものではなく、他の手法により実現されてもよいことは言うまでもない。以下、各種変形例について説明する。
(1)上記実施形態においては、音声サービスサーバ100は、関連連絡先503は、認証情報に含まれる情報に基づいて登録することとしているが、関連連絡先503の登録は別途行うこととしてもよい。
(2)上記実施の形態においては、情報処理端末200から音声サービスサーバ100から直接、録音音声の送信要求を送信する態様としているが、これはその限りではない。情報処理端末200は、ユーザの音声入力が有った場合に、音声認識をする認識サーバに一端その音声を送信し、その音声の内容が録音音声を要求するものであると解析された場合に、当該認識サーバから音声サービスサーバ100に、録音音声を要求する情報を送信するように構成してもよい。
(3)上記実施の形態においては、情報処理端末200の一実現例としてスマートスピーカー(AIスピーカー)を例に説明したが、これはその限りではない。ユーザの音声を集音する機能、音声を出力する機能が搭載され、通信機能を有している機器であればどのような機器であってもよく、例えば、ロボットなどであってもよい。
(4)本開示の各実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。記憶媒体は、HDDやSDDなどの任意の適切な記憶媒体、またはこれらの2つ以上の適切な組合せを含むことができる。記憶媒体は、揮発性、不揮発性、または揮発性と不揮発性の組合せでよい。なお、記憶媒体はこれらの例に限られず、プログラムを記憶可能であれば、どのようなデバイスまたは媒体であってもよい。
なお、音声サービスサーバ100は、例えば、記憶媒体に記憶されたプログラムを読み出し、読み出したプログラムを実行することによって、各実施形態に示す複数の機能部の機能を実現することができる。また、当該プログラムは、任意の伝送媒体(通信ネットワークや放送波等)を介して、音声サービスサーバ100に提供されてもよい。音声サービスサーバ100は、例えば、インターネット等を介してダウンロードしたプログラムを実行することにより、各実施形態に示す複数の機能部の機能を実現する。
なお、当該プログラムは、例えば、ActionScript、JavaScript(登録商標)などのスクリプト言語、Objective―C、Java(登録商標)などのオブジェクト指向プログラミング言語、HTML5などのマークアップ言語などを用いて実装できる。
音声サービスサーバ100における処理の少なくとも一部は、1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。また、音声サービスサーバ100の各機能部は、上記実施形態に示した機能を実現する1または複数の回路によって実現されてもよく、1の回路により複数の機能部の機能が実現されることとしてもよい。
(5)本開示の実施形態を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本開示の範囲に含まれることに留意されたい。例えば、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。また、各実施形態に示す構成を適宜組み合わせることとしてもよい。
1 通信システム
100 音声サービスサーバ
110 受信部
120 記憶部
121 ユーザ音声情報
130 制御部
131 ユーザ登録部
132 音声登録部
133 特定部
134 抽出部
135 音声配信部
140 送信部
200 情報処理装置(スマートスピーカー)
210 受信部
220 記憶部
230 スピーカー
240 マイク
250 送信部
400、400a、400b、400c 携帯端末
410 受信部
420 記憶部
430 入力部
440 出力部
450 送信部
460 制御部

Claims (6)

  1. 録音されている音声の再生を要求する音声入力を受け付ける音声入力受付部と、
    前記音声入力受付部を介して受け付けた前記音声入力に基づく指示を、ユーザの電話番号を認証情報として、登録されている音声をユーザの端末に送信する音声サービスを実行する音声サービスサーバに送信する第1送信部と、
    前記音声サービスサーバから音声情報を受信する第1受信部と、
    前記第1受信部が受信した音声情報を出力する出力部と、を備える情報処理端末と、
    前記音声入力に基づく指示を受信する第2受信部と、
    情報処理端末を示す識別情報と、当該情報処理端末に対応付けられているユーザを示すユーザ情報とが対応付けられた対応情報と、ユーザ毎に対応付けて録音された音声情報を記憶する記憶部と、
    前記対応情報を参照して、前記第2受信部が受信した音声入力に基づく指示を送信した情報処理端末に対応付けられているユーザを特定する特定部と、
    前記特定したユーザに対応付けられた音声情報を前記記憶部から抽出する抽出部と、
    前記抽出部が抽出した音声情報を前記情報処理端末に送信する第2送信部と、を備える音声サービスサーバと、
    を備える通信システム。
  2. 前記情報処理端末は、
    前記ユーザの端末から、前記音声サービスサーバへのアクセス要求を受け付けるアクセス要求受付部を更に備え、
    前記第1送信部は、前記アクセス要求を前記音声サービスサーバに送信し、
    前記第2受信部は、前記アクセス要求を受信し、
    前記第2送信部は、前記音声サービスサーバは、前記アクセス要求に基づいて認証情報の入力を要求する要求フォームを送信し、
    前記第1受信部は、前記要求フォームを受信し、
    前記第1送信部は、前記要求フォームを前記ユーザの端末に送信し、
    前記ユーザの端末は、
    前記アクセス要求を前記ユーザから受け付ける入力部と、
    前記アクセス要求を前記情報処理端末に送信する第3送信部と、
    前記要求フォームを受信する第3受信部と、
    前記要求フォームに対して前記入力部を介して前記ユーザから認証情報を受け付け、
    前記第3送信部は、前記認証情報を前記情報処理端末に送信し、
    前記第1受信部は、前記認証情報を受信し、
    前記第1送信部は、前記認証情報を、前記音声サービスサーバに送信し、
    前記第2受信部は、前記認証情報を受信し、
    前記音声サービスサーバは、
    前記音声サービスサーバは、前記ユーザを示す識別情報と、前記情報処理端末とを、対応付けて前記対応情報に登録する登録部を備える
    ことを特徴とする請求項1に記載の通信システム。
  3. 前記認証情報は、前記ユーザの端末の電話番号である
    ことを特徴とする請求項2に記載の通信システム。
  4. 前記音声サービスサーバは、
    前記情報処理端末に対して、前記登録を行ったユーザに対応付けられた音声情報にアクセスするアクセス権を発行する発行部を備え、
    前記第2送信部は、前記アクセス権を前記情報処理端末に送信し、
    前記第1受信部は、前記アクセス権を受信し、
    前記情報処理端末は、前記アクセス権を、前記音声サービスサーバを利用するためのアプリケーションに付与する
    ことを特徴とする請求項2に記載の通信システム。
  5. 前記入力部は、複数のユーザの端末の連絡先の入力を受け付け、
    前記第3送信部は、前記複数のユーザの端末の連絡先を前記情報処理端末に送信し、
    前記第1受信部は、前記複数のユーザの端末の連絡先を受信し、
    前記第1送信部は、前記複数のユーザの端末の連絡先を前記音声サービスサーバに送信し、
    前記登録部は、前記対応情報において、前記ユーザを示す識別情報に対応付けて、前記複数のユーザの端末の連絡先を登録し、
    前記音声サービスサーバは、
    前記ユーザに対応付けて、新たな音声が記憶されると、当該ユーザに対応付けられた1以上のユーザの連絡先に対して、音声が記憶されたことを示す情報を通知する通知部を備える
    ことを特徴とする請求項2〜4のいずれか一項に記載の通信システム。
  6. 情報処理端末と、登録されている音声をユーザの端末に送信する音声サービスを実行する音声サービスサーバとを含む通信システムにおける音声配信方法であって、前記音声サービスサーバは、情報処理端末を示す識別情報と、当該情報処理端末に対応付けられているユーザを示すユーザ情報とが対応付けられた対応情報と、ユーザ毎に対応付けて録音された音声情報を記憶する記憶部を備え、
    前記情報処理端末が、録音されている音声の再生を要求する音声入力を受け付ける音声入力受付ステップと、
    前記情報処理端末が、前記音声入力受付ステップにおいて受け付けた前記音声入力に基づく指示を、ユーザの電話番号を認証情報として、前記音声サービスサーバに送信する第1送信ステップと、
    前記音声サービスサーバが、前記音声入力に基づく指示を受信する第1受信ステップと、
    前記音声サービスサーバが、前記対応情報を参照して、前記第1受信ステップが受信した音声入力に基づく指示を送信した情報処理端末に対応付けられているユーザを特定する特定ステップと、
    前記音声サービスサーバが、前記特定したユーザに対応付けられた音声情報を前記記憶部から抽出する抽出ステップと、
    前記音声サービスサーバが、前記抽出ステップにおいて抽出した音声情報を前記情報処理端末に送信する第2送信ステップと、
    前記情報処理端末が、前記音声サービスサーバから音声情報を受信する第2受信ステップと、
    前記情報処理端末が、前記第2受信ステップが受信した音声情報を出力する出力ステップと、を含む音声配信方法。
JP2018152775A 2018-08-14 2018-08-14 通信システム及び音声配信方法 Active JP6830933B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018152775A JP6830933B2 (ja) 2018-08-14 2018-08-14 通信システム及び音声配信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018152775A JP6830933B2 (ja) 2018-08-14 2018-08-14 通信システム及び音声配信方法

Publications (2)

Publication Number Publication Date
JP2020028061A JP2020028061A (ja) 2020-02-20
JP6830933B2 true JP6830933B2 (ja) 2021-02-17

Family

ID=69620402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018152775A Active JP6830933B2 (ja) 2018-08-14 2018-08-14 通信システム及び音声配信方法

Country Status (1)

Country Link
JP (1) JP6830933B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0832618A (ja) * 1994-07-14 1996-02-02 Hitachi Ltd 音声メールシステムおよび音声メール交換装置
CA2545434A1 (en) * 2003-08-26 2005-03-03 Hang-Jei Cho Method of proving service for telephone call recording and system thereof
JP2009027560A (ja) * 2007-07-20 2009-02-05 Nippon Telegr & Teleph Corp <Ntt> 伝言サーバ装置とその動作方法、及びこの伝言サーバ装置で使用されるプログラムとその記録媒体
US9641954B1 (en) * 2012-08-03 2017-05-02 Amazon Technologies, Inc. Phone communication via a voice-controlled device
JP6161213B2 (ja) * 2015-03-18 2017-07-12 ソフトバンク株式会社 音声通知システム、音声管理サーバ、及び端末管理サーバ

Also Published As

Publication number Publication date
JP2020028061A (ja) 2020-02-20

Similar Documents

Publication Publication Date Title
JP7353497B2 (ja) 能動的に対話の開始を提起するためのサーバ側処理方法及びサーバ、並びに能動的に対話の開始が提起できる音声インタラクションシステム
US9444565B1 (en) Wireless audio communications device, system and method
CN107911361B (zh) 支持多会话的语音管理方法、装置、终端设备及存储介质
US20200084173A1 (en) Method and system of operating a social networking application via an external device
TW201427457A (zh) 資訊共用方法、終端、伺服器及系統
US9219807B1 (en) Wireless audio communications device, system and method
WO2020244317A1 (zh) 会议控制的实现方法、装置和服务器
US11258733B2 (en) Transcription bot for group communications
EP3665910B1 (en) Online automatic audio transcription for hearing aid users
CN103731339B (zh) 数字生活网络联盟***及***中在线多媒体资源共享方法
CN111147789A (zh) 一种音视频流录制的方法、装置、设备以及存储介质
WO2016155363A1 (zh) 多媒体文件播放器的播放列表的维护方法及装置
JP6830933B2 (ja) 通信システム及び音声配信方法
CN103188393B (zh) 远程辅助家庭通信终端和***
JP6407461B1 (ja) 信号処理装置、通信システム、信号処理装置で実施される方法、及び信号処理装置で実行されるプログラム
JP2020052794A (ja) 情報処理システム
WO2020044084A1 (zh) 近场数据迁移方法及其装置
CN104754400B (zh) 一种基于移动终端的封套信息共享方法及装置
CN112910829B (zh) 一种音频共享方法、装置及***
JP2017204856A (ja) VoIP通話サービスでリングバックトーンを利用するためのコンピュータプログラムおよび通話方法
CN104301556A (zh) 电话交互方法、装置和***
WO2017078003A1 (ja) コンテンツ再生システム、認証方法、及び媒体
KR101481657B1 (ko) 음원 스트리밍 서버에서 음악 같이 듣기 방법
KR20190054378A (ko) 실시간 경보방송에 대한 녹음 및 청취가 가능한 동보방송 시스템 및 그 제어방법
CN111835920B (zh) 通话处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210127

R150 Certificate of patent or registration of utility model

Ref document number: 6830933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250