JP6917821B2 - 再生装置、プログラムおよび再生方法 - Google Patents

再生装置、プログラムおよび再生方法 Download PDF

Info

Publication number
JP6917821B2
JP6917821B2 JP2017147691A JP2017147691A JP6917821B2 JP 6917821 B2 JP6917821 B2 JP 6917821B2 JP 2017147691 A JP2017147691 A JP 2017147691A JP 2017147691 A JP2017147691 A JP 2017147691A JP 6917821 B2 JP6917821 B2 JP 6917821B2
Authority
JP
Japan
Prior art keywords
content
output destination
output
audio signal
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017147691A
Other languages
English (en)
Other versions
JP2019029828A (ja
Inventor
修弥 和田
修弥 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2017147691A priority Critical patent/JP6917821B2/ja
Publication of JP2019029828A publication Critical patent/JP2019029828A/ja
Application granted granted Critical
Publication of JP6917821B2 publication Critical patent/JP6917821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、再生装置、プログラムおよび再生方法に関する。
特許文献1には、楽曲を表す曲データの内容に応じて、楽曲を出力する装置を切り替える音響システムが開示されている。この音響システムによれば、楽曲の周波数特性に応じた装置で楽曲を出力することができる。
特開2016−82456号公報
ユーザがコンテンツを視聴する場合、コンテンツを視聴する状況は、例えば雑音やユーザの位置、視聴する人数等によって変化する。そして、変化後の状況によっては、それまでに音を出力していた装置では音が聞き取りにくくなるなど、音を出力していた装置がユーザにとって適切な装置でなくなる場合がある。
本発明は、コンテンツを視聴する状況が変化しても、ユーザがコンテンツに応じた適切な視聴を行えるようにすることを目的とする。
本発明は、コンテンツを取得する取得手段と、前記取得手段が取得したコンテンツを再生する再生手段と、自装置の周囲の状況を特定する特定手段と、前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定した状況に基づいて複数の出力先の中から選択する選択手段と、前記選択手段が選択した出力先へ、前記再生手段で再生されたコンテンツの音声を出力する出力手段とを備える再生装置を提供する。
本発明においては、前記特定手段は、自装置の周囲の雑音レベルを特定し、前記選択手段は、前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定した雑音レベルに基づいて選択する構成であってもよい。
また、本発明においては、前記特定手段は、自装置のユーザの位置を特定し、前記選択手段は、前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定した位置に基づいて選択する構成としてもよい。
また、本発明においては、前記特定手段は、自装置の周囲にいる人の数を特定し、前記選択手段は、前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定した数に基づいて選択する構成としてもよい。
また、本発明は、コンピュータを、コンテンツを取得する取得手段と、前記取得手段が取得したコンテンツを再生する再生手段と、自装置の周囲の状況を特定する特定手段と、前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定した状況に基づいて複数の出力先の中から選択する選択手段と、前記選択手段が選択した出力先へ、前記再生手段で再生されたコンテンツの音声を出力する出力手段として機能させるためのプログラムを提供する。
また、本発明は、コンテンツを取得する取得ステップと、前記取得ステップで取得したコンテンツを再生する再生ステップと、自装置の周囲の状況を特定する特定ステップと、前記再生ステップで再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定ステップで特定した状況に基づいて複数の出力先の中から選択する選択ステップと、前記選択ステップで選択した出力先へ、前記再生ステップで再生されたコンテンツの音声を出力する出力ステップとを備える再生方法を提供する。
本発明によれば、コンテンツを視聴する状況が変化しても、ユーザがコンテンツに応じた適切な視聴を行うことができる。
本発明の一実施形態に係る再生システムに含まれる装置を示した図。 コンテンツ再生装置10のハードウェア構成の一例を示した図。 コンテンツ再生装置10において実現する機能を示した機能ブロック図。 コンテンツ再生装置10が行う処理の流れを示したフローチャート。 コンテンツ再生装置10が行う処理の流れを示したフローチャート。
[実施形態]
図1は、本発明の一実施形態に係る再生システム1に含まれる装置を示した図である。コンテンツ再生装置10は、コンテンツを取得し、取得したコンテンツを再生する装置である。コンテンツ再生装置10は、コンテンツを再生し、コンテンツの音声を内部スピーカまたは外部機器で出力する。なお、コンテンツ再生装置10は、本発明の処理を行うコンピュータとして機能してもよい。
外部スピーカ20は、エンクロージャーと一または複数のスピーカユニットを有するスピーカである。外部スピーカ20は、コンテンツ再生装置10に有線で接続されており、コンテンツ再生装置10から供給される音声信号が表す音声を出力する。なお、外部スピーカ20は、音声信号を有線ではなく無線により取得する構成であってもよい。ヘッドフォン40は、コンテンツ再生装置10から無線により出力される音声信号を取得し、取得した音声信号が表す音声を出力する。なお、ヘッドフォン40は、音声信号を無線ではなく有線により取得する構成であってもよい。
(コンテンツ再生装置10の構成)
図2は、コンテンツ再生装置10のハードウェア構成の一例を示した図である。通信部105は、有線および/または無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信部105は、ネットワークを介して音声通信やデータ通信を行う。例えば、通信部105は、インターネットで配信されるラジオ放送のデータを取得する。また、通信部105は、ネットワークを介してアクセス可能なサーバから楽曲や動画などのコンテンツのデータを取得する。これらのデータは、本発明に係るコンテンツの一例である。近距離通信部106は、Bluetooth(登録商標)や無線LANの通信などの近距離無線通信の通信インターフェースとして機能する。近距離通信部106は、本発明に係る出力手段の一例である。出力部103は、音声信号を出力する出力端子を有しており、出力端子にケーブルで接続された外部スピーカ20へ音声信号を出力する。出力部103も、本発明に係る出力手段の一例である。音声処理部107は、マイクロフォンとスピーカ(内蔵スピーカ)を有している。音声処理部107は、供給される音声信号を内蔵スピーカへ出力する。内蔵スピーカは、音声信号が表す音声を出力する。また、音声処理部107は、マイクロフォンが取得した音声をデジタル信号に変換し、このデジタル信号を制御部101へ供給する。
記憶部102は、不揮発性メモリを有しており、制御部101が実行するプログラムを記憶している。また、記憶部102は、通信部105がサーバから取得したコンテンツのデータを記憶する。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。記憶部102は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。記憶部102は、補助記憶装置と呼ばれてもよい。
制御部101は、CPU(Central Processing Unit)およびメモリを有している。コンテンツ再生装置10において実現する機能は、記憶部102に記憶されているプログラム(ソフトウェア)をCPU、メモリなどのハードウェア上に読み込ませることでCPUが演算を行い、出力部103の制御、通信部105の制御、近距離通信部106の制御、音声処理部107の制御、メモリおよび記憶部102におけるデータの読み出しおよび/または書き込みの制御を行うことで実現される。後述の各種処理は、1つのCPUでの実行に限定されるものではなく、2以上のCPUにより同時または逐次に実行されてもよい。CPUは、1以上のチップで実装されてもよい。制御部101は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。メモリは、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリは、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリは、本発明の一実施形態に係る処理を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
図3は、制御部101が記憶部102に記憶されているプログラムを実行することにより実現する機能のうち、本発明に係る機能の構成を示した機能ブロック図である。取得部1001は、コンテンツのデータを記憶部102または通信部105から取得する。再生部1002は、取得部1001が取得したコンテンツを再生する。特定部1003は、音声処理部107のマイクロフォンが収音した音を表すデジタル信号を取得し、取得したデジタル信号を解析してコンテンツ再生装置の周囲の状況を特定する。音声認識部1005は、音声処理部107のマイクロフォンが収音した音を表すデジタル信号を取得し、取得したデジタル信号を解析してユーザの音声を認識する。選択部1004は、コンテンツの音声の出力先を特定部1003が特定した状況と、再生部1002が再生するコンテンツの属性に基づいて選択する。選択部1004は、音声認識部1005が行った音声認識の結果に基づいて、再生部1002が再生するコンテンツの音声が選択した出力先へ出力されるように、出力部、近距離通信部106、音声処理部107を制御する。
(実施形態の動作例)
次に本実施形態の動作の一例について説明する。コンテンツ再生装置10は、マイクロフォンが取得したユーザの音声の音声認識を行う。コンテンツ再生装置10は、認識した音声の内容がコンテンツの再生を指示する内容である場合、再生するコンテンツを問い合わせる音声を内蔵スピーカから出力する。コンテンツ再生装置10は、再生するコンテンツをユーザが音声で指示すると、音声認識を行い、認識したコンテンツを取得する。
例えば、ユーザは、記憶部102に記憶されているコンテンツを再生する場合、再生するコンテンツのタイトル名を音声で発し、インターネットで配信されているラジオ放送を再生する場合、視聴する放送局名を音声で発する。コンテンツ再生装置10(取得部1001)は、記憶部102に記憶されているコンテンツのタイトル名を認識した場合、認識したタイトル名のコンテンツを記憶部102から取得する。また、コンテンツ再生装置10(取得部1001)は、ラジオ放送の放送局名を認識した場合、認識した放送局が配信しているラジオ放送のデータを、通信部105を制御して取得する。
次にコンテンツ再生装置10は、コンテンツの音声の音声信号を出力する前に、音声信号の出力先を選択する処理を行う。図4は、音声信号の出力先を選択する処理の流れを示したフローチャートである。まずコンテンツ再生装置10(特定部1003)は、音声処理部107のマイクロフォンから供給されるデジタル信号を解析し、騒音(ノイズ)のレベルを検知する(ステップSA1)。
次にコンテンツ再生装置10(選択部1004)は、再生するコンテンツの属性を特定する(ステップSA2)。コンテンツ再生装置10は、ラジオ放送の音声を再生する場合、コンテンツの属性がラジオ放送であると特定し、記憶部102から取得した楽曲のコンテンツを再生する場合、コンテンツの属性が楽曲であると特定する。
次にコンテンツ再生装置10(選択部1004)は、コンテンツの音声信号の出力先を選択する(ステップSA3)。ここでコンテンツ再生装置10は、ステップSA1で検知したレベルとステップSA2で特定したコンテンツの属性により出力先を選択する。具体的には、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、検知した騒音のレベルが予め定められた閾値未満である場合、ステップSA3の開始時点で音声信号の出力先として選択されている出力先を、音声信号の出力先とする。例えば、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、検知した騒音のレベルが予め定められた閾値未満であり、ステップSA3の開始時点で音声信号の出力先が外部スピーカ20となっている場合、音声信号の出力先として外部スピーカ20を選択する。また、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、検知した騒音のレベルが予め定められた閾値以上である場合、音声信号の出力先としてヘッドフォン40を選択する。また、コンテンツ再生装置10は、再生するコンテンツの属性がラジオ放送であり、検知した騒音のレベルが予め定められた閾値未満である場合、音声信号の出力先として内蔵スピーカを選択する。また、コンテンツ再生装置10は、再生するコンテンツの属性がラジオ放送であり、検知した騒音のレベルが予め定められた閾値以上である場合、音声信号の出力先としてヘッドフォン40を選択する。コンテンツ再生装置10(選択部1004)は、選択した出力先からコンテンツの音声が出力されるように音声処理部107、近距離通信部106、出力部103を制御する。
次にコンテンツ再生装置10(選択部1004)は、選択した出力先をユーザに通知する(ステップSA4)。コンテンツ再生装置10(再生部1002)は、音声信号の出力先を通知すると、取得したコンテンツを再生する(ステップSA5)。例えば、コンテンツ再生装置10は、音声信号の出力先として選択した出力先が外部スピーカ20である場合、「外部スピーカで音声を出力します」という音声を内蔵スピーカから出力する。次にコンテンツ再生装置10は、コンテンツの再生を開始し、再生したコンテンツの音声を表す音声信号を出力部103から外部スピーカ20へ出力する。外部スピーカ20は、コンテンツ再生装置10から供給される音声信号が表す音声を出力する。また、コンテンツ再生装置10は、音声信号の出力先として選択した出力先がヘッドフォン40である場合、「ヘッドフォンで音声を出力します」という音声を内蔵スピーカから出力する。次にコンテンツ再生装置10は、コンテンツの再生を開始し、再生したコンテンツの音声を表す音声信号を近距離通信部106から出力する。ヘッドフォン40は、コンテンツ再生装置10から供給される音声信号を取得し、取得した音声信号が表す音声を出力する。また、コンテンツ再生装置10は、音声信号の出力先として選択した出力先が内蔵スピーカである場合、「内蔵スピーカで音声を出力します」という音声を内蔵スピーカから出力する。次にコンテンツ再生装置10は、コンテンツの再生を開始し、再生したコンテンツの音声を内蔵スピーカで出力する。
コンテンツ再生装置10は、コンテンツの再生を開始すると、図5の処理を行う。コンテンツ再生装置10(特定部1003)は、音声処理部107のマイクロフォンから供給されるデジタル信号を解析し、騒音(ノイズ)のレベルを検知する(ステップSB1)。例えば、コンテンツ再生装置10は、マイクロフォンから供給されるデジタル信号において、ユーザの音声と、出力している音声信号が表す音声をキャンセルし、キャンセル後の音声のレベルを騒音のレベルとする。
次にコンテンツ再生装置10(選択部1004)は、コンテンツの音声信号の出力先を選択する(ステップSB2)。ここでコンテンツ再生装置10は、ステップSB1で検知したレベルとステップSA2で特定したコンテンツの属性により出力先を選択する。ステップSB1で検知した騒音のレベルは、コンテンツ再生装置10の周囲の状況の一例である。即ち、コンテンツ再生装置10は、コンテンツ再生装置10の周囲の状況およびコンテンツの属性により出力先を選択する。
具体的には、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、検知した騒音のレベルが予め定められた閾値未満である場合、ステップSB2の開始時点で音声信号の出力先として選択されている出力先を、音声信号の出力先とする。例えば、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、ステップSB2の開始時点で音声信号の出力先が外部スピーカ20となっている場合、音声信号の出力先として外部スピーカ20を選択する。また、コンテンツ再生装置10は、再生するコンテンツの属性が楽曲であり、検知した騒音のレベルが予め定められた閾値以上である場合、音声信号の出力先としてヘッドフォン40を選択する。
また、コンテンツ再生装置10は、再生するコンテンツの属性がラジオ放送であり、検知した騒音のレベルが予め定められた閾値未満である場合、音声信号の出力先として内蔵スピーカを選択する。また、コンテンツ再生装置10は、再生するコンテンツの属性がラジオ放送であり、検知した騒音のレベルが予め定められた閾値以上である場合、音声信号の出力先としてヘッドフォン40を選択する。
次にコンテンツ再生装置10(選択部1004)は、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが同じであるか判断する(ステップSB3)。コンテンツ再生装置10は、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが同じである場合(ステップSB3でYES)、処理の流れをステップSB8へ移す。
コンテンツ再生装置10(選択部1004)は、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが異なる場合(ステップSB3でNO)、音声信号の出力先の変更を行うか問い合わせる音声を出力する(ステップSB4)。
例えば、コンテンツの属性が楽曲であり、音声信号の出力先が外部スピーカ20であり、騒音のレベルが閾値未満である状態から、騒音のレベルが閾値以上となると、ステップSB2において音声信号の出力先としてヘッドフォン40が選択され、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが異なる状態となる。この場合、コンテンツ再生装置10は、ステップSB3でNOと判断し、例えば「音声の出力先をヘッドフォンに変更しますか?」との音声を内蔵スピーカから出力し、音声の出力先を変更するか否かをユーザに問い合わせる。
また、コンテンツの属性がラジオ放送であり、音声信号の出力先が内蔵スピーカであり、騒音のレベルが閾値未満である状態から、騒音のレベルが閾値以上となると、ステップSB2において音声信号の出力先としてヘッドフォン40が選択され、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが異なる状態となる。この場合、コンテンツ再生装置10は、ステップSB3でNOと判断し、例えば「音声の出力先をヘッドフォンに変更しますか?」との音声を内蔵スピーカから出力し、音声の出力先を変更するか否かをユーザに問い合わせる。
また、コンテンツの属性がラジオ放送であり、音声信号の出力先がヘッドフォン40であり、騒音のレベルが閾値以上である状態から、騒音のレベルが閾値未満となると、ステップSB2において音声信号の出力先として内蔵スピーカが選択され、ステップSB2の開始時点での音声信号の出力先と、ステップSB2で選択した音声信号の出力先とが異なる状態となる。この場合、コンテンツ再生装置10は、ステップSB3でNOと判断し、例えば「音声の出力先を内蔵スピーカに変更しますか?」との音声を表す音声信号をヘッドフォン40へ出力し、音声の出力先を変更するか否かをユーザに問い合わせる。
ユーザは、ステップSB4で出力された音声に応じて音声を発する。コンテンツ再生装置10(音声認識部1005)は、ユーザが音声を発すると、音声認識を行う(ステップSB5)。次にコンテンツ再生装置10(選択部1004)は、音声認識の結果が、音声信号の出力先の変更を指示する内容であるか判断する(ステップSB6)。コンテンツ再生装置10は、音声認識の結果、ユーザが発した音声が出力先の変更を指示する内容ではない場合(ステップSB6でNO)、音声の出力先を変更せず、処理の流れをステップSB8へ移す。なお、コンテンツ再生装置10は、ステップSB4の処理を終えた後、予め定められた時間が経過してもユーザの音声を認識しなかった場合にも、処理の流れをステップSB8へ移すようにしてもよい。
コンテンツ再生装置10(選択部1004)は、ユーザが発した音声が出力先の変更を指示する内容である場合(ステップSB6でYES)、音声の出力先をステップSB2で選択した出力先に変更する(ステップSB7)。例えば、コンテンツ再生装置10は、音声信号の出力先を外部スピーカ20からヘッドフォン40に変更する場合、外部スピーカ20への音声信号の出力を停止し、近距離通信部106から無線通信により音声信号をヘッドフォン40へ出力する。これにより、外部スピーカ20からはコンテンツの音が出力されなくなり、ヘッドフォン40からコンテンツの音が出力される。ユーザは、騒音のレベルが大きい状況においては、ヘッドフォン40から出力される音を聞くため、騒音に遮られることなくコンテンツの音声を聞くことができる。
また、コンテンツ再生装置10は、音声信号の出力先を内蔵スピーカからヘッドフォン40に変更する場合、内蔵スピーカへの音声信号の供給を停止し、近距離通信部106から無線通信により音声信号をヘッドフォン40へ出力する。これにより、内蔵スピーカからはコンテンツの音が出力されなくなり、ヘッドフォン40からコンテンツの音が出力される。ユーザは、騒音のレベルが大きい状況においては、ヘッドフォン40から出力される音を聞くため、騒音に遮られることなくコンテンツの音声を聞くことができる。
また、コンテンツ再生装置10は、音声信号の出力先をヘッドフォン40から内蔵スピーカに変更する場合、近距離通信部106からの音声信号の出力を停止し、音声信号を内蔵スピーカへ供給する。これにより、ヘッドフォン40からはコンテンツの音が出力されなくなり、内蔵スピーカからコンテンツの音が出力される。騒音のレベルが小さい状況では、内部スピーカからコンテンツの音が出力されるため、ユーザは、騒音に遮られることなく、内蔵スピーカから出力されるコンテンツの音を聞くことができる。
コンテンツ再生装置10は、ステップSB7の処理を終えた後、ステップSB3でYESと判断した場合、またはステップSB6でNOと判断した場合、コンテンツの再生が終了したか判断する(ステップSB8)。例えば、コンテンツ再生装置10は、記憶部102から取得したコンテンツを再生している場合、コンテンツの再生を終えていないと、コンテンツの再生が終了していないと判断し、処理の流れをステップSB1へ戻す。また、コンテンツ再生装置10は、コンテンツの再生停止を指示するユーザの音声を認識していない場合、処理の流れをステップSB1へ戻す。コンテンツ再生装置10は、記憶部102から取得したコンテンツの再生を終えると、ステップSB8でコンテンツの再生が終了したと判断し、図5の処理を終了する。また、コンテンツ再生装置10は、コンテンツの再生停止を指示するユーザの音声を認識した場合、ステップSB8でコンテンツの再生が終了したと判断し、図5の処理を終了する。
本発明によれば、コンテンツの属性とコンテンツ再生装置10の周囲の状況に応じて音声信号の出力先が変更されるため、コンテンツを視聴する状況が変化してもコンテンツに応じて適切に音声を視聴することができる。
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態および以下の変形例は、各々を組み合わせてもよい。
本発明においては、騒音のレベルの変化が変化したときだけでなく、ユーザが発した音声に応じて、音声信号の出力先を変更してもよい。
上述した実施形態においては、コンテンツ再生装置10がユーザの音声を認識しているが、外部のサーバ装置へユーザの音声を表す情報を送信し、送信した情報を用いて外部のサーバ装置がユーザの音声を認識し、認識結果をコンテンツ再生装置10へ送る構成であってもよい。
上述した実施形態においては、コンテンツ再生装置10は、周囲の状況およびコンテンツの属性により音声信号の出力先を選択し、コンテンツ再生装置10の周囲の状況の一例として、騒音のレベルを用いているが、周囲の状況は騒音のレベルに限定されるものではない。例えば、コンテンツ再生装置10が撮像素子を有し、撮像素子で得られた画像から周囲にいる人間の距離および/または人数を特定し、特定結果とコンテンツの属性に応じて音声信号の出力先を選択してもよい。例えば、コンテンツ再生装置10は、周囲にいる人間の人数を特定し、コンテンツがロックであり、周囲にいる人間の人数が二人以上である場合、音声信号の出力先として外部スピーカ20を選択し、コンテンツがロックであり、周囲にいる人間の人数が一人である場合、音声信号の出力先としてヘッドフォン40を選択してもよい。また、コンテンツ再生装置10は、コンテンツ再生装置10からユーザまでの距離が外部スピーカ20からユーザまでの距離より遠く、コンテンツの属性がクラシックである場合、音声信号の出力先として内蔵スピーカを選択し、外部スピーカ20からユーザまでの距離がコンテンツ再生装置10からユーザまでの距離より遠く、コンテンツの属性がクラシックである場合、音声信号の出力先として外部スピーカ20を選択してもよい。
また、コンテンツ再生装置10は、予め定められたユーザの位置を撮像素子で得られた画像から特定し、特定した位置とコンテンツの属性に応じて音声信号の出力先を選択するようにしてもよい。コンテンツ再生装置10は、予め定められたユーザの位置を特定し、コンテンツ再生装置10から特定した位置までの距離が予め定められた閾値以上であり、コンテンツの属性がクラシックである場合、音声信号の出力先として外部スピーカ20を選択し、コンテンツ再生装置10から特定した位置までの距離が予め定められた閾値未満であり、コンテンツの属性がクラシックである場合、音声信号の出力先として内蔵スピーカを選択してもよい。
コンテンツ再生装置10は、予め定められたユーザを撮像素子で得られた画像から認識する場合、予め定められたユーザ以外の人間の有無に応じて音声信号の出力先を変更するようにしてもよい。コンテンツ再生装置10は、予め定められたユーザ以外の人間がコンテンツ再生装置10の周囲に存在し、コンテンツの属性がクラシックである場合、音声信号の出力先としてヘッドフォン40を選択し、予め定められたユーザ以外の人間がコンテンツ再生装置10の周囲に存在せず、コンテンツの属性がクラシックである場合、音声信号の出力先として外部スピーカ20または内蔵スピーカを選択してもよい。
本発明においては、コンテンツ再生装置10は、時間帯も加味して音声信号の出力先を選択する構成としてもよい。例えば、上述した実施形態では、コンテンツ再生装置10は、コンテンツの属性がラジオ放送であり、騒音のレベルが閾値未満であり、時刻が昼の時間帯である場合には、音声信号の出力先を内蔵スピーカとし、コンテンツの属性がラジオ放送であり、騒音のレベルが閾値未満であり、時刻が夜の時間帯である場合には、音声信号の出力先をヘッドフォン40としてもよい。
本発明においては、コンテンツ再生装置10は、マイクロフォンで取得する音声により、複数のユーザの各々を認識してもよい。コンテンツ再生装置10は、複数のユーザの各々を認識する場合、同じ状況と同じコンテンツであっても、音声信号の出力先がユーザ毎に設定されている構成であってもよい。
本発明においては、コンテンツの音声として、音声アシスタントの音声を含めてもよい。音声アシスタントの音声を出力する際にも、上述した実施形態でコンテンツが楽曲である場合と同様に音声の出力先を変更してもよい。
上述した実施形態においては、コンテンツ再生装置10は、ネットワークを介してコンテンツを取得しているが、近距離通信部106で他の装置から近距離通信でコンテンツを取得してもよい。また、USBメモリ、メモリカードなどの外部メモリにアクセスするインターフェースをコンテンツ再生装置10に設け、インターフェースに装着された外部メモリからコンテンツを取得してもよい。
上述した実施形態においては、コンテンツ再生装置10は、ユーザの音声の認識結果が音声信号の出力先の変更を指示する内容である場合、音声信号の出力先を変更しているが、音声信号の出力先を変更する構成は、実施形態の構成に限定されるものではない。例えば、コンテンツ再生装置10は、ステップSB3の後、音声信号の出力先をステップSB2で選択した出力先へ変更する内容の音声を出力し、ステップSB3〜ステップSB6の処理を行わない構成としてもよい。
上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェアおよび/またはソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。即ち、各機能ブロックは、物理的および/または論理的に結合した1つの装置により実現されてもよいし、物理的および/または論理的に分離した2つ以上の装置を直接的および/または間接的に(例えば、有線および/または無線)で接続し、これら複数の装置により実現されてもよい。
また、コンテンツ再生装置10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部または全てが実現されてもよい。例えば、制御部101は、これらのハードウェアの少なくとも1つで実装されてもよい。
本明細書で説明した実施形態/変形例の処理手順、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペアおよびデジタル加入者回線(DSL)などの有線技術および/または赤外線、無線およびマイクロ波などの無線技術を使用してウェブサイト、サーバ、または他のリモートソースから送信される場合、これらの有線技術および/または無線技術は、伝送媒体の定義内に含まれる。
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、またはこれらの任意の組み合わせによって表されてもよい。なお、本明細書で説明した用語および/または本明細書の理解に必要な用語については、同一のまたは類似する意味を有する用語と置き換えてもよい。
本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
「接続された(connected)」、「結合された(coupled)」という用語、またはこれらのあらゆる変形は、2またはそれ以上の要素間の直接的または間接的なあらゆる接続または結合を意味し、互いに「接続」または「結合」された2つの要素間に1またはそれ以上の中間要素が存在することを含むことができる。要素間の結合または接続は、物理的なものであっても、論理的なものであっても、あるいはこれらの組み合わせであってもよい。本明細書で使用する場合、2つの要素は、1またはそれ以上の電線、ケーブルおよび/またはプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域および光(可視および不可視の両方)領域の波長を有する電磁エネルギーなどの電磁エネルギーを使用することにより、互いに「接続」または「結合」されると考えることができる。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。
「含む(including)」、「含んでいる(comprising)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本開示の全体において、例えば、英語でのa, an, およびtheのように、翻訳により冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数のものを含むものとする。
以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨および範囲を逸脱することなく修正および変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。
10…コンテンツ再生装置、20…外部スピーカ、40…ヘッドフォン、101…制御部、102…記憶部、103…出力部、105…通信部、106…近距離通信部、107…音声処理部、1001…取得部、1002…再生部、1003…特定部、1004…選択部、1005…音声認識部。

Claims (3)

  1. コンテンツを取得する取得手段と、
    前記取得手段が取得したコンテンツを再生する再生手段と、
    自装置の周囲にいる人の数を特定する特定手段と、
    前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定したに基づいて複数の出力先の中から選択する選択手段と、
    前記選択手段が選択した出力先へ、前記再生手段で再生されたコンテンツの音声を出力する出力手段と
    を備え
    前記選択手段は、前記コンテンツの属性が共通する2つの場合のうち、前記数が2以上である第1の場合には、出力先としてスピーカを選択し、前記数が1である第2の場合には、出力先としてヘッドフォンを選択することを特徴とする再生装置。
  2. コンピュータを、
    コンテンツを取得する取得手段と、
    前記取得手段が取得したコンテンツを再生する再生手段と、
    自装置の周囲にいる人の数を特定する特定手段と、
    前記再生手段で再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定手段が特定したに基づいて複数の出力先の中から選択する選択手段と、
    前記選択手段が選択した出力先へ、前記再生手段で再生されたコンテンツの音声を出力する出力手段
    として機能させるためのプログラムであって、
    前記選択手段は、前記コンテンツの属性が共通する2つの場合のうち、前記数が2以上である第1の場合には、出力先としてスピーカを選択し、前記数が1である第2の場合には、出力先としてヘッドフォンを選択することを特徴とするプログラム。
  3. コンテンツを取得する取得ステップと、
    前記取得ステップで取得したコンテンツを再生する再生ステップと、
    自装置の周囲にいる人の数を特定する特定ステップと、
    前記再生ステップで再生されたコンテンツの音声の出力先を、当該コンテンツの属性と、前記特定ステップで特定したに基づいて複数の出力先の中から選択する選択ステップと、
    前記選択ステップで選択した出力先へ、前記再生ステップで再生されたコンテンツの音声を出力する出力ステップと
    を備え
    前記選択ステップでは、前記コンテンツの属性が共通する2つの場合のうち、前記数が2以上である第1の場合には、出力先としてスピーカを選択し、前記数が1である第2の場合には、出力先としてヘッドフォンを選択することを特徴とする再生方法。
JP2017147691A 2017-07-31 2017-07-31 再生装置、プログラムおよび再生方法 Active JP6917821B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017147691A JP6917821B2 (ja) 2017-07-31 2017-07-31 再生装置、プログラムおよび再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017147691A JP6917821B2 (ja) 2017-07-31 2017-07-31 再生装置、プログラムおよび再生方法

Publications (2)

Publication Number Publication Date
JP2019029828A JP2019029828A (ja) 2019-02-21
JP6917821B2 true JP6917821B2 (ja) 2021-08-11

Family

ID=65476624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017147691A Active JP6917821B2 (ja) 2017-07-31 2017-07-31 再生装置、プログラムおよび再生方法

Country Status (1)

Country Link
JP (1) JP6917821B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4441391B2 (ja) * 2004-11-29 2010-03-31 株式会社メガチップス 音声再生装置
JP2008182402A (ja) * 2007-01-24 2008-08-07 Mitsubishi Electric Corp 携帯端末装置
JP2008227942A (ja) * 2007-03-13 2008-09-25 Pioneer Electronic Corp コンテンツ再生装置及びコンテンツ再生方法
JP2008228184A (ja) * 2007-03-15 2008-09-25 Funai Electric Co Ltd 音声出力装置
US8750543B2 (en) * 2010-09-08 2014-06-10 Panasonic Corporation Sound reproduction device

Also Published As

Publication number Publication date
JP2019029828A (ja) 2019-02-21

Similar Documents

Publication Publication Date Title
KR102545837B1 (ko) 디스플레이 장치, 디스플레이 장치의 배경음악 제공방법 및 배경음악 제공 시스템
US10776074B2 (en) Methods, systems, and media for controlling audio output
EP3846020A1 (en) Sound effect adjusting method and apparatus, electronic device, and storage medium
US10014841B2 (en) Method and apparatus for controlling audio playback based upon the instrument
WO2010095264A1 (ja) コンテンツ送信装置、コンテンツ出力システム、送信制御方法、送信制御プログラムおよび記録媒体
KR20150059932A (ko) 사운드 출력 방법 및 장치
JP6917821B2 (ja) 再生装置、プログラムおよび再生方法
US20180124127A1 (en) Content reproduction apparatus, content reproduction system, and content reproduction method
JP6151112B2 (ja) 再生装置、再生装置の制御方法、サーバ、および、システム
US8737809B2 (en) Content playing apparatus and control method thereof
JPWO2018079379A1 (ja) 通信端末装置、プログラム及び情報処理方法
US20140121794A1 (en) Method, Apparatus, And Computer Program Product For Providing A Personalized Audio File
CN106572140B (zh) 媒体文件播放的方法和终端设备
WO2019167373A1 (ja) 機能実行指示システム
US20200349190A1 (en) Interactive music on-demand method, device and terminal
JP7369604B2 (ja) 情報処理システム
WO2019017033A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US12026428B2 (en) Audio video navigation system for vehicle and method for playing media thereof
US12052553B2 (en) Sound output device, sound output system, and control method
WO2020049826A1 (ja) 情報処理装置
KR20140038791A (ko) 멀티미디어 데이터 재생방법 및 이를 적용한 멀티미디어 재생장치
JP7181116B2 (ja) 制御システム
JP2019074949A (ja) 検索装置およびプログラム
US20230080895A1 (en) Dynamic operation of a voice controlled device
WO2020049827A1 (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210720

R150 Certificate of patent or registration of utility model

Ref document number: 6917821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150