JP2009049873A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2009049873A JP2009049873A JP2007215778A JP2007215778A JP2009049873A JP 2009049873 A JP2009049873 A JP 2009049873A JP 2007215778 A JP2007215778 A JP 2007215778A JP 2007215778 A JP2007215778 A JP 2007215778A JP 2009049873 A JP2009049873 A JP 2009049873A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- block
- signal
- processing apparatus
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Stereophonic System (AREA)
Abstract
【課題】2chの入力音声信号から擬似的に5.1chの音声情報を作り出す。
【解決手段】情報処理装置は、ビデオ・フレーム・バッファ100と、左右2chの音声信号を入力して4chの音声信号を作り出す音声処理ブロック200と、音声処理ブロック200から供給される4chの音声信号を重み付け合成して5.1chのサラウンド音声信号を生成する音声合成ブロック300と、画像認識機能を備え、音声信号に同期する画像信号を認識した結果に基づいて音声合成ブロック300で4chの音声信号を合成する際に用いる合成パラメータを制御する音声合成制御ブロック500で構成される。
【選択図】 図1
【解決手段】情報処理装置は、ビデオ・フレーム・バッファ100と、左右2chの音声信号を入力して4chの音声信号を作り出す音声処理ブロック200と、音声処理ブロック200から供給される4chの音声信号を重み付け合成して5.1chのサラウンド音声信号を生成する音声合成ブロック300と、画像認識機能を備え、音声信号に同期する画像信号を認識した結果に基づいて音声合成ブロック300で4chの音声信号を合成する際に用いる合成パラメータを制御する音声合成制御ブロック500で構成される。
【選択図】 図1
Description
本発明は、画像信号及びこれに同期した音声信号からなる情報コンテンツを記録又は再生出力する情報処理装置に係り、特に、サラウンド再生環境に対応した音声情報の処理を行なう情報処理装置に関する。
さらに詳しくは、本発明は、通常の2chステレオマイクで撮影されたコンテンツを再生する際に擬似的に5.1ch分の音声情報を作り出すことによって、5.1chサラウンドのような臨場感を得る情報処理装置、並びに、通常の2chステレオマイクしか実装していないビデオカメラにおいて擬似的に5.1ch分の音声情報を作り出して記録する情報処理装置に関する。
家庭用のビデオカメラは既に広く普及している。近年では、動画像及び音声データをデジタル符号化して、DVD(Digital Versatile Disc)やハード・ディスクなどのコンピュータ・ファイルとして記録・管理するデジタルビデオカメラが増えてきている。また、デジタルカメラに画像認識技術を組み合わせることで、被写体認識処理が可能であり、被写体画像の位置や大きさに応じた自動照準(AF)、自動露光(AE)といったカメラワークの自動化技術も進められている。
一方、動画像及び画像データの再生システムとしては、想定される位置の視聴ユーザの周囲に複数のスピーカを配置して、実音源に近い、すなわち臨場感のあるサラウンド再生技術が知られている。サラウンド再生環境を実現する音声データ信号方式として、例えば、米国ドルビー研究所の開発したデジタル・マルチチャンネル音声信号の高能率符号化方式であるAC−3が知られている。このAC−3のサラウンド再生システムは、例えば、視聴者の前方左側に配置された左チャンネル用スピーカLと、視聴者の前方中央に配置されたセンター・チャンネル用スピーカCと、視聴者の前方右側に配置された右チャンネル用スピーカRと、視聴者の後方左右にそれぞれ配置されたサラウンド・チャンネル用スピーカLs及びRsという5台のスピーカで構成され(図3を参照のこと)、その音声チャネル数はフロント左右2チャンネルとフロントセンター1チャンネルとリア2チャンネルにさらにスーパーウーハ駆動用の低域専用チャンネル(0.1チャンネル)を加えた5.1チャンネルとなる。
DVDのような大容量の記録メディアの普及とともに、ホームシアターを始め5.1チャンネルを備えたサラウンド再生環境が家庭内にも浸透しつつある。また、家庭用ビデオカメラにも、5.1チャンネルで音声を記録可能な製品が出現している。5.1チャンネルで撮影されたコンテンツを5.1chサラウンド環境で再生すると、その場に居合わせたような臨場感が味わうことができ、ユーザにとってメリットは大きい。
例えば、複数のマイクロフォンを備え、上記複数の各マイクロフォンから出力されるオーディオ信号を複数チャンネルのオーディオ信号に処理した第1の複数のオーディオ信号と、上記複数の各マイクロフォンから出力される全チャンネルのオーディオ信号を1つのチャンネルのオーディオ信号に処理した第2のオーディオ信号とを、上記映像信号と共に同時に上記記録媒体に記録するようにし、さらに、上記記録を上記第1の複数のオーディオ信号と上記第2のオーディオ信号とを独立して再生することが可能なるように行なうようにしたビデオカメラについて提案がなされている(例えば、特許文献1を参照のこと)。
また、撮影時に少なくとも異なる4方向以上からの音声を収音するようにビデオカメラに配設された4個以上のマイクロフォンM1、M2、M3、M4、…Mnと、前記マイクロフォンから各々出力される音声出力信号m1、m2、m3、m4、…mnを音声合成し、撮影方向に対して右前方からの音声信号Rと、左前方からの音声信号Lと、前方中央からの音声信号Cと、3つの方向と異なる方向からのサラウンド音声信号Sから構成される4チャンネル(Rch、Lch、Cch、Sch)の音声信号を生成する音声合成手段と、音声合成手段によって出力された4チャンネルの音声信号R、L、C、Sを予め定められた演算式に沿って2チャンネルの音声データLt、Rtに変換する信号処理を行ない出力するマトリックス・エンコーダと、マトリックス・エンコーダから出力される2チャンネルLtch、Rtchの音声データLt、Rtを記録媒体に記録する音声データ記録手段を備えるビデオカメラの録音装置について提案がなされており、記録される音声データは従来と同じ2チャンネルでありながら、再生時にマトリックス・デコードすることで4チャンネル以上のマルチチャンネルのサラウンド再生が可能となり、臨場感のある再生音が得られる(例えば、特許文献2を参照のこと)。
しかしながら、価格設定に制限のある家庭用デジタルカメラにとって、5.1chサラウンドに対応するには、ライセンス取得などの各種の制約があり、またセット形状から多チャンネルのマイク(5台のスピーカに対応した5台のマイクL、C、R、Ls、Rs)を配置することが難しいといった問題がある。このため、2チャンネルでしか記録できないビデオカメラがいまだに多いというのが実情である。
本発明の目的は、動画像及び音声からなる情報を記録又は再生出力する際に、サラウンド再生環境に対応した音声情報の処理を好適に行なうことができる、優れた情報処理装置を提供することにある。
本発明のさらなる目的は、通常の2chステレオマイクで撮影されたコンテンツを再生する際に擬似的に5.1ch分の音声情報を作り出すことによって、5.1chサラウンドのような臨場感を得ることができる、優れた情報処理装置を提供することにある。
本発明のさらなる目的は、通常の2chステレオマイクしか実装していないビデオカメラにおいて擬似的に5.1ch分の音声情報を作り出して記録することができる、優れた情報処理装置を提供することにある。
本発明は、上記課題を参酌してなされたものであり、画像信号及びこれに同期した音声信号からなる情報コンテンツを記録又は再生出力する情報処理装置であって、
左右2チャンネルからなる入力音声信号L及びRに信号処理を施して全方位性となる音声信号Cを作り出し、さらに該音声信号Cから特定の効果をかけた音声信号Eを作り出して、4チャンネルの音声信号L、R、C、Eを出力する音声処理ブロックと、
前記音声処理ブロックから出力される4チャンネルの音声信号L、R、C、Eを重み付け合成して、視聴者の前方左側に相当する左チャンネル用音声信号Lと、視聴者の前方中央に相当するセンター・チャンネル用音声信号Cと、視聴者の前方右側に相当する右チャンネル用音声信号Rと、視聴者の後方左右にそれぞれ相当するサラウンド・チャンネル用音声信号Ls及びRsからなる5チャンネルを含むサラウンド音声信号を生成する音声合成ブロックと、
音声信号に同期した入力画像信号を認識する画像認識手段を備え、該画像認識結果に基づいて前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを制御する音声合成制御ブロックと、
を具備することを特徴とする情報処理装置である。
左右2チャンネルからなる入力音声信号L及びRに信号処理を施して全方位性となる音声信号Cを作り出し、さらに該音声信号Cから特定の効果をかけた音声信号Eを作り出して、4チャンネルの音声信号L、R、C、Eを出力する音声処理ブロックと、
前記音声処理ブロックから出力される4チャンネルの音声信号L、R、C、Eを重み付け合成して、視聴者の前方左側に相当する左チャンネル用音声信号Lと、視聴者の前方中央に相当するセンター・チャンネル用音声信号Cと、視聴者の前方右側に相当する右チャンネル用音声信号Rと、視聴者の後方左右にそれぞれ相当するサラウンド・チャンネル用音声信号Ls及びRsからなる5チャンネルを含むサラウンド音声信号を生成する音声合成ブロックと、
音声信号に同期した入力画像信号を認識する画像認識手段を備え、該画像認識結果に基づいて前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを制御する音声合成制御ブロックと、
を具備することを特徴とする情報処理装置である。
但し、前記音声合成ブロックは、前記音声処理ブロックから出力される4チャンネルの音声信号L、R、C、Eを重み付け合成して、スーパーウーハ駆動用の低域専用チャンネル(0.1チャンネル)の音声信号LFEをさらに生成して、5.1チャンネルの音声信号を合成出力するようにすることもできる。
また、前記音声処理ブロックは、音声フィルタにより音声信号Cから特定のフィルタ効果をかけた音声信号Eを作り出すが、この音声フィルタは具体的には特定の周波数帯域の成分のみを通過させるバンドパス・フィルタで構成される。
動画像及び画像データの再生システムとしては、例えば米国ドルビー研究所の開発したAC−3に代表される、視聴ユーザの周囲に複数のスピーカを配置して、実音源に近い、すなわち臨場感のある5.1チャンネル構成のサラウンド再生技術が知られている。ユーザにとっては、その場に居合わせたような臨場感が味わうことができ、メリットは大きい。
しかしながら、価格設定に制限のある家庭用デジタルカメラにとって、5.1チャンネル構成のサラウンドに対応するには、ライセンス取得などの各種の制約があり、またセット形状から多チャンネルのマイクを配置することが難しいといった問題がある。
これに対し、本発明に係る情報処理装置は、通常の2chステレオマイクで撮影されたコンテンツを再生したり記録したりする際に、画像認識情報を用いて擬似的に5.1ch分の音声情報を作り出すように構成されており、2チャンネルのマイクのみを備えたビデオカメラで得られたようなAVコンテンツから5.1chサラウンドのような臨場感を得ることができる。
具体的には、まず、音声処理ブロックが右2チャンネルからなる入力音声信号L及びRに信号処理を施して全方位性となる音声信号Cを作り出し、さらに該音声信号Cから特定の効果をかけた音声信号Eを作り出して、4チャンネルの音声信号L、R、C、Eとし、次いで、旺盛合成ブロックが、これら4チャンネルの音声信号L、R、C、Eから視聴者の前方中央に相当するセンター・チャンネル用音声信号Cと、視聴者の前方右側に相当する右チャンネル用音声信号Rと、視聴者の後方左右にそれぞれ相当するサラウンド・チャンネル用音声信号Ls及びRsからなる5チャンネルと、スーパーウーハ駆動用の低域専用チャンネル(0.1チャンネル)の音声信号LFEの合計5.1チャンネルを合成するように構成されている。そして、音声合成制御ブロックは、音声信号に同期した入力画像信号の画像認識結果に基づいて前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを制御する。
音声合成ブロックは、例えば、前記画像認識手段により認識された画面内の被写体の位置や大きさに基づいて、前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを決定するようにしてもよい。
また、音声合成ブロックは、音声処理ブロックにおいて、全方位性となる音声信号Cから特定の効果をかけた音声信号Eを作り出す際に用いる音声フィルタの制御を行なうようにしてもよい。例えば、前記画像認識手段により認識された被写体の人数又は種類に基づいて、前記音声処理ブロックにおける音声フィルタの特性を決定するようにしてもよい。
本発明によれば、通常の2chステレオマイクで撮影されたコンテンツを再生する際に、画像認識情報を用いて擬似的に5.1ch分の音声情報を作り出すことによって、5.1chサラウンドのような臨場感を得ることができる、優れた情報処理装置を提供することができる。
また、本発明によれば、通常の2chステレオマイクしか実装していないビデオカメラにおいて、画像認識情報を用いて擬似的に5.1ch分の音声情報を作り出して記録することができる、優れた情報処理装置を提供することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
図1には、本発明の一実施形態に係る情報処理装置の構成を模式的に示している。この情報処理装置は、例えばDVD再生装置からビデオ信号及び2chの音声信号を入力しサラウンド再生出力し、あるいは2chステレオマイクしか搭載していないビデオカメラからビデオ信号及び音声信号を入力してサラウンド再生に対応した記録を行なうための処理を実行する。
図1に示すように、情報処理装置は、ビデオ・フレーム・バッファ100と、左右2chの音声信号を入力して4chの音声信号を作り出す音声処理ブロック200と、音声処理ブロック200から供給される4chの音声信号を重み付け合成して5.1chのサラウンド音声信号を生成する音声合成ブロック300と、画像認識機能を備え、音声信号に同期する画像信号を認識した結果に基づいて音声合成ブロック300で4chの音声信号を合成する際に用いる合成パラメータを制御する音声合成制御ブロック500で構成される。
ビデオ・フレーム・バッファ100は、伝送されるビデオ信号を画像認識するために一時的に保存する。ビデオ信号は、DVD再生装置(図示しない)などから供給される再生ビデオ信号、あるいはビデオカメラ(図示しない)で撮影されるビデオ信号である。
音声処理ブロック200は、入力された左右2chそれぞれの音声信号L及びRを重畳若しくは合成するなど信号処理を施して全方位性となる音声信号Cを作り出し、さらにこの全方位性の音声信号Cに特定の効果をかけた音声信号Eを作り出す。そして、音声処理ブロック200は、左右2chの音声信号L及びRとともに、全方位性の音声信号C、音声信号Cに特定の効果をかけた音声信号Eの4chを後段の音声合成ブロック300に出力する。
この音声信号Eは、全方位性の音声信号Cから音声フィルタを介して特定の成分のみを抽出した音声信号である。また、音声フィルタを通過した際に音声信号Eは幾分の遅延が生じるが、4chすべての音声信号の同時性を保つために、他の3chの音声信号L、R、Cの伝送路上には適当なディレイ素子が配置されている。
音声信号Eを生成するための音声フィルタは、例えばバンドパス・フィルタ(BPF)で構成され、全方位性の音声信号Cから特定の周波数帯域の線分のみを通過させる。例えば、男性の声の帯域のみを通過させるバンドパス・フィルタを用いて音声フィルタを構成することができる。
また、音声フィルタの周波数特性は一定である必要はなく、画像認識機能を備えた音声合成制御ブロック500が音声信号に同期して入力される画像信号の画像認識結果に基づいてその周波数特性を制御するようにしてもよい。例えば、ビデオ・フレーム・バッファ100に一時保持されている画像信号を画像認識ブロック550が画像認識して、(主要な)被写体が男性であることを認識したときには、例えば男性の声の帯域のみを通過させる周波数帯域に音声フィルタを設定するようにしてもよい。
さらには、音声合成制御ブロック500は、画像認識ブロック550により認識された(対象となる)被写体の人数に応じて音声フィルタの周波数特性を切り替えるようにして、音声処理ブロック200が複数の音声信号Eを生成するようにしてもよい。例えば、1画面内で成人男性と子供が認識されたときには、2種類のバンドパス・フィルタによってそれぞれ成人男性の声の帯域と子供の声の帯域を抽出した2種類の音声信号E1及びE2を生成して、後段の音声合成ブロック300に出力する。なお、この場合の音声処理ブロック200と音声合成ブロック300間の音声信号は可変信号数となるため、デジタル・データで音声信号のやり取りを行なうようにしてもよい。
音声合成ブロック300は、音声処理ブロック200から出力される4chの音声信号L、R、C、Eから、視聴者の前方左側に相当する左チャンネル用音声信号Lと、視聴者の前方中央に相当するセンター・チャンネル用音声信号Cと、視聴者の前方右側に相当する右チャンネル用音声信号Rと、視聴者の後方左右にそれぞれ相当するサラウンド・チャンネル用音声信号Ls及びRsからなる合計5.1chのサラウンド音声信号を合成する。これによって、擬似5.1ch記録若しくは擬似5.1ch記録を実現することができる。具体的には、音声合成ブロック300は、音声合成制御ブロック500が画像認識ブロック550による画像認識結果に基づいて決定する各4通りの合成パラメータPL、PR、PC、PEを基に、下式により4chの音声信号L、R、C、Eを重み合成して、5.1chそれぞれの音声信号L、R、C、Ls、Rsを計算する。
音声合成制御ブロック500は、信号線600よりメモリ・アクセスして、ビデオ・フレーム・バッファ100にある画像を画像認識ブロック560により解析し、画像内の認識対象の属性情報(対象の種別、位置、サイズなど)を作成した結果に基づいて、信号線610を使って音声合成ブロック300の合成パラメータを随時変更する。また、音声合成制御ブロック500は、画像内で認識された対象の属性情報(被写体の種類や性別、年齢など)に応じて、図示しない信号線を介して音声処理ブロック200内の音声フィルタの周波数特性を決定するようにしてもよい(前述)。
図1に示す例では、音声合成制御ブロック500は、プロセッサ510と、ROM(Read Only Memory)520と、RAM(Random Access Memory)530と、入出力インターフェース540と、信号線600によりビデオ・フレーム・バッファ100内のビデオ画像を画像認識することのできる画像認識ブロック550と、これらを相互に接続するバス560で構成される。
プロセッサ510は、所定のプログラムを実行することによって、音声合成ブロック300において4chの音声信号L、R、C、Eを重み合成する際に用いる合成パラメータを随時変更するための処理を行ない、信号線610を介して音声合成ブロック300に設定する。また、プロセッサ510は、所定のプログラムを実行することによって、音声処理ブロック200内の音声フィルタの特性を随時変更するための処理を行ない、図示しない信号線を介して音声処理ブロック200に設定する。
ROM520は、プロセッサ510により実行されるプログラムや各種パラメータなどを保持するメモリであり、例えば、フラッシュメモリなどのEEPROMにより構成される。ROM520に格納されるプログラムには、上述した、音声合成ブロック300において音声信号を重み合成する際の合成パラメータを変更するためのアルゴリズムや、音声処理ブロック200内の音声フィルタの特性を変更するためのアルゴリズムを実現するためのプログラムが含まれる。
RAM530は、プロセッサ510におけるプログラム実行に必要な作業データ等を保持するメモリであり、例えばSRAM(Static RAM)やDRAM(Dynamic RAM)などの読み書き可能なメモリ装置により構成され、主にプロセッサ510の作業用メモリとして用いられる。
入出力インターフェース540は、外部装置(図示しない)とのデータのやり取りの際のインターフェース・プロトコルを実現するものであり、例えば、ROM520内のプログラムの更新処理のために使用される。
画像認識ブロック560は、信号線600を介してメモリ・アクセスして、ビデオ・フレーム・バッファ100にある画像を解析し、画像内の認識対象の属性情報(対象の種別、位置、サイズなど)を作成する。画像認識ブロック560では特に被写体の検出並びに認識を行なう顔認識が適用される。顔認識処理は、例えば、顔画像の位置を検出して検出顔として抽出する顔検出処理と、検出顔から主要な顔器官の位置を検出する顔器官検出処理と、検出顔の識別(人物の特定)を行なう顔識別処理で構成される。但し、本発明の要旨は特定の画像認識技術に限定されるものではないので、本明細書ではこれ以上説明しない。
既に述べたように、プロセッサ510は、所定のプログラムを実行することによって、音声合成ブロック300において4chの音声信号L、R、C、Eを重み付け合成して5.1chの音声信号L、R、C、Ls、Rsを生成する際に用いる各4通りの合成パラメータPL、PR、PC、PEを随時変更するための処理を行なう。合成パラメータを変更するアルゴリズムとしては、画像認識ブロック560により認識された画面内の対象物(被写体)の位置や大きさに基づいて合成パラメータを決定する方法が挙げられる。
ここで、画像認識ブロック560により画面内に人物(あるいは、犬などのペット、自動車などの特定の機械装置類などの対象)を検知したときには、5.1chの音声信号L、R、C、Ls、Rsを生成する際にそれぞれ用いる合成パラメータPL、PR、PC、PEを例えば以下の表1に示すように決定する。
上記の表中に含まれる変数α、β、γ、δは画面内で検出された対象の位置に応じて決定される。例えば、図2に示すように、画面中央から対象までの距離をaとし、画面左端から画面中央までの距離をlとすると、変数α、β、γ、δをそれぞれ下式のように決定することができる。但し、同図中の5台のスピーカL、C、R、Ls、Rsは5.1chサラウンド再生システムにおいて想定される配置とする。
他方、画像認識ブロック560により画面内に人物などの対象を検知しなかったときには、5.1chの音声信号L、R、C、Ls、Rsを生成する際にそれぞれ用いる合成パラメータPL、PR、PC、PEを例えば以下の表2に示すように決定する。
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
本発明に係る情報処理装置は、通常の2chステレオマイクで撮影されたコンテンツを擬似的に5.1chで再生する場合、あるいは、通常の2chステレオマイクしか実装していないビデオカメラにおいて擬似的に5.1chで記録する場合に適用することができる。
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
100…ビデオ・フレーム・バッファ
200…音声処理ブロック
300…音声合成ブロック
500…音声合成制御ブロック
510…プロセッサ
520…ROM
530…RAM
540…入出力インターフェース
550…画像認識ブロック
560…バス
600、610…信号線
200…音声処理ブロック
300…音声合成ブロック
500…音声合成制御ブロック
510…プロセッサ
520…ROM
530…RAM
540…入出力インターフェース
550…画像認識ブロック
560…バス
600、610…信号線
Claims (11)
- 画像信号及びこれに同期した音声信号からなる情報コンテンツを記録又は再生出力する情報処理装置であって、
左右2チャンネルからなる入力音声信号L及びRに信号処理を施して全方位性となる音声信号Cを作り出し、さらに該音声信号Cから特定の効果をかけた音声信号Eを作り出して、4チャンネルの音声信号L、R、C、Eを出力する音声処理ブロックと、
前記音声処理ブロックから出力される4チャンネルの音声信号L、R、C、Eを重み付け合成して、視聴者の前方左側に相当する左チャンネル用音声信号Lと、視聴者の前方中央に相当するセンター・チャンネル用音声信号Cと、視聴者の前方右側に相当する右チャンネル用音声信号Rと、視聴者の後方左右にそれぞれ相当するサラウンド・チャンネル用音声信号Ls及びRsからなる5チャンネルを含むサラウンド音声信号を生成する音声合成ブロックと、
音声信号に同期した入力画像信号を認識する画像認識手段を備え、該画像認識結果に基づいて前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを制御する音声合成制御ブロックと、
を具備することを特徴とする情報処理装置。 - 前記音声処理ブロックは、音声フィルタにより音声信号Cから特定のフィルタ効果をかけた音声信号Eを作り出す、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声フィルタは、特定の周波数帯域の成分のみを通過させるバンドパス・フィルタで構成される、
ことを特徴とする請求項2に記載の情報処理装置。 - 前記音声合成制御ブロックは、音声信号に同期して入力される画像信号の前記画像認識手段による画像認識結果に基づいて、前記音声フィルタの周波数特性を制御する、
ことを特徴とする請求項3に記載の情報処理装置。 - 前記音声合成制御ブロックは、前記画像認識手段により認識された被写体の人数に応じて前記音声フィルタの周波数特性を切り替えて、前記音声合成ブロックにより複数の音声信号Eを生成させる、
ことを特徴とする請求項4に記載の情報処理装置。 - 前記音声合成ブロックは、前記音声処理ブロックから出力される4チャンネルの音声信号L、R、C、Eを重み付け合成して、スーパーウーハ駆動用の低域専用チャンネル(0.1チャンネル)の音声信号LFEをさらに生成する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声合成ブロックは、前記画像認識手段により認識された被写体の人数又は種類に基づいて、前記音声処理ブロックにおける音声フィルタの特性を決定する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声合成ブロックは、前記画像認識手段により認識された画面内の被写体の位置に基づいて、前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを決定する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声合成ブロックは、前記画像認識手段により認識された画面内の被写体の大きさに基づいて、前記音声合成ブロックで4チャンネルの音声信号L、R、C、Eを合成する際に用いる合成パラメータを決定する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声合成ブロックにより生成されたサラウンド音声信号を、入力画像信号と同期して記録する動画記録手段をさらに備える、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記音声合成ブロックにより生成されたサラウンド音声信号を、入力画像信号と同期して再生出力する動画再生手段をさらに備える、
ことを特徴とする請求項1に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007215778A JP2009049873A (ja) | 2007-08-22 | 2007-08-22 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007215778A JP2009049873A (ja) | 2007-08-22 | 2007-08-22 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009049873A true JP2009049873A (ja) | 2009-03-05 |
Family
ID=40501624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007215778A Pending JP2009049873A (ja) | 2007-08-22 | 2007-08-22 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009049873A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013146893A1 (ja) * | 2012-03-28 | 2013-10-03 | 株式会社ニコン | デジタルカメラ |
EP3709215A1 (en) * | 2019-03-13 | 2020-09-16 | Panasonic Intellectual Property Management Co., Ltd. | Imaging apparatus |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0481199A (ja) * | 1990-07-23 | 1992-03-13 | Matsushita Electric Ind Co Ltd | ステレオマイクロホン |
JPH077798A (ja) * | 1986-03-27 | 1995-01-10 | Hughes Aircraft Co | 遠近感を訂正するステレオ増強システム |
JP2000295699A (ja) * | 1998-12-24 | 2000-10-20 | Bose Corp | オーディオ信号処理システム |
JP2003018543A (ja) * | 2001-04-27 | 2003-01-17 | Sony Corp | ビデオカメラ |
JP2004187288A (ja) * | 2002-11-20 | 2004-07-02 | Haruhiko Onozato | 音源映像の表示領域からその音声を出力させる映像音声再生方法 |
JP2004336609A (ja) * | 2003-05-12 | 2004-11-25 | Sanyo Electric Co Ltd | ステレオ化処理回路 |
JP2005311604A (ja) * | 2004-04-20 | 2005-11-04 | Sony Corp | 情報処理装置及び情報処理装置に用いるプログラム |
JP2006074386A (ja) * | 2004-09-01 | 2006-03-16 | Fujitsu Ltd | 立体音響再生方法、通信装置及びプログラム |
JP2007005849A (ja) * | 2005-06-21 | 2007-01-11 | Sony Corp | 記録装置、記録方法、再生装置、再生方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体 |
JP2007013255A (ja) * | 2005-06-28 | 2007-01-18 | Sony Corp | 信号処理装置および方法、プログラム、並びに記録媒体 |
-
2007
- 2007-08-22 JP JP2007215778A patent/JP2009049873A/ja active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH077798A (ja) * | 1986-03-27 | 1995-01-10 | Hughes Aircraft Co | 遠近感を訂正するステレオ増強システム |
JPH0481199A (ja) * | 1990-07-23 | 1992-03-13 | Matsushita Electric Ind Co Ltd | ステレオマイクロホン |
JP2000295699A (ja) * | 1998-12-24 | 2000-10-20 | Bose Corp | オーディオ信号処理システム |
JP2003018543A (ja) * | 2001-04-27 | 2003-01-17 | Sony Corp | ビデオカメラ |
JP2004187288A (ja) * | 2002-11-20 | 2004-07-02 | Haruhiko Onozato | 音源映像の表示領域からその音声を出力させる映像音声再生方法 |
JP2004336609A (ja) * | 2003-05-12 | 2004-11-25 | Sanyo Electric Co Ltd | ステレオ化処理回路 |
JP2005311604A (ja) * | 2004-04-20 | 2005-11-04 | Sony Corp | 情報処理装置及び情報処理装置に用いるプログラム |
JP2006074386A (ja) * | 2004-09-01 | 2006-03-16 | Fujitsu Ltd | 立体音響再生方法、通信装置及びプログラム |
JP2007005849A (ja) * | 2005-06-21 | 2007-01-11 | Sony Corp | 記録装置、記録方法、再生装置、再生方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体 |
JP2007013255A (ja) * | 2005-06-28 | 2007-01-18 | Sony Corp | 信号処理装置および方法、プログラム、並びに記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013146893A1 (ja) * | 2012-03-28 | 2013-10-03 | 株式会社ニコン | デジタルカメラ |
EP3709215A1 (en) * | 2019-03-13 | 2020-09-16 | Panasonic Intellectual Property Management Co., Ltd. | Imaging apparatus |
US11463615B2 (en) | 2019-03-13 | 2022-10-04 | Panasonic Intellectual Property Management Co., Ltd. | Imaging apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1416769B1 (en) | Object-based three-dimensional audio system and method of controlling the same | |
US10021507B2 (en) | Arrangement and method for reproducing audio data of an acoustic scene | |
JP4364326B2 (ja) | 複数の聴取者用3次元音響再生装置及びその方法 | |
RU2586842C2 (ru) | Устройство и способ преобразования первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал | |
JP3521900B2 (ja) | バーチャルスピーカアンプ | |
KR101368859B1 (ko) | 개인 청각 특성을 고려한 2채널 입체 음향 재생 방법 및장치 | |
EP2737727B1 (en) | Method and apparatus for processing audio signals | |
US20120128160A1 (en) | Three-dimensional sound capturing and reproducing with multi-microphones | |
CN109410912B (zh) | 音频处理的方法、装置、电子设备及计算机可读存储介质 | |
JP4934580B2 (ja) | 映像音声記録装置および映像音声再生装置 | |
CN110192396A (zh) | 用于基于头部跟踪数据确定和/或使用音频滤波器的方法和*** | |
CN103081512A (zh) | 3d声音再现方法和设备 | |
JP6246922B2 (ja) | 音響信号処理方法 | |
JP2019506058A (ja) | 没入型オーディオ再生のための信号合成 | |
JP2004048751A (ja) | 多チャンネル立体音響サウンドの生成方法及び装置 | |
US11221820B2 (en) | System and method for processing audio between multiple audio spaces | |
CN103609143B (zh) | 用于捕获和回放源自多个声音源的声音的方法 | |
Llorach et al. | Towards realistic immersive audiovisual simulations for hearing research: Capture, virtual scenes and reproduction | |
US20190289418A1 (en) | Method and apparatus for reproducing audio signal based on movement of user in virtual space | |
JP2007158527A (ja) | 信号処理装置、信号処理方法、再生装置、記録装置 | |
JP2006033847A (ja) | 最適な仮想音源を提供する音響再生装置及び音響再生方法 | |
WO2018173413A1 (ja) | 音声信号処理装置及び音声信号処理システム | |
JP2005157278A (ja) | 全周囲音場創生装置、全周囲音場創生方法、及び全周囲音場創生プログラム | |
JP2005223714A (ja) | 音響収音装置、音響収音方法、記録媒体 | |
JP2009049873A (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121009 |