WO2022220181A1

WO2022220181A1 - 情報処理方法、情報処理装置、及び、プログラム

Info

Publication number: WO2022220181A1
Application number: PCT/JP2022/017167
Authority: WO
Inventors: 智一石川; 耕水野
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2021-04-12
Filing date: 2022-04-06
Publication date: 2022-10-20
Also published as: EP4325898A1; JPWO2022220181A1; US20240015461A1

Abstract

情報処理方法は、仮想的な空間を再現するための空間情報を取得し（Ｓ２１）、仮想的な空間は、仮想的な空間内に配置される第１構造物と、音源とを含み、それぞれが、第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成し（Ｓ２３）、複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有し、複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出し（Ｓ２４）、複数の反射指標値に基づいて、複数の第２構造物のうちの１つの第２構造物を選択し（Ｓ２５）、第１構造物を、選択した１つの第２構造物に置き換えることで、第１構造物の立体形状が単純化された単純化空間を生成する（Ｓ２６）。

Description

情報処理方法、情報処理装置、及び、プログラム

　本開示は、立体音響を再現する情報処理方法、情報処理装置、及び、プログラムに関する。

　ＶＲ（Virtual Reality）またはＡＲ（Augmented Reality）等で空間の伝達特性を模擬した仮想空間における音響を再生する際に、特許文献１に記載されているような、空間の形状に応じたインパルス応答を用いることで音オブジェクトの実在感や仮想環境のリアリティを高める音響再生技術が知られている。

特開２００６－１２８８１８号公報

　しかしながら、立体音響の再生において、音響再生処理に大きな処理負荷が必要とされる。また、音源の位置、受聴者の位置、再生空間の空間構造などが変化すると、変化した音源の位置、受聴者の位置、再生空間の空間構造に応じて演算をする必要があるため、大きな処理負荷が必要とされる。

　そこで、本開示は、立体音響の再生に要する処理負荷を低減することができる情報処理方法などを提供する。

　本開示の一態様に係る情報処理方法は、仮想的な空間を再現するための空間情報を取得し、前記仮想的な空間は、前記仮想的な空間内に配置される第１構造物と、音源とを含み、それぞれが、前記第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成し、前記複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有し、前記複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、前記複数の第２構造物にそれぞれ対応する複数の反射指標値を算出し、前記複数の反射指標値に基づいて、前記複数の第２構造物のうちの１つの第２構造物を選択し、前記第１構造物を、選択した前記１つの第２構造物に置き換えることで、前記第１構造物の立体形状が単純化された単純化空間を生成する。

　また、本開示の一態様に係る情報処理装置は、プロセッサと、メモリと、を備え、前記プロセッサは、前記メモリを用いて、仮想的な空間を再現するための空間情報を取得し、前記仮想的な空間は、前記仮想的な空間内に配置される第１構造物と、音源とを含み、それぞれが、前記第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成し、前記複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有し、前記複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、前記複数の第２構造物にそれぞれ対応する複数の反射指標値を算出し、前記複数の反射指標値に基づいて、前記複数の第２構造物のうちの１つの第２構造物を選択し、前記第１構造物を、選択した前記１つの第２構造物に置き換えることで、前記第１構造物の立体形状が単純化された単純化空間を生成する。

　なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び非一時的な記録媒体の任意な組み合わせで実現されてもよい。

　本開示に係る情報処理方法などは、立体音響の再生に要する処理負荷を低減することができる。

実施の形態に係る音響再生システムの一例を示す図である。各単純な立体形状の予め対応付けられている重みを示す表である。情報処理装置の動作の一例を示すフローチャートである。仮想的な空間を単純化する処理の一例を示すフローチャートである。仮想的な空間の具体例を示す図である。

　（本開示の基礎となった知見）
　従来の音響再生技術には、例えば、特許文献１に記載されているような境界要素法などの物理特性を忠実に再現する波動音響理論に基づく方式、または、音線法等の幾何音響に基づく方法などが知られている。波動音響理論に基づく方式では、複雑な空間形状に対して、特に高域においてインパルス応答を算出する際に演算量が増大するという課題がある。また、音線法等の幾何音響に基づく方法を使用する場合においても、音オブジェクトが移動したり、利用者が移動する６ＤｏＦ（６自由度）環境では実時間での計算量が多いという課題がある。

　これによれば、仮想的な空間に配置される第１構造物の形状を単純化して生成した複数の第２構造物のうち反射指標値に基づいて選択した１つの第２構造物に置き換える。このため、音響に影響する特性が類似し、かつ、単純化した形状の第２構造物に第１構造物を置き換えることができ、音響に影響する特性を変化させないように、演算量を低減することができる単純化空間を得ることができる。よって、立体音響の再生に要する処理負荷を低減することができる。

　また、さらに、前記仮想的な空間内の受聴者の受聴位置を特定し、前記複数の第２構造物の生成では、前記受聴位置から前記第１構造物を平面視した場合の前記第１構造物の投影面積と等しくなるように、前記複数種類の単純な立体形状のうちの前記１種類以上の立体形状を組み合わせることで、前記複数の第２構造物を生成してもよい。

　このため、第１構造物と音響に影響する特性が類似する複数の第２構造物を生成することができる。

　また、前記複数の第２構造物のそれぞれは、前記音源から前記受聴位置までの間に音の伝搬経路において、前記受聴位置から前記複数の第２構造物をそれぞれ平面視した場合の当該第２構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角と、前記受聴位置から前記第１構造物を平面視した場合の前記第１構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角とが互いに等しくなるように生成されてもよい。

　また、前記複数の第２構造物は、互いに異なる形状を有してもよい。

　また、前記１つの第２構造物の選択では、前記複数の第２構造物のうち対応する反射指標値が最小となる第２構造物を前記１つの第２構造物として選択してもよい。

　このため、複数の第２構造物のうちで演算量が最小となる構造物を１つの第２構造物として選択することができる。

　また、さらに、前記仮想的な空間内の受聴者の頭部の位置及び姿勢を特定し、前記単純化空間と、前記頭部の位置及び姿勢と、前記音源の位置とに基づいて、前記音源から前記頭部へ到来する音、及び、前記単純化空間の前記１つの第２構造物に反射して前記頭部へ到来する音の少なくとも一方の音の、到来方向と、到来するまでに伝搬する伝搬距離とを算出し、前記少なくとも一方の音の、前記到来方向及び前記伝搬距離を所定の頭部伝達関数に畳み込むことで、音声信号を生成し、生成した音声信号を出力してもよい。

　これによれば、音響に影響する特性を変化させないように、演算量を低減することができる単純化空間を用いて立体音響処理を行うため、立体音響の再生に要する処理負荷を低減することができる。

　また、前記頭部の位置及び姿勢と、前記音源の位置とは、互いに異なる複数のタイミングで特定され、前記複数のタイミングのそれぞれ毎に、前記伝搬距離の算出、前記音声信号の生成、及び、前記音声信号の出力が行われてもよい。

　これによれば、立体音響の再生に要する処理負荷を低減することができるため、リアルタイムに実行する処理の処理負荷を効果的に低減することができる。

　なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　以下、図面を参照しながら、実施の形態について説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。つまり、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素は、本開示の課題を達成するために必ずしも必要ではないが、より好ましい形態を構成する構成要素として説明される。

　（実施の形態）
　［１．構成］
　まず、本開示に係るシステム構成について説明する。

　図１は、実施の形態に係る音響再生システムの一例を示す図である。

　本実施の形態に係る音響再生システム１は、図１に示すように、例えば、情報処理装置１００と、端末２００と、コントローラ３００とを備える。これらは、例えば、互いに専用の有線通信で通信可能に接続されていてもよいし、無線通信で通信可能に接続されていてもよい。これらは、直接通信可能に接続されていてもよいし、間に所定の機器を介して通信可能に接続されていてもよい。情報処理装置１００は、仮想的な空間内での音響を再生し、端末２００に出力する。情報処理装置１００は、仮想的な空間を再現し、仮想的な空間内のユーザに聞こえる音響を再生する。仮想的な空間には、構造物、音源、受聴者などが含まれる。受聴者は、ユーザである。これらの構造物、音源、及び、受聴者は、仮想的なものである。情報処理装置１００は、仮想的な空間における、構造物のサイズ及び位置と、音源の位置と、受聴者の位置とに基づいて、仮想的な空間内の受聴者に聞こえる音響を再生する。端末２００は、ユーザに生成された音響を出力し、コントローラ３００がユーザから受け付けた入力を、コントローラ３００取得する。端末２００により取得された入力に応じて、仮想的な空間内の受聴者の位置及び姿勢が変更される。このため、情報処理装置１００は、端末２００により取得された入力に応じて変更された、仮想的な空間内の受聴者の位置及び姿勢に応じて、再生する音響を変更する。

　まず、情報処理装置１００について説明する。

　情報処理装置１００は、取得部１０１と、候補生成部１０２と、算出部１０３と、選択部１０４と、デコード部１０５と、空間生成部１０６と、レンダリング部１０７と、通信部１０８とを備える。情報処理装置１００は、プロセッサがメモリを用いて所定のプログラムを実行することで実現されうる。つまり、情報処理装置１００は、コンピュータである。

　取得部１０１は、仮想的な空間内における音響を再現するための音響情報を取得する。取得部１０１は、外部の記憶装置からネットワークを介して音響情報を取得してもよいし、内部の記憶装置から音響情報を取得してもよい。記憶装置は、光ディスク、メモリカードなどの記録媒体に記録されている情報を読み出す装置であってもよいし、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）記録媒体を内蔵しており、当該記録媒体に記録されている情報を読み出す装置であってもよい。外部の記憶装置は、例えば、インターネットを介して接続されるサーバであってもよい。なお、音響情報は、例えば、音源による音声を示す音声ストリームと、仮想的な空間を示す空間情報とを含む。

　空間情報は、仮想的な空間に配置される第１構造物を再現するためのメッシュ情報、音源位置などを含む。メッシュ情報は、構造物のサイズ、形状、色、反射率、残響特性などの情報を含む。構造物は、人工的な構造物、及び、自然の構造物を含む。つまり、構造物は、空間を規定するためのあらゆる仮想的な物体を含む。音源位置は、構造物において、音が再生（出力）される位置を示す。音源位置は、時間経過と共に変化してもよい。音源は、例えば、オブジェクトベース、ＨＯＡベース、チャンネルベースなどの音源である。

　候補生成部１０２は、それぞれが、第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成する。複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有する。複数種類の単純な立体形状は、例えば、直方体、円柱、球、及び、円錐を含む。第２構造物は、例えば、直方体、円柱、球、及び、円錐のうちの１個以上の組み合わせで構成されてもよいし、直方体、円柱、球、及び、円錐の２種類以上の各種類１個以上の組み合わせで構成されてもよい。複数の第２構造物は、互いに異なる形状を有する。

　候補生成部１０２は、第１構造物の形状と近似する形状を有するように、単純化形状の組み合わせを複数通り決定することで、複数の第２構造物を生成する。具体的には、候補生成部１０２は、受聴位置から処理対象の第１構造物を平面視した場合の、処理対象の第１構造物の投影面積と等しくなるように、複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせることで、複数の第２構造物を生成する。ここで、複数の第２構造物のそれぞれは、音源から受聴位置までの間に音の伝搬経路において、受聴位置から複数の第２構造物をそれぞれ平面視した場合の当該第２構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角と、受聴位置から第１構造物を平面視した場合の第１構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角とが互いに等しくなるように生成される。また、候補生成部１０２は、空間情報のメッシュ情報に複数の第１構造物が含まれている場合、複数の第１構造物のそれぞれについて、複数の第２構造物を生成する。

　算出部１０３は、候補生成部１０２により生成された複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出する。これにより、算出部１０３は、複数の第２構造物にそれぞれが対応する複数の反射指標値を算出する。具体的には、算出部１０３は、各第２構造物を構成している、１以上の単純な立体形状に予め対応付けられている重みの総和を反射指標値として算出する。反射指標値は、具体的には、正対する音源からの所定の音が効率よく反射されるほど大きい値が設定される指標値である。効率よく反射するとは、例えば、所定の音と反射された音とを比較したときの周波数特性の差分がより小さいことをいう。例えば、反射指標値は、直方体、円柱、球、及び、円錐の順に大きい値が設定される。

　図２は、各単純な立体形状の予め対応付けられている重みを示す表である。

　直方体には重みｗ１が対応付けられており、円柱には重みｗ１より小さい重みｗ２が対応付けられており、球体には重みｗ２より小さい重みｗ３が対応付けられており、円錐には重みｗ３より小さい重みｗ４が対応付けられている。例えば、第２構造物が直方体１個で構成される場合、算出部１０３は、重みｗ１を当該第２構造物の反射指標値として算出する。また、例えば、第２構造物が円柱１個と、球体２個との組み合わせで構成される場合、算出部１０３は、重みｗ２と、重みｗ３×２との和を当該第２構造物の反射指標値として算出する。また、例えば、第２構造物が円錐４個の組み合わせで構成される場合、算出部１０３は、重みｗ４×４を当該第２構造物の反射指標値として算出する。

　選択部１０４は、複数の第２構造物にそれぞれ対応する複数の反射指標値に基づいて、複数の第２構造物のうちの１つの第２構造物を選択する。具体的には、選択部１０４は、複数の第２構造物のうち対応する反射指標値が最小となる第２構造物を１つの第２構造物として選択する。

　デコード部１０５は、符号化されている音声ストリームに復号処理を行うことで、第１音声信号を復号する。

　空間生成部１０６は、第１構造物を、選択部１０４により選択された１つの第２構造物に置き換えることで、第１構造物の立体形状が単純化された単純化空間を生成する。

　レンダリング部１０７は、空間生成部１０６により生成された単純化空間と、受聴者の頭部の位置及び姿勢と、音源の位置とに基づいて、音源から頭部へ到来する音、及び、単純化空間の１つの第２構造物に反射して前記頭部へ到来する音の少なくとも一方の音の、到来方向と、到来するまでに伝搬する伝搬距離とを算出する。そして、レンダリング部１０７は、デコード部１０５により復号された第１音声信号に対して、少なくとも一方の音の、到来方向及び伝搬距離を所定の頭部伝達関数（ＨＲＴＦ）に畳み込む演算を行うことで、第２音声信号を生成し、生成した第２音声信号を出力する。また、レンダリング部１０７は、空間情報と、受聴者の頭部の位置及び姿勢とに基づいて、受聴者の受聴位置から受聴者の姿勢において受聴者から見える視界を示す映像信号を生成する。映像信号は、当該視界に含まれる、構造物を単純化していない仮想的な空間内における構造物の映像である。なお、レンダリング部１０７は、通信部１０８により受信された受聴者情報に基づいて、仮想的な空間内の受聴者の受聴位置を特定する。

　通信部１０８は、端末２００との間で通信することで、端末２００との間で情報の授受を行う。通信部１０８は、例えば、出力用の第２音声信号及び映像信号を端末２００へ送信する。また、通信部１０８は、例えば、受聴者の頭部の位置及び姿勢を示す受聴者情報を端末２００から受信する。

　次に、端末２００について説明する。

　端末２００は、通信部２０１と、制御部２０２と、検出部２０３と、入力受付部２０４と、表示部２０５と、音声出力部２０６とを備える。端末２００は、例えば、ユーザの頭部に装着されるＶＲヘッドセットであってもよいし、ユーザの頭部に装着するための装着器具に取り付けられたスマートフォンなどの携帯端末であってもよい。

　通信部２０１は、情報処理装置１００との間で通信することで、情報処理装置１００との間で情報の授受を行う。通信部２０１は、例えば、受聴者の頭部の位置及び姿勢を示す受聴者情報を情報処理装置１００へ送信する。また、通信部１０８は、例えば、出力用の第２音声信号及び映像信号を情報処理装置１００から受信する。

　制御部２０２は、通信部２０１が受信した第２音声信号及び映像信号のうち、第２音声信号を音声出力部２０６へ出力し、映像信号を表示部２０５へ出力する。また、制御部２０２は、検出部２０３により検出されたユーザの頭部の動作（つまり、頭部の位置及び姿勢の変化）を取得する。また、制御部２０２は、入力受付部２０４により受け付けられた入力を取得する。入力は、仮想空間内で受聴者の位置を移動させたり、受聴者の姿勢を変更させたりすることを示す。制御部２０２は、取得したユーザの頭部の動作、及び、受聴者の頭部の位置及び姿勢を変更することを示す入力に基づいて、受聴者の受聴位置及び受聴者の頭部の姿勢を示す受聴者情報を生成し、通信部２０１を介して受聴者情報を情報処理装置１００へ送信する。制御部２０２は、頭部の動作及び入力を取得し、取得した頭部の動作及び入力に基づいて受聴者情報を生成する処理を逐次（つまり一定時間間隔で）行う。一定時間間隔は、例えば１秒未満の時間である。

　検出部２０３は、ユーザの頭部の動作を逐次検出する。検出部２０３は、ユーザの頭部の位置及び姿勢の変化を検出する。検出部２０３は、例えば、加速度センサ及び角速度センサを含む。検出部２０３は、例えば、ＩＭＵ（Inertial Measurement Unit）である。

　入力受付部２０４は、仮想空間内で受聴者の位置を移動させたり、受聴者の頭部の姿勢を変更させたりすることを示す入力をユーザに操作されたコントローラ３００から受け付ける。入力受付部２０４は、コントローラ３００との間で無線通信することでコントローラ３００からの入力を受け付けてもよいし、有線通信することでコントローラ３００からの入力を受け付けてもよい。コントローラ３００からの入力を受け付ける入力受付部２０４の機能は、通信部２０１が有していてもよい。入力受付部２０４は、ユーザからの入力を直接受け付けるボタン、タッチセンサなどを有していてもよい。

　表示部２０５は、制御部２０２により出力された映像信号が示す映像（動画像）を表示する。動画像は、複数のフレームから構成される映像である。映像は、静止画であってもよい。表示部２０５は、例えば、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイなどである。

　音声出力部２０６は、制御部２０２により出力された音声信号が示す音声（音楽を含む）を出力する。音声出力部２０６は、例えば、スピーカなどである。

　コントローラ３００は、ユーザからの入力を受け付け、受け付けた入力を端末２００に送信する装置である。

　［２．動作］
　次に、情報処理装置１００の動作、つまり、情報処理装置１００により実行される情報処理方法について説明する。

　図３は、情報処理装置の動作の一例を示すフローチャートである。

　情報処理装置１００は、空間情報に含まれる仮想的な空間を単純化する（Ｓ１１）。仮想的な空間を単純化する処理の詳細は、後述する。

　次に、情報処理装置１００は、仮想的な空間内の受聴者の頭部の位置及び姿勢を含む受聴者情報取得する（Ｓ１２）。

　次に、情報処理装置１００は、空間生成部１０６により生成された単純化空間と、受聴者の頭部の位置及び姿勢と、音源の位置とに基づいて、音源から頭部へ到来する音、及び、単純化空間の１つの第２構造物に反射して前記頭部へ到来する音の少なくとも一方の音の、到来方向と、到来するまでに伝搬する伝搬距離とを算出する。そして、情報処理装置１００は、復号された第１音声信号に対して、少なくとも一方の音の、到来方向及び伝搬距離を所定の頭部伝達関数（ＨＲＴＦ）に畳み込む演算を行い、第２音声信号を生成する（Ｓ１３）。

　次に、情報処理装置１００は、生成した第２音声信号を出力する（Ｓ１４）。

　図４は、仮想的な空間を単純化する処理の一例を示すフローチャートである。

　情報処理装置１００は、空間情報を取得する（Ｓ２１）。空間情報は、仮想的な空間を再現するための情報である。仮想的な空間は、仮想的な空間内に配置される構造物と、音源とを含む。

　情報処理装置１００は、仮想的な空間内の受聴者の受聴位置を取得する（Ｓ２２）。

　次に、情報処理装置１００は、仮想的な空間内の１以上の第１構造物のそれぞれについて、ステップＳ２３～ステップＳ２６を含むループを実行する。

　情報処理装置１００は、それぞれが、処理対象の第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成する（Ｓ２３）。

　次に、情報処理装置１００は、複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、複数の第２構造物にそれぞれ対応する複数の反射指標値を算出する（Ｓ２４）。

　次に、情報処理装置１００は、複数の反射指標値に基づいて、複数の第２構造物の内の１つの第２構造物を選択する（Ｓ２５）。

　情報処理装置１００は、第１構造物を、選択した１つの第２構造物に置き換える（Ｓ２６）。

　情報処理装置１００は、１以上の第１構造物の全てについて、ステップＳ２３～ステップＳ２６を実行するとループを終了する。これにより、全ての第１構造物が第２構造物に置換された単純化空間が生成される。

　なお、情報処理装置１００は、上記ループを実行しなくてもよく、仮想的な空間内の１以上の第１構造物のそれぞれについて、ステップＳ２３～Ｓ２６の処理を実行できればよい。

　図５は、仮想的な空間の具体例を示す図である。

　図５に示すように、仮想的な空間ＶＳ１００は、複数の第１構造物３０１と、音源３０２と、受聴者３１０とを含む。情報処理装置１００は、円弧状に湾曲している第１構造物３０１を、より単純な形状の第２構造物に置き換える。例えば、受聴者３１０の受聴位置から第１構造物３０１を平面視した場合の第１構造物３０１の投影形状３１１の投影面積と等しくなるように、複数種類の単純な立体形状の内の１種類以上の立体形状を組み合わせることで、複数の第２構造物を生成する。複数の第２構造物は、例えば、１個の直方体形状、５個の円柱を組み合わせた形状、２０個の球を組み合わせた形状、１０個の円錐を組み合わせた形状などであってもよい。

　［３．効果］
　本実施の形態に係る情報処理装置１００は、下記の情報処理方法を行う。情報処理装置１００は、仮想的な空間を再現するための空間情報を取得する。仮想的な空間は、仮想的な空間内に配置される第１構造物と、音源とを含む。情報処理装置１００は、それぞれが、第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成する。複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有する。情報処理装置１００は、複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、複数の第２構造物にそれぞれ対応する複数の反射指標値を算出する。情報処理装置１００は、複数の反射指標値に基づいて、複数の第２構造物のうちの１つの第２構造物を選択する。情報処理装置１００は、第１構造物を、選択した１つの第２構造物に置き換えることで、第１構造物の立体形状が単純化された単純化空間を生成する。

　また、情報処理装置１００は、さらに、仮想的な空間内の受聴者の受聴位置を特定する。情報処理装置１００は、複数の第２構造物の生成において、受聴位置から第１構造物を平面視した場合の第１構造物の投影面積と等しくなるように、複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせることで、複数の第２構造物を生成する。

　また、複数の第２構造物のそれぞれは、音源から受聴位置までの間に音の伝搬経路において、受聴位置から複数の第２構造物をそれぞれ平面視した場合の当該第２構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角と、受聴位置から第１構造物を平面視した場合の第１構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角とが互いに等しくなるように生成される。

　また、情報処理装置１００は、１つの第２構造物の選択において、複数の第２構造物のうち対応する反射指標値が最小となる第２構造物を１つの第２構造物として選択する。

　また、情報処理装置１００は、さらに、下記の処理を行う。情報処理装置１００は、仮想的な空間内の受聴者の頭部の位置及び姿勢を特定する。情報処理装置１００は、単純化空間と、頭部の位置及び姿勢と、音源の位置とに基づいて、音源から頭部へ到来する音、及び、単純化空間の１つの第２構造物に反射して頭部へ到来する音の少なくとも一方の音の、到来方向と、到来するまでに伝搬する伝搬距離とを算出する。情報処理装置１００は、少なくとも一方の音の、到来方向及び伝搬距離を所定の頭部伝達関数に畳み込むことで、音声信号を生成する。情報処理装置１００は、生成した音声信号を出力する。

　また、頭部の位置及び姿勢と、音源の位置とは、互いに異なる複数のタイミングで特定される。複数のタイミングのそれぞれ毎に、伝搬距離の算出、音声信号の生成、及び、音声信号の出力が行われる。

　例えば、情報処理装置１００は、プロセッサと、メモリとを備え、プロセッサは、メモリを用いて、上記の処理を行う。

　［その他の実施の形態等］
　以上のように、本開示について上記の実施の形態に基づいて説明してきたが、本開示は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本開示に含まれる。

　（１）上記の実施の形態における各装置は、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記ＲＡＭまたはハードディスクユニットには、コンピュータプログラムが記録されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

　（２）上記の実施の形態における各装置は、構成する構成要素の一部または全部は、１個のシステムＬＳＩ（Large Scale Integration：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。前記ＲＡＭには、コンピュータプログラムが記録されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

　また、上記の各装置を構成する構成要素の各部は、個別に１チップ化されていても良いし、一部またはすべてを含むように１チップ化されてもよい。

　また、ここでは、システムＬＳＩとしたが、集積度の違いにより、ＩＣ、ＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

　（３）上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしてもよい。前記ＩＣカードまたは前記モジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。前記ＩＣカードまたは前記モジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ＩＣカードまたは前記モジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。

　（４）本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。

　また、本開示は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Ｂｌｕ－ｒａｙ（登録商標）　Ｄｉｓｃ）、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。

　また、本開示は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

　また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記録しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。

　また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

　（５）上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。

　本開示は、立体音響の再生に要する処理負荷を低減することができる情報処理方法、情報処理装置、及び、プログラムなどに利用可能である。

　　１　　音響再生システム
１００　　情報処理装置
１０１　　取得部
１０２　　候補生成部
１０３　　算出部
１０４　　選択部
１０５　　デコード部
１０６　　空間生成部
１０７　　レンダリング部
１０８　　通信部
２００　　端末
２０１　　通信部
２０２　　制御部
２０３　　検出部
２０４　　入力受付部
２０５　　表示部
２０６　　音声出力部
３００　　コントローラ
３０１　　第１構造物
３０２　　音源
３１０　　受聴者
３１１　　投影形状

Claims

　仮想的な空間を再現するための空間情報を取得し、前記仮想的な空間は、前記仮想的な空間内に配置される第１構造物と、音源とを含み、
　それぞれが、前記第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成し、前記複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有し、
　前記複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、前記複数の第２構造物にそれぞれ対応する複数の反射指標値を算出し、
　前記複数の反射指標値に基づいて、前記複数の第２構造物のうちの１つの第２構造物を選択し、
　前記第１構造物を、選択した前記１つの第２構造物に置き換えることで、前記第１構造物の立体形状が単純化された単純化空間を生成する
　情報処理方法。
　さらに、
　前記仮想的な空間内の受聴者の受聴位置を特定し、
　前記複数の第２構造物の生成では、前記受聴位置から前記第１構造物を平面視した場合の前記第１構造物の投影面積と等しくなるように、前記複数種類の単純な立体形状のうちの前記１種類以上の立体形状を組み合わせることで、前記複数の第２構造物を生成する
　請求項１に記載の情報処理方法。
　前記複数の第２構造物のそれぞれは、前記音源から前記受聴位置までの間に音の伝搬経路において、前記受聴位置から前記複数の第２構造物をそれぞれ平面視した場合の当該第２構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角と、前記受聴位置から前記第１構造物を平面視した場合の前記第１構造物の投影形状の重心位置と重心位置を挟む２点の位置との３つの位置のそれぞれの位置における音の反射角とが互いに等しくなるように生成される
　請求項２に記載の情報処理方法。
　前記複数の第２構造物は、互いに異なる形状を有する
　請求項１から３のいずれか１項に記載の情報処理方法。
　前記１つの第２構造物の選択では、前記複数の第２構造物のうち対応する反射指標値が最小となる第２構造物を前記１つの第２構造物として選択する
　請求項１から４のいずれか１項に記載の情報処理方法。
　さらに、
　前記仮想的な空間内の受聴者の頭部の位置及び姿勢を特定し、
　前記単純化空間と、前記頭部の位置及び姿勢と、前記音源の位置とに基づいて、前記音源から前記頭部へ到来する音、及び、前記単純化空間の前記１つの第２構造物に反射して前記頭部へ到来する音の少なくとも一方の音の、到来方向と、到来するまでに伝搬する伝搬距離とを算出し、
　前記少なくとも一方の音の、前記到来方向及び前記伝搬距離を所定の頭部伝達関数に畳み込むことで、音声信号を生成し、
　生成した音声信号を出力する
　請求項１から５のいずれか１項に記載の情報処理方法。
　前記頭部の位置及び姿勢と、前記音源の位置とは、互いに異なる複数のタイミングで特定され、
　前記複数のタイミングのそれぞれ毎に、前記伝搬距離の算出、前記音声信号の生成、及び、前記音声信号の出力が行われる
　請求項６に記載の情報処理方法。
　請求項１から７のいずれか１項に記載の情報処理方法をコンピュータに実行させるためのプログラム。
　プロセッサと、
　メモリと、を備え、
　前記プロセッサは、前記メモリを用いて、
　仮想的な空間を再現するための空間情報を取得し、前記仮想的な空間は、前記仮想的な空間内に配置される第１構造物と、音源とを含み、
　それぞれが、前記第１構造物の形状を単純化するための単純化形状を有する複数の第２構造物を生成し、前記複数の第２構造物のそれぞれの単純化形状は、予め定められた複数種類の単純な立体形状のうちの１種類以上の立体形状を組み合わせた形状を有し、
　前記複数の第２構造物のそれぞれについて、当該第２構造物の音の反射効率に関連する反射指標値を算出することで、前記複数の第２構造物にそれぞれ対応する複数の反射指標値を算出し、
　前記複数の反射指標値に基づいて、前記複数の第２構造物のうちの１つの第２構造物を選択し、
　前記第１構造物を、選択した前記１つの第２構造物に置き換えることで、前記第１構造物の立体形状が単純化された単純化空間を生成する
　情報処理装置。