JP6463955B2 - 三次元音響再生装置及びプログラム - Google Patents

三次元音響再生装置及びプログラム Download PDF

Info

Publication number
JP6463955B2
JP6463955B2 JP2014239135A JP2014239135A JP6463955B2 JP 6463955 B2 JP6463955 B2 JP 6463955B2 JP 2014239135 A JP2014239135 A JP 2014239135A JP 2014239135 A JP2014239135 A JP 2014239135A JP 6463955 B2 JP6463955 B2 JP 6463955B2
Authority
JP
Japan
Prior art keywords
component
channel
wrapped
channels
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014239135A
Other languages
English (en)
Other versions
JP2016100877A (ja
Inventor
靖茂 中山
靖茂 中山
大出 訓史
訓史 大出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2014239135A priority Critical patent/JP6463955B2/ja
Publication of JP2016100877A publication Critical patent/JP2016100877A/ja
Application granted granted Critical
Publication of JP6463955B2 publication Critical patent/JP6463955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

この発明は、三次元音響再生装置及びプログラムに関し、特に、2チャンネル以上の音響信号からなるマルチチャンネル立体音響を頭部伝達関数(HRTF:Head-Related Transfer Function)によりバイノーラル化(両耳聴化)して再生するものに関する。
スーパーハイビジョンの音響方式である22.2マルチチャンネル音響は、22個のスピーカと2個の低音効果(LFE:Low Frequency Effects)用のスピーカとを視聴者を取り囲むように配置して、三次元的な音響空間を再現する方式である。この22.2マルチチャンネル音響を家庭で簡易に再生するための要素技術として、バイノーラル技術の研究が進められている(非特許文献1参照)。
バイノーラル技術は、音源から左右耳までの音の伝搬特性を模擬することで、聴取者に任意の方向の音源から音が到来するように知覚させる技術である。音源から左右耳までの音の伝搬特性を頭部伝達関数(HRTF:Head-Related Transfer Function)といい、この頭部伝達関数を音響信号に作用させることによって、ヘッドホン再生やトランスオーラル再生にて知覚される音の到来方向を制御することができる。
松井健太郎、「スーパーハイビジョン音響用バイノーラル技術」、日本放送協会放送技術研究所、NHK技研R&D(134)、p.20-25、2012年07月
頭部伝達関数を用いた再生では、音像定位がはっきりした信号の方向については比較的認識しやすいが、音像成分と比較して、周囲を囲まれたような音像や残響など包み込まれ感を空間的に再現するものの中には、その音響空間を認識しにくいものがある。
したがって、かかる点に鑑みてなされた本発明の目的は、マルチチャンネル音響信号をバイノーラル化して再生する際、マルチチャンネル音響信号の包み込まれ成分を強調して再生することが可能な三次元音響再生装置及びプログラムを提供することにある。
上述した諸課題を解決すべく、本発明に係る三次元音響再生装置は、マルチチャンネル音響信号を音像成分と包み込まれ成分とに分離する分析部と、前記音像成分をバイノーラル化する音像成分処理部と、前記包み込まれ成分を強調してバイノーラル化する包み込まれ成分強調処理部と、バイノーラル化された前記音像成分及び前記包み込まれ成分を加算する加算器とを備え、前記分析部は、前記マルチチャンネル音響信号を分散共分散行列により主成分分析し、得られた固有値の大きさに基づき前記マルチチャンネル音響信号を前記音像成分と前記包み込まれ成分とに分離し、前記包み込まれ成分強調処理部は、前記マルチチャンネル音響信号のチャンネル数で前記包み込まれ成分をバイノーラル化した信号より両耳間相関係数が小さくなるように前記包み込まれ成分のチャンネル数を変更し、変更後のチャンネル数による前記包み込まれ成分をバイノーラル化することにより前記包み込まれ成分を強調する、ものである。
また、前記包み込まれ成分強調処理部は、前記包み込まれ成分のチャンネル数を前記マルチチャンネル音響信号のチャンネル数より増加させる場合、前記マルチチャンネル音響信号において隣り合う2つのチャンネルの間に新たなチャンネルを設ける、ことが好ましい。
また、前記包み込まれ成分強調処理部は、前記包み込まれ成分のチャンネル数を変更する場合、変更後のチャンネル配置による再生時のパワーが前記マルチチャンネル音響信号による再生時のパワーから変化しないよう各チャンネルの出力を調整する、ことが好ましい。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記三次元音響再生装置として機能させるものである。
本発明に係る三次元音響再生装置及びプログラムによれば、マルチチャンネル音響信号をバイノーラル化して再生する際、マルチチャンネル音響信号の包み込まれ成分を強調して再生することが可能になる。
本発明の一実施形態に係る三次元音響再生装置の概略構成を示す図である。 分析部の概略構成を示す図である。 包み込まれ成分強調処理部の概略構成を示す図である。
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。なお、本実施形態では、マルチチャンネル音響信号として22.2マルチチャンネル音響信号を例に説明を行うが、本発明はこれに限定されず、5.1チャンネル音響信号など、種々のマルチチャンネル音響方式の音響信号に対応できるものである。以降の説明において、22.2マルチチャンネル音響信号を適宜「22ch音響信号」と略記する。
図1は、本発明の一実施形態に係る三次元音響再生装置の概略構成を示す図である。三次元音響再生装置は、分析部10と、包み込まれ成分強調処理部20と、音像成分処理部30と、加算器40を備える。三次元音響再生装置の各機能部10〜40は、CPU等の好適なプロセッサや好適な電子回路により構成されるものである。
分析部10は、マルチチャンネル音響信号から音像成分と包みこまれ成分とを分離する。包み込まれ成分強調処理部20は、マルチチャンネル音響信号の包み込まれ成分を強調し、2チャンネルの信号へとバイノーラル化する。また、音像成分処理部30は、マルチチャンネル音響信号の音像成分に頭部伝達関数を作用させ2チャンネルの信号へとバイノーラル化する。加算器40は、包み込まれ成分に対応する2チャンネルの信号と、音像成分に対応する2チャンネルの信号とを加算して出力し、出力信号は後段の再生装置(図示せず)にてヘッドホン再生又はトランスオーラル再生される。
以下、分析部10及び包み込まれ成分強調処理部20について詳述する。
分析部10は、マルチチャンネル音響信号から音像成分と包みこまれ成分を分離する。音像成分とは、音像定位(信号の方向)がはっきりした信号であり、包み込まれ成分とは、残響等の空間的な特徴(包み込まれ感)に関する信号である。図2は、分析部10の概略構成を示す図である。分析部10は、主成分分析部11と、固有値判定部12と、変換行列生成部13と、音像成分変換部14と、包み込まれ成分変換部15と、を備える。
主成分分析部11は、あるサンプル数(例えば2048サンプル)を単位とするフレーム毎に、入力されたマルチチャンネル音響信号を分散共分散行列により主成分分析する。主成分分析の結果、固有値と固有値に対応した固有ベクトルが出力される。
固有値判定部12は、主成分分析により得られた固有値の総計とそれぞれの固有値の大きさから、音像成分に対応する固有値と包み込まれ成分に対応する固有値とを判定する。例えば、固有値判定部12は、所定値以上の固有値を音像成分に対応する固有値とし、それ以外の固有値を包み込まれ成分に対応する固有値とすることができる。また、固有値判定部12は、固有値の大きい方から順に累計して固有値の総計に占める割合が所定値以内となる固有値を音像成分に対応する固有値とし、それ以外の固有値を包み込まれ成分に対応する固有値とすることができる。また、固有値判定部12は、固有値の大きい方から順に所定数の固有値を音像成分に対応する固有値とし、それ以外の固有値を包み込まれ成分に対応する固有値とすることができる。
変換行列生成部13は、音像成分に対応する固有値の固有ベクトルを用いて音像成分変換行列を生成する。また、変換行列生成部13は、包み込まれ成分に対応する固有値の固有ベクトルを用いて包み込まれ成分変換行列を生成する。
音像成分変換部14は、変換行列生成部13が生成した音像成分変換行列を入力信号である22ch音響信号に作用させることにより、入力信号から音像成分を分離することができる。音像成分変換部14は、後段の頭部伝達関数による処理のため、分離した音像成分を22.2マルチチャンネル音響の信号として出力する。
包み込まれ成分変換部15は、変換行列生成部13が生成した包み込まれ成分変換行列を入力信号である22ch音響信号に作用させることにより、入力信号から包み込まれ成分を分離して出力する。包み込まれ成分変換部15は、後段の頭部伝達関数による処理のため、分離した音像成分を22.2マルチチャンネル音響の信号として出力する。
包み込まれ成分強調処理部20は、マルチチャンネル音響信号の包み込まれ成分を強調し、ヘッドホン等による再生のため2チャンネルの信号へとバイノーラル化(両耳聴化)する。ここで、包み込まれ感に関する指標として両耳間相関係数(IACC:Inter-Aural Cross Correlation)が知られており、一般に、再生される音響信号のIACCが大きいと空間的な包み込まれ感を認識することが困難になり、IACCが小さいと空間的な包み込まれ感を認識することが可能となる。このため、本実施形態に係る包み込まれ成分強調処理部20は、再生する音響信号のIACCが小さくなるように包み込まれ成分のチャンネル数を変更する。
ここで、チャンネル数の変換には、チャンネル数を増やす方向と減らす方向が考えられる。一般に、スピーカにより音響信号の再生を行った場合、部屋の反射音が付加されるため、時間・空間的に入力されたマルチチャンネル音響信号以上のチャンネル数と同等の再生環境になっていると考えられる。一方、音の方向性の内、前後感や上下感に関わる特徴量として周波数特性上のピーク・ノッチの存在が指摘されているが、包み込まれ成分とより多くの方向(チャンネル)からの信号とを頭部伝達関数を作用させ加算して再生すると、それぞれの周波数特徴量が異なるため、マスキング効果により、結果的に方向性が失われてしまうことも考えられる。そのため、包み込まれ成分強調処理部20によるチャンネル数の変更はチャンネルの増加又は減少の一方向に限定されず、IACCを小さくする任意の方向に変更できるものである。
図3は、包み込まれ成分強調処理部20の概略構成を示す図である。包み込まれ成分強調処理部20は、チャンネル数変換部21と、HRTF処理部22と、IACC計算部23と、を備える。
チャンネル数変換部21は、包み込まれ成分である22ch音響信号を他のチャンネル数の信号(Nch信号)へと変換する。なお、Nの値は2以上とする。チャンネル数変換部21は、22ch音響信号をより多いチャンネル数にアップミックスする場合と、より少ないチャンネル数にダウンミックスする場合とがある。チャンネル数変換部21は、チャンネル数を増やしてアップミックスする場合、22.2チャンネルのうち隣り合う2つのチャンネルの間に新たなチャンネルを設け、隣り合う信号をミックスした信号を生成した新たなチャンネルへ割り当てることができる。この場合、チャンネル数変換部21は、新たなチャンネルを含む3つのチャンネルの合計パワーが同じになるようにレベルを調整しても良い。チャンネル数変換部21は、チャンネル数を減らしてダウンミックスする場合、所望のチャンネル配置に対して再生時のパワーが変化しないようにレベル調整を行うことができる。
HRTF処理部22は、チャンネル数変更後のNch信号に対し、Nch信号に対応する頭部伝達関数を作用させ、2チャンネルの信号へとバイノーラル化する。
IACC計算部23は、HRTF処理部22による2チャンネルの信号のIACCを計算し、その際のチャンネル配置情報をIACCの値と共に保持する。
包み込まれ成分強調処理部20は、Nの値を順次インクリメント又はデクリメントさせながら、22ch音響信号に対する全組み合わせについて、チャンネル数変換部21、HRTF処理部22、IACC計算部23の処理を繰り返すことにより、少なくとも22ch音響信号として包み込まれ成分をバイノーラル化した際のIACCよりIACCが小さくなるチャンネル配置(Nch信号)を検出し、対応するNch信号を頭部伝達関数によりバイノーラル化して出力する。好適には、包み込まれ成分強調処理部20は、ダウンミックス及びアップミックスを含む種々のチャンネル配置に対してIACCの検出を繰り返し行い、その中でIACCが最小となるチャンネル配置(Nch信号)を検出し、対応するNch信号を頭部伝達関数によりバイノーラル化して出力する。
このように、本実施形態によれば、包み込まれ成分強調処理部20は、入力信号であるマルチチャンネル音響信号のチャンネル数で包み込まれ成分をバイノーラル化した信号よりも、両耳間相関係数が小さくなるように包み込まれ成分のチャンネル数を変更し、変更後のチャンネル数による包み込まれ成分をバイノーラル化することにより前記包み込まれ成分を強調する。これにより、マルチチャンネル音響信号をバイノーラル化して再生する際、マルチチャンネル音響信号の包み込まれ成分を強調して再生することが可能になる。すなわち、包み込まれ感が認識しにくい番組などでも包み込まれ感を強調することで音響空間の広がりを向上させることが可能になる。
また、包み込まれ成分強調処理部20は、包み込まれ成分のチャンネル数を増加させる場合、入力信号のマルチチャンネル音響方式において隣り合う2つのチャンネルの間に新たなチャンネルを設けることができる。これにより、アップミックスに伴う新たなチャンネル位置決定の演算負荷を低減し、かつ、新たなチャンネルを変更前のチャンネル配置に対し効果的な位置に配置することが可能となる。
また、包み込まれ成分強調処理部20は、包み込まれ成分のチャンネル数を変更する場合、変更後のチャンネル配置による再生時のパワーが入力信号のマルチチャンネル音響方式による再生時のパワーから変化しないよう各チャンネルの出力を調整することができる。これにより、後段で音像成分のバイノーラル信号と加算され再生された場合、包み込まれ成分のみが過剰に増大又は縮小されることを防ぐことができ、聴取時の違和感を低減することが可能になる。
また、分析部10は、マルチチャンネル音響信号を主成分分析し、得られた固有値に基づきマルチチャンネル音響信号を音像成分と包み込まれ成分とに分離する。これにより、音像成分と包み込まれ成分とを定量的に分離することが可能となる。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各構成部、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の構成部やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。
なお、上述した三次元音響再生装置として機能させるためにコンピュータを用いることができ、そのようなコンピュータは、三次元音響再生装置の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。
10 分析部
11 主成分分析部
12 固有値判定部
13 変換行列生成部
14 音像成分変換部
15 包み込まれ成分変換部
20 包み込まれ成分強調処理部
21 チャンネル数変換部
22 HRTF処理部
23 IACC計算部
30 音像成分処理部
40 加算器

Claims (4)

  1. マルチチャンネル音響信号を音像成分と包み込まれ成分とに分離する分析部と、
    前記音像成分をバイノーラル化する音像成分処理部と、
    前記包み込まれ成分を強調してバイノーラル化する包み込まれ成分強調処理部と、
    バイノーラル化された前記音像成分及び前記包み込まれ成分を加算する加算器とを備え、
    前記分析部は、前記マルチチャンネル音響信号を分散共分散行列により主成分分析し、得られた固有値の大きさに基づき前記マルチチャンネル音響信号を前記音像成分と前記包み込まれ成分とに分離し、
    前記包み込まれ成分強調処理部は、前記マルチチャンネル音響信号のチャンネル数で前記包み込まれ成分をバイノーラル化した信号より両耳間相関係数が小さくなるように前記包み込まれ成分のチャンネル数を変更し、変更後のチャンネル数による前記包み込まれ成分をバイノーラル化することにより前記包み込まれ成分を強調する、三次元音響再生装置。
  2. 前記包み込まれ成分強調処理部は、前記包み込まれ成分のチャンネル数を前記マルチチャンネル音響信号のチャンネル数より増加させる場合、前記マルチチャンネル音響信号において隣り合う2つのチャンネルの間に新たなチャンネルを設ける、請求項1に記載の三次元音響再生装置。
  3. 前記包み込まれ成分強調処理部は、前記包み込まれ成分のチャンネル数を変更する場合、変更後のチャンネル配置による再生時のパワーが前記マルチチャンネル音響信号による再生時のパワーから変化しないよう各チャンネルの出力を調整する、請求項1又は2に記載の三次元音響再生装置。
  4. コンピュータを、請求項1乃至のいずれか一項に記載の三次元音響再生装置として機能させるためのプログラム。
JP2014239135A 2014-11-26 2014-11-26 三次元音響再生装置及びプログラム Active JP6463955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014239135A JP6463955B2 (ja) 2014-11-26 2014-11-26 三次元音響再生装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014239135A JP6463955B2 (ja) 2014-11-26 2014-11-26 三次元音響再生装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016100877A JP2016100877A (ja) 2016-05-30
JP6463955B2 true JP6463955B2 (ja) 2019-02-06

Family

ID=56075801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014239135A Active JP6463955B2 (ja) 2014-11-26 2014-11-26 三次元音響再生装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6463955B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019230236A1 (ja) * 2018-05-28 2019-12-05 株式会社 資生堂 バイノーラル音処理装置、情報処理装置、及び、プログラム
EP3987825A1 (en) * 2019-06-20 2022-04-27 Dolby Laboratories Licensing Corporation Rendering of an m-channel input on s speakers (s<m)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03128400U (ja) * 1990-03-12 1991-12-24
JP3059191B2 (ja) * 1990-05-24 2000-07-04 ローランド株式会社 音像定位装置
JPH07123498A (ja) * 1993-08-31 1995-05-12 Victor Co Of Japan Ltd ヘッドホン再生システム
WO2009031871A2 (en) * 2007-09-06 2009-03-12 Lg Electronics Inc. A method and an apparatus of decoding an audio signal
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
JP5736124B2 (ja) * 2010-05-18 2015-06-17 シャープ株式会社 音声信号処理装置、方法、プログラム、及び記録媒体
EP2523473A1 (en) * 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer

Also Published As

Publication number Publication date
JP2016100877A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
KR102653560B1 (ko) 다채널 오디오 신호 처리 장치 및 방법
KR101567461B1 (ko) 다채널 사운드 신호 생성 장치
TWI415111B (zh) 空間解碼器單元、空間解碼器裝置、音訊系統、消費型電子裝置、產生一對雙耳輸出聲道之方法及電腦可讀媒體
US8180062B2 (en) Spatial sound zooming
KR101368859B1 (ko) 개인 청각 특성을 고려한 2채널 입체 음향 재생 방법 및장치
KR102226071B1 (ko) 다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치
JP5496235B2 (ja) 多重オーディオチャンネル群の再現の向上
BR112016001738B1 (pt) Método, aparelho incluindo um sistema de renderização de áudio e meio não transitório de processamento de objetos de áudio espacialmente difusos ou grandes
US9607622B2 (en) Audio-signal processing device, audio-signal processing method, program, and recording medium
JP2008522483A (ja) 多重チャンネルオーディオ入力信号を2チャンネル出力で再生するための装置及び方法と、これを行うためのプログラムが記録された記録媒体
US9538307B2 (en) Audio signal reproduction device and audio signal reproduction method
US20110038485A1 (en) Nonlinear filter for separation of center sounds in stereophonic audio
US20220078570A1 (en) Method for generating binaural signals from stereo signals using upmixing binauralization, and apparatus therefor
JP2006033847A (ja) 最適な仮想音源を提供する音響再生装置及び音響再生方法
JP6663490B2 (ja) スピーカシステム、音声信号レンダリング装置およびプログラム
JP5787128B2 (ja) 音響システム、音響信号処理装置および方法、並びに、プログラム
GB2574667A (en) Spatial audio capture, transmission and reproduction
JP6463955B2 (ja) 三次元音響再生装置及びプログラム
JP4951985B2 (ja) 音声信号処理装置、音声信号処理システム、プログラム
JP5372142B2 (ja) サラウンド信号生成装置、サラウンド信号生成方法、及びサラウンド信号生成プログラム
JP7332745B2 (ja) 音声処理方法及び音声処理装置
WO2024081957A1 (en) Binaural externalization processing
KR20150005438A (ko) 오디오 신호 처리 방법 및 장치
Aarts et al. NAG

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190107

R150 Certificate of patent or registration of utility model

Ref document number: 6463955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250