JP2011139263A - Stereophonic sound generation system, method for controlling the same and control program - Google Patents

Stereophonic sound generation system, method for controlling the same and control program Download PDF

Info

Publication number
JP2011139263A
JP2011139263A JP2009297581A JP2009297581A JP2011139263A JP 2011139263 A JP2011139263 A JP 2011139263A JP 2009297581 A JP2009297581 A JP 2009297581A JP 2009297581 A JP2009297581 A JP 2009297581A JP 2011139263 A JP2011139263 A JP 2011139263A
Authority
JP
Japan
Prior art keywords
sound
speaker
sound image
elevation angle
reference direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009297581A
Other languages
Japanese (ja)
Other versions
JP5472613B2 (en
JP2011139263A5 (en
Inventor
Sho Ko
捷 黄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Aizu
Original Assignee
University of Aizu
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Aizu filed Critical University of Aizu
Priority to JP2009297581A priority Critical patent/JP5472613B2/en
Publication of JP2011139263A publication Critical patent/JP2011139263A/en
Publication of JP2011139263A5 publication Critical patent/JP2011139263A5/ja
Application granted granted Critical
Publication of JP5472613B2 publication Critical patent/JP5472613B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a stereophonic sound generation system using a plane arrangement speaker capable of generating sound images localized, not only in the horizontal direction but also in the arbitrary vertical direction, by a simple method, and to provide a method for controlling the stereophonic sound generation system and a control program. <P>SOLUTION: A sound image localization setting part 301 sets localization positions (θ, α) of the sound images. A speaker selection part 302 selects speakers 40, from which sound signals from a sound source 10 are output, based on the localization positions of the sound images. A head transfer function determination part 303 reads and determines a head transfer function corresponding to the respective speakers 40 from a head transfer function table 305 based on sound image localization. An energy distribution part 304 calculates energy amounts of the sound signals to be output from the respective speakers 40. A convolution processing part 306 convolves the head transfer function determined to the sound signals to be output from the selected speakers 40, and in addition, distributes calculated energy of the sound signals for every speaker 40. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、平面配置スピーカを用いた立体音響生成システムに関するものであって、特に、立体音響を生成する時に頭部伝達関数(HRTF)を左右のスピーカグループに加えることによって立体効果を高めたシステムに係る。   The present invention relates to a stereophonic sound generation system using planarly arranged speakers, and in particular, a system that enhances the stereoeffect by adding a head related transfer function (HRTF) to left and right speaker groups when generating stereophonic sound. Concerning.

従来では、3Dの立体音響を再現する手法として、特許文献1に示されるように、全空間をカバーするように立体的にスピーカを配置し、各スピーカの音量比を操作して立体的な音像を生成するAP(Amplitude Panning)法がある。このようなAP法は、ターゲットとする音像方向の近傍のスピーカだけを利用するので、仰角方向の音像を再現するためには高い位置にスピーカを配置する必要がある。   Conventionally, as a technique for reproducing 3D stereophonic sound, as disclosed in Patent Document 1, three-dimensional sound images are arranged by three-dimensionally arranging speakers so as to cover the entire space and operating the volume ratio of each speaker. There is an AP (Amplitude Panning) method for generating. Since such an AP method uses only a speaker in the vicinity of the target sound image direction, it is necessary to place the speaker at a high position in order to reproduce a sound image in the elevation angle direction.

しかしながら、一般的な家庭環境では、立体配置スピーカシステムのように高い位置にスピーカを配置することは困難であるため、この観点から、平面配置スピーカによる立体音響生成システムに関する提案が、例えば特許文献2や特許文献3に示すように従来からなされている。これらは、クロストークのない2チャンネルヘッドホン再生に近い状態をスピーカシステムで実現する方法である。代表的なものとしてクロストークを逆フィルターによってキャンセルするトランスノーラル法などがある。   However, in a general home environment, it is difficult to arrange a speaker at a high position as in a three-dimensional speaker system. From this viewpoint, a proposal regarding a three-dimensional sound generation system using a planar speaker is disclosed in Patent Document 2, for example. Or, as shown in Patent Document 3, it has been conventionally performed. These are methods for realizing a state close to 2-channel headphone playback without crosstalk with a speaker system. A typical example is a transnormal method in which crosstalk is canceled by an inverse filter.

また、特許文献4のように、FIRフィルタを適用することにより、同一平面に配置された2つのスピーカであっても音像を水平方向だけでなく上下方向にパンニング可能な3次元パンニング装置も提案されている。   Further, as disclosed in Patent Document 4, a three-dimensional panning device that can pan a sound image not only in a horizontal direction but also in a vertical direction by using two speakers arranged in the same plane by applying an FIR filter has been proposed. ing.

特開2009−77379号公報JP 2009-77379 A 特開平9−233600号公報JP-A-9-233600 特開2008−160265号公報JP 2008-160265 A 特許第3177714号公報Japanese Patent No. 3177714

ところで、上記特許文献2や特許文献3に示すような平面配置スピーカを用いた立体音響生成システムでは、頭部伝達関数を用いたステレオヘッドホン、あるいはクロストークキャンセル処理を加えた2チャンネルのスピーカシステムを使用しているが、処理が複雑で、受聴位置が厳しい制限を受けるといった課題が生じる。すなわち、特許文献2や特許文献3のようなトランスノーラル法を採用してクロストークをキャンセルする方法は、受聴位置が狭く当該位置からズレてしまうとクロストークが含まれてしまい、さらには環境の反響を受け易いといった課題がある。   By the way, in the stereophonic sound generation system using the planar arrangement speaker as shown in Patent Document 2 and Patent Document 3 described above, a stereo headphone using a head-related transfer function or a two-channel speaker system to which a crosstalk cancellation process is added. Although it is used, the problem is that the processing is complicated and the listening position is severely restricted. In other words, the method of canceling crosstalk by adopting the transnoral method such as Patent Document 2 and Patent Document 3 includes crosstalk when the listening position is narrow and deviates from the position, and further, the environment. There is a problem that it is easy to receive a response.

また、上記特許文献4示した方法では、上下方向のパンニングをすべてFIRフィルタで処理するために、その演算処理に時間が掛かるという課題がある。   In addition, the method disclosed in Patent Document 4 has a problem in that it takes time to perform the arithmetic processing because all panning in the vertical direction is processed by the FIR filter.

本発明は上記のような従来技術の課題を解決するために提案されたものであって、その目的は、水平方向だけでなく、任意の垂直方向に定位する音像を簡単な方法により生成することが可能な平面配置スピーカを用いた立体音響生成システム、その制御方法及び制御プログラムを提供することにある。   The present invention has been proposed in order to solve the above-described problems of the prior art, and an object thereof is to generate a sound image localized not only in the horizontal direction but also in an arbitrary vertical direction by a simple method. The present invention provides a stereophonic sound generation system using a planarly arranged speaker, a control method thereof, and a control program.

前記の目的を達成するために、本発明の平面配置スピーカによる立体音響生成システムは、5チャンネルの平面配置スピーカを備え、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成する立体音響生成システムであって、各種操作を入力する操作部と、音像の定位位置を生成する音像定位処理部と、を備え、前記音像定位処理部は、前記操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定部と、使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理部と、前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定部と、使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定部により決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理部により算出されたエネルギー配分を割り当てる畳み込み処理部と、を有し、前記音量配分処理部は、音像定位設定部による設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する第1の基準方向決定手段と、前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には受聴者を基準に前方に位置する3つの各スピーカに1/6音量を配分し、後方に位置する2つの各スピーカに1/4音量を配分する第1の音量配分手段と、前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定部により設定された音像を挟む4つの第2の基準方向を決定する第2の基準方向決定手段と、前記音像定位設定部により設定された音像の仰角が前記αv以下である場合に、[発明を実施するための形態]において述べる[数1]に基づいて、前記第2の基準方向決定手段により決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する第2の音量配分手段と、を有することを特徴とする。 In order to achieve the above object, a stereophonic sound generation system using a planar speaker according to the present invention includes a five-channel planar speaker and applies a sound image localization process to an audio signal from a sound source to place a sound image at an arbitrary position. A stereophonic sound generation system that localizes and generates stereophonic sound through the speaker, comprising: an operation unit that inputs various operations; and a sound image localization processing unit that generates a localization position of a sound image, and the sound image localization processing unit includes: A sound image localization setting unit that sets a localization position of a desired sound image input through the operation unit; a volume distribution processing unit that determines a speaker to be used and determines a volume distribution output from each speaker; and the localization of the sound image Based on the position, the head-related transfer function determination unit that determines the head-related transfer function to be convoluted with the audio signal output from each speaker, and the output from the speaker used A convolution processing unit that convolves the head-related transfer function determined by the head-related transfer function determination unit with respect to the audio signal and allocates the energy distribution calculated by the audio energy distribution processing unit, and the volume Regardless of the setting by the sound image localization setting unit, the distribution processing unit sets the first reference direction of the sound image as a reference with respect to the listener, a direction in which the elevation angle is 0 degrees and each azimuth angle is the speaker position, and the elevation angle is α v A direction in which each azimuth is an intermediate position between adjacent speakers other than the center speaker, and a direction in which each elevation is 90 degrees and each azimuth is 0 degrees. And a first reference direction determination means for determining the total volume of the audio signal from the sound source to the speakers in the first reference direction when the elevation angle is 0 degree in the first reference direction. And the first When the elevation angle is α v among the two reference directions, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth angle, and the elevation angle is 90 ° among the first reference directions. First volume distribution means for allocating 1/6 volume to each of the three speakers located in front of the listener and ¼ volume to each of the two speakers located behind, A second reference direction determining means for determining four second reference directions sandwiching the sound image set by the sound image localization setting unit from the viewpoints of elevation angle and azimuth angle from among the first reference directions; When the elevation angle of the sound image set by the sound image localization setting unit is equal to or less than α v , the second reference direction determining means determines the angle based on [Formula 1] described in [Mode for Carrying Out the Invention]. Volume distribution in each second reference direction determined and a predetermined coupling coefficient Multiplies, by adding in all the second reference direction component of this value has been determined, and having a second volume allocation means for calculating the volume distribution of each speaker, a.

以上のような本発明によれば、受聴者の耳と同程度の高さの水平面上に配置するスピーカを用いる場合であっても、水平方向(方位角の方向)だけでなく垂直方向(仰角の方向)にも自由に定位する音像を生成し立体音響を実現可能な立体音響システム、その制御方法及び制御プログラムを提供することができる。特に、現在のサラウンドシステムで採用されている5.1チャンネルの標準スピーカシステムを利用することで立体音響を生成することができるため、特別な生成装置や、立体的にスピーカを配置することが必要ない利点を有する。   According to the present invention as described above, not only in the horizontal direction (direction of azimuth) but also in the vertical direction (elevation angle), even when using a speaker placed on a horizontal plane that is as high as the ears of the listener. 3D), a stereophonic sound system capable of generating a stereo image freely and also realizing stereophonic sound, a control method thereof, and a control program can be provided. In particular, since it is possible to generate stereophonic sound by using the 5.1 channel standard speaker system adopted in the current surround system, it is necessary to arrange special speakers and speakers in three dimensions. Has no advantage.

また、本発明は、できるだけ多くのスピーカを用い、多方向からの信号にそれぞれ左か右の頭部伝達関数を畳み込むことによってクロストークの影響を軽減することができるため、クロストークのキャンセル処理を必要とせず、受聴位置の制限を緩くすることが可能である。さらに、通常は受聴位置をスピーカシステムの中心とすることを理想とするが、その近傍においても良好な立体音響を実現することができ、また、受聴者の頭の回転や左右、前後の移動の影響を少なくすることが可能である。   In addition, the present invention can reduce the influence of crosstalk by using as many speakers as possible and convolving the left or right head-related transfer functions with signals from multiple directions. It is possible to relax the listening position restriction without the need. In addition, it is ideal to have the listening position at the center of the speaker system, but good stereophonic sound can be achieved in the vicinity of the speaker system, and the listener's head can be rotated and moved left and right and back and forth. It is possible to reduce the influence.

本発明の実施形態に係る立体音響生成システムの全体構成の一例を示すブロック図。The block diagram which shows an example of the whole structure of the stereophonic sound production | generation system which concerns on embodiment of this invention. 本発明の実施形態に係る立体音響生成システムの平面配置スピーカ(5チャンネル)の配置例を示す図。The figure which shows the example of arrangement | positioning of the planar arrangement | positioning speaker (5 channels) of the stereophonic sound generation system which concerns on embodiment of this invention. 本発明の実施形態に係る立体音響生成システムの音像の定位例を示す図。The figure which shows the localization example of the sound image of the stereophonic sound production | generation system which concerns on embodiment of this invention. 本発明の実施形態に係る立体音響生成システムの平面配置スピーカ(8チャンネル)の配置例を示す図。The figure which shows the example of arrangement | positioning of the planar arrangement | positioning speaker (8 channels) of the stereophonic sound generation system which concerns on embodiment of this invention. 本発明の実施形態に係る立体音響生成システムのスピーカ配置及び基準方向(第1の基準方向)を示す図(5チャンネル)。The figure (5 channels) which shows the speaker arrangement | positioning and reference direction (1st reference direction) of the stereophonic sound production | generation system which concerns on embodiment of this invention. 本発明の実施形態に係る立体音響生成システムのスピーカ配置及び基準方向(第1の基準方向)を示す図(8チャンネル)。The figure (8 channels) which shows the speaker arrangement | positioning and reference direction (1st reference direction) of the stereophonic sound production | generation system which concerns on embodiment of this invention.

[本実施形態]
[1.構成]
次に、本発明の実施形態に係る平面配置スピーカを用いた立体音響システムの構成について、図1〜3を参照して以下に説明する。図1は、本実施形態に係る立体音響システムの全体構成を示す機能ブロック図である。なお、以下では、特別言及のないの場合は5チャンネルの場合を想定し、スピーカ40は、図2に示すように、左側のスピーカグループ(L、SL、8チャンネル場合はMLも)と、右のスピーカグループ(R、SR、8チャンネルの場合はMRも)と、が配置される。
[This embodiment]
[1. Constitution]
Next, the structure of the stereophonic sound system using the planar speaker according to the embodiment of the present invention will be described below with reference to FIGS. FIG. 1 is a functional block diagram showing the overall configuration of the stereophonic sound system according to the present embodiment. In the following, the case of 5 channels is assumed unless otherwise specified, and the speaker 40 is connected to the left speaker group (L, SL, ML in the case of 8 channels) and the right as shown in FIG. Speaker groups (R, SR, and MR in the case of 8 channels) are arranged.

図1に示す通り、本実施形態に係る平面配置スピーカによる立体音響システムは、音源10と、音像の定位位置やチャンネル数の指定等、各種入力操作を行う操作部20と、後述する各機能により所望の音像の定位を実現するように、スピーカ40毎の音量配分や頭部伝達関数の付与等の定位処理を実行する音像定位処理部30と、スピーカ40(C、L、SL、R、SR)と、から構成されている。   As shown in FIG. 1, the stereophonic sound system using the planar speaker according to the present embodiment includes a sound source 10, an operation unit 20 that performs various input operations such as designation of a localization position of a sound image and the number of channels, and functions described later. A sound image localization processing unit 30 for performing localization processing such as volume distribution for each speaker 40 and provision of a head-related transfer function and a speaker 40 (C, L, SL, R, SR) so as to realize a desired sound image localization. ) And.

ここで、音像定位処理部30の具体的な構成について以下に詳述する。
まず、図1に示す通り、前記操作部20による入力操作に応じて、所望の仮想的な音像の定位位置を設定する音像定位設定部301を備えている。例えば、図3に示すように、この音像定位設定部301は、操作部20を通じて操作により、受聴者を基準とした音像の方位角θと、上下方向を決める仰角αからなる所望の音像定位(方位角θ、仰角α)を設定する。
Here, a specific configuration of the sound image localization processing unit 30 will be described in detail below.
First, as shown in FIG. 1, a sound image localization setting unit 301 is provided for setting a desired virtual sound image localization position in accordance with an input operation by the operation unit 20. For example, as shown in FIG. 3, the sound image localization setting unit 301 is operated through the operation unit 20, and a desired sound image localization (the desired sound image localization consisting of the azimuth angle θ of the sound image with respect to the listener and the elevation angle α that determines the vertical direction) Azimuth angle θ and elevation angle α) are set.

また、音像定位処理部30は、音像定位設定部301により設定された音像の定位に応じて、図2のように配置されたスピーカ40のうち、使用するものを選択するスピーカ選択部302を備えている。なお、具体的なスピーカ40の選択態様については[2.3.音声信号のエネルギー配分処理]の項目において説明する。   Further, the sound image localization processing unit 30 includes a speaker selection unit 302 that selects a speaker to be used among the speakers 40 arranged as shown in FIG. 2 according to the localization of the sound image set by the sound image localization setting unit 301. ing. In addition, about the specific selection mode of the speaker 40, [2.3. This will be described in the item of “Audio signal energy distribution processing”.

また、音像定位処理部30は、音源10からの音声信号に対して畳み込む左右のスピーカ40グループ毎の頭部伝達関数を決定する頭部伝達関数決定部303を備えている。ここで、頭部伝達関数とは、音像位置から音を発生させる場合の、音源から受聴者の耳に至るまでの音の伝達関数であり、特に、音像位置、受聴者、スピーカ位置等により区別される。そのため、頭部伝達関数決定部303は、左右のスピーカ40のグループに対しては、左側用として頭部伝達関数(HRTFL)を、右側用として頭部伝達関数(HRTFR)を、所望の音像定位(θ、α)に基づき決定する。 The sound image localization processing unit 30 includes a head-related transfer function determining unit 303 that determines a head-related transfer function for each of the left and right speaker 40 groups to be convoluted with the sound signal from the sound source 10. Here, the head-related transfer function is a transfer function of sound from the sound source to the listener's ear when sound is generated from the sound image position, and is particularly distinguished by the sound image position, listener, speaker position, etc. Is done. Therefore, the head-related transfer function determination unit 303 selects the head-related transfer function (HRTF L ) for the left side and the head-related transfer function (HRTF R ) for the right side as desired for the group of left and right speakers 40. It is determined based on the sound image localization (θ, α).

また、音像定位処理部30は、音像定位設定部301により設定された音像の定位位置に基づいて、スピーカ選択部302により選択された各スピーカ40に対して、配分する音声信号のエネルギー量を演算するエネルギー配分部304を備えている。このエネルギー配分部304による音声信号のエネルギー配分の計算態様は[2.3.音声信号のエネルギー配分処理]の項目において詳述する。なお、スピーカ選択部302とエネルギー配分部304が、特許請求の範囲上の「音量配分処理部」に対応する。   Further, the sound image localization processing unit 30 calculates the energy amount of the audio signal to be distributed to each speaker 40 selected by the speaker selection unit 302 based on the localization position of the sound image set by the sound image localization setting unit 301. An energy distribution unit 304 is provided. The calculation mode of the energy allocation of the audio signal by the energy allocation unit 304 is [2.3. This will be described in detail in the section of “Audio signal energy distribution processing”. The speaker selection unit 302 and the energy distribution unit 304 correspond to a “volume distribution processing unit” in the claims.

また、音像定位処理部30は、頭部伝達関数テーブル305を備え、5チャンネル又は8チャンネルの場合における各スピーカ40に対する受聴者毎の頭部伝達関数を格納する。   The sound image localization processing unit 30 includes a head-related transfer function table 305, and stores a head-related transfer function for each listener for each speaker 40 in the case of 5 channels or 8 channels.

また、音像定位処理部30は、音源10からの音声信号に対して頭部伝達関数決定部303により決定された頭部伝達関数を畳み込み、かつ、エネルギー配分部304により演算された音声信号のエネルギーを各スピーカ40に割り当てる畳み込み処理部306を備えている。この畳み込み処理部306は、頭部伝達関数決定部303により決定されるこの頭部伝達関数HRTFを音源10からの音声信号に畳み込むことによって、音の方向感覚を強くし、さらに、各スピーカ40に所定のエネルギーを配分することで立体的な音像を作り出す。   Further, the sound image localization processing unit 30 convolves the head-related transfer function determined by the head-related transfer function determination unit 303 with the sound signal from the sound source 10 and the energy of the sound signal calculated by the energy distribution unit 304. Is provided to each speaker 40. The convolution processing unit 306 convolves the head-related transfer function HRTF determined by the head-related transfer function determining unit 303 with the audio signal from the sound source 10, thereby strengthening the sense of direction of the sound. A three-dimensional sound image is created by allocating predetermined energy.

[2.作用]
[2.1.基本作用]
上記のような構成を有する平面配置スピーカを用いた立体音響システムにおける、音像生成の基本作用を以下に説明する。
まず、操作部20を通じて入力操作により音像定位設定部301は、ユーザが所望する音像の定位位置(θ,α)を設定する。
[2. Action]
[2.1. Basic action]
The basic operation of sound image generation in the stereophonic sound system using the planar speaker having the above configuration will be described below.
First, the sound image localization setting unit 301 sets a localization position (θ, α) of a sound image desired by the user by an input operation through the operation unit 20.

そして、スピーカ選択部302が、音像定位設定部301により設定された音像定位位置に基づいて、音源10からの音声信号を出力するスピーカ40を選択する。すなわち、5チャンネルの場合、設定された音像の定位位置に応じて、図2に示すようなスピーカ40のC、L、SL、R、SRのうちのいずれを使用するかを選択し、また、8チャンネルの場合、図4に示すようなスピーカ40のC、L、SL、ML、BC、R、SR、MRのうちのいずれかを選択する。   Then, the speaker selection unit 302 selects the speaker 40 that outputs the audio signal from the sound source 10 based on the sound image localization position set by the sound image localization setting unit 301. That is, in the case of 5 channels, according to the localization position of the set sound image, select which of C, L, SL, R, SR of the speaker 40 as shown in FIG. In the case of 8 channels, any one of C, L, SL, ML, BC, R, SR, and MR of the speaker 40 as shown in FIG. 4 is selected.

次に、頭部伝達関数決定部303は、音像定位設定部301により設定された音像定位に基づいて、左右のスピーカ40グループに対応する頭部伝達関数を頭部伝達関数テーブル305から読み出し、決定する(下記[2.2.頭部伝達関数決定及び畳み込み処理]参照。)。   Next, the head-related transfer function determination unit 303 reads out the head-related transfer functions corresponding to the left and right speaker 40 groups from the head-related transfer function table 305 based on the sound image localization set by the sound image localization setting unit 301 and determines them. (See [2.2. Head Transfer Function Determination and Convolution Processing] below.)

また、エネルギー配分部304は、スピーカ選択部302により選択された各スピーカ40から出力する音声信号のエネルギー量を算出する(下記[2.3.音声信号のエネルギー配分処理]参照。)。   Further, the energy distribution unit 304 calculates the energy amount of the audio signal output from each speaker 40 selected by the speaker selection unit 302 (see [2.3. Audio signal energy distribution process] below).

そして、畳込み処理部306は、選択されたスピーカ40により出力される音源10からの音声信号に対して頭部伝達関数決定部303により決定された頭部伝達関数を畳み込み、加えて、エネルギー配分部304により演算されたスピーカ40毎の音声信号のエネルギーを配分する。これにより、出力対象となる各スピーカ40から所定のエネルギー量の音声信号を出力することで、所望の音像の定位を実現する。   Then, the convolution processing unit 306 convolves the head-related transfer function determined by the head-related transfer function determining unit 303 with the audio signal from the sound source 10 output from the selected speaker 40, and adds the energy distribution. The energy of the audio signal for each speaker 40 calculated by the unit 304 is distributed. As a result, a desired sound image is localized by outputting a sound signal having a predetermined energy amount from each speaker 40 to be output.

[2.2.頭部伝達関数の決定及び畳み込み処理]
次に、頭部伝達関数決定部303による各スピーカ40に対する頭部伝達関数の決定処理、及び決定された頭部伝達関数の音源10からの音声信号への畳み込み処理について、具体的に説明する。
[2.2. Head Transfer Function Determination and Convolution Processing]
Next, the head-related transfer function determination process for each speaker 40 by the head-related transfer function determination unit 303 and the process of convolving the determined head-related transfer function into the audio signal from the sound source 10 will be specifically described.

この頭部伝達関数決定部303は、音像定位設定部301により設定された音像の定位位置(θ、α)に対応させるように、左右のスピーカ40のグループ毎に、頭部伝達関数テーブル305に格納された所定の頭部伝達関数(音像位置から音を発生させた場合の音源から左と右の耳までの伝達関数HRTFLとHRTFR)を読み出すことで決定する。そして、畳込み処理部306は、この頭部伝達関数決定部303により決定された頭部伝達関数を、音源10からの音声信号に対して畳み込む。 The head-related transfer function determination unit 303 stores the head-related transfer function table 305 for each group of the left and right speakers 40 so as to correspond to the sound image localization position (θ, α) set by the sound image localization setting unit 301. It is determined by reading out the stored predetermined head-related transfer functions (transfer functions HRTF L and HRTF R from the sound source to the left and right ears when sound is generated from the sound image position). Then, the convolution processing unit 306 convolves the head-related transfer function determined by the head-related transfer function determining unit 303 with the audio signal from the sound source 10.

より詳細には、5チャンネルのシステムの場合、左側のスピーカ40のグループ(L、SL、8チャンネル場合はMLも)には左の耳の頭部伝達関数HRTFL(θ,α)、右側のスピーカ40のグループ(R、SR、8チャンネルの場合はMRも)には右の耳の頭部伝達関数HRTFR(θ,α)を頭部伝達関数決定部303により決定し、頭部伝達関数畳み込み部306が、この頭部伝達関数を音源10から送られる音声信号に畳み込む。 More specifically, in the case of a 5-channel system, the left ear head transfer function HRTF L (θ, α) and the right-side speaker 40 group (L, SL, ML in the case of 8 channels) The head transfer function HRTF R (θ, α) of the right ear is determined by the head transfer function determination unit 303 for the group of speakers 40 (R, SR, and MR in the case of 8 channels), and the head transfer function is determined. The convolution unit 306 convolves this head-related transfer function with the audio signal sent from the sound source 10.

これにより、後述する音声信号のエネルギー配分処理により配分されたエネルギーで、左側のスピーカ40グループからは頭部伝達関数HRTFL(θ,α)が畳み込まれた音声信号が出力され、右側のスピーカ40グループからは頭部伝達関数HRTFR(θ,α)が畳み込まれた音声信号が出力される。 As a result, a sound signal in which the head-related transfer function HRTF L (θ, α) is convoluted is output from the left speaker 40 group with the energy distributed by the energy distribution process of the sound signal described later, and the right speaker From the 40 groups, audio signals in which the head-related transfer function HRTF R (θ, α) is convoluted are output.

また、前方(C)と後方(BC 但し、8チャンネルの場合のみ使用する。)のスピーカ40では、後述するエネルギー配分処理により当該スピーカ40に配分されたエネルギーの半分ずつを、左右の頭部伝達関数HRTFL(θ,α)と頭部伝達関数HRTFR(θ,α)が畳み込まれた音声信号で合成し、出力される。 Further, in the front (C) and rear (BC, which is used only in the case of 8 channels), half of the energy distributed to the speaker 40 by energy distribution processing described later is transmitted to the left and right heads. The function HRTF L (θ, α) and the head related transfer function HRTF R (θ, α) are synthesized with the convoluted audio signal and output.

このように、HRTFの特性を音声信号に畳み込むことによって、音の方向感覚を強くし、立体的な音像を作り出す。すなわち、トランスノーラルシステムなどとは異なり、本方法は左右のスピーカ40のグループにそれぞれ左と右のHRTFを畳み込むので、スピーカ40のグループのトータル作用でスピーカ40の位置による頭部伝達関数の影響とクロストークの影響を弱めることが可能となり、音像の方向特性を作り出すことができる。   Thus, by convolving the HRTF characteristics with the audio signal, the sense of direction of the sound is strengthened and a three-dimensional sound image is created. That is, unlike the transnormal system, the present method convolves the left and right HRTFs in the left and right speaker 40 groups, respectively, and therefore the influence of the head-related transfer function due to the position of the speakers 40 by the total action of the speaker 40 groups. It is possible to weaken the influence of crosstalk and create the direction characteristics of the sound image.

また、このような特徴を実現するためには、シングルユニットのスピーカ40よりも縦方向に配置したマルチユニットのスピーカ40を使用した方が音像の方向特性は顕著であり、受聴者の頭の上下動による影響も抑制することが可能である。   In order to realize such a feature, the direction characteristics of the sound image are more prominent when the multi-unit speaker 40 arranged in the vertical direction is used than the single unit speaker 40, and the listener's head is located above and below the head. It is also possible to suppress the effects of movement.

なお、頭部伝達関数は音像方向によってエネルギーが変化し、実測データは方向に関する連続性に欠けるので、頭部伝達関数のエネルギーを全て正規化し、音像方向による頭部伝達関数のエネルギーの違いを後述する拡張APによって実現する。   Note that the energy of the head-related transfer function changes depending on the direction of the sound image, and the measured data lacks continuity with respect to the direction. This is realized by the extended AP.

[2.3.音声信号のエネルギー配分処理]
次に、上記で示した音像定位設定部301により設定した音像の定位位置に基づいた、スピーカ選択部302及びエネルギー配分部304による決定するスピーカ40の選択処理及びスピーカ40毎のエネルギー配分処理を図5及び6、表1〜4を参照して以下に詳述する。
[2.3. Audio signal energy distribution processing]
Next, a speaker 40 selection process and an energy distribution process for each speaker 40 determined by the speaker selection unit 302 and the energy distribution unit 304 based on the sound image localization position set by the sound image localization setting unit 301 described above are shown in FIG. 5 and 6, detailed below with reference to Tables 1-4.

まず、全方向の音像の定位を考える前に、音像の基準方向(特許請求の範囲上の「第1の基準方向」に対応する。以下、第1の基準方向と称する。)となる、仰角0度で各スピーカ40の置かれる方位角、所定の仰角αv(以下では、αv=30とするが変更可能。)でスピーカ40(センタースピーカを除く)位置の中間の方位角、加えて仰角90度方向(方位角は0度)におけるエネルギー配分Epを決定する。ここで、第1の基準方向としては、隣合うスピーカ40(センタースピーカを除く)の中間位置を方位角にとるのが基本だが、仰角0度の場合は、従前のシステムとの互換性を考慮しスピーカ40の位置を採用する。また、仰角90度の場合は、いずれの方位角でも構わないため、0度に設定する。 First, before considering the localization of the sound image in all directions, the elevation angle becomes the reference direction of the sound image (corresponding to the “first reference direction” in the claims, hereinafter referred to as the first reference direction). An azimuth angle at which each speaker 40 is placed at 0 degrees, an azimuth angle in the middle of the position of the speaker 40 (excluding the center speaker) at a predetermined elevation angle α v (hereinafter, α v = 30 can be changed), The energy distribution E p in the 90 ° elevation direction (azimuth angle is 0 °) is determined. Here, as the first reference direction, the intermediate position of the adjacent speakers 40 (excluding the center speaker) is basically taken as the azimuth, but in the case of an elevation angle of 0 degrees, consideration is given to compatibility with the previous system. The position of the speaker 40 is adopted. Further, in the case of an elevation angle of 90 degrees, any azimuth angle may be used, so it is set to 0 degrees.

具体的には、通常の5チャンネル標準ホームシアターシステムの場合は、図2に示すように、スピーカ40の配置方位はC(0度)、L(30度)、R(330度)、SL(120度)とSR(240度)である。そのため、第1の基準方向及びエネルギー配分として、図5に示すように、仰角0度で方位角0、30、120、240、330度(実際にスピーカのある方位)、仰角30度で方位角0、75、180、285度(センタースピーカを除いた各スピーカの中間方位)、仰角90度(方位角任意)で方位角0度、の各スピーカ40のエネルギー配分Epp=C,L,R,SL,RL)を決め、全空間のエネルギー配分の基準とする。 Specifically, in the case of a normal 5-channel standard home theater system, as shown in FIG. 2, the arrangement orientation of the speaker 40 is C (0 degrees), L (30 degrees), R (330 degrees), SL (120 Degrees) and SR (240 degrees). Therefore, as shown in FIG. 5, as the first reference direction and energy distribution, as shown in FIG. 5, the azimuth angle is 0, 30, 120, 240, 330 degrees (the azimuth where the speaker is actually located) at the elevation angle of 0 degrees, and the azimuth angle at the elevation angle of 30 degrees Energy distribution E p ( p = C, L) of each speaker 40 of 0, 75, 180, 285 degrees (intermediate azimuth of each speaker excluding the center speaker), elevation angle 90 degrees (azimuth angle arbitrary) and azimuth angle 0 degree , R, SL, RL) are determined and used as a reference for energy distribution in the entire space.

これらの第1の基準方向における使用するスピーカ40、各スピーカ40のエネルギー配分は下記表1に示す通りである。
[表1]

Figure 2011139263
The speaker 40 used in the first reference direction and the energy distribution of each speaker 40 are as shown in Table 1 below.
[Table 1]
Figure 2011139263

また、図4に示すような8チャンネル等間隔スピーカ配置システムの場合は、スピーカの配置方位はC(0度)、L(45度)、ML(90度)、SL(135度)、BC(180度)、SR(225度)、MR(270度)、とR(315度)である。そのため、8チャンネルの場合の第1の基準方向及びエネルギー配分として、図6に示すように、仰角0度で方位角0、45、90、135、180、225、270、315度(実際にスピーカのある方位)、仰角30度で方位角0、67.5、112.5、157.5度、202.5度、247.5度と292.5度(センタースピーカを除いた各スピーカの中間方位)、仰角90度で方位角0度(方位角任意)、における各スピーカのエネルギー配分Epp=C, L, R, ML, MR, SL, RL)を決め、全空間のエネルギー配分の基準とする。 In the case of an 8-channel equally spaced speaker arrangement system as shown in FIG. 4, the speaker arrangement directions are C (0 degrees), L (45 degrees), ML (90 degrees), SL (135 degrees), BC ( 180 degrees), SR (225 degrees), MR (270 degrees), and R (315 degrees). Therefore, as the first reference direction and energy distribution in the case of 8 channels, as shown in FIG. 6, the elevation angle is 0 degree and the azimuth angles are 0, 45, 90, 135, 180, 225, 270, 315 degrees (actually speakers Azimuth), elevation angle 30 degrees, azimuth angles 0, 67.5, 112.5, 157.5 degrees, 202.5 degrees, 247.5 degrees and 292.5 degrees (middle of each speaker excluding the center speaker) Azimuth), energy distribution E p ( p = C, L, R, ML, MR, SL, RL) is determined for each speaker at an azimuth angle of 90 degrees and an azimuth angle of 0 degrees (any azimuth angle). The standard.

これらの8チャンネルの場合の第1の基準方向における、使用するスピーカ40、及び各スピーカ40のエネルギー配分は下記表2に示す通りである。
[表2]

Figure 2011139263
The speaker 40 to be used and the energy distribution of each speaker 40 in the first reference direction in the case of these eight channels are as shown in Table 2 below.
[Table 2]
Figure 2011139263

このように、スピーカ選択部302及びエネルギー配分部304では、仰角0、αv、90度における第1の基準方向を決定する機能(特許請求の範囲上の「第1の基準方向決定手段」に対応する。)と、当該第1の基準方向におけるエネルギー配分を決定する機能(特許請求の範囲上の「第1の音量配分手段」に対応する。)を有している。 As described above, the speaker selection unit 302 and the energy distribution unit 304 have a function of determining the first reference direction at elevation angles 0, α v , and 90 degrees (in the “first reference direction determination unit” in the claims). And a function for determining energy distribution in the first reference direction (corresponding to “first volume distribution means” in the claims).

次に、これらの第1の基準方向のエネルギー配分を基準に全方向のAP法に拡張する場合を説明する。上記以外の方向(θ,α)の音像に関しては、下記の[数1]に基づいて、音像定位設定部301により設定された音像の定位位置を囲む4つの基準方向(特許請求の範囲上の「第2の基準方向」に対応する。以下、第2の基準方向と称する。)のスピーカ40のエネルギー配分を基に、線形結合により最終的なスピーカのエネルギー配分を決定する。
ここでは、まず、音像定位設定部301により設定された音像の仰角αが、第1の基準方向(第1の基準方向)として設定したαv以下である場合(α≦αvの場合)について説明する。
Next, a case where the energy distribution in the first reference direction is extended to the omni-directional AP method based on the reference will be described. For sound images in directions (θ, α) other than the above, based on the following [Equation 1], four reference directions surrounding the sound image localization position set by the sound image localization setting unit 301 (on the claims) The final speaker energy distribution is determined by linear combination based on the energy distribution of the speakers 40 corresponding to the “second reference direction” (hereinafter referred to as the second reference direction).
Here, first, the elevation angle of the sound image which is set by the sound image localization setting unit 301 alpha is, for the first reference direction (the case of alpha ≦ alpha v) (first reference direction) when it is αv less set as described To do.

[数1]

Figure 2011139263
[Equation 1]
Figure 2011139263

ここで、(θrl,αl)、(θll,αl)、(θrh,αh)、(θlh,αh)は、音像定位設定部301により設定された音像に対して右下、左下、右上、左上に位置する第2の基準方向であり、また、krl、kll、krh、klhは、下記[数2]により与えられる。なお、θllとθlhが0度となる場合には、代わりに360度を用いる。 Here, (θ rl , α l ), (θ ll , α l ), (θ rh , α h ), (θ lh , α h ) are on the right with respect to the sound image set by the sound image localization setting unit 301. The second reference direction is located at the lower, lower left, upper right, and upper left, and k rl , k ll , k rh , and k lh are given by the following [ Equation 2]. When θ ll and θ lh are 0 degrees, 360 degrees is used instead.

[数2]
rl = ((θll-θ)/(θllrl)) ((αh-α)/(αhl))
ll = ((θ-θrl)/(θllrl)) ((αh-α)/(αhl))
rh = ((θlh-θ)/(θlhrh)) ((α-αl)/(αhl))
lh = ((θ-θrh)/(θlhrh)) ((α-αl)/(αhl))
[Equation 2]
k rl = ((θ ll -θ) / (θ llrl )) ((α h -α) / (α hl ))
k ll = ((θ-θ rl ) / (θ llrl )) ((α h -α) / (α hl ))
k rh = ((θ lh -θ) / (θ lhrh )) ((α-α l ) / (α hl ))
k lh = ((θ-θ rh ) / (θ lhrh )) ((α-α l ) / (α hl ))

例えば、5チャンネルシステムで音像方向が(θ,α)=(60,15)の場合では、4つの第2の基準方向は、(θrl, αl)=(30,0),(θll,αl)=(120,0),(θrh,αh)=(0,30),(θlh,αh)=(75,30)となるため、krl,kll,krh,klhは、次のように算出される。 For example, when the sound image direction is (θ, α) = (60, 15) in a 5-channel system, the four second reference directions are (θ rl , α l ) = (30, 0), (θ ll , Α l ) = (120, 0), (θ rh , α h ) = (0, 30), (θ lh , α h ) = (75, 30), so k rl , k ll , k rh , K lh are calculated as follows.

[数3]
rl=60/90×15/30=1/3
ll=30/90×15/30=1/6
rh=15/75×15/30=1/10
lh=60/75×15/30=2/5
[Equation 3]
k rl = 60/90 × 15/30 = 1/3
k ll = 30/90 × 15/30 = 1/6
k rh = 15/75 × 15/30 = 1/10
k lh = 60/75 × 15/30 = 2/5

そのため、音像の定位位置が(θ,α)=(60,15)の場合、各スピーカ40のエネルギー配分は下記表3の通りとなる。
[表3]

Figure 2011139263
Therefore, when the localization position of the sound image is (θ, α) = (60, 15), the energy distribution of each speaker 40 is as shown in Table 3 below.
[Table 3]
Figure 2011139263

このように、スピーカ選択部302及びエネルギー配分部304は、音像定位設定部301により設定された音像の定位位置に対して4方向の第2の基準方向(特許請求の範囲上の「第2の基準方向決定手段」に対応する。)を決定する機能と、この4方向の第2の基準方向におけるエネルギー配分を決定する機能(特許請求の範囲上の「第2の音量配分手段」に対応する。)を有している。   In this manner, the speaker selection unit 302 and the energy distribution unit 304 have four second reference directions (“second” in the claims) with respect to the localization position of the sound image set by the sound image localization setting unit 301. And a function for determining energy distribution in the second reference direction of the four directions (corresponding to “second volume distribution means” in the claims). .)have.

具体的には、下記のように4つの第2の基準方向を決定している。すなわち、この場合、音像定位設定部301により設定された音像の仰角が15度であるため、4つの第2の基準方向の仰角は、第1の基準方向のうち、この15度を挟む0度と30度の2つとなり、αl=0,αh=30となる。 Specifically, four second reference directions are determined as follows. That is, in this case, since the elevation angle of the sound image set by the sound image localization setting unit 301 is 15 degrees, the elevation angles of the four second reference directions are 0 degrees sandwiching the 15 degrees among the first reference directions. And 30 degrees, α l = 0 and α h = 30.

5チャンネルのシステムを仮定すれば、第1の基準方向より、αl=0の方位角は、0,30,120,240,330度であるから、この60度を挟んだ30度と120度が第2の基準方向の基準方位となる。つまり、θrlは60度より小さい値の中の最大値(30度)となり、θllは60度より大きい値の中の最小値(120度)となる。 Assuming a 5-channel system, the azimuth angle of α l = 0 from the first reference direction is 0, 30, 120, 240, and 330 degrees. Therefore, 30 degrees and 120 degrees sandwiching this 60 degrees. Is the reference orientation of the second reference direction. That is, θ rl is a maximum value (30 degrees) among values smaller than 60 degrees, and θ ll is a minimum value (120 degrees) among values larger than 60 degrees.

また、第1の基準方向より、αh=30の方位角は、0(360),75,180,285度となるので、この60度を挟んだ0度と75度が第2の基準方向の基準方位となる。つまり、θrhは60度より小さい値の中の最大値(0度)となり、θlhは60度より大きい値の中の最小値(75度)となる。 Further, the azimuth angle of α h = 30 from the first reference direction is 0 (360), 75, 180, 285 degrees, so 0 degrees and 75 degrees sandwiching the 60 degrees are the second reference direction. This is the reference orientation. That is, θ rh is the maximum value (0 degrees) among the values smaller than 60 degrees, and θ lh is the minimum value (75 degrees) among the values larger than 60 degrees.

一方、音像定位設定部301により設定された音像の仰角αが、第1の基準方向として設定したαvを上回る場合(α>αvの場合)について以下に説明する。α>αvの場合では、第2の基準方向となる右上、左上の仰角が90度(αh=90)となるため、θrhとθlhが同じとなり、音像方向を囲む3つの第2の基準方向のスピーカ40のエネルギー配分を基に、上記[数1]に基づいて、線形結合により最終的なスピーカのエネルギー配分を決める。 On the other hand, the sound image of the elevation angle alpha which is set by the sound image localization setting unit 301 (in the case of α> α v) when exceeding the αv set as a first reference direction is described below. In the case of α> α v , the upper right and upper left elevation angles that are the second reference direction are 90 degrees (α h = 90), so θ rh and θ lh are the same, and the three second surrounding the sound image direction Based on the energy distribution of the speakers 40 in the reference direction, the final speaker energy distribution is determined by linear combination based on the above [Equation 1].

具体的には、上記[数1]のkrl,kll,krh,klhは、下記[数4]により与えられる。なお、θllが0度となる場合は代わりに360度を用いる。 Specifically, k rl , k ll , k rh , and k lh in the above [ Equation 1] are given by the following [ Equation 4]. If θ ll is 0 degrees, 360 degrees is used instead.

[数4]
rl=((θll−θ)/(θll−θrl))((αh−α)/(αh−αl))
ll=((θ−θrl)/(θll−θrl))((αh−α)/(αh−αl))
lh=krh=((θ−θl)/(αh−αl))
[Equation 4]
k rl = ((θ ll −θ) / (θ ll −θ rl )) ((α h −α) / (α h −α l ))
k ll = ((θ−θ rl ) / (θ ll −θ rl )) ((α h −α) / (α h −α l ))
k lh = k rh = ((θ−θ l ) / (α h −α l ))

例えば、同じく5チャンネルシステムで音像定位設定部301により設定された音像の定位位置が(θ,α)=(60,60)の場合では、3つの第2の基準方向は(θrl,αl)=(0,30),(θll,αl)=(75,30),(θrh,αh)=(θlh,αh)=(−,90)となり、また、krl,kll,krh,klhは、上記[数4]に基づき次のように算出される。 For example, when the localization position of the sound image set by the sound image localization setting unit 301 is (θ, α) = (60, 60) in the same 5-channel system, the three second reference directions are (θ rl , α l ) = (0, 30), (θ ll , α l ) = (75, 30), (θ rh , α h ) = (θ lh , α h ) = (−, 90), and k rl , k ll , k rh , and k lh are calculated as follows based on the above [ Equation 4].

[数5]
rl=15/75×30/60=1/10
ll=60/75×30/60=2/5
rh=klh=30/60=1/2
[Equation 5]
k rl = 15/75 × 30/60 = 1/10
k ll = 60/75 × 30/60 = 2/5
k rh = k lh = 30/60 = 1/2

この算出されたkrl,kll,krh,klhの値を上記[数1]に代入することで得られた各スピーカ40のエネルギー配分は下記表4の通りとなる。
[表4]

Figure 2011139263
The energy distribution of each speaker 40 obtained by substituting the calculated values of k rl , k ll , k rh , and k lh into the above [Equation 1] is as shown in Table 4 below.
[Table 4]
Figure 2011139263

なお、上記で挙げた3つの第2の基準方向は下記のように決定される。すなわち、音像定位設定部301により設定された音像の定位位置が(θ,α)=(60,60)の場合、仰角が60度であるため、第1の基準方向の仰角0,30,90度のうち、当該第2の基準方向の仰角は60度を挟む30度と90度であり、αl=30,αh=90となる。 Note that the three second reference directions mentioned above are determined as follows. That is, when the localization position of the sound image set by the sound image localization setting unit 301 is (θ, α) = (60, 60), the elevation angle is 60 degrees, and thus the elevation angles 0, 30, 90 in the first reference direction. Of the degrees, the elevation angles in the second reference direction are 30 degrees and 90 degrees with 60 degrees interposed therebetween, and α l = 30 and α h = 90.

これにより、設定された音像の定位位置に対して右上と左上の第2の基準方向の仰角は90度となる。ここで、αh=90の場合は、方位に関係なく基準方向は真上の方向となるため、θrhとθlhは任意の値となり、上述の通り考慮する必要がない。 Thereby, the elevation angle in the second reference direction in the upper right and upper left with respect to the set position of the sound image is 90 degrees. Here, when α h = 90, the reference direction is directly above regardless of the direction, so θ rh and θ lh are arbitrary values and need not be considered as described above.

また、5チャンネルのシステムを仮定すれば、第1の基準方向より、αl=30の方位角は0(360),75,180,285度となり、60度を挟んだ0度と75度が第2の基準方向の基準方位となる。つまり、θrlは60度より小さい値の中の最大値(0度)となり、θllは60度より大きい値の中の最小値(75度)となる。 Assuming a 5-channel system, the azimuth angle of α l = 30 is 0 (360), 75, 180, 285 degrees from the first reference direction, and 0 degrees and 75 degrees across 60 degrees. It becomes the reference azimuth of the second reference direction. That, theta rl is the largest value among the 60-degree smaller value (0 °) and, theta ll is the minimum value of the 60-degree greater than (75 °).

このように、第1及び2の基準方向のエネルギー配分と、上記[数1],[数2],[数4]を用いて、スピーカ選択部302及びエネルギー配分部304は、使用するスピーカの選択処理と、各スピーカに対する音源10からの音声信号のエネルギー配分処理が行うことで、水平方向だけでなく垂直方向に任意の仰角を有する音像をも生成することができる。   Thus, using the energy distribution in the first and second reference directions and the above [Equation 1], [Equation 2], and [Equation 4], the speaker selection unit 302 and the energy distribution unit 304 use the speaker to be used. By performing the selection process and the energy distribution process of the audio signal from the sound source 10 for each speaker, it is possible to generate a sound image having an arbitrary elevation angle not only in the horizontal direction but also in the vertical direction.

上記表1〜4によれば、定位された音像の仰角が0度の場合は、一般的なAP法と同様に、音像方向近傍のスピーカ40だけを用い、スピーカ40のエネルギー比を変化させることにより当該音像の定位位置を移動させることが可能である。   According to Tables 1-4 above, when the elevation angle of the localized sound image is 0 degree, the energy ratio of the speaker 40 is changed using only the speaker 40 in the vicinity of the sound image direction, as in the general AP method. Thus, the localization position of the sound image can be moved.

また、定位された音像の仰角が0度でない場合は、使用するスピーカ40の数を増やす必要があり、音像と同じ方位角に実際にスピーカがあっても、そのスピーカではなく近くのスピーカを利用する必要がある。特に、正面方向の音像を生成する場合は、センターのスピーカ40によるエネルギーを抑えた方が、音像の仰角感覚が得られ易くなることが上記結果から確かめられた。   If the elevation angle of the localized sound image is not 0 degree, it is necessary to increase the number of speakers 40 to be used, and even if there is actually a speaker at the same azimuth angle as the sound image, a nearby speaker is used instead of the speaker. There is a need to. In particular, when generating a sound image in the front direction, it was confirmed from the above results that it is easier to obtain an elevation angle sensation of a sound image when the energy of the center speaker 40 is suppressed.

また、仰角90度の音像に関しては前後、左右のバランスを考慮に入れて、全てのスピーカ40を利用する必要がある。なお、全空間での音像移動を考えた時には、どのスピーカもエネルギーの変化が連続でスムーズであることが必要であり、特に、仰角90度の方向は方位による差がないようにする必要がある。   In addition, regarding a sound image with an elevation angle of 90 degrees, it is necessary to use all the speakers 40 in consideration of the balance between front and rear and left and right. When considering the movement of the sound image in the entire space, it is necessary for any speaker to have a continuous and smooth change in energy, and in particular, the direction at an elevation angle of 90 degrees needs to have no difference depending on the direction. .

[3.効果]
以上のような本実施形態によれば、受聴者の耳と同程度の高さの水平面上に配置するスピーカを用いる場合であっても、水平方向(方位角の方向)だけでなく垂直方向(仰角の方向)にも自由に定位する音像を生成し立体音響を実現可能な立体音響システム、その制御方法及び制御プログラムを提供することができる。特に、現在のサラウンドシステムで採用されている5.1チャンネルの標準スピーカシステムを利用することで立体音響を生成することができるため、特別な生成装置や、立体的にスピーカを配置することが必要ない利点を有する。
[3. effect]
According to the present embodiment as described above, not only in the horizontal direction (direction of azimuth) but also in the vertical direction (even in the direction of the azimuth angle), even when using a speaker arranged on a horizontal plane having the same height as the listener's ear. It is possible to provide a stereophonic sound system capable of generating a sound image that is freely localized in the direction of the elevation angle and realizing stereophonic sound, a control method thereof, and a control program. In particular, since it is possible to generate stereophonic sound by using the 5.1 channel standard speaker system adopted in the current surround system, it is necessary to arrange special speakers and speakers in three dimensions. Has no advantage.

また、本発明は、できるだけ多くのスピーカ用い、多方向からの信号にそれぞれ左か右の頭部伝達関数を畳み込むことによってクロストークの影響を軽減することができるため、クロストークのキャンセル処理を必要とせず、受聴位置の制限を緩くすることが可能である。さらに、通常は受聴位置をスピーカシステムの中心とすることを理想とするが、その近傍においても良好な立体音響を実現することができ、また、受聴者の頭の回転や左右、前後の移動の影響を少なくすることが可能である。   In addition, the present invention can reduce the influence of crosstalk by using as many speakers as possible and convolving the left or right head-related transfer functions with signals from multiple directions, thus requiring crosstalk cancellation processing. Instead, it is possible to loosen the listening position restriction. In addition, it is ideal to have the listening position at the center of the speaker system, but good stereophonic sound can be achieved in the vicinity of the speaker system, and the listener's head can be rotated and moved left and right and back and forth. It is possible to reduce the influence.

[他の実施形態]
なお、本発明は、上記のようにエネルギー配分部304が上記[数1]のように線形結合により各スピーカ40により出力される音声信号のエネルギーを算出する実施形態に限定するものではなく、各スピーカ40のエネルギー配分を、基準方向の非線形結合によって決定する実施形態も包含する。例えば、2乗正弦関数や両サイドの変化を速くし中間の変化を遅くした補正関数などを用いて算出することが可能である。
[Other Embodiments]
Note that the present invention is not limited to the embodiment in which the energy distribution unit 304 calculates the energy of the audio signal output from each speaker 40 by linear combination as described in [Equation 1] as described above. Also included are embodiments in which the energy distribution of the speaker 40 is determined by non-linear coupling in the reference direction. For example, it is possible to calculate using a square sine function or a correction function in which changes on both sides are made faster and intermediate changes are made slower.

10…音源
20…操作部
30…音像定位処理部
301…音像定位設定部
302…スピーカ選択部
303…頭部伝達関数決定部
304…エネルギー配分部
305…頭部伝達関数テーブル
306…畳み込み処理部
40…スピーカ
HRTF…頭部伝達関数
HRTFL…左側スピーカ用頭部伝達関数
HRTFR…右側スピーカ用頭部伝達関数
DESCRIPTION OF SYMBOLS 10 ... Sound source 20 ... Operation part 30 ... Sound image localization process part 301 ... Sound image localization setting part 302 ... Speaker selection part 303 ... Head-related transfer function determination part 304 ... Energy distribution part 305 ... Head-related transfer function table 306 ... Convolution process part 40 ... Speaker HRTF ... Head related transfer function HRTF L ... Head transfer function for left speaker HRTF R ... Head transfer function for right speaker

Claims (12)

5チャンネルの平面配置スピーカを備え、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成する立体音響生成システムであって、
各種操作を入力する操作部と、
音像の定位位置を生成する音像定位処理部と、を備え、
前記音像定位処理部は、
前記操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定部と、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理部と、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定部と、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定部により決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理部により算出されたエネルギー配分を割り当てる畳み込み処理部と、を有し、
前記音量配分処理部は、
音像定位設定部による設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する第1の基準方向決定手段と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には受聴者を基準に前方に位置する3つの各スピーカに1/6音量を配分し、後方に位置する2つの各スピーカに1/4音量を配分する第1の音量配分手段と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定部により設定された音像を挟む4つの第2の基準方向を決定する第2の基準方向決定手段と、
前記音像定位設定部により設定された音像の仰角が前記αv以下である場合に、[数1]に基づいて、前記第2の基準方向決定手段により決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する第2の音量配分手段と、を有することを特徴とする立体音響システム。
[数1]
Figure 2011139263
A stereophonic sound generating system including a five-channel planar speaker, localizing a sound image to an arbitrary position by performing sound image localization processing on an audio signal from a sound source, and generating stereophonic sound through the speaker,
An operation unit for inputting various operations;
A sound image localization processing unit that generates a localization position of the sound image,
The sound image localization processing unit
A sound image localization setting unit for setting a localization position of a desired sound image input through the operation unit;
A volume distribution processing unit that determines a speaker to be used and determines a volume distribution to be output from each speaker;
A head-related transfer function determination unit that determines a head-related transfer function to be convoluted with a sound signal output from each speaker, based on the localization position of the sound image;
A convolution processing unit that convolves the head-related transfer function determined by the head-related transfer function determination unit with respect to the audio signal output from the speaker to be used, and assigns the energy distribution calculated by the sound energy distribution processing unit; Have
The volume distribution processing unit
Regardless of the setting by the sound image localization setting unit, the first reference direction of the sound image is the direction in which the elevation angle is 0 degrees and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degrees). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. First reference direction determining means;
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and if the elevation angle is 90 degrees in the first reference direction, the listener is used as a reference. First volume distribution means for distributing 1/6 volume to each of the three speakers positioned in the front and distributing 1/4 volume to each of the two speakers positioned in the rear;
A second reference direction determining means for determining four second reference directions sandwiching the sound image set by the sound image localization setting unit from the viewpoint of elevation angle and azimuth angle from the first reference direction;
When the elevation angle of the sound image set by the sound image localization setting unit is equal to or less than α v , the sound volume in each second reference direction determined by the second reference direction determination unit based on [Equation 1] A second volume distribution means for calculating the volume distribution for each speaker by multiplying the distribution by a predetermined coupling coefficient and adding this value for all the determined second reference directions; A stereophonic sound system characterized by that.
[Equation 1]
Figure 2011139263
8チャンネルの平面配置スピーカを備え、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成する立体音響生成システムであって、
各種操作を入力する操作部と、
音像の定位位置を生成する音像定位処理部と、を備え、
前記音像定位処理部は、
前記操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定部と、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理部と、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定部と、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定部により決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理部により算出されたエネルギー配分を割り当てる畳み込み処理部と、を有し、
前記音量配分処理部は、
音像定位設定部による設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する第1の基準方向決定手段と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には当該第1の基準方向の各スピーカに1/8音量を配分する第1のエネルギー配分手段と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定部により設定された音像を挟む4つの第2の基準方向を決定する第2の基準方向決定手段と、
前記音像定位設定部により設定された音像の仰角が前記αv以下である場合に、[数2]に基づいて、前記第2の基準方向決定手段により決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する第2の音量配分手段と、を有することを特徴とする立体音響システム。
[数2]
Figure 2011139263
A stereophonic sound generation system that includes an 8-channel planar speaker, localizes a sound image by performing sound image localization processing on a sound signal from a sound source, and generates stereophonic sound through the speaker.
An operation unit for inputting various operations;
A sound image localization processing unit that generates a localization position of the sound image,
The sound image localization processing unit
A sound image localization setting unit for setting a localization position of a desired sound image input through the operation unit;
A volume distribution processing unit that determines a speaker to be used and determines a volume distribution to be output from each speaker;
A head-related transfer function determination unit that determines a head-related transfer function to be convoluted with a sound signal output from each speaker, based on the localization position of the sound image;
A convolution processing unit that convolves the head-related transfer function determined by the head-related transfer function determination unit with respect to the audio signal output from the speaker to be used, and assigns the energy distribution calculated by the sound energy distribution processing unit; Have
The volume distribution processing unit
Regardless of the setting by the sound image localization setting unit, the first reference direction of the sound image is the direction in which the elevation angle is 0 degrees and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degrees). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. First reference direction determining means;
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and when the elevation angle is 90 degrees in the first reference direction, the first First energy distribution means for distributing 1/8 volume to each speaker in the reference direction;
A second reference direction determining means for determining four second reference directions sandwiching the sound image set by the sound image localization setting unit from the viewpoint of elevation angle and azimuth angle from the first reference direction;
When the elevation angle of the sound image set by the sound image localization setting unit is equal to or less than α v , the sound volume in each second reference direction determined by the second reference direction determination means based on [Expression 2] A second volume distribution means for calculating the volume distribution for each speaker by multiplying the distribution by a predetermined coupling coefficient and adding this value for all the determined second reference directions; A stereophonic sound system characterized by that.
[Equation 2]
Figure 2011139263
前記第2の音量配分手段は、前記音像定位設定部により設定された音像の仰角が前記αvを上回る場合に、[数3]に基づいて、前記第2の基準方向決定手段により決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出することを特徴とする請求項1又は2に記載の立体音響システム。
[数3]
Figure 2011139263
The second sound volume distribution unit is determined by the second reference direction determination unit based on [Equation 3] when the elevation angle of the sound image set by the sound image localization setting unit exceeds the α v . Multiplying the volume distribution in each second reference direction by a predetermined coupling coefficient and adding this value for all the determined second reference directions to calculate the volume distribution for each speaker. The stereophonic sound system according to claim 1 or 2, characterized by the above.
[Equation 3]
Figure 2011139263
前記頭部伝達関数決定部は、受聴者を基準として左側のスピーカには左側用の頭部伝達関数を、右側のスピーカには右側用の頭部伝達関数を、正面のスピーカには左及び右側用の頭部伝達関数を決定することを特徴とする請求項1又は3に記載の立体音響システム。   The head-related transfer function determining unit is based on the listener, the left-side head related transfer function for the left-side speaker, the right-side head-related transfer function for the right-side speaker, and the left and right-side for the front-side speaker. The stereophonic sound system according to claim 1 or 3, wherein a head related transfer function is determined. 前記頭部伝達関数決定部は、受聴者を基準として左側のスピーカには左側用の頭部伝達関数を、右側のスピーカには右側用の頭部伝達関数を、正面及び背面のスピーカには左及び右側用の頭部伝達関数を決定することを特徴とする請求項2又は3に記載の立体音響システム。   The head-related transfer function determining unit is based on the listener, the left-side head related transfer function for the left speaker, the right-side head related transfer function for the right-side speaker, and the left-side head-related transfer function for the front and back speakers. The stereophonic sound system according to claim 2 or 3, wherein a head-related transfer function for the right side and the right side is determined. 前記音像定位位置に応じたスピーカ毎の頭部伝達関数を格納する頭部伝達関数テーブルを備え、
前記頭部伝達関数決定部は、当該頭部伝達関数テーブルから所望の頭部伝達関数を読み出し決定することを特徴とする請求項1〜5のいずれか1項に記載の立体音響システム。
A head-related transfer function table storing a head-related transfer function for each speaker according to the sound image localization position;
The stereophonic sound system according to any one of claims 1 to 5, wherein the head-related transfer function determination unit reads and determines a desired head-related transfer function from the head-related transfer function table.
5チャンネルの平面配置スピーカを備え、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成する立体音響生成システムの制御方法であって、
各種操作を入力する操作部と、
音像の定位位置を生成する音像定位処理部と、を備え、
前記音像定位処理部は、
前記操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定ステップと、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理ステップと、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定ステップと、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定ステップで決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理ステップで算出されたエネルギー配分を割り当てる畳み込み処理ステップと、を実行し、
前記音量配分処理ステップは、
音像定位設定ステップによる設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する処理と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には受聴者を基準に前方に位置する3つの各スピーカに1/6音量を配分し、後方に位置する2つの各スピーカに1/4音量を配分する処理と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定ステップで設定された音像を挟む4つの第2の基準方向を決定する処理と、
前記音像定位設定ステップで設定された音像の仰角が前記αv以下である場合に、[数4]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理と、を含むことを特徴とする立体音響システムの制御方法。
[数4]
Figure 2011139263
A control method for a stereophonic sound generation system that includes a 5-channel planar speaker, localizes a sound image by performing sound image localization processing on a sound signal from a sound source, and generates stereophonic sound through the speaker.
An operation unit for inputting various operations;
A sound image localization processing unit that generates a localization position of the sound image,
The sound image localization processing unit
A sound image localization setting step for setting a localization position of a desired sound image input through the operation unit;
A volume distribution processing step for determining a speaker to be used and determining a volume distribution to be output from each speaker;
A head-related transfer function determination step for determining a head-related transfer function to be convoluted with an audio signal output from each speaker based on the localization position of the sound image;
A convolution processing step that convolves the head-related transfer function determined in the head-related transfer function determination step with the sound signal output by the speaker to be used, and assigns the energy distribution calculated in the sound energy distribution processing step; Run,
The volume distribution processing step includes:
Regardless of the setting in the sound image localization setting step, the first reference direction of the sound image is the direction in which the elevation angle is 0 degree and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degree). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. Processing,
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and if the elevation angle is 90 degrees in the first reference direction, the listener is used as a reference. Distributing 1/6 volume to each of the three speakers located in front and distributing 1/4 volume to each of the two speakers located behind;
A process of determining four second reference directions sandwiching the sound image set in the sound image localization setting step from the viewpoints of elevation angle and azimuth angle from among the first reference directions;
When the elevation angle of the sound image set in the sound image localization setting step is less than or equal to α v , the sound volume distribution in each second reference direction determined based on [Equation 4] is multiplied by a predetermined coupling coefficient. And a process of calculating a volume distribution for each speaker by adding this value for all of the determined second reference directions, and a method for controlling a stereophonic sound system.
[Equation 4]
Figure 2011139263
8チャンネルの平面配置スピーカを備え、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成する立体音響生成システムの制御方法であって、
各種操作を入力する操作部と、
音像の定位位置を生成する音像定位処理部と、を備え、
前記音像定位処理部は、
前記操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定ステップと、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理ステップと、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定ステップと、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定ステップで決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理ステップで算出されたエネルギー配分を割り当てる畳み込み処理ステップと、を実行し、
前記音量配分処理ステップは、
音像定位設定ステップによる設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する処理と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には当該第1の基準方向の各スピーカに1/8音量を配分する処理と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定ステップで設定された音像を挟む4つの第2の基準方向を決定する処理と、
前記音像定位設定ステップで設定された音像の仰角が前記αv以下である場合に、[数5]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理と、を含むことを特徴とする立体音響システムの制御方法。
[数5]
Figure 2011139263
A control method for a stereophonic sound generation system comprising an 8-channel planar speaker, localizing a sound image to an arbitrary position by applying sound image localization processing to a sound signal from a sound source, and generating stereophonic sound through the speaker,
An operation unit for inputting various operations;
A sound image localization processing unit that generates a localization position of the sound image,
The sound image localization processing unit
A sound image localization setting step for setting a localization position of a desired sound image input through the operation unit;
A volume distribution processing step for determining a speaker to be used and determining a volume distribution to be output from each speaker;
A head-related transfer function determination step for determining a head-related transfer function to be convoluted with an audio signal output from each speaker based on the localization position of the sound image;
A convolution processing step that convolves the head-related transfer function determined in the head-related transfer function determination step with the sound signal output by the speaker to be used, and assigns the energy distribution calculated in the sound energy distribution processing step; Run,
The volume distribution processing step includes:
Regardless of the setting in the sound image localization setting step, the first reference direction of the sound image is the direction in which the elevation angle is 0 degree and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degree). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. Processing,
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and when the elevation angle is 90 degrees in the first reference direction, the first A process of allocating 1/8 volume to each speaker in the reference direction;
A process of determining four second reference directions sandwiching the sound image set in the sound image localization setting step from the viewpoints of elevation angle and azimuth angle from among the first reference directions;
When the elevation angle of the sound image set in the sound image localization setting step is equal to or less than α v , the sound volume distribution in each second reference direction determined by [Equation 5] is multiplied by a predetermined coupling coefficient. And a process of calculating a volume distribution for each speaker by adding this value for all of the determined second reference directions, and a method for controlling a stereophonic sound system.
[Equation 5]
Figure 2011139263
前記音量配分処理ステップは、前記音像定位設定ステップで設定された音像の仰角が前記αvを上回る場合に、[数6]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理を含むことを特徴とする請求項7又は8に記載の立体音響システムの制御方法。
[数6]
Figure 2011139263
In the sound volume distribution processing step, when the elevation angle of the sound image set in the sound image localization setting step exceeds the α v , the sound volume distribution in each second reference direction determined based on [Equation 6] and a predetermined value are determined. 9. A process of calculating a sound volume distribution for each speaker by multiplying the value by the coupling coefficient of the second and adding the values for all the determined second reference directions. The control method of the stereophonic sound system as described in 2.
[Equation 6]
Figure 2011139263
5チャンネルの平面配置スピーカを備え、コンピュータにより、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成させる立体音響生成システムの制御プログラムであって、
このプログラムは前記コンピュータに、
操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定処理と、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理と、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定処理と、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定ステップで決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理により算出されたエネルギー配分を割り当てる畳み込み処理と、を実行させ、
前記音量配分処理は、
音像定位設定処理による設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する処理と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には受聴者を基準に前方に位置する3つの各スピーカに1/6音量を配分し、後方に位置する2つの各スピーカに1/4音量を配分する処理と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定処理で設定された音像を挟む4つの第2の基準方向を決定する処理と、
前記音像定位設定処理で設定された音像の仰角が前記αv以下である場合に、[数7]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理と、を含むことを特徴とする立体音響システムの制御プログラム。
[数7]
Figure 2011139263
A control program for a three-dimensional sound generation system that includes a five-channel planar speaker and localizes a sound image to an arbitrary position by performing sound image localization processing on a sound signal from a sound source by a computer and generates a three-dimensional sound through the speaker. There,
This program is stored in the computer
A sound image localization setting process for setting a localization position of a desired sound image input through the operation unit;
A volume distribution process for determining a speaker to be used and determining a volume distribution to be output from each speaker;
A head-related transfer function determination process for determining a head-related transfer function to be convoluted with a sound signal output from each speaker, based on the localization position of the sound image;
A convolution process in which the head-related transfer function determined in the head-related transfer function determination step is convoluted with the sound signal output from the speaker to be used, and the energy distribution calculated by the sound energy distribution process is assigned. Let it run
The volume distribution process is:
Regardless of the setting by the sound image localization setting process, the first reference direction of the sound image is a direction in which the elevation angle is 0 degrees and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degrees). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. Processing,
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and if the elevation angle is 90 degrees in the first reference direction, the listener is used as a reference. Distributing 1/6 volume to each of the three speakers located in front and distributing 1/4 volume to each of the two speakers located behind;
A process of determining four second reference directions sandwiching the sound image set in the sound image localization setting process from the viewpoints of elevation angle and azimuth angle from among the first reference directions;
When the elevation angle of the sound image set in the sound image localization setting process is equal to or less than α v , the sound volume distribution in each second reference direction determined based on [Equation 7] is multiplied by a predetermined coupling coefficient. And a process of calculating a volume distribution for each speaker by adding the values for all of the determined second reference directions, a control program for a stereophonic sound system, comprising:
[Equation 7]
Figure 2011139263
8チャンネルの平面配置スピーカを備え、コンピュータにより、音源からの音声信号に音像定位処理を施すことで音像を任意の位置に定位させ、当該スピーカを通じて立体音響を生成させる立体音響生成システムの制御プログラムであって、
このプログラムは前記コンピュータに、
操作部を通じて入力された所望の音像の定位位置を設定する音像定位設定処理と、
使用するスピーカを決定し、各スピーカから出力する音量配分を決定する音量配分処理処理と、
前記音像の定位位置に基づいて、各スピーカから出力される音声信号に畳み込む頭部伝達関数を決定する頭部伝達関数決定処理と、
使用するスピーカにより出力される音声信号に対して、頭部伝達関数決定ステップで決定された頭部伝達関数を畳み込み、かつ、前記音声エネルギー配分処理で算出されたエネルギー配分を割り当てる畳み込み処理と、を実行させ、
前記音量配分処理は、
音像定位設定処理による設定に拘らず、音像の第1の基準方向として、受聴者を基準に、仰角が0度で各方位角をスピーカ位置とする方向と、仰角がαv(0度より大きく90度より小さければ任意に複数設定可能)で各方位角をセンタースピーカ以外の隣り合うスピーカの中間位置とする方向と、仰角が90度で各方位角を0度とする方向と、を決定する処理と、
前記第1の基準方向のうち仰角が0度の場合には当該第1の基準方向のスピーカに前記音源からの音声信号の全音量を配分し、前記第1の基準方向のうち仰角がαvの場合には方位角の視点で当該第1の基準方向を挟む2つの各スピーカに1/2音量を配分し、前記第1の基準方向のうち仰角が90度の場合には当該第1の基準方向の各スピーカに1/8音量を配分する処理と、
前記第1の基準方向のうちから、仰角、方位角の視点で、前記音像定位設定処理で設定された音像を挟む4つの第2の基準方向を決定する処理と、
前記音像定位設定処理で設定された音像の仰角が前記αv以下である場合に、[数8]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理と、を含むことを特徴とする立体音響システムの制御プログラム。
[数8]
Figure 2011139263
A control program for a stereophonic sound generation system that includes an 8-channel planar speaker and localizes a sound image at an arbitrary position by performing sound image localization processing on a sound signal from a sound source by a computer and generates stereophonic sound through the speaker. There,
This program is stored in the computer
A sound image localization setting process for setting a localization position of a desired sound image input through the operation unit;
A volume distribution process for determining a speaker to be used and determining a volume distribution to be output from each speaker;
A head-related transfer function determination process for determining a head-related transfer function to be convoluted with a sound signal output from each speaker, based on the localization position of the sound image;
A convolution process in which the head-related transfer function determined in the head-related transfer function determination step is convoluted with the sound signal output by the speaker to be used, and the energy distribution calculated in the sound energy distribution process is assigned. Let it run
The volume distribution process is:
Regardless of the setting by the sound image localization setting process, the first reference direction of the sound image is a direction in which the elevation angle is 0 degrees and each azimuth angle is the speaker position with respect to the listener, and the elevation angle is α v (greater than 0 degrees). The direction in which each azimuth is set to an intermediate position between adjacent speakers other than the center speaker and the direction in which the elevation angle is 90 degrees and each azimuth is 0 degrees are determined. Processing,
When the elevation angle is 0 degree in the first reference direction, the entire volume of the audio signal from the sound source is distributed to the speakers in the first reference direction, and the elevation angle is α v in the first reference direction. In this case, ½ volume is distributed to each of the two speakers sandwiching the first reference direction from the viewpoint of the azimuth, and when the elevation angle is 90 degrees in the first reference direction, the first A process of allocating 1/8 volume to each speaker in the reference direction;
A process of determining four second reference directions sandwiching the sound image set in the sound image localization setting process from the viewpoints of elevation angle and azimuth angle from among the first reference directions;
When the elevation angle of the sound image set in the sound image localization setting process is less than or equal to α v , the sound volume distribution in each second reference direction determined by [Equation 8] is multiplied by a predetermined coupling coefficient. And a process of calculating a volume distribution for each speaker by adding the values for all of the determined second reference directions, a control program for a stereophonic sound system, comprising:
[Equation 8]
Figure 2011139263
前記音量配分処理は、前記音像定位設定処理で設定された音像の仰角が前記αvを上回る場合に、[数9]に基づいて、決定された各第2の基準方向の音量配分と所定の結合係数とを乗算し、この値を決定された全ての前記第2の基準方向分で加算することで、スピーカ毎の音量配分を算出する処理を含むことを特徴とする請求項10又は11に記載の立体音響システムの制御プログラム。
[数9]
Figure 2011139263
In the volume distribution process, when the elevation angle of the sound image set in the sound image localization setting process exceeds α v , the volume distribution in each second reference direction determined based on [Equation 9] and a predetermined The method according to claim 10 or 11, further comprising a process of calculating a volume distribution for each speaker by multiplying a coupling coefficient and adding the value for all of the determined second reference directions. The control program of the described stereophonic sound system.
[Equation 9]
Figure 2011139263
JP2009297581A 2009-12-28 2009-12-28 Stereophonic sound generation system, control method thereof, and control program Expired - Fee Related JP5472613B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009297581A JP5472613B2 (en) 2009-12-28 2009-12-28 Stereophonic sound generation system, control method thereof, and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009297581A JP5472613B2 (en) 2009-12-28 2009-12-28 Stereophonic sound generation system, control method thereof, and control program

Publications (3)

Publication Number Publication Date
JP2011139263A true JP2011139263A (en) 2011-07-14
JP2011139263A5 JP2011139263A5 (en) 2013-02-14
JP5472613B2 JP5472613B2 (en) 2014-04-16

Family

ID=44350247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009297581A Expired - Fee Related JP5472613B2 (en) 2009-12-28 2009-12-28 Stereophonic sound generation system, control method thereof, and control program

Country Status (1)

Country Link
JP (1) JP5472613B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016019041A (en) * 2014-07-04 2016-02-01 日本放送協会 Acoustic signal conversion device, acoustic signal conversion method, and acoustic signal conversion program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05300597A (en) * 1992-04-18 1993-11-12 Yamaha Corp Video-coupler sound image localization device
JPH06301390A (en) * 1993-04-12 1994-10-28 Sanyo Electric Co Ltd Stereoscopic sound image controller
JPH07248255A (en) * 1994-03-09 1995-09-26 Sharp Corp Method and apparatus for forming stereophonic image
JP2005278125A (en) * 2004-03-26 2005-10-06 Victor Co Of Japan Ltd Multi-channel audio signal processing device
JP2007251832A (en) * 2006-03-17 2007-09-27 Fukushima Prefecture Sound image localizing apparatus, and sound image localizing method
JP2007329746A (en) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> Three-dimensional acoustic panning device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05300597A (en) * 1992-04-18 1993-11-12 Yamaha Corp Video-coupler sound image localization device
JPH06301390A (en) * 1993-04-12 1994-10-28 Sanyo Electric Co Ltd Stereoscopic sound image controller
JPH07248255A (en) * 1994-03-09 1995-09-26 Sharp Corp Method and apparatus for forming stereophonic image
JP2005278125A (en) * 2004-03-26 2005-10-06 Victor Co Of Japan Ltd Multi-channel audio signal processing device
JP2007251832A (en) * 2006-03-17 2007-09-27 Fukushima Prefecture Sound image localizing apparatus, and sound image localizing method
JP2007329746A (en) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> Three-dimensional acoustic panning device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016019041A (en) * 2014-07-04 2016-02-01 日本放送協会 Acoustic signal conversion device, acoustic signal conversion method, and acoustic signal conversion program

Also Published As

Publication number Publication date
JP5472613B2 (en) 2014-04-16

Similar Documents

Publication Publication Date Title
US12035130B2 (en) Method and apparatus for rendering acoustic signal, and computer-readable recording medium
EP3311593B1 (en) Binaural audio reproduction
EP2891336B1 (en) Virtual rendering of object-based audio
JP4743790B2 (en) Multi-channel audio surround sound system from front loudspeakers
KR100608024B1 (en) Apparatus for regenerating multi channel audio input signal through two channel output
KR101651419B1 (en) Method and system for head-related transfer function generation by linear mixing of head-related transfer functions
US8437485B2 (en) Method and device for improved sound field rendering accuracy within a preferred listening area
EP3704875B1 (en) Virtual rendering of object based audio over an arbitrary set of loudspeakers
EP3141002A1 (en) Virtual sound systems and methods
JP2014522155A5 (en)
JP2009077379A (en) Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program
SG182561A1 (en) A method for enlarging a location with optimal three-dimensional audio perception
US10321252B2 (en) Transaural synthesis method for sound spatialization
JP5472613B2 (en) Stereophonic sound generation system, control method thereof, and control program
KR20060005829A (en) Sound reproducing apparatus and method for providing virtual sound source
US20120224700A1 (en) Sound image control device and sound image control method
WO2016121519A1 (en) Acoustic signal processing device, acoustic signal processing method, and program
Han et al. Loudspeaker distributions suitable for crosstalk cancellers robust to head rotation
KR20090129727A (en) Virtual speaker system of three dimensions with equalizer and control method thereof, recording medium recording program which has control method thereof
CN114830694B (en) Audio device and method for generating a three-dimensional sound field
KR20230147674A (en) Apparatus and method for rendering audio objects
Wilkinson AD-3D: HRTF based 3D Audio Designer
JP2012004816A (en) Sound source localization method, sound source localization apparatus, and program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140121

R150 Certificate of patent or registration of utility model

Ref document number: 5472613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees