JP2023121744A - Stereophonic sound reproducing device - Google Patents

Stereophonic sound reproducing device Download PDF

Info

Publication number
JP2023121744A
JP2023121744A JP2023024373A JP2023024373A JP2023121744A JP 2023121744 A JP2023121744 A JP 2023121744A JP 2023024373 A JP2023024373 A JP 2023024373A JP 2023024373 A JP2023024373 A JP 2023024373A JP 2023121744 A JP2023121744 A JP 2023121744A
Authority
JP
Japan
Prior art keywords
speaker
listener
signal
ear
directivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023024373A
Other languages
Japanese (ja)
Inventor
知哉 長倉
Tomoya Nagakura
俊哉 鮫島
Toshiya Samejima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu University NUC
Original Assignee
Kyushu University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu University NUC filed Critical Kyushu University NUC
Publication of JP2023121744A publication Critical patent/JP2023121744A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

To provide a stereophonic sound reproducing technique with robustness stronger than that of the conventional one.SOLUTION: A stereophonic sound reproducing device includes: a first speaker 21 whose main axis of directivity is directed towards one ear of a listener; a second speaker 22 whose main axis of directivity is directed towards the other ear of the listener; and a signal processing section 1 for executing crosstalk cancellation processing to cancel sound reaching the one ear of the listener from the second speaker 22 and sound reaching the other ear from the first speaker 21, so as to generate a post-processing signal. In the stereophonic sound reproducing device, the first speaker 21 and the second speaker 22 emit sound based on the post-processing signal. The first speaker 21 and the second speaker 22 are arranged on a median plane or on the same sagittal plane of the listener.SELECTED DRAWING: Figure 18

Description

本発明は、立体音響再生技術に関する。 The present invention relates to stereophonic sound reproduction technology.

従来の2チャネルスピーカによるバイノーラル立体音響再生システムにおいては、2つのスピーカを横方向に並べて、2つのスピーカを聴取者の頭部中心に向けるステレオ配置、言い換えれば横型配置が頻繁に用いられていた(例えば、特許文献1参照。)。 Conventional binaural stereophonic sound reproduction systems using two-channel speakers frequently use a stereo arrangement in which two speakers are arranged side by side and directed toward the center of the listener's head, in other words, a horizontal arrangement ( For example, see Patent Document 1.).

特開2001-57699号公報JP-A-2001-57699

しかし、このような横型配置では、聴取者の位置変動に敏感であり、ロバスト性が弱い可能性があった。 However, such a horizontal arrangement is sensitive to changes in the listener's position, and may have weak robustness.

本発明は、従来よりもロバスト性が強い立体音響再生装置を提供することを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a stereophonic sound reproducing apparatus that is more robust than the conventional one.

この発明の一態様による立体音響再生装置は、指向性の主軸が、聴取者の一方の耳に向けられた第一スピーカと、指向性の主軸が、聴取者の他方の耳に向けられた第二スピーカと、第二スピーカから一方の耳に到達する音及び第一スピーカから他方の耳に到達する音を打ち消すためのクロストークキャンセル処理を行い、処理後信号を生成する信号処理部と、を含む立体音響再生装置であって、第一スピーカ及び第二スピーカは、処理後信号に基づく音を発し、第一スピーカ及び第二スピーカは、聴取者の正中面上または同一矢状面上に配置される。 A stereophonic sound reproduction device according to an aspect of the present invention includes a first speaker whose directivity main axis is directed to one ear of a listener, and a second speaker whose directivity main axis is directed to the other ear of the listener. two speakers, and a signal processing unit that performs crosstalk cancellation processing to cancel the sound reaching one ear from the second speaker and the sound reaching the other ear from the first speaker, and generates a post-processing signal. wherein the first speaker and the second speaker emit sound based on the processed signal, and the first speaker and the second speaker are arranged on the listener's median plane or on the same sagittal plane be done.

2個のスピーカを聴取者の正中面上または同一矢状面上に配置することで、従来よりも聴取者の移動に対するロバスト性が高い立体音響再生を可能とする。 By arranging two speakers on the median plane of the listener or on the same sagittal plane, it is possible to reproduce stereophonic sound with higher robustness against the movement of the listener than before.

図1(a)(b)は、理論的背景を説明するための図である。FIGS. 1(a) and 1(b) are diagrams for explaining the theoretical background. 図2(a)(b)は、理論的背景を説明するための図である。FIGS. 2A and 2B are diagrams for explaining the theoretical background. 図3(a)(b)は、理論的背景を説明するための図である。FIGS. 3A and 3B are diagrams for explaining the theoretical background. 図4は、本発明に関わる身体的な基準面の名称を説明するための図である。FIG. 4 is a diagram for explaining the names of physical reference planes related to the present invention. 図5は、立体音響再生装置の機能構成の例を示す図である。FIG. 5 is a diagram showing an example of a functional configuration of a stereophonic sound reproduction device. 図6は、立体音響再生方法の処理手続きの例を示す図である。FIG. 6 is a diagram showing an example of the processing procedure of the stereophonic sound reproduction method. 図7(a)(b)は、シミュレーション結果を示すための図である。FIGS. 7A and 7B are diagrams for showing simulation results. 図8(a)(b)は、シミュレーション結果を示すための図である。FIGS. 8A and 8B are diagrams showing simulation results. 図9(a)(b)は、シミュレーション結果を示すための図である。FIGS. 9A and 9B are diagrams for showing simulation results. 図10(a)(b)は、シミュレーション結果を示すための図である。FIGS. 10A and 10B are diagrams showing simulation results. 図11(a)(b)は、シミュレーション結果を示すための図である。FIGS. 11A and 11B are diagrams showing simulation results. 図12(a)(b)は、指向性の強さ及びスピーカの距離を説明するための図である。FIGS. 12(a) and 12(b) are diagrams for explaining the strength of directivity and the distance between speakers. 図13(a)(b)は、指向性の強さ及びスピーカの距離を説明するための図である。FIGS. 13A and 13B are diagrams for explaining the strength of directivity and the distance between speakers. 図14は、指向性の強さ及びスピーカの距離を説明するための図である。FIG. 14 is a diagram for explaining the strength of directivity and the distance between speakers. 図15(a)(b)は、指向性の強さ及びスピーカの距離を説明するための図である。FIGS. 15A and 15B are diagrams for explaining the strength of directivity and the distance between speakers. 図16(a)(b)は、指向性の強さ及びスピーカの距離を説明するための図である。FIGS. 16A and 16B are diagrams for explaining the strength of directivity and the distance between speakers. 図17は、コンピュータの機能構成例を示す図である。FIG. 17 is a diagram illustrating a functional configuration example of a computer; 図18(a)(b)は、本発明の実施形態を説明するための図である。18(a) and 18(b) are diagrams for explaining an embodiment of the present invention. 図19(a)(b)は、本発明の実施形態を説明するための図である。19(a) and 19(b) are diagrams for explaining an embodiment of the present invention.

[理論的背景]
まず、背景技術のように、スピーカを横型配置した場合の聴取者の移動に対するロバスト性の弱さについて説明する。以下、説明の簡略化のために、システムへの入力信号として左信号のみに正弦波を入力した場合について考慮することにする。
[Theoretical Background]
First, as in the background art, the weakness of robustness against the movement of the listener when the speakers are horizontally arranged will be described. In the following, for the sake of simplification of explanation, the case of inputting a sine wave only to the left signal as an input signal to the system will be considered.

立体音響再生システムにおいては、入力の左信号が左耳でのみ再生されるようにするために、右耳での合成信号が0になるように、スピーカからの出力信号の振幅や位相が制御される。この制御はクロストークキャンセルと呼ばれている。また、左信号が歪みを生じることなく左耳において再生されるようにするために、2つのスピーカから左耳までの音響伝達特性をフラットにするように振幅や位相が制御される。この制御は伝達関数の等化と呼ばれている。 In a stereophonic sound reproduction system, the amplitude and phase of the output signal from the speaker are controlled so that the synthesized signal at the right ear becomes 0 in order to reproduce the input left signal only at the left ear. be. This control is called crosstalk cancellation. Also, the amplitude and phase are controlled to flatten the acoustic transfer characteristics from the two speakers to the left ear so that the left signal can be reproduced at the left ear without distortion. This control is called transfer function equalization.

例えば、図1(a)に示すように、左スピーカ42が出力する音響信号が経路l12を通って右耳に到達するとする。このとき右耳B1に到達する音響信号をp12とする。この場合、クロストークキャンセルを制御するために、右スピーカ41から経路l11を通って右耳に、信号p12と逆位相の信号p11を到達させる。これにより、左信号に対応する、右耳での合成信号p1の振幅を0とすることができる。この状況を図1(b)に示す。図1(b)において、実線は合成信号p1を示し、破線は信号p11を示し、点線は信号p12を示す。 For example, as shown in FIG. 1(a), it is assumed that the acoustic signal output by the left speaker 42 reaches the right ear through the path l12 . Let p12 be the acoustic signal that reaches the right ear B1 at this time. In this case, in order to control the crosstalk cancellation, the signal p11 having the opposite phase to the signal p12 is caused to reach the right ear from the right speaker 41 through the path l11. As a result, the amplitude of the combined signal p1 at the right ear, which corresponds to the left signal, can be set to zero. This situation is shown in FIG. 1(b). In FIG. 1(b), the solid line indicates the synthesized signal p1 , the dashed line indicates the signal p11 , and the dotted line indicates the signal p12 .

ここで、聴取者が横方向に移動したとする。この場合、図2(a)に示すように、図2(a)の経路と比較して、経路l12は長くなり、経路l11は短くなる。これらの長さの増減方向の差異に起因して、右耳B1での信号p12の位相は遅れ、信号p11の位相は早まる。このように、信号p12と信号p11の位相とが反対方向に変化すると、合成信号p1の振幅を0とする制御がなされなくなる。この状況を図2(b)に示す。図2(b)において、実線は合成信号p1を示し、破線は信号p11を示し、点線は信号p12を示す。 Now suppose that the listener moves laterally. In this case, as shown in FIG. 2(a), path l12 is longer and path l11 is shorter than the path in FIG. 2(a). Due to the difference in the direction of increase and decrease of these lengths, the phase of signal p12 at the right ear B1 is delayed and the phase of signal p11 is advanced. Thus, when the phases of the signal p12 and the signal p11 change in opposite directions, the control to set the amplitude of the combined signal p1 to 0 is no longer performed. This situation is shown in FIG. 2(b). In FIG. 2(b), the solid line indicates the composite signal p1 , the dashed line indicates the signal p11 , and the dotted line indicates the signal p12 .

このように、スピーカの横型配置による再生では、聴取者が横方向に移動したときに、合成信号が急激に変化する可能性がある。この点において、スピーカの横型配置では、聴取者の位置変動に敏感であり、ロバスト性が弱い可能性があると言える。 In this way, in reproduction by the horizontal arrangement of the speakers, there is a possibility that the composite signal will change abruptly when the listener moves in the horizontal direction. In this respect, it can be said that the horizontal arrangement of speakers is sensitive to changes in the position of the listener and may have weak robustness.

そこで、図3(a)に示すように、2つのスピーカを聴取者の正中面上または同一矢状面上に配置することを考える。図3(a)では、左スピーカ42及び右スピーカ41のそれぞれを示すために、水平面で同じ位置にある左スピーカ42及び右スピーカ41を少しだけずらして記載している。 Therefore, as shown in FIG. 3(a), consider placing two speakers on the median plane of the listener or on the same sagittal plane. In FIG. 3A, in order to show the left speaker 42 and the right speaker 41 respectively, the left speaker 42 and the right speaker 41, which are located at the same position on the horizontal plane, are slightly shifted.

図3(a)に示すように、スピーカが聴取者の正中面または同一矢状面上に配置されている場合、聴取者の横方向の移動に対する経路l11及び経路l12の長さは図2(a)の経路と比較して、ともに増加の方向へと変化する。これに起因して、右耳B1での信号p12と信号p11の位相はともに遅れる。このように、p11の位相と信号p12の位相とが同じ方向に変化する場合には、想定されたクロストークキャンセルの効果を見込むことができ、合成信号の変動は小さいと考えられる。この状況を図3(b)に示す。図3(b)において、実線は合成信号p1を示し、破線は信号p11を示し、点線は信号p12を示す。このため、スピーカを聴取者の正中面上または同一矢状面上に配置することで、聴取者の移動に対するロバスト性が強くなると考えられる。 As shown in FIG. 3(a), when the loudspeakers are placed in the median plane or the same sagittal plane of the listener, the lengths of path l11 and path l12 for lateral movement of the listener are shown in FIG. Both change in the direction of increase compared to path 2(a). Due to this, the phases of both the signal p12 and the signal p11 at the right ear B1 are delayed. In this way, when the phase of p11 and the phase of signal p12 change in the same direction, it is possible to anticipate the expected effect of crosstalk cancellation, and the fluctuation of the combined signal is considered to be small. This situation is shown in FIG. 3(b). In FIG. 3(b), the solid line indicates the synthesized signal p1 , the dashed line indicates the signal p11 , and the dotted line indicates the signal p12 . For this reason, it is considered that arranging the speakers on the median plane of the listener or on the same sagittal plane increases the robustness against the movement of the listener.

しかし、この場合、正中面上の1点から両耳への伝達関数が左右対称であるとすると、理論的には、H11=H21,H12=H22となり、伝達関数行列Hの逆行列である制御フィルタ行列Gを計算することができない可能性がある。H11, H12, H21, H22は、伝達関数行列Hの要素である伝達関数である。 However, in this case, assuming that the transfer function from one point on the median plane to both ears is symmetrical, theoretically H 11 =H 21 , H 12 =H 22 , and the inverse of the transfer function matrix H It may not be possible to compute the control filter matrix G, which is a matrix. H 11 , H 12 , H 21 , H 22 are transfer functions that are elements of the transfer function matrix H.

この問題を解決するために、聴取者の正中面上または同一矢状面上に配置した一方のスピーカの指向性の主軸を、聴取者の一方の耳に向けて、他方のスピーカの指向性の主軸を、聴取者の他方の耳に向ける。これにより、理論的に、制御フィルタ行列Gの設計を可能にする。 To solve this problem, the principal axis of directivity of one speaker placed on the listener's median plane or in the same sagittal plane is directed toward one ear of the listener, and the directivity of the other speaker The principal axis is directed toward the other ear of the listener. This theoretically allows the design of the control filter matrix G.

[実施形態]
以下、本発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
[Embodiment]
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail. In the drawings, constituent parts having the same function are denoted by the same numbers, and redundant explanations are omitted.

立体音響再生装置は、図5に例示するように、信号処理部1と、第一スピーカ21と、第二スピーカ22とを備えている。立体音響再生方法は、以下に説明するステップS1及びステップS2により例えば実現される。 The stereophonic sound reproduction device includes a signal processing unit 1, a first speaker 21, and a second speaker 22, as illustrated in FIG. A stereophonic sound reproduction method is implemented, for example, by steps S1 and S2 described below.

図4は、スピーカ配置に関わる身体的な基準面とその名称を説明するための図である。正中面は身体を左右対称に切る面の呼称である。また、矢状面は正中面に平行な面の総称である。 FIG. 4 is a diagram for explaining physical reference planes related to speaker placement and their names. The median plane is the name of the plane that cuts the body symmetrically. Also, the sagittal plane is a generic term for planes parallel to the median plane.

<スピーカ配置形態その1>
図18(a)に示すように、第一スピーカ21と第二スピーカ22は、聴取者の正中面上に例えば配置される。より詳細には、図18(a)では、第一スピーカ21と第二スピーカ22は、聴取者の正中面上であって、縦方向に並べて配置されている。
<Speaker placement form 1>
As shown in FIG. 18(a), the first speaker 21 and the second speaker 22 are arranged, for example, on the median plane of the listener. More specifically, in FIG. 18A, the first speaker 21 and the second speaker 22 are arranged side by side in the vertical direction on the median plane of the listener.

図18(a)は、第一スピーカ21と第二スピーカ22を聴取者の正中面上に配置した場合のスピーカの配置方法を説明するための俯瞰図である。図18(b)は、第一スピーカ21と第二スピーカ22を聴取者の正中面上に配置した場合のスピーカの配置方向を説明する図であり、図18(a)の上面図である。 FIG. 18(a) is a bird's-eye view for explaining a speaker arrangement method when the first speaker 21 and the second speaker 22 are arranged on the median plane of the listener. FIG. 18(b) is a diagram for explaining the arrangement direction of the speakers when the first speaker 21 and the second speaker 22 are arranged on the median plane of the listener, and is a top view of FIG. 18(a).

<スピーカ配置形態その2>
図19(a)に示すように、第一スピーカ21と第二スピーカ22は、聴取者の同一矢状面上に配置されてもよい。より詳細には、図19(a)に例示するように、第一スピーカ21と第二スピーカ22は、聴取者の同一矢状面上であって、縦方向に並べて配置されてもよい。
<Speaker placement form 2>
As shown in FIG. 19(a), the first speaker 21 and the second speaker 22 may be arranged on the same sagittal plane of the listener. More specifically, as illustrated in FIG. 19A, the first speaker 21 and the second speaker 22 may be arranged side by side in the vertical direction on the same sagittal plane of the listener.

図19(a)は第一スピーカ21と第二スピーカ22を聴取者の同一矢状面上に配置した場合のスピーカの配置方法を説明するための俯瞰図である。図19(b)は第一スピーカ21と第二スピーカ22を聴取者の同一矢状面上に配置した場合のスピーカの配置方向を説明する図であり、図19(a)の上面図である。 FIG. 19(a) is a bird's-eye view for explaining a speaker arrangement method when the first speaker 21 and the second speaker 22 are arranged on the same sagittal plane of the listener. FIG. 19(b) is a diagram for explaining the arrangement direction of the speakers when the first speaker 21 and the second speaker 22 are arranged on the same sagittal plane of the listener, and is a top view of FIG. 19(a). .

図18(a)及び図19(a)では、聴取者の足元を原点とする3次元空間において、聴取者はy軸正方向に向いている。また、x軸及びz軸を含む面に聴取者の耳B1及び耳B2が位置している。図18(a)及び図19(a)では、第一スピーカ21の指向性の主軸は、聴取者の一方の耳B1に向けられており、第二スピーカ22の指向性の主軸は、聴取者の他方の耳B2に向けられている。 In FIGS. 18A and 19A, the listener faces the positive direction of the y-axis in a three-dimensional space with the listener's feet as the origin. Also, the ears B1 and B2 of the listener are positioned on a plane including the x-axis and the z-axis. 18(a) and 19(a), the directivity main axis of the first speaker 21 is directed toward one ear B1 of the listener, and the directivity main axis of the second speaker 22 is directed toward the listener. is directed to the other ear B2 of the

聴取者の正中面とは、図18(a)及び図19(a)においては、y軸及びz軸を含む面のことである。聴取者の矢状面とは、図18(a)及び図19(a)においては、y軸及びz軸を含む面である正中面に平行な面のことである。 The median plane of the listener is the plane containing the y-axis and the z-axis in FIGS. 18(a) and 19(a). The sagittal plane of the listener is a plane parallel to the median plane that includes the y-axis and the z-axis in FIGS. 18(a) and 19(a).

<信号処理部1>
信号処理部1には、入力信号d1,d2が入力される。入力信号d1,d2は、例えばバイノーラル信号である。入力信号d1,d2は、バイノーラル信号ではない、音響信号、音声信号であってもよい。
<Signal processing unit 1>
Input signals d 1 and d 2 are input to the signal processing unit 1 . The input signals d 1 and d 2 are binaural signals, for example. The input signals d 1 and d 2 may be acoustic signals or voice signals instead of binaural signals.

信号処理部1は、第二スピーカ22から聴取者の一方の耳に到達する音及び第一スピーカ21から聴取者の他方の耳に到達する音を打ち消すためのクロストークキャンセル処理を行い、処理後信号v1,v2を生成する(ステップS1)。 The signal processing unit 1 performs crosstalk cancellation processing for canceling the sound reaching one ear of the listener from the second speaker 22 and the sound reaching the other ear of the listener from the first speaker 21, and after processing Signals v 1 and v 2 are generated (step S1).

なお、信号処理部1は、クロストークキャンセル処理と共に、第一スピーカ21から一方の耳までの音響伝達特性(ダイレクト成分)及び第二スピーカ22から他方の耳までの音響伝達特性(ダイレクト成分)を補償する処理、言い換えればこれらの周波数特性をフラットにする等化処理を行ってもよい。 In addition to crosstalk cancellation processing, the signal processing unit 1 performs acoustic transfer characteristics (direct component) from the first speaker 21 to one ear and acoustic transfer characteristics (direct component) from the second speaker 22 to the other ear. Compensation processing, in other words, equalization processing for flattening these frequency characteristics may be performed.

これらのクロストークキャンセル処理及び等化処理を行うために、信号処理部1は、例えば以下に説明する伝達関数G11, G12, G21, G22を用いた処理を行う。α=1であり、式(1)を満たす制御フィルタ行列Gにより定まる伝達関数G11, G12, G21, G22を用いた以下の処理が行われると、クロストークキャンセル処理及び等化処理が行われることになる。αが1以外の正の数であり、式(1)を満たす制御フィルタ行列Gにより定まる伝達関数G11, G12, G21, G22を用いた以下の処理が行われると、クロストークキャンセル処理が行われることになる。α及び式(1)については、後述する。 In order to perform these crosstalk cancellation processing and equalization processing, the signal processing unit 1 performs processing using, for example, transfer functions G 11 , G 12 , G 21 , and G 22 described below. When α=1 and the following processing using the transfer functions G 11 , G 12 , G 21 , G 22 determined by the control filter matrix G that satisfies Equation (1) is performed, crosstalk cancellation processing and equalization processing will take place. When α is a positive number other than 1 and the following processing using transfer functions G 11 , G 12 , G 21 , and G 22 determined by the control filter matrix G that satisfies Equation (1) is performed, crosstalk cancellation processing will take place. α and formula (1) will be described later.

信号処理部1は、入力信号d1に対して伝達関数G11を用いた処理が行い、入力信号d2に対して伝達関数G12を用いた処理が行い、これらの処理後の信号を合成した信号を処理後信号v1とする。 The signal processing unit 1 performs processing using the transfer function G11 on the input signal d1 , performs processing using the transfer function G12 on the input signal d2 , and combines these processed signals. The resulting signal is defined as a post-processing signal v1 .

また、信号処理部1は、入力信号d1に対して伝達関数G21を用いた処理が行い、入力信号d2に対して伝達関数G22を用いた処理が行い、これらの処理後の信号を合成した信号を処理後信号v2とする。 Further, the signal processing unit 1 performs processing using the transfer function G21 on the input signal d1 , performs processing using the transfer function G22 on the input signal d2 , and processes these processed signals The signal obtained by synthesizing the is assumed to be the post-processing signal v2 .

G11, G12, G21, G22は、制御フィルタ行列Gの要素である伝達関数である。制御フィルタ行列Gは、予め決定された伝達関数行列Hに基づいて予め計算されているとする。なお、立体音響再生装置は、図5に破線で示す、制御フィルタ行列Gを計算する制御フィルタ行列計算部3を更に備えていてもよい。制御フィルタ行列計算部3の処理については、後述する。 G 11 , G 12 , G 21 , G 22 are transfer functions that are elements of the control filter matrix G. It is assumed that the control filter matrix G is pre-calculated based on the transfer function matrix H determined in advance. Note that the stereophonic sound reproducing apparatus may further include a control filter matrix calculator 3 for calculating the control filter matrix G, indicated by a dashed line in FIG. The processing of the control filter matrix calculator 3 will be described later.

処理後信号v1,v2は、第一スピーカ21及び第二スピーカ22に出力される。この例は、処理後信号v1が第一スピーカ21に出力され、処理後信号v2が第二スピーカ22に出力される。 The processed signals v 1 and v 2 are output to the first speaker 21 and the second speaker 22 . In this example, the processed signal v 1 is output to the first speaker 21 and the processed signal v 2 is output to the second speaker 22 .

<第一スピーカ21及び第二スピーカ22>
第一スピーカ21及び第二スピーカ22には、処理後信号v1,v2が入力される。
<First Speaker 21 and Second Speaker 22>
The processed signals v 1 and v 2 are input to the first speaker 21 and the second speaker 22 .

第一スピーカ21及び第二スピーカ22は、処理後信号v1,v2に基づく音を発する(ステップS2)。この例では、第一スピーカ21は処理後信号v1に基づく音を発し、第二スピーカ22は処理後信号v2に基づく音を発する。 The first speaker 21 and the second speaker 22 emit sounds based on the post-processing signals v1 and v2 (step S2). In this example, the first speaker 21 emits a sound based on the processed signal v1 , and the second speaker 22 emits a sound based on the processed signal v2 .

<制御フィルタ行列計算部3>
立体音響再生装置が、制御フィルタ行列計算部3を備えている場合には、制御フィルタ行列計算部3は、予め決定された伝達関数行列Hに基づいて、例えば以下の式を満たすように、制御フィルタ行列Gを計算する。αは、0より大きい数である。例えば、α=1である。

Figure 2023121744000002
この処理は、例えばステップS1の処理の前に行われる。 <Control filter matrix calculator 3>
When the stereophonic sound reproduction device is provided with the control filter matrix calculator 3, the control filter matrix calculator 3 performs control based on a predetermined transfer function matrix H so as to satisfy the following formula, for example: Compute the filter matrix G. α is a number greater than 0. For example, α=1.
Figure 2023121744000002
This process is performed, for example, before the process of step S1.

実施形態の立体音響再生装置のように、2個のスピーカを聴取者の正中面上または同一矢状面上に配置することで、従来よりもロバスト性を強くすることができる。 By arranging two speakers on the median plane of the listener or on the same sagittal plane as in the stereophonic sound reproducing apparatus of the embodiment, robustness can be enhanced more than before.

[シミュレーション結果]
以下、剛体球モデルによるシミュレーション結果を示す。
[simulation result]
The simulation results using the rigid sphere model are shown below.

このシミュレーションでは、指向性音源として近接した2つの点音源(いわゆるDipole音源)を用い、聴取者の頭部の簡易モデルとして球表面で粒子速度が0である剛体球を用いている。 In this simulation, two point sound sources (so-called dipole sound sources) are used as directional sound sources, and a rigid sphere whose particle velocity is 0 on the spherical surface is used as a simple model of the listener's head.

また、制御フィルタの設計に用いるプラント伝達関数として頭部球体が座標軸原点にある場合のものを用いている。また、制御フィルタは最小二乗法による時間領域設計手法(Wiener Filter Approach)を用いて設計した。制御フィルタのタップ数はNg=512とした。スピーカの配置距離はL=1.4m、配置角度は10°、頭部の剛球体の半径はh=0.08mとし、0 Hzから22050 Hzの周波数範囲で883点について計算を行い、サンプリング周波数は44100 Hz、球波動関数の打ち切り展開次数はN = [round(kh)+10] とした。ここで、kは、波数を表す。 In addition, as the plant transfer function used for designing the control filter, the one when the head sphere is at the origin of the coordinate axis is used. The control filter was designed using the time-domain design method (Wiener Filter Approach) based on the least-squares method. The number of taps of the control filter was set to Ng=512. The speaker placement distance is L = 1.4m, the placement angle is 10°, the radius of the rigid sphere on the head is h = 0.08m, and the calculation is performed for 883 points in the frequency range from 0 Hz to 22050 Hz, with a sampling frequency of 44100. Hz, and the truncated expansion order of the spherical wave function is N = [round(kh)+10]. where k represents the wave number.

上記のシミュレーション条件下における、頭部が横方向の移動(図2(a)及び図3(a)に示すような移動)に対するクロストークキャンセル量の周波数特性を図7(a)(b)に示す。図7(a)は背景技術のようにスピーカを横型配置した場合のクロストークキャンセル量の周波数特性を示す図であり、図7(b)は実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合のクロストークキャンセル量の周波数特性を示す図である。図7(a)(b)において、横軸は頭部運動、言い換えれば頭部の横方向の移動距離を示し、縦軸は周波数を示す。また、図7(a)(b)において、白い部分ほどクロストークキャンセル量が多いことを示す。図7(a)及び図7(b)を比較すると、実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合には、周波数帯域全体に渡ってクロストークキャンセルが補償されていることがわかる。 7(a) and 7(b) show the frequency characteristics of the amount of crosstalk cancellation with respect to the lateral movement of the head (movements as shown in FIGS. 2(a) and 3(a)) under the above simulation conditions. show. FIG. 7(a) is a diagram showing the frequency characteristics of the amount of crosstalk cancellation when the speakers are horizontally arranged as in the background art, and FIG. Alternatively, it is a diagram showing the frequency characteristics of the amount of crosstalk cancellation when arranged on the same sagittal plane. In FIGS. 7(a) and 7(b), the horizontal axis indicates head motion, in other words, the horizontal movement distance of the head, and the vertical axis indicates frequency. In addition, in FIGS. 7A and 7B, whiter portions indicate greater amounts of crosstalk cancellation. Comparing FIG. 7(a) and FIG. 7(b), when the speakers are placed on the median plane of the listener or on the same sagittal plane as in the embodiment, crosstalk cancellation occurs over the entire frequency band. is found to be compensated for.

上記のシミュレーション条件下における、頭部が横方向(図18(a)及び図19(a)においてx軸方向)及び縦方向(図18(a)及び図19(a)においてy軸方向)の移動に対するクロストークキャンセル量の平均値を図8(a)(b)に示す。図8(a)は背景技術のようにスピーカを横型配置した場合のクロストークキャンセル量の平均値を示す図であり、図8(b)は実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合のクロストークキャンセル量の平均値を示す図である。図8(a)(b)において、横軸は頭部の横方向の移動距離を示し、縦軸は頭部の縦方向の移動距離を示す。図8(a)(b)において、白い部分ほどクロストークキャンセル量が多いことを示す。図8(a)及び図8(b)を比較すると、実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合には、横方向及び縦方向の広い範囲に渡ってクロストークキャンセルが補償されていることがわかる。 Under the above simulation conditions, the head is in the horizontal direction (the x-axis direction in FIGS. 18(a) and 19(a)) and the vertical direction (the y-axis direction in FIGS. 18(a) and 19(a)). FIGS. 8(a) and 8(b) show average values of crosstalk cancellation amounts with respect to movement. FIG. 8(a) is a diagram showing the average value of the amount of crosstalk cancellation when the speakers are horizontally arranged as in the background art, and FIG. Alternatively, it is a diagram showing the average value of the amount of crosstalk cancellation when arranged on the same sagittal plane. In FIGS. 8A and 8B, the horizontal axis indicates the horizontal movement distance of the head, and the vertical axis indicates the vertical movement distance of the head. In FIGS. 8(a) and 8(b), whiter portions indicate greater amounts of crosstalk cancellation. Comparing FIGS. 8(a) and 8(b), when the speakers are arranged on the median plane of the listener or on the same sagittal plane as in the embodiment, the horizontal and vertical It can be seen that crosstalk cancellation is compensated across.

上記のシミュレーション条件下における、頭部が横方向(図18(a)及び図19(a)においてx軸方向)の各位置にある場合の合成信号の周波数特性を図9(a)(b)及び及び図10(a)(b)に示す。 9(a) and 9(b) show the frequency characteristics of the combined signal when the head is at each position in the horizontal direction (the x-axis direction in FIGS. 18(a) and 19(a)) under the above simulation conditions. and and shown in FIGS. 10(a) and (b).

図9(a)は背景技術のようにスピーカを横型配置した場合であって、頭部が原点位置にある場合の合成信号の周波数特性を示す図である。図9(b)は背景技術のようにスピーカを横型配置した場合であって、頭部が原点位置から横方向に3cmずれた位置にある場合の合成信号の周波数特性を示す図である。 FIG. 9(a) is a diagram showing the frequency characteristics of the synthesized signal when the speakers are horizontally arranged as in the background art and the head is at the origin position. FIG. 9(b) is a diagram showing the frequency characteristics of the synthesized signal when the speakers are horizontally arranged as in the background art and the head is laterally displaced by 3 cm from the origin position.

図10(a)は実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合であって、頭部が原点位置にある場合の合成信号の周波数特性を示す図である。図10(b)は実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合であって、頭部が原点位置から横方向に3cmずれた位置にある場合の合成信号の周波数特性を示す図である。 FIG. 10(a) is a diagram showing the frequency characteristics of the synthesized signal when the speakers are placed on the median plane of the listener or on the same sagittal plane as in the embodiment, and the head is at the origin position. is. FIG. 10(b) shows a case in which the speakers are arranged on the median plane of the listener or on the same sagittal plane as in the embodiment, and the head is positioned laterally 3 cm away from the origin position. FIG. 4 is a diagram showing frequency characteristics of a combined signal;

図9(a)(b)及び図10(a)(b)において、横軸は周波数を示し、縦軸は相対レベルを示す。図9(a)(b)及び図10(a)(b)において、破線は再生したい信号であるダイレクト成分を示し、実線は消したい信号であるクロストーク成分を示す。 In FIGS. 9A, 9B and 10A, 10B, the horizontal axis indicates frequency and the vertical axis indicates relative level. In FIGS. 9A, 9B and 10A, 10B, the dashed line indicates the direct component, which is the signal to be reproduced, and the solid line indicates the crosstalk component, which is the signal to be erased.

図9(b)から、背景技術のようにスピーカを横型配置した場合には、12 kHz付近に経路長差に起因すると思われる悪条件周波数が見られ、頭部位置変動によって合成信号の振幅が大きく変動することがわかる。 From Fig. 9(b), when the speakers are arranged horizontally as in the background art, an ill-conditioned frequency is seen around 12 kHz, which is thought to be caused by the difference in path length, and the amplitude of the synthesized signal changes due to head position fluctuations. You can see that it fluctuates greatly.

一方、図10(b)から、実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合には、頭部が位置変動しても、ダイレクト成分、クロストーク成分ともに変動が少なく、悪条件周波数が再生周波数帯域に見られないことがわかる。 On the other hand, from FIG. 10(b), when the speakers are arranged on the median plane of the listener or on the same sagittal plane as in the embodiment, even if the position of the head changes, the direct component and the crosstalk component It can be seen that there is little variation in both, and the ill-conditioned frequency is not seen in the reproduction frequency band.

上記のシミュレーション条件下における、頭部が横方向(図18(a)及び図19(a)においてx軸方向)及び縦方向(図18(a)及び図19(a)においてy軸方向)の移動に対する周波数特性のフラット性を図11(a)(b)に示す。図11(a)は背景技術のようにスピーカを横型配置した場合の周波数特性のフラット性を示す図である。図11(b)は実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合の周波数特性のフラット性を示す図である。図11(a)(b)において、黒い部分ほど周波数特性のフラット性が保たれていることを示す。図11(a)及び図11(b)を比較すると、実施形態のようにスピーカを聴取者の正中面上または同一矢状面上に配置した場合には、横方向及び縦方向の広い範囲に渡って周波数特性のフラット性が保たれていることがわかる。 Under the above simulation conditions, the head is in the horizontal direction (the x-axis direction in FIGS. 18(a) and 19(a)) and the vertical direction (the y-axis direction in FIGS. 18(a) and 19(a)). FIGS. 11A and 11B show the flatness of the frequency characteristics with respect to movement. FIG. 11A is a diagram showing the flatness of frequency characteristics when speakers are horizontally arranged as in the background art. FIG. 11(b) is a diagram showing the flatness of the frequency characteristics when the speakers are arranged on the median plane of the listener or on the same sagittal plane as in the embodiment. In FIGS. 11A and 11B, blacker portions indicate that the flatness of the frequency characteristics is maintained. Comparing FIGS. 11(a) and 11(b), when the speakers are arranged on the median plane of the listener or on the same sagittal plane as in the embodiment, the horizontal and vertical directions are wide. It can be seen that the flatness of the frequency characteristics is maintained over the entire range.

[指向性の強さ及びスピーカの配置距離]
以下、図12にしめすような自由音場モデルを用いて、右信号d1が右耳に合成されるダイレクト成分P1(ω)及び左耳に合成されるクロストーク成分P2(ω)を定式化することを考える。図12において、B1は聴取者の右耳であり、B2は聴取者の左耳であり、Y1は一方のスピーカである指向性付き音源であり、Y2は他方のスピーカである指向性付き音源であり、Lはスピーカと聴取者の距離であり、L1はスピーカY1と聴取者の右耳B1との距離である。
[Directivity strength and speaker placement distance]
Below, using a free-field model as shown in FIG. 12, the direct component P 1 (ω) synthesized in the right ear and the crosstalk component P 2 (ω) synthesized in the left ear of the right signal d 1 are expressed as Consider formulating. In FIG. 12, B 1 is the listener's right ear, B 2 is the listener's left ear, Y 1 is the directional sound source, one speaker, and Y 2 is the other speaker, the directional L is the distance between the speaker and the listener, and L1 is the distance between the speaker Y1 and the listener's right ear B1 .

指向性付き点音源の伝達関数は、以下のように表されるとする。H11はY1からB1までの伝達関数であり、H21はY1からB2までの伝達関数である。ρ0は、空気の密度であり、所定の数である。kは、波数である。

Figure 2023121744000003
A(φ)は指向性係数である。
Figure 2023121744000004
このとき、単位体積加速度あたりの伝達関数行列H(ω)は、以下のように表される。
Figure 2023121744000005
ここで、H(ω)に対する逆行列G(ω)は、以下のように表される。
Figure 2023121744000006
理想的には、H(ω)G(ω)=Iとなる。しかし、制御フィルタ行列G(ω)をディジタルフィルタとして実装する場合には、そのフィルタ係数の数値を、採用する量子化bit数に応じた範囲(ダイナミックレンジ)内に収める必要がある。 Assume that the transfer function of a directional point sound source is expressed as follows. H11 is the transfer function from Y1 to B1 and H21 is the transfer function from Y1 to B2 . ρ 0 is the density of air and is a given number. k is the wave number.
Figure 2023121744000003
A(φ) is the directivity coefficient.
Figure 2023121744000004
At this time, the transfer function matrix H(ω) per unit volume acceleration is expressed as follows.
Figure 2023121744000005
Here, the inverse matrix G(ω) for H(ω) is expressed as follows.
Figure 2023121744000006
Ideally, H(ω)G(ω)=I. However, when implementing the control filter matrix G(ω) as a digital filter, it is necessary to keep the numerical values of the filter coefficients within a range (dynamic range) corresponding to the number of quantization bits employed.

G(ω)をフーリエ変換したg(t)は、以下のように表される。cは、音波の伝搬速度であり、所定の数である。δは、単位インパルス関数である。

Figure 2023121744000007
フィルタ係数の最大値を1に正規化する場合、以下のようになる。
Figure 2023121744000008
実際の制御は、H(ω)G(ω)=P(ω)となる。システムへの入力信号をd1=δ(t)、d=0とした場合に、右耳にP1(ω)=1、左耳にP2(ω)=0の合成信号が生成されるように制御をすることを考える。この場合、右耳B1に合成される音圧P1(ω)、左耳B2に合成される音圧P2(ω)は、以下のように表される。
Figure 2023121744000009
ここで、P1(ω)を大きくして、ダイナミックレンジの損失を低減するために、(1)指向性係数A(φ)を小さくすること(≒スピーカの指向性を強くすること)、及び/又は、(2)スピーカと聴取者の距離Lが小さくなればL1も小さくなるため、スピーカと聴取者の距離Lを小さくすることが考えられる。 g(t) obtained by Fourier transforming G(ω) is expressed as follows. c is the propagation speed of the sound wave and is a predetermined number. δ is the unit impulse function.
Figure 2023121744000007
If we normalize the maximum value of the filter coefficients to 1, then:
Figure 2023121744000008
Actual control is H(ω)G(ω)=P(ω). Assuming that the input signal to the system is d 1 =δ(t) and d 2 =0, a combined signal of P 1 (ω)=1 in the right ear and P 2 (ω)=0 in the left ear is generated. Think of controlling as In this case, the sound pressure P 1 (ω) synthesized in the right ear B 1 and the sound pressure P 2 (ω) synthesized in the left ear B 2 are expressed as follows.
Figure 2023121744000009
Here, in order to increase P 1 (ω) and reduce the loss of the dynamic range, (1) the directivity coefficient A(φ) should be decreased (≒the directivity of the speaker should be strengthened), and or (2) if the distance L between the speaker and the listener is reduced, the distance L1 is also reduced;

指向性係数A(φ)=(cos φ)Dとして、指向性の強さDとダイナミックレンジの損失量(相対レベル)の関係は、図13(a)の実線及び左軸のようになる。図13(a)には、聴取者の頭部が横方向に7cm移動した時のクロストークキャンセル量を破線及び右軸で更に示している。図13(a)の横軸は、指向性の強さを示している。なお、図13(a)において、左軸の相対レベルが小さいほど、ダイナミックレンジの損失量が大きくなるという関係がある。 Assuming a directivity coefficient A(φ)=(cos φ) D , the relationship between the directivity strength D and the loss amount (relative level) of the dynamic range is shown by the solid line and the left axis in FIG. 13(a). FIG. 13(a) further shows the amount of crosstalk cancellation when the listener's head moves laterally by 7 cm with the dashed line and the right axis. The horizontal axis of FIG. 13(a) indicates the strength of directivity. In FIG. 13A, there is a relationship that the smaller the relative level on the left axis, the larger the amount of loss in the dynamic range.

図13(a)に示すように、指向性を強くすると、ダイナミックレンジの損失量は小さくなるが、クロストークキャンセル量も小さくなる。また、指向性を弱くすると、ダイナミックレンジの損失量は大きくなるが、クロストークキャンセル量も大きくなる。 As shown in FIG. 13(a), increasing the directivity reduces the amount of dynamic range loss, but also reduces the amount of crosstalk cancellation. Also, if the directivity is weakened, the amount of dynamic range loss increases, but the amount of crosstalk cancellation also increases.

このように、ダイナミックレンジの損失量とクロストークキャンセル量との間にはトレードオフの関係がある。 Thus, there is a trade-off relationship between the amount of dynamic range loss and the amount of crosstalk cancellation.

このため、第一スピーカ21の指向性の強さ及び第二スピーカ22の指向性の強さは、このトレードオフの関係を考慮して、ダイナミックレンジの損失量が所定の第一閾値よりも小さくなり、かつ、クロストークキャンセル量が所定の第二閾値よりも大きくなるように設定されてもよい。 Therefore, considering this trade-off relationship, the intensity of the directivity of the first speaker 21 and the intensity of the directivity of the second speaker 22 are determined so that the loss amount of the dynamic range is smaller than the predetermined first threshold. and the crosstalk cancellation amount may be set to be greater than a predetermined second threshold.

スピーカと聴取者の距離Lとダイナミックレンジの損失量(相対レベル)の関係は、図13(b)の実線及び左軸のようになる。図13(b)には、聴取者の頭部が横方向に7cm移動した時のクロストークキャンセル量を破線及び右軸で更に示している。図13(b)の横軸は、スピーカと聴取者の距離を示している。図13(b)において、左軸の相対レベルが小さいほど、ダイナミックレンジの損失量が大きくなるという関係がある。 The relationship between the distance L between the speaker and the listener and the amount of dynamic range loss (relative level) is shown by the solid line and the left axis in FIG. 13(b). In FIG. 13(b), the broken line and right axis further indicate the amount of crosstalk cancellation when the listener's head moves laterally by 7 cm. The horizontal axis of FIG. 13(b) indicates the distance between the speaker and the listener. In FIG. 13B, there is a relationship that the smaller the relative level on the left axis, the larger the amount of loss in the dynamic range.

図13(b)に示すように、スピーカと聴取者の距離を長くすると、ダイナミックレンジの損失量は大きくなるが、クロストークキャンセル量も大きくなる。また、スピーカと聴取者の距離を短くすると、ダイナミックレンジの損失量は小さくなるが、クロストークキャンセル量も小さくなる。 As shown in FIG. 13(b), increasing the distance between the speaker and the listener increases the amount of dynamic range loss, but also increases the amount of crosstalk cancellation. Also, if the distance between the speaker and the listener is shortened, the amount of loss in dynamic range is reduced, but the amount of crosstalk cancellation is also reduced.

このように、ダイナミックレンジの損失量とクロストークキャンセル量との間にはトレードオフの関係がある。 Thus, there is a trade-off relationship between the amount of dynamic range loss and the amount of crosstalk cancellation.

このため、第一スピーカ21及び第二スピーカ22と聴取者との距離は、このトレードオフの関係を考慮して、ダイナミックレンジの損失量が所定の第一閾値よりも小さくなり、かつ、クロストークキャンセル量が所定の第二閾値よりも大きくなるように設定されてもよい。 Therefore, considering this trade-off relationship, the distance between the first speaker 21 and the second speaker 22 and the listener is such that the amount of dynamic range loss is less than a predetermined first threshold and crosstalk is minimized. The amount of cancellation may be set to be greater than a predetermined second threshold.

図14に、スピーカと聴取者の距離及び指向性の強さと、スコアとの関係を示す。このスコアは、以下の(1)から(4)のそれぞれを満たす場合には1点を加える処理により計算されるスコアである。(1)ダイナミックレンジの損失が35 dB以下である。(2)7cm移動時のクロストークキャンセル量が10 dB以上である。(3)7cm移動時のダイレクト成分の音圧低下が3 dB以下である。(4)制御フィルタの条件数が15以下である(なお、制御フィルタの条件数の最小値は1であり最大値は249である。)。図14の白の部分は、スコアの最高点である4点を示している。図14において、横軸はスピーカと聴取者の距離を示し、縦軸は指向性の強さを示す。図14の白い部分に対応するように、スピーカと聴取者の距離及び指向性の強さを決定してもよい。 FIG. 14 shows the relationship between the distance between the speaker and the listener, the intensity of directivity, and the score. This score is a score calculated by adding 1 point when each of the following (1) to (4) is satisfied. (1) Dynamic range loss is 35 dB or less. (2) The amount of crosstalk cancellation when moving 7 cm is 10 dB or more. (3) The sound pressure drop of the direct component when moving 7 cm is 3 dB or less. (4) The number of conditions of the control filter is 15 or less (the minimum value of the number of conditions of the control filter is 1 and the maximum value is 249). The white part in FIG. 14 indicates the maximum score of 4 points. In FIG. 14, the horizontal axis indicates the distance between the speaker and the listener, and the vertical axis indicates the strength of directivity. The distance between the speaker and the listener and the strength of directivity may be determined so as to correspond to the white portion in FIG.

図15(a)に、スピーカと聴取者の距離及び指向性の強さと、ダイナミックレンジの損失との関係を示す。図15(a)の白の部分は、ダイナミックレンジの損失が35 dB以下であることを示している。 FIG. 15(a) shows the relationship between the distance between the speaker and the listener, the strength of directivity, and the loss of dynamic range. The white portion in FIG. 15(a) indicates that the dynamic range loss is 35 dB or less.

図15(b)に、スピーカと聴取者の距離及び指向性の強さと、7cm移動時のクロストークキャンセル量との関係を示す。図15(b)の白の部分は、7cm移動時のクロストークキャンセル量が10 dB以上であることを示している。 FIG. 15(b) shows the relationship between the distance between the speaker and the listener, the strength of directivity, and the amount of crosstalk cancellation when moving 7 cm. The white portion in FIG. 15(b) indicates that the amount of crosstalk cancellation when moving 7 cm is 10 dB or more.

図16(a)に、スピーカと聴取者の距離及び指向性の強さと、7cm移動時のダイレクト成分の音圧低下との関係を示す。図16(a)の黒の部分は、7cm移動時のダイレクト成分の音圧低下が3 dB以下であることを示している。 FIG. 16(a) shows the relationship between the distance between the speaker and the listener, the strength of directivity, and the drop in sound pressure of the direct component when moving 7 cm. The black portion in FIG. 16(a) indicates that the sound pressure drop of the direct component when moving 7 cm is 3 dB or less.

図16(b)に、スピーカと聴取者の距離及び指向性の強さと、制御フィルタの条件数との関係を示す。図16(b)の黒の部分は、制御フィルタの条件数が15以下であることを示している。 FIG. 16(b) shows the relationship between the distance between the speaker and the listener, the intensity of directivity, and the condition number of the control filter. The black part in FIG. 16(b) indicates that the number of conditions of the control filter is 15 or less.

なお、図15(a)(b)及び図16(a)(b)において、横軸はスピーカと聴取者の距離を示し、縦軸は指向性の強さを示す。 In FIGS. 15A, 15B and 16A, 16B, the horizontal axis indicates the distance between the speaker and the listener, and the vertical axis indicates the strength of directivity.

立体音響再生装置は、図5に一点線で示す、スピーカ制御部5を更に備えていてもよい。スピーカ制御部5は、ダイナミックレンジの損失量が所定の第一閾値よりも小さくなり、かつ、クロストークキャンセル量が所定の第二閾値よりも大きくなるように、第一スピーカ21の指向性の強さ及び第二スピーカ22の指向性の強さ、及び/又は、第一スピーカ21及び第二スピーカ22と聴取者との距離を制御する。スピーカ制御部5は、例えばソフトウェア処理により又は物理的な手法により、スピーカの指向性の強さを変更可能であるとする。また、スピーカ制御部5は、例えば物理的な手法により、第一スピーカ21及び第二スピーカ22と聴取者の距離を変更可能であるとする。 The stereophonic sound reproduction device may further include a speaker control section 5 indicated by a dashed line in FIG. The speaker control unit 5 adjusts the directivity of the first speaker 21 so that the amount of dynamic range loss is smaller than a predetermined first threshold and the amount of crosstalk cancellation is larger than a predetermined second threshold. and the directivity strength of the second speaker 22 and/or the distance between the first speaker 21 and the second speaker 22 and the listener. It is assumed that the speaker control unit 5 can change the strength of directivity of the speaker, for example, by software processing or by a physical method. Further, it is assumed that the speaker control unit 5 can change the distance between the first speaker 21 and the second speaker 22 and the listener by, for example, a physical method.

[変形例]
以上、本発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、本発明に含まれることはいうまでもない。
[Variation]
Although the embodiments of the present invention have been described above, the specific configuration is not limited to these embodiments. Needless to say, it is included in the present invention.

実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。 The various processes described in the embodiments are not only executed in chronological order according to the described order, but may also be executed in parallel or individually according to the processing capacity of the device that executes the processes or as necessary.

例えば、立体音響再生装置の構成部間のデータのやり取りは直接行われてもよいし、図示していない記憶部を介して行われてもよい。 For example, data exchange between components of the stereophonic sound reproduction device may be performed directly or may be performed via a storage unit (not shown).

[プログラム、記録媒体]
上述した立体音響再生装置の各部の処理をコンピュータにより実現してもよく、この場合は立体音響再生装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図17に示すコンピュータ1000の記憶部1020に読み込ませ、演算処理部1010、入力部1030、出力部1040などに動作させることにより、立体音響再生装置における各種の処理機能がコンピュータ上で実現される。
[Program, recording medium]
The processing of each part of the stereophonic sound reproduction device described above may be realized by a computer. In this case, the processing contents of the functions that the stereophonic sound reproduction device should have are described by a program. By loading this program into the storage unit 1020 of the computer 1000 shown in FIG. is realized by

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体は、例えば、非一時的な記録媒体であり、具体的には、磁気記録装置、光ディスク、等である。 A program describing the contents of this processing can be recorded in a computer-readable recording medium. A computer-readable recording medium is, for example, a non-temporary recording medium, specifically a magnetic recording device, an optical disc, or the like.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 Also, distribution of this program is carried out by selling, assigning, lending, etc. portable recording media such as DVDs and CD-ROMs on which the program is recorded, for example. Further, the program may be distributed by storing the program in the storage device of the server computer and transferring the program from the server computer to other computers via the network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の非一時的な記憶装置である補助記録部1050に格納する。そして、処理の実行時、このコンピュータは、自己の非一時的な記憶装置である補助記録部1050に格納されたプログラムを記憶部1020に読み込み、読み込んだプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを記憶部1020に読み込み、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program, for example, first stores a program recorded on a portable recording medium or a program transferred from a server computer once in the auxiliary recording unit 1050, which is its own non-temporary storage device. Store. When executing the process, this computer reads the program stored in the auxiliary recording section 1050, which is its own non-temporary storage device, into the storage section 1020, and executes the process according to the read program. As another execution form of this program, the computer may read the program directly from the portable recording medium into the storage unit 1020 and execute processing according to the program. It is also possible to execute processing in accordance with the received program each time the is transferred. In addition, the above processing is executed by a so-called ASP (Application Service Provider) type service, which does not transfer the program from the server computer to this computer, but realizes the processing function only by executing the execution instruction and obtaining the result. may be It should be noted that the program in this embodiment includes information that is used for processing by a computer and that conforms to the program (data that is not a direct instruction to the computer but has the property of prescribing the processing of the computer, etc.).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。例えば、信号処理部1、制御フィルタ行列計算部3は、処理回路により構成されてもよい。また、記憶部1020は、メモリーであってもよい。 Moreover, in this embodiment, the device is configured by executing a predetermined program on a computer, but at least a part of these processing contents may be implemented by hardware. For example, the signal processor 1 and the control filter matrix calculator 3 may be configured by processing circuits. Also, the storage unit 1020 may be a memory.

その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。 In addition, it goes without saying that appropriate modifications are possible without departing from the gist of the present invention.

1信号処理部
21実施形態における第一スピーカ
22実施形態における第二スピーカ
3制御フィルタ行列計算部
41従来の配置形態における第一スピーカ
42従来の配置形態における第二スピーカ
1 Signal processing unit 21 First speaker 22 in embodiment Second speaker 3 Control filter matrix calculator 41 First speaker 42 in conventional layout Second speaker in conventional layout

Claims (3)

指向性の主軸が、聴取者の一方の耳に向けられた第一スピーカと、
指向性の主軸が、前記聴取者の他方の耳に向けられた第二スピーカと、
前記第二スピーカから前記一方の耳に到達する音及び前記第一スピーカから前記他方の耳に到達する音を打ち消すためのクロストークキャンセル処理を行い、処理後信号を生成する信号処理部と、
を含む立体音響再生装置であって、
前記第一スピーカ及び前記第二スピーカは、前記処理後信号に基づく音を発し、
前記第一スピーカ及び前記第二スピーカは、前記聴取者の正中面上または同一矢状面上に配置される、
立体音響再生装置。
a first loudspeaker with a directional principal axis directed toward one ear of the listener;
a second speaker with a directional principal axis directed toward the other ear of the listener;
a signal processing unit that performs crosstalk cancellation processing for canceling the sound reaching the one ear from the second speaker and the sound reaching the other ear from the first speaker, and generating a post-processing signal;
A stereophonic sound reproduction device comprising
The first speaker and the second speaker emit a sound based on the processed signal,
the first speaker and the second speaker are positioned on the listener's median plane or on the same sagittal plane;
Stereophonic sound reproduction device.
請求項1の立体音響再生装置であって、
前記第一スピーカの指向性の強さ及び前記第二スピーカの指向性の強さは、ダイナミックレンジの損失量が所定の第一閾値よりも小さくなり、かつ、クロストークキャンセル量が所定の第二閾値よりも大きくなるように設定される、
立体音響再生装置。
The stereophonic sound reproduction device according to claim 1,
The strength of the directivity of the first speaker and the strength of the directivity of the second speaker are such that the amount of dynamic range loss is smaller than a predetermined first threshold and the amount of crosstalk cancellation is a predetermined second set to be greater than the threshold,
Stereophonic sound reproduction device.
請求項1の立体音響再生装置であって、
前記第一スピーカ及び前記第二スピーカと前記聴取者との距離は、ダイナミックレンジの損失量が所定の第一閾値よりも小さくなり、かつ、クロストークキャンセル量が所定の第二閾値よりも大きくなるように設定される、
立体音響再生装置。
The stereophonic sound reproduction device according to claim 1,
At a distance between the first speaker and the second speaker and the listener, the amount of dynamic range loss is smaller than a predetermined first threshold and the amount of crosstalk cancellation is larger than a predetermined second threshold. is set to
Stereophonic sound reproduction device.
JP2023024373A 2022-02-21 2023-02-20 Stereophonic sound reproducing device Pending JP2023121744A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022024721 2022-02-21
JP2022024721 2022-02-21

Publications (1)

Publication Number Publication Date
JP2023121744A true JP2023121744A (en) 2023-08-31

Family

ID=87797943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023024373A Pending JP2023121744A (en) 2022-02-21 2023-02-20 Stereophonic sound reproducing device

Country Status (1)

Country Link
JP (1) JP2023121744A (en)

Similar Documents

Publication Publication Date Title
JP6933215B2 (en) Sound field forming device and method, and program
KR101547035B1 (en) Three-dimensional sound capturing and reproducing with multi-microphones
JP4300194B2 (en) Sound reproduction apparatus, sound reproduction method, and sound reproduction program
JP4343845B2 (en) Audio data processing method and sound collector for realizing the method
JP7028238B2 (en) Signal processing equipment and methods, as well as programs
CN108702566B (en) Cylindrical microphone array for efficient recording of 3D sound fields
US10403259B2 (en) Multi-microphone feedforward active noise cancellation
US8611552B1 (en) Direction-aware active noise cancellation system
CN109302660B (en) Audio signal compensation method, device and system
US7889872B2 (en) Device and method for integrating sound effect processing and active noise control
CN100525101C (en) Method and apparatus to record a signal using a beam forming algorithm
KR100647338B1 (en) Method of and apparatus for enlarging listening sweet spot
US20190251948A1 (en) Signal processing device, signal processing method, and program
CN113473294B (en) Coefficient determination method and device
US10986447B2 (en) Doppler compensation in coaxial and offset speakers
JP2023121744A (en) Stereophonic sound reproducing device
JP6970366B2 (en) Sound image reproduction device, sound image reproduction method and sound image reproduction program
CN113473293B (en) Coefficient determination method and device
CN113242491B (en) Noise reduction processing method, apparatus, device, storage medium, and program
JP7010231B2 (en) Signal processing equipment and methods, as well as programs
KR101796768B1 (en) Noise reducing device using active noise control and method for the same
KR102347626B1 (en) Method and apparatus for generating personal sound zone according to distance
JP2011259299A (en) Head-related transfer function generation device, head-related transfer function generation method, and audio signal processing device
US20240233746A9 (en) Audio rendering method and electronic device performing the same
US20220295213A1 (en) Signal processing device, signal processing method, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230221