JP5417227B2 - Multi-channel acoustic signal downmix device and program - Google Patents
Multi-channel acoustic signal downmix device and program Download PDFInfo
- Publication number
- JP5417227B2 JP5417227B2 JP2010056681A JP2010056681A JP5417227B2 JP 5417227 B2 JP5417227 B2 JP 5417227B2 JP 2010056681 A JP2010056681 A JP 2010056681A JP 2010056681 A JP2010056681 A JP 2010056681A JP 5417227 B2 JP5417227 B2 JP 5417227B2
- Authority
- JP
- Japan
- Prior art keywords
- downmix
- signal
- channel
- sound
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、多数の音響チャンネルを持つ番組コンテンツの音響信号を受信し、2チャンネル音響信号や5.1チャンネルサラウンド音響信号へダウンミックスする技術に関する。 The present invention relates to a technique for receiving an audio signal of a program content having a large number of audio channels and downmixing it to a 2-channel audio signal or a 5.1-channel surround audio signal.
大画面・高精細の映像システムに対応した2次元音響方式として、2チャンネル音響方式や5.1チャンネルサラウンド音響方式よりもさらに臨場感の高い音響再生が実現できる「前方5チャンネル+側方・後方5チャンネル音響方式」がある。 As a two-dimensional audio system compatible with large-screen, high-definition video systems, it is possible to realize more realistic sound reproduction than the 2-channel audio system and 5.1-channel surround sound system. There is a “5-channel sound system”.
また、更に高さ方向にもチャンネルを階層的に拡張し、高さ方向の音像定位を可能にした「3次元(立体)音響方式」がある。この3次元音響方式の例を図8に示す。3次元音響方式は、例えば図8に示す多数の音響チャンネル(メインチャンネル22ch、低域強調(LFE)チャンネル2ch)から構成されている。この3次元音響方式の番組制作は、大画面映像ディスプレイ(TVディスプレイ)と多数のスピーカーを配置した図8の標準制作配置で行われる。 In addition, there is a “three-dimensional (three-dimensional) sound system” in which channels are expanded hierarchically in the height direction to enable sound image localization in the height direction. An example of this three-dimensional acoustic method is shown in FIG. The three-dimensional sound system is composed of, for example, a large number of sound channels (main channel 22ch, low frequency emphasis (LFE) channel 2ch) shown in FIG. This three-dimensional audio system program production is performed in the standard production arrangement of FIG. 8 in which a large screen video display (TV display) and a large number of speakers are arranged.
3次元音響方式などのマルチチャンネル音響の形式で制作された番組コンテンツの音響信号は、音響符号化ストリーム信号として多重され電波等により家庭に伝送される。この音響符号化ストリーム信号には、マルチチャンネル音響信号のほかに、音響方式に関するパラメータや番組コンテンツに適切なダウンミックス係数のパラメータなどの音響チャンネル関連メタデータが多重されている。 An audio signal of program content produced in a multi-channel audio format such as a three-dimensional audio system is multiplexed as an audio encoded stream signal and transmitted to a home by radio waves or the like. In addition to the multi-channel audio signal, audio channel-related metadata such as a parameter relating to the audio system and a parameter of a downmix coefficient appropriate for the program content are multiplexed in the audio encoded stream signal.
家庭においては、標準制作配置に則った音響用スピーカーを設置しない場合が多く、従来の2チャンネル音響信号や5.1チャンネルサラウンド音響信号の再生装置で再生されることも多いと想定される。この場合、家庭等においては、音響符号化ストリーム信号を受信し、これをマルチチャンネル音響信号の形式に復号し、また音響チャンネル関連メタデータを分離し、マルチチャンネル音響信号を、音響チャンネル関連メタデータと再生装置側で設定される再生チャンネル数に従って分配し、2チャンネル音響信号や5.1チャンネルサラウンド音響信号にダウンミックスした後、音響再生される。 In homes, there are many cases where an acoustic speaker is not installed according to the standard production arrangement, and it is assumed that it is often reproduced by a conventional reproducing apparatus for 2-channel sound signals and 5.1-channel surround sound signals. In this case, at home, etc., an audio encoded stream signal is received, decoded into a multi-channel audio signal format, audio channel-related metadata is separated, and the multi-channel audio signal is converted into audio channel-related metadata. Are distributed according to the number of playback channels set on the playback device side, down-mixed into a 2-channel audio signal or a 5.1-channel surround sound signal, and then played back.
例えば、DVDやハイビジョン放送の音響システムとして、「国際電気通信連合 無線通信部門(ITU−R)で勧告されている、5.1チャンネルサラウンド音響技術方式が普及している(例えば、非特許文献1参照)。電波産業会(ARIB)では、5.1チャンネルサラウンド音響信号を受信したときに2チャンネルステレオ音響信号にダウンミックスする機能を、「ARIB STD−B21 デジタル放送用受信装置(望ましい仕様)」として規定している(例えば、非特許文献2参照)。この規定においては具体的なダウンミックスの計算式及びメタデータとして送出される後方チャンネルパラメータが規定されている。 For example, as a sound system for DVD and high-definition broadcasting, “a 5.1 channel surround sound technology system recommended by the International Telecommunications Union Wireless Communication Sector (ITU-R) is widespread (for example, Non-Patent Document 1). (See ARIB STD-B21 Receiver for Digital Broadcasting (preferred specifications).) The Radio Industry Association (ARIB) has a function to downmix 5.1 channel surround sound signals to 2 channel stereo sound signals. (See, for example, Non-Patent Document 2). In this specification, a specific downmix calculation formula and a rear channel parameter transmitted as metadata are specified.
また、2次元音響方式よりもさらに臨場感の高い音響を再生できる「3次元(立体)音響方式」の番組制作に基づくマルチチャンネル音響信号についても、多数のスピーカーを標準配置とは異なる従来からの2チャンネル音響信号の再生装置や5.1チャンネルサラウンド音響信号の再生装置で再生されることも多い。この3次元音響方式などの多数の音響チャンネル信号を2チャンネル音響信号や5.1チャンネルサラウンド音響信号にダウンミックスするための具体的な計算式及びメタデータ、メタデータ受信時の計算式の例はARIB STD−B32「デジタル放送における映像符号化、音声符号化及び多重化方式」に記載されている(例えば、非特許文献3参照)。 Also, for multi-channel audio signals based on “3D (stereoscopic) audio system” program production that can reproduce sounds with a higher sense of presence than 2D audio systems, many speakers are different from the standard arrangement. It is often played back by a 2-channel sound signal playback device or a 5.1-channel surround sound signal playback device. Examples of specific calculation formulas and metadata, and calculation formulas at the time of receiving metadata for downmixing a large number of audio channel signals such as this three-dimensional audio system into 2-channel audio signals and 5.1-channel surround sound signals are as follows: It is described in ARIB STD-B32 “Video Coding, Audio Coding and Multiplexing System in Digital Broadcasting” (for example, see Non-Patent Document 3).
しかしながら、ARIB STD−B32に記載されている規定のダウンミックスの計算式に則りつつ単純にダウンミックスを行うと、「オーバーフローに伴う音質劣化又は番組(5.1チャンネルサラウンド音響信号や2チャンネル音響信号も混在する)間の音の大きなレベル差、及び音声バランスの劣化」が頻繁に発生する。 However, when downmixing is simply performed in accordance with the prescribed downmix calculation formula described in ARIB STD-B32, “sound quality deterioration due to overflow or program (5.1 channel surround sound signal or 2 channel sound signal) A large difference in sound level between the two) and a deterioration in sound balance occur frequently.
そこで、ダウンミックスの計算式に則りつつ頻繁に発生するオーバーフローに伴う音質劣化、又は番組間の音の大きなレベル差及び音声バランスの劣化を少なくする技術が必要とされていた。 Therefore, a technique for reducing deterioration in sound quality due to frequent overflow, or a large level difference in sound between programs and deterioration in sound balance, in accordance with the downmix calculation formula is required.
本発明の目的は、規定のダウンミックスの計算式に則りつつ頻繁に発生するオーバーフローに伴う音質劣化又は番組間に発生する音の大きなレベル差、及び音声バランスの劣化を低減する、マルチチャンネル音響信号のダウンミックス装置及びプログラムを提供することにある。 An object of the present invention is to reduce a sound quality deterioration due to a frequent overflow or a large level difference of sound generated between programs and a deterioration of sound balance in accordance with a prescribed downmix calculation formula. It is in providing the downmix apparatus and program of this.
本発明は、3次元(立体)音響方式のように多数のチャンネルから構成されるマルチチャンネル音響信号に対してダウンミックスする際に、規定のダウンミックスの計算式に則りつつ頻繁に発生するオーバーフローに伴う音質劣化又は番組間に発生する音の大きなレベル差、及び音声バランスの劣化を少なくするため、主に、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置側で設定される「再生チャンネル数」に従って各再生チャンネルのマルチチャンネル音響信号を選択して分配する音響チャンネル選択・分配部と、各再生チャンネル用に分配されたマルチチャンネル音響信号を入力して、音響チャンネル関連メタデータ内で指示される規定のダウンミックスの計算式のダウンミックス係数に従ってダウンミックスを行う各再生チャンネル用のダウンミックス音響チャンネルブロックとを備える。 In the present invention, when a multi-channel audio signal composed of a large number of channels is downmixed as in a three-dimensional (stereoscopic) audio system, an overflow that frequently occurs in accordance with a prescribed downmix calculation formula. In order to reduce the accompanying sound quality deterioration or the large level difference of sound generated between programs and the deterioration of sound balance, “parameters related to the sound system” in the sound channel related metadata and “ Select and distribute the multi-channel audio signal of each playback channel according to the number of playback channels, and input the multi-channel audio signal distributed for each playback channel, in the audio channel related metadata According to the downmix coefficient of the prescribed downmix calculation formula indicated by And a downmix acoustic channel block for each reproduction channel to be mixed.
各再生チャンネル用のダウンミックス音響チャンネルブロック(第iダウンミックス音響チャンネルブロック)は、ダウンミックスに際し、位相シフトダウンミックス音響信号及び単純ダウンミックス音響信号を生成するとともに、第iダウンミックス音響チャンネルのベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルに従って、位相シフトダウンミックス音響信号又は単純ダウンミックス音響信号に対してフェードイン/フェードアウト処理を用いて切替を行い、第iダウンミックス音響信号を出力する。ダウンミックスされた第iダウンミックス音響信号は、対応するスピーカーを通して音響再生される。 The downmix sound channel block (i-th downmix sound channel block) for each reproduction channel generates a phase-shifted downmix sound signal and a simple downmix sound signal during downmixing, and also provides a base for the i-th downmix sound channel. According to the cross-correlation value and the sound signal level of the sound channel signal and the accompanying sound channel signal, the phase-shift downmix sound signal or the simple downmix sound signal is switched using the fade-in / fade-out process, and the i-th downmix sound Output a signal. The downmixed i-th downmix sound signal is reproduced as sound through a corresponding speaker.
即ち、本発明のダウンミックス装置は、マルチチャンネル音響信号をダウンミックスして再生チャンネル数分のダウンミックス音響信号を生成するダウンミックス装置であって、マルチチャンネル音響信号と関連付けて多重される音響チャンネル関連メタデータの多重信号を受信して、該音響チャンネル関連メタデータ内の音響方式に関するパラメータを分離して抽出する音響チャンネル関連メタデータ分離手段と、前記音響方式に関するパラメータと、当該ダウンミックス装置に予め設定される再生チャンネル数に基づいて、各再生チャンネルのマルチチャンネル音響信号のうちベース音響チャンネル信号と前記ベース音響チャンネル信号を除く他の音響信号である付随音響チャンネル信号を選択して決定し、各再生チャンネル用に分配する音響チャンネル選択・分配手段と、再生チャンネルごとに、位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号と、遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成するとともに、各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するダウンミックス音響信号生成手段と、を備えることを特徴とする。 That is, the downmix device of the present invention is a downmix device that downmixes multichannel audio signals to generate downmix audio signals for the number of playback channels, and is an audio channel multiplexed in association with the multichannel audio signals. An acoustic channel-related metadata separating means for receiving a multiplexed signal of related metadata and separating and extracting a parameter relating to an acoustic method in the acoustic channel-related metadata; a parameter relating to the acoustic method; and the downmix device Based on the number of playback channels set in advance, among the multi-channel audio signals of each playback channel, select and determine a base acoustic channel signal and an accompanying acoustic channel signal that is another acoustic signal excluding the base acoustic channel signal , Distribute for each playback channel The sound channel selection / distribution means generates a phase-shift downmix sound signal for downmixing by phase shift and a simple downmix sound signal for downmixing only by delay processing for each playback channel, and for each playback channel. Switching between the phase shift downmix sound signal or the simple downmix sound signal is determined according to the cross-correlation value and sound signal level of the base sound channel signal and the accompanying sound channel signal, and the downmix sound signal for each reproduction channel is determined. Downmix acoustic signal generation means for outputting.
また、本発明のダウンミックス装置において、前記ダウンミックス音響信号生成手段は、前記位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号を生成する位相シフトダウンミックス生成手段と、前記遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成する単純ダウンミックス生成手段と、各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するダウンミックス切替手段と、を備えることを特徴とする。 In the downmix device according to the present invention, the downmix sound signal generating means may be a phase shift downmix sound generating means for generating a phase shift downmix sound signal for downmixing by the phase shift, and a downshift only by the delay process. Simple downmix generation means for generating a simple downmix sound signal for mixing, and the phase shift downmix sound signal according to the cross-correlation value and sound signal level of the base sound channel signal and the accompanying sound channel signal in each reproduction channel, or Downmix switching means for determining switching of the simple downmix sound signal and outputting a downmix sound signal for each reproduction channel.
また、本発明のダウンミックス装置において、前記ダウンミックス音響信号生成手段は、前記ベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルに基づいて、前記位相シフトダウンミックス音響信号と、前記単純ダウンミックス音響信号のいずれかを判別する旨を示すダウンミックス切替信号を生成する位相シフトブロック切替判定手段をさらに備えることを特徴とする。 Further, in the downmix device of the present invention, the downmix sound signal generating means is configured to generate the phase shift downmix sound signal based on the cross-correlation value and sound signal level of the base sound channel signal and the accompanying sound channel signal. The apparatus further includes phase shift block switching determination means for generating a downmix switching signal indicating that any one of the simple downmix acoustic signals is determined.
また、本発明のダウンミックス装置において、前記位相シフトブロック切替判定手段は、前記音響方式に関するパラメータ及び前記再生チャンネル数に基づいて決定されたベース音響チャンネル信号と付随音響チャンネル信号との間の相互相関値を算出する相互相関演算手段と、前記ベース音響チャンネル信号及び前記付随音響チャンネル信号のそれぞれの音響信号レベルを算出する音響信号レベル算出手段と、前記相互相関演算手段から得られる相互相関値と、前記音響信号レベル算出手段から得られる付随音響チャンネル信号の音響信号レベルから、前記位相シフトダウンミックス音響信号と、前記単純ダウンミックス音響信号のいずれがダウンミックス処理(音質劣化等の抑制)に適しているかを、予め定められた切替判定基準に従って判定し、判定した結果に基づくダウンミックス切替信号を生成する切替判定手段と、を備えることを特徴とする。 Further, in the downmix device of the present invention, the phase shift block switching determination means includes a cross-correlation between the base acoustic channel signal and the accompanying acoustic channel signal determined based on the parameters relating to the acoustic scheme and the number of reproduction channels. A cross-correlation calculating means for calculating a value, an acoustic signal level calculating means for calculating the respective acoustic signal levels of the base acoustic channel signal and the accompanying acoustic channel signal, and a cross-correlation value obtained from the cross-correlation calculating means, From the sound signal level of the accompanying sound channel signal obtained from the sound signal level calculation means, any of the phase shift downmix sound signal and the simple downmix sound signal is suitable for downmix processing (suppression of sound quality degradation and the like). In accordance with predetermined switching criteria Determined, the switching determination means for generating a downmix switching signal based on the judgment result, characterized in that it comprises a.
また、本発明のダウンミックス装置において、前記切替判定手段は、前記切替判定基準として、前記相互相関値が所定値以上、且つ前記ベース音響チャンネル信号の音響信号レベルの少なくとも1つがフルスケール換算で所定レベル以上、且つ前記付随音響チャンネル信号の音響信号レベルの少なくとも1つがフルスケール換算で所定レベル以上とし、全てが満たされた場合に前記位相シフトダウンミックス音響信号へと切り替え、それ以外は前記単純ダウンミックス音響信号に切り替えるように判定し、判定した結果に基づくダウンミックス切替信号を生成する手段を有することを特徴とする。 Further, in the downmix device of the present invention, the switching determination means uses, as the switching determination criterion, the cross-correlation value is a predetermined value or more and at least one of the acoustic signal levels of the base acoustic channel signal is predetermined in full scale conversion. More than a level, and at least one of the audio signal levels of the accompanying audio channel signal is set to a predetermined level or more in full scale conversion, and when all are satisfied, the phase shift downmix audio signal is switched to, and otherwise the simple down It has the means to determine to switch to a mix sound signal, and to produce | generate the downmix switching signal based on the determined result, It is characterized by the above-mentioned.
また、本発明のダウンミックス装置において、前記音響チャンネル関連メタデータ分離手段は、前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを行うよう指示するダウンミックス切替信号用のメタデータが、前記音響チャンネル関連メタデータ内に存在するか否かを判定し、前記音響チャンネル関連メタデータ内に前記ダウンミックス切替信号用のメタデータが存在すると判定した場合に、該メタデータからダウンミックス切替信号を生成する手段を有し、前記ダウンミックス音響信号生成手段は、該ダウンミックス切替信号に基づいて前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力する手段を有することを特徴とする。 Further, in the downmix device of the present invention, the acoustic channel related metadata separation means may include metadata for a downmix switching signal instructing to switch the phase shift downmix acoustic signal or the simple downmix acoustic signal. If the metadata for the downmix switching signal is determined to be present in the acoustic channel-related metadata, it is determined whether the metadata is present in the acoustic channel-related metadata. Means for generating a signal, wherein the downmix sound signal generation means determines switching between the phase shift downmix sound signal or the simple downmix sound signal based on the downmix switch signal, and for each reproduction channel. To output downmix sound signal Characterized in that it has.
また、本発明のダウンミックス装置において、前記ダウンミックス音響信号生成手段は、前記ダウンミックス切替信号に従う切替を行う際にフェードイン/フェードアウト処理を施すフェードイン/フェードアウト処理手段を有することを特徴とする。 In the downmix device of the present invention, the downmix sound signal generating means includes fade-in / fade-out processing means for performing a fade-in / fade-out process when switching according to the downmix switching signal. .
さらに、本発明は、マルチチャンネル音響信号をダウンミックスして再生チャンネル数分のダウンミックス音響信号を生成するダウンミックス装置として構成するコンピュータに、マルチチャンネル音響信号と関連付けて多重される音響チャンネル関連メタデータの多重信号を受信して、該音響チャンネル関連メタデータ内の音響方式に関するパラメータを分離して抽出するステップと、前記音響方式に関するパラメータと、当該ダウンミックス装置に予め設定される再生チャンネル数に基づいて、各再生チャンネルのマルチチャンネル音響信号のうちベース音響チャンネル信号と前記ベース音響チャンネル信号を除く他の音響信号である付随音響チャンネル信号を選択して決定し、各再生チャンネル用に分配するステップと、再生チャンネルごとに、位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号と、遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成するとともに、各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するステップと、を実行させるためのプログラムとして特徴を有する。 Furthermore, the present invention provides an audio channel-related meta that is multiplexed in association with a multichannel audio signal on a computer configured as a downmix device that downmixes multichannel audio signals to generate downmix audio signals for the number of playback channels. Receiving a multiplexed signal of data, separating and extracting parameters related to the audio system in the audio channel related metadata, parameters related to the audio system, and the number of playback channels set in advance in the downmix device; A step of selecting and determining a base sound channel signal and an accompanying sound channel signal other than the base sound channel signal among the multi-channel sound signals of each play channel, and distributing the selected sound signals to the play channels; And play channel For each, a phase-shifted downmix sound signal that is downmixed by phase shift and a simple downmix sound signal that is downmixed only by delay processing are generated, and the base sound channel signal and the associated sound channel in each reproduction channel are generated. Determining whether to switch the phase-shift downmix audio signal or the simple downmix audio signal according to a signal cross-correlation value and an audio signal level, and outputting a downmix audio signal for each reproduction channel. Features as a program.
本発明によれば、3次元音響方式などの多数の音響チャンネル信号のダウンミックスを行うにあたり、2チャンネル音響や5.1チャンネルサラウンド音響信号などの番組間での音響信号レベル等の差異がある場合でも、規定のダウンミックスの計算式に則りつつ頻繁に発生するオーバーフローに伴う音質劣化又は番組間に発生する音の大きなレベル差、及び音声バランスの劣化を低減させることができるようになる。 According to the present invention, when downmixing a large number of sound channel signals such as a three-dimensional sound system, there is a difference in the sound signal level between programs such as 2-channel sound and 5.1-channel surround sound signal. However, it is possible to reduce deterioration in sound quality due to frequent overflow or a large level difference in sound generated between programs and deterioration in sound balance in accordance with a prescribed downmix calculation formula.
以下、本発明による一実施例のマルチチャンネル音響信号のダウンミックス装置を説明する。 Hereinafter, a multi-channel audio signal downmix apparatus according to an embodiment of the present invention will be described.
図1は、本発明による一実施例のマルチチャンネル音響信号のダウンミックス装置を示す図であり、3次元音響方式などの多数の音響チャンネル信号を2チャンネル音響や5.1チャンネルサラウンド音響信号にダウンミックスする装置である。本実施例のダウンミックス装置1は、音響符号化ストリームとして伝送される図8に示す標準制作配置に従ったマルチチャンネル音響信号と音響チャンネル関連メタデータ多重信号を受信して、マルチチャンネル音響信号を、音響チャンネル関連メタデータと再生装置(ダウンミックス装置1)側で設定される再生チャンネル数に従って分配し、2チャンネル音響や5.1チャンネルサラウンド音響信号へとダウンミックスを行う装置である。尚、図8は、前述したように、大画面・高精細の映像システムに適した音響方式として、臨場感の高い音響を再生できる「3次元(立体)音響方式」のスピーカー配置例であり、メインチャンネル22ch、低域強調(LFE)チャンネル2chの場合である。
FIG. 1 is a diagram illustrating a multi-channel audio signal downmixing apparatus according to an embodiment of the present invention, in which a large number of audio channel signals such as a three-dimensional audio system are downgraded to 2-channel audio or 5.1-channel surround audio signals. It is a device to mix. The
本実施例のダウンミックス装置1は、音響チャンネル関連メタデータ分離部11と、音響チャンネル選択・分配部12と、位相シフトブロック切替判定部13、位相シフトダウンミックス部14、単純ダウンミックス部15、及びダウンミックス切替部16からなる第nダウンミックス音響チャンネルブロックとを備える。第nダウンミックス音響チャンネルブロックは、再生チャンネル数(n)に対応した数で構成される。
The
音響チャンネル関連メタデータ分離部11は、音響符号化ストリームにてmチャンネルマルチチャンネル音響信号と関連付けて多重される音響チャンネル関連メタデータの多重信号を受信して、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」を分離して抽出し、抽出した「音響方式に関するパラメータ」を、音響チャンネル選択・分配部12、位相シフトブロック切替判定部13、位相シフトダウンミックス部14、及び単純ダウンミックス部15に送出する。
The acoustic channel-related
ここで、「音響方式に関するパラメータ」は、マルチチャンネル音響信号におけるベース音響チャンネル信号を指定するパラメータを含み、好適には、位相シフトダウンミックスの計算式のダウンミックス係数のパラメータと、単純ダウンミックスの計算式のダウンミックス係数のパラメータとを含めることもできる。「音響方式に関するパラメータ」に位相シフトダウンミックスの計算式のダウンミックス係数のパラメータと、単純ダウンミックスの計算式のダウンミックス係数のパラメータとを含んでいない場合には、再生装置側(ダウンミックス装置1側)で予め定めたダウンミックス係数を用いるようにする。 Here, the “parameters related to the acoustic system” include parameters that specify the base acoustic channel signal in the multi-channel acoustic signal, and preferably the parameters of the downmix coefficient in the calculation formula of the phase shift downmix and the simple downmix. It is also possible to include a parameter of the downmix coefficient in the calculation formula. If the “parameter for acoustic method” does not include the parameter of the downmix coefficient in the calculation formula of the phase shift downmix and the parameter of the downmix coefficient in the calculation formula of the simple downmix, the playback device side (downmix device) The downmix coefficient predetermined in (1 side) is used.
音響チャンネル選択・分配部12は、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」と再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて、第iダウンミックス音響チャンネルブロックに入力される各再生チャンネルのマルチチャンネル音響信号のうちベース音響チャンネル信号とベース音響チャンネルを除く他の音響信号(付随音響チャンネル信号)を選択して決定し、第nダウンミックス音響チャンネルブロックの各々(第iダウンミックス音響チャンネルブロック)に分配する。
The sound channel selection /
位相シフトブロック切替判定部13は、第iダウンミックス音響チャンネルのベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルに従って、位相シフトダウンミックス部14で生成された位相シフトダウンミックス音響信号と、単純ダウンミックス部15で生成された単純ダウンミックス音響信号のいずれがダウンミックス処理(音質劣化等の抑制)に適しているかを、後述する予め定められた切替判定基準に従って音響ブロック単位で判定し、判定した結果に基づくダウンミックス切替信号を生成してダウンミックス切替部16に送出する。
The phase shift block switching
位相シフトダウンミックス部14は、各再生チャンネル用に分配されたマルチチャンネル音響信号を入力して、音響チャンネル関連メタデータ内で指示される規定の位相シフトダウンミックスの計算式のダウンミックス係数に従って位相シフトダウンミックス音響信号を生成する。
The phase
単純ダウンミックス部15は、各再生チャンネル用に分配されたマルチチャンネル音響信号を入力して、音響チャンネル関連メタデータ内で指示される規定の単純ダウンミックスの計算式のダウンミックス係数に従って単純ダウンミックス音響信号を生成する。
The
ダウンミックス切替部16は、位相シフトダウンミックス部14で生成された位相シフトダウンミックス音響信号と、単純ダウンミックス部15で生成された単純ダウンミックス音響信号とを、位相シフトブロック切替判定部13からのダウンミックス切替信号にしたがって切替を行い、第iダウンミックス音響信号を出力する。尚、ダウンミックス切替部16は、位相シフトブロック切替判定部13からのダウンミックス切替信号に従う切替を行う際にフェードイン/フェードアウト処理を施すフェードイン/フェードアウト処理部161を有する。このフェードイン/フェードアウト処理を行うことにより、音質劣化等の抑制に伴う信号切替時に生じうる雑音(歪み)を低下させることができる。ダウンミックスされた第iダウンミックス音響信号は、対応するスピーカー17−1〜17−nを通して音響再生される。
The
このように、各再生チャンネル用のダウンミックス音響チャンネルブロック(第iダウンミックス音響チャンネルブロック)は、再生チャンネルごとに、位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号と、遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成するとともに、各再生チャンネルにおけるベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルを算出し、算出した相互相関値及び音響信号レベルに従って、位相シフトダウンミックス音響信号又は単純ダウンミックス音響信号の切り替えを行い、各再生チャンネル用のダウンミックス音響信号を出力する。 As described above, the downmix sound channel block (i-th downmix sound channel block) for each reproduction channel is down by only the phase shift downmix sound signal for performing the downmix by the phase shift and the delay process for each reproduction channel. Generates a simple downmix sound signal for mixing, calculates the cross-correlation value and sound signal level of the base sound channel signal and the accompanying sound channel signal in each reproduction channel, and calculates the phase according to the calculated cross-correlation value and sound signal level. The shift downmix sound signal or the simple downmix sound signal is switched, and the downmix sound signal for each reproduction channel is output.
尚、音響チャンネル関連メタデータ分離部11は、位相シフトブロック切替判定部13によって再生装置側(ダウンミックス装置1側)で「位相シフトブロック切替判定処理」を行う代わりに、送信側で予め位相シフトブロック切替判定部13の「位相シフトブロック切替判定処理」を行っておき、「ダウンミックス切替信号用のメタデータ」として音響チャンネル関連メタデータに含めて伝送することも可能である。この場合、音響チャンネル関連メタデータ分離部11は、位相シフトダウンミックス音響信号又は単純ダウンミックス音響信号の切り替えを行うよう指示する「ダウンミックス切替信号用のメタデータ」が、音響チャンネル関連メタデータ内に存在するか否かを判定し、音響チャンネル関連メタデータ内に「ダウンミックス切替信号用のメタデータ」が存在すると判定した場合に、該メタデータからダウンミックス切替信号を生成する(図6参照)。したがって、図6に示す例では、再生装置側(ダウンミックス装置1側)で位相シフトブロック切替判定部13を備える必要がなくなる。
The acoustic channel related
以下、より詳細に、位相シフトブロック切替判定部13、位相シフトダウンミックス部14、及び単純ダウンミックス部15についてそれぞれ説明する。
Hereinafter, the phase shift block switching
(位相シフトブロック切替判定部)
図2は、本発明による一実施例のマルチチャンネル音響信号のダウンミックス装置における位相シフトブロック切替判定部のブロック図である。位相シフトブロック切替判定部13は、相互相関演算部131と、音響信号レベル算出部132と、切替判定部133とを備える。
(Phase shift block switching determination unit)
FIG. 2 is a block diagram of a phase shift block switching determination unit in the multi-channel audio signal downmix apparatus according to an embodiment of the present invention. The phase shift block switching
相互相関演算部131は、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定されたベース音響チャンネル信号と付随音響チャンネル信号との間の相互相関値を算出し、切替判定部133に送出する。
The
音響信号レベル算出部132は、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定されたベース音響チャンネル信号及び付随音響チャンネル信号のそれぞれの音響信号レベルを算出し、切替判定部133に送出する。
The sound signal
切替判定部133は、相互相関演算部131から得られる相互相関値と、音響信号レベル算出部132から得られる付随音響チャンネル信号の音響信号レベルから、位相シフトダウンミックス部14で生成される位相シフトダウンミックス音響信号と、単純ダウンミックス部15で生成される単純ダウンミックス音響信号のいずれがダウンミックス(音質劣化等の抑制)に適しているかを、予め定められた切替判定基準に従って音響ブロック単位で判定し、判定した結果に基づくダウンミックス切替信号を生成する。
The switching
切替判定部133は、「位相シフトダウンミックス」と「単純ダウンミックス」の切替判定基準として、相互相関値がa(例えば、0.7)以上、且つベース音響チャンネル信号の音響信号レベルの少なくとも1つがフルスケール換算で所定レベルLe_base(例えば−6dB)以上、且つ付随音響チャンネルの音響信号レベルの少なくとも1つがフルスケール換算で所定レベルLe_aux(例えば−6dB)以上とし、全てが満たされた場合に位相シフトダウンミックス音響信号へと切り替え、それ以外は単純ダウンミックス音響信号に切り替えるように判定する。
The switching
メインチャンネル22chの音響チャンネル信号をメインチャンネル5chの音響チャンネル信号にダウンミックスする場合、図9及び図11の2種類が規定のダウンミックスの計算式としてARIB等で規定されているものを用いる。 When downmixing the sound channel signal of the main channel 22ch to the sound channel signal of the main channel 5ch, the two types shown in FIGS. 9 and 11 are defined by ARIB or the like as a prescribed downmix calculation formula.
メインチャンネル22chの音響チャンネル信号をメインチャンネル2chの音響チャンネル信号にダウンミックスする場合、図10及び図12の2種類が規定のダウンミックスの計算式としてARIB等で規定されているものを用いる。 When downmixing the sound channel signal of the main channel 22ch to the sound channel signal of the main channel 2ch, the two types shown in FIGS. 10 and 12 are defined by ARIB or the like as the prescribed downmix calculation formula.
つまり、チャンネル22.2chの音響チャンネル信号をチャンネル5.1chへダウンミックスする場合、図8に示す22.2chの音響チャンネル信号のうち、FL,FR,FC,BL,BR(図9及び図11)が「ベース音響チャンネル信号」であり、「付随音響チャンネル信号」は、その他の音響信号となり、この情報が、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」として多重されている。 That is, when down-mixing the 22.2ch acoustic channel signal to the 5.1ch channel, among the 22.2ch acoustic channel signals shown in FIG. 8, FL, FR, FC, BL, BR (FIGS. 9 and 11). ) Is a “base acoustic channel signal”, and the “accompanying acoustic channel signal” is another acoustic signal, and this information is multiplexed as “parameters related to the acoustic method” in the acoustic channel related metadata.
また、チャンネル22.2chの音響チャンネル信号をチャンネル2chへダウンミックスする場合、図8に示す22.2chの音響チャンネル信号のうち、FL,FR(図10及び図12)が「ベース音響チャンネル信号」であり、「付随音響チャンネル信号」は、その他の音響信号となり、この情報が、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」として多重されている。
In addition, when down-mixing the channel 22.2 channel audio channel signal to
このように、位相シフトブロック切替判定部13は、第iダウンミックス音響チャンネルのベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルに従って、位相シフトダウンミックス部14で生成される位相シフトダウンミックス音響信号と、単純ダウンミックス部15で生成される単純ダウンミックス音響信号のいずれがダウンミックス(音質劣化等の抑制)に適しているかを、予め定められた切替判定基準に従って音響ブロック単位で判定し、判定した結果に基づくダウンミックス切替信号を生成する。
Thus, the phase shift block switching
(位相シフトダウンミックス部)
図3は、本発明による一実施例のマルチチャンネル音響信号のダウンミックス装置における位相シフトダウンミックス部のブロック図である。位相シフトダウンミックス部14は、遅延部141と、位相シフト部142−kと、加算部143とを備える。
(Phase shift downmix part)
FIG. 3 is a block diagram of a phase shift downmix unit in a multichannel audio signal downmix apparatus according to an embodiment of the present invention. The phase
遅延部141は、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定されたベース音響チャンネルの音響信号に対して、付随音響チャンネル信号の位相シフトに伴う遅延時間に相当する遅延を施し、加算部143に出力する。
The
位相シフト部142−kは、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定された付随音響チャンネル信号の各々(k個)に対して付随音響チャンネルごとに予め定めた位相シフトを行い、加算部143に出力する。ただし、映像信号と音響信号との間の大きなズレを防止するために、付随音響チャンネルの位相シフトに伴う遅延時間を所定の範囲内、例えば1音響ブロック内となるよう制限するものとし、各付随音響チャンネルにおける遅延時間をほぼ同一になるよう制限して位相シフトを行うのが望ましい。
The phase shift unit 142-k includes the accompanying acoustic channel signal determined based on the “parameters relating to the acoustic method” in the acoustic channel-related metadata and the “number of reproduction channels” set on the reproduction device (downmix device 1) side. A predetermined phase shift is performed for each (k) of each of the associated acoustic channels, and the result is output to the adding
加算部143は、遅延を施したベース音響チャンネル信号及び位相シフトを施した付随音響チャンネル信号を音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」で指示される規定のダウンミックスの計算式のダウンミックス係数(図9乃至図12)に従ってダウンミックスを行い、位相シフトダウンミックス音響信号として生成する。
The
ここで、位相シフトダウンミックス部14における付随音響チャンネルの音響信号の位相シフト及び加算処理の順は、加算を行った後、位相シフトを行うように構成することも可能である。位相シフトは、信号の周波数特性は変化させずに信号の位相特性のみを変える処理であり、全域通過フィルタ(All Pass Filter:APF)を用いて行う。位相シフトを行うフィルタの設計は、例えば、「ディジタル信号処理ハンドブック」(オーム社、pp92−101、pp381−384)や、「コンピュータ音楽」(東京電機大学出版局、pp159−161,pp315−339,pp388−400)や、「ディジタルフィルタデザイン」(昭晃堂)などで詳述されている。
Here, the order of the phase shift and addition processing of the acoustic signal of the accompanying acoustic channel in the phase
各付随音響チャンネル信号の位相シフトは異なる特性を持つAPFを使用することもできるが、同一の特性を持つAPFを使用しても効果が得られる。同一の特性を持つAPFを使用する場合、付随音響チャンネル信号の加算を行った後、位相シフトを行うことも可能である。 The phase shift of each accompanying acoustic channel signal can use an APF having different characteristics, but an effect can be obtained by using an APF having the same characteristics. When using an APF having the same characteristics, it is also possible to perform phase shift after adding the accompanying acoustic channel signal.
このように、位相シフトダウンミックス部14は、付随音響チャンネル信号の各々(k個)に対して付随音響チャンネルごとに予め定めた位相シフトを行うとともに、ベース音響チャンネル信号に対して、付随音響チャンネル信号の位相シフトに伴う遅延時間に相当する遅延を施して、規定のダウンミックスの計算式のダウンミックス係数(図9乃至図12)に従ってダウンミックスを行い、位相シフトダウンミックス音響信号として生成する。
As described above, the phase
(単純ダウンミックス部)
図4は、本発明による一実施例のマルチチャンネル音響信号のダウンミックス装置における単純ダウンミックス部のブロック図である。単純ダウンミックス部15は、ベース音響チャンネル信号用の遅延部151と、付随音響チャンネル信号用の遅延部152−1〜遅延部152−kと、加算部153とを備える。
(Simple downmix part)
FIG. 4 is a block diagram of a simple downmix unit in the multichannel audio signal downmix apparatus according to an embodiment of the present invention. The
遅延部151は、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定されたベース音響チャンネルの音響信号に対して、付随音響チャンネル信号の位相シフトに伴う遅延時間に相当する遅延を施し、加算部153に出力する。
The
遅延部152−kは、音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」及び再生装置(ダウンミックス装置1)側で設定される「再生チャンネル数」に基づいて決定された付随音響チャンネル信号の各々(k個)に対して付随音響チャンネルごとに予め定めた遅延処理を行い、加算部153に出力する。ただし、映像信号と音響信号との間の大きなズレを防止するために、付随音響チャンネルの遅延時間を所定の範囲内、例えば1音響ブロック内となるよう制限するものとし、各付随音響チャンネルにおける遅延時間をほぼ同一になるよう制限するのが望ましい。
The delay unit 152-k is configured to output the associated acoustic channel signal determined based on the “parameters relating to the acoustic method” in the acoustic channel-related metadata and the “number of reproduction channels” set on the reproduction device (downmix device 1) side. Each (k) is subjected to a predetermined delay process for each accompanying acoustic channel, and is output to the
加算部153は、遅延を施したベース音響チャンネル信号及び付随音響チャンネル信号を音響チャンネル関連メタデータ内の「音響方式に関するパラメータ」で指示される規定のダウンミックスの計算式のダウンミックス係数(図9乃至図12)に従ってダウンミックスを行い、単純ダウンミックス音響信号として生成する。ここで、音響チャンネル信号の遅延処理は、ダウンミックス加算を行った後、遅延処理を行うことも可能である。
The
このように、単純ダウンミックス部15は、付随音響チャンネル信号の各々(k個)に対して付随音響チャンネルごとに予め定めた遅延処理を行うとともに、ベース音響チャンネル信号に対して、付随音響チャンネル信号に伴う遅延時間に相当する遅延を施して、規定のダウンミックスの計算式のダウンミックス係数(図9乃至図12)に従ってダウンミックスを行い、単純ダウンミックス音響信号として生成する。
As described above, the
(ダウンミックス切替部)
図1に示すように、ダウンミックス切替部16は、位相シフトダウンミックス部14で生成された位相シフトダウンミックス音響信号と、単純ダウンミックス部15で生成された単純ダウンミックス音響信号とを、位相シフトブロック切替判定部13からのダウンミックス切替信号にしたがって、切替時の雑音を抑制すべく「位相シフトダウンミックス音響信号」と「単純ダウンミックス音響信号」の切替の際にフェードイン/フェードアウト処理を施しながら切替を行い、第iダウンミックス音響信号を出力する。
(Downmix switching part)
As shown in FIG. 1, the
次に、本発明による一実施例のダウンミックス装置1の動作について説明する。
Next, operation | movement of the
図5は、本発明による一実施例のダウンミックス装置1の動作フロー図である。
FIG. 5 is an operation flowchart of the
ステップS1にて、ダウンミックス装置1は、音響チャンネル関連メタデータ分離部11によって、音響チャンネル関連メタデータ多重信号を受信する。
In step S <b> 1, the
ステップS2にて、ダウンミックス装置1は、音響チャンネル関連メタデータ分離部11によって、音響チャンネル関連メタデータの分離を行い、「音響方式に関するパラメータ」を抽出する。
In step S <b> 2, the
ステップS3にて、ダウンミックス装置1は、音響チャンネル選択・分配部12によって、再生チャンネル数に対応するチャンネルパラメータを設定する。
In step S <b> 3, the
ステップS4にて、ダウンミックス装置1は、音響チャンネル選択・分配部12によって、マルチチャンネル音響信号を受信する。
In step S <b> 4, the
ステップS5にて、ダウンミックス装置1は、音響チャンネル関連メタデータ分離部11によって、「音響チャンネル関連メタデータ」内に、送信側から「ダウンミックス切替信号用のメタデータ」が存在するか否かを確認する。「ダウンミックス切替信号用のメタデータ」が「音響チャンネル関連メタデータ」内に存在する場合には、音響チャンネル関連メタデータ分離部11は、「ダウンミックス切替信号用のメタデータ」からダウンミックス切替信号を生成して、ステップS10に進む。「ダウンミックス切替信号用のメタデータ」が「音響チャンネル関連メタデータ」内に存在しない場合、ステップS6に進む。
In step S5, the
ステップS6にて、ダウンミックス装置1は、音響チャンネル選択・分配部12によって、ダウンミックス切替信号用のメタデータ」内の「音響方式に関するパラメータ」に基づいて、マルチチャンネル音響信号をベース音響チャンネル信号と付随音響チャンネル信号に分離する。
In step S <b> 6, the
ステップS7にて、ダウンミックス装置1は、位相シフトブロック切替判定部13によって、音響ブロック単位でベース音響チャンネル信号と各付随音響チャンネル信号との相互相関値をそれぞれ算出する。
In step S7, the
ステップS8にて、ダウンミックス装置1は、位相シフトブロック切替判定部13によって、音響ブロック単位でベース音響チャンネル信号と各付随音響チャンネル信号との音響信号レベルをそれぞれ算出する。
In step S <b> 8, the
ステップS9にて、ダウンミックス装置1は、位相シフトブロック切替判定部13によって、再生チャンネルごとに、音響ブロック単位のダウンミックス切替信号(位相シフトダウンミックス/単純ダウンミックス)を生成する。
In step S <b> 9, the
ステップS10にて、ダウンミックス装置1は、位相シフトダウンミックス部14及び単純ダウンミックス部15によって、「位相シフトダウンミックス音響信号」と「単純ダウンミックス音響信号」をそれぞれ生成する。
In step S <b> 10, the
ステップS11にて、ダウンミックス装置1は、ダウンミックス切替部16によって、ダウンミックス切替信号にしたがって、切り替え時の雑音を抑制すべく「位相シフトダウンミックス音響信号」と「単純ダウンミックス音響信号」の切り替えの際にフェードイン/フェードアウト処理を施しながら切り替えを行い、第iダウンミックス音響信号を出力する。これにより、再生チャンネル数(n)分のダウンミックス音響信号を生成して、音質や音圧の劣化を抑制しつつ各対応するスピーカー17−1〜17−nに送出して再生することが可能となる。
In step S <b> 11, the
図7は、この音質や音圧の劣化を抑制する様子の説明図である。図7(a)は、規定のダウンミックスの計算式に単純に則り、ダウンミックスを行った場合に生じうるオーバーフローやレベル変動を示す図である。ベース音響チャンネル信号と付随音響チャンネル信号との間で相互相関値及びレベル差を判別することなくダウンミックスを実行した場合、再生装置側で許容されるダイナミックレンジ(Dレンジ)を超える可能性がある。一方、図7(b)に示すように、本実施例のダウンミックス装置1によれば、ベース音響チャンネル信号と付随音響チャンネル信号との間で相互相関値及びレベル差を判定し、更にリアルタイム性を保持するべく「位相シフトダウンミックス音響信号」と「単純ダウンミックス音響信号」の切り替えを行うため、ダウンミックスを行った場合に生じうるオーバーフローやレベル変動を好適に抑制することができるようになる。
FIG. 7 is an explanatory diagram showing how the deterioration of sound quality and sound pressure is suppressed. FIG. 7A is a diagram showing overflow and level fluctuation that may occur when downmixing is performed simply in accordance with a prescribed downmix calculation formula. When downmixing is performed without discriminating the cross-correlation value and level difference between the base sound channel signal and the accompanying sound channel signal, there is a possibility that the dynamic range (D range) allowed on the playback device side may be exceeded. . On the other hand, as shown in FIG. 7B, according to the
本発明に係るダウンミックス装置1をコンピュータで構成した場合、各機能を実現する処理内容を記述したプログラムを、当該コンピュータの内部又は外部の記憶部に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。また、このようなプログラムは、例えばDVD又はCD−ROMなどの可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばネットワーク上にあるサーバの記憶部に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶部に記憶することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。従って、本発明は、前述した実施例に限定されるものではなく、その主旨を逸脱しない範囲において種々変更可能である。
When the
本発明によれば、ベース音響チャンネル信号と付随音響チャンネル信号との間で相互相関値及びレベル差を判定し、更にリアルタイム性を保持するべく「位相シフトダウンミックス音響信号」と「単純ダウンミックス音響信号」の切り替えを行うため、ダウンミックスを行った場合に生じうるオーバーフローやレベル変動を好適に抑制することができるので、マルチチャンネル信号をダウンミックスする用途に有用である。 According to the present invention, a cross-correlation value and a level difference are determined between a base sound channel signal and an accompanying sound channel signal, and a “phase shift downmix sound signal” and a “simple downmix sound” are maintained in order to maintain real-time characteristics. Since the “signal” is switched, overflow and level fluctuation that may occur when downmixing is performed can be suitably suppressed, which is useful for applications in which multichannel signals are downmixed.
1 ダウンミックス装置
11 音響チャンネル関連メタデータ分離部
12 音響チャンネル選択・分配部
13 位相シフトブロック切替判定部
14 位相シフトダウンミックス部
15 単純ダウンミックス部
16 ダウンミックス切替部
17−1〜17−n スピーカー
131 相互相関演算部
132 音響信号レベル算出部
133 切替判定部
141 遅延部
142−k 位相シフト部
143 加算部
151 遅延部
152−k 遅延部
153 加算部
161 フェードイン・フェードアウト処理部
DESCRIPTION OF
Claims (8)
マルチチャンネル音響信号と関連付けて多重される音響チャンネル関連メタデータの多重信号を受信して、該音響チャンネル関連メタデータ内の音響方式に関するパラメータを分離して抽出する音響チャンネル関連メタデータ分離手段と、
前記音響方式に関するパラメータと、当該ダウンミックス装置に予め設定される再生チャンネル数に基づいて、各再生チャンネルのマルチチャンネル音響信号のうちベース音響チャンネル信号と前記ベース音響チャンネル信号を除く他の音響信号である付随音響チャンネル信号を選択して決定し、各再生チャンネル用に分配する音響チャンネル選択・分配手段と、
再生チャンネルごとに、位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号と、遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成するとともに、各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するダウンミックス音響信号生成手段と、
を備えることを特徴とするダウンミックス装置。 A downmix device for downmixing multichannel audio signals to generate downmix audio signals for the number of playback channels,
An acoustic channel-related metadata separation means for receiving a multiplexed signal of acoustic channel-related metadata multiplexed in association with a multi-channel acoustic signal, and separating and extracting a parameter relating to an acoustic method in the acoustic channel-related metadata;
Based on the parameters related to the sound system and the number of playback channels preset in the downmix device, the base sound channel signal and other sound signals excluding the base sound channel signal among the multi-channel sound signals of each play channel. Sound channel selection / distribution means for selecting and determining a certain accompanying sound channel signal and distributing it for each reproduction channel;
For each playback channel, a phase-shifted downmix sound signal that is downmixed by phase shift and a simple downmix sound signal that is downmixed only by delay processing are generated, and the base sound channel signal and the associated sound signal in each playback channel are generated. Downmix sound signal generation means for determining switching between the phase shift downmix sound signal or the simple downmix sound signal according to the cross-correlation value and sound signal level of the sound channel signal and outputting the downmix sound signal for each reproduction channel When,
A downmix device comprising:
前記位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号を生成する位相シフトダウンミックス生成手段と、
前記遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成する単純ダウンミックス生成手段と、
各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するダウンミックス切替手段と、
を備えることを特徴とする、請求項1に記載のダウンミックス装置。 The downmix sound signal generating means includes
A phase shift downmix generating means for generating a phase shift downmix acoustic signal for downmixing by the phase shift;
Simple downmix generation means for generating a simple downmix sound signal for downmixing only by the delay processing;
Switching between the phase shift downmix sound signal or the simple downmix sound signal is determined according to the cross-correlation value and sound signal level of the base sound channel signal and the accompanying sound channel signal in each reproduction channel, and the down for each reproduction channel is determined. Downmix switching means for outputting a mixed sound signal;
The downmix device according to claim 1, comprising:
前記ベース音響チャンネル信号と付随音響チャンネル信号の相互相関値及び音響信号レベルに基づいて、前記位相シフトダウンミックス音響信号と、前記単純ダウンミックス音響信号のいずれかを判別する旨を示すダウンミックス切替信号を生成する位相シフトブロック切替判定手段をさらに備えることを特徴とする、請求項2に記載のダウンミックス装置。 The downmix sound signal generating means includes
A downmix switching signal indicating that the phase shift downmix sound signal or the simple downmix sound signal is discriminated based on the cross-correlation value and the sound signal level of the base sound channel signal and the accompanying sound channel signal. The downmix device according to claim 2, further comprising phase shift block switching determination means for generating
前記音響方式に関するパラメータ及び前記再生チャンネル数に基づいて決定されたベース音響チャンネル信号と付随音響チャンネル信号との間の相互相関値を算出する相互相関演算手段と、
前記ベース音響チャンネル信号及び前記付随音響チャンネル信号のそれぞれの音響信号レベルを算出する音響信号レベル算出手段と、
前記相互相関演算手段から得られる相互相関値と、前記音響信号レベル算出手段から得られる付随音響チャンネル信号の音響信号レベルから、前記位相シフトダウンミックス音響信号と、前記単純ダウンミックス音響信号のいずれがダウンミックス処理に適しているかを、予め定められた切替判定基準に従って判定し、判定した結果に基づくダウンミックス切替信号を生成する切替判定手段と、
を備えることを特徴とする、請求項3に記載のダウンミックス装置。 The phase shift block switching determination means is
Cross-correlation calculating means for calculating a cross-correlation value between the base sound channel signal and the accompanying sound channel signal determined based on the parameters related to the sound system and the number of reproduction channels;
Acoustic signal level calculation means for calculating the respective acoustic signal levels of the base acoustic channel signal and the accompanying acoustic channel signal;
From the cross-correlation value obtained from the cross-correlation calculating means and the sound signal level of the accompanying sound channel signal obtained from the sound signal level calculating means, any of the phase shift downmix sound signal and the simple downmix sound signal is Switching determination means for determining whether it is suitable for downmix processing according to a predetermined switching determination criterion, and generating a downmix switching signal based on the determined result;
The downmix device according to claim 3, further comprising:
前記相互相関値が所定値以上、且つ前記ベース音響チャンネル信号の音響信号レベルの少なくとも1つがフルスケール換算で所定レベル以上、且つ前記付随音響チャンネル信号の音響信号レベルの少なくとも1つがフルスケール換算で所定レベル以上とし、全てが満たされた場合に前記位相シフトダウンミックス音響信号へと切り替え、それ以外は前記単純ダウンミックス音響信号に切り替えるように判定し、判定した結果に基づくダウンミックス切替信号を生成する手段を有することを特徴とする、請求項4に記載のダウンミックス装置。 The switching determination means, as the switching determination criterion,
The cross-correlation value is not less than a predetermined value, at least one of the sound signal levels of the base sound channel signal is not less than a predetermined level in full scale conversion, and at least one of the sound signal levels of the accompanying sound channel signal is predetermined in full scale conversion It is determined to switch to the phase shift downmix sound signal when all are satisfied, and to switch to the simple downmix sound signal otherwise, and a downmix switch signal is generated based on the determined result. The downmix device according to claim 4, further comprising means.
前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを行うよう指示するダウンミックス切替信号用のメタデータが、前記音響チャンネル関連メタデータ内に存在するか否かを判定し、前記音響チャンネル関連メタデータ内に前記ダウンミックス切替信号用のメタデータが存在すると判定した場合に、該メタデータからダウンミックス切替信号を生成する手段を有し、
前記ダウンミックス音響信号生成手段は、
該ダウンミックス切替信号に基づいて前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力する手段を有することを特徴とする、請求項1に記載のダウンミックス装置。 The acoustic channel-related metadata separating means is
Determining whether or not metadata for a downmix switching signal instructing switching of the phase shift downmix acoustic signal or the simple downmix acoustic signal exists in the acoustic channel related metadata; Means for generating a downmix switching signal from the metadata when it is determined that the metadata for the downmix switching signal exists in the channel-related metadata;
The downmix sound signal generating means includes
And a means for determining whether to switch the phase-shifted downmix sound signal or the simple downmix sound signal based on the downmix switch signal and outputting a downmix sound signal for each reproduction channel. Item 2. The downmix device according to item 1.
前記ダウンミックス切替信号に従う切替を行う際にフェードイン/フェードアウト処理を施すフェードイン/フェードアウト処理手段を有することを特徴とする、請求項3〜6のいずれか一項に記載のダウンミックス装置。 The downmix sound signal generating means includes
The downmix device according to any one of claims 3 to 6, further comprising fade-in / fade-out processing means for performing fade-in / fade-out processing when switching according to the downmix switching signal.
マルチチャンネル音響信号と関連付けて多重される音響チャンネル関連メタデータの多重信号を受信して、該音響チャンネル関連メタデータ内の音響方式に関するパラメータを分離して抽出するステップと、
前記音響方式に関するパラメータと、当該ダウンミックス装置に予め設定される再生チャンネル数に基づいて、各再生チャンネルのマルチチャンネル音響信号のうちベース音響チャンネル信号と前記ベース音響チャンネル信号を除く他の音響信号である付随音響チャンネル信号を選択して決定し、各再生チャンネル用に分配するステップと、
再生チャンネルごとに、位相シフトによってダウンミックスを行う位相シフトダウンミックス音響信号と、遅延処理のみによってダウンミックスを行う単純ダウンミックス音響信号を生成するとともに、各再生チャンネルにおける前記ベース音響チャンネル信号と前記付随音響チャンネル信号の相互相関値及び音響信号レベルに従って前記位相シフトダウンミックス音響信号又は前記単純ダウンミックス音響信号の切り替えを判定し、各再生チャンネル用のダウンミックス音響信号を出力するステップと、
を実行させるためのプログラム。 In a computer configured as a downmix device that downmixes multichannel audio signals and generates downmix audio signals for the number of playback channels,
Receiving a multiplexed signal of acoustic channel-related metadata multiplexed in association with the multi-channel acoustic signal, and separating and extracting parameters relating to the acoustic scheme in the acoustic channel-related metadata;
Based on the parameters related to the sound system and the number of playback channels preset in the downmix device, the base sound channel signal and other sound signals excluding the base sound channel signal among the multi-channel sound signals of each play channel. Selecting and determining certain accompanying audio channel signals and distributing them for each playback channel;
For each playback channel, a phase-shifted downmix sound signal that is downmixed by phase shift and a simple downmix sound signal that is downmixed only by delay processing are generated, and the base sound channel signal and the associated sound signal in each playback channel are generated. Determining whether to switch the phase shift downmix sound signal or the simple downmix sound signal according to the cross-correlation value and sound signal level of the sound channel signal, and outputting a downmix sound signal for each reproduction channel;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056681A JP5417227B2 (en) | 2010-03-12 | 2010-03-12 | Multi-channel acoustic signal downmix device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056681A JP5417227B2 (en) | 2010-03-12 | 2010-03-12 | Multi-channel acoustic signal downmix device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011193164A JP2011193164A (en) | 2011-09-29 |
JP5417227B2 true JP5417227B2 (en) | 2014-02-12 |
Family
ID=44797650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010056681A Expired - Fee Related JP5417227B2 (en) | 2010-03-12 | 2010-03-12 | Multi-channel acoustic signal downmix device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5417227B2 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2613731C2 (en) | 2012-12-04 | 2017-03-21 | Самсунг Электроникс Ко., Лтд. | Device for providing audio and method of providing audio |
CN108806704B (en) * | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | Multi-channel audio signal processing device and method |
KR102161157B1 (en) * | 2013-07-05 | 2020-09-29 | 한국전자통신연구원 | Method and apparatus for processing audio signal |
KR102161169B1 (en) * | 2013-07-05 | 2020-09-29 | 한국전자통신연구원 | Method and apparatus for processing audio signal |
MX357405B (en) * | 2014-03-24 | 2018-07-09 | Samsung Electronics Co Ltd | Method and apparatus for rendering acoustic signal, and computer-readable recording medium. |
JP6285790B2 (en) * | 2014-03-25 | 2018-02-28 | 日本放送協会 | Channel number converter |
JP6313641B2 (en) * | 2014-03-25 | 2018-04-18 | 日本放送協会 | Channel number converter |
US9774974B2 (en) | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
KR101993348B1 (en) * | 2014-09-24 | 2019-06-26 | 한국전자통신연구원 | Audio metadata encoding and audio data playing apparatus for supporting dynamic format conversion, and method for performing by the appartus, and computer-readable medium recording the dynamic format conversions |
JP2016072889A (en) * | 2014-09-30 | 2016-05-09 | シャープ株式会社 | Audio signal processing device, audio signal processing method, program, and recording medium |
JP6703884B2 (en) * | 2016-04-13 | 2020-06-03 | 日本放送協会 | Channel number converter, broadcast receiver and program |
JP6684651B2 (en) * | 2016-05-24 | 2020-04-22 | 日本放送協会 | Channel number converter and its program |
WO2020102156A1 (en) | 2018-11-13 | 2020-05-22 | Dolby Laboratories Licensing Corporation | Representing spatial audio by means of an audio signal and associated metadata |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148165A (en) * | 1998-11-10 | 2000-05-26 | Matsushita Electric Ind Co Ltd | Karaoke device |
JP4084990B2 (en) * | 2002-11-19 | 2008-04-30 | 株式会社ケンウッド | Encoding device, decoding device, encoding method and decoding method |
KR101097000B1 (en) * | 2004-03-11 | 2011-12-20 | 피에스에스 벨기에 엔브이 | A method and system for processing sound signals |
JP3915804B2 (en) * | 2004-08-26 | 2007-05-16 | ヤマハ株式会社 | Audio playback device |
JP2007288405A (en) * | 2006-04-14 | 2007-11-01 | Matsushita Electric Ind Co Ltd | Video sound output system, video sound processing method, and program |
JP2007311965A (en) * | 2006-05-17 | 2007-11-29 | Pioneer Electronic Corp | Digital audio signal processor |
-
2010
- 2010-03-12 JP JP2010056681A patent/JP5417227B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011193164A (en) | 2011-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5417227B2 (en) | Multi-channel acoustic signal downmix device and program | |
US10863298B2 (en) | Method and apparatus for reproducing three-dimensional audio | |
KR102124547B1 (en) | Encoded audio metadata-based equalization | |
JP6105062B2 (en) | System, method, apparatus and computer readable medium for backward compatible audio encoding | |
KR101759005B1 (en) | Loudspeaker position compensation with 3d-audio hierarchical coding | |
JP5174527B2 (en) | Acoustic signal multiplex transmission system, production apparatus and reproduction apparatus to which sound image localization acoustic meta information is added | |
KR102302672B1 (en) | Method and apparatus for rendering sound signal, and computer-readable recording medium | |
KR20100063092A (en) | A method and an apparatus of decoding an audio signal | |
NO338725B1 (en) | Generating a multi-channel output signal | |
KR102149411B1 (en) | Apparatus and method for generating audio data, apparatus and method for playing audio data | |
US20040008847A1 (en) | Method and apparatus for producing multi-channel sound | |
JP5314129B2 (en) | Sound reproducing apparatus and sound reproducing method | |
US20140310010A1 (en) | Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same | |
US10999678B2 (en) | Audio signal processing device and audio signal processing system | |
US8351622B2 (en) | Audio mixing device | |
CN112823534B (en) | Signal processing device and method, and program | |
JP6694755B2 (en) | Channel number converter and its program | |
KR20070081735A (en) | Apparatus for encoding and decoding audio signal and method thereof | |
JP2014204322A (en) | Acoustic signal reproducing device and acoustic signal preparation device | |
KR102370348B1 (en) | Apparatus and method for providing the audio metadata, apparatus and method for providing the audio data, apparatus and method for playing the audio data | |
JP6630599B2 (en) | Upmix device and program | |
JP2020120377A (en) | Audio authoring device, audio rendering device, transmission device, reception device, and method | |
JP2015065551A (en) | Voice reproduction system | |
KR20220030983A (en) | Apparatus and method for providing the audio metadata, apparatus and method for providing the audio data, apparatus and method for playing the audio data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130827 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130919 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131118 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |