KR20230122397A - Surruond Sound Mastering Processing - Google Patents

Surruond Sound Mastering Processing Download PDF

Info

Publication number
KR20230122397A
KR20230122397A KR1020220019017A KR20220019017A KR20230122397A KR 20230122397 A KR20230122397 A KR 20230122397A KR 1020220019017 A KR1020220019017 A KR 1020220019017A KR 20220019017 A KR20220019017 A KR 20220019017A KR 20230122397 A KR20230122397 A KR 20230122397A
Authority
KR
South Korea
Prior art keywords
channel
channels
value
output level
threshold
Prior art date
Application number
KR1020220019017A
Other languages
Korean (ko)
Inventor
하수호
Original Assignee
주식회사 킨트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 킨트 filed Critical 주식회사 킨트
Priority to KR1020220019017A priority Critical patent/KR20230122397A/en
Publication of KR20230122397A publication Critical patent/KR20230122397A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 서라운드 사운드 마스터링 프로세싱 방법을 제공한다.The present invention provides a surround sound mastering processing method.

Description

서라운드 사운드 마스터링 프로세싱 방법{Surruond Sound Mastering Processing}Surround Sound Mastering Processing Method {Surruond Sound Mastering Processing}

본 발명은 서라운드 사운드 마스터링 프로세싱 방법에 관한 것이다.The present invention relates to a surround sound mastering processing method.

멀티채널 시스템의 개발은 특히 돌비 연구소 (Dolby Laboratory) 에 의해 촉진되었다. 70년대에 돌비 연구소에 의해 발명된 "돌비 서라운드 (Dolby-Surround)" 와 관련하여, 이른바 "매트릭스 서라운드 방법 (Matrix-Surround method)" 사이에, 예컨대 Dolby ProLogic, ProLogic 2, Circle Surround, Circle Surround 2 가 존재한다. 이로 인해, 7.1 채널들까지, 특히 채널들 FL (FL = Front left), C (C = center), FR (FR = Front right), 측면 서라운드 채널들 LS (Leftsurround), RS (Rightsurround), 후방 서라운드 채널들 BL (Back Left), BR (Back right) 및 채널 LFE (low frequency effect) 를 인코딩 (코딩) 하는 가능성이 제공된다. 이 채널들부터 2 개의 전달 채널들 Lt (L = left, t = total), Rt (R = right, t = total) 은 매트릭스화되며, 상기 전달 채널들은, 상응하는 디코더들에 의해 다시 오리지널 채널들에 분배되어, 즉 디코딩 후 오리지널 채널들로서 재생되기 위해 모든 정보를 포함한다. 인코딩 (코딩) 시 무엇보다도 서라운드 채널들 LS, RS, BL, BR 안에 놓여 있는 정보들의 음향 부분들은 +/-90°만큼 위상 회전되어 채널들 L 및 R 에 대하여 더해지고, 그리고 음량 레벨이 약간 내려가면서 전방 채널들 R, L 안에 매립된다.The development of multichannel systems was particularly promoted by Dolby Laboratory. In relation to "Dolby-Surround" invented by Dolby Laboratories in the 70's, between the so-called "Matrix-Surround method", such as Dolby ProLogic, ProLogic 2, Circle Surround, Circle Surround 2 exists. This leads to up to 7.1 channels, in particular channels FL (FL = Front left), C (C = center), FR (FR = Front right), side surround channels LS (Leftsurround), RS (Rightsurround), rear surround The possibility to encode (code) the channels BL (Back Left), BR (Back right) and channel LFE (low frequency effect) is provided. From these channels the two transfer channels Lt (L = left, t = total), Rt (R = right, t = total) are matrixed, which by the corresponding decoders are converted back to the original channels , that is, contains all information to be reproduced as original channels after decoding. During encoding (coding), among other things, the acoustic parts of the information lying in the surround channels LS, RS, BL, BR are phase-rotated by +/-90° and added for channels L and R, and the volume level is slightly lowered. As it goes, it is buried in the front channels R and L.

개별 채널들의 이러한 인코딩 전에, 멀티채널 사운드 프로세싱에서는 그 밖의 단계들이 선행하며, 즉, 스테레오/모노의 오디오 자료로부터 그 어떤 컨피규레이션 (configuration) 의 서라운드로의 업믹싱 (Upmixing) 의 범위에서의 일반적인 멀티채널 프로세싱 과정에서의 제 1 단계는 채널 또는 채널 혼합물을 개별 채널들로 분할하는 것이다. 이 분할은 대응하는 소프트웨어를 통해 실현될 수 있다. 상기 분할 후 상기 개별 채널들은, 예Before this encoding of the individual channels, other steps precede in multichannel sound processing, namely general multichannel in the range of upmixing from stereo/mono audio material to surround in any configuration. The first step in the processing sequence is to divide a channel or channel mixture into individual channels. This division can be realized through corresponding software. After the division, the individual channels are, e.g.

컨대 원래의 스테레오 믹스와 비교하여 특히 멀티채널 믹스의 안정성을 멀티채널 압축/제한을 통해 보장하기 위In order to ensure the stability of the multichannel mix in particular compared to the original stereo mix via multichannel compression/limiting.

한 그 밖의 프로세싱을 위해 존재한다. 이를 위해, 압축기/제한기가 제공되어 있다. 압축기/제한기는 과변조를 예방하기 위해 피크 레벨의 초과를 저지하는 제한 장치이다. 또한, 그것들은 악기 그룹/노래 또는 언어의 음량/라우드니스 (loudness) 조절 장치로 여겨질 수 있다. 이 이외에, 그것들은 이미 인코딩 전에, 채널 또는 채널 혼합물을 개별 채널들로 분할함으로써 발생된 에너지손실의 일부를 보정한다. 이때, 각각의 개별 채널 또는 채널 그룹들에 압축기/제한기가 할당되어 있다. 압축기 및/또는 제한기의 내부에서 파라미터들, 즉, 채널 페이더, 임계값, 어택 (존재한다면), 릴리스 및 출력 레벨 (아웃풋 레벨) 의 값들을 설정함으로써 개별 채널들 간의 비율을 조절한다. 상기 조절은 이미 인코딩 전에 개별 채널들 간의 음량/라우드니스 밸런스가 안정화되는 결과를 초래한다. 채널 페이더 볼륨은 사운드 스튜디오 안의 중요한 구성요소인 믹싱 데스크에서 각 개별 채널의 음량을 조절하는데 쓰인다. 채널 페이더의 정상-음향 위치는 0 dB 이다. 채널 페이더를 0 dB 로 설정하면, 개별 채널에 원래 인가된 신호는, 대응하는 채널 스트립에서 정확히 조정되고 중립적으로 설정된 이득값을 전제로 하여 원래 레벨 조정되었던 바와 같이 울린다. 채널 이득값은 신호가 채널 페이더를 통과하기 전에 상기 신호의 사전 증폭을 조절한다. 임계값은 채널 페이더에 인가된 신호의 문턱처럼 작용한다. 이때, 압축기/제한기는 인가된 신호가 임계값을 초과하자마자 신호를 제한하도록 작동한다. 릴리스값은 인가된 신호가 다시 임계값 아래로 떨어진 후 다시 제로 위치 (zero position) 로 데려가기 위해 압축기/제한기가 필요로 하는 시간에 관한 정보를 제공한다. 어택값 (attack value) 은 임계값의 초과시의 반응 시간을 결정한다. 결국 출력 레벨은 채널에 인가된 신호가 압축기/제한기에 의한 프로세싱 후 얼마나 강한지를 표시한다. 출력 레블러 (Output Leveler) 는 어느 정도 신호 증폭기에 관한 것이다.It exists for other processing. For this purpose, a compressor/restrictor is provided. A compressor/limiter is a limiting device that resists exceeding peak levels to prevent overmodulation. Also, they can be considered as instruments for controlling the volume/loudness of a group of instruments/songs or words. In addition to this, they compensate for some of the energy loss caused by dividing the channel or channel mixture into individual channels, already before encoding. At this time, a compressor/limiter is assigned to each individual channel or channel groups. Adjust the ratio between the individual channels by setting the parameters inside the compressor and/or limiter, namely the values of the channel fader, threshold, attack (if present), release and output level (output level). This adjustment results in a stabilization of the volume/loudness balance between the individual channels already before encoding. The channel fader volume is used to adjust the volume of each individual channel on the mixing desk, which is an important component in a sound studio. The steady-acoustic position of the channel fader is 0 dB. With the channel fader set to 0 dB, the signals originally applied to the individual channels sound as if they were originally level-adjusted, assuming correctly tuned and neutrally set gains in the corresponding channel strip. The channel gain value controls the pre-amplification of the signal before it passes through the channel fader. The threshold acts like a threshold for the signal applied to the channel fader. The compressor/limiter then operates to limit the applied signal as soon as it exceeds the threshold. The release value provides information about the time required by the compressor/limiter to bring it back to the zero position after the applied signal falls back below the threshold. The attack value determines the reaction time when a threshold is exceeded. The output level, in turn, indicates how strong the signal applied to the channel is after processing by the compressor/limiter. Output Leveler is to some extent about signal amplifiers.

도입부에 언급된 유형의 방법은 여기에 개략화된 매트릭스 서라운드 공학의 분야에서 전혀 수용되지 않거나 일부만 수용된다. 심지어 해당 전문 서적에서는, 매트릭스 서라운드 공학이 오늘날의 이산 (discrete) 디지털 방법과 보조를 맞출 수 없다는 것이 확인된다 (예컨대 크리스티안 비르크너 (Christian Birkner) "서라운드, 멀티채널 공학 입문" PPV Presse Projekt 출판사 게엠베하, 베륵키르쉔 (Bergkirchen), 2002 참조). 이는 무엇보다도 흔한 기술표준에 따라 만들어진 Lt, Rt 스테레오 합산 (stereo sum) 이 통상적으로 생산된 스테레오 믹스와 비교하여 (상기 스테레오 믹스는 TV 영역, 라디오 및 음악 영역에서 프로그램들의 내부에서 대개 백 퍼센트 프로세싱된다) 본래 질적으로 보조를 맞출 수 없다는 인식으로부터 발생한다. 인코딩에 의해 초래된 위상 회전은 소리를 약하게 하며, 주파수 특성에 영향을 미치고, 따라서 "보다 작고 보다 애매하게" 들린다.Methods of the type mentioned in the introduction have no or only partial acceptance in the field of matrix surround engineering outlined here. Even in corresponding specialist books, it is confirmed that matrix surround engineering cannot keep pace with today's discrete digital methods (e.g. Christian Birkner "Introduction to surround, multichannel engineering" PPV Presse Projekt Publisher GmbH , Bergkirchen, 2002). This is, among other things, a Lt, Rt stereo sum made according to common technical standards compared to a conventionally produced stereo mix (the stereo mix is usually one hundred percent processed inside programs in the TV domain, radio and music domain ) arises from the recognition that it is inherently qualitatively incapable of keeping pace. The phase rotation caused by the encoding mutes the sound and affects the frequency characteristics, thus making it sound "smaller and more obscure".

다른 한편으로는, 매트릭스 서라운드 공학은 유용하고 호환 가능한 서라운드 시스템에 대한 전체 요구를 충족시킨다.On the other hand, matrix surround engineering satisfies the entire need for a usable and compatible surround system.

그러므로, 이 문제점을 고려하여, 그리고 상기 설명된 선행기술의 가치를 수용하면서, 본 발명의 목적은 Lt, Rt 인코딩된 서라운드 믹스가 디코딩되어야 하는 믹스들의 데이터 트랜스미터로서 기능을 수행할 뿐만 아니라 동시에 또한 그 자체가 스테레오 및 모노에 대하여 존재할 수 있도록, 그리고 필요시 그의 품질을 본 발명에 따른 방법에 의한 프로세싱에 의해 개선할 수 있도록, 도입부에 언급된 유형의 방법을 개선하는 것이다. Therefore, taking into account this problem, and accepting the value of the prior art described above, it is an object of the present invention not only to function as a data transmitter of the mixes from which the Lt, Rt encoded surround mix must be decoded, but also to do so at the same time. It is to improve a method of the type mentioned in the introduction so that it can be present for stereo and mono and, if necessary, its quality can be improved by processing by the method according to the invention.

이 목적은 청구항 제 1 항의 특징들로 달성된다. 본 발명의 바람직한 실시형태들은 종속항들에 나타나 있다.This object is achieved with the features of claim 1 . Preferred embodiments of the invention are presented in the dependent claims.

본 발명에 따르면, 채널 페이더들은 균일한 값으로 설정되고, 단계 c) 에서는 균일한 출력 레벨값을 가진 적어도 2 개의 채널이 제한되며, 이때 채널 C (Center) 는 출력 레벨값에서 변할 수 있고, 각각의 그 밖의 채널은, 상기 채널 C 가 상기 2 개의 채널의 균일한 출력 레벨값보다 적어도 1 데시벨 적은 출력 레벨값을 갖도록 제한되고, 단계 d) 에 뒤이어 상기 인코딩된 채널들의 그 밖의 압축 및/또는 제한은 파라미터들, 즉, 채널 페이더, 임계값, 릴리스 및 출력 레벨 중 적어도 하나의 값을 설정함으로써 수행된다.According to the present invention, the channel faders are set to uniform values, and in step c) at least two channels with uniform output level values are limited, wherein channel C (Center) can vary in output level value, respectively the other channels of are constrained such that the channel C has an output level value at least 1 decibel less than the uniform output level value of the two channels, and, following step d), other compression and/or restriction of the encoded channels. is performed by setting a value of at least one of the parameters, that is, a channel fader, a threshold, a release, and an output level.

이에 따르면, 예컨대 우선 단계 b) 에서는 기본설정에서 개별 채널들, 바람직하게는 5 개의 개별 채널들은 균일한 채널 페이더값 (볼륨) 으로 설정된다. 그 후, 5.1 시스템 내부에서의 제 6 채널은 프로세싱되어야 하는 오디오 자료에 따라 예컨대 보다 높은 채널 페이더값을 얻을 것이다. 이 값은 바람직하게는 0.1 내지 5 db 사이에 존재한다. 그 후, 이 기본설정은 본 발명의 범위에서 전체 프로세싱에 걸쳐 유지되거나 또는 수동으로 변경될 수 있다. 이는 (예컨대 5.1 컨피규레이션의) 모든 6 개의 채널에 적용될 것이다. 그 후, 채널 페이더값들의 표준화된 또는 수동 설정 후, 신호들은 단계 c) 에서의 제한을 위해 전달된다. According to this, for example, firstly in step b) the individual channels, preferably 5 individual channels, are set to a uniform channel fader value (volume) in the default setting. Then, the sixth channel inside the 5.1 system will get a higher channel fader value, for example, depending on the audio material to be processed. This value preferably lies between 0.1 and 5 db. Then, this default setting can be maintained or manually changed throughout the entire processing within the scope of the present invention. This will apply to all 6 channels (eg in a 5.1 configuration). Then, after standardized or manual setting of the channel fader values, the signals are passed for limiting in step c).

즉, 본 발명에 따르면 균일한 출력 레벨값을 가진 적어도 2 개의 채널은 임계값 및 릴리스를 동일하게 설정할시 제한될 수 있으며, 이때 하나의 채널은 임계값에서 뿐만 아니라 출력 레벨에서도 특정 사전설정 내에서 자유로이 설정되고, 보다 정확히 말하면 프로세싱되어야 하는 오디오 자료에 따라 설정된다.That is, according to the present invention, at least two channels having a uniform output level value can be limited when the threshold value and release are set identically, and at this time, one channel can be limited not only at the threshold value but also at the output level within a specific preset. It is set freely, more precisely according to the audio material to be processed.

본 발명은, 개별 채널들로의 분할이 에너지의 제어되지 않은 분할을 동반한다는 인식에 그 기초를 두고 있으며, 상기 제어되지 않은 분할은 음량/라우드니스 콘스텔레이션 (constellation), 및 믹스 내부에서의 위상 위치에 영향을 준다. 즉, 그 자체가 채널들 FL 및 FR 에 맞게, 그리고 음량 및 라우드니스에 있어서 최적화되었던 완성된 스테레오 믹스를 분할하면, 이는 원래의 밸런스가 영구히 파괴된다는 결과를 가진다. 그 후, 밸런스, 위상 위치 뿐만 아니라 음량/라우드니스 콘스텔레이션도 믹스 내부에서 유지되지 않는다. 즉, 에너지의 분할은 개별 채널들의 약화를 그 결과로 갖는다. 이제 본 발명의 기본적인 아이디어는 제한을 통해 개별 채널들 간의 밸런스를, 원래의 스타일 믹스 (style mix) 가 다시 생산되거나 또는 음향 및 표현에 있어서 개선되도록 설정하는 것이다. 서라운드 믹스 내부에서의 위상 위치는 본 발명에 따르면 이미 인코딩 전에 채널 페이더들의 콘스텔레이션 (단계 b)) 및 제한을 통해 안정화된다. 본 발명에 따르면, 파라미터들, 즉, 채널 페이더, 임계값, 릴리스 및 출력 레벨 중 적어도 하나의 값이 설정됨으로써, 단계 d) 에 뒤이은 그 밖의 제한을 통한 최적의 라우드니스가 실현된다.The present invention is based on the recognition that splitting into individual channels involves an uncontrolled splitting of energy, which splits the loudness/loudness constellation, and the phase within the mix. affect location. That is, dividing the finished stereo mix, which itself has been optimized for the channels FL and FR, and for volume and loudness, has the result that the original balance is permanently destroyed. After that, the volume/loudness constellation as well as the balance, phase position are not maintained within the mix. That is, the splitting of energy has as a result weakening of the individual channels. Now the basic idea of the present invention is to establish a balance between the individual channels by means of restrictions, so that the original style mix is produced again or improved in sound and presentation. The phase position inside the surround mix is, according to the invention, already stabilized before encoding via constellation (step b)) and limitation of the channel faders. According to the invention, the value of at least one of the parameters, i.e. channel fader, threshold, release and output level is set so that optimum loudness is achieved through the other restrictions following step d).

선행기술로부터 공지된 제 1 의, 그리고 단계 c) 에서 나타낸 제한은, 믹스 안에서 가능한 한 높은 음량을 유지하기 위해 서라운드 범위에서 일반적으로 사용된다. 하지만 그것은 분할된 채널들의 본 발명에 따른 안정화에는 쓰이지 않는다. 본 발명의 그 밖의 사상은, 우세한 견해에 반해 단계 d) 에 뒤이어 개별 채널들의 그밖의 제한이 수행되는 것이다. 인코딩된 서라운드 믹스는 스테레오 및 모노 믹스와 직접적으로 비교할 때 나쁜 음향을 갖기 때문에, 그것은 흐름 프로그램, 예컨대 라디오 및 TV 에 덜 적합한데, 왜냐하면 이 경우에는 인코딩된 믹스가 스테레오 및 모노 믹스와 경쟁하기 때문이다. 그렇기 때문에, 본 발명은, 라우드니스, 즉 믹스의 에너지 및 음향 윤곽을 최적화하기 위해, 인코딩 후 제한기를 최대화기의 형태로 관련시키는 것을 제안한다. 그 결과는 서라운드 인코딩된 믹스이며, 상기 믹스는 스테레오 및 모노 콘텍스트에서 절대적으로 및 등가적으로 작동한다. 이 제한에 의해 스테레오 또는 모노 믹스의 에너지도 유지되며, 이때 스테레오 오리지널에 일치하거나 또는 이것을 개선시키는 음향이 생성된다.The first limitation known from the prior art, and indicated in step c), is generally used in the surround range to keep the volume as high as possible in the mix. However, it is not used for stabilization according to the invention of divided channels. A further idea of the invention is that, contrary to the prevailing opinion, subsequent to step d) other restrictions of the individual channels are performed. Because the encoded surround mix sounds bad when compared directly to the stereo and mono mixes, it is less suitable for flow programming, such as radio and TV, because in this case the encoded mix competes with the stereo and mono mixes. . As such, the present invention proposes to relate a limiter in the form of a maximizer after encoding, in order to optimize the loudness, ie the energy and acoustic profile of the mix. The result is a surround encoded mix, which works absolutely and equally in stereo and mono contexts. This limitation also preserves the energy of the stereo or mono mix, producing a sound that matches or enhances the stereo original.

이 이외에, 본 발명의 장점은 서라운드 인코딩된 믹스가 보다 위상 안정적이라는 데에 있다. In addition to this, an advantage of the present invention is that the surround encoded mix is more phase stable.

그 밖의 장점은 스테레오 인코딩된 믹스가 본 발명에 따른 방법에 의한 프로세싱 후 기존에 알려진 스테레오보 다 현저히 더 잘 들린다는 것이다. 이 방법을 통해, 추가적으로 소비자의 청취 공간이 포함되며, 따라서 이렇게 인코딩된 스테레오 믹스는 보다 명료하게, 다차원적으로, 그리고 보다 집중적으로 울린다.Another advantage is that the stereo encoded mix sounds significantly better than the previously known stereo after processing by the method according to the invention. In this way, additionally the consumer's listening space is included, so the stereo mix thus encoded sounds more clearly, multi-dimensionally and more intensely.

이 이외에, 이 방법을 통해, 이미 임의의 유형의 매트릭스 서라운드 방법에서 인코딩된 스테레오 믹스를, 모든 오디오 컨피규레이션에서의 새로운 안정성 및 음색으로 전환되도록 프로세싱하는 것이 가능하다.In addition to this, with this method it is possible to process a stereo mix already encoded in any type of matrix surround method to be converted into a new stability and timbre in any audio configuration.

그 밖의 적용 영역은 디지털 서라운드 방법을 위해 만들어진 기존의 개별 채널들로부터 새로운 결과로의 변환이다. 즉, 예컨대 Dolby Digital 과 dts 제품은, 완전한 스테레오 및 모노 호환성에 있어서 디지털 Decoding-Equipment 를 갖고 있지 않은 소비자들을 위해 청취 가능하게 만들어질 수 있다.Another area of application is the conversion of existing discrete channels made for digital surround methods into new results. That is, Dolby Digital and dts products, for example, can be made audible for consumers who do not have digital decoding-equipment in full stereo and mono compatibility.

본 발명의 범위에서, 출력 레벨을 위해 단계 c) 에서는 채널들 FL 및 FR 의 균일한 값이 설정될 수 있으며, 이때 바람직하게는 출력 레벨값은 -8.0 dB (dB = decibel) 과 -24.0 dB 사이로 설정된다. 채널 C 의 출력 레벨값은 프로세싱되어야 하는 오디오 자료에 따라 자유로이 맞춰진다. 바람직하게는, 이 채널의 출력 레벨값은 채널들 FR 및 FL 에 대해 +1 내지 +6 dB 만큼 차이가 난다. 7. 1 채널들까지 제한하기 위해, 본 발명의 그 밖의 바람직한 실시형태에 따르면, 단계 c) 에서는 추가적으로 채널들 Ls, Rs, BI, Br, LFE 의 균일한 출력 레벨값이 설정된다. 이때, -9.0 dB 과 -25.0 dB 사이의 출력 레벨값, 7.0 dB 과 10.0 dB 사이의 채널 페이더값, -1.0 dB 과 -10 dB 사이의 임계값, 및 0.5 와 2.0 사이의 릴리스값의 설정이 특히 효과적인 것으로 증명되었다.Within the scope of the present invention, a uniform value of the channels FL and FR can be set in step c) for the output level, wherein the output level value is preferably between -8.0 dB (dB = decibel) and -24.0 dB. is set The output level value of channel C is freely set according to the audio material to be processed. Preferably, the output level value of this channel differs by +1 to +6 dB with respect to channels FR and FL. 7. In order to limit up to 1 channel, according to another preferred embodiment of the present invention, uniform output level values of the channels Ls, Rs, BI, Br and LFE are additionally set in step c). At this time, the output level value between -9.0 dB and -25.0 dB, the channel fader value between 7.0 dB and 10.0 dB, the threshold value between -1.0 dB and -10 dB, and the release value between 0.5 and 2.0 are particularly set. proven to be effective.

이 이외에, 단계 d) 에 뒤이은 그 밖의 제한을 위해 -1.0 dB 와 -10.0 dB 사이의 임계값, 0 dB 과 -1.0 dB 사이의 출력 레벨값, 및 0.5 와 2.0 사이의 릴리스값의 설정이 특히 바람직한 것으로 밝혀졌다.In addition to this, the setting of a threshold value between -1.0 dB and -10.0 dB, an output level value between 0 dB and -1.0 dB, and a release value between 0.5 and 2.0 for the other restrictions following step d) are particularly found to be desirable.

채널당 멀티밴드 압축기의 최적의 이용을 통해, 본 발명의 범위에서 믹스의 주파수들에 영향을 미칠 수 있다. Through optimal use of the multiband compressor per channel, it is possible to influence the frequencies of the mix within the scope of the present invention.

대응하는 주파수 범위의 강조 또는 약화를 통해, 음향 윤곽의 변경시 예컨대 2 채널로부터 6 채널로의 디코딩의 범위에서 생성되었던, 손실된 주파수들을 특정하게 반복할 수 있다. 즉, 이 효과는 이퀄라이저의 효과와 대등하게 취급될 수 있으며, 상기 이퀄라이저는 마찬가지로 멀티밴드 압축기에 대해 대안적으로 사용될 수 있다. Through the enhancement or attenuation of the corresponding frequency range, it is possible to specifically repeat the lost frequencies, which have been generated in the range of decoding, for example from 2 channels to 6 channels, when the sound contour changes. That is, this effect can be treated equivalently to that of an equalizer, and the equalizer can likewise be used alternatively to a multi-band compressor.

마찬가지로, 대응하는 출력 자료에 있어서, 단계 b) 에서는 개별 채널당 압축해제를 수행하는 것이 바람직할 수 있다. 본 발명은, 분할 후의 개별 채널당 압축해제는 단계 a) 이전의 분할되어야 하는 합계의 기존에 자주 사용된 압축해제보다 더 가치있는 결과를 제공한다는 인식에 도달했다. 압축해제 장치는 파라미터들, 즉, 임계값, 어택, 릴리스, 비율 및 출력 레벨을 갖추고 있는 압축기이다. 값 1.00 이하의 비율값의 설정, 및 긴 어택값 및 릴리스값들은 대응하는 출력 자료에 있어서 (상기 출력 자료는 이미 그 자체가 너무 심하게 또는 브릭월 압축 (brickwall compression) 을 통해 바람직하지 않게 마스터링되었다) 보다 다이내믹한 결과를 초래할 수 있다. 출력 자료에 맞춰진 임계값 및 출력 레벨 설정을 전제로 한다.Similarly, for the corresponding output material, it may be desirable to perform decompression per individual channel in step b). The present invention has come to the realization that decompression per individual channel after division gives a more valuable result than the previously often used decompression of the sum to be divided prior to step a). A decompressor is a compressor with parameters: threshold, attack, release, rate and power level. The setting of the ratio value below the value 1.00, and the long attack and release values in the corresponding output material (the output material has already been undesirably mastered too heavily by itself or through brickwall compression) ) can lead to more dynamic results. It is assumed that the threshold value and output level settings tailored to the output data are set.

최종적으로, 본 발명은 녹음 매체, 사운드 캐리어, 디지털 데이터 레코드를 위한 상기 방법의 사용, 및 통상적인 오디오 포맷으로부터 새로운 가능한 음향으로의 변환 자동화의 사용을 제공한다. 이는 오디오/비디오 장비 안에 탑재될 수 있거나 또는 단독형 하드웨어 또는 소프트웨어로서 작동될 수 있고, 또한 소프트웨어 및 하드웨어에 그 기초를 둔 호스트-애플리케이션 내에 적용될 수 있다.Finally, the present invention provides for the use of the method for recording media, sound carriers, digital data records, and the use of automation of conversion from conventional audio formats to new possible sounds. It can be embedded in audio/video equipment or can be operated as stand-alone hardware or software, and can also be applied within software and host-applications based on hardware.

이하, 본 발명의 특히 바람직한 실시형태를 다음과 같이 설정된 파라미터들을 가진 5.1 채널 서라운드 시스템에 기초하여 설명한다.Hereinafter, a particularly preferred embodiment of the present invention will be described based on a 5.1 channel surround system with parameters set as follows.

도 1은 개발 시스템 개요도이다.
도 2는 서라운드 마스터링 방법에 대한 설명도이다.
1 is a schematic diagram of a development system.
2 is an explanatory diagram of a surround mastering method.

예 5.1 에서의 인코딩 전의 제한 Constraints before encoding in Example 5.1

a) 미리 분할된 오디오 트랙들의 채널 페이더 FL, FR, Ls, Rs, LFE 는 0 db 의 설정을 가지며, C 의 채널 페이더값은, 프로세싱되어야 하는 오디오 자료에 따라 위쪽으로 편차를 나타낸다. a) The channel faders FL, FR, Ls, Rs, LFE of the pre-divided audio tracks have a setting of 0 db, and the channel fader value of C indicates an upward deviation according to the audio material to be processed.

믹싱 데스크 (mixing desk) 에서, 채널 페이더들은 각각의 채널의 음량을 조절한다. 페이더의 정상-음향 위치는 0 dB 이다. 채널 페이더는 0 dB 로 설정되며, 따라서 채널에 인가된 신호는, 정확히 조정되고 중립적으로 설정된 이득값을 전제로 하여 원래 레벨 조정되었던 것과 마찬가지로 울린다. 이 조정 후 신호들은 제한기를 가진 채널 페이더들에게 전달된다.At the mixing desk, channel faders adjust the volume of each channel. The normal-acoustic position of the fader is 0 dB. The channel fader is set to 0 dB, so the signal applied to the channel sounds as if it were originally level-adjusted, assuming correctly tuned and neutrally set gain values. After this adjustment, the signals are passed to the channel faders with limiters.

b) 제한기를 가진 6 채널들의 각각의 채널 페이더는 +8.3 db 의 설정을 가진다. b) Each channel fader of the 6 channels with a limiter has a setting of +8.3 db.

즉, 8.3 db 만큼 6 채널들의 각각이 통과된다. 이는 중요한데, 왜냐하면 원래 너무 약한 6 개별 채널들이 이러한 방식으로 다시 강화되기 때문이다.That is, each of the 6 channels is passed by 8.3 db. This is important because the 6 individual channels, which were originally too weak, are reinforced in this way.

c) 6 제한기들의 각각은 "임계값" 값 -3.3 db 를 가진다. c) Each of the 6 limiters has a “threshold” value of -3.3 db.

"임계값" 값은 채널 페이더에 인가된 신호의 스레스홀드값을 나타내며, 상기 임계값부터 제한기가 작동하기 시작한다. 제한기는 신호가 임계값을 초과하자마자 신호를 제한하도록 작동한다. 하지만 이는 오히려 압The "threshold" value represents the threshold value of the signal applied to the channel fader, at which threshold the limiter starts operating. The limiter works to limit the signal as soon as it exceeds a threshold. but this is rather

축기와는 달리 간단하게 수행되는데, 왜냐하면 즉시 반응하기 때문이며, 반면 압축기는 얼마나 정확히 압축되어야 할 지에 대해 다수의 복잡한 개별설정을 준비해 놓고 있다. 제한기는 오히려 신호 압축의 특성을 가진다. 본 경우에 값이 -3.3 db 을 초과하면, 위로부터 엄격히 제한되며 (그리고 신호는 레벨이 더 이상 올라갈 수 없기 때문에 신호 내부에서의 에너지가 상승됨으로써 라우드니스를 얻는다), 보다 정확히 말하면 그럼에도 불구하고 그의 특성을 변경시키지 않도록 제한된다. 모든 채널이 간단히 심하게만 제한된다면, 결과는 강하기는 하나 평평하고, 깊이를 갖지 않으며, 그리고 "펌핑 (pumping)" 효과를 갖는 것으로 보일 것이다.Unlike compressors, this is done simply because they respond instantaneously, whereas compressors have a number of complex individual settings for exactly how much to compress. The limiter rather has the characteristics of signal compression. If the value exceeds -3.3 db in the present case, it is strictly limited from above (and loudness is obtained by raising the energy inside the signal since the signal cannot rise in level any further), more precisely its characteristic nonetheless. is restricted so as not to change. If all channels are simply severely restricted, the result will appear strong but flat, with no depth, and with a "pumping" effect.

채널 C 에서의 임계값은 임계값 안의 프로세싱되어야 하는 오디오에 따라 변화할 수 있다. The threshold in channel C can vary depending on the audio to be processed within the threshold.

d) 각각의 제한기는 "릴리스" 값 1.00 을 가진다.d) Each limiter has a “release” value of 1.00.

"릴리스" 값은 인가된 신호가 다시 임계값 아래로 떨어진 후 제한기가 다시 제로 위치로 되돌아가는데 시간이 얼마나 필요한지를 나타낸다. 신호가 임계값 한계 위로 가면, 제한기는 레벨을 제한한다. 신호가 다시 떨어지면, "릴리스" 값을 선택할 수 있는 다수의 가능성이 존재한다.The "release" value indicates how long it takes for the limiter to return to the zero position after the applied signal falls back below the threshold. When the signal goes above the threshold limit, the limiter limits the level. When the signal drops again, there are a number of possibilities to choose the "release" value.

e) "출력 레벨" 값 e) "Output Level" value

"출력 레벨" 값은 제한기에 의한 프로세싱 후 채널에 인가된 신호의 강도를 표시한다. 기본적으로, 보통의 신호 증폭기/제한기에 관한 것이다. 이 값의 장점은, 추후의 스테레오/모노에서 뿐만 아니라 전체 서라운드 포맷들에서 음량의 정확한 상태를 다시 찾는 것을 허용하는 고정 컨피규레이션을 찾아낼 수 있다는 것이다.The "output level" value indicates the strength of the signal applied to the channel after processing by the limiter. Basically, it's a normal signal amplifier/limiter. The advantage of this value is that it can find a fixed configuration allowing to find back the correct state of loudness in full surround formats as well as later in stereo/mono.

바람직한 설정은 다음과 같다:Preferred settings are:

- 채널 "FL" - 17.5 db - Channel "FL" - 17.5 db

- 채널 "FR" - 17.5 db - Channel "FR" - 17.5 db

- 채널 "C" - 17.5 db - Channel "C" - 17.5 db

- 채널 "LS" - 18.5 db- Channel "LS" - 18.5 db

- 채널 "RS" - 18.5 db - Channel "RS" - 18.5 db

- 채널 "LFE" - 18.5 db - Channel "LFE" - 18.5 db

채널 C 의 "출력 레벨" 값은 프로세싱되어야 하는 오디오 자료에 따라 변화할 수 있다. The "output level" value of channel C can vary depending on the audio material to be processed.

즉, 이 컨피규레이션은 다시 믹스를 안정화한다. 원칙적으로 매우 낮은 출력 레벨값들은 믹스가 에너지와 관련하여 다시 상당히 충전됨으로써 실현되는데, 왜냐하면 인코딩 프로세싱에서는 6 채널로부터 다시 2 채널(Lt, Rt) 이 되기 때문이다. 즉, 에너지의 거듭제곱이 그 결과이다. 보다 높은 출력 레벨값들의 경우, 인코딩에 있어서 믹스가 파괴되는 결과와 함께 심한 과변조가 생긴다.In other words, this configuration again stabilizes the mix. In principle, very low output level values are realized by having the mix re-charged significantly in terms of energy, since in the encoding processing it goes from 6 channels back to 2 channels (Lt, Rt). That is, the power of energy is the result. For higher output level values, severe overmodulation occurs in the encoding with the result that the mix is destroyed.

단계 d) 에 뒤이어 압축기/제한기/맥시머를 수단으로 제공된 그 밖의 제한을 위해, 바람직하게는 다음의 값들이 선택될 수 있다:For the other limits provided by means of the compressor/limiter/maximer following step d), the following values may preferably be chosen:

a) 임계값 a) Threshold

임계값은 표준화될 수 없다. 여기에서는 청각에 좌우되며, 값을 아래로 더 멀리 내리면 내릴수록 (즉, 맥시 마이저가 더 빨리 작동하기 시작하면 시작할수록), 인코딩된 믹스는 변화하는 주파수 및 음향 윤곽에 있어서 더 많은 라우드니스를 얻는다. 이 설정은 오디오에 좌우된다. 더 많은 라우드니스를 오리지널 신호가 가지면 가질수록 (예컨대 Dance Music), 더 적은 임계값이 필요해진다. 임계값 -2.6 dB 이 바람직한 것으로 증명되었다.Thresholds cannot be standardized. It depends on your hearing here, the farther you drop the value down (i.e. the sooner the maximizer starts working), the more loudness the encoded mix gets in terms of changing frequencies and sonic contours. This setting depends on the audio. The more loudness the original signal has (e.g. Dance Music), the less threshold is needed. A threshold of -2.6 dB has proven desirable.

b) 출력 레벨 b) output level

아웃 실링값 (Out-Ceiling Value) -0.1 dB 은 거의 모든 믹스에 있어서 그 효과를 증명하였다. 임계값이 설정되고 신호가 -(마이너스) 0.1 dB 에 달한 후, 믹스 내부에서의 레벨 피크 (level peak) 들이 - 서라운드 믹스 내부에서의 개별채널 덧셈으로 인해 - 지된다. 이때, 0 dB 마크의 과변조가 저지된다. Out-Ceiling Value -0.1 dB proved its effectiveness in almost all mixes. After the threshold is set and the signal reaches -(minus) 0.1 dB, the level peaks inside the mix - due to the individual channel additions inside the surround mix - is stopped At this time, overmodulation of the 0 dB mark is prevented.

이로 인해, 스테레오-오리지널과 똑같은 또는 더 잘 들리는, 하지만 진폭에 있어서 달리 보이는 결과가 생긴다. This results in a sound that sounds the same or better than the stereo-original, but looks different in amplitude.

음향 결과는 동시에 상승하는 라우드니스에 있어서 보다 다이내믹하게 작용하며, 이는 일반적으로 대개의 경우 상호 배타적이다. 오디오 자료가 일반적으로 압축/제한을 통해 보다 소리가 커지기는 하나 동시에 덜 다이내믹하게 되면, 이는 여기에서 프로세싱된 방법에서 상호 배타적이지 않고, 다이내믹스 (dynamics) 뿐만 아니라 라우드니스를 획득할 수 있다. The acoustic results are more dynamic in terms of simultaneously rising loudness, which are generally mutually exclusive in most cases. If the audio material is typically made louder through compression/limiting, but less dynamic at the same time, these are not mutually exclusive in the way processed here, dynamics as well as loudness can be achieved.

릴리스값 맥시마이저에 있어서 "릴리스" 값 1.00 이 사용된다. 이것은 결과가 원래대로 울린다는 점에서 그 효과를 증명하였다.For the release value maximizer, a "release" value of 1.00 is used. This proved its effectiveness in that the results sounded the way they did.

발명된 본 방법의 내에서 모든 값들의 최적의 설정에 의해, - 오리지널과 비교하여 - 그 어떤 오디오 환경에서의 보다 높은 음향품질이 생성된다.Optimal setting of all values within the invented method produces - compared to the original - a higher sound quality in any audio environment.

이 방법은, Lt, Rt 트랙이 되도록 형성하기 위해, 서라운드 믹스의 완전히 생산된 개별 트랙들 (이산 트랙들)에 마찬가지로 적용될 수 있다.This method can likewise be applied to the fully produced individual tracks (discrete tracks) of the surround mix, to form what becomes the Lt, Rt track.

Claims (3)

특히 서라운드 멀티채널 사운드 공학에서 멀티채널 사운드 시스템에서의 멀티채널 프로세싱 방법으로서,
a) 채널 또는 채널 혼합물을 개별 채널들로 분할하는 단계;
b) 생성된 상기 개별 채널들을 파라미터 채널 페이더를 설정함으로써 프로세싱하는 단계;
c) 파라미터들, 즉, 상기 채널 페이더, 임계값, 릴리스, 출력 레벨의 값들을 설정함으로써 상기 개별 채널들을 압축 및/또는 제한하는 단계; 및
d) 상기 개별 채널들을 인코딩하는 단계를 가지며,
상기 채널 페이더들은 상기 단계 b) 에서 균일한 값으로 설정되고, 상기 단계 c) 에서는 균일한 출력 레벨값을 가진 적어도 2 개의 채널이 제한되고, 이때 채널 C (Center) 는 상기 균일한 출력 레벨값에서 변할 수 있고, 각각의 그 밖의 채널은, 상기 채널 C 가 상기 2 개의 채널의 균일한 출력 레벨값보다 적어도 1 데시벨 적은 출력 레벨값을 갖도록 제한되고, 상기 단계 d) 에 뒤이어 상기 인코딩된 채널들의 그 밖의 압축 및/또는 제한은 상기 파라미터들, 즉, 상기 채널 페이더, 상기 임계값, 상기 릴리스 및 상기 출력 레벨 중 적어도 하나의 값을 설정함으로써 수행되는 것을 특징으로 하는 프로세싱 방법.
As a multichannel processing method in a multichannel sound system, especially in surround multichannel sound engineering,
a) dividing the channel or mixture of channels into individual channels;
b) processing the generated individual channels by setting a parameter channel fader;
c) compressing and/or limiting the individual channels by setting parameters, ie values of the channel fader, threshold, release, output level; and
d) encoding the individual channels;
The channel faders are set to a uniform value in step b), and at least two channels with uniform output level values are limited in step c), wherein channel C (Center) is at the uniform output level value. and each other channel is constrained such that the channel C has an output level value that is at least 1 decibel less than the uniform output level value of the two channels and, following step d), the output level of the encoded channels and the outer compression and/or limiting is performed by setting a value of at least one of said parameters, namely said channel fader, said threshold, said release and said output level.
제1항에 있어서,
적어도 하나의 채널 페이더는 균일한 값을 통해 설정되는 것을 특징으로 하는 멀티채널 사운드 시스템에서의 멀티채널 프로세싱 방법.
According to claim 1,
A multi-channel processing method in a multi-channel sound system, characterized in that at least one channel fader is set through a uniform value.
제1항에 있어서,
상기 채널 페이더들의 값들은 상기 채널 또는 채널 그룹을 상기 개별 채널들로 분할한 후 모든 채널에 있어서 동일한 것을 특징으로 하는 멀티채널 사운드 시스템에서의 멀티채널 프로세싱 방법.
According to claim 1,
The multi-channel processing method in a multi-channel sound system, characterized in that the values of the channel faders are the same for all channels after dividing the channel or channel group into the individual channels.
KR1020220019017A 2022-02-14 2022-02-14 Surruond Sound Mastering Processing KR20230122397A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220019017A KR20230122397A (en) 2022-02-14 2022-02-14 Surruond Sound Mastering Processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220019017A KR20230122397A (en) 2022-02-14 2022-02-14 Surruond Sound Mastering Processing

Publications (1)

Publication Number Publication Date
KR20230122397A true KR20230122397A (en) 2023-08-22

Family

ID=87799821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220019017A KR20230122397A (en) 2022-02-14 2022-02-14 Surruond Sound Mastering Processing

Country Status (1)

Country Link
KR (1) KR20230122397A (en)

Similar Documents

Publication Publication Date Title
TWI416505B (en) Method and apparatus of providing protection against signal clipping of audio signals derived from digital audio data
CN107851440B (en) Metadata-based dynamic range control for encoded audio extension
US11727948B2 (en) Efficient DRC profile transmission
RU2659490C2 (en) Concept for combined dynamic range compression and guided clipping prevention for audio devices
US8355909B2 (en) Hybrid permanent/reversible dynamic range control system
US20030023429A1 (en) Digital signal processing techniques for improving audio clarity and intelligibility
KR101571197B1 (en) Method for multi-channel processing in a multi-channel sound system
US20080080722A1 (en) Loudness controller with remote and local control
CN112534717B (en) Feedback-responsive multi-channel audio enhancement, decoding, and rendering
US20020075965A1 (en) Digital signal processing techniques for improving audio clarity and intelligibility
KR20230122397A (en) Surruond Sound Mastering Processing