TWI416505B - 對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備 - Google Patents

對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備 Download PDF

Info

Publication number
TWI416505B
TWI416505B TW098136170A TW98136170A TWI416505B TW I416505 B TWI416505 B TW I416505B TW 098136170 A TW098136170 A TW 098136170A TW 98136170 A TW98136170 A TW 98136170A TW I416505 B TWI416505 B TW I416505B
Authority
TW
Taiwan
Prior art keywords
audio
gain value
gain
value
signal
Prior art date
Application number
TW098136170A
Other languages
English (en)
Other versions
TW201042637A (en
Inventor
Wolfgang A Schildbach
Alexander Groeschel
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of TW201042637A publication Critical patent/TW201042637A/zh
Application granted granted Critical
Publication of TWI416505B publication Critical patent/TWI416505B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備 前後參照相關申請案
此申請案主張2008年10月29日提出的美國專利臨時申請案第61/109,433號之優先權,其全部以引用的方式併入本文中。
該專利申請案有關一使用嵌入於數位聲頻流中之預存聲頻元資料的聲頻信號之截割保護。特別地是,該申請案有關當把多通道聲頻信號降混至較少通道時之截割保護。
將聲頻元資料嵌入一數位聲頻流、例如數位廣播環境係一普通之概念。此元資料係“有關資料的資料”,亦即有關該聲頻流中之數位聲頻的資料。該元資料能對聲頻譯碼器提供有關如何複製該聲頻之資訊,元資料之一型式係動態範圍控制資訊,其代表一時變增益包跡。此動態範圍控制元資料能具有多數用途之作用:
(1)控制複製聲頻之動態範圍:數位傳送允許用於一高動態範圍,但收聽條件未總是允許充份利用這點。雖然高動態範圍係在安靜起居室條件中想要的,其基於該高背景雜訊位準未能適當地用於其他條件,例如用於一汽車收音機。為配合寬廣變化性之收聽條件,指示接收器如何減少該複製聲頻之動態範圍的元資料可被***該數位聲頻流;代替於傳輸之前減少該聲頻之動態範圍。該後一方法不是較佳的,因該方法使得其不可能用於一接收器,以用全動態範圍複製該聲頻。代替地,該前一方法係較佳的,因其允許該聽眾決定動態範圍控制是否應被施加或不需視該收聽環境而定。此動態範圍控制元資料造成一可用於聽眾的解碼信號在其辨別之高品質精美的動態範圍壓縮。
(2)萬一降混操作防止截割:當一多通道信號(例如5.1通道聲頻信號)被降混時,通道之數目典型係減少至二通道,萬一經由立體喇叭複製包括超過二通道(例如具有5個主要通道及1個低頻效應通道之5.1通道聲頻信號)的多通道聲頻信號,典型施行一接收器側降混操作,在此該多通道信號被混合成二通道。萬一將5通道信號降混成2通道(立體聲)信號(該低頻效應通道於降混期間典型不被考慮),該混合操作能被以一降混矩陣所敘述,例如具有二列及5行之2-5矩陣。
用於將5.1通道信號之5個主要通道混合成二個通道的不同降混方案係已知的,例如Lo/Ro(僅只左側、僅只右側)、或Lt/Rt(全部左側、全部右側)。
該降混步驟帶有該數位立體信號之偶發超載的風險,藉此產生非所要求的截割人工因數。當一將超過該最大可表示值的經降混數位信號之振幅被限制於該最大(或最小)可表示值時,此截割可發生,例如萬一簡單之未簽署的固定點二進位表示法,當該經計算之降混振幅被限制於該最大值字詞時,在此所有位元對應於1,發生截割。萬一於16位元中之未簽署的表示法,該最大值可例如對應於“01111111 11111111”之字詞。
當用於各種降混方案之降混矩陣係在在該頭端、發送器、或內容產生側得知時,對於當降混時可導致截割之信號,指示一接收器於混合之前衰減該等待降混的信號之動態範圍控制元資料可被加至該聲頻流,以動態地防止截割。
(3)萬一升高輸出防止截割:用於遍及動態很有限通道(例如經由類比RF連線由一機頂盒至電視之RF輸入)的重傳,該信號被升高,典型達11分貝,以在此路徑上達成一更好之信噪比。於此等應用中,對於當增強達11分貝時可導致截割之信號,指示一接收器於施加該11分貝增強之前衰減該等信號的動態範圍控制元資料可被加至該聲頻流,以動態地防止截割。
由該裝置接收該聲頻流之觀點,如果該進來之動態範圍控制元資料具有在點(1)之下的目的、亦即該動態範圍之控制、在點(2)之下的目的、亦即降混截割保護、或在點(1)及(2)兩者之下的目的之作用係不清楚的。通常,該元資料達成兩任務,但這未總是如此,故於一些案例中,該元資料不能包括降混截割保護。此外,如果該元資料(典型地,一不同增益參數被用於RF模式)係與在點(3)之下的RF模式有關,萬一額外之增強(萬一降混與萬一未降混兩者),該元資料可被用來防止截割。
再者,由於一些聲頻編碼格式之事實,該元資料係選擇性地,該進來之聲頻流可全不包括動態範圍控制元資料。
如果該動態範圍控制元資料不包括具有該壓縮之聲頻流、或被包括、但不包括降混截割保護,如果多通道信號被降混成較少之通道,不想要之截割人工因數可為存在於該解碼信號中。
本發明敘述當藉由聲頻元資料之截割保護不被保證時的防止聲頻信號截割之方法及設備。
該申請案之第一態樣有關一提供保護免於聲頻信號、例如降混數位聲頻信號的信號截割之方法,該聲頻信號係源自數位聲頻資料。根據該方法,其係決定基於所接收之聲頻元資料的第一增益值是否足以用於保護免於該聲頻信號之截割。該聲頻元資料被嵌入在第一聲頻流中。例如其係決定包括具有一壓縮聲頻流之時變增益包跡元資料是否足以防止降混截割。如果第一增益值係不足以用於保護,該個別之第一增益值係以足以用於保護免於該聲頻信號之截割的增益值取代。較佳地是,如果沒有有關動態範圍控制之元資料係存在於該第一聲頻流中,該方法可加入足以用於保護免於信號截割的增益值。例如於該時變增益包跡元資料不提供足以降混截割保護、或其全然不存在之案例中,該時間變化增益包跡元資料被修改或加入,以致其確實提供足以降混截割保護。
該方法允許截割保護、特別是萬一降混之截割保護,而不管是否接收足以用於截割保護之增益值。
根據該方法,所接收之聲頻增益字詞(如果提供)可被盡可能符合實際地施加,但當該等進來之增益字詞不提供足夠之衰減以例如於一降混中防止截割時可被超越。
因動態範圍控制資料具有在點(1)之下的目的帶有精美之態樣的作用,如果該進來之元資料不提供該動態範圍控制資料,其典型不會於該接收裝置(例如機頂盒)之運轉中導入此動態範圍控制資料。如(2)之性質雖然能夠與因此將被該接收情況所提供。這意指該接收之裝置將嘗試在點(1)之下儘可能多地保存意欲用於動態範圍控制的動態範圍控制資料,而同時加入截割保護。
有各種方式以決定基於所接收之聲頻元資料的第一增益值是否足以用於保護免於信號截割。
根據一較佳方式,第二增益值係基於該數位聲頻資料所計算,在此該等第二增益值係足以用於該聲頻信號之截割保護。該等第二增益值可為不會導致截割之最大可容許的增益值。
較佳地是,該方法以於此一使其比較基於所接收之聲頻元資料的第一增益值及該等經計算之第二增益值的方式,決定該等第一增益值是否足夠。該方法可比較與該聲頻資料的一片段有關之一第一值和與聲頻資料的同一片段有關之個別第二增益值。
於其間之相依中,增益值之截割保護適用聲頻流可由該等第一及第二增益值產生。較佳地是,於該比較操作上之相依性中,由第一增益值及該經計算之第二增益值選擇此等增益值。藉由選擇第二計算增益值代替該第一增益值,該第一增益值係以所選擇之第二增益值取代。
較佳地是,選擇一對第一及第二增益值之最小值。如果該第一增益值係大於足以用於保護之經計算的第二增益值,這指示有一風險,即該第一增益值係不足以用於截割保護,且如此將以該個別之第二增益值取代。以別的方式,如果該第一增益值係比足以用於保護之經計算的第二增益值較小,這指示沒有信號截割之風險,且該第一增益值應被保存。
由該第一及第二增益值選擇增益值可如在下面所說明地進行:如果該第一增益值及該第二增益值兩者提供小於或等於1之增益,取兩者之最小值。這意指該第一增益值已經保證截割保護,或如果未保證,其將被該第二增益值所取代的其中之一。
如果該第二增益值之增益係大於1,且該第一增益值提供一小於或等於1之增益,該信號可被增強,且仍然將不會截割。儘管如此,該進來之聲頻流要求衰減,例如為實現動態範圍限制目的,且其如此被保存。
如果該第一增益值提供一大於1之增益,且該第二增益值提供一小於或等於1之增益,該進來之第一增益值將破壞截割保護,且如此取該第二增益值。
如果該第一增益值及該第二增益值提供一大於1之增益,該輸入將應被增強。只要仍然沒有截割發生,此增強被允許,且如此該第一增益值及該第二增益值之較小者被使用。
用於決定該等第一增益值是否足以用於保護之另一選擇方式係施加該等第一增益值至聲頻資料,且決定該結果之數位聲頻信號(例如該降混信號)是否截割。
如果該等第一增益值係不足以用於保護,吾人可重覆地地決定足以用於截割保護之增益值,並由當作最初增益值之第一增益值開始。例如吾人可根據該等增益值之解析度決定該聲頻信號是否以一增益值截割,該增益值係小於該等第一增益值之最近的增益值(例如,如果該等第一增益值係0.8,且該增益值解析度係0.1,該最近之較小增益值將為0.7)。如果該信號仍然截割,吾人可決定是否以該下一較小之增益值截割該聲頻信號(例如0.6之增益值),這被重複,直至一不會導致信號截割之增益值被發現。
較佳地是,該方法係施行作為轉碼過程的一部份,在此第一聲頻編碼格式(例如該AAC格式或該高效率AAC(HE-AAC)格式、亦已知為aacPlus)中之第一聲頻流被轉碼成在第二聲頻編碼格式(例如該杜比數位格式或該杜比數位+格式)中編碼之第二聲頻流。該第二聲頻流包括該等足以用於截割之取代增益值、或具有源自該處之增益值。既然用於承載該聲頻資料之數位壓縮格式不能遍及該整個傳輸鏈被保持,直至該傳輸鏈中之最後的聲頻解碼器(例如直至該AVR-聲頻/視頻接收器之解碼器),聲頻轉碼通常係需要的。萬一廣播,這是因為例如不同編碼方案可被使用於該無線廣播(或經由纜線對該客戶之廣播)與該接收裝置(例如機頂盒-STB)及該傳輸鏈(例如該AVR中之解碼器或該電視機中之聲頻解碼器)中之最後解碼器間之聲頻的傳輸。例如該聲頻資料可被經由該AAC格式或該HE-AAC格式無線地廣播,且接著該聲頻資料可被轉碼成用於由該STB傳輸至該AVR之杜比數位格式或杜比數位+格式。因而,一轉碼步驟可被施行,例如於該STB中,以由一格式至另一格式獲得。此轉碼步驟包括該聲頻資料本身之轉碼,但理想地亦同樣包括所附元資料之轉碼,特別是該動態範圍控制資料,根據一較佳具體實施例,該方法於該第二聲頻流中提供轉碼聲頻增益元資料,該增益元資料足以用於保護免於信號截割。
於將信號由一壓縮聲頻流格式轉碼至另一格式之任何裝置中,該方法可為很有用的,在此其不知在如有任何該時變增益控制元資料被該第一格式所傳送的時間之前是否包括降混截割保護(例如於一AAC/HE-AAC至杜比數位轉碼器,一杜比E至AAC/HE-AAC轉碼器、或一杜比數位至AAC/HE-AAC轉碼器中)。
較佳地是,用於決定該等第一增益值是否足以用於保護,該數位聲頻資料係根據至少一降混方案、例如根據一Lt/Rt降混方案降混。該降混導致一或多個信號,例如一與該右側通道有關之信號及一與該左側通道有關之信號。此外,複數降混方案可被考慮,且該數位聲頻資料係根據超過一降混方案降混。
較佳地是,源自該聲頻信號之各種信號的一實際峰值被連續地決定,亦即在一給定時間,其係決定該等各種信號之哪一個具有該最高信號值。用於計算一峰值,該方法可在一給定時間決定二或更多信號之絕對值的最大值。該二或更多信號可在根據第一降混方案降混之後包括一或多個信號,例如該降混之左側通道信號的樣本之絕對值與該降混之右側通道信號的同時樣本之絕對值。此外,用於計算該峰值,該方法亦可在根據第二(及甚至第三)降混之方案降混之後考慮一或多個信號之絕對值。再者,該峰值決定可在降混之前考盧一或多個聲頻信號之絕對值,例如5.1通道信號的5個主要通道之每一個的絕對值。應注意的是萬一轉碼,其典型不知該多通道信號是否透過離散通道被稍後播放,或如果根據一降混方案之降混被施行。
一峰值對應於這些同時信號樣本值之最大值,藉此指示該最大振幅,用於所有可能之案例,該信號可具有在一特別時間之情況,且這是該截割保護演算法將被考慮之極差案例。
該動態範圍控制資料典型係時變的,於某一粒化中,其大致上有關該個別聲頻編碼格式或其之一體部份的資料區段(例如區塊)之長度。如此,第二增益值較佳地係亦每資料區段計算。
因此,該等峰值或連續峰值之取樣比率較佳地係減少(降低取樣)。這可藉由決定複數連續峰值或連續經過濾峰值之最大值所完成。特別地是,該方法可決定與例如一區塊或資訊框的資料區段有關聯之複數連續(經過濾)峰值之最大值。萬一轉碼,該方法可決定與該第二(輸出)資料流的一資料區段有關聯之複數連續(經過濾)峰值的最大值。應注意的是不只基於一輸出區段中之信號樣本的連續峰值較佳地係被考慮用於決定該最大值,同時也考慮將影響該資料區段之解碼的額外(之前或稍後)之峰值、亦即有關在一解碼窗口之開始或結束的信號樣本之峰值。這些峰值係亦與該資料區段有關聯。
代替選擇該最高峰值,吾人可每資料區段計算一不同值,用於減少該取樣比率。
應注意的是源自異於峰值的聲頻資料之樣本可被降低取樣。例如該聲頻資料可被降混至單一通道(單聲道),且每輸出資料區段僅只決定該降混之連續樣本的最大值。根據一不同範例,用於每一經降混通道信號之第一個每一最大值係每輸出資料區段被計算(降低取樣),且接著決定這些最大值之峰值。
基於所決定之最大值,一增益值可藉由倒轉所決定之最大值被計算。如果1係可被表示之最大信號值,倒轉所決定之最大值直接地獲得一增益因數。當該增益因數係施加至該(經過濾)峰值的最大值,該結果之值等於1、亦即該最大信號值。這意指施加該增益之每一聲頻樣本被保持低於1或等於1,如此避免對此資料區段之截割。如果1係該最大信號位準,1對應於0dBFS-分貝滿刻度記錄;大致上0dBFS被分派至該最大可能之位準。
代替僅只倒轉所決定之最大值,一增益值可藉由將一最大信號值(對應於0dBFS)除以與一資料區段有關所決定之最大值被計算。然而,比起一簡單之倒轉,該計算成本係較高的。
萬一轉碼,用於該第一聲頻編碼格式(輸入聲頻流之格式)及該第二聲頻編碼格式(輸出聲頻流之格式),該資料區段(例如區塊或資訊框)長度通常係不同的。例如於AAC中,一區塊典型包含128個樣本(於HE-AAC中:每區塊256個樣本),反之於杜比數位中,一區塊典型包含256個樣本。如此,當由AAC轉碼至杜比數位時,每區塊的樣本之數目增加。於AAC中,一資訊框典型包括1024個樣本(於HE-AAC中:每資訊框2048個樣本),其中於杜比數位中,一資訊框典型包括1536個樣本(6區塊)。如此,當由AAC轉碼至杜比數位時,每資訊框的樣本之數目亦增加。該動態範圍控制資料之粒化大多數係該區塊尺寸或該資訊框尺寸的其中之一。例如在用於該HE-AAC聲頻流的MPEG中之動態範圍控制元資料“DRC”與杜比數位中之增益元資料“dynrng”的粒化係該區塊尺寸。對比之下,杜比數位中之增益元資料“compr”與用於該HE-AAC聲頻流的DVB(數位視頻廣播)中之增益元資料“大量壓縮”的粒化係資訊框尺寸。
此外,用於該輸入聲頻流(例如32千赫、或44.1千赫)及該輸出聲頻流(例如48千赫)之取樣比率可為不同的,亦即該聲頻係重取樣。這亦變更該等進來資料區段及該等輸出資料區段間之長度關係。再者,該等進來及輸出資料區段不能被對齊。此外,應注意的是一輸入資料區段(例如區塊或資訊框)中所傳輸之元資料具有一動態範圍控制衝擊之區域(亦即該聲頻流中之一範圍,在此該增益值之施加具有影響),其通常未正如該資料區段一般大,但為較大的。這是由於所使用之轉變的疊加特性與由於該動態範圍控制通常被施加在該頻譜領域中之事實。同理對於該輸出聲頻流之動態範圍控制資料通常有效的。因此,用於決定哪一輸入增益值影響一給定輸出資料區段,吾人一可檢查輸入及輸出衝擊長度之重疊(取代考慮該輸入及輸出資料區段之重疊),如將在稍後詳細說明者。
由於上面所討論之理由,該動態範圍控制資料之轉碼將考慮一輸出動態範圍控制值可被超過一個之進來動態範圍控制值所影響。於此案例中,當轉碼該資料流時,該動態範圍控制資料之重取樣(裝上新框架)可被施行。
因此,該方法可包括重取樣源自該第一聲頻流之所接收聲頻元資料的增益值之步驟。當該第一聲頻流之一資料區段涵蓋比該第二聲頻流的一資料區段較短之時間長度時,該等增益值被降低取樣。
一被重取樣之增益值可藉由計算複數連續增益值之最小值所決定。換句話說:由若干輸入動態範圍控制增益(其係有關聯的用於一輸出資料區段),該最小者被選擇。用於此之動機係儘可能多地保存該等進來值(萬一該等值不會導致於信號截割)。然而,既然該等增益值必需被重取樣,這通常係不可能的。因此,選擇該最小增益值,其傾向於減少該信號振幅。然而,該信號振幅之此減少被當作較不顯著或麻煩的。較佳地是,此最小值係每輸出資料區段所決定。
如果沒有關於動態範圍控制之增益元資料係存在於該第一聲頻流中,該方法較佳地是加入足以用於保護免於該第二聲頻流(輸出聲頻流)中之截割的增益值。較佳地係限制這些增益值,以致它們不會超過1之增益。用於防止該等增益值免於超過1之理由係該信號將不會被不需要地增強,以變得接近該截割邊界。
如此,如果一個別之經計算第二增益值具有低於1之增益,該個別加入之增益值對應於該經計算之第二增益值。如果一個別之經計算第二增益值係高於1,該個別加入之增益值被設定至1之增益。
該申請案之第二態樣有關一提供保護免於源自數位聲頻資料的聲頻信號之信號截割的設備。該設備被組構成執行如上面討論之方法。該等設備之特色對應於如上面討論的方法之特色。據此,該設備包括用於決定基於所接收之聲頻元資料的第一增益值是否足以用於保護免於該聲頻信號的截割之機構。再者,如果該等第一增益值係不足夠的,該設備包括用於以一足以保護免於該聲頻信號之截割的增益值取代第一增益值之機構。
較佳地是,該決定機構包括用以基於該數位聲頻資料計算第二增益值之機構,在此該第二增益值係足以用於該聲頻信號之截割保護。更較佳地是,該決定機構亦包括比較機構,用於比較基於所接收之聲頻元資料的第一增益值及該等經計算之第二增益值。於其間之相依中,由該等第一增益值及該經計算之第二增益值選擇增益值。
有關該申請案之第一態樣的上面之說法係亦適用於該申請案之第二態樣。
該申請案之第三態樣有關一轉碼器,在此該轉碼器被組構成將一聲頻流由第一聲頻編碼格式轉碼成第二聲頻編碼格式。該轉碼器包括根據該申請案之第二態樣的設備。較佳地是,該轉碼器係接收該第一聲頻流之接收裝置的一部份,在此該第一聲頻流係一數位廣播信號,例如一數位電視信號(例如DVB-T、DVB-S、DVB-C)或一數位收音機信號(例如DAB信號)之聲頻流。例如,該接收裝置係一機頂盒。該聲頻流亦可經由該網際網路(例如網際網路電視或網際網路收音機)被廣播。另一選擇係,該第一聲頻流可為由例如DVD(多功能數位碟片)或藍光光碟之數位資料儲存媒體讀取。
有關該申請案之第一及第二態樣的上面之說法係亦適用於該申請案之第三態樣。
AAC/HE-AAC及杜比數位/杜比數位+支援元資料之概念,更明確地是承載一時變增益之增益字詞,以於解碼期間選擇性地施加至該聲頻資料。為著要減少該資料之目的,這些增益字詞典型係每資料區段、例如每區塊或資訊框僅只傳送一次。於該等聲頻格式中,這些增益字詞係選擇性的,亦即其在技術上可能不傳送該資料。杜比數位及杜比數位+編碼器典型傳送該等增益字詞,反之AAC及HE-AAC編碼器通常不傳送該等增益字詞。然而,傳送該等增益字詞的AAC及HE-AAC編碼器之數目正增加。該申請案允許接收一聲頻流之解碼器或轉碼器於兩狀態中做‘‘正確之事”。如果聲頻增益字詞被提供,“該正確之事”將為盡可能如實地處理所接收之聲頻增益字詞,但當該等進來之增益字詞不提供足夠之衰減以例如萬一降混防止信號截割時超越它們。如果沒有提供增益值,“該正確之事”將為計算及提供防止信號截割之增益值。
圖1顯示一轉碼器之具體實施例,使該轉碼器提供保護免於信號截割,尤其萬一降混(例如由5.1通道信號降混至2通道信號)保護免於截割。該轉碼器接收一包括聲頻元資料之數位聲頻流1。例如,該數位聲頻流係AAC或HE-AAC(HE-AAC第一版或HE-AAC第二版)數位聲頻流。該數位聲頻流可為例如DVB-T、DVB-S、DVB-C流之DVB視頻/聲頻流的一部份。該轉碼器將所接收之聲頻流1轉碼成一輸出聲頻流14,其係在一不同格式中被編碼,例如杜比數位或杜比數位+。典型地,杜比數位解碼器支援多通道信號之降混,且假設所接收之杜比數位元資料中所包括的時變增益包跡包括降混截割保護。不幸地是,位元聲頻流1(例如AAC/HE-AAC位元聲頻流)不須包含時變增益包跡元資料,且甚至萬一承載此資料,該資料是否包括截割保護係不清楚的。該轉碼器防止一接收裝置(於該轉碼器之下游)中之解碼器(例如一杜比數位解碼器)產生輸出信號,該輸出信號包含當降混該信號時之截割人工因數。該轉碼器確保該輸出聲頻流14含有包括降混截割保護的時變增益包跡元資料。
於圖1中,單元2讀取在聲頻流1的聲頻元資料中所包含之動態範圍控制增益值3。選擇性地,增益值3係進一步在單元5中處理,例如該增益值3根據該經轉碼之輸出聲頻流14的資料區段時序被重取樣及轉碼。元資料增益值之重取樣及轉碼被討論在2007年10月5-8日呈現在紐約聲頻工程協會會議論文之第123次會議、Wolfgang Schildbach等人的文件“動態範圍控制係數及另一元資料之轉碼成MPEG-4 HE AAC”中。此論文之揭示內容、尤其用於元資料增益值之重取樣及轉碼的概念係以引用的方式併入本文中。此外,在2008年9月30日,該申請人提出美國臨時專利申請案第61/101497號,具有該標題“聲頻元資料之轉碼”,使該美國臨時專利申請案有關元資料增益值之重取樣及轉碼。此申請案之揭示內容、尤其用於元資料增益值之重取樣及轉碼的概念係以引用的方式併入本文中。
與重取樣同時的,聲頻流1中之聲頻資料典型係藉由一解碼器6成PCM(脈碼調變)聲頻資料。該被解碼之聲頻資料7包括複數平行之信號通道、例如萬一5.1通道信號為6信號通道,或萬一7.1通道信號為8信號通道。
一計算單元8基於聲頻資料7決定被計算之增益值9。該等被計算增益值9係足以用於在該轉碼器下游的接收裝置中保護免於信號截割,該接收裝置接收該經轉碼之聲頻流,尤其當降混該接收裝置中之信號時。此裝置可為一AVR或一電視機。該等被計算增益值將保證該被降混之信號最大抵達0dBFS或更少。源自聲頻流1中之元資料的增益值4及被計算增益值9係在單元10彼此比較。單元10輸出增益值11,如果增益值流4之個別增益值係不足以防止該接收裝置中之信號截割,在此增益值流4之一增益值係以一源自增益值流9之增益值所取代。同時,聲頻資料7係藉由編碼器12編碼成一輸出聲頻編碼格式,例如杜比數位或杜比數位+。該被編碼之聲頻資料及增益值11係在單元13中組合。該結果之聲頻流提供聲頻增益元資料,其防止信號截割,尤其用於信號降混之案例。
大致上,進入之聲頻增益元資料應被儘可能多地保存,只要該增益元資料提供保護免於信號截割。於大部份案例中,該輸入聲頻流(看圖1中之1)的一資料區段(例如區塊或資訊框)之長度及該輸出聲頻流(看圖1中之14)的一資料區段(例如區塊或資訊框)之長度係不同的。再者,該輸入聲頻流之一資料區段的開頭與該輸出聲頻流之一資料區段的開頭典型係未對齊的(縱使該等資料區段長度係完全相同)。如此,一由進入元資料至輸出元資料之映射典型係需要的。
圖2說明一用於映射進來元資料至輸出元資料之較佳方式。如稍早所討論,每一資料區段(例如區塊或資訊框)典型地具有動態範圍控制資料(或複數增益值、例如8個增益值)之一增益值。然而,靠著一輸入資料區段(例如區塊或資訊框)所傳輸之元資料具有一動態範圍控制衝擊之區域(亦即該聲頻流中之一範圍,在此該增益值之施加具有影響),其通常未正如該資料區段一般大,但為較大的。這是由於所使用之轉變的疊加特性(亦即使用大於該資料區段之窗口,且該等窗口重疊),與由於該動態範圍控制通常被施加在該頻譜領域中之事實。同理對於該輸出聲頻位元流之動態範圍控制資料通常有效的。於圖2中,該等實線標示該輸入流中之資料區段20-23的開頭及末端,與該輸出流中之資料區段24-26的開頭及末端。於圖2中,一增益值的動態範圍控制衝擊30-33及34-36之每一區域延伸超出該個別資料區段之開頭及末端。衝擊30-33及34-36之每一區域係藉由該等虛線所指示。
例如於HE-AAC中,該區塊尺寸係256個樣本,反之一用於解碼的窗口具有512個樣本。512個樣本之整個窗口可被當作一衝擊之區域:然而,與在該窗口之中間的衝擊作比較,在該等窗口之外部邊緣,該增益值之衝擊係較小的。如此,衝擊之區域亦可被當作該窗口的一部份。該衝擊之區域可為選自該區塊/資訊框尺寸(在此:256個樣本)直至該窗口尺寸(在此:512個樣本)之若干樣本。較佳地是,所使用之衝擊區域係大於該資料區段(區塊或資訊框)之尺寸。
用於決定哪一輸入動態範圍控制值影響一給定之輸出資料區段,其較佳的是檢查輸入及輸出衝擊區域之重疊(取代檢查該輸入及輸出資料區段之重疊)。於圖2中,其係決定該輸入流中之衝擊30-33的哪一區域與一給定輸出資料區段24-26之衝擊34-36的區域重疊。例如,該輸出流中之資料區段24的衝擊34之區域與該等區域30、31、32及33重疊。因此,較佳地是,當決定所示輸出流中之第一資料區段24的增益值時,考慮與四資料區段20、21、22及23有關之增益值。該第一資料區段24被該4輸入資料區段20-23所影響。另一選擇係,該方法可檢查該等輸入衝擊區塊及該輸出信號區段之重疊,或該等輸入資料區段及該輸出資料區段之重疊。
此映射或重取樣過程可在圖1的單元5中進行,該單元5接收該輸入流1之增益值3,且將該等增益值3之一或多個映射至一增益值4。
圖3說明用以基於所接收之聲頻資料決定峰值的區塊50之具體實施例。此峰值決定區塊50可為圖1中之區塊8的一部份。基於包括複數通道(在此5.1通道信號之5通道,該低頻效應通道不被考慮)的被解碼之多通道聲頻資料7,降混係根據一或多個降混方案(亦即根據一或多個降混矩陣)施行。應注意的是該轉碼器全然不知降混是否在該接收裝置中施行,且哪一降混方案係接著被使用於該接收裝置中。如此,如果一多通道信號係透過離散之通道播放、或如果施行根據數個方案之一的降混,其係未知的。該轉碼器模擬所有案例及決定該最壞案例。
於圖3中之範例中,根據該Lo/Ro降混方案之降混係在區塊41中施行,根據該Pro Logic(PL)降混方案之降混係在區塊42中施行,且根據該Pro Logic II(PL II)降混方案之降混係在區塊43中施行。該PL降混方案及該PL II降混方案係Lt/Rt降混方案之二變體,如在此之前所討論者。每一降混方案輸出一右側通道信號及一左側通道信號。然後,在降混之後,計算該等信號之絕對值(看圖3中之區塊44)。較佳地是,該多通道聲頻信號7之各種通道的絕對樣本值亦被計算(看用於決定該等絕對值之區塊40)。在異於降混之另一案例中,例如如果該信號稍後被增強達一額外之增益(例如萬一該RF模式為11分貝增益,如以後討論者),亦考慮該等通道之絕對值(沒有降混)係有助於防止信號截割。
在一時間於區塊45中計算該絕對值之最大值(=峰值)。計算該最大值係連續地施行,藉此產生一道峰值46。由於不同之信號處理,各種樣本具有不同信號延遲可為可能的此等不同之信號延遲可被對齊(未示出)。該等樣本值之最大值指示一信號用於所有案例能具有之最大振幅,且如此這是該最壞案例,考慮該截割保護演算法。該轉碼器如此在一時間模擬該接收裝置中之信號的最壞案例振幅。一達成保護免於截割之動態範圍控制值將以其最大抵達0dBFS之方式衰減(或增強)該信號。
應注意的是基於比圖3所說明更少之絕對值(例如沒有考慮該等未降混通道之絕對值)、或基於圖3中未示出之額外絕對值(例如其它降混方案之絕對值),該區塊50可決定一峰值。另一選擇係,其係可能降混該等通道7,而沒有決定一峰值:例如該二結果之通道可被組合,且該組合之信號被進一步處理(取代使用如藉由區塊45所輸出之峰值46)。
峰值46之進一步處理被指示在圖4中。藉由相同參考符號所標示的圖1及4中之象徵性元件根本上是相同的。峰值46於單元60中遭受一編塊及最大值組合之步驟。在此,該最高峰值被決定用於一給定輸出資料區段(例如一區塊)。換句話說:該等峰值係藉由對於一輸出資料區段由複數峰值選擇該最高峰值而降低取樣。應注意的是不只對應於一輸出區段中之信號樣本的連續峰值較佳地是被考慮用於決定該最大值。反之,亦將影響一給定資料區段的額外(之前與稍後)之峰值亦被考慮,亦即在一解碼窗口之開頭及末端有關信號樣本的峰值。較佳地是,該窗口之所有樣本被考慮。
此取樣之結果係根據該公式C=1/X在區塊61倒轉,在此C意指一被計算之增益值9,且X意指用於該輸出流14之區塊的個別之最高峰值。該結果C係一因數(增益),當該增益係施加至該個別之聲頻樣本時,其保證該資料區段(例如區塊)之每一聲頻樣本係低於或等於該最大信號位準1(對應於0dBFS)。這避免對於此資料區段截割,應注意的是該最大信號位準意指該經轉碼聲頻流的接收器中之信號的最大信號位準;如此,在區塊60之輸出,該振幅可為高於1(當C<1時)。
該計算增益C係防止截割的最大可容許之增益;一比該計算增益C較小之增益值亦可被使用(於此案例中,該結果之信號甚至較小)。應注意的是如果該增益C係低於1,該增益C(或一較小之增益)必需被施加,以別的方式該信號將至少在該最壞案例情節中截割。
於區塊5中,來自該元資料之進來增益值3同樣遭受一重取樣。由有關用於一輸出資料區段之若干進來增益,該最小增益被選擇及使用供進一步處理。較佳地是,該重取樣係如關於圖2所討論地施行:用於決定哪一進來增益值係與一輸出資料區段有關,該輸入及輸出衝擊區域之重疊被考慮。如果一進來資料區段之衝擊區塊與一給定輸出資料區段之衝擊區塊重疊,當決定該最小增益值時,該進來資料區段被考慮(且如此考慮其之增益值)。替代地,亦有關圖2所討論之二種另一選擇方式可被使用。
用於此之動機係保存該等進來值。然而,既然該等增益值必需根據該輸出流之時序被重取樣,這是不可能的。由複數連續增益值使用該最小增益值傾向於減少該信號振幅,其被視為在如較不顯著或麻煩之趨勢。
如果有關動態範圍控制資料係存在於該進來資料流1中,此增益(較佳地是在區塊5中之重取樣之後)及足以用於截割保護的被計算增益值9間之比較係於區塊10中完成。區塊62決定一被重取樣之增益值4及一被計算增益值9間之最小值,使該較小之增益值被用作該輸出增益值(區塊62形成一最小值選擇器)。
如果沒有進來增益值存在,圖4中之切換器63將切換至該上方位置,以區塊62接著決定1之增益及該被計算增益值間之最小值,使該較小增益值被用作該輸出增益值,如此,如果沒有進來增益值存在,該輸出增益值被限制於1之最大增益。
下表說明比較區塊10之操作。在此,“I”一詞標示該進來動態範圍控制增益4(在重取樣之後),且“C”一詞標示該經計算之增益9。
如果I及C兩者係較小或等於1,取該最小值。這意指無論I是否已經保證截割保護,其將被C所取代。
如果C>1及I≦1,該信號可被增強,且仍然將不會截割。該進來聲頻流雖然要求衰減,例如實現動態範圍限制目的,及如此I被保存(於此案例中,I係I與C之最小值)。
如果I>1及C≦1,該進來值將破壞截割保護,且如此取C(於此案例中,C係I與C之最小值)。
如果I及C兩者係大於1,該輸入將被增強。只要仍然沒有截割發生,此增強被允許,且如此使用I及C之較小者。
如果沒有進來動態範圍值存在,只要C≦1,藉由使用C確保截割保護。如果C>1,該信號將不被修改(亦即該信號將不會不需要地增強至接近該截割邊界)。故單一被取為該輸出增益。於兩案例中,當沒有進來增益值存在時,1及C之最小值被使用(取代I及C間之最小值)。
圖5以流程圖之形式說明該輸出增益值11之選擇。其係決定一增益值I是否存在(看圖5中之參考130)。如果一增益值I目前係存在,該輸出增益值視該進來增益值I及該被計算增益值C之值而定。如果I≦1及C≦1,該選擇之增益值對應於I及C之最小值(看參考131)。如果I≦1及C>1,該選擇之增益值對應於I(看參考132)。如果I>1及C≦1,該選擇之增益值對應於C(看參考133)。如果I>1及C>1,該選擇之增益值對應於I及C之最小值(看參考134)。應注意的是在所有這些四案例中,該輸出值仍然對應於I及C之最小值。如此,其係不需要決定I及C是否≦1。
如果目前沒有增益值I存在,該輸出增益值視該計算增益值C之值而定。如果C≦1,該輸出增益值對應於C(看參考135)。如果C>1,該輸出增益值對應於1(看參考136)。應注意的是於兩案例中,該輸出值仍然對應於1及C之最小值。如此,其係不需要決定C是否≦1。
如上面所討論之具體實施例達成該進來動態被保存及僅只如果截割將發生,該動態被修改以防止截割。如果沒有動態範圍控制值存在,足夠之動態範圍控制值被加至該聲頻流,以防止截割。該等模式間之切換同時與平順地工作,藉此減輕任何人工因數。
圖6說明對圖4中之具體實施例的另一選擇。藉由相同參考符號所標示的圖4及6中之象徵性元件根本上是相同的。於圖6中,用於該線模式及該RF模式的二不同模式之分開增益元資料被接收及轉碼。於圖6中之具體實施例中,用於該RF模式及該線模式之不同增益字詞被計算,因為它們使用二不同型式之元資料。該線模式元資料涵蓋一較小範圍之值,且更通常被傳送(典型每區塊一次),反之該RF模式元資料涵蓋一較大範圍之值,且通常更少被傳送(典型每資訊框一次)。於該RF模式中,當透過一動態地很有限之通道(例如經由一類比RF天線連線自一機頂盒至一電視之RF輸入)傳輸該信號時,該信號被升高達11分貝之額外增益,其允許一較高之信噪比。再者,既然該RF模式增益元資料比該線模式之增益元資料涵蓋一更廣範圍之值,該RF模式允許較高之動態範圍壓縮。用於該線模式之增益元資料係標示為“DRC”(看參考記號3),反之用於該RF模式的增益元資料係標示為“compr”(看參考記號3')。請注意於DVB中,用於該RF模式之增益元資料係標示為“壓縮”或“大量壓縮”。再者,圖6中之具體實施例亦考慮一程式參考位準(PRL),其可當作該元資料的一部份被傳輸。該PRL指示該聲頻內容的一參考響度(例如於HE-AAC中,該PRL能於0分貝及-31.75分貝之間變化)。PRL之施加將該聲頻之響度降低至一界定之目標參考位準。於該聲頻編碼格式之相依中,用於該參考之其它術語係共通的,例如對話位準、對話規格化或dialnorm。
於圖6中,在所接收之PRL的相依性上,用於一資料區塊之最高峰值(如藉由單元60所產生)係於單元70中調整位準(通常,該位準被該PRL所減少)。用於計算與該線模式有關之增益值,該等位準調整樣本係在區塊61中倒轉,藉此產生被計算之增益值,如果該聲頻信號係於該接收器藉由該PRL所調整,該等被計算之增益值保證該區塊之每一聲頻樣本係低於或等於該最大信號位準1。區塊5中之進來DRC資料3的重取樣、及該被重取樣之增益值4與該等被計算增益值的比較係與圖4完全相同。
既然於該接收器中,萬一使用該RF模式,該信號亦被增強達11分貝,用於計算與該RF模式有關之增益值,該等位準調整樣本係在區塊71中被增強達11分貝。該轉碼器如此模擬該接收裝置中之信號的最壞情況振幅。該等升高之樣本係在區塊61'中被倒轉,藉此產生用於該RF模式之計算增益值,如果該聲頻信號係於該接收器中藉由該PRL調整及升高達11分貝,其保證該區塊之每一聲頻樣本係低於或等於1(=最大信號振幅)。
圖6中之具體實施例較佳地是被用於一轉碼器,並輸出一杜比數位聲頻流(例如HE-AAC至杜比數位轉碼器或AAC至杜比數位轉碼器)。根據杜比數位,於該線模式中,每一編碼區塊具有一“DRC”(動態範圍控制)增益值,反之於該RF模式中,每一資訊框(包括6個區塊)具有一“compr”增益值。雖然如此,兩型式之增益值有關動態範圍控制。用於該RF模式之被計算增益值係於區塊73中由該編塊率至該編框率降低取樣。區塊73決定用於總數6個連續區塊之計算增益值的最小值,使每一最小值分派至用於該整個資訊框之被計算增益值72。以此一決定用於一輸出資訊框之最小值的方式,該等進來compr增益值3'於區塊5'中之重取樣與於區塊5中之重取樣不同。該等被重取樣增益值4'及該經計算之以資訊框為基礎的增益值72之比較係與之前所討論者相同。
萬一降混,於圖6之具體實施例中不只提供保護免於截割,而且於該RF模式中當施加11分貝之額外增益時免於信號截割(在其它方面,該11分貝升高之信號可截割,甚至當未使用信號降混時)。因此,其有利的是亦於區塊50中考慮沒有降混的通道之絕對值。
應注意的是如果沒有PRL被接收,較佳地是,該PRL被設定至一預設值。
用於計算增益值,一平滑化級可被使用。圖7顯示一平滑化級80之具體實施例,其可被放置在區塊50之輸出及區塊61及61'的輸入間之路徑中的任何位置。較佳地是,平滑化級80被放置在區塊50之輸出,藉此基於該等峰值46產生被平滑化峰值46'。平滑化級80提供一用於平滑化級之輸入信號、例如該峰值信號的低通濾波器。其目的係在踢入該截割保護之後改良該成聲印象:在一截割保護時期之後的閃避增益之直接釋放將聽起來惱人的。如此,如在限制器設備被廣泛地做成,該峰值信號(及藉此所衍生的增益信號;看下面)係以第一階低通濾波器濾波,其較佳地是在200毫秒之時間常數τ操作。如果一新輸入值要求比該平滑化信號將達成較高之程度的截割保護(既然該新輸入值係高於該被平滑化之信號),其繞過該平滑化級及馬上生效。於此案例中,該上輸入係大於圖7中之最大值計算區塊81的下輸入。
較佳地是,圖3-7中之具體實施例係聲頻轉碼器的一部份,例如由AAC及/或HE-AAC至杜比數位,或由杜比E或杜比數位至AAC及/或HE-AAC。然而,應注意的是圖3-7中之具體實施例不須為聲頻轉碼器的一部份。這些具體實施例可為接收該進來聲頻流1及施加該修改增益值(沒有轉碼)之裝置的一部份。該等修改之增益值可被直接地用於調整該接收聲頻流之增益。例如圖3-7中之具體實施例可為AVR或電視機的一部份。
圖8說明用於提供降混保護的另一選擇具體實施例。該設備接收包含於聲頻元資料或源自聲頻元資料之進來增益字詞90。增益字詞90可對應於圖1及4中之增益值3或4。再者,該設備接收聲頻樣本91(例如PCM聲頻樣本)。例如,該聲頻樣本91可為峰值,如藉由圖3中之區塊50所產生者。如果該等聲頻樣本91不是絕對值,該等聲頻樣本91之絕對值可在此之前被決定。於區塊92中,最大允許增益值gainmax (t)係藉由根據以下方程式之除法所計算:
在此,該signalmax,allowed 一詞標示該最大允許信號振幅,例如signalmax,allowed =1。該signal(t)標示該目前聲頻樣本91。
於區塊93中,該最大允許增益值gainmax (t)被限制於1之最大增益:如果一值gainmax (t)係高於1,則gainmax (t)將被設定至1。然而,如果一值gainmax (t)係低於1或等於1,該值將不會被修改。
區塊93之輸出被餵入至一平滑化過濾級94。平滑化過濾級94包含一低通濾波器及一最小值選擇器95,該最小值選擇器選擇其二輸入之最小值。該操作係類似於圖7中之平滑化過濾級80。然而,既然該過濾級94替代聲頻樣本平滑化增益值,在此替代一最大值選擇器81使用一選擇器95(該等增益值係藉由倒轉聲頻樣本所得到)。當被放置在區塊92上游時,一平滑化過濾級80可替代地被使用(其藉由倒轉決定增益值)。類似地,當被放置在區塊61及/或61'下游時,平滑化過濾級94可被使用於圖4及5(既然區塊61及/或61'下游之增益信號被處理)。萬一該增益值在區塊93突然增加(在其它方面,該聲頻可聽起來惱人的),平滑化過濾級94平滑化該信號斜度。對比之下,平滑化過濾級94讓該增益信號通過,而萬一該增益值突然減少沒有平滑化(在其它方面,該信號將截割)。在平滑化過濾級95之輸出的計算增益信號96係與最小值選擇器97中之進來增益字詞90比較。該實際被計算增益值96及該實際進來增益字詞90之最小值被傳給最小值選擇器97之輸出。在最小值選擇器97之輸出的增益值98提供降混保護,並可被嵌入在一經轉碼之聲頻流中,如之前所討論者。
應注意的是圖8中之具體實施例不須為聲頻轉碼器的一部份。該等輸出增益值可被直接地用於調整所接收之聲頻流的位準。於此案例中,圖8之設備可為AVR或電視機的一部份。
再者,圖8中之具體實施例可被用來防止信號截割,而沒有考慮降混。例如,圖8中之具體實施例可接收傳統PCM聲頻樣本91,而不會進一步於區塊50中預先處理。於此案例中,當PCM樣本91係藉由該等輸出增益值所放大時,圖8中之具體實施例防止截割。
圖9說明另一選擇具體實施例。藉由相同參考符號所標示的圖8及9中之象徵性元件根本上是相同的。對比於圖8中之具體實施例,圖9中之具體實施例係一像圖4及6中之體實施例的方塊關連之操作版本,在此僅只一除法係每信號區塊施行(或任何其他像資訊框之資料區段)。這減少每時間之除法的數目。如已經有關圖8討論者,聲頻樣本91可被圖3之區塊50所產生。如果該等聲頻樣本91不是絕對值,該等聲頻樣本91之絕對值可在之前被決定(在圖9中未示出)。該等聲頻樣本91係接著餵入至一平滑化過濾級80,其對應於圖7中之平滑化過濾級80。對比於圖8,平滑化過濾級80處理聲頻樣本,替代增益樣本。如此,平滑化過濾級80使用一最大值選擇器81替代一最小值選擇器95。在平滑化之後,每聲頻區塊的樣本之最大值係在單元100中決定。然後,該最大值係在區塊101中倒轉,藉此計算每區塊之最大可容許增益。此增益值係比較於最小值選擇器97中之目前增益值90,使兩值之最小值被傳給最小值選擇器97之輸出。在最小值選擇器97之輸出,該等增益值98提供降混截割保護,且可被嵌入在一經轉碼之聲頻流中,如之前所討論者。圖9中之具體實施例可被修改,以當沒有進來之增益值90存在時,用類似方式產生一增益值98:如果沒有進來之增益值90存在,且該經計算之增益係小於或等於1,該被計算之增益值係輸出。如果該被計算增益值係大於1(且沒有進來之增益值90存在),一具有1之增益的增益值被輸出。這可被圖6之額外切換器63所實現,使該切換器切換於該進來增益值90及1之增益之間,而與該進來之增益值90的存在相依。
應注意的是如之前所討論之具體實施例對應於一限制器,其有關出自一不同壓縮器情況之增益值。
圖10說明一接收如藉由圖1之轉碼器所產生的經轉碼之聲頻流14的接收裝置。區塊121由該聲頻流14分開該等增益值11。該接收裝置另包括一產生被解碼聲頻信號120之解碼器110。該被解碼聲頻信號120之振幅係在區塊112中藉由如源自於圖1之增益值11被調整。如果一選擇性降混係在區塊113中施行,既然該等增益值11係足以防止信號截割,萬一降混,該輸出信號114不會截割。該被解碼聲頻信號120之振幅可藉由該PRL(未示出)被進一步調整。如果該等增益值11在該RF模式中亦考慮11分貝升高,如關於圖6所討論者,該聲頻信號120亦可被升高達11分貝,而沒有截割(如果信號降混與如果無信號降混兩者)。
1...數位聲頻流
2...單元
3...增益值
3'...增益值
4...增益值
4'...增益值
5...單元
5'...區塊
6...解碼器
7...聲頻資料
8...計算單元
9...增益值
10...單元
11...輸出增益值
12...編碼器
13...單元
14...輸出聲頻流
20...資料區段
21...資料區段
22...資料區段
23...資料區段
24...資料區段
25...資料區段
26...資料區段
30...控制衝擊
31...控制衝擊
32...控制衝擊
33...控制衝擊
34...控制衝擊
35...控制衝擊
36...控制衝擊
40...區塊
41...區塊
42...區塊
43...區塊
44...區塊
45...區塊
46...峰值
46'...峰值
50...區塊
60...單元
61...區塊
61’...區塊
62...區塊
63...切換器
70...單元
71...區塊
72...增益值
73...區塊
80...平滑化級
81...最大值計算區塊
90...增益字詞
91...聲頻樣本
92...區塊
93...區塊
94...過濾級
95...最小值選擇器
96...增益值
97...最小值選擇器
98...增益值
100...單元
101...區塊
110...解碼器
112...區塊
113...區塊
114...輸出信號
120...聲頻信號
121...區塊
本發明係在下面以示範方式參考所附圖面說明,其中
圖1說明一提供截割保護的轉碼器之具體實施例;
圖2說明一用於元資料之裝上新框架的較佳方式;
圖3說明一用以基於所接收之聲頻資料決定峰值之具體實施例:
圖4說明一用於合併進來動態範圍控制資料與足以用於截割保護之計算增益值的具體實施例;
圖5說明該等輸出增益值之選擇;
圖6說明用於合併進來動態範圍控制資料與足以用於截割保護之計算增益值的另一選擇具體實施例;
圖7說明一平滑化過濾級之具體實施例;
圖8說明用於提供截割保護之另一具體實施例;
圖9說明用於提供截割保護之又另一具體實施例;及
圖10說明一接收該經轉碼之聲頻流的接收裝置。
1...數位聲頻流
2...單元
3...增益值
4...增益值
5...單元
6...解碼器
7...聲頻資料
8...計算單元
9...增益值
10...單元
11...輸出增益值
12...編碼器
13...單元
14...輸出聲頻流

Claims (35)

  1. 一種對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法,該方法包括:決定基於嵌入第一數位聲頻流之聲頻元資料的第一增益值是否足以保護免於該聲頻信號之截割;及如果第一增益值係不足夠的,用一足以保護免於該聲頻信號之截割的增益值取代該個別之第一增益值,其中該決定之步驟包括以下步驟:基於該數位聲頻資料計算第二增益值,該等第二增益值足以用於該聲頻信號之截割保護;及比較基於所接收之聲頻元資料的該等第一增益值與所計算之第二增益值。
  2. 如申請專利範圍第1項之方法,其中計算第二增益值之步驟包括:決定最大可容許之增益值。
  3. 如申請專利範圍第1項之方法,其中在該比較步驟上之從屬中,增益值係選自該等第一增益值及該等經計算之第二增益值,在此以一增益值取代係藉由選擇第二經計算之增益值所施行。
  4. 如申請專利範圍第3項之方法,其中選擇一對第一及第二增益值之最小值。
  5. 如申請專利範圍第1項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成 以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於聲頻信號之截割的取代增益值、或具有源自彼之增益值。
  6. 如申請專利範圍第1項之方法,其中該聲頻信號係一經降混之聲頻信號,且該方法提供該經降混信號免於信號截割之保護。
  7. 如申請專利範圍第1項之方法,其中決定第一增益值是否足以用於保護之步驟包括以下步驟:根據至少第一降混方案降混該數位聲頻資料。
  8. 如申請專利範圍第7項之方法,其中決定第一增益值是否足以用於保護之步驟包括以下步驟:計算峰值,其中一峰值係藉由一次決定至少二聲頻信號之絕對值的最大值所計算,該至少二聲頻信號選自以下之組群:在降混之後根據該第一降混方案的一或多個聲頻信號,在降混之前的一或多個聲頻信號,及在降混之後根據第二降混方案的一或多個聲頻信號。
  9. 如申請專利範圍第1項之方法,其中決定第一增益值是否足以用於保護之步驟包括以下步驟:決定源自該數位聲頻資料之複數連續信號值的最大值。
  10. 如申請專利範圍第9項之方法,其中決定第一增 益值是否足以用於保護之步驟包括以下步驟:計算峰值,其中一峰值係藉由一次決定至少二聲頻信號之絕對值的最大值所計算,該至少二聲頻信號選自以下之組群:在降混之後根據第一降混方案的一或多個聲頻信號,在降混之前的一或多個聲頻信號,及在降混之後根據第二降混方案的一或多個聲頻信號,及其中該複數連續之信號值對應於連續之峰值或連續之經過濾峰值。
  11. 如申請專利範圍第9項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中該第二聲頻流被編組於資料區段中,及決定與該第二聲頻流的一區段有關之複數信號值的最大值。
  12. 如申請專利範圍第9項之方法,其中一最大信號值係除以所決定之最大值。
  13. 如申請專利範圍第9項之方法,其中 所決定之最大值被倒轉。
  14. 如申請專利範圍第1項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中該第一聲頻流被編組於資料區段中,至少一增益值係以該第一聲頻流之資料區段所接收,該第二聲頻流被編組於資料區段中,及該方法另包括該步驟:重取樣該第一聲頻流之增益值。
  15. 如申請專利範圍第1項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中該第一聲頻流被編組於資料區段中,至少一增益值係以該第一聲頻流之資料區段所接收, 該第二聲頻流被編組於資料區段中,該方法另包括該步驟:決定該第一聲頻流之複數連續增益值的最小值。
  16. 如申請專利範圍第15項之方法,其中該複數連續增益值之每一個具有衝擊區,且這些增益值之衝擊區與第二聲頻流中之增益值的衝擊區重疊。
  17. 如申請專利範圍第1項之方法,其中如果沒有與動態範圍控制有關之元資料存在於該第一聲頻流中,加入足以用於保護免於該聲頻信號之截割的增益值。
  18. 如申請專利範圍第17項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中如果沒有與動態範圍控制有關之元資料存在於該第一聲頻流中,足以用於保護免於該聲頻信號之截割的增益值被加入該第二聲頻流中。
  19. 如申請專利範圍第17項之方法,其中所加入之增益值之最大增益被限制於1。
  20. 如申請專利範圍第19項之方法,該方法包括基於該數位聲頻資料計算第二增益值之步驟,該等第二增益值足以用於該聲頻信號之截割保護,其中 如果一個別之經計算的第二增益值具有低於1之增益,該加入之增益值對應於該經計算之第二增益值;及如果一個別之經計算的第二增益值具有高於1之增益,該加入之增益值對應於1之增益。
  21. 如申請專利範圍第1項之方法,其中一平滑化濾波器被用於產生該等第二增益值。
  22. 如申請專利範圍第1至21項之任一項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中該第一聲頻編碼格式係AAC或HE-AAC,及該第二聲頻編碼格式係杜比數位。
  23. 如申請專利範圍第22項之方法,其中該第一聲頻流係DVB視頻/聲頻流的一部份。
  24. 如申請專利範圍第8項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增 益值、或具有源自彼之增益值,且其中該第二聲頻流被編組於資料塊中,嵌入該第一聲頻流中之聲頻元資料包括指示該聲頻內容之響度的元資料,且基於該數位聲頻資料計算第二增益值,該等第二增益值足以用於該聲頻信號之截割保護,該等第二增益值之計算包括:決定用於該第二聲頻流的一資料塊之複數峰值的最大值;及依據在指示該聲頻內容之響度的元資料,位準調整該最大值,及比較基於所接收之聲頻元資料的第一增益值與所計算之第二增益值。
  25. 如申請專利範圍第24項之方法,其中指示該聲頻內容之響度的元資料係程式參考位準元資料。
  26. 如申請專利範圍第24項之方法,其中該第一聲頻流包括用於第一模式之增益元資料與用於第二模式之不同增益元資料,其中該第二模式允許比該第一模式較高之動態範圍壓縮;用於該第一模式之第二增益值係基於經位準調整之最大值所計算,用於該第一模式之第二增益值足以用於該第一模式中之截割保護;比較基於用在該第一模式所接收之聲頻元資料的增益 值與用在該第一模式所計算之第二增益值;用在該第二模式之第二增益值係藉由放大被位準調整之最大值達11分貝所計算,用在該第二模式之第二增益值足以用於該第二模式中之截割保護;比較基於用在該第二模式所接收之聲頻元資料的增益值與用在該第二模式之經計算的第二增益值。
  27. 如申請專利範圍第8項之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值,且其中該第二聲頻流被編組於資料塊中;該第一聲頻流包括用於第一模式之增益元資料與用於第二模式之不同增益元資料,其中該第二模式允許比該第一模式較高之動態範圍壓縮;用於該第一模式之第二增益值係基於最大值所計算,其中一最大值係用於該第二聲頻流的一資料塊之複數峰值的最大值,且其中用於該第一模式之第二增益值係足以用於該第一模式中之截割保護;比較基於用在該第一模式所接收之聲頻元資料的增益值與用在該第一模式所計算之第二增益值; 用在該第二模式之第二增益值係藉由放大該等最大值或其相依值達11分貝所計算,用在該第二模式之該等第二增益值足以用於該第二模式中之截割保護;及比較基於用在該第二模式所接收之聲頻元資料的增益值與用在該第二模式之經計算的第二增益值。
  28. 如申請專利範圍第26或27項之方法,其中用在該第二模式之第二增益值係藉由自一塊速率至一框速率之降低取樣所計算。
  29. 如申請專利範圍第28項之方法,其中該降低取樣係藉由對於總數為6連續塊段決定所計算增益值之最小值所施行。
  30. 一種對源自數位聲頻資料之聲頻信號的信號截割提供保護之設備,該設備包括:一決定機構,用於決定基於嵌入第一數位聲頻之聲頻元資料的第一增益值是否足以保護免於該聲頻信號之截割;及一取代機構,如果該第一增益值係不足以用於保護,用一足以保護免於該聲頻信號之截割的增益值取代第一增益值,其中該決定機構包括:一計算機構,用以基於該數位聲頻資料計算第二增益值,該等第二增益值足以用於該聲頻信號之截割保護;及一比較機構,用於比較基於所接收之聲頻元資料的該等第一增益值與所計算之第二增益值。
  31. 如申請專利範圍第30項之設備,其中該設備係轉碼器的一部份,該轉碼器被組構成將以第一聲頻編碼格式編碼之該第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,該第二聲頻流包括聲頻元資料,該聲頻元資料具有足以用於保護免於該聲頻信號之截割的取代增益值、或具有源自彼之增益值。
  32. 如申請專利範圍第30項之設備,其中該聲頻信號係一經降混之聲頻信號,且該設備提供該經降混信號免於信號截割之保護。
  33. 一種轉碼器,其組構成以將以第一聲頻編碼格式編碼之第一聲頻流轉碼成以第二聲頻編碼格式編碼之第二聲頻流,該轉碼器包括如申請專利範圍第30至32項之任一項的設備。
  34. 如申請專利範圍第33項之轉碼器,其中該第一聲頻流係一數位廣播信號。
  35. 一種對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法,其中該方法係在下述轉碼之過程中施行將以第一聲頻編碼格式編碼之第一聲頻流轉碼成以與該第一聲頻編碼格式不同之第二聲頻編碼格式編碼之第二聲頻流,且其中如果沒有與動態範圍控制有關之元資料存在於該第一聲頻流中,足以用於保護免於該聲頻信號之截割的增益值被加入該第二聲頻流中,藉由基於該第一聲頻流中所 包括之數位聲頻資料計算該些增益值。
TW098136170A 2008-10-29 2009-10-26 對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備 TWI416505B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10943308P 2008-10-29 2008-10-29

Publications (2)

Publication Number Publication Date
TW201042637A TW201042637A (en) 2010-12-01
TWI416505B true TWI416505B (zh) 2013-11-21

Family

ID=41508867

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098136170A TWI416505B (zh) 2008-10-29 2009-10-26 對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備

Country Status (9)

Country Link
US (1) US8892450B2 (zh)
EP (3) EP4293665A3 (zh)
JP (1) JP5603339B2 (zh)
CN (1) CN102203854B (zh)
BR (1) BRPI0919880B1 (zh)
ES (1) ES2963744T3 (zh)
RU (1) RU2468451C1 (zh)
TW (1) TWI416505B (zh)
WO (1) WO2010053728A1 (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2232700T3 (pl) 2007-12-21 2015-01-30 Dts Llc System regulacji odczuwanej głośności sygnałów audio
AR077680A1 (es) 2009-08-07 2011-09-14 Dolby Int Ab Autenticacion de flujos de datos
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
US9105300B2 (en) 2009-10-19 2015-08-11 Dolby International Ab Metadata time marking information for indicating a section of an audio object
US9508356B2 (en) * 2010-04-19 2016-11-29 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
CN101951504B (zh) * 2010-09-07 2012-07-25 中国科学院深圳先进技术研究院 基于重叠边界的多媒体切片转码方法和***
CN102005206B (zh) * 2010-11-16 2012-07-25 华平信息技术股份有限公司 多路音频帧的混音方法
TWI800092B (zh) * 2010-12-03 2023-04-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
US9171549B2 (en) 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
RU2586874C1 (ru) * 2011-12-15 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN112185400A (zh) * 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的***
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
CN102968995B (zh) * 2012-11-16 2018-10-02 新奥特(北京)视频技术有限公司 一种音频信号的混音方法及装置
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
BR112015017064B1 (pt) * 2013-01-21 2022-03-22 Dolby Laboratories Licensing Corporation Método, meio legível em computador e aparelho para otimizar o nível de intensidade do som e a faixa dinâmica através de dispositivos de reprodução diferentes
BR122022020319B1 (pt) * 2013-01-28 2023-02-28 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
CN110379434B (zh) 2013-02-21 2023-07-04 杜比国际公司 用于参数化多声道编码的方法
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
ME02623B (me) 2013-04-05 2017-06-20 Dolby Laboratories Licensing Corp Aparat za kompandovanje i metod za smanjenje šuma kvantizacije korišćenjem napredne spektralne ekstenzije
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP3044876B1 (en) 2013-09-12 2019-04-10 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
PL3522157T3 (pl) * 2013-10-22 2022-02-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9769550B2 (en) 2013-11-06 2017-09-19 Nvidia Corporation Efficient digital microphone receiver process and system
US9454975B2 (en) * 2013-11-07 2016-09-27 Nvidia Corporation Voice trigger
EP3451706B1 (en) 2014-03-24 2023-11-01 Dolby International AB Method and device for applying dynamic range compression to a higher order ambisonics signal
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
CN111326165B (zh) * 2014-03-25 2023-12-12 弗朗霍夫应用科学研究促进协会 音频编码器装置、音频解码器装置、及其操作方法
US10878828B2 (en) * 2014-09-12 2020-12-29 Sony Corporation Transmission device, transmission method, reception device, and reception method
FR3031852B1 (fr) * 2015-01-19 2018-05-11 Devialet Amplificateur a reglage de niveau sonore automatique
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
KR20160132574A (ko) * 2015-05-11 2016-11-21 현대자동차주식회사 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법
US10109288B2 (en) * 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US10015612B2 (en) 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
CN109005452A (zh) * 2018-10-09 2018-12-14 深圳市亿联智能有限公司 一种应用于智能机顶盒的串行混音方法
KR20210090096A (ko) 2018-11-13 2021-07-19 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호 및 연관된 메타데이터에 의해 공간 오디오를 표현하는 것
CN112153533B (zh) * 2020-09-25 2021-09-07 展讯通信(上海)有限公司 音频信号的破音消除方法及装置、存储介质、终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
WO2008100098A1 (en) * 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5821889A (en) * 1996-11-06 1998-10-13 Sabine, Inc. Automatic clip level adjustment for digital processing
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP2000181477A (ja) * 1998-12-14 2000-06-30 Olympus Optical Co Ltd 音声処理装置
US6675125B2 (en) * 1999-11-29 2004-01-06 Syfx Statistics generator system and method
JP4251769B2 (ja) 2000-11-15 2009-04-08 ヤマハ株式会社 ディジタルオーディオアンプ
US6704704B1 (en) * 2001-03-06 2004-03-09 Microsoft Corporation System and method for tracking and automatically adjusting gain
WO2003063346A2 (en) * 2002-01-24 2003-07-31 Koninklijke Philips Electronics N.V. A method for decreasing the dynamic range of a signal and electronic circuit
JP2003280691A (ja) * 2002-03-19 2003-10-02 Sanyo Electric Co Ltd 音声処理方法および音声処理装置
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
JP2004214843A (ja) * 2002-12-27 2004-07-29 Alpine Electronics Inc デジタルアンプ及びそのゲイン調整方法
DE10344638A1 (de) * 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP2007524124A (ja) * 2004-02-16 2007-08-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ トランスコーダ及びそのための符号変換方法
CN1930914B (zh) * 2004-03-04 2012-06-27 艾格瑞***有限公司 对多声道音频信号进行编码和合成的方法和装置
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US8290181B2 (en) * 2005-03-19 2012-10-16 Microsoft Corporation Automatic audio gain control for concurrent capture applications
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
US8116485B2 (en) * 2005-05-16 2012-02-14 Qnx Software Systems Co Adaptive gain control system
CN101199015A (zh) * 2005-06-15 2008-06-11 Lg电子株式会社 记录介质、用于混合音频数据的装置及其方法
KR101492826B1 (ko) * 2005-07-14 2015-02-13 코닌클리케 필립스 엔.브이. 다수의 출력 오디오 채널들을 생성하기 위한 장치 및 방법과, 그 장치를 포함하는 수신기 및 오디오 재생 디바이스, 데이터 스트림 수신 방법, 및 컴퓨터 판독가능 기록매체
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
US7760886B2 (en) * 2005-12-20 2010-07-20 Fraunhofer-Gesellschaft zur Foerderung der Angewandten Forscheng e.V. Apparatus and method for synthesizing three output channels using two input channels
WO2007091842A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
WO2008021110A2 (en) * 2006-08-09 2008-02-21 Dolby Laboratories Licensing Corporation Audio-peak limiting in slow and fast stages
JP2008197199A (ja) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd オーディオ符号化装置及びオーディオ復号化装置
EP2256724A1 (en) * 2008-03-19 2010-12-01 Pioneer Corporation Overtone production device, acoustic device, and overtone production method
WO2009120387A1 (en) * 2008-03-27 2009-10-01 Analog Devices, Inc. Method and apparatus for scaling signals to prevent amplitude clipping
US8094809B2 (en) * 2008-05-12 2012-01-10 Visteon Global Technologies, Inc. Frame-based level feedback calibration system for sample-based predictive clipping
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
KR101722747B1 (ko) 2015-02-25 2017-04-03 주식회사 제일메디칼코퍼레이션 본 플레이트 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
WO2008100098A1 (en) * 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Also Published As

Publication number Publication date
WO2010053728A1 (en) 2010-05-14
US8892450B2 (en) 2014-11-18
EP2353161A1 (en) 2011-08-10
EP2353161B1 (en) 2017-05-24
EP3217395A1 (en) 2017-09-13
ES2963744T3 (es) 2024-04-01
EP4293665A2 (en) 2023-12-20
EP4293665A3 (en) 2024-01-10
US20110208528A1 (en) 2011-08-25
JP2012507059A (ja) 2012-03-22
EP3217395B1 (en) 2023-10-11
RU2468451C1 (ru) 2012-11-27
CN102203854B (zh) 2013-01-02
BRPI0919880A2 (pt) 2015-12-15
CN102203854A (zh) 2011-09-28
JP5603339B2 (ja) 2014-10-08
TW201042637A (en) 2010-12-01
BRPI0919880B1 (pt) 2020-03-03

Similar Documents

Publication Publication Date Title
TWI416505B (zh) 對源自數位聲頻資料之聲頻信號的信號截割提供保護之方法及設備
EP2332140B1 (en) Transcoding of audio metadata
JP6851523B2 (ja) 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化
US10063204B2 (en) Loudness level control for audio reception and decoding equipment
KR102251763B1 (ko) 예약된 데이터 공간에 위치된 메타데이터 컨테이너를 갖는 인코딩된 오디오 비트스트림의 디코딩
JP6727194B2 (ja) 効率的なdrcプロファイル伝送
EP3761672B1 (en) Using metadata to aggregate signal processing operations
KR101571197B1 (ko) 멀티채널 사운드 시스템에서의 멀티채널 프로세싱 방법
KR20230122397A (ko) 서라운드 사운드 마스터링 프로세싱 방법