TW201027517A - Transcoding of audio metadata - Google Patents
Transcoding of audio metadata Download PDFInfo
- Publication number
- TW201027517A TW201027517A TW098131941A TW98131941A TW201027517A TW 201027517 A TW201027517 A TW 201027517A TW 098131941 A TW098131941 A TW 098131941A TW 98131941 A TW98131941 A TW 98131941A TW 201027517 A TW201027517 A TW 201027517A
- Authority
- TW
- Taiwan
- Prior art keywords
- gain
- metadata
- audio
- curve
- coding scheme
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 58
- 230000005236 sound signal Effects 0.000 claims description 20
- 239000000463 material Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims 1
- 230000002496 gastric effect Effects 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 82
- 230000006870 function Effects 0.000 description 66
- 230000005540 biological transmission Effects 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 239000000523 sample Substances 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000010355 oscillation Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
201027517 六、發明說明: 【發明所屬之技術領域】 本發明關係於音訊編碼的領域。尤其,有關於在不同 音訊編碼方案間之音訊元資料的轉碼。 【先前技術】 隨著數位電視及無線電系統的廣泛流行,想要導引節 φ 目音量及動態範圍的接收機側控制及控制立體音降混 (downmix)的元資料(即有關資料的資料)愈來愈重要。因爲 音訊資料的無線廣播格式或傳輸格式並不必然與節目製作 或回送格式相同,即,音訊信號在建立或處理後所用之編 碼方案不必然相同,這表示必須使元資料由一格式至另一 格式進行轉碼。隨著被稱爲aacPlus的音訊編解碼器HE AAC的引入幾個新廣播系統中,已經有課題針對如何最佳 編碼新元資料及如何將現行存在元資料轉碼爲HE AAC或 φ 由HE AAC轉出。 HE ACC(高效先進音訊編碼)係爲現行低位元率編解碼 器,提供全頻寬近CD音質的48kbps立體音。HE AAC規格 下,已經被標準化於MPEG-4中。該規格供在解碼器中之 元資料的選用應用的加強方法,以改良出現在原始MPEG-2 A AC定義中出現的若干缺點。尤其,其允許元資料的規 格,例如DRC(動態範圍控制)、DN(對話正規化)或由多頻 道至立體音的降混,這係大量用於廣播中,以完成特別是 收聽環境之原始節目材料的適當再現。 -5- 201027517 雖然例如HE ACC的編解碼器被廣泛用於廣播中,但 在製作側及接收側上,有不同編碼方案係很常見。例如, 杜比E編碼方案經常爲內容製作者所使用,而也稱爲ac_3 的杜比數位編碼方案或杜比D方案也經常被用於劇院及家 用劇院解碼系統中。因此,有需要在不同編碼方案間之音 訊元資料作轉碼,以確保在製作側所原來設定的元資料以 未惡化方式到達最終解碼系統。此目標通常爲當使受到原 始定義元資料的原始編碼音訊串流與受到轉換格式元資料 的接收音訊串流相比較時確保收聽者未檢出感觀差異或幾 乎沒有感觀差異。以下之發明有關於此問題並界定將元資 料由一壓縮位元流轉譯至一不同壓縮位元流格式之方法, 特別是當兩格式的訊框(framing)並不相容時。 【發明內容】 本發明描述一種用以將有關於動態範圍控制的音訊增 益元資料由第一音訊編碼方案的第一增益元資料轉碼 (transcoding)爲第二音訊編碼方案的第二增益元資料的方 法,其中該第一及第二音訊編碼方案使用編碼方塊及其中 各個編碼方塊具有至少一相關增益値。該方法包含根據該 第一增益元資料的增益値,以選擇該第二增益元資料的增 益値之步驟’使得該第一增益元資料的最小增益値在相關 於第二增益元資料的增益値的時間實例旁的時間間隔內選 出。 此第一與第二編碼方案的例子可以爲杜比E、AAC、 201027517 Η E A A C及/或杜比數位(杜比D)及其變化型,例如杜比數位 +。第一音訊編碼方案也可以稱爲在元資料轉碼器輸入的 源編碼方案,而第二音訊編碼方案也可以稱爲在元資料轉 碼器之輸出目標編碼方案。兩編碼方案均界定相關於編碼 音訊信號的元資料。典型地,內藏編碼方案將編碼音訊信 號分段爲編碼方塊。取決於編碼方案,此等編碼方塊可以 包含不同量的編碼信號取樣。再者,編碼方塊也可以涵蓋 φ 不同時間長度之編碼音訊信號。通常,各個編碼方塊具有 相關元資料,其也包含予以施加至特定編碼方塊的音訊信 號的增益値。另一方面’很多音訊編碼方案施加所謂取樣 保持行爲,其維持現行增益値,直到更新增益値接收的瞬 間。因此,此時,現行增益値係有關於編碼方塊,直到更 新增益値被收到爲止。 依據本發明另一態樣,用以選擇第二元資料的增益値 之時間間隔係爲上下限所定義。此上下限係爲個別增減至 φ 相關於第二增益元資料的增益値的時間實例的一時間常數 所決定。換句話說,在較佳實施例中,該間隔係對稱於第 二增益元資料的增益値的時間實例。 此時間常數可以被選擇’使得其大於或等於第一音訊 編碼方案的編碼方塊的時間長度與第二音訊編碼方案的編 碼方塊之時間長度的最大値。如果時間常數係被選擇,則 所述方法Θ到對增益過衝及限幅有抵抗之轉碼增益値。在 某些狀況下’可以確定轉碼增益元資料從不會超出源增益 元資料。 201027517 另一方面,時間常數也可以被選擇小於第一音訊編碼 方案的編碼方塊的時間長度與第二音訊編碼方案的編碼方 塊的時間長度之最大値。這是有利於在源增益元資料與目 標增益元資料間完成良好匹配。 在某些狀況下,可能發生第一增益元資料的增益値並 未落在有關於第二增益元資料的增益値之時間實例旁的時 間間隔內。例如,此發生於如果時間常數係被選擇以相對 地小或者第二音訊編碼方案的編碼方塊的時間長度係小於 第一音訊編碼方案的編碼方塊的時間長度。在此時,該方 法可以選擇第二增益元資料的增益値爲有關於編碼方塊第 二增益元資料增益値,該編碼方塊係在有關於第二增益元 資料的增益値的編碼方塊之前。或者,該方法也可以選擇 在時間間隔之前的第一增益元資料的增益値作爲第二增益 元資料的增益値。換句話說,轉碼器可以使用音訊編碼方 案的取樣保存行爲並維持現行增益値,直到接收到更新增 益値爲止。 依據本發明另一態樣,該方法更適用於該第二音訊編 碼方案允許不同內插曲線的選擇,其內插第二增益元資料 的鄰近增益値,以形成第二增益曲線。此音訊編碼方案例 爲HE A AC,其允許特別適用於增益釋放之線性內插曲線 以及特別適用於增益攻擊的多數突出內插曲線的選擇。如 果第二音訊編碼方案提供此功能,則該方法可以包含根據 第一增益元資料的增益値,在第二增益元資料的兩相鄰增 益値間選擇適當之內插曲線。 ~ 8 - 201027517 該適當之內插曲線可以例如根據第一增益元資料的兩 相鄰增益値間之差加以選擇。例如,如果第一源增益値( 很)高及下一源增益値(很)低,則可以選擇“攻擊”狀內插曲 線。另一方面,如果第一與下一源增益値相當地相似,則 可以選擇“釋放”狀內插曲線。 或者,如果第一增益曲線係相關於第一增益元資料的 增益値,而此第一增益曲線可以藉由內插第一增益元資料 Φ 的相鄰增益値加以取得,則適當內插曲線可以根據第一增 益曲線的斜率加以選擇。明確地說,如果第一增益曲線的 負斜率超出預定臨限値,則可以檢出增益攻擊。換句話說 ,如果第一增益曲線陡降,則可以檢出增益攻擊。另一方 面,如果第一增益曲線的負斜率低於預定臨限値,則檢出 增益釋放。根據第一增益曲線的檢出增益攻擊或增益釋放 ’該方法然後在第二增益元資料的兩相鄰增益値間選擇適 當內插曲線。 φ 如前所述,第二編碼方案可以允許選擇可以被稱爲內 插曲線型樣的多數“攻擊”內插曲線。這些不同內插曲線型 樣典型在時間上彼此延遲,藉以允許不同“攻擊”時間的定 義。爲了使用此第二編碼方案的功能’該方法可以根據第 一增益曲線的斜率絕對値爲最大的位置’來在第二增益元 資料的兩相鄰增益値間,選擇適當的內插曲線。換句話說 ’該方法決定第一增益曲線的最陡點並選擇第二編碼方案 的最接近此最陡點的內插曲線型樣。 依據本發明另一態樣,第一增益兀資料的增益値的選 -9 - 201027517 擇不只可以根據第一增益元資料的增益値組,同時也可以 根據整個第一增益曲線。在此等情形下,該方法包含在時 間間隔內選擇第一增益曲線的最小値成爲第二增益元資料 的增益値的步驟。如果第一增益元資料沒有增益値落在有 關於第二增益元資料的增益値的時間實例旁的時間間隔內 時,這可能特別有用。 作爲第一增益曲線的最小値計算的低複雜度替代法, 較佳地在該時間間隔內選擇第一增益曲線的一組取樣的最 小値作爲第二增益元資料的給定增益値。第一增益曲線的 此組取樣可以包含在落入該時間間隔內的第二增益値的編 碼方塊時間實例的第一增益曲線的取樣。 另外,本發明描述一種將有關於動態範圍控制之音訊 增益元資料由第一音訊編碼方案之第一增益元資料轉碼爲 第二音訊編碼方案之第二增益元資料的方法,其中該第一 與第二音訊編碼方案每編碼方塊具有不同數量的音訊取樣 及其中各個編碼方塊具有相關增益値。再者,相鄰編碼方 塊的一連串增益値係被內插以定義增益曲線。該方法包含 有根據第一增益元資料的增益値,選擇第二增益元資料的 增益値的步驟,使得第二增益曲線一直在第一增益曲線下 。使用此條件,可以確保沒有限幅之源音訊信號係被轉碼 爲同樣也沒有限幅的目標音訊信號。 再者,本發明描述一種將有關於動態範圍控制之音訊 增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲 第二音訊編碼方案的第二增益元資料的方法’其中該第一 -10 - 201027517 與第二編碼方案使用編碼方塊及其中各個編碼方塊具有相 關增益値。另外’第二增益曲線係有關於第二增益元資料 的增益値。該方法包含選擇第二增益元資料的增益値的步 驟’使得在有關於第一音訊編碼方案的編碼方塊之時間實 例’該第二增益曲線係小於或等於該第一增益元資料的增 益値。 依本發明另一態樣,第二增益元資料的增益値的選擇 Φ 可能不只是根據第一增益元資料的增益値組,也根據整個 第一增益曲線。在此情形下,該方法可以選擇第二增益元 資料的增益値,使得在相關於第一音訊編碼方案的編碼方 塊相關的時間實例及/或在與第二音訊編碼方案的編碼方 塊的時間實例,該第二增益曲線小於或等於第一增益曲線 。當第二音訊編碼方案的編碼方塊的時間長度小於該第一 音訊編碼方案的編碼方塊的時間長度時,這可能顯著有利 〇 ❷ 對於某些編碼方案,增益曲線包含有關於鄰近增益値 的區段及窗函數。典型地,曲線區段係藉由使用編碼方案 的窗函數內插於相鄰增益値間加以取得。在此時,在特定 時間實例的增益曲線的上述取樣可以爲增益値及窗函數的 一組取樣所決定。對於某些編碼方案’所有或次組曲線區 段的窗函數爲相同的,使得增益曲線可以爲增益値及窗函 數的有限組取樣所描述。這允許上述方法之低複雜度實施 法,即使根據源增益曲線作增益値選擇。 本發明更描述轉碼系統’其實施上述轉碼方法。這些 -11 - 201027517 轉碼系統可以爲傳輸系統或消費者機頂盒的一部份。轉碼 系統可以利用爲周圍系統所提供之處理及記憶體手段,但 轉碼系統也可以包含本身處理手段,例如CPU及記憶體手 段,如ROM或RAM。 例如,音訊轉碼系統的實施法可以包含數位處理器及 記憶體,用以儲存爲處理器所執行之指令。記憶體也可以 更儲存進入元資料及在傳輸前產生之外出元資料。尤其, 編碼方塊的增益値可以儲存在記憶體中,用於處理。再者 ’較佳地,令窗函數的取樣或第一及/或第二編碼方案的 多數窗函數儲存於記憶體中。 例示音訊轉碼系統可以被實施於機頂盒,用以由傳輸 音訊格式轉碼爲用於播放或記錄於消費者家的音訊編碼方 案。例如,於作爲傳輸音訊編碼方案的HE AAC與作爲播 放之無線廣播音訊編碼方案的杜比數位(+ )間之轉碼可以 設在機頂盒中。 音訊轉碼系統的另一例子可以實施爲由節目製作或回 送音訊編碼格式轉碼至傳輸音訊格式的頭端。例如,在作 爲製作音訊方案的杜比E及作爲傳輸音訊方案的HE AAC間 之轉碼可以設在此頭端系統中。 應注意的是,於此文件中所述之方法與系統可以應用 至各種第一與第二音訊編碼方案,例如杜比E、也稱爲杜 比D或AC-3的杜比數位( + )、AAC(先進音訊編碼)、及/或稱 爲 aaacPlus 的 HE AAC(高效 AAC)。 再者,應注意於本文件所述之方法與系統可以彼此組 -12- 201027517 合使用。即,其也可以使用一方法用於—轉碼方向而另一 方法用於相反的轉碼方向。 【實施方式】 元資料爲“有關音訊資料的資料”,其與多頻道音訊串 流一起進行於例如杜比數位、杜比E、aAC ' HE AAC或其 他音訊編解碼器中。其取決於傳輸音訊串流,而移除需要 φ 廣播以持續調整並壓縮音訊位準的情形。其也提供音訊混 合器’以有關於音訊串流的音響動態的高度自由度。在過 去’與多頻道音訊一起工作的廣播者經常具有音軌平均位 準低於其他節目位準上或下的問題。同時,當環繞聲音內 容被播放於具有立體或單音音訊輸出的電視機時產生問題 。使用音訊元資料’音響工程師可以對於不同播放系統不 同地混合音訊內容並設定播放位準,全部在後製平台上, 使得廣播者可以輸送更符合之音訊信號並確保最重要音訊 φ 元件通過。 元資料提供若干參數,其特別想要改變輸送至消費者 特有收聽環境的節目的聲音。這些元資料參數被稱爲對話 位準(也稱爲對話正規化或dialnorm)、動態範圍控制、及 降混。雖然技術上,並非個別元資料參數,但在消費者解 碼器內的降混作爲特定元資料參數所生效,並如同 dialnorm及動態範圍控制必須小心監視及選擇生效該降混 狀況的元資料參數。在製作側上之音響工程師最後負責最 佳化多頻道混合,以在最佳收聽環境下作最佳播放。然而 -13 - 201027517 ,也必須小心以確保考量較差的收聽環境。這就是爲何在 轉碼期間元資料未失真或只以限定方式失真很重要的理由 ,以在製作階段,保留所設計元資料之品質。 對話位準參數提供正規化値給家用解碼器。此値調整 音訊的音量至一預設位準,以協助由節目內容至節目內容 及媒體至媒體的位準匹配。對話位準並不會在節目素材上 主張任何壓縮或擴張,而是降低音訊的音量至一標準化位 準。對話位準與動態範圍控制規格一起動作。對話位準參 數於節目的輕聲及大聲間設定一種“空帶”。 有時稱爲動態範圍壓縮或午夜模式之動態範圍控制 (DRC)給消費者以降低動態範圍收聽節目音訊之彈性。動 態範圍的壓縮使得觀看者收看電視而不會干擾鄰居。此控 制經常是選用的並經常可以在多數音訊解碼器,例如杜比 數位解碼器中關閉。動態範圍控制也可以用於消費者解碼 器上的共同“午夜模式”。 在低音量時’節目的輕聲部份(耳語及輕聲細語)很難 聽到。然而’如果收看者加大音量,則加大部份(爆聲、 螢幕爭吵聲、鎗聲等)變成太大而不適。或者,在具有高 位準背景雜訊的環境中’節目的輕聲部份將爲周圍雜訊所 拉下。當在該解碼器中主張動態範圍規格時,則解碼器提 高節目的輕聲部份的位準同時降低大聲部份的位準,允許 使用者享受於電影中,而不必持續觸碰音量控制鈕。 動態範圍控制典型包含兩參數或“規格,,:RJ7模式及線 模式。應注思的疋’此兩參數並不會改變在位元串流中之 -14- 201027517 編碼音訊的內容。它們被使用以調整在收聽環境內的節目 素材的極限,以此考量這些在降低動態範圍下所較佳或必 須收聽節目之實例。 RF模式被設計用於峰値限制狀況,其中解碼節目係想 要透過電視上之RF輸入而輸送,例如透過機頂盒上的天線 輸出。其典型允許在±48.16dB範圍內的動態範圍壓縮’並 也稱爲低率DRC。 φ 線模式提供較輕類型的壓縮,並允許使用者在家用解 碼器內的低位準增強/高位準削減參數之調整。其典型允 許在±2 4.08 dB範圍的動態範圍壓縮並被稱爲高率DRC。增 強及削減區域的調整或“縮放”允許消費者客製化其特定收 聽環境的音訊播放。 降混爲例如杜比數位的音訊編碼器內的特性,其允許 多頻道節目被幾個喇叭頻道所播放。簡單地說,降混允許 消費者享受數位電視廣播,而不必完整之5 . 1 -頻道家用劇 φ 院設置。有關於立體音混頻,當混頻被監視爲單音情況下 維持相容性時,多頻道音訊混頻需要工程師參考與少數喇 叭頻道之混頻,以確保降混狀況的相容性。 協助完成適當降混、協助確保音響工程師/內容製作 者的意圖的某些元資料參數將在這些環境間轉譯。明確地 說,元資料提供對喇叭頻道係如何“加”入所得之降混中之 控制。當音響工程師通常最佳化理想收聽環境中之播放的 多頻道混頻時,在降混狀況下預覽該混頻也是很重要的, 以確定當選擇降混元資料參數時,與不同播放系統的相容 -15- 201027517 性。 如上所述,元資料等等可以被使用以控制在解碼器中 之時變增益元件,使用此作爲動態範圍控制及/或音訊信 號的限制手段,以防止限幅。不同於在編碼器側上之壓縮 ,在解碼器側上之壓縮施加點爲末端使用者維持對動態範 圍壓縮量的控制。對於午夜觀看,末端使用者可以使用最 大壓縮,而具有自家用劇院之“愛樂者”可能較想要原始劇 院混頻的完整動態範圍。 在現代數位廣播鏈中,幾個音訊格式係被使用於製作 、回送、及傳輸階段中。其中原始音訊混頻可能仍爲未壓 縮線性PCM格式串流,製作的末端結果經常爲杜比E格式 串流。使用杜比E作爲在內容製作程序中之音訊編解碼器 ,製作者有可能在這些之中內藏描述整個節目音量的元資 料參數(DialNorm)、予以被使用以產生DRC係數之壓縮器 規格、及降頻。 圖1顯示由製作中心至消費者家的例示音訊轉碼鏈100 的例子。在製作中心1 0 1,音訊串流典型爲最適用以製作 及後製目的,例如杜比E的音訊格式。此製作音訊串流然 後被轉碼爲最適用以無線廣播目的1 02的格式,例如杜比 數位,其係被稱爲杜比D或AC-3。如果需要音訊串流的傳 輸或廣播,則此無線廣播音訊串流可能需要轉碼爲適當傳 輸或廣播格式103,例如HE-AAC。此傳輸音訊串流可以然 後透過網路104被傳輸至在消費者家中之多數機頂盒105上 。由於多數消費者設備106均需要特定消費者音訊格式, 201027517 例如杜比數位以放出正確之音訊串流,所以在機頂盒1 〇 5 中有需要進一步由傳輸音訊串流轉碼爲消費者音訊串流。 應注意的是’部份製作、無線廣播、傳輸及消費者音訊格 式可能相同。尤其’無線廣播及消費者音訊串流格式可能 均爲杜比數位。 換句話說’杜比Ε格式可以被轉碼爲音訊資料串流, 其更適用以在電影劇院、家中劇院或傳統家用音響中放出 ❹ 內谷。此無線廣播首訊資料串流的例子爲杜比數位串流。 在音訊資料串流格式間之轉碼,即在製作音訊串流與無線 廣播音訊串流間之轉碼同時也觸發元資料轉碼的需求。 如果需要音訊串流的傳輸或廣播,則無線廣播音訊串 流’例如杜比數位串流可能需要轉碼爲傳輸音訊串流,例 如Μ P E G Η Ε - A A C音訊串流’其係最佳化用於音訊於低位 元率鏈結上的傳輸。對於在無線廣播音訊串流與傳輸音訊 串流間之此等轉碼,相關元資料需要被轉碼。 φ 在傳輸後,音訊資料串流通常在接收器被解碼,接收 器可以爲在消費者住所之機頂盒(STB)。尤其,如果音訊 資料串流爲多頻道音訊串流,例如環繞聲音訊串流,則其 較佳將傳輸音訊串流轉碼爲消費者音訊串流,例如杜比數 位。藉此’多頻道信號可以經由光學或同軸S/p DIF鏈結 傳送給消費者家中劇院或電視機中之多頻道接收器。同時 ’在傳輸音訊串流與消費者音訊串流間之轉碼需要在相關 元資料間之轉碼。 當一格式之音訊資料串流被轉碼爲另一格式之音訊資 -17- 201027517 料串流時,元資料需要與之一起進行。DialNorm元資料的 轉碼典型並未呈現大問題,因爲它通常只有在節目邊緣才 顯著改變其他就幾乎不變。然而,DRC元資料的轉碼則很 重要,因爲DRC控制信號在不同音訊格式中具有不同訊框 。表1列出例示音訊格式及編解碼器的不同訊框長度。 編解碼器 視訊框率(fi>s) 取樣之訊框長度 AAC N/A 128/1024 HE AAC N/A 256/2048 LD AAC N/A 120/960 LD HE AAC N/A 240/1920 杜比AC-3 N/A 256/1536 杜比E 25 1920 杜比E 50 960 杜比E 30 1600 杜比E 60 800 表1
對於AAC爲主格式,在“訊框長度”列中之左側數量表 示短方塊/訊框的長度及右數量表示長方塊/訊框解析度。 對於杜比數位/AC-3格式,“訊框長度”中之左數量表示高 速率DRC字的解析度,即對於線模式的訊框大小,及右數 量表示低速率DRC字元的解析度,即RF模式之訊框大小。 可以看出,取決於架構,DRC元資料的轉碼可以由較 高速率之元資料進行至較低速率,或反之亦然。爲了更複 雜,AAC爲主格式也可以改變時間解析度,即現場之訊框 長度,使得兩狀況,即由高速率轉碼爲低速率及由低速率 轉碼爲高速率均可以在相同串流中發生及在相同轉碼操作 -18- 201027517 中發生。再者’ AAC爲主格式可以一訊框一訊框地發出有 元資料出現否的信號。典型,解碼語意定義一取樣及保持 行爲,即解碼器被指示以一直使用收到之最新增益控制信 號,直到新資料到達爲止。因此,在AAC訊框中沒有元資 料表示解碼器中應被施加最新增益控制信號,直到進一步 通知爲止。 爲壓縮器所施加之增益可以爲長準固定部份所特徵化 φ ,並爲增益快速下降之陡“攻擊”所中斷。這些“攻擊”典型 施加以軟化在音響強度中之突然增加,例如在電影中之爆 炸。由這些斜角,壓縮器增益可以以稱爲“釋放”的長時間 常數回復。換句話說,在音響強度中之突然增加被尖增益 “攻擊”所對抗,其中增益値係在很短時間期間被強烈降低 ’而在增益“釋放”期間,則增益增加被平順地執行。 雖然在施加DRC增益時音訊信號的部份量的調變失真 在該攻擊上不可避免,但此攻擊之衰減時間常數被選擇, φ 使得調變失真聽不到。增益攻擊之適當衰減時間的選擇爲 音響工程師設計適當DRC元資料時的一項重要任務,並且 在元資料轉碼時,將DRC元資料由製作音訊格式轉碼至無 線廣播音訊格式進行一步轉碼至傳輸音訊格式,例如AAC 時,必須小心以不破壞此特性。 再者,壓縮器也可以耦接至限制器,其限制在任一時 間之最大壓縮器增益,以不會產生通過odBFS的信號。此 等限制器典型用以防止限幅。當轉碼元資料時,此等限制 器功能需要考量。 -19- 201027517 例如AAC、HE A AC、及杜比數位/AC-3之音訊編解碼 器典型爲適應性轉換爲主的編解碼器,其根據例如MDCT ,即修改離散餘弦轉換的Princen-Bradley時域假象取消 (TDAC)技術,使用頻率-線性臨界取樣濾波排。MDCT轉換 經常被耦接額外窗函數,以藉由使MDCT及逆MDCT函數在 濾波器邊界點平滑進行至零,而避免在轉換邊界的不連續 〇 這是如圖2所示,其中顯示音訊編碼器200及音訊解碼 器210。圖2顯示轉換爲主編碼器201及轉換爲主解碼器211 ,如同在例如AAC及杜比數位/ AC-3之音訊編碼方案中被 使用。如上所述,此編碼方案包含在編碼側上之TDAC轉 換濾波排204及在解碼側上之逆TDAC轉換濾波排214。再 者,在編碼及解碼側的窗函數203及213分別移除在濾波器 邊界的TDAC轉換204、214的不連續。另外,轉換爲主編 碼器201及解碼器211包含額外元件,例如分別爲黑點205 及2 1 5所表示之暫態檢測器、量化手段、位元配置手段等 等。 爲了進一步降低傳輸資料速率,例如HE-A AC之某些 音訊編解碼器使用稱爲頻帶複製(SBR)的技術。SBR的內 在原理爲音訊信號的較高頻部份的心理聲響重要性相當地 低。因此,使用SBR的音訊編解碼器只使用上述之轉換爲 主編碼器編碼信號頻譜的下半部。信號頻譜的上半部係爲 SBR解碼器或合成所產生,其主要爲在傳統轉換爲主之解 碼器後的後置處理。不作傳輸高頻頻譜,SBR根據傳輸於 201027517 內在編碼器中之低頻的分析,在解碼器中重建較高頻率。 爲了確保準確重建,部份導引資訊被以很低資料率傳輸於 編碼位元流中。在編碼側使用QMF(正交鏡濾波器)分析的 此SBR分析係在圖2中被顯示爲方塊2 02。典型地,此QMF 分析藉由分析例如64信號次頻帶而決定基本頻譜信號資訊 。在解碼側上,信號資訊係被用於SB R合成2 12中,使用包 含64次頻帶之QMF合成濾波器排。 I 上述轉換爲主編碼方案的主要優點爲信號元件及對應 量化雜訊元件(想要被遮蔽)被保持在臨界頻寬內,由人類 耳朵的遮蔽特性導出之最大利益,及最小化感覺無雜訊編 碼所需的所得資料率。 在開始DRC元資料的轉碼之前,將提供在音訊解碼器 的此DRC元資料使用的簡要說明。對於每訊框或方塊,音 訊解碼器將剖析所接收位元串流,以表示是否新增益値被 傳輸用於該特定訊框。如果未提供新增益値,則解碼器將 φ 使用最後傳輸增益値。另一方面,如果已經收到新增益値 ,則新增益値將被讀入並應用。 對於例如AAC及AC-3的某一群音訊編解碼器,新接收 增益値將被使用以放大或衰減由訊框中解碼出的頻譜音訊 資料。換句話說,在施加逆TDAC轉換前,增益被施加至 頻訊音訊次頻帶。由於此轉換的施加及取樣重疊典型相關 於轉換而典型應用及由於相關窗化,增益値將有效地被內 插於連續訊框之間。在本文中,內插函數可以被視爲加權 函數。此內插增益曲線係如圖3所示,其中顯示A A C編解 -21 - 201027517 碼器的s型內插函數3 01。典型內插函數係如圖4a中之圖形 401所示。對應窗函數402係示於圖4b中。另外,應注意的 是,也可以使用非對稱窗函數及相關內插函數。例如當窗 函數由一信號方塊變化至下一方塊時,也可以發生此非對 稱窗函數。在圖4c中,顯示此非對稱窗函數411及412,及 其相關內插函數421及422。 再者,圖5顯示用於三連續方塊或訊框的內插增益曲 線。可以看出,由零方塊至第一方塊的由6dB至OdB的增益 轉移係爲AAC窗函數所內插,以得到典型S形內插曲線501 。由第一方塊至第二方塊,增益値保持在OdB不變,使得 增益曲線502保持平坦。然後,在第三方塊發生另一增益 轉移至-3.5dB,其再次造成典型S形內插曲線502。 對於另一群之音訊編解碼器,例如HE AAC編解碼器 ,增益將不會施加至MDCT頻譜上。相反地,其將在QMF( 正交鏡濾波器)合成前施加,該合成典型跟在逆MDCT轉換 後。藉由預設,增益値係被線性內插於相鄰訊框或槽之間 ,如圖3所示,成爲內插曲線3 02。另外,HE AAC位元流 語法保留另3個位元以選擇8個不同內插曲線303之一。這 些方案基本上不會內插,而是在“突然”跳至預定轉移曲線 後的新增益之前,持續保持舊增益値不同時間量。圖3顯 示分佈於訊框寬度上之一組轉移曲線303。此突然增益轉 移曲線較佳匹配當想要突然增益改變的狀態,例如增益攻 擊時的狀態。對於HE A AC編碼方案,該串增益値有效地 內插以形成如圖3所示之增益曲線3 02及3 03。此內插係有
201027517 關於QMF合成之脈衝回應。 爲了容易解說,可以假設將也被稱爲释 控制信號具無限高解析度,但在真實中,if 格上取樣。爲了由一代表値至另一代表値, 取樣增益値爲時間連續的內插級。此級典塑 器的取樣保持語意。不是每一訊框承載增益 是部份音訊資料格式,例如杜比E允許發出 格特別是壓縮器規格。爲了轉碼目的,此屬 被視爲增益控制信號。事實上,壓縮器規相 特定增益値給每一音訊信號取樣。因此,壓 定義增益控制信號。使用內插級,這些增益 有時間連續信號代表値。 在以下,轉碼元資料的問題將進一步另 ,參考由2007年十月5至8日之音響工程師1 W. Schildbach等人所作之“動態範圍控制係 φ 料的轉碼爲PMEG-4 HE AAC”,其係倂入作 如前所述,轉碼的目的爲受到轉碼元: ,特別是轉碼增益値的音訊信號聽起來一 1 於具有施加原始增益之音訊信號。由此明; 碼演算法的若干侷限可以公式化爲: •當受到原始增益値的信號並未限幅E 益値的信號也不應被限幅。即,該信號必ί 。這可以藉由拾取增益取樣加以完成,使ί 號的增益不會超出進入增益。 益曲線的增益 益値只在分立 可以假設內插 遵循上述解碼 控制係數,而 選擇元資料規 縮器規格可以 暗示地指定一 縮器規格實際 控制信號也具 析。在本文中 δ會123頁的由 數與其他元資 $參考。 料的音訊信號 或儘可能類似 目標,對於轉 ,受到轉碼增 保留限幅保護 施加至轉碼信 -23- 201027517 •對於靜態增益曲線,轉碼增益曲線應相同。即,其 中在原始增益曲線與轉碼增益曲線間之準靜態信號應沒有 不匹配。 •當發生動態增益改變時,施加至轉碼信號上的增益 應儘可地接近地模擬進入增益,即釋放及攻擊次數應類似 〇 考量這些侷限,可以公式化某些量的轉碼演算法。這 些轉碼演算法將被槪述如下。啓始音訊編碼格式之增益値 將稱爲源增益値及對應音訊編碼格式將稱爲源編碼方案的 源格式。轉碼增益値將稱爲目標增益値及相關音訊編碼格 式將稱爲目標編碼方案的目標格式。 應注意的是,取決於特定轉碼狀態,不同強調可以放 在不同組或次組的侷限上。在某些狀況中,較佳地確保目 標增益曲線永遠小於或等於源增益曲線。如果予以避免在 目標側上的音訊限幅,則這可能是較佳選項。另一方面, 這也可能足以確保只有在某組取樣點處,目標增益曲線係 小於或等於源增益曲線。例如,其足以明定只有目標增益 値爲小於或等於源增益値。在此時,由於在源側及/或目 標側的內插,有可能發生目標增益曲線在某些點超出源增 益曲線。然而,這也可能在可容忍過調變效應的代價下, 得到源增益曲線與目標增益曲線的較佳整體匹配。再者, 在部份轉碼狀況下,也可適當地進一步喚醒有關於目標增 益曲線或目標增益値的侷限小於或等於源增益曲線或源增 益曲線。在此等情況下,更強的強調可能放置在增益曲線 -24- 201027517 的整個匹配上。 也應注意的是,以下演算法也可以用以漸進地將增益 元資料由源@碼方案轉碼至目標編碼方案。由於編碼音訊 信號的即時特性,所以這是很重要。因此,在典型轉碼狀 態中不可能緩衝任意數量的源編碼方塊並對這些緩衝源編 碼方塊執行整體轉碼操作。因此,適當轉碼演算法需要一 方塊一方塊爲主地執行漸進轉碼。此漸進方塊狀轉碼可以 A 以以下轉碼演算法完成。 再者,應注意的是,以下演算法可應用至非相稱訊框 。這表示源編碼方案的訊框及目標編碼方案的訊框可以爲 任意地不同,兩者均有關於訊框大小,即每訊框的取樣數 或每訊框包含的音訊信號的長度,及有關於訊框的同步化 ’即’它們個別之開始及結束時間。事實上,甚至源編碼 方案與目標編碼方案的取樣率可能不同。 再者,也可以說成以下演算法不只限制音訊增益資料 Φ 的轉碼’同時也可以應用至將信號由一壓縮位元流格式轉 碼至另一壓縮位兀流格式之任意裝置,其中該等格式之訊 框並不相容。有關於音訊編碼的一些例子爲杜比E至/自 Η E - A A C轉碼器或杜比數位至/自Η E - A A C轉碼器。例如, 由於AAC/HE AAC及杜比數位位元流有不同訊框,即使杜 比數位位元流分配空間給元資料,也不可能直接將元資料 由A A C / Η E - A A C位元流映圖至杜比數位位元流。因此,爲 了保留在AAC/HE AAC位元流中之元資料,於以下所述之 方法與演算法需要執行元資料轉譯。 -25- 201027517 演算法1 :排列順序濾波器 符合或近似上述侷限的可能爲對源增益値施加排列順 序濾波器。假設g’i(i = 〇 ’…’ N-1)爲目標格式之N訊框的 目標增益値,及gj(j = l ’…’ M-1)爲源格式之Μ訊框的源 增益値。再者,假設t’i爲相關目標增益値g’i被施加的次數 及tj爲源增益値gj被施加之次數。 由於用於源格式之解碼器中之濾波排及/或窗函數的 _ 內插函數,源增益値gj定義一連續源增益曲線,稱爲G(t) ,其係由兩相鄰源增益値gj及gj + 1間之曲線區段Gj(t)的序 連構成。如果W(t)爲兩源增益値間之內插或加權函數,曲 線區段Gj(t)可以被寫成
Gj (〇 = gj (l - W{t -φ gJ+iW(t ~tj). (1) 圖6顯示此一內插源增益曲線G(t),601,其係由曲線 區段Gj(t)之連序所構成(j = 〇,…7)。換句話說,源增益曲 線G(t),601係根據九個源增益値gj(j = 0,…,8),在時間 參 tj(j = 0 »…,8)。在所示例子中,內藏源編碼方案爲線性 內插方法所選擇之HE AAC。此線性內插法解釋相鄰源增 益値gj間之線性轉移。應注意的是,其他編碼方案提供類 似內插源增益曲線。 可以展現出當在時間t’i時選擇目標增益値g’i,使用公 式 = (2) 然後,上述轉碼侷限可以在某些附屬條件下符合。通 -26 - 201027517 常,也可以說成爲如果;5被選擇,使得 β > ), (ί;+, - /;)} (3) 則內插目標增益曲線將一直保持在內插源增益曲線下 。尤其,當內藏編碼方案使用線性內插方案時適用。 這是示於圖7a及7b中。圖7a顯示當(~1〇#川_〇),即 目標編碼格式之訊框尺寸小於或等於源編碼格式之訊框尺 寸。例如,此等狀況可以發生於當元資料由HE A AC長訊 φ 框解析度轉碼至杜比數位。源增益曲線701係爲於爲圓圈 所代表的時間to、t,、t2及t3源增益値gj所定義。爲了簡單 起見,已經被施加有稱爲Η E A AC之線性內插。可以由圖 7a看出,如果/3被選擇大於或等於(tj + 1-tj),在時間實例 t’〇至t’18的一連串目標增益値g、可以使用公式(2)決定。這 些目標增益値g’i係在圖7a被表示爲“X”並得到目標增益曲 線702,其可以永久在源增益曲線701下。用於g’^公式之 操作模式可以由雙箭頭703看到,其表示向後及向前延伸 參 (tj + 1- tj)時間實例的時間實例t’8旁的時間間隔。換句話說 ,卢=(tj + 1-tj)。在此時間間隔內,最小源增益値gj具有 f/ e If I ’川 _ I〆 /·+1 ’y+i _ G lj, (4〉 係被選擇爲目標增益値g’i。在時間實例t’8,目標增 益値g’8被決定爲在時間實例t2的源增益値g2。 圖7b顯示當’即當目標編碼格式之訊框 尺寸大於或等於源編碼格式之訊框尺寸時。例如,此狀況 可以發生於當由杜比數位轉碼爲HE AAC長訊框解析度時 。在時間實例U至t, 8的源增益値gj係爲圓圈所表示,並造 -27- 201027517 成源增益曲線G(t)’ 711°當選擇Θ爲大& $胃於(t’i + 1-t’i) ,可以使用公式(2)決定在時間實例^至Γ3的—連串目標 增益値g,i。這些目標增益値可以在圖7b中被表示爲“x”。 可以看出,這些目標增益値g’i造成目標增益曲線712 ’其 係一直低於源增益曲線GG) ’ 711 °類似於圖7a ’雙箭頭 713表示對於召=(1、+ 1-匕)的時間實例11’旁的時間間隔。 參考圖6 ,其中轉碼例子係例示用於。可 以看出,如果yS =(t’i + i_t’i) ’則取得虛線目標增益曲線602 。再者,在時間實例t ’ =4旁的相關時間間隔係由雙箭頭6 0 4 所示。應注意的是’目標增益曲線的壓縮器釋放係相較於 源增益曲線601的壓縮器釋放被延遲。準確地說,源增益 曲線的壓縮器釋放開始於時間實例t = 3處,而目標增益曲 線的壓縮器釋放只開始於時間實例t’=4。另一方面,可以 看出目標增益曲線的攻擊相較於源增益曲線的攻擊爲超前 。準確地說,源增益曲線的壓縮器攻擊開始於時間實例 t = 2,而目標增益曲線的壓縮器攻擊則已經在時間實例t ’ = 1 開始。 圖6也顯示第二目標增益曲線603,其已經藉由選擇參 數/5=0.5*(匕+ 1-厂〇加以取得,即在公式(3)中明定限制下 的參數値。當選擇/3爲 再也不能確保目標增益曲線一直在源增益曲線下。然 而,參數卢的變動對壓縮器釋放的延遲量及/或壓縮器攻 擊的超前量作出控制。在圖6中之目標增益曲線6 03顯示, 201027517 當選擇卢=0.5*(t’i + 1-t’i)時’壓縮器攻擊及釋放曲線可以 移動較目標增益曲線602接近源增益曲線6〇ι。用以決定目 標增益値的相關時間間隔的大小在時間實例t,= 4處係被雙 箭頭605所顯示。然而,應注意的是,當具有沒< ,(tj + 1-tj)}的參數冷應被小心拾取,因爲値 太低的万可能造成目標增益顯著超出源增益曲線。此過量 增益過衝可能造成可聽到之音訊缺陷,例如限幅。因此, φ 適當參數万的選擇爲元資料轉碼器的方案者在考量多數不 同方面下所作出之折衝。例如,此等方面可以包含所施加 音訊編碼格式、被編碼之內容、由源編碼方案轉碼至目標 編碼方案的方向等等。 應注意的是’此演算法可以以低計算複雜度實施,尤 其’如果相關於不同時間實例tj的元資料以預定順序方式 排列。這是由於用於目標增益値g’i的計算的源增益値gj的 數量很低。典型地,只需要很少的比較計算用以決定最小 φ 値。再者,應注意的是,提出排列順序濾波器演算法只使 用源增益値gj及其相關時間實例tj,以決定目標增益値g、 。這資料係可以直接於轉碼單元由元資料位元流迅速取得 並不需要額外處理。此特性加至提議排列順序濾波器演算 法的低計算複雜性。 圖8顯示使用上述排列順序濾波器演算法轉碼源增益 曲線8 0 1的另一例子。在上述例子中’源編碼格式的訊框 大小爲25 6取樣,而目標編碼格式之訊框大小爲2048取樣 。參數冷已經被選擇爲冷=1Ώ3χ{(Γί+ι·Γί) ’(h+i-tj)}。此 -29- 201027517 轉碼狀態可能發生於例如杜比數位的編碼方案係被轉換至 HE AAC,其有可能定義相當長訊框尺寸,以提供較低頻 寬傳輸。圖8也顯示轉碼目標增益曲線8〇2並且可以看出符 合參數/9的明定狀態,轉碼增益曲線8 02係低於增益曲線 801。再者,可以看出攻擊已經超前,而壓縮器釋放已經 被延遲。藉由以冷<max{(t’i+1-t’i),+ 選擇參數召
,此作用可以降低。然而,即,以相較於源增益曲線的目 標增益曲線的可能過衝的代價。 再者,應注意的是,當選擇/9〈maxUt’i + i-t’i),(tj+1-tj)}時,可能發生,尤其是當,即目標編 碼格式的訊框尺寸係小於或等於源編碼格式之訊框尺寸, 即,沒有源增益値g可以在時間實例t’i旁的間隔[t’i-万,
t’i+万]中指明。在此等實例中,公式將不 能得到目標增益値g ’ i的一值。因此’可能有利以使用解碼 器的取樣及保持行爲並假設目標增益値g’i維持不變’直到 新値目標增益値使用上述公式(2)加以指明爲止。換句話說 ,目標增益値公式可以被寫成 ,_ Jmin{g川,’,-ί;| S e [ί’,Ύ,ίW] 8i=z\ · ⑹ 或者,可以使用解碼器的取樣及保持行爲於源編碼方 案上。這表示如果沒有更新源增益値gj可以在時間實例 旁的間隔[t,i - ’ t ’ i +沒]中指明’則最後檢測源增益値被 假設爲現行源增益値gj。用以決定目標增益値g ’ i的公式可 以被重寫爲 -30- 201027517 ,=i min^y 11^-^1 <p\tj e * 1&,7·Ι 0[ί',-ΑΛ+Α]. (7) “取樣及保持”方法的優點爲目標增益値g’i只根據源增 益値gj加以決定。如上所述,此排列順序濾波器演算法的 特性可以對低計算複雜度作出貢獻。 或者,較佳地進一步考量源增益曲線G(t)的準確路徑 並使用修改公式決定目標增益値g’i φ ^( = min{G(〇||/V-/|<^}. (8) 這可以特別有利於當’即當目標編碼格 式之訊框尺寸小於或等於源編碼格式之訊框大小,因爲該 組的適當源增益値以選擇目標增益値g’i ’將不會爲空白。 相關演算法將稱爲通用排列順序濾波器演算法。 另一方面,應注意的是,此修改選擇公式需要知道在 元資料轉碼器的源增益曲線。尤其,元資料轉碼器需要知 道內插函數W(t)或者甚至可能爲源編碼方案所用之該組內 Ο 插函數。根據這些內插函數W⑴及源增益値gj,源增益曲 線區段Gj(t)及源增益曲線G(t)可以被決定。整體言之,相 較於只使用源增益値gj的排列順序濾波器演算法的版本, 可以期待藉由使用修改選擇公式,轉碼演算法的計算複雜 性將增加。 也應注意的是’上述公式(8)可以藉由只考量源增益曲 線G (t)的一組取樣加以修改。例如,可能較佳地,只考量 目標增益値的時間實例t’i及/或源增益値的時間實例tj的源 增益曲線値。公式可以被然後重寫爲 -31 - 201027517 g\ = min{G(〇 I \t\ -t\ S y?}, with / e {r1,, t}}. (9) 限定源增益曲線G(t)至一組取樣値將降低所通用的排 列順序濾波器演算法的計算複雜度。再者,應注意的是’ 一區段源增益曲線G(t)可以藉由兩鄰近源增益値gj,gj + 1及 內插加權函數W(t)加以描述。因此,如果只需要一組取樣 的源增益曲線G(t),則此完整組的取樣可以由源增益値gj 及一限定組取樣的內插函數W(t)決定。此限定組取樣的內 插函數W(t)可以例如儲存於元資料轉碼器的記憶體中。 吾人可以想出使用兩選擇公式的組合,即排列順序濾 波器演算法與通用排列順序濾波器演算法的組合。例如’ 較佳使用低複雜度排列順序濾波器演算法,其只使用源增 益値gj,於目標方塊尺寸大於或等於源方塊尺寸,而使用 源增益曲線G(t)或一組其取樣的較高複雜度通用排列順序 濾波器演算法係被使用於目標方塊尺寸小於源區塊尺寸的 狀況中。 演算法2 : “最佳匹配”增益 爲了決定符合或至少接近上述用於轉碼的侷限的第二 演算法,源增益曲線G(t)及目標增益曲線G’(t)將相比較。 假設W’(t)爲目標解碼方案的內插函數。例如,用於A AC編 解碼器的內插函數可以被以半窗尺寸爲單位寫成 W’(t) = (Sin(tTt/2))2。此內插或加權函數典型爲窗函數的平 方。應注意的是,一些編解碼器也預見窗切換的可能性, 使得內插函數W’(t)可以由一編碼方塊改變至另一編碼方 -32- 201027517 塊。再者,編解碼器的方塊尺寸也可以改變,以造成窗函 數的改變。這些效應與環境可能藉由選擇適當內插函數 W’(t)給每一增益曲線區段加以考量。 使用目標解碼方案的內插函數w’(t),在目標增益値 8、及8’;+1間之內插目標增益曲線〇’〇)可以被寫成 (〇=g\ (\-w\t-t\ ))+^'+1 ). (10) 整個目標增益曲線G’(t)可以藉由連序鄰近目標增益曲 φ 線區段G’i(t)加以取得。 假設gj,i表示在時間4,|的所有源增益,+ 1, 即在兩連續目標增益値g’i及g’i + 1間之時間間隔內的源增益 値群。應注意的是,由於在源編碼方案及目標編碼方案上 的訊框尺寸的“立即”改變,在時間間隔內的源增益値群及 時間間隔本身的長度可能以特定(ad hoc)基礎地改變。因 此,同時,在tj.i中之i及j的可能組合可以根據一方塊一方 塊爲基礎地改變。 ❹ 選擇小於或等於在時間間隔[t’i,t’i + 1]內的連串源增 益値g’i的目標增益値gjj及更明確地說目標增益曲線區段 G’i(t)的條件可以被寫爲: (11) 換句話說,在時間實例1」的目標增益曲線G’(t)需要 小於或等於在時間實例的源增益値。 定義在時間實例〇厂-1’〇的目標解碼方案的內插函數 ,以採用値W’j^W’di-t’i)並考量目標增益曲線區段 G’i(t)的公式,該條件可以被寫爲 -33- 201027517 客,,(卜 其可以被重新寫爲 , 1 1-F' ^i+l ^ W* IV1 ^1' rr JJ π jj 此耦接組的不等式需要爲在所有目標增益値爲g\,Vi 有效。再者,所有目標增益値g’i需要爲大於或等於0,即
s\>0 > Vi。對於正規化內插函數,即對於具有, 1-FP ❺ 此也造成看到,因此,不等式可以重寫爲: 1 1 g ,+1 ^ gjj g —gjy (12〉
j,t yV 以類似方式,跟隨目標曲線區段G ’ i (t)的鄰近目標增 益曲線區段G’i + 1(t)的不等式可以被寫爲: 〇\+1 (0 = g'M (l - ^'y,(+1)+ g'M W'AM < gJ>M, (13) 其中『"+1 =『Ί+1-Λ+1),及C+1<G,i+1W(+2。此不等式提供 g ’ i + 1的另一條件’即
, ^ 1 ^ j,M , < 1 ,1 „ gi+i-(ι-^,,/^+ι'Fi^g<+2-pFQ^+ii ( } 由於g’,Vi以及內插函數w’(t)被正規化,即, 『Άνί,·/‘。如上所述,i及j的可能組合爲源編碼方案的方 塊尺寸與目標編碼方案的方塊尺寸間之現行關係所給定。 這些可能組合可能演化並一方塊一方塊地有所不同。 設定g’o = 〇,剩餘g’i(i>〇)可以由該組不等式所提供的 範圍選出。 選擇的程序係如圖9a所示,用於目標編碼方案[t’, t’i + 1]大於等於源編碼方案h,^+1]的時間間隔的例子中。 -34- 201027517 圖9 a顯示源增益曲線9 0 1,其係由分別在時間實例t〇至t, 8 的源增益値go至gl8的內插取得。爲了此源增益曲線901, 予以決定轉碼目標增益曲線G’(t)。在所示例子中,此目標 增益曲線包含三目標增益曲線G’〇(t)、G’,(t)、G,2(t),分 別如圖9中之圖形區段902 ' 903及9〇4所示。在時間間隔 [t’i ’广+ 1]內的條件G’KUSgj.i可以被寫成用於該所示例 子爲 G 0 (’〇)幺容〇,G 〇 (’! ) S 约,(?。(’2)幺容2,G 〇 (’3) € 发3,G 〇 (’4)幺 ,G’0 (ί5)彡 gs, 對於G’〇(t)及類似於GMt)及G’2(t)的方式。當使用目 標解碼器W ’( t)的內插函數時,對於j = 0,…6的値 W’hc^W’Oj.o-t’o)可以被計算。藉由在以上提供方程式中 使用這些內插値,可以取得用於目標增益値g’,的一組不等 式’成爲先前選擇目標增益値g’o的函數。將目標增益曲線 G’〇(t)(即,圖形902)匹配至在間隔[t’〇,t、]中之源增益曲 φ 線901的較佳方式爲選擇所有不等式同時符合的最大目標 增益値g ’ i。 應注意的是,目標增益値g ’ i需要被小心由導出不等式 所允許的範圍中拾取。如果目標增益値g’i的局部最佳値被 選出,則上述不等式可能顯著地限制以下目標增益値g’i+1 的可能値之選擇。這最後可能造成振目標增益曲線G ’( t) ,這典型並不是想要的。此一振盪行爲的例子可以看出, 當選擇g’Q = 0時,依據上述方程式(I2)及(I4),將留下很大 自由度用以選擇§\的最佳及最大値。然而,這可能需要 -35- 201027517 g’2的選擇更小或甚至零,由於大校正部份 gl。在下 一步驟中,下一目標增益値g’ 3可以依據該組不等式自由地 最大化。可以看出,此局部最佳化及選擇程序,一次處理 只有一目標增益値g’i,可能造成在目標增益曲線G’(t)中 的不想要的振盪。 因此,較佳地,在更通用最佳化程序內選擇目標增益 値,而不必局部地過配合至該資料。例如,可以藉由將目 標增益値g’i補充至額外侷限,例如藉由將目標增益値限制 大於或等於目標增益値g’i而避免振盪,該目標增益値係依 據上述排列順序濾波器演算法加以決定。然後除了在以最 佳匹配增益演算法之文中所述不等式外這些條件將被符合 〇 再者,應注意的是,當沒有源增益値gj,i存在之目標 時間間隔[t’i,t’1+1]具有時,上述演算法將不 提供不等式G’KtjdHgjd。因此,沒有條件用以限制對應目 標增益値g’i的選擇。當目標編碼方案的方塊/訊框尺寸小 於源編碼方案的方塊尺寸時,可能發生此等狀況。此問題 可以例如藉由施加音訊解碼器的取樣及保持行爲而克服。 例如,在此等例子中,gj,i可以被選擇爲最後知道之源增 益値gj。 或者,較佳地在此等例子中,其中“最佳匹配”增益演 算法並未提供任何條件,以依據上述排列順序濾波器演算 法選擇目標增益値g’ i。再者,在另一實施例中,較佳由間 隔[t’i -冷,t’i+召]選擇可能源增益値gj,其中參數yS可以 -36- 201027517 依據在排列順序濾波器演算法的本文4 擇。使用這些可能源增益値gj,依據所 演算法之不等式可以被公式化,因此, 增益値。 所述“最佳匹配”增益演算法根據领 目標增益値g ’ ;。另外,考量目標增益 其以依據上述公式之內插函數W’(t)造 0 內插。此元資料轉碼器並不需知道用於 插方案,只單純依據已經存在元資料位 。因此,“最佳匹配”增益演算法可以被 性。再者’應注意的是,元資料轉碼器 目標編碼方案之內插函數w’(t)。事實 數的特定取樣W’j.i需要被元資料轉碼器 以被儲存在元資料轉碼器之記憶體作爲 應注意的是,類似於排列順序濾沒 ® 匹配”增益演算法可以被通用化,使得 時源增益曲線也被考慮用於轉碼目的。 算法假定源增益値的時間實例,目標增 於源增益値,即。如果源增 碼器所知’則此條件可以被重新公式化 値的時間實例,目標增益曲線應小於或 即 G’idOSGjd.i)(具有 t,i<tj,iSt’i +丨及 t 此所述之目標增益區段G,Kt)及源增益 線,此不等式可以被寫成: |所述之公式加以選 述“最佳-匹配”增益 可以決定適當目標 ί增益値gj選擇適當 曲線G’(t)的行程, 成目標增益値g’i的 源編碼方案中之內 元流中之源增益値 實施爲低計算複雜 並不需要準確知道 上,只有此內插函 所知。這些取樣可 一表。 芝器演算法,“最佳 不只源增益値,同 “最佳匹配”增益演 益曲線應小於或等 益曲線爲兀資料轉 ,以描述該源增益 等於源增益曲線, j<Ktj + 1。使用於 區段G j (t)的內插曲 -37- 201027517 g\ (l - -1\))+ g'M W\tLi - f,) < g.(l - W(tji - tj))+ -tj). (15) 定義评’^ =评’(^,;-匕)爲在時間實例匕;(即在目標增益 曲線的第i個曲線區段及源增益曲線的第j個曲線區段的時 間實例)的目標編碼方案的內插函數値。在類似方法中, 可以定義Wj,i = W(tj,i-tj)。使用源編碼方案的內插函數及目 標編碼方案的內插函數之取樣値,上述不等式可以改寫爲 +1 ^ τρ- [gj (l - wUi)+ gj^wu - (l - W'Lt )g·, ]. (16)
rr JJ 類似於只使用源增益値的“最佳匹配”增益演算法的公 式,此公式提供一遞迴方法’用以根據其先前目標增益値 g’i計算目標增益値g’i+1。所得演算法被稱爲通用“最佳匹 配”增益演算法。當(t’i + pt’oytj + i-tj)時(即在兩相鄰源增 益値間之時間間隔大於或等於在兩相鄰目標增益値的狀況 )係特別有利。如上所述’對於此等狀況,可能發生未符 合條件+ i的源增益値gji存在的情形。在此等情 況下’通用“最佳匹配”增益演算法將對源增益曲線提供適 當內插增益並允許根據其先前目標增益値g,,及內插源增益 値決定目標增益値g,i+丨。 通用“最佳匹配”增益演算法的功能性之狀況(其中 (t’i+1-t’i)<(tj + 1-tj))可以在圖9b中看到,其中一線性內插增 益曲線921係被轉碼爲s曲線內插增益曲線922。此等狀況 可能於轉碼HE-AAC增益元資料成爲AAC或AC-3增益元資 料發生。 在此特定例子中,源編碼方案的方塊尺寸準確爲6倍 -38- 201027517 之目標編碼方案的方塊尺寸,再者,方塊邊界準確重疊, 即第一目標編碼方塊的時間實例^與第一源編碼方塊的時 間實例t’〇重合’ 1’6與“重合,以此類推。對於圖91)中所之 特定例子,W’j,i=l及上述遞迴公式變成〜)+g;+1%vj 。較佳選項爲選擇最大可能目標增益値,其在此情況下對 應於在時間實例t’i+1之源增益曲線的値。這是在圖9b所示 ’其中’在時間實例t’1Q的目標增益値g,1Q係被以“x”931表 φ 示。整體言之’可以看出目標增益曲線922良好匹配源增 益曲線9 2 1。也可以看出,如方程式(丨5)所要求,目標增益 曲線922在時間實例於或等於源增益曲線921。另一方 面’由於目標編碼方案的S曲線內插,目標增益曲線有時 大於源增益曲線。如上所強調,此通用侷限的目標增益曲 線應一直小於或等於源增益曲線的喚起在某些轉碼狀況下 可能有利,尤其當較強的強調係放在兩增益曲線的整體匹 配上。 φ 應注意的是’可能較佳地使用“最佳匹配”增益演算法 與通用“最佳匹配”增益演算法的組合。例如,“最佳匹配” 增益演算法可以用於目標編碼方案的方塊尺寸大於或等於 源編碼方案的方塊尺寸的狀況中,尤其由AC-3至HE AAC 的轉碼。另一方面,通用“最佳匹配”增益演算法可以用於 當目標編碼方案的方塊尺寸係小於源編碼方案的方塊尺寸 ,尤其是將由HE-AAC轉換至AC-3。藉由組合演算法,於 計算複雜性與匹配效能間可以作出一取捨。 -39 - 201027517 演算法3 :內插挑選 利用爲MPEG-4 HE AAC所提供之額外DRC增益控制功 能的另一演算法也稱爲增益內插方案。如上所述,HE AAC允許不同內插方案的選擇,以由兩鄰近增益値間之線 性內插或兩鄰近編碼方塊間之八時間實例之一的突出“攻 擊”狀內插選擇。因此,增益內插方案致能於兩增益控制 點或增益値間之增益內插曲線形狀的控制。這已經在圖3 的圖表302及3 03中描述。可以看出慢內插302將適用以模 組化一平滑指數增益釋放,而內插方案3 03可以模組化尖 增益攻擊。 此觀察引起以下演算法,用以將一源增益曲線轉碼至 目標增益曲線,例如HE A AC,其中目標編碼方案允許不 同內插方案的選擇或不同內插曲線型樣。目標編碼方案允 至少允許可能平滑“釋放”內插曲線型樣及可能突出“攻擊” 內插曲線型樣的選擇。該演算法可以包含步驟: 1. 評估源增益曲線的斜率。這可以例如藉由分析其一 階導數或藉由分計算適當鄰接源增益値間之差加以完成。 如果負斜率超出某一臨限,則將現行訊框分類爲“攻擊 ”(A),否則分類現行訊框爲“釋放”(R)。 2. 如果現行訊框已經分類爲(R),則依據上述排列順序 濾波器演算法決定下一目標增益値。再者’選擇目標編碼 方案的平滑或“釋放”內插曲線。 3 .如果現行訊框已經被分類爲(A) ’則依據上述之排列 順序演算法決定下一目標增益値。如果源編碼方案爲轉換 -40 - 201027517 爲主編解碼器,例如AAC或AC-3,則下一目標增益値也可 以被選擇爲對中於AAC窗中心的目標增益的最小値。在決 定適當下一目標增益値後,選擇目標編碼方案的“攻擊”內 插曲線型樣。再者,如果目標編碼方案允許在不同時間實 例選擇多數“攻擊”內插曲線型樣之一,則選擇“攻擊”內插 曲線型樣中,其斜率係最接近源增益曲線的一階導數的絕 對値爲最高的一點,即在該點的斜率爲最陡者。取決於源 φ 編碼方案,此在源增益曲線上的點可以由不同手段決定。 例如,對於AAC的S-形狀內插曲線,在兩相鄰源增益値間 之最陡斜率的點爲兩源增益値間之中點。 圖10顯示增益元資料由轉換爲主編碼方案,例如AAC 或AC-3轉碼爲HE AAC的模擬結果。圖形1001顯示源增益 曲線及圖形1 002顯示目標增益曲線。可以看出,當使用所 述內插挑選演算法時,可以取得非常良好之匹配結果。事 實上,觀察到之結果將較以上述排列順序濾波器演算法取 φ 得爲佳之結果。尤其,這是由於內插挑選演算法額外使用 目標編碼方案的功能性,以在不同內插曲線間選擇。此選 擇係根據在“攻擊”區段及“釋放”區段中之源增益曲線的分 類加以執行。換句話說’內插挑選演算法不只考量源增益 値及窗及/或目標編碼系統的內插函數,同時也分析源增 益曲線的行程,以決定適當目標增益値並最後決定一適當 目標增益曲線型樣。簡言之,可以認爲內插挑選演算法考 量源增益値及源解碼器的窗及/或內插函數及目標增益値 及目標解碼器的窗及/或內插函數。 -41 - 201027517 本文件提供幾項用以將增益元資料轉碼於源編碼方案 及目標編碼方案的演算法。此增益元資料的轉碼需要被執 行於音訊流的製作中心與音訊流的無線廣播最終點間之幾 個時機點。所述演算法允許在不同編碼方案間之彈性轉碼 ,該編碼方案具有不同長度的編碼方塊或訊框及在相鄰增 益値間有不同時間間隔。再者,這些長度的編碼方塊可以 在任意時間改變及在相鄰增益値間之時間間隔可以在音訊 流內的任意時間改變。所述演算法考量此源及目標編碼方 案的彈性並允許於變化方塊長度的編碼方案間之彈性轉碼 及改變之時間間隔。另外,所述演算法允許於源增益曲線 與目標增益曲線間之最佳匹配並可以考量例如目標增益曲 線應一直在源增益曲線下的侷限,以避免不想要的作用, 例如限幅。 最終應注意已經描述了符合有關於計算複雜度及在元 資料轉碼器內處理的資料量的不同要求之多數演算法。較 佳地,單純根據在元資料位元流內可得之源增益値執行元 資料轉碼。這將提供具有減少處理器及記憶體要求的很低 複雜度轉碼演算法。這是例如排列順序濾波器演算法的情 形。轉碼效能可以在額外考量內插方案及目標編碼設內窗 函數而加以改良。即,例如“最佳匹配”時的增益演算法及 內插挑選演算法。在此時,元資料轉碼器也可以直接根據 由元資料位元流所取得之資訊執行轉碼。事實上,在元資 料轉碼器中並不需要有關於源編碼方案的詳細知識。最終 ,如果內插方案及源編碼方案的窗函數被考量,則元資料 -42- 201027517 轉碼可以進一步改良。這是在通用排列順序濾 及通用“最佳匹配”增益演算法。然而,這些演 關元資料轉碼器之源編碼方案的額外資訊。此 如儲存在元資料轉碼器的記憶體中並可以限制 選擇取樣。例如,如果元資料轉碼係執行於消 上,此資料可以儲存於機頂盒記億體中。 應注意的是,上述演算法可以以多種方式 Φ ,其可以較佳地使用一演算法,用於特定轉碼 轉碼狀況改變,則切換至另一演算法。此改變 能發生於當編碼方案的方塊尺寸例如由一長方 方塊。再者,當應用不同窗函數時,可以改變 因此,應了解的是,於此所述之演算法的組合 本發明之一部份。除了選擇一特定轉碼狀況的 算法外,較佳可以採用可用之參數,例如排列 演算法的參數/5至特定轉碼狀況。例如,如果 φ 案或目標編碼方案上,編碼方塊的長度由長訊 訊框,則可以適當地修改施加在排列順序演算 間隔。 通常,應了解的是,於本文件中所述之演 關參數可以以任何組合施加並根據每方塊一戈 立即”改變,以適用至現行及連續改變轉碼狀況 【圖式簡單說明】 圖1爲典型轉碼鏈; 波器演算法 算法需要有 資料可以例 至窗函數的 費者機頂盒 組合。例如 狀況,如果 轉碼狀態可 塊改變至短 內插狀態。 可以認爲是 適當轉碼演 順序濾波器 在源編碼方 框改變爲短 法中之時間 算法及其相 f塊爲基礎“ -43- 201027517 圖2爲音訊編解碼的典型編碼及解碼結構; 圖3爲不同音訊編解碼的不同內插增益曲線; 圖4 a爲音訊編解碼的內插函數; 圖4b爲有關於圖4 a的內插函數的窗函數: 圖4 c爲用於非對稱窗函數及其相關內插函數的例子; 圖5爲一連串序連內插增益曲線; 圖6爲第一轉碼演算法的增益匹配特性的第一例; 圖7a及7b爲顯示第一轉碼演算法的增益匹配特性的第 二例; 圖8爲使用第一轉碼演算法的增益元資料的轉碼之實 驗結果; 圖9a及9b爲第二轉碼演算法的增益匹配特性;及 圖1〇爲使用第三轉碼演算法的增益元資料的轉碼的實 驗結果。 【主要元件符號說明】 100 :鏈 1 〇 1 :製作中心 102 :無線廣播格式 103 :廣播格式 104 :網路 105 :機頂盒 106 :消費者設備 2〇〇 :音訊編碼器 201027517 201 :轉換爲主編碼器 202 : QMF分析 203 :窗函數 204 : TDAC轉換器 205 :元件 210 :音訊解碼器 2 1 1 :轉換爲主解碼器 212 : SBR分析 213 :窗函數 214 : TDAC轉換器 2 1 5 :元件
-45-
Claims (1)
- 201027517 七、申請專利範圍: 1. 一種將有關於動態範圍控制之音訊增益元資料由第 一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方 案的第二增益元資料的方法,其中 該第一及第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有至少一相關增益値;及 其中該方法包含步驟: 根據該第一增益元資料的增益値,選擇該第二增益元 資料的增益値,使得有關於該第二增益元資料的該增益値 的時間實例旁的時間間隔內,該第一增益元資料的最小增 益値被選出; 如果沒有該第一增益元資料的增益値落在有關於該第 二增益元資料的該增益値的該時間實例旁的該時間間隔內 ,則選擇該第二增益元資料的該增益値爲 有關於該編碼方塊的該第二增益元資料的該增益値, 該編碼方塊超前有關於該第二增益元資料的該增益値的該 編碼方塊;或 該第一增益元資料的該增益値,其在該時間間隔的前 一時間間隔。 2. 如申請專利範圍第1項所述之方法,其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的不同 時間長度。 3 .如申請專利範圍第1項所述之方法,其中該時間間 隔的上及下限係爲一時間常數所決定’該時間常數係分別 -46- 201027517 加入至與該第二增益元資料的該增益値相關的該時間實例 及由該第二增益元資料的該增益値相關的該時間實例減去 〇 4. 如申請專利範圔第3項所述之方法’其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編 碼音訊信號的 某些時間長度,及其中該時間常數係大於或等於 該第一音訊編碼方案的該編碼方塊的該時間長度;及 φ 該第二音訊編碼方案的該編碼方塊的該時間長度的最 大値。 5. 如申請專利範圍第3項所述之方法’其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的某些 時間長度及其中該時間常數小於 該第一音訊編碼方案的該編碼方塊的該時間長度;及 該第二音訊編碼方案的該編碼方塊的該時間長度的最 大値。 Φ 6·如申請專利範圍第1項所述之方法,其中該第二音 訊編碼方案允許不同內插曲線的選擇,內插曲線內插該第 二增益元資料的相鄰增益値’以形成第二增益曲線;及其 中該方法更包含步驟: 根據該第一增益元資料的該增益値,在該第二增益元 資料的兩相鄰增益値間,選擇一適當內插曲線。 7.如申請專利範圍第6項所述之方法,其中該適當內 插曲線係根據該第一增益元資料的兩相鄰增益値間之差加 以選擇。 -47- 201027517 8. 如申請專利範圍第6項所述之方法,其中 第一增益曲線係相關於該第一增益元資料的該增益値 ;及 該第一增益曲線係藉由內插該第一增益元資料之相鄰 增益値而取得,及 該方法更包含步驟:根據該第一增益曲線的斜率,在 該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線 〇 9. 如申請專利範圍第8項所述之方法,更包含步驟: 如果該第一增益曲線的負斜率超出預定臨限値,則檢 出一增益攻擊; 如果該第一增益曲線的負斜率低於預定臨限値,則檢 出一增益釋放;及 根據該第一增益曲線的檢出增益攻擊或增益釋放,在 該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線 ❹ 1 0·如申請專利範圍第9項所述之方法,其中該方法更 包含步驟: 根據該第一增益曲線的該斜率的絕對値的最大値之位 置’選擇該第二增益元資料的兩相鄰增益値間之該適當內 插曲線。 11,一種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 -48- 201027517 該第一及第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有至少一相關增益値;及 第一增益曲線相關於該第一增益元資料的該增益値 及 其中該方法包含步驟: 選擇相關於該第二增益元資料之該增益値的時間實例 旁的時間間隔內的該第一增益曲線的最小値作爲該第二增 Φ 益元資料的該增益値。 12.如申請專利範圍第11項所述之方法,其中 該選擇該第一增益曲線的最小値的步驟包含在該時間 間隔內選擇該第一增益曲線的一組取樣的最小値。 1 3 .如申請專利範圍第1 2項所述之方法,其中 該第一增益曲線的該組取樣對應於相關於落在該時間 間隔內的該第二增益値的該編碼方塊的時間實例的該第一 增益曲線的該等取樣。 φ 1 4 . —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有至少一相關增益値;及 相鄰編碼方塊的一連串增益値係被內插,以定義增益 曲線;及 其中該方法包含步驟:根據該第一增益元資料的增益 -49- 201027517 値’選擇該第二增益元資料的該增益値,使得第二增益曲 線低於第一增益曲線。 15.—種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 該第一與第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有至少一相關增益値;及 第一增益曲線係相關於該第一增益元資料的該增益値 » 第二增益曲線係相關於該第二增益元資料的該增益値 :及 其中該方法包含步驟··在相關於該第一音訊編碼方案 的編碼方塊的時間實例及相關於該第二音訊編碼方案的編 碼方塊的時間實例’選擇該第二增益元資料的該增益値使 得該第二增益曲線係小於或等於該第一增益曲線。 1 6 ·如申請專利範圍1 5項所述之方法,其中 該第一增益曲線係由相關於相鄰第一增益値的區段與 第一窗函數所構成;及 該第二增益曲線係由相關於相鄰第二增益値的區段及 第二窗函數所構成。 17.—種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統,其中 該第一與第二音訊編碼方案使用編碼方塊;及 -50- 201027517 各個編碼方塊具有至少一相關增益値;及 其中該轉碼系統包含: 選擇手段,用以根據該第一增益元資料的該增益値, 選擇該第二增益元資料的增益値,使得在相關於該第二增 益兀資料的該增益値的時間實例旁的時間間隔內,該第一 增益兀資料的最小增益値被選出,及如果該第一增益元資 料的增益値未落在相關於該第二增益元資料的該增益値的 φ 時間實例旁的時間間隔內,則選擇該第二增益元資料的該 增益値爲 相關於該編碼方塊的該第二增益元資料的該增益値, 該編碼方塊超前相關於該第二增益元資料的該增益値的該 編碼方塊;或 在該時間間隔前一個之該第一增益元資料的該直 0 18.—種將有關於動態範圍控制的音訊增益元資料 Φ 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統,其中 該第一與第二音訊編碼方案使用編碼方塊;& 各個編碼方塊具有至少一相關增益値; 第一增益曲線係相關於該第一增益元資料的該if # {直 •及 其中該轉碼系統包含: 選擇手段,用以在相關於該第二增益元資料的胃增益 値的該時間實例旁的時間間隔內選擇該第一增益曲@ 6勺胃 -51 - 201027517 小値作爲該第二增益元資料的該增益値。 19. —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統’其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有相關增益値:及 相鄰編碼方塊的一連串增益値被內插’以定義增益曲 線;及 其中該轉碼系統包含:選擇手段’用以根據該第一增 益元資料的增益値’選擇該第二增益元資料的該增益値’ 使得第二增益曲線係低於第一增益曲線。 20. —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統’其中 該第一與第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有相關增益値; 第一增益曲線係相關於該第一增益元資料的該增益値 ;及 第二增益曲線係相關於該第二增益元資料的該增益値 •,及 其中該轉碼系統包含.選擇手段’用以在相關於該第 一音訊編碼方案的該編碼方塊的時間實例及相關於該第二 音訊編碼方案的該編碼方塊的時間實例,選擇該第二增益 -52- 201027517 元資料的該增益値,使得該第二增益曲線係小於或等於該 第一增益曲線。 21. —種電腦程式產品,包含可執行指令,用以當被 執行於電腦時,執行如申請專利範圍第1至1 6項中任一項 所述之方法。 22. —種機頂盒,用以解碼接收之多媒體信號,該機 頂盒包含: φ 接收器,用以接收第一編碼方案的多媒體信號; 轉碼單元,用以將第一編碼方案的多媒體信號轉碼爲 第二編碼方案的多媒體信號;及 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一及第二音訊編碼方案使用編碼方塊;及 φ 各個編碼方塊具有至少一相關增益値:及 其中該轉碼單元根據該第一增益元資料的該增益値, 選擇該第二增益元資料的增益値,使得在相關於該第二增 益元資料的該增益値的時間實例旁的時間間隔內,該第一_ 增益元資料的最小增益値被選擇;及如果該第一增益元畜 料的增益値未落在相關於該第二增益元資料的該增益値的 時間實例旁的時間間隔內時,則該第二增益元資料的該;t曾 益値被選擇爲 相關於該編碼方塊的該第二增益元資料的該增益値, -53- 201027517 該編碼方塊係在相關於該第二增益元資料的該增益値的編 碼方塊之前;或 該時間間隔前一個的該第一增益元資料的該增益値。 23·—種解碼所接收之多媒體信號的機頂盒,該機頂 盒包含: 接收器,用以接收第一編碼方案之多媒體信號·, 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 @ 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有至少一相關增益値 第一增益曲線相關於該第一增益元資料的該增益値; 及 ⑩ 其中該轉碼單元在相關於該第二增益元資料的該增益 値的時間實例旁的時間間隔內,選擇該第一增益曲線的最 小値作爲該第二增益元資料的該增益値。 24. —種用以解碼所接收之多媒體信號的機頂盒,該 機頂盒包含: 接收器,用以接收第一編碼方案之多媒體信號·, 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 -54- 201027517 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有相關增益値;及 Φ 相鄰編碼方塊的一連串增益値係被內插,以定義增益 曲線,及 其中該轉碼單元根據該第一增益元資料的增益値,選 擇該第二增益元資料的該增益値,使得第二增益曲線係低 於第一增益曲線。 25.—種解碼所接收之多媒體信號的機頂盒,該機頂 盒包含: 接收器,用以接收第一編碼方案之多媒體信號; ❹ 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有一相關增益値; 第一增益曲線係相關於該第一增益元資料的該等增益 -55- 201027517 値;及 第二增益曲線係相關於該第二增益元資料的該等增益 値;及 其中該轉碼系統在該第一音訊編碼方案的該編碼方塊 相關的時間實例及在該第二音訊編碼方案的該編碼方塊相 關的時間實例,選擇該第二增益元資料的該增益値’使得 該第二增益曲線係小於或等於該第一增益曲線。 26.如申請專利範圍第1至16項中任一項所述之方法’ 其中該第一與第二音訊編碼方案爲杜比E、杜比數位、 AAC、HE AAC 之一
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10149708P | 2008-09-30 | 2008-09-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201027517A true TW201027517A (en) | 2010-07-16 |
TWI457913B TWI457913B (zh) | 2014-10-21 |
Family
ID=41264281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098131941A TWI457913B (zh) | 2008-09-30 | 2009-09-22 | 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8798776B2 (zh) |
EP (1) | EP2332140B1 (zh) |
JP (1) | JP5129888B2 (zh) |
CN (2) | CN102171755B (zh) |
AR (1) | AR073676A1 (zh) |
TW (1) | TWI457913B (zh) |
WO (1) | WO2010039441A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI451746B (zh) * | 2011-11-04 | 2014-09-01 | Quanta Comp Inc | 視訊會議系統及視訊會議方法 |
US9037457B2 (en) | 2011-02-14 | 2015-05-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec supporting time-domain and frequency-domain coding modes |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
TWI560699B (en) * | 2013-07-22 | 2016-12-01 | Fraunhofer Ges Forschung | Apparatus and method for efficient object metadata coding |
US9536530B2 (en) | 2011-02-14 | 2017-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
US9578435B2 (en) | 2013-07-22 | 2017-02-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for enhanced spatial audio object coding |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
US9743210B2 (en) | 2013-07-22 | 2017-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US10249311B2 (en) | 2013-07-22 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
PL2232700T3 (pl) | 2007-12-21 | 2015-01-30 | Dts Llc | System regulacji odczuwanej głośności sygnałów audio |
WO2010053728A1 (en) * | 2008-10-29 | 2010-05-14 | Dolby Laboratories Licensing Corporation | Signal clipping protection using pre-existing audio gain metadata |
WO2010075377A1 (en) | 2008-12-24 | 2010-07-01 | Dolby Laboratories Licensing Corporation | Audio signal loudness determination and modification in the frequency domain |
TWI538394B (zh) | 2009-04-10 | 2016-06-11 | 杜比實驗室特許公司 | 利用順逆向濾波方式獲取所欲非零相移之技術 |
TWI501580B (zh) | 2009-08-07 | 2015-09-21 | Dolby Int Ab | 資料串流的鑑別 |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012026092A1 (ja) * | 2010-08-23 | 2012-03-01 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8521541B2 (en) * | 2010-11-02 | 2013-08-27 | Google Inc. | Adaptive audio transcoding |
JP5719966B2 (ja) | 2011-04-08 | 2015-05-20 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定 |
TWI603632B (zh) | 2011-07-01 | 2017-10-21 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
US9183842B2 (en) * | 2011-11-08 | 2015-11-10 | Vixs Systems Inc. | Transcoder with dynamic audio channel changing |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
CN112185399A (zh) * | 2012-05-18 | 2021-01-05 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的*** |
EP2898510B1 (en) * | 2012-09-19 | 2016-07-13 | Dolby Laboratories Licensing Corporation | Method, system and computer program for adaptive control of gain applied to an audio signal |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9344828B2 (en) * | 2012-12-21 | 2016-05-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
CN109102815B (zh) | 2013-01-21 | 2023-09-19 | 杜比实验室特许公司 | 编码装置和方法、转码方法和转码器、非暂态介质 |
US9841941B2 (en) | 2013-01-21 | 2017-12-12 | Dolby Laboratories Licensing Corporation | System and method for optimizing loudness and dynamic range across different playback devices |
WO2014114781A1 (en) * | 2013-01-28 | 2014-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US9858932B2 (en) * | 2013-07-08 | 2018-01-02 | Dolby Laboratories Licensing Corporation | Processing of time-varying metadata for lossless resampling |
EP2833549B1 (en) | 2013-08-01 | 2016-04-06 | EchoStar UK Holdings Limited | Loudness level control for audio reception and decoding equipment |
EP2838196B1 (en) * | 2013-08-12 | 2023-04-26 | Bellevue Investments GmbH & Co. KGaA | System and method for controlled dynamics adaptation for musical content |
US9380383B2 (en) * | 2013-09-06 | 2016-06-28 | Gracenote, Inc. | Modifying playback of content using pre-processed profile information |
EP3044790B1 (en) | 2013-09-12 | 2018-10-03 | Dolby International AB | Time-alignment of qmf based processing data |
EP4379714A2 (en) * | 2013-09-12 | 2024-06-05 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
CN105556837B (zh) | 2013-09-12 | 2019-04-19 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
RU2750644C2 (ru) * | 2013-10-18 | 2021-06-30 | Телефонактиеболагет Л М Эрикссон (Пабл) | Кодирование и декодирование положений спектральных пиков |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP3522157B1 (en) * | 2013-10-22 | 2021-09-22 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
CA3162763A1 (en) * | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
US9608588B2 (en) * | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
CN109087653B (zh) * | 2014-03-24 | 2023-09-15 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
WO2015144587A1 (en) * | 2014-03-25 | 2015-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
WO2015180866A1 (en) | 2014-05-28 | 2015-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Data processor and transport of user control data to audio decoders and renderers |
EP4044180A1 (en) | 2014-10-01 | 2022-08-17 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
CN110164483B (zh) | 2014-10-03 | 2021-03-02 | 杜比国际公司 | 渲染音频节目的方法和*** |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US10097594B1 (en) * | 2017-08-31 | 2018-10-09 | T-Mobile Usa, Inc. | Resource-managed codec selection |
AU2019252524A1 (en) | 2018-04-11 | 2020-11-05 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
WO2020028833A1 (en) | 2018-08-02 | 2020-02-06 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10743170B1 (en) | 2019-11-28 | 2020-08-11 | Motorola Solutions, Inc. | Device, system and method for emergency audio transmission |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5814506A (en) * | 1995-08-02 | 1998-09-29 | New England Biolabs, Inc. | Over-expression and purification of a truncated thermostable DNA polymerase by protein fusion |
JP2001282261A (ja) | 2000-03-30 | 2001-10-12 | Canon Inc | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 |
EP1586045A1 (en) * | 2002-12-27 | 2005-10-19 | Nielsen Media Research, Inc. | Methods and apparatus for transcoding metadata |
EP1513137A1 (en) | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN100542198C (zh) | 2006-01-11 | 2009-09-16 | 华为技术有限公司 | 一种离散多音频调制数据传输方法及*** |
US8239190B2 (en) | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
CN101067931B (zh) | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与*** |
WO2009128663A2 (en) * | 2008-04-16 | 2009-10-22 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN102007533B (zh) * | 2008-04-16 | 2012-12-12 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
KR101061129B1 (ko) * | 2008-04-24 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 이의 장치 |
-
2009
- 2009-09-10 US US12/556,788 patent/US8798776B2/en active Active
- 2009-09-17 CN CN2009801383855A patent/CN102171755B/zh active Active
- 2009-09-17 CN CN201210146227.8A patent/CN102682780B/zh active Active
- 2009-09-17 EP EP09792645A patent/EP2332140B1/en active Active
- 2009-09-17 JP JP2011530099A patent/JP5129888B2/ja active Active
- 2009-09-17 WO PCT/US2009/057251 patent/WO2010039441A1/en active Application Filing
- 2009-09-22 TW TW098131941A patent/TWI457913B/zh active
- 2009-09-24 AR ARP090103682A patent/AR073676A1/es active IP Right Grant
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9037457B2 (en) | 2011-02-14 | 2015-05-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec supporting time-domain and frequency-domain coding modes |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
TWI488176B (zh) * | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
US9536530B2 (en) | 2011-02-14 | 2017-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
TWI451746B (zh) * | 2011-11-04 | 2014-09-01 | Quanta Comp Inc | 視訊會議系統及視訊會議方法 |
US9699584B2 (en) | 2013-07-22 | 2017-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US10659900B2 (en) | 2013-07-22 | 2020-05-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
TWI560699B (en) * | 2013-07-22 | 2016-12-01 | Fraunhofer Ges Forschung | Apparatus and method for efficient object metadata coding |
US9743210B2 (en) | 2013-07-22 | 2017-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US9788136B2 (en) | 2013-07-22 | 2017-10-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US10249311B2 (en) | 2013-07-22 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US10277998B2 (en) | 2013-07-22 | 2019-04-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US9578435B2 (en) | 2013-07-22 | 2017-02-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for enhanced spatial audio object coding |
US10701504B2 (en) | 2013-07-22 | 2020-06-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US10715943B2 (en) | 2013-07-22 | 2020-07-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US11227616B2 (en) | 2013-07-22 | 2022-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
US11330386B2 (en) | 2013-07-22 | 2022-05-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
US11337019B2 (en) | 2013-07-22 | 2022-05-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US11463831B2 (en) | 2013-07-22 | 2022-10-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for efficient object metadata coding |
US11910176B2 (en) | 2013-07-22 | 2024-02-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for low delay object metadata coding |
US11984131B2 (en) | 2013-07-22 | 2024-05-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for audio encoding and decoding for audio channels and audio objects |
Also Published As
Publication number | Publication date |
---|---|
US8798776B2 (en) | 2014-08-05 |
CN102171755B (zh) | 2012-09-19 |
AR073676A1 (es) | 2010-11-24 |
CN102171755A (zh) | 2011-08-31 |
JP5129888B2 (ja) | 2013-01-30 |
EP2332140B1 (en) | 2013-02-20 |
CN102682780B (zh) | 2014-07-16 |
WO2010039441A1 (en) | 2010-04-08 |
TWI457913B (zh) | 2014-10-21 |
EP2332140A1 (en) | 2011-06-15 |
JP2012504260A (ja) | 2012-02-16 |
CN102682780A (zh) | 2012-09-19 |
US20100083344A1 (en) | 2010-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI457913B (zh) | 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒 | |
US10276173B2 (en) | Encoded audio extended metadata-based dynamic range control | |
KR101761041B1 (ko) | 음량 및 동적 범위 제어에 대한 메타데이터 | |
JP5603339B2 (ja) | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 | |
KR101849612B1 (ko) | 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치 | |
RU2689438C2 (ru) | Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа | |
EP1667110B1 (en) | Error reconstruction of streaming audio information | |
US8060042B2 (en) | Method and an apparatus for processing an audio signal | |
KR101108060B1 (ko) | 신호 처리 방법 및 이의 장치 | |
TW201145816A (en) | System for combining loudness measurements in a single playback mode | |
US5845251A (en) | Method, system and product for modifying the bandwidth of subband encoded audio data | |
RU2477532C2 (ru) | Устройство и способ кодирования и воспроизведения звука | |
KR102605961B1 (ko) | 고해상도 오디오 코딩 | |
KR100782261B1 (ko) | 오디오 배속 조절 기반 비디오 동기화방법 | |
US6516299B1 (en) | Method, system and product for modifying the dynamic range of encoded audio signals | |
CN113302684B (zh) | 高分辨率音频编解码 | |
WO2021200151A1 (ja) | 送信装置、送信方法、受信装置、及び受信方法 | |
JP2021124719A (ja) | 音声符号化装置および音声復号装置、ならびにプログラム | |
CN113302688A (zh) | 高分辨率音频编解码 | |
CN113348507A (zh) | 高分辨率音频编解码 | |
Series | Low delay audio coding for broadcasting applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |