TW201027517A - Transcoding of audio metadata - Google Patents

Transcoding of audio metadata Download PDF

Info

Publication number
TW201027517A
TW201027517A TW098131941A TW98131941A TW201027517A TW 201027517 A TW201027517 A TW 201027517A TW 098131941 A TW098131941 A TW 098131941A TW 98131941 A TW98131941 A TW 98131941A TW 201027517 A TW201027517 A TW 201027517A
Authority
TW
Taiwan
Prior art keywords
gain
metadata
audio
curve
coding scheme
Prior art date
Application number
TW098131941A
Other languages
English (en)
Other versions
TWI457913B (zh
Inventor
Wolfgang A Schildbach
Kurt M Krauss
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW201027517A publication Critical patent/TW201027517A/zh
Application granted granted Critical
Publication of TWI457913B publication Critical patent/TWI457913B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

201027517 六、發明說明: 【發明所屬之技術領域】 本發明關係於音訊編碼的領域。尤其,有關於在不同 音訊編碼方案間之音訊元資料的轉碼。 【先前技術】 隨著數位電視及無線電系統的廣泛流行,想要導引節 φ 目音量及動態範圍的接收機側控制及控制立體音降混 (downmix)的元資料(即有關資料的資料)愈來愈重要。因爲 音訊資料的無線廣播格式或傳輸格式並不必然與節目製作 或回送格式相同,即,音訊信號在建立或處理後所用之編 碼方案不必然相同,這表示必須使元資料由一格式至另一 格式進行轉碼。隨著被稱爲aacPlus的音訊編解碼器HE AAC的引入幾個新廣播系統中,已經有課題針對如何最佳 編碼新元資料及如何將現行存在元資料轉碼爲HE AAC或 φ 由HE AAC轉出。 HE ACC(高效先進音訊編碼)係爲現行低位元率編解碼 器,提供全頻寬近CD音質的48kbps立體音。HE AAC規格 下,已經被標準化於MPEG-4中。該規格供在解碼器中之 元資料的選用應用的加強方法,以改良出現在原始MPEG-2 A AC定義中出現的若干缺點。尤其,其允許元資料的規 格,例如DRC(動態範圍控制)、DN(對話正規化)或由多頻 道至立體音的降混,這係大量用於廣播中,以完成特別是 收聽環境之原始節目材料的適當再現。 -5- 201027517 雖然例如HE ACC的編解碼器被廣泛用於廣播中,但 在製作側及接收側上,有不同編碼方案係很常見。例如, 杜比E編碼方案經常爲內容製作者所使用,而也稱爲ac_3 的杜比數位編碼方案或杜比D方案也經常被用於劇院及家 用劇院解碼系統中。因此,有需要在不同編碼方案間之音 訊元資料作轉碼,以確保在製作側所原來設定的元資料以 未惡化方式到達最終解碼系統。此目標通常爲當使受到原 始定義元資料的原始編碼音訊串流與受到轉換格式元資料 的接收音訊串流相比較時確保收聽者未檢出感觀差異或幾 乎沒有感觀差異。以下之發明有關於此問題並界定將元資 料由一壓縮位元流轉譯至一不同壓縮位元流格式之方法, 特別是當兩格式的訊框(framing)並不相容時。 【發明內容】 本發明描述一種用以將有關於動態範圍控制的音訊增 益元資料由第一音訊編碼方案的第一增益元資料轉碼 (transcoding)爲第二音訊編碼方案的第二增益元資料的方 法,其中該第一及第二音訊編碼方案使用編碼方塊及其中 各個編碼方塊具有至少一相關增益値。該方法包含根據該 第一增益元資料的增益値,以選擇該第二增益元資料的增 益値之步驟’使得該第一增益元資料的最小增益値在相關 於第二增益元資料的增益値的時間實例旁的時間間隔內選 出。 此第一與第二編碼方案的例子可以爲杜比E、AAC、 201027517 Η E A A C及/或杜比數位(杜比D)及其變化型,例如杜比數位 +。第一音訊編碼方案也可以稱爲在元資料轉碼器輸入的 源編碼方案,而第二音訊編碼方案也可以稱爲在元資料轉 碼器之輸出目標編碼方案。兩編碼方案均界定相關於編碼 音訊信號的元資料。典型地,內藏編碼方案將編碼音訊信 號分段爲編碼方塊。取決於編碼方案,此等編碼方塊可以 包含不同量的編碼信號取樣。再者,編碼方塊也可以涵蓋 φ 不同時間長度之編碼音訊信號。通常,各個編碼方塊具有 相關元資料,其也包含予以施加至特定編碼方塊的音訊信 號的增益値。另一方面’很多音訊編碼方案施加所謂取樣 保持行爲,其維持現行增益値,直到更新增益値接收的瞬 間。因此,此時,現行增益値係有關於編碼方塊,直到更 新增益値被收到爲止。 依據本發明另一態樣,用以選擇第二元資料的增益値 之時間間隔係爲上下限所定義。此上下限係爲個別增減至 φ 相關於第二增益元資料的增益値的時間實例的一時間常數 所決定。換句話說,在較佳實施例中,該間隔係對稱於第 二增益元資料的增益値的時間實例。 此時間常數可以被選擇’使得其大於或等於第一音訊 編碼方案的編碼方塊的時間長度與第二音訊編碼方案的編 碼方塊之時間長度的最大値。如果時間常數係被選擇,則 所述方法Θ到對增益過衝及限幅有抵抗之轉碼增益値。在 某些狀況下’可以確定轉碼增益元資料從不會超出源增益 元資料。 201027517 另一方面,時間常數也可以被選擇小於第一音訊編碼 方案的編碼方塊的時間長度與第二音訊編碼方案的編碼方 塊的時間長度之最大値。這是有利於在源增益元資料與目 標增益元資料間完成良好匹配。 在某些狀況下,可能發生第一增益元資料的增益値並 未落在有關於第二增益元資料的增益値之時間實例旁的時 間間隔內。例如,此發生於如果時間常數係被選擇以相對 地小或者第二音訊編碼方案的編碼方塊的時間長度係小於 第一音訊編碼方案的編碼方塊的時間長度。在此時,該方 法可以選擇第二增益元資料的增益値爲有關於編碼方塊第 二增益元資料增益値,該編碼方塊係在有關於第二增益元 資料的增益値的編碼方塊之前。或者,該方法也可以選擇 在時間間隔之前的第一增益元資料的增益値作爲第二增益 元資料的增益値。換句話說,轉碼器可以使用音訊編碼方 案的取樣保存行爲並維持現行增益値,直到接收到更新增 益値爲止。 依據本發明另一態樣,該方法更適用於該第二音訊編 碼方案允許不同內插曲線的選擇,其內插第二增益元資料 的鄰近增益値,以形成第二增益曲線。此音訊編碼方案例 爲HE A AC,其允許特別適用於增益釋放之線性內插曲線 以及特別適用於增益攻擊的多數突出內插曲線的選擇。如 果第二音訊編碼方案提供此功能,則該方法可以包含根據 第一增益元資料的增益値,在第二增益元資料的兩相鄰增 益値間選擇適當之內插曲線。 ~ 8 - 201027517 該適當之內插曲線可以例如根據第一增益元資料的兩 相鄰增益値間之差加以選擇。例如,如果第一源增益値( 很)高及下一源增益値(很)低,則可以選擇“攻擊”狀內插曲 線。另一方面,如果第一與下一源增益値相當地相似,則 可以選擇“釋放”狀內插曲線。 或者,如果第一增益曲線係相關於第一增益元資料的 增益値,而此第一增益曲線可以藉由內插第一增益元資料 Φ 的相鄰增益値加以取得,則適當內插曲線可以根據第一增 益曲線的斜率加以選擇。明確地說,如果第一增益曲線的 負斜率超出預定臨限値,則可以檢出增益攻擊。換句話說 ,如果第一增益曲線陡降,則可以檢出增益攻擊。另一方 面,如果第一增益曲線的負斜率低於預定臨限値,則檢出 增益釋放。根據第一增益曲線的檢出增益攻擊或增益釋放 ’該方法然後在第二增益元資料的兩相鄰增益値間選擇適 當內插曲線。 φ 如前所述,第二編碼方案可以允許選擇可以被稱爲內 插曲線型樣的多數“攻擊”內插曲線。這些不同內插曲線型 樣典型在時間上彼此延遲,藉以允許不同“攻擊”時間的定 義。爲了使用此第二編碼方案的功能’該方法可以根據第 一增益曲線的斜率絕對値爲最大的位置’來在第二增益元 資料的兩相鄰增益値間,選擇適當的內插曲線。換句話說 ’該方法決定第一增益曲線的最陡點並選擇第二編碼方案 的最接近此最陡點的內插曲線型樣。 依據本發明另一態樣,第一增益兀資料的增益値的選 -9 - 201027517 擇不只可以根據第一增益元資料的增益値組,同時也可以 根據整個第一增益曲線。在此等情形下,該方法包含在時 間間隔內選擇第一增益曲線的最小値成爲第二增益元資料 的增益値的步驟。如果第一增益元資料沒有增益値落在有 關於第二增益元資料的增益値的時間實例旁的時間間隔內 時,這可能特別有用。 作爲第一增益曲線的最小値計算的低複雜度替代法, 較佳地在該時間間隔內選擇第一增益曲線的一組取樣的最 小値作爲第二增益元資料的給定增益値。第一增益曲線的 此組取樣可以包含在落入該時間間隔內的第二增益値的編 碼方塊時間實例的第一增益曲線的取樣。 另外,本發明描述一種將有關於動態範圍控制之音訊 增益元資料由第一音訊編碼方案之第一增益元資料轉碼爲 第二音訊編碼方案之第二增益元資料的方法,其中該第一 與第二音訊編碼方案每編碼方塊具有不同數量的音訊取樣 及其中各個編碼方塊具有相關增益値。再者,相鄰編碼方 塊的一連串增益値係被內插以定義增益曲線。該方法包含 有根據第一增益元資料的增益値,選擇第二增益元資料的 增益値的步驟,使得第二增益曲線一直在第一增益曲線下 。使用此條件,可以確保沒有限幅之源音訊信號係被轉碼 爲同樣也沒有限幅的目標音訊信號。 再者,本發明描述一種將有關於動態範圍控制之音訊 增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲 第二音訊編碼方案的第二增益元資料的方法’其中該第一 -10 - 201027517 與第二編碼方案使用編碼方塊及其中各個編碼方塊具有相 關增益値。另外’第二增益曲線係有關於第二增益元資料 的增益値。該方法包含選擇第二增益元資料的增益値的步 驟’使得在有關於第一音訊編碼方案的編碼方塊之時間實 例’該第二增益曲線係小於或等於該第一增益元資料的增 益値。 依本發明另一態樣,第二增益元資料的增益値的選擇 Φ 可能不只是根據第一增益元資料的增益値組,也根據整個 第一增益曲線。在此情形下,該方法可以選擇第二增益元 資料的增益値,使得在相關於第一音訊編碼方案的編碼方 塊相關的時間實例及/或在與第二音訊編碼方案的編碼方 塊的時間實例,該第二增益曲線小於或等於第一增益曲線 。當第二音訊編碼方案的編碼方塊的時間長度小於該第一 音訊編碼方案的編碼方塊的時間長度時,這可能顯著有利 〇 ❷ 對於某些編碼方案,增益曲線包含有關於鄰近增益値 的區段及窗函數。典型地,曲線區段係藉由使用編碼方案 的窗函數內插於相鄰增益値間加以取得。在此時,在特定 時間實例的增益曲線的上述取樣可以爲增益値及窗函數的 一組取樣所決定。對於某些編碼方案’所有或次組曲線區 段的窗函數爲相同的,使得增益曲線可以爲增益値及窗函 數的有限組取樣所描述。這允許上述方法之低複雜度實施 法,即使根據源增益曲線作增益値選擇。 本發明更描述轉碼系統’其實施上述轉碼方法。這些 -11 - 201027517 轉碼系統可以爲傳輸系統或消費者機頂盒的一部份。轉碼 系統可以利用爲周圍系統所提供之處理及記憶體手段,但 轉碼系統也可以包含本身處理手段,例如CPU及記憶體手 段,如ROM或RAM。 例如,音訊轉碼系統的實施法可以包含數位處理器及 記憶體,用以儲存爲處理器所執行之指令。記憶體也可以 更儲存進入元資料及在傳輸前產生之外出元資料。尤其, 編碼方塊的增益値可以儲存在記憶體中,用於處理。再者 ’較佳地,令窗函數的取樣或第一及/或第二編碼方案的 多數窗函數儲存於記憶體中。 例示音訊轉碼系統可以被實施於機頂盒,用以由傳輸 音訊格式轉碼爲用於播放或記錄於消費者家的音訊編碼方 案。例如,於作爲傳輸音訊編碼方案的HE AAC與作爲播 放之無線廣播音訊編碼方案的杜比數位(+ )間之轉碼可以 設在機頂盒中。 音訊轉碼系統的另一例子可以實施爲由節目製作或回 送音訊編碼格式轉碼至傳輸音訊格式的頭端。例如,在作 爲製作音訊方案的杜比E及作爲傳輸音訊方案的HE AAC間 之轉碼可以設在此頭端系統中。 應注意的是,於此文件中所述之方法與系統可以應用 至各種第一與第二音訊編碼方案,例如杜比E、也稱爲杜 比D或AC-3的杜比數位( + )、AAC(先進音訊編碼)、及/或稱 爲 aaacPlus 的 HE AAC(高效 AAC)。 再者,應注意於本文件所述之方法與系統可以彼此組 -12- 201027517 合使用。即,其也可以使用一方法用於—轉碼方向而另一 方法用於相反的轉碼方向。 【實施方式】 元資料爲“有關音訊資料的資料”,其與多頻道音訊串 流一起進行於例如杜比數位、杜比E、aAC ' HE AAC或其 他音訊編解碼器中。其取決於傳輸音訊串流,而移除需要 φ 廣播以持續調整並壓縮音訊位準的情形。其也提供音訊混 合器’以有關於音訊串流的音響動態的高度自由度。在過 去’與多頻道音訊一起工作的廣播者經常具有音軌平均位 準低於其他節目位準上或下的問題。同時,當環繞聲音內 容被播放於具有立體或單音音訊輸出的電視機時產生問題 。使用音訊元資料’音響工程師可以對於不同播放系統不 同地混合音訊內容並設定播放位準,全部在後製平台上, 使得廣播者可以輸送更符合之音訊信號並確保最重要音訊 φ 元件通過。 元資料提供若干參數,其特別想要改變輸送至消費者 特有收聽環境的節目的聲音。這些元資料參數被稱爲對話 位準(也稱爲對話正規化或dialnorm)、動態範圍控制、及 降混。雖然技術上,並非個別元資料參數,但在消費者解 碼器內的降混作爲特定元資料參數所生效,並如同 dialnorm及動態範圍控制必須小心監視及選擇生效該降混 狀況的元資料參數。在製作側上之音響工程師最後負責最 佳化多頻道混合,以在最佳收聽環境下作最佳播放。然而 -13 - 201027517 ,也必須小心以確保考量較差的收聽環境。這就是爲何在 轉碼期間元資料未失真或只以限定方式失真很重要的理由 ,以在製作階段,保留所設計元資料之品質。 對話位準參數提供正規化値給家用解碼器。此値調整 音訊的音量至一預設位準,以協助由節目內容至節目內容 及媒體至媒體的位準匹配。對話位準並不會在節目素材上 主張任何壓縮或擴張,而是降低音訊的音量至一標準化位 準。對話位準與動態範圍控制規格一起動作。對話位準參 數於節目的輕聲及大聲間設定一種“空帶”。 有時稱爲動態範圍壓縮或午夜模式之動態範圍控制 (DRC)給消費者以降低動態範圍收聽節目音訊之彈性。動 態範圍的壓縮使得觀看者收看電視而不會干擾鄰居。此控 制經常是選用的並經常可以在多數音訊解碼器,例如杜比 數位解碼器中關閉。動態範圍控制也可以用於消費者解碼 器上的共同“午夜模式”。 在低音量時’節目的輕聲部份(耳語及輕聲細語)很難 聽到。然而’如果收看者加大音量,則加大部份(爆聲、 螢幕爭吵聲、鎗聲等)變成太大而不適。或者,在具有高 位準背景雜訊的環境中’節目的輕聲部份將爲周圍雜訊所 拉下。當在該解碼器中主張動態範圍規格時,則解碼器提 高節目的輕聲部份的位準同時降低大聲部份的位準,允許 使用者享受於電影中,而不必持續觸碰音量控制鈕。 動態範圍控制典型包含兩參數或“規格,,:RJ7模式及線 模式。應注思的疋’此兩參數並不會改變在位元串流中之 -14- 201027517 編碼音訊的內容。它們被使用以調整在收聽環境內的節目 素材的極限,以此考量這些在降低動態範圍下所較佳或必 須收聽節目之實例。 RF模式被設計用於峰値限制狀況,其中解碼節目係想 要透過電視上之RF輸入而輸送,例如透過機頂盒上的天線 輸出。其典型允許在±48.16dB範圍內的動態範圍壓縮’並 也稱爲低率DRC。 φ 線模式提供較輕類型的壓縮,並允許使用者在家用解 碼器內的低位準增強/高位準削減參數之調整。其典型允 許在±2 4.08 dB範圍的動態範圍壓縮並被稱爲高率DRC。增 強及削減區域的調整或“縮放”允許消費者客製化其特定收 聽環境的音訊播放。 降混爲例如杜比數位的音訊編碼器內的特性,其允許 多頻道節目被幾個喇叭頻道所播放。簡單地說,降混允許 消費者享受數位電視廣播,而不必完整之5 . 1 -頻道家用劇 φ 院設置。有關於立體音混頻,當混頻被監視爲單音情況下 維持相容性時,多頻道音訊混頻需要工程師參考與少數喇 叭頻道之混頻,以確保降混狀況的相容性。 協助完成適當降混、協助確保音響工程師/內容製作 者的意圖的某些元資料參數將在這些環境間轉譯。明確地 說,元資料提供對喇叭頻道係如何“加”入所得之降混中之 控制。當音響工程師通常最佳化理想收聽環境中之播放的 多頻道混頻時,在降混狀況下預覽該混頻也是很重要的, 以確定當選擇降混元資料參數時,與不同播放系統的相容 -15- 201027517 性。 如上所述,元資料等等可以被使用以控制在解碼器中 之時變增益元件,使用此作爲動態範圍控制及/或音訊信 號的限制手段,以防止限幅。不同於在編碼器側上之壓縮 ,在解碼器側上之壓縮施加點爲末端使用者維持對動態範 圍壓縮量的控制。對於午夜觀看,末端使用者可以使用最 大壓縮,而具有自家用劇院之“愛樂者”可能較想要原始劇 院混頻的完整動態範圍。 在現代數位廣播鏈中,幾個音訊格式係被使用於製作 、回送、及傳輸階段中。其中原始音訊混頻可能仍爲未壓 縮線性PCM格式串流,製作的末端結果經常爲杜比E格式 串流。使用杜比E作爲在內容製作程序中之音訊編解碼器 ,製作者有可能在這些之中內藏描述整個節目音量的元資 料參數(DialNorm)、予以被使用以產生DRC係數之壓縮器 規格、及降頻。 圖1顯示由製作中心至消費者家的例示音訊轉碼鏈100 的例子。在製作中心1 0 1,音訊串流典型爲最適用以製作 及後製目的,例如杜比E的音訊格式。此製作音訊串流然 後被轉碼爲最適用以無線廣播目的1 02的格式,例如杜比 數位,其係被稱爲杜比D或AC-3。如果需要音訊串流的傳 輸或廣播,則此無線廣播音訊串流可能需要轉碼爲適當傳 輸或廣播格式103,例如HE-AAC。此傳輸音訊串流可以然 後透過網路104被傳輸至在消費者家中之多數機頂盒105上 。由於多數消費者設備106均需要特定消費者音訊格式, 201027517 例如杜比數位以放出正確之音訊串流,所以在機頂盒1 〇 5 中有需要進一步由傳輸音訊串流轉碼爲消費者音訊串流。 應注意的是’部份製作、無線廣播、傳輸及消費者音訊格 式可能相同。尤其’無線廣播及消費者音訊串流格式可能 均爲杜比數位。 換句話說’杜比Ε格式可以被轉碼爲音訊資料串流, 其更適用以在電影劇院、家中劇院或傳統家用音響中放出 ❹ 內谷。此無線廣播首訊資料串流的例子爲杜比數位串流。 在音訊資料串流格式間之轉碼,即在製作音訊串流與無線 廣播音訊串流間之轉碼同時也觸發元資料轉碼的需求。 如果需要音訊串流的傳輸或廣播,則無線廣播音訊串 流’例如杜比數位串流可能需要轉碼爲傳輸音訊串流,例 如Μ P E G Η Ε - A A C音訊串流’其係最佳化用於音訊於低位 元率鏈結上的傳輸。對於在無線廣播音訊串流與傳輸音訊 串流間之此等轉碼,相關元資料需要被轉碼。 φ 在傳輸後,音訊資料串流通常在接收器被解碼,接收 器可以爲在消費者住所之機頂盒(STB)。尤其,如果音訊 資料串流爲多頻道音訊串流,例如環繞聲音訊串流,則其 較佳將傳輸音訊串流轉碼爲消費者音訊串流,例如杜比數 位。藉此’多頻道信號可以經由光學或同軸S/p DIF鏈結 傳送給消費者家中劇院或電視機中之多頻道接收器。同時 ’在傳輸音訊串流與消費者音訊串流間之轉碼需要在相關 元資料間之轉碼。 當一格式之音訊資料串流被轉碼爲另一格式之音訊資 -17- 201027517 料串流時,元資料需要與之一起進行。DialNorm元資料的 轉碼典型並未呈現大問題,因爲它通常只有在節目邊緣才 顯著改變其他就幾乎不變。然而,DRC元資料的轉碼則很 重要,因爲DRC控制信號在不同音訊格式中具有不同訊框 。表1列出例示音訊格式及編解碼器的不同訊框長度。 編解碼器 視訊框率(fi>s) 取樣之訊框長度 AAC N/A 128/1024 HE AAC N/A 256/2048 LD AAC N/A 120/960 LD HE AAC N/A 240/1920 杜比AC-3 N/A 256/1536 杜比E 25 1920 杜比E 50 960 杜比E 30 1600 杜比E 60 800 表1
對於AAC爲主格式,在“訊框長度”列中之左側數量表 示短方塊/訊框的長度及右數量表示長方塊/訊框解析度。 對於杜比數位/AC-3格式,“訊框長度”中之左數量表示高 速率DRC字的解析度,即對於線模式的訊框大小,及右數 量表示低速率DRC字元的解析度,即RF模式之訊框大小。 可以看出,取決於架構,DRC元資料的轉碼可以由較 高速率之元資料進行至較低速率,或反之亦然。爲了更複 雜,AAC爲主格式也可以改變時間解析度,即現場之訊框 長度,使得兩狀況,即由高速率轉碼爲低速率及由低速率 轉碼爲高速率均可以在相同串流中發生及在相同轉碼操作 -18- 201027517 中發生。再者’ AAC爲主格式可以一訊框一訊框地發出有 元資料出現否的信號。典型,解碼語意定義一取樣及保持 行爲,即解碼器被指示以一直使用收到之最新增益控制信 號,直到新資料到達爲止。因此,在AAC訊框中沒有元資 料表示解碼器中應被施加最新增益控制信號,直到進一步 通知爲止。 爲壓縮器所施加之增益可以爲長準固定部份所特徵化 φ ,並爲增益快速下降之陡“攻擊”所中斷。這些“攻擊”典型 施加以軟化在音響強度中之突然增加,例如在電影中之爆 炸。由這些斜角,壓縮器增益可以以稱爲“釋放”的長時間 常數回復。換句話說,在音響強度中之突然增加被尖增益 “攻擊”所對抗,其中增益値係在很短時間期間被強烈降低 ’而在增益“釋放”期間,則增益增加被平順地執行。 雖然在施加DRC增益時音訊信號的部份量的調變失真 在該攻擊上不可避免,但此攻擊之衰減時間常數被選擇, φ 使得調變失真聽不到。增益攻擊之適當衰減時間的選擇爲 音響工程師設計適當DRC元資料時的一項重要任務,並且 在元資料轉碼時,將DRC元資料由製作音訊格式轉碼至無 線廣播音訊格式進行一步轉碼至傳輸音訊格式,例如AAC 時,必須小心以不破壞此特性。 再者,壓縮器也可以耦接至限制器,其限制在任一時 間之最大壓縮器增益,以不會產生通過odBFS的信號。此 等限制器典型用以防止限幅。當轉碼元資料時,此等限制 器功能需要考量。 -19- 201027517 例如AAC、HE A AC、及杜比數位/AC-3之音訊編解碼 器典型爲適應性轉換爲主的編解碼器,其根據例如MDCT ,即修改離散餘弦轉換的Princen-Bradley時域假象取消 (TDAC)技術,使用頻率-線性臨界取樣濾波排。MDCT轉換 經常被耦接額外窗函數,以藉由使MDCT及逆MDCT函數在 濾波器邊界點平滑進行至零,而避免在轉換邊界的不連續 〇 這是如圖2所示,其中顯示音訊編碼器200及音訊解碼 器210。圖2顯示轉換爲主編碼器201及轉換爲主解碼器211 ,如同在例如AAC及杜比數位/ AC-3之音訊編碼方案中被 使用。如上所述,此編碼方案包含在編碼側上之TDAC轉 換濾波排204及在解碼側上之逆TDAC轉換濾波排214。再 者,在編碼及解碼側的窗函數203及213分別移除在濾波器 邊界的TDAC轉換204、214的不連續。另外,轉換爲主編 碼器201及解碼器211包含額外元件,例如分別爲黑點205 及2 1 5所表示之暫態檢測器、量化手段、位元配置手段等 等。 爲了進一步降低傳輸資料速率,例如HE-A AC之某些 音訊編解碼器使用稱爲頻帶複製(SBR)的技術。SBR的內 在原理爲音訊信號的較高頻部份的心理聲響重要性相當地 低。因此,使用SBR的音訊編解碼器只使用上述之轉換爲 主編碼器編碼信號頻譜的下半部。信號頻譜的上半部係爲 SBR解碼器或合成所產生,其主要爲在傳統轉換爲主之解 碼器後的後置處理。不作傳輸高頻頻譜,SBR根據傳輸於 201027517 內在編碼器中之低頻的分析,在解碼器中重建較高頻率。 爲了確保準確重建,部份導引資訊被以很低資料率傳輸於 編碼位元流中。在編碼側使用QMF(正交鏡濾波器)分析的 此SBR分析係在圖2中被顯示爲方塊2 02。典型地,此QMF 分析藉由分析例如64信號次頻帶而決定基本頻譜信號資訊 。在解碼側上,信號資訊係被用於SB R合成2 12中,使用包 含64次頻帶之QMF合成濾波器排。 I 上述轉換爲主編碼方案的主要優點爲信號元件及對應 量化雜訊元件(想要被遮蔽)被保持在臨界頻寬內,由人類 耳朵的遮蔽特性導出之最大利益,及最小化感覺無雜訊編 碼所需的所得資料率。 在開始DRC元資料的轉碼之前,將提供在音訊解碼器 的此DRC元資料使用的簡要說明。對於每訊框或方塊,音 訊解碼器將剖析所接收位元串流,以表示是否新增益値被 傳輸用於該特定訊框。如果未提供新增益値,則解碼器將 φ 使用最後傳輸增益値。另一方面,如果已經收到新增益値 ,則新增益値將被讀入並應用。 對於例如AAC及AC-3的某一群音訊編解碼器,新接收 增益値將被使用以放大或衰減由訊框中解碼出的頻譜音訊 資料。換句話說,在施加逆TDAC轉換前,增益被施加至 頻訊音訊次頻帶。由於此轉換的施加及取樣重疊典型相關 於轉換而典型應用及由於相關窗化,增益値將有效地被內 插於連續訊框之間。在本文中,內插函數可以被視爲加權 函數。此內插增益曲線係如圖3所示,其中顯示A A C編解 -21 - 201027517 碼器的s型內插函數3 01。典型內插函數係如圖4a中之圖形 401所示。對應窗函數402係示於圖4b中。另外,應注意的 是,也可以使用非對稱窗函數及相關內插函數。例如當窗 函數由一信號方塊變化至下一方塊時,也可以發生此非對 稱窗函數。在圖4c中,顯示此非對稱窗函數411及412,及 其相關內插函數421及422。 再者,圖5顯示用於三連續方塊或訊框的內插增益曲 線。可以看出,由零方塊至第一方塊的由6dB至OdB的增益 轉移係爲AAC窗函數所內插,以得到典型S形內插曲線501 。由第一方塊至第二方塊,增益値保持在OdB不變,使得 增益曲線502保持平坦。然後,在第三方塊發生另一增益 轉移至-3.5dB,其再次造成典型S形內插曲線502。 對於另一群之音訊編解碼器,例如HE AAC編解碼器 ,增益將不會施加至MDCT頻譜上。相反地,其將在QMF( 正交鏡濾波器)合成前施加,該合成典型跟在逆MDCT轉換 後。藉由預設,增益値係被線性內插於相鄰訊框或槽之間 ,如圖3所示,成爲內插曲線3 02。另外,HE AAC位元流 語法保留另3個位元以選擇8個不同內插曲線303之一。這 些方案基本上不會內插,而是在“突然”跳至預定轉移曲線 後的新增益之前,持續保持舊增益値不同時間量。圖3顯 示分佈於訊框寬度上之一組轉移曲線303。此突然增益轉 移曲線較佳匹配當想要突然增益改變的狀態,例如增益攻 擊時的狀態。對於HE A AC編碼方案,該串增益値有效地 內插以形成如圖3所示之增益曲線3 02及3 03。此內插係有
201027517 關於QMF合成之脈衝回應。 爲了容易解說,可以假設將也被稱爲释 控制信號具無限高解析度,但在真實中,if 格上取樣。爲了由一代表値至另一代表値, 取樣增益値爲時間連續的內插級。此級典塑 器的取樣保持語意。不是每一訊框承載增益 是部份音訊資料格式,例如杜比E允許發出 格特別是壓縮器規格。爲了轉碼目的,此屬 被視爲增益控制信號。事實上,壓縮器規相 特定增益値給每一音訊信號取樣。因此,壓 定義增益控制信號。使用內插級,這些增益 有時間連續信號代表値。 在以下,轉碼元資料的問題將進一步另 ,參考由2007年十月5至8日之音響工程師1 W. Schildbach等人所作之“動態範圍控制係 φ 料的轉碼爲PMEG-4 HE AAC”,其係倂入作 如前所述,轉碼的目的爲受到轉碼元: ,特別是轉碼增益値的音訊信號聽起來一 1 於具有施加原始增益之音訊信號。由此明; 碼演算法的若干侷限可以公式化爲: •當受到原始增益値的信號並未限幅E 益値的信號也不應被限幅。即,該信號必ί 。這可以藉由拾取增益取樣加以完成,使ί 號的增益不會超出進入增益。 益曲線的增益 益値只在分立 可以假設內插 遵循上述解碼 控制係數,而 選擇元資料規 縮器規格可以 暗示地指定一 縮器規格實際 控制信號也具 析。在本文中 δ會123頁的由 數與其他元資 $參考。 料的音訊信號 或儘可能類似 目標,對於轉 ,受到轉碼增 保留限幅保護 施加至轉碼信 -23- 201027517 •對於靜態增益曲線,轉碼增益曲線應相同。即,其 中在原始增益曲線與轉碼增益曲線間之準靜態信號應沒有 不匹配。 •當發生動態增益改變時,施加至轉碼信號上的增益 應儘可地接近地模擬進入增益,即釋放及攻擊次數應類似 〇 考量這些侷限,可以公式化某些量的轉碼演算法。這 些轉碼演算法將被槪述如下。啓始音訊編碼格式之增益値 將稱爲源增益値及對應音訊編碼格式將稱爲源編碼方案的 源格式。轉碼增益値將稱爲目標增益値及相關音訊編碼格 式將稱爲目標編碼方案的目標格式。 應注意的是,取決於特定轉碼狀態,不同強調可以放 在不同組或次組的侷限上。在某些狀況中,較佳地確保目 標增益曲線永遠小於或等於源增益曲線。如果予以避免在 目標側上的音訊限幅,則這可能是較佳選項。另一方面, 這也可能足以確保只有在某組取樣點處,目標增益曲線係 小於或等於源增益曲線。例如,其足以明定只有目標增益 値爲小於或等於源增益値。在此時,由於在源側及/或目 標側的內插,有可能發生目標增益曲線在某些點超出源增 益曲線。然而,這也可能在可容忍過調變效應的代價下, 得到源增益曲線與目標增益曲線的較佳整體匹配。再者, 在部份轉碼狀況下,也可適當地進一步喚醒有關於目標增 益曲線或目標增益値的侷限小於或等於源增益曲線或源增 益曲線。在此等情況下,更強的強調可能放置在增益曲線 -24- 201027517 的整個匹配上。 也應注意的是,以下演算法也可以用以漸進地將增益 元資料由源@碼方案轉碼至目標編碼方案。由於編碼音訊 信號的即時特性,所以這是很重要。因此,在典型轉碼狀 態中不可能緩衝任意數量的源編碼方塊並對這些緩衝源編 碼方塊執行整體轉碼操作。因此,適當轉碼演算法需要一 方塊一方塊爲主地執行漸進轉碼。此漸進方塊狀轉碼可以 A 以以下轉碼演算法完成。 再者,應注意的是,以下演算法可應用至非相稱訊框 。這表示源編碼方案的訊框及目標編碼方案的訊框可以爲 任意地不同,兩者均有關於訊框大小,即每訊框的取樣數 或每訊框包含的音訊信號的長度,及有關於訊框的同步化 ’即’它們個別之開始及結束時間。事實上,甚至源編碼 方案與目標編碼方案的取樣率可能不同。 再者,也可以說成以下演算法不只限制音訊增益資料 Φ 的轉碼’同時也可以應用至將信號由一壓縮位元流格式轉 碼至另一壓縮位兀流格式之任意裝置,其中該等格式之訊 框並不相容。有關於音訊編碼的一些例子爲杜比E至/自 Η E - A A C轉碼器或杜比數位至/自Η E - A A C轉碼器。例如, 由於AAC/HE AAC及杜比數位位元流有不同訊框,即使杜 比數位位元流分配空間給元資料,也不可能直接將元資料 由A A C / Η E - A A C位元流映圖至杜比數位位元流。因此,爲 了保留在AAC/HE AAC位元流中之元資料,於以下所述之 方法與演算法需要執行元資料轉譯。 -25- 201027517 演算法1 :排列順序濾波器 符合或近似上述侷限的可能爲對源增益値施加排列順 序濾波器。假設g’i(i = 〇 ’…’ N-1)爲目標格式之N訊框的 目標增益値,及gj(j = l ’…’ M-1)爲源格式之Μ訊框的源 增益値。再者,假設t’i爲相關目標增益値g’i被施加的次數 及tj爲源增益値gj被施加之次數。 由於用於源格式之解碼器中之濾波排及/或窗函數的 _ 內插函數,源增益値gj定義一連續源增益曲線,稱爲G(t) ,其係由兩相鄰源增益値gj及gj + 1間之曲線區段Gj(t)的序 連構成。如果W(t)爲兩源增益値間之內插或加權函數,曲 線區段Gj(t)可以被寫成
Gj (〇 = gj (l - W{t -φ gJ+iW(t ~tj). (1) 圖6顯示此一內插源增益曲線G(t),601,其係由曲線 區段Gj(t)之連序所構成(j = 〇,…7)。換句話說,源增益曲 線G(t),601係根據九個源增益値gj(j = 0,…,8),在時間 參 tj(j = 0 »…,8)。在所示例子中,內藏源編碼方案爲線性 內插方法所選擇之HE AAC。此線性內插法解釋相鄰源增 益値gj間之線性轉移。應注意的是,其他編碼方案提供類 似內插源增益曲線。 可以展現出當在時間t’i時選擇目標增益値g’i,使用公 式 = (2) 然後,上述轉碼侷限可以在某些附屬條件下符合。通 -26 - 201027517 常,也可以說成爲如果;5被選擇,使得 β > ), (ί;+, - /;)} (3) 則內插目標增益曲線將一直保持在內插源增益曲線下 。尤其,當內藏編碼方案使用線性內插方案時適用。 這是示於圖7a及7b中。圖7a顯示當(~1〇#川_〇),即 目標編碼格式之訊框尺寸小於或等於源編碼格式之訊框尺 寸。例如,此等狀況可以發生於當元資料由HE A AC長訊 φ 框解析度轉碼至杜比數位。源增益曲線701係爲於爲圓圈 所代表的時間to、t,、t2及t3源增益値gj所定義。爲了簡單 起見,已經被施加有稱爲Η E A AC之線性內插。可以由圖 7a看出,如果/3被選擇大於或等於(tj + 1-tj),在時間實例 t’〇至t’18的一連串目標增益値g、可以使用公式(2)決定。這 些目標增益値g’i係在圖7a被表示爲“X”並得到目標增益曲 線702,其可以永久在源增益曲線701下。用於g’^公式之 操作模式可以由雙箭頭703看到,其表示向後及向前延伸 參 (tj + 1- tj)時間實例的時間實例t’8旁的時間間隔。換句話說 ,卢=(tj + 1-tj)。在此時間間隔內,最小源增益値gj具有 f/ e If I ’川 _ I〆 /·+1 ’y+i _ G lj, (4〉 係被選擇爲目標增益値g’i。在時間實例t’8,目標增 益値g’8被決定爲在時間實例t2的源增益値g2。 圖7b顯示當’即當目標編碼格式之訊框 尺寸大於或等於源編碼格式之訊框尺寸時。例如,此狀況 可以發生於當由杜比數位轉碼爲HE AAC長訊框解析度時 。在時間實例U至t, 8的源增益値gj係爲圓圈所表示,並造 -27- 201027517 成源增益曲線G(t)’ 711°當選擇Θ爲大& $胃於(t’i + 1-t’i) ,可以使用公式(2)決定在時間實例^至Γ3的—連串目標 增益値g,i。這些目標增益値可以在圖7b中被表示爲“x”。 可以看出,這些目標增益値g’i造成目標增益曲線712 ’其 係一直低於源增益曲線GG) ’ 711 °類似於圖7a ’雙箭頭 713表示對於召=(1、+ 1-匕)的時間實例11’旁的時間間隔。 參考圖6 ,其中轉碼例子係例示用於。可 以看出,如果yS =(t’i + i_t’i) ’則取得虛線目標增益曲線602 。再者,在時間實例t ’ =4旁的相關時間間隔係由雙箭頭6 0 4 所示。應注意的是’目標增益曲線的壓縮器釋放係相較於 源增益曲線601的壓縮器釋放被延遲。準確地說,源增益 曲線的壓縮器釋放開始於時間實例t = 3處,而目標增益曲 線的壓縮器釋放只開始於時間實例t’=4。另一方面,可以 看出目標增益曲線的攻擊相較於源增益曲線的攻擊爲超前 。準確地說,源增益曲線的壓縮器攻擊開始於時間實例 t = 2,而目標增益曲線的壓縮器攻擊則已經在時間實例t ’ = 1 開始。 圖6也顯示第二目標增益曲線603,其已經藉由選擇參 數/5=0.5*(匕+ 1-厂〇加以取得,即在公式(3)中明定限制下 的參數値。當選擇/3爲 再也不能確保目標增益曲線一直在源增益曲線下。然 而,參數卢的變動對壓縮器釋放的延遲量及/或壓縮器攻 擊的超前量作出控制。在圖6中之目標增益曲線6 03顯示, 201027517 當選擇卢=0.5*(t’i + 1-t’i)時’壓縮器攻擊及釋放曲線可以 移動較目標增益曲線602接近源增益曲線6〇ι。用以決定目 標增益値的相關時間間隔的大小在時間實例t,= 4處係被雙 箭頭605所顯示。然而,應注意的是,當具有沒< ,(tj + 1-tj)}的參數冷應被小心拾取,因爲値 太低的万可能造成目標增益顯著超出源增益曲線。此過量 增益過衝可能造成可聽到之音訊缺陷,例如限幅。因此, φ 適當參數万的選擇爲元資料轉碼器的方案者在考量多數不 同方面下所作出之折衝。例如,此等方面可以包含所施加 音訊編碼格式、被編碼之內容、由源編碼方案轉碼至目標 編碼方案的方向等等。 應注意的是’此演算法可以以低計算複雜度實施,尤 其’如果相關於不同時間實例tj的元資料以預定順序方式 排列。這是由於用於目標增益値g’i的計算的源增益値gj的 數量很低。典型地,只需要很少的比較計算用以決定最小 φ 値。再者,應注意的是,提出排列順序濾波器演算法只使 用源增益値gj及其相關時間實例tj,以決定目標增益値g、 。這資料係可以直接於轉碼單元由元資料位元流迅速取得 並不需要額外處理。此特性加至提議排列順序濾波器演算 法的低計算複雜性。 圖8顯示使用上述排列順序濾波器演算法轉碼源增益 曲線8 0 1的另一例子。在上述例子中’源編碼格式的訊框 大小爲25 6取樣,而目標編碼格式之訊框大小爲2048取樣 。參數冷已經被選擇爲冷=1Ώ3χ{(Γί+ι·Γί) ’(h+i-tj)}。此 -29- 201027517 轉碼狀態可能發生於例如杜比數位的編碼方案係被轉換至 HE AAC,其有可能定義相當長訊框尺寸,以提供較低頻 寬傳輸。圖8也顯示轉碼目標增益曲線8〇2並且可以看出符 合參數/9的明定狀態,轉碼增益曲線8 02係低於增益曲線 801。再者,可以看出攻擊已經超前,而壓縮器釋放已經 被延遲。藉由以冷<max{(t’i+1-t’i),+ 選擇參數召
,此作用可以降低。然而,即,以相較於源增益曲線的目 標增益曲線的可能過衝的代價。 再者,應注意的是,當選擇/9〈maxUt’i + i-t’i),(tj+1-tj)}時,可能發生,尤其是當,即目標編 碼格式的訊框尺寸係小於或等於源編碼格式之訊框尺寸, 即,沒有源增益値g可以在時間實例t’i旁的間隔[t’i-万,
t’i+万]中指明。在此等實例中,公式將不 能得到目標增益値g ’ i的一值。因此’可能有利以使用解碼 器的取樣及保持行爲並假設目標增益値g’i維持不變’直到 新値目標增益値使用上述公式(2)加以指明爲止。換句話說 ,目標增益値公式可以被寫成 ,_ Jmin{g川,’,-ί;| S e [ί’,Ύ,ίW] 8i=z\ · ⑹ 或者,可以使用解碼器的取樣及保持行爲於源編碼方 案上。這表示如果沒有更新源增益値gj可以在時間實例 旁的間隔[t,i - ’ t ’ i +沒]中指明’則最後檢測源增益値被 假設爲現行源增益値gj。用以決定目標增益値g ’ i的公式可 以被重寫爲 -30- 201027517 ,=i min^y 11^-^1 <p\tj e * 1&,7·Ι 0[ί',-ΑΛ+Α]. (7) “取樣及保持”方法的優點爲目標增益値g’i只根據源增 益値gj加以決定。如上所述,此排列順序濾波器演算法的 特性可以對低計算複雜度作出貢獻。 或者,較佳地進一步考量源增益曲線G(t)的準確路徑 並使用修改公式決定目標增益値g’i φ ^( = min{G(〇||/V-/|<^}. (8) 這可以特別有利於當’即當目標編碼格 式之訊框尺寸小於或等於源編碼格式之訊框大小,因爲該 組的適當源增益値以選擇目標增益値g’i ’將不會爲空白。 相關演算法將稱爲通用排列順序濾波器演算法。 另一方面,應注意的是,此修改選擇公式需要知道在 元資料轉碼器的源增益曲線。尤其,元資料轉碼器需要知 道內插函數W(t)或者甚至可能爲源編碼方案所用之該組內 Ο 插函數。根據這些內插函數W⑴及源增益値gj,源增益曲 線區段Gj(t)及源增益曲線G(t)可以被決定。整體言之,相 較於只使用源增益値gj的排列順序濾波器演算法的版本, 可以期待藉由使用修改選擇公式,轉碼演算法的計算複雜 性將增加。 也應注意的是’上述公式(8)可以藉由只考量源增益曲 線G (t)的一組取樣加以修改。例如,可能較佳地,只考量 目標增益値的時間實例t’i及/或源增益値的時間實例tj的源 增益曲線値。公式可以被然後重寫爲 -31 - 201027517 g\ = min{G(〇 I \t\ -t\ S y?}, with / e {r1,, t}}. (9) 限定源增益曲線G(t)至一組取樣値將降低所通用的排 列順序濾波器演算法的計算複雜度。再者,應注意的是’ 一區段源增益曲線G(t)可以藉由兩鄰近源增益値gj,gj + 1及 內插加權函數W(t)加以描述。因此,如果只需要一組取樣 的源增益曲線G(t),則此完整組的取樣可以由源增益値gj 及一限定組取樣的內插函數W(t)決定。此限定組取樣的內 插函數W(t)可以例如儲存於元資料轉碼器的記憶體中。 吾人可以想出使用兩選擇公式的組合,即排列順序濾 波器演算法與通用排列順序濾波器演算法的組合。例如’ 較佳使用低複雜度排列順序濾波器演算法,其只使用源增 益値gj,於目標方塊尺寸大於或等於源方塊尺寸,而使用 源增益曲線G(t)或一組其取樣的較高複雜度通用排列順序 濾波器演算法係被使用於目標方塊尺寸小於源區塊尺寸的 狀況中。 演算法2 : “最佳匹配”增益 爲了決定符合或至少接近上述用於轉碼的侷限的第二 演算法,源增益曲線G(t)及目標增益曲線G’(t)將相比較。 假設W’(t)爲目標解碼方案的內插函數。例如,用於A AC編 解碼器的內插函數可以被以半窗尺寸爲單位寫成 W’(t) = (Sin(tTt/2))2。此內插或加權函數典型爲窗函數的平 方。應注意的是,一些編解碼器也預見窗切換的可能性, 使得內插函數W’(t)可以由一編碼方塊改變至另一編碼方 -32- 201027517 塊。再者,編解碼器的方塊尺寸也可以改變,以造成窗函 數的改變。這些效應與環境可能藉由選擇適當內插函數 W’(t)給每一增益曲線區段加以考量。 使用目標解碼方案的內插函數w’(t),在目標增益値 8、及8’;+1間之內插目標增益曲線〇’〇)可以被寫成 (〇=g\ (\-w\t-t\ ))+^'+1 ). (10) 整個目標增益曲線G’(t)可以藉由連序鄰近目標增益曲 φ 線區段G’i(t)加以取得。 假設gj,i表示在時間4,|的所有源增益,+ 1, 即在兩連續目標增益値g’i及g’i + 1間之時間間隔內的源增益 値群。應注意的是,由於在源編碼方案及目標編碼方案上 的訊框尺寸的“立即”改變,在時間間隔內的源增益値群及 時間間隔本身的長度可能以特定(ad hoc)基礎地改變。因 此,同時,在tj.i中之i及j的可能組合可以根據一方塊一方 塊爲基礎地改變。 ❹ 選擇小於或等於在時間間隔[t’i,t’i + 1]內的連串源增 益値g’i的目標增益値gjj及更明確地說目標增益曲線區段 G’i(t)的條件可以被寫爲: (11) 換句話說,在時間實例1」的目標增益曲線G’(t)需要 小於或等於在時間實例的源增益値。 定義在時間實例〇厂-1’〇的目標解碼方案的內插函數 ,以採用値W’j^W’di-t’i)並考量目標增益曲線區段 G’i(t)的公式,該條件可以被寫爲 -33- 201027517 客,,(卜 其可以被重新寫爲 , 1 1-F' ^i+l ^ W* IV1 ^1' rr JJ π jj 此耦接組的不等式需要爲在所有目標增益値爲g\,Vi 有效。再者,所有目標增益値g’i需要爲大於或等於0,即
s\>0 > Vi。對於正規化內插函數,即對於具有, 1-FP ❺ 此也造成看到,因此,不等式可以重寫爲: 1 1 g ,+1 ^ gjj g —gjy (12〉
j,t yV 以類似方式,跟隨目標曲線區段G ’ i (t)的鄰近目標增 益曲線區段G’i + 1(t)的不等式可以被寫爲: 〇\+1 (0 = g'M (l - ^'y,(+1)+ g'M W'AM < gJ>M, (13) 其中『"+1 =『Ί+1-Λ+1),及C+1<G,i+1W(+2。此不等式提供 g ’ i + 1的另一條件’即
, ^ 1 ^ j,M , < 1 ,1 „ gi+i-(ι-^,,/^+ι'Fi^g<+2-pFQ^+ii ( } 由於g’,Vi以及內插函數w’(t)被正規化,即, 『Άνί,·/‘。如上所述,i及j的可能組合爲源編碼方案的方 塊尺寸與目標編碼方案的方塊尺寸間之現行關係所給定。 這些可能組合可能演化並一方塊一方塊地有所不同。 設定g’o = 〇,剩餘g’i(i>〇)可以由該組不等式所提供的 範圍選出。 選擇的程序係如圖9a所示,用於目標編碼方案[t’, t’i + 1]大於等於源編碼方案h,^+1]的時間間隔的例子中。 -34- 201027517 圖9 a顯示源增益曲線9 0 1,其係由分別在時間實例t〇至t, 8 的源增益値go至gl8的內插取得。爲了此源增益曲線901, 予以決定轉碼目標增益曲線G’(t)。在所示例子中,此目標 增益曲線包含三目標增益曲線G’〇(t)、G’,(t)、G,2(t),分 別如圖9中之圖形區段902 ' 903及9〇4所示。在時間間隔 [t’i ’广+ 1]內的條件G’KUSgj.i可以被寫成用於該所示例 子爲 G 0 (’〇)幺容〇,G 〇 (’! ) S 约,(?。(’2)幺容2,G 〇 (’3) € 发3,G 〇 (’4)幺 ,G’0 (ί5)彡 gs, 對於G’〇(t)及類似於GMt)及G’2(t)的方式。當使用目 標解碼器W ’( t)的內插函數時,對於j = 0,…6的値 W’hc^W’Oj.o-t’o)可以被計算。藉由在以上提供方程式中 使用這些內插値,可以取得用於目標增益値g’,的一組不等 式’成爲先前選擇目標增益値g’o的函數。將目標增益曲線 G’〇(t)(即,圖形902)匹配至在間隔[t’〇,t、]中之源增益曲 φ 線901的較佳方式爲選擇所有不等式同時符合的最大目標 增益値g ’ i。 應注意的是,目標增益値g ’ i需要被小心由導出不等式 所允許的範圍中拾取。如果目標增益値g’i的局部最佳値被 選出,則上述不等式可能顯著地限制以下目標增益値g’i+1 的可能値之選擇。這最後可能造成振目標增益曲線G ’( t) ,這典型並不是想要的。此一振盪行爲的例子可以看出, 當選擇g’Q = 0時,依據上述方程式(I2)及(I4),將留下很大 自由度用以選擇§\的最佳及最大値。然而,這可能需要 -35- 201027517 g’2的選擇更小或甚至零,由於大校正部份 gl。在下 一步驟中,下一目標增益値g’ 3可以依據該組不等式自由地 最大化。可以看出,此局部最佳化及選擇程序,一次處理 只有一目標增益値g’i,可能造成在目標增益曲線G’(t)中 的不想要的振盪。 因此,較佳地,在更通用最佳化程序內選擇目標增益 値,而不必局部地過配合至該資料。例如,可以藉由將目 標增益値g’i補充至額外侷限,例如藉由將目標增益値限制 大於或等於目標增益値g’i而避免振盪,該目標增益値係依 據上述排列順序濾波器演算法加以決定。然後除了在以最 佳匹配增益演算法之文中所述不等式外這些條件將被符合 〇 再者,應注意的是,當沒有源增益値gj,i存在之目標 時間間隔[t’i,t’1+1]具有時,上述演算法將不 提供不等式G’KtjdHgjd。因此,沒有條件用以限制對應目 標增益値g’i的選擇。當目標編碼方案的方塊/訊框尺寸小 於源編碼方案的方塊尺寸時,可能發生此等狀況。此問題 可以例如藉由施加音訊解碼器的取樣及保持行爲而克服。 例如,在此等例子中,gj,i可以被選擇爲最後知道之源增 益値gj。 或者,較佳地在此等例子中,其中“最佳匹配”增益演 算法並未提供任何條件,以依據上述排列順序濾波器演算 法選擇目標增益値g’ i。再者,在另一實施例中,較佳由間 隔[t’i -冷,t’i+召]選擇可能源增益値gj,其中參數yS可以 -36- 201027517 依據在排列順序濾波器演算法的本文4 擇。使用這些可能源增益値gj,依據所 演算法之不等式可以被公式化,因此, 增益値。 所述“最佳匹配”增益演算法根據领 目標增益値g ’ ;。另外,考量目標增益 其以依據上述公式之內插函數W’(t)造 0 內插。此元資料轉碼器並不需知道用於 插方案,只單純依據已經存在元資料位 。因此,“最佳匹配”增益演算法可以被 性。再者’應注意的是,元資料轉碼器 目標編碼方案之內插函數w’(t)。事實 數的特定取樣W’j.i需要被元資料轉碼器 以被儲存在元資料轉碼器之記憶體作爲 應注意的是,類似於排列順序濾沒 ® 匹配”增益演算法可以被通用化,使得 時源增益曲線也被考慮用於轉碼目的。 算法假定源增益値的時間實例,目標增 於源增益値,即。如果源增 碼器所知’則此條件可以被重新公式化 値的時間實例,目標增益曲線應小於或 即 G’idOSGjd.i)(具有 t,i<tj,iSt’i +丨及 t 此所述之目標增益區段G,Kt)及源增益 線,此不等式可以被寫成: |所述之公式加以選 述“最佳-匹配”增益 可以決定適當目標 ί增益値gj選擇適當 曲線G’(t)的行程, 成目標增益値g’i的 源編碼方案中之內 元流中之源增益値 實施爲低計算複雜 並不需要準確知道 上,只有此內插函 所知。這些取樣可 一表。 芝器演算法,“最佳 不只源增益値,同 “最佳匹配”增益演 益曲線應小於或等 益曲線爲兀資料轉 ,以描述該源增益 等於源增益曲線, j<Ktj + 1。使用於 區段G j (t)的內插曲 -37- 201027517 g\ (l - -1\))+ g'M W\tLi - f,) < g.(l - W(tji - tj))+ -tj). (15) 定義评’^ =评’(^,;-匕)爲在時間實例匕;(即在目標增益 曲線的第i個曲線區段及源增益曲線的第j個曲線區段的時 間實例)的目標編碼方案的內插函數値。在類似方法中, 可以定義Wj,i = W(tj,i-tj)。使用源編碼方案的內插函數及目 標編碼方案的內插函數之取樣値,上述不等式可以改寫爲 +1 ^ τρ- [gj (l - wUi)+ gj^wu - (l - W'Lt )g·, ]. (16)
rr JJ 類似於只使用源增益値的“最佳匹配”增益演算法的公 式,此公式提供一遞迴方法’用以根據其先前目標增益値 g’i計算目標增益値g’i+1。所得演算法被稱爲通用“最佳匹 配”增益演算法。當(t’i + pt’oytj + i-tj)時(即在兩相鄰源增 益値間之時間間隔大於或等於在兩相鄰目標增益値的狀況 )係特別有利。如上所述’對於此等狀況,可能發生未符 合條件+ i的源增益値gji存在的情形。在此等情 況下’通用“最佳匹配”增益演算法將對源增益曲線提供適 當內插增益並允許根據其先前目標增益値g,,及內插源增益 値決定目標增益値g,i+丨。 通用“最佳匹配”增益演算法的功能性之狀況(其中 (t’i+1-t’i)<(tj + 1-tj))可以在圖9b中看到,其中一線性內插增 益曲線921係被轉碼爲s曲線內插增益曲線922。此等狀況 可能於轉碼HE-AAC增益元資料成爲AAC或AC-3增益元資 料發生。 在此特定例子中,源編碼方案的方塊尺寸準確爲6倍 -38- 201027517 之目標編碼方案的方塊尺寸,再者,方塊邊界準確重疊, 即第一目標編碼方塊的時間實例^與第一源編碼方塊的時 間實例t’〇重合’ 1’6與“重合,以此類推。對於圖91)中所之 特定例子,W’j,i=l及上述遞迴公式變成〜)+g;+1%vj 。較佳選項爲選擇最大可能目標增益値,其在此情況下對 應於在時間實例t’i+1之源增益曲線的値。這是在圖9b所示 ’其中’在時間實例t’1Q的目標增益値g,1Q係被以“x”931表 φ 示。整體言之’可以看出目標增益曲線922良好匹配源增 益曲線9 2 1。也可以看出,如方程式(丨5)所要求,目標增益 曲線922在時間實例於或等於源增益曲線921。另一方 面’由於目標編碼方案的S曲線內插,目標增益曲線有時 大於源增益曲線。如上所強調,此通用侷限的目標增益曲 線應一直小於或等於源增益曲線的喚起在某些轉碼狀況下 可能有利,尤其當較強的強調係放在兩增益曲線的整體匹 配上。 φ 應注意的是’可能較佳地使用“最佳匹配”增益演算法 與通用“最佳匹配”增益演算法的組合。例如,“最佳匹配” 增益演算法可以用於目標編碼方案的方塊尺寸大於或等於 源編碼方案的方塊尺寸的狀況中,尤其由AC-3至HE AAC 的轉碼。另一方面,通用“最佳匹配”增益演算法可以用於 當目標編碼方案的方塊尺寸係小於源編碼方案的方塊尺寸 ,尤其是將由HE-AAC轉換至AC-3。藉由組合演算法,於 計算複雜性與匹配效能間可以作出一取捨。 -39 - 201027517 演算法3 :內插挑選 利用爲MPEG-4 HE AAC所提供之額外DRC增益控制功 能的另一演算法也稱爲增益內插方案。如上所述,HE AAC允許不同內插方案的選擇,以由兩鄰近增益値間之線 性內插或兩鄰近編碼方塊間之八時間實例之一的突出“攻 擊”狀內插選擇。因此,增益內插方案致能於兩增益控制 點或增益値間之增益內插曲線形狀的控制。這已經在圖3 的圖表302及3 03中描述。可以看出慢內插302將適用以模 組化一平滑指數增益釋放,而內插方案3 03可以模組化尖 增益攻擊。 此觀察引起以下演算法,用以將一源增益曲線轉碼至 目標增益曲線,例如HE A AC,其中目標編碼方案允許不 同內插方案的選擇或不同內插曲線型樣。目標編碼方案允 至少允許可能平滑“釋放”內插曲線型樣及可能突出“攻擊” 內插曲線型樣的選擇。該演算法可以包含步驟: 1. 評估源增益曲線的斜率。這可以例如藉由分析其一 階導數或藉由分計算適當鄰接源增益値間之差加以完成。 如果負斜率超出某一臨限,則將現行訊框分類爲“攻擊 ”(A),否則分類現行訊框爲“釋放”(R)。 2. 如果現行訊框已經分類爲(R),則依據上述排列順序 濾波器演算法決定下一目標增益値。再者’選擇目標編碼 方案的平滑或“釋放”內插曲線。 3 .如果現行訊框已經被分類爲(A) ’則依據上述之排列 順序演算法決定下一目標增益値。如果源編碼方案爲轉換 -40 - 201027517 爲主編解碼器,例如AAC或AC-3,則下一目標增益値也可 以被選擇爲對中於AAC窗中心的目標增益的最小値。在決 定適當下一目標增益値後,選擇目標編碼方案的“攻擊”內 插曲線型樣。再者,如果目標編碼方案允許在不同時間實 例選擇多數“攻擊”內插曲線型樣之一,則選擇“攻擊”內插 曲線型樣中,其斜率係最接近源增益曲線的一階導數的絕 對値爲最高的一點,即在該點的斜率爲最陡者。取決於源 φ 編碼方案,此在源增益曲線上的點可以由不同手段決定。 例如,對於AAC的S-形狀內插曲線,在兩相鄰源增益値間 之最陡斜率的點爲兩源增益値間之中點。 圖10顯示增益元資料由轉換爲主編碼方案,例如AAC 或AC-3轉碼爲HE AAC的模擬結果。圖形1001顯示源增益 曲線及圖形1 002顯示目標增益曲線。可以看出,當使用所 述內插挑選演算法時,可以取得非常良好之匹配結果。事 實上,觀察到之結果將較以上述排列順序濾波器演算法取 φ 得爲佳之結果。尤其,這是由於內插挑選演算法額外使用 目標編碼方案的功能性,以在不同內插曲線間選擇。此選 擇係根據在“攻擊”區段及“釋放”區段中之源增益曲線的分 類加以執行。換句話說’內插挑選演算法不只考量源增益 値及窗及/或目標編碼系統的內插函數,同時也分析源增 益曲線的行程,以決定適當目標增益値並最後決定一適當 目標增益曲線型樣。簡言之,可以認爲內插挑選演算法考 量源增益値及源解碼器的窗及/或內插函數及目標增益値 及目標解碼器的窗及/或內插函數。 -41 - 201027517 本文件提供幾項用以將增益元資料轉碼於源編碼方案 及目標編碼方案的演算法。此增益元資料的轉碼需要被執 行於音訊流的製作中心與音訊流的無線廣播最終點間之幾 個時機點。所述演算法允許在不同編碼方案間之彈性轉碼 ,該編碼方案具有不同長度的編碼方塊或訊框及在相鄰增 益値間有不同時間間隔。再者,這些長度的編碼方塊可以 在任意時間改變及在相鄰增益値間之時間間隔可以在音訊 流內的任意時間改變。所述演算法考量此源及目標編碼方 案的彈性並允許於變化方塊長度的編碼方案間之彈性轉碼 及改變之時間間隔。另外,所述演算法允許於源增益曲線 與目標增益曲線間之最佳匹配並可以考量例如目標增益曲 線應一直在源增益曲線下的侷限,以避免不想要的作用, 例如限幅。 最終應注意已經描述了符合有關於計算複雜度及在元 資料轉碼器內處理的資料量的不同要求之多數演算法。較 佳地,單純根據在元資料位元流內可得之源增益値執行元 資料轉碼。這將提供具有減少處理器及記憶體要求的很低 複雜度轉碼演算法。這是例如排列順序濾波器演算法的情 形。轉碼效能可以在額外考量內插方案及目標編碼設內窗 函數而加以改良。即,例如“最佳匹配”時的增益演算法及 內插挑選演算法。在此時,元資料轉碼器也可以直接根據 由元資料位元流所取得之資訊執行轉碼。事實上,在元資 料轉碼器中並不需要有關於源編碼方案的詳細知識。最終 ,如果內插方案及源編碼方案的窗函數被考量,則元資料 -42- 201027517 轉碼可以進一步改良。這是在通用排列順序濾 及通用“最佳匹配”增益演算法。然而,這些演 關元資料轉碼器之源編碼方案的額外資訊。此 如儲存在元資料轉碼器的記憶體中並可以限制 選擇取樣。例如,如果元資料轉碼係執行於消 上,此資料可以儲存於機頂盒記億體中。 應注意的是,上述演算法可以以多種方式 Φ ,其可以較佳地使用一演算法,用於特定轉碼 轉碼狀況改變,則切換至另一演算法。此改變 能發生於當編碼方案的方塊尺寸例如由一長方 方塊。再者,當應用不同窗函數時,可以改變 因此,應了解的是,於此所述之演算法的組合 本發明之一部份。除了選擇一特定轉碼狀況的 算法外,較佳可以採用可用之參數,例如排列 演算法的參數/5至特定轉碼狀況。例如,如果 φ 案或目標編碼方案上,編碼方塊的長度由長訊 訊框,則可以適當地修改施加在排列順序演算 間隔。 通常,應了解的是,於本文件中所述之演 關參數可以以任何組合施加並根據每方塊一戈 立即”改變,以適用至現行及連續改變轉碼狀況 【圖式簡單說明】 圖1爲典型轉碼鏈; 波器演算法 算法需要有 資料可以例 至窗函數的 費者機頂盒 組合。例如 狀況,如果 轉碼狀態可 塊改變至短 內插狀態。 可以認爲是 適當轉碼演 順序濾波器 在源編碼方 框改變爲短 法中之時間 算法及其相 f塊爲基礎“ -43- 201027517 圖2爲音訊編解碼的典型編碼及解碼結構; 圖3爲不同音訊編解碼的不同內插增益曲線; 圖4 a爲音訊編解碼的內插函數; 圖4b爲有關於圖4 a的內插函數的窗函數: 圖4 c爲用於非對稱窗函數及其相關內插函數的例子; 圖5爲一連串序連內插增益曲線; 圖6爲第一轉碼演算法的增益匹配特性的第一例; 圖7a及7b爲顯示第一轉碼演算法的增益匹配特性的第 二例; 圖8爲使用第一轉碼演算法的增益元資料的轉碼之實 驗結果; 圖9a及9b爲第二轉碼演算法的增益匹配特性;及 圖1〇爲使用第三轉碼演算法的增益元資料的轉碼的實 驗結果。 【主要元件符號說明】 100 :鏈 1 〇 1 :製作中心 102 :無線廣播格式 103 :廣播格式 104 :網路 105 :機頂盒 106 :消費者設備 2〇〇 :音訊編碼器 201027517 201 :轉換爲主編碼器 202 : QMF分析 203 :窗函數 204 : TDAC轉換器 205 :元件 210 :音訊解碼器 2 1 1 :轉換爲主解碼器 212 : SBR分析 213 :窗函數 214 : TDAC轉換器 2 1 5 :元件
-45-

Claims (1)

  1. 201027517 七、申請專利範圍: 1. 一種將有關於動態範圍控制之音訊增益元資料由第 一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方 案的第二增益元資料的方法,其中 該第一及第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有至少一相關增益値;及 其中該方法包含步驟: 根據該第一增益元資料的增益値,選擇該第二增益元 資料的增益値,使得有關於該第二增益元資料的該增益値 的時間實例旁的時間間隔內,該第一增益元資料的最小增 益値被選出; 如果沒有該第一增益元資料的增益値落在有關於該第 二增益元資料的該增益値的該時間實例旁的該時間間隔內 ,則選擇該第二增益元資料的該增益値爲 有關於該編碼方塊的該第二增益元資料的該增益値, 該編碼方塊超前有關於該第二增益元資料的該增益値的該 編碼方塊;或 該第一增益元資料的該增益値,其在該時間間隔的前 一時間間隔。 2. 如申請專利範圍第1項所述之方法,其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的不同 時間長度。 3 .如申請專利範圍第1項所述之方法,其中該時間間 隔的上及下限係爲一時間常數所決定’該時間常數係分別 -46- 201027517 加入至與該第二增益元資料的該增益値相關的該時間實例 及由該第二增益元資料的該增益値相關的該時間實例減去 〇 4. 如申請專利範圔第3項所述之方法’其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編 碼音訊信號的 某些時間長度,及其中該時間常數係大於或等於 該第一音訊編碼方案的該編碼方塊的該時間長度;及 φ 該第二音訊編碼方案的該編碼方塊的該時間長度的最 大値。 5. 如申請專利範圍第3項所述之方法’其中該第一與 第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的某些 時間長度及其中該時間常數小於 該第一音訊編碼方案的該編碼方塊的該時間長度;及 該第二音訊編碼方案的該編碼方塊的該時間長度的最 大値。 Φ 6·如申請專利範圍第1項所述之方法,其中該第二音 訊編碼方案允許不同內插曲線的選擇,內插曲線內插該第 二增益元資料的相鄰增益値’以形成第二增益曲線;及其 中該方法更包含步驟: 根據該第一增益元資料的該增益値,在該第二增益元 資料的兩相鄰增益値間,選擇一適當內插曲線。 7.如申請專利範圍第6項所述之方法,其中該適當內 插曲線係根據該第一增益元資料的兩相鄰增益値間之差加 以選擇。 -47- 201027517 8. 如申請專利範圍第6項所述之方法,其中 第一增益曲線係相關於該第一增益元資料的該增益値 ;及 該第一增益曲線係藉由內插該第一增益元資料之相鄰 增益値而取得,及 該方法更包含步驟:根據該第一增益曲線的斜率,在 該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線 〇 9. 如申請專利範圍第8項所述之方法,更包含步驟: 如果該第一增益曲線的負斜率超出預定臨限値,則檢 出一增益攻擊; 如果該第一增益曲線的負斜率低於預定臨限値,則檢 出一增益釋放;及 根據該第一增益曲線的檢出增益攻擊或增益釋放,在 該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線 ❹ 1 0·如申請專利範圍第9項所述之方法,其中該方法更 包含步驟: 根據該第一增益曲線的該斜率的絕對値的最大値之位 置’選擇該第二增益元資料的兩相鄰增益値間之該適當內 插曲線。 11,一種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 -48- 201027517 該第一及第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有至少一相關增益値;及 第一增益曲線相關於該第一增益元資料的該增益値 及 其中該方法包含步驟: 選擇相關於該第二增益元資料之該增益値的時間實例 旁的時間間隔內的該第一增益曲線的最小値作爲該第二增 Φ 益元資料的該增益値。 12.如申請專利範圍第11項所述之方法,其中 該選擇該第一增益曲線的最小値的步驟包含在該時間 間隔內選擇該第一增益曲線的一組取樣的最小値。 1 3 .如申請專利範圍第1 2項所述之方法,其中 該第一增益曲線的該組取樣對應於相關於落在該時間 間隔內的該第二增益値的該編碼方塊的時間實例的該第一 增益曲線的該等取樣。 φ 1 4 . —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有至少一相關增益値;及 相鄰編碼方塊的一連串增益値係被內插,以定義增益 曲線;及 其中該方法包含步驟:根據該第一增益元資料的增益 -49- 201027517 値’選擇該第二增益元資料的該增益値,使得第二增益曲 線低於第一增益曲線。 15.—種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的方法,其中 該第一與第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有至少一相關增益値;及 第一增益曲線係相關於該第一增益元資料的該增益値 » 第二增益曲線係相關於該第二增益元資料的該增益値 :及 其中該方法包含步驟··在相關於該第一音訊編碼方案 的編碼方塊的時間實例及相關於該第二音訊編碼方案的編 碼方塊的時間實例’選擇該第二增益元資料的該增益値使 得該第二增益曲線係小於或等於該第一增益曲線。 1 6 ·如申請專利範圍1 5項所述之方法,其中 該第一增益曲線係由相關於相鄰第一增益値的區段與 第一窗函數所構成;及 該第二增益曲線係由相關於相鄰第二增益値的區段及 第二窗函數所構成。 17.—種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統,其中 該第一與第二音訊編碼方案使用編碼方塊;及 -50- 201027517 各個編碼方塊具有至少一相關增益値;及 其中該轉碼系統包含: 選擇手段,用以根據該第一增益元資料的該增益値, 選擇該第二增益元資料的增益値,使得在相關於該第二增 益兀資料的該增益値的時間實例旁的時間間隔內,該第一 增益兀資料的最小增益値被選出,及如果該第一增益元資 料的增益値未落在相關於該第二增益元資料的該增益値的 φ 時間實例旁的時間間隔內,則選擇該第二增益元資料的該 增益値爲 相關於該編碼方塊的該第二增益元資料的該增益値, 該編碼方塊超前相關於該第二增益元資料的該增益値的該 編碼方塊;或 在該時間間隔前一個之該第一增益元資料的該直 0 18.—種將有關於動態範圍控制的音訊增益元資料 Φ 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統,其中 該第一與第二音訊編碼方案使用編碼方塊;& 各個編碼方塊具有至少一相關增益値; 第一增益曲線係相關於該第一增益元資料的該if # {直 •及 其中該轉碼系統包含: 選擇手段,用以在相關於該第二增益元資料的胃增益 値的該時間實例旁的時間間隔內選擇該第一增益曲@ 6勺胃 -51 - 201027517 小値作爲該第二增益元資料的該增益値。 19. —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統’其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有相關增益値:及 相鄰編碼方塊的一連串增益値被內插’以定義增益曲 線;及 其中該轉碼系統包含:選擇手段’用以根據該第一增 益元資料的增益値’選擇該第二增益元資料的該增益値’ 使得第二增益曲線係低於第一增益曲線。 20. —種將有關於動態範圍控制的音訊增益元資料由 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼 方案的第二增益元資料的轉碼系統’其中 該第一與第二音訊編碼方案使用編碼方塊; 各個編碼方塊具有相關增益値; 第一增益曲線係相關於該第一增益元資料的該增益値 ;及 第二增益曲線係相關於該第二增益元資料的該增益値 •,及 其中該轉碼系統包含.選擇手段’用以在相關於該第 一音訊編碼方案的該編碼方塊的時間實例及相關於該第二 音訊編碼方案的該編碼方塊的時間實例,選擇該第二增益 -52- 201027517 元資料的該增益値,使得該第二增益曲線係小於或等於該 第一增益曲線。 21. —種電腦程式產品,包含可執行指令,用以當被 執行於電腦時,執行如申請專利範圍第1至1 6項中任一項 所述之方法。 22. —種機頂盒,用以解碼接收之多媒體信號,該機 頂盒包含: φ 接收器,用以接收第一編碼方案的多媒體信號; 轉碼單元,用以將第一編碼方案的多媒體信號轉碼爲 第二編碼方案的多媒體信號;及 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一及第二音訊編碼方案使用編碼方塊;及 φ 各個編碼方塊具有至少一相關增益値:及 其中該轉碼單元根據該第一增益元資料的該增益値, 選擇該第二增益元資料的增益値,使得在相關於該第二增 益元資料的該增益値的時間實例旁的時間間隔內,該第一_ 增益元資料的最小增益値被選擇;及如果該第一增益元畜 料的增益値未落在相關於該第二增益元資料的該增益値的 時間實例旁的時間間隔內時,則該第二增益元資料的該;t曾 益値被選擇爲 相關於該編碼方塊的該第二增益元資料的該增益値, -53- 201027517 該編碼方塊係在相關於該第二增益元資料的該增益値的編 碼方塊之前;或 該時間間隔前一個的該第一增益元資料的該增益値。 23·—種解碼所接收之多媒體信號的機頂盒,該機頂 盒包含: 接收器,用以接收第一編碼方案之多媒體信號·, 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 @ 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有至少一相關增益値 第一增益曲線相關於該第一增益元資料的該增益値; 及 ⑩ 其中該轉碼單元在相關於該第二增益元資料的該增益 値的時間實例旁的時間間隔內,選擇該第一增益曲線的最 小値作爲該第二增益元資料的該增益値。 24. —種用以解碼所接收之多媒體信號的機頂盒,該 機頂盒包含: 接收器,用以接收第一編碼方案之多媒體信號·, 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 -54- 201027517 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案的每編碼方塊具有不同數 量的音訊取樣; 各個編碼方塊具有相關增益値;及 Φ 相鄰編碼方塊的一連串增益値係被內插,以定義增益 曲線,及 其中該轉碼單元根據該第一增益元資料的增益値,選 擇該第二增益元資料的該增益値,使得第二增益曲線係低 於第一增益曲線。 25.—種解碼所接收之多媒體信號的機頂盒,該機頂 盒包含: 接收器,用以接收第一編碼方案之多媒體信號; ❹ 轉碼單元,用以將該第一編碼方案的該多媒體信號轉 碼爲第二編碼方案的多媒體信號;及 發射器,用以傳輸該經轉碼多媒體信號; 其中該轉碼單元將有關於動態範圍控制的音訊增益元 資料由該第一編碼方案的第一增益元資料轉碼爲該第二編 碼方案的第二增益元資料,其中 該第一與第二音訊編碼方案使用編碼方塊;及 各個編碼方塊具有一相關增益値; 第一增益曲線係相關於該第一增益元資料的該等增益 -55- 201027517 値;及 第二增益曲線係相關於該第二增益元資料的該等增益 値;及 其中該轉碼系統在該第一音訊編碼方案的該編碼方塊 相關的時間實例及在該第二音訊編碼方案的該編碼方塊相 關的時間實例,選擇該第二增益元資料的該增益値’使得 該第二增益曲線係小於或等於該第一增益曲線。 26.如申請專利範圍第1至16項中任一項所述之方法’ 其中該第一與第二音訊編碼方案爲杜比E、杜比數位、 AAC、HE AAC 之一
TW098131941A 2008-09-30 2009-09-22 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒 TWI457913B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10149708P 2008-09-30 2008-09-30

Publications (2)

Publication Number Publication Date
TW201027517A true TW201027517A (en) 2010-07-16
TWI457913B TWI457913B (zh) 2014-10-21

Family

ID=41264281

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098131941A TWI457913B (zh) 2008-09-30 2009-09-22 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒

Country Status (7)

Country Link
US (1) US8798776B2 (zh)
EP (1) EP2332140B1 (zh)
JP (1) JP5129888B2 (zh)
CN (2) CN102171755B (zh)
AR (1) AR073676A1 (zh)
TW (1) TWI457913B (zh)
WO (1) WO2010039441A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI451746B (zh) * 2011-11-04 2014-09-01 Quanta Comp Inc 視訊會議系統及視訊會議方法
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
TWI560699B (en) * 2013-07-22 2016-12-01 Fraunhofer Ges Forschung Apparatus and method for efficient object metadata coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9578435B2 (en) 2013-07-22 2017-02-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for enhanced spatial audio object coding
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
US9743210B2 (en) 2013-07-22 2017-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US10249311B2 (en) 2013-07-22 2019-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
PL2232700T3 (pl) 2007-12-21 2015-01-30 Dts Llc System regulacji odczuwanej głośności sygnałów audio
WO2010053728A1 (en) * 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata
WO2010075377A1 (en) 2008-12-24 2010-07-01 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
TWI538394B (zh) 2009-04-10 2016-06-11 杜比實驗室特許公司 利用順逆向濾波方式獲取所欲非零相移之技術
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2012026092A1 (ja) * 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8521541B2 (en) * 2010-11-02 2013-08-27 Google Inc. Adaptive audio transcoding
JP5719966B2 (ja) 2011-04-08 2015-05-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定
TWI603632B (zh) 2011-07-01 2017-10-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN112185399A (zh) * 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的***
EP2898510B1 (en) * 2012-09-19 2016-07-13 Dolby Laboratories Licensing Corporation Method, system and computer program for adaptive control of gain applied to an audio signal
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9344828B2 (en) * 2012-12-21 2016-05-17 Bongiovi Acoustics Llc. System and method for digital signal processing
CN109102815B (zh) 2013-01-21 2023-09-19 杜比实验室特许公司 编码装置和方法、转码方法和转码器、非暂态介质
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
WO2014114781A1 (en) * 2013-01-28 2014-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
US9858932B2 (en) * 2013-07-08 2018-01-02 Dolby Laboratories Licensing Corporation Processing of time-varying metadata for lossless resampling
EP2833549B1 (en) 2013-08-01 2016-04-06 EchoStar UK Holdings Limited Loudness level control for audio reception and decoding equipment
EP2838196B1 (en) * 2013-08-12 2023-04-26 Bellevue Investments GmbH & Co. KGaA System and method for controlled dynamics adaptation for musical content
US9380383B2 (en) * 2013-09-06 2016-06-28 Gracenote, Inc. Modifying playback of content using pre-processed profile information
EP3044790B1 (en) 2013-09-12 2018-10-03 Dolby International AB Time-alignment of qmf based processing data
EP4379714A2 (en) * 2013-09-12 2024-06-05 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
RU2750644C2 (ru) * 2013-10-18 2021-06-30 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование положений спектральных пиков
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP3522157B1 (en) * 2013-10-22 2021-09-22 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Concept for combined dynamic range compression and guided clipping prevention for audio devices
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
CA3162763A1 (en) * 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9608588B2 (en) * 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
CN109087653B (zh) * 2014-03-24 2023-09-15 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
WO2015144587A1 (en) * 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
WO2015180866A1 (en) 2014-05-28 2015-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Data processor and transport of user control data to audio decoders and renderers
EP4044180A1 (en) 2014-10-01 2022-08-17 Dolby International AB Decoding an encoded audio signal using drc profiles
CN110164483B (zh) 2014-10-03 2021-03-02 杜比国际公司 渲染音频节目的方法和***
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US10097594B1 (en) * 2017-08-31 2018-10-09 T-Mobile Usa, Inc. Resource-managed codec selection
AU2019252524A1 (en) 2018-04-11 2020-11-05 Bongiovi Acoustics Llc Audio enhanced hearing protection system
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
US10743170B1 (en) 2019-11-28 2020-08-11 Motorola Solutions, Inc. Device, system and method for emergency audio transmission

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5814506A (en) * 1995-08-02 1998-09-29 New England Biolabs, Inc. Over-expression and purification of a truncated thermostable DNA polymerase by protein fusion
JP2001282261A (ja) 2000-03-30 2001-10-12 Canon Inc 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体
EP1586045A1 (en) * 2002-12-27 2005-10-19 Nielsen Media Research, Inc. Methods and apparatus for transcoding metadata
EP1513137A1 (en) 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN100542198C (zh) 2006-01-11 2009-09-16 华为技术有限公司 一种离散多音频调制数据传输方法及***
US8239190B2 (en) 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
CN101067931B (zh) 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与***
WO2009128663A2 (en) * 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN102007533B (zh) * 2008-04-16 2012-12-12 Lg电子株式会社 用于处理音频信号的方法和装置
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
TWI488176B (zh) * 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
TWI451746B (zh) * 2011-11-04 2014-09-01 Quanta Comp Inc 視訊會議系統及視訊會議方法
US9699584B2 (en) 2013-07-22 2017-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US10659900B2 (en) 2013-07-22 2020-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
TWI560699B (en) * 2013-07-22 2016-12-01 Fraunhofer Ges Forschung Apparatus and method for efficient object metadata coding
US9743210B2 (en) 2013-07-22 2017-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US9788136B2 (en) 2013-07-22 2017-10-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US10249311B2 (en) 2013-07-22 2019-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
US10277998B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US9578435B2 (en) 2013-07-22 2017-02-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for enhanced spatial audio object coding
US10701504B2 (en) 2013-07-22 2020-06-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US10715943B2 (en) 2013-07-22 2020-07-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US11227616B2 (en) 2013-07-22 2022-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
US11330386B2 (en) 2013-07-22 2022-05-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US11337019B2 (en) 2013-07-22 2022-05-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US11463831B2 (en) 2013-07-22 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US11910176B2 (en) 2013-07-22 2024-02-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US11984131B2 (en) 2013-07-22 2024-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects

Also Published As

Publication number Publication date
US8798776B2 (en) 2014-08-05
CN102171755B (zh) 2012-09-19
AR073676A1 (es) 2010-11-24
CN102171755A (zh) 2011-08-31
JP5129888B2 (ja) 2013-01-30
EP2332140B1 (en) 2013-02-20
CN102682780B (zh) 2014-07-16
WO2010039441A1 (en) 2010-04-08
TWI457913B (zh) 2014-10-21
EP2332140A1 (en) 2011-06-15
JP2012504260A (ja) 2012-02-16
CN102682780A (zh) 2012-09-19
US20100083344A1 (en) 2010-04-01

Similar Documents

Publication Publication Date Title
TWI457913B (zh) 音訊元資料的轉碼方法與系統、及其電腦程式產品與機上盒
US10276173B2 (en) Encoded audio extended metadata-based dynamic range control
KR101761041B1 (ko) 음량 및 동적 범위 제어에 대한 메타데이터
JP5603339B2 (ja) 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
KR101849612B1 (ko) 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치
RU2689438C2 (ru) Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа
EP1667110B1 (en) Error reconstruction of streaming audio information
US8060042B2 (en) Method and an apparatus for processing an audio signal
KR101108060B1 (ko) 신호 처리 방법 및 이의 장치
TW201145816A (en) System for combining loudness measurements in a single playback mode
US5845251A (en) Method, system and product for modifying the bandwidth of subband encoded audio data
RU2477532C2 (ru) Устройство и способ кодирования и воспроизведения звука
KR102605961B1 (ko) 고해상도 오디오 코딩
KR100782261B1 (ko) 오디오 배속 조절 기반 비디오 동기화방법
US6516299B1 (en) Method, system and product for modifying the dynamic range of encoded audio signals
CN113302684B (zh) 高分辨率音频编解码
WO2021200151A1 (ja) 送信装置、送信方法、受信装置、及び受信方法
JP2021124719A (ja) 音声符号化装置および音声復号装置、ならびにプログラム
CN113302688A (zh) 高分辨率音频编解码
CN113348507A (zh) 高分辨率音频编解码
Series Low delay audio coding for broadcasting applications

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent