TW201027517A

TW201027517A - Transcoding of audio metadata

Info

Publication number: TW201027517A
Application number: TW098131941A
Authority: TW
Inventors: Wolfgang A Schildbach; Kurt M Krauss
Original assignee: Dolby Lab Licensing Corp
Priority date: 2008-09-30
Filing date: 2009-09-22
Publication date: 2010-07-16
Also published as: US8798776B2; CN102171755B; AR073676A1; CN102171755A; JP5129888B2; EP2332140B1; CN102682780B; WO2010039441A1; TWI457913B; EP2332140A1; JP2012504260A; CN102682780A; US20100083344A1

Description

201027517 六、發明說明：【發明所屬之技術領域】本發明關係於音訊編碼的領域。尤其，有關於在不同音訊編碼方案間之音訊元資料的轉碼。【先前技術】隨著數位電視及無線電系統的廣泛流行，想要導引節 φ 目音量及動態範圍的接收機側控制及控制立體音降混 (downmix)的元資料（即有關資料的資料）愈來愈重要。因爲音訊資料的無線廣播格式或傳輸格式並不必然與節目製作或回送格式相同，即，音訊信號在建立或處理後所用之編碼方案不必然相同，這表示必須使元資料由一格式至另一格式進行轉碼。隨著被稱爲aacPlus的音訊編解碼器HE AAC的引入幾個新廣播系統中，已經有課題針對如何最佳編碼新元資料及如何將現行存在元資料轉碼爲HE AAC或 φ 由HE AAC轉出。 HE ACC(高效先進音訊編碼）係爲現行低位元率編解碼器，提供全頻寬近CD音質的48kbps立體音。HE AAC規格下，已經被標準化於MPEG-4中。該規格供在解碼器中之元資料的選用應用的加強方法，以改良出現在原始MPEG-2 A AC定義中出現的若干缺點。尤其，其允許元資料的規格，例如DRC(動態範圍控制）、DN(對話正規化）或由多頻道至立體音的降混，這係大量用於廣播中，以完成特別是收聽環境之原始節目材料的適當再現。 -5- 201027517 雖然例如HE ACC的編解碼器被廣泛用於廣播中，但在製作側及接收側上，有不同編碼方案係很常見。例如，杜比E編碼方案經常爲內容製作者所使用，而也稱爲ac_3 的杜比數位編碼方案或杜比D方案也經常被用於劇院及家用劇院解碼系統中。因此，有需要在不同編碼方案間之音訊元資料作轉碼，以確保在製作側所原來設定的元資料以未惡化方式到達最終解碼系統。此目標通常爲當使受到原始定義元資料的原始編碼音訊串流與受到轉換格式元資料的接收音訊串流相比較時確保收聽者未檢出感觀差異或幾乎沒有感觀差異。以下之發明有關於此問題並界定將元資料由一壓縮位元流轉譯至一不同壓縮位元流格式之方法，特別是當兩格式的訊框（framing)並不相容時。【發明內容】本發明描述一種用以將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼 (transcoding)爲第二音訊編碼方案的第二增益元資料的方法，其中該第一及第二音訊編碼方案使用編碼方塊及其中各個編碼方塊具有至少一相關增益値。該方法包含根據該第一增益元資料的增益値，以選擇該第二增益元資料的增益値之步驟’使得該第一增益元資料的最小增益値在相關於第二增益元資料的增益値的時間實例旁的時間間隔內選出。此第一與第二編碼方案的例子可以爲杜比E、AAC、 201027517 Η E A A C及/或杜比數位（杜比D)及其變化型，例如杜比數位 +。第一音訊編碼方案也可以稱爲在元資料轉碼器輸入的源編碼方案，而第二音訊編碼方案也可以稱爲在元資料轉碼器之輸出目標編碼方案。兩編碼方案均界定相關於編碼音訊信號的元資料。典型地，內藏編碼方案將編碼音訊信號分段爲編碼方塊。取決於編碼方案，此等編碼方塊可以包含不同量的編碼信號取樣。再者，編碼方塊也可以涵蓋 φ 不同時間長度之編碼音訊信號。通常，各個編碼方塊具有相關元資料，其也包含予以施加至特定編碼方塊的音訊信號的增益値。另一方面’很多音訊編碼方案施加所謂取樣保持行爲，其維持現行增益値，直到更新增益値接收的瞬間。因此，此時，現行增益値係有關於編碼方塊，直到更新增益値被收到爲止。依據本發明另一態樣，用以選擇第二元資料的增益値之時間間隔係爲上下限所定義。此上下限係爲個別增減至 φ 相關於第二增益元資料的增益値的時間實例的一時間常數所決定。換句話說，在較佳實施例中，該間隔係對稱於第二增益元資料的增益値的時間實例。此時間常數可以被選擇’使得其大於或等於第一音訊編碼方案的編碼方塊的時間長度與第二音訊編碼方案的編碼方塊之時間長度的最大値。如果時間常數係被選擇，則所述方法Θ到對增益過衝及限幅有抵抗之轉碼增益値。在某些狀況下’可以確定轉碼增益元資料從不會超出源增益元資料。 201027517 另一方面，時間常數也可以被選擇小於第一音訊編碼方案的編碼方塊的時間長度與第二音訊編碼方案的編碼方塊的時間長度之最大値。這是有利於在源增益元資料與目標增益元資料間完成良好匹配。在某些狀況下，可能發生第一增益元資料的增益値並未落在有關於第二增益元資料的增益値之時間實例旁的時間間隔內。例如，此發生於如果時間常數係被選擇以相對地小或者第二音訊編碼方案的編碼方塊的時間長度係小於第一音訊編碼方案的編碼方塊的時間長度。在此時，該方法可以選擇第二增益元資料的增益値爲有關於編碼方塊第二增益元資料增益値，該編碼方塊係在有關於第二增益元資料的增益値的編碼方塊之前。或者，該方法也可以選擇在時間間隔之前的第一增益元資料的增益値作爲第二增益元資料的增益値。換句話說，轉碼器可以使用音訊編碼方案的取樣保存行爲並維持現行增益値，直到接收到更新增益値爲止。依據本發明另一態樣，該方法更適用於該第二音訊編碼方案允許不同內插曲線的選擇，其內插第二增益元資料的鄰近增益値，以形成第二增益曲線。此音訊編碼方案例爲HE A AC，其允許特別適用於增益釋放之線性內插曲線以及特別適用於增益攻擊的多數突出內插曲線的選擇。如果第二音訊編碼方案提供此功能，則該方法可以包含根據第一增益元資料的增益値，在第二增益元資料的兩相鄰增益値間選擇適當之內插曲線。 ~ 8 - 201027517 該適當之內插曲線可以例如根據第一增益元資料的兩相鄰增益値間之差加以選擇。例如，如果第一源增益値（很）高及下一源增益値（很）低，則可以選擇“攻擊”狀內插曲線。另一方面，如果第一與下一源增益値相當地相似，則可以選擇“釋放”狀內插曲線。或者，如果第一增益曲線係相關於第一增益元資料的增益値，而此第一增益曲線可以藉由內插第一增益元資料 Φ 的相鄰增益値加以取得，則適當內插曲線可以根據第一增益曲線的斜率加以選擇。明確地說，如果第一增益曲線的負斜率超出預定臨限値，則可以檢出增益攻擊。換句話說，如果第一增益曲線陡降，則可以檢出增益攻擊。另一方面，如果第一增益曲線的負斜率低於預定臨限値，則檢出增益釋放。根據第一增益曲線的檢出增益攻擊或增益釋放 ’該方法然後在第二增益元資料的兩相鄰增益値間選擇適當內插曲線。 φ 如前所述，第二編碼方案可以允許選擇可以被稱爲內插曲線型樣的多數“攻擊”內插曲線。這些不同內插曲線型樣典型在時間上彼此延遲，藉以允許不同“攻擊”時間的定義。爲了使用此第二編碼方案的功能’該方法可以根據第一增益曲線的斜率絕對値爲最大的位置’來在第二增益元資料的兩相鄰增益値間，選擇適當的內插曲線。換句話說 ’該方法決定第一增益曲線的最陡點並選擇第二編碼方案的最接近此最陡點的內插曲線型樣。依據本發明另一態樣，第一增益兀資料的增益値的選 -9 - 201027517 擇不只可以根據第一增益元資料的增益値組，同時也可以根據整個第一增益曲線。在此等情形下，該方法包含在時間間隔內選擇第一增益曲線的最小値成爲第二增益元資料的增益値的步驟。如果第一增益元資料沒有增益値落在有關於第二增益元資料的增益値的時間實例旁的時間間隔內時，這可能特別有用。作爲第一增益曲線的最小値計算的低複雜度替代法，較佳地在該時間間隔內選擇第一增益曲線的一組取樣的最小値作爲第二增益元資料的給定增益値。第一增益曲線的此組取樣可以包含在落入該時間間隔內的第二增益値的編碼方塊時間實例的第一增益曲線的取樣。另外，本發明描述一種將有關於動態範圍控制之音訊增益元資料由第一音訊編碼方案之第一增益元資料轉碼爲第二音訊編碼方案之第二增益元資料的方法，其中該第一與第二音訊編碼方案每編碼方塊具有不同數量的音訊取樣及其中各個編碼方塊具有相關增益値。再者，相鄰編碼方塊的一連串增益値係被內插以定義增益曲線。該方法包含有根據第一增益元資料的增益値，選擇第二增益元資料的增益値的步驟，使得第二增益曲線一直在第一增益曲線下。使用此條件，可以確保沒有限幅之源音訊信號係被轉碼爲同樣也沒有限幅的目標音訊信號。再者，本發明描述一種將有關於動態範圍控制之音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的方法’其中該第一 -10 - 201027517 與第二編碼方案使用編碼方塊及其中各個編碼方塊具有相關增益値。另外’第二增益曲線係有關於第二增益元資料的增益値。該方法包含選擇第二增益元資料的增益値的步驟’使得在有關於第一音訊編碼方案的編碼方塊之時間實例’該第二增益曲線係小於或等於該第一增益元資料的增益値。依本發明另一態樣，第二增益元資料的增益値的選擇 Φ 可能不只是根據第一增益元資料的增益値組，也根據整個第一增益曲線。在此情形下，該方法可以選擇第二增益元資料的增益値，使得在相關於第一音訊編碼方案的編碼方塊相關的時間實例及/或在與第二音訊編碼方案的編碼方塊的時間實例，該第二增益曲線小於或等於第一增益曲線。當第二音訊編碼方案的編碼方塊的時間長度小於該第一音訊編碼方案的編碼方塊的時間長度時，這可能顯著有利〇 ❷ 對於某些編碼方案，增益曲線包含有關於鄰近增益値的區段及窗函數。典型地，曲線區段係藉由使用編碼方案的窗函數內插於相鄰增益値間加以取得。在此時，在特定時間實例的增益曲線的上述取樣可以爲增益値及窗函數的一組取樣所決定。對於某些編碼方案’所有或次組曲線區段的窗函數爲相同的，使得增益曲線可以爲增益値及窗函數的有限組取樣所描述。這允許上述方法之低複雜度實施法，即使根據源增益曲線作增益値選擇。本發明更描述轉碼系統’其實施上述轉碼方法。這些 -11 - 201027517 轉碼系統可以爲傳輸系統或消費者機頂盒的一部份。轉碼系統可以利用爲周圍系統所提供之處理及記憶體手段，但轉碼系統也可以包含本身處理手段，例如CPU及記憶體手段，如ROM或RAM。例如，音訊轉碼系統的實施法可以包含數位處理器及記憶體，用以儲存爲處理器所執行之指令。記憶體也可以更儲存進入元資料及在傳輸前產生之外出元資料。尤其，編碼方塊的增益値可以儲存在記憶體中，用於處理。再者 ’較佳地，令窗函數的取樣或第一及/或第二編碼方案的多數窗函數儲存於記憶體中。例示音訊轉碼系統可以被實施於機頂盒，用以由傳輸音訊格式轉碼爲用於播放或記錄於消費者家的音訊編碼方案。例如，於作爲傳輸音訊編碼方案的HE AAC與作爲播放之無線廣播音訊編碼方案的杜比數位（+ )間之轉碼可以設在機頂盒中。音訊轉碼系統的另一例子可以實施爲由節目製作或回送音訊編碼格式轉碼至傳輸音訊格式的頭端。例如，在作爲製作音訊方案的杜比E及作爲傳輸音訊方案的HE AAC間之轉碼可以設在此頭端系統中。應注意的是，於此文件中所述之方法與系統可以應用至各種第一與第二音訊編碼方案，例如杜比E、也稱爲杜比D或AC-3的杜比數位（ + )、AAC(先進音訊編碼）、及/或稱爲 aaacPlus 的 HE AAC(高效 AAC)。再者，應注意於本文件所述之方法與系統可以彼此組 -12- 201027517 合使用。即，其也可以使用一方法用於—轉碼方向而另一方法用於相反的轉碼方向。【實施方式】元資料爲“有關音訊資料的資料”，其與多頻道音訊串流一起進行於例如杜比數位、杜比E、aAC ' HE AAC或其他音訊編解碼器中。其取決於傳輸音訊串流，而移除需要 φ 廣播以持續調整並壓縮音訊位準的情形。其也提供音訊混合器’以有關於音訊串流的音響動態的高度自由度。在過去’與多頻道音訊一起工作的廣播者經常具有音軌平均位準低於其他節目位準上或下的問題。同時，當環繞聲音內容被播放於具有立體或單音音訊輸出的電視機時產生問題。使用音訊元資料’音響工程師可以對於不同播放系統不同地混合音訊內容並設定播放位準，全部在後製平台上，使得廣播者可以輸送更符合之音訊信號並確保最重要音訊 φ 元件通過。元資料提供若干參數，其特別想要改變輸送至消費者特有收聽環境的節目的聲音。這些元資料參數被稱爲對話位準（也稱爲對話正規化或dialnorm)、動態範圍控制、及降混。雖然技術上，並非個別元資料參數，但在消費者解碼器內的降混作爲特定元資料參數所生效，並如同 dialnorm及動態範圍控制必須小心監視及選擇生效該降混狀況的元資料參數。在製作側上之音響工程師最後負責最佳化多頻道混合，以在最佳收聽環境下作最佳播放。然而 -13 - 201027517 ，也必須小心以確保考量較差的收聽環境。這就是爲何在轉碼期間元資料未失真或只以限定方式失真很重要的理由，以在製作階段，保留所設計元資料之品質。對話位準參數提供正規化値給家用解碼器。此値調整音訊的音量至一預設位準，以協助由節目內容至節目內容及媒體至媒體的位準匹配。對話位準並不會在節目素材上主張任何壓縮或擴張，而是降低音訊的音量至一標準化位準。對話位準與動態範圍控制規格一起動作。對話位準參數於節目的輕聲及大聲間設定一種“空帶”。有時稱爲動態範圍壓縮或午夜模式之動態範圍控制 (DRC)給消費者以降低動態範圍收聽節目音訊之彈性。動態範圍的壓縮使得觀看者收看電視而不會干擾鄰居。此控制經常是選用的並經常可以在多數音訊解碼器，例如杜比數位解碼器中關閉。動態範圍控制也可以用於消費者解碼器上的共同“午夜模式”。在低音量時’節目的輕聲部份（耳語及輕聲細語）很難聽到。然而’如果收看者加大音量，則加大部份（爆聲、螢幕爭吵聲、鎗聲等）變成太大而不適。或者，在具有高位準背景雜訊的環境中’節目的輕聲部份將爲周圍雜訊所拉下。當在該解碼器中主張動態範圍規格時，則解碼器提高節目的輕聲部份的位準同時降低大聲部份的位準，允許使用者享受於電影中，而不必持續觸碰音量控制鈕。動態範圍控制典型包含兩參數或“規格，，：RJ7模式及線模式。應注思的疋’此兩參數並不會改變在位元串流中之 -14- 201027517 編碼音訊的內容。它們被使用以調整在收聽環境內的節目素材的極限，以此考量這些在降低動態範圍下所較佳或必須收聽節目之實例。 RF模式被設計用於峰値限制狀況，其中解碼節目係想要透過電視上之RF輸入而輸送，例如透過機頂盒上的天線輸出。其典型允許在±48.16dB範圍內的動態範圍壓縮’並也稱爲低率DRC。 φ 線模式提供較輕類型的壓縮，並允許使用者在家用解碼器內的低位準增強/高位準削減參數之調整。其典型允許在±2 4.08 dB範圍的動態範圍壓縮並被稱爲高率DRC。增強及削減區域的調整或“縮放”允許消費者客製化其特定收聽環境的音訊播放。降混爲例如杜比數位的音訊編碼器內的特性，其允許多頻道節目被幾個喇叭頻道所播放。簡單地說，降混允許消費者享受數位電視廣播，而不必完整之5 . 1 -頻道家用劇 φ 院設置。有關於立體音混頻，當混頻被監視爲單音情況下維持相容性時，多頻道音訊混頻需要工程師參考與少數喇叭頻道之混頻，以確保降混狀況的相容性。協助完成適當降混、協助確保音響工程師/內容製作者的意圖的某些元資料參數將在這些環境間轉譯。明確地說，元資料提供對喇叭頻道係如何“加”入所得之降混中之控制。當音響工程師通常最佳化理想收聽環境中之播放的多頻道混頻時，在降混狀況下預覽該混頻也是很重要的，以確定當選擇降混元資料參數時，與不同播放系統的相容 -15- 201027517 性。如上所述，元資料等等可以被使用以控制在解碼器中之時變增益元件，使用此作爲動態範圍控制及/或音訊信號的限制手段，以防止限幅。不同於在編碼器側上之壓縮，在解碼器側上之壓縮施加點爲末端使用者維持對動態範圍壓縮量的控制。對於午夜觀看，末端使用者可以使用最大壓縮，而具有自家用劇院之“愛樂者”可能較想要原始劇院混頻的完整動態範圍。在現代數位廣播鏈中，幾個音訊格式係被使用於製作、回送、及傳輸階段中。其中原始音訊混頻可能仍爲未壓縮線性PCM格式串流，製作的末端結果經常爲杜比E格式串流。使用杜比E作爲在內容製作程序中之音訊編解碼器，製作者有可能在這些之中內藏描述整個節目音量的元資料參數（DialNorm)、予以被使用以產生DRC係數之壓縮器規格、及降頻。圖1顯示由製作中心至消費者家的例示音訊轉碼鏈100 的例子。在製作中心1 0 1，音訊串流典型爲最適用以製作及後製目的，例如杜比E的音訊格式。此製作音訊串流然後被轉碼爲最適用以無線廣播目的1 02的格式，例如杜比數位，其係被稱爲杜比D或AC-3。如果需要音訊串流的傳輸或廣播，則此無線廣播音訊串流可能需要轉碼爲適當傳輸或廣播格式103，例如HE-AAC。此傳輸音訊串流可以然後透過網路104被傳輸至在消費者家中之多數機頂盒105上。由於多數消費者設備106均需要特定消費者音訊格式， 201027517 例如杜比數位以放出正確之音訊串流，所以在機頂盒1 〇 5 中有需要進一步由傳輸音訊串流轉碼爲消費者音訊串流。應注意的是’部份製作、無線廣播、傳輸及消費者音訊格式可能相同。尤其’無線廣播及消費者音訊串流格式可能均爲杜比數位。換句話說’杜比Ε格式可以被轉碼爲音訊資料串流，其更適用以在電影劇院、家中劇院或傳統家用音響中放出 ❹ 內谷。此無線廣播首訊資料串流的例子爲杜比數位串流。在音訊資料串流格式間之轉碼，即在製作音訊串流與無線廣播音訊串流間之轉碼同時也觸發元資料轉碼的需求。如果需要音訊串流的傳輸或廣播，則無線廣播音訊串流’例如杜比數位串流可能需要轉碼爲傳輸音訊串流，例如Μ P E G Η Ε - A A C音訊串流’其係最佳化用於音訊於低位元率鏈結上的傳輸。對於在無線廣播音訊串流與傳輸音訊串流間之此等轉碼，相關元資料需要被轉碼。 φ 在傳輸後，音訊資料串流通常在接收器被解碼，接收器可以爲在消費者住所之機頂盒（STB)。尤其，如果音訊資料串流爲多頻道音訊串流，例如環繞聲音訊串流，則其較佳將傳輸音訊串流轉碼爲消費者音訊串流，例如杜比數位。藉此’多頻道信號可以經由光學或同軸S/p DIF鏈結傳送給消費者家中劇院或電視機中之多頻道接收器。同時 ’在傳輸音訊串流與消費者音訊串流間之轉碼需要在相關元資料間之轉碼。當一格式之音訊資料串流被轉碼爲另一格式之音訊資 -17- 201027517 料串流時，元資料需要與之一起進行。DialNorm元資料的轉碼典型並未呈現大問題，因爲它通常只有在節目邊緣才顯著改變其他就幾乎不變。然而，DRC元資料的轉碼則很重要，因爲DRC控制信號在不同音訊格式中具有不同訊框。表1列出例示音訊格式及編解碼器的不同訊框長度。編解碼器視訊框率(fi>s) 取樣之訊框長度 AAC N/A 128/1024 HE AAC N/A 256/2048 LD AAC N/A 120/960 LD HE AAC N/A 240/1920 杜比AC-3 N/A 256/1536 杜比E 25 1920 杜比E 50 960 杜比E 30 1600 杜比E 60 800 表1

對於AAC爲主格式，在“訊框長度”列中之左側數量表示短方塊/訊框的長度及右數量表示長方塊/訊框解析度。對於杜比數位/AC-3格式，“訊框長度”中之左數量表示高速率DRC字的解析度，即對於線模式的訊框大小，及右數量表示低速率DRC字元的解析度，即RF模式之訊框大小。可以看出，取決於架構，DRC元資料的轉碼可以由較高速率之元資料進行至較低速率，或反之亦然。爲了更複雜，AAC爲主格式也可以改變時間解析度，即現場之訊框長度，使得兩狀況，即由高速率轉碼爲低速率及由低速率轉碼爲高速率均可以在相同串流中發生及在相同轉碼操作 -18- 201027517 中發生。再者’ AAC爲主格式可以一訊框一訊框地發出有元資料出現否的信號。典型，解碼語意定義一取樣及保持行爲，即解碼器被指示以一直使用收到之最新增益控制信號，直到新資料到達爲止。因此，在AAC訊框中沒有元資料表示解碼器中應被施加最新增益控制信號，直到進一步通知爲止。爲壓縮器所施加之增益可以爲長準固定部份所特徵化 φ ，並爲增益快速下降之陡“攻擊”所中斷。這些“攻擊”典型施加以軟化在音響強度中之突然增加，例如在電影中之爆炸。由這些斜角，壓縮器增益可以以稱爲“釋放”的長時間常數回復。換句話說，在音響強度中之突然增加被尖增益 “攻擊”所對抗，其中增益値係在很短時間期間被強烈降低 ’而在增益“釋放”期間，則增益增加被平順地執行。雖然在施加DRC增益時音訊信號的部份量的調變失真在該攻擊上不可避免，但此攻擊之衰減時間常數被選擇， φ 使得調變失真聽不到。增益攻擊之適當衰減時間的選擇爲音響工程師設計適當DRC元資料時的一項重要任務，並且在元資料轉碼時，將DRC元資料由製作音訊格式轉碼至無線廣播音訊格式進行一步轉碼至傳輸音訊格式，例如AAC 時，必須小心以不破壞此特性。再者，壓縮器也可以耦接至限制器，其限制在任一時間之最大壓縮器增益，以不會產生通過odBFS的信號。此等限制器典型用以防止限幅。當轉碼元資料時，此等限制器功能需要考量。 -19- 201027517 例如AAC、HE A AC、及杜比數位/AC-3之音訊編解碼器典型爲適應性轉換爲主的編解碼器，其根據例如MDCT ，即修改離散餘弦轉換的Princen-Bradley時域假象取消 (TDAC)技術，使用頻率-線性臨界取樣濾波排。MDCT轉換經常被耦接額外窗函數，以藉由使MDCT及逆MDCT函數在濾波器邊界點平滑進行至零，而避免在轉換邊界的不連續〇這是如圖2所示，其中顯示音訊編碼器200及音訊解碼器210。圖2顯示轉換爲主編碼器201及轉換爲主解碼器211 ，如同在例如AAC及杜比數位/ AC-3之音訊編碼方案中被使用。如上所述，此編碼方案包含在編碼側上之TDAC轉換濾波排204及在解碼側上之逆TDAC轉換濾波排214。再者，在編碼及解碼側的窗函數203及213分別移除在濾波器邊界的TDAC轉換204、214的不連續。另外，轉換爲主編碼器201及解碼器211包含額外元件，例如分別爲黑點205 及2 1 5所表示之暫態檢測器、量化手段、位元配置手段等等。爲了進一步降低傳輸資料速率，例如HE-A AC之某些音訊編解碼器使用稱爲頻帶複製（SBR)的技術。SBR的內在原理爲音訊信號的較高頻部份的心理聲響重要性相當地低。因此，使用SBR的音訊編解碼器只使用上述之轉換爲主編碼器編碼信號頻譜的下半部。信號頻譜的上半部係爲 SBR解碼器或合成所產生，其主要爲在傳統轉換爲主之解碼器後的後置處理。不作傳輸高頻頻譜，SBR根據傳輸於 201027517 內在編碼器中之低頻的分析，在解碼器中重建較高頻率。爲了確保準確重建，部份導引資訊被以很低資料率傳輸於編碼位元流中。在編碼側使用QMF(正交鏡濾波器）分析的此SBR分析係在圖2中被顯示爲方塊2 02。典型地，此QMF 分析藉由分析例如64信號次頻帶而決定基本頻譜信號資訊。在解碼側上，信號資訊係被用於SB R合成2 12中，使用包含64次頻帶之QMF合成濾波器排。 I 上述轉換爲主編碼方案的主要優點爲信號元件及對應量化雜訊元件（想要被遮蔽）被保持在臨界頻寬內，由人類耳朵的遮蔽特性導出之最大利益，及最小化感覺無雜訊編碼所需的所得資料率。在開始DRC元資料的轉碼之前，將提供在音訊解碼器的此DRC元資料使用的簡要說明。對於每訊框或方塊，音訊解碼器將剖析所接收位元串流，以表示是否新增益値被傳輸用於該特定訊框。如果未提供新增益値，則解碼器將 φ 使用最後傳輸增益値。另一方面，如果已經收到新增益値，則新增益値將被讀入並應用。對於例如AAC及AC-3的某一群音訊編解碼器，新接收增益値將被使用以放大或衰減由訊框中解碼出的頻譜音訊資料。換句話說，在施加逆TDAC轉換前，增益被施加至頻訊音訊次頻帶。由於此轉換的施加及取樣重疊典型相關於轉換而典型應用及由於相關窗化，增益値將有效地被內插於連續訊框之間。在本文中，內插函數可以被視爲加權函數。此內插增益曲線係如圖3所示，其中顯示A A C編解 -21 - 201027517 碼器的s型內插函數3 01。典型內插函數係如圖4a中之圖形 401所示。對應窗函數402係示於圖4b中。另外，應注意的是，也可以使用非對稱窗函數及相關內插函數。例如當窗函數由一信號方塊變化至下一方塊時，也可以發生此非對稱窗函數。在圖4c中，顯示此非對稱窗函數411及412，及其相關內插函數421及422。再者，圖5顯示用於三連續方塊或訊框的內插增益曲線。可以看出，由零方塊至第一方塊的由6dB至OdB的增益轉移係爲AAC窗函數所內插，以得到典型S形內插曲線501 。由第一方塊至第二方塊，增益値保持在OdB不變，使得增益曲線502保持平坦。然後，在第三方塊發生另一增益轉移至-3.5dB，其再次造成典型S形內插曲線502。對於另一群之音訊編解碼器，例如HE AAC編解碼器，增益將不會施加至MDCT頻譜上。相反地，其將在QMF( 正交鏡濾波器）合成前施加，該合成典型跟在逆MDCT轉換後。藉由預設，增益値係被線性內插於相鄰訊框或槽之間，如圖3所示，成爲內插曲線3 02。另外，HE AAC位元流語法保留另3個位元以選擇8個不同內插曲線303之一。這些方案基本上不會內插，而是在“突然”跳至預定轉移曲線後的新增益之前，持續保持舊增益値不同時間量。圖3顯示分佈於訊框寬度上之一組轉移曲線303。此突然增益轉移曲線較佳匹配當想要突然增益改變的狀態，例如增益攻擊時的狀態。對於HE A AC編碼方案，該串增益値有效地內插以形成如圖3所示之增益曲線3 02及3 03。此內插係有

201027517 關於QMF合成之脈衝回應。爲了容易解說，可以假設將也被稱爲释控制信號具無限高解析度，但在真實中，if 格上取樣。爲了由一代表値至另一代表値，取樣增益値爲時間連續的內插級。此級典塑器的取樣保持語意。不是每一訊框承載增益是部份音訊資料格式，例如杜比E允許發出格特別是壓縮器規格。爲了轉碼目的，此屬被視爲增益控制信號。事實上，壓縮器規相特定增益値給每一音訊信號取樣。因此，壓定義增益控制信號。使用內插級，這些增益有時間連續信號代表値。在以下，轉碼元資料的問題將進一步另，參考由2007年十月5至8日之音響工程師1 W. Schildbach等人所作之“動態範圍控制係 φ 料的轉碼爲PMEG-4 HE AAC”，其係倂入作如前所述，轉碼的目的爲受到轉碼元：，特別是轉碼增益値的音訊信號聽起來一 1 於具有施加原始增益之音訊信號。由此明；碼演算法的若干侷限可以公式化爲： •當受到原始增益値的信號並未限幅E 益値的信號也不應被限幅。即，該信號必ί 。這可以藉由拾取增益取樣加以完成，使ί 號的增益不會超出進入增益。益曲線的增益益値只在分立可以假設內插遵循上述解碼控制係數，而選擇元資料規縮器規格可以暗示地指定一縮器規格實際控制信號也具析。在本文中 δ會123頁的由數與其他元資 $參考。料的音訊信號或儘可能類似目標，對於轉，受到轉碼增保留限幅保護施加至轉碼信 -23- 201027517 •對於靜態增益曲線，轉碼增益曲線應相同。即，其中在原始增益曲線與轉碼增益曲線間之準靜態信號應沒有不匹配。 •當發生動態增益改變時，施加至轉碼信號上的增益應儘可地接近地模擬進入增益，即釋放及攻擊次數應類似〇考量這些侷限，可以公式化某些量的轉碼演算法。這些轉碼演算法將被槪述如下。啓始音訊編碼格式之增益値將稱爲源增益値及對應音訊編碼格式將稱爲源編碼方案的源格式。轉碼增益値將稱爲目標增益値及相關音訊編碼格式將稱爲目標編碼方案的目標格式。應注意的是，取決於特定轉碼狀態，不同強調可以放在不同組或次組的侷限上。在某些狀況中，較佳地確保目標增益曲線永遠小於或等於源增益曲線。如果予以避免在目標側上的音訊限幅，則這可能是較佳選項。另一方面，這也可能足以確保只有在某組取樣點處，目標增益曲線係小於或等於源增益曲線。例如，其足以明定只有目標增益値爲小於或等於源增益値。在此時，由於在源側及/或目標側的內插，有可能發生目標增益曲線在某些點超出源增益曲線。然而，這也可能在可容忍過調變效應的代價下，得到源增益曲線與目標增益曲線的較佳整體匹配。再者，在部份轉碼狀況下，也可適當地進一步喚醒有關於目標增益曲線或目標增益値的侷限小於或等於源增益曲線或源增益曲線。在此等情況下，更強的強調可能放置在增益曲線 -24- 201027517 的整個匹配上。也應注意的是，以下演算法也可以用以漸進地將增益元資料由源@碼方案轉碼至目標編碼方案。由於編碼音訊信號的即時特性，所以這是很重要。因此，在典型轉碼狀態中不可能緩衝任意數量的源編碼方塊並對這些緩衝源編碼方塊執行整體轉碼操作。因此，適當轉碼演算法需要一方塊一方塊爲主地執行漸進轉碼。此漸進方塊狀轉碼可以 A 以以下轉碼演算法完成。再者，應注意的是，以下演算法可應用至非相稱訊框。這表示源編碼方案的訊框及目標編碼方案的訊框可以爲任意地不同，兩者均有關於訊框大小，即每訊框的取樣數或每訊框包含的音訊信號的長度，及有關於訊框的同步化 ’即’它們個別之開始及結束時間。事實上，甚至源編碼方案與目標編碼方案的取樣率可能不同。再者，也可以說成以下演算法不只限制音訊增益資料 Φ 的轉碼’同時也可以應用至將信號由一壓縮位元流格式轉碼至另一壓縮位兀流格式之任意裝置，其中該等格式之訊框並不相容。有關於音訊編碼的一些例子爲杜比E至/自 Η E - A A C轉碼器或杜比數位至/自Η E - A A C轉碼器。例如，由於AAC/HE AAC及杜比數位位元流有不同訊框，即使杜比數位位元流分配空間給元資料，也不可能直接將元資料由A A C / Η E - A A C位元流映圖至杜比數位位元流。因此，爲了保留在AAC/HE AAC位元流中之元資料，於以下所述之方法與演算法需要執行元資料轉譯。 -25- 201027517 演算法1 :排列順序濾波器符合或近似上述侷限的可能爲對源增益値施加排列順序濾波器。假設g’i(i = 〇 ’…’ N-1)爲目標格式之N訊框的目標增益値，及gj(j = l ’…’ M-1)爲源格式之Μ訊框的源增益値。再者，假設t’i爲相關目標增益値g’i被施加的次數及tj爲源增益値gj被施加之次數。由於用於源格式之解碼器中之濾波排及/或窗函數的 _ 內插函數，源增益値gj定義一連續源增益曲線，稱爲G(t) ，其係由兩相鄰源增益値gj及gj + 1間之曲線區段Gj(t)的序連構成。如果W(t)爲兩源增益値間之內插或加權函數，曲線區段Gj(t)可以被寫成

Gj (〇 = gj (l - W{t -φ gJ+iW(t ~tj). (1) 圖6顯示此一內插源增益曲線G(t)，601，其係由曲線區段Gj(t)之連序所構成（j = 〇，…7)。換句話說，源增益曲線G(t)，601係根據九個源增益値gj(j = 0，…，8)，在時間參 tj(j = 0 »…，8)。在所示例子中，內藏源編碼方案爲線性內插方法所選擇之HE AAC。此線性內插法解釋相鄰源增益値gj間之線性轉移。應注意的是，其他編碼方案提供類似內插源增益曲線。可以展現出當在時間t’i時選擇目標增益値g’i，使用公式 = （2) 然後，上述轉碼侷限可以在某些附屬條件下符合。通 -26 - 201027517 常，也可以說成爲如果；5被選擇，使得 β > ), (ί;+, - /;)} (3) 則內插目標增益曲線將一直保持在內插源增益曲線下。尤其，當內藏編碼方案使用線性內插方案時適用。這是示於圖7a及7b中。圖7a顯示當（~1〇#川_〇)，即目標編碼格式之訊框尺寸小於或等於源編碼格式之訊框尺寸。例如，此等狀況可以發生於當元資料由HE A AC長訊 φ 框解析度轉碼至杜比數位。源增益曲線701係爲於爲圓圈所代表的時間to、t,、t2及t3源增益値gj所定義。爲了簡單起見，已經被施加有稱爲Η E A AC之線性內插。可以由圖 7a看出，如果/3被選擇大於或等於（tj + 1-tj)，在時間實例 t’〇至t’18的一連串目標增益値g、可以使用公式（2)決定。這些目標增益値g’i係在圖7a被表示爲“X”並得到目標增益曲線702，其可以永久在源增益曲線701下。用於g’^公式之操作模式可以由雙箭頭703看到，其表示向後及向前延伸參（tj + 1- tj)時間實例的時間實例t’8旁的時間間隔。換句話說，卢=(tj + 1-tj)。在此時間間隔內，最小源增益値gj具有 f/ e If I ’川 _ I〆 /·+1 ’y+i _ G lj，（4〉係被選擇爲目標增益値g’i。在時間實例t’8，目標增益値g’8被決定爲在時間實例t2的源增益値g2。圖7b顯示當’即當目標編碼格式之訊框尺寸大於或等於源編碼格式之訊框尺寸時。例如，此狀況可以發生於當由杜比數位轉碼爲HE AAC長訊框解析度時。在時間實例U至t, 8的源增益値gj係爲圓圈所表示，並造 -27- 201027517 成源增益曲線G(t)’ 711°當選擇Θ爲大& $胃於（t’i + 1-t’i) ，可以使用公式（2)決定在時間實例^至Γ3的—連串目標增益値g，i。這些目標增益値可以在圖7b中被表示爲“x”。可以看出，這些目標增益値g’i造成目標增益曲線712 ’其係一直低於源增益曲線GG) ’ 711 °類似於圖7a ’雙箭頭 713表示對於召=(1、+ 1-匕）的時間實例11’旁的時間間隔。參考圖6 ,其中轉碼例子係例示用於。可以看出，如果yS =(t’i + i_t’i) ’則取得虛線目標增益曲線602 。再者，在時間實例t ’ =4旁的相關時間間隔係由雙箭頭6 0 4 所示。應注意的是’目標增益曲線的壓縮器釋放係相較於源增益曲線601的壓縮器釋放被延遲。準確地說，源增益曲線的壓縮器釋放開始於時間實例t = 3處，而目標增益曲線的壓縮器釋放只開始於時間實例t’=4。另一方面，可以看出目標增益曲線的攻擊相較於源增益曲線的攻擊爲超前。準確地說，源增益曲線的壓縮器攻擊開始於時間實例 t = 2，而目標增益曲線的壓縮器攻擊則已經在時間實例t ’ = 1 開始。圖6也顯示第二目標增益曲線603，其已經藉由選擇參數/5=0.5*(匕+ 1-厂〇加以取得，即在公式（3)中明定限制下的參數値。當選擇/3爲再也不能確保目標增益曲線一直在源增益曲線下。然而，參數卢的變動對壓縮器釋放的延遲量及/或壓縮器攻擊的超前量作出控制。在圖6中之目標增益曲線6 03顯示， 201027517 當選擇卢=0.5*(t’i + 1-t’i)時’壓縮器攻擊及釋放曲線可以移動較目標增益曲線602接近源增益曲線6〇ι。用以決定目標增益値的相關時間間隔的大小在時間實例t，= 4處係被雙箭頭605所顯示。然而，應注意的是，當具有沒< ，（tj + 1-tj)}的參數冷應被小心拾取，因爲値太低的万可能造成目標增益顯著超出源增益曲線。此過量增益過衝可能造成可聽到之音訊缺陷，例如限幅。因此， φ 適當參數万的選擇爲元資料轉碼器的方案者在考量多數不同方面下所作出之折衝。例如，此等方面可以包含所施加音訊編碼格式、被編碼之內容、由源編碼方案轉碼至目標編碼方案的方向等等。應注意的是’此演算法可以以低計算複雜度實施，尤其’如果相關於不同時間實例tj的元資料以預定順序方式排列。這是由於用於目標增益値g’i的計算的源增益値gj的數量很低。典型地，只需要很少的比較計算用以決定最小 φ 値。再者，應注意的是，提出排列順序濾波器演算法只使用源增益値gj及其相關時間實例tj，以決定目標增益値g、。這資料係可以直接於轉碼單元由元資料位元流迅速取得並不需要額外處理。此特性加至提議排列順序濾波器演算法的低計算複雜性。圖8顯示使用上述排列順序濾波器演算法轉碼源增益曲線8 0 1的另一例子。在上述例子中’源編碼格式的訊框大小爲25 6取樣，而目標編碼格式之訊框大小爲2048取樣。參數冷已經被選擇爲冷=1Ώ3χ{(Γί+ι·Γί) ’（h+i-tj)}。此 -29- 201027517 轉碼狀態可能發生於例如杜比數位的編碼方案係被轉換至 HE AAC，其有可能定義相當長訊框尺寸，以提供較低頻寬傳輸。圖8也顯示轉碼目標增益曲線8〇2並且可以看出符合參數/9的明定狀態，轉碼增益曲線8 02係低於增益曲線 801。再者，可以看出攻擊已經超前，而壓縮器釋放已經被延遲。藉由以冷<max{(t’i+1-t’i)，+ 選擇參數召

，此作用可以降低。然而，即，以相較於源增益曲線的目標增益曲線的可能過衝的代價。再者，應注意的是，當選擇/9〈maxUt’i + i-t’i)，（tj+1-tj)}時，可能發生，尤其是當，即目標編碼格式的訊框尺寸係小於或等於源編碼格式之訊框尺寸，即，沒有源增益値g可以在時間實例t’i旁的間隔[t’i-万，

t’i+万]中指明。在此等實例中，公式將不能得到目標增益値g ’ i的一值。因此’可能有利以使用解碼器的取樣及保持行爲並假設目標增益値g’i維持不變’直到新値目標增益値使用上述公式（2)加以指明爲止。換句話說，目標增益値公式可以被寫成，_ Jmin{g川，’,-ί;| S e [ί’,Ύ,ίW] 8i=z\ · ⑹ 或者，可以使用解碼器的取樣及保持行爲於源編碼方案上。這表示如果沒有更新源增益値gj可以在時間實例旁的間隔[t，i - ’ t ’ i +沒]中指明’則最後檢測源增益値被假設爲現行源增益値gj。用以決定目標增益値g ’ i的公式可以被重寫爲 -30- 201027517 ,=i min^y 11^-^1 <p\tj e * 1&，7·Ι 0[ί',-ΑΛ+Α]. (7) “取樣及保持”方法的優點爲目標增益値g’i只根據源增益値gj加以決定。如上所述，此排列順序濾波器演算法的特性可以對低計算複雜度作出貢獻。或者，較佳地進一步考量源增益曲線G(t)的準確路徑並使用修改公式決定目標增益値g’i φ ^( = min{G(〇||/V-/|<^}. (8) 這可以特別有利於當’即當目標編碼格式之訊框尺寸小於或等於源編碼格式之訊框大小，因爲該組的適當源增益値以選擇目標增益値g’i ’將不會爲空白。相關演算法將稱爲通用排列順序濾波器演算法。另一方面，應注意的是，此修改選擇公式需要知道在元資料轉碼器的源增益曲線。尤其，元資料轉碼器需要知道內插函數W(t)或者甚至可能爲源編碼方案所用之該組內 Ο 插函數。根據這些內插函數W⑴及源增益値gj，源增益曲線區段Gj(t)及源增益曲線G(t)可以被決定。整體言之，相較於只使用源增益値gj的排列順序濾波器演算法的版本，可以期待藉由使用修改選擇公式，轉碼演算法的計算複雜性將增加。也應注意的是’上述公式（8)可以藉由只考量源增益曲線G (t)的一組取樣加以修改。例如，可能較佳地，只考量目標增益値的時間實例t’i及/或源增益値的時間實例tj的源增益曲線値。公式可以被然後重寫爲 -31 - 201027517 g\ = min{G(〇 I \t\ -t\ S y?}, with / e {r1,, t}}. (9) 限定源增益曲線G(t)至一組取樣値將降低所通用的排列順序濾波器演算法的計算複雜度。再者，應注意的是’ 一區段源增益曲線G(t)可以藉由兩鄰近源增益値gj，gj + 1及內插加權函數W(t)加以描述。因此，如果只需要一組取樣的源增益曲線G(t)，則此完整組的取樣可以由源增益値gj 及一限定組取樣的內插函數W(t)決定。此限定組取樣的內插函數W(t)可以例如儲存於元資料轉碼器的記憶體中。吾人可以想出使用兩選擇公式的組合，即排列順序濾波器演算法與通用排列順序濾波器演算法的組合。例如’ 較佳使用低複雜度排列順序濾波器演算法，其只使用源增益値gj，於目標方塊尺寸大於或等於源方塊尺寸，而使用源增益曲線G(t)或一組其取樣的較高複雜度通用排列順序濾波器演算法係被使用於目標方塊尺寸小於源區塊尺寸的狀況中。演算法2 : “最佳匹配”增益爲了決定符合或至少接近上述用於轉碼的侷限的第二演算法，源增益曲線G(t)及目標增益曲線G’（t)將相比較。假設W’（t)爲目標解碼方案的內插函數。例如，用於A AC編解碼器的內插函數可以被以半窗尺寸爲單位寫成 W’（t) = (Sin(tTt/2))2。此內插或加權函數典型爲窗函數的平方。應注意的是，一些編解碼器也預見窗切換的可能性，使得內插函數W’（t)可以由一編碼方塊改變至另一編碼方 -32- 201027517 塊。再者，編解碼器的方塊尺寸也可以改變，以造成窗函數的改變。這些效應與環境可能藉由選擇適當內插函數 W’（t)給每一增益曲線區段加以考量。使用目標解碼方案的內插函數w’（t)，在目標增益値 8、及8’；+1間之內插目標增益曲線〇’〇)可以被寫成 (〇=g\ (\-w\t-t\ ))+^'+1 ). (10) 整個目標增益曲線G’（t)可以藉由連序鄰近目標增益曲 φ 線區段G’i(t)加以取得。假設gj,i表示在時間4,|的所有源增益，+ 1，即在兩連續目標增益値g’i及g’i + 1間之時間間隔內的源增益値群。應注意的是，由於在源編碼方案及目標編碼方案上的訊框尺寸的“立即”改變，在時間間隔內的源增益値群及時間間隔本身的長度可能以特定（ad hoc)基礎地改變。因此，同時，在tj.i中之i及j的可能組合可以根據一方塊一方塊爲基礎地改變。 ❹ 選擇小於或等於在時間間隔[t’i，t’i + 1]內的連串源增益値g’i的目標增益値gjj及更明確地說目標增益曲線區段 G’i(t)的條件可以被寫爲： (11) 換句話說，在時間實例1」的目標增益曲線G’（t)需要小於或等於在時間實例的源增益値。定義在時間實例〇厂-1’〇的目標解碼方案的內插函數，以採用値W’j^W’di-t’i)並考量目標增益曲線區段 G’i(t)的公式，該條件可以被寫爲 -33- 201027517 客，，(卜其可以被重新寫爲 , 1 1-F' ^i+l ^ W* IV1 ^1' rr JJ π jj 此耦接組的不等式需要爲在所有目標增益値爲g\，Vi 有效。再者，所有目標增益値g’i需要爲大於或等於0，即

s\>0 > Vi。對於正規化內插函數，即對於具有， 1-FP ❺ 此也造成看到，因此，不等式可以重寫爲： 1 1 g ,+1 ^ gjj g —gjy (12〉

j，t yV 以類似方式，跟隨目標曲線區段G ’ i (t)的鄰近目標增益曲線區段G’i + 1(t)的不等式可以被寫爲：〇\+1 (0 = g'M (l - ^'y,(+1)+ g'M W'AM < gJ>M, (13) 其中『"+1 =『Ί+1-Λ+1)，及C+1<G，i+1W(+2。此不等式提供 g ’ i + 1的另一條件’即

, ^ 1 ^ j,M , < 1 ，1 „ gi+i-(ι-^,,/^+ι'Fi^g<+2-pFQ^+ii ( } 由於g’，Vi以及內插函數w’（t)被正規化，即，『Άνί，·/‘。如上所述，i及j的可能組合爲源編碼方案的方塊尺寸與目標編碼方案的方塊尺寸間之現行關係所給定。這些可能組合可能演化並一方塊一方塊地有所不同。設定g’o = 〇，剩餘g’i(i>〇)可以由該組不等式所提供的範圍選出。選擇的程序係如圖9a所示，用於目標編碼方案[t’， t’i + 1]大於等於源編碼方案h，^+1]的時間間隔的例子中。 -34- 201027517 圖9 a顯示源增益曲線9 0 1，其係由分別在時間實例t〇至t, 8 的源增益値go至gl8的內插取得。爲了此源增益曲線901，予以決定轉碼目標增益曲線G’（t)。在所示例子中，此目標增益曲線包含三目標增益曲線G’〇(t)、G’,（t)、G，2(t)，分別如圖9中之圖形區段902 ' 903及9〇4所示。在時間間隔 [t’i ’广+ 1]內的條件G’KUSgj.i可以被寫成用於該所示例子爲 G 0 (’〇)幺容〇，G 〇 (’! ) S 约，(?。(’2)幺容2，G 〇 (’3) € 发3，G 〇 (’4)幺，G’0 (ί5)彡 gs，對於G’〇(t)及類似於GMt)及G’2(t)的方式。當使用目標解碼器W ’（ t)的內插函數時，對於j = 0，…6的値 W’hc^W’Oj.o-t’o)可以被計算。藉由在以上提供方程式中使用這些內插値，可以取得用於目標增益値g’,的一組不等式’成爲先前選擇目標增益値g’o的函數。將目標增益曲線 G’〇(t)(即，圖形902)匹配至在間隔[t’〇，t、]中之源增益曲 φ 線901的較佳方式爲選擇所有不等式同時符合的最大目標增益値g ’ i。應注意的是，目標增益値g ’ i需要被小心由導出不等式所允許的範圍中拾取。如果目標增益値g’i的局部最佳値被選出，則上述不等式可能顯著地限制以下目標增益値g’i+1 的可能値之選擇。這最後可能造成振目標增益曲線G ’（ t) ，這典型並不是想要的。此一振盪行爲的例子可以看出，當選擇g’Q = 0時，依據上述方程式（I2)及（I4)，將留下很大自由度用以選擇§\的最佳及最大値。然而，這可能需要 -35- 201027517 g’2的選擇更小或甚至零，由於大校正部份 gl。在下一步驟中，下一目標增益値g’ 3可以依據該組不等式自由地最大化。可以看出，此局部最佳化及選擇程序，一次處理只有一目標增益値g’i，可能造成在目標增益曲線G’（t)中的不想要的振盪。因此，較佳地，在更通用最佳化程序內選擇目標增益値，而不必局部地過配合至該資料。例如，可以藉由將目標增益値g’i補充至額外侷限，例如藉由將目標增益値限制大於或等於目標增益値g’i而避免振盪，該目標增益値係依據上述排列順序濾波器演算法加以決定。然後除了在以最佳匹配增益演算法之文中所述不等式外這些條件將被符合〇再者，應注意的是，當沒有源增益値gj,i存在之目標時間間隔[t’i，t’1+1]具有時，上述演算法將不提供不等式G’KtjdHgjd。因此，沒有條件用以限制對應目標增益値g’i的選擇。當目標編碼方案的方塊/訊框尺寸小於源編碼方案的方塊尺寸時，可能發生此等狀況。此問題可以例如藉由施加音訊解碼器的取樣及保持行爲而克服。例如，在此等例子中，gj，i可以被選擇爲最後知道之源增益値gj。或者，較佳地在此等例子中，其中“最佳匹配”增益演算法並未提供任何條件，以依據上述排列順序濾波器演算法選擇目標增益値g’ i。再者，在另一實施例中，較佳由間隔[t’i -冷，t’i+召]選擇可能源增益値gj，其中參數yS可以 -36- 201027517 依據在排列順序濾波器演算法的本文4 擇。使用這些可能源增益値gj，依據所演算法之不等式可以被公式化，因此，增益値。所述“最佳匹配”增益演算法根據领目標增益値g ’ ；。另外，考量目標增益其以依據上述公式之內插函數W’（t)造 0 內插。此元資料轉碼器並不需知道用於插方案，只單純依據已經存在元資料位。因此，“最佳匹配”增益演算法可以被性。再者’應注意的是，元資料轉碼器目標編碼方案之內插函數w’（t)。事實數的特定取樣W’j.i需要被元資料轉碼器以被儲存在元資料轉碼器之記憶體作爲應注意的是，類似於排列順序濾沒 ® 匹配”增益演算法可以被通用化，使得時源增益曲線也被考慮用於轉碼目的。算法假定源增益値的時間實例，目標增於源增益値，即。如果源增碼器所知’則此條件可以被重新公式化値的時間實例，目標增益曲線應小於或即 G’idOSGjd.i)(具有 t，i<tj，iSt’i +丨及 t 此所述之目標增益區段G，Kt)及源增益線，此不等式可以被寫成： |所述之公式加以選述“最佳-匹配”增益可以決定適當目標 ί增益値gj選擇適當曲線G’（t)的行程，成目標增益値g’i的源編碼方案中之內元流中之源增益値實施爲低計算複雜並不需要準確知道上，只有此內插函所知。這些取樣可一表。芝器演算法，“最佳不只源增益値，同 “最佳匹配”增益演益曲線應小於或等益曲線爲兀資料轉，以描述該源增益等於源增益曲線， j<Ktj + 1。使用於區段G j (t)的內插曲 -37- 201027517 g\ (l - -1\))+ g'M W\tLi - f,) < g.(l - W(tji - tj))+ -tj). (15) 定義评’^ =评’（^，；-匕）爲在時間實例匕；（即在目標增益曲線的第i個曲線區段及源增益曲線的第j個曲線區段的時間實例）的目標編碼方案的內插函數値。在類似方法中，可以定義Wj，i = W(tj，i-tj)。使用源編碼方案的內插函數及目標編碼方案的內插函數之取樣値，上述不等式可以改寫爲 +1 ^ τρ- [gj (l - wUi)+ gj^wu - (l - W'Lt )g·, ]. (16)

rr JJ 類似於只使用源增益値的“最佳匹配”增益演算法的公式，此公式提供一遞迴方法’用以根據其先前目標增益値 g’i計算目標增益値g’i+1。所得演算法被稱爲通用“最佳匹配”增益演算法。當（t’i + pt’oytj + i-tj)時（即在兩相鄰源增益値間之時間間隔大於或等於在兩相鄰目標增益値的狀況 )係特別有利。如上所述’對於此等狀況，可能發生未符合條件+ i的源增益値gji存在的情形。在此等情況下’通用“最佳匹配”增益演算法將對源增益曲線提供適當內插增益並允許根據其先前目標增益値g，，及內插源增益値決定目標增益値g，i+丨。通用“最佳匹配”增益演算法的功能性之狀況（其中 (t’i+1-t’i)<(tj + 1-tj))可以在圖9b中看到，其中一線性內插增益曲線921係被轉碼爲s曲線內插增益曲線922。此等狀況可能於轉碼HE-AAC增益元資料成爲AAC或AC-3增益元資料發生。在此特定例子中，源編碼方案的方塊尺寸準確爲6倍 -38- 201027517 之目標編碼方案的方塊尺寸，再者，方塊邊界準確重疊，即第一目標編碼方塊的時間實例^與第一源編碼方塊的時間實例t’〇重合’ 1’6與“重合，以此類推。對於圖91)中所之特定例子，W’j,i=l及上述遞迴公式變成〜)+g;+1%vj 。較佳選項爲選擇最大可能目標增益値，其在此情況下對應於在時間實例t’i+1之源增益曲線的値。這是在圖9b所示 ’其中’在時間實例t’1Q的目標增益値g，1Q係被以“x”931表 φ 示。整體言之’可以看出目標增益曲線922良好匹配源增益曲線9 2 1。也可以看出，如方程式（丨5)所要求，目標增益曲線922在時間實例於或等於源增益曲線921。另一方面’由於目標編碼方案的S曲線內插，目標增益曲線有時大於源增益曲線。如上所強調，此通用侷限的目標增益曲線應一直小於或等於源增益曲線的喚起在某些轉碼狀況下可能有利，尤其當較強的強調係放在兩增益曲線的整體匹配上。 φ 應注意的是’可能較佳地使用“最佳匹配”增益演算法與通用“最佳匹配”增益演算法的組合。例如，“最佳匹配” 增益演算法可以用於目標編碼方案的方塊尺寸大於或等於源編碼方案的方塊尺寸的狀況中，尤其由AC-3至HE AAC 的轉碼。另一方面，通用“最佳匹配”增益演算法可以用於當目標編碼方案的方塊尺寸係小於源編碼方案的方塊尺寸，尤其是將由HE-AAC轉換至AC-3。藉由組合演算法，於計算複雜性與匹配效能間可以作出一取捨。 -39 - 201027517 演算法3 :內插挑選利用爲MPEG-4 HE AAC所提供之額外DRC增益控制功能的另一演算法也稱爲增益內插方案。如上所述，HE AAC允許不同內插方案的選擇，以由兩鄰近增益値間之線性內插或兩鄰近編碼方塊間之八時間實例之一的突出“攻擊”狀內插選擇。因此，增益內插方案致能於兩增益控制點或增益値間之增益內插曲線形狀的控制。這已經在圖3 的圖表302及3 03中描述。可以看出慢內插302將適用以模組化一平滑指數增益釋放，而內插方案3 03可以模組化尖增益攻擊。此觀察引起以下演算法，用以將一源增益曲線轉碼至目標增益曲線，例如HE A AC，其中目標編碼方案允許不同內插方案的選擇或不同內插曲線型樣。目標編碼方案允至少允許可能平滑“釋放”內插曲線型樣及可能突出“攻擊” 內插曲線型樣的選擇。該演算法可以包含步驟： 1. 評估源增益曲線的斜率。這可以例如藉由分析其一階導數或藉由分計算適當鄰接源增益値間之差加以完成。如果負斜率超出某一臨限，則將現行訊框分類爲“攻擊 ”（A)，否則分類現行訊框爲“釋放”（R)。 2. 如果現行訊框已經分類爲（R)，則依據上述排列順序濾波器演算法決定下一目標增益値。再者’選擇目標編碼方案的平滑或“釋放”內插曲線。 3 .如果現行訊框已經被分類爲（A) ’則依據上述之排列順序演算法決定下一目標增益値。如果源編碼方案爲轉換 -40 - 201027517 爲主編解碼器，例如AAC或AC-3，則下一目標增益値也可以被選擇爲對中於AAC窗中心的目標增益的最小値。在決定適當下一目標增益値後，選擇目標編碼方案的“攻擊”內插曲線型樣。再者，如果目標編碼方案允許在不同時間實例選擇多數“攻擊”內插曲線型樣之一，則選擇“攻擊”內插曲線型樣中，其斜率係最接近源增益曲線的一階導數的絕對値爲最高的一點，即在該點的斜率爲最陡者。取決於源 φ 編碼方案，此在源增益曲線上的點可以由不同手段決定。例如，對於AAC的S-形狀內插曲線，在兩相鄰源增益値間之最陡斜率的點爲兩源增益値間之中點。圖10顯示增益元資料由轉換爲主編碼方案，例如AAC 或AC-3轉碼爲HE AAC的模擬結果。圖形1001顯示源增益曲線及圖形1 002顯示目標增益曲線。可以看出，當使用所述內插挑選演算法時，可以取得非常良好之匹配結果。事實上，觀察到之結果將較以上述排列順序濾波器演算法取 φ 得爲佳之結果。尤其，這是由於內插挑選演算法額外使用目標編碼方案的功能性，以在不同內插曲線間選擇。此選擇係根據在“攻擊”區段及“釋放”區段中之源增益曲線的分類加以執行。換句話說’內插挑選演算法不只考量源增益値及窗及/或目標編碼系統的內插函數，同時也分析源增益曲線的行程，以決定適當目標增益値並最後決定一適當目標增益曲線型樣。簡言之，可以認爲內插挑選演算法考量源增益値及源解碼器的窗及/或內插函數及目標增益値及目標解碼器的窗及/或內插函數。 -41 - 201027517 本文件提供幾項用以將增益元資料轉碼於源編碼方案及目標編碼方案的演算法。此增益元資料的轉碼需要被執行於音訊流的製作中心與音訊流的無線廣播最終點間之幾個時機點。所述演算法允許在不同編碼方案間之彈性轉碼，該編碼方案具有不同長度的編碼方塊或訊框及在相鄰增益値間有不同時間間隔。再者，這些長度的編碼方塊可以在任意時間改變及在相鄰增益値間之時間間隔可以在音訊流內的任意時間改變。所述演算法考量此源及目標編碼方案的彈性並允許於變化方塊長度的編碼方案間之彈性轉碼及改變之時間間隔。另外，所述演算法允許於源增益曲線與目標增益曲線間之最佳匹配並可以考量例如目標增益曲線應一直在源增益曲線下的侷限，以避免不想要的作用，例如限幅。最終應注意已經描述了符合有關於計算複雜度及在元資料轉碼器內處理的資料量的不同要求之多數演算法。較佳地，單純根據在元資料位元流內可得之源增益値執行元資料轉碼。這將提供具有減少處理器及記憶體要求的很低複雜度轉碼演算法。這是例如排列順序濾波器演算法的情形。轉碼效能可以在額外考量內插方案及目標編碼設內窗函數而加以改良。即，例如“最佳匹配”時的增益演算法及內插挑選演算法。在此時，元資料轉碼器也可以直接根據由元資料位元流所取得之資訊執行轉碼。事實上，在元資料轉碼器中並不需要有關於源編碼方案的詳細知識。最終，如果內插方案及源編碼方案的窗函數被考量，則元資料 -42- 201027517 轉碼可以進一步改良。這是在通用排列順序濾及通用“最佳匹配”增益演算法。然而，這些演關元資料轉碼器之源編碼方案的額外資訊。此如儲存在元資料轉碼器的記憶體中並可以限制選擇取樣。例如，如果元資料轉碼係執行於消上，此資料可以儲存於機頂盒記億體中。應注意的是，上述演算法可以以多種方式 Φ ，其可以較佳地使用一演算法，用於特定轉碼轉碼狀況改變，則切換至另一演算法。此改變能發生於當編碼方案的方塊尺寸例如由一長方方塊。再者，當應用不同窗函數時，可以改變因此，應了解的是，於此所述之演算法的組合本發明之一部份。除了選擇一特定轉碼狀況的算法外，較佳可以採用可用之參數，例如排列演算法的參數/5至特定轉碼狀況。例如，如果 φ 案或目標編碼方案上，編碼方塊的長度由長訊訊框，則可以適當地修改施加在排列順序演算間隔。通常，應了解的是，於本文件中所述之演關參數可以以任何組合施加並根據每方塊一戈立即”改變，以適用至現行及連續改變轉碼狀況【圖式簡單說明】圖1爲典型轉碼鏈；波器演算法算法需要有資料可以例至窗函數的費者機頂盒組合。例如狀況，如果轉碼狀態可塊改變至短內插狀態。可以認爲是適當轉碼演順序濾波器在源編碼方框改變爲短法中之時間算法及其相 f塊爲基礎“ -43- 201027517 圖2爲音訊編解碼的典型編碼及解碼結構；圖3爲不同音訊編解碼的不同內插增益曲線；圖4 a爲音訊編解碼的內插函數；圖4b爲有關於圖4 a的內插函數的窗函數：圖4 c爲用於非對稱窗函數及其相關內插函數的例子；圖5爲一連串序連內插增益曲線；圖6爲第一轉碼演算法的增益匹配特性的第一例；圖7a及7b爲顯示第一轉碼演算法的增益匹配特性的第二例；圖8爲使用第一轉碼演算法的增益元資料的轉碼之實驗結果；圖9a及9b爲第二轉碼演算法的增益匹配特性；及圖1〇爲使用第三轉碼演算法的增益元資料的轉碼的實驗結果。【主要元件符號說明】 100 ：鏈 1 〇 1 :製作中心 102 :無線廣播格式 103 :廣播格式 104 :網路 105 :機頂盒 106 :消費者設備 2〇〇 :音訊編碼器 201027517 201 :轉換爲主編碼器 202 ： QMF分析 203 :窗函數 204 : TDAC轉換器 205 :元件 210 :音訊解碼器 2 1 1 :轉換爲主解碼器 212 ： SBR分析 213 :窗函數 214 : TDAC轉換器 2 1 5 :元件

-45-

Claims

201027517 七、申請專利範圍： 1. 一種將有關於動態範圍控制之音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的方法，其中該第一及第二音訊編碼方案使用編碼方塊；及各個編碼方塊具有至少一相關增益値；及其中該方法包含步驟：根據該第一增益元資料的增益値，選擇該第二增益元資料的增益値，使得有關於該第二增益元資料的該增益値的時間實例旁的時間間隔內，該第一增益元資料的最小增益値被選出；如果沒有該第一增益元資料的增益値落在有關於該第二增益元資料的該增益値的該時間實例旁的該時間間隔內，則選擇該第二增益元資料的該增益値爲有關於該編碼方塊的該第二增益元資料的該增益値，該編碼方塊超前有關於該第二增益元資料的該增益値的該編碼方塊；或該第一增益元資料的該增益値，其在該時間間隔的前一時間間隔。 2. 如申請專利範圍第1項所述之方法，其中該第一與第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的不同時間長度。 3 .如申請專利範圍第1項所述之方法，其中該時間間隔的上及下限係爲一時間常數所決定’該時間常數係分別 -46- 201027517 加入至與該第二增益元資料的該增益値相關的該時間實例及由該第二增益元資料的該增益値相關的該時間實例減去〇 4. 如申請專利範圔第3項所述之方法’其中該第一與第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的某些時間長度，及其中該時間常數係大於或等於該第一音訊編碼方案的該編碼方塊的該時間長度；及 φ 該第二音訊編碼方案的該編碼方塊的該時間長度的最大値。 5. 如申請專利範圍第3項所述之方法’其中該第一與第二音訊編碼方案的該編碼方塊涵蓋編碼音訊信號的某些時間長度及其中該時間常數小於該第一音訊編碼方案的該編碼方塊的該時間長度；及該第二音訊編碼方案的該編碼方塊的該時間長度的最大値。 Φ 6·如申請專利範圍第1項所述之方法，其中該第二音訊編碼方案允許不同內插曲線的選擇，內插曲線內插該第二增益元資料的相鄰增益値’以形成第二增益曲線；及其中該方法更包含步驟：根據該第一增益元資料的該增益値，在該第二增益元資料的兩相鄰增益値間，選擇一適當內插曲線。 7.如申請專利範圍第6項所述之方法，其中該適當內插曲線係根據該第一增益元資料的兩相鄰增益値間之差加以選擇。 -47- 201027517 8. 如申請專利範圍第6項所述之方法，其中第一增益曲線係相關於該第一增益元資料的該增益値 ;及該第一增益曲線係藉由內插該第一增益元資料之相鄰增益値而取得，及該方法更包含步驟：根據該第一增益曲線的斜率，在該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線〇 9. 如申請專利範圍第8項所述之方法，更包含步驟：如果該第一增益曲線的負斜率超出預定臨限値，則檢出一增益攻擊；如果該第一增益曲線的負斜率低於預定臨限値，則檢出一增益釋放；及根據該第一增益曲線的檢出增益攻擊或增益釋放，在該第一增益元資料的兩相鄰增益値間選擇該適當內插曲線 ❹ 1 0·如申請專利範圍第9項所述之方法，其中該方法更包含步驟：根據該第一增益曲線的該斜率的絕對値的最大値之位置’選擇該第二增益元資料的兩相鄰增益値間之該適當內插曲線。 11，一種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的方法，其中 -48- 201027517 該第一及第二音訊編碼方案使用編碼方塊；各個編碼方塊具有至少一相關增益値；及第一增益曲線相關於該第一增益元資料的該增益値及其中該方法包含步驟：選擇相關於該第二增益元資料之該增益値的時間實例旁的時間間隔內的該第一增益曲線的最小値作爲該第二增 Φ 益元資料的該增益値。 12.如申請專利範圍第11項所述之方法，其中該選擇該第一增益曲線的最小値的步驟包含在該時間間隔內選擇該第一增益曲線的一組取樣的最小値。 1 3 .如申請專利範圍第1 2項所述之方法，其中該第一增益曲線的該組取樣對應於相關於落在該時間間隔內的該第二增益値的該編碼方塊的時間實例的該第一增益曲線的該等取樣。 φ 1 4 . —種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的方法，其中該第一與第二音訊編碼方案的每編碼方塊具有不同數量的音訊取樣；各個編碼方塊具有至少一相關增益値；及相鄰編碼方塊的一連串增益値係被內插，以定義增益曲線；及其中該方法包含步驟：根據該第一增益元資料的增益 -49- 201027517 値’選擇該第二增益元資料的該增益値，使得第二增益曲線低於第一增益曲線。 15.—種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的方法，其中該第一與第二音訊編碼方案使用編碼方塊；各個編碼方塊具有至少一相關增益値；及第一增益曲線係相關於該第一增益元資料的該增益値 » 第二增益曲線係相關於該第二增益元資料的該增益値 :及其中該方法包含步驟··在相關於該第一音訊編碼方案的編碼方塊的時間實例及相關於該第二音訊編碼方案的編碼方塊的時間實例’選擇該第二增益元資料的該增益値使得該第二增益曲線係小於或等於該第一增益曲線。 1 6 ·如申請專利範圍1 5項所述之方法，其中該第一增益曲線係由相關於相鄰第一增益値的區段與第一窗函數所構成；及該第二增益曲線係由相關於相鄰第二增益値的區段及第二窗函數所構成。 17.—種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的轉碼系統，其中該第一與第二音訊編碼方案使用編碼方塊；及 -50- 201027517 各個編碼方塊具有至少一相關增益値；及其中該轉碼系統包含：選擇手段，用以根據該第一增益元資料的該增益値，選擇該第二增益元資料的增益値，使得在相關於該第二增益兀資料的該增益値的時間實例旁的時間間隔內，該第一增益兀資料的最小增益値被選出，及如果該第一增益元資料的增益値未落在相關於該第二增益元資料的該增益値的 φ 時間實例旁的時間間隔內，則選擇該第二增益元資料的該增益値爲相關於該編碼方塊的該第二增益元資料的該增益値，該編碼方塊超前相關於該第二增益元資料的該增益値的該編碼方塊；或在該時間間隔前一個之該第一增益元資料的該直 0 18.—種將有關於動態範圍控制的音訊增益元資料 Φ 第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的轉碼系統，其中該第一與第二音訊編碼方案使用編碼方塊；& 各個編碼方塊具有至少一相關增益値；第一增益曲線係相關於該第一增益元資料的該if # {直 •及其中該轉碼系統包含：選擇手段，用以在相關於該第二增益元資料的胃增益値的該時間實例旁的時間間隔內選擇該第一增益曲@ 6勺胃 -51 - 201027517 小値作爲該第二增益元資料的該增益値。 19. —種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的轉碼系統’其中該第一與第二音訊編碼方案的每編碼方塊具有不同數量的音訊取樣；各個編碼方塊具有相關增益値：及相鄰編碼方塊的一連串增益値被內插’以定義增益曲線；及其中該轉碼系統包含：選擇手段’用以根據該第一增益元資料的增益値’選擇該第二增益元資料的該增益値’ 使得第二增益曲線係低於第一增益曲線。 20. —種將有關於動態範圍控制的音訊增益元資料由第一音訊編碼方案的第一增益元資料轉碼爲第二音訊編碼方案的第二增益元資料的轉碼系統’其中該第一與第二音訊編碼方案使用編碼方塊；各個編碼方塊具有相關增益値；第一增益曲線係相關於該第一增益元資料的該增益値 ;及第二增益曲線係相關於該第二增益元資料的該增益値 •，及其中該轉碼系統包含.選擇手段’用以在相關於該第一音訊編碼方案的該編碼方塊的時間實例及相關於該第二音訊編碼方案的該編碼方塊的時間實例，選擇該第二增益 -52- 201027517 元資料的該增益値，使得該第二增益曲線係小於或等於該第一增益曲線。 21. —種電腦程式產品，包含可執行指令，用以當被執行於電腦時，執行如申請專利範圍第1至1 6項中任一項所述之方法。 22. —種機頂盒，用以解碼接收之多媒體信號，該機頂盒包含： φ 接收器，用以接收第一編碼方案的多媒體信號；轉碼單元，用以將第一編碼方案的多媒體信號轉碼爲第二編碼方案的多媒體信號；及發射器，用以傳輸該經轉碼多媒體信號；其中該轉碼單元將有關於動態範圍控制的音訊增益元資料由該第一編碼方案的第一增益元資料轉碼爲該第二編碼方案的第二增益元資料，其中該第一及第二音訊編碼方案使用編碼方塊；及 φ 各個編碼方塊具有至少一相關增益値：及其中該轉碼單元根據該第一增益元資料的該增益値，選擇該第二增益元資料的增益値，使得在相關於該第二增益元資料的該增益値的時間實例旁的時間間隔內，該第一_ 增益元資料的最小增益値被選擇；及如果該第一增益元畜料的增益値未落在相關於該第二增益元資料的該增益値的時間實例旁的時間間隔內時，則該第二增益元資料的該;t曾益値被選擇爲相關於該編碼方塊的該第二增益元資料的該增益値， -53- 201027517 該編碼方塊係在相關於該第二增益元資料的該增益値的編碼方塊之前；或該時間間隔前一個的該第一增益元資料的該增益値。 23·—種解碼所接收之多媒體信號的機頂盒，該機頂盒包含：接收器，用以接收第一編碼方案之多媒體信號·，轉碼單元，用以將該第一編碼方案的該多媒體信號轉碼爲第二編碼方案的多媒體信號；及 @ 發射器，用以傳輸該經轉碼多媒體信號；其中該轉碼單元將有關於動態範圍控制的音訊增益元資料由該第一編碼方案的第一增益元資料轉碼爲該第二編碼方案的第二增益元資料，其中該第一與第二音訊編碼方案使用編碼方塊；及各個編碼方塊具有至少一相關增益値第一增益曲線相關於該第一增益元資料的該增益値；及 ⑩ 其中該轉碼單元在相關於該第二增益元資料的該增益値的時間實例旁的時間間隔內，選擇該第一增益曲線的最小値作爲該第二增益元資料的該增益値。 24. —種用以解碼所接收之多媒體信號的機頂盒，該機頂盒包含：接收器，用以接收第一編碼方案之多媒體信號·，轉碼單元，用以將該第一編碼方案的該多媒體信號轉碼爲第二編碼方案的多媒體信號；及 -54- 201027517 發射器，用以傳輸該經轉碼多媒體信號；其中該轉碼單元將有關於動態範圍控制的音訊增益元資料由該第一編碼方案的第一增益元資料轉碼爲該第二編碼方案的第二增益元資料，其中該第一與第二音訊編碼方案的每編碼方塊具有不同數量的音訊取樣；各個編碼方塊具有相關增益値；及 Φ 相鄰編碼方塊的一連串增益値係被內插，以定義增益曲線，及其中該轉碼單元根據該第一增益元資料的增益値，選擇該第二增益元資料的該增益値，使得第二增益曲線係低於第一增益曲線。 25.—種解碼所接收之多媒體信號的機頂盒，該機頂盒包含：接收器，用以接收第一編碼方案之多媒體信號； ❹ 轉碼單元，用以將該第一編碼方案的該多媒體信號轉碼爲第二編碼方案的多媒體信號；及發射器，用以傳輸該經轉碼多媒體信號；其中該轉碼單元將有關於動態範圍控制的音訊增益元資料由該第一編碼方案的第一增益元資料轉碼爲該第二編碼方案的第二增益元資料，其中該第一與第二音訊編碼方案使用編碼方塊；及各個編碼方塊具有一相關增益値；第一增益曲線係相關於該第一增益元資料的該等增益 -55- 201027517 値；及第二增益曲線係相關於該第二增益元資料的該等增益値；及其中該轉碼系統在該第一音訊編碼方案的該編碼方塊相關的時間實例及在該第二音訊編碼方案的該編碼方塊相關的時間實例，選擇該第二增益元資料的該增益値’使得該第二增益曲線係小於或等於該第一增益曲線。 26.如申請專利範圍第1至16項中任一項所述之方法’ 其中該第一與第二音訊編碼方案爲杜比E、杜比數位、 AAC、HE AAC 之一