JP6945092B2 - 効率的なdrcプロファイル伝送 - Google Patents
効率的なdrcプロファイル伝送 Download PDFInfo
- Publication number
- JP6945092B2 JP6945092B2 JP2021015545A JP2021015545A JP6945092B2 JP 6945092 B2 JP6945092 B2 JP 6945092B2 JP 2021015545 A JP2021015545 A JP 2021015545A JP 2021015545 A JP2021015545 A JP 2021015545A JP 6945092 B2 JP6945092 B2 JP 6945092B2
- Authority
- JP
- Japan
- Prior art keywords
- drc
- audio signal
- profiles
- profile
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims description 140
- 238000000034 method Methods 0.000 claims description 109
- 238000003860 storage Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 3
- 238000009877 rendering Methods 0.000 description 103
- 230000006835 compression Effects 0.000 description 56
- 238000007906 compression Methods 0.000 description 56
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000009499 grossing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本願は2014年10月1日に出願された米国仮特許出願第62/058,228号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本稿はオーディオ信号の処理に関する。特に、本稿は、ダイナミックレンジ制御(DRC: Dynamic Range Control)プロファイルを帯域幅効率のよい仕方で伝送するための方法および対応するシステムに関する。
本稿に記載されるようにエンコードされたオーディオ信号中にエンコードされるべきオーディオ・コンテンツは、無線で、有線接続を介して、ファイルを通じて、インターネット・ダウンロードを介してなどの多様な方法の一つまたは複数で多様な源オーディオ・フォーマットの一つまたは複数において受領されうる。
〔態様1〕
エンコードされたオーディオ信号を生成するための方法であって、前記エンコードされたオーディオ信号はフレームのシーケンスを有し、前記エンコードされたオーディオ信号は、対応する複数の異なるレンダリング・モードについての複数の異なるダイナミックレンジ制御(DRC)プロファイルを示し、当該方法は、
・前記複数のDRCプロファイルからのDRCプロファイルの異なる部分集合を、フレームの前記シーケンスの異なるフレームに挿入して、フレームの前記シーケンスの二つ以上のフレームが合同して前記複数のDRCプロファイルを含むようにすることを含む、
方法。
〔態様2〕
・フレームの前記シーケンスがIフレームからなるサブシーケンスを含み;
・DRCプロファイルの前記異なる部分集合はIフレームからなる前記サブシーケンスの異なるIフレームに挿入される、
態様1記載の方法。
〔態様3〕
DRCプロファイルの部分集合が単一のDRCプロファイルのみを含む、態様1または2記載の方法。
〔態様4〕
・前記複数のDRCプロファイルがN個のDRCプロファイルを含み、Nは整数であり、N>1であり;
・前記N個のDRCプロファイルはフレームの前記シーケンスからのN個の異なるフレームに挿入される、
態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記複数のDRCプロファイルすべてをフレームの前記シーケンスの最初のフレームに挿入することをさらに含む、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
・前記複数のDRCプロファイルからのDRCプロファイルの前記異なる部分集合は、フレームの前記シーケンスからのM個の連続するフレームからなる各サブシーケンスが合同して前記複数のDRCプロファイルを含むように、フレームの前記シーケンスの異なるフレームに挿入され;
・Mは整数であり、M>1である、
態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
フレームの前記シーケンスのフレームにフラグを挿入することをさらに含み、前記フラグは、そのフレームがDRCプロファイルを含むか否かを示す、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
・前記複数のDRCプロファイルのうちのあるDRCプロファイルが、ダイナミックレンジ圧縮曲線を定義する定義データを含む明示的なDRCプロファイルであり;
・ダイナミックレンジ圧縮曲線は入力ラウドネスと信号に適用されるべき利得との間のマッピングを与える、
態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
前記複数のDRCプロファイルのすべてが明示的なDRCプロファイルである、態様8記載の方法。
〔態様10〕
前記定義データは:
・前記入力ラウドネスをブーストするためのブースト利得;
・前記ブースト利得が適用可能な前記入力ラウドネスについての範囲を示すブースト利得範囲;
・0dBの利得が適用可能な前記入力ラウドネスの範囲を示すヌル帯域範囲;
・前記入力ラウドネスを減衰させるためのカット利得;
・前記カット利得が適用可能な前記入力ラウドネスの範囲を示すカット利得範囲;
・ヌル利得と前記ブースト利得との間の遷移を示すブースト利得比;および/または
・前記ヌル利得と前記カット利得との間の遷移を示すカット利得比、
のうちの一つまたは複数を含む、態様8または9記載の方法。
〔態様11〕
黙示的DRCプロファイルの指示を挿入することをさらに含み、黙示的DRCプロファイルの定義データは前記エンコードされたオーディオ信号のデコーダに知られている、態様8ないし10のうちいずれか一項記載の方法。
〔態様12〕
・フレームの前記シーケンスのフレームはオーディオ・データおよびメタデータを含み;
・DRCプロファイルの部分集合がメタデータとして挿入される、
態様1ないし11のうちいずれか一項記載の方法。
〔態様13〕
・DRCプロファイルは、該DRCプロファイルが適用可能な出力参照レベルの範囲を定義する定義データを含み;
・前記出力参照レベルは、あるレンダリング・モードのダイナミックレンジを示す、
態様1ないし12のうちいずれか一項記載の方法。
〔態様14〕
前記レンダリング・モードの前記ダイナミックレンジは、出力参照レベルの増大とともに減少してもよく、逆も成り立つ、態様13記載の方法。
〔態様15〕
DRCプロファイルのダイナミックレンジ圧縮曲線の最大ブースト利得および最大カット利得は、出力参照レベルの増大とともに増大してもよく、逆も成り立つ、態様13または14記載の方法。
〔態様16〕
前記複数のDRCプロファイルは:
・ホームシアター・レンダリング・モードにおいて使うための第一のDRCプロファイル;
・フラットパネル・レンダリング・モードにおいて使うための第二のDRCプロファイル;
・ポータブル装置スピーカー・レンダリング・モードにおいて使うための第三のDRCプロファイル;および/または
・ヘッドフォン・レンダリング・モードにおいて使うための第四のDRCプロファイル
のうちの一つまたは複数を含む、態様1ないし15のうちいずれか一項記載の方法。
〔態様17〕
前記エンコードされたオーディオ信号を含むビットストリームを生成することをさらに含み、前記ビットストリームはAC4ビットストリームである、態様1ないし16のうちいずれか一項記載の方法。
〔態様18〕
・特定のレンダリング・モードについて前記エンコードされたオーディオ信号についての明示的なDRC利得を決定し;
・フレームの前記シーケンスのフレームに前記明示的なDRC利得を挿入することをさらに含む、
態様1ないし17のうちいずれか一項記載の方法。
〔態様19〕
・前記特定のレンダリング・モードについてDRC構成データをもつDRCプロファイルをフレームの前記シーケンスのフレームの部分集合に挿入することをさらに含み、前記DRC構成データは、前記特定のレンダリング・モードについて、フレームの前記シーケンスのフレーム内に明示的なDRC利得が含まれているという事実を示すものである、態様18記載の方法。
〔態様20〕
・明示的なDRC利得が、該明示的なDRC利得が適用可能なフレームの前記シーケンスからのフレームに挿入される;および/または
・フレームの前記シーケンスからのフレームが、その特定のレンダリング・モード内でそのフレームをデコードするために必要とされる前記一つまたは複数の明示的なDRC利得を含む、
態様18または19記載の方法。
〔態様21〕
エンコードされたオーディオ信号を含むビットストリームであって、前記エンコードされたオーディオ信号はフレームのシーケンスを有し、前記エンコードされたオーディオ信号は、対応する複数の異なるレンダリング・モードについての複数の異なるダイナミックレンジ制御(DRC)プロファイルを示し、前記複数のDRCプロファイルからのDRCプロファイルの異なる部分集合は、フレームの前記シーケンスの異なるフレーム内に含まれており、フレームの前記シーケンスの二つ以上のフレームが合同して前記複数のDRCプロファイルを含む、ビットストリーム。
〔態様22〕
エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号はフレームのシーケンスを有し、前記エンコードされたオーディオ信号は、対応する複数の異なるレンダリング・モードについての複数の異なるダイナミックレンジ制御(DRC)プロファイルを示し、前記複数のDRCプロファイルからのDRCプロファイルの異なる部分集合が、フレームの前記シーケンスの異なるフレーム内に含まれており、フレームの前記シーケンスの二つ以上のフレームが合同して前記複数のDRCプロファイルを含み、当該方法は、
・前記複数の異なるレンダリング・モードから第一のレンダリング・モードを決定する段階と;
・フレームの前記シーケンスの現在フレーム内に含まれているDRCプロファイルの部分集合から一つまたは複数のDRCプロファイルを決定する段階と;
・前記一つまたは複数のDRCプロファイルのうちの少なくとも一つが前記第一のレンダリング・モードに適用可能であるかどうかを判定する段階と;
・前記一つまたは複数のDRCプロファイルのうちのどれも前記第一のレンダリング・モードに適用可能でない場合、現在DRCプロファイルとして、デフォルトDRCプロファイルを選択する段階であって、前記デフォルトDRCプロファイルの定義データは、前記エンコードされたオーディオ信号をデコードするためのデコーダにおいて既知である、段階と;
・前記現在DRCプロファイルを使って現在フレームをデコードする段階とを含む、
方法。
〔態様23〕
前記一つまたは複数のDRCプロファイルのうちの少なくとも一つが前記第一のレンダリング・モードに適用可能であるかどうかを判定する段階(611)が、
・前記第一のレンダリング・モードについての第一の出力参照レベルを決定し;
・前記一つまたは複数のDRCプロファイルからのDRCプロファイルが適用可能な出力参照レベルの範囲を決定し;
・前記第一の出力参照レベルが出力参照レベルの前記範囲内にはいるかどうかを判定することを含む、
態様22記載の方法。
〔態様24〕
前記一つまたは複数のDRCプロファイルからの第一のDRCプロファイルを、該第一のDRCプロファイルが前記第一のレンダリング・モードに適用可能であると判定される場合に、現在DRCプロファイルとして選択する段階(604)をさらに含む、態様22または23記載の方法。
〔態様25〕
フレームの前記シーケンスのうちの現在フレームがDRCプロファイルの部分集合を含んでいるかどうかを判定する段階をさらに含む、態様22ないし24のうちいずれか一項記載の方法。
〔態様26〕
・DRCプロファイルの部分集合がフレームの前記シーケンスのIフレーム内に含まれており;
・前記現在フレームがDRCプロファイルの部分集合を含んでいるかどうかを判定する段階が、現在フレームがIフレームであるかどうかを判定すること(603)を含む、
態様25記載の方法。
〔態様27〕
・前記現在フレームがDRCプロファイルの部分集合を含んでいるかどうかを判定する段階が、現在フレーム内に含まれるDRCプロファイル・フラグを検証すること(606)を含む、
態様25または26記載の方法。
〔態様28〕
・現在フレームが複数の黙示的DRCプロファイルからの黙示的DRCプロファイルを示すかどうかを判定する段階であって、黙示的DRCプロファイルの定義データは前記入力オーディオ信号をデコードするデコーダにおいて既知である、段階と;
・現在フレームが黙示的DRCプロファイルを示すと判定される場合、該黙示的DRCプロファイルを現在DRCプロファイルとして選択する段階(608)とをさらに含む、
態様22ないし27のうちいずれか一項記載の方法。
〔態様29〕
前記現在フレームのデコードする段階が、フレームの前記シーケンスを、前記第一のレンダリング・モードの第一の出力参照レベルにレベリングすることを含む、態様22ないし28のうちいずれか一項記載の方法。
〔態様30〕
前記現在フレームのデコードする段階が、現在DRCプロファイル内で指定されているダイナミックレンジ圧縮曲線を使って現在フレームのラウドネス・レベルを適応させることを含む、態様22ないし29のうちいずれか一項記載の方法。
〔態様31〕
エンコードされたオーディオ信号を生成するためのエンコーダであって、前記エンコードされたオーディオ信号はフレームのシーケンスを有し、前記エンコードされたオーディオ信号は、対応する複数の異なるレンダリング・モードについての複数の異なるダイナミックレンジ制御(DRC)プロファイルを示し、当該エンコーダは、
・前記複数のDRCプロファイルからのDRCプロファイルの異なる部分集合を、フレームの前記シーケンスの異なるフレームに挿入し、フレームの前記シーケンスの二つ以上のフレームが合同して前記複数のDRCプロファイルを含むようにするよう構成されている、
エンコーダ。
〔態様32〕
エンコードされたオーディオ信号をデコードするデコーダであって、前記エンコードされたオーディオ信号はフレームのシーケンスを有し、前記エンコードされたオーディオ信号は、対応する複数の異なるレンダリング・モードについての複数の異なるダイナミックレンジ制御(DRC)プロファイルを示し、前記複数のDRCプロファイルからのDRCプロファイルの異なる部分集合が、フレームの前記シーケンスの異なるフレーム内に含まれており、フレームの前記シーケンスの二つ以上のフレームが合同して前記複数のDRCプロファイルを含み、当該デコーダは、
・前記複数の異なるレンダリング・モードから第一のレンダリング・モードを決定する段階と;
・フレームの前記シーケンスの現在フレーム内に含まれているDRCプロファイルの部分集合から一つまたは複数のDRCプロファイルを決定する段階と;
・前記一つまたは複数のDRCプロファイルのうちの少なくとも一つが前記第一のレンダリング・モードに適用可能であるかどうかを判定する段階と;
・前記一つまたは複数のDRCプロファイルのうちのどれも前記第一のレンダリング・モードに適用可能でない場合、現在DRCプロファイルとして、デフォルトDRCプロファイルを選択する段階であって、前記デフォルトDRCプロファイルの定義データは、前記デコーダにおいて既知である、段階と;
・前記現在DRCプロファイルを使って現在フレームをデコードする段階とを実行するよう構成されている、
デコーダ。
Claims (15)
- 一つまたは複数のプロセッサによって実行される、エンコードされたオーディオ信号をデコードする方法であって、前記エンコードされたオーディオ信号は、エンコードされたオーディオ・データおよびメタデータを含むフレームのシーケンスを有し、前記メタデータはダイナミックレンジ制御(DRCと称される)利得の複数の異なる集合を含み、前記エンコードされたオーディオ信号は、前記オーディオ信号のラウドネスの指標と、前記フレームのシーケンスの一つまたは複数のフレームにおけるDRC構成メタデータとをさらに含み、前記DRC構成メタデータは、前記エンコードされたオーディオ信号に関連付けられた複数のDRCプロファイルと、各DRCプロファイルについて、そのDRCプロファイルが適用可能な出力参照レベルの範囲とを示し、DRC利得の各集合が前記複数のDRCプロファイルのうちの一つに対応し、当該方法は、
・デコードされたオーディオ信号のための所望される出力参照レベルを設定する段階と;
・前記DRCプロファイルのうちの、前記適用可能な出力参照レベルの範囲がデコードされたオーディオ信号のための前記所望される出力参照レベルを含む一つまたは複数のDRCプロファイルを識別する段階と;
・前記識別されたDRCプロファイルのうちの一つを選択する段階と;
・前記エンコードされたオーディオ信号をデコードする段階と;
・デコードされたオーディオ信号に選択されたDRCプロファイルに対応するDRC利得を適用することによって、デコードされたオーディオ信号のダイナミックレンジを調整する段階と;
・前記オーディオ信号のラウドネスの指標およびデコードされたオーディオ信号のための前記所望される出力参照レベルに応答して、ラウドネス関係利得を決定する段階と;
・前記調整されたデコードされたオーディオ信号に前記ラウドネス関係利得を適用して、前記所望される出力参照レベルをもつラウドネス調整されたデコードされたオーディオ信号を得る段階とを含み、
前記選択されたDRCプロファイルに対応する諸DRC利得が時間的に等距離である、
方法。 - 前記DRCプロファイルのうちの一つまたは複数は、ノイズのある環境での再生のために適用可能である、請求項1に記載の方法。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、ノイズのある環境での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項2に記載の方法。
- 前記DRCプロファイルのうちの一つまたは複数は、限られたダイナミックレンジをもつ装置での再生のために適用可能である、請求項1に記載の方法。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、限られたダイナミックレンジをもつ装置での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項4に記載の方法。
- 前記DRCプロファイルのうちの一つまたは複数は、深夜の環境での再生のために適用可能である、請求項1に記載の方法。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、深夜の環境での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項6に記載の方法。
- エンコードされたオーディオ信号をデコードするデコーダであって、前記エンコードされたオーディオ信号は、エンコードされたオーディオ・データおよびメタデータを含むフレームのシーケンスを有し、前記メタデータはダイナミックレンジ制御(DRCと称される)利得の複数の異なる集合を含み、前記エンコードされたオーディオ信号は、前記オーディオ信号のラウドネスの指標と、前記フレームのシーケンスの一つまたは複数のフレームにおけるDRC構成メタデータとをさらに含み、前記DRC構成メタデータは、前記エンコードされたオーディオ信号に関連付けられた複数のDRCプロファイルと、各DRCプロファイルについて、そのDRCプロファイルが適用可能な出力参照レベルの範囲とを示し、DRC利得の各集合が前記複数のDRCプロファイルのうちの一つに対応し、当該デコーダは、
・デコードされたオーディオ信号のための所望される出力参照レベルを設定する段階と;
・前記DRCプロファイルのうちの、前記適用可能な出力参照レベルの範囲がデコードされたオーディオ信号のための前記所望される出力参照レベルを含む一つまたは複数のDRCプロファイルを識別する段階と;
・前記識別されたDRCプロファイルのうちの一つを選択する段階と;
・前記エンコードされたオーディオ信号をデコードする段階と;
・デコードされたオーディオ信号に選択されたDRCプロファイルに対応するDRC利得を適用することによって、デコードされたオーディオ信号のダイナミックレンジを調整する段階と;
・前記オーディオ信号のラウドネスの指標およびデコードされたオーディオ信号のための前記所望される出力参照レベルに応答して、ラウドネス関係利得を決定する段階と;
・前記調整されたデコードされたオーディオ信号に前記ラウドネス関係利得を適用して、前記所望される出力参照レベルをもつラウドネス調整されたデコードされたオーディオ信号を得る段階と
を実行する一つまたは複数のプロセッサを有しており、
前記選択されたDRCプロファイルに対応する諸DRC利得が時間的に等距離である、
デコーダ。 - 前記DRCプロファイルのうちの一つまたは複数は、ノイズのある環境での再生のために適用可能である、請求項8に記載のデコーダ。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、ノイズのある環境での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項9に記載のデコーダ。
- 前記DRCプロファイルのうちの一つまたは複数は、限られたダイナミックレンジをもつ装置での再生のために適用可能である、請求項8に記載のデコーダ。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、限られたダイナミックレンジをもつ装置での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項11に記載のデコーダ。
- 前記DRCプロファイルのうちの一つまたは複数は、深夜の環境での再生のために適用可能である、請求項8に記載のデコーダ。
- 前記識別されたDRCプロファイルのうちの一つを選択することが、深夜の環境での再生のために適用可能な、前記DRCプロファイルのうちの一つを選択することを含む、請求項13に記載のデコーダ。
- 命令のシーケンスを有する非一時的なコンピュータ可読記憶媒体であって、前記命令のシーケンスは、オーディオ信号処理装置によって実行されると、前記オーディオ信号処理装置に請求項1記載の方法を実行させるものである、コンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021148579A JP7273914B2 (ja) | 2014-10-01 | 2021-09-13 | 効率的なdrcプロファイル伝送 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462058228P | 2014-10-01 | 2014-10-01 | |
US62/058,228 | 2014-10-01 | ||
JP2020112665A JP6834049B2 (ja) | 2014-10-01 | 2020-06-30 | 効率的なdrcプロファイル伝送 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020112665A Division JP6834049B2 (ja) | 2014-10-01 | 2020-06-30 | 効率的なdrcプロファイル伝送 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021148579A Division JP7273914B2 (ja) | 2014-10-01 | 2021-09-13 | 効率的なdrcプロファイル伝送 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021073814A JP2021073814A (ja) | 2021-05-13 |
JP6945092B2 true JP6945092B2 (ja) | 2021-10-06 |
Family
ID=54288763
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516501A Active JP6727194B2 (ja) | 2014-10-01 | 2015-09-29 | 効率的なdrcプロファイル伝送 |
JP2020112665A Active JP6834049B2 (ja) | 2014-10-01 | 2020-06-30 | 効率的なdrcプロファイル伝送 |
JP2021015545A Active JP6945092B2 (ja) | 2014-10-01 | 2021-02-03 | 効率的なdrcプロファイル伝送 |
JP2021148579A Active JP7273914B2 (ja) | 2014-10-01 | 2021-09-13 | 効率的なdrcプロファイル伝送 |
JP2023074399A Pending JP2023099123A (ja) | 2014-10-01 | 2023-04-28 | 効率的なdrcプロファイル伝送 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516501A Active JP6727194B2 (ja) | 2014-10-01 | 2015-09-29 | 効率的なdrcプロファイル伝送 |
JP2020112665A Active JP6834049B2 (ja) | 2014-10-01 | 2020-06-30 | 効率的なdrcプロファイル伝送 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021148579A Active JP7273914B2 (ja) | 2014-10-01 | 2021-09-13 | 効率的なdrcプロファイル伝送 |
JP2023074399A Pending JP2023099123A (ja) | 2014-10-01 | 2023-04-28 | 効率的なdrcプロファイル伝送 |
Country Status (6)
Country | Link |
---|---|
US (6) | US10020001B2 (ja) |
EP (4) | EP4044180A1 (ja) |
JP (5) | JP6727194B2 (ja) |
CN (4) | CN106796799B (ja) |
ES (2) | ES2814900T3 (ja) |
WO (1) | WO2016050740A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6727194B2 (ja) * | 2014-10-01 | 2020-07-22 | ドルビー・インターナショナル・アーベー | 効率的なdrcプロファイル伝送 |
CN107148780B (zh) * | 2014-11-07 | 2020-06-16 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10999678B2 (en) * | 2017-03-24 | 2021-05-04 | Sharp Kabushiki Kaisha | Audio signal processing device and audio signal processing system |
JP7107305B2 (ja) * | 2017-04-25 | 2022-07-27 | ソニーグループ株式会社 | 信号処理装置および方法、並びにプログラム |
EP3506661A1 (en) | 2017-12-29 | 2019-07-03 | Nokia Technologies Oy | An apparatus, method and computer program for providing notifications |
CN111713016B (zh) * | 2018-02-15 | 2023-11-28 | 杜比实验室特许公司 | 响度控制方法和装置 |
US11894006B2 (en) * | 2018-07-25 | 2024-02-06 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
KR102253524B1 (ko) * | 2019-09-02 | 2021-05-20 | 네이버 주식회사 | 라우드니스 정규화 방법 및 시스템 |
CN111933173B (zh) * | 2020-08-03 | 2022-03-01 | 南京工程学院 | 一种增益平稳调节的动态范围控制方法及*** |
US20230334746A1 (en) * | 2020-10-28 | 2023-10-19 | Qualcomm Incorporated | Intelligent management of application layer rendering |
US11907611B2 (en) * | 2020-11-10 | 2024-02-20 | Apple Inc. | Deferred loudness adjustment for dynamic range control |
AU2021385196A1 (en) * | 2020-11-24 | 2023-06-22 | Gaudio Lab, Inc. | Method for normalizing audio signal, and device therefor |
EP4309373A1 (en) * | 2021-03-10 | 2024-01-24 | Dolby International AB | Apparatus and method for leveling main and supplementary audio from a hbbtv service |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5659539A (en) | 1995-07-14 | 1997-08-19 | Oracle Corporation | Method and apparatus for frame accurate access of digital audio-visual information |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6104441A (en) | 1998-04-29 | 2000-08-15 | Hewlett Packard Company | System for editing compressed image sequences |
BR0009534B1 (pt) * | 1999-04-02 | 2012-01-24 | disco ótico, método e dispositivo de gravação para gravação de um disco ótico e método e dispositivo de reprodução para reprodução de um disco ótico. | |
US6959275B2 (en) * | 2000-05-30 | 2005-10-25 | D.S.P.C. Technologies Ltd. | System and method for enhancing the intelligibility of received speech in a noise environment |
AU2003288595A1 (en) | 2002-12-18 | 2004-07-09 | Koninklijke Philips Electronics N.V. | Adaptive encoding of digital multimedia information |
US20040261111A1 (en) | 2003-06-20 | 2004-12-23 | Aboulgasem Abulgasem Hassan | Interactive mulitmedia communications at low bit rates |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
TWI247546B (en) | 2004-04-22 | 2006-01-11 | Newsoft Technology Corp | A video encoding method which carries out the encoding of P frame or B frame by utilizing I frame |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
JP2007109328A (ja) * | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
US8199834B2 (en) | 2006-01-04 | 2012-06-12 | University Of Dayton | Frame decimation through frame simplification |
WO2007127023A1 (en) | 2006-04-27 | 2007-11-08 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
EP2118885B1 (en) | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
CN101295504B (zh) * | 2007-04-28 | 2013-03-27 | 诺基亚公司 | 用于仅文本的应用的娱乐音频 |
BRPI0805829B1 (pt) | 2007-05-14 | 2020-05-26 | Samsung Electronics Co., Ltd | Método de transmissão de um serviço de difusão móvel, e aparelho para transmissão de um serviço de difusão móvel |
US8468426B2 (en) | 2008-07-02 | 2013-06-18 | Apple Inc. | Multimedia-aware quality-of-service and error correction provisioning |
US20110246603A1 (en) | 2008-09-05 | 2011-10-06 | The Chinese University Of Hong Kong | Methods and devices for live streaming using pre-indexed file formats |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8606009B2 (en) * | 2010-02-04 | 2013-12-10 | Microsoft Corporation | High dynamic range image generation and rendering |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
ES2526761T3 (es) * | 2010-04-22 | 2015-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para modificar una señal de audio de entrada |
JP5650227B2 (ja) | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
WO2014124377A2 (en) * | 2013-02-11 | 2014-08-14 | Dolby Laboratories Licensing Corporation | Audio bitstreams with supplementary data and encoding and decoding of such bitstreams |
US9055367B2 (en) * | 2011-04-08 | 2015-06-09 | Qualcomm Incorporated | Integrated psychoacoustic bass enhancement (PBE) for improved audio |
US9135929B2 (en) * | 2011-04-28 | 2015-09-15 | Dolby International Ab | Efficient content classification and loudness estimation |
KR101858695B1 (ko) | 2012-04-09 | 2018-05-16 | 엘지전자 주식회사 | 데이터 관리 방법 |
JP5885571B2 (ja) * | 2012-04-16 | 2016-03-15 | アルパイン株式会社 | ディジタル放送の受信装置 |
CN109003617B (zh) * | 2013-01-21 | 2023-08-15 | 杜比实验室特许公司 | 用于在不同回放设备之间优化响度和动态范围的***和方法 |
CN107276551B (zh) * | 2013-01-21 | 2020-10-02 | 杜比实验室特许公司 | 解码具有保留数据空间中的元数据容器的编码音频比特流 |
JP6445460B2 (ja) | 2013-01-28 | 2018-12-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
WO2015038522A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
CN109903776B (zh) * | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
US20170193638A1 (en) * | 2014-09-11 | 2017-07-06 | Kevin Patrick GRUNDY | System and method for controlling dynamic range compression image processing |
JP6727194B2 (ja) * | 2014-10-01 | 2020-07-22 | ドルビー・インターナショナル・アーベー | 効率的なdrcプロファイル伝送 |
-
2015
- 2015-09-29 JP JP2017516501A patent/JP6727194B2/ja active Active
- 2015-09-29 ES ES18202206T patent/ES2814900T3/es active Active
- 2015-09-29 EP EP22159881.6A patent/EP4044180A1/en active Pending
- 2015-09-29 ES ES20177137T patent/ES2912586T3/es active Active
- 2015-09-29 EP EP18202206.1A patent/EP3467827B1/en active Active
- 2015-09-29 WO PCT/EP2015/072371 patent/WO2016050740A1/en active Application Filing
- 2015-09-29 EP EP15777900.0A patent/EP3201915B1/en active Active
- 2015-09-29 CN CN201580053702.9A patent/CN106796799B/zh active Active
- 2015-09-29 CN CN202110526963.5A patent/CN113257274A/zh active Pending
- 2015-09-29 EP EP20177137.5A patent/EP3736809B1/en active Active
- 2015-09-29 US US15/513,546 patent/US10020001B2/en active Active
- 2015-09-29 CN CN202110526962.0A patent/CN113257273A/zh active Pending
- 2015-09-29 CN CN202110527052.4A patent/CN113257275A/zh active Pending
-
2018
- 2018-07-03 US US16/026,529 patent/US10354670B2/en active Active
-
2019
- 2019-05-23 US US16/420,473 patent/US10783897B2/en active Active
-
2020
- 2020-06-30 JP JP2020112665A patent/JP6834049B2/ja active Active
- 2020-09-16 US US17/022,152 patent/US11250868B2/en active Active
-
2021
- 2021-02-03 JP JP2021015545A patent/JP6945092B2/ja active Active
- 2021-09-13 JP JP2021148579A patent/JP7273914B2/ja active Active
-
2022
- 2022-02-13 US US17/670,459 patent/US11727948B2/en active Active
-
2023
- 2023-04-28 JP JP2023074399A patent/JP2023099123A/ja active Pending
- 2023-08-14 US US18/233,330 patent/US20240029748A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6945092B2 (ja) | 効率的なdrcプロファイル伝送 | |
JP6859420B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
JP7038788B2 (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210203 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210209 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210817 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6945092 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |