JP5096468B2 - サイド情報なしの時間的ノイズエンベロープの自由な整形 - Google Patents
サイド情報なしの時間的ノイズエンベロープの自由な整形 Download PDFInfo
- Publication number
- JP5096468B2 JP5096468B2 JP2009524635A JP2009524635A JP5096468B2 JP 5096468 B2 JP5096468 B2 JP 5096468B2 JP 2009524635 A JP2009524635 A JP 2009524635A JP 2009524635 A JP2009524635 A JP 2009524635A JP 5096468 B2 JP5096468 B2 JP 5096468B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency domain
- quantization
- domain
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002123 temporal effect Effects 0.000 title claims abstract description 49
- 238000007493 shaping process Methods 0.000 title claims abstract description 17
- 238000013139 quantization Methods 0.000 claims abstract description 105
- 238000001914 filtration Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 22
- 230000000873 masking effect Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 abstract description 38
- 230000006870 function Effects 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Transducers For Ultrasonic Waves (AREA)
- Burglar Alarm Systems (AREA)
Description
2.AC−3のような既存のシステムに対する下位互換性をTNSに持たせることができないスペクトル手段に、逆フィルターを適用する必要がある
3.スペクトルに、逆フィルターを適用する必要があるので、デコーダの複雑さが増大する
本発明の特徴によれば、ノイズフィードバック量子化(NFQ)に基づく新技術により、スペクトル領域コーディングシステムにおける量子化ノイズの時間エンベロープを、MPEG−2/4・AACに用いられるTNSコーディングツールにより課された制限を克服しつつ修正する。本発明の特徴によれば、AACシステムにおけるTNSの代わりにNFQを採用する。本発明の特徴によれば、NFQはまた、AC−3システムのような他のスペクトル領域のコーディングシステムにおいて採用することもできる。
本発明のさらに他の特徴によれば、ディジタルオーディオエンコーダにおける、周波数領域ノイズフィードバック量子化の方法が提供される。この方法では、時間領域オーディオ信号から抽出した周波数領域信号をノイズフィードバック信号と結合させ、量子化装置の入力信号を生成し、量子化装置の入力信号を量子化して量子化装置の出力信号を生成し、量子化装置の入力信号と量子化装置の出力信号とを結合して量子化誤差信号を生成し、量子化誤差信号にフィルターを掛けてノイズフィードバック信号を生成する。
2.エンコーダのみの処理である
3.サイド情報の伝送を必要としない
4.既存のオーディオコーディングシステムと下位互換性がある
5.デコーダの複雑性を軽減する
本発明の他の利点は、ノイズの時間的進展がスペクトルグループの信号特性によく合致するように、フィードバックフィルターを全スペクトルに亘って変化させることができる点である。言い換えると、1以上の周波数ビン又は周波数ビンのグループ、ここで周波数ビンはスペクトルグループを形成している、の各々に一意的なフィードバックフィルターを採用することができる。TNSもそのような能力を持つが、デコーダに要求されるスペクトルグループを示すことの必要性と共に、フィルター係数をデコーダに伝送する必要性があるので、使うことのできるスペクトル領域の数は非常に制限される。
AAC(以下の参考文献2参照)及びAC−3(以下の参考文献3参照)を含む最新のオーディオコーディング技術では、量子化により生じたノイズを、知覚的に適切な方法で、制御するためにスペクトル領域における量子化を行う。一般に、MDCTのような時間・周波数変換を用いて、入力時間波形をスペクトル領域に変換する。時間・周波数変換と平行して、知覚モデルを計算し、時間・周波数変換の出力係数のそれぞれに生じる量子化ノイズを調整するために知覚モデルを用いる。図2は、入力をスペクトル領域に変換し信号のスペクトル表現を量子化する、先行技術のオーディオコーディングシステム(エンコーダ及びデコーダ)の単純化して示した概略ブロック図である。離散的時間領域信号x(n)を、周波数領域(又はスペクトル領域)の信号を生成するための、時間・周波数変換又は時間・周波数変換機能(時間・周波数変換)12に適用する。スペクトル領域の信号を、量子化装置又は量子化機能(Q)14により量子化し、周波数領域の信号を量子化したものY(K)を生成する。システムのデコーダ部分には、時間領域の出力信号をもたらす逆変換又は逆変換機能(周波数・時間変換)16が含まれる。
代替的に、式(3)はZ変換形式を用いて式(4)のように書き換えることができる。
本発明の実施の形態を適用したときの性能の一例を図4に示す。ここで、ノイズフィードバックフィルター又はノイズフィードバックフィルター機能を、結果生じた部分的な信号対ノイズ比がほぼ一定になるような、オーディオコンテンツの特定の変換ブロックに適用するよう設計されている。部分的な信号対ノイズ比は、この例では、変換ブロックにおけるサンプル数より少ない、少数のサンプルについて計算したSNRとして定義される。さらにこの例では、ノイズフィードバックフィルターの次数は10に設定されている。図4の上段は、鋭い過渡信号を有する変換ブロック内の時間領域における入力波形を示す。中段は、単純なスペクトル領域のコーダの出力信号を示し、ここでは、量子化ノイズが過渡信号の始まる前の変換ブロック全体に拡がっている。下段は、次数が10のNFQを採用した本発明の実施の形態を適用したスペクトル領域オーディオコーダの出力を示す。本例における、NFQ処理又はNFQシステムに対して、フィードバックフィルターは、断片的なSNRが、変換ブロック全体を通してほぼ一定に維持されるように計算される。量子化ノイズの時間的エンベロープを修正させる本発明の能力を示すように、NFQ処理又はNFQシステムの出力は、NFQがない場合の構成に比べて顕著にプリエコー(過渡信号に先立つ、変換ブロック内にノイズが拡がっている部分)が少なくなっている。
先行技術のMPEG−2/4・AACエンコーダの単純化した概略ブロック図を図6に示す。入力パルスコード変調(PCM)オーディオが、2048点のMDCT32を用いて、スペクトル領域に変換され、そのブロックに対するマスキング曲線の推定値が心理音響モデル34を用いて計算される。次に、(スペクトルの量子化による)ノイズ対マスク比(NMR)をできるだけ低く維持するようにスケールファクターが選択される(36)。結果生じた信号は量子化され(38)、次いでエントロピーコード化される(40)。フォーマッタ又はフォーマット処理(ビットストリーム)42は、エンコードされたビットストリーム出力を生成する。しかしながらこの技術は、個々の変換ブロック内での時間的マスキングを無視する。本発明の特徴によれば、量子化ノイズを時間的に配置する方法が示されている。図6に示したAACエンコーダを、図7で示したように、ノイズフィードバック量子化装置18及びダイナミックノイズフィードバック計算30を加算し、補完的なTNSエンコーディング・デコーディングフィルター(すなわち、図1のフィルター6及び8)を削除し、TNSフィルター係数をエンコーダからデコーダに伝送する必要性を削除すると、先に示唆したように、スペクトル領域量子化ノイズを、(スペクトル領域にスケールファクターを適用することにより)スペクトルマスキングモデルに適するのみならず(NFQを適用することにより)時間的マスキングモデルにも適するように再配置することができる。ダイナミックノイズフィードバック計算30は、(1)PCM時間領域入力、又は(2)MDCT32の周波数領域出力のどちらか一方からの入力を受け取る。時間的マスキングモデルは図7には示されていない。
x(n)n=0,1,...N−1
別名化した時間シーケンスを抽出することができ、
本発明に係るノイズフィードバック量子化の適用には、以下のうちの少なくとも1つが含まれる。
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[2]MPEG−2/4・AACの詳細は以下の参考文献に記載されている
1)ISO/IEC IS-14496(パート3、オーディオ)、1996年、AAC ISO/IEC JTC1/SC29, 「Information technology-very low bitrate audio-visual coding」、
2) ISO/IEC 13818-7、International Standard、1997年「MPEG-2 advanced audio coding, AAC」、
3) M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、1996年、Proc. of the 101st AES-Convention、「ISO/IEC MPEG-2 Advanced Audio Coding」、
4) M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、Journal of the AES, Vol.45, No.10, October 1997, pp. 789-814、「ISO/IEC MPEG-2 Advanced Audio Coding」、
5) Karlheinz Brandenburgによる、Proc. of the AES 17th International Conference on High Quality Audio Coding, Florence, Italy, 1999、「MP3 and AAC explained」、及び、
6) G. A. Soulodre他による、J. Audio Eng. Soc, Vol.46, No.3, pp 164-177 March 1998、「Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs」
[3]J. Princen、A. Bradleyによる、IEEE Trans. Accoust. Speech Signal Processing, vol. ASSP-34 pp. 1153-1161, Oct. 1986、「Analysis/synthesis filter bank design based on time domain aliasing cancellation」
[4]AC−3、ドルビーデジタル(Dolby Digital)としても知られている(ドルビーとドルビーデジタルはドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である)は、「A/52B document」に定義されている(Digital Audio Compression Standard (AC-3, E-AC-3) Revision B、及びそれに先行する標準、「A52/A」書面(ATSC標準:Digital Audio Compression Standard (AC-3), Revision A)及び「A52/A」(Digital Audio Compression Standard (AC-3))。
1)Steve Vernonによる、1995年8月の EEE Trans.Consumer Electronics,Vol.41,No. 3、「Design and Implementation of AC-3 Coders」
2)Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」
3)Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」
[5]Werner Verhelst、Dreten De Koningによる2002年6月の、「Least Squares Theory and Design of Optimal Noise Shaping Filters」AES 22nd International Conference on Virtual, Synthetic and Entertainment Audio。
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。特記なき場合は、本発明の1部として含まれるアルゴリズムは、特定の計算機または特定の他の装置に本質的に関連するものではない。具体的には、種々の汎用機を、ここに記載された内容に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
Claims (13)
- 離散時間領域信号の周波数領域表現の量子化を採用する、離散時間領域信号をエンコーディングするためのディジタルオーディオエンコーディング方法であって、
周波数領域量子化誤差の指標(E(k))を、周波数領域で、抽出するステップ(20,22)と、
周波数領域で、フィルター係数を用いて前記量子化誤差の指標にフィルター処理を行って、フィルター処理された量子化誤差の指標を生成するステップ(24)と、
前記フィルター処理された量子化誤差の指標を、周波数領域で、周波数領域量子化(20)の前に前記離散時間領域信号の周波数領域表現にフィードバック信号として適用するステップ(26)と、
を具備し、
前記フィルター処理を行うステップ(24)は、前記離散時間領域信号および前記離散時間領域信号の周波数領域表現のうちの一つに基づいて前記フィルター係数を動的に制御することを含み、前記フィルター係数は、時間的信号のエンベロープを計算し、該時間的信号のエンベロープの逆数をとり、その結果の逆DFTを計算することを含む処理と、線形予測コーディング(LPC)計算を含む処理とのうちの一つにより取得されることを特徴とする方法。 - 前記フィルター処理を行うステップでは、離散時間領域信号の周波数領域表現のスペクトルの全セグメントに亘ってフィルター処理された量子化誤差の指標が変化することができるように、1以上の周波数ビン又は周波数ビンのグループの各々にフィルター処理された量子化誤差の指標を生成するために前記量子化誤差の指標にフィルター処理を行うことを特徴とする請求項1に記載の方法。
- 前記フィルター係数は、時間的マスキングモデルに応答することを特徴とする請求項1又は2に記載の方法。
- 前記時間的マスキングモデルは、量子化したノイズの時間的整形をおこなおうとすることを特徴とする請求項3に記載の方法。
- 前記時間的マスキングモデルは、変換ブロック内で前記離散時間領域信号の相対的に音量の小さいセグメントから音量の大きいセグメントに前記量子化ノイズを移動させようとすることを特徴とする請求項3に記載の方法。
- エンコードされたビットストリームを生成するために(40,42)、前記離散時間領域信号の前記量子化した周波数領域表現をエンコードするステップをさらに具備することを特徴とする請求項1乃至請求項5のいずれか1項に記載のディジタルオーディオエンコーディング方法。
- ディジタルオーディオエンコーダにおける、周波数領域ノイズフィードバック量子化の方法であって、
周波数領域量子化装置の入力信号を生成するために時間領域オーディオ信号から抽出した周波数領域信号を周波数領域ノイズフィードバック信号と結合させるステップ(26)と、
周波数領域量子化装置の出力信号を生成するために、前記周波数領域量子化装置の入力信号を量子化するステップ(20)と、
周波数領域量子化誤差信号を生成するために、前記周波数領域量子化装置の前記入力信号を前記周波数領域量子化装置の前記出力信号と結合させるステップ(22)と、
前記周波数領域ノイズフィードバック信号を生成するために、フィルター係数を用いて前記周波数領域量子化誤差信号にフィルター処理を行うステップ(24)と、
前記時間領域オーディオ信号および前記周波数領域信号のうちの一つに基づいて前記フィルター係数を動的に制御するステップと
を具備し、前記フィルター係数は、時間的信号のエンベロープを計算し、該時間的信号のエンベロープの逆数をとり、その結果の逆DFTを計算することを含む処理と、線形予測コーディング(LPC)計算を含む処理とのうちの一つにより取得されることを特徴とする方法。 - 前記動的に制御するステップでは、時間的マスキングモデルに応答して前記フィルター係数を制御することを特徴とする請求項7に記載の方法。
- 請求項1乃至請求項8のいずれか1項に記載の方法のすべてのステップを実施するようにした手段を具備する装置。
- 請求項1乃至請求項8のいずれか1項に記載の方法のすべてのステップをコンピュータに実行させるようにした、コンピュータ読み取り可能な媒体に記憶させたコンピュータプログラム。
- ディジタルオーディオエンコーダで用いるための周波数領域ノイズフィードバック量子化装置であって、
周波数領域量子化装置の入力信号を生成するために、時間領域オーディオ信号から抽出した周波数領域信号を周波数領域ノイズフィードバック信号と結合させる第1の合成器(26)と、
周波数領域量子化装置の出力信号を生成するために、前記周波数領域量子化装置の入力信号を量子化する量子化装置(20)と、
量子化誤差信号を生成するために、前記周波数領域量子化装置の入力信号と前記周波数領域量子化装置の出力信号とを結合する第2の合成器(22)と、
周波数領域ノイズフィードバック信号を生成するために、フィルター係数を用いて前記周波数領域量子化誤差信号にフィルター処理を行うノイズフィードバックフィルター(24)と、
前記時間領域オーディオ信号および前記周波数領域信号のうちの一つに基づいて前記フィルター係数を動的に制御する周波数領域フィルター係数制御装置(30)と
を具備し、前記フィルター係数は、時間的信号のエンベロープを計算し、該時間的信号のエンベロープの逆数をとり、その結果の逆DFTを計算することを含む処理と、線形予測コーディング(LPC)計算を含む処理とのうちの一つにより取得されることを特徴とする装置。 - 前記周波数領域フィルター係数制御装置(30)は、時間的マスキングモデルに応答して前記フィルター係数を制御することを特徴とする請求項11に記載の量子化装置。
- 前記ノイズフィードバックフィルターの次数は10から20の範囲であることを特徴とする請求項11または請求項12に記載の量子化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83809406P | 2006-08-15 | 2006-08-15 | |
US60/838,094 | 2006-08-15 | ||
PCT/US2007/017811 WO2008021247A2 (en) | 2006-08-15 | 2007-08-10 | Arbitrary shaping of temporal noise envelope without side-information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010500631A JP2010500631A (ja) | 2010-01-07 |
JP5096468B2 true JP5096468B2 (ja) | 2012-12-12 |
Family
ID=38984075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009524635A Active JP5096468B2 (ja) | 2006-08-15 | 2007-08-10 | サイド情報なしの時間的ノイズエンベロープの自由な整形 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8706507B2 (ja) |
EP (1) | EP2054882B1 (ja) |
JP (1) | JP5096468B2 (ja) |
CN (1) | CN101501761B (ja) |
AT (1) | ATE496365T1 (ja) |
DE (1) | DE602007012116D1 (ja) |
TW (1) | TWI456567B (ja) |
WO (1) | WO2008021247A2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
EP2054882B1 (en) | 2006-08-15 | 2011-01-19 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
AT504164B1 (de) * | 2006-09-15 | 2009-04-15 | Tech Universit T Graz | Vorrichtung zur gerauschunterdruckung bei einem audiosignal |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
JP4603062B2 (ja) * | 2008-06-26 | 2010-12-22 | 京セラ株式会社 | 信号変換器、無線信号送信システム及び無線信号受信システム |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
PT2491553T (pt) | 2009-10-20 | 2017-01-20 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo |
MX2012008075A (es) * | 2010-01-12 | 2013-12-16 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo. |
WO2012150482A1 (en) * | 2011-05-04 | 2012-11-08 | Nokia Corporation | Encoding of stereophonic signals |
EP2707873B1 (en) * | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
WO2013142650A1 (en) | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
WO2014161996A2 (en) * | 2013-04-05 | 2014-10-09 | Dolby International Ab | Audio processing system |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2887350B1 (en) | 2013-12-19 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
ES2952973T3 (es) * | 2014-01-15 | 2023-11-07 | Samsung Electronics Co Ltd | Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal |
EP3105755B1 (en) | 2014-02-14 | 2017-07-26 | Telefonaktiebolaget LM Ericsson (publ) | Comfort noise generation |
US9576589B2 (en) * | 2015-02-06 | 2017-02-21 | Knuedge, Inc. | Harmonic feature processing for reducing noise |
US11232804B2 (en) * | 2017-07-03 | 2022-01-25 | Dolby International Ab | Low complexity dense transient events detection and coding |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US11295750B2 (en) * | 2018-09-27 | 2022-04-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for noise shaping using subspace projections for low-rate coding of speech and audio |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3010663B2 (ja) | 1989-12-28 | 2000-02-21 | ソニー株式会社 | ノイズシェーピング回路 |
JPH03201715A (ja) * | 1989-12-28 | 1991-09-03 | Sony Corp | ノイズシェーピング回路 |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
US5487086A (en) * | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
TW324762B (en) | 1996-07-15 | 1998-01-11 | Tokyo Electric Power Co | Manufacturing method for concrete sections |
US6415251B1 (en) * | 1997-07-11 | 2002-07-02 | Sony Corporation | Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
JP3681105B2 (ja) * | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
JP4152192B2 (ja) | 2001-04-13 | 2008-09-17 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の高品質タイムスケーリング及びピッチスケーリング |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
CN100414606C (zh) * | 2002-01-25 | 2008-08-27 | Nxp股份有限公司 | 用于从pcm信号中减去量化噪声的方法和单元 |
US7483835B2 (en) | 2002-12-23 | 2009-01-27 | Arbitron, Inc. | AD detection using ID code and extracted signature |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
JP4212591B2 (ja) * | 2003-06-30 | 2009-01-21 | 富士通株式会社 | オーディオ符号化装置 |
JP2006047561A (ja) * | 2004-08-03 | 2006-02-16 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号復号化装置 |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
EP2054882B1 (en) | 2006-08-15 | 2011-01-19 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
TWM324762U (en) | 2007-05-11 | 2008-01-01 | Wan-Chen Jou | Externally connected type condensed water atomizer of air conditioner |
-
2007
- 2007-08-10 EP EP07836718A patent/EP2054882B1/en active Active
- 2007-08-10 WO PCT/US2007/017811 patent/WO2008021247A2/en active Application Filing
- 2007-08-10 DE DE602007012116T patent/DE602007012116D1/de active Active
- 2007-08-10 JP JP2009524635A patent/JP5096468B2/ja active Active
- 2007-08-10 CN CN200780030179.3A patent/CN101501761B/zh active Active
- 2007-08-10 AT AT07836718T patent/ATE496365T1/de not_active IP Right Cessation
- 2007-08-10 US US12/310,124 patent/US8706507B2/en active Active
- 2007-08-14 TW TW096129984A patent/TWI456567B/zh active
Also Published As
Publication number | Publication date |
---|---|
WO2008021247A9 (en) | 2008-07-10 |
ATE496365T1 (de) | 2011-02-15 |
WO2008021247A3 (en) | 2008-04-17 |
DE602007012116D1 (de) | 2011-03-03 |
CN101501761A (zh) | 2009-08-05 |
US8706507B2 (en) | 2014-04-22 |
TW200818123A (en) | 2008-04-16 |
WO2008021247A2 (en) | 2008-02-21 |
EP2054882B1 (en) | 2011-01-19 |
CN101501761B (zh) | 2012-02-08 |
US20100094637A1 (en) | 2010-04-15 |
TWI456567B (zh) | 2014-10-11 |
JP2010500631A (ja) | 2010-01-07 |
EP2054882A2 (en) | 2009-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5096468B2 (ja) | サイド情報なしの時間的ノイズエンベロープの自由な整形 | |
CN109509478B (zh) | 音频处理装置 | |
JP6735053B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
KR102067044B1 (ko) | 과도 프로세싱을 향상시키기 위한 사후 프로세서, 사전 프로세서, 오디오 인코더, 오디오 디코더, 및 관련 방법 | |
US7761290B2 (en) | Flexible frequency and time partitioning in perceptual transform coding of audio | |
JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
KR101278805B1 (ko) | 엔트로피 코딩 방법 및 엔트로피 디코딩 방법 | |
CA2286068C (en) | Method for coding an audio signal | |
KR100991450B1 (ko) | 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 | |
KR20100086032A (ko) | 오디오 코딩 장치 및 그 방법 | |
US9230551B2 (en) | Audio encoder or decoder apparatus | |
KR20090018873A (ko) | 인코딩된 신호의 처리 | |
US20100250260A1 (en) | Encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111025 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120104 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120203 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120810 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120918 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5096468 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |