JP2016541012A - 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 - Google Patents
周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 Download PDFInfo
- Publication number
- JP2016541012A JP2016541012A JP2016527226A JP2016527226A JP2016541012A JP 2016541012 A JP2016541012 A JP 2016541012A JP 2016527226 A JP2016527226 A JP 2016527226A JP 2016527226 A JP2016527226 A JP 2016527226A JP 2016541012 A JP2016541012 A JP 2016541012A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- shaping
- frequency domain
- bandwidth extension
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007493 shaping process Methods 0.000 title claims abstract description 191
- 230000002123 temporal effect Effects 0.000 title claims description 31
- 238000003780 insertion Methods 0.000 title description 3
- 230000037431 insertion Effects 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims description 63
- 230000003595 spectral effect Effects 0.000 claims description 29
- 230000010076 replication Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 10
- 239000013256 coordination polymer Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 235000020280 flat white Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
Abstract
Description
ビットストリームを受信し、ビットストリームから符号化オーディオ信号を導出するように構成されているビットストリーム受信機と、
符号化オーディオ信号から時間領域における復号オーディオ信号を導出するように構成されているコア復号器モジュールと、
復号オーディオ信号の時間エンベロープを決定するように構成されている時間エンベロープ生成器と、
周波数領域帯域幅拡張信号を生成するように構成されている帯域幅拡張モジュールであって、帯域幅拡張モジュールは、時間領域における雑音信号を生成するように構成されている雑音発生器を備え、帯域幅拡張モジュールは、整形済み雑音信号を生成するために復号オーディオ信号の時間エンベロープに依存して雑音信号を時間的に整形するように構成されている予備整形モジュールを備え、帯域幅拡張モジュールは、整形済み雑音信号を周波数領域雑音信号に変換するように構成されている時間−周波数変換器を備え、周波数領域帯域幅拡張信号は、周波数領域雑音信号に依存する、帯域幅拡張モジュールと、
復号オーディオ信号を周波数領域復号オーディオ信号に変換するように構成されている時間−周波数変換器と、
帯域幅拡張済み周波数領域オーディオ信号を生成するために、周波数領域復号オーディオ信号と周波数領域帯域幅拡張信号とを一つにまとめるように構成されているコンバイナと、
帯域幅拡張済み周波数領域オーディオ信号を帯域幅拡張済み時間領域オーディオ信号に変換するように構成されている周波数−時間変換器と、を備える。
ビットストリーム受信機を使用して、ビットストリームを受信し、ビットストリームから符号化オーディオ信号を導出するステップと、
コア復号器モジュールを使用して、符号化オーディオ信号から時間領域における復号オーディオ信号を導出するステップと、
時間エンベロープ生成器を使用して、復号オーディオ信号の時間エンベロープを決定するステップと、
帯域幅拡張モジュールであって、
帯域幅拡張モジュールの雑音発生器を使用して時間領域における雑音信号を生成するステップ、
帯域幅拡張モジュールの予備整形モジュールを使用して、整形済み雑音信号を生成するために復号オーディオ信号の時間エンベロープに依存して雑音信号を時間的に整形するステップ、
帯域幅拡張モジュールの時間−周波数変換器を使用して、整形済み雑音信号を周波数領域雑音信号に変換するステップであって、周波数領域帯域幅拡張信号が周波数領域雑音信号に依存するステップ、を実行する帯域幅拡張モジュールを使用し、周波数領域帯域幅拡張信号を生成するステップと、
さらなる時間−周波数変換器を使用して、復号オーディオ信号を周波数領域復号オーディオ信号に変換するステップと、
コンバイナを使用して、帯域幅拡張済み周波数領域オーディオ信号を生成するために、周波数領域復号オーディオ信号と周波数領域帯域幅拡張信号とを組み合わせるステップと、
周波数−時間変換器を使用して、帯域幅拡張済み周波数領域オーディオ信号を帯域幅拡張済み時間領域オーディオ信号に変換するステップと、を含むものである。
ビットストリームBSを受信し、ビットストリームBSから符号化オーディオ信号EASを導出するように構成されたビットストリーム受信機2と、
符号化オーディオ信号EASから時間領域における復号オーディオ信号DASを導出するように構成されたコア復号器モジュール3と、
復号オーディオ信号DASの時間エンベロープTEDを決定するように構成された時間エンベロープ生成器4と、
周波数領域帯域幅拡張信号BEFを生成するように構成された帯域幅拡張モジュール5であって、時間領域における雑音信号NOSを生成するように構成された雑音発生器6、整形済み雑音信号SNSを生成するために復号オーディオ信号DASの時間エンベロープTEDに依存して雑音信号NOSを時間的に整形するように構成された予備整形モジュール7、及び、整形済み雑音信号SNSを周波数領域雑音信号FNSに変換するように構成された時間−周波数変換器8を備え、周波数領域帯域幅拡張信号BEFは周波数領域雑音信号FNSに依存する帯域幅拡張モジュール5と、
復号オーディオ信号DASを周波数領域復号オーディオ信号FDSに変換するように構成された時間−周波数変換器9と、
帯域幅拡張済み周波数領域オーディオ信号BFSを生成するために、周波数領域復号オーディオ信号FDSと周波数領域帯域幅拡張信号BEFとを組み合わせるように構成されたコンバイナ10と、
帯域幅拡張済み周波数領域オーディオ信号BFSを帯域幅拡張済み時間領域オーディオ信号BASに変換するように構成されている周波数−時間変換器11と、を備えている。
ビットストリーム受信機2を使用して、ビットストリームBSを受信し、ビットストリームBSから符号化オーディオ信号EASを導出するステップと、
コア復号器モジュール3を使用して、符号化オーディオ信号EASから時間領域における復号オーディオ信号DASを導出するステップと、
時間エンベロープ生成器4を使用して、復号オーディオ信号DASの時間エンベロープTEDを決定するステップと、
帯域幅拡張モジュール5であって、
前記帯域幅拡張モジュール5の雑音発生器6を使用して時間領域における雑音信号NOSを生成するステップ、
帯域幅拡張モジュール5の予備整形モジュール7を使用して、整形済み雑音信号SNSを生成するために復号オーディオ信号DASの時間エンベロープTEDに依存して雑音信号NOSを時間的に整形するステップ、及び
帯域幅拡張モジュール5の時間−周波数変換器8を使用して、整形済み雑音信号SNSを周波数領域雑音信号FNSに変換するステップであって、周波数領域帯域幅拡張信号BEFが周波数領域雑音信号FNSに依存するステップを実行する、帯域幅拡張モジュール5を使用し、周波数領域帯域幅拡張信号BEFを生成するステップと、
さらなる時間−周波数変換器9を使用して、復号オーディオ信号DASを周波数領域復号オーディオ信号FDSに変換するステップと、
コンバイナ10を使用して、帯域幅拡張済み周波数領域オーディオ信号BFSを生成するために、周波数領域復号オーディオ信号FDSと周波数領域帯域幅拡張信号BEFとを組み合わせるステップと、
周波数−時間変換器11を使用して、帯域幅拡張済み周波数領域オーディオ信号BFSを帯域幅拡張済み時間領域オーディオ信号BASに変換するステップと、を含む。
2 ビットストリーム受信機
3 コア復号器モジュール
4 時間エンベロープ生成器
5 帯域幅拡張モジュール
6 雑音発生器
7 予備整形モジュール
8 時間−周波数変換器
9 時間−周波数変換器
10 コンバイナ
11 周波数−時間変換器
12 周波数範囲選択器
13 後整形モジュール
14 さらなる雑音発生器
15 さらなる予備整形モジュール
16 さらなる時間−周波数変換器
17 トーン発生器
18 トーン予備整形モジュール
19 時間−周波数変換器
20 コンバイナ
21 時間領域コア復号器
22 周波数領域コア復号器
23 制御パラメータ抽出器
24 整形利得計算器
BS ビットストリーム
EAS 符号化オーディオ信号
DAS 復号オーディオ信号
TED 時間エンベロープ
BEF 周波数領域帯域幅拡張信号
NOS 雑音信号
SNS 整形済み雑音信号
FNS 周波数領域雑音信号
FDS 周波数領域復号オーディオ信号
BFS 帯域幅拡張済み周波数領域オーディオ信号
BAS 帯域幅拡張済み時間領域オーディオ信号
FSR 周波数範囲選択済み周波数領域雑音信号
SIS サイド情報信号
NOSF さらなる雑音信号
SNSF さらなる整形済み雑音信号
FNSF さらなる周波数領域雑音信号
TOS トーン信号
STS 整形済みトーン信号
FTS 周波数領域トーン信号
SG 整形利得
CP 制御パラメータ
Claims (24)
- ビットストリーム(BS)を復号するためのオーディオ復号器デバイス(1)であって、
前記ビットストリーム(BS)を受信し、前記ビットストリーム(BS)から符号化オーディオ信号(EAS)を導出するように構成されているビットストリーム受信機(2)と、
前記符号化オーディオ信号(EAS)から時間領域における復号オーディオ信号(DAS)を導出するように構成されているコア復号器モジュール(3)と、
前記復号オーディオ信号(DAS)の時間エンベロープ(TED)を決定するように構成されている時間エンベロープ生成器(4)と、
周波数領域帯域幅拡張信号(BEF)を生成するように構成された帯域幅拡張モジュール(5)であって、時間領域における雑音信号(NOS)を生成するように構成された雑音発生器(6)、整形済み雑音信号(SNS)を生成するために前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記雑音信号(NOS)を時間的に整形するように構成された予備整形モジュール(7)、及び前記整形済み雑音信号(SNS)を周波数領域雑音信号(FNS)に変換するように構成された時間−周波数変換器(8)を有し、前記周波数領域帯域幅拡張信号(BEF)は前記周波数領域雑音信号(FNS)に依存する帯域幅拡張モジュール(5)と、
前記復号オーディオ信号(DAS)を周波数領域復号オーディオ信号(FDS)に変換するように構成された時間−周波数変換器(9)と、
帯域幅拡張済み周波数領域オーディオ信号(BFS)を生成するために、前記周波数領域復号オーディオ信号(FDS)と前記周波数領域帯域幅拡張信号(BEF)とを一つにまとめるように構成されたコンバイナ(10)と、
前記帯域幅拡張済み周波数領域オーディオ信号(BFS)を帯域幅拡張済み時間領域オーディオ信号(BAS)に変換するように構成された周波数−時間変換器(11)と、を備えているオーディオ復号器デバイス(1)。 - 前記周波数領域帯域幅拡張信号(BEF)をスペクトル帯域複製無しに生成する請求項1に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記雑音信号(NOS)の前記時間的整形が過度強調的に行われるように構成されている請求項1及び2のいずれか一項に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、バンドパスフィルタのバンクによって前記雑音信号(NOS)を別々の部分帯域雑音信号に分割し、前記部分帯域雑音信号の各々に対して特定の時間的整形を実行することによって、前記雑音信号(NOS)の前記時間的整形が部分帯域的に行われるように構成されている請求項1から3のいずれか一項に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記周波数領域帯域幅拡張信号(BEF)の周波数範囲を設定するように構成された周波数範囲選択器(12)を備えている請求項1から4のいずれか一項に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記周波数領域帯域幅拡張信号(BEF)を周波数領域において時間的に及び/又はスペクトル的に整形するように構成された後整形モジュールを備えている請求項1から5のいずれか一項に記載のオーディオ復号器デバイス。
- 前記ビットストリーム受信機(2)は、前記ビットストリーム(BS)からサイド情報信号(SIS)を導出するように構成されており、前記帯域幅拡張モジュール(5)は、前記サイド情報信号(SIS)に依存して前記周波数領域帯域幅拡張信号(BEF)を生成するように構成されている請求項1から6のいずれか一項に記載のオーディオ復号器デバイス。
- 前記雑音発生器(6)は、前記サイド情報信号(SIS)に依存して前記雑音信号(NOS)を生成するように構成されている請求項7に記載のオーディオ復号器デバイス。
- 前記予備整形モジュール(7)は、前記サイド情報信号(SIS)に依存して前記雑音信号(NOS)を時間的に整形するように構成されている請求項7又は8のいずれか一項に記載のオーディオ復号器デバイス。
- 前記後整形モジュール(13)は、前記サイド情報信号(SIS)に依存して前記周波数領域帯域幅拡張信号(BEF)を時間的に及び/又はスペクトル的に整形するように構成されている請求項7から9のいずれか一項に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、時間領域におけるさらなる雑音信号(NOSF)を生成するように構成されたさらなる雑音発生器(14)と、さらなる整形済み雑音信号(SNSF)を生成するために前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記さらなる雑音信号(NOSF)を時間的に整形するように構成されたさらなる予備整形モジュール(15)と、前記さらなる整形済み雑音信号(SNSF)をさらなる周波数領域雑音信号(FNSF)に変換するように構成されたさらなる時間−周波数変換器(16)と、を備え、前記周波数領域帯域幅拡張信号(BEF)は前記さらなる周波数領域雑音信号(FNSF)に依存する請求項1から10のいずれか一項に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記さらなる雑音信号(NOSF)の前記時間的整形が過度強調的に行われるように構成されている請求項11に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、バンドパスフィルタのバンクによって前記さらなる雑音信号(NOSF)を別々のさらなる部分帯域雑音信号に分割し、前記さらなる部分帯域雑音信号の各々に対して特定の時間的整形を実行することによって、前記さらなる雑音信号(NOSF)の前記時間的整形が部分帯域的に行われるように構成されている請求項11又は12に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、時間領域におけるトーン信号(TOS)を生成するように構成されたトーン発生器(17)と、整形済みトーン信号(STS)を生成するために前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記トーン信号(TOS)を時間的に整形するように構成されたトーン予備整形モジュール(18)と、前記整形済みトーン信号(STS)を周波数領域トーン信号(FTS)に変換するように構成された時間−周波数変換器(19)と、を備え、前記周波数領域帯域幅拡張信号(BEF)は前記周波数領域トーン信号(FTS)に依存する請求項1から13のいずれか一項に記載のオーディオ復号器デバイス。
- 前記コア復号器モジュール(5)は、時間領域コア復号器(21)及び周波数領域コア復号器(22)を備え、前記時間領域コア復号器(21)又は前記周波数領域コア復号器(22)のいずれかが、前記符号化オーディオ信号(EAS)から前記復号オーディオ信号(DAS)を導出するために使用される請求項1から14のいずれか一項に記載のオーディオ復号器デバイス。
- 制御パラメータ抽出器(23)は、前記コア復号器モジュール(3)によって使用される制御パラメータ(CP)を前記復号オーディオ信号(DAS)から抽出するように構成されており、前記帯域幅拡張モジュール(5)は、前記制御パラメータ(CP)に依存して前記周波数領域帯域幅拡張信号(BEF)を生成するように構成されている請求項15に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記予備整形モジュール(7)に関する整形利得(SG)を確立するように構成された整形利得計算器(24)を備え、前記予備整形モジュール(7)は、前記予備整形モジュール(7)に関する前記整形利得(SG)に依存して前記雑音信号(NOS)を時間的に整形するように構成されている請求項1から16のいずれか一項に記載のオーディオ復号器デバイス。
- 前記予備整形モジュール(7)に関する整形利得(SG)を確立するための前記整形利得計算器(24)は、前記制御パラメータ(CP)に依存して前記予備整形モジュール(7)に関する整形利得(SG)を確立するように構成されている請求項16及び17に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記さらなる予備整形モジュール(15)に関する整形利得を確立するように構成されている整形利得計算器を備え、前記さらなる予備整形モジュール(14)は、前記さらなる予備整形モジュール(14)に関する前記整形利得に依存して前記さらなる雑音信号(NOSF)を時間的に整形するように構成されている請求項11から18のいずれか一項に記載のオーディオ復号器デバイス。
- 前記さらなる予備整形モジュール(15)に関する整形利得を確立するための前記整形利得計算器は、前記制御パラメータ(CP)に依存して前記さらなる予備整形モジュール(15)に関する整形利得を確立するように構成されている請求項16及び19に記載のオーディオ復号器デバイス。
- 前記帯域幅拡張モジュール(5)は、前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記トーン予備整形モジュール(18)に関する整形利得を確立するように構成された整形利得計算器を備え、前記トーン予備整形モジュール(18)は、前記トーン予備整形モジュール(18)に関する前記整形利得に依存して前記トーン信号(TOS)を時間的に整形するように構成されている請求項14から20のいずれか一項に記載のオーディオ復号器デバイス。
- 前記トーン予備整形モジュール(18)に関する整形利得を確立するための前記整形利得計算器は、前記制御パラメータ(CP)に依存して前記さらなる予備整形モジュール(18)に関する整形利得を確立するように構成されている請求項16及び21に記載のオーディオ復号器デバイス。
- ビットストリーム(BS)を復号するための方法であって、
ビットストリーム受信機(2)を使用して、前記ビットストリーム(BS)を受信し、前記ビットストリーム(BS)から符号化オーディオ信号(EAS)を導出するステップと、
コア復号器モジュール(3)を使用して、前記符号化オーディオ信号(EAS)から時間領域における復号オーディオ信号(DAS)を導出するステップと、
時間エンベロープ生成器(4)を使用して、前記復号オーディオ信号(DAS)の時間エンベロープ(TED)を決定するステップと、
帯域幅拡張モジュール(5)であって、
前記帯域幅拡張モジュール(5)の雑音発生器(6)を使用して時間領域における雑音信号(NOS)を生成するステップ、
前記帯域幅拡張モジュール(5)の予備整形モジュール(7)を使用して、整形済み雑音信号(SNS)を生成するために前記復号オーディオ信号(DAS)の前記時間エンベロープ(TED)に依存して前記雑音信号(NOS)を時間的に整形するステップ、及び
前記帯域幅拡張モジュール(5)の時間−周波数変換器(8)を使用して、前記整形済み雑音信号(SNS)を周波数領域雑音信号(FNS)に変換するステップであって、前記周波数領域帯域幅拡張信号(BEF)が前記周波数領域雑音信号(FNS)に依存するステップ、を実行する前記帯域幅拡張モジュール(5)を使用し、周波数領域帯域幅拡張信号(BEF)を生成するステップと、
さらなる時間−周波数変換器(9)を使用して、前記復号オーディオ信号(DAS)を周波数領域復号オーディオ信号(FDS)に変換するステップと、
コンバイナ(10)を使用して、帯域幅拡張済み周波数領域オーディオ信号(BFS)を生成するために、前記周波数領域復号オーディオ信号(FDS)と前記周波数領域帯域幅拡張信号(BEF)とを組み合わせるステップと、
周波数−時間変換器(11)を使用して、前記帯域幅拡張済み周波数領域オーディオ信号(BFS)を帯域幅拡張済み時間領域オーディオ信号(BAS)に変換するステップと、を含む方法。 - プロセッサで作動すると請求項23に記載の方法を実行するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13191127.3 | 2013-10-31 | ||
EP13191127 | 2013-10-31 | ||
PCT/EP2014/073375 WO2015063227A1 (en) | 2013-10-31 | 2014-10-30 | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016541012A true JP2016541012A (ja) | 2016-12-28 |
JP6396459B2 JP6396459B2 (ja) | 2018-09-26 |
Family
ID=51845400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016527226A Active JP6396459B2 (ja) | 2013-10-31 | 2014-10-30 | 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9805731B2 (ja) |
EP (1) | EP3063761B1 (ja) |
JP (1) | JP6396459B2 (ja) |
KR (1) | KR101852749B1 (ja) |
CN (1) | CN105706166B (ja) |
CA (1) | CA2927990C (ja) |
ES (1) | ES2657337T3 (ja) |
MX (1) | MX355452B (ja) |
RU (1) | RU2666468C2 (ja) |
TR (1) | TR201802303T4 (ja) |
WO (1) | WO2015063227A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022516604A (ja) * | 2018-12-21 | 2022-03-01 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | パルス処理を使用して周波数拡張オーディオ信号を生成するためのオーディオプロセッサおよび方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
CN110534128B (zh) * | 2019-08-09 | 2021-11-12 | 普联技术有限公司 | 一种噪音处理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0936685A (ja) * | 1994-10-06 | 1997-02-07 | Shin Nakagawa | 音響信号再生方法及び装置 |
JP2005509928A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号帯域幅拡張 |
JP2008096567A (ja) * | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
JP2010020356A (ja) * | 2003-07-29 | 2010-01-28 | Panasonic Corp | オーディオ信号帯域拡張装置 |
JP2011034046A (ja) * | 2009-04-03 | 2011-02-17 | Ntt Docomo Inc | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
EP1829424B1 (en) * | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及*** |
PT2571024E (pt) * | 2007-08-27 | 2014-12-23 | Ericsson Telefon Ab L M | Frequência de transição adaptativa entre preenchimento de ruído e extensão da largura de banda |
HUE047607T2 (hu) * | 2007-08-27 | 2020-05-28 | Ericsson Telefon Ab L M | Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését |
KR101230479B1 (ko) * | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
CN101281748B (zh) * | 2008-05-14 | 2011-06-15 | 武汉大学 | 用编码索引实现的空缺子带填充方法及编码索引生成方法 |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
EP2273493B1 (en) * | 2009-06-29 | 2012-12-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Bandwidth extension encoding and decoding |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
SG178320A1 (en) * | 2010-06-09 | 2012-03-29 | Panasonic Corp | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus |
CA2827000C (en) * | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
EP2707875A4 (en) * | 2011-05-13 | 2015-03-25 | Samsung Electronics Co Ltd | NOISE REDUCTION AND AUDIO CODING |
-
2014
- 2014-10-30 TR TR2018/02303T patent/TR201802303T4/tr unknown
- 2014-10-30 JP JP2016527226A patent/JP6396459B2/ja active Active
- 2014-10-30 WO PCT/EP2014/073375 patent/WO2015063227A1/en active Application Filing
- 2014-10-30 MX MX2016005167A patent/MX355452B/es active IP Right Grant
- 2014-10-30 EP EP14792794.1A patent/EP3063761B1/en active Active
- 2014-10-30 KR KR1020167014361A patent/KR101852749B1/ko active IP Right Grant
- 2014-10-30 ES ES14792794.1T patent/ES2657337T3/es active Active
- 2014-10-30 RU RU2016121163A patent/RU2666468C2/ru active
- 2014-10-30 CN CN201480059424.3A patent/CN105706166B/zh active Active
- 2014-10-30 CA CA2927990A patent/CA2927990C/en active Active
-
2016
- 2016-04-22 US US15/136,417 patent/US9805731B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0936685A (ja) * | 1994-10-06 | 1997-02-07 | Shin Nakagawa | 音響信号再生方法及び装置 |
JP2005509928A (ja) * | 2001-11-23 | 2005-04-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号帯域幅拡張 |
JP2010020356A (ja) * | 2003-07-29 | 2010-01-28 | Panasonic Corp | オーディオ信号帯域拡張装置 |
JP2008096567A (ja) * | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
JP2011034046A (ja) * | 2009-04-03 | 2011-02-17 | Ntt Docomo Inc | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム |
Non-Patent Citations (2)
Title |
---|
TAORI R: "HI-BIN: AN ALTERNATIVE APPROACH TO WIDEBAND SPEECH CODING", PROCEEDINGS OF 2000 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, 以下備考, vol. 2, JPN5017000856, 5 June 2000 (2000-06-05), US, pages 1157 - 1160, ISSN: 0003625156 * |
菊入 圭: "音声と音楽の高効率な圧縮を実現するMPEG標準音声音響統合符号化方式", NTT DOCOMOテクニカル・ジャーナル, vol. 19, no. 3, JPN6017031750, 1 October 2011 (2011-10-01), pages 18 - 23, ISSN: 0003625155 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022516604A (ja) * | 2018-12-21 | 2022-03-01 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | パルス処理を使用して周波数拡張オーディオ信号を生成するためのオーディオプロセッサおよび方法 |
JP7314280B2 (ja) | 2018-12-21 | 2023-07-25 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | パルス処理を使用して周波数拡張オーディオ信号を生成するためのオーディオプロセッサおよび方法 |
US11776554B2 (en) | 2018-12-21 | 2023-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency enhanced audio signal using pulse processing |
Also Published As
Publication number | Publication date |
---|---|
EP3063761A1 (en) | 2016-09-07 |
ES2657337T3 (es) | 2018-03-02 |
JP6396459B2 (ja) | 2018-09-26 |
CN105706166B (zh) | 2020-07-14 |
KR101852749B1 (ko) | 2018-06-07 |
KR20160075768A (ko) | 2016-06-29 |
RU2666468C2 (ru) | 2018-09-07 |
US20160240200A1 (en) | 2016-08-18 |
US9805731B2 (en) | 2017-10-31 |
CA2927990C (en) | 2018-08-14 |
MX2016005167A (es) | 2016-07-05 |
WO2015063227A1 (en) | 2015-05-07 |
EP3063761B1 (en) | 2017-11-22 |
MX355452B (es) | 2018-04-18 |
RU2016121163A (ru) | 2017-12-05 |
CN105706166A (zh) | 2016-06-22 |
CA2927990A1 (en) | 2015-05-07 |
TR201802303T4 (tr) | 2018-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6396459B2 (ja) | 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 | |
CA2978814C (en) | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal | |
CN105793924B (zh) | 使用错误隐藏提供经解码的音频信息的音频解码器及方法 | |
AU2012217269B2 (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
CN106796800B (zh) | 音频编码器、音频解码器、音频编码方法和音频解码方法 | |
RU2483364C2 (ru) | Схема аудиокодирования/декодирования с переключением байпас | |
CN107077858B (zh) | 使用具有全带隙填充的频域处理器以及时域处理器的音频编码器和解码器 | |
EP2491555B1 (en) | Multi-mode audio codec | |
EP1756807B1 (en) | Audio encoding | |
IL278164B (en) | Audio encoder and decoder | |
KR20150110708A (ko) | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 | |
KR102619434B1 (ko) | 펄스 프로세싱을 사용하여 주파수 향상 오디오 신호를 생성하기 위한 오디오 프로세서 및 방법 | |
Vaillancourt et al. | New post-processing techniques for low bit rate celp codecs | |
BR112016009563B1 (pt) | Extensão de largura de banda de áudio através da inserção de ruído temporal pré- formado no domínio de frequência |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170829 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6396459 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |