JP2009109977A - 高い帯域信号に対するフレーム消去隠蔽を行うための方法及び装置 - Google Patents
高い帯域信号に対するフレーム消去隠蔽を行うための方法及び装置 Download PDFInfo
- Publication number
- JP2009109977A JP2009109977A JP2008166446A JP2008166446A JP2009109977A JP 2009109977 A JP2009109977 A JP 2009109977A JP 2008166446 A JP2008166446 A JP 2008166446A JP 2008166446 A JP2008166446 A JP 2008166446A JP 2009109977 A JP2009109977 A JP 2009109977A
- Authority
- JP
- Japan
- Prior art keywords
- band signal
- frame
- pitch period
- repetition
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 116
- 230000000737 periodic effect Effects 0.000 claims abstract description 77
- 238000011069 regeneration method Methods 0.000 claims description 12
- 238000005314 correlation function Methods 0.000 claims description 11
- 230000002238 attenuated effect Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000011084 recovery Methods 0.000 claims description 7
- 238000005311 autocorrelation function Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 2
- 239000010410 layer Substances 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008929 regeneration Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000012792 core layer Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012966 insertion method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Stereo-Broadcasting Methods (AREA)
- Application Of Or Painting With Fluid Materials (AREA)
- Extrusion Moulding Of Plastics Or The Like (AREA)
- Error Detection And Correction (AREA)
Abstract
【課題】高い帯域の信号に対してフレーム消去隠蔽を行う方法を提供する。
【解決手段】低い帯域の信号に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを判断し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うピッチ周期反復方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために前のフレームデータ反復方法を使用するステップを含んでいる。本発明はさらに高い帯域の信号に対してフレーム消去隠蔽を行う装置とスピーチ復号装置を開示している。音声信号の品質の低下の問題が避けられる。
【選択図】図2
【解決手段】低い帯域の信号に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを判断し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うピッチ周期反復方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために前のフレームデータ反復方法を使用するステップを含んでいる。本発明はさらに高い帯域の信号に対してフレーム消去隠蔽を行う装置とスピーチ復号装置を開示している。音声信号の品質の低下の問題が避けられる。
【選択図】図2
Description
本発明は信号復号技術の分野に関し、特に高い帯域信号に対するフレーム消去隠蔽を行うための方法及び装置に関する。
本出願は2007年9月15日出願の中国特許出願第200710153955.0号明細書(発明の名称“METHOD AND DEVICE FOR PERFORMING FRAME ERASURE CONCEALMENT TO HIGHER-BAND SIGNAL”)と、2007年11月24日出願の中国特許出願第200710194570.9号明細書(発明の名称“METHOD AND DEVICE FOR PERFORMING FRAME ERASURE CONCEALMENT TO HIGHER-BAND SIGNAL”)の特典を主張しており、これらはその全体が本出願で参考として組み込まれている。
大部分の伝統的な音声コーデックでは、音声信号の帯域幅は低い。少数の音声コーデックのみが広い帯域幅を有し、ネットワーク技術の開発によりネットワーク伝送速度は増加し、広帯域コーデックの要求はさらに高くなる。随意選択的に、音声コーデックの帯域幅は超広帯域(50Hz−14000Hz)および全帯域(20Hz−20000Hz)までであることが望ましい。
広帯域音声コーデックを伝統的な音声コーデックと適合させるために、音声コーデックは複数の層に分割されることができる。以下の説明は1例として2つの層を含んでいる音声コーデックについて行われている。
第1に、2つの層を含んでいる音声コーデックはコード化側の解析直角ミラーフィルタバンクにより入力信号を高い帯域の信号と低い帯域の信号とに分離する。低い帯域の信号はコード化のために低い帯域のコーダへ入力され、高い帯域の信号はコード化のために高い帯域のコーダへ入力される。得られた低い帯域のデータと高い帯域のデータはビット流マルチプレクサによってビット流へ合成され、そのビット流は送出される。低い帯域の信号はその周波数が信号の帯域幅の低い帯域にある信号を指し、高い帯域の信号はその周波数が信号の帯域幅の高い帯域にある信号を指している。例えば入力信号の帯域幅が50Hz−7000Hzであるとき、低い帯域の信号の帯域幅は50Hz−4000Hzであることができ、高い帯域の信号の帯域幅は4000Hz−7000Hzであることができる。復号は復号側で実行される。ビット流は低い帯域のビット流と高い帯域のビット流とに分割され、低い帯域のビット流と高い帯域のビット流はそれぞれ復号のために低い帯域の復号装置と高い帯域の復号装置へ入力される。したがって低い帯域の信号と高い帯域の信号が得られる。低い帯域の信号と高い帯域の信号は合成直角ミラーフィルタバンクにより音声信号に合成され出力される。
現在、IPにわたる音声(VoIP)の応用と、無線ネットワーク音声の応用が一層普及している。音声送信は実時間で確実に小さいデータパケットを送信することを必要とする。音声フレームが送信期間中に失われるとき、失われた音声フレームを再送信する時間がない。同様に音声フレームが長いルートを通過し、音声フレームが再生されるときに適時に到達できないならば、音声フレームは失われたフレームに等しい。したがって音声システムでは音声フレームが到着できないか、または時間内に到着できないならば、音声フレームは失われたフレームとして考えることができる。
失われたフレームに対して処理が行われないならば、音声は断続され、音声品質は非常に影響される。したがって失われたフレームに対して、フレーム消去隠蔽処理が必要とされる。換言すると、失われた音声データが評価され、評価されたデータが失われたデータを置換するために使用される。したがってより良好な音声品質はフレームの失われた環境で得られることができる。入力信号を高い帯域の信号と低い帯域の信号に分割する音声コーデックにおいて、フレーム消去隠蔽はそれぞれフレーム消去隠蔽期間中に低い帯域の信号と高い帯域の信号に対して行われ、フレーム消去隠蔽後に得られた高い帯域の信号と低い帯域の信号は合成直角ミラーフィルタバンクを介して音声信号に合成され出力される。
フレーム消去隠蔽方法は挿入方法、補間方法、再生成方法を含んでいる。
フレーム消去隠蔽のための挿入方法は、スプライス、無声置換、雑音置換、先のフレーム反復を含んでいる。
フレーム消去隠蔽のための補間方法は、波形置換、ピッチ反復、時間ドメイン波形改正を含んでいる。
再生成方法はコーダパラメータ補間およびモデルベースの再生成方法を含んでいる。
モデルベースの再生成方法は最良の音声品質と最高のアルゴリズムの複雑性を有し、先のフレーム反復方法は良好な音声品質と、高くないアルゴリズムの複雑性を有する。
低い帯域の信号による音声品質における影響は高い帯域の信号による影響よりも高いので、高い複雑性と高い音声品質を有するフレーム消去隠蔽アルゴリズム(例えばピッチ反復、時間ドメイン波形改正、コーダパラメータ補間、モデルベースの再生成方法)は低い帯域の信号に対して使用される。低い複雑性と低い音声品質を有するフレーム消去隠蔽アルゴリズムは高い帯域の信号に対して使用される。したがって音声品質と複雑性の妥協が実現される。
従来技術のスピーチ復号装置では、ピッチ反復はフレーム消去隠蔽を行うために低い帯域の信号で使用され、先のフレーム反復及び減衰方法はフレーム消去隠蔽を行うために高い帯域の信号で使用される。
先のフレーム反復および減衰方法に基づいて高い帯域の信号を回復する式を以下に示す。
shb(n)=shb(n−N)・α, n=0,…,N−1
この式では、shb(n), n=0,…,N−1は失われたフレームの回復された高い帯域の信号を表し、Nはフレームのサンプル数を表し、減衰係数αは0乃至1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか、あるいは連続的に失われたパケットの数にしたがって適応して変化する変数であることができる。例えば第1の失われたフレームは0.9のように大きい減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のような小さい減衰係数により乗算される。
shb(n)=shb(n−N)・α, n=0,…,N−1
この式では、shb(n), n=0,…,N−1は失われたフレームの回復された高い帯域の信号を表し、Nはフレームのサンプル数を表し、減衰係数αは0乃至1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか、あるいは連続的に失われたパケットの数にしたがって適応して変化する変数であることができる。例えば第1の失われたフレームは0.9のように大きい減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のような小さい減衰係数により乗算される。
本発明を実現するプロセスでは、本発明者は信号が強い周期性を有するとき、高い帯域の信号は正確に回復されることができないことを発見した。低い帯域の信号と高い帯域の信号が一貫した周期性を有するとき、フレーム消去隠蔽が従来技術により高い帯域の信号に対して行われるときに高い帯域の信号の本来の周期性は破壊される。したがってスピーチ復号装置から出力された音声信号の品質は低下される。
本発明の1実施形態は、スピーチ復号装置から出力された音声信号の品質を改良するために高い帯域の信号に対してフレーム消去隠蔽を行うための方法を提供する。
本発明の別の実施形態は、スピーチ復号装置から出力された音声信号の品質を改良するための高い帯域の信号に対してフレーム消去隠蔽を行うための装置を提供する。
本発明の別の実施形態は、スピーチ復号装置から出力された音声信号の品質を改良するためのスピーチ復号装置を提供する。
本発明の実施形態による技術的な解決方法は前述の目的を実現するために以下のように行われる。
高い帯域の信号に対してフレーム消去隠蔽を行う方法は、
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、
周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、ピッチ周期反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行い、周期的な強度が予め構成されたしきい値よりも低いならば、先のフレームデータ反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うステップを含んでいる。
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、
周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、ピッチ周期反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行い、周期的な強度が予め構成されたしきい値よりも低いならば、先のフレームデータ反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うステップを含んでいる。
高い帯域の信号に対してフレーム消去隠蔽を行う装置は、
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号をピッチ周期反復モジュールへ送信し、周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号を先のフレームデータ反復モジュールへ送信するように構成されている周期的強度計算モジュールと、
ピッチ周期反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されているピッチ周期反復モジュールと、
先のフレームデータ反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されている先のフレームデータ反復モジュールとを含んでいる。
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号をピッチ周期反復モジュールへ送信し、周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号を先のフレームデータ反復モジュールへ送信するように構成されている周期的強度計算モジュールと、
ピッチ周期反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されているピッチ周期反復モジュールと、
先のフレームデータ反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されている先のフレームデータ反復モジュールとを含んでいる。
スピーチ復号装置は、
入力ビット流を低い帯域のビット流と高い帯域のビット流へデマルチプレクスするように構成されているビット流デマルチプレクスモジュールと、
低い帯域のビット流と高い帯域のビット流を低い帯域の信号と高い帯域の信号へそれぞれ復号するように構成されている低い帯域の復号装置と高い帯域の復号装置と、
低い帯域の信号のピッチ周期を得るために低い帯域の信号に対してフレーム消去隠蔽を行うように構成されている低い帯域の信号用のフレーム消去隠蔽装置と、
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを決定し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うためピッチ周期反復ベースの方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために先のフレームデータ反復ベースの方法を使用するように構成されているフレーム消去隠蔽方法と、
フレーム消去隠蔽後、低い帯域の信号と高い帯域の信号を音声信号へ合成し出力するように構成されている合成直角ミラーフィルタバンクとを含んでいる。
入力ビット流を低い帯域のビット流と高い帯域のビット流へデマルチプレクスするように構成されているビット流デマルチプレクスモジュールと、
低い帯域のビット流と高い帯域のビット流を低い帯域の信号と高い帯域の信号へそれぞれ復号するように構成されている低い帯域の復号装置と高い帯域の復号装置と、
低い帯域の信号のピッチ周期を得るために低い帯域の信号に対してフレーム消去隠蔽を行うように構成されている低い帯域の信号用のフレーム消去隠蔽装置と、
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを決定し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うためピッチ周期反復ベースの方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために先のフレームデータ反復ベースの方法を使用するように構成されているフレーム消去隠蔽方法と、
フレーム消去隠蔽後、低い帯域の信号と高い帯域の信号を音声信号へ合成し出力するように構成されている合成直角ミラーフィルタバンクとを含んでいる。
従来の技術と比較して、本発明の1実施形態による技術的解決方法では、低い帯域の信号のピッチ周期に関して高い帯域の信号の周期的な強度が計算され、その後、低い帯域の信号のピッチ周期の情報に関する高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかが決定され、周期的な強度がしきい値以上であるとき、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うためにピッチ周期反復ベースの方法が使用される。したがって高い帯域の信号が強い周期性を有するとき、高い帯域の信号の周期性は破壊されない。したがって高い帯域の信号の周期性が破壊されるので音声信号の品質が低下する問題は避けられることができる。高い帯域の信号の周期的強度がしきい値よりも低く、高い帯域の信号の周期的な強度が弱いことが決定されるとき、先のフレームデータ反復ベースの方法はフレーム消去隠蔽を現在の失われたフレームに対して行うために使用される。高い帯域の信号の周期的強度が弱いとき、高い周波数の雑音が誘起される。それ故、高い周波数の雑音が誘起されるために音声信号の音声品質が低下する問題は避けることができる。このようにして、本発明の1実施形態にしたがって高い帯域の信号に対してフレーム消去隠蔽を行う技術的解決方法はスピーチ復号装置から出力された音声信号の品質を改良することができる。
本発明を添付図面および以下の特定の実施形態を参照して詳細に説明する。
図1は本発明の1実施形態によるスピーチ復号装置の構造図である。図1に示されているように、スピーチ復号装置はビット流デマルチプレクスモジュール、低い帯域の復号装置、高い帯域の復号装置、低い帯域の信号用のフレーム消去隠蔽装置、高い帯域の信号用のフレーム消去隠蔽装置、合成直角ミラーフィルタバンクを含んでいる。
図1は本発明の1実施形態によるスピーチ復号装置の構造図である。図1に示されているように、スピーチ復号装置はビット流デマルチプレクスモジュール、低い帯域の復号装置、高い帯域の復号装置、低い帯域の信号用のフレーム消去隠蔽装置、高い帯域の信号用のフレーム消去隠蔽装置、合成直角ミラーフィルタバンクを含んでいる。
ビット流デマルチプレクスモジュールは入力ビット流を低い帯域のビット流と高い帯域のビット流へデマルチプレクスするように構成されている。低い帯域の信号と高い帯域の信号はそれぞれ低い帯域の復号装置と高い帯域の復号装置により低い帯域のビット流と高い帯域のビット流を復号することにより得られる。低い帯域の信号と高い帯域の信号は低い帯域の信号用のフレーム消去隠蔽装置と高い帯域の信号用のフレーム消去隠蔽装置とによりそれぞれ処理され、その後合成直角ミラーフィルタバンクにより音声信号へ合成されて出力される。
低い帯域の信号用のフレーム消去隠蔽装置は低い帯域の信号のフレーム消去隠蔽を処理し、低い帯域の信号のピッチ周期を高い帯域の信号用のフレーム消去隠蔽装置へ与える。
高い帯域の信号用のフレーム消去隠蔽装置は本発明の1実施形態にしたがって高い帯域の信号に対してフレーム消去隠蔽方法を行う。本発明の1実施形態による高い帯域の信号に対するフレーム消去隠蔽方法は、低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるか否かを決定し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うピッチ周期反復方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために先のフレームデータ反復ベースの方法を使用するステップを含んでいる。
図2は、本発明の1実施形態による高い帯域の信号のフレーム消去隠蔽方法を示すフローチャートである。図3は、本発明の1実施形態による高い帯域の信号のフレーム消去隠蔽装置の構造図である。図2及び図3を参照して、本発明の1実施形態によるフレーム消去隠蔽を実行する技術的解決方法の詳細な説明を以下行う。
図2に示されているように、高い帯域の信号に対してフレーム消去隠蔽を行う方法は以下のステップを含んでいる。
ステップ700:低い帯域の信号に関する高い帯域の信号の周期的な強度は低い帯域の信号のフレーム消去隠蔽を通して得られる低い帯域の信号のピッチ周期にしたがって計算される。
ステップ700で、低い帯域の信号のフレーム消去隠蔽はピッチ反復ベースの方法のようなピッチ周期を得ることができるフレーム消去隠蔽方法と、モデルベースの再生成ベースの方法と、コーダパラメータ補間ベースの方法とを使用し、コーダパラメータはピッチ周期パラメータを含んでいる。例えばモデルベースの再生成ベースの方法は線形の予測モデルに基づいた再生成を行うフレーム消去隠蔽方法であることができる。
ステップ700で、高い帯域信号用のフレーム消去隠蔽装置は最初に低い帯域信号tlbのピッチ周期を計算するために低い帯域の信号用の信号フレーム消去隠蔽を使用し、その後tlbに関して高い帯域信号の周期的強度r(tlb)を計算するために高い帯域の信号の経歴バッファ信号shb(n)を使用する。
通常、信号の周期的強度の評価による関数は自己相関関数と正規化された相関関数を含んでいる。
この式では、r(i)はiに関する相関関数を表し、slb(j)は低い帯域の信号を表し、Nは1フレームの音声信号に対するサンプル数のような相関関数を計算するためのウィンドウの長さを表し、min_pitchはピッチ周期を検索するための下限であり、max_pitchはピッチ周期を検索するための上限である。したがって低い帯域の信号のピッチ周期は以下のようになる。
換言すると、tlbはr(i)が最大値を有するときiの値に等しい。
この式では、shb(n)、n=−M,…,−1は高い帯域の信号の経歴バッファ信号を表し、Mは高い帯域の信号の経歴バッファ信号中のサンプル数を表す。Nは1フレーム中の高い帯域の信号のサンプル数のような一定の正の整数である。
この式では、Nは1フレーム中の高い帯域の信号のサンプル数のような一定の正の整数である。
図3を参照すると、図3に示されているような高い帯域の信号用のフレーム消去隠蔽装置は周期的な強度計算モジュールと、ピッチ周期反復モジュールと、前のフレームデータ反復モジュールとを含んでいる。ステップ700では、周期的な強度の計算モジュールは低い帯域の信号用の信号フレーム消去隠蔽により低い帯域の信号のピッチ周期を計算し、低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算する。
ステップ700で、低い帯域の信号のピッチ周期tlbに加えて、低い帯域の信号のピッチ周期情報は低い帯域信号のピッチ周期tlbの概略値を含むことができる。高い帯域の信号用のフレーム消去隠蔽装置は最初に低い帯域の信号用の信号フレーム消去隠蔽により低い帯域の信号のピッチ周期tlbを計算することができる。高い帯域の信号のピッチ周期を検索する複雑性を減少し、高い帯域の信号のピッチ周期の正確性を改良するために[max(tlb−m,pit_min),min(tlb+m,pit_max)]のような低い帯域信号のピッチ周期tlbの間隔は高い帯域の信号の正規化された相関関数を計算するために使用される。高い帯域の信号の経歴バッファ信号thb(n)は[max(tlb−m,pit_min),min(tlb+m,pit_max)]に関して高い帯域の信号の周期的強度r(tlb)を計算するために使用される。
この式では、mは3以下の任意の他の値のような検索間隔の半径である。実験結果にしたがって、mが大きい程、正確性は高くなり、アルゴリズムの複雑性は高くなる。この実施形態ではmは3に等しい。pit_minは最小のピッチ周期である。この実施形態ではpit_min=16であり、pit_maxは最大のピッチ周期である。この実施形態ではpit_max=144である。他の実施形態ではpit_min=20およびpit_max=143またはpit_min=16およびpit_max=160であることも可能にされる。高い帯域の信号のピッチ周期thbを以下示す。
したがって、低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度が得られる。
ステップ701では、低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度が予め構成されたしきい値よりも高いかそれに等しいかが決定される。低い帯域の信号のピッチ周期に関する高い帯域の信号の周期的強度が予め構成されたしきい値よりも高いかそれに等しいならば、ステップ702が実行され、そうでなければステップ703が行われる。
ステップ701で、相関関数により周期的強度を計算する方法では、しきい値Rは多数のテストを経て選択されることができる。例えばシミュレーションでは、本発明の1実施形態にしたがって高い帯域の信号用のフレーム消去隠蔽方法を行うスピーチ復号装置は異なるしきい値で出力された音声信号を得るために使用されることができ、音声信号の信号対雑音比(SNR)が計算され、最大のSNRを有する音声信号に対応するしきい値がステップ701で選択されたしきい値として選択される。随意選択的に、ステップ701で選択されたしきい値は経験的値にしたがって決定されることができる。r(ttb)≧Rならば、高い帯域の信号の経歴バッファ信号shb(n)がtlbに関して強力な周期的強度を有することが決定され、そうでなければ、高い帯域の信号の経歴バッファ信号shb(n)はtlbに関して強力な周期的強度を持たないことが決定される。
正規化された相関関数により周期的強度を計算する方法では、しきい値は0から1の範囲の負ではない数であることができる。0.7のようなRnorは多数の検査を通して選択されることができる。プロセスは相関関数により周期的強度を計算する方法のプロセスと同じである。随意選択的に経験値が選択されることができる。rnor(ttb)≧Rnorまたはrnor_max≧Rnorであるならば、高い帯域の信号の経歴バッファ信号shb(n)が低い帯域の信号のピッチ周期情報に関して強力な周期的強度をもたないことが決定される。
図3に示されているように高い帯域の信号用のフレーム消去隠蔽装置では、周期的強度計算モジュールは低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的強度を計算し、低い帯域の信号のピッチ周期情報に関して高い帯域の信号の計算された周期的強度が周期的強度計算モジュールで予め構成されたしきい値以上であるかを判断する。計算された周期的な強度がしきい値以上であるならば、ピッチ周期反復モジュールがその次のプロセスを行い、そうでなければ先のフレームデータ反復モジュールがその次のプロセスを行う。
ステップ702では、ピッチ周期反復方法は失われたフレーム中の高い帯域の信号のフレーム消去隠蔽を行うために使用される。
ステップ702では、ピッチ周期反復方法はピッチ反復方法、モデルベースの再生成ベースの方法又はピッチ反復及び減衰ベースの方法を含んでいる。
ステップ702では、例えばピッチ反復が高い帯域の信号に対するフレーム消去隠蔽を行うために使用される。以下の式は失われたフレームの高い帯域の信号を再生成するために使用される。
shb(n)=shb(n−tlb),n=0,…,N−1
この式では、shb(n),n=0,…,N−1は失われたフレームの回復された高い帯域の信号を表しており、Nは1フレーム中に含まれるサンプル数を表し、shb(n),n=−M,…,−1は高い帯域の信号の経歴バッファ信号を表し、Mは高い帯域の信号の経歴バッファ信号中のサンプル数を表している。
shb(n)=shb(n−tlb),n=0,…,N−1
この式では、shb(n),n=0,…,N−1は失われたフレームの回復された高い帯域の信号を表しており、Nは1フレーム中に含まれるサンプル数を表し、shb(n),n=−M,…,−1は高い帯域の信号の経歴バッファ信号を表し、Mは高い帯域の信号の経歴バッファ信号中のサンプル数を表している。
フレーム消去隠蔽が周期性を単に反復することにより高い帯域の信号に対して行われるとき、多数の連続して失われたフレームの場合、過剰な周期性を有する信号が発生される可能性がある。その効果を強化するため、回復された信号は減衰係数αにより乗算される。ピッチ周期反復方法はピッチ反復及び減衰ベースの方法を含み、フレーム消去隠蔽は現在の失われたフレームの高い帯域の信号に対して行われる。得られた高い帯域の信号を以下に示す。
shb(n)=shb(n−tlb)・α,n=0,…,N−1
この式では、Nは1フレームのサンプル数を表し、減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。しきい値を決定する方法もまた減衰係数を決定するために使用されることができ、その説明の反復は省略する。
shb(n)=shb(n−tlb)・α,n=0,…,N−1
この式では、Nは1フレームのサンプル数を表し、減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。しきい値を決定する方法もまた減衰係数を決定するために使用されることができ、その説明の反復は省略する。
ピッチ反復及び減衰ベースの方法では、フレーム消去隠蔽は現在の失われたフレームの高い帯域の信号に対して行われる。さらに、フレーム消去隠蔽が変形されたディスクリートな余弦変換(MDCT)に基づいている場合、2つのフレームの信号s’hb(n)は最初にピッチ周期反復を通して複製される。
s’hb(n)=shb(n−tlb),n=0,…,2N−1
信号s’hb(n)は正弦ウィンドウwtdac(n)で加算され減衰され、現在のフレームの逆変形されたディスクリートな余弦変換(IMDCT)係数の評価された値dcur(n)は以下のように得られる。
dcur(n)=wtdac(n)shb(n)β,n=0,…,2N−1
βは21/2/2のような減衰係数である。dcur(n)は先のフレームのIMDCT係数dpre(n)とオーバーラップ加算され減衰され、したがって現在のフレームの出力信号は次式のように得られる。
shb(n)=(wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n))α,
n=0,…,N−1
先のフレームのIMDCT係数dpre(n)の後者のフレームは先のフレームのIMDCT係数の後者の部分と呼ばれる。減衰係数αは0から1の範囲の負ではない数であることができる。減衰係数αは0.8のような定数であるか、α=1−0.005×(n−1)のような連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。減衰は逐一増加され、したがって出力信号は平滑になる。
s’hb(n)=shb(n−tlb),n=0,…,2N−1
信号s’hb(n)は正弦ウィンドウwtdac(n)で加算され減衰され、現在のフレームの逆変形されたディスクリートな余弦変換(IMDCT)係数の評価された値dcur(n)は以下のように得られる。
dcur(n)=wtdac(n)shb(n)β,n=0,…,2N−1
βは21/2/2のような減衰係数である。dcur(n)は先のフレームのIMDCT係数dpre(n)とオーバーラップ加算され減衰され、したがって現在のフレームの出力信号は次式のように得られる。
shb(n)=(wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n))α,
n=0,…,N−1
先のフレームのIMDCT係数dpre(n)の後者のフレームは先のフレームのIMDCT係数の後者の部分と呼ばれる。減衰係数αは0から1の範囲の負ではない数であることができる。減衰係数αは0.8のような定数であるか、α=1−0.005×(n−1)のような連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。減衰は逐一増加され、したがって出力信号は平滑になる。
図4は本発明の1実施形態によるピッチ周期反復モジュールを示しており、ピッチ周期にしたがってフレームの信号を複製するように構成された反復モジュールと、フレームのIMDCT係数の評価された値を得るために正弦波ウィンドウをフレームの複製された信号へ加算しその信号を減衰するように構成された減衰モジュールと、現在のフレームの評価された値を先のフレームのIMDCT係数の後者のフレームとオーバーラップ−加算して減衰するオーバーラップ−加算(OLA)モジュールとを含んでいる。
ステップ702で、フレーム消去隠蔽が線形の予測モデルに基づいた再生成ベースの方法により高い帯域の信号に対して行われるとき、高い帯域の残余信号のピッチ周期反復ehb(n)を実行するために次式が使用される。
ehb(n)=ehb(n−tlb),n=0,…,N−1
この式では、ehb(n),n=0,…,N−1は現在の失われたフレームの高い帯域の残余信号を表しており、ehb(n),n=−M,…,−1は線形の予測解析に関する高い帯域の信号の経歴バッファ信号の残余を表している。
ehb(n)=ehb(n−tlb),n=0,…,N−1
この式では、ehb(n),n=0,…,N−1は現在の失われたフレームの高い帯域の残余信号を表しており、ehb(n),n=−M,…,−1は線形の予測解析に関する高い帯域の信号の経歴バッファ信号の残余を表している。
この式では、shb(n),n=0,…,N−1は現在の失われたフレームの回復された高い帯域の信号を表しており、Nは1フレーム中に含まれるサンプル数を表し、shb(n),n=−M,…,−1は高い帯域の信号の経歴バッファ信号を表し、Mは高い帯域の信号中のサンプル数を表している。減衰係数αは0乃至1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか、或いは連続的に失われたパケットの数にしたがって適応して変化する変数であることができる。例えば第1の失われたフレームは0.9のように大きい減衰係数により乗算され、第2の失われたフレームおよび後続するフレームは0.7のような小さい減衰係数により乗算される。
ステップ702では、図3に示されているピッチ周期反復モジュールはピッチ周期反復ベースの方法により失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行う。ピッチ周期反復モジュールはピッチ反復ベースの方法により高い帯域の信号に対してフレーム消去隠蔽を行うか、または線形予測モデル方法のようなモデルに基づいた再生成ベースの方法により高い帯域の信号に対してフレーム消去隠蔽を行うことができる。
ステップ703では、先のフレームデータ反復ベースの方法は失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために使用される。
ステップ703では、先のフレームデータ反復ベースの方法は先のフレーム反復ベースの方法と、先のフレーム反復及び減衰ベースの方法と、コーダパラメータ補間ベースの方法とを含んでいる。
ステップ703では、図3に示されている先のフレームデータ反復モジュールは先のデータ反復ベースの方法により失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行う。特に先のフレーム反復ベースの方法、先のフレーム反復及び減衰ベースの方法又はコーダパラメータ補間ベースの方法が使用されることができる。
例えば先のフレーム反復及び減衰ベースの方法が使用されるとき、現在の失われたフレームの先のフレームの時間ドメインデータは現在の失われたフレーム中に複製され、減衰係数αが乗算される。換言すると、次の式は失われたフレームを回復するために使用されることができる。
shb(n)=shb(n−N)・α,n=0,…,N−1
この式では、Nは1フレーム中に含まれるサンプル数を表す。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか、または連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
shb(n)=shb(n−N)・α,n=0,…,N−1
この式では、Nは1フレーム中に含まれるサンプル数を表す。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であるか、または連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
図5は本発明の1実施形態による先のフレームデータ反復モジュールを示している。図5に示されているように、先のフレームデータ反復モジュールは、先のフレームの高い帯域の信号を現在の失われたフレーム中に複製して、複製されたフレームを減衰モジュールに入力するように構成されている先のフレームの高い帯域の信号用の反復モジュールと、フレーム消去隠蔽後に高い帯域の信号を得るために複製されたフレームを減衰係数αにより乗算するように構成されている減衰モジュールとを含んでいる。
高い帯域の信号復号装置のアルゴリズムが頻繁ドメインアルゴリズムであるならば、先のフレーム反復及び減衰ベースの方法は先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中に幾つかの中間データを反復し減衰するために使用され、この方法は現在の失われたフレームの先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中に得られる中間データを現在の失われたフレームの中間データとして使用し、その中間データを減衰し、現在の失われたフレームの減衰された時間ドメインデータを現在の失われたフレームの中間データと合成し、または先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中に得られ減衰される中間データを現在の失われたフレームの中間データとして使用し、失われたフレームの時間ドメインデータを中間データと合成するステップを含んでいる。
例えば、高い帯域の復号装置がMDCTに基づいている高い帯域の復号装置であるとき、現在の失われたフレームのIMDCT係数を評価するために先のフレームのIMDCT係数は反復され減衰されることができる。合成式にしたがって、先のフレームのIMDCT係数と、現在の失われたフレームのIMDCT係数は現在の失われたフレームの時間ドメインデータを得るためにオーバーラップ−加算される。
現在の失われたフレームのIMDCT係数は次式により評価されることができる。
dcur(n)=dpre(n)・α,n=0,…,2N−1
この式において、dcur(n)は現在の失われたフレームのIMDCT係数であり、dpre(n)は先のフレームのIMDCT係数であり、Nは1フレーム中に含まれるサンプル数である。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であってもよく、あるいは連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
dcur(n)=dpre(n)・α,n=0,…,2N−1
この式において、dcur(n)は現在の失われたフレームのIMDCT係数であり、dpre(n)は先のフレームのIMDCT係数であり、Nは1フレーム中に含まれるサンプル数である。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.8のような定数であってもよく、あるいは連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
現在の失われたフレームの時間ドメインデータは次式によりIMDCT係数に対してOLAを行うことにより得られる。
shb(n)=wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n),
n=0,…,N−1
この式において、shb(n)は現在の失われたフレームの時間ドメインデータであり、wtdac(n)はハミングウィンドウおよび正弦波ウィンドウのようなOLA合成期間中に加算されるウィンドウ関数である。ウィンドウ関数を決定する方法は、従来技術でshb(n)を計算する期間中にウィンドウ関数を決定する方法と同じである。
shb(n)=wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n),
n=0,…,N−1
この式において、shb(n)は現在の失われたフレームの時間ドメインデータであり、wtdac(n)はハミングウィンドウおよび正弦波ウィンドウのようなOLA合成期間中に加算されるウィンドウ関数である。ウィンドウ関数を決定する方法は、従来技術でshb(n)を計算する期間中にウィンドウ関数を決定する方法と同じである。
図6は、本発明の1実施形態による別の先のフレームデータ反復モジュールの構造図である。図6に示されているように、先のフレームデータ反復モジュールは先のフレームIMDCT係数記憶モジュールと、減衰モジュールと、OLAモジュールとを含んでいる。先のフレームIMDCT係数記憶モジュールは頻繁ドメインデータから時間ドメインデータを回復する期間中にIMDCT係数を記憶するように構成されている。減衰モジュールは現在の失われたフレームのIMDCT係数を得るためにIMDCT係数をαにより減衰するように構成されている。先のフレームのIMDCT係数と、減衰後に得られた現在の失われたフレームのIMDCT係数はオーバーラップ−加算のためにOLAモジュールへ入力される。その後、フレーム消去隠蔽後に現在の失われたフレームの高い帯域の信号が得られる。
IMDCT係数の代わりにMDCT係数が反復され減衰されるならば、IMDCT係数を得るためにMDCT係数に対してIMDCTが行われ、IMDCT係数は減衰される。現在の失われたフレームの時間ドメインデータはOLAプロセスを通して得られる。しかしながら、IMDCTプロセスの計算量がさらに付加される。当業者は先のフレームのIMDCT係数が反復され直接減衰され、現在の失われたフレームの時間ドメインデータがOLAプロセスで合成されるならば、計算量は減少されることができることを認識できる。
さらに例えば、高い帯域の復号装置が高速度フーリエ変換(FFT)に基づいた高い帯域の復号装置であるとき、先のフレームの逆高速度フーリエ変換(IFFT)が現在の失われたフレームのIFFT係数を評価するために反復され減衰されることができる。その後、OLAが現在の失われたフレームの時間ドメインデータを得るために行われる。
現在の失われたフレームのIFFT係数は次式により評価されることができる。
dcur(n)=dpre(n)・α,n=0,…,M−1
この式では、dcur(n)は現在の失われたフレームのIFFT係数であり、dpre(n)は先のフレームのIFFT係数であり、Mは1フレームにより必要とされるIFFT係数の数を表している。通常Mは1フレーム中のサンプル数を表し、Nよりも大きい。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.875のような定数であってもよく、或いは連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
dcur(n)=dpre(n)・α,n=0,…,M−1
この式では、dcur(n)は現在の失われたフレームのIFFT係数であり、dpre(n)は先のフレームのIFFT係数であり、Mは1フレームにより必要とされるIFFT係数の数を表している。通常Mは1フレーム中のサンプル数を表し、Nよりも大きい。減衰係数αは0から1の範囲の負ではない数である。減衰係数αは0.875のような定数であってもよく、或いは連続して失われたパケットの数にしたがって適応して変化する可変数であってもよい。例えば第1の失われたフレームは、0.9のようなより大きな減衰係数により乗算され、第2の失われたフレームと後続するフレームは0.7のようなより小さい減衰係数により乗算される。
現在の失われたフレームの前の(M−N)サンプルは以下のOLA式によって再生される。
shb(n)=w(n+N)dpre(n+N)+w(n)dcur(n),
n=0,…,M−N−1
この式ではshb(n)は現在の失われたフレームの時間ドメインデータであり、w(n)はハミングウィンドウおよび正弦波ウィンドウのようなOLA合成期間中に加算されるウィンドウ関数である。
shb(n)=w(n+N)dpre(n+N)+w(n)dcur(n),
n=0,…,M−N−1
この式ではshb(n)は現在の失われたフレームの時間ドメインデータであり、w(n)はハミングウィンドウおよび正弦波ウィンドウのようなOLA合成期間中に加算されるウィンドウ関数である。
現在の失われたフレーム後の(2N−M)サンプルは次式により再生される。
shb(n)=dcur(n),n=M−N,…,N−1
この式において、Mは1フレームにより必要とされるIFFT係数の数を表し、Nは1フレームのサンプル数である。
shb(n)=dcur(n),n=M−N,…,N−1
この式において、Mは1フレームにより必要とされるIFFT係数の数を表し、Nは1フレームのサンプル数である。
2つの層のコーデックを除いて、スピーチ復号装置はさらにコア層及び強調層を含んでいる多層復号装置を含むことができる。コアコーデックは伝統的な狭帯域または広帯域コーデックである。幾つかの強調層はコアコーデックのコア層に基づいて拡張される。したがってコア層は対応する伝統的な音声コーデックと直接相互通信することができる。強調層は低い帯域の音声信号の音声品質を改良するように構成されている低い帯域の強調層と、音声帯域幅を拡張するように構成されている高い帯域の強調層を含んでいる。例えば狭帯域の信号は広帯域の信号へ拡張され、または広帯域の信号は超広帯域の信号に拡張され、または超広帯域の信号は全帯域の信号へ拡張される。しかしながら少なくとも2つの層を含んでいるスピーチ復号装置は低い帯域の信号と高い帯域の信号へ復号されている異なる層の信号を合成し、それぞれフレーム消去隠蔽を行い、したがってスピーチ復号装置から出力される音声信号が得られる。それ故、本発明の1実施形態にしたがって高い帯域の信号に対してフレーム消去隠蔽を行う技術的解決方法はコア層と強調層を含んでいる多層復号装置にも応用可能である。
前述の説明から認められるように、本発明の1実施形態により与えられる技術的解決方法にしたがって、低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度が計算され、その後、低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度が予め構成されたしきい値以上であるか等しいかが決定され、周期的強度が予め構成されたしきい値以上であるならば、ピッチ周期反復ベースの方法が現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために使用される。したがって高い帯域の信号が強い周期性を有するとき、高い帯域の信号の周期性は破壊されず、高い帯域の信号の周期性が破壊される。したがって高い帯域の信号の周期性が破壊されるので、音声信号の品質が低下する問題は防止されることができる。
さらに、本発明の1実施形態によれば、フレーム消去隠蔽が低い帯域の信号に対して行われるとき低い帯域の信号のピッチ周期が得られ、低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度が計算される。したがって周期的強度計算モジュールを構成するハードウェアオーバーヘッドは減少されることができる。
高い帯域の信号の周期的強度がしきい値よりも低く、高い帯域の信号の周期的強度が弱いことが決定されるとき、先のフレームデータ反復ベースの方法が現在の失われたフレームに対してフレーム消去隠蔽を行うために使用される。高い帯域の信号の周期的強度が弱い時、高い周波数の雑音が導入される。それ故、高い周波数の雑音が導入されるため音声信号の音声品質が低下される問題は防止されることができる。このようにして、本発明の1実施形態にしたがって高い帯域の信号に対してフレーム消去隠蔽を行う技術的解決方法はスピーチ復号装置から出力された音声信号の品質を改良することができる。
さらに高い帯域の信号復号装置のアルゴリズムが頻繁ドメインアルゴリズムであるとき、先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中の中間データは現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために使用されることができる。高い帯域の信号がMCDTに基づいて符合化されるとき、復号装置から得られたIMDCT係数は反復され減衰されることができ、その後OLAプロセスが現在の失われたフレームの時間ドメインデータを回復するために行われる。したがって計算量は減少する。
当業者は本発明はハードウェア又はソフトウェアの一方或いはその両者を使用して実行されることができることを容易に認識するであろう。本発明の技術液範囲内に含まれる実施形態はコンピュータが実行可能な命令、コンピュータが読取可能な命令、またはそこに記憶されたデータ構造を伝送し、又は有するためのコンピュータが読取可能な媒体も含んでいる。このようなコンピュータが読取可能な媒体はRAM、ROM、他の光ディスク記憶装置、または磁気ディスク記憶装置のような物理的な記憶媒体を含むことができる。コンピュータが読取可能な媒体中に記憶されている命令のプログラムは方法を行うためにマシンにより実行される。その方法は本発明の方法の実施形態のうちの任意の1つのステップを含むことができる。
前述の実施形態は単なる例示として与えられたものであり、実施形態の順序は実施形態を評価するための規準として考えられることはできない。さらに実施形態中の表現「ステップ」は本発明をここで説明したようなシーケンスで実行するためのステップのシーケンスに限定することを意図していない。
さらに付加的な利点及び変更が当業者により容易に行われるであろう。それ故、本発明はその広い特徴の発明であり、ここで示され説明された特別な詳細および代表的な実施形態に限定されない。したがって特許請求の範囲とその等価物により規定されているように種々の変形及び変更が本発明の技術的範囲を逸脱せずに行われることができる。
Claims (18)
- 低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、
周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、ピッチ周期反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行い、周期的な強度が予め構成されたしきい値よりも低いならば、先のフレームデータ反復ベースの方法によって現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うステップを含んでいる高い帯域の信号に対してフレーム消去隠蔽を行う方法。 - 低い帯域の信号のピッチ周期情報は低い帯域の信号のピッチ周期と低い帯域の信号のピッチ周期のインターバルを含み、インターバルの第1の境界は低い帯域の信号のピッチ周期と最小のピッチ周期からmを減算することにより得られる値の大きい方の値であり、インターバルの第2の境界は低い帯域の信号のピッチ周期と最大のピッチ周期へmを加算することにより得られる値の小さい方の値であり、mは3以下である請求項1記載の方法。
- 低い帯域の信号のピッチ周期は低い帯域の信号のフレーム消去隠蔽プロセスを通して得られる請求項1又は2記載の方法。
- 低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的強度を計算することは、現在の失われたフレームの高い帯域の信号の経歴バッファ信号により、自己相関関数と正規化された相関関数により低い帯域の信号のピッチ周期情報に関する高い帯域の信号の周期的強度を計算するステップを含んでいる請求項1記載の方法。
- ピッチ周期反復ベースの方法はピッチ反復ベースの方法と、ピッチ反復および減衰ベースの方法と、モデルベースの再生成方法とを含んでいる請求項1又は4記載の方法。
- ピッチ反復及び減衰ベースの方法により現在の失われたフレームの高い帯域の信号に対するフレーム消去隠蔽の実行は、ピッチ周期に基づいて高い帯域の信号の経歴バッファ信号を複製し、正弦波ウィンドウを複製された信号へ付加し、ウィンドウ信号を減衰して逆変形されたディスクリートな余弦変換の評価値と、IMDCTと、現在のフレームの係数とを獲得し、評価された値を先のフレームのIMDCT係数の後者の部分でオーバーラップ加算し減衰するステップを含んでいる請求項5記載の方法。
- 先のフレームのIMDCT係数の後者の部分により評価された値をオーバーラップ加算し減衰するための減衰係数は、連続して失われたパケット数にしたがって適応して変化する可変数である請求項6記載の方法。
- 先のフレームデータ反復ベースの方法は、先のフレーム反復ベースの方法、先のフレーム反復及び減衰ベースの方法、コーダパラメータ補間ベースの方法を含んでいる請求項1記載の方法。
- 先のフレームデータ反復及び減衰ベースの方法により現在の失われたフレームの高い帯域の信号に対するフレーム消去隠蔽の実行は、現在のフレームの時間ドメインデータとして現在の失われたフレームの先のフレームの時間ドメインデータを使用し、時間ドメインデータを減衰するステップを含んでいる請求項8記載の方法。
- 先のフレーム反復方法により現在の失われたフレームの高い帯域の信号に対するフレーム消去隠蔽の実行は、
現在の失われたフレームの先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中に得られる中間データを現在の失われたフレームの中間データとして使用し、その中間データを減衰し、現在の失われたフレームの減衰された時間ドメインデータを現在の失われたフレームの中間データと合成し、または先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中に得られ減衰される中間データを現在の失われたフレームの中間データとして使用し、現在の失われたフレームの時間ドメインデータを現在の失われたフレームの中間データと合成するステップを含んでいる請求項8または9記載の方法。 - 中間データがIMDCT係数であるとき、現在の失われたフレームの時間ドメインデータを現在の失われたフレームの中間データと合成するステップは、
現在の失われたフレームの時間ドメインデータを得るために現在の失われたフレームのIMDCT係数と先のフレームのIMDCT係数とをオーバーラップ加算するステップを含んでいる請求項10記載の方法。 - 低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号をピッチ周期反復モジュールへ送信し、周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号を先のフレームデータ反復モジュールへ送信するように構成されている周期的強度計算モジュールと、
ピッチ周期反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されているピッチ周期反復モジュールと、
先のフレームデータ反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されている先のフレームデータ反復モジュールとを具備している高い帯域の信号に対してフレーム消去隠蔽を行う装置。 - 先のフレームデータ反復モジュールは、
先のフレームの高い帯域の信号を現在の失われたフレームへ複製するように構成されている先のフレームの高い帯域の信号用の反復モジュールと、
フレーム消去隠蔽後、高い帯域の信号を得るために先のフレームの高い帯域の信号の反復モジュールにより複製される先のフレームの高い帯域の信号を減衰係数により乗算するように構成されている減衰モジュールとを具備している請求項12記載の装置。 - 先のフレームデータ反復モジュールは、
先のフレームの頻繁ドメインデータから時間ドメインデータを回復する期間中にIMDCT係数を記憶するように構成されている先のフレームの逆変形されたディスクリートな余弦変換、IMDCT、係数記憶モジュールと、
現在の失われたフレームのIMDCT係数を得るために先のフレームのIMDCT係数記憶モジュール中のIMDCT係数を減衰するように構成されている減衰モジュールと、
現在の失われたフレームの時間ドメインデータを得るために、先のフレームIMDCT係数記憶モジュール中の先のフレームのIMDCT係数と、減衰モジュールにより得られた現在の失われたフレームのIMDCT係数とをオーバーラップ加算するように構成されているオーバーラップ−加算、即ちOLAモジュールとを具備している請求項12記載の装置。 - ピッチ周期反復モジュールは、
ピッチ周期にしたがって現在のフレームの信号を複製するように構成されている反復モジュールと、
現在のフレームのIMDCT係数の評価された値を得るために、正弦波ウィンドウを複製された信号に加算し、ウィンドウ信号を減衰するように構成されている減衰モジュールと、
評価された値と先のフレームのIMDCT係数の後者の部分とをオーバーラップ−加算し減衰するように構成されているオーバーラップ−加算、即ちOLAモジュールとを具備している請求項12記載の装置。 - 入力ビット流を低い帯域のビット流と高い帯域のビット流へデマルチプレクスするように構成されているビット流デマルチプレクスモジュールと、
低い帯域のビット流と高い帯域のビット流を低い帯域の信号と高い帯域の信号へそれぞれ復号するように構成されている低い帯域の復号装置と高い帯域の復号装置と、
低い帯域の信号のピッチ周期を得るために低い帯域の信号に対してフレーム消去隠蔽を行うように構成されている低い帯域の信号用のフレーム消去隠蔽装置と、
低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを決定し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うためピッチ周期反復ベースの方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために先のフレームデータ反復ベースの方法を使用するように構成されているフレーム消去隠蔽方法と、
フレーム消去隠蔽後、低い帯域の信号と高い帯域の信号を音声信号へ合成して出力するように構成されている合成直角ミラーフィルタバンクとを具備しているスピーチ復号装置。 - 高い帯域の信号用のフレーム消去隠蔽装置は、
現在の失われたフレームの低い帯域の信号のピッチ周期情報に関して高い帯域の信号の周期的な強度を計算し、周期的な強度が予め構成されたしきい値以上であるかを判断し、周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号をピッチ周期反復モジュールへ送信し、周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号を先のフレームデータ反復モジュールへ送信するように構成されている周期的強度計算モジュールと、
ピッチ周期反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されているピッチ周期反復モジュールと、
先のフレームデータ反復ベースの方法により現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うように構成されている先のフレームデータ反復モジュールとを具備している請求項16記載のスピーチ復号装置。 - コンピュータ装置により実行されるとき、コンピュータ装置に請求項1乃至11のいずれか1項記載のステップを行わせるコンピュータプログラムを具備しているコンピュータプログラムプロダクト。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710153955 | 2007-09-15 | ||
CNB2007101945709A CN100524462C (zh) | 2007-09-15 | 2007-11-24 | 对高带信号进行帧错误隐藏的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009109977A true JP2009109977A (ja) | 2009-05-21 |
Family
ID=39898258
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009531715A Active JP4603091B2 (ja) | 2007-09-15 | 2008-05-04 | 高帯域信号にフレーム消失の隠蔽を行う方法および装置 |
JP2008166446A Withdrawn JP2009109977A (ja) | 2007-09-15 | 2008-06-25 | 高い帯域信号に対するフレーム消去隠蔽を行うための方法及び装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009531715A Active JP4603091B2 (ja) | 2007-09-15 | 2008-05-04 | 高帯域信号にフレーム消失の隠蔽を行う方法および装置 |
Country Status (9)
Country | Link |
---|---|
US (3) | US8200481B2 (ja) |
EP (2) | EP2068306B1 (ja) |
JP (2) | JP4603091B2 (ja) |
KR (1) | KR100998430B1 (ja) |
CN (2) | CN100524462C (ja) |
AT (2) | ATE485581T1 (ja) |
DE (2) | DE602008003085D1 (ja) |
ES (1) | ES2328649T3 (ja) |
WO (1) | WO2009033375A1 (ja) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
CN101325631B (zh) * | 2007-06-14 | 2010-10-20 | 华为技术有限公司 | 一种估计基音周期的方法和装置 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR100922897B1 (ko) * | 2007-12-11 | 2009-10-20 | 한국전자통신연구원 | Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법 |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
EP2289065B1 (en) * | 2008-06-10 | 2011-12-07 | Dolby Laboratories Licensing Corporation | Concealing audio artifacts |
US8706479B2 (en) * | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
US8280725B2 (en) * | 2009-05-28 | 2012-10-02 | Cambridge Silicon Radio Limited | Pitch or periodicity estimation |
CN101615910B (zh) | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
CN101937679B (zh) * | 2010-07-05 | 2012-01-11 | 展讯通信(上海)有限公司 | 音频数据帧的错误掩盖方法及音频解码装置 |
JP2012032713A (ja) * | 2010-08-02 | 2012-02-16 | Sony Corp | 復号装置、復号方法、およびプログラム |
EP2458585B1 (en) * | 2010-11-29 | 2013-07-17 | Nxp B.V. | Error concealment for sub-band coded audio signals |
BR112012029132B1 (pt) | 2011-02-14 | 2021-10-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Representação de sinal de informações utilizando transformada sobreposta |
PT2676267T (pt) | 2011-02-14 | 2017-09-26 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
CN103620672B (zh) * | 2011-02-14 | 2016-04-27 | 弗劳恩霍夫应用研究促进协会 | 用于低延迟联合语音及音频编码(usac)中的错误隐藏的装置和方法 |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
MY164797A (en) | 2011-02-14 | 2018-01-30 | Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V | Apparatus and method for processing a decoded audio signal in a spectral domain |
EP3537436B1 (en) * | 2011-10-24 | 2023-12-20 | ZTE Corporation | Frame loss compensation method and apparatus for voice frame signal |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
CN103426441B (zh) * | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
WO2013183977A1 (ko) * | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
EP3252762B1 (en) * | 2012-10-01 | 2019-01-30 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, program and recording medium |
CN103854649B (zh) * | 2012-11-29 | 2018-08-28 | 中兴通讯股份有限公司 | 一种变换域的丢帧补偿方法及装置 |
PL3098811T3 (pl) * | 2013-02-13 | 2019-04-30 | Ericsson Telefon Ab L M | Ukrywanie błędu ramki |
BR112015031606B1 (pt) | 2013-06-21 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros |
CN104240715B (zh) * | 2013-06-21 | 2017-08-25 | 华为技术有限公司 | 用于恢复丢失数据的方法和设备 |
CN104282309A (zh) | 2013-07-05 | 2015-01-14 | 杜比实验室特许公司 | 丢包掩蔽装置和方法以及音频处理*** |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
CN103489448A (zh) * | 2013-09-03 | 2014-01-01 | 广州日滨科技发展有限公司 | 语音数据处理方法及*** |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
CA2984562C (en) | 2013-10-31 | 2020-01-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
ES2755166T3 (es) | 2013-10-31 | 2020-04-21 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP2922056A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
CN107369455B (zh) | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
WO2015190985A1 (en) * | 2014-06-13 | 2015-12-17 | Telefonaktiebolaget L M Ericsson (Publ) | Burst frame error handling |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
EP3176781A4 (en) * | 2014-07-28 | 2017-12-27 | Samsung Electronics Co., Ltd. | Method and apparatus for packet loss concealment, and decoding method and apparatus employing same |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
TWI602172B (zh) | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
TWI771266B (zh) * | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US9978400B2 (en) * | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US9837094B2 (en) * | 2015-08-18 | 2017-12-05 | Qualcomm Incorporated | Signal re-use during bandwidth transition period |
WO2017129270A1 (en) * | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
CN106291205B (zh) * | 2016-10-14 | 2019-04-16 | 广州视源电子科技股份有限公司 | 一种血氧探头故障诊断方法及装置 |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
CN106898356B (zh) * | 2017-03-14 | 2020-04-14 | 建荣半导体(深圳)有限公司 | 一种适用于蓝牙语音通话的丢包隐藏方法、装置及蓝牙语音处理芯片 |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
CN111383643B (zh) * | 2018-12-28 | 2023-07-04 | 南京中感微电子有限公司 | 一种音频丢包隐藏方法、装置及蓝牙接收机 |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
US11646042B2 (en) * | 2019-10-29 | 2023-05-09 | Agora Lab, Inc. | Digital voice packet loss concealment using deep learning |
US11429830B2 (en) | 2020-03-05 | 2022-08-30 | Fasteners For Retail, Inc. | Security tag holder and assembly for use with package having curved surfaces |
USD956607S1 (en) | 2020-04-16 | 2022-07-05 | Fasteners For Retail, Inc. | Security tag holder |
US12000178B2 (en) | 2020-05-18 | 2024-06-04 | Fasteners For Retail, Inc. | Security tag holder |
CN113035208B (zh) * | 2021-03-04 | 2023-03-28 | 北京百瑞互联技术有限公司 | 一种音频解码器的分级错误隐藏方法、装置及存储介质 |
CN114299994B (zh) * | 2022-01-04 | 2024-06-18 | 中南大学 | 激光多普勒远距离侦听语音的爆音检测方法、设备及介质 |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3111459B2 (ja) * | 1990-06-11 | 2000-11-20 | ソニー株式会社 | 音声データの高能率符号化方法 |
US5943347A (en) * | 1996-06-07 | 1999-08-24 | Silicon Graphics, Inc. | Apparatus and method for error concealment in an audio stream |
US5907822A (en) * | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
US6952668B1 (en) * | 1999-04-19 | 2005-10-04 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
DE19959038A1 (de) * | 1999-12-08 | 2001-06-28 | Bosch Gmbh Robert | Verfahren zur Dekodierung von digitalen Audiodaten |
US6691085B1 (en) | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
US6968309B1 (en) | 2000-10-31 | 2005-11-22 | Nokia Mobile Phones Ltd. | Method and system for speech frame error concealment in speech decoding |
KR100830857B1 (ko) * | 2001-01-19 | 2008-05-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 전송 시스템, 오디오 수신기, 전송 방법, 수신 방법 및 음성 디코더 |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
EP1425562B1 (en) * | 2001-08-17 | 2007-01-10 | Broadcom Corporation | Improved bit error concealment methods for speech coding |
KR20030044292A (ko) | 2001-11-29 | 2003-06-09 | 주식회사 현대시스콤 | 음성 시스템에서 피치 파라미터 탐색 장치 및 방법 |
US20030163304A1 (en) * | 2002-02-28 | 2003-08-28 | Fisseha Mekuria | Error concealment for voice transmission system |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US20030220787A1 (en) * | 2002-04-19 | 2003-11-27 | Henrik Svensson | Method of and apparatus for pitch period estimation |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
JP2004302259A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 音響信号の階層符号化方法および階層復号化方法 |
JP2004361731A (ja) * | 2003-06-05 | 2004-12-24 | Nec Corp | オーディオ復号装置及びオーディオ復号方法 |
US7337108B2 (en) * | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
EP1722359B1 (en) | 2004-03-05 | 2011-09-07 | Panasonic Corporation | Error conceal device and error conceal method |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
DE602005008574D1 (de) * | 2004-04-28 | 2008-09-11 | Matsushita Electric Ind Co Ltd | Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren |
JPWO2005106848A1 (ja) * | 2004-04-30 | 2007-12-13 | 松下電器産業株式会社 | スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 |
US7710982B2 (en) * | 2004-05-26 | 2010-05-04 | Nippon Telegraph And Telephone Corporation | Sound packet reproducing method, sound packet reproducing apparatus, sound packet reproducing program, and recording medium |
WO2006025313A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
RU2404506C2 (ru) * | 2004-11-05 | 2010-11-20 | Панасоник Корпорэйшн | Устройство масштабируемого декодирования и устройство масштабируемого кодирования |
SG124307A1 (en) * | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | Method and system for lost packet concealment in high quality audio streaming applications |
US7519535B2 (en) * | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US8178727B2 (en) * | 2005-06-27 | 2012-05-15 | National University Corporation Tohoku University | Bis(arylmethylidene)acetone compound, anti-cancer agent, carcinogenesis-preventive agent, inhibitor of expression of Ki-Ras, ErbB2, c-Myc and Cycline D1, β-catenin-degrading agent, and p53 expression enhancer |
CN101213590B (zh) * | 2005-06-29 | 2011-09-21 | 松下电器产业株式会社 | 可扩展解码装置及丢失数据插值方法 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
JP4876574B2 (ja) | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US7457746B2 (en) | 2006-03-20 | 2008-11-25 | Mindspeed Technologies, Inc. | Pitch prediction for packet loss concealment |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8280728B2 (en) * | 2006-08-11 | 2012-10-02 | Broadcom Corporation | Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform |
WO2008022207A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Time-warping of decoded audio signal after packet loss |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US20080071550A1 (en) * | 2006-09-18 | 2008-03-20 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode audio signal by using bandwidth extension technique |
KR101292771B1 (ko) * | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR20090076797A (ko) | 2007-09-15 | 2009-07-13 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치 |
-
2007
- 2007-11-24 CN CNB2007101945709A patent/CN100524462C/zh active Active
-
2008
- 2008-05-04 DE DE602008003085T patent/DE602008003085D1/de active Active
- 2008-05-04 CN CN2008800003799A patent/CN101542594B/zh active Active
- 2008-05-04 WO PCT/CN2008/070867 patent/WO2009033375A1/zh active Application Filing
- 2008-05-04 JP JP2009531715A patent/JP4603091B2/ja active Active
- 2008-05-04 EP EP08734223A patent/EP2068306B1/en active Active
- 2008-05-04 AT AT08734223T patent/ATE485581T1/de not_active IP Right Cessation
- 2008-05-16 ES ES08156327T patent/ES2328649T3/es active Active
- 2008-05-16 EP EP08156327A patent/EP2037450B1/en active Active
- 2008-05-16 AT AT08156327T patent/ATE438910T1/de not_active IP Right Cessation
- 2008-05-16 DE DE602008000072T patent/DE602008000072D1/de active Active
- 2008-05-29 US US12/129,118 patent/US8200481B2/en active Active
- 2008-06-06 US US12/134,410 patent/US20090076807A1/en not_active Abandoned
- 2008-06-23 KR KR1020080059133A patent/KR100998430B1/ko active IP Right Grant
- 2008-06-25 JP JP2008166446A patent/JP2009109977A/ja not_active Withdrawn
- 2008-11-18 US US12/273,391 patent/US7552048B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2037450A1 (en) | 2009-03-18 |
WO2009033375A1 (fr) | 2009-03-19 |
US20090076805A1 (en) | 2009-03-19 |
ATE485581T1 (de) | 2010-11-15 |
JP2009538460A (ja) | 2009-11-05 |
DE602008000072D1 (de) | 2009-09-17 |
US20090076808A1 (en) | 2009-03-19 |
JP4603091B2 (ja) | 2010-12-22 |
ES2328649T3 (es) | 2009-11-16 |
KR100998430B1 (ko) | 2010-12-03 |
EP2068306A1 (en) | 2009-06-10 |
EP2068306B1 (en) | 2010-10-20 |
DE602008003085D1 (de) | 2010-12-02 |
US8200481B2 (en) | 2012-06-12 |
KR20090028676A (ko) | 2009-03-19 |
CN101231849A (zh) | 2008-07-30 |
EP2068306A4 (en) | 2009-12-02 |
US7552048B2 (en) | 2009-06-23 |
EP2037450B1 (en) | 2009-08-05 |
CN101542594B (zh) | 2012-01-25 |
CN100524462C (zh) | 2009-08-05 |
ATE438910T1 (de) | 2009-08-15 |
CN101542594A (zh) | 2009-09-23 |
US20090076807A1 (en) | 2009-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009109977A (ja) | 高い帯域信号に対するフレーム消去隠蔽を行うための方法及び装置 | |
TWI553628B (zh) | 訊框錯誤隱藏方法 | |
RU2496156C2 (ru) | Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования | |
CN105765651B (zh) | 使用错误隐藏提供经解码的音频信息的音频解码器及方法 | |
TWI585748B (zh) | 訊框錯誤隱藏方法以及音訊解碼方法 | |
JP6791839B2 (ja) | パケット損失隠匿方法 | |
JP6530449B2 (ja) | 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置 | |
KR102250472B1 (ko) | 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합 | |
KR20220045260A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
KR20090076797A (ko) | 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090731 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090825 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100430 |