JP4698593B2 - 音声復号化装置および音声復号化方法 - Google Patents

音声復号化装置および音声復号化方法 Download PDF

Info

Publication number
JP4698593B2
JP4698593B2 JP2006529149A JP2006529149A JP4698593B2 JP 4698593 B2 JP4698593 B2 JP 4698593B2 JP 2006529149 A JP2006529149 A JP 2006529149A JP 2006529149 A JP2006529149 A JP 2006529149A JP 4698593 B2 JP4698593 B2 JP 4698593B2
Authority
JP
Japan
Prior art keywords
frame
gain
vector
average amplitude
adaptive codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006529149A
Other languages
English (en)
Other versions
JPWO2006009074A1 (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006529149A priority Critical patent/JP4698593B2/ja
Publication of JPWO2006009074A1 publication Critical patent/JPWO2006009074A1/ja
Application granted granted Critical
Publication of JP4698593B2 publication Critical patent/JP4698593B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声復号化装置および音声復号化方法に関する。
インターネット等において行われるパケット通信では、伝送路においてパケットを消失する等して復号化装置で符号化情報を受信できなかった場合、このパケットの消失補償(隠蔽)処理を行うのが一般的である。
例えば、音声符号化の分野では、ITU−T勧告G.729において、(1)合成フィルタ係数を繰り返し使用し、(2)ピッチ利得および固定符号帳利得(FCB利得)を徐々に減衰させ、(3)FCB利得予測器の内部状態を徐々に減衰させ、(4)直前の正常フレームにおける有声モード/無声モードの判定結果に基づき、適応符号帳もしくは固定符号帳のいずれか一方を用いて音源信号を生成するフレーム消失隠蔽処理が規定されている(例えば、特許文献1参照)。
この方式では、ポストフィルタで行われるピッチ分析結果を用いて、ピッチ予測利得の大小で有声モード/無声モードを判定し、例えば、直前の正常フレームが有声モードの場合、適応符号帳を用いて合成フィルタの音源ベクトルを生成する。ACB(適応符号帳)ベクトルは、フレーム消失補償処理用に生成されたピッチラグに基づいて適応符号帳から生成され、フレーム消失補償処理用に生成されるピッチゲインを乗じて音源ベクトルとなる。フレーム消失補償処理用のピッチラグには、直前に用いた復号ピッチラグをインクリメントしたものが使用される。フレーム消失補償処理用ピッチゲインには、直前に用いた復号ピッチゲインを定数倍して減衰させたものが使用される。
特開平9−120298号公報
しかしながら、従来の音声復号化装置は、過去のピッチゲインに基づいてフレーム消失補償処理用のピッチゲインを決定している。ところが、ピッチゲインは必ずしも信号のエネルギ変化を反映したパラメータではない。そのため、生成されたフレーム消失補償処理用のピッチゲインは過去の信号のエネルギ変化を考慮したものにならない。さらに、一定の比率でピッチゲインを減衰させているため、過去の信号のエネルギ変化と関係なくフレーム消失補償処理用のピッチゲインが減衰する。すなわち、過去の信号のエネルギ変化が考慮されず、かつ、一定の割合でピッチゲインが減衰されるため、補償したフレームは過去の信号からのエネルギの連続性が保たれ難く、音切れ感を生じ易い。よって、復号信号の音質が劣化する。
よって、本発明の目的は、消失補償処理において、過去の信号のエネルギ変化を考慮して復号信号の音質を向上させることができる音声復号化装置および音声復号化方法を提供することである。
本発明の音声復号化装置は、音源信号を生成する適応符号帳と、前記音源信号のサブフレーム間のエネルギ変化を算出する算出手段と、前記エネルギ変化に基づいて前記適応符号帳の利得を決定する決定手段と、前記適応符号帳の利得を用いて消失フレームに対する補償フレームを生成する生成手段と、を具備する構成を採る。
本発明によれば、消失補償処理において、過去の信号のエネルギ変化を考慮することができ、復号信号の音質を向上させることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
本発明の実施の形態1に係る音声符号化装置は、適応符号帳にバッファリングされている過去に生成した音源信号のエネルギ変化を調べ、エネルギの連続性が保たれるように適応符号帳のピッチゲイン、すなわち、適応符号帳利得(ACB利得)を生成する。これにより、消失フレームの補償フレーム用に生成される音源ベクトルの過去の信号からのエネルギ連続性が改善されると共に、適応符号帳に保存される信号のエネルギ連続性が保たれる。
図1は、本発明の実施の形態1に係る音声復号化装置内部の補償フレーム生成部100の主要な構成を示すブロック図である。
この補償フレーム生成部100は、適応符号帳106、ベクトル生成部115、雑音性付加部116、乗算器132、ACB利得生成部135、およびエネルギ変化算出部143を備える。
エネルギ変化算出部143は、適応符号帳106より出力されるACB(適応符号帳)ベクトルの末尾から1ピッチ周期分の音源信号の平均エネルギを算出する。一方、エネルギ変化算出部143の内部メモリには、直前サブフレームにおいて同様に算出された1ピッチ周期分の音源信号の平均エネルギが保持されている。そこで、エネルギ変化算出部143は、現サブフレームと直前サブフレームの1ピッチ周期分の音源信号の平均エネルギの比を計算する。なお、この平均エネルギは、音源信号のエネルギの平方根でも対数でも良い。エネルギ変化算出部143は、計算された比をさらにサブフレーム間において平滑化処理し、平滑化された比をACB利得生成部135へ出力する。
エネルギ変化算出部143は、直前サブフレームにおいて算出された1ピッチ周期分の音源信号のエネルギを現サブフレームで算出された1ピッチ周期分の音源信号のエネルギ
で更新する。例えば、以下の(式1)に従ってEcを計算する。
Ec=√((Σ(ACB[Lacb−i])2)/Pc) …(式1)
(ここで、ACB[0:Lacb−1]:適応符号帳バッファ、
Lacb:適応符号帳バッファ長、
Pc:現サブフレームにおけるピッチ周期、
Ec:現サブフレームにおける過去1ピッチ周期の音源信号の平均振幅
(エネルギの平方根)、
i=1,2,…,Pc)
次に、エネルギ変化算出部143は、直前サブフレームで計算したEcをEpとして保持しておき、エネルギ変化率ReをRe=Ec/Epとして算出する。そして、エネルギ変化算出部143は、Reを0.98でクリッピングして、Sre=0.7×Sre+0.3×Reのような式で平滑化し、平滑化エネルギ変化率SreをACB利得生成部135へ出力する。エネルギ変化算出部143は、最後にEp=Ecとして、Epを更新する。
このように、エネルギ変化を算出してACB利得を決定することにより、エネルギ連続性が保持される。そして、決定されたACB利得を用いて適応符号帳のみから音源生成を行えば、エネルギ連続性が保持された音源ベクトルを生成できる。
ACB利得生成部135は、過去に復号されたACB利得を用いて定義される隠蔽処理用ACB利得、または、エネルギ変化算出部143から出力されるエネルギ変化率情報によって定義される隠蔽処理用ACB利得、のいずれか一方を選択し、最終的な隠蔽処理用ACB利得を乗算器132へ出力する。
ここで、エネルギ変化率情報とは、直前サブフレームの末尾1ピッチ周期から求めた平均振幅A(−1)と、2サブフレーム前の末尾1ピッチ周期から求めた平均振幅A(−2)との比、すなわちA(−1)/A(−2)をサブフレーム間で平滑化したものであり、過去の復号信号のパワ変化を表すものであり、これを基本的にACB利得とする。ただし、過去に復号されたACB利得を用いて定義された隠蔽処理用ACB利得の方が上記のエネルギ変化率情報より大きい場合は、過去に復号されたACB利得を用いて定義された隠蔽処理用ACB利得を最終的な隠蔽処理用ACB利得として選択するようにしても良い。また、上記のA(−1)/A(−2)の比が上限値を超える場合は、上限値でクリッピングする。上限値としては例えば0.98を用いる。
ベクトル生成部115は、適応符号帳106から、対応するACBベクトルを生成する。
ところで、上記の補償フレーム生成部100は、有声性の強弱に関係なく、過去の信号のエネルギ変化のみでACB利得を決定している。よって、音切れ感は解消されるものの、有声性が弱いのにACB利得が高くなることがあり、この場合強いブザー音を生成してしまう。
そこで、本実施の形態では、自然な音質を目指すために、適応符号帳106から生成されたベクトルに雑音性を付加するための雑音性付加部116を、適応符号帳106へのフィードバックループとは別系統として備える。
雑音性付加部116における音源ベクトルの雑音化は、適応符号帳106から生成された音源ベクトルの特定の周波数帯域成分を雑音化することによって行う。より具体的には、適応符号帳106から生成された音源ベクトルに低域通過フィルタをかけて高域成分を取り除き、取り除かれた高域成分の信号エネルギと同じエネルギを有する雑音信号を加算
する。この雑音信号は固定符号帳から生成された音源ベクトルに高域通過フィルタをかけて低域成分を取り除いて生成される。低域通過フィルタと高域通過フィルタは、その阻止域と通過域とが相互に反対になっている完全再構成フィルタバンクか、それに準ずるものを用いる。
上記の構成により、最後に正常受信した音源波形の特徴を適応符号帳106に保存したまま、任意に雑音性を付加し、生成される音源ベクトルの特徴を任意に加工できる。また、音源ベクトルに対して雑音性を付加しても、雑音性が付加される前の音源ベクトルのエネルギは保存されるので、エネルギ連続性を損なうことがない。
図2は、雑音性付加部116内部の主要な構成を示すブロック図である。
この雑音性付加部116は、乗算器110、111、ACB成分生成部134、FCB利得生成部139、FCB成分生成部141、固定符号帳145、ベクトル生成部146、および加算器147を備える。
ACB成分生成部134は、ベクトル生成部115から出力されたACBベクトルを低域通過フィルタに通し、ベクトル生成部115から出力されたACBベクトルのうち雑音を付加しない帯域の成分を生成し、この成分をACB成分として出力する。低域通過フィルタを通過した後のACBベクトルAは、乗算器110およびFCB利得生成部139に出力される。
FCB成分生成部141は、ベクトル生成部146から出力されたFCB(固定符号帳)ベクトルを高域通過フィルタに通し、ベクトル生成部146から出力されたFCBのうち雑音を付加する帯域の成分を生成し、この成分をFCB成分として出力する。高域通過フィルタを通過した後のFCBベクトルFは、乗算器111およびFCB利得生成部139に出力される。
なお、上記の低域通過フィルタおよび高域通過フィルタは、直線位相FIRフィルタである。
FCB利得生成部139は、ACB利得生成部135から出力される隠蔽処理用ACB利得と、ACB成分生成部134から出力される隠蔽処理用ACBベクトルAと、ACB成分生成部134へ入力されるACB成分生成部134での処理を行う前のACBベクトルと、FCB成分生成部141から出力されるFCBベクトルFとから、以下のようにして隠蔽処理用FCB利得を算出する。
FCB利得生成部139は、ACB成分生成部134における処理前と処理後のACBベクトルの差ベクトルDのエネルギEd(ベクトルDの各要素の二乗和)を算出する。次に、FCB利得生成部139は、FCBベクトルFのエネルギEf(ベクトルFの各要素の二乗和)を算出する。次に、FCB利得生成部139は、ACB成分生成部134から入力されたACBベクトルAと、FCB成分生成部141から入力されたFCBベクトルFとの相互相関Raf(ベクトルAとFとの内積)を算出する。次に、FCB利得生成部139は、ACB成分生成部134から入力されたACBベクトルAと上記の差ベクトルDとの相互相関Rad(ベクトルAとDとの内積)を算出する。次に、FCB利得生成部139は、以下の(式2)により、利得を算出する。
(−Raf+√(Raf×Raf+Ef×Ed+2×Ef×Rad))/Ef
…(式2)
ただし、解が虚数や負の数になる場合は、√(Ed/Ef)を利得とする。最後にFCB利得生成部139は、上記の(式2)で求めた利得にACB利得生成部135で生成さ
れた隠蔽処理用ACB利得を乗じて隠蔽処理用FCB利得を得る。
上記の記載は、以下の2つのベクトルのエネルギが等しくなるように隠蔽処理用FCB利得を算出する方法の一例である。ここで、2つのベクトルとは、1つは、ACB成分生成部134へ入力された元々のACBベクトルに隠蔽処理用ACB利得を乗じたベクトルであり、もう1つは、ACBベクトルAに隠蔽処理用ACB利得を乗じたベクトルと、FCBベクトルFに隠蔽処理用FCB利得(未知であり、ここで算出する対象である)を乗じたベクトルとの和ベクトルである。
加算器147は、ACB利得生成部135で決定されたACB利得をACB成分生成部134で生成されたACBベクトルA(音源ベクトルのACB成分)に乗じたものと、FCB利得生成部139で決定されたFCB利得をFCB成分生成部141で生成されたFCBベクトルF(音源ベクトルのFCB成分)に乗じたものと、の和ベクトルを最終的な音源ベクトルとして合成フィルタへ出力する。また、ACB成分生成部134へ入力される(低域通過フィルタ処理前の)ACBベクトルに隠蔽処理用ACB利得を乗じたベクトル、を適応符号帳106にフィードバックして適応符号帳106をACBベクトルのみで更新し、加算器147によって得られたベクトルを合成フィルタの駆動音源とする。
なお、合成フィルタの駆動音源には、位相拡散処理やピッチ周期性強化を図る処理を加えても良い。
このように、本実施の形態によれば、過去の復号音声信号のエネルギ変化率でACB利得を決定し、その利得で生成されるACBベクトルのエネルギに等しい音源ベクトルを生成するようにしているため、消失フレームの前後において復号音声のエネルギ変化が滑らかとなり、音切れ感を生じにくくすることができる。
また、以上の構成において、適応符号帳106の更新を適応符号ベクトルでのみ行うため、例えば、ランダムに雑音化された音源ベクトルで適応符号帳106を更新する場合に生じる後続フレームの雑音感を抑えることができる。
また、以上の構成において、音声信号の有声定常部での隠蔽処理は、主として高域(例えば、3kHz以上)にのみ雑音を付加するので、従来の全域に雑音を付加する方式に比べて雑音感を生じ難くすることができる。
(実施の形態2)
実施の形態1では、本発明に係る補償フレーム生成部の構成の一例として、補償フレーム生成部を単独で採り上げて詳細に説明した。本発明の実施の形態2では、本発明に係る補償フレーム生成部を音声符号化装置に搭載する場合の音声符号化装置の構成の一例を示す。なお、実施の形態1と同一の構成要素には同一の符号を付し、その説明を省略する。
図3は、本発明の実施の形態2に係る音声復号化装置の主要な構成を示すブロック図である。
本実施の形態に係る音声復号化装置は、入力フレームが正常フレームであった場合、通常の復号化処理を行い、入力フレームが正常フレームでなかった(フレームを消失した)場合には、この消失フレームに対する隠蔽処理を行う。切替えスイッチ121〜127は、入力フレームが正常フレームであるか否かを示すBFI(Bad Frame Indicator)に従って切り替わり、上記の2つの処理を可能とする。
まず、通常の復号化処理における本実施の形態に係る音声復号化装置の動作について説
明する。図3に示したスイッチの状態は、通常の復号化処理におけるスイッチの位置を示したものである。
多重化分離部101は、符号化ビットストリームを各パラメータ(LPC符号、ピッチ符号、ピッチ利得符号、FCB符号、およびFCB利得符号)に分離して、それぞれを対応する復号部に供給する。LPC復号部102は、多重化分離部101から供給されたLPC符号からLPCパラメータを復号する。ピッチ周期復号部103は、多重化分離部101から供給されたピッチ符号からピッチ周期を復号する。ACB利得復号部104は、多重化分離部101から供給されたACB符号からACB利得を復号する。FCB利得復号部105は、多重化分離部101から供給されたFCB利得符号からFCB利得を復号する。
適応符号帳106は、ピッチ周期復号部103から出力されたピッチ周期を用いて、ACBベクトルを生成し、乗算部110に出力する。乗算部110は、ACB利得復号部104から出力されたACB利得を、適応符号帳106から出力されたACBベクトルに乗じ、ゲイン調整後のACBベクトルを音源生成部108へ供給する。一方、固定符号帳107は、多重化分離部101から出力された固定符号帳符号からFCBベクトルを生成し、乗算部111に出力する。乗算部111は、FCB利得復号部105から出力されたFCB利得を、固定符号帳107から出力されたFCBベクトルに乗じ、ゲイン調整後のFCBベクトルを音源生成部108へ供給する。音源生成部108は、乗算部110、111から出力された2つのベクトルを加算して音源ベクトルを生成し、これを適応符号帳106へフィードバックすると共に、合成フィルタ109へ出力する。
音源生成部108は、乗算器110から隠蔽処理用ACB利得乗算後のACBベクトルを、乗算器111から隠蔽処理用FCB利得乗算後のFCBベクトルを、それぞれ取得し、両者を加算したものを音源ベクトルとする。誤りなしの場合は、音源生成部108は、この加算したベクトルを音源信号として適応符号帳106にフィードバックすると共に、合成フィルタ109へ出力する。
合成フィルタ109は、スイッチ124を介して入力される線形予測係数(LPC)で構成される線形予測フィルタであり、音源生成部108から出力された駆動音源ベクトルを入力してフィルタ処理を行って、復号音声信号を出力する。
出力された復号音声信号は、ポストフィルタなどの後処理の後、音声復号化装置の最終出力となる。また、消失フレーム隠蔽処理部112内の零交差率算出部(図示せず)にも出力される。
次に、隠蔽処理における本実施の形態に係る音声復号化装置の動作について説明する。この処理は、主に消失フレーム隠蔽処理部112が司る。
通常の復号化処理においても、LPC復号部102、ピッチ周期復号部103、ACB利得復号部104、およびFCB利得復号部105で得られる各復号パラメータ(LPCパラメータ、ピッチ周期、ACB利得、およびFCB利得)は、消失フレーム隠蔽処理部112に供給されている。消失フレーム隠蔽処理部112には、これらの4種類の復号パラメータと、前フレームの復号音声(合成フィルタ109の出力)と、適応符号帳106に保持されている過去の生成音源信号と、現フレーム(消失フレーム)用に生成されたACBベクトルと、現フレーム(消失フレーム)用に生成されたFCBベクトルと、が入力される。消失フレーム隠蔽処理部112は、これらのパラメータを用いて後述の消失フレームの隠蔽処理を行い、得られるLPCパラメータ、ピッチ周期、ACB利得、固定符号帳符号、FCB利得、ACBベクトル、およびFCBベクトルを出力する。
隠蔽処理用ACBベクトル、隠蔽処理用ACB利得、隠蔽処理用FCBベクトル、および隠蔽処理用FCB利得が生成され、隠蔽処理用ACBベクトルは乗算器110へ、隠蔽処理用ACB利得は乗算器110へ、隠蔽処理用FCBベクトルは切替えスイッチ125を介して乗算器111へ、隠蔽処理用FCB利得は切替えスイッチ126を介して乗算器111へ、それぞれ出力される。
音源生成部108は、隠蔽処理時に、ACB成分生成部134へ入力される(LPF処理前の)ACBベクトルに隠蔽処理用ACB利得を乗じたベクトルを適応符号帳106にフィードバックし(適応符号帳106はACBベクトルのみで更新する)、上記の加算処理によって得られたベクトルを合成フィルタの駆動音源とする。なお、誤りなしの場合と同様、合成フィルタの駆動音源には位相拡散処理やピッチ周期性強化を図る処理を加えても良い。
なお、上記の説明において、消失フレーム隠蔽処理部112および音源生成部108が実施の形態1における補償フレーム生成部に相当する。また、雑音性付加の処理において使用される固定符号帳(実施の形態1では固定符号帳145)は、音声復号化装置の固定符号帳107で代用されている。
このように、本実施の形態によれば、本発明に係る補償フレーム生成部を音声復号化装置に搭載することができる。
なお、AMR方式では、後述のFCB符号生成部140に相当する処理は、1フレームの復号処理を開始する前に1フレーム分のビット列をランダムに生成することによって行われており、必ずしもFCB符号のみを個別に生成する手段を備える必要はない。
また、合成フィルタ109に出力される音源信号と、適応符号帳106へフィードバックされる音源信号とは必ずしも同じものである必要はない。例えば、合成フィルタ109へ出力される音源信号の生成時には、AMR方式のように、FCBベクトルに対して位相拡散処理を適用したり、ピッチ周期性強化を図る処理を加えたりしても良い。このとき、適応符号帳106へ出力される信号の生成方法は、エンコーダ側の構成と一致させる。これにより、主観的品質をより改善できる場合がある。
また、本実施の形態では、消失フレーム隠蔽処理部112にFCB利得復号部105からFCB利得が入力されているが、これは必ずしも必要ない。上述した方法で隠蔽処理用FCB利得を算出する前に仮の隠蔽処理用FCB利得が必要な場合のために、仮の隠蔽処理用FCB利得を求めるような場合に必要となる。あるいは、有限語長の固定小数点演算の場合に、ダイナミックレンジを狭めて演算精度の劣化を防ぐために、上記FCBベクトルFにこの仮の隠蔽処理用FCB利得を予め乗算しておく場合にも必要となる。
(実施の形態3)
有声と無声の間の中間的な性質を有する消失フレームに対しては、図4に示すように、適応符号帳および固定符号帳の双方を用いて、これらの符号帳から生成される音源ベクトルをミキシングして補償フレームを生成することが望ましい。しかし、例えば、こういう中間的な信号は、雑音性を有するため有声性が低くなっている場合もあれば、パワが変化しているため有声性が低くなっている場合、または過渡部・立ち上がり付近・語尾付近であるために有声性が低くなっている場合等、様々なケースがあり、ランダムに生成した固定符号帳を固定的に使用して音源信号を生成するという構成を採ると、復号音声に雑音感を生じて主観品質が劣化する。
一方、CELP方式の音声復号化は、過去に生成した音源信号を適応符号帳に記憶しておいて、この音源信号を用いて現在の入力信号に対する音源信号を表すモデルを生成する。すなわち、適応符号帳に記憶された音源信号を再帰的に用いることとなる。よって、一旦音源信号が雑音的なものとなると、後続のフレームにおいても影響が伝播して雑音的になるという問題がある。
そこで、本実施の形態では、図5に示すように、適応符号帳で生成される音源のうち、一部の周波数帯域のみを固定符号帳で生成される雑音的な信号で置換することにより、雑音が主観品質に与える影響を極力少なくする。より具体的には、適応符号帳で生成される音源の高域のみを固定符号帳で生成される雑音的な信号で置換する。高域成分が雑音的であることは実際の音声信号において観察されることであり、全帯域を均一的に雑音化するよりも自然な主観品質を得やすいからである。
また、本実施の形態では、雑音性を付加するにあたり、モード判定部を新たに備え、判定された音声モードに基づいて雑音性付加部において雑音を付加する信号帯域を切り替え、付加する雑音性に強弱を付ける。
なお、帯域制限した適応符号帳および固定符号帳から生成される音源ベクトルを用いて音源信号を合成するということは、正常フレームである前フレームにおいて求まっているACB利得およびFCB利得をそのまま使用できないということを意味している。帯域制限しない適応符号帳および固定符号帳から生成される音源ベクトルの合成ベクトルの利得は、帯域制限した適応符号帳および固定符号帳から生成される音源ベクトルの利得とは異なるからである。そこで、フレーム間のエネルギが不連続となることを防止するためには、実施の形態1で示した補償フレーム生成部が必要となる。
また、固定符号帳によって生成される音源ベクトルをミキシングするに際し、実施の形態1で示した雑音性付加部を転用することができる。
これにより、音声信号の特徴(音声モード)に応じて復号音源信号の雑音化を行う信号帯域を切り替えることができる。例えば、周期性が低く雑音性が高いモードでは雑音を付加する信号帯域を広くし、周期性が強く有声性が高いモードでは雑音を付加する信号帯域を狭くすることで、復号合成音声信号の主観的な品質をより自然性の高いものにすることができる。
図6は、本発明の実施の形態3に係る補償フレーム生成部100aの主要な構成を示すブロック図である。なお、この補償フレーム生成部100aは、実施の形態1に示した補償フレーム生成部100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
モード判定部138は、過去の復号ピッチ周期の履歴と、過去の復号合成音声信号の零交差率と、過去の平滑化復号ACB利得と、過去の復号音源信号のエネルギ変化率と、連続消失フレーム数と、を用いて復号音声信号のモード判定を行う。雑音性付加部116aは、モード判定部138で判定されたモードに基づいて、雑音を付加する信号帯域を切り替える。
図7は、雑音性付加部116a内部の主要な構成を示すブロック図である。なお、この雑音性付加部116aは、実施の形態1に示した雑音性付加部116と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
フィルタ遮断周波数切替え部137は、モード判定部138から出力されるモード判定
結果に基づいてフィルタ遮断周波数を決定し、ACB成分生成部134およびFCB成分生成部141に対応するフィルタ係数を出力する。
図8は、上記のACB成分生成部134内部の主要な構成を示すブロック図である。
ACB成分生成部134は、ベクトル生成部115から出力されたACBベクトルを、BFIが消失フレームを示す場合にLPF(低域通過フィルタ)161を通過させることで雑音を付加しない帯域の成分をACB成分として生成する。このLPF161は、フィルタ遮断周波数切替え部137から出力されるフィルタ係数によって構成される直線位相FIRフィルタである。フィルタ遮断周波数切替え部137は、複数種類の遮断周波数に対応したフィルタ係数セットを格納しており、モード判定部138から出力されたモード判定結果に対応するフィルタ係数を選んでLPF161に出力する。
フィルタの遮断周波数と音声モードとの対応関係は、例えば以下のようなものである。これは、電話帯域音声で音声モードが3モード構成の例である。
有声モード:遮断周波数=3kHz
雑音モード:遮断周波数=0Hz(全帯域遮断=ACBベクトルはゼロベクトル)
その他モード:遮断周波数=1kHz
図9は、上記のFCB成分生成部141内部の主要な構成を示すブロック図である。
ベクトル生成部146から出力されたFCBベクトルは、BFIが消失フレームを示す場合に高域通過フィルタ(HPF)171に入力される。HPF171は、フィルタ遮断周波数切替え部137から出力されるフィルタ係数によって構成される直線位相FIRフィルタである。フィルタ遮断周波数切替え部137は、複数種類の遮断周波数に対応したフィルタ係数セットを格納しており、モード判定部138から出力されたモード判定結果に対応するフィルタ係数を選んでHPF171に出力する。
フィルタの遮断周波数と音声モードとの対応関係は、例えば以下のようなものである。ここでも、電話帯域音声で音声モードが3モード構成の例である。
有声モード:遮断周波数=3kHz
雑音モード:遮断周波数=0Hz(全帯域通過=入力したFCBベクトルをそのまま出力)
その他モード:遮断周波数=1kHz
このとき、最終的なFCBベクトルは、以下の(式3)で示されるようなピッチ周期化処理によって周期性を強調したものとすると周期性を有する信号を生成する場合に効果的である。
c(n)=c(n)+βc(n−T) [n=T,T+1,…,L−1] …(式3)
(ただし、c(n)はFCBベクトル、βはピッチ周期化利得係数、Tはピッチ周期、Lはサブフレーム長)
本実施の形態に係る補償フレーム生成部を実施の形態2で示した音声復号化装置に搭載すると次のようになる。図10は、本実施の形態に係る音声復号化装置内部の消失フレーム隠蔽処理部112の主要な構成を示すブロック図である。なお、既に説明したブロック図については、同じ符号を付し、その説明を基本的に省略する。
LPC生成部136は、過去に入力された復号LPC情報に基づいて隠蔽処理用LPCパラメータを生成し、これを切替えスイッチ124を介して合成フィルタ109へ出力する。例えば、隠蔽処理用LPCパラメータの生成方法は、例えば、AMR方式では直前の
LSPパラメータを平均的なLSPパラメータに近づけたものを隠蔽処理用LSPパラメータとし、これをLPCパラメータに変換したものを隠蔽処理用LPCパラメータとする。なお、フレーム消失が長時間(例えば、20msフレームで3フレーム以上)続く場合は、LPCパラメータに重みづけを行い、合成フィルタの帯域幅の拡張を行って白色化を行っても良い。この重みづけは、LPC合成フィルタの伝達関数を1/A(z)とすれば、1/A(z/γ)で表され、γの値は0.99−0.97程度の値か、その値を初期値として徐々に下げていくものとする。なお、1/A(z)は、以下の(式4)に従う。
1/A(z)=1/(1+Σa(i)z-i) …(式4)
(ただし、i=1,…,p(pはLPC分析次数))
ピッチ周期生成部131は、モード判定部138におけるモード判定の後、ピッチ周期を生成する。具体的には、AMR方式の12.2kbpsモードの場合、直前の正常サブフレームの復号ピッチ周期(整数精度)を消失フレームにおけるピッチ周期として出力する。すなわち、ピッチ周期生成部131は、復号ピッチを保持するメモリを備え、サブフレーム毎にその値を更新し、誤り時にそのバッファの値を隠蔽処理時のピッチ周期として出力する。なお、適応符号帳106は、ピッチ周期生成部131から出力されたこのピッチ周期から、対応するACBベクトルを生成する。
FCB符号生成部140は、生成したFCB符号を切替えスイッチ127を介して固定符号帳107に出力する。
固定符号帳107は、FCB符号に対応するFCBベクトルをFCB成分生成部141に出力する。
零交差率算出部142は、合成フィルタから出力された合成信号を入力し、零交差率を計算してモード判定部138に出力する。ここで、零交差率は、直前1ピッチ周期の信号の特徴を抽出するため(一番時間的に近い部分での特徴を反映させるため)に、直前1ピッチ周期を用いて算出するのが良い。
上記のように生成された各パラメータ、具体的には、隠蔽処理用ACBベクトルは切替えスイッチ123を介して乗算器110へ、隠蔽処理用ACB利得は切替えスイッチ122を介して乗算器110へ、隠蔽処理用FCBベクトルは切替えスイッチ125を介して乗算器111へ、隠蔽処理用FCB利得は切替えスイッチ126を介して乗算器111へ、それぞれ出力される。
図11は、モード判定部138内部の主要な構成を示すブロック図である。
モード判定部138は、ピッチ履歴分析の結果と、平滑化ピッチ利得と、エネルギ変化情報と、零交差率情報と、消失フレームの連続数と、を用いてモード判定を行う。本発明のモード判定は、フレーム消失隠蔽処理用のものであるので、フレームで1回(正常フレームの復号処理が終わってから、最初にモード情報が使われる隠蔽処理を行うまでの間)行えば良く、本実施の形態では第1サブフレームの音源復号処理の冒頭で行う。
ピッチ履歴分析部182は、過去複数サブフレーム分の復号ピッチ周期情報をバッファに保持しており、過去のピッチ周期の変動が大きいか小さいかによって有声定常性を判定する。より具体的には、バッファ内の最大ピッチ周期と最小ピッチ周期との差が所定の閾値(例えば、最大ピッチ周期の15%または10サンプル(8kHzサンプリング時)のいずれか小さい方)以内におさまっていれば有声定常性が高いと判定する。ピッチ周期のバッファ更新は、1フレーム分のピッチ周期情報をバッファリングしているのであれば1フレームに1回(一般的にはフレーム処理の最後で)行えば良いし、そうでない場合はサ
ブフレームに1回(一般的にはサブフレーム処理の最後で)行えば良い。保持するピッチ周期の数は直前4サブフレーム(20ms)程度とする。ピッチ変化の大きさだけで判定する事により、倍ピッチ誤り(ピッチ周期を半分に誤る)や半ピッチ誤り(ピッチ周期を2倍に誤る)時は有声定常とは判定されず、倍ピッチや半ピッチの情報を用いて隠蔽処理を行った場合に生じる「声が裏返る」ようなことがなくなる。
平滑化ACB利得算出部183は、復号ACB利得のサブフレーム間変動をある程度抑えるためのサブフレーム間平滑化処理を行う。例えば、次式で表される程度の平滑化処理とする。
(平滑化ACB利得)=0.7×(平滑化ACB利得)+0.3×(復号ACB利得)
算出された平滑化ACB利得が閾値(例えば0.7)を超える場合は有声性が高いと判定する。
判定部184は、上記のパラメータに加え、さらに、エネルギ変化情報と零交差率情報を用いてモード判定を行う。具体的には、ピッチ履歴分析結果で有声定常性が高く、かつ、平滑化ACB利得の閾値処理の結果有声性が高く、かつ、エネルギ変化が閾値以下(例えば2未満)で、かつ、零交差率が閾値以下(例えば0.7未満)の場合に有声(有声定常)モードと判定し、零交差率が閾値以上(例えば0.7以上)の場合は雑音(雑音性信号)モードと判定し、それ以外の場合はその他(立ち上がり・過渡)モードと判定する。
モード判定部138は、モード判定を行った後、現フレームが連続何フレーム目の消失フレームかにより最終モード判定結果を決定する。具体的には、連続2フレーム目までは上記モード判定結果を最終モード判定結果とし、連続3フレーム目では上記モード判定結果が有声モードであった場合はその他モードに変更して最終モード判定結果とし、連続4フレーム目以降は雑音モードとする。このような最終モード判定により、バーストフレーム消失時(3フレーム以上フレーム消失が続いた場合)にブザー音が発生することを防ぎ、あわせて時間と共に自然に復号信号が雑音化されるようにして、主観的な違和感を和らげることができる。連続何フレーム目の消失フレームかは、現フレームが正常フレームだったらカウンタを0クリアし、そうでない場合にカウンタを1ずつ増やすような連続消失フレーム数カウンタを備えれば、そのカウンタの値を参照することで判断できる。なお、AMR方式の場合は、ステートマシンを備えているのでステートマシンのステートを参照すれば良い。
このように、本実施の形態によれば、有声部の隠蔽処理時に雑音感の発生を防止し、直前サブフレームの利得が偶然小さい値になっているような場合でも、隠蔽処理時に音切れが生じることを防止することができる。
また、以上の構成において、モード判定部138は、デコーダ側でピッチ分析を行わずにモード判定を行うことができるので、デコーダでのピッチ分析を行わないコーデックへの適用時に演算量の増加を少なくすることができる。
また、以上の構成において、消失フレームの連続数によって付加する雑音の帯域を変化させるので、隠蔽処理によるブザー音の発生を抑える事ができる。
(実施の形態4)
図12は、本発明に係る音声復号化装置を無線通信システムに適用した場合の、無線送信装置300およびこれに対応する無線受信装置310の主要な構成を示すブロック図である。
無線送信装置300は、入力装置301、A/D変換装置302、音声符号化装置30
3、信号処理装置304、RF変調装置305、送信装置306、およびアンテナ307を有している。
A/D変換装置302の入力端子は、入力装置301の出力端子に接続されている。音声符号化装置303の入力端子は、A/D変換装置302の出力端子に接続されている。信号処理装置304の入力端子は、音声符号化装置303の出力端子に接続されている。RF変調装置305の入力端子は、信号処理装置304の出力端子に接続されている。送信装置306の入力端子は、RF変調装置305の出力端子に接続されている。アンテナ307は、送信装置306の出力端子に接続されている。
入力装置301は、音声信号を受けてこれを電気信号であるアナログ音声信号に変換し、A/D変換装置302に与える。A/D変換装置302は、入力装置301からのアナログの音声信号をディジタル音声信号に変換し、これを音声符号化装置303へ与える。音声符号化装置303は、A/D変換装置302からのディジタル音声信号を符号化して音声符号化ビット列を生成し信号処理装置304に与える。信号処理装置304は、音声符号化装置303からの音声符号化ビット列にチャネル符号化処理やパケット化処理及び送信バッファ処理等を行った後、その音声符号化ビット列をRF変調装置305に与える。RF変調装置305は、信号処理装置304からのチャネル符号化処理等が行われた音声符号化ビット列の信号を変調して送信装置306に与える。送信装置306は、RF変調装置305からの変調された音声符号化信号を、アンテナ307を介して電波(RF信号)として送出する。
無線送信装置300においては、A/D変換装置302を介して得られるディジタル音声信号に対して数十msのフレーム単位で処理が行われる。システムを構成するネットワークがパケット網である場合には、1フレーム又は数フレームの符号化データを1つのパケットに入れこのパケットをパケット網に送出する。なお、前記ネットワークが回線交換網の場合には、パケット化処理や送信バッファ処理は不要である。
無線受信装置310は、アンテナ311、受信装置312、RF復調装置313、信号処理装置314、音声復号化装置315、D/A変換装置316、および出力装置317を有している。なお、音声復号化装置315に、本実施の形態に係る音声復号化装置が使用されている。
受信装置312の入力端子は、アンテナ311に接続されている。RF復調装置313の入力端子は、受信装置312の出力端子に接続されている。信号処理装置314の入力端子は、RF復調装置313の出力端子に接続されている。音声復号化装置315の入力端子は、信号処理装置314の出力端子に接続されている。D/A変器案装置316の入力端子は、音声復号化装置315の出力端子に接続されている。出力装置317の入力端子は、D/A変換装置316の出力端子に接続されている。
受信装置312は、アンテナ311を介して音声符号化情報を含んでいる電波(RF信号)を受けてアナログの電気信号である受信音声符号化信号を生成し、これをRF復調装置313に与える。アンテナ311を介して受けた電波(RF信号)は、伝送路において信号の減衰や雑音の重畳がなければ、音声信号送信装置300において送出された電波(RF信号)と全く同じものになる。RF復調装置313は、受信装置312からの受信音声符号化信号を復調し信号処理装置314に与える。信号処理装置314は、RF復調装置313からの受信音声符号化信号のジッタ吸収バッファリング処理、パケット組みたて処理およびチャネル復号化処理等を行い、受信音声符号化ビット列を音声復号化装置315に与える。音声復号化装置315は、信号処理装置314からの受信音声符号化ビット列の復号化処理を行って復号音声信号を生成しD/A変換装置316へ与える。D/A変
換装置316は、音声復号化装置315からのディジタル復号音声信号をアナログ復号音声信号に変換して出力装置317に与える。出力装置317は、D/A変換装置316からのアナログ復号音声信号を空気の振動に変換し音波として人間の耳に聞こえる様に出力する。
このように、本実施の形態に係る音声復号化装置は、無線通信システムに適用することができる。なお、本実施の形態に係る音声復号化装置は、無線通信システムに限らず、例えば、有線通信システムにも適用できることは言うまでもない。
以上、本発明の各実施の形態について説明した。
本発明に係る音声復号化装置および補償フレーム生成方法は、上記の実施の形態1〜4に限定されず、種々変更して実施することが可能である。
また、本発明に係る、音声復号化装置、無線送信装置、無線受信装置、および補償フレーム生成方法は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、本発明に係る音声復号化装置は、有線通信システムにおいても利用可能であり、これにより、上記と同様の作用効果を有する有線通信システムを提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る補償フレーム生成方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る音声復号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年7月20日出願の特願2004−212180に基づく。この内容はすべてここに含めておく。
本発明に係る音声復号化装置および音声復号化方法は、移動体通信システム等の用途に適用できる。
実施の形態1に係る補償フレーム生成部の主要な構成を示すブロック図 実施の形態1に係る雑音性付加部内部の主要な構成を示すブロック図 実施の形態2に係る音声復号化装置の主要な構成を示すブロック図 適応符号帳および固定符号帳の双方を用いて補償フレームを生成する例 適応符号帳で生成される音源のうち、一部の周波数帯域のみを固定符号帳で生成される雑音的な信号で置換する例 実施の形態3に係る補償フレーム生成部の主要な構成を示すブロック図 実施の形態3に係る雑音性付加部内部の主要な構成を示すブロック図 実施の形態3に係るACB成分生成部内部の主要な構成を示すブロック図 実施の形態3に係るFCB成分生成部内部の主要な構成を示すブロック図 実施の形態3に係る消失フレーム隠蔽処理部の主要な構成を示すブロック図 実施の形態3に係るモード判定部内部の主要な構成を示すブロック図 実施の形態4に係る無線送信装置および無線受信装置の主要な構成を示すブロック図

Claims (5)

  1. 音源信号を生成する適応符号帳と、
    前記適応符号帳に格納された音源信号の末尾1ピッチ周期の平均振幅を算出する平均振幅算出手段と、
    前記算出された平均振幅を保持するメモリと、
    前記平均振幅算出手段において現算出対象期間について算出された平均振幅と、前記平均振幅算出手段において前記現算出対象期間以前の算出参照期間について算出され且つ前記メモリに保持された平均振幅との比を、エネルギ変化率として算出し、前記エネルギ変化率を時間的に平滑化するエネルギ変化率算出手段と、
    前記エネルギ変化率算出手段において得られた前記平滑化エネルギ変化率、又は、前記現算出対象期間以前に復号された適応符号帳利得を、処理用適応符号帳利得として決定する決定手段と、
    消失フレームについて前記決定手段によって決定された処理用適応符号帳利得を前記音源信号に乗じることにより、前記消失フレームに対する補償フレームを生成する生成手段と、
    前記生成された補償フレームの高周波数帯域を雑音化する雑音化手段と、
    を具備し、
    前記雑音化手段は、
    少なくとも前記消失フレームより前の復号ピッチ周期変動の大小に基づいて有声定常性の高低を判定し、有声定常性が低いと判定される場合には、前記高周波数帯域を雑音化対象帯域とする一方、有声定常性が高いと判定される場合には、前記高周波数帯域内の高周波数側領域に雑音化対象帯域を限定する、
    音声復号化装置。
  2. 前記雑音化手段は、
    消失フレームの連続数に従い、前記雑音化対象帯域をより低い周波数帯域まで広げる、
    請求項記載の音声復号化装置。
  3. 請求項1記載の音声復号化装置を具備する通信端末装置。
  4. 請求項1記載の音声復号化装置を具備する基地局装置。
  5. 適応符号帳に格納された音源信号の末尾1ピッチ周期の平均振幅を算出する平均振幅算出ステップと、
    前記算出された平均振幅を保持する保持ステップと、
    前記平均振幅算出ステップにおいて現算出対象期間について算出された平均振幅と、前記平均振幅算出ステップにおいて前記現算出対象期間以前の算出参照期間について算出され且つ前記保持された平均振幅との比を、エネルギ変化率として算出し、前記エネルギ変化率を時間的に平滑化するエネルギ変化率算出ステップと、
    前記エネルギ変化率算出ステップにおいて得られた前記平滑化エネルギ変化率、又は、前記現算出対象期間以前に復号された適応符号帳利得を、処理用適応符号帳利得として決定する決定ステップと、
    消失フレームについて前記決定ステップによって決定された処理用適応符号帳利得を前記音源信号に乗じることにより、前記消失フレームに対する補償フレームを生成する生成ステップと、
    前記生成された補償フレームの高周波数帯域を雑音化する雑音化ステップと、
    を具備し、
    前記雑音化ステップは、
    少なくとも前記消失フレームより前の復号ピッチ周期変動の大小に基づいて有声定常性の高低を判定し、有声定常性が低いと判定される場合には、前記高周波数帯域を雑音化対象帯域とする一方、有声定常性が高いと判定される場合には、前記高周波数帯域内の高周波数側領域に雑音化対象帯域を限定する、
    音声復号化方法
JP2006529149A 2004-07-20 2005-07-14 音声復号化装置および音声復号化方法 Expired - Fee Related JP4698593B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006529149A JP4698593B2 (ja) 2004-07-20 2005-07-14 音声復号化装置および音声復号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004212180 2004-07-20
JP2004212180 2004-07-20
PCT/JP2005/013051 WO2006009074A1 (ja) 2004-07-20 2005-07-14 音声復号化装置および補償フレーム生成方法
JP2006529149A JP4698593B2 (ja) 2004-07-20 2005-07-14 音声復号化装置および音声復号化方法

Publications (2)

Publication Number Publication Date
JPWO2006009074A1 JPWO2006009074A1 (ja) 2008-05-01
JP4698593B2 true JP4698593B2 (ja) 2011-06-08

Family

ID=35785187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006529149A Expired - Fee Related JP4698593B2 (ja) 2004-07-20 2005-07-14 音声復号化装置および音声復号化方法

Country Status (5)

Country Link
US (1) US8725501B2 (ja)
EP (1) EP1775717B1 (ja)
JP (1) JP4698593B2 (ja)
CN (1) CN1989548B (ja)
WO (1) WO2006009074A1 (ja)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
WO2006098274A1 (ja) * 2005-03-14 2006-09-21 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル復号化方法
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
FR2907586A1 (fr) * 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
MX2009004427A (es) * 2006-10-24 2009-06-30 Voiceage Corp Metodo y dispositivo para codificar cuadros de transicion en señales de habla.
JP4504389B2 (ja) 2007-02-22 2010-07-14 富士通株式会社 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
US8666528B2 (en) 2009-05-01 2014-03-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US8718804B2 (en) 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
CN101741402B (zh) * 2009-12-24 2014-10-22 北京韦加航通科技有限责任公司 一种无线通信***下适用于超大动态范围的无线接收机
IN2012DN05235A (ja) 2010-01-08 2015-10-23 Nippon Telegraph & Telephone
ES2600313T3 (es) 2010-10-07 2017-02-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
CN102480760B (zh) * 2010-11-23 2014-09-10 中兴通讯股份有限公司 ***间链路协议帧丢帧处理、补偿帧判别方法及装置
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
EP2724340B1 (en) * 2011-07-07 2019-05-15 Nuance Communications, Inc. Single channel suppression of impulsive interferences in noisy speech signals
CN102915737B (zh) * 2011-07-31 2018-01-19 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
EP2770503B1 (en) 2011-10-21 2019-05-29 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame errors and method and apparatus for audio decoding
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
EP3125239B1 (en) * 2013-02-05 2019-07-17 Telefonaktiebolaget LM Ericsson (publ) Method and appartus for controlling audio frame loss concealment
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
BR112015031606B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
CN105408956B (zh) * 2013-06-21 2020-03-27 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品
JP6482540B2 (ja) * 2013-06-21 2019-03-13 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 改善されたピッチラグ推定を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法
MX352092B (es) 2013-06-21 2017-11-08 Fraunhofer Ges Forschung Aparato y método para mejorar el ocultamiento del libro de códigos adaptativo en la ocultación similar a acelp empleando una resincronización de pulsos mejorada.
CN107818789B (zh) 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
ES2755166T3 (es) 2013-10-31 2020-04-21 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando una ocultación de error que modifica una señal de excitación de dominio de tiempo
CA2984562C (en) 2013-10-31 2020-01-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
CN107369455B (zh) 2014-03-21 2020-12-15 华为技术有限公司 语音频码流的解码方法及装置
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
JP6516099B2 (ja) * 2015-08-05 2019-05-22 パナソニックIpマネジメント株式会社 音声信号復号装置および音声信号復号方法
CN107846691B (zh) * 2016-09-18 2022-08-02 中兴通讯股份有限公司 一种mos测量方法、装置及分析仪
EP3617904A4 (en) * 2017-04-28 2020-04-29 Sony Corporation INFORMATION PROCESSING DEVICE AND METHOD
CN108922551B (zh) * 2017-05-16 2021-02-05 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法
BR112021008089A2 (pt) 2018-11-02 2021-08-03 Dolby International Ab codificador de áudio e decodificador de áudio
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130999A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd コード励振線形予測復号化装置
JPH09321783A (ja) * 1996-03-29 1997-12-12 Mitsubishi Electric Corp 音声符号化伝送システム
JP2001013998A (ja) * 1999-06-30 2001-01-19 Matsushita Electric Ind Co Ltd 音声復号化装置及び符号誤り補償方法
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
CA2005115C (en) * 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10232699A (ja) * 1997-02-21 1998-09-02 Japan Radio Co Ltd Lpcボコーダ
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
JP3510168B2 (ja) * 1999-12-09 2004-03-22 日本電信電話株式会社 音声符号化方法及び音声復号化方法
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7478042B2 (en) * 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
ATE439666T1 (de) * 2001-02-27 2009-08-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
US6732389B2 (en) * 2002-05-28 2004-05-11 Edwin Drexler Bed sheet with traction areas
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
US20080243496A1 (en) * 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8219392B2 (en) * 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8239191B2 (en) * 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP5596341B2 (ja) * 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130999A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd コード励振線形予測復号化装置
JPH09321783A (ja) * 1996-03-29 1997-12-12 Mitsubishi Electric Corp 音声符号化伝送システム
JP2001013998A (ja) * 1999-06-30 2001-01-19 Matsushita Electric Ind Co Ltd 音声復号化装置及び符号誤り補償方法
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置

Also Published As

Publication number Publication date
US20080071530A1 (en) 2008-03-20
JPWO2006009074A1 (ja) 2008-05-01
WO2006009074A1 (ja) 2006-01-26
CN1989548A (zh) 2007-06-27
US8725501B2 (en) 2014-05-13
EP1775717A1 (en) 2007-04-18
EP1775717A4 (en) 2009-06-17
EP1775717B1 (en) 2013-09-11
CN1989548B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
JP4698593B2 (ja) 音声復号化装置および音声復号化方法
EP3355305B1 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
JP4112027B2 (ja) 再生成位相情報を用いた音声合成
JP4550289B2 (ja) Celp符号変換
EP3285254B1 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
ES2625895T3 (es) Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal
US5873059A (en) Method and apparatus for decoding and changing the pitch of an encoded speech signal
ES2340975T3 (es) Metodo y aparato para obtener un factor de atenuacion.
JPH09127996A (ja) 音声復号化方法及び装置
WO2006098274A1 (ja) スケーラブル復号化装置およびスケーラブル復号化方法
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
US20140288925A1 (en) Bandwidth extension of audio signals
EP2951824B1 (en) Adaptive high-pass post-filter
JP4299676B2 (ja) 固定音源ベクトルの生成方法及び固定音源符号帳
JP2003249957A (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP2005091749A (ja) 音源信号符号化装置、及び音源信号符号化方法
JP2004302257A (ja) 長期ポストフィルタ
CN101533639A (zh) 语音信号处理方法及装置
RU2574849C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра
EP1164577A2 (en) Method and apparatus for reproducing speech signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110301

R150 Certificate of patent or registration of utility model

Ref document number: 4698593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees