JP3607774B2 - 音声符号化装置 - Google Patents

音声符号化装置 Download PDF

Info

Publication number
JP3607774B2
JP3607774B2 JP09117796A JP9117796A JP3607774B2 JP 3607774 B2 JP3607774 B2 JP 3607774B2 JP 09117796 A JP09117796 A JP 09117796A JP 9117796 A JP9117796 A JP 9117796A JP 3607774 B2 JP3607774 B2 JP 3607774B2
Authority
JP
Japan
Prior art keywords
speech
parameter
signal
spectrum
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP09117796A
Other languages
English (en)
Other versions
JPH09281999A (ja
Inventor
秀享 ▲高▼橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP09117796A priority Critical patent/JP3607774B2/ja
Priority to GB0023247A priority patent/GB2351211B/en
Priority to GB9707087A priority patent/GB2312360B/en
Priority to GB0023246A priority patent/GB2350763B/en
Priority to US08/845,543 priority patent/US6272459B1/en
Priority to DE19715126A priority patent/DE19715126C2/de
Publication of JPH09281999A publication Critical patent/JPH09281999A/ja
Application granted granted Critical
Publication of JP3607774B2 publication Critical patent/JP3607774B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声符号化装置、より詳しくは、音声信号をディジタル情報圧縮して記録または伝送する音声符号化装置に関する。
【0002】
【従来の技術】
音声信号を効率良く圧縮するために広く用いられている手段として、音声信号を、スペクトル包絡を表す線形予測パラメータと、線形予測残差信号に対応する音源パラメータとを用いて符号化する方式がある。このような線形予測の手段を用いた音声符号化方式は、少ない伝送容量で比較的高品質な合成音声を得られることから、最近のハードウェア技術の進歩と相まって様々な応用方式が盛んに研究され、開発されている。
【0003】
その中でも良い音質が得られる方式として、Kleijin等による ”Improved speech quality and efficient vector quantization in SELP”(ICASP’88 s4.4,pp.155−158,1988)と題した論文に記載されている、過去の音源信号を繰り返して得られる適応コードブックを用いるCELP(Code Excited Linear Predictive Coding)方式がよく知られている。
【0004】
上述したような線形予測分析を基礎とした音声符号化装置は、比較的低いビットレートで高品質な符号化性能を得ることができるという利点を有している。このような線形予測分析を基礎とした音声符号化装置は、人間が発する概周期的な有声音を前提として構成されており、1フレームの分析長は20ms前後が適当であるとされている。
【0005】
しかしながら、上述したような従来の音声符号化装置は、音声信号区間以外の非音声信号区間については良好に符号化することができず、特に背景雑音等が混入すると急激に音質が劣化してしまうという問題点があった。
【0006】
上述したような音声符号化装置の適用分野としては、移動体電話や音声録音装置などが考えられており、これらは背景雑音が混入する場合を含む様々な環境下で使用されるものと想定されるために、上記音質劣化の問題点は、魅力的な製品を実現する上でどうしても解決しなければならない必須の課題である。
【0007】
このような問題点に鑑みて本出願人は、特願平7−268756号において、予め定められたフレーム間隔に分割された入力信号が音声信号か非音声信号かを判別する音声判別手段と、上記入力信号のスペクトルパラメータを出力する線形予測分析手段と、上記音声判別手段による判別結果が非音声信号であることが所定フレーム数にわたって連続した場合に上記入力信号のスペクトルパラメータとして上記線形予測分析手段に所定の先行フレームにおけるスペクトルパラメータを継続して出力させる制御手段と、線形予測残差信号に相当する駆動音源信号を生成する駆動音源信号生成手段と、上記スペクトルパラメータに基づいて上記駆動音源信号から音声を合成する合成フィルタとを備えた音声符号化装置を提案しており、これにより、非音声信号が入力しても良好に符号化することができる音質の良い音声符号化装置としている。
【0008】
【発明が解決しようとする課題】
しかしながら、上記特願平7−268756号に記載のものでは、非音声区間におけるスペクトルパラメータの切り替え時における音質劣化を抑制することはできるが、長時間にわたって非音声区間が続いたときは、その非音声区間に対する音質の向上には寄与するものではなく、音質劣化は大きいままである。
【0009】
本発明は上記事情に鑑みてなされたものであり、良好に音声信号を符号化することができる高品質な音声符号化装置を提供することを目的としている。
【0010】
【課題を解決するための手段】
上記の目的を達成するために、本発明の第1の音声符号化装置は、所定のフレーム間隔に分割された入力信号が音声信号または非音声信号の何れであるかを判別する音声判別手段と、上記入力信号のスペクトルパラメータを出力する線形予測分析手段と、上記音声判別手段による判別結果が非音声信号であることが所定フレーム数にわたって連続した場合に入力信号のスペクトルパラメータとして先行フレームにおけるスペクトルパラメータを継続して使用させるように制御する制御手段と、非音声信号であると判別されたフレームが上記所定フレーム数を越えて連続した場合には予め用意した非音声用スペクトルパラメータと現在のフレームのスペクトルパラメータとの平滑化を行いその平滑化されたスペクトルパラメータを出力する非音声フレーム用スペクトル平滑化手段と、線形予測残差信号に相当する駆動音源信号を生成する駆動音源信号生成手段と、上記スペクトルパラメータに基づいて上記駆動音源信号から音声を合成する合成フィルタとを備えたものである。
【0011】
また、本発明の第2の音声符号化装置は、上記第1の音声符号化装置において、上記非音声用スペクトルパラメータの初期値として所定の背景ノイズに基づくスペクトルパラメータの値を用いるものである。
【0012】
さらに、本発明の第3の音声符号化装置は、上記第1または第2の音声符号化装置において、上記非音声用スペクトルパラメータの重み付けを現在のフレームのスペクトルパラメータに対する重み付けよりも大きくして平滑化するものである。
【0013】
そして、本発明の第4の音声符号化装置は、上記第1,第2または第3の音声符号化装置において、上記非音声フレーム用スペクトル平滑化手段から出力されたスペクトルパラメータを、次のフレームの平滑化に用いるために非音声スペクトルパラメータとして記憶するパラメータ記憶手段を備えたものである。
【0014】
従って、本発明の第1の音声符号化装置は、音声判別手段が所定のフレーム間隔に分割された入力信号が音声信号または非音声信号の何れであるかを判別し、線形予測分析手段が上記入力信号のスペクトルパラメータを出力し、上記音声判別手段による判別結果が非音声信号であることが所定フレーム数にわたって連続した場合に制御手段が入力信号のスペクトルパラメータとして先行フレームにおけるスペクトルパラメータを継続して使用させるように制御し、非音声信号であると判別されたフレームが上記所定フレーム数を越えて連続した場合には非音声フレーム用スペクトル平滑化手段が予め用意した非音声用スペクトルパラメータと現在のフレームのスペクトルパラメータとの平滑化を行いその平滑化されたスペクトルパラメータを出力し、駆動音源信号生成手段が線形予測残差信号に相当する駆動音源信号を生成し、合成フィルタが上記スペクトルパラメータに基づいて上記駆動音源信号から音声を合成する。
【0015】
また、本発明の第2の音声符号化装置は、上記非音声用スペクトルパラメータの初期値として所定の背景ノイズに基づくスペクトルパラメータの値を用いる。
【0016】
さらに、本発明の第3の音声符号化装置は、上記非音声用スペクトルパラメータの重み付けを現在のフレームのスペクトルパラメータに対する重み付けよりも大きくして平滑化する。
【0017】
そして、本発明の第4の音声符号化装置は、パラメータ記憶手段が上記非音声フレーム用スペクトル平滑化手段から出力されたスペクトルパラメータを、次のフレームの平滑化に用いるために非音声スペクトルパラメータとして記憶する。
【0018】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1から図4は本発明の一実施形態を示したものであり、図1は音声符号化装置の構成を示すブロック図である。
【0019】
この音声符号化装置は、コード駆動線形予測符号化によるものであり、図1に示すように、入力端子に接続されたバッファメモリ1の出力端は3つに分岐されていて、第1の出力端はサブフレーム分割器7を介して減算器8に接続され、第2の出力端は線形予測分析手段たるLPC分析器5の入力端に接続され、第3の出力端は音声判別手段たる音声判別器2を介して後述する切替スイッチ4A,4Bの制御を行う制御手段たるスイッチ制御回路3に接続されている。
【0020】
上記LPC分析器5は、切替スイッチ4Aの入力端子bに接続されているとともに、パラメータメモリ5aにその出力を記憶させるようになっていて、このパラメータメモリ5aは切替スイッチ4Aの入力端子aに接続されている。
【0021】
上記切換スイッチ4Aの出力端子は引き続いて配設されている切換スイッチ4Bの入力端子に接続されていて、この切換スイッチ4Bの出力端子aは合成フィルタ6に、出力端子bは非音声フレーム用スペクトル平滑化手段たるパラメータ平滑化器19に接続されている。
【0022】
上記パラメータ平滑化器19にはその出力を記憶させて必要に応じて読み出すためのパラメータ記憶手段たるパラメータメモリ19aが接続されていて、該パラメータ平滑化器19の出力端は上記合成フィルタ6に接続されている。
【0023】
この合成フィルタ6には、適応コードブック12と確率コードブック14を用いて生成される信号が入力されるようになっている。
【0024】
すなわち、上記適応コードブック12は、乗算器13を介して加算器17の第1入力端子に接続されており、また、確率コードブック14は、乗算器15とスイッチ16とを介して上記加算器17の第2入力端子に接続されている。
【0025】
この加算器17の出力端子は、合成フィルタ6を介して上記減算器8の入力端子に接続されている一方で、遅延回路11を介して上記適応コードブック12に接続されている。
【0026】
上記合成フィルタ6の出力端は、サブフレーム分割器7が接続された減算器8および聴感重み付けフィルタ9を介して誤差評価器10の入力端子に接続されている。この誤差評価器10による評価結果は、上述した適応コードブック12と、確率コードブック14と、さらに乗算器13,15とにフィードバックされて、最適なコードの選択やゲインの調整に用いられるようになっているとともに、上記誤差評価器10は、マルチプレクサ18にも接続されている。
【0027】
上述のような音声符号化装置において、線形予測残差信号に相当する駆動音源信号を生成する駆動音源信号生成手段は、上記遅延回路11、適応コードブック12、確率コードブック14、乗算器13,15、スイッチ16、加算器17等を含んで構成されている。
【0028】
次に、図2は上記音声判別器2のより詳細な構成を示すブロック図である。
【0029】
この音声判別器2に入力された上記バッファメモリ1の出力信号は、2つに分岐されて一方がフレームエネルギー分析回路2aに、他方が初期フレームエネルギー分析回路2bに入力されるようになっている。
【0030】
上記フレームエネルギー分析回路2aは加算器2cの+端子となっている第1入力端子に、上記初期フレームエネルギー分析回路2bは該加算器2cの−端子となっている第2入力端子にそれぞれ接続されているとともに、さらに、初期フレームエネルギー分析回路2bは、閾値決定回路2dにも接続されている。
【0031】
そして、上記加算器2cの出力端子と上記閾値決定回路2dの出力端子は、共に判別回路2eに接続されていて、この判別回路2eの出力が上記スイッチ制御回路3に出力されるようになっている。
【0032】
次に、上記図1および図2に示したような構成における信号の流れを説明する。
【0033】
入力端子から例えば8kHz(すなわち、1サンプル当たり1/8ms)でサンプリングされた原音声信号を入力して、予め定められたフレーム間隔(例えば20ms、すなわち160サンプル)の音声信号をバッファメモリ1に格納する。
【0034】
バッファメモリ1は、入力信号をフレーム単位でサブフレーム分割器7とLPC分析器5と音声判別器2とに送出する。
【0035】
この音声判別器2は、フレームの入力信号が音声か非音声かを、例えば以下に説明するような方法で判別する。
【0036】
上記図2に示したような構成の音声判別器2において、フレームエネルギー分析回路2aは、入力されたフレーム入力信号のフレームエネルギーEf を次に示すような数式により算出する。
【0037】
【数1】
Figure 0003607774
ここに、s(n)はサンプルnにおける入力信号、Nはフレーム長をそれぞれ示している。
【0038】
また、上記初期フレームエネルギー分析回路2bは、符号化を開始したときのフレームエネルギーEb を上記数式1と同様の数式を用いて算出する。
【0039】
上記閾値決定回路2dは、背景雑音エネルギーの大きさに応じて閾値を決定する。例えば、図3に示すように、背景雑音エネルギーがdB単位で増加するに従って、閾値をdB単位で減少させる関係により、閾値を決定する。そして、その結果を判別回路2eに送出する。
【0040】
加算器2cでは、フレームエネルギーEf を正として入力するとともに、初期フレームエネルギーEb を負として入力してこれらを加算することにより、フレームエネルギーEf から初期フレームエネルギーEb を減算し、その減算結果を判別回路2eに送出する。
【0041】
そして、判別回路2eは、入力された減算結果と閾値を比較して、減算結果が閾値より大きければフレーム入力信号は音声区間であると判別し、そうでなければ非音声区間であると判別する。
【0042】
図1に戻って、サブフレーム分割器7は、フレームの入力信号を予め定められたサブフレーム間隔(例えば5ms、つまり40サンプル)に分割する。すなわち、1フレームの入力信号から、第1サブフレームから第4サブフレームまでの4つのサブフレーム信号が作成される。
【0043】
LPC分析器5は、入力信号に対して線形予測分析(LPC分析)を行って、スペクトル特性を表すスペクトルパラメータたる線形予測パラメータαを抽出し、パラメータメモリ5aに送出するとともに、切替スイッチ4A,4Bを介して合成フィルタ6あるいはパラメータ平滑化器19に送出する。
【0044】
次に、スイッチ制御回路3の動作について、図4のフローチャートを参照して説明する。
【0045】
まず、符号化を開始すると(ステップS1)、非音声フレーム連続数を示すiを0にセットする(ステップS2)。
【0046】
次に、音声判別器2における判別結果が音声(v)であるか非音声(uv)であるかを判定して(ステップS3)、もし判別結果が非音声である場合には、iを1だけ増加させる(ステップS4)。そして、このiが所定数R(例えば5)よりも大きいか否かを判定し(ステップS5)、大きい場合には切替スイッチ4Aの端子および切替スイッチ4Bの端子を両方ともa側に閉じ(ステップS6)、パラメータメモリ5aから出力される先行フレームのスペクトルパラメータを継続して使用する(ステップS7)。
【0047】
続いて、iがR+1よりも大きいか否かを判定し(ステップS8)、大きい場合には切替スイッチ4Aの端子および切替スイッチ4Bの端子を両方ともb側に閉じて(ステップS9)、LPC分析器5によりLPC分析を行い(ステップS10)、その結果がパラメータ平滑化器19に入力されるようにする。
【0048】
そして、このパラメータ平滑化器19において、パラメータの平滑化を以下に説明するように行う(ステップS11)。
【0049】
背景ノイズ用初期kパラメータNoise_αを予め用意してパラメータメモリ19aに記憶しておき、平滑化を数式2に示すような重み付けにより行う。
【0050】
【数2】
Figure 0003607774
なお、この背景ノイズ用初期kパラメータNoise_αは、例えばオフィス環境における背景ノイズを入力したときの、あるスペクトルパラメータを代表させた値である。
【0051】
このように背景ノイズ用初期kパラメータNoise_αの重み付けを現在のフレームのスペクトルパラメータα[i]の重み付けよりも重くすることによって、パラメータα[i]の値が揺らいでも、その揺らぎの影響を小さく抑制するようになっている。
【0052】
続いて、直後に背景ノイズ用初期kパラメータNoise_α[i]を数式3に示すように更新する(ステップS12)。
【0053】
【数3】
Figure 0003607774
その後、次のフレームの処理を待つ(ステップS13)。
【0054】
また、上記ステップS8においてiがR+1以下である場合にも、上記ステップS13に進む。
【0055】
このようにして、非音声部での音源信号は、LPC分析の結果を反映しつつも、揺らぎを抑えることができる。
【0056】
一方、上記ステップS3における判別結果が音声である場合には、非音声フレーム連続数を示すiを0にリセットした後に(ステップS14)、切替スイッチ4Aの端子をb側に閉じるとともに切替スイッチ4Bの端子をa側に閉じて(ステップS15)、LPC分析を行ってスペクトルパラメータを更新する(ステップS16)。その後、上記ステップS13に進み、次のフレームの処理を待つ。
【0057】
また、上記ステップS5においてiが所定数R以下である場合にも、上記ステップS14に進む。
【0058】
図1の説明に再び戻って、適応コードブックの遅れL、ゲインβ、確率コードブックのインデックスi、ゲインγは、次に説明するような手段により決定される。
【0059】
まず、適応コードブックの遅延Lとゲインβは、以下の処理によって決定される。
【0060】
遅延回路11において、先行サブフレームにおける合成フィルタ6の入力信号すなわち駆動音源信号に、ピッチ周期に相当する遅延を与えて適応コードベクトルとして作成する。
【0061】
例えば、想定するピッチ周期を40〜167サンプルとすると、40〜167サンプル遅れの128種類の信号が適応コードベクトルとして作成され、適応コードブック12に格納される。
【0062】
このときスイッチ16は開いた状態となっていて、各適応コードベクトルは乗算器13でゲイン値を可変して乗じた後に、加算器17を通過してそのまま合成フィルタ6に入力される。
【0063】
この合成フィルタ6は、線形予測パラメータα’を用いて合成処理を行い、合成ベクトルを減算器8に送出する。この減算器8は、原音声ベクトルと合成ベクトルとの減算を行うことにより誤差ベクトルを生成し、得られた誤差ベクトルを聴感重み付けフィルタ9に送出する。
【0064】
この聴感重み付けフィルタ9は、誤差ベクトルに対して聴感特性を考慮した重み付け処理を行い、誤差評価器10に送出する。
【0065】
誤差評価器10は、誤差ベクトルの2乗平均を計算し、その2乗平均値が最小となる適応コードベクトルを検索して、その遅れLとゲインβをマルチプレクサ18に送出する。このようにして、適応コードブック12の遅延Lとゲインβが決定される。
【0066】
続いて、確率コードブックのインデックスiとゲインγは、以下の処理によって決定される。
【0067】
確率コードブック14は、サブフレーム長に対応する次元数(すなわち、上述の例では40次元)の確率コードベクトルが、例えば512種類予め格納されており、各々にインデックスが付与されている。なお、このときにはスイッチ16は閉じた状態となっている。
【0068】
まず、上記処理によって決定された最適な適応コードベクトルを、乗算器13で最適ゲインβを乗じた後に、加算器17に送出する。
【0069】
次に、各確率コードベクトルを乗算器15でゲイン値を可変して乗じた後に、加算器17に入力する。加算器17は上記最適ゲインβを乗じた最適な適応コードベクトルと各確率コードベクトルの加算を行い、その結果が合成フィルタ6に入力される。
【0070】
この後の処理は、上記適応コードブックパラメータの決定処理と同様に行われる。すなわち、合成フィルタ6は線形予測パラメータα’を用いて合成処理を行い、合成ベクトルを減算器8に送出する。
【0071】
減算器8は原音声ベクトルと合成ベクトルとの減算を行うことにより誤差ベクトルを生成し、得られた誤差ベクトルを聴感重み付けフィルタ9に送出する。
【0072】
聴感重み付けフィルタ9は、誤差ベクトルに対して聴感特性を考慮した重み付け処理を行い、誤差評価器10に送出する。
【0073】
誤差評価器10は、誤差ベクトルの2乗平均を計算して、その2乗平均値が最小となる確率コードベクトルを検索して、そのインデックスiとゲインγをマルチプレクサ18に送出する。このようにして、確率コードブック14のインデックスiとゲインγが決定される。
【0074】
上記マルチプレクサ18は、量子化された線形予測パラメータα’、適応コードブックの遅れL、ゲインβ、確率コードブックのインデックスi、ゲインγの各々をマルチプレクスして伝送するものである。
【0075】
なお、上述したような音声符号化装置に対応する音声復号化装置の復号化動作は、上記特願平7−268756号に記載した従来例におけるものと同様である。
【0076】
また、音声判別器における音声判別方法は、上述した手段に限るものではないことはいうまでもない。
【0077】
さらに、上記実施形態においては、コード駆動線形予測符号化による音声符号化装置を一例として取り上げて説明したが、線形予測パラメータと、線形予測残差信号に相当する駆動音源信号のパラメータとで表現する音声符号化装置であれば、当然にして、何れのものにも適用することが可能である。
【0078】
そして、符号化パラメータに音声/非音声の情報も伝送するようにして、復号化装置に符号化装置と同様のスイッチ制御回路および切替スイッチを設け、音声/非音声の情報に基づいて切替スイッチの制御を行うことにより可変ビットレート符号化装置/復号化装置を構成し、より高い圧縮効率で符号化することも可能である。
【0079】
このような実施形態の音声符号化装置によれば、非音声フレームが所定数以上連続する場合におけるフレーム毎のパラメータの揺らぎを抑制することができるために、非音声区間における音質が安定して、良好に音声信号を符号化することができる高品質な音声符号化装置となる。
【0080】
【発明の効果】
以上説明したように請求項1に記載の発明によれば、符号化された非音声信号のフレーム毎の揺らぎが小さくなり、良好に音声信号を符号化することができる高品質な音声符号化装置を得ることができる。
【0081】
また、請求項2に記載の発明によれば、請求項1に記載の発明と同様の効果を奏するとともに、所定の背景ノイズに基づくスペクトルパラメータの値を非音声用スペクトルパラメータの初期値として用いるために、符号化された非音声信号に違和感が生じることはない。
【0082】
さらに、請求項3に記載の発明によれば、請求項1または請求項2に記載の発明と同様の効果を奏するとともに、符号化された非音声信号のフレーム毎の揺らぎを一層抑制することができて、より円滑に平滑化することができる。
【0083】
そして、請求項4に記載の発明によれば、請求項1、請求項2または請求項3に記載の発明と同様の効果を奏するとともに、非音声スペクトルパラメータを記憶するパラメータ記憶手段を備えたために、次の平滑化の処理が容易になる。
【図面の簡単な説明】
【図1】本発明の一実施形態の音声符号化装置の構成を示すブロック図。
【図2】上記実施形態の音声判別器のより詳細な構成を示すブロック図。
【図3】上記実施形態において、音声判別器の閾値決定回路により決定される閾値と背景雑音エネルギーとの関係の一例を示す線図。
【図4】上記実施形態の音声符号化装置の動作を示すフローチャート。
【符号の説明】
2…音声判別器(音声判別手段)
3…スイッチ制御回路(制御手段)
5…LPC分析器(線形予測分析手段)
6…合成フィルタ
11…遅延回路(駆動音源信号生成手段の一部)
12…適応コードブック(駆動音源信号生成手段の一部)
14…確率コードブック(駆動音源信号生成手段の一部)
19…パラメータ平滑化器(非音声フレーム用スペクトル平滑化手段)
19a…パラメータメモリ(パラメータ記憶手段)

Claims (4)

  1. 所定のフレーム間隔に分割された入力信号が、音声信号または非音声信号の何れであるかを判別する音声判別手段と、
    上記入力信号のスペクトルパラメータを出力する線形予測分析手段と、
    上記音声判別手段による判別結果が非音声信号であることが所定フレーム数にわたって連続した場合に、入力信号のスペクトルパラメータとして先行フレームにおけるスペクトルパラメータを継続して使用させるように制御する制御手段と、
    非音声信号であると判別されたフレームが上記所定フレーム数を越えて連続した場合には、予め用意した非音声用スペクトルパラメータと現在のフレームのスペクトルパラメータとの平滑化を行い、その平滑化されたスペクトルパラメータを出力する非音声フレーム用スペクトル平滑化手段と、
    線形予測残差信号に相当する駆動音源信号を生成する駆動音源信号生成手段と、
    上記スペクトルパラメータに基づいて上記駆動音源信号から音声を合成する合成フィルタと、
    を具備したことを特徴とする音声符号化装置。
  2. 上記非音声用スペクトルパラメータの初期値として、所定の背景ノイズに基づくスペクトルパラメータの値を用いることを特徴とする請求項1に記載の音声符号化装置。
  3. 上記非音声用スペクトルパラメータの重み付けを現在のフレームのスペクトルパラメータに対する重み付けよりも大きくして平滑化することを特徴とする請求項1または請求項2に記載の音声符号化装置。
  4. 上記非音声フレーム用スペクトル平滑化手段から出力されたスペクトルパラメータを、次のフレームの平滑化に用いるために非音声スペクトルパラメータとして記憶するパラメータ記憶手段を具備したことを特徴とする請求項1、請求項2または請求項3に記載の音声符号化装置。
JP09117796A 1996-04-12 1996-04-12 音声符号化装置 Expired - Lifetime JP3607774B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP09117796A JP3607774B2 (ja) 1996-04-12 1996-04-12 音声符号化装置
GB0023247A GB2351211B (en) 1996-04-12 1997-04-08 Voice signal coding apparatus
GB9707087A GB2312360B (en) 1996-04-12 1997-04-08 Voice signal coding apparatus
GB0023246A GB2350763B (en) 1996-04-12 1997-04-08 Voice signal coding apparatus
US08/845,543 US6272459B1 (en) 1996-04-12 1997-04-11 Voice signal coding apparatus
DE19715126A DE19715126C2 (de) 1996-04-12 1997-04-11 Sprachsignal-Codiervorrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09117796A JP3607774B2 (ja) 1996-04-12 1996-04-12 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH09281999A JPH09281999A (ja) 1997-10-31
JP3607774B2 true JP3607774B2 (ja) 2005-01-05

Family

ID=14019189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09117796A Expired - Lifetime JP3607774B2 (ja) 1996-04-12 1996-04-12 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3607774B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220172703A1 (en) * 2019-08-20 2022-06-02 Ai, Inc. Acoustic model learning apparatus, method and program and speech synthesis apparatus, method and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2548010T3 (es) * 2007-03-05 2015-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Procedimiento y dispositivo para suavizar ruido de fondo estacionario

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220172703A1 (en) * 2019-08-20 2022-06-02 Ai, Inc. Acoustic model learning apparatus, method and program and speech synthesis apparatus, method and program

Also Published As

Publication number Publication date
JPH09281999A (ja) 1997-10-31

Similar Documents

Publication Publication Date Title
KR100417634B1 (ko) 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법
US5873059A (en) Method and apparatus for decoding and changing the pitch of an encoded speech signal
US6272459B1 (en) Voice signal coding apparatus
EP1688920B1 (en) Speech signal decoding
US6424942B1 (en) Methods and arrangements in a telecommunications system
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
EP1073039A2 (en) Speech decoder with gain processing
JP3266178B2 (ja) 音声符号化装置
JPH08305398A (ja) 音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP3270922B2 (ja) 符号化,復号化方法及び符号化,復号化装置
JPH09185397A (ja) 音声情報記録装置
JP3607774B2 (ja) 音声符号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3303580B2 (ja) 音声符号化装置
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JPH10149200A (ja) 線形予測符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH09281997A (ja) 音声符号化装置
JPH09114498A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041008

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 9

EXPY Cancellation because of completion of term