JPH04271399A - 音声ピッチ予測装置 - Google Patents

音声ピッチ予測装置

Info

Publication number
JPH04271399A
JPH04271399A JP3282691A JP3282691A JPH04271399A JP H04271399 A JPH04271399 A JP H04271399A JP 3282691 A JP3282691 A JP 3282691A JP 3282691 A JP3282691 A JP 3282691A JP H04271399 A JPH04271399 A JP H04271399A
Authority
JP
Japan
Prior art keywords
pitch
prediction
length
predictor
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3282691A
Other languages
English (en)
Other versions
JP2870608B2 (ja
Inventor
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3282691A priority Critical patent/JP2870608B2/ja
Publication of JPH04271399A publication Critical patent/JPH04271399A/ja
Application granted granted Critical
Publication of JP2870608B2 publication Critical patent/JP2870608B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号または音声信
号を線形予測した残差信号に対してピッチ予測を行う音
声ピッチ予測装置に関する。
【0002】
【従来の技術】一般に音声信号は、近接サンプルの相関
が高く、近接サンプルの信号系列による線形予測に基づ
いて音声信号を効率よく情報圧縮することができる。ま
た、音声信号にはピッチによる繰り返し的な冗長性もあ
り、ピッチ予測により情報圧縮の効率をさらに高めるこ
ともできる。
【0003】これら2つの線形予測を用いた低ビットレ
イトの音声符号化方法として、コ−ド・エキサイテッド
・リニア・プレディクション(Code−Excite
d Linear Prediction(CELP)
)が盛んに研究開発されている(参考文献:”Stoc
hastic Coding of Speech S
ignals at Very Low Bit Ra
tes : The Importance of S
peech Perception”, M.R.Sc
hroeder and B.S. Atal, Sp
eech Communication 4, 198
5, page 155−162, North−Ho
land)。
【0004】CELPでは、予測残差信号を40サンプ
ルの長さのベクトルとして扱い、ベクトル量子化の技術
を用いて予測残差信号を非常に低ビットレイトで圧縮符
号化している。
【0005】図4にCELPに基づく従来の符号化器の
一構成例を示す。
【0006】図4に示すコードブック401には、一定
のサンプル長(例えば40サンプル)の、残差信号波形
(コードワードと称する)を複数種類(例えば1024
種類)記憶させ、最小エラー選択器408の指示により
、全てのコードワードを順番に出力させる。
【0007】このコードワードは掛算器402で増幅し
た後、ピッチ予測器403でピッチ構造を持たせ、次に
スペクトル予測器404でスペクトル的な構造を持たせ
て合成出力波形を得る。
【0008】入力端子405から入力された音声信号波
形は、上記一定のサンプル長のベクトルとして加算器4
06に入力され、加算器406はこの音声信号波形と予
測器404からの合成信号波形との差、即ちエラー波形
を出力する。
【0009】このエラー波形は、聴覚的重み付けフィル
タ407でスペクトル的に整形され、最小エラー選択器
408に入力される。
【0010】最小エラー選択器408は、この整形後の
エラー波形のエネルギーを最小にするようなコードワー
ドをコードブック401から選択する。
【0011】ここで、符号化されたパラメータは、コー
ドワードのエネルギーgain、スペクトルパラメータ
α、ピッチパラメータtau,a、及び残差コードワー
ドの指標値indexである。
【0012】伝送情報量の具体例として、スペクトルパ
ラメータαは20msecごとに40bits(2Kb
ps)、その他のパラメータは5msecごとに、ピッ
チパラメータとしてピッチ長tauに7bitsと予測
係数aに3bits(2Kbps)、コードワードの指
標値indexに10bits(2Kbps)、コード
ワードのエネルギーgainに5bits(1Kbps
)とすると、全体の伝送情報量は7Kbpsとなる。
【0013】ピッチ予測器403としては、最も一般的
に使用されている1タップのものを想定し、ピッチ長(
例えば40〜167サンプル)は7bitsで符号化し
、予測係数は非線形量子化により3bitsに量子化し
て伝送する。
【0014】
【発明が解決しようとする課題】しかしながら、上述の
CELP符号化器では、伝送情報量のうちピッチパラメ
ータ(ピッチ長と予測係数)の情報量が全体の3割程度
を占めている。従って、全体の伝送情報量を例えば4K
bps程度に低減するためには、ピッチパラメータの情
報量をさらに圧縮する必要がある。
【0015】そのために従来のCELP符号化器は、例
えば分析区間の長さを5msecから10msecに長
くしてピッチパラメータの伝送レイトを低減させて情報
量を圧縮していた。しかし、音声のピッチ構造の時間的
変化が速いので、比較的長い分析期間(10msec)
に亘ってピッチ長や予測係数が定常であると仮定して処
理することは無理であり、従来のCELP符号化器では
、圧縮音声の品質が劣化するという問題点があった。
【0016】本発明は、上述した従来のCELP符号化
器における問題点に鑑み、分析区間の長さを長くするこ
となくピッチパラメータであるピッチ長と予測係数の伝
送情報量を低減することが可能な音声ピッチ予測装置を
提供する。
【0017】
【課題を解決するための手段】本発明の音声ピッチ予測
装置は、過去の分析区間の被分析信号に対してピッチ予
測を行って被分析信号の第1ピッチ長及び共分散を出力
する第1ピッチ予測手段と、ピッチ予測手段から出力さ
れた共分散を特定の範囲の共分散と比較して比較結果を
出力するピッチ強度判定手段と、ピッチ強度判定手段か
ら出力された比較結果に基づいて現在の分析区間の被分
析信号に対して特定の範囲でピッチ予測を行って被分析
信号の第2ピッチ長及び予測係数を出力する第2ピッチ
予測手段と、第2ピッチ予測手段から出力された第2ピ
ッチ長及び予測係数を符号化する符号化手段とを備えて
おり、符号化手段は、ピッチ強度判定手段から出力され
た比較結果に基づいて第2ピッチ長のビット数を変化さ
せて差分形式により符号化するように構成されている。
【0018】本発明の音声ピッチ予測装置に係る第2ピ
ッチ予測手段は、第1ピッチ長に基づいて平均ピッチ長
を推定して出力するように構成されており、符号化手段
は、比較結果に基づいて第2ピッチ長を推定された平均
ピッチ長からの差分形式で符号化するように構成されて
もよい。
【0019】本発明の音声ピッチ予測装置に係る第2ピ
ッチ予測手段は、比較結果に基づいて選択可能な複数の
ピッチ予測部により構成されており、複数のピッチ予測
部を選択することにより第2ピッチ長のビット配分を変
化させるように構成されてもよい。
【0020】
【作用】本発明の音声ピッチ予測装置によれば、第1ピ
ッチ予測手段は、過去の分析区間の被分析信号に対して
ピッチ予測を行って被分析信号の第1ピッチ長及び共分
散を出力し、ピッチ強度判定手段は、第1ピッチ予測手
段から出力された共分散を特定の範囲の共分散と比較し
て比較結果を出力し、第2ピッチ予測手段は、ピッチ強
度判定手段から出力された比較結果に基づいて現在の分
析区間の被分析信号に対して特定の範囲でピッチ予測を
行って被分析信号の第2ピッチ長及び予測係数を出力し
、符号化手段は、第2ピッチ予測手段により探索された
第2ピッチ長をピッチ強度判定手段から出力された比較
結果に基づいて第2ピッチ長のビット数を変化させて差
分形式で符号化すると共に、第2ピッチ長に対応する予
測係数を所定のビット数で符号化する。
【0021】
【実施例】以下、図面を参照して本発明の音声ピッチ予
測装置における実施例について説明する。
【0022】図1は、本発明の音声ピッチ予測装置にお
ける第1実施例の構成を示すブロック図である。
【0023】図1に示すように、本実施例の音声ピッチ
予測装置は、入力端子101に接続された第1メモリ1
02、第1メモリ102に接続された第1ピッチ予測手
段としてのピッチ予測器103、ピッチ予測器103に
接続されたピッチ強度判定手段としてのピッチ強度判定
器104、ピッチ予測器103に接続されたスイッチ1
05、入力端子106及び第1メモリ102に接続され
た第2メモリ107、第2メモリ107に接続された第
2ピッチ予測手段としてのピッチ予測器108、ピッチ
強度判定器104及びピッチ予測器108及び出力端子
110に接続された符号化手段としての適応ビット配分
符号化器109により構成されている。
【0024】次に、本実施例の音声ピッチ予測器の動作
を説明する。
【0025】まず、過去の分析区間(以下、分析フレー
ムと称する)の被分析信号としての音声信号または音声
信号を線形予測器により予測した残差信号(以下、音声
信号と称する)が、入力端子101に入力されると、第
1メモリ102は過去の分析フレームの音声信号を入力
して記憶する。
【0026】ピッチ予測器103は、第1メモリ102
が保持する過去の分析フレームの音声信号に対してピッ
チ予測を行って過去の分析フレームに対する音声信号の
第1ピッチ長及びピッチ構造の強弱(以下、共分散と称
する)を出力する。
【0027】ピッチ強度判定器104は、ピッチ予測器
103から出力される共分散が所定の値より高い(大き
い)ときに所定の判定信号を出力する。
【0028】第2メモリ107は、入力端子106を通
じて現在の分析フレームの音声信号を入力して記憶する
【0029】ピッチ予測器108は、第2メモリ107
が記憶している現在の分析フレームの音声信号に対して
ピッチ予測を行い、現在の分析フレームの音声信号に対
する第2ピッチ長及び予測係数を出力する。その際に、
ピッチ強度判定器104が所定の判定信号を出力したと
きには、ピッチ予測器103が出力する第1ピッチ長に
基づいて第2ピッチ長の探索範囲を所定の範囲に制限す
る。
【0030】適応ビット配分符号化器109は、ピッチ
予測器108が出力する第2ピッチ長及び予測係数を所
定のビット数で符号化し、出力端子110に出力する。 また、適応ビット配分符号化器109は、ピッチ強度判
定器104が所定の判定信号を出力したときには、第2
ピッチ長のビット数を小さくすると共に予測係数のビッ
ト数を大きくし、かつ第2ピッチ長を差分形式で符号化
する。
【0031】入力端子101から過去の分析フレ−ムの
音声信号がフレームごとに入力されると、入力された過
去の分析フレームの音声信号は、第1メモリ102に記
憶される。式1に過去の分析フレームの音声信号を表す
【0032】
【数1】
【0033】ここで、n=1は現在の分析フレームの音
声信号に対する直前のサンプルを示す指標値である。
【0034】ピッチ予測器103は、過去の分析フレー
ムの音声信号を第1メモリ102から受け取って、以下
に述べる方法によりピッチ長tauを推定すると共に共
分散covarを求める。即ち、ピッチ予測器103は
、式2を用いて式3により表される共分散値Covar
2[τ]を最大にするτを、第1ピッチの所定の推定範
囲(40〜167サンプル)で探索し、得られたτをピ
ッチ長tauとして出力し、更にこのピッチ長tau(
=τ)における共分散covar(=Covar2[t
au]=Covar2[τ])を計算して出力する。
【0035】
【数2】
【0036】
【数3】
【0037】上記式2の共分散の計算式は、従来用いら
れていた計算式(式4)と比較すると共分散の計算範囲
が推定ピッチ長になっていることが分かる。式4に基づ
いてピッチ長tauを推定した場合には、その値は真の
ピッチ長の倍数になって変動が非常に激しい値となる。 式4を用いる場合、計算範囲(つまりピッチの分析窓長
)が短いときは、ピッチとは無関係な長さを誤って出力
してしまうことが多い。しかし式2では、推定ピッチが
低い場合には計算範囲が広がり、ピッチ構造を持つ大局
的な波形から共分散が計算されることになるから、局所
的な波形の相似状態をピッチと誤って判断する確率が低
下する。
【0038】
【数4】
【0039】式3は既存の3タップのピッチ予測器で用
いられている計算式である。一般に、ピッチ周波数が高
い場合には、サンプルごとに計算される共分散が離散的
になり、真のピッチ長での共分散を得ることは困難であ
りピッチ長を誤って計算してしまうことがあるが、式3
を用いることによりそれを防止できる(参考文献:US
P4,133,976; ”Predictive S
peech Signal Coding with 
Reduced Noise Effects”, B
.S.Atal, M.R.Schroeder )。
【0040】ピッチ強度判定器104は、ピッチ予測器
103が出力する共分散covarを受け取り、予め設
定された特定の範囲における共分散の値(以下、判定域
値と称する)、例えば0.5、と比較する。
【0041】ここで、共分散covarが判定域値より
高い(大きい)場合には、過去の分析フレームの音声信
号に強いピッチ構造があるとして所定の判定信号を出力
する。
【0042】他方、共分散covarが判定域値より低
い(小さい)場合には、ピッチ強度判定器104は過去
の分析フレームの音声信号には弱いピッチ構造しかない
としてこの判定信号を出力せず、このときスイッチ10
5がオフになり、ピッチ予測器108が従来のピッチ予
測を行う。
【0043】入力端子106から入力される現在の分析
フレームの音声信号は、フレームごとにメモリ108に
記憶される。この現在の分析フレームの音声信号を式5
で表す。
【0044】
【数5】
【0045】ピッチ予測器103はこのように表される
現在の分析フレームの音声信号を第2メモリ107から
受け取り、次のようにしてピッチ長tauを推定し、予
測係数Coefを算出する。なお、簡単のため、ピッチ
予測器108は1タップのピッチ予測器であるとする。 この1タップのピッチ予測器の処理内容は式6によって
表される。
【0046】
【数6】
【0047】ここで、Err[n]は、ピッチ予測残差
信号を表す。
【0048】ピッチ予測器108は、まず、ピッチ予測
器103と同様に式7で表される共分散を最大にするτ
をピッチ探索範囲から検出し、その検出されたτをピッ
チ長Tau(=τ)として出力する。また、ピッチ予測
器108はそのピッチ長Tauを用いて式8により予測
係数Coefを計算して出力する。
【0049】
【数7】
【0050】
【数8】
【0051】適応ビット配分符号化器109は、ピッチ
予測器108から出力されるピッチ長Tau及び予測係
数Coefを受け取る。ピッチ強度判定器104が、過
去の分析フレームの音声信号には弱いピッチ構造しかな
いと判定した場合を説明する。所定の判定信号を出力し
ていないので、適応ビット配分符号化器109は現在の
分析フレームの音声信号にも弱いピッチ構造しかないと
予測する。
【0052】そして、ピッチ長及び予測係数へのビット
配分として、ピッチ長には多くのビット数を、予測係数
には少ないビット数をそれぞれ割り当てる(例えばピッ
チ長に7ビット、予測係数に1ビット)。
【0053】上記のようなビット配分が有効なのは、ピ
ッチ構造が弱いフレームではピッチ予測のピッチ長は非
常に変化が激しく、予測係数に関しては音声信号の自己
相関値が低いので、予測係数のビット数を小さくしても
そのための性能の劣化が許容できるためである。なお、
予測係数の量子化誤差による性能劣化は、自己相関値a
と、量子化による誤差dの関数として式9により表され
る。
【0054】
【数9】
【0055】適応ビット配分符号化器109は、上述し
たようなビット配分でピッチ長及び予測係数を符号化し
、符号化されたピッチ長及び予測係数をピッチパラメー
タとして出力端子110に出力する。
【0056】次に、ピッチ予測器103から出力される
共分散covarが判定域値より高く(大きく)、過去
の分析フレームの音声信号に強いピッチ構造があるとし
て所定の判定信号をピッチ強度判定器104が出力した
場合の動作を説明する。
【0057】上記の場合には、所定の判定信号によって
スイッチ105はオンし、ピッチ予測器103が推定し
たピッチ長tauがピッチ予測器108に与えられる。 ピッチ予測器108はこの推定したピッチ長tauから
差分形式で表現できる範囲でピッチ長を探索する。
【0058】例えば、後述するように、適応ビット配分
符号化器109がピッチ長に2ビットを割り当てる場合
には、ピッチの探索範囲は、ピッチ長tauの近傍4点
、すなわちtau−2,tau−1,tau,tau+
1のみとなる。ピッチ予測器108はこの範囲で、上述
のようにしてピッチ長を求め、かつ予測係数を算出する
【0059】適応ビット配分符号化器109は、算出さ
れたピッチ長及び予測係数をピッチ予測器108から受
け取って符号化するが、ピッチ強度判定器104が所定
の判定信号を出力しているのでピッチ長は差分形式で符
号化され、ピッチ長には少ないビット数、そして予測係
数には多くのビット数が割り当てられる、例えば、ピッ
チ長に2ビット、予測係数に6ビットのビット配分にな
る。
【0060】ピッチ長を差分形式で、少ないビット数で
符号化するのは、現在の分析フレームの音声信号に対す
るピッチ構造が強いと予想できるからである。予測係数
に多くのビット数を割り当てるのは、予測係数に関して
は音声信号の自己相関値が高い(大きい)ので、予測ゲ
インを大きく取るためには、予測係数の量子化誤差をで
きるだけ小さく抑える必要があるからである。適応ビッ
ト配分符号化器109は、このようにして符号化したピ
ッチ長及び予測係数を出力端子110に出力する。
【0061】上述したように本実施例による音声ピッチ
予測装置では、ピッチパラメータであるピッチ長及び予
測係数を符号化するときに、共分散(ピッチ構造の強弱
)に基づいてピッチ長及び予測係数のビット数を適応的
に変化させて、ピッチ長を差分形式で符号化するので、
ピッチパラメータを効率よく情報圧縮することができる
【0062】次に本発明の音声ピッチ予測装置における
第2実施例について説明する。
【0063】図2は本発明による音声ピッチ予測器の第
2実施例の構成を示すブロック図である。図1の音声ピ
ッチ予測器と同一の構成要素には同一の符号を付して説
明を省略する。
【0064】図2に示す音声ピッチ予測装置は、上述し
た図1に示すピッチ予測器108の代わりにピッチ予測
器208及びピッチ予測器211を備えている。また、
スイッチ105の代わりにスイッチ205を備えている
【0065】ピッチ強度判定器104が所定の判定信号
を出力したときは、スイッチ205が第2メモリ107
の出力とピッチ予測器208の入力とを接続し、ピッチ
強度判定器104が所定の信号を出力しないときは、第
2メモリ107の出力とピッチ予測器211の入力とを
接続する。
【0066】ピッチ予測器211は、図1のピッチ予測
器108と同様に1タップのピッチ予測器である。他方
、ピッチ予測器208は、3タップのピッチ予測器であ
り、ピッチ予測器103からのピッチ長に基づいてピッ
チ長の探索範囲を制限する。
【0067】適応ビット配分符号化器209は、適応ビ
ット配分符号化器109と基本的に同じであるが、ピッ
チ強度判定器104が所定の判定信号を出力した場合に
は、ピッチ予測器208からのピッチパラメータを符号
化し、ピッチ強度判定器104が所定の判定信号を出力
しない場合には、ピッチ予測器211からのピッチパラ
メータを符号化する。
【0068】メモリ102、ピッチ予測器103及びピ
ッチ強度判定器104の動作は、図1の場合と同じであ
るので説明を省略する。
【0069】まず、ピッチ強度判定器104が、過去の
分析フレームの音声信号のピッチ構造が弱いと判定して
、所定の判定信号を出力しない場合の動作を説明する。
【0070】この場合には、ピッチ予測器211は、ス
イッチ205を通じてメモリ107から現在の分析フレ
ームの音声信号を受け取ってピッチ長及び予測係数を求
める。
【0071】ピッチ予測器211は、図1のスイッチ1
05がオフの場合のピッチ予測器108と同様の動作に
よってピッチ長及び予測係数を求めて、ピッチ長及び予
測係数を適応ビット配分符号化器209に出力する。
【0072】適応ビット配分符号化器209は、得られ
たピッチ長及び予測係数にそれぞれビット数を配分(例
えば、7ビットと1ビット)し、そのビット配分により
符号化してから端子110に出力する。
【0073】ピッチ強度判定器104が、過去の分析フ
レームの音声信号のピッチ構造が強いと判定し、所定の
判定信号を出力した場合には、ピッチ予測器208は、
メモリ107から現在の分析フレームの音声信号を受け
取ってピッチ長及び予測係数を求める。このピッチ予測
器208の処理内容は式10により表される。
【0074】
【数10】
【0075】ピッチ予測器208には、ピッチ予測器1
03が推定したピッチ長tauが与えられており、ピッ
チ予測器208は推定されたピッチ長tauに基づいて
ピッチの探索範囲を制限する。例えば適応ビット配分符
号化器209がピッチ長に2ビットを割り当てる場合に
は、ピッチの探索範囲は、ピッチ長tauの近傍4点、
すなわちtau−2,tau−1,tau,tau+1
のみとなる。ピッチ予測器208はこの範囲で、ピッチ
長を求め、かつ3つの予測係数を算出する。
【0076】適応ビット配分符号化器209は、上記の
ピッチ長及び予測係数をピッチ予測器208から受け取
って符号化するが、ピッチ強度判定器104が所定の判
定信号を出力しているのでピッチ長が差分形式で符号化
され、ピッチ長には少ないビット数を、予測係数には多
くのビット数をそれぞれ配分する(例えばピッチ長に2
ビット、予測係数に6ビット)。
【0077】図1に示した第1実施例における音声ピッ
チ予測装置では、ピッチ強度判定器104が所定の判定
信号を出力した場合には、適応ビット配分符号化器10
9は、予測係数を符号化する場合のビット数を増加させ
ていた。しかしピッチ予測器108は1タップのピッチ
予測器であるため、予測係数に3ビット以上のビット数
を割り当てても改善効果は飽和傾向となる。
【0078】本実施例の音声ピッチ予測装置では、上述
のようにピッチ強度判定器104が所定の判定信号を出
力した場合には、3タップのピッチ予測器208により
ピッチ長および予測係数が求められる。そして3タップ
の場合には、1タップの場合に比べ予測係数に多くの情
報量が必要となるが、予測ゲインが高く、性能が優れて
いるので、適応ビット配分符号化器209で予測係数に
大きいビット数を割り当てることが一層効果的となる。
【0079】次に本発明の音声ピッチ予測装置における
第3実施例について説明する。
【0080】図3は、本実施例における音声ピッチ予測
装置の構成を示すブロック図である。
【0081】図1の音声ピッチ予測器と同一の構成要素
には同一の符号を付して説明を省略する。
【0082】図3に示す音声ピッチ予測装置は、新たに
ピッチ予測器305を備えている。
【0083】ピッチ予測器305は、ピッチ強度判定器
104が過去の分析フレームの音声信号のピッチ構造が
強いと判定して、所定の判定信号を出力したときに、ピ
ッチ予測器103が出力するピッチ長tauに基づいて
、推定平均ピッチを求めてピッチ予測器308に出力す
る。
【0084】ピッチ予測器305は、式11、式12に
基づいて推定平均ピッチを求める。
【0085】
【数11】
【0086】
【数12】
【0087】ここで、AvePtchは推定平均ピッチ
、tauはピッチ予測器103が出力するピッチ長、a
は定数であり例えば0.1に設定される。
【0088】Limit[x](但し、x=AvePi
tch)は、xを一定の範囲に抑える関数であり、本実
施例の場合にはxを72から136に制限する。式12
で表されるOutAPは、ピッチ予測器305が出力す
る推定平均ピッチである。
【0089】ピッチ予測器308は、ピッチ強度判定器
104が所定の判定信号を出力しない場合には、ピッチ
予測器305が出力する推定平均ピッチから、差分形式
で表現できる範囲でピッチ長を探索する。それ以外はピ
ッチ予測器108と同じである。
【0090】適応ビット配分符号化器309は、ピッチ
強度判定器104から所定の判定信号が入力されるか否
かに応じてビット配分を設定してピッチ予測器308か
ら受け取ったピッチ長及び予測係数を符号化するが、適
応ビット配分符号化器109と異なり、所定の判定信号
が入力されない場合でもピッチ長を差分形式で符号化す
る。
【0091】メモリ102、ピッチ予測器103及びピ
ッチ強度判定器104の動作は、図1の場合と同じでな
ので説明を省略する。
【0092】ピッチ予測器305は、ピッチ強度判定器
104が過去の分析フレームの音声信号に強いピッチ構
造があると判定して所定の判定信号を出力した場合に、
式11、式12に基づいて推定平均ピッチを求めてピッ
チ予測器308に出力する。
【0093】ピッチ予測器308は、ピッチ強度判定器
104が所定の判定信号を出力した場合には、ピッチ予
測器103が出力するピッチ長から差分形式で表現でき
る範囲でピッチ長を探索し、予測係数を求めて適応ビッ
ト配分符号化器309に出力する。
【0094】適応ビット配分符号化器309は、上記の
ピッチ長及び予測係数を受け取り、ピッチ長を予測係数
よりも少ないビットでビット分配(例えばピッチ長を差
分形式で2ビットに、予測係数を5ビットにビット分配
)し、ビット分配されたピッチ長及び予測係数を符号化
して出力端子110に出力するピッチ強度判定器104
が、過去の分析フレームの音声信号には強いピッチ構造
がないと判定し、所定の判定信号を出力しない場合には
、ピッチ予測器308は、ピッチ予測器305が出力し
た上記推定平均ピッチから差分形式で表現できる範囲で
ピッチ長を探索する。そして、得られたピッチ長を予測
係数と共に適応ビット配分符号化器309に出力する。
【0095】適応ビット配分符号化器309は、上記の
ピッチ長及び予測係数を受け取り、それぞれをビット配
分(例えば、ピッチ長を差分形式で6ビット、予測係数
を1ビット)し、ビット配分されたピッチ長及び予測係
数を符号化して出力端子110に出力する。
【0096】適応ビット配分符号化器309が上述のよ
うにピッチ長を差分形式で6ビットに符号化する場合に
は、ピッチ長の値は、平均ピッチ(−32)から平均ピ
ッチ(+31)の範囲に入る。従って、ピッチ予測器3
05が推定平均ピッチを求める際、推定ピッチ長の範囲
が40〜167の範囲であれば、推定平均ピッチは72
〜136の範囲に抑えればよいことになる。これが、式
12のLimit[AvePitch]で推定平均ピッ
チを72〜136の範囲に制限した理由である。
【0097】通常、個人の音声に注目すると、ピッチ周
波数の範囲はあまり広くはないのでピッチ長のビット数
を低減することが可能であり、上述したように、過去の
分析フレームの音声信号に弱いピッチ構造しかない場合
にもピッチ長が差分形式で符号化される音声ピッチ予測
装置では、ピッチ長に対するビット数の配分を少なくす
ることができるので、効率よく情報を圧縮することがで
きる。
【0098】
【発明の効果】本発明の音声ピッチ予測装置によれば、
過去の分析区間の被分析信号に対してピッチ予測を行っ
て被分析信号の第1ピッチ長及び共分散を出力する第1
ピッチ予測手段と、ピッチ予測手段から出力された共分
散を特定の範囲の共分散と比較して比較結果を出力する
ピッチ強度判定手段と、ピッチ強度判定手段から出力さ
れた比較結果に基づいて現在の分析区間の被分析信号に
対して特定の範囲でピッチ予測を行って被分析信号の第
2ピッチ長及び予測係数を出力する第2ピッチ予測手段
と、第2ピッチ予測手段から出力された第2ピッチ長及
び予測係数を符号化する符号化手段とを備えており、符
号化手段は、ピッチ強度判定手段から出力された比較結
果に基づいて第2ピッチ長のビット数を変化させて差分
形式により符号化するように構成されているので、ピッ
チパラメータを効率よく情報圧縮して伝達情報量を低減
でき、分析区間の長さを長くすることがないので、音声
を高品質で圧縮できる。
【図面の簡単な説明】
【図1】本発明による音声ピッチ予測装置の第1実施例
の構成を示すブロック図である。
【図2】本発明による音声ピッチ予測装置の第2実施例
の構成を示すブロック図である。
【図3】本発明による音声ピッチ予測装置の第3実施例
の構成を示すブロック図である。
【図4】従来のCELP符号化器の一例を示すブロック
図である。
【符号の説明】
101、106  入力端子 102、107  メモリ 103、108、208、211、305、308  
ピッチ予測器 104  ピッチ強度判定器 105、205  スイッチ 109、209、309  適応ビット配分符号化器1
10  出力端子

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】過去の分析区間の被分析信号に対してピッ
    チ予測を行って当該被分析信号の第1ピッチ長及び共分
    散を出力する第1ピッチ予測手段と、前記ピッチ予測手
    段から出力された前記共分散を特定の範囲の共分散と比
    較して当該比較結果を出力するピッチ強度判定手段と、
    前記ピッチ強度判定手段から出力された前記比較結果に
    基づいて現在の分析区間の被分析信号に対して特定の範
    囲でピッチ予測を行って該被分析信号の第2ピッチ長及
    び予測係数を出力する第2ピッチ予測手段と、前記第2
    ピッチ予測手段から出力された前記第2ピッチ長及び前
    記予測係数を符号化する符号化手段とを備えており、前
    記符号化手段は、前記ピッチ強度判定手段から出力され
    た前記比較結果に基づいて前記第2ピッチ長のビット数
    を変化させて差分形式により符号化するように構成され
    ていることを特徴とする音声ピッチ予測装置。
  2. 【請求項2】前記第2ピッチ予測手段は、前記第1ピッ
    チ長に基づいて平均ピッチ長を推定して出力するように
    構成されており、前記符号化手段は、前記比較結果に基
    づいて前記第2ピッチ長を前記推定された平均ピッチ長
    からの差分形式で符号化するように構成されている請求
    項1に記載の音声ピッチ予測装置。
  3. 【請求項3】前記第2ピッチ予測手段が、前記比較結果
    に基づいて選択可能な複数のピッチ予測部により構成さ
    れており、該複数のピッチ予測部を選択することにより
    前記第2ピッチ長のビット配分を変化させるように構成
    された請求項1又は2に記載の音声ピッチ予測装置。
JP3282691A 1991-02-27 1991-02-27 音声ピッチ予測装置 Expired - Fee Related JP2870608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3282691A JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3282691A JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Publications (2)

Publication Number Publication Date
JPH04271399A true JPH04271399A (ja) 1992-09-28
JP2870608B2 JP2870608B2 (ja) 1999-03-17

Family

ID=12369635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3282691A Expired - Fee Related JP2870608B2 (ja) 1991-02-27 1991-02-27 音声ピッチ予測装置

Country Status (1)

Country Link
JP (1) JP2870608B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06131000A (ja) * 1992-10-15 1994-05-13 Nec Corp 基本周期符号化装置
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法

Also Published As

Publication number Publication date
JP2870608B2 (ja) 1999-03-17

Similar Documents

Publication Publication Date Title
US7016831B2 (en) Voice code conversion apparatus
US6704702B2 (en) Speech encoding method, apparatus and program
US7444283B2 (en) Method and apparatus for transmitting an encoded speech signal
EP0696026B1 (en) Speech coding device
EP1755109B1 (en) Scalable encoding and decoding apparatuses and methods
CA1218745A (en) Speech signal processing system
US7031912B2 (en) Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals
US7702504B2 (en) Bitrate scalable speech coding and decoding apparatus and method
US7590532B2 (en) Voice code conversion method and apparatus
KR20010022187A (ko) 개선된 음성 인코더를 구비한 전송 시스템
US6928406B1 (en) Excitation vector generating apparatus and speech coding/decoding apparatus
KR100218214B1 (ko) 음성 부호화 장치 및 음성 부호화 복호화 장치
EP2187390B1 (en) Speech signal decoding
EP0708435B1 (en) Encoding and decoding apparatus of line spectrum pair parameters
US6012026A (en) Variable bitrate speech transmission system
EP1837997A1 (en) Long-term prediction encoding method, long-term prediction decoding method, devices thereof, program thereof, and recording medium
EP1473710B1 (en) Multistage multipulse excitation audio encoding apparatus and method
US6484139B2 (en) Voice frequency-band encoder having separate quantizing units for voice and non-voice encoding
JPH04271399A (ja) 音声ピッチ予測装置
JP3067676B2 (ja) Lspの予測符号化装置及び方法
US7031913B1 (en) Method and apparatus for decoding speech signal
US20040049381A1 (en) Speech coding method and speech coder
EP0723257B1 (en) Voice signal transmission system using spectral parameter and voice parameter encoding apparatus and decoding apparatus used for the voice signal transmission system
JPH09172413A (ja) 可変レート音声符号化方式
KR20000016318A (ko) 가변 비트레이트 음성 전송 시스템

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees