JP3026461B2 - 音声のピッチ予測符号化法 - Google Patents

音声のピッチ予測符号化法

Info

Publication number
JP3026461B2
JP3026461B2 JP3068282A JP6828291A JP3026461B2 JP 3026461 B2 JP3026461 B2 JP 3026461B2 JP 3068282 A JP3068282 A JP 3068282A JP 6828291 A JP6828291 A JP 6828291A JP 3026461 B2 JP3026461 B2 JP 3026461B2
Authority
JP
Japan
Prior art keywords
pitch
candidate
adaptive codebook
speech
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3068282A
Other languages
English (en)
Other versions
JPH04305135A (ja
Inventor
一則 間野
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3068282A priority Critical patent/JP3026461B2/ja
Publication of JPH04305135A publication Critical patent/JPH04305135A/ja
Application granted granted Critical
Publication of JP3026461B2 publication Critical patent/JP3026461B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声の信号系列を少
ない情報量でディジタル符号化する高能率音声符号化法
に適用され、励振信号を線形予測合成フィルタに通して
合成し、その励振信号を、過去の励振信号をピッチ周期
で繰り返して作ったピッチ適応符号帳と、雑音信号から
なる雑音符号帳とから得て符号化する場合における音声
のピッチ予測符号化法に関する。
【0002】
【従来の技術】ディジタル移動無線通信や、音声蓄積サ
ービスでは、電波や記憶媒体の効率的利用を図るため
に、種々の高能率音声符号化法が用いられている。8k
Hzサンプリングの音声を8kbit/s以下で符号化
する方法としては、CELP、VSELP、マルチパル
ス符号化、重み付きベクトル量子化による変換符号化等
が知られているが、いずれも、図3Aに示すように、入
力音声を、8msから30ms程度を1フレームとし
て、ピッチ予測合成部11よりの、現在量子化しようと
する音声を過去の前方予測型のピッチ予測による合成残
差と、励振ベクトル合成部12からの新たな雑音または
パルス列からなる信号との和を線形予測合成フィルタ1
3にとおし、その合成フィルタ13よりの合成音声が現
在の入力音声に対し波形ひずみが最小となる符号を波形
ひずみ最小化部14で合成部11,12を制御して決定
する。線形予測合成フィルタ13は現在量子化しようと
する1フレームの音声を分析して線形予測してフィルタ
係数を決定する前方予測と、既に符号化されたものを復
号した音声から線形予測してフィルタ係数を決定する後
方予測とがある。
【0003】ここで、ピッチ予測合成部11では、適応
符号帳として蓄えられたピッチ合成残差波形の中から、
最も符号化に適した候補を選択する。適応符号帳は、図
3Bに示すように、過去の励振波形15を、合成しよう
とする長さN(符号化フレーム長)のベクトル長に各ピ
ッチ周期τで繰り返して構成される。つまり符号化した
過去の励振波形中の先頭(現時点)0より、予め決めら
れたピッチがありそうな時間逆のぼった各点までの各ピ
ッチ周期τiを繰り返して符号化フレーム長Nとする。
その予め決められた点までの期間がNより大になると、
その分、基準点をづらして、Nだけ取り出す。このよう
にしてピッチ適応符号帳の各ベクトル1〜kが得られ
る。
【0004】このピッチ予測によるピッチ候補選択法と
しては、従来、開ループ法と閉ループ法とのいずれかの
方法が用いられていた。開ループ法では、図4Aに示す
ように、ピッチ周期検出部16で音声符号化とは別に符
号化しようとする現フレームの入力音声の自己相関、変
形相関法等で音声のピッチ周期を一意に決定し、この決
定されたピッチ周期と等しい、または近いものをピッチ
適応符号帳17から選出し、その選出したピッチ候補残
差信号に、振幅設定部18で振幅を与えて出力する。こ
の方法は演算量は少ないが、音声符号化の品質は閉ルー
プ法よりも劣る。
【0005】閉ループ法は、図4Bに示すようにピッチ
適応符号帳17から選択したピッチ候補に振幅設定部1
8で振幅を与えて励振信号として線形予測フィルタ13
へ供給しそのフィルタ13の出力合成音声が現入力音声
に対し、波形ひずみが最小になるようにピッチ候補を、
ピッチ適応符号帳17から波形ひずみ最小化部14で選
択して決定する。この手法は符号化音声の品質は、開ル
ープ法よりも良いが、演算量が多いという欠点がある。
【0006】この発明の目的は、少ない演算量で、符号
化音声の波形ひずみの小さい音声ピッチ予測符号化法を
提供することにある。
【0007】
【課題を解決するための手段】この発明は、2段階の階
層的なピッチ候補選択を行う。まず第1段で、開ループ
法により、少ない演算量で複数のピッチ候補を求め、次
に第2段として、少くとも第1段で予備選択された候補
に対して、符号化音声の品質を高めるために、閉ループ
法により波形ひずみ最小化に基づくピッチ予測符号決定
を行う。
【0008】このようにして全体として、少ない演算量
で、高品質のピッチ予測を可能とする。
【0009】
【実施例】図1Aにこの発明によるピッチ予測符号化法
の実施例を示し、図4Bと対応する部分に同一符号を付
けてある。この発明では第1段の選択で、ピッチ予測選
択部21において、ピッチ適応符号帳17からK1 (K
1<K)個のピッチ候補を選択する。この選択は例えば
図1Bに示すように、入力音声を線形予測逆フィルタ2
2へ供給し、入力音声の線形予測残差を求め、この線形
予測残差とピッチ適応符号帳17の各候補との内積(ま
たは、相互相関係数)を内積(相互相関)演算部23で
演算し、その演算結果で予備選択を行なう。すなわち、
現在の入力音声を線形予測した残差{en },n=1,
…,N、適応符号帳17のK個の各ベクトルを
{qn k },n=1,…,N,k=1,…,Kとする
と、 dk =ΣN n=1 n n k ,k=1,…,K または、dk =ΣN n=1 n n k /√Σ
N n=1 (qn k )2 k=1,…,K を計算し、dk の大きいベクトルを適応符号帳17のK
個のベクトルのうち、上位K1 個だけを選択する。その
選択されたベクトルについて、第2段の選択を行なう。
つまり、図1Aにおける、閉ループ法によって波形ひず
みを最小とするベクトルを選択する。
【0010】この構成により、第1段での簡単な内積計
算での予備選択により、適応符号帳17の候補を絞り込
むことができるので、演算量を低減することができる。
また、この実施例においては、適応符号帳17のK個の
ベクトルすべてと予備選択計算を行なったが、例えば、
適応符号帳17内の1つおきのベクトルについて、前述
した予備選択計算を行ない、その結果、上位K1 個のベ
クトルを選択し、第2段では、その選ばれたK1 個のベ
クトルとその前後の候補ベクトルとについて閉ループ計
算を行なってもよい。また、サンプリングされた励振信
号からなる、整数値のピッチ周期系列だけでなく、信号
間を補間してもとめた、非整数値ピッチ周期の候補も含
めた適応符号帳17を構成し、第1段では、整数値のピ
ッチ周期系列からなる候補のみについて予備選択を行な
い、第2段では、その予備選択された候補と、その前後
の非整数値のピッチ周期の候補についても一緒に閉ルー
プ計算を行うようにしてもよい。
【0011】上述では、ピッチ適応符号帳17の候補ベ
クトルと線形予測残差との内積を計算しているので、候
補ベクトルのピッチ周期τが符号化フレーム長(ベクト
ル長)Nよりも小さい場合には、適応ピッチ周期を繰り
返して構成する必要があった。このように、ピッチ周期
τが符号化フレーム長(ベクトル長)Nよりも小さい場
合には、そのピッチ候補の1ピッチ周期τ分以降には、
実際の線形予測残差を継ぎ足して1符号化フレーム長と
し、これをピッチ候補ベクトルとして予備選択の計算を
行なってもよい。これは、例えば図2Aに示すように、
過去の励振信号の先頭に現在フレームの線形予測残差を
加え、過去の励振信号の1候補ピッチ周期τに線形予測
残差を0点から足して全体で符号フレーム長Nとし、こ
のことを、予め決められた各過去の励振信号の各点につ
いてシフトさせながら、これをピッチ候補として内積を
計算し、上位K1 個を選択し、第2段めでは、選択され
たK1 個のピッチ候補について、実際の適応符号帳17
を構成して閉ループ法により最終決定を行なう。この方
法により、第1段での不要な候補のピッチ繰り返し計算
をおこなう必要がなくなり、演算量の低減が図れる。
【0012】この図2Aに示した予備選択を用いた実施
例の結果を図2Bに示す。図2Bは、ピッチ適応符号帳
17の大きさをK=127とし、その第1段の予備選択
の候補数K1 を変化させた場合の、音声符号化のセグメ
ンタルSNRと演算量との実験による結果である。K1
をその最大数K=127から、20程度に予備選択によ
って絞り込んでも、セグメンタルSNRを殆んど下げず
に、演算量を小さくできることがこの図2Bから理解さ
れる。
【0013】
【発明の効果】以上のように、この発明の2段階の階層
的なピッチ予測符号化法では、第1段で、開ループ法に
より、少ない演算量で複数のピッチ周期候補を求め、第
2段として、第1段で予備選択された候補と対応したも
のに対して、符号化音声の品質を高めるために、閉ルー
プ法により精密な波形ひずみ最小化に基づくピッチ予測
符号決定を行うので、全体として、少ない演算量で、高
品質のピッチ予測を可能とする利点がある。
【図面の簡単な説明】
【図1】Aはこの発明の実施例におけるピッチ予測合成
部の例を示すブロック図、Bは第1段におけるピッチ予
備選択の例を示すブロック図である。
【図2】Aは第1段のピッチ予備選択におけるピッチ候
補と線形予測残差とよりなるベクトル構成の例を示す
図、Bは図2Aのベクトルを用いたピッチ予備選択によ
る候補数とセグメンタルSNRと演算量との関係を示し
た図である。
【図3】Aはピッチ適応符号帳と雑音符号帳とを励振源
とする一般の音声符号化方式を示すブロック図、Bはピ
ッチ適応符号帳の構成例を示す図である。
【図4】Aは従来の開ループ型のピッチ予測合成部の構
成を示すブロック図、Bは従来の閉ループ型のピッチ予
測合成部の構成を示すブロック図である。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 励振信号を線形予測合成フィルタに通し
    て合成する符号化法であって、過去の励振信号をピッチ
    周期で繰り返して作ったピッチ適応符号帳と、雑音信号
    からなる雑音符号帳との2つを励振源とする方法におい
    て、ピッチの適応符号帳からの最適な候補選択法とし
    て、まず、開ループ法により、ピッチ候補を複数個残す
    第1段の予備選択を行ない、その後、上記線形予測合成
    フィルタを通して、波形ひずみが最小になるように、閉
    ループ法によって最終的なピッチ候補選択を、少くとも
    上記予備選択されたものを用いて行なう、ことを特徴と
    する音声のピッチ予測符号化法。
  2. 【請求項2】 上記第1段の予備選択は、現在の符号化
    フレームの線形予測残差と上記適応符号帳のピッチ候補
    との内積、または相互相関係数を用いて行なうことを特
    徴とする請求項1記載の音声のピッチ予測符号化法。
  3. 【請求項3】 上記第1段の予備選択において、上記適
    応符号帳のピッチ候補が1ピッチ周期より長い場合は、
    その1ピッチ周期分に対し、上記線形予測残差を継ぎた
    して、1フレーム分の長さとしたものを、上記ピッチ候
    補とすることを特徴とする請求項2記載の音声のピッチ
    予測符号化法。
JP3068282A 1991-04-01 1991-04-01 音声のピッチ予測符号化法 Expired - Lifetime JP3026461B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3068282A JP3026461B2 (ja) 1991-04-01 1991-04-01 音声のピッチ予測符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3068282A JP3026461B2 (ja) 1991-04-01 1991-04-01 音声のピッチ予測符号化法

Publications (2)

Publication Number Publication Date
JPH04305135A JPH04305135A (ja) 1992-10-28
JP3026461B2 true JP3026461B2 (ja) 2000-03-27

Family

ID=13369256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3068282A Expired - Lifetime JP3026461B2 (ja) 1991-04-01 1991-04-01 音声のピッチ予測符号化法

Country Status (1)

Country Link
JP (1) JP3026461B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658816B2 (ja) * 1993-08-26 1997-09-30 日本電気株式会社 音声のピッチ符号化装置
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
JP5511372B2 (ja) * 2007-03-02 2014-06-04 パナソニック株式会社 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法

Also Published As

Publication number Publication date
JPH04305135A (ja) 1992-10-28

Similar Documents

Publication Publication Date Title
JP4187556B2 (ja) スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
US7280959B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
US4852179A (en) Variable frame rate, fixed bit rate vocoding method
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3094908B2 (ja) 音声符号化装置
JPH06222797A (ja) 音声符号化方式
JPH08234799A (ja) 改良されたベクトル励起源を有するデジタル音声コーダ
US5953697A (en) Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes
KR19980080463A (ko) 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법
JPH056199A (ja) 音声パラメータ符号化方式
JP4550176B2 (ja) 音声符号化方法
JPH0944195A (ja) 音声符号化装置
JP3026461B2 (ja) 音声のピッチ予測符号化法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP2658816B2 (ja) 音声のピッチ符号化装置
KR100416363B1 (ko) 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
KR20040043278A (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3583945B2 (ja) 音声符号化方法
JPH06131000A (ja) 基本周期符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JPH08234795A (ja) 音声符号化装置
JPH113098A (ja) 音声符号化方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100128

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110128

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110128

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120128

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120128

Year of fee payment: 12