JPH08179798A - 音声のピッチラグ符号化方法および装置 - Google Patents

音声のピッチラグ符号化方法および装置

Info

Publication number
JPH08179798A
JPH08179798A JP6324566A JP32456694A JPH08179798A JP H08179798 A JPH08179798 A JP H08179798A JP 6324566 A JP6324566 A JP 6324566A JP 32456694 A JP32456694 A JP 32456694A JP H08179798 A JPH08179798 A JP H08179798A
Authority
JP
Japan
Prior art keywords
pitch
bit
pitch lag
bit pattern
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6324566A
Other languages
English (en)
Inventor
Masahiro Serizawa
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6324566A priority Critical patent/JPH08179798A/ja
Publication of JPH08179798A publication Critical patent/JPH08179798A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】より低い平均ビットレートで、高性能に音声の
ピッチラグを符号化することが可能な音声のピッチラグ
符号化方法および装置を提供すること。 【構成】入力端子1は、一群のサブフレームからなる音
声信号を入力する。サブフレームピッチ抽出回路2,
3,4は、それぞれ異なる1つのサブフレームからピッ
チラグを抽出する。ビット判定回路7は、複数のピッチ
ラグを予め定められた複数のビットパタンと比較し、複
数のピッチラグを表示し且つビット数の総和を最小とす
るビットパタンの番号を出力する。符号化回路8は、サ
ブフレームピッチ抽出回路2,3,4の出力した複数の
ピッチラグとビット判定回路7の出力するビットパタン
の番号とを受け、ビットパタンの番号に従って複数のピ
ッチラグを符号化する。マルチプレクサ5は、ビット判
定回路7の出力と符号化回路8の出力とを受け変調し、
変調信号として出力端子6から出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声のピッチラグ符号化
方法および装置に関し、特にCELP(CodeExcited Lin
ear Prediction Coding) 型の音声符号化方式の音声の
ピッチラグ符号化方法および装置に関する。
【0002】
【従来の技術】従来から音声のピッチラグ符号化技術を
用いた音声符号化方式の代表的な方式としてはCELP
方式がある。CELP方式は、フレーム単位(例えば40
msec)で得た特徴パラメータ(スペクトル特性)と、こ
のフレームを更に分割したサブフレーム単位(例えば 8
msec)で得た特徴パラメータ(ピッチラグ、音源コー
ド、ゲイン)を用いて、音声信号符号化を行う。CEL
P方式に関しては、例えば、エム・シュレーダー(M.Sc
hroeder )とビー・アタル(B.Atal)等がアイイーイー
イー・プロシーディングス(IEEE Proc.)ICASSP-85,1985
年、937〜940頁にコード・エキサイテド・リニア
・プリディクション:ハイ・クオリティ・スピーチ・ア
ット・ベリー・ロウ・ビット・レイツ(Code-excited l
inear prediction: High quality speech at very low
bit rates )と題して発表した論文(文献1)等に記載
されている。ここに述べるピッチラグは音声信号の有声
音声のピッチ周期に対応するものであり、符号化された
値は、ピッチ周期の整数倍値または整数分の1倍付近の
値となる。通常、この値は時間と共に緩やかに変化す
る。
【0003】CELP方式で使用されている従来のピッ
チラグ符号化技術では、サブフレームごとに抽出したピ
ッチラグをフレーム単位で伝送する。
【0004】従来の音声のピッチラグ符号化装置の一例
を図2のブロック図を用いて説明する。なお図2では、
1フレームが持つサブフレーム数を3とする。
【0005】図2に示す従来の音声のピッチラグ符号化
装置の動作は、まず、入力端子11から音声信号を入力
する。次に、サブフレームピッチ抽出回路12,13,
14で、入力した音声信号から各サブフレームに対応す
るピッチラグを抽出し、抽出したピッチラグをマルチプ
レクサ15に出力する。次に、マルチプレクサ15で、
各サブフレームピッチ抽出回路12,13,14から渡
されたピッチラグを変調し、変調信号を出力端子16に
渡す。出力端子16は渡された変調信号を出力する。
【0006】ここでピッチラグの抽出方法の1つとし
て、CELP音声符号化方式で使用しているオープンル
ープ探索法がある。これは、該サブフレームの入力音声
信号列ベクトルxと過去にLサンプル遡って入力音声信
号をサブフレーム長に切り出したベクトルx(L)との相関
値を使用する方法である。遡るサンプル数Lを符号化ビ
ットBで表される範囲に対して相関値を計算する。最後
に、相関値が最大となるLを第2番目のサブフレームの
ピッチラグとして出力する。この際、人間の耳に雑音と
して聞こえるパワーの小さい周波数領域での量子化雑音
を抑える聴感重み付けを施した入力音声信号を用いる場
合もある。
【0007】各サブフレームでピッチラグの符号化に割
り当てられた符号化ビットをBビットとし、1フレーム
当たりのサブフレーム数をNとすると、フレーム当たり
のピッチラグに対する符号化ビットは、N×Bビットと
なる。また、差分符号化を用いた場合、各サブフレーム
のビット配分をB(1),B(2),...,B(N)とするとフレーム当
たりのピッチラグに対する符号化ビットは、
【0008】
【0009】となる。差分符号化に関する文献として、
アイラ・エイ・ジャーソン(Ira.A.Gerson)等がアイイ
ーイーイー・ジェー・セレクテッド・エリアズ・イン・
コミュニケーションズ(IEEE J. Selected Areas in Co
mmunications. )Vol.10,No.5,June, 1992年、858〜
865頁にテクニクス・フォ・インプルービング・ザ・
パフォマンス・オブ・シー・イー・エル・ピー・タイプ
・スピーチ・コーダーズ(Techniques for Improving t
he Performance of CELP-Type Speech Coders )と題し
て発表した招待論文(文献2)がある。また、音声符号
化の有声音部の符号化では、差分符号化により、符号化
ビット数を大幅に削減できることが知られている。
【0010】具体的な一例を用いて、従来の音声のピッ
チラグ符号化装置での符号化ビットを説明する。ここで
は、式(2) に示す第n〜第n+3フレームのピッチラグの
例を用いる。1フレーム当たり3サブフレームとする。
また、ピッチラグはn〜127の8ビット分の整数値をと
るとする。
【0011】
【0012】従来の音声のピッチラグ符号化装置で、各
サブフレームでのピッチラグの符号化ビットをすべてB
=8ビットとすると、4フレーム分の符号化ビットは全
部で、 8*3*4=96ビット (3) となる。また、差分符号化を用いて、2番目,3番目の
サブフレームを、B(1)=8ビット, B(2)=B(3)=6ビッ
トとすると、 (8+6*2)*4=80ビット (4) となる。ただしこの場合、第n+3フレーム目の1番目,
2番目 サブフレームの差が100となり、差分値は、
6ビット即ち64レベルでは表現できない。これに対処
するために、第2サブフレームの符号化値として、差分
値で表現可能な8ビットを使用する必要がある。
【0013】
【発明が解決しようとする課題】上述した従来の音声の
ピッチラグ符号化装置は、各サブフレームでピッチラグ
を抽出した後に、ピッチラグが持っている各サブフレー
ム間の相関を利用しておらず、十分にビットレートを低
減化できていないという問題点がある。
【0014】本発明の目的は、より低い平均ビットレー
トで、高性能に音声のピッチラグを符号化することが可
能な音声のピッチラグ符号化方法および装置を提供する
ことにある。
【0015】
【課題を解決するための手段】本発明の音声のピッチラ
グ符号化方法は、入力音声信号から複数のピッチラグを
特徴パラメータとして抽出し、予め定めた個数単位で前
記特徴パラメータを組み合せて伝送する音声のピッチラ
グ符号化方法において、前記個数単位の特徴パラメータ
を表すことができるビットパタンを前記個数単位の特徴
パラメータを用いて決定し、前記ビットパタンに従って
前記個数単位の前記特徴パラメータの符号を計算し、前
記特徴パラメータの符号と前記ビットパタンとを組み合
せて伝送する構成である。
【0016】本発明の音声のピッチラグ符号化方法は、
前記予め定めた個数単位が、複数のサブフレームからな
るフレームを単位としてもよい。
【0017】本発明の音声のピッチラグ符号化方法は、
前記フレーム単位の複数の前記ピッチラグを用いたビッ
トパタンの決定結果が、前記フレーム単位の複数の前記
ピッチラグを表すことができる最小ビット数のビットパ
タンであってもよい。
【0018】本発明の音声のピッチラグ符号化装置は、
一群のサブフレームからなる音声信号を入力する入力端
子と、前記一群のサブフレームから選択したそれぞれ異
なる1つのサブフレームからピッチラグを抽出するサブ
フレームピッチ抽出回路と、前記ピッチ抽出回路の出力
した複数のピッチラグを予め定められた複数のビットパ
タンと比較し、前記複数のピッチラグを表示し且つビッ
ト数の総和を最小とするビットパタンの番号を出力する
ビット判定回路と、前記ピッチ抽出回路の出力した複数
のピッチラグと前記ビット判定回路の出力するビットパ
タンの番号とを受け、前記ビットパタンの番号に従って
前記複数のピッチラグを符号化する符号化回路と、前記
ビット判定回路の出力と前記符号化回路の出力とを受け
組み合せビット系列として出力端子から出力するマルチ
プレクサとを有する構成である。
【0019】
【作用】本発明では、フレームごとに、これのピッチラ
グを表示するビットパタンを決定し、このパタンに従っ
て、ピッチラグの符号化を行うと共に、ビットパタンの
番号の符号化を行う。これにより、隣接するフレームの
ピッチラグに相関の強い音声のピッチラグ符号化に適用
して、性能の劣化なしに平均符号化ビットレートを低減
できることになる。
【0020】式(2) の例を用いて本発明の原理の説明を
行う。また、ビットパタンとして、
【0021】
【0022】の4パタンを使用する。4パタンなので、
このビットパタンを伝送するために、各フレームで伝送
ビット2ビットが余分に必要である。第nフレームにお
いて、式(2) の(90,92,94)のピッチラグが抽
出されているので、このピッチラグを表せる最小ビット
数のパタンは、8,2,2ビットとなる。したがって、
第nフレームでのピッチラグに関する伝送ビット数は、
8+2+2=12ビットに、ビットパタン用のビット2
ビットを加えて、14ビットとなる。同様に、第n+3フ
レームまでに関して必要なビット数を計算すると次式と
なる。
【0023】
【0024】従って、この例では、4フレーム分の符号
化ビットは、 14+22+18+26=80ビット (7) となる。この値は、従来の符号化装置の式(3) による符
号化ビット数より、16ビット削減されている。また、
従来方式で差分符号化を行った場合の式(4) と同じビッ
ト数でありながら、すべてのサブフレームで近似値を使
用せずに、精度を全く劣化させずに、ピッチ符号化を行
うことができる。
【0025】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0026】図1は本発明の一実施例のブロック図であ
る。
【0027】本実施例の音声のピッチラグ符号化装置1
0では、1フレームが持つサブフレーム数を3とする。
構成としては、一群のサブフレームからなる音声信号を
入力する入力端子1と、一群のサブフレームから選択し
たそれぞれ異なる1つのサブフレームからピッチラグを
抽出するサブフレームピッチ抽出回路2,3,4と、サ
ブフレームピッチ抽出回路2,3,4の出力した複数の
ピッチラグを予め定められた複数のビットパタンと比較
し、複数のピッチラグを表示し且つビット数の総和を最
小とするビットパタンの番号を出力するビット判定回路
7と、サブフレームピッチ抽出回路2,3,4の出力し
た複数のピッチラグとビット判定回路7の出力するビッ
トパタンの番号とを受け、ビットパタンの番号に従って
複数のピッチラグを符号化する符号化回路8と、ビット
判定回路7の出力と符号化回路8の出力とを受け変調
し、変調信号として出力端子6から出力するマルチプレ
クサ5とを備えている。
【0028】次に動作について説明する。
【0029】まず、入力端子1から音声信号を入力す
る。次に、サブフレームピッチ抽出回路2,3,4で、
入力する音声信号を用いて各サブフレームに対応するピ
ッチラグを抽出し、抽出したピッチラグをピッチ判定回
路7と符号化回路8に出力する。ピッチラグの抽出方法
は従来の技術の項で説明したものと同一なのでここでの
説明は省略する。ビット判定回路7は、予め定めたビッ
トパタン (例えば式(5))の中から、サブフレームピッチ
抽出回路2,3,4から渡された複数のピッチラグを表
示し、且つビット数の和が最小となるものを選択する。
更に、選択したビットパタンの番号を符号化回路8およ
びマルチプレクサ5に渡す。符号化回路8は、サブフレ
ームピッチ抽出回路2,3,4から渡された各ピッチラ
グを符号化し、マルチプレクサ5に渡す。この時の符号
化ビットパタンは、ビット判定回路7から渡されるビッ
トパタンの番号に対応するものを用いる。次に、マルチ
プレクサ5は、符号化回路8から渡される各サブフレー
ムのピッチラグの符号と、ビット判定回路7から渡され
るビットパタンの番号とを変調し、変調信号として出力
端子6に渡す。出力端子6は渡された変調信号を出力す
る。
【0030】
【発明の効果】以上説明したように、本発明は、入力音
声信号から複数のピッチラグを抽出し、個数単位のピッ
チラグを表すことができるビットパタンを個数単位のピ
ッチラグを用いて決定し、ビットパタンに従って個数単
位のピッチラグの符号を計算し、ピッチラグの符号とビ
ットパタンとを変調し伝送することにより、より低い平
均ビットレートで、高性能に音声のピッチラグを符号化
することが可能になるという効果が有る。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】従来の音声のピッチラグ符号化装置のブロック
図である。
【符号の説明】
1 入力端子 2,3,4 サブフレームピッチ抽出回路 5 マルチプレクサ 6 出力端子 7 ビット判定回路 8 符号化回路 10 音声のピッチラグ符号化装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号から複数のピッチラグを特
    徴パラメータとして抽出し、予め定めた個数単位で前記
    特徴パラメータを組み合せて伝送する音声のピッチラグ
    符号化方法において、前記個数単位の特徴パラメータを
    表すことができるビットパタンを前記個数単位の特徴パ
    ラメータを用いて決定し、前記ビットパタンに従って前
    記個数単位の前記特徴パラメータの符号を計算し、前記
    特徴パラメータの符号と前記ビットパタンとを組み合せ
    て伝送することを特徴とする音声のピッチラグ符号化方
    法。
  2. 【請求項2】 前記予め定めた個数単位が、複数のサブ
    フレームからなるフレームを単位とすることを特徴とす
    る請求項1記載の音声のピッチラグ符号化方法。
  3. 【請求項3】 前記フレーム単位の複数の前記ピッチラ
    グを用いたビットパタンの決定結果が、前記フレーム単
    位の複数の前記ピッチラグを表すことができる最小ビッ
    ト数のビットパタンであることを特徴とする請求項2記
    載の音声のピッチラグ符号化方法。
  4. 【請求項4】 一群のサブフレームからなる音声信号を
    入力する入力端子と、前記一群のサブフレームから選択
    したそれぞれ異なる1つのサブフレームからピッチラグ
    を抽出するサブフレームピッチ抽出回路と、前記ピッチ
    抽出回路の出力した複数のピッチラグを予め定められた
    複数のビットパタンと比較し、前記複数のピッチラグを
    表示し且つビット数の総和を最小とするビットパタンの
    番号を出力するビット判定回路と、前記ピッチ抽出回路
    の出力した複数のピッチラグと前記ビット判定回路の出
    力するビットパタンの番号とを受け、前記ビットパタン
    の番号に従って前記複数のピッチラグを符号化する符号
    化回路と、前記ビット判定回路の出力と前記符号化回路
    の出力とを受け組み合せビット系列として出力端子から
    出力するマルチプレクサとを有することを特徴とする音
    声のピッチラグ符号化装置。
JP6324566A 1994-12-27 1994-12-27 音声のピッチラグ符号化方法および装置 Pending JPH08179798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6324566A JPH08179798A (ja) 1994-12-27 1994-12-27 音声のピッチラグ符号化方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6324566A JPH08179798A (ja) 1994-12-27 1994-12-27 音声のピッチラグ符号化方法および装置

Publications (1)

Publication Number Publication Date
JPH08179798A true JPH08179798A (ja) 1996-07-12

Family

ID=18167247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6324566A Pending JPH08179798A (ja) 1994-12-27 1994-12-27 音声のピッチラグ符号化方法および装置

Country Status (1)

Country Link
JP (1) JPH08179798A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100349656B1 (ko) * 2000-12-20 2002-08-24 한국전자통신연구원 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61254999A (ja) * 1985-05-07 1986-11-12 日本電気株式会社 ピッチおよび有声/無声判別信号の符号化方法
JPH0335300A (ja) * 1989-06-30 1991-02-15 Fujitsu Ltd 音声符号・復号化伝送方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61254999A (ja) * 1985-05-07 1986-11-12 日本電気株式会社 ピッチおよび有声/無声判別信号の符号化方法
JPH0335300A (ja) * 1989-06-30 1991-02-15 Fujitsu Ltd 音声符号・復号化伝送方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100349656B1 (ko) * 2000-12-20 2002-08-24 한국전자통신연구원 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US6470313B1 (en) Speech coding
WO2001020595A1 (en) Voice encoder/decoder
WO2006001218A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
JP3137176B2 (ja) 音声符号化装置
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3064947B2 (ja) 音声・楽音符号化及び復号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH10177398A (ja) 音声符号化装置
JP2002140099A (ja) 音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JPH08179798A (ja) 音声のピッチラグ符号化方法および装置
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP2736157B2 (ja) 符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3299099B2 (ja) 音声符号化装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH06131000A (ja) 基本周期符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980331