JPH113098A - 音声符号化方法および装置 - Google Patents

音声符号化方法および装置

Info

Publication number
JPH113098A
JPH113098A JP9155552A JP15555297A JPH113098A JP H113098 A JPH113098 A JP H113098A JP 9155552 A JP9155552 A JP 9155552A JP 15555297 A JP15555297 A JP 15555297A JP H113098 A JPH113098 A JP H113098A
Authority
JP
Japan
Prior art keywords
pitch period
frame
pitch
subframe
current frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9155552A
Other languages
English (en)
Other versions
JP3435310B2 (ja
Inventor
Masahiro Oshikiri
正浩 押切
Kimio Miseki
公生 三関
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP15555297A priority Critical patent/JP3435310B2/ja
Priority to US09/012,792 priority patent/US6202046B1/en
Publication of JPH113098A publication Critical patent/JPH113098A/ja
Priority to US09/726,562 priority patent/US6704702B2/en
Application granted granted Critical
Publication of JP3435310B2 publication Critical patent/JP3435310B2/ja
Priority to US10/675,947 priority patent/US7191120B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】音声信号のピッチ周期を少ない計算量で算出
し、かつ少ない情報量で表現することが可能な音声符号
化方法を提供する。 【解決手段】入力端子21からの入力音声信号をフレー
ム・サブフレーム構成部22でフレームに分割し、さら
に各フレームをサブフレーム化に分割した後、ピッチ周
期分析部23により現フレーム、現フレームに対し過去
のフレームおよび未来のフレームのうちの少なくとも二
つのフレームのピッチ周期を求め、これらのピッチ周期
からサブフレームピッチ周期抽出部24でサブフレーム
毎のピッチ周期を補間により求めて、このサブフレーム
ピッチ周期の情報を出力端子25より出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号の圧縮符
号化を行う音声符号化方法に係り、特に音声信号の符号
化処理の中のピッチ周期を求める処理に関する。
【0002】
【従来の技術】音声信号を低ビットレートで高能率に圧
縮符号化する技術は、自動車電話等の移動体通信や企業
内通信において、電波の有効利用や通信コストの削減に
重要な技術である。
【0003】8kbps以下のビットレートで品質の優
れた音声合成が可能な音声符号化方式として、CELP
(Code Excited Linear Prediction)方式が知られてい
る。CELP方式は、M.R.Schrodeder氏とB.S.Atal氏に
より、“Code-Excited Linear Prediction(CELP) High-
Quality Speech at Very low Bit Rates”,Proc.ICASS
P;1985,pp.937-939(文献1)で発表されて以来、高品
質な音声が合成できる方式として注目され、品質の改善
や計算量の削減について、種々の検討がなされてきた。
【0004】CELP方式による音声符号化を実現する
ための構成要素の一つとして、適応符号帳がある。適応
符号帳は、入力音声信号のピッチ予測分析を閉ループ動
作または合成による分析(Analysis by Synthesis)によ
って行うものである。一般に適応符号帳によるピッチ予
測分析は、20〜147サンプルの探索範囲(128候
補)でピッチ周期の探索を行って、目標信号に対する歪
が最小となるピッチ周期を求め、このピッチ周期の情報
を7ビットの符号化データとして伝送することが多い。
【0005】上述した従来のCELP方式では、サブフ
レーム単位に閉ループ動作によってピッチ周期を決定す
るため、前述のようにピッチ周期の探索範囲が128候
補と大きい場合、計算量が膨大になってしまう。さら
に、このような直接的なピッチ周期探索法では、ピッチ
周期の情報はサブフレーム当たり7ビット必要となり、
仮に4サブフレームで1フレームが構成されると、フレ
ーム当たり28ビットものビット数が必要になってしま
う。
【0006】本来、音声信号のピッチ周期の変動はゆる
やかな部分が多く、サブフレーム毎に全探索を行う必要
はない。このようなピッチ周期の性質を利用して、計算
量の削減およびビット数の削減が可能である。そのよう
な観点から、ピッチ周期の探索範囲を限定する差分ピッ
チ表現を用いる方法が報告されている。
【0007】その一つに、ピッチ周期の探索に際し奇数
サブフレームについては全ての候補探索を行い、偶数サ
ブフレームについては奇数サブフレームの近傍の候補の
みを探索することで、計算量とビット数を削減する方法
がJ.P.Campbell,Jr.氏らによって“An Expandable Erro
r-Protected 4800 bps CELP coder(U.S.Federal Standa
rd 4800 bps Voice Coder)”,Proc.ICASSP;1989,pp.73
5-738 (文献2)で報告されている。この方法によれ
ば、奇数サブフレームについては128候補の全探索、
偶数サブフレームについては例えば32候補に限定して
ピッチ周期の探索を行うと、ピッチ周期の情報量をフレ
ーム当たり24ビットに削減することができる。
【0008】しかし、この方法では奇数サブフレームで
求めたピッチ周期が実際のピッチ周期と大きく異なる値
が選択された場合、次のサブフレームにまで影響を与え
てしまい、品質劣化が知覚されるという問題が生じる。
実際、サブフレームのように短い区間でピッチ分析を行
うと、実際と異なるピッチ周期が求まりやすくなってし
まう。
【0009】また、安定的にフレームのピッチ周期を求
め、各サブフレームをそれぞれフレームピッチ周期から
の変動量として表し、その近傍のみピッチ周期を探索す
る方法がM.Yong氏らによって“Efficient Encoding of
the Long-Term Predictor inVector Excitation Coders
”,Boston,MA:Kluwer,1991,pp329-338 (文献3)で
報告されている。この方法によれば、フレームのピッチ
周期の情報を7ビットで表し、サブフレームのピッチ周
期の情報を5ビットで表している。
【0010】この方法の利点は、全てのサブフレームの
ピッチ周期探索は32候補だけに対して行えばよく、大
幅な計算量削減が可能となる点にある。しかしながら、
この方法には、フレーム内でピッチ周期が変動するよう
な場合に大きな劣化が生じてしまうという問題点があ
る。この問題点を図1(a)を用いて説明する。
【0011】図1(a)に示すように、実際のピッチ周
期がフレーム内で変動するような場合、フレームのピッ
チ周期はその中での平均的な周期として求められる。各
サブフレームのピッチ周期は、フレームのピッチ周期の
近傍を探索範囲とする。しかし、探索範囲が十分な大き
さでない場合、図1(a)に示すように実際のピッチ周
期を求めることはできない。また、探索範囲を大きくし
てしまうと、それだけピッチ周期の情報を表すのに必要
なビット数が必要になり、計算量やビット削減の効果が
小さくなってしまう。
【0012】
【発明が解決しようとする課題】上述したように、従来
の音声符号化方法であるCELP方式では、サブフレー
ム単位の閉ループ探索によってピッチ周期を求めるた
め、ピッチ周期を求めるのに必要な計算量が膨大とな
り、しかもピッチ周期情報のビット数が増大するという
問題点がある。
【0013】また、文献2に記載されたような探索範囲
を限定してピッチ周期を求める方法では、ピッチ周期を
求めるための計算量およびピッチ周期情報のビット数が
減少するが、ピッチ周期を正しく求めることが難しいと
いう問題点がある。
【0014】さらに、文献3に記載されたようにサブフ
レームのピッチ周期をフレームのピッチ周期からの変動
量としてフレームのピッチ周期近傍においてのみ探索す
る方法では、大幅な計算量の削減が可能であるが、フレ
ーム内でピッチ周期が変動するような場合はサブフレー
ムのピッチ周期を正しく求めることができないという問
題点があった。
【0015】本発明は、このような従来技術の問題点を
解消するためになされたもので、音声信号のフレーム周
期を少ない計算量で正しく求めることができ、かつピッ
チ周期を少ない情報量で表現できる音声符号化方法を提
供することを目的とする。
【0016】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は入力音声信号を予め定められた長さのフレ
ームに分割し、入力音声信号のピッチ周期を求める処理
を含む音声符号化処理において、符号化しようとする現
フレームに対して時間的に未来のフレームのピッチ周期
を求める処理と、このピッチ周期を符号化する処理とを
含むことを特徴とする。
【0017】また、本発明は入力音声信号を予め定めら
れた長さのフレームに分割し、各フレームの音声信号を
さらにサブフレームに分割して、音声信号のピッチ周期
を求める処理を含む音声符号化処理において、符号化し
ようとする現フレームと現フレームに対して過去のフレ
ームおよび未来のフレームのうちの少なくとも二つのフ
レームのピッチ周期を用いて現フレーム中のサブフレー
ムのピッチ周期予測値を求め、このピッチ周期予測値を
用いて現フレーム中のサブフレームのピッチ周期を求め
ることを特徴とする。
【0018】このように本発明では、現フレームに対し
て未来のフレームのピッチ周期を求めるため、現フレー
ムのピッチ周期や過去のフレームのピッチ周期とともに
用いて、補間により現フレーム中のサブフレームのピッ
チ周期予測値を求め、このピッチ周期予測値を用いて現
フレーム中のサブフレームのピッチ周期を求めることに
より、フレーム内でピッチ周期が変動する場合であって
も、サブフレームのピッチ周期を精度よく、かつ少ない
計算量で求め、しかも少ない情報量で表すことができ
る。
【0019】図1(b)を用いて説明すると、同図に示
されるように図1(a)と同様に実際のピッチ周期はフ
レーム内で変化している。本発明では例えば現フレーム
のピッチ周期と過去のフレームのピッチ周期とで補間を
行い、各サブフレーム毎にサブフレームピッチ周期予測
値を求め、その近傍にサブフレームのピッチ周期の探索
範囲を決定する。このため、実際のピッチ周期は探索範
囲の中に含まれ、ピッチ周期の正確な探索を行うことが
できる。
【0020】また、サブフレームピッチ周期予測値は実
際のピッチ周期をかなり正確に近似するため、サブフレ
ームのピッチ周期の探索範囲を例えば8候補のように狭
めても問題は生じない。サブフレームピッチ周期の探索
範囲を8候補とすると、フレームのピッチ周期は7ビッ
ト、サブフレーム当たり3ビットで表されるため、4サ
ブフレームで1フレームとすれば、サブフレームのピッ
チ周期は、従来ではフレーム当たり28ビットで必要で
あったの対し、7ビット+3ビット*4=19ビットの
情報量で表すことができる。また、サブフレームピッチ
周期の探索範囲が8候補と小さいため、計算量の削減に
も大きく寄与する。
【0021】本発明においては、上記のようにして求め
られた現フレーム中のサブフレームのピッチ周期を符号
化してもよいし、入力される音声信号のピッチ周期成分
を強調するピッチフィルタを有する場合、上記のように
して求められた現フレーム中のサブフレームのピッチ周
期を用いてピッチフィルタの伝達関数を決定するように
してもよい。ピッチフィルタは、例えば聴感重みフィル
タやポストフィルタの一構成要素として知られる。
【0022】さらに、本発明は過去の駆動信号系列を予
め定められた範囲に含まれる周期で繰り返して生成され
る複数の適応ベクトルを格納した適応符号帳を有し、こ
の適応符号帳から取り出される適応ベクトルを所定のフ
ィルタに通して得られる信号と目標ベクトルとの誤差が
最小となる周期の適応ベクトルを所定の探索範囲から探
索する処理を含む音声符号化処理において、入力音声信
号を予め定められた長さのフレームに分割し、各フレー
ムの音声信号をさらにサブフレームに分割した後、符号
化しようとする現フレームと現フレームに対して過去の
フレームおよび未来のフレームのうちの少なくとも二つ
のフレームのピッチ周期を用いて現フレーム中のサブフ
レームのピッチ周期予測値を求め、このピッチ周期予測
値を用いて現フレーム中のサブフレームについての前記
探索範囲を決定することを特徴とする。
【0023】本発明においては、フレームのピッチ周期
を求める際、フレーム毎にピッチ周期の分析位置を適応
的に決定してもよい。より具体的には、ピッチ周期分析
位置を音声信号、予測残差信号、または低域通過フィル
タ通過後の予測残差信号の短区間パワーの大きさで判定
する。このようにすることにより、ピッチ周期をより正
確に求めることができ、復号音声の品質向上が図られ
る。
【0024】また、ピッチ周期の連続性に応じて現フレ
ーム中のサブフレームのピッチ周期を求める方法を選択
してもよい。例えば、ピッチ周期が連続的に変化してい
ると判定された場合は、サブフレームピッチ周期予測値
を求め、この近傍を探索することによりサブフレームピ
ッチ周期を求める。逆に、ピッチ周期の変化が不連続で
あると判定された場合、サブフレームピッチ周期は全探
索によって求める。このような適応処理により、ピッチ
周期の連続性に応じて最適なサブフレームピッチ周期の
探索法が選択されるため、復号音声の品質が向上する。
【0025】また、複数のサブフレームのピッチ周期の
変動を表す相対ピッチパターンを複数個格納した相対ピ
ッチパターン符号帳をさらに有し、サブフレームのピッ
チ周期の変化を相対ピッチパターン符号帳から所定の指
標に基づいて選択した一つの相対ピッチパターンによっ
て表すようにしてもよく、これによりサブフレームピッ
チ周期を表す情報のさらなるビット数削減を図ってい
る。
【0026】すなわち、相対ピッチパターン符号帳は、
例えば出現頻度の高い相対ピッチパターンをベクトルと
して格納している。これと複数のサブフレームのピッチ
周期をベクトル化したものとマッチングをとり、最も適
した相対ピッチパターンで複数のサブフレームのピッチ
周期を表すようにする。例えば、サブフレームのピッチ
周期を個別に表すのにサブフレーム当たり3ビット必要
であれば、4サブフレーム当たり12ビット必要になる
が、この4次元ベクトルを相対ピッチパターン符号帳内
の7ビットの大きさを持つ一つの相対ピッチパターンで
表現すれば、フレーム当たり5ビットのビット削減につ
ながる。
【0027】また、本発明においては入力音声信号を予
め定められた長さのフレームに分割し、入力音声信号の
ピッチ周期を求める処理を含む音声符号化処理を行うた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体であって、符号化しようとする現フレームに対
して時間的に未来のフレームのピッチ周期を求める処理
と、このピッチ周期を符号化する処理とを実行するため
のプログラムを記録した記録媒体が提供される。
【0028】また、本発明によると入力音声信号を予め
定められた長さのフレームに分割し、各フレームの音声
信号をさらにサブフレームに分割して、音声信号のピッ
チ周期を求める処理を含む音声符号化処理を行うための
プログラムを記録したコンピュータ読み取り可能な記録
媒体であって、符号化しようとする現フレームと現フレ
ームに対して過去のフレームおよび未来のフレームのう
ちの少なくとも二つのフレームのピッチ周期を用いて現
フレーム中のサブフレームのピッチ周期予測値を求め、
このピッチ周期予測値を用いて現フレーム中のサブフレ
ームのピッチ周期を求める処理を実行するためのプログ
ラムを記録した記録媒体が提供される。
【0029】さらに、本発明においては過去の駆動信号
系列を予め定められた範囲に含まれる周期で繰り返して
生成される複数の適応ベクトルを格納した適応符号帳を
有し、この適応符号帳から取り出される適応ベクトルを
所定のフィルタに通して得られる信号と目標ベクトルと
の誤差が最小となる周期の適応ベクトルを所定の探索範
囲から探索する処理を含む音声符号化処理を行うための
プログラムを記録したコンピュータ読み取り可能な記録
媒体であって、入力音声信号を予め定められた長さのフ
レームに分割し、各フレームの音声信号をさらにサブフ
レームに分割した後、符号化しようとする現フレームと
現フレームに対して過去のフレームおよび未来のフレー
ムのうちの少なくとも二つのフレームのピッチ周期を用
いて現フレーム中のサブフレームのピッチ周期予測値を
求め、このピッチ周期予測値を用いて現フレーム中のサ
ブフレームについての前記探索範囲を決定する処理を実
行するためのプログラムを記録した記録媒体が提供され
る。
【0030】
【発明の実施の形態】以下、本発明による音声符号化方
法の実施形態について説明する。
【0031】(第1の実施形態)図2は、本発明の第1
の実施形態に係る音声符号化方法におけるピッチ周期分
析の基本動作を説明するためのブロック図である。同図
において、入力端子11にはディジタル化された音声信
号(以下、入力音声信号という)が順次入力される。こ
の入力音声信号は、フレーム構成部12で予め定められ
た長さのフレームと呼ばれる単位に分割される(フレー
ム化)。このフレーム構成部12でフレーム化された音
声信号はピッチ周期分析部13によりピッチ周期の分析
が行われ、ピッチ周期の情報が出力端子14から出力さ
れる。
【0032】次に、フレーム構成部12の動作を図3を
用いて説明する。便宜上、ここでは後述する第2の実施
形態におけるフレーム・サブフレーム構成部22(図
4)におけるサブフレーム構成部の動作についても説明
する。
【0033】図3は、本実施形態における入力音声信号
のフレーム構造とサブフレーム構造を表す。図3では、
フレームを特定するためにf(m) という記号を付してい
る。ここで、m=0のフレームはこれから符号化しよう
とするフレーム(現フレームという)を表し、m≦−1
のフレームは既に符号化が終了している過去のフレーム
を表す。さらに、frは現フレームに対して時間的に未
来のフレーム(これを先読み部という)を表す。
【0034】入力音声信号をs(n) と表し、s(0) を現
フレームの先頭に位置する音声信号とすると、s(n) と
f(m) およびfrの間には次のような関係が成り立つ。
【0035】 f(m) ={s(n) ;n=m*NF〜(m+1)*NF−1} (1) (m≦0) fr={s(n) ;n=NF〜NF+ND−1} (2) ここで、NFはフレーム長、NDは先読み部の長さを表
す。本実施形態ではNF=160、ND=120として
説明する。
【0036】また、フレームf(0) のサブフレームをs
f(k) とすると、s(m) とsf(k)の間には次のような
関係が成り立つ。 sf(k) ={s(n) ;n=k*NSF〜(k+1)*NSF−1} (0≦k≦K−1) (3) ここで、NSFはサブフレーム長、Kはサブフレーム数
をそれぞれ表す。本実施形態ではNSF=40、K=4
として説明を行う。また、nはサンプルを表す変数、m
はフレームを表す変数、kはサブフレームを表す変数で
ある。
【0037】このようにフレームとサブフレームを構成
した後に、ピッチ周期分析部13においてピッチ周期分
析を行う。ピッチ周期分析部13は、先読み部frに分
析の中心を置いてピッチ周期の分析を行う点に特徴があ
る。分析の中心の定義は後で述べる。
【0038】ピッチ周期の分析には既存の技術を適用で
きる。例えば、「音声のディジタル信号処理」コロナ社
発行(文献4)にいくつかピッチ分析法が紹介されてい
る。本実施形態では、次のようなピッチ周期分析法を用
いている。
【0039】まず、図示しないLPC分析部において、
入力音声信号s(n) を分析してLPC係数を求め、この
LPC係数を使って次式で表される伝達関数A(z) の予
測フィルタを構成する。
【0040】
【数1】
【0041】ここで、α(i) はLPC係数、IPは分析
次数をそれぞれ表す。本実施形態では、IP=10とし
て説明を進める。この伝達関数A(z) の予測フィルタに
音声信号s(n) を通して、予測残差信号e(n) を次式に
従い求める。
【0042】
【数2】
【0043】次に、予測残差信号e(n) にハミング窓を
掛けて窓掛け信号u(n) を求め、この窓掛け信号u(n)
の相関分析を行い、次式に示す相関値ρ(t) を用いてピ
ッチ周期を抽出する。
【0044】
【数3】
【0045】ここで、NWはピッチ周期分析長、NCは
ピッチ周期分析位置をそれぞれ表す。本実施形態では、
NW=160、NC=200として説明を行う。また、
相関値ρ(t) の分析範囲は{20≦t≦147}とす
る。
【0046】そして、相関値ρ(t) が最大となるときの
tがフレームのピッチ周期Tの情報として出力端子14
から出力される。このピッチ周期Tの情報は例えば符号
化され、図示しない復号器へ伝送される。
【0047】窓関数にハミング窓や方形窓のような対称
窓を用いた場合、ピッチ分析位置は窓関数の中心と考え
ることができる。また、窓の形が左と右で異なる非対称
窓を用いた場合、その分析位置は対称窓と同様に中心部
と考えることはできない。この場合、本実施形態では窓
関数の振幅値が最大となる位置を中心としてみなすこと
にする。
【0048】このように本実施形態では、現フレームに
対して未来のフレームのピッチ周期を求めるため、これ
を後述するように現フレームのピッチ周期や過去のフレ
ームのピッチ周期とともに用いて、補間により現フレー
ム中のサブフレームのピッチ周期予測値を求め、このピ
ッチ周期予測値を用いて現フレーム中のサブフレームの
ピッチ周期を求めることにより、フレーム内でピッチ周
期が変動する場合であっても、サブフレームのピッチ周
期を精度よく、かつ少ない計算量で求め、しかも少ない
情報量で表すことができる。
【0049】(第2の実施形態)図4は、本発明の第2
の実施形態に係る音声符号化方法におけるサブフレーム
ピッチ抽出の基本動作を説明するためのブロック図であ
る。同図において、入力端子21へのディジタル化され
た入力音声信号は、フレーム・サブフレーム構成部22
でフレームに分割され、各フレームはさらにサブフレー
ムに分割される。このフレーム・サブフレーム構成部2
2でフレーム化された音声信号およびサブフレーム化さ
れた音声信号は、ピッチ周期分析部23およびサブフレ
ームピッチ周期抽出部24に入力される。ピッチ周期分
析部23では、ピッチ周期Tの分析が行われ、ピッチ周
期Tの情報がサブフレームピッチ周期抽出部24に入力
される。
【0050】サブフレームピッチ周期抽出部24では、
ピッチ周期分析部23で求められたピッチ周期Tを基
に、サブフレーム毎のピッチ周期ST(k) が求められ、
このサブフレームピッチ周期ST(k) の情報が出力端子
25から出力される。
【0051】次に、図5を用いて本実施形態の特徴部分
であるサブフレームピッチ周期抽出部24について説明
する。図5はサブフレームピッチ周期抽出部24の構成
を示すブロック図であり、入力端子101に入力される
図4のピッチ周期分析部23からのピッチ周期Tの情報
を用いて、サブフレームピッチ周期予測値算出部102
でサブフレーム毎にサブフレームピッチ周期予測値を算
出する。サブフレームピッチ周期算出部104では、サ
ブフレームピッチ周期予測値算出部102で求めたサブ
フレームピッチ周期予測値を基に、入力端子103に入
力される図4のフレーム・サブフレーム構成部22から
の音声信号を用いてサブフレーム毎にサブフレームピッ
チ周期ST(k) を算出し、このサブフレームピッチ周期
ST(k)の情報を出力端子105へ出力する。
【0052】図6を用いて、サブフレームピッチ周期の
算出方法をさらに詳細に説明する。まず、ピッチ周期分
析部23において現フレームf(0) で求めたピッチ周期
をT(0) とし、過去のフレームf(-1)で求めたピッチ周
期をT(-1)とする。サブフレームピッチ周期抽出部24
では、これらの2つのピッチ周期を用いてサブフレーム
ピッチ周期予測値STP(k) をサブフレーム毎に求め
る。本実施形態では、T(-1)とT(0) とから補間により
サブフレームピッチ周期予測値STP(k) を求める方法
について説明する。音声信号の性質から、本来のサブフ
レームピッチ周期ST(k) はサブフレームピッチ周期予
測値STP(k) の近傍にあると考えることができる。そ
の理由として、音声信号のピッチ周期は時間的な変動が
小さいということが挙げられる。
【0053】次に、サブフレームピッチ周期予測値ST
P(k) を用いてサブフレームピッチ周期ST(k) を求め
る方法を図7を用いて説明する。上述のようにサブフレ
ームピッチ周期ST(k) はサブフレームピッチ周期予測
値STP(k) の近傍にあるという仮定が成り立つことか
ら、その近傍のみをピッチ周期抽出のための範囲として
考えることができる。図7では、第0サブフレームsf
(0) におけるサブフレームピッチ周期予測値STP(0)
と、サブフレームピッチ周期ST(0) を抽出するための
相関値計算の範囲NRを表している。
【0054】このように本実施形態では、サブフレーム
ピッチ周期予測値STP(0) を中心として±NR/2の
範囲をサブフレームピッチ周期ST(0) を求めるための
相関値計算の範囲としている。すなわち、STP(0) −
NR/2≦t≦STP(0) +NR/2−1の範囲に含ま
れる周期についてのみ、先に示した式(6)で規定され
る相関値ρ(t) を算出し、これが最大値をとるときのS
TP(0) に対する相対ピッチ周期ΔT(0) の情報を出力
端子25より出力する。従って、サブフレームsf(0)
のサブフレームピッチ周期ST(0) は、サブフレームピ
ッチ周期予測値STP(0) と相対ピッチ周期ΔT(0) と
の和STP(0) +ΔT(0) として求めることができる。
同様にして、他のサブフレームsf(k) の相対ピッチ周
期ΔT(k) を求め、この情報を出力端子25より出力す
る。本実施形態ではNR=8としている。
【0055】本実施形態によると、次のような効果が得
られる。まず、サブフレームピッチ周期を求めるための
相関値計算の範囲をNRとすることができるため、大幅
な計算量削減が実現できる。仮に、サブフレーム毎にサ
ブフレームピッチ周期を式(6)により求めると、全て
のピッチ周期候補(128候補)について計算する場
合、約40,000回の積和演算が必要になる。これに
対し、本実施形態を適用した場合、相関値計算範囲をN
R=3とすると積和演算は約4,000回で済み、約9
0%計算量を削減できる。但し、これはピッチ周期分析
長NW=160のもとで計算した結果である。
【0056】また、従来ではサブフレームピッチ周期を
表すのに必要な情報量は、サブフレーム毎に128候補
の全範囲について計算する場合、4サブフレームで1フ
レームが構成されるとすると、フレーム当たり7ビット
*4=28ビットが必要であった。これに対し、本実施
形態ではフレームピッチ周期T(0) を表すのに7ビッ
ト、相対ピッチ周期ΔT(k) を表すのにサブフレーム当
たり3ビットあればよいから、サブフレームピッチ周期
を表すのに必要な情報量はフレーム当たり7ビット+3
ビット*4=19ビットとなり、約35%のビット数削
減につながる。なお、過去のフレームのピッチ周期T(-
1)は、1フレーム前の処理におけるピッチ周期T(0) で
代用することができるため、これを新たにビットを使っ
て表す必要はない。
【0057】次に、本実施形態におけるサブフレームピ
ッチ周期算出の処理手順を図8のフローチャートにより
説明する。まず、ステップS11で入力音声信号をフレ
ーム化、サブフレーム化を行う。次に、ステップS12
で現フレーム内に分析の中心を置いてピッチ周期T(0)
を算出する。次に、ステップS13で現フレームのピッ
チ周期T(0) と過去のフレームのピッチ周期T(-1)とを
用いて、サブフレーム毎のサブフレームピッチ周期予測
値STP(k) を求める。そして、ステップS14でカウ
ンタkを0に設定した後、ステップS15でサブフレー
ムsf(k) の相対ピッチ周期ΔT(k) を算出し、ステッ
プS16でカウンタkを1だけインクリメントする。ス
テップS17でカウンタkがK(Kはサブフレーム数)
に一致しているかどうかの判定を行う。ここでkがKに
一致していなければ、ステップS15に戻って処理を継
続し、一致したならば処理は終了する。
【0058】(第3の実施形態)図9を用いて本発明の
第3の実施形態を説明する。本実施形態と第2の実施形
態の違いは、サブフレームピッチ周期予測値STP(k)
を求める際に、先読み部frのピッチ周期Trを利用し
ている点にある。
【0059】サブフレームの中心が過去のフレームf(-
1)のピッチ周期T(-1)の分析位置と現フレームf(0) の
ピッチ周期T(0) の分析位置の間にある場合、そのサブ
フレームのサブフレームピッチ周期予測値STP(k)
は、T(-1)とT(0) を用いて求められる。同様に、サブ
フレームの中心が現フレームf(0) のピッチ周期T(0)
の分析位置と先読み部frのピッチ周期Trの分析位置
の間にある場合、そのサブフレームのサブフレームピッ
チ周期予測値STP(k) は、T(0) とTrを用いて求め
られる。本実施形態では、直線補間を用いてサブフレー
ムピッチ周期予測値STP(k) を算出している。
【0060】このようにしてサブフレームピッチ周期予
測値STP(k) を求めた後に、第2の実施形態と同様に
して相対ピッチ周期ΔT(k) をサブフレーム毎に求め
る。
【0061】また、本実施形態においてサブフレームピ
ッチ周期ST(k) を表すのに必要な情報は、現フレーム
のピッチ周期T(0) を1フレーム前の処理において求め
た先読み部frのピッチ周期Trで代用することができ
るため、先読み部frのピッチ周期Trとサブフレーム
毎の相対ピッチ周期ΔT(k) だけでよい。
【0062】次に、図10に示すフローチャートを用い
て本実施形態における処理手順を説明する。図10のス
テップS21、S24、S25、S26およびS27の
処理は、図8のステップS11、S14、S15、S1
6およびS17とそれぞれ同じであるので、ここでは説
明を省略する。図10の処理手順の特徴的な部分は、ス
テップS22で先読み部frに分析の中心を置いてピッ
チ周期Trを算出する点と、ステップS23でサブフレ
ームピッチ周期予測値STP(k) を先読み部frのピッ
チ周期Trと現フレームf(0) のピッチ周期T(0) とを
用いて求めるか、もしくは現フレームf(0) のピッチ周
期T(0) と過去のフレームf(-1)のピッチ周期T(-1)と
を用いて求めるかのいずれかを使う点にある。
【0063】本実施形態では、いずれのサブフレームピ
ッチ周期予測値STP(k) も過去のフレームf(-1)のピ
ッチ周期T(-1)と現フレームf(0) のピッチ周期T(0)
、またはT(0) と先読み部frのピッチ周期Trの内
挿値として表されるため、より正確な予測値を得ること
ができる。
【0064】例えば、実際のピッチ周期が図11に示す
ように変動している場合、第2の実施形態のように過去
のフレームのピッチ周期T(-1)と現フレームのピッチ周
期T(0) を基にサブフレームピッチ周期予測値STP
(k) を求める方法では、サブフレームピッチ周期予測値
STP(k) の信頼性が低下してしまうという問題が生じ
ることがある。これに対し、本実施形態では先読み部f
rのピッチ周期Trが実際のピッチ周期を正確に表すた
め、その補間値も実際のピッチ周期を正確に表すことが
できるようになる。
【0065】(第4の実施形態)図12を用いて本発明
の第4の実施形態を説明する。本実施形態と第3の実施
形態の違いは、サブフレームピッチ周期予測値STP
(k) を求める際に、先読み部frのピッチ周期Trと現
フレームf(0) のピッチ周期T(0) を用いる点にある。
【0066】本実施形態の処理手順を図13に示すフロ
ーチャートを用いて説明する。図13におけるステップ
S31、S34〜S37の処理は、図8におけるステッ
プS11、S14〜S17の処理と同様であるので、こ
こでは説明を省略する。
【0067】ステップS32において、先読み部frに
分析の中心を置いてピッチ周期Trを算出する。次に、
ステップS33で先読み部frのピッチ周期Trと現フ
レームf(0) のピッチ周期T(0) を用いてサブフレーム
ピッチ周期予測値STP(k)を算出する。
【0068】本実施形態では、先読み部frのピッチ周
期Trと現フレームf(0) のピッチ周期T(0) とから補
間によりサブフレームピッチ周期予測値STP(k) を求
めることができるため、第3の実施形態に比べ先読み部
frの長さを短くでき、従って遅延を小さくできるとい
うメリットがある。
【0069】(第5の実施形態)図14を用いて本発明
の第5の実施形態を説明する。本実施形態と第4の実施
形態の違いは、サブフレームピッチ周期予測値STP
(k) を求める際に、先読み部frのピッチ周期Trと過
去のフレームf(-1)のピッチ周期T(-1)を用いている点
にある。
【0070】本実施形態によると、次のような効果があ
る。ピッチ周期の正確な分析は一般に困難であり、現在
においても確立された方式があるわけではない。本実施
形態では式(6)で表される相関分析による方法につい
て説明しているが、この場合も常に正しいピッチ周期を
求められるわけではなく、実際のピッチ周期の整数分の
1のピッチ周期が求められてしまったり、逆に整数倍の
ピッチ周期が求められてしまう場合がある。
【0071】図14に示されるように、現フレームf
(0) のピッチ周期T(0) の分析が失敗し、実際のピッチ
周期から大きく外れてしまった場合、先読み部frのピ
ッチ周期Trと過去のフレームf(-1)のピッチ周期T(-
1)とで補間を行い、サブフレームピッチ周期予測値ST
P(k) を求めるようにすれば、現フレームf(0) のピッ
チ周期T(0) が正確に求まった場合と同様に効率的にピ
ッチ周期を表現することができる。
【0072】本実施形態の処理手順を図15に示すフロ
ーチャートを用いて説明する。図15におけるステップ
S41、S42、S45、S47、S48、S49およ
びS50の処理は、図10におけるステップS21、S
22、S23、S24、S25、S26およびS27の
処理と同じであるので、ここでは説明を省略する。本実
施形態で特徴的な部分は、ステップS43、S44およ
びS46の処理であるので、これらの処理について説明
する。
【0073】ステップS43およびS44において先読
み部で求めたピッチ周期Trと過去のフレームのピッチ
周期T(-1)との平均値をステップS43で算出し、その
平均値と現フレームのピッチ周期T(0) との大きさを次
式(7)に従い比較する(ステップS44)。
【0074】
【数4】
【0075】式(7)が成立する場合、現フレームf
(0) のピッチ周期T(0) は信頼できるものとして、ステ
ップS45に示すようにサブフレームピッチ周期予測値
STP(k) を算出するために現フレームf(0) のピッチ
周期T(0) を用いる。逆に、式(7)が成立しないとき
は、ステップS46で示すように先読み部frのピッチ
周期Trと過去のフレームf(-1)のピッチ周期T(-1)の
みを用いてサブフレームピッチ周期予測値STP(k) を
算出する。
【0076】(第6の実施形態)図16を用いて本発明
の第6の実施形態を説明する。図16において、入力端
子201、フレーム・サブフレーム構成部202および
ピッチ周期分析部203は、図1中の参照符号101〜
103を付した要素と同じであるので、ここでは説明を
省略する。
【0077】本実施形態の特徴は、本発明を適応符号帳
を用いた音声符号化方法に適用した点にある。適応符号
帳とは、過去の駆動信号系列を予め定められた範囲に含
まれる周期で繰り返して生成される複数の適応ベクトル
を格納したコードブックをいう。
【0078】サブフレームピッチ周期予測値算出部20
4では、ピッチ周期分析部203で求めたピッチ周期を
基に、各サブフレーム毎にサブフレームピッチ周期予測
値STP(k) を算出する。サブフレームピッチ周期予測
値STP(k) の算出法には、図6、図9、図12および
図14で説明した方法のいずれも適用可能である。ま
た、それによる効果は前述した通りである。ただし、図
6で説明した方法ではピッチ周期分析部203でのピッ
チ周期分析の中心が現フレームf(0) 上にあり、図9、
図12、図14で説明した方法ではピッチ周期分析の中
心は先読み部fr上にあるという違いはある。本実施形
態では、図6で説明した方法に基づいた場合の例につい
て説明する。
【0079】サブフレームピッチ周期予測値算出部20
4では、ピッチ周期分析部203で求めたピッチ周期T
(0) とf(-1)フレームのピッチ周期T(-1)とから補間に
よりサブフレームピッチ周期予測値STP(k) を求め
る。
【0080】探索範囲決定部205では、サブフレーム
ピッチ周期ST(0) を求める際の探索範囲、つまり適応
符号帳206に対する適応ベクトルの探索範囲を決定す
る。具体的には、サブフレームピッチ周期予測値STP
(0) を中心として±NR/2を探索範囲とする。すなわ
ち、STP(0) −NR/2≦t≦STP(0) +NR/2
−1の範囲に含まれる周期についてのみ探索を行う。探
索は、以下のような方法で行われる。
【0081】探索範囲決定部205で決定された探索範
囲に含まれるピッチ周期tに対応する適応ベクトルq
(t,n) を適応符号帳206から取り出し、これを聴感重
み付き合成フィルタ207に通して合成信号p(t,n) を
生成する。そして、この合成信号p(t,n) と、入力音声
信号を聴感重みフィルタ208に通して得られる目標信
号r(n) との寄与度cntb(t) を減算器209を介し
て歪算出部210で次式に従い算出する。
【0082】
【数5】
【0083】探索範囲に含まれるピッチ周期tの全候補
の中で、寄与度cntb(t) が最大となるときのピッチ
周期tをサブフレームピッチ周期ST(0) とし、サブフ
レームピッチ周期ST(0) からサブフレームピッチ周期
予測値STP(0) を差し引いた値を相対ピッチ周期ΔT
(0) とする。この相対ピッチ周期ΔT(0) を求める処理
を全てのサブフレームsf(k) について行い、全サブフ
レームの相対ピッチ周期ΔT(k) を求める。
【0084】最後に、出力端子212からピッチ周期分
析部203で求めたピッチ周期T(0) の情報を出力し、
出力端子211から歪算出部210で寄与度cntb
(t)が最大となるときの相対ピッチ周期ΔT(k) の情報
を出力する。
【0085】次に、本実施形態の処理手順を図17〜1
8に示すフローチャートを用いて説明する。図17〜1
8におけるステップS101、S102、S103、S
104、S114およびS115の処理は、図8におけ
るステップS11、S12、S13、S14、S16お
よびS17の処理と同じであるので、ここでは説明を省
略する。以下、本実施形態特有の処理について説明す
る。
【0086】ステップS105では、サブフレームsf
(k) の探索範囲を決定する。探索範囲は、前述したよう
にサブフレームピッチ周期予測値STP(k) を用いて定
められる。ステップS106で、変数cntbmaxと
サブフレームピッチ周期ST(k) の初期値を与える。c
ntbmaxには初期値になり得る十分に大きな値を与
え、ST(k) には最小ピッチ周期を与える。ステップS
107では、探索範囲に含まれる周期tに対応する適応
ベクトルq(t,n) を適応符号帳から選択し、ステップS
108で適応ベクトルq(t,n) を聴感重み付き合成フィ
ルタに通して合成信号p(t,n) を生成する。ステップS
109では、予め求めておいた目標信号r(n) と合成信
号p(t,n) との寄与度cntb(t) を算出し、ステップ
S110ではピッチ周期tにおける寄与度cntb(t)
とcntbmaxの大きさを比較する。
【0087】ここで、cntb(t) >cntbmaxが
成り立つ場合、ステップS111においてcntbma
xにcntb(t) を与え、ST(k) にtを与えてステッ
プS112に進む。cntb(t) >cntbmaxが成
り立たない場合、ステップS112に進む。
【0088】ステップS112では、探索範囲に含まれ
るピッチ周期tの候補を全て探索したか否かを判定し、
そうであればステップS113に進み、そうでなければ
ステップS107に戻って、まだ探索を行っていないピ
ッチ周期tを用いて処理を継続する。ステップS113
では、サブフレームsf(k) の相対ピッチ周期ΔT(k)
をサブフレームピッチ周期ST(k) とサブフレームピッ
チ周期予測値STP(k) を用いて算出し、ステップS1
14に進む。
【0089】(第7の実施形態)図19〜20のフロー
チャートを用いて本発明の第7の実施形態を説明する。
本実施形態と第6の実施形態との違いは、サブフレーム
ピッチ周期予測値の算出に図9で説明した方法を適用し
ている点にある。
【0090】本実施形態によると、前述したようにサブ
フレームピッチ周期予測値STP(k) の実際のピッチ周
期に対する正確性が向上するため、サブフレームsf
(k)のサブフレームピッチ周期ST(k) の探索範囲を小
さくでき、結果的に相対ピッチ周期ΔT(k) を表現する
のに必要なビット数および計算量を少なくすることがで
きるという効果がある。図19〜20において、ステッ
プS201およびS204〜S215の処理は、それぞ
れ図17〜18におけるステップS101およびS10
4〜S115の処理と同様であるので、ここでは説明を
省略する。
【0091】本実施形態で特徴的な処理は、ステップS
202とS203にある。ステップS202では、ピッ
チ周期分析の中心を先読み部に置いてピッチ周期を分析
している。ステップS203では、サブフレームピッチ
周期予測値STP(k) の算出を先読み部frのピッチ周
期Trとフレームf(0) のピッチ周期T(0) を用いて決
定するか、もしくはフレームf(0) のピッチ周期T(0)
とフレームf(-1)のピッチ周期T(-1)を用いて決定する
かのいずれか一方を用いている。
【0092】(第8の実施形態)図21〜22のフロー
チャートを用いて第8の実施形態を説明する。本実施形
態と第7の実施形態との違いは、サブフレームピッチ周
期予測値算出部に図12で説明した方法を適用している
点にある。
【0093】本実施形態によると、前述したように先読
み部の大きさを小さくできるため、遅延を短くすること
ができるという効果がある。図21〜22において、ス
テップS301、S302およびS304〜S315の
処理は、図19〜20におけるステップS201、S2
02およびS204〜S215の処理と同様であるの
で、ここでは説明を省略する。
【0094】本実施形態で特徴的な処理はステップS3
03にあり、このステップS303ではサブフレームピ
ッチ周期予測値STP(k) を先読み部frのピッチ周期
Trとフレームf(0) のピッチ周期T(0) を用いて算出
している。
【0095】(第9の実施形態)図23〜24のフロー
チャートを用いて本発明の第9の実施形態を説明する。
本実施形態と第8の実施形態との違いは、サブフレーム
ピッチ周期予測値算出部に図14で説明した方法を適用
している点にある。
【0096】本実施形態の方法を用いれば、前述したよ
うにフレームf(0) でのピッチ周期T(0) の分析が失敗
し実際のピッチ周期から大きく外れてしまった場合で
も、先読み部frで求めたピッチ周期Trとフレームf
(-1)のピッチ周期T(-1)とで補間を行うことでサブフレ
ームピッチ周期予測値STP(k) を正確に求めることが
でき、フレームf(0) のピッチ周期T(0) が正確に求ま
った場合と同様に効率的にピッチ周期を表現することが
できる。
【0097】図23〜24において、ステップS40
1、S402およびS407〜S418の処理は、図2
1〜22におけるステップS301、S302およびS
304〜S315の処理と同様であり、また図23〜2
4におけるステップS403〜S406の処理は、図1
5におけるステップS43〜S46の処理と同じである
ので、ここでは説明を省略する。
【0098】(第10の実施形態)図25を用いて本発
明の第10の実施形態を説明する。図25において入力
端子301、フレーム・サブフレーム構成部302、ピ
ッチ周期分析部303、サブフレームピッチ周期算出部
304、探索範囲決定部305、適応符号帳306、聴
感重み付き合成フィルタ307、聴感重みフィル30
8、減算器309、歪算出部310、出力端子311,
312は、図16中の参照符号201〜212を付した
要素と同一であるので、ここでは説明を省略する。本実
施形態の特徴は、ピッチ周期分析部303でのピッチ周
期の分析位置をピッチ周期分析位置決定部313によっ
て決定する点にある。
【0099】本実施形態の効果を図26を用いて説明す
る。同図のように入力音声信号の特性がフレーム内で変
化している場合、ピッチ周期分析位置が固定であると正
確なピッチ周期を求められないことがある。図26の場
合、ピッチ周期分析位置が固定のときのピッチ分析対象
の信号に周期成分が含まれていないことが正確なピッチ
周期を求めることができない原因になっている。しか
し、ピッチ分析位置を可変にできれば、図26に示すよ
うにピッチ周期成分を有する波形が存在する位置にピッ
チ周期分析位置を設定することができるので、正確なピ
ッチ周期を求めることが可能になる。ただし、この場合
にはピッチ周期分析位置を表すための付加情報が必要に
なる。
【0100】図25において、ピッチ周期分析部313
はピッチ周期分析位置を決定する。本実施形態では、入
力音声信号の短区間パワーもしくは低域通過フィルタを
通過した後の予測残差信号のパワーなどを指標にして、
そのパワーが大きくなる部分にピッチ周期分析位置を設
定する方法を用いている。そのピッチ周期分析位置の情
報をピッチ周期分析部303に送ると同時に、出力端子
314から出力する。ピッチ周期分析部303では、ピ
ッチ周期分析位置決定部313から送られてきたピッチ
周期分析位置の情報に従ってピッチ周期の分析を行う。
【0101】(第11の実施形態)図27を用いて本発
明の第11の実施形態を説明する。図27において、入
力端子401、フレーム・サブフレーム構成部402、
ピッチ周期分析部403、サブフレームピッチ周期算出
部404、探索範囲決定部405、適応符号帳406、
聴感重み付き合成フィルタ407、聴感重みフィルタ4
08、減算器409、歪算出部410、出力端子41
1,412は、図16中の参照符号201〜212を付
した要素と同じであるので、ここでは説明を省略する。
【0102】本実施形態の特徴は、ピッチ周期分析部4
03で求めたピッチ周期の変化が連続的であるか否かを
連続性判定部413で判定し、その判定結果に応じて適
応符号帳406の探索範囲を決定する点にある。すなわ
ち、本実施形態ではピッチ周期の変化が連続的であると
判定された場合、前述したようにサブフレームピッチ周
期予測値を求め、その値を基に探索範囲決定部405で
適応符号帳406の探索範囲を決定する。連続的でない
と判定されたなら、全探索部414で適応符号帳406
内の全候補について探索を行うようにしている。
【0103】本実施形態は、次のような効果を有する。
ピッチ周期分析部403で求めたピッチ周期が連続的に
変化している場合、これまで述べてきたようにピッチ周
期を補間してその周辺のみを探索する方法では効果的に
機能する。しかしながら、音声信号は常に安定してピッ
チ周期が変化しているわけではなく、ピッチ周期が大き
く変化する場合もあり、また無声部のようにピッチ成分
が存在しない場合もある。このようなとき、ピッチ周期
は連続的に変化しているという仮定の基に強制的に補間
して探索範囲を限定すると、深刻な品質劣化を招いてし
まう。このようにピッチ周期が連続的でない場合、本実
施形態では適応符号帳406の全候補を探索するように
切り替えることで、上述の問題を回避することができ
る。
【0104】また、全候補探索を行うかどうかをピッチ
周期分析部403で求めたピッチ周期Tのときの周期性
の強さに応じて切り替えても、同様の効果が得られる。
すなわち、式(6)のρ(T) で表されるようなピッチ周
期性の強さを表す変数が予め定められた閾値以下である
場合には、全探索部414で全候補を探索するようにス
イッチ415を切り替えることで、ピッチ周期が存在し
ない領域での劣化を回避することができる。
【0105】連続性判定部413では、ピッチ周期分析
部403で求めたピッチ周期を使ってピッチ周期の連続
性を判定する。本実施形態では、フレームf(0) で求め
たピッチ周期T(0) とフレームf(-1)で求めたピッチ周
期T(-1)とを使う場合について説明するが、先読み部f
rのピッチ周期Trとフレームf(0) のピッチ周期T
(0) を用いる場合、もしくは先読み部frのピッチ周期
Trとフレームf(-1)のピッチ周期T(-1)の連続性を用
いる場合、先読み部frのピッチ周期Trとフレームf
(0) のピッチ周期T(0) とフレームf(-1)のピッチ周期
T(-1)の連続性を用いる場合にも適用できる。ピッチ周
期の連続性は、次式(9)に従って判定される。
【0106】
【数6】
【0107】式(9)が成立する場合、ピッチ周期は連
続的に変化していると判定され、スイッチ415は探索
範囲決定部405の出力を選択して、これまで説明した
ように限定した探索範囲についてのみ適応符号帳406
の探索を行う。式(9)が成立しない場合、ピッチ周期
は連続的に変化していないと判定され、スイッチ415
は全探索部414を選択し、適応符号帳406内の全て
の候補について探索を行う。連続性判定部414の判定
結果は、出力端子416から出力される。さらに、連続
性判定部414からの出力がピッチ周期は連続的に変化
しているものではないというものであれば、ピッチ周期
分析部403で求めたピッチ周期は出力端子412から
出力する必要はない。
【0108】(第12の実施形態)図28を用いて本発
明の第12の実施形態を説明する。図28において、入
力端子501、フレーム・サブフレーム構成部502、
ピッチ周期分析部503、サブフレームピッチ周期算出
部504、適応符号帳506、聴感重み付き合成フィル
タ507、聴感重みフィルタ508、減算器509、歪
算出部510、出力端子511,512は、図16中の
参照符号201〜204、206〜212を付した要素
と同じであるので、ここでは説明を省略する。
【0109】本実施形態の特徴は、複数のサブフレーム
のサブフレームピッチ周期の変動を表す相対ピッチ周期
のパターン(相対ピッチパターンという)の複数個の集
合で構成される相対ピッチパターン符号帳505を有
し、複数のサブフレームの相対ピッチ周期をベクトルと
みなして、このベクトルと最も類似している相対ピッチ
パターン符号帳505内の相対ピッチパターンを選択す
るようにしている点にある。
【0110】本実施形態によると、次のような効果があ
る。サブフレーム毎に相対ピッチ周期ΔT(k) をスカラ
ー量子化すると、例えば前述のように探索範囲NR=8
とした場合、それを表現するのに3ビット必要になる。
すなわち、相対ピッチ周期ΔT(k) の情報を表すのに、
フレーム当たり3ビット×4サブフレーム=12ビット
だけ必要になる。
【0111】これに対し、本実施形態では出現頻度の高
い相対ピッチ周期のパターンを相対ピッチパターンとし
て持つ相対ピッチパターン符号帳505を有している。
ここで、仮に4つのサブフレーム(sf(0) 〜sf(3)
)の相対ピッチ周期ΔT(0)〜ΔT(3) で1ベクトル
(4次元)を表し、相対ピッチパターン符号帳505が
128(7ビット)種類の相対ピッチパターンで構成さ
れたとすると、本来4つのサブフレームの相対ピッチ周
期ΔT(k) を表すのに12ビット必要であったものが7
ビットで表されることになり、大幅なビット削減が達成
されるという利点がある。
【0112】相対ピッチパターン符号帳505は、次式
に示すように予め求めておいた代表的な相対ピッチパタ
ーンpv(j) をJ種類有している。 pv(j) ={v(j,k) ;k=0〜K-1 } (10) (0≦j≦J−1) 加算器513では、次式に示されるようにサブフレーム
ピッチ周期予測値STP(k) と第j番目の相対ピッチパ
ターンpv(j) とで加算を行い、K個のサブフレームの
ピッチ周期の組Tx(j) を求める。 Tx(j) =STP(k) +v(j,k) (11) このようにして求めたピッチ周期の組Tx(j) に基づい
て、K個のサブフレームにまたがる寄与度が最大となる
ときの相対ピッチパターンを閉ループ的に探索する。こ
のとき、適応符号帳506の内部状態はサブフレーム毎
に更新される。このときのサブフレーム数はK個に限定
されることはなく、2以上、K以下のサブフレーム数に
対する相対ピッチ周期を求めることができる。また、計
算量を削減するために、まず計算量の少ない簡単な指標
(例えば寄与度の分子項)によって相対ピッチパターン
の候補を限定し、その残った候補に対して正確な寄与度
を求めて最終的に1つの相対ピッチパターンを決定して
もよい。
【0113】(第13の実施形態)図29を用いて本発
明の第13の実施形態を説明する。図29において、入
力端子601、フレーム・サブフレーム構成部602、
ピッチ周期分析部603、サブフレームピッチ周期算出
部604、相対ピッチパターン符号帳605、適応符号
帳606、聴感重み付き合成フィルタ607、聴感重み
フィルタ608、減算器609、歪算出部610、出力
端子611,612、加算器613は、図20中の参照
符号501〜513を付した要素と同じであるので、こ
こでは説明を省略する。
【0114】本実施形態の特徴は、適応符号帳606と
ともに雑音符号帳614の影響を考慮に入れて相対ピッ
チパターンを決定する点にある。このような構成によ
り、さらに正確な相対ピッチパターンを決定することが
可能になる。
【0115】このとき、適応ベクトルに乗算器615で
乗じられるゲインは端子616より与えられる。このゲ
インは、次式で表される理想ゲインgopt、または、
ここでは図示していない適応ベクトルゲイン符号帳の中
で最も理想ゲインgoptに最も近い要素が用いられ
る。
【0116】
【数7】
【0117】ここで、r(n) は目標ベクトル、p(t,n)
はピッチ周期tにおける適応ベクトルを聴感重み付き合
成フィルタ607に通した信号を表す。
【0118】同様に、雑音ベクトルに乗算器617で乗
じられるゲインは端子618より与えられる。このゲイ
ンは、次式で表される理想ゲインbopt、または、こ
こでは図示していない雑音ベクトルゲイン符号帳の中で
最も理想ゲインboptに最も近い要素が用いられる。
【0119】
【数8】
【0120】ここで、t(n)は目標ベクトル、e(i,n)
はインデックスiにおける雑音ベクトルを聴感重み付き
合成フィルタ607に通した信号を表す。
【0121】複数サブフレームにまたがる寄与度が最大
となるときの相対ピッチパターンが決定されたときに、
出力端子611からそのときの相対ピッチパターンのイ
ンデックスが出力される。また、出力端子612から
は、ピッチ周期分析部603で求めたピッチ周期の情報
が出力される。
【0122】このとき、適応符号帳606の内部状態は
サブフレーム毎に更新される。このときのサブフレーム
数はK個に限定されず、2以上、K以下のサブフレーム
数に対する相対ピッチ周期を求めることができる。ま
た、計算量を削減するために、まず計算量の少ない簡単
な指標(例えば寄与度の分子項)によって相対ピッチバ
ターンの候補を限定し、その残った候補に対して正確な
寄与度を求めて最終的に1つの相対ピッチパターンを決
定してもよい。
【0123】(第14の実施形態)図30を用いて本発
明の第14の実施形態を説明する。本実施形態は、CE
LP方式のエンコーダ(音声符号化装置)に本発明を適
用した例である。また、本実施形態ではこれまで説明し
てきた実施形態をいくつか組み合わせた一つの代表的な
構成になっているが、これに限定されるものではなく、
様々な組み合わせをCELP方式に適用することができ
る。
【0124】図30においては、入力端子501からデ
ィジタル化された音声信号が入力され、フレーム・サブ
フレーム構成部502においてフレームとサブフレーム
が構成される。その後、フレーム・サブフレームに分割
された音声信号はLPC係数分析部521に与えられ、
LPC分析によってLPC係数が算出される。このLP
C係数は、聴感重みフィルタ508および聴感重み付き
合成フィルタ507の伝達関数を決定する際に利用され
る。
【0125】LPC係数分析部521で求められたLP
C係数は、LPC係数量子化部522において量子化さ
れ、量子化によって求められるインデックスはマルチプ
レクサ523に与えられ、後述する他の情報とともに多
重化される。また、量子化後に復号されたLPC係数
は、聴感重み付き合成フィルタ507の伝達関数を決定
する際に用いられる。
【0126】入力音声信号は、ピッチ周期分析位置決定
部525にも与えられる。ピッチ周期分析位置決定部5
25では、音声信号の予め定められた短区間のパワーを
規定個数求め、その中で短区間パワーが最も大きくなる
領域を表すインデックスをピッチ周期分析部503とマ
ルチプレクサ523に与える。ピッチ周期分析部503
では、ピッチ周期分析位置決定部525で決定された分
析位置を中心に音声信号、予測残差信号または低域通過
フィルタを通過後の予測残差信号等を用いてピッチ周期
の分析を行う。
【0127】ここで求めたピッチ周期と前フレーム処理
で求めたピッチ周期との連続性を連続性判定部526で
判定し、その判定結果をマルチプレクサ523に与え
る。判定の結果が連続であるとなった場合、ピッチ周期
分析部503で求めたピッチ周期をマルチプレクサ52
3に与えると共に、サブフレームピッチ周期予測値算出
部504においてサブフレーム毎のピッチ周期予測値を
求める。探索範囲決定部530では、サブフレームピッ
チ周期予測値を基にサブフレーム毎のピッチ周期探索範
囲を決定する。この場合、探索範囲決定部530で決定
された探索範囲に含まれるピッチ周期の適応ベクトルが
候補として選択される。
【0128】連続性判定部526の判定結果が連続でな
いとなった場合、全探索部527が選択されるようスイ
ッチ531を切り替え、適応符号帳528に含まれる全
て適応ベクトルが候補として選択される。この場合、ピ
ッチ周期分析部503で求めたピッチ周期はマルチプレ
クサ523に与える必要はない。
【0129】乗算器532では、適応符号帳528から
選択される適応ベクトルと適応ベクトルゲイン符号帳5
33から選択される適応ベクトルゲインとの積がとられ
る。乗算器534では同様に、雑音符号帳529から選
択される雑音ベクトルと雑音ベクトルゲイン符号帳53
5から選択される雑音ベクトルゲインとの積がとられ
る。加算器536では、乗算器532,534から得ら
れるそれぞれの信号の和をとり、駆動ベクトルを生成す
る。
【0130】このようにして生成された駆動ベクトルを
聴感重み付き合成フィルタ507に通して、合成ベクト
ルを生成する。減算器509では、音声信号を聴感重み
フィルタ508に通して得られる目標ベクトルと合成ベ
クトルとの差をとり、この差信号を基に歪算出部511
で歪を求める。この歪が最小となるときの適応ベクト
ル、適応ベクトルゲイン、雑音ベクトルおよび雑音ベク
トルゲインの組み合わせを効率的に探索する。
【0131】例えば、図31のフローチャートに示され
るように、サブフレーム毎に適応ベクトル、適応ベクト
ルゲイン、雑音ベクトル、雑音ベクトルゲインの順に直
列的に求めていく方法がある。また、図32のフローチ
ャートに示されるように、サブフレーム毎に適応ベクト
ルゲインと雑音ベクトルゲインをベクトル量子化によっ
て同時最適化を図る構成の場合には、適応ベクトル、雑
音ベクトル、ゲインベクトルの順に求める方法もある。
【0132】すなわち、図31ではまずステップS60
1でカウンタkを0に設定した後、ステップS602,
S603,S604,S605で適応ベクトル、適応ベ
クトルゲイン、雑音ベクトル、雑音ベクトルゲインを順
次求め、ステップS606でカウンタkを1だけインク
リメントする。ステップS607でカウンタkがKに一
致しているかどうかの判定を行う。一致していなけれ
ば、ステップS602に戻って処理を継続し、一致した
ならば処理は終了する。
【0133】また、図32ではまずステップS701で
カウンタkを0に設定した後、ステップS702,S7
03,S704で適応ベクトル、雑音ベクトル、ゲイン
ベクトル(適応ベクトルゲインと雑音ベクトルゲイン)
を順次求め、ステップS705でカウンタkを1だけイ
ンクリメントする。ステップS706でカウンタkがK
に一致しているかどうかの判定を行う。一致していなけ
れば、ステップS702に戻って処理を継続し、一致し
たならば処理は終了する。
【0134】このようにして歪が最小となるときの適応
ベクトル、適応ベクトルゲイン、雑音ベクトル、雑音ベ
クトルゲインを表すインデックスをマルチプレクサ52
3に与える。連続性判定部526において連続であると
判定されている場合、適応ベクトルのインデックスはサ
ブフレームピッチ周期予測値に対する相対値として表さ
れる。
【0135】マルチプレクサ523では、連続性判定部
526の判定結果が連続である場合とそうでない場合と
で多重化する対象が異なる。すなわち、連続性判定部5
26の判定結果が連続である場合、LPC係数量子化部
522で求めたLPC係数インデックス、ピッチ周期分
析位置決定部525で求めた分析位置インデックス、連
続性判定部526で求めた判定情報、ピッチ周期分析部
503で求めたピッチ周期情報、適応ベクトルのサブフ
レームピッチ周期予測値に対する相対値、適応ベクトル
ゲインのインデックス、雑音ベクトルインデックスおよ
び雑音ベクトルゲインのインデックスを多重化して符号
化データ出力端子524から符号化データとして出力す
る。一方、連続性判定部526の判定結果が連続でない
場合、LPC係数量子化部522で求めたLPC係数イ
ンデックス、連続性判定部526で求めた判定情報、適
応ベクトルのインデックス、適応ベクトルゲインのイン
デックス、雑音ベクトルのインデックスおよび雑音ベク
トルゲインのインデックスを多重化して出力端子524
から出力する。
【0136】(第15の実施形態)図33を用いて本発
明の第15の実施形態を説明する。本実施形態は本発明
をCELP方式のデコーダ(音声復号化装置)に適用し
た例を示している。本実施形態は、これまで説明した実
施形態をいくつか組み合わせて構成されたCELPエン
コーダ部に対応するデコーダ部を表しているが、これに
限定されるものではなく、様々な組み合せにより構成さ
れるCELPエンコーダ部に対応するデコーダ部に適用
することができる。
【0137】入力端子801から多重化された符号化デ
ータが入力され、デマルチプレクサ802において種々
のパラメータのインデックスに変換される。LPC係数
復号部811では、LPC係数インデックスを基にLP
C係数を復号し、合成フィルタ812に与える。サブフ
レームピッチ周期生成部803では、ピッチ周期に関連
する情報が与えられ、適応符号帳804で用いられるピ
ッチ周期を生成する。このピッチ周期の生成についての
詳細は、図34を用いて後述する。
【0138】ここで生成されたピッチ周期を指標とし
て、適応符号帳804から適応ベクトルを求める。この
適応ベクトルに、適応ベクトルゲインインデックスを指
標にして適応ベクトルゲイン符号帳805から求められ
た適応ベクトルゲインを乗算器806で乗じる。同様
に、雑音符号帳807から雑音ベクトルインデックスを
指標にして求められた雑音ベクトルに、雑音ベクトルゲ
インインデックスを指標に雑音ベクトルゲイン符号帳8
08から求められた雑音ベクトルゲインを乗算器809
で乗じる。
【0139】これら乗算後の2つの信号を加算器810
で加算して駆動信号を生成し、合成フィルタ812に駆
動信号を与えて合成信号を生成する。この合成信号をポ
ストフィルタ813に入力し、ホルマン卜強調、ピッチ
強調、ゲイン調整などの聴感的な改善を施した後、出力
端子815より出力する。
【0140】次に、図34を用いてサブフレームピッチ
周期生成部803の説明を行う。入力端子901からピ
ッチ周期の連続性の判定情報が入力され、その情報に応
じてスイッチ904とスイッチ911を切り替える。ピ
ッチ周期の連続性判定情報が「不連続」を表す揚合、入
力端子902からはサブフレーム毎のピッチ周期インデ
ックスが入力され、スイッチ904を経由してサブフレ
ームピッチ周期復号部910でサブフレームピッチ周期
が復号され、スイッチ911を経由して出力端子912
から出力される。
【0141】ピッチ周期の連続性判定情報が「連続」を
表す揚合、入力端子902からはピッチ周期分析位置イ
ンデックス、ピッチ周期インデックス、相対ピッチ周期
インデックスが与えられ、スイッチ904を経由してそ
れぞれピッチ周期分析位置復号部905、ピッチ周期復
号部906および相対ピッチ周期復号部907にそれぞ
れ与えられる。その結果求められる、ピッチ周期分析位
置およびピッチ周期を用いてサブフレームピッチ周期予
測値算出部908でサブフレームピッチ周期予測値を求
める。サブフレームピッチ周期算出部909では、サブ
フレームピッチ周期予測値と相対ピッチ周期とを用いて
サブフレームピッチ周期を算出し、スイッチ911を経
由して出力端子912より出力する。
【0142】図35に、本発明に係る音声符号化/復号
化方法を実現するコンピュータシステムの構成を示す。
このコンピュータシステムは例えばパーソナルコンピュ
ータであり、演算処理を司るCPU1001と、キーボ
ード、ポインティングデバイスおよびマイクロフォンな
どの入力部1002と、ディスプレイおよびスピーカな
どの出力部1003と、主記憶としてのROM1004
およびRAM1005と、外部記憶装置としてのハード
ディスク装置1006、フロッピディスク装置1007
および光ディスク装置1008をバス1009により接
続して構成されている。
【0143】ここで、ハードディスク装置1006、フ
ロッピディスク装置1007および光ディスク装置10
08のいずれかの記録媒体に、上述した実施形態で説明
した音声符号化処理を実行するためのプログラムおよび
符号化データが格納される。そして、このプログラムに
従って入力部1001から入力される入力音声信号に対
してCPU1001で音声符号化処理が行われ、また記
録媒体から読み出された符号化データに対してCPU1
001により音声復号化処理が行われ、出力部1003
から出力される。このようにすることにより、通常のパ
ーソナルコンピュータを用いて本発明の音声符号化/復
号化処理を実施することができる。
【0144】本発明は、以下のように種々変形して実施
することができる。 (1)以上の実施形態では、サブフレームピッチ周期予
測値を求める方法として補間もしくは外挿を用いたが、
これに限定されるものではなく、例えば予測に用いるピ
ッチ周期の数を増やして予測の精度を向上させたり、高
次の関数やスプライン関数といったより高度な予測を行
うことも可能である。こうすることにより、サブフレー
ムピッチの実測値と予測値との誤差が減少し、より少な
い情報量でサブフレームピッチ周期を表すことができ
る。
【0145】(2)ピッチ周期分析部で求めたピッチ周
期を量子化する際に、過去に求めたピッチ周期で予測し
て、その予測値との差分を量子化することにより量子化
効率を向上させることもできる。
【0146】(3)サブフレームピッチ周期予測値から
探索範囲を決定する際に、サブフレームピッチ周期予測
値の近傍にのみ設定するのではなく、サブフレームピッ
チ周期予測値の整数倍の近傍もしくは整数分の1の近傍
に設定することもできる。
【0147】(4)聴感重みフィルタの一構成要素であ
るピッチフィルタのピッチ周期の算出を目的として、こ
れまで説明してきた実施形態を適用してもよい。同様
に、ここでは明示していないポストフィルタの一構成要
素であるピッチフィルタのピッチ周期の算出を目的とし
て、これまで説明してきた実施形態を適用してもよい。
その場合、付加情報は必要がないので、容易に音声符号
化装置に適用できる。
【0148】(5)以上述べてきた実施形態による音声
符号化方法をフレーム単位で切り替えて使用してもよ
い。その場合、どの実施形態の方法を使用したかを表す
ための付加情報が新たに必要となる。
【0149】
【発明の効果】以上説明したように、本発明の音声符号
化方法によれば、合成音の品質を維持しつつ、サブフレ
ームピッチ周期を探索する際の計算量を削減することが
できるとともに、サブフレームピッチ周期の情報を表す
ためのビット数を効果的に削減することができる。
【0150】すなわち、本発明の音声符号化方法では、
現フレーム、過去のフレームおよび未来のフレームのう
ちの少なくとも二つのフレームのピッチ周期を用いて、
補間により現フレームのサブフレームのサブフレームピ
ッチ周期予測値を求め、このサブフレームピッチ周期予
測値を用いてサブフレームピッチ周期を決定することに
よって、フレーム内でピッチ周期が変動しても、複数の
ピッチ周期からサブフレームピッチ周期予測値を予測す
ることで精度の良い予測が可能となり、サブフレームピ
ッチ周期を求めるための計算量およびその情報を表現す
るビット数を削減することができる。
【図面の簡単な説明】
【図1】 本発明の基本原理を説明するための図
【図2】 本発明に係る音声符号化方法におけるピッチ
周期分析の基本動作を説明するためのブロック図
【図3】 フレーム構造とサブフレーム構造を示す図
【図4】 本発明の第2の実施形態に係る音声符号化方
法を説明するためのブロック図
【図5】 第2の実施形態におけるサブフレームピッチ
抽出部の構成を示すブロック図
【図6】 第2の実施形態におけるサブフレームピッチ
周期の算出方法を説明するための図
【図7】 第2の実施形態におけるサブフレームピッチ
周期の算出方法を説明するための図
【図8】 第2の実施形態におけるサブフレームピッチ
周期算出の処理手順を説明するためのフローチャート
【図9】 本発明の第3の実施形態におけるサブフレー
ムピッチ周期の算出方法を説明するための図
【図10】 第3の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
【図11】 第3の実施形態の効果を説明するための図
【図12】 本発明の第4の実施形態におけるサブフレ
ームピッチ周期算出方法を説明するための図
【図13】 第4の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
【図14】 本発明の第5の実施形態におけるサブフレ
ームピッチ周期算出方法を説明するための図
【図15】 第5の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
【図16】 本発明の第6の実施形態に係る音声符号化
方法を説明するためのブロック図
【図17】 第6の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の一部を示す図
【図18】 第6の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
【図19】 本発明の第7の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
【図20】 第7の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
【図21】 本発明の第8の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
【図22】 第8の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
【図23】 本発明の第9の実施形態におけるサブフレ
ームピッチ周期算出の処理手順を説明するためのフロー
チャートの一部を示す図
【図24】 第9の実施形態におけるサブフレームピッ
チ周期算出の処理手順を説明するためのフローチャート
の他の一部を示す図
【図25】 本発明の第10の実施形態に係る音声符号
化方法を説明するためのブロック図
【図26】 第10の実施形態の効果を説明するための
【図27】 本発明の第11の実施形態に係る音声符号
化方法を説明するためのブロック図
【図28】 本発明の第12の実施形態に係る音声符号
化方法を説明するためのブロック図
【図29】 本発明の第13の実施形態に係る音声符号
化方法を説明するためのブロック図
【図30】 本発明の音声符号化方法をCELP方式に
適用した第14の実施形態に係る音声符号化装置の構成
を示すブロック図
【図31】 第14の実施形態における適応ベクトル、
適応ベクトルゲイン、雑音ベクトルおよび雑音ベクトル
ゲインを求める手順を説明するためのフローチャート
【図32】 第14の実施形態における適応ベクトル、
雑音ベクトルおよびゲインベクトルを求める手順を説明
するためのフローチャート
【図33】 本発明の音声復号化方法をCELP方式に
適用した第15の実施形態に係る音声復号化装置の構成
を示すブロック図
【図34】 第15の実施形態におけるサブフレームピ
ッチ周期生成部の構成を示すブロック図
【図35】 本発明に係る音声符号化/復号化方法を実
現するコンピュータシステムの構成を示すブロック図
【符号の説明】
11…音声信号入力端子 12…フレーム構成部 13…ピッチ周期分析部 14…ピッチ周期情報出力端子 21…音声信号入力端子 22…フレーム・サブフレーム構成部 23…ピッチ周期分析部 24…サブフレームピッチ周期抽出部 25…サブフレームピッチ周期情報出力端子 201,301,401,501,601…音声信号入
力端子 202,302,402,502,602…フレーム・
サブフレーム構成部 203,303,403,503,603…ピッチ周期
分析部 204,304,404,504,604…サブフレー
ムピッチ周期予測値算出部 205,305,405,530…探索範囲決定部 206,306,406,506,528,606…適
応符号帳 207,307,407,507,607…聴感重み付
き合成フィルタ 208,308,408,508,608…聴感重みフ
ィルタ 209,309,409,509,609…減算器 210,310,410,510,610…歪算出部 211,311,411,511,611…歪最小時の
相対ピッチ周期情報出力端子 212,312,412,512,612…ピッチ周期
情報出力端子 313,525…ピッチ周期分析位置決定部 314…ピッチ周期分析位置情報出力端子 413,526…連続性判定部 414,527…全探索部 415,531…スイッチ 416…連続性判定結果出力端子 505,605…相対ピッチパターン符号帳 513,536,613,619…加算器 521…LPC係数分析部 522…LPC係数量子化部 523…マルチプレクサ 524…符号化データ出力端子 529,614…雑音符号帳 532,534,615,617…乗算器 533…適応ベクトル符号帳 535…適応ベクトルゲイン符号帳 801…符号化データ入力端子 802…デマルチプレクサ 803…サブフレームピッチ周期生成部 804…適応符号帳 805…適応ベクトルゲイン符号帳 806,809…乗算器 807…雑音符号帳 808…雑音ベクトルゲイン符号帳 810…加算器 811…LPC係数復号部 812…合成フィルタ 813…ポストフィルタ 814…音声信号出力端子

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】入力音声信号を予め定められた長さのフレ
    ームに分割し、入力音声信号のピッチ周期を求める処理
    を含む符号化処理を行う音声符号化方法において、 符号化しようとする現フレームに対して時間的に未来の
    フレームのピッチ周期を求める処理と、このピッチ周期
    を符号化する処理とを含むことを特徴とする音声符号化
    方法。
  2. 【請求項2】入力音声信号を予め定められた長さのフレ
    ームに分割し、各フレームの音声信号をさらにサブフレ
    ームに分割して、音声信号のピッチ周期を求める処理を
    含む符号化処理を行う音声符号化方法において、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームのピッチ周期を求めることを特徴とする音声符号化
    方法。
  3. 【請求項3】前記現フレーム中のサブフレームのピッチ
    周期を符号化することを特徴とする請求項2記載の音声
    符号化方法。
  4. 【請求項4】入力される音声信号のピッチ周期成分を抑
    圧または強調するピッチフィルタを有し、前記現フレー
    ム中のサブフレームのピッチ周期を用いて該ピッチフィ
    ルタの伝達関数を決定することを特徴とする請求項2記
    載の音声符号化方法。
  5. 【請求項5】過去の駆動信号系列を予め定められた範囲
    に含まれる周期で繰り返して生成される複数の適応ベク
    トルを格納した適応符号帳を有し、この適応符号帳から
    取り出される適応ベクトルを所定のフィルタに通して得
    られる信号と目標ベクトルとの誤差が最小となる周期の
    適応ベクトルを所定の探索範囲から探索する処理を含む
    音声符号化方法において、 入力音声信号を予め定められた長さのフレームに分割
    し、各フレームの音声信号をさらにサブフレームに分割
    した後、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームについての前記探索範囲を決定することを特徴とす
    る音声符号化方法。
  6. 【請求項6】前記フレームのピッチ周期を求める際、フ
    レーム毎にピッチ周期の分析位置を適応的に決定するこ
    とを特徴とする請求項2〜5のいずれか1項記載の音声
    符号化方法。
  7. 【請求項7】ピッチ周期の連続性に応じて、現フレーム
    中のサブフレームのピッチ周期を求める方法を選択する
    ことを特徴とする請求項2〜6のいずれか1項記載の音
    声符号化方法。
  8. 【請求項8】複数のサブフレームのピッチ周期の変動を
    表す相対ピッチパターンを複数個格納した相対ピッチパ
    ターン符号帳をさらに有し、 サブフレームのピッチ周期の変化を該相対ピッチパター
    ン符号帳から所定の指標に基づいて選択した一つの相対
    ピッチパターンによって表すことを特徴とする請求項2
    〜7のいずれか1項記載の音声符号化方法。
  9. 【請求項9】入力音声信号を予め定められた長さのフレ
    ームに分割し、入力音声信号のピッチ周期を求める処理
    を含む符号化処理を行う音声符号化装置において、 符号化しようとする現フレームに対して時間的に未来の
    フレームのピッチ周期を求める手段と、 この手段により求められたピッチ周期を符号化する手段
    とを有することを特徴とする音声符号化装置。
  10. 【請求項10】入力音声信号を予め定められた長さのフ
    レームに分割し、各フレームの音声信号をさらにサブフ
    レームに分割して、音声信号のピッチ周期を求める処理
    を含む符号化処理を行う音声符号化装置において、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求めるサブフレームピ
    ッチ周期予測値算出手段と、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームのピッチ周期を求めるサブフレームピッチ周期算出
    手段とを有することを特徴とする音声符号化装置。
  11. 【請求項11】過去の駆動信号系列を予め定められた範
    囲に含まれる周期で繰り返して生成される複数の適応ベ
    クトルを格納した適応符号帳を有し、この適応符号帳か
    ら取り出される適応ベクトルを所定のフィルタに通して
    得られる信号と目標ベクトルとの誤差が最小となる周期
    の適応ベクトルを所定の探索範囲から探索する処理を含
    む音声符号化装置において、 入力音声信号を予め定められた長さのフレームに分割
    し、各フレームの音声信号をさらにサブフレームに分割
    する手段と、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求めるサブフレームピ
    ッチ周期予測値算出手段と、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームについての前記探索範囲を決定する探索範囲決定手
    段とを有することを特徴とする音声符号化装置。
  12. 【請求項12】入力音声信号を予め定められた長さのフ
    レームに分割し、入力音声信号のピッチ周期を求める処
    理を含む音声符号化処理を行うためのプログラムを記録
    したコンピュータ読み取り可能な記録媒体であって、 符号化しようとする現フレームに対して時間的に未来の
    フレームのピッチ周期を求める処理と、このピッチ周期
    を符号化する処理とを実行するためのプログラムを記録
    した記録媒体。
  13. 【請求項13】入力音声信号を予め定められた長さのフ
    レームに分割し、各フレームの音声信号をさらにサブフ
    レームに分割して、音声信号のピッチ周期を求める処理
    を含む音声符号化処理を行うためのプログラムを記録し
    たコンピュータ読み取り可能な記録媒体であって、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームのピッチ周期を求める処理を実行するためのプログ
    ラムを記録した記録媒体。
  14. 【請求項14】過去の駆動信号系列を予め定められた範
    囲に含まれる周期で繰り返して生成される複数の適応ベ
    クトルを格納した適応符号帳を有し、この適応符号帳か
    ら取り出される適応ベクトルを所定のフィルタに通して
    得られる信号と目標ベクトルとの誤差が最小となる周期
    の適応ベクトルを所定の探索範囲から探索する処理を含
    む音声符号化処理を行うためのプログラムを記録したコ
    ンピュータ読み取り可能な記録媒体であって、 入力音声信号を予め定められた長さのフレームに分割
    し、各フレームの音声信号をさらにサブフレームに分割
    した後、 符号化しようとする現フレームと現フレームに対して過
    去のフレームおよび未来のフレームのうちの少なくとも
    二つのフレームのピッチ周期を用いて現フレーム中のサ
    ブフレームのピッチ周期予測値を求め、 このピッチ周期予測値を用いて現フレーム中のサブフレ
    ームについての前記探索範囲を決定する処理を実行する
    ためのプログラムを記録した記録媒体。
JP15555297A 1997-01-23 1997-06-12 音声符号化方法および装置 Expired - Fee Related JP3435310B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP15555297A JP3435310B2 (ja) 1997-06-12 1997-06-12 音声符号化方法および装置
US09/012,792 US6202046B1 (en) 1997-01-23 1998-01-23 Background noise/speech classification method
US09/726,562 US6704702B2 (en) 1997-01-23 2000-12-01 Speech encoding method, apparatus and program
US10/675,947 US7191120B2 (en) 1997-01-23 2003-10-02 Speech encoding method, apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15555297A JP3435310B2 (ja) 1997-06-12 1997-06-12 音声符号化方法および装置

Publications (2)

Publication Number Publication Date
JPH113098A true JPH113098A (ja) 1999-01-06
JP3435310B2 JP3435310B2 (ja) 2003-08-11

Family

ID=15608564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15555297A Expired - Fee Related JP3435310B2 (ja) 1997-01-23 1997-06-12 音声符号化方法および装置

Country Status (1)

Country Link
JP (1) JP3435310B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002059877A1 (fr) * 2001-01-25 2002-08-01 Sony Corporation Appareil de traitement de donnees
WO2002059876A1 (fr) * 2001-01-25 2002-08-01 Sony Corporation Appareil de traitement de donnees
JP2007279754A (ja) * 1999-08-23 2007-10-25 Matsushita Electric Ind Co Ltd 音声符号化装置
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
JP2009003387A (ja) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JP5314771B2 (ja) * 2010-01-08 2013-10-16 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734286B2 (ja) * 1999-08-23 2011-07-27 パナソニック株式会社 音声符号化装置
JP2007279754A (ja) * 1999-08-23 2007-10-25 Matsushita Electric Ind Co Ltd 音声符号化装置
WO2002059876A1 (fr) * 2001-01-25 2002-08-01 Sony Corporation Appareil de traitement de donnees
US7269559B2 (en) 2001-01-25 2007-09-11 Sony Corporation Speech decoding apparatus and method using prediction and class taps
US7467083B2 (en) 2001-01-25 2008-12-16 Sony Corporation Data processing apparatus
WO2002059877A1 (fr) * 2001-01-25 2002-08-01 Sony Corporation Appareil de traitement de donnees
WO2008155919A1 (ja) * 2007-06-21 2008-12-24 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
JP2009003387A (ja) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JP5314771B2 (ja) * 2010-01-08 2013-10-16 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
US9812141B2 (en) 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10049680B2 (en) 2010-01-08 2018-08-14 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10049679B2 (en) 2010-01-08 2018-08-14 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
US10056088B2 (en) 2010-01-08 2018-08-21 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals

Also Published As

Publication number Publication date
JP3435310B2 (ja) 2003-08-11

Similar Documents

Publication Publication Date Title
US6704702B2 (en) Speech encoding method, apparatus and program
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JPH08263099A (ja) 符号化装置
JPH09281998A (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JPH0990995A (ja) 音声符号化装置
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
EP1005022B1 (en) Speech encoding method and speech encoding system
JP4550176B2 (ja) 音声符号化方法
EP1367565A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH10177398A (ja) 音声符号化装置
JP3435310B2 (ja) 音声符号化方法および装置
JP3888097B2 (ja) ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
JP3299099B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3249144B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH06131000A (ja) 基本周期符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3471542B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JPH0511799A (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees