JP4935329B2

JP4935329B2 - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Info

Publication number: JP4935329B2
Application number: JP2006325696A
Authority: JP
Inventors: 博康井手
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2006-12-01
Filing date: 2006-12-01
Publication date: 2012-05-23
Anticipated expiration: 2026-12-01
Also published as: JP2008139562A

Description

本発明は、分析合成型の音声圧縮復元を実行する際に必要となる、音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラムに関する。

移動体通信の分野においては、利用者の増加に対処する等の理由から、低ビットレート（8kbps程度）の音声の圧縮符号化方法が求められている。例えば、8kbpsの音声符号化方法として、ITU-T勧告G.729に示される音声符号化方法がある。該勧告に係る音声符号化方法は、基本的には、音声信号を予測分析により予測係数と残差信号とに分解してから送信する方法である。予測分析としては、例えば、線型予測分析や、ＭＬＳＡ（Mel Log Spectrum Approximation）分析（例えば、非特許文献１参照。）が知られている。

今井聖、住田一男、古市千枝子著「音声合成のためのメル対数スペクトル近似（ＭＬＳＡ）フィルタ」、電子通信学会論文誌、第Ｊ６６−Ａ巻、第２号、ｐ．１２２−１２９、１９８３年

分析合成型の符号化及び復号において上述の低ビットレート通信を可能にするためには、符号化装置側から復号装置側へ、いかに残差信号に関する情報を効率的に伝達するか、に、工夫が必要となる。残差信号は情報量が多いため、そのまま送信すると、オーバーフローしてしまうからである。

かかる工夫のひとつとして、典型的な残差信号を集めた符号帳を符号化側の装置（送信機）と復号側の装置（受信機）とで共有し、前者の装置から後者の装置に向けて、符号帳から選択された残差信号がどれであるかを伝えることが行われている。しかし、音質改善のために動的な符号帳を用いた場合、送信機と受信機との間で符号帳のミスマッチが生じ得るという問題がある。

なお、送信機で生成された残差信号は、受信機においては音声再生のための励起信号として使われる。つまり、残差信号という用語と励起信号という用語とは、局面によって使い分けがなされるに過ぎず、実体としては同じものを指す。よって、以下では、両用語の使い方には拘泥しない。

上述の符号帳を用いることなく、残差信号に関する情報を効率的に伝達するための工夫として、送信機が残差信号を周波数変換してから符号化することが考えられる。

しかし、例えば音声が子音の場合には、残差信号は雑音としての性質を顕著に有することが多く、このようなときにまで一律に周波数変換係数を受信機に伝達することには無駄が多い。すなわち、限られた送信容量を効率的に利用することができない。

本発明は、上記実情に鑑みてなされたもので、音声圧縮復号技術において、残差信号を複数の帯域に分割し、雑音帯域については主にその旨を示すフラグを送信対象とし、非雑音帯域については周波数変換係数を送信対象とすることにより、残差信号に関する情報を効率的に伝達しつつ、再生音声の品質を十分に確保するような、音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラムを提供することを目的とする。

上記目的を達成するために、この発明の第１の観点に係る音声符号化装置は、
音声信号を予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成部と、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別部と、
前記雑音判別部により雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成部と、
前記雑音判別部により雑音帯域ではないと判別された前記帯域の前記帯域別残差信号を実時間領域において重ね合わせてから周波数変換して、非雑音帯域における周波数変換係数を生成する非雑音帯域変換部と、
前記予測分析部で得られた予測係数と前記フラグ生成部で得られたフラグとゲインと前記非雑音帯域変換部で生成された周波数変換係数とを符号化する符号化部と、
を備える。

残差信号を複数の帯域に分割し、雑音帯域については原則としてその旨を示すフラグのみを送信対象とし、非雑音帯域については周波数変換係数を送信対象とすることにより、残差信号に関する情報の効率的な伝達と、再生音声の品質の確保と、を両立させることができる。

上記目的を達成するために、この発明の第２の観点に係る音声符号化装置は、
音声信号を予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号を周波数変換して周波数変換係数を生成する全帯域変換部と、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成部と、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別部と、
前記雑音判別部により雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成部と、
前記全帯域変換部で得られた周波数変換係数から、前記雑音判別部により雑音帯域ではないと判別された前記帯域の周波数変換係数を集計する集計手段と、
前記予測分析部で得られた予測係数と前記フラグ生成部で得られたフラグとゲインと前記集計手段で集計された周波数変換係数とを符号化する符号化部と、
を備える。

残差信号を帯域別残差信号に分割する前に周波数変換係数を全帯域に渡って一括して求めるので、帯域フィルタの分解能等の性能に関係なく高い精度で周波数変換係数を求めることができる。

前記雑音判別部は、例えば、前記帯域毎に前記帯域別残差信号の自己相関関数の形状に基づき該帯域が雑音帯域か否かを判別する。

このようにすると、後に詳しく述べるように、所定の基準を採用することにより、容易に有声無声判別ができる。

前記予測分析部は、例えば、ＭＬＳＡ（Mel Log Spectrum Approximation）分析により前記予測係数としてＭＬＳＡフィルタ係数を求め、該ＭＬＳＡフィルタ係数により定義される逆フィルタを用いて前記残差信号を求める。

前記予測分析部は、あるいは例えば、線形予測分析により前記予測係数として線形予測係数を求め、該線型予測係数により定義される逆フィルタを用いて前記残差信号を求める。

上記目的を達成するために、この発明の第３の観点に係る音声復号装置は、
予測分析により音声信号から生成された予測係数、該予測分析により該音声信号から生成された残差信号の特定の帯域が雑音帯域であることを示すフラグ、雑音帯域における帯域別残差信号のゲイン、及び、非雑音帯域における周波数変換係数、が符号化された結果である符号を受信する受信部と、
前記符号から、前記予測係数、前記フラグ、前記ゲイン、及び、前記非雑音帯域における周波数変換係数、を復号する復号部と、
前記フラグにより雑音帯域であることが示されている帯域において帯域毎に前記ゲインにより振幅が調整された雑音列を生成する雑音列生成部と、
前記フラグにより雑音帯域であることが示されている帯域においては当該帯域における周波数変換係数を全て０として記憶し、前記非雑音帯域においては前記復号された周波数変換係数を記憶することで全帯域の周波数変換係数を生成し、この生成された周波数変換係数をスペクトル逆変換して非雑音帯域における残差信号を求める逆変換部と、
前記雑音列生成部で生成された雑音列と前記逆変換部で求められた非雑音帯域における残差信号とを重ね合わせて復元残差信号を生成する残差信号復元部と、
前記復号部で復号された予測係数と前記残差信号復元部で生成された復元残差信号とを合成することにより復元音声信号を生成する合成部と、
を備える。

本発明によれば、分析合成型の音声信号通信において、情報伝達量を抑えつつ、再生音声の音質を向上させることができる。

以下、本発明の実施の形態に係る音声符号化装置及び音声復号装置について詳細に説明する。音声符号化装置の機能構成例として３種類（それぞれ実施形態１、実施形態２、実施形態３、とする。）を、音声復号装置の機能構成例として２種類（それぞれ実施形態４、実施形態５とする。）を挙げ、さらに、これらの機能構成例を実現するための物理的な構成例として音声符号化兼復号装置（実施形態６とする。）を挙げる。なお、これらの実施形態を順次記述するにあたっては、原則として、同一の部材については同一の符号を付すこととし、その説明を省略する。

なお、実施形態１乃至実施形態３に係る音声符号化装置が送信する信号は、本質的には同じものである。また、実施形態４及び実施形態５に係る音声復号装置が受信する信号は、本質的には同じものである。よって、実施形態６に係る音声符号化兼復号装置としては、上述の音声符号化装置と音声復号装置を任意に組み合わせたものを想定してよい。

（実施形態１）
図１は、本実施形態に係る音声符号化装置１１１の機能構成図である。

音声符号化装置１１１は、図示するように、マイクロフォン１２１と、Ａ／Ｄ変換部１２３と、予測分析部１２５と、帯域フィルタ部１２７と、雑音判別部１２９と、符号化用Ａスイッチ部１３１と、フラグ及びゲイン生成部１３３と、集計変換部１３５と、符号化部１３７と、送信部１３９と、を備える。

予測分析部１２５は、予測分析用逆フィルタ算出器１４１を内蔵している。

帯域フィルタ部１２７は、第１帯域フィルタ１４３と、第２帯域フィルタ１４５と、図１では省略するが、第３帯域フィルタ以降の必要な帯域フィルタと、を備える。

雑音判別部１２９は、第１雑音判別器１４７と、第２雑音判別器１４９と、図１では省略するが、第３雑音判別器以降の必要な雑音判別器と、を備える。

符号化用Ａスイッチ部１３１は、第１Ａスイッチ１５１と、第２Ａスイッチ１５３と、図１では省略するが、第３Ａスイッチ以降の必要なＡスイッチと、を備える。

フラグ及びゲイン生成部１３３は、第１フラグ生成及び第１ゲイン算出器１５５と、第２フラグ生成及び第２ゲイン算出器１５７と、図１では省略するが、第３フラグ生成及び第３ゲイン算出器以降の必要なフラグ生成及びゲイン算出器と、を備え、フラグ及び雑音ゲイン集計器１５９をさらに備える。

集計変換部１３５は、非雑音残差信号集計器１６１と、スペクトル変換器１６３と、非雑音帯域切り出し器１６２と、を備える。

マイクロフォン１２１に入力されたアナログ音声信号は、Ａ／Ｄ変換部１２３により、例えば16kHzサンプリングにより、デジタル音声信号に変換されてから、予測分析部１２５に引き渡される。予測分析部１２５は、引き渡されたデジタル音声信号に、線型予測分析やＭＬＳＡ（Mel Log Spectrum Approximation）分析等の予測分析を施す。予測分析部１２５は、該デジタル音声信号を、所定の時間区間（例えば5ms）に区切って、S_i={s_i、0、・・・、s_i、l-1}(0≦i≦M-1)という形にした後、各時間区間について、予測係数、例えば、線型予測係数やＭＬＳＡ係数、を算出する。続いて、該予測係数から、予測分析用逆フィルタ算出器１４１により、予測分析用逆フィルタを求める。次に、デジタル音声信号S_iが該予測分析用逆フィルタに入力された結果として、残差信号D_i={d_i、0、・・・、d_i、l-1}(0≦i≦M-1)が求まる。このように、予測分析部１２５は、デジタル音声信号を、予測係数と残差信号とに分解する。

予測分析部１２５により生成された予測係数は、そのまま符号化部１３７に引き渡される。

一方、同じく生成された残差信号は、帯域フィルタ部１２７に引き渡されて、帯域毎の残差信号に分割される。帯域フィルタ部１２７は、例えば、残差信号を帯域１乃至８に分割し、帯域１を0〜1kHz、帯域２を1〜2kHz、帯域３を2〜3kHz、帯域４を3〜4kHz、帯域５を4〜5kHz、帯域６を5kHz〜6kHz、帯域７を6kHz〜7kHz、帯域８を7kHz〜8kHz、とするのが好適である。残差信号が第１帯域フィルタ１４３に通されることにより帯域１の残差信号が生成され、残差信号が第２帯域フィルタ１４５に通されることにより帯域２の残差信号が生成され、以下、同様である。

帯域識別のための変数をωと表記することにする。例えば、第１帯域フィルタ１４３により生成される信号はω=1の帯域の信号であるとし、第２帯域フィルタ１４５により生成される信号はω=2の帯域の信号であるとする。

生成された帯域１の残差信号は、雑音判別部１２９の中の第１雑音判別器１４７と、符号化用Ａスイッチ部１３１の中の第１Ａスイッチ１５１と、に引き渡され、生成された帯域２の残差信号は、雑音判別部１２９の中の第２雑音判別器１４９と、符号化用Ａスイッチ部１３１の中の第２Ａスイッチ１５３と、に引き渡され、以下、同様である。

第１雑音判別器１４７は、引き渡された帯域１の残差信号が雑音であるか否かを判別し、第１Ａスイッチ１５１に対して切替命令を送る。ここで、切替命令とは、帯域１の残差信号が雑音であると判別された場合には第１Ａスイッチ１５１をａ１側に閉じ、帯域１の残差信号が雑音ではないと判別された場合には第１Ａスイッチをｂ１側に閉じるように、第１Ａスイッチ１５１を制御する命令である。第２雑音判別器１４９は、引き渡された帯域２の残差信号が雑音であるか否かを判別し、第２Ａスイッチ１５３に対して切替命令を送る。ここで、切替命令とは、帯域２の残差信号が雑音であると判別された場合には第２Ａスイッチ１５３をａ２側に閉じ、帯域２の残差信号が雑音ではないと判別された場合には第２Ａスイッチをｂ２側に閉じるように、第２Ａスイッチ１５３を制御する命令である。帯域３以降についても同様である。

第１Ａスイッチ１５１がａ１側に閉じた場合は、帯域１の残差信号は、フラグ及びゲイン生成部１３３の中の第１フラグ生成及び第１ゲイン算出器１５５には引き渡されるが、集計変換部１３５の中の非雑音残差信号集計器１６１には引き渡されない。一方、第１Ａスイッチ１５１がｂ１側に閉じた場合は、帯域１の残差信号は、フラグ及びゲイン生成部１３３の中の第１フラグ生成及び第１ゲイン算出器１５５には引き渡されないが、集計変換部１３５の中の非雑音残差信号集計器１６１には引き渡される。第２Ａスイッチ１５３がａ２側に閉じた場合は、帯域２の残差信号は、フラグ及びゲイン生成部１３３の中の第２フラグ生成及び第２ゲイン算出器１５７には引き渡されるが、集計変換部１３５の中の非雑音残差信号集計器１６１には引き渡されない。一方、第２Ａスイッチ１５３がｂ２側に閉じた場合は、帯域１の残差信号は、フラグ及びゲイン生成部１３３の中の第２フラグ生成及び第２ゲイン算出器１５７には引き渡されないが、集計変換部１３５の中の非雑音残差信号集計器１６１には引き渡される。帯域３以降についても同様である。

フラグ及びゲイン生成部１３３の中の第１フラグ生成及び第1ゲイン算出器１５５は、帯域１の残差信号を受け取った場合には、帯域１が雑音帯域である旨を示すフラグを生成するとともに帯域１の残差信号のゲインを算出し、該フラグ及び該ゲインを同じくフラグ及びゲイン生成部１３３の中にあるフラグ及び雑音ゲイン集計器１５９に引き渡す一方、帯域１の残差信号を受け取らなかった場合には、何も行わない。フラグ及びゲイン生成部１３３の中の第２フラグ生成及び第２ゲイン算出器１５７は、帯域２の残差信号を受け取った場合には、帯域２が雑音帯域である旨を示すフラグを生成するとともに帯域２の残差信号のゲインを算出し、該フラグ及び該ゲインを同じくフラグ及びゲイン生成部１３３の中にあるフラグ及び雑音ゲイン集計器１５９に引き渡す一方、帯域２の残差信号を受け取らなかった場合には、何も行わない。帯域３以降についても同様である。

各帯域のゲインは、残差信号の該帯域の成分の強度を表すものである。音声信号においては、一般に、帯域が異なればゲインも異なる値になる。ゲインは、後述の音声復号装置に伝えられる。すると、該装置により、元の残差信号の帯域毎の強度の違いが反映された音声信号が再生される。したがって、音声符号化装置１１１により帯域毎にゲインを求めておくことは、例えばゲインが帯域に依存しない一定値であるといった仮定を採る場合に比べて、後述の音声復号装置が高い品質の音声信号を再生するのに資する。なお、本実施形態においては、非雑音帯域における残差信号の性質については、数値で表される周波数変換係数として音声復号装置に伝達されるので、別途ゲインを求める必要はない。

雑音判別部１２９及び符号化用Ａスイッチ部１３１が上述のように動作することから、フラグ及び雑音ゲイン集計器１５９には、雑音帯域におけるフラグ及びゲインが集められる結果となる。これらの雑音帯域におけるフラグ及びゲインは、符号化部１３７に引き渡される。

集計変換部１３５の中の非雑音残差信号集計器１６１は、どの帯域の残差信号が符号化用Ａスイッチ部１３１から引き渡されたかを把握するとともに、かかる帯域の残差信号だけを実時間領域において重ね合わせた信号を生成する。

雑音判別部１２９及び符号化用Ａスイッチ部１３１が上述のように動作することから、非雑音残差信号集計器１６１が上述のように把握した帯域は、結果として、非雑音帯域である。同様に、非雑音残差信号集計器１６１が上述のように重ね合わせて生成した信号は、結果として、非雑音帯域における残差信号である。

非雑音帯域における残差信号は、非雑音残差信号集計器１６１から同じく集計変換部１３５の中のスペクトル変換器１６３に引き渡され、高速フーリエ変換（FFT、Fast Fourier Transform）、離散コサイン変換（DCT、Discrete Cosine Transform）、変形コサイン変換（MDCT、Modified Discrete Cosine Transform）等の周波数変換手法により、周波数変換係数に変換されてから、同じく集計変換部１３５の中の非雑音帯域切り出し器１６２に引き渡される。

非雑音帯域切り出し器１６２には、非雑音残差信号集計器１６１が上述のように把握した、どの帯域が非雑音帯域であるか、という情報も引き渡される。非雑音帯域切り出し器１６２は、かかる情報を参照することにより、スペクトル変換器１６３から引き渡された周波数変換係数のうち、非雑音帯域における周波数変換係数だけを取り出して、符号化部１３７に引き渡す。つまり、符号化部１３７には、非雑音帯域における残差信号を周波数変換して得られた全帯域における周波数変換係数のうち、非雑音帯域における周波数変換係数だけが切り出されて引き渡される。

もっとも、雑音判別部１２９及び符号化用Ａスイッチ部１３１が上述のように動作することから、非雑音残差信号集計器１６１が上述の重ね合わせにより生成した、非雑音帯域における残差信号は、元々、雑音帯域の成分を含まない。よって、原理的には、スペクトル変換器１６３が生成する周波数変換係数は、雑音帯域において数値0が並んだものとなる。したがって、非雑音帯域切り出し器１６２は、非雑音残差信号集計器１６１からの非雑音帯域に関する情報の引き渡しを受けずに、スペクトル変換器１６３から引き渡された周波数変換係数から値が0の係数を除去したものを符号化部１３７に引き渡すものであってもよい。ただし、帯域フィルタ部１２７の帯域フィルタとしての精度を考慮して、本実施形態においては、動作を確実なものとするために、非雑音帯域切り出し器１６２は周波数変換係数の切り出しにあたり非雑音帯域に関する情報を参照するものとする。

符号化部１３７は、予測分析部１２５からは予測係数を、フラグ及びゲイン生成部１３３からは雑音帯域におけるフラグ及びゲインを、集計変換部１３５からは非雑音帯域における周波数変換係数を、受け取る。符号化部１３７はこれらをまとめて所定の符号化手法、例えばベクトル量子化手法やハフマン符号化手法、により符号化し、生成された符号を送信部１３９に引き渡す。

送信部１３９は、符号化部１３７から、予測係数、フラグ、ゲイン、及び、非雑音帯域における周波数変換係数、が符号化されたもの、を受け取り、これを、後述の実施形態４又は５に係る音声復号装置、あるいは、かかる音声復号装置として機能する、後述の実施形態６に係る他の音声符号化兼復号装置に向けて、送信する。送信方法は、本実施形態においては、無線通信であるとするが、他の、有線や、有線と無線の併用など、様々な通信方法であってもよい。

本実施形態に係る音声符号化装置１１１は、残差信号を複数の帯域に分割し、雑音帯域についてはその旨を示すフラグと、該帯域におけるゲインのみを送信対象とし、非雑音帯域については周波数変換係数を送信対象とすることにより、残差信号に関する情報の効率的な伝達と、再生音声の品質の確保と、を両立させることができる。

（実施形態２）
図２は、本実施形態に係る音声符号化装置１１３の機能構成図である。音声符号化装置１１３は、概ね、実施形態１に係る音声符号化装置１１１と同じ構成を有する。主な相違点は、符号化用Ａスイッチ１３１が符号化用Ｃスイッチ部１６５に置き換えられていることと、それに伴い定電圧源（電圧V_C）が設けられていることと、Band Elimination Filter１６９が設けられていることと、それに伴い集計変換部１３５としてまとめられていた部分が分解された上で構成要素の仕様が一部変更されていること、である。

実施形態１において雑音判別部１２９は符号化用Ａスイッチ部１３１に切替命令を送っていたが、本実施形態においては、雑音判別部１２９は符号化用Ｃスイッチ部１６５に対して選択オン命令を送る。ここで、選択オン命令とは、帯域１についての場合であれば、帯域１の残差信号が雑音であると判別された場合には第１Ｃスイッチ１７１のｃ１を閉じｄ１を開き、帯域１の残差信号が雑音ではないと判別された場合には第１Ｃスイッチ１７１のｃ１を開きｄ１を閉じるように、第１Ｃスイッチ１７１を制御する命令である。そして、帯域２についての場合であれば、帯域２の残差信号が雑音であると判別された場合には第２Ｃスイッチ１７３のｃ２を閉じｄ２を開き、帯域２の残差信号が雑音ではないと判別された場合には第２Ｃスイッチ１７３のｃ２を開きｄ２を閉じるように、第２Ｃスイッチ１７３を制御する命令である。帯域３以降についての場合も同様である。

第１Ｃスイッチ１７１においてｃ１が閉じｄ１が開いた場合は、帯域１の残差信号がフラグ及びゲイン生成部１３３に引き渡されるが、非雑音帯域決定器１６７には電圧V_Cが印加されず、非雑音帯域決定器１６７は帯域１が雑音帯域である旨を記憶する。一方、第１Ｃスイッチ１７１においてｃ１が開きｄ１が閉じた場合は、帯域１の残差信号がフラグ及びゲイン生成部１３３に引き渡されず、非雑音帯域決定器１６７には電圧V_Cが印加され、非雑音帯域決定器１６７は帯域１が非雑音帯域である旨を記憶する。第２Ｃスイッチ１７３においてｃ２が閉じｄ２が開いた場合は、帯域２の残差信号がフラグ及びゲイン生成部１３３に引き渡されるが、非雑音帯域決定器１６７には電圧V_Cが印加されず、非雑音帯域決定器１６７は帯域２が雑音帯域である旨を記憶する。一方、第２Ｃスイッチ１７３においてｃ２が開きｄ２が閉じた場合は、帯域２の残差信号がフラグ及びゲイン生成部１３３に引き渡されず、非雑音帯域決定器１６７には電圧V_Cが印加され、非雑音帯域決定器１６７は帯域２が非雑音帯域である旨を記憶する。帯域３以降についても同様である。

このように、定電圧源（電圧V_C）は、非雑音帯域決定器１６７が、どの帯域が非雑音帯域であるかを把握するためのものである。図示した定電圧源は模式的なものであって、非雑音帯域決定器１６７によるかかる把握を可能にするものであれば他の機構のもので代用してよい。

非雑音帯域決定器１６７は、把握した非雑音帯域に関する情報を、実施形態１において非雑音残差信号集計器１６１が行ったのと同様に、非雑音帯域切り出し器１６２に引き渡す。

非雑音帯域決定器１６７はしかし、実施形態１における非雑音残差信号集計器１６１とは異なり、非雑音帯域の残差信号を受け取っていない。本実施形態においては、スペクトル変換器１６３が非雑音帯域の残差信号を取得するために、まず残差信号全体が予測分析部１２５からBand Elimination Filter１６９に引き渡される。非雑音帯域決定器１６７はどの帯域が非雑音帯域であるかを把握しているのであるから、逆に、どの帯域が雑音帯域であるかを把握しているともいえる。そこで、非雑音帯域決定器１６７は、かかる雑音帯域、すなわちスペクトル変換器１６３に残差信号が入力される前に削除されておくべき帯域を、Band Elimination Filter１６９に一括して指定する命令を送る。Band Elimination Filter１６９は、削除すべき帯域を自在に選択設定することができるフィルタであり、本実施形態においては、前記命令にしたがって、予測分析部１２５から引き渡された残差信号のうち削除すべき帯域を削除した上で、スペクトル変換器１６３に引き渡す。

本実施形態は、実施形態１の変形例といえる。ただし、本実施形態においては、実施形態１の場合と異なり、スペクトル変換器１６３に入力される非雑音残差信号として、帯域フィルタ部１２７を経由したものを用いずに、Band Elimination Filter１６９を経由したものを用いている。したがって、帯域フィルタ部１２７で使用される多数の帯域フィルタに比べフィルタとしての性能が高いBand Elimination Filterが１個だけでも入手できる場合には、本実施形態を採用する方が、実施形態１の場合に比べて非雑音帯域における周波数変換係数が高い精度で求まるという利点がある。また、実施形態１の場合、非雑音残差信号集計器１６１が非雑音帯域の残差信号の重ね合わせ処理を行う際に誤差が生じ得るが、本実施形態の場合にはかかる重ね合わせ処理がないので、この点でも、周波数変換係数がより高い精度で求まると期待される。

（実施形態３）
図３は、本実施形態に係る音声符号化装置１１５の機能構成図である。音声符号化装置１１５は、実施形態１に係る音声符号化装置１１１に類似した構成を有するが、符号化用Ａスイッチ１３１が符号化用Ｅスイッチ部１７７に置き換えられている点と、集計変換部１３５としてまとめられていた部分が完全に分解された上でスペクトル変換器１６３を除く構成要素の仕様が一部変更されている点と、において相違する。

本実施形態においては、予測分析部１２５からの残差信号が直接にスペクトル変換器１６３に引き渡される。そして、スペクトル変換器１６３は、先の２つの実施形態の場合と異なり、引き渡された残差信号に雑音帯域が含まれているか否かには拘泥せずに、残差信号全体から周波数変換係数を求める。

求まった周波数変換係数は、周波数変換係数切り分け器１７５に引き渡される。この周波数変換係数切り分け器１７５は、先の２つの実施形態における非雑音帯域切り出し器１６２と比べ、受け取った周波数変換係数を所定の帯域に対応づける点において似ている。しかし、後者が非雑音帯域に属する周波数変換係数を削除するのに対して、前者は周波数変換係数の全てを所定の複数の帯域に分類するだけであって、帯域１における周波数変換係数、帯域２における周波数変換係数、・・・、のように結局全ての周波数変換係数を出力する点が異なる。

周波数変換係数切り分け器１７５から出力された帯域１の周波数変換係数が伝送される信号線は、符号化用Ｅスイッチ部１７７の中の第１Ｅスイッチ１８１に接続され、帯域２の周波数変換係数が伝送される信号線は第２Ｅスイッチ１８３に接続されている。帯域３以降についても同様である。

実施形態１において雑音判別部１２９は符号化用Ａスイッチ部１３１に切替命令を送っていたが、本実施形態においては、雑音判別部１２９は符号化用Ｅスイッチ部１７７に対して選択オン命令を送る。ここで、選択オン命令とは、帯域１についての場合であれば、帯域１の残差信号が雑音であると判別された場合には第１Ｅスイッチ１８１のｅ１を閉じｆ１を開き、帯域１の残差信号が雑音ではないと判別された場合には第１Ｅスイッチ１８１のｅ１を開きｆ１を閉じるように、第１Ｅスイッチ１８１を制御する命令である。そして、帯域２についての場合であれば、帯域２の残差信号が雑音であると判別された場合には第２Ｅスイッチ１８３のｅ２を閉じｆ２を開き、帯域２の残差信号が雑音ではないと判別された場合には第２Ｅスイッチ１８３のｅ２を開きｆ２を閉じるように、第２Ｅスイッチ１８３を制御する命令である。帯域３以降についての場合も同様である。

第１Ｅスイッチ１８１においてｅ１が閉じｆ１が開いた場合は、帯域１の残差信号がフラグ及びゲイン生成部１３３に引き渡されるが、非雑音周波数変換係数集計器１７９には帯域１における周波数変換係数が引き渡されず、非雑音周波数変換係数集計器１７９は帯域１における周波数変換係数を記憶しない。一方、第１Ｅスイッチ１８１においてｅ１が開きｆ１が閉じた場合は、帯域１の残差信号はフラグ及びゲイン生成部１３３に引き渡されず、非雑音周波数変換係数集計器１７９には帯域１における周波数変換係数が引き渡され、非雑音周波数変換係数集計器１７９は帯域１における周波数変換係数を記憶する。第２Ｅスイッチ１８３においてｅ２が閉じｆ２が開いた場合は、帯域２における残差信号がフラグ及びゲイン生成部１３３に引き渡されるが、非雑音周波数変換係数集計器１７９には帯域２の周波数変換係数が引き渡されず、非雑音周波数変換係数集計器１７９は帯域２における周波数変換係数を記憶しない。一方、第２Ｅスイッチ１８３においてｅ２が開きｆ２が閉じた場合は、帯域２の残差信号はフラグ及びゲイン生成部１３３に引き渡されず、非雑音周波数変換係数集計器１７９には帯域２における周波数変換係数が引き渡され、非雑音周波数変換係数集計器１７９は帯域２における周波数変換係数を記憶する。帯域３以降についても同様である。

この結果、非雑音周波数変換係数集計器１７９には、非雑音帯域における周波数変換係数が集計され記憶される。非雑音周波数変換係数集計器１７９は、かかる周波数変換係数を符号化部１３７に引き渡す。

本実施形態に係る音声符号化装置１１５が符号化の対象とするものは、先の２つの実施形態に係る音声符号化装置１１１及び音声符号化装置１１３が符号化の対象とするものと同じである。

ただし、本実施形態の場合、残差信号を帯域別残差信号に分割する前に周波数変換係数を全帯域に渡って一括して求める。よって、実施形態１の場合と異なり、周波数変換係数が、帯域フィルタ部１２７の性能とは関係なく、高精度で求まる。また、本実施形態においては、周波数変換係数は、実施形態１における非雑音残差信号集計器１６１（図１）での信号の重ね合わせ処理に伴う誤差の影響も受けずに、高精度で求まる。さらに、実施形態２と比較しても、本実施形態においては、周波数変換係数が、Band Elimination Filterの性能とは関係なく、高精度で求まる。

（実施形態４）
図４は、本実施形態に係る音声復号装置２１１の機能構成図である。

音声復号装置２１１は、図示するように、受信部２２１と、復号部２２３と、フラグ存否判別部２２５と、復号用Ｇスイッチ部２２７と、帯域別雑音列生成部２２９と、集計逆変換部２３１と、残差信号復元部２３３と、合成用フィルタ算出部２３５と、合成用フィルタ部２３７と、Ｄ／Ａ変換部２３９と、スピーカ２４１と、を備える。

フラグ存否判別部２２５は、第１フラグ存否判別器２４３と、第２フラグ存否判別器２４５と、図４では省略するが、第３フラグ存否判別器以降の必要なフラグ存否判別器と、を備える。

復号用Ｇスイッチ部２２７は、第１Ｇスイッチ２４７と、第２Ｇスイッチ２４９と、図４では省略するが、第３Ｇスイッチ以降の必要なＧスイッチと、を備える。

帯域別雑音列生成部２２９は、第１雑音列生成器２５１と、第２雑音列生成器２５３と、図４では省略するが、第３雑音列生成器以降の必要な雑音列生成器と、を備える。

集計逆変換部２３１は、周波数変換係数集計及び補充器２５５と、スペクトル逆変換器２５７と、を備える。

受信部２２１は、実施形態１係る音声符号化装置１１１（図１）や、実施形態２に係る音声符号化装置１１３（図２）や、実施形態３に係る音声符号化装置１１５（図３）が、送信部１３９から無線通信手段等により送信した符号を受け取り、復号部２２３に引き渡す。かかる符号は、予測係数、フラグ、ゲイン、及び、非雑音帯域における周波数変換係数、が符号化されたものである。

復号部２２３は、受信部２２１から引き渡された符号を復号して、上述のように変数i(0≦i≦M-1)により識別した各時間区分における、予測係数と、フラグと、ゲインと、非雑音帯域における周波数変換係数と、を生成する。

復号部２２３は、生成した予測係数を、合成用フィルタ算出部２３５に引き渡す。それとともに、復号部２２３は、生成したフラグとゲインと非雑音帯域における周波数変換係数とを、帯域毎の情報として、フラグ存否判別部２２５及び復号用Ｇスイッチ部２２７に引き渡す。概ね、各帯域の情報のうちフラグの有無に関する情報がフラグ存否判別部２２５に引き渡され、各帯域の情報のうちフラグ以外に関する情報が復号用Ｇスイッチ部２２７に引き渡される。

なお、フラグ、ゲイン、周波数変換係数は、帯域毎にみると、復号部２２３により生成されていたり生成されていなかったりする。つまり、音声符号化装置１１１（図１）等の送信側の装置において、雑音帯域についてのみフラグとゲインが生成され符号化され、かつ、非雑音帯域についてのみ周波数変換係数が生成され符号化されているので、受信側の装置である本実施形態に係る音声復号装置２１１の中で復号部２２３による復号が行われても、雑音帯域における周波数変換係数や、非雑音帯域におけるフラグ及びゲインは、生成されることはない。

復号部２２３の役割のひとつは、帯域１の情報のうち、帯域１におけるフラグの有無を、フラグ存否判別部２２５の中の第１フラグ存否判別器２４３に通知することである。より正確には、復号部２２３は、帯域１におけるフラグが生成された場合にはその旨を第１フラグ存否判別器２４３に通知し、帯域１におけるフラグが生成されなかった場合には第１フラグ存否判別器２４３に何らの通知も行わない。帯域２については、復号部２２３は、帯域２におけるフラグが生成された場合にはその旨を第２フラグ存否判別器２４５に通知し、帯域２におけるフラグが生成されなかった場合には第２フラグ存否判別器２４５に何らの通知も行わない。帯域３以降についても同様である。

復号部２２３はまた、帯域１の情報のうち、フラグ以外の情報、すなわち、帯域１が雑音帯域であった場合には帯域１におけるゲイン、帯域１が非雑音帯域であった場合には帯域１における周波数変換係数、を、復号用Ｇスイッチ部２２７の中の第１Ｇスイッチ２４７に通知する。帯域２については、フラグ以外の情報、すなわち、帯域２が雑音帯域であった場合には帯域２におけるゲイン、帯域２が非雑音帯域であった場合には帯域２における周波数変換係数、を、復号用Ｇスイッチ部２２７の中の第２Ｇスイッチ２４９に通知する。帯域３以降についても、同様である。

第１フラグ存否判別器２４３は、復号部２２３から帯域１のフラグが生成された旨の通知を受けたか否かを判別し、第１Ｇスイッチ１５１に対して切替命令を送る。ここで、切替命令とは、帯域１のフラグが生成された旨の通知を受けたと判別された場合には第１Ｇスイッチ２４７をｇ１側に閉じ、帯域１のフラグが生成された旨の通知を受けなかったと判別された場合には第１Ｇスイッチをｈ１側に閉じるように、第１Ｇスイッチ２４７を制御する命令である。第２フラグ存否判別器２４５は、復号部２２３から帯域２のフラグが生成された旨の通知を受けたか否かを判別し、第２Ｇスイッチ２４９に対して切替命令を送る。ここで、切替命令とは、帯域２のフラグが生成された旨の通知を受けたと判別された場合には第２Ｇスイッチ２４９をｇ２側に閉じ、帯域２のフラグが生成された旨の通知を受けなかったと判別された場合には第２Ｇスイッチをｈ２側に閉じるように、第２Ｇスイッチ２４９を制御する命令である。帯域３以降についても同様である。

第１Ｇスイッチ２４７がｇ１側に閉じた場合は、帯域別雑音列生成部２２９の中の第１雑音列生成器２５１に、帯域１のゲインが届けられる。なぜならば、第１Ｇスイッチ２４７がｇ１側に閉じたということは、上述の通り、第１フラグ存否判別器２４３が帯域１におけるフラグの存在を検知したからであり、かかるフラグが存在する以上、復号部２２３は帯域１において周波数変換係数ではなくゲインを復号したことになり、したがって、復号部２２３から帯域１の情報として第１Ｇスイッチ２４７に通知されるのは周波数変換係数ではなくゲインだったということであり、ゆえに、第１Ｇスイッチ２４７がｇ１側に閉じたことにより復号部２２３と第１雑音列生成器２５１との間で接続された信号線を流れる情報は帯域１のゲインということになるからである。

一方、第１Ｇスイッチ２４７がｈ１側に閉じた場合は、集計逆変換部２３１の中の周波数変換係数集計及び補充器２５５に、帯域１における周波数変換係数が届けられる。なぜならば、第１Ｇスイッチ２４７がｈ１側に閉じたということは、上述の通り、第１フラグ存否判別器２４３が帯域１におけるフラグの不在を検知したからであり、かかるフラグが存在しない以上、復号部２２３は帯域１においてゲインではなく周波数変換係数を復号したことになり、したがって、復号部２２３から帯域１の情報として第１Ｇスイッチ２４７に通知されるのはゲインではなく周波数変換係数だったということであり、ゆえに、第１Ｇスイッチ２４７がｈ１側に閉じたことにより復号部２２３と周波数変換係数集計及び補充器２５５との間で接続された信号線を流れる情報は帯域１における周波数変換係数ということになるからである。

同様に、第２Ｇスイッチ２４９がｇ２側に閉じた場合は、帯域別雑音列生成部２２９の中の第２雑音列生成器２５３に、帯域２のゲインが届けられる。なぜならば、第２Ｇスイッチ２４９がｇ２側に閉じたということは、上述の通り、第２フラグ存否判別器２４５が帯域２におけるフラグの存在を検知したからであり、かかるフラグが存在する以上、復号部２２３は帯域２において周波数変換係数ではなくゲインを復号したことになり、したがって、復号部２２３から帯域２の情報として第２Ｇスイッチ２４９に通知されるのは周波数変換係数ではなくゲインだったということであり、ゆえに、第２Ｇスイッチ２４９がｇ２側に閉じたことにより復号部２２３と第２雑音列生成器２５３との間で接続された信号線を流れる情報は帯域２のゲインということになるからである。

一方、第２Ｇスイッチ２４９がｈ２側に閉じた場合は、集計逆変換部２３１の中の周波数変換係数集計及び補充器２５５に、帯域２における周波数変換係数が届けられる。なぜならば、第２Ｇスイッチ２４９がｈ２側に閉じたということは、上述の通り、第２フラグ存否判別器２４５が帯域２におけるフラグの不在を検知したからであり、かかるフラグが存在しない以上、復号部２２３は帯域２においてゲインではなく周波数変換係数を復号したことになり、したがって、復号部２２３から帯域２の情報として第１Ｇスイッチに通知されるのはゲインではなく周波数変換係数だったということであり、ゆえに、第２Ｇスイッチ２４９がｈ２側に閉じたことにより復号部２２３と周波数変換係数集計及び補充器２５５との間で接続された信号線を流れる情報は帯域２における周波数変換係数ということになるからである。

帯域３以降についても同様である。

帯域別雑音列生成部２２９の中の第１雑音列生成器２５１は、帯域１のゲインを受け取った場合には、内蔵のホワイトノイズ生成器（図示せず。）と、ホワイトノイズから帯域１の信号を取り出す内蔵の帯域フィルタ（図示せず。）と、受け取ったゲインの通りに信号の振幅を調整する内蔵の乗算器（図示せず。）と、により、帯域１の雑音列を生成し、残差信号復元部２３３に引き渡す一方、帯域１のゲインを受け取らなかった場合には、何も行わない。

帯域別雑音列生成部２２９の中の第２雑音列生成器２５３は、帯域２のゲインを受け取った場合には、内蔵のホワイトノイズ生成器（図示せず。）と、ホワイトノイズから帯域２の信号を取り出す内蔵の帯域フィルタ（図示せず。）と、受け取ったゲインの通りに信号の振幅を調整する内蔵の乗算器（図示せず。）と、により、帯域２の雑音列を生成し、残差信号復元部２３３に引き渡す一方、帯域２のゲインを受け取らなかった場合には、何も行わない。

帯域３以降についても同様である。

フラグ存否判別部２２５及び復号用Ｇスイッチ部２２７が上述のように動作することから、残差信号復元部２３３には、雑音帯域における残差信号として妥当と考えられる信号が、全ての雑音帯域に渡って、入力されることになる。ここで「妥当」という表現を用いているのは、次の理由による。すなわち、実施形態１に係る音声符号化装置１１１（図１）等の送信側の装置では雑音帯域における残差信号をゲインという量だけにより特徴づけて、かかるゲインだけを受信側の装置である本実施形態に係る音声復号装置２１１に伝達した。よって、音声復号装置２１１は、雑音帯域における残差信号を完全に復元することはできず、ゲインという量だけしか通知されていない状況においては最も適切な残差信号、つまり妥当と考えられる信号、あるいは擬似的な残差信号、を生成したといえるからである。

集計逆変換部２３１の中の周波数変換係数集計及び補充器２５５は、帯域１における周波数変換係数を受け取った場合には、それを記憶する一方、帯域１の周波数変換係数を受け取らなかった場合には、帯域１における周波数変換係数を全て0とし、それを記憶する。集計逆変換部２３１の中の周波数変換係数集計及び補充器２５５は、帯域２における周波数変換係数を受け取った場合には、それを記憶する一方、帯域２の周波数変換係数を受け取らなかった場合には、帯域２における周波数変換係数を全て0とし、それを記憶する。帯域３以降についても同様である。

周波数変換係数集計及び補充器２５５は、このように、周波数変換係数を受け取った帯域については、かかる周波数変換係数をそのまま記憶し、周波数変換係数を受け取らなかった帯域については、周波数変換係数として0を補充して記憶することにより、欠落した帯域のない周波数変換係数を生成したことになる。周波数変換係数集計及び補充器２５５は、かかる周波数変換係数を、同じく集計逆変換部２３１の中にあるスペクトル逆変換器２５７に引き渡す。スペクトル逆変換器２５７は、実施形態１に係る音声符号化装置１１１（図１）等の送信側の装置の中のスペクトル変換器１６３において用いられた所定の周波数変換手法と対をなす逆変換手法を用いて、引き渡された周波数変換係数から実時間領域の信号に逆変換する。スペクトル変換器１６３が受け取る周波数変換係数には、上述の通り、欠落がないため、前記逆変換は円滑に行われる。スペクトル逆変換器２５７は、かかる実時間領域の信号を残差信号復元部２３３に引き渡す。

フラグ存否判別部２２５及び復号用Ｇスイッチ部２２７が上述のように動作することから、スペクトル逆変換器２５７から残差信号復元部２３３に引き渡された実時間領域の信号は、非雑音帯域における復元残差信号である。

以上から、残差信号復元部２３３には、帯域別雑音列生成部２２９からは上述の通り擬似的なものとはいえ雑音帯域における残差信号が引き渡され、集計逆変換部２３１からは非雑音帯域における復元残差信号が引き渡されるので、結局、全帯域における残差信号が引き渡されることになる。残差信号復元部２３３は、これら各帯域の残差信号を重ね合わせることにより、復元残差信号D'_i={d'_i、0、・・・、d'_i、l-1}(0≦i≦M-1)を生成する。生成された復元残差信号は、合成用フィルタ部２３７に引き渡される。

合成用フィルタ算出部２３５には、復号部２２３から予測係数が引き渡される。合成用フィルタ算出部２３５は、引き渡された予測係数に基づいて、任意の既知の手法により、合成用フィルタの仕様を決定し、かかる決定の結果を合成用フィルタ部２３７に通知する。合成用フィルタ部２３７は、かかる通知に従って、自らの仕様を定める。

合成用フィルタ部２３７には、残差信号復元部２３３からの復元残差信号が、励起信号として入力される。なお、既に述べたように、残差信号と励起信号とは、同じ信号を別の視点からみたものにすぎない。かかる励起信号の入力の結果、合成用フィルタ部２３７からは復元されたデジタル音声信号が生成される。該信号はＤ／Ａ変換部２３９によりアナログ音声信号に変換された後、スピーカ２４１に送られる。こうして、スピーカ２４１からは、復元された音声信号が、人間の耳に聞こえる態様にて発せられる。

（実施形態５）
図５は、本実施形態に係る音声復号装置２１３の機能構成図である。

本実施形態は、実施形態４の変形例である。すなわち、実施形態４においては、雑音帯域毎に実時間信号を生成していたのに対して、本実施形態においては、雑音帯域のゲインに合わせて周波数変換係数を生成してから、非雑音帯域の周波数変換係数とともに一括して実時間領域への逆変換を行う。

本実施形態に係る音声復号装置２１３は、実施形態４に係る音声復号装置２１１（図４）と比較すると、帯域別雑音列生成部２２９（図４）を帯域別定数周波数変換係数生成部２５９に置換し、復号用Ｇスイッチ部２２７の下流の信号線の構成を一部変更し、集計逆変換部２３１（図４）を一括集計逆変換部２６１に置換し、残差信号復元部２３３が省略された構成となっている。

帯域別定数周波数変換係数生成部２５９の中の第１定数周波数変換係数生成器２６３は、帯域１のゲインを受け取った場合には、まず帯域１における周波数変換係数として周波数変換係数の単位量が並んだものを生成し、次いで、該ゲインを乗じて、帯域１における周波数変換係数を生成して、一括集計逆変換部２６１の中の周波数変換係数集計器２６７に引き渡す一方、帯域１のゲインを受け取らなかった場合には、何らの動作も行わない。

帯域別定数周波数変換係数生成部２５９の中の第２定数周波数変換係数生成器２６５は、帯域２のゲインを受け取った場合には、まず帯域２における周波数変換係数として周波数変換係数の単位量が並んだものを生成し、次いで、該ゲインを乗じて、帯域２における周波数変換係数を生成して、一括集計逆変換部２６１の中の周波数変換係数集計器２６７に引き渡す一方、帯域２のゲインを受け取らなかった場合には、何らの動作も行わない。

帯域３以降についても同様である。

復号用Ｇスイッチ部２２７と一括集計逆変換部２６１とを結ぶ信号線に、図５においてｇ’１やｇ’２で示される接続部が設けられているために、上述の周波数変換係数の引き渡しが可能となる。なお、第１Ｇスイッチ２４７においてスイッチはｇ１とｈ１の何れか一方側のみに閉じ、第２Ｇスイッチ２４９においてスイッチはｇ２とｈ２の何れか一方側にのみ閉じるから、接続部ｇ’１やｇ’２には、復号用Ｇスイッチ部２２７からの信号又は帯域別定数周波数変換係数生成部２５９からの信号の何れか一方だけが流入するのであり、かかる２種類の信号が混じり合うことはない。

一括集計逆変換部２６１の中の周波数変換係数集計器２６７は、実施形態４に係る音声復号装置２１１（図４）における集計逆変換部２３１の中の周波数変換係数集計及び補充器２５５とよく似た機能を有する。実施形態４における周波数変換係数集計及び補充器２５５（図４）は、欠落した帯域を補うために、数値0から構成される周波数変換係数を生成する必要があった。

しかし、本実施形態の場合、フラグ存否判別部２２５、復号用Ｇスイッチ部２２７、及び、帯域別定数周波数変換係数生成部２５９、の動作から明らかなように、周波数変換係数集計器２６７は受け取った変換係数を単に記憶するだけの動作により、欠落した帯域のない周波数変換係数を生成してスペクトル逆変換器２５７による逆変換に供することができる。

フラグ存否判別部２２５、復号用Ｇスイッチ部２２７、及び、帯域別定数周波数変換係数生成部２５９、の動作から明らかなように、一括集計逆変換部２６１の中のスペクトル逆変換器２５７が生成した残差信号は、雑音帯域と非雑音帯域の両成分を既に含んでいる。

よって、かかる残差信号は、そのまま復元残差信号、又は、励起用の信号として、合成用フィルタ部２３７に引き渡してよい。本実施形態の場合は、実施形態４において雑音帯域の成分と非雑音帯域の成分とを重ね合わせて復元残差信号を生成するために用いられた残差信号復元部２３３（図４）は不要である。

このように、本実施形態は原理的には実施形態４と同様の動作を行う。ただし、実施形態４においては帯域別雑音列生成部２２９（図４）の中にホワイトノイズ発生源や帯域フィルタ（いずれも図示せず。）が必要であるのに対して、本実施形態においてはかかる部材が不要であるので、より簡易である。

（実施形態６）
図６は、本実施形態に係る音声符号化兼復号装置３１１を示したものである。ここまで機能構成図である図１乃至図５を参照して説明してきた実施形態１乃至実施形態５に係る音声符号化装置１１１、音声符号化装置１１３、音声符号化装置１１５、音声復号装置２１１、音声復号装置２１３、は、物理的には、使い勝手の観点から両種の装置の機能を統合した、本実施形態に係る音声符号化兼復号装置３１１により実現される。以下では、音声符号化兼復号装置３１１として携帯電話機を想定して説明する。

音声符号化兼復号装置３１１は、図１乃至図３で既に示してあるマイクロフォン１２１と、図４及び図５で既に示してあるスピーカ２４１と、を備える。該装置は、アンテナ３３５と、操作キー３３７と、をさらに備える。該装置は、システムバス３３３により相互に接続された、ＣＰＵ３２１と、ＲＯＭ（Read Only Memory）３２３と、記憶部３２５と、音声処理部３２９と、無線通信部３２７と、操作キー入力処理部３３１と、をさらに備える。記憶部３２５は、例えば、ＲＡＭ（Random Access Memory）３３９と、ハードディスク３４１と、を備える。音声符号化兼復号装置３１１は、図６に示したものの他にも、例えば、実施形態２に示したBand Elimination Filter１６９を、別途、専用ハードウェアとして備える等してもよい。

ＲＯＭ３２３には、音声符号化及び復号のための動作プログラムが格納されている。ＣＰＵ３２１は、該動作プログラムに従って動作する。そして、ＣＰＵ３２１は、内蔵のレジスタ（図示せず。）と記憶部３２５との間で適宜データのやりとりを行いながら、数値演算により、音声符号化兼復号装置３１１に、図１乃至図５に示す音声符号化装置１１１、音声符号化装置１１３、音声符号化装置１１５、音声復号装置２１１、音声復号装置２１３、としての機能を発揮させる。ＣＰＵ３２１は、その際、必要に応じて音声処理部３２９、無線通信部３２７、操作キー入力処理部３３１とデータのやりとりを行う。

図６の音声処理部３２９は、図１乃至図３のＡ／Ｄ変換部１２３、及び、図４及び図５のＤ／Ａ変換部２３９として動作することができる。無線通信部３２７は、図１乃至図３の送信部１３９、及び、図４及び図５の受信部２２１として動作することができる。符号の送受信は、基本的には、図６のアンテナ３３５を用いた無線通信により行われるが、別の方法、例えば有線通信により行われてもよい。操作キー入力処理部３３１は、操作キー３３７からの操作信号を受け付けて、操作信号に対応するキーコード信号をＣＰＵ３２１に伝達する。操作キー３３７は、通信の相手方となる音声符号化兼復号装置３１１を特定する、すなわちいわゆる電話番号を入力するのに使われる他、基本的には設定済みの各種事項をユーザの好みに応じて変化させるために用いられてもよい。

（予測分析の手順）
以下では、図１乃至図３の予測分析部１２５が行う予測分析について、図７に示すフローチャートを参照しつつ説明する。予測分析としては、例えば、線型予測分析やＭＬＳＡ（Mel Log Spectrum Approximation）分析が知られている。図７では、後者を括弧書きにして、両分析が併記されている。

記憶部３２５（図６）には、既に、デジタル音声信号（入力波形）S_i={s_i、0、・・・、s_i、l−1}(0≦i≦M-1)が格納されているとする。ＣＰＵ３２１（図６）は、内蔵のカウンタレジスタ（図示せず）を入力信号サンプルカウンタiの格納に用いることとし、初期値として、i=0とする（図７のステップＳ４１１）。

ＣＰＵ３２１は、内蔵の汎用レジスタ（図示せず）に、記憶部３２５から、入力信号サンプルS_i={s_i、0、・・・、s_i、l-1}をロードする（図７のステップＳ４１３）。

ＣＰＵ３２１は、線型予測分析の場合は、入力信号サンプルS_iから、線型予測係数A_i={a_i、1、・・・、a_i、n}を計算する（ステップＳ４１５）。ただし、nは線型予測分析の次数である。計算方法としては、残差信号が所定の尺度に基づき十分に小さいと評価されることになるような計算方法であれば、任意の既知の手法を採用してよい。例えば、よく知られている、自己相関関数の計算とレビンソン・ダービンアルゴリズムを組み合わせた計算方法を採用するのが好適である。

ＣＰＵ３２１は、ＭＬＳＡ分析の場合は、入力信号サンプルS_iから、まず、ケプストラムC_i={c_i、0、・・・、c_i、(l/2)-1}を計算する。かかる計算には、任意の既知の手法を採用してよい。どの手法においても、概ね、離散フーリエ変換をする、絶対値をとる、対数をとる、逆離散フーリエ変換をする、といった手続が行われる。次に、求めたケプストラムC_iから、任意の既知の手法により、ＭＬＳＡフィルタ係数M_i={m_i、0、・・・、m_i、p-1}を計算する（ステップＳ４１５）。

線型予測分析の場合は線型予測係数A_i={a_i、1、・・・、a_i、n}が、ＭＬＳＡ分析の場合はＭＬＳＡフィルタ係数M_i={m_i、0、・・・、m_i、p-1}が、記憶部３２５に予測係数として記憶される（ステップＳ４１７）。

続いて、線型予測分析の場合、線型予測係数A_iから、任意の既知の手法により、予測分析用逆線型予測フィルタAIA_iが計算され、ＭＬＳＡ分析の場合、ＭＬＳＡフィルタ係数M_iから、任意の既知の手法により、予測分析用逆ＭＬＳＡフィルタAIM_iが計算される（ステップＳ４１９）。これらの計算は、図１及び図２の予測分析用逆フィルタ算出器１４１が行う計算に相当する。

求めた予測分析用逆線型予測フィルタAIA_i又は予測分析用逆ＭＬＳＡフィルタAIM_iに入力信号サンプルS_i={s_i、0、・・・、s_i、l-1}が通されることにより、残差信号D_i={d_i、0、・・・、d_i、l-1｝が求まる（図７のステップＳ４２１）。残差信号D_iは記憶部３２５に記憶される（ステップＳ４２３）。

ここで、入力信号サンプルカウンタiがM-1に達しているか否かが判別される（ステップＳ４２５）。達していれば（ステップＳ４２５；Ｙｅｓ）、終了する。一方、達していなければ（ステップＳ４２５；Ｎｏ）、次の時間区間の入力信号サンプルについての処理を行うために、iを1だけインクリメントし（ステップＳ４２７）、ステップＳ４１３以降の処理を繰り返す。

（残差信号からフラグ等を生成する手順）
以下では、実施形態１乃至実施形態３に係る音声符号化装置１１１、音声符号化装置１１３、音声符号化装置１１５、が行う、残差信号からフラグ、ゲイン、及び、周波数変換係数、を生成する手順を説明する。

なお、前提として、Ａ／Ｄ変換部１２３（図１乃至図３）によりデジタル音声信号（入力信号）S_i={s_i、0、・・・、s_i、l-1}(0≦i≦M-1)が既に求められて記憶部３２５（図６）に格納されているものとし、かつ、該信号を受け取った予測分析部１２５（図１乃至３）により既に予測係数及び残差信号D_i={d_i、0、・・・、d_i、l-1}}(0≦i≦M-1)も求められていて、これらの係数及び残差信号も記憶部３２５に格納されているものとする。

まず、実施形態１に係る音声符号化装置１１１（図１）が行う処理の手順を、図８及び図９に示すフローチャートを参照しつつ説明する。

ＣＰＵ３２１（図６）は、内蔵のカウンタレジスタ（図示せず。）において、入力信号サンプルカウンタiを、i=0に設定する（図８のステップＳ４３１）。

ＣＰＵ３２１は、内蔵の汎用レジスタ（図示せず。）に、記憶部３２５（図６）から、残差信号D_i={d_i、0、・・・、d_i、l-1}をロードする（図８のステップＳ４３３）。

ＣＰＵ３２１は、カウンタレジスタにおいて、帯域識別変数ωを、ω=1に設定する（ステップＳ４３５）。

ＣＰＵ３２１は、帯域フィルタ部１２７（図１）として機能することにより、帯域ωの残差信号D_i、ω={d_i、ω、0、・・・、d_i、ω、l-1}を生成する（図８のステップＳ４３７）。

ＣＰＵ３２１は、雑音判別部１２９（図１）として機能することにより、D_i、ωが雑音であるか否かを判別する（ステップＳ４３９）。D_i、ωが雑音であると判別された場合には（ステップＳ４３９；Ｙｅｓ）、ＣＰＵ３２１はフラグ及びゲイン生成部１３３（図１）として機能することにより、帯域ωにおけるフラグFlag_i、ωの生成、及び、帯域ωにおけるゲインG_i、ωの算出、を行う（図８のステップＳ４４１）。

かかるFlag_i、ω及びゲインG_i、ωが記憶部に格納されてから（ステップＳ４４３）、ステップＳ４４７に進む。D_i、ωが雑音ではないと判別された場合には（ステップＳ４３９；Ｎｏ）、ＣＰＵ３２１は集計変換部１３５（図１）として機能することにより、D_i、ωを記憶部３２５に格納してから（図８のステップＳ４４５）、ステップＳ４４７に進む。

なお、ステップＳ４３９において行われる、D_i、ωが雑音であるか否かを判別する手法としては、様々なものが考えられるが、その好適な一例は、次のようなものである。すなわち、残差信号D_i、ωについて、規格化された自己相関関数
C_REG(t)=C(t)/REG(t)
（ただし、
C(t)=d_i、ω、0×d_i、ω、t+・・・
+d_{i、ω、l-1-t}×d_i、ω、l-1
であり、
REG(t)={(d_i、ω、0 ²＋・・・＋d_{i、ω、l-1-t} ²)
×(d_i、ω、t ²＋・・・＋d_i、ω、l-1 ²)}^0.5
である。）
を計算し、C_REG(t)が例えば0.5よりも大きい極大値を有する場合は雑音ではないと判別し、C_REG(t)が0.5よりも大きい極大値を有しない場合は雑音である、と判別する方法である。

また、ステップＳ４４１において行われる、ゲインG_i、ωの算出にあたっても、様々なものが考えられるが、その好適な一例は、次のようなものである。すなわち、
G_i、ω=10×log₁₀{Avg(d_i、ω ²)}、
Avg(d_i、ω ²)
=(d_i、ω、0 ²+・・・+d_i、ω、l-1 ²)/l
である。対数をとるのは、音の大きさと、人間の聴覚の感度との関係を考慮したからである。

ステップＳ４４７では、ωが、最終帯域を示す所定の自然数ω_finに達したか否かが判別される。達していない場合（ステップＳ４４７；Ｎｏ）には、ωを1増加してから（ステップＳ４４９）、ステップＳ４３７に戻り、達している場合（ステップＳ４４７；Ｙｅｓ）には、ステップＳ４５１に進む。なお、帯域は、基本的には低周波数側から番号付けされているものとする。つまり、ω=1は最低周波数帯域を、ω=ω_finは最高周波数帯域を、それぞれ意味する。

ステップＳ４５１では、iがM-1に達したか否かが判別される。達していない場合（ステップＳ４５１；Ｎｏ）には、iを1増加してから（ステップＳ４５３）、ステップＳ４３３に戻る。達している場合（ステップＳ４５１；Ｙｅｓ）、図９のステップＳ４６１に進む。この時点で、雑音帯域についてのみフラグ及びゲインが生成されて記憶部３２５に格納されている。そして、残差信号の各帯域の成分のうち非雑音帯域のものだけが記憶部３２５に格納されている。

ステップＳ４６１では、ＣＰＵ３２１は、入力信号サンプルカウンタiをi=0に設定する。

ＣＰＵ３２１は、非雑音残差信号D_i、v={d_{i、ｖ、０}、・・・、d_i、v、l-1}を汎用レジスタに置き、d_{i、ｖ、０}、・・・、d_i、v、l-1を全て0に初期化設定する（ステップＳ４６３）。また、帯域識別変数ωを、ω=1に設定する（ステップＳ４６５）。

ＣＰＵ３２１は、記憶部３２５の内部を検索して、D_i、ωが格納されているか否かを調査する（ステップＳ４６７）。かかる調査の結果（ステップＳ４６９）、D_i、ωが格納されていると判別された場合（ステップＳ４６９；Ｙｅｓ）、帯域ωは非雑音帯域であり、非雑音残差信号を求めるための重ね合わせ処理が必要になる。この処理は、図１の非雑音残差信号集計器１６１の機能に対応する。よって、D_i、ωはレジスタにロードされ（ステップＳ４７１）、これまでレジスタに格納されていたD_i、vに重ね合わされる。D_i、vがかかる重ね合わせの結果得られた数列に更新されてから（ステップＳ４７３）、ステップＳ４７５に進む。

一方、ステップＳ４６９において、D_i、ωが格納されてないと判別された場合（ステップＳ４６９；Ｎｏ）、帯域ωは雑音帯域であるから、非雑音残差信号を求めるための重ね合わせは行われずに、ステップＳ４７５に進む。

ステップＳ４７５において、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ４７５；Ｎｏ）は、ωを1増加してから（ステップＳ４７７）、ステップＳ４６７に戻り、非雑音帯域の探索と、非雑音帯域が見つかった場合の上述の重ね合わせ処理と、が繰り返される。ωがω_finに達したと判別された場合（ステップＳ４７５；Ｙｅｓ）、ステップＳ４７９に進む。

ステップＳ４７９において、ＣＰＵ３２１は、スペクトル変換器１６３（図１）として機能することにより、D_i、vを所定の手法により周波数変換してスペクトルF[D_i、v]を求める。F[D_i、v]は、周波数変換係数から構成される。

なお、以下の説明、及び、図８以降の図面においては、用語が煩雑になることを避けるために、スペクトルとしての一組の周波数変換係数群、又は、スペクトルの一部をなす周波数変換係数群、を指して、単に、周波数変換係数、と呼ぶ場合がある。また、スペクトルの全体又は一部を構成する個々の周波数係数を指して、成分、と呼ぶ場合がある。

ＣＰＵ３２１は、帯域識別変数ωをω=1に設定し（図９のステップＳ４８１）、記憶部３２５の内部を検索してD_i、ωが格納されているか否かを調査し（ステップＳ４８３）、格納の有無を判別する（ステップＳ４８５）。この手順（ステップＳ４８１〜ステップＳ４８５）は、雑音帯域と非雑音帯域に場合分けした処理に関係する手順であるという点では、既出の手順であるステップＳ４６５〜ステップＳ４６９と全く同様の手順である。

なお、かかる場合分けにあたっては、ＣＰＵ３２１は、記憶部３２５の内部の検索に際し、上述のようにD_i、ωが見つかるか否かを調査する代わりに、フラグFlag_i、ωが見つからないか見つかるかを調査してもよい。既出のステップＳ４３７〜ステップＳ４４９から明らかなように、D_i、ωとFlag_i、ωは択一的に記憶部に格納されるからである。

D_i、ωが格納されていると判別された場合には（ステップＳ４８５；Ｙｅｓ）、ωは非雑音帯域であるということであるから、ＣＰＵ３２１は、非雑音帯域切り出し器１６２として機能することにより、F[D_i、v]から帯域ωにおける周波数変換係数F[D_i、v](ω)={f_{D、i、v、ω、１}、・・・、f_{D、i、v、ω、p(ω)}}を切り出し（ステップＳ４８７）、記憶部３２５に格納する（ステップＳ４８９）。ここで、p(ω)は、帯域ωにおける周波数変換係数の個数である。その後、ステップＳ４９１に進む。

一方、D_i、ωが格納されていないと判別された場合には（ステップＳ４８５；Ｎｏ）、ωは雑音帯域であるということであるから、周波数変換係数の切り出しは行われずに、ステップＳ４９１に進む。

ステップＳ４９１では、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ４９１；Ｎｏ）、ωを1増加してから（ステップＳ４９３）、ステップＳ４８３に戻り、達していると判別された場合（ステップＳ４９１；Ｙｅｓ）、i番目の時間区間における帯域毎の処理が終了したということであるから、ステップＳ４９５に進む。

ステップＳ４９５では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ４９５；Ｎｏ）、iを1増加してから（ステップＳ４９７）、ステップＳ４６３に戻り、達していると判別された場合（ステップＳ４９５；Ｙｅｓ）、全ての時間区間における処理が終了したと言うことであるから、残差信号からフラグ等を求める処理全体が終了する。

次に、実施形態２に係る音声符号化装置１１３（図２）が行う処理の手順を、図１０に示すフローチャートを参照しつつ説明する。

ＣＰＵ３２１は、入力信号サンプルカウンタiを、i=0に設定する（図１０のステップＳ５１１）。

ＣＰＵ３２１は、レジスタに、記憶部３２５から、入力信号サンプルD_i={d_i、0、・・・、d_i、l-1}をロードするとともに、帯域識別変数ωをω=1に設定し（ステップＳ５１３）、帯域ωの残差信号D_i、ω={d_i、ω、0、・・・、d_i、ω、l-1}を生成する（ステップＳ５１５）。

ＣＰＵ３２１は、D_i、ωが雑音であるか否かを判別する（ステップＳ５１７）。D_i、ωが雑音であると判別された場合には（ステップＳ５１７；Ｙｅｓ）、帯域ωにおけるフラグFlag_i、ωの生成及びゲインG_i、ωの算出と、それらの記憶部３２５への格納と、が行われてから（ステップＳ５１９）、ステップＳ５２３に進む。

一方、D_i、ωが雑音ではないと判別された場合には（ステップＳ５１７；Ｎｏ）、Band Elimination Filter１６９（図２）の設定が、帯域ωを削除対象としない設定にされてから（ステップＳ５２１）、ステップＳ５２３に進む。

ここで、Band Elimination Filter１６９のかかる設定は、後述のステップＳ５２５等で示されるωについてのループ処理について、各ループ毎に累積的に行われる。例えば、ステップＳ５１７の雑音判別処理において、全帯域のうち、帯域２、帯域５、帯域６が雑音ではないと判別された場合には、Band Elimination Filter１６９の設定は、最終的には、帯域２と、帯域５と、帯域６と、の計3個の帯域を除く帯域を削除する設定となる。

ステップＳ５２３では、ωがω_finに達したか否かが判別され、達していないと判別された場合（ステップＳ５２３；Ｎｏ）、ωを1増加してから（ステップＳ５２５）、ステップＳ５１５に戻り、達していると判別された場合（ステップＳ５２３；Ｙｅｓ）、ステップＳ５２７に進む。

ステップＳ５２７では、iがM-1に達したか否かが判別され、達していないと判別された場合（ステップＳ５２７；Ｎｏ）、iを1増加してから（ステップＳ５２９）、ステップＳ５１３に戻り、達していると判別された場合（ステップＳ５２７；Ｙｅｓ）、ステップＳ５３１に進む。

この時点で、ＣＰＵ３２１は、フラグ及びゲイン生成部１３３として機能することをほぼ完了し、また、非雑音帯域決定器１６７（図２）として機能することによりBand Elimination Filter１６９に削除帯域指定命令を送る動作を完了したことになる。

ステップＳ５３１では、入力信号サンプルカウンタiがi=0に設定される。それから、ＣＰＵ３２１は、残差信号D_iをロードし、ステップＳ５２１における累積的設定が済んでいるBand Elimination Filter１６９に通すことにより、非雑音残差信号D_i、v={d_i、v、0、・・・、d_i、v、l-1}を生成する。

なお、Band Elimination Filter１６９は、ＲＯＭ３２３（図６）に格納されたＣＰＵの動作プログラムに含まれる関数等であってもよいし、別途ハードウェアとして備えられたものであってもよい。

ＣＰＵ３２１はさらに、生成した非雑音残差信号D_i、vを周波数変換してスペクトルF[D_i、ｖ]を求める（ステップＳ５３３）。

ステップＳ５３５では、帯域識別変数ωが、ω=1に設定される。

ステップＳ５３７及びステップＳ５３９では帯域ωが雑音帯域であるか非雑音帯域であるかが判別される。本ステップは、図２においては、非雑音帯域決定器１６７が非雑音帯域切り出し器１６２に非雑音帯域に関する情報を送ることに相当する。なお、図８及び図９に示したフローチャートにおいては、雑音帯域であるか非雑音帯域であるかの判別に際して、帯域別残差信号D_i、ωの検索が行われている。そして、かかる判別はフラグFlag_i、ωの検索により行ってもよいことは、前述したとおりである。

それに対して、図１０で示される手順においては、該図に対応する実施形態２を示す図２からも明らかなとおり、帯域別残差信号D_i、ωを記憶部３２５に格納する過程（図８のステップＳ４４５）がない。実施形態２においては、D_i、ωを重ね合わせる処理が不要だからである。したがって、図１０のステップＳ５３７及びステップＳ５３９における判別の方法としては、フラグFlag_i、ωの検索による方法しか採り得ない。この事情は、後述の、実施形態３に対応したフローチャートである図１１及び図１２においても同様である。

結局、ステップＳ５３９では、記憶部３２５にフラグFlag_i、ωが格納されているか否かが判別される。Flag_i、ωが格納されていないと判別された場合（ステップＳ５３９；Ｎｏ）、帯域ωは非雑音帯域であるということであるから、ステップＳ５３３で求められたスペクトルF[D_i、v]から帯域ωにおける周波数変換係数F[D_i、v](ω)={f_{D、i、v、ω、１}、・・・、f_{D、i、v、ω、p(ω)}}が切り出され、記憶部３２５に格納されてから（ステップＳ５４１）、ステップＳ５４３に進む。

一方、Flag_i、ωが格納されていると判別された場合（ステップＳ５３９；Ｙｅｓ）、帯域ωは雑音帯域であるということであるから、そのままステップＳ５４３に進む。

ステップＳ５４３では、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ５４３；Ｎｏ）、ωを1増加してから（ステップＳ５４５）、ステップＳ５３７に戻り、達していると判別された場合（ステップＳ５４３；Ｙｅｓ）、i番目の時間区間における帯域毎の処理が終了したということであるから、ステップＳ５４７に進む。

ステップＳ５４７では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ５４７；Ｎｏ）、iを1増加してから（ステップＳ５４９）、ステップＳ５３３に戻り、達していると判別された場合（ステップＳ５４７；Ｙｅｓ）、全ての時間区間における処理が終了したと言うことであるから、残差信号からフラグ等を求める処理全体が終了する。

次に、実施形態３に係る音声符号化装置１１５（図３）が行う処理の手順を、図１１及び図１２に示すフローチャートを参照しつつ説明する。

はじめに、入力信号サンプルカウンタiが、i=0に設定される（図１１のステップＳ５４０）。

入力信号サンプルD_i={d_i、0、・・・、d_i、l-1}がロードされ（ステップＳ５４２）、そのスペクトルF[D_i]が求められ（ステップＳ５４４）、ステップＳ５４７に進む。図３におけるスペクトル変換器１６３の位置から明らかなとおり、実施形態３においては、先の２つの実施形態の場合に比べて、早い段階で周波数変換が行われることが特徴である。各種の前置処理を経ないうちに周波数変換が行われるために、かかる前置処理に起因する誤差の影響がなく、周波数変換係数が精度よく求まることは、既に述べたとおりである。

ステップＳ５４６では、帯域識別変数ωがω=1に設定される。

ステップＳ５４８では、帯域ωにおける周波数変換係数F[D_i](ω)={f_{D、i、ω、１}、・・・、f_{D、i、ω、p(ω)}}が、F[D_i]から切り出されることにより生成される。なお、この時点では、帯域ωが雑音帯域であるか非雑音帯域であるかがまだ判別されていないので、周波数変換係数F[D_i](ω)は全ての帯域ωについて生成される。生成されたF[D_i](ω)は、記憶部３２５に格納される（ステップＳ５５０）。

ステップＳ５５２では、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ５５２；Ｎｏ）、ωを1増加してから（ステップＳ５５５）、ステップＳ５４８に戻り、達していると判別された場合（ステップＳ５５２；Ｙｅｓ）、ステップＳ５５７に進む。

ステップＳ５５７では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ５５７；Ｎｏ）、iを1増加してから（ステップＳ５５９）、ステップＳ５４２に戻り、達していると判別された場合（ステップＳ５５７；Ｙｅｓ）、ステップＳ５６１に進む。

ステップＳ５６１では、入力信号サンプルカウンタiが、i=0に設定される。ステップＳ５６３では、残差信号D_iがレジスタにロードされ、ステップ５６５では、帯域識別変数ωが、ω=1に設定され、ステップＳ５６７では、入力信号サンプルD_iから、帯域フィルタ部１２７（図３）の中の第ω帯域フィルタにより、帯域ωの残差信号D_i、ω={d_i、ω、0、・・・、d_i、ω、l-1}が生成される。

ここで、残差信号D_i、ωが雑音か否かが判別される（ステップＳ５６９）。D_i、ωが雑音であると判別された場合（ステップＳ５６９；Ｙｅｓ）、フラグFlag_i、ωの生成及びゲインG_i、ωの算出が行われ（ステップＳ５７１）、Flag_i、ω及びG_i、ωの記憶部３２５への格納が行われてから（ステップＳ５７３）、ステップＳ５７５に進む。D_i、ωが雑音ではないと判別された場合は（ステップＳ５６９；Ｎｏ）、すぐにステップＳ５７５に進む。

ステップＳ５７５では、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ５７５；Ｎｏ）、ωを1増加してから（ステップＳ５７７）、ステップＳ５６７に戻り、達していると判別された場合（ステップＳ５７５；Ｙｅｓ）、ステップＳ５７９に進む。

ステップＳ５７９では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ５７９；Ｎｏ）、iを1増加してから（ステップＳ５８１）、ステップＳ５６３に戻り、達していると判別された場合（ステップＳ５７９；Ｙｅｓ）、図１２のステップＳ５９１に進む。

ステップＳ５９１では、入力信号サンプルカウンタiが、i=0に設定される。そして、ステップＳ５９３では、帯域識別変数ωがω=1に設定される。

記憶部３２５の内部が検索され、フラグFlag_i、ωが格納されているか否かが調査された（ステップＳ５９５）後、Flag_i、ωが格納されているか否かの判別ステップ（ステップＳ５９７）に進む。

Flag_i、ωが格納されていないと判別された場合（ステップＳ５９７；Ｎｏ）、帯域ωにおける周波数変換係数F[D_i](ω)={f_{D、i、ω、１}、・・・、f_{D、i、ω、p(ω)}}がレジスタにロードされる（ステップＳ５９９）。そして、レジスタにはF[D_i](ω)とは別に、帯域ωにおける周波数変換係数F[D_i、v](ω)={f_{D、i、v、ω、１}、・・・、f_{D、i、v、ω、p(ω)}}が用意され、F[D_i、v](ω)=F[D_i](ω)によりF[D_i、v](ω)が決定される（ステップＳ６０１）。

ここで、上述のようにF[D_i](ω)は全ての帯域について生成されるものであるのに対し、ステップＳ６０１で定義されるF[D_i、v](ω)は、ステップＳ５９７における場合分けのため、非雑音帯域についてのみ生成されるものであることに留意する。F[D_i、v](ω)が記憶部３２５に格納された（ステップＳ６０３）後、ステップＳ６０５に進む。

一方、Flag_i、ωが格納されていると判別された場合は（ステップＳ５９７；Ｙｅｓ）、そのままステップＳ６０５に進む。

ステップＳ６０５では、ωがω_finに達したか否かが判別される。達していないと判別された場合（ステップＳ６０５；Ｎｏ）、ωを1増加してから（ステップＳ６０７）、ステップＳ５９５に戻り、達していると判別された場合（ステップＳ６０５；Ｙｅｓ）、ステップＳ６０９に進む。

ステップＳ６０９では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ６０９；Ｎｏ）、iを1増加してから（ステップＳ６１１）、ステップＳ５９３に戻り、達していると判別された場合（ステップＳ６０９；Ｙｅｓ）、処理を終了する。

（フラグ等から残差信号を復元する手順）
以下では、実施形態４に係る音声復号装置２１１及び実施形態５に係る音声復号装置２１３が行う、残差信号からフラグ、ゲイン、及び、周波数変換係数、を求める手順を説明する。

なお、前提として、復号部２２３（図４乃び図５）により、予測係数、フラグFlag_i、ω(0≦i≦M-1、1≦ω≦ω_fin、ただしωは雑音帯域であるとする。)、ゲインG_i、ω(0≦i≦M-1、1≦ω≦ω_fin、ただしωは雑音帯域であるとする。)、非雑音帯域における周波数変換係数F[D_i、v](ω)={f_{D、i、v、ω、１}、・・・、f_{D、i、v、ω、p(ω)}} (0≦i≦M-1、1≦ω≦ω_fin、ただしωは非雑音帯域であるとする。)、は、既に復号されて記憶部３２５に格納されているものとする。

まず、実施形態４に係る音声復号装置２１１（図４）が行う処理の手順を、図１３及び図１４に示すフローチャートを参照しつつ説明する。

はじめに、ステップＳ６２１（図１３）において、入力信号サンプルカウンタiが、i=0に設定される。

ＣＰＵ３２１は、レジスタに、復元雑音残差信号D'_i、uvと、非雑音残差信号スペクトルF[D_i、v]と、を用意し、D'_i、uvの成分と、F[D_i、v]の成分と、を全て0に初期化設定する（ステップＳ６２３）。

なお、F[D_i、v]の全ての成分の初期値は、上述の通り、一般には0に設定するのが適切である。かかる数値0は、非雑音帯域における残差信号は別途ゲインを元に復元されるために、オフセットが不要であるとの観点から決定されたものであって、絶対的な規則ではない。

例えば、実施形態１乃至５については、ゲインに関係した処理を省略する、つまり雑音帯域についての情報としては音声符号化装置と音声復号装置の間（換言すれば送受信器間）でフラグのみを伝達することとした変形例も考え得るが、かかる場合には、人間の聴覚特性を考慮した上で、F[D_i、v]の成分の初期値を、0以外の所定の定数にしてもよいし、さらに、かかる所定の定数が成分毎に異なっていてもよい。このようにすれば、後述のように、非雑音帯域についてのみ成分の置換が行われるので、最終的に生成されるF[D_i、v]においては、雑音帯域における成分が前記所定の定数のまま残る。つまり、前記所定の定数とは、送受信器間でゲインの授受がなされない場合に、あらかじめ定めておくゲインである。

帯域識別変数ωがω=1に設定された（ステップＳ６２５）後、記憶部３２５の内部が検索されて、フラグFlag_i、ωが格納されているか否かが調査され（ステップＳ６２７）、判別ステップ（ステップＳ６２９）に進む。

Flag_i、ωが格納されていると判別された場合（ステップＳ６２９；Ｙｅｓ）、帯域ωは雑音帯域であるということであるから、記憶部３２５にはゲインG_i、ωが格納されているはずである。そこで、G_i、ωがレジスタにロードされる（ステップＳ６３１）。これは、図４においては、復号部２２３から復号用Ｇスイッチ部２２７に帯域ωの情報として引き渡されるものが、周波数変換係数ではなくゲインであることに相当する。

ＣＰＵ３２１は、帯域別雑音列生成部２２９（図４）として機能することにより、ロードされたG_i、ωを手がかりにして、帯域ωにおける雑音列D'_i、uv、ωを生成する（図１３のステップＳ６３３）。具体的な生成方法は、後に図１４を参照して説明する。

ＣＰＵ３２１は、生成されたD'_i、uv、ωを、レジスタ内に格納されているD'_i、uvに重ね合わせて、新たなD'_i、uvを生成する。つまり、D'_i、uvを更新する（図１３のステップＳ６３５）。これは、図４においては、帯域別雑音列生成部２２９（図４）により生成された雑音列が残差信号復元部２３３において重ね合わせられ、雑音帯域における残差信号が復元されていく過程に相当する。D'_i、uvが上述のように更新されたら、ステップＳ６４１に進む。

一方、ステップＳ６２９において、Flag_i、ωが格納されていないと判別された場合（ステップＳ６２９；Ｎｏ）、帯域ωは非雑音帯域であるということであるから、記憶部３２５には帯域ωにおける周波数変換係数F[D_i、v](ω)が格納されているはずである。そこで、F[D_i、v](ω)がレジスタにロードされる（ステップＳ６３７）。これは、図４においては、復号部２２３から復号用Ｇスイッチ部２２７に帯域ωの情報として引き渡されるものが、ゲインではなく周波数変換係数であることに相当する。

ＣＰＵ３２１は、レジスタ内に格納されている非雑音残差信号スペクトルF[D_i、v]の成分のうち、帯域ωにおける成分群を、ステップＳ６３７でロードしたF[D_i、v](ω)に置換することにより、F[D_i、v]を更新する（ステップＳ６３９）。

既出のステップＳ６２３において、F[D_i、v]の成分の初期値は全て0に設定されているから、後述のステップＳ６４３等によるωに関するループ処理により、F[D_i、v]の一部分が、ループの度にF[D_i、v](ω)に置換され、F[D_i、v]は最終的には非雑音残差信号スペクトルとして適切なものとなる。

ここで、かかる置換が生じるのは非雑音帯域の成分についてのみであり、雑音帯域の成分は初期値である0のままであることに留意する。

ステップＳ６３７及びステップＳ６３９で行われる処理は、図４においては、周波数変換係数集計及び補充器２５５が復号用Ｇスイッチ部２２７から非雑音帯域における周波数変換係数を受け取って集計し、雑音帯域における周波数変換係数としては0を補充しつつ、全帯域における周波数変換係数を求めていく過程に相当する。F[D_i、v]が上述のように更新されたら、ステップＳ６４１に進む。

なお、このように、ステップＳ６２７におけるFlag_i、ωの検索の後にF[D_i、v]が徐々に完成されていく手順を採っている理由は、実施形態１乃至５の音声符号化装置と音声復号装置との間では、非雑音帯域における周波数変換係数の授受は行わないことを前提としているためである。

かかる授受が行われないことは、ＣＰＵ３２１に検索のための負荷がかかるという問題を生じさせ得るが、送信器としての音声符号化装置から受信器としての音声復号装置への情報伝達量が少なくて済むという点で、本発明の目的に沿ったものである。しかも、一般的なＣＰＵにとって、フラグという簡潔な情報の有無を検索する程度の負荷は、実際にはほとんど問題とはならない。

もっとも、実施形態１乃至５の変形例として、一部の非雑音帯域についての情報については、フラグの代わりに、該帯域の周波数変換係数を0とした態様で伝達してもよい。このようにすれば、送受信器間での情報伝達量は増加するが、上述のＣＰＵの検索負担の軽減と、ステップＳ６３７及びステップＳ６３９で行われる置換処理の一部省略が可能となり、音声復号装置における処理の高速化に資する。また、送受信器間での情報伝達量が増加するといっても、小さな数値である数値0が伝達されるだけであるから、与えられた情報伝達量に余裕がある場合には、このような変形例の方が効率が良いこともあり得る。

ステップＳ６４１では、ωがω_finに達したか否かが判別され、達していない場合（ステップＳ６４１；Ｎｏ）、ωを1増加してから（ステップＳ６４３）、ステップＳ６２７に戻り、達している場合（ステップＳ６４１；Ｙｅｓ）、ステップＳ６４５に進む。

ステップＳ６４５では、ＣＰＵ３２１は図４におけるスペクトル逆変換器２５７として機能することにより、非雑音残差信号スペクトルF[D_i、v]から非雑音残差信号D_i、vを求める。そして、ＣＰＵ３２１は、D'_i、uvとD_i、vを重ね合わせることにより、復元残差信号D'_iを求め（ステップＳ６４７）、D'_iを記憶部に格納する（ステップＳ６４９）。

ステップＳ６５１では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ６５１；Ｎｏ）、iを1増加してから（ステップＳ６５３）、ステップＳ６２３に戻り、達したと判別された場合（ステップＳ６５１；Ｙｅｓ）、処理を終了する。

以下では、上述のステップＳ６３３における帯域別雑音列D'_i、uv、ωの生成の具体的な手順について、図１４に示すフローチャートを参照しつつ説明する。

はじめに、大きさが±1で、時間間隔が乱数であるような基本雑音列R_i={R_i、0、・・・、R_i、l-1}を生成する（ステップＳ６５５）。

ここでは、元の残差信号のサンプリング間隔と同じサンプリング間隔であるとしてR_iを生成する。よって、実際には、その各要素R_i、0、・・・、R_i、l-1の値はそれぞれ0か+1か-1のいずれかである。しかも、これら時間順に並んだ要素の列においては、ランダムな個数間隔で+1か-1が出現し、他の要素の値は0ということになる。

得られた基本雑音列R_iを、帯域ωの成分を取り出す帯域フィルタに通すことにより、帯域ωの基本雑音列R_i、ω={R_i、ω、0、・・・、R_i、ω、l-1｝を生成する（ステップＳ６５７）。

生成した帯域ωの基本雑音列R_i、ωに、図１３のステップＳ６３１でロードされたゲインG_i、ωを乗じることにより、雑音列D’_i、uv、ω={d’_{i、uv、ω、0}、・・・、d’_{i、uv、ω、l-1}｝が生成され（ステップＳ６５９）、処理は終了する。

次に、実施形態５に係る音声復号装置２１３（図５）が行う処理の手順を、図１５に示すフローチャートを参照しつつ説明する。

はじめに、ステップＳ６６１において、入力信号サンプルカウンタiが、i=0に設定される。

ＣＰＵ３２１のレジスタにおいて復元残差信号スペクトルF[D'_i]が用意され、その成分が全て0に初期化設定される（ステップＳ６６３）。

帯域識別変数ωがω=1に設定された（ステップＳ６６５）後、記憶部３２５の内部が検索されて、フラグFlag_i、ωが格納されているか否かが調査され（ステップＳ６６７）、判別ステップ（ステップＳ６６９）に進む。

Flag_i、ωが格納されていると判別された場合（ステップＳ６６９；Ｙｅｓ）、ゲインG_i、ωがレジスタにロードされる（ステップＳ６７１）。

ＣＰＵ３２１は、復元残差信号スペクトルF[D'_i]の成分について、帯域ωに含まれる成分を全て、G_i、ω×単位成分、に置換することにより、F[D'_i]を更新する（ステップＳ６７３）。これは、図５においては、帯域別定数周波数変換係数生成部２５９から、雑音帯域における周波数変換係数が、周波数変換係数集計器２６７に引き渡されることに相当する。この後、ステップＳ６７９に進む。

一方、Flag_i、ωが格納されていないと判別された場合（ステップＳ６６９；Ｎｏ）、帯域ωにおける周波数変換係数F[D_i、v](ω)がレジスタにロードされ（ステップＳ６７５）、F[D'_i]の成分について、帯域ωに含まれる成分群がF[D_i、v](ω)に置換されることにより、F[D'_i]が更新されてから（ステップＳ６７７）、ステップＳ６７９に進む。

ステップＳ６７９では、ωがω_finに達したか否かが判別され、達していない場合（ステップＳ６７９；Ｎｏ）、ωを1増加してから（ステップＳ６８１）、ステップＳ６６７に戻り、達している場合（ステップＳ６７９；Ｙｅｓ）、ステップＳ６８３に進む。

ステップＳ６８３では、逆変換により、復元残差信号スペクトルF[D'_i]から残差信号D'_iが求められる。D'_iが記憶部に格納された（ステップＳ６８５）後、ステップＳ６８７に進む。

ステップＳ６８７では、iがM-1に達したか否かが判別される。達していないと判別された場合（ステップＳ６８７；Ｎｏ）、iを1増加してから（ステップＳ６８９）、ステップＳ６６３に戻り、達したと判別された場合（ステップＳ６８７；Ｙｅｓ）、処理を終了する。

（音声信号復元の手順）
以下では、図１６を参照しつつ、図４及び図５に示した音声復号装置２１１及び音声復号装置２１３の内部で行われる、音声信号復元の手順について説明する。ここでは、予測分析としてＭＬＳＡ分析が用いられた場合の手順を例に説明するが、線型予測分析など他の予測分析が用いられた場合の手順も、同様である。

受信部２２１（図４及び図５）は、元の音声の予測係数等が符号化された結果である符号を、受信して、復号部２２３（図４及び図５）に引き渡す。復号部２２３は、引き渡された符号を復号して、予測係数と、フラグ等とを生成する。これらは記憶部３２５に格納される。予測係数は、ＭＬＳＡ分析の場合は、ＭＬＳＡフィルタ係数M_i={m_i、0、・・・、m_i、p-1}(0≦i≦M-1)である。

入力信号サンプルカウンタがi=1に設定（図１６のステップＳ７１１）された後、予測係数M_iが記憶部３２５からＣＰＵ３２１の内部のレジスタにロードされる（ステップＳ７１３）。次に、予測係数M_iから合成用逆フィルタCIM_iが計算される（ステップＳ７１５）。これは、図４及び図５において、予測係数を引き渡された合成用フィルタ算出部２３５により、合成用フィルタ部２３７の仕様が定められることに相当する。

続いて、復元残差信号D 'iが、ステップＳ７１５にて求められた合成用フィルタCIM_iに通される。その結果、復元されたデジタル音声信号S '_i={s'_i、0、・・・、s'_i、l-1}(0≦i≦M-1)が生成される（ステップＳ７１７）。復元されたデジタル音声信号S'_iは記憶部３２５に格納される（ステップＳ７１９）。続いて、iがM-1に達しているか否かが判別され（ステップＳ７２１）、達していないのであれば（ステップＳ７２１；Ｎｏ）、iを1だけ増加してから（ステップＳ７２３）、ステップＳ７１３に戻る。iがM-1に達しているのであれば（ステップＳ７２１；Ｙｅｓ）、処理を終了する。

（ケプストラムからＭＬＳＡ係数を求める手順の一例）
図１７は、ケプストラムC_i={c_i、0、・・・、c_i、(l/2)-1}からＭＬＳＡフィルタ係数M_i={m_i、0、・・・、m_i、p-1}を求める具体的な手順の一例をフローチャートにしたものである。ステップＳ８１１〜Ｓ８３５に示した計算を行うことにより、ＭＬＳＡフィルタ係数が求まる。αは近似用の数値であり、音声信号が10kHzでサンプリングされている場合にはα=0.35とするのが好適である。また、β=１-α²である。m_i(0≦i≦p-1)は0に初期化しておく。

このようにして求まったＭＬＳＡフィルタ係数を用いたＭＬＳＡフィルタの構成の一例を、図１８に示す。P₁〜P₄は近似用係数であり、例えば、P₁=0.4999、P₂=0.1067、P₃=0.0117、P₄=0.0005656とするのが好適である。

なお、この発明は、上記実施形態に限定されず、既に文中でもいくつかの変形例を挙げたように、種々の変形及び応用が可能である。上述のハードウェア構成やブロック構成、フローチャートは例示であって、限定されるものではない。

例えば、図３に示される音声符号化兼復号装置３１１として携帯電話機を想定して説明したが、ＰＨＳ（Personal Handyphone System）、ＰＤＡ（Personal Digital Assistants）、ノート型及びデスクトップ型パーソナルコンピュータ等による音声処理においても、同様に本発明を適用することができる。例えば本発明をパーソナルコンピュータに適用する場合には、パーソナルコンピュータに音声入出力装置や通信装置等を付加すれば、ハードウェアとしては携帯電話機の機能を有するようにすることができる。そして、上述の処理をコンピュータに実行させるためのコンピュータプログラムが記録媒体や通信により配布されれば、これをコンピュータにインストールして実行させることにより、該コンピュータをこの発明に係る音声符号化装置又は音声復号装置として機能させることも可能である。

すなわち、上記実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。

本発明の実施形態１に係る音声符号化装置の機能構成図である。本発明の実施形態２に係る音声符号化装置の機能構成図である。本発明の実施形態３に係る音声符号化装置の機能構成図である。本発明の実施形態４に係る音声復号装置の機能構成図である。本発明の実施形態５に係る音声復号装置の機能構成図である。本発明の実施形態６に係る音声符号化兼復号装置の物理的な構成を示す図である。線型予測分析又はＭＬＳＡ分析の流れを示す図である。本発明の実施形態１における、残差信号からフラグ等を生成する処理の流れの前半を示す図である。本発明の実施形態１における、残差信号からフラグ等を生成する処理の流れの後半を示す図である。本発明の実施形態２における、残差信号からフラグ等を生成する処理の流れを示す図である。本発明の実施形態３における、残差信号からフラグ等を生成する処理の流れの前半を示す図である。本発明の実施形態３における、残差信号からフラグ等を生成する処理の流れの後半を示す図である。本発明の実施形態４における、フラグ等から残差信号を復元する処理の流れを示す図である。本発明の実施形態４における、帯域毎の雑音列を生成する処理の流れを示す図である。本発明の実施形態５における、フラグ等から残差信号を復元する処理の流れを示す図である。音声信号を復元する流れを示す図である。ＭＬＳＡフィルタ係数の計算の流れの一例を示す図である。ＭＬＳＡフィルタの一例を示す図である。

符号の説明

１１１・・・実施形態１に係る音声符号化装置、１１３・・・実施形態２に係る音声符号化装置、１１５・・・実施形態３に係る音声符号化装置、１２１・・・マイクロフォン、１２３・・・Ａ／Ｄ変換部、１２５・・・予測分析部、１２７・・・帯域フィルタ部、１２９・・・雑音判別部、１３１・・・符号化用Ａスイッチ部、１３３・・・フラグ及びゲイン生成部、１３５・・・集計変換部、１３７・・・符号化部、１３９・・・送信部、１４１・・・予測分析用逆フィルタ算出器、１４３・・・第１帯域フィルタ、１４５・・・第２帯域フィルタ、１４７・・・第１雑音判別器、１４９・・・第２雑音判別器、１５１・・・第１Ａスイッチ、１５３・・・第２Ａスイッチ、１５５・・・第１フラグ生成及び第１ゲイン算出器、１５７・・・第２フラグ生成及び第２ゲイン算出器、１５９・・・フラグ及び雑音ゲイン集計器、１６１・・・非雑音残差信号集計器、１６２・・・非雑音帯域切り出し器、１６３・・・スペクトル変換器、１６５・・・符号化用Ｃスイッチ部、１６７・・・非雑音帯域決定器、１６９・・・Band Elimination Filter、１７１・・・第１Ｃスイッチ、１７３・・・第２Ｃスイッチ、１７５・・・周波数変換係数切り分け器、１７７・・・符号化用Ｅスイッチ部、１７９・・・非雑音周波数変換係数集計器、１８１・・・第１Ｅスイッチ、１８３・・・第２Ｅスイッチ、２１１・・・実施形態４に係る音声復号装置、２１３・・・実施形態５に係る音声復号装置、２２１・・・受信部、２２３・・・復号部、２２５・・・フラグ存否判別部、２２７・・・復号用Ｇスイッチ部、２２９・・・帯域別雑音列生成部、２３１・・・集計逆変換部、２３３・・・残差信号復元部、２３５・・・合成用フィルタ算出部、２３７・・・合成用フィルタ部、２３９・・・Ｄ／Ａ変換部、２４１・・・スピーカ、２４３・・・第１フラグ存否判別器、２４５・・・第２フラグ存否判別器、２４７・・・第１Ｇスイッチ、２４９・・・第２Ｇスイッチ、２５１・・・第１雑音列生成器、２５３・・・第２雑音列生成器、２５５・・・周波数変換係数集計及び補充器、２５７・・・スペクトル逆変換器、２５９・・・帯域別定数周波数変換係数生成部、２６１・・・一括集計逆変換部、２６３・・・第１定数周波数変換係数生成器、２６５・・・第２定数周波数変換係数生成器、２６７・・・周波数変換係数集計器、３１１・・・実施形態６に係る音声符号化兼復号装置、３２１・・・ＣＰＵ、３２３・・・ＲＯＭ、３２５・・・記憶部、３２７・・・無線通信部、３２９・・・音声処理部、３３１・・・操作キー入力処理部、３３３・・・システムバス、３３５・・・アンテナ、３３７・・・操作キー、３３９・・・ＲＡＭ、３４１・・・ハードディスク

Claims

音声信号を予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成部と、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別部と、
前記雑音判別部により雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成部と、
前記雑音判別部により雑音帯域ではないと判別された前記帯域の前記帯域別残差信号を実時間領域において重ね合わせてから周波数変換して、非雑音帯域における周波数変換係数を生成する非雑音帯域変換部と、
前記予測分析部で得られた予測係数と前記フラグ生成部で得られたフラグとゲインと前記非雑音帯域変換部で生成された周波数変換係数とを符号化する符号化部と、
を備える音声符号化装置。
音声信号を予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号を周波数変換して周波数変換係数を生成する全帯域変換部と、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成部と、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別部と、
前記雑音判別部により雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成部と、
前記全帯域変換部で得られた周波数変換係数から、前記雑音判別部により雑音帯域ではないと判別された前記帯域の周波数変換係数を集計する集計手段と、
前記予測分析部で得られた予測係数と前記フラグ生成部で得られたフラグとゲインと前記集計手段で集計された周波数変換係数とを符号化する符号化部と、
を備える音声符号化装置。
前記雑音判別部は、
前記帯域毎に前記帯域別残差信号の自己相関関数の形状に基づき該帯域が雑音帯域か否かを判別する、
ことを特徴とする請求項１又は２に記載の音声符号化装置。
前記予測分析部は、
ＭＬＳＡ（Mel Log Spectrum Approximation）分析により前記予測係数としてＭＬＳＡフィルタ係数を求め、該ＭＬＳＡフィルタ係数により定義される逆フィルタを用いて前記残差信号を求める、
ことを特徴とする請求項１乃至３の何れか１項に記載の音声符号化装置。
前記予測分析部は、
線形予測分析により前記予測係数として線形予測係数を求め、該線型予測係数により定義される逆フィルタを用いて前記残差信号を求める、
ことを特徴とする請求項１乃至３の何れか１項に記載の音声符号化装置。
予測分析により音声信号から生成された予測係数、該予測分析により該音声信号から生成された残差信号の特定の帯域が雑音帯域であることを示すフラグ、雑音帯域における帯域別残差信号のゲイン、及び、非雑音帯域における周波数変換係数、が符号化された結果である符号を受信する受信部と、
前記符号から、前記予測係数、前記フラグ、前記ゲイン、及び、前記非雑音帯域における周波数変換係数、を復号する復号部と、
前記フラグにより雑音帯域であることが示されている帯域において帯域毎に前記ゲインにより振幅が調整された雑音列を生成する雑音列生成部と、
前記フラグにより雑音帯域であることが示されている帯域においては当該帯域における周波数変換係数を全て０として記憶し、前記非雑音帯域においては前記復号された周波数変換係数を記憶することで全帯域の周波数変換係数を生成し、この生成された周波数変換係数をスペクトル逆変換して非雑音帯域における残差信号を求める逆変換部と、
前記雑音列生成部で生成された雑音列と前記逆変換部で求められた非雑音帯域における残差信号とを重ね合わせて復元残差信号を生成する残差信号復元部と、
前記復号部で復号された予測係数と前記残差信号復元部で生成された復元残差信号とを合成することにより復元音声信号を生成する合成部と、
を備える音声復号装置。
音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成ステップと、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別ステップと、
前記雑音判別ステップにおいて雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成ステップと、
前記雑音判別ステップにおいて雑音帯域ではないと判別された前記帯域の前記帯域別残差信号を実時間領域において重ね合わせてから周波数変換して、非雑音帯域における周波数変換係数を生成する非雑音帯域変換ステップと、
前記予測分析ステップで得られた予測係数と前記フラグ生成ステップで得られたフラグとゲインと前記非雑音帯域変換ステップで得られた周波数変換係数とを符号化する符号化ステップと、
から構成される音声符号化方法。
予測分析により音声信号から生成された予測係数、該予測分析により該音声信号から生成された残差信号の特定の帯域が雑音帯域であることを示すフラグ、雑音帯域における帯域別残差信号のゲイン、及び、非雑音帯域における周波数変換係数、が符号化された結果である符号を受信する受信ステップと、
前記符号から、前記予測係数、前記フラグ、前記ゲイン、及び、前記非雑音帯域における周波数変換係数、を復号する復号ステップと、
前記フラグにより雑音帯域であることが示されている帯域において帯域毎に前記ゲインにより振幅が調整された雑音列を生成する雑音列生成ステップと、
前記フラグにより雑音帯域であることが示されている帯域においては当該帯域における周波数変換係数を全て０として記憶し、前記非雑音帯域においては前記復号された周波数変換係数を記憶することで全帯域の周波数変換係数を生成し、この生成された周波数変換係数をスペクトル逆変換して非雑音帯域における残差信号を求める逆変換ステップと、
前記雑音列生成ステップで生成された雑音列と前記逆変換ステップで求められた非雑音帯域における残差信号とを重ね合わせて復元残差信号を生成する残差信号復元ステップと、
前記復号ステップで復号された予測係数と前記残差信号復元ステップで生成された復元残差信号とを合成することにより復元音声信号を生成する合成ステップと、
から構成される音声復号方法。
コンピュータに、
音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号を帯域別残差信号に分割する帯域別残差信号生成ステップと、
前記残差信号について帯域毎に該帯域が雑音帯域か否かを判別する雑音判別ステップと、
前記雑音判別ステップにおいて雑音帯域であると判別された前記帯域について該帯域が雑音帯域であることを示すフラグを生成するとともに該帯域の帯域別残差信号のゲインを求めるフラグ生成ステップと、
前記雑音判別ステップにおいて雑音帯域ではないと判別された前記帯域の前記帯域別残差信号を実時間領域において重ね合わせてから周波数変換して、非雑音帯域における周波数変換係数を生成する非雑音帯域変換ステップと、
前記予測分析ステップで得られた予測係数と前記フラグ生成ステップで得られたフラグとゲインと前記非雑音帯域変換ステップで得られた周波数変換係数とを符号化する符号化ステップと、
を実行させるコンピュータプログラム。
コンピュータに、
予測分析により音声信号から生成された予測係数、該予測分析により該音声信号から生成された残差信号の特定の帯域が雑音帯域であることを示すフラグ、雑音帯域における帯域別残差信号のゲイン、及び、非雑音帯域における周波数変換係数、が符号化された結果である符号を受信する受信ステップと、
前記符号から、前記予測係数、前記フラグ、前記ゲイン、及び、前記非雑音帯域における周波数変換係数、を復号する復号ステップと、
前記フラグにより雑音帯域であることが示されている帯域において帯域毎に前記ゲインにより振幅が調整された雑音列を生成する雑音列生成ステップと、
前記フラグにより雑音帯域であることが示されている帯域においては当該帯域における周波数変換係数を全て０として記憶し、前記非雑音帯域においては前記復号された周波数変換係数を記憶することで全帯域の周波数変換係数を生成し、この生成された周波数変換係数をスペクトル逆変換して非雑音帯域における残差信号を求める逆変換ステップと、
前記雑音列生成ステップで生成された雑音列と前記逆変換ステップで求められた非雑音帯域における残差信号とを重ね合わせて復元残差信号を生成する残差信号復元ステップと、
前記復号ステップで復号された予測係数と前記残差信号復元ステップで生成された復元残差信号とを合成することにより復元音声信号を生成する合成ステップと、
を実行させるコンピュータプログラム。