JP5025485B2

JP5025485B2 - ステレオ符号化装置およびステレオ信号予測方法

Info

Publication number: JP5025485B2
Application number: JP2007542732A
Authority: JP
Inventors: 道代後藤; 幸司吉田; 宏幸江原
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2005-10-31
Filing date: 2006-10-30
Publication date: 2012-09-12
Anticipated expiration: 2026-10-30
Also published as: US8112286B2; WO2007052612A1; JPWO2007052612A1; EP1953736A1; EP1953736A4; US20090119111A1

Description

本発明は、ステレオ符号化装置およびステレオ信号予測方法に関する。

携帯電話機を用いた通話のように、移動体通信システムにおける音声通信では、現在、モノラル方式による同一ビットレートでの通信が主流である。しかし、今後、第４世代の移動体通信システムのように、伝送レートのさらなる高ビットレート化が進めば、より臨場感の高いステレオ信号を用いた音声通信が普及することが期待される。

ステレオ音声信号の符号化方法としては、非特許文献１記載のものがある。この符号化方法は、以下の式（１）を用いて一方のチャネル信号ｘから他方のチャネル信号ｙを予測し、その予測誤差を最小にするような予測パラメータａ_ｋおよびｄを符号化する。ここで、ａ_ｋはＫ次の予測係数、ｄは二つのチャネル信号の時間差を表している。

Hendrik Fuchs, "Improving Joint Stereo Audio Coding by Adaptive Inter-Channel Prediction," Applications of Signal Processing to Audio and Acoustics, Final Program and Paper Summaries, 1993 IEEE Workshop on 17-20 Oct. 1993, Page(s) 39-42.

しかしながら、上記の符号化方法は、予測誤差を小さくするために予測係数の次数をある次数以上に維持することが必要であり、そのため符号化ビットレートが高くなるという問題がある。例えば、符号化ビットレートを低くするために予測係数の次数を低く設定すると、予測性能が低下し、聴覚的に音質劣化が生じる。

本発明の目的は、ステレオ信号の各チャネル間の予測性能を向上させ、復号信号の音質を改善することができるステレオ符号化装置およびステレオ信号予測方法を提供することである。

本発明のステレオ符号化装置は、第１チャネル信号の低域成分を通過させる第１ローパスフィルタと、第２チャネル信号の低域成分を通過させる第２ローパスフィルタと、前記第１チャネル信号の低域成分から前記第２チャネル信号の低域成分を予測して予測パラメータを生成する予測手段と、前記第１チャネル信号を符号化する第１符号化手段と、前記予測パラメータを符号化する第２符号化手段と、前記予測パラメータを記憶するメモリと、を具備し、前記予測手段は、前記メモリに記憶された過去の前記予測パラメータに基づいて、当該予測パラメータを基準として所定範囲内の予測パラメータを生成する構成を採る。

また、本発明のステレオ信号予測方法は、第１チャネル信号の低域成分を通過させるステップと、第２チャネル信号の低域成分を通過させるステップと、前記第１チャネル信号の低域成分から前記第２チャネル信号の低域成分を予測して予測パラメータを生成するステップと、前記予測パラメータをメモリに記憶するステップと、を具備し、前記予測パラメータを生成するステップでは、前記メモリに記憶された過去の前記予測パラメータに基づいて、当該予測パラメータを基準として所定範囲内の予測パラメータを生成するようにした。

本発明によれば、ステレオ信号の各チャネル間の予測性能を向上させ、復号信号の音質を改善することができる。

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

（実施の形態１）
図１は、本発明の実施の形態１に係るステレオ符号化装置１００の主要な構成を示すブロック図である。

ステレオ符号化装置１００は、ＬＰＦ１０１−１、ＬＰＦ１０１−２、予測部１０２、第１チャネル符号化部１０３、および予測パラメータ符号化部１０４を備え、第１チャネル信号および第２チャネル信号からなるステレオ信号が入力され、これに符号化を施し、符号化パラメータを出力する。なお、本明細書において、同様の機能を有する複数の構成に対して同一の符号を付すこととし、さらに各符号に続けて異なる枝番を付して互いを区別する。

ステレオ符号化装置１００の各部は以下の動作を行う。

ＬＰＦ１０１−１は、入力信号（原信号）の低域成分のみを通過させるローパスフィルタであり、具体的には、入力される第１チャネル信号Ｓ１において遮断周波数（カットオフ周波数）よりも高域の周波数成分を遮断し、低域成分のみが残った第１チャネル信号Ｓ１’を予測部１０２に出力する。ＬＰＦ１０１−２も同様に、ＬＰＦ１０１−１と同一の遮断周波数を用いて、入力される第２チャネル信号Ｓ２の高域成分を遮断し、低域成分のみの第２チャネル信号Ｓ２’を予測部１０２に出力する。

予測部１０２は、ＬＰＦ１０１−１から出力される第１チャネル信号Ｓ１’（低域成分）およびＬＰＦ１０１−２から出力される第２チャネル信号Ｓ２’（低域成分）を用いて、第１チャネル信号から第２チャネル信号を予測し、この予測に関する情報（予測パラメータ）を予測パラメータ符号化部１０４に出力する。具体的には、予測部１０２は、信号Ｓ１’と信号Ｓ２’とを比較することにより、これら２つの信号間の遅延時間差τおよび振幅比ｇ（共に第１チャネル信号を基準とした値）を求め、これらを予測パラメータとして予測パラメータ符号化部１０４に出力する。

第１チャネル符号化部１０３は、原信号Ｓ１に対し、所定の符号化処理を行い、第１チャネルに関して得られる符号化パラメータを出力する。原信号が音声信号であるならば、第１チャネル符号化部１０３は、例えば、ＣＥＬＰ（Code-Excited Linear Prediction）方式による符号化を行い、得られる適応符号帳ラグ、ＬＰＣ係数等のＣＥＬＰパラメータを符号化パラメータとして出力する。また、原信号がオーディオ信号であるならば、第１チャネル符号化部１０３は、例えば、ＭＰＥＧ−４（Moving Picture Experts Group phase-4）に規定されるＡＡＣ（Advanced Audio Coding）方式による符号化を行い、得られる符号化パラメータを出力する。

予測パラメータ符号化部１０４は、予測部１０２から出力される予測パラメータに対し、所定の符号化処理を施し、得られる符号化パラメータを出力する。例えば、所定の符号化処理として、予測パラメータの候補を予め記憶した符号帳を備え、この符号帳から最適な予測パラメータを選択し、この予測パラメータに対応するインデックスを出力する方法をとる。

次いで、予測部１０２で行われる上記予測処理について、より詳細に説明する。

予測部１０２は、遅延時間差τおよび振幅比ｇを求める際に、まず遅延時間差τから求める。ＬＰＦ１０１−１通過後の第１チャネル信号の低域成分Ｓ１’と、ＬＰＦ１０１−２通過後の第２チャネル信号の低域成分Ｓ２’との間の遅延時間差τは、次式（２）で表される相互相関関数の値を最大にするｍ＝ｍ_ｍａｘとして求まる。

ここで、ｎおよびｍはサンプル番号を、ＦＬはフレーム長（サンプル数）を示す。相互相関関数は、一方の信号をｍだけシフトさせ、２つの信号相互の相関値を算出したものである。

次に、予測部１０２は、求まった遅延時間差τを用いて、Ｓ１’とＳ２’との間の振幅比ｇを次式（３）に従って求める。

上記式（３）は、Ｓ２’と遅延時間差τ分だけずらしたＳ１’との振幅比を算出している。

そして、予測部１０２は、τおよびｇを用いて、第１チャネル信号の低域成分Ｓ１’から第２チャネル信号の低域成分Ｓ２”を次式（４）に従って予測する。

このように、予測部１０２が、第１チャネル信号の低域成分を用いて、第２チャネル信号の低域成分を予測することにより、ステレオ信号の予測性能が向上する。この原理について以下詳細に説明する。

図２Ａ及び図２Ｂは、原信号である第１チャネル信号および第２チャネル信号の各スペクトルの一例を示した図である。なお、ここでは、説明を簡単にするために、音源（音の発生源）が１つである場合を例にとって説明する。

そもそもステレオ信号は、全チャネル共通のある音源で発生した音を、互いに離れて設置された複数の（本実施の形態では２つの）マイクロフォンで収音した信号である。よって、音源からマイクロフォンまで遠ければ遠いほど信号のエネルギーが減衰し、また到達時間にも遅延が生じる。そのため、図２Ａ及び図２Ｂにも現れているように、各チャネルのスペクトルは異なる波形を示すものの、遅延時間差Δｔおよび振幅差ΔＡを補正すれば、両チャネルの信号は良く類似するようになる。ここで、遅延時間差および振幅差というパラメータは、マイクロフォンの設置位置によって決まる特性パラメータであるため、１つのマイクロフォンで収音された信号に対し１組の値が対応するパラメータである。

一方、音声信号またはオーディオ信号には、図３に示すように、信号のエネルギーが高域よりもより低域の方に偏るという特徴がある。そのため、符号化処理の一部として予測を行う場合には、高域成分よりも低域成分に重点を置いて予測を行うことが予測性能向上の観点から望ましい。

そこで、本実施の形態では、入力信号の高域成分を遮断し、残った低域成分を用いて予測パラメータを求める。そして、求まった予測パラメータの符号化パラメータを復号側に出力する。すなわち、予測パラメータ自体は、入力信号の低域成分に基づいて求めたものであるが、これを高域まで含めた全帯域に対する予測パラメータとして出力する。既に説明した通り、予測パラメータは、１つのマイクロフォンで収音された信号に対し１組の値が対応するものであるから、低域成分のみに基づいて求めたものであっても、その予測パラメータ自体は全帯域に対して有効であると考えられるからである。

また、エネルギーの低い高域成分をも含めて予測を行うと、この精度の悪い高域成分の
影響で予測性能が低下する可能性があるが、本実施の形態では、高域成分を予測に用いないため、高域成分の影響を受けて予測性能が低下するおそれもない。

ステレオ符号化装置１００に対応する本実施の形態に係るステレオ復号装置は、第１チャネル符号化部１０３から出力される第１チャネルの符号化パラメータを受信し、この符号化パラメータを復号することにより、第１チャネルの復号信号を得ると共に、予測パラメータ符号化部１０４から出力される符号化パラメータ（予測パラメータ）および第１チャネルの復号信号を用いることにより、全帯域の第２チャネルの復号信号を得ることができる。

このように、本実施の形態によれば、ＬＰＦ１０１−１で第１チャネル信号の高域成分を遮断し、ＬＰＦ１０１−２で第２チャネル信号の高域成分を遮断し、予測部１０２で第１チャネル信号の低域成分から第２チャネル信号の低域成分を予測することにより、予測パラメータを得る。そして、第１チャネル信号の符号化パラメータと共にこの予測パラメータの符号化パラメータを出力することにより、ステレオ信号の各チャネル間の予測性能を向上させ、復号信号の音質を改善することができる。また、原信号の高域成分を遮断しているので、予測係数の次数も低く抑えることができる。

なお、本実施の形態では、原信号の第１チャネル信号に対し第１チャネル符号化部１０３において符号化を施し、予測部１０２において、第１チャネル信号Ｓ１’から第２チャネル信号Ｓ２’を予測する場合を例にとって説明したが、第１チャネル符号化部１０３の代わりに第２チャネル符号化部を設け、原信号の第２チャネル信号に対し符号化を施す態様としても良い。かかる場合、予測部１０２において、第２チャネル信号Ｓ２’から第１チャネル信号Ｓ１’を予測するような構成とする。

また、本実施の形態は、第１チャネル信号および第２チャネル信号を入力信号とする代わりに、別の入力信号に対して上記の符号化を行うことも可能である。図４は、本実施の形態の他のバリエーションに係るステレオ符号化装置１００ａの主要な構成を示すブロック図である。ここでは、第１チャネル信号Ｓ１および第２チャネル信号Ｓ２がステレオ／モノラル変換部１１０に入力され、ステレオ／モノラル変換部１１０において、ステレオ信号Ｓ１、Ｓ２がモノラル信号Ｓ_ＭＯＮＯに変換され、出力される。

ステレオ／モノラル変換部１１０における変換方法としては、例えば、第１チャネル信号Ｓ１および第２チャネル信号Ｓ２の平均信号または重み付き平均信号を求め、これをモノラル信号Ｓ_ＭＯＮＯとする。すなわち、このバリエーションにおいては、実質的な符号化の対象は、モノラル信号Ｓ_ＭＯＮＯおよび第１チャネル信号Ｓ１ということになる。

そこで、ＬＰＦ１１１は、モノラル信号Ｓ_ＭＯＮＯの高域部をカットしてモノラル信号Ｓ’_ＭＯＮＯを生成し、予測部１０２ａは、モノラル信号Ｓ’_ＭＯＮＯから第１チャネル信号Ｓ１を予測し、予測パラメータを算出する。一方、第１チャネル符号化部１０３の代わりにモノラル符号化部１１２が設けられており、このモノラル符号化部１１２は、モノラル信号Ｓ_ＭＯＮＯに対し所定の符号化処理を施す。他の動作はステレオ符号化装置１００と同様である。

また、本実施の形態は、予測部１０２から出力される予測パラメータに対し、平滑化処理を施すような構成としても良い。図５は、本実施の形態のさらなるバリエーションに係るステレオ符号化装置１００ｂの主要な構成を示すブロック図である。ここでは、予測部１０２の後段に平滑化部１２０が設けられ、予測部１０２から出力される予測パラメータに対し平滑化処理が施される。また、メモリ１２１が設けられ、平滑部１２０から出力される平滑化された予測パラメータが保存される。より詳細には、平滑化部１２０は、予測
部１０２から入力される現フレームのτ(ｉ)、ｇ(ｉ)、およびメモリ１２１から入力される過去フレームのτ(ｉ−１)、ｇ(ｉ−１)の双方を用いて、以下の式（５）、（６）に示す平滑化処理を施し、平滑化された予測パラメータを予測パラメータ符号化部１０４ｂに出力する。

予測パラメータ符号化部１０４ｂは、この平滑化された予測パラメータに対し、次式（７）を用いた予測を行い、予測パラメータを得る。

他の動作はステレオ符号化装置１００と同様である。このように、τおよびｇの値の変化がフレーム間で平滑化されることにより、第２チャネル信号の予測信号Ｓ２”のフレーム間の連続性を向上させることができる。

また、本実施の形態では、予測パラメータとして遅延時間差τおよび振幅比ｇを用いる場合を例にとって説明したが、これらのパラメータの代わりに遅延時間差τおよび予測系数列ａ_ｋを用いて、次式（８）により第１チャネル信号から第２チャネル信号を予測するような構成としても良い。

この構成により、予測性能をより高めることができる。

また、本実施の形態では、予測パラメータの１つとして振幅比を用いる場合を例にとって説明したが、同様の特性を示すパラメータとして振幅差、エネルギー比、エネルギー差等を用いても良い。

（実施の形態２）
図６は、本発明の実施の形態２に係るステレオ符号化装置２００の主要な構成を示すブロック図である。なお、ステレオ符号化装置２００は、実施の形態１に示したステレオ符号化装置１００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置２００は、メモリ２０１をさらに備え、このメモリ２０１に保存されているデータを予測部２０２が適宜参照し、実施の形態１に係る予測部１０２と異なる動作を行う。

より詳細には、メモリ２０１は、予測部２０２から出力される予測パラメータ（遅延時間差τ、振幅比ｇ）を過去の所定フレーム（フレーム数Ｎ）について蓄積し、これを予測部２０２に適宜出力する。

予測部２０２には、メモリ２０１から過去フレームの予測パラメータが入力される。予測部２０２は、メモリ２０１から入力される過去フレームの予測パラメータの値に応じて、現フレームにおいて予測パラメータを探索する際の探索範囲を決定する。予測部２０２は、決定された探索範囲内において予測パラメータの探索を行い、最終的に得られる予測パラメータを予測パラメータ符号化部１０４に出力する。

上記処理を数式を用いて説明すると、過去の遅延時間差をτ(ｉ−１)、τ(ｉ−２)、τ(ｉ−３)、・・・、τ(ｉ−ｊ)・・・、τ(ｉ−Ｎ)として、現フレームの遅延時間差τ(ｉ)は、次式（９）に示す範囲内で検索が行われる。

ここで、ｊは１からＮまでの値である。

また、過去の振幅比をｇ(ｉ−１)、ｇ(ｉ−１)、ｇ(ｉ−２)、ｇ(ｉ−３)、・・・、ｇ(ｉ−ｊ)、・・・、ｇ(ｉ−Ｎ)として、現フレームの振幅比ｇ(ｉ)は、次式（１０）に示す範囲内で検索が行われる。

ｊは１からＮまでの値である。

このように、本実施の形態によれば、予測パラメータを求める際の探索範囲を、過去フレームにおける予測パラメータの値に基づいて決定することにより、より詳細には、現フレームの予測パラメータを過去フレームの予測パラメータの近傍の値に制限することにより、極端な予測誤りが発生することを防止し、復号信号の音質劣化を回避することができる。

（実施の形態３）
図７は、本発明の実施の形態３に係るステレオ符号化装置３００の主要な構成を示すブロック図である。ステレオ符号化装置３００も、実施の形態１に示したステレオ符号化装置１００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置３００は、パワ検出部３０１および遮断周波数決定部３０２をさらに備え、パワ検出部３０１の検出結果に基づいて、遮断周波数決定部３０２がＬＰＦ１０１−１、１０１−２の遮断周波数を適応的に制御する。

より詳細には、パワ検出部３０１は、第１チャネル信号Ｓ１および第２チャネル信号Ｓ２の双方のパワをモニタし、モニタ結果を遮断周波数決定部３０２に出力する。ここで、
パワとして各サブバンドごとの平均値を使用する。

遮断周波数決定部３０２は、まず、第１チャネル信号Ｓ１について、各サブバンド毎のパワを全帯域に亘って平均し、全帯域の平均パワを算出する。次に、遮断周波数決定部３０２は、算出された全帯域の平均パワを閾値として、第１チャネル信号Ｓ１の各サブバンドのパワを閾値と大小比較する。そして、閾値よりも大きなサブバンドを全て含むような遮断周波数ｆ１を決定する。

第２チャネル信号Ｓ２についても第１チャネル信号Ｓ１と同様の処理を行い、遮断周波数決定部３０２は、ＬＰＦ１０１−２の遮断周波数ｆ２の値を決定する。そして、遮断周波数ｆ１、ｆ２に基づいて、最終的なＬＰＦ１０１−１、１０１−２に共通の遮断周波数ｆｃを決定し、ＬＰＦ１０１−１、１０１−２に指示する。これにより、ＬＰＦ１０１−１、１０１−２は、相対的にパワが大きな周波数帯域の成分を全て残して、予測部１０２に出力することができる。

通常、ｆ１とｆ２とは同一の値になると考えられるので、遮断周波数決定部３０２は、ｆ１（またはｆ２）を最終的な遮断周波数ｆｃとする。もし、ｆ１とｆ２とが異なる値を示す場合は、情報を安全に残すという観点から、より低域成分が残る方の遮断周波数、すなわち値の大きい方の遮断周波数を採用してｆｃとする。

このように、本実施の形態によれば、相対的にパワの高い信号を対象として、予測パラメータである遅延時間差および振幅比を求めるので、予測パラメータの算出精度、すなわち予測性能を向上させることができる。

なお、本実施の形態では、入力信号のパワに基づいてローパスフィルタの遮断周波数を決定する例を示したが、例えば、入力信号のサブバンド毎のＳ／Ｎ比を用いる構成としても良い。図８は、本実施の形態の他のバリエーションに係るステレオ符号化装置３００ａの主要な構成を示すブロック図である。ステレオ符号化装置３００ａは、パワ検出部３０１の代わりにＳ／Ｎ比検出部３０１ａを備え、入力信号のサブバンド毎のＳ／Ｎ比をモニタする。ノイズレベルは、入力信号から推定する。遮断周波数決定部３０２ａは、Ｓ／Ｎ比検出部３０１ａのモニタ結果に基づき、相対的にＳ／Ｎ比の高いサブバンドを全て含むように、ローパスフィルタの遮断周波数を決定する。これにより、周囲騒音が存在する環境下で遮断周波数を適応的に制御することができる。よって、周囲騒音のレベルが相対的に低いサブバンドに基づいて遅延時間差および振幅比を算出することができ、予測パラメータの算出精度を向上させることができる。

また、遮断周波数がフレーム毎に不連続に変動すると、ローパスフィルタ通過後の信号の特性が変化し、τやｇの値もフレーム毎に不連続となって予測性能が低下する。そこで、遮断周波数がフレーム間で連続性を保つように、遮断周波数自体の平滑化を行っても良い。

（実施の形態４）
図９は、本発明の実施の形態４に係るステレオ符号化装置４００の主要な構成を示すブロック図である。ここでは、入力信号が音声信号であり、また、ステレオ符号化装置４００が、モノラル信号の符号化パラメータとステレオ信号の符号化パラメータとを生成するスケーラブル符号化装置である例を示す。

ステレオ符号化装置４００の一部の構成は、実施の形態１のバリエーションにおいて示したステレオ符号化装置１００ａと同一である（図４参照。同一の構成要素には同一の符号を付す。）。しかし、入力信号が音声であるので、ステレオ符号化装置１００ａにはな
い構成である第１チャネル符号化部４１０において、音声符号化に適したＣＥＬＰ符号化の手法を第１チャネル信号の符号化に応用できるような工夫が施されている。

具体的には、ステレオ符号化装置４００は、第１チャネル信号および第２チャネル信号を入力信号とし、コアレイヤにおいてモノラル信号の符号化を行い、拡張レイヤにおいてステレオ信号のうち第１チャネル信号について符号化を行い、モノラル信号の符号化パラメータおよび第１チャネル信号の符号化パラメータの双方を復号側に出力する。復号側では、モノラル信号の符号化パラメータおよび第１チャネル信号の符号化パラメータを用いて、第２チャネル信号も復号することができる。

コアレイヤは、ステレオ／モノラル変換部１１０、ＬＰＦ１１１、およびモノラル符号化部１１２を備え、これらの構成は、ステレオ符号化装置１００ａに示した構成と基本的に同一であるが、モノラル符号化部１１２はさらに、符号化処理の途中で得られるモノラル信号の駆動音源信号を拡張レイヤに出力する。

拡張レイヤは、ＬＰＦ１０１−１、予測部１０２ａ、予測パラメータ符号化部１０４、および第１チャネル符号化部４１０を備える。予測部１０２ａは、実施の形態１と同様に、モノラル信号の低域成分から第１チャネル信号の低域成分を予測して、生成された予測パラメータを予測パラメータ符号化部１０４に出力すると共に、駆動音源予測部４０１にも出力する。

第１チャネル符号化部４１０は、第１チャネル信号を音源情報と声道情報とに分けて符号化を行う。音源情報については、駆動音源予測部４０１で予測部１０２ａから出力される予測パラメータを用いて、モノラル符号化部１１２から出力されるモノラル信号の駆動音源信号を用いて、第１チャネル信号の駆動音源信号を予測する。そして、第１チャネル符号化部４１０は、通常のＣＥＬＰ符号化と同様に、音源符号帳４０２、合成フィルタ４０５、歪み最小化部４０８等を用いた音源探索を行い、音源情報の符号化パラメータを得る。一方、声道情報については、ＬＰＣ分析／量子化部４０４で第１チャネル信号の線形予測分析およびその分析結果の量子化を行い、声道情報の符号化パラメータを得て、これは合成フィルタ４０５での合成信号の生成に使用される。

このように、本実施の形態によれば、ステレオ／モノラル変換部１１０で第１チャネル信号および第２チャネル信号からモノラル信号を生成し、ＬＰＦ１１１でモノラル信号の高域成分を遮断してモノラルの低域成分を生成する。そして、予測部１０２ａで、実施の形態１と同様の処理により、モノラル信号の低域成分から第１チャネル信号の低域成分を予測して予測パラメータを得、この予測パラメータを用いてＣＥＬＰ符号化に準じた方法により第１チャネル信号の符号化を行い、第１チャネル信号の符号化パラメータを得る。この第１チャネル信号の符号化パラメータは、モノラル信号の符号化パラメータと共に復号側に出力される。この構成により、モノラル−ステレオのスケーラブル符号化装置を実現し、かつ、ステレオ信号の各チャネル間の予測性能を向上させ、復号信号の音質を改善することができる。

（実施の形態５）
図１０は、本発明の実施の形態５に係るステレオ符号化装置５００の主要な構成を示すブロック図である。ステレオ符号化装置５００も、実施の形態１に示したステレオ符号化装置１００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置５００は、閾値設定部５０１および予測部５０２を備え、予測部５０２は、閾値設定部５０１に予め設定されている閾値φ_ｔｈと相互相関関数φの値とを比
較することにより、この相互相関関数の信頼性を判定する。

具体的には、予測部５０２は、まず、ＬＰＦ１０１−１通過後の第１チャネル信号の低域成分Ｓ１’と、ＬＰＦ１０１−２通過後の第２チャネル信号の低域成分Ｓ２’とを用い、次式（１１）で表される相互相関関数φを求める。

但し、相互相関関数φは、各々のチャネル信号の自己相関関数で正規化されているとする。また、ｎおよびｍはサンプル番号を、ＦＬはフレーム長（サンプル数）を示す。式（１１）から明らかなように、φの最大値は１である。

そして、予測部５０２は、閾値設定部５０１に予め設定されている閾値φ_ｔｈと相互相関関数φの最大値とを比較し、これが閾値以上の場合、この相互相関関数を信頼できるものと判定する。言い換えれば、予測部５０２は、閾値設定部５０１に予め設定されている閾値φｔｈと相互相関関数φの各サンプル値とを比較し、少なくとも１点において閾値以上のサンプル点が存在する場合、この相互相関関数を信頼できるものと判定する。図１１は、相互相関関数φの一例を示した図である。これは、相互相関関数の最大値が閾値を超える例である。

かかる場合、予測部５０２は、第１チャネル信号の低域成分Ｓ１’と、第２チャネル信号の低域成分Ｓ２’との間の遅延時間差τを、上記式（１１）で表される相互相関関数の値を最大にするｍ＝ｍ_ｍａｘとして求める。

一方、予測部５０２は、相互相関関数φの最大値が閾値φ_ｔｈに達しない場合、前フレームで既に求まっている遅延時間差τを当該フレームの遅延時間差τとして決定する。図１２も、相互相関関数φの一例を示した図である。ここでは、相互相関関数の最大値が閾値を超えない例を示している。

なお、予測部５０２は、振幅比ｇについては、実施の形態１と同様の方法により算出する。

このように、本実施の形態によれば、信頼性の高い遅延時間差τを求めるために、相互相関関数の値が信頼できるか否かの判定を行った上で、遅延時間差τの値を決定する。具体的には、遅延時間差を求める際の相互相関関数として、各々のチャネル信号の自己相関関数で正規化されている相互相関関数を使用し、予め閾値を設けておいて、相互相関関数の最大値が閾値以上となる場合、相互相関関数の値を最大にするｍ＝ｍ_ｍａｘを遅延時間差として決定する。一方、相互相関関数が全く閾値に達しない場合は、前フレームで求まっている遅延時間差を当該フレームの遅延時間差として決定する。このような構成を採ることにより、遅延時間差をより精度良く求めることができる。

（実施の形態６）
図１３は、本発明の実施の形態６に係るステレオ符号化装置６００の主要な構成を示すブロック図である。ステレオ符号化装置６００は、実施の形態５に示したステレオ符号化装置５００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置６００は、有声／無声判定部６０１をさらに備え、閾値設定部５０１の閾値設定のために、ローパスフィルタを通過する前の第１チャネル信号および第２チャネル信号の有声／無声判定を行う。

具体的には、有声／無声判定部６０１は、第１チャネル信号Ｓ１および第２チャネル信号Ｓ２の各々を用いて、自己相関関数φ_ＳＳの値を次式（１２）に従って算出する。

ここで、Ｓ(ｎ)は第１チャネル信号または第２チャネル信号を、ｎおよびｍはサンプル番号を、ＦＬはフレーム長（サンプル数）を示す。式（１２）から明らかなように、φ_ＳＳの最大値は１である。

有声／無声判定部６０１には、有声／無声判定のための閾値が予め設定されている。有声／無声判定部６０１は、第１チャネル信号または第２チャネル信号の自己相関関数φ_ＳＳの値を閾値と比較し、閾値を超えた場合は有声と判定し、超えなかった場合は有声ではない（すなわち無声）と判定する。すなわち、有声／無声判定は、第１チャネル信号および第２チャネル信号の双方に対し行われる。そして、第１チャネル信号の自己相関関数φ_ＳＳおよび第２チャネル信号の自己相関関数φ_ＳＳの双方の値を、例えば平均値をとる等することにより考慮し、これらのチャネル信号が有声であるか無声であるかを決定する。判定結果は、閾値設定部５０１へ出力される。

閾値設定部５０１は、有声と判断された場合と、有声と判断されなかった場合とで、閾値設定を変える。具体的には、有声の場合の閾値φ_Ｖを無声の場合の閾値φ_ＵＶよりも小さく設定する。その理由は、有声音の場合は周期性があるので、ローカルピークとなる相互相関関数の値と、他のローカルピークとならない相互相関関数の値との差が大きいからである。一方、無声音の場合は周期性がないので（雑音的であるので）、ローカルピークとなる相互相関関数の値と、他のローカルピークとならない相互相関関数の値との差が大きくならないからである。

図１４は、有声音の場合の相互相関関数の一例を示した図である。また、図１５は、無声音の場合の相互相関関数の一例を示した図である。共に、閾値も併せて示している。この図に示すように、有声音と無声音とでは相互相関関数の様相が異なるので、信頼できる相互相関関数の値を採用するために、閾値を設定し、有声性を有する信号と、無声性を有する信号とで、閾値の設定の仕方を変える。すなわち、無声性を示すと判断された信号に対しては、相互相関関数の閾値を大きく設定することにより、他のローカルピークとならない相互相関関数の値との差が大きくない限りは、遅延時間差として採用されないこととなり、相互相関関数の信頼性を高めることができる。

このように、本実施の形態によれば、ローパスフィルタを通過する前の第１チャネル信号および第２チャネル信号を用いて有声／無声判定を行い、有声の場合と無声の場合とで、相互相関関数の信頼度を判断する際の閾値を変える。具体的には、有声の場合の閾値を無声の場合の閾値よりも小さく設定する。よって、遅延時間差をより精度良く求めることができる。

（実施の形態７）
図１６は、本発明の実施の形態７に係るステレオ符号化装置７００の主要な構成を示すブロック図である。ステレオ符号化装置７００は、実施の形態６に示したステレオ符号化装置６００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置７００は、有声／無声判定部６０１の後段に、係数設定部７０１、閾値設定部７０２、および予測部７０３を備え、有声／無声の判定結果に応じた係数を相互相関関数の最大値に乗じ、この係数乗算後の相互相関関数の最大値を用いて、遅延時間差を求める。

具体的には、係数設定部７０１は、有声／無声判定部６０１から出力される判定結果に基づいて、有声の場合と無声の場合とで異なる係数ｇを設定し、閾値設定部７０２へ出力する。ここで係数ｇは、相互相関関数の最大値を基準にして、１未満の正の値が設定される。また、有声の場合の係数ｇ_Ｖが無声の場合の係数ｇ_ＵＶよりも大きくなるように設定される。閾値設定部７０２は、相互相関関数の最大値φ_ｍａｘに係数ｇを乗じた値を閾値φ_ｔｈに設定し、予測部７０３へ出力する。予測部７０３は、この閾値φ_ｔｈと相互相関関数の最大値φ_ｍａｘとの間の領域にピークの頂点が含まれるローカルピークを検出する。

図１７は、有声音の場合の相互相関関数の一例を示した図である。また、図１８は、無声音の場合の相互相関関数の一例を示した図である。共に、閾値も併せて示している。予測部７０３は、ピークの頂点が最大値φ_ｍａｘと閾値φ_ｔｈとの間の領域に存在する相互相関関数のローカルピークを検出し、最大値を示すピーク（図中、丸で囲んだピーク）以外にローカルピークが検出されなければ、相互相関関数の値を最大とするｍ＝ｍ_ｍａｘを遅延時間差として決定する。例えば、図１７の例では、φ_ｍａｘとφ_ｔｈとの間の領域にローカルピークが１箇所だけ存在するので、ｍ＝ｍ_ｍａｘを遅延時間差τとして採用する。一方、最大値を示すピーク以外にもローカルピークが検出されれば、前フレームの遅延時間差を当該フレームの遅延時間差として決定する。例えば、図１８の例では、φ_ｍａｘとφ_ｔｈの間の領域にローカルピークが４箇所存在するので（図中、丸で囲んだピーク）、ｍ＝ｍ_ｍａｘを遅延時間差τとしては採用せず、前フレームの遅延時間差を当該フレームの遅延時間差として採用する。

有声と無声で係数を変えることにより閾値の設定を変更する理由は、有声音の場合は周期性があるので、通常ローカルピークとなる相互相関関数の値と、他のローカルピークとならない相互相関関数の値との差が大きいので、最大値φ_ｍａｘの近傍だけを確認すれば良いためである。一方、無声音の場合、通常、周期性がないので（雑音的であるので）、ローカルピークとなる相互相関関数の値と、他のローカルピークとならない相互相関関数の値との差が大きくならないので、最大値φ_ｍａｘと他のローカルピークとの差が充分にあるかを確認する必要があるためである。

このように、本実施の形態によれば、相互相関関数の最大値を基準にして、最大値に１未満の正の係数を乗じた値を閾値とする。ここで、有声の場合と無声の場合とで、乗じる係数の値を変える（有声の場合の方が無声の場合よりも大きくする）。そして、相互相関関数の最大値と閾値との間に存在する相互相関関数のローカルピークを検出し、最大値を示すピーク以外にローカルピークが検出されなければ、相互相関関数の値を最大とするｍ＝ｍ_ｍａｘの値を遅延時間差として決定する。一方、最大値を示すピーク以外にローカルピークが検出される場合は、前フレームの遅延時間差を当該フレームの遅延時間差として決定する。すなわち、相互相関関数の最大値を基準として、相互相関関数の最大値から所定の範囲内に含まれるローカルピークの個数の大小に応じて、遅延時間差を設定する。こ
のような構成を採ることにより、遅延時間差をより精度良く求めることができる。

（実施の形態８）
図１９は、本発明の実施の形態８に係るステレオ符号化装置８００の主要な構成を示すブロック図である。ステレオ符号化装置８００は、実施の形態５に示したステレオ符号化装置５００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置８００は、相互相関関数値保存部８０１をさらに備え、この相互相関関数値保存部８０１に保存されている相互相関関数値を予測部８０２が参照し、実施の形態５に係る予測部５０２とは異なる動作を行う。

具体的には、相互相関関数値保存部８０１は、予測部８０２から出力される平滑化後の最大相互相関値を蓄積し、これを予測部８０２に適宜出力する。

予測部８０２は、閾値設定部５０１に予め設定されている閾値φ_ｔｈと相互相関関数φの最大値とを比較し、これが閾値以上の場合、この相互相関関数を信頼できるものと判定する。言い換えれば、予測部８０２は、閾値設定部５０１に予め設定されている閾値φ_ｔｈと相互相関関数φの各サンプル値とを比較し、少なくとも１点において閾値以上のサンプル点が存在する場合、この相互相関関数を信頼できるものと判定する。

かかる場合、予測部８０２は、第１チャネル信号の低域成分Ｓ１’と、第２チャネル信号の低域成分Ｓ２’との間の遅延時間差τを、上記式（１２）で表される相互相関関数の値を最大にするｍ＝ｍ_ｍａｘとして求める。

一方、予測部８０２は、相互相関関数φの最大値が閾値φ_ｔｈに達しない場合、相互相関関数値保存部８０１から出力された前フレームの平滑化後の最大相互相関値を用いて、遅延時間差τを決定する。平滑化後の最大相互相関値は次式（１３）によって表される。

ここで、φ_{ｓｍｏｏｔｈ＿ｐｒｅｖ}は前フレームの平滑化後の最大相互相関値を、φ_ｍａｘは現フレームの最大相互相関値を、αは平滑化の係数であり、０＜α＜１を満たす定数である。

なお、相互相関関数値保存部８０１に蓄積された平滑化後の最大相互相関値は、次のフレームの遅延時間差決定の際、φ_{ｓｍｏｏｔｈ＿ｐｒｅｖ}として用いられる。

具体的には、相互相関関数φの最大値が閾値φ_ｔｈに達しない場合、予測部８０２は、前フレームの平滑化後の最大相互相関値φ_{ｓｍｏｏｔｈ＿ｐｒｅｖ}を予め定められた閾値φ_{ｔｈ＿ｓｍｏｏｔｈ＿ｐｒｅｖ}と比較する。この結果、φ_{ｓｍｏｏｔｈ＿ｐｒｅｖ}がφ_{ｔｈ＿ｓｍｏｏｔｈ＿ｐｒｅｖ}より大きい場合、前フレームの遅延時間差を現フレームの遅延時間差τとして決定する。逆に、φ_{ｓｍｏｏｔｈ＿ｐｒｅｖ}がφ_{ｔｈ＿ｓｍｏｏｔｈ＿ｐｒｅｖ}を超えない場合、現フレームの遅延時間差を０とする。

なお、予測部８０２は、振幅比ｇについては、実施の形態１と同様の方法により算出する。

このように、本実施の形態によれば、現フレームの最大相互相関値が低い場合に得られた遅延時間差は信頼性も低いため、前フレームでの平滑化最大相互相関値を用いて判定されたより信頼性の高い前フレームの遅延時間差で代用することにより、遅延時間差をより精度良く求めることができる。

（実施の形態９）
図２０は、本発明の実施の形態９に係るステレオ符号化装置９００の主要な構成を示すブロック図である。ステレオ符号化装置９００は、実施の形態６に示したステレオ符号化装置６００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

ステレオ符号化装置９００は、重み設定部９０１及び遅延時間差保存部９０２をさらに備え、第１チャネル信号および第２チャネル信号の有声／無声判定結果に応じた重みが重み設定部９０１から出力され、この重みと、遅延時間差保存部９０２に保存されている遅延時間差とを用いて、予測部９０３が実施の形態６に係る予測部５０２とは異なる動作を行う。

重み設定部９０１は、有声／無声判定部６０１において有声と判断された場合と、無声と判断された場合とで、重みｗ（＞１．０）を変える。具体的には、無声の場合の重みｗを有声の場合の重みｗよりも大きく設定する。

その理由は、有声音の場合は周期性があるので、相互相関関数の最大値と、ローカルピークでの他の相互相関関数の値との差が比較的大きく、最大相互相関値を示すシフト量が正しい遅延差であることの信頼性が高いのに対して、無声音の場合は周期性がない（雑音的である）ので、相互相関関数の最大値と、ローカルピークでの他の相互相関関数の値との差が比較的小さく、最大相互相関値を示すシフト量が必ずしも正しい遅延差を示しているとは限らないからである。このため、無声の場合の重みｗをより大きく設定し、前フレームの遅延差をより選びやすくすることで、より精度の高い遅延差を求めることができる。

遅延時間差保存部９０２は、予測部９０３から出力される遅延時間差τを蓄積し、これを予測部９０３に適宜出力する。

予測部９０３は、重み設定部９０１によって設定された重みｗを用いて、遅延差を以下のように決定する。まず、ＬＰＦ１０１−１通過後の第１チャネル信号の低域成分Ｓ１’と、ＬＰＦ１０１−２通過後の第２チャネル信号の低域成分Ｓ２’との間の遅延時間差τの候補を上記式（１１）で表される相互相関関数の値を最大にするｍ＝ｍ_ｍａｘとして求める。相互相関関数は、各々のチャネル信号の自己相関関数で正規化されている。

ただし、式（１１）において、ｎはサンプル番号を、ＦＬはフレーム長（サンプル数）を示す。また、ｍはシフト量を示す。

ここで、予測部９０３は、ｍの値と、遅延時間差保存部９０２に保存されている前フレームの遅延時間差の値との差分が予め設定された範囲内にあれば、次式（１４）に示すように、上記式（１１）によって得られる相互相関値に対して、重み設定部９０１によって設定された重みを乗じる。なお、予め設定された範囲とは、遅延時間差保存部９０２に保存されている前フレームの遅延時間差τ_ｐｒｅｖを中心に設定される。

一方、ｍの値が予め設定された範囲外にあれば、次式（１５）に示すようになる。

このように求めた遅延時間差τの候補の信頼性を上記式（１４）及び上記式（１５）によって表される相互相関関数の最大値（最大相互相関値）φ_ｍａｘにより判定し、最終的な遅延時間差τを決定する。具体的には、閾値設定部５０１に予め設定されている閾値φ_ｔｈと最大相互相関値φ_ｍａｘとを比較し、最大相互相関値φ_ｍａｘが閾値φ_ｔｈ以上の場合、この相互相関関数を信頼できるものと判定し、相互相関関数の値を最大にするｍ＝ｍ_ｍａｘを遅延時間差τとして決定する。

図２１は、相互相関関数のローカルピークが重み付けされることによって最大相互相関値となる場合の一例を示した図である。また、図２２は、閾値φ_ｔｈを超えていなかった最大相互相関値が重み付けされることによって閾値φ_ｔｈを超える最大相互相関値となる場合の一例を示した図である。さらに、図２３は、閾値φ_ｔｈを超えていなかった最大相互相関値が重み付けされても閾値φ_ｔｈを超えなかった場合の一例を示した図である。図２３に示す場合、現フレームの遅延時間差を０に設定する。

このように、本実施の形態によれば、サンプルのシフト量ｍと前フレームの遅延時間差との差分が所定範囲内である場合、相互相関関数値に重み付けを行うことにより、前フレームの遅延時間差付近のシフト量での相互相関関数値をそれ以外のシフト量での相互相関関数値に比べて相対的により大きい値として評価し、前フレームの遅延時間差付近のシフト量が選ばれやすくなり、これにより、現フレームの遅延時間差をより精度良く求めることができる。

なお、本実施の形態では、有声無声判定結果によって、相互相関関数値に乗じる重みを変える構成として説明したが、有声無声判定結果によらず常に固定の重みを乗じるような構成としてもよい。

なお、実施の形態５から実施の形態９では、ローパスフィルタを通過した後の第１チャネル信号および第２チャネル信号に対する処理を例にとって説明したが、ローパスフィルタ処理を行わない信号に対して実施の形態５から実施の形態９までの処理を適用することも可能である。

また、ローパスフィルタを通過した第１チャネル信号および第２チャネル信号の代わりに、ローパスフィルタを通過した第１チャネル信号の残差信号およびローパスフィルタを通過した第２チャネル信号の残差信号を用いることも可能である。

さらに、ローパスフィルタ処理を行わない第１チャネル信号および第２チャネル信号の代わりに、第１チャネル信号の残差信号および第２チャネル信号の残差信号を用いることも可能である。

以上、本発明の各実施の形態について説明した。

本発明に係るステレオ符号化装置およびステレオ信号予測方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。

本発明に係るステレオ音声符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。

なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ信号予測方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るステレオ符号化装置の一部の機能を実現することができる。

また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されても良いし、一部または全てを含むように１チップ化されても良い。

また、ここではＬＳＩとしたが、集積度の違いによって、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩ等と呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現しても良い。ＬＳＩ製造後に、プログラム化することが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。

さらに、半導体技術の進歩または派生する別技術により、ＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。

本明細書は、２００５年１０月３１日出願の特願２００５−３１６７５４、２００６年６月１５日出願の特願２００６−１６６４５８及び２００６年１０月２日出願の特願２００６−２７１０４０に基づくものである。この内容は全てここに含めておく。

本発明に係るステレオ符号化装置およびステレオ信号予測方法は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用することができる。

実施の形態１に係るステレオ符号化装置の主要な構成を示すブロック図第１チャネル信号のスペクトルの一例を示した図第２チャネル信号のスペクトルの一例を示した図音声信号またはオーディオ信号の特徴を説明するための図実施の形態１の他のバリエーションに係るステレオ符号化装置の主要な構成を示すブロック図実施の形態１のさらなるバリエーションに係るステレオ符号化装置の主要な構成を示すブロック図実施の形態２に係るステレオ符号化装置の主要な構成を示すブロック図実施の形態３に係るステレオ符号化装置の主要な構成を示すブロック図実施の形態３の他のバリエーションに係るステレオ符号化装置の主要な構成を示すブロック図実施の形態４に係るステレオ符号化装置の主要な構成を示すブロック図実施の形態５に係るステレオ符号化装置の主要な構成を示すブロック図相互相関関数の一例を示した図相互相関関数の一例を示した図実施の形態６に係るステレオ符号化装置の主要な構成を示すブロック図有声音の場合の相互相関関数の一例を示した図無声音の場合の相互相関関数の一例を示した図実施の形態７に係るステレオ符号化装置の主要な構成を示すブロック図有声音の場合の相互相関関数の一例を示した図無声音の場合の相互相関関数の一例を示した図実施の形態８に係るステレオ符号化装置の主要な構成を示すブロック図実施の形態９に係るステレオ符号化装置の主要な構成を示すブロック図相互相関関数のローカルピークが重み付けされることによって最大相互相関値となる場合の一例を示した図閾値φ_ｔｈを超えていなかった最大相互相関値が重み付けされることによって閾値φ_ｔｈを超える最大相互相関値となる場合の一例を示した図閾値φ_ｔｈを超えていなかった最大相互相関値が重み付けされても閾値φ_ｔｈを超えなかった場合の一例を示した図

Claims

第１チャネル信号の低域成分を通過させる第１ローパスフィルタと、
第２チャネル信号の低域成分を通過させる第２ローパスフィルタと、
前記第１チャネル信号の低域成分から前記第２チャネル信号の低域成分を予測して予測パラメータを生成する予測手段と、
前記第１チャネル信号を符号化する第１符号化手段と、
前記予測パラメータを符号化する第２符号化手段と、
前記予測パラメータを記憶するメモリと、
を具備し、
前記予測手段は、
前記メモリに記憶された過去の前記予測パラメータに基づいて、当該予測パラメータを基準として所定範囲内の予測パラメータを生成する、
ステレオ符号化装置。
前記予測手段は、
前記予測を行って、前記第１チャネル信号の低域成分と前記第２チャネル信号の低域成分との間の遅延時間差および振幅比に関する情報を生成する、
請求項１記載のステレオ符号化装置。
前記第１チャネル信号および前記第２チャネル信号のパワを取得する取得手段と、
前記第１チャネル信号および前記第２チャネル信号のパワに基づいて、前記第１ローパスフィルタおよび前記第２ローパスフィルタの遮断周波数を決定する決定手段と、
をさらに具備する請求項１記載のステレオ符号化装置。
前記第１チャネル信号および前記第２チャネル信号のＳ／Ｎ比を検出する検出手段と、
前記第１チャネル信号および前記第２チャネル信号のＳ／Ｎ比に基づいて、前記第１ローパスフィルタおよび前記第２ローパスフィルタの遮断周波数を決定する決定手段と、
をさらに具備する請求項１記載のステレオ符号化装置。
前記予測パラメータの平滑化を行う平滑化手段をさらに具備し、
前記第２符号化手段は、
平滑化された前記予測パラメータを符号化する、
請求項１記載のステレオ符号化装置。
前記第１チャネル信号の低域成分と前記第２チャネル信号の低域成分とを互いにシフトさせ、これら２つの信号の相互相関関数の値を算出する算出手段をさらに具備し、
前記予測手段は、
前記遅延時間差に関する情報の生成にあたり、前記相互相関関数の値が閾値以上の場合、当該相互相関関数を最大とするシフト量を遅延時間差とし、前記相互相関関数の値が閾値未満の場合、前フレームの遅延時間差を再度使用する、
請求項２記載のステレオ符号化装置。
前記第１チャネル信号および前記第２チャネル信号の有声無声判定を行う判定手段をさらに具備し、
前記予測手段は、
前記判定手段の判定結果に基づいて前記閾値を設定する、
請求項６記載のステレオ符号化装置。
前記予測手段は、
前記相互相関関数の最大値が第１閾値以上の場合、当該相互相関関数を最大とするシフト量を遅延時間差とし、前記相互相関関数の最大値が前記第１閾値未満の場合であって、かつ、前フレームの平滑化された相互相関値の最大値が第２閾値以上の場合、前フレームの遅延時間差を現フレームの遅延時間差とし、前フレームの平滑化された相互相関値の最大値が前記第２閾値未満の場合、現フレームの遅延時間差を０とする、
請求項６記載のステレオ符号化装置。
前記予測手段は、
前記第１チャネル信号の低域成分と前記第２チャネル信号の低域成分とを互いにシフトさせた際のサンプルのシフト量と、前フレームの遅延時間差との差分が所定範囲内である場合、前記相互相関関数の値に重み付けを行う、
請求項６記載のステレオ符号化装置。
前記第１チャネル信号および前記第２チャネル信号の有声無声判定を行う判定手段と、
前記判定手段の判定結果に基づいて前記重みを設定する重み設定手段と、
をさらに具備する請求項９記載のステレオ符号化装置。
前記第１チャネル信号および前記第２チャネル信号の有声無声判定を行う判定手段と、
前記第１チャネル信号の低域成分と前記第２チャネル信号の低域成分とを互いにシフトさせ、これら２つの信号の相互相関関数の値を算出する算出手段と、
をさらに具備し、
前記予測手段は、
前記遅延時間差に関する情報の生成にあたり、前記相互相関関数の最大値から所定範囲内に含まれるローカルピークの数に応じて、前記遅延時間差を設定する、
請求項２記載のステレオ符号化装置。
請求項１記載のステレオ符号化装置を具備する通信端末装置。
請求項１記載のステレオ符号化装置を具備する基地局装置。
第１チャネル信号の低域成分を通過させるステップと、
第２チャネル信号の低域成分を通過させるステップと、
前記第１チャネル信号の低域成分から前記第２チャネル信号の低域成分を予測して予測パラメータを生成するステップと、
前記予測パラメータをメモリに記憶するステップと、
を具備し、
前記予測パラメータを生成するステップでは、
前記メモリに記憶された過去の前記予測パラメータに基づいて、当該予測パラメータを基準として所定範囲内の予測パラメータを生成する、
ステレオ信号予測方法。