JP5046652B2

JP5046652B2 - 音声符号化装置および音声符号化方法

Info

Publication number: JP5046652B2
Application number: JP2006550764A
Authority: JP
Inventors: 幸司吉田; 道代後藤
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2004-12-27
Filing date: 2005-12-26
Publication date: 2012-10-10
Anticipated expiration: 2025-12-26
Also published as: EP1818911B1; US20080010072A1; KR20070092240A; BRPI0516376A; ATE545131T1; WO2006070751A1; JPWO2006070751A1; EP1818911A4; US7945447B2; EP1818911A1; CN101091208A; CN101091208B

Description

本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。

移動体通信やＩＰ通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。

また、ＩＰネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。

よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル−ステレオ間でのスケーラブル構成（モノラル−ステレオ・スケーラブル構成）を有する符号化が望まれる。

このような、モノラル−ステレオ・スケーラブル構成を有する音声符号化方法としては、例えば、チャネル（以下、適宜「ｃｈ」と略す）間の信号の予測（第１ｃｈ信号から第２ｃｈ信号の予測、または、第２ｃｈ信号から第１ｃｈ信号の予測）を、チャネル相互間のピッチ予測により行う、すなわち、２チャネル間の相関を利用して符号化を行うものがある（非特許文献１参照）。
Ramprashad, S.A., "Stereophonic CELP coding using cross channel prediction", Proc. IEEE Workshop on Speech Coding, pp.136-138, Sep. 2000.

しかしながら、上記非特許文献１記載の音声符号化方法では、双方のチャネル間の相関が小さい場合には、チャネル間の予測の性能（予測ゲイン）が低下してしまい、符号化効率が劣化する。

本発明の目的は、モノラル−ステレオ・スケーラブル構成を有する音声符号化において、ステレオ信号の複数チャネル信号間の相関が小さい場合でも効率的にステレオ音声を符号化することができる音声符号化装置および音声符号化方法を提供することである。

本発明の音声符号化装置は、コアレイヤのモノラル信号を用いた符号化を行う第１符号化手段と、拡張レイヤのステレオ信号を用いた符号化を行う第２符号化手段と、を具備し、前記第１符号化手段は、第１チャネル信号および第２チャネル信号を含むステレオ信号を入力信号として、前記第１チャネル信号および前記第２チャネル信号からモノラル信号を生成する生成手段を具備し、前記第２符号化手段は、前記モノラル信号を符号化して得られるモノラル駆動音源信号に基づいて、前記第１チャネル信号または前記第２チャネル信号の予測信号を合成する合成手段を具備する構成を採る。

本発明によれば、ステレオ信号の複数チャネル信号間の相関が小さい場合でも効率的にステレオ音声を符号化することができる。

以下、モノラル−ステレオ・スケーラブル構成を有する音声符号化に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。

（実施の形態１）
本実施の形態に係る音声符号化装置の構成を図１に示す。図１に示す音声符号化装置１００は、モノラル信号のためのコアレイヤ符号化部１１０とステレオ信号のための拡張レイヤ符号化部１２０とを備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。

コアレイヤ符号化部１１０において、モノラル信号生成部１１１は、入力される第１ｃｈ音声信号s_ch1(n)、第２ｃｈ音声信号s_ch2(n)（但し、n=0〜NF-1；NFはフレーム長)から、式（１）に従ってモノラル信号s_mono(n)を生成し、モノラル信号符号化部１１２に出力する。

モノラル信号符号化部１１２は、モノラル信号s_mono(n)に対する符号化を行い、このモノラル信号の符号化データをモノラル信号復号部１１３に出力する。また、このモノラル信号の符号化データは、拡張レイヤ符号化部１２０から出力される量子化符号や符号化データと多重されて符号化データとして音声復号装置へ伝送される。

モノラル信号復号部１１３は、モノラル信号の符号化データからモノラルの復号信号を生成して拡張レイヤ符号化部１２０に出力する。

拡張レイヤ符号化部１２０において、第１ｃｈ予測フィルタ分析部１２１は、第１ｃｈ音声信号s_ch1(n)とモノラル復号信号とから第１ｃｈ予測フィルタパラメータを求めて量子化し、第１ｃｈ予測フィルタ量子化パラメータを第１ｃｈ予測信号合成部１２２に出力する。なお、第１ｃｈ予測フィルタ分析部１２１への入力として、モノラル復号信号の代わりに、モノラル信号生成部１１１の出力であるモノラル信号s_mono(n)を用いてもよい。また、第１ｃｈ予測フィルタ分析部１２１は、第１ｃｈ予測フィルタ量子化パラメータを符号化した第１ｃｈ予測フィルタ量子化符号を出力する。この第１ｃｈ予測フィルタ量子化符号は他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

第１ｃｈ予測信号合成部１２２は、モノラル復号信号と第１ｃｈ予測フィルタ量子化パラメータとから第１ｃｈ予測信号を合成し、その第１ｃｈ予測信号を減算器１２３に出力する。第１ｃｈ予測信号合成部１２２の詳細については後述する。

減算器１２３は、入力信号である第１ｃｈ音声信号と第１ｃｈ予測信号との差、すなわち、第１ｃｈ入力音声信号に対する第１ｃｈ予測信号の残差成分の信号（第１ｃｈ予測残差信号）を求め、第１ｃｈ予測残差信号符号化部１２４に出力する。

第１ｃｈ予測残差信号符号化部１２４は、第１ｃｈ予測残差信号を符号化して第１ｃｈ予測残差符号化データを出力する。この第１ｃｈ予測残差符号化データは他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

一方、第２ｃｈ予測フィルタ分析部１２５は、第２ｃｈ音声信号s_ch2(n)とモノラル復号信号とから第２ｃｈ予測フィルタパラメータを求めて量子化し、第２ｃｈ予測フィルタ量子化パラメータを第２ｃｈ予測信号合成部１２６に出力する。また、第２ｃｈ予測フィルタ分析部１２５は、第２ｃｈ予測フィルタ量子化パラメータを符号化した第２ｃｈ予測フィルタ量子化符号を出力する。この第２ｃｈ予測フィルタ量子化符号は他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

第２ｃｈ予測信号合成部１２６は、モノラル復号信号と第２ｃｈ予測フィルタ量子化パラメータとから第２ｃｈ予測信号を合成し、その第２ｃｈ予測信号を減算器１２７に出力する。第２ｃｈ予測信号合成部１２６の詳細については後述する。

減算器１２７は、入力信号である第２ｃｈ音声信号と第２ｃｈ予測信号との差、すなわち、第２ｃｈ入力音声信号に対する第２ｃｈ予測信号の残差成分の信号（第２ｃｈ予測残差信号）を求め、第２ｃｈ予測残差信号符号化部１２８に出力する。

第２ｃｈ予測残差信号符号化部１２８は、第２ｃｈ予測残差信号を符号化して第２ｃｈ
予測残差符号化データを出力する。この第２ｃｈ予測残差符号化データは他の符号化データや量子化符号と多重されて符号化データとして音声復号装置へ伝送される。

次いで、第１ｃｈ予測信号合成部１２２および第２ｃｈ予測信号合成部１２６の詳細について説明する。第１ｃｈ予測信号合成部１２２および第２ｃｈ予測信号合成部１２６の構成は図２＜構成例１＞または図３＜構成例２＞に示すようになる。構成例１および２のいずれも、第１ｃｈ入力信号と第２ｃｈ入力信号との加算信号であるモノラル信号と、各チャネル信号との間の相関性に基づき、モノラル信号に対する各チャネル信号の遅延差（Ｄサンプル）および振幅比（ｇ）を予測フィルタ量子化パラメータとして用いて、モノラル信号から各チャネルの予測信号を合成する。

＜構成例１＞
構成例１では、図２に示すように、第１ｃｈ予測信号合成部１２２および第２ｃｈ予測信号合成部１２６は、遅延器２０１および乗算器２０２を備え、式（２）で表される予測により、モノラル復号信号sd_mono(n)から、各チャネルの予測信号sp_ch(n)を合成する。

＜構成例２＞
構成例２では、図３に示すように、図２に示す構成にさらに、遅延器２０３−１〜Ｐ、乗算器２０４−１〜Ｐおよび加算器２０５を備える。そして、予測フィルタ量子化パラメータとして、モノラル信号に対する各チャネル信号の遅延差（Ｄサンプル）および振幅比（ｇ）の他に、予測係数列｛a(0),a(1), a(2), ..., a(P)｝（Pは予測次数、a(0)=1.0）を用い、式（３）で表される予測により、モノラル復号信号sd_mono(n)から、各チャネルの予測信号sp_ch(n)を合成する。

これに対し、第１ｃｈ予測フィルタ分析部１２１および第２ｃｈ予測フィルタ分析部１２５は、式（４）で表される歪み、すなわち、各チャネルの入力音声信号s_ch(n) (n=0〜NF-1)と上式（２）または（３）に従って予測される各チャネルの予測信号sp_ch(n)との歪Distを最小とするような予測フィルタパラメータを求め、そのフィルタパラメータを量子化した予測フィルタ量子化パラメータを、上記構成を採る第１ｃｈ予測信号合成部１２２および第２ｃｈ予測信号合成部１２６に出力する。また、第１ｃｈ予測フィルタ分析部１２１および第２ｃｈ予測フィルタ分析部１２５は、予測フィルタ量子化パラメータを符号化した予測フィルタ量子化符号を出力する。

なお、構成例１に対しては、第１ｃｈ予測フィルタ分析部１２１および第２ｃｈ予測フィルタ分析部１２５は、モノラル復号信号と各チャネルの入力音声信号との間の相互相関を最大にするような遅延差Ｄおよびフレーム単位の平均振幅の比ｇを予測フィルタパラメータとして求めてもよい。

次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声
復号装置の構成を図４に示す。図４に示す音声復号装置３００は、モノラル信号のためのコアレイヤ復号部３１０と、ステレオ信号のための拡張レイヤ復号部３２０とを備える。

モノラル信号復号部３１１は、入力されるモノラル信号の符号化データを復号し、モノラル復号信号を拡張レイヤ復号部３２０に出力するとともに、最終出力として出力する。

第１ｃｈ予測フィルタ復号部３２１は、入力される第１ｃｈ予測フィルタ量子化符号を復号して、第１ｃｈ予測フィルタ量子化パラメータを第１ｃｈ予測信号合成部３２２に出力する。

第１ｃｈ予測信号合成部３２２は、音声符号化装置１００の第１ｃｈ予測信号合成部１２２と同じ構成を採り、モノラル復号信号と第１ｃｈ予測フィルタ量子化パラメータとから第１ｃｈ音声信号を予測し、その第１ｃｈ予測音声信号を加算器３２４に出力する。

第１ｃｈ予測残差信号復号部３２３は、入力される第１ｃｈ予測残差符号化データを復号し、第１ｃｈ予測残差信号を加算器３２４に出力する。

加算器３２４は、第１ｃｈ予測音声信号と第１ｃｈ予測残差信号とを加算して第１ｃｈの復号信号を求め、最終出力として出力する。

一方、第２ｃｈ予測フィルタ復号部３２５は、入力される第２ｃｈ予測フィルタ量子化符号を復号して、第２ｃｈ予測フィルタ量子化パラメータを第２ｃｈ予測信号合成部３２６に出力する。

第２ｃｈ予測信号合成部３２６は、音声符号化装置１００の第２ｃｈ予測信号合成部１２６と同じ構成を採り、モノラル復号信号と第２ｃｈ予測フィルタ量子化パラメータとから第２ｃｈ音声信号を予測し、その第２ｃｈ予測音声信号を加算器３２８に出力する。

第２ｃｈ予測残差信号復号部３２７は、入力される第２ｃｈ予測残差符号化データを復号し、第２ｃｈ予測残差信号を加算器３２８に出力する。

加算器３２８は、第２ｃｈ予測音声信号と第２ｃｈ予測残差信号とを加算して第２ｃｈの復号信号を求め、最終出力として出力する。

このような構成を採る音声復号装置３００では、モノラル−ステレオ・スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号化データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データおよび量子化符号のすべてを用いて第１ｃｈ復号信号および第２ｃｈ復号信号を復号して出力する。

ここで、本実施の形態に係るモノラル信号は、図５に示すように、第１ｃｈ音声信号s_ch1と第２ｃｈ音声信号s_ch2との加算によって得られる信号であるため、双方のチャネルの信号成分を含む中間的な信号である。よって、第１ｃｈ音声信号と第２ｃｈ音声信号とのチャネル間相関が小さい場合でも、第１ｃｈ音声信号とモノラル信号との相関および第２ｃｈ音声信号とモノラル信号との相関は、チャネル間相関よりは大きくなるものと予想される。よって、モノラル信号から第１ｃｈ音声信号を予測する場合の予測ゲインおよびモノラル信号から第２ｃｈ音声信号を予測する場合の予測ゲイン（図５：予測ゲインＢ）は、第１ｃｈ音声信号から第２ｃｈ音声信号を予測する場合の予測ゲインおよび第２ｃｈ音声信号から第１ｃｈ音声信号を予測する場合の予測ゲイン（図５：予測ゲインＡ）よりも大きくなることが予想される。

そして、この関係をまとめたのが図６である。すなわち、第１ｃｈ音声信号と第２ｃｈ音声信号とのチャネル間相関が十分大きい場合は、予測ゲインＡおよび予測ゲインＢはそれほど変わらず双方とも十分大きい値が得られる。しかし、第１ｃｈ音声信号と第２ｃｈ音声信号とのチャネル間相関が小さい場合は、予測ゲインＡはチャネル間相関が十分大きい場合に比べ急激に低下するのに対し、予測ゲインＢは、予測ゲインＡよりも低下の度合いが小さく、予測ゲインＡよりも大きい値になるものと予想される。

このように、本実施の形態では、第１ｃｈ音声信号および第２ｃｈ音声信号双方の信号成分を含む中間的な信号であるモノラル信号から各チャネルの信号を予測して合成するため、チャネル間相関が小さい複数チャネルの信号に対しても従来より予測ゲインが大きい信号を合成することができる。その結果、同等の音質をより低ビットレートの符号化により得ること、および、同等のビットレートでより高音質な音声を得ることができる。よって、本実施の形態によれば、符号化効率の向上を図ることができる。

（実施の形態２）
図７に本実施の形態に係る音声符号化装置４００の構成を示す。図７に示すように、音声符号化装置４００は、図１（実施の形態１）に示す構成から第２ｃｈ予測フィルタ分析部１２５、第２ｃｈ予測信号合成部１２６、減算器１２７および第２ｃｈ予測残差信号符号化部１２８を取り除いた構成を採る。つまり、音声符号化装置４００は、第１ｃｈと第２ｃｈのうち第１ｃｈに対してのみ予測信号を合成し、モノラル信号の符号化データ、第１ｃｈ予測フィルタ量子化符号および第１ｃｈ予測残差符号化データのみを音声復号装置へ伝送する。

一方、本実施の形態に係る音声復号装置５００の構成は図８に示すようになる。図８に示すように、音声復号装置５００は、図４（実施の形態１）に示す構成から第２ｃｈ予測フィルタ復号部３２５、第２ｃｈ予測信号合成部３２６、第２ｃｈ予測残差信号復号部３２７および加算器３２８を取り除き、代わりに、第２ｃｈ復号信号合成部３３１を加えた構成を採る。

第２ｃｈ復号信号合成部３３１は、モノラル復号信号sd_mono(n)と第１ｃｈ復号信号sd_ch1(n)とを用いて、式（１）に示す関係に基づき、式（５）に従って第２ｃｈ復号信号sd_ch2(n)を合成する。

なお、本実施の形態では拡張レイヤ符号化部１２０が第１ｃｈに対してのみ処理する構成としたが、第１ｃｈに代えて第２ｃｈに対してのみ処理する構成としてもよい。

このように、本実施の形態によれば、実施の形態１に比べ装置構成を簡単にすることができる。また、第１ｃｈおよび第２ｃｈのうち一方のチャネルの符号化データのみの伝送で済むので、さらに符号化効率が向上する。

（実施の形態３）
図９に本実施の形態に係る音声符号化装置６００の構成を示す。コアレイヤ符号化部１１０は、モノラル信号生成部１１１およびモノラル信号ＣＥＬＰ符号化部１１４を備え、拡張レイヤ符号化部１２０は、モノラル駆動音源信号保持部１３１、第１ｃｈＣＥＬＰ符号化部１３２および第２ｃｈＣＥＬＰ符号化部１３３を備える。

モノラル信号ＣＥＬＰ符号化部１１４は、モノラル信号生成部１１１で生成されたモノラル信号s_mono(n)に対してＣＥＬＰ符号化を行い、モノラル信号符号化データ、および、ＣＥＬＰ符号化によって得られるモノラル駆動音源信号を出力する。このモノラル駆動音源信号は、モノラル駆動音源信号保持部１３１に保持される。

第１ｃｈＣＥＬＰ符号化部１３２は、第１ｃｈ音声信号に対してＣＥＬＰ符号化を行って第１ｃｈ符号化データを出力する。また、第２ｃｈＣＥＬＰ符号化部１３３は、第２ｃｈ音声信号に対してＣＥＬＰ符号化を行って第２ｃｈ符号化データを出力する。第１ｃｈＣＥＬＰ符号化部１３２および第２ｃｈＣＥＬＰ符号化部１３３は、モノラル駆動音源信号保持部１３１に保持されたモノラル駆動音源信号を用いて、各チャネルの入力音声信号に対応する駆動音源信号の予測、および、その予測残差成分に対するＣＥＬＰ符号化を行う。

次いで、第１ｃｈＣＥＬＰ符号化部１３２および第２ｃｈＣＥＬＰ符号化部１３３の詳細について説明する。第１ｃｈＣＥＬＰ符号化部１３２および第２ｃｈＣＥＬＰ符号化部１３３の構成を図１０に示す。

図１０において、第Ｎｃｈ（Ｎは１または２）ＬＰＣ分析部４０１は、第Ｎｃｈ音声信号に対するＬＰＣ分析を行い、得られたＬＰＣパラメータを量子化して第ＮｃｈＬＰＣ予測残差信号生成部４０２および合成フィルタ４０９に出力するとともに、第ＮｃｈＬＰＣ量子化符号を出力する。第ＮｃｈＬＰＣ分析部４０１では、ＬＰＣパラメータの量子化に際し、モノラル信号に対するＬＰＣパラメータと第Ｎｃｈ音声信号から得られるＬＰＣパラメータ（第ＮｃｈＬＰＣパラメータ）との相関が大きいことを利用して、モノラル信号の符号化データからモノラル信号量子化ＬＰＣパラメータを復号し、そのモノラル信号量子化ＬＰＣパラメータに対するＮｃｈＬＰＣパラメータの差分成分を量子化することにより効率的な量子化を行う。

第ＮｃｈＬＰＣ予測残差信号生成部４０２は、第Ｎｃｈ量子化ＬＰＣパラメータを用いて、第Ｎｃｈ音声信号に対するＬＰＣ予測残差信号を算出して第Ｎｃｈ予測フィルタ分析部４０３に出力する。

第Ｎｃｈ予測フィルタ分析部４０３は、ＬＰＣ予測残差信号およびモノラル駆動音源信号から第Ｎｃｈ予測フィルタパラメータを求めて量子化し、第Ｎｃｈ予測フィルタ量子化パラメータを第Ｎｃｈ駆動音源信号合成部４０４に出力するとともに、第Ｎｃｈ予測フィルタ量子化符号を出力する。

第Ｎｃｈ駆動音源信号合成部４０４は、モノラル駆動音源信号および第Ｎｃｈ予測フィルタ量子化パラメータを用いて、第Ｎｃｈ音声信号に対応する予測駆動音源信号を合成して乗算器４０７−１へ出力する。

ここで、第Ｎｃｈ予測フィルタ分析部４０３は、実施の形態１（図１）における第１ｃｈ予測フィルタ分析部１２１および第２ｃｈ予測フィルタ分析部１２５に対応し、それらの構成および動作は同様になる。また、第Ｎｃｈ駆動音源信号合成部４０４は、実施の形態１（図１〜３）における第１ｃｈ予測信号合成部１２２および第２ｃｈ予測信号合成部１２６に対応し、それらの構成および動作は同様になる。但し、本実施の形態では、モノラル復号信号に対する予測を行って各チャネルの予測信号を合成するのではなく、モノラル信号に対応するモノラル駆動音源信号に対する予測を行って各チャネルの予測駆動音源信号を合成する点において実施の形態１と異なる。そして、本実施の形態では、その予測駆動音源信号に対する残差成分（予測しきれない誤差成分）の音源信号を、ＣＥＬＰ符号化における音源探索により符号化する。

つまり、第１ｃｈおよび第２ｃｈＣＥＬＰ符号化部１３２、１３３は、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６を有し、適応音源、固定音源、およびモノラル駆動音源信号から予測した予測駆動音源の各音源信号にそれら各々のゲインを乗じて加算し、その加算によって得られた駆動音源に対して歪み最小化による閉ループ型音源探索を行う。そして、適応音源インデクス、固定音源インデクス、適応音源、固定音源および予測駆動音源信号に対するゲイン符号を第Ｎｃｈ音源符号化データとして出力する。より具体的には、以下のようになる。

合成フィルタ４０９は、第ＮｃｈＬＰＣ分析部４０１から出力される量子化ＬＰＣパラメータを用いて、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６で生成された音源ベクトル、および、第Ｎｃｈ駆動音源信号合成部４０４で合成された予測駆動音源信号を駆動音源としてＬＰＣ合成フィルタによる合成を行う。この結果得られる合成信号のうち第Ｎｃｈの予測駆動音源信号に対応する成分は、実施の形態１（図１〜３）において第１ｃｈ予測信号合成部１２２または第２ｃｈ予測信号合成部１２６から出力される各チャネルの予測信号に相当する。そして、このようにして得られた合成信号は、減算器４１０へ出力される。

減算器４１０は、合成フィルタ４０９から出力された合成信号を第Ｎｃｈ音声信号から減算することにより誤差信号を算出し、この誤差信号を聴覚重み付け部４１１へ出力する。この誤差信号が符号化歪みに相当する。

聴覚重み付け部４１１は、減算器４１０から出力された符号化歪みに対して聴覚的な重み付けを行い、歪最小化部４１２へ出力する。

歪最小化部４１２は、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６に対して、聴覚重み付け部４１１から出力される符号化歪みを最小とするようなインデクスを決定し、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６が使用するインデクスを指示する。また、歪最小化部４１２は、それらのインデクスに対応するゲイン、具体的には、第Ｎｃｈ適応符号帳４０５からの適応ベクトルおよび第Ｎｃｈ固定符号帳４０６からの固定ベクトルに対する各ゲイン（適応符号帳ゲインおよび固定符号帳ゲイン）を生成し、それぞれ乗算器４０７−２、４０７−４へ出力する。

また、歪最小化部４１２は、第Ｎｃｈ駆動音源信号合成部４０４から出力された予測駆動音源信号、乗算器４０７−２でのゲイン乗算後の適応ベクトルおよび乗算器４０７−４でのゲイン乗算後の固定ベクトル、の３種類の信号間のゲインを調整する各ゲインを生成し、それぞれ乗算器４０７−１、４０７−３および４０７−５へ出力する。それら３種類の信号間のゲインを調整する３種類のゲインは、好ましくはそれらのゲイン値間に相互に関係性をもたせて生成することが望ましい。例えば、第１ｃｈ音声信号と第２ｃｈ音声信号とのチャネル間相関が大きい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトルの寄与分に対して相対的に大きくなるように、逆にチャネル間相関が小さい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトルの寄与分に対して相対的に小さくなるようにする。

また、歪最小化部４１２は、それらのインデクス、それらのインデクスに対応する各ゲインの符号および信号間調整用ゲインの符号を第Ｎｃｈ音源符号化データとして出力する。

第Ｎｃｈ適応符号帳４０５は、過去に生成された合成フィルタ４０９への駆動音源の音
源ベクトルを内部バッファに記憶しており、歪最小化部４１２から指示されたインデクスに対応する適応符号帳ラグ（ピッチラグ、または、ピッチ周期）に基づいて、この記憶されている音源ベクトルから１サブフレーム分を生成し、適応符号帳ベクトルとして乗算器４０７−２へ出力する。

第Ｎｃｈ固定符号帳４０６は、歪最小化部４１２から指示されたインデクスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器４０７−４へ出力する。

乗算器４０７−２は、第Ｎｃｈ適応符号帳４０５から出力された適応符号帳ベクトルに適応符号帳ゲインを乗じ、乗算器４０７−３へ出力する。

乗算器４０７−４は、第Ｎｃｈ固定符号帳４０６から出力された固定符号帳ベクトルに固定符号帳ゲインを乗じ、乗算器４０７−５へ出力する。

乗算器４０７−１は、第Ｎｃｈ駆動音源信号合成部４０４から出力された予測駆動音源信号にゲインを乗じ、加算器４０８へ出力する。乗算器４０７−３は、乗算器４０７−２でのゲイン乗算後の適応ベクトルに別のゲインを乗じ、加算器４０８へ出力する。乗算器４０７−５は、乗算器４０７−４でのゲイン乗算後の固定ベクトルに別のゲインを乗じ、加算器４０８へ出力する。

加算器４０８は、乗算器４０７−１から出力された予測駆動音源信号と、乗算器４０７−３から出力された適応符号帳ベクトルと、乗算器４０７−５から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ４０９に出力する。

合成フィルタ４０９は、加算器４０８から出力される音源ベクトルを駆動音源としてＬＰＣ合成フィルタによる合成を行う。

このように、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６で生成された音源ベクトルを用いて符号化歪みが求められる一連の処理は閉ループとなっており、歪最小化部４１２は、この符号化歪みが最小となるような、第Ｎｃｈ適応符号帳４０５および第Ｎｃｈ固定符号帳４０６のインデクスを決定し、出力する。

第１ｃｈおよび第２ｃｈＣＥＬＰ符号化部１３２、１３３は、このようにして得られた符号化データ（ＬＰＣ量子化符号、予測フィルタ量子化符号、音源符号化データ）を第Ｎｃｈ符号化データとして出力する。

次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置７００の構成を図１１に示す。図１１に示す音声復号装置７００は、モノラル信号のためのコアレイヤ復号部３１０と、ステレオ信号のための拡張レイヤ復号部３２０とを備える。

モノラルＣＥＬＰ復号部３１２は、入力されるモノラル信号の符号化データをＣＥＬＰ復号し、モノラル復号信号、および、ＣＥＬＰ復号によって得られるモノラル駆動音源信号を出力する。このモノラル駆動音源信号は、モノラル駆動音源信号保持部３４１に保持される。

第１ｃｈＣＥＬＰ復号部３４２は、第１ｃｈ符号化データに対してＣＥＬＰ復号を行って第１ｃｈ復号信号を出力する。また、第２ｃｈＣＥＬＰ復号部３４３は、第２ｃｈ符号化データに対してＣＥＬＰ復号を行って第２ｃｈ復号信号を出力する。第１ｃｈＣＥＬＰ
復号部３４２および第２ｃｈＣＥＬＰ復号部３４３は、モノラル駆動音源信号保持部３４１に保持されたモノラル駆動音源信号を用いて、各チャネルの符号化データに対応する駆動音源信号の予測、および、その予測残差成分に対するＣＥＬＰ復号を行う。

このような構成を採る音声復号装置７００では、モノラル−ステレオ・スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号化データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データのすべてを用いて第１ｃｈ復号信号および第２ｃｈ復号信号を復号して出力する。

次いで、第１ｃｈＣＥＬＰ復号部３４２および第２ｃｈＣＥＬＰ復号部３４３の詳細について説明する。第１ｃｈＣＥＬＰ復号部３４２および第２ｃｈＣＥＬＰ復号部３４３の構成を図１２に示す。第１ｃｈおよび第２ｃｈＣＥＬＰ復号部３４２、３４３は、音声符号化装置６００（図９）から伝送されたモノラル信号符号化データおよび第Ｎｃｈ符号化データ（Ｎは１または２）から、第ＮｃｈＬＰＣ量子化パラメータの復号、第Ｎｃｈ駆動音源信号の予測信号を含むＣＥＬＰ音源信号の復号を行い、第Ｎｃｈ復号信号を出力する。より具体的には、以下のようになる。

第ＮｃｈＬＰＣパラメータ復号部５０１は、モノラル信号符号化データを用いて復号されたモノラル信号量子化ＬＰＣパラメータと第ＮｃｈＬＰＣ量子化符号とを用いて第ＮｃｈＬＰＣ量子化パラメータの復号を行い、得られた量子化ＬＰＣパラメータを合成フィルタ５０８へ出力する。

第Ｎｃｈ予測フィルタ復号部５０２は、第Ｎｃｈ予測フィルタ量子化符号を復号し、得られた第Ｎｃｈ予測フィルタ量子化パラメータを第Ｎｃｈ駆動音源信号合成部５０３へ出力する。

第Ｎｃｈ駆動音源信号合成部５０３は、モノラル駆動音源信号および第Ｎｃｈ予測フィルタ量子化パラメータを用いて、第Ｎｃｈ音声信号に対応する予測駆動音源信号を合成して乗算器５０６−１へ出力する。

合成フィルタ５０８は、第ＮｃｈＬＰＣパラメータ復号部５０１から出力される量子化ＬＰＣパラメータを用いて、第Ｎｃｈ適応符号帳５０４および第Ｎｃｈ固定符号帳５０５で生成された音源ベクトル、および、第Ｎｃｈ駆動音源信号合成部５０３で合成された予測駆動音源信号を駆動音源としてＬＰＣ合成フィルタによる合成を行う。得られた合成信号は、第Ｎｃｈ復号信号として出力される。

第Ｎｃｈ適応符号帳５０４は、過去に生成された合成フィルタ５０８への駆動音源の音源ベクトルを内部バッファに記憶しており、第Ｎｃｈ音源符号化データに含まれるインデクスに対応する適応符号帳ラグ（ピッチラグ、または、ピッチ周期）に基づいて、この記憶されている音源ベクトルから１サブフレーム分を生成し、適応符号帳ベクトルとして乗算器５０６−２へ出力する。

第Ｎｃｈ固定符号帳５０５は、第Ｎｃｈ音源符号化データに含まれるインデクスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器５０６−４へ出力する。

乗算器５０６−２は、第Ｎｃｈ適応符号帳５０４から出力された適応符号帳ベクトルに第Ｎｃｈ音源符号化データに含まれる適応符号帳ゲインを乗じ、乗算器５０６−３へ出力する。

乗算器５０６−４は、第Ｎｃｈ固定符号帳５０５から出力された固定符号帳ベクトルに第Ｎｃｈ音源符号化データに含まれる固定符号帳ゲインを乗じ、乗算器５０６−５へ出力する。

乗算器５０６−１は、第Ｎｃｈ駆動音源信号合成部５０３から出力された予測駆動音源信号に、第Ｎｃｈ音源符号化データに含まれる、予測駆動音源信号に対する調整用ゲインを乗じ、加算器５０７へ出力する。

乗算器５０６−３は、乗算器５０６−２でのゲイン乗算後の適応ベクトルに、第Ｎｃｈ音源符号化データに含まれる、適応ベクトルに対する調整用ゲインを乗じ、加算器５０７へ出力する。

乗算器５０６−５は、乗算器５０６−４でのゲイン乗算後の固定ベクトルに、第Ｎｃｈ音源符号化データに含まれる、固定ベクトルに対する調整用ゲインを乗じ、加算器５０７へ出力する。

加算器５０７は、乗算器５０６−１から出力された予測駆動音源信号と、乗算器５０６−３から出力された適応符号帳ベクトルと、乗算器５０６−５から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ５０８に出力する。

合成フィルタ５０８は、加算器５０７から出力される音源ベクトルを駆動音源としてＬＰＣ合成フィルタによる合成を行う。

以上の音声符号化装置６００の動作フローをまとめると図１３に示すようになる。すなわち、第１ｃｈ音声信号と第２ｃｈ音声信号とからモノラル信号を生成し（ＳＴ１３０１）、モノラル信号に対しコアレイヤのＣＥＬＰ符号化を行い（ＳＴ１３０２）、次いで、第１ｃｈのＣＥＬＰ符号化および第２ｃｈのＣＥＬＰ符号化を行う（ＳＴ１３０３、１３０４）。

また、第１ｃｈ、第２ｃｈＣＥＬＰ符号化部１３２、１３３の動作フローをまとめると図１４に示すようになる。すなわち、まず、第ＮｃｈのＬＰＣ分析とＬＰＣパラメータの量子化を行い（ＳＴ１４０１）、次いで、第ＮｃｈのＬＰＣ予測残差信号を生成する（ＳＴ１４０２）。次いで、第Ｎｃｈの予測フィルタの分析を行い（ＳＴ１４０３）、第Ｎｃｈの駆動音源信号を予測する（ＳＴ１４０４）。そして、最後に、第Ｎｃｈの駆動音源の探索とゲインの探索を行う（ＳＴ１４０５）。

なお、第１ｃｈ、第２ｃｈＣＥＬＰ符号化部１３２、１３３においては、ＣＥＬＰ符号化における音源探索による音源符号化に先立ち、第Ｎｃｈ予測フィルタ分析部４０３によって予測フィルタパラメータを求めていたが、予測フィルタパラメータに対する符号帳を別途設け、ＣＥＬＰ音源探索において、適応音源探索等の探索と共に、歪み最小化による閉ループ型の探索によって最適な予測フィルタパラメータをその符号帳に基づいて求めるような構成としてもよい。または、第Ｎｃｈ予測フィルタ分析部４０３において予測フィルタパラメータの候補を複数求めておき、ＣＥＬＰ音源探索における歪み最小化による閉ループ型の探索によって、それら複数の候補の中から最適な予測フィルタパラメータを選択するような構成としてもよい。このような構成を採ることにより、より最適なフィルタパラメータを算出することができ、予測性能の向上（すなわち、復号音声品質の向上）を図ることができる。

また、第１ｃｈ、第２ｃｈＣＥＬＰ符号化部１３２、１３３でのＣＥＬＰ符号化におけ
る音源探索による音源符号化において、第Ｎｃｈ音声信号に対応する予測駆動音源信号、ゲイン乗算後の適応ベクトルおよびゲイン乗算後の固定ベクトル、の３種類の信号間のゲインを調整するための各ゲインをそれぞれの信号に乗ずる構成としたが、そのような調整用のゲインを用いない構成、または、調整用のゲインとして第Ｎｃｈ音声信号に対応する予測駆動音源信号に対してのみゲインを乗ずる構成としてもよい。

また、ＣＥＬＰ音源探索時に、モノラル信号のＣＥＬＰ符号化で得られたモノラル信号符号化データを利用し、そのモノラル信号符号化データに対する差分成分（補正成分）を符号化する構成としてもよい。例えば、適応音源ラグや各音源のゲインの符号化時に、モノラル信号のＣＥＬＰ符号化で得られる適応音源ラグからの差分値、適応音源ゲイン・固定音源ゲインに対する相対比などを符号化対象として符号化する。これにより、各チャネルのＣＥＬＰ音源に対する符号化の効率を向上させることができる。

また、音声符号化装置６００（図９）の拡張レイヤ符号化部１２０の構成を、実施の形態２（図７）と同様に、第１ｃｈに関する構成だけとしてもよい。すなわち、拡張レイヤ符号化部１２０では、第１ｃｈ音声信号に対してのみモノラル駆動音源信号を用いた駆動音源信号の予測および予測残差成分に対するＣＥＬＰ符号化を行う。この場合、音声復号装置７００（図１１）の拡張レイヤ復号部３２０では、実施の形態２（図８）と同様に、第２ｃｈ信号の復号を行うために、モノラル復号信号sd_mono(n)および第１ｃｈ復号信号sd_ch1(n)を用いて、式（１）に示す関係に基づき、式（５）に従って第２ｃｈ復号信号sd_ch2(n)を合成する。

また、第１ｃｈ、第２ｃｈＣＥＬＰ符号化部１３２、１３３および第１ｃｈ、第２ｃｈＣＥＬＰ復号部３４２、３４３においては、音源探索における音源構成として、適応音源および固定音源のうち、いずれか一方だけを用いる構成としてもよい。

また、第Ｎｃｈ予測フィルタ分析部４０３において、第Ｎｃｈ音声信号をＬＰＣ予測残差信号の代わりに、モノラル信号生成部１１１で生成されたモノラル信号s_mono(n)をモノラル駆動音源信号の代わりに用いて、第Ｎｃｈ予測フィルタパラメータを求めるようにしてもよい。この場合の音声符号化装置７５０の構成を図１５に、第１ｃｈＣＥＬＰ符号化部１４１および第２ｃｈＣＥＬＰ符号化部１４２の構成を図１６に示す。図１５に示すように、モノラル信号生成部１１１で生成されたモノラル信号s_mono(n)が、第１ｃｈＣＥＬＰ符号化部１４１および第２ｃｈＣＥＬＰ符号化部１４２に入力される。そして、図１６に示す第１ｃｈＣＥＬＰ符号化部１４１および第２ｃｈＣＥＬＰ符号化部１４２の第Ｎｃｈ予測フィルタ分析部４０３において、第Ｎｃｈ音声信号およびモノラル信号s_mono(n)を用いて、第Ｎｃｈ予測フィルタパラメータを求める。このような構成にすることによって、第Ｎｃｈ量子化ＬＰＣパラメータを用いて第Ｎｃｈ音声信号からＬＰＣ予測残差信号を算出する処理が不要となる。また、モノラル駆動音源信号の代わりにモノラル信号s_mono(n)を用いることで、モノラル駆動音源信号を用いる場合よりも時間的に後（未来）の信号を用いて第Ｎｃｈ予測フィルタパラメータを求めることができる。なお、第Ｎｃｈ予測フィルタ分析部４０３では、モノラル信号生成部１１１で生成されたモノラル信号s_mono(n)を用いる代わりに、モノラル信号ＣＥＬＰ符号化部１１４での符号化で得られるモノラル復号信号を用いるようにしてもよい。

また、第Ｎｃｈ適応符号帳４０５の内部バッファに、合成フィルタ４０９への駆動音源の音源ベクトルの代わりに、乗算器４０７−３でのゲイン乗算後の適応ベクトルと乗算器４０７−５でのゲイン乗算後の固定ベクトルのみを加算した信号ベクトルとを記憶するようにしてもよい。この場合は、復号側の第Ｎｃｈ適応符号帳でも同様な構成とする必要がある。

また、第１ｃｈ、第２ｃｈＣＥＬＰ符号化部１３２、１３３で行われる各チャネルの予測駆動音源信号に対する残差成分の音源信号の符号化では、ＣＥＬＰ符号化による時間領域での音源探索を行う代わりに、残差成分の音源信号を周波数領域へ変換し、周波数領域での残差成分の音源信号の符号化を行うようにしてもよい。

このように、本実施の形態によれば、音声符号化に適したＣＥＬＰ符号化を用いるため、さらに効率的な符号化を行うことができる。

（実施の形態４）
図１７に本実施の形態に係る音声符号化装置８００の構成を示す。音声符号化装置８００は、コアレイヤ符号化部１１０および拡張レイヤ符号化部１２０を備える。なお、コアレイヤ符号化部１１０の構成は実施の形態１（図１）と同一であるため説明を省略する。

拡張レイヤ符号化部１２０は、モノラル信号ＬＰＣ分析部１３４、モノラルＬＰＣ残差信号生成部１３５、第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７を備える。

モノラル信号ＬＰＣ分析部１３４は、モノラル復号信号に対するＬＰＣパラメータを算出して、このモノラル信号ＬＰＣパラメータをモノラルＬＰＣ残差信号生成部１３５、第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７へ出力する。

モノラルＬＰＣ残差信号生成部１３５は、ＬＰＣパラメータを用いて、モノラル復号信号に対するＬＰＣ残差信号（モノラルＬＰＣ残差信号）を生成して、第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７へ出力する。

第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７は、モノラル復号信号に対するＬＰＣパラメータおよびＬＰＣ残差信号を用いて、各チャネルの音声信号に対するＣＥＬＰ符号化を行い、各チャネルの符号化データを出力する。

次いで、第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７の詳細について説明する。第１ｃｈＣＥＬＰ符号化部１３６および第２ｃｈＣＥＬＰ符号化部１３７の構成を図１８に示す。なお、図１８において実施の形態３（図１０）と同一の構成には同一符号を付し、説明を省略する。

第ＮｃｈＬＰＣ分析部４１３は、第Ｎｃｈ音声信号に対するＬＰＣ分析を行い、得られたＬＰＣパラメータを量子化して第ＮｃｈＬＰＣ予測残差信号生成部４０２および合成フィルタ４０９に出力するとともに、第ＮｃｈＬＰＣ量子化符号を出力する。第ＮｃｈＬＰＣ分析部４１３では、ＬＰＣパラメータの量子化に際し、モノラル信号に対するＬＰＣパラメータと第Ｎｃｈ音声信号から得られるＬＰＣパラメータ（第ＮｃｈＬＰＣパラメータ）との相関が大きいことを利用して、モノラル信号ＬＰＣパラメータに対するＮｃｈＬＰＣパラメータの差分成分を量子化することにより効率的な量子化を行う。

第Ｎｃｈ予測フィルタ分析部４１４は、第ＮｃｈＬＰＣ予測残差信号生成部４０２から出力されるＬＰＣ予測残差信号およびモノラルＬＰＣ残差信号生成部１３５から出力されるモノラルＬＰＣ残差信号から第Ｎｃｈ予測フィルタパラメータを求めて量子化し、第Ｎｃｈ予測フィルタ量子化パラメータを第Ｎｃｈ駆動音源信号合成部４１５に出力するとともに、第Ｎｃｈ予測フィルタ量子化符号を出力する。

第Ｎｃｈ駆動音源信号合成部４１５は、モノラルＬＰＣ残差信号および第Ｎｃｈ予測フィルタ量子化パラメータを用いて、第Ｎｃｈ音声信号に対応する予測駆動音源信号を合成
して乗算器４０７−１へ出力する。

なお、音声符号化装置８００に対する音声復号装置では、音声符号化装置８００と同様にして、モノラル復号信号に対するＬＰＣパラメータおよびＬＰＣ残差信号を算出して、各チャネルのＣＥＬＰ復号部での各チャネルの駆動音源信号の合成に用いる。

また、第Ｎｃｈ予測フィルタ分析部４１４において、第ＮｃｈＬＰＣ予測残差信号生成部４０２から出力されるＬＰＣ予測残差信号およびモノラルＬＰＣ残差信号生成部１３５から出力されるモノラルＬＰＣ残差信号の代わりに、第Ｎｃｈ音声信号およびモノラル信号生成部１１１で生成されたモノラル信号s_mono(n)を用いて、第Ｎｃｈ予測フィルタパラメータを求めるようにしてもよい。さらに、モノラル信号生成部１１１で生成されたモノラル信号s_mono(n)を用いる代わりに、モノラル復号信号を用いるようにしてもよい。

このように、本実施の形態によれば、モノラル信号ＬＰＣ分析部１３４およびモノラルＬＰＣ残差信号生成部１３５を備えるため、コアレイヤにおいて任意の符号化方式でモノラル信号が符号化される場合でも、拡張レイヤにおいてＣＥＬＰ符号化を用いることができる。

なお、上記各実施の形態に係る音声符号化装置、音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。

また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部又は全てを含むように１チップ化されてもよい。

ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。

さらには、半導体技術の進歩又は派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。

本明細書は、２００４年１２月２７日出願の特願２００４−３７７９６５および２００５年８月１８日出願の特願２００５−２３７７１６に基づくものである。これらの内容はすべてここに含めておく。

本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。

本発明の実施の形態１に係る音声符号化装置の構成を示すブロック図本発明の実施の形態１に係る第１ｃｈ、第２ｃｈ予測信号合成部の構成を示すブロック図本発明の実施の形態１に係る第１ｃｈ、第２ｃｈ予測信号合成部の構成を示すブロック図本発明の実施の形態１に係る音声復号装置の構成を示すブロック図本発明の実施の形態１に係る音声符号化装置の動作説明図本発明の実施の形態１に係る音声符号化装置の動作説明図本発明の実施の形態２に係る音声符号化装置の構成を示すブロック図本発明の実施の形態２に係る音声復号装置の構成を示すブロック図本発明の実施の形態３に係る音声符号化装置の構成を示すブロック図本発明の実施の形態３に係る第１ｃｈ、第２ｃｈＣＥＬＰ符号化部の構成を示すブロック図本発明の実施の形態３に係る音声復号装置の構成を示すブロック図本発明の実施の形態３に係る第１ｃｈ、第２ｃｈＣＥＬＰ復号部の構成を示すブロック図本発明の実施の形態３に係る音声符号化装置の動作フロー図本発明の実施の形態３に係る第１ｃｈ、第２ｃｈＣＥＬＰ符号化部の動作フロー図本発明の実施の形態３に係る音声符号化装置の別の構成を示すブロック図本発明の実施の形態３に係る第１ｃｈ、第２ｃｈＣＥＬＰ符号化部の別の構成を示すブロック図本発明の実施の形態４に係る音声符号化装置の構成を示すブロック図本発明の実施の形態４に係る第１ｃｈ、第２ｃｈＣＥＬＰ符号化部の構成を示すブロック図

Claims

コアレイヤのモノラル信号を用いた符号化を行う第１符号化手段と、
拡張レイヤのステレオ信号を用いた符号化を行う第２符号化手段と、を具備し、
前記第１符号化手段は、第１チャネル信号および第２チャネル信号を含むステレオ信号を入力信号として、前記第１チャネル信号および前記第２チャネル信号からモノラル信号を生成する生成手段を具備し、
前記第２符号化手段は、前記モノラル信号を符号化して得られるモノラル駆動音源信号に基づいて、前記第１チャネル信号または前記第２チャネル信号の予測信号を合成する合成手段を具備する、
音声符号化装置。
前記第２符号化手段は、前記予測信号と前記第１チャネル信号または前記第２チャネル信号との残差信号を符号化する、
請求項１記載の音声符号化装置。
前記第２符号化手段は、前記第１チャネル信号または前記第２チャネル信号から第１チャネルＬＰＣ残差信号または第２チャネルＬＰＣ残差信号を算出する算出手段、をさらに具備し、
前記合成手段は、前記モノラル駆動音源信号に対する前記第１チャネルＬＰＣ残差信号または前記第２チャネルＬＰＣ残差信号の遅延差および振幅比を用いて、前記予測信号を合成する、
請求項１又は２に記載の音声符号化装置。
前記合成手段は、前記モノラル駆動音源信号と、前記第１チャネルＬＰＣ残差信号または前記第２チャネルＬＰＣ残差信号とから算出される前記遅延差および前記振幅比を用いて、前記予測信号を合成する、
請求項３記載の音声符号化装置。
請求項１記載の音声符号化装置を具備する無線通信移動局装置。
請求項１記載の音声符号化装置を具備する無線通信基地局装置。
コアレイヤにおいてモノラル信号を用いた符号化を行い、拡張レイヤにおいてステレオ信号を用いた符号化を行う音声符号化方法であって、
前記コアレイヤにおいて、第１チャネル信号および第２チャネル信号を含むステレオ信号を入力信号として、前記第１チャネル信号および前記第２チャネル信号からモノラル信号を生成する生成工程を具備し、
前記拡張レイヤにおいて、前記モノラル信号を符号化して得られるモノラル駆動音源信号に基づいて、前記第１チャネル信号または前記第２チャネル信号の予測信号を合成する合成工程を具備する、
音声符号化方法。