WO2006118178A1

WO2006118178A1 - 音声符号化装置および音声符号化方法

Info

Publication number: WO2006118178A1
Application number: PCT/JP2006/308811
Authority: WO
Inventors: Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-04-28
Filing date: 2006-04-27
Publication date: 2006-11-09
Also published as: CN101167124B; EP1876585B1; CN101167124A; JP4850827B2; DE602006014957D1; EP1876585A1; JPWO2006118178A1; KR20080003839A; KR101259203B1; EP1876585A4; US20090076809A1; US8433581B2

Abstract

　モノラル－ステレオ・スケーラブル構成を有する音声符号化において、効率的にステレオ音声を符号化することができる音声符号化装置。この装置では、相関度比較部（３０４）が、第１ｃｈ音声信号から第１ｃｈのチャネル内相関（第１ｃｈ内の過去の信号と現在の信号との相関度）を算出するとともに、第２ｃｈ音声信号から第２ｃｈのチャネル内相関（第２ｃｈ内の過去の信号と現在の信号との相関度）を算出し、第１ｃｈのチャネル内相関と第２ｃｈのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択し、選択部（３０５）が、相関度比較部（３０４）での選択結果に従って、第１ｃｈ内予測部（３０７）から出力される第１ｃｈ予測信号、または、第１ｃｈ信号生成部（３１１）から出力される第１ｃｈ予測信号のいずれかを選択して、減算器（３０３）および第１ｃｈ予測残差信号符号化部（３０８）に出力する。

Description

明細書

音声符号化装置および音声符号化方法

技術分野

[0001] 本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。

背景技術

[0002] 移動体通信や IP通信での伝送帯域の広帯域化、サービスの多様化に伴 1、、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号ィ匕が必須となる。

[0003] また、 IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号ィ匕が望まれている。スケーラブルな構成とは、受信側で部分的な符号ィ匕データ力もでも音声データの復号が可能な構成を、う。

[0004] よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側にぉ、て選択可能な、モノラルーステレオ間でのスケーラブル構成（モノラルステレオ'スケーラブル構成）を有する符号化が望まれる。

[0005] このような、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕方法としては、例えば、チャネル (以下、適宜「ch」と略す）間の信号の予測 (第 lch信号から第 2 ch信号の予測、または、第 2ch信号力も第 lch信号の予測)を、チャネル相互間のピツチ予測により行う、すなわち、 2チャネル間の相関を利用して符号ィ匕を行うものがある (非特許文献 1参照)。非特言午文献 1 : Ramprashad， S.A., "Stereophonic CELP coding using cross channel p rediction", Proc. IEEE Workshop on Speech Coding, pp.136- 138， Sep. 2000.

発明の開示

発明が解決しょうとする課題

[0006] し力しながら、上記非特許文献 1記載の音声符号化方法では、双方のチャネル間の相関が小さい場合には、チャネル間の予測性能（予測ゲイン）が低下してしまい、符号化効率が劣化する。

[0007] また、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕方法におけるステレオ拡張レイヤでの符号ィ匕にチャネル間の予測を用いた符号ィ匕を適用する場合、双方のチャネル間の相関が小さぐかつ、ステレオ拡張レイヤで符号ィ匕の対象となるチャネルのチャネル内相関（すなわち、チャネル内の過去の信号と現在の信号との相関度)が小さ!、場合には、チャネル間の予測のみでは十分な予測性能 (予測ゲイン）が得られず符号化効率が劣化する。

[0008] 本発明の目的は、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕において、効率的にステレオ音声を符号化することができる音声符号化装置および音声符号化方法を提供することである。

課題を解決するための手段

[0009] 本発明の音声符号ィ匕装置は、モノラル信号のためのコアレイヤの符号ィ匕を行う第 1 符号ィヒ手段と、ステレオ信号のための拡張レイヤの符号ィヒを行う第 2符号ィヒ手段と、を具備し、前記第 1符号化手段は、ステレオ信号を構成する第 1チャネルの信号および第 2チャネルの信号からモノラル信号を生成し、前記第 2符号化手段は、前記第 1 チャネルおよび前記第 2チャネルのうち、チャネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第 1チャネルに対する符号ィ匕を行う構成を採る。

発明の効果

[0010] 本発明によれば、効率的にステレオ音声を符号ィ匕することができる。

図面の簡単な説明 [0011] [図 1]本発明の実施の形態 1に係る音声符号化装置の構成を示すブロック図

[図 2]本発明の実施の形態 1に係る拡張レイヤ符号ィ匕部の動作フロー図

[図 3]本発明の実施の形態 1に係る拡張レイヤ符号ィ匕部の動作概念図

[図 4]本発明の実施の形態 1に係る拡張レイヤ符号ィ匕部の動作概念図

[図 5]本発明の実施の形態 1に係る音声復号装置の構成を示すブロック図

[図 6]本発明の実施の形態 2に係る音声符号ィ匕装置の構成を示すブロック図

[図 7]本発明の実施の形態 2に係る第 IchCELP符号ィ匕部の構成を示すブロック図 [図 8]本発明の実施の形態 2に係る第 IchCELP符号ィ匕部の動作フロー図発明を実施するための最良の形態

[0012] 以下、モノラル一ステレオ'スケーラブル構成を有する音声符号ィ匕に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。

[0013] (実施の形態 1)

本実施の形態に係る音声符号化装置の構成を図 1に示す。図 1に示す音声符号化装置 100は、モノラル信号のためのコアレイヤ符号ィ匕部 200とステレオ信号のための拡張レイヤ符号ィ匕部 300とを備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。

[0014] コアレイヤ符号ィ匕部 200において、モノラル信号生成部 201は、入力される第 lch 音声信号 s_chl(n)、第 2ch音声信号 s_ch2(n) (但し、 n=0〜NF- 1 ;NFはフレーム長)から、式（1)に従ってモノラル信号 s_m_ono(n)を生成し、モノラル信号符号ィ匕部 202に出力する。

[数 1] s_mono (n) = ( s_chl (n) + s_ch2 (n) ) / 2 … （1 )

[0015] モノラル信号符号ィ匕部 202は、モノラル信号 s_mono(n)に対する符号ィ匕を行、、このモノラル信号の符号ィ匕データをモノラル信号復号部 203に出力する。また、このモノラル信号の符号ィ匕データは、拡張レイヤ符号ィ匕部 300から出力される量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。

[0016] モノラル信号復号部 203は、モノラル信号の符号ィ匕データ力モノラルの復号信号を生成して拡張レイヤ符号ィ匕部 300に出力する。

[0017] 拡張レイヤ符号ィ匕部 300において、チャネル間予測パラメータ分析部 301は、第 1 ch音声信号とモノラル復号信号とから、モノラル信号に対する第 lch音声信号の予測パラメータ（チャネル間予測パラメータ）を求めて量子化し、チャネル間予測部 302 に出力する。ここでは、チャネル間予測パラメータ分析部 301は、チャネル間予測パラメータとして、モノラル信号 (モノラル復号信号）に対する第 lch音声信号の遅延差 (Dサンプル)および振幅比 (g)を求める。また、チャネル間予測パラメータ分析部 30 1は、チャネル間予測パラメータを量子化および符号ィ匕したチャネル間予測パラメ一タ量子化符号を出力する。このチャネル間予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号ィ匕データとして、後述する音声復号装置へ伝送される。

[0018] チャネル間予測部 302は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号力も第 lch信号を予測し、この第 lch予測信号 (チャネル間予測)を減算器 303および第 lch予測残差信号符号ィ匕部 308に出力する。例えば、チャネル間予測部 302は、式（2)で表される予測により、モノラル復号信号 sd_m_ono(n)から、第 1 ch予測信号 _Sp_chl(n)を合成する。

[数 2] sp_chl (n) = g · sd_mono (n - D) … ( 2 )

[0019] 相関度比較部 304は、第 lch音声信号力も第 lchのチャネル内相関（第 lch内の過去の信号と現在の信号との相関度)を算出するとともに、第 2ch音声信号から第 2c hのチャネル内相関（第 2ch内の過去の信号と現在の信号との相関度）を算出する。各チャネルのチャネル内相関としては、例えば、対応する音声信号に対する正規ィ匕最大自己相関係数値、対応する音声信号に対するピッチ予測ゲイン値、対応する音声信号力求められる LPC予測残差信号に対する正規ィ匕最大自己相関係数値、対応する音声信号力求められる LPC予測残差信号に対するピッチ予測ゲイン値などを用いることができる。そして、相関度比較部 304は、第 lchのチャネル内相関と第 2 chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部 305、 306に出力される。また、この選択情報は、量子化符号および符号化データと多重されて、符号化データとして、後述する音声復号装置へ伝送される。

[0020] 第 lch内予測部 307は、第 lch音声信号と、第 lch予測残差信号符号化部 308から入力される第 lch復号信号とから、第 lchでのチャネル内予測により、第 lch信号を予測して、この第 lch予測信号を選択部 305に出力する。また、第 lch内予測部 3 07は、第 lchでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第 lchのチャネル内予測パラメータ量子化符号を選択部 306に出力する。なお、チャネル内予測の詳細については後述する。

[0021] 第 2ch信号生成部 309は、モノラル信号復号部 203から入力されるモノラル復号信号と、第 lch予測残差信号符号ィ匕部 308から入力される第 lch復号信号とから、上式（1)の関係に基づいて、第 2ch復号信号を生成する。つまり、第 2ch信号生成部 3 09は、モノラル復号信号 sd_mono(n)と第 lch復号信号 sd_chl(n)とから、式（3)に従つて第 2ch復号信号 _Sd_ch2(n)を生成して、第 2ch内予測部 310に出力する。

[数 3] sd_ch2 (n) = 2 · sd_mono (n) - sd_chl (n) … 、3 )

[0022] 第 2ch内予測部 310は、第 2ch音声信号と第 2ch復号信号とから、第 2chでのチヤネル内予測により、第 2ch信号を予測して、この第 2ch予測信号を第 lch信号生成部 311に出力する。また、第 2ch内予測部 310は、第 2chでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第 2chのチャネル内予測パラメータ量子化符号を選択部 306に出力する。なお、チャネル内予測の詳細については後述する。

[0023] 第 lch信号生成部 311は、第 2ch予測信号と、モノラル信号復号部 203から入力されるモノラル復号信号とから、上式（1)の関係に基づいて、第 lch予測信号を生成する。つまり、第 lch信号生成部 311は、モノラル復号信号 sd_m_ono(n)と第 2ch予測信号 s_ch2_p(n)とから、式 (4)に従って第 lch予測信号 s_chl_p(n)を生成して、選択部 30 5に出力する。

画 s_chl_p (n) = 2 · sd_mono (n) - s_ch2_p (n … ( 4 )

[0024] 選択部 305は、相関度比較部 304での選択結果に従って、第 lch内予測部 307から出力される第 lch予測信号、または、第 lch信号生成部 311から出力される第 lch 予測信号の!/、ずれかを選択して、減算器 303および第 lch予測残差信号符号化部 308に出力する。選択部 305は、相関度比較部 304により第 lchが選択された場合（つまり、第 lchのチャネル内相関が第 2chのチャネル内相関より大きい場合）、第 lch 内予測部 307から出力される第 lch予測信号を選択し、相関度比較部 304により第 2chが選択された場合（つまり、第 lchのチャネル内相関が第 2chのチャネル内相関以下の場合)、第 lch信号生成部 311から出力される第 lch予測信号を選択する。

[0025] 選択部 306は、相関度比較部 304での選択結果に従って、第 lch内予測部 307から出力される第 lchのチャネル内予測パラメータ量子化符号、または、第 2ch内予測部 310から出力される第 2chのチャネル内予測パラメータ量子化符号のいずれかを選択して、チャネル内予測パラメータ量子化符号として出力する。このチャネル内予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。

[0026] 具体的には、選択部 306は、相関度比較部 304により第 lchが選択された場合 (つまり、第 lchのチャネル内相関が第 2chのチャネル内相関より大きい場合）、第 lch内予測部 307から出力される第 lchのチャネル内予測パラメータ量子化符号を選択し、相関度比較部 304により第 2chが選択された場合 (つまり、第 lchのチャネル内相関が第 2chのチャネル内相関以下の場合）、第 2ch内予測部 310から出力される第 2 chのチャネル内予測パラメータ量子化符号を選択する。 [0027] 減算器 303は、入力信号である第 lch音声信号と第 lch予測信号との残差信号（第 lch予測残差信号)、すなわち、チャネル間予測部 302から出力された第 lch予測信号と、選択部 305から出力された第 lch予測信号とを、第 lch音声信号から差し引いた残りの信号を求め、第 lch予測残差信号符号ィ匕部 308に出力する。

[0028] 第 lch予測残差信号符号ィ匕部 308は、第 lch予測残差信号を符号化した第 lch 予測残差符号化データを出力する。この第 lch予測残差符号化データは、他の符号化データ、量子化符号および選択情報と多重されて、符号ィ匕データとして、後述する音声復号装置へ伝送される。また、第 lch予測残差信号符号ィ匕部 308は、第 lch予測残差符号化データを復号した信号と、チャネル間予測部 302から出力された第 lc h予測信号と、選択部 305から出力された第 lch予測信号とを加算して、第 lch復号信号を求め、この第 lch復号信号を第 lch内予測部 307および第 2ch信号生成部 3 09に出力する。

[0029] ここで、第 lch内予測部 307および第 2ch内予測部 310は、各チャネル内の信号の相関性を利用して、過去の信号力も符号ィ匕対象フレームの信号を予測するチヤネル内予測を行う。例えば、 1次のピッチ予測フィルタを用いる場合は、チャネル内予測により予測される各チャネルの信号は式（5)で表される。ここで、 Sp(n)は各チャネルの予測信号、 s(n)は各チャネルの復号信号 (第 lch復号信号または第 2ch復号信号) である。また、 Tおよび gpは、各チャネルの復号信号と各チャネルの入力信号 (第 lch 音声信号または第 2ch音声信号)とから求められる、 1次のピッチ予測フィルタのラグおよび予測係数であり、これらはチャネル内予測パラメータを構成する。

[数 5]

Sp (n) = gp · s (n-T) … ( 5 )

[0030] 次、で、図 2〜4を用いて、拡張レイヤ符号ィ匕部 300の動作にっ、て説明する。

[0031] まず、第 lchのチャネル内相関度 corlおよび第 2chのチャネル内相関度 cor2を算出する（ST11)。

[0032] 次いで、 corlと cor2とを比較して（ST12)、チャネル内相関度がより大きいチャネルでのチャネル内予測を用いる。

[0033] すなわち、 corl >cor2の場合は（ST12 : YES)、第 lchでのチャネル内予測を行つて求めた第 lch予測信号を符号ィ匕対象として選択する。具体的には、図 3に示すように、第 n— 1フレームの第 lch復号信号 21から上式（5)に従って第 nフレームの第 lc h信号 22を予測し (ST13)、このようにして予測した第 lch予測信号 22を符号ィ匕対象として選択部 305から出力する（ST17)。つまり、 corl >cor2の場合は、第 lch復号信号から第 lch信号を直接的に予測する。

[0034] 一方、 corl≤ cor2の場合は（ST12： NO)、第 2ch復号信号を生成し（ST14)、第 2 chでのチャネル内予測を行って第 2チャネル予測信号を求め（ST15)、第 2ch予測信号とモノラル復号信号とから第 lch予測信号を求め（ST16)、このようにして求めた第 lch予測信号を符号ィ匕対象として選択部 305から出力する (ST17)。具体的には、図 4に示すように、第 n—lフレームの第 lch復号信号 31および第 n—lフレームのモノラル復号信号 32から、上式（3)に従って、第 n— 1フレームの第 2ch復号信号を生成する。次いで、第 n—1フレームの第 2ch復号信号 33から上式 (5)に従って第 nフレームの第 2ch信号 34を予測する。次いで、第 nフレームの第 2ch予測信号 34 および第 nフレームのモノラル復号信号 35から、上式 (4)に従って、第 nフレームの第 lch予測信号 36を生成する。そして、このようにして予測した第 lch予測信号 36を符号化対象として選択する。つまり、 _Corl≤cor2の場合は、第 2ch予測信号とモノラル復号信号とから、第 lch信号を間接的に予測する。

[0035] 次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置の構成を図 5に示す。図 5に示す音声復号装置 400は、モノラル信号のためのコアレイヤ復号部 410と、ステレオ信号のための拡張レイヤ復号部 420 とを備える。

[0036] モノラル信号復号部 411は、入力されるモノラル信号の符号化データを復号し、モノラル復号信号を拡張レイヤ復号部 420に出力するとともに、最終出力として出力する。

[0037] チャネル間予測パラメータ復号部 421は、入力されるチャネル間予測パラメータ量子化符号を復号してチャネル間予測部 422に出力する。 [0038] チャネル間予測部 422は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号力も第 lch信号を予測し、この第 lch予測信号 (チャネル間予測)を加算器 423に出力する。例えば、チャネル間予測部 422は、上式（2)で表される予測により、モノラル復号信号 sd_mono(n)から、第 lch予測信号 sp_chl(n)を合成する。

[0039] 第 lch予測残差信号復号部 424は、入力される第 lch予測残差符号ィ匕データを復号して加算器 423に出力する。

[0040] 加算器 423は、チャネル間予測部 422から出力される第 lch予測信号と、第 lch予測残差信号復号部 424から出力される第 lch予測残差信号と、選択部 426から出力される第 lch予測信号とを加算して、第 lch復号信号を求め、この第 lch復号信号を、第 lch内予測部 425および第 2ch信号生成部 427に出力するとともに、最終出力として出力する。

[0041] 第 lch内予測部 425は、第 lch復号信号と、第 lchのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第 lch信号を予測して、この第 lc h予測信号を選択部 426に出力する。

[0042] 第 2ch信号生成部 427は、モノラル復号信号と第 lch復号信号とから、上式 (3)に従って第 2ch復号信号を生成して、第 2ch内予測部 428に出力する。

[0043] 第 2ch内予測部 428は、第 2ch復号信号と、第 2chのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第 2ch信号を予測して、この第 2c h予測信号を第 lch信号生成部 429に出力する。

[0044] 第 lch信号生成部 429は、モノラル復号信号と第 2ch予測信号とから、上式 (4)に従って第 lch予測信号を生成して、選択部 426に出力する。

[0045] 選択部 426は、選択情報が示す選択結果に従って、第 lch内予測部 425から出力される第 lch予測信号、または、第 lch信号生成部 429から出力される第 lch予測信号のいずれかを選択して、加算器 423に出力する。選択部 426は、図 1の音声符号化装置 100にて第 lchが選択された場合 (つまり、第 lchのチャネル内相関が第 2ch のチャネル内相関より大きい場合）、第 lch内予測部 425から出力される第 lch予測信号を選択し、音声符号ィ匕装置 100にて第 2chが選択された場合 (つまり、第 lchのチャネル内相関が第 2chのチャネル内相関以下の場合）、第 lch信号生成部 429から出力される第 lch予測信号を選択する。

[0046] このような構成を採る音声復号装置 400では、モノラル—ステレオ'スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号ィ匕データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号ィ匕データおよび量子化符号のすべてを用いて第 lch復号信号および第 2ch復号信号を復号して出力する。

[0047] このように、本実施の形態では、チャネル内相関がより大き、チャネルでのチャネル内予測により求めた予測信号を用いて拡張レイヤでの符号ィ匕を行うため、符号ィ匕対象チャネル (本実施形態では第 lch)の符号ィ匕対象フレームにおけるチャネル内相関（チャネル内予測性能）が小さく予測が有効に行えない場合でも、他方のチャネル (本実施形態では第 2ch)のチャネル内相関が大きい場合には、その他方のチヤネルでのチャネル内予測により求めた予測信号を用いて符号ィ匕対象チャネルの信号を予測することができるため、符号ィ匕対象チャネルのチャネル内相関が小さ、場合でも、十分な予測性能 (予測ゲイン)を得ることができ、その結果、符号化効率の劣化を防ぐことができる。

[0048] なお、上記説明では、拡張レイヤ符号ィ匕部 300にチャネル間予測パラメータ分析部 301およびチャネル間予測部 302を設ける構成について説明した力拡張レイヤ符号ィ匕部 300はこれらの各部を有しない構成を採ることも可能である。この場合、拡張レイヤ符号ィ匕部 300では、コアレイヤ符号ィ匕部 200から出力されたモノラル復号信号が直接減算器 303に入力され、減算器 303は、第 lch音声信号からモノラル復号信号および第 lch予測信号を減算して予測残差信号を求める。

[0049] また、上記説明では、チャネル内相関の大きさに基づいて、第 lchでのチャネル内予測により直接求めた第 lch予測信号 (直接的予測）、または、第 2chでのチャネル内予測により求めた第 2ch予測信号力も間接的に求めた第 lch予測信号 (間接的予測）のいずれかを選択したが、符号ィ匕対象チャネルである第 lchのチャネル内予測誤差 (すなわち、入力信号である第 lch音声信号に対する第 lch予測信号の誤差）力 S小さい方の第 lch予測信号を選択してもよい。または、双方の第 lch予測信号を用いて拡張レイヤでの符号ィ匕を行、、その結果生じる符号ィ匕歪みがより小さ、方の第 lch予測信号を選択してもよ、。

[0050] (実施の形態 2)

図 6に本実施の形態に係る音声符号ィ匕装置 500の構成を示す。

[0051] コアレイヤ符号ィ匕部 510において、モノラル信号生成部 511は、上式（1)に従ってモノラル信号を生成し、モノラル信号 CELP符号ィ匕部 512に出力する。

[0052] モノラル信号 CELP符号ィ匕部 512は、モノラル信号生成部 511で生成されたモノラル信号に対して CELP符号ィ匕を行い、モノラル信号符号ィ匕データ、および、 CELP 符号ィ匕によって得られるモノラル駆動音源信号を出力する。モノラル信号符号化データは、モノラル信号復号部 513に出力されるとともに、第 lch符号ィ匕データと多重されて音声復号装置へ伝送される。また、モノラル駆動音源信号は、モノラル駆動音源信号保持部 521に保持される。

[0053] モノラル信号復号部 513は、モノラル信号の符号ィ匕データ力もモノラルの復号信号を生成して、モノラル復号信号保持部 522に出力する。このモノラル復号信号は、モノラル復号信号保持部 522に保持される。

[0054] 拡張レイヤ符号ィ匕部 520において、第 IchCELP符号ィ匕部 523は、第 lch音声信号に対して CELP符号ィ匕を行って第 lch符号ィ匕データを出力する。第 IchCELP符号ィ匕部 523は、モノラル信号符号ィ匕データ、モノラル復号信号、モノラル駆動音源信号、第 2ch音声信号、および、第 2ch信号生成部 525から入力される第 2ch復号信号を用いて、第 lch音声信号に対応する駆動音源信号の予測、および、その予測残差成分に対する CELP符号化を行う。第 IchCELP符号化部 523は、その予測残差成分に対する CELP音源符号化にお、て、ステレオ信号の各チャネルのチャネル内相関に基づき、適応符号帳探索を行う符号帳を切替える (すなわち、符号化に用いるチャネル内予測を行うチャネルを切替える）。第 IchCELP符号ィ匕部 523の詳細については後述する。

[0055] 第 lch復号部 524は、第 lch符号ィ匕データを復号して第 lch復号信号を求め、この第 lch復号信号を第 2ch信号生成部 525に出力する。

[0056] 第 2ch信号生成部 525は、モノラル復号信号と第 lch復号信号とから、上式（3)に従って第 2ch復号信号を生成して、第 IchCELP符号ィ匕部 523に出力する。 [0057] 次いで、第 IchCELP符号ィ匕部 523の詳細について説明する。第 IchCELP符号化部 523の構成を図 7に示す。

[0058] 図 7において、第 IchLPC分析部 601は、第 lch音声信号に対する LPC分析を行 V、、得られた LPCパラメータを量子化して第 IchLPC予測残差信号生成部 602および合成フィルタ 615に出力するとともに、第 1 chLPC量子化符号を第 1 ch符号化データとして出力する。第 IchLPC分析部 601では、 LPCパラメータの量子化に際し、モノラル信号に対する LPCパラメータと第 lch音声信号力も得られる LPCパラメータ (第 IchLPCパラメータ）との相関が大きいことを利用して、モノラル信号の符号化デ一タカもモノラル信号量子化 LPCパラメータを復号し、そのモノラル信号量子化 LPC ノメータに対する第 IchLPCパラメータの差分成分を量子化することにより効率的な量子化を行う。

[0059] 第 IchLPC予測残差信号生成部 602は、第 lch量子化 LPCパラメータを用いて、第 lch音声信号に対する LPC予測残差信号を算出してチャネル間予測パラメータ分析部 603に出力する。

[0060] チャネル間予測パラメータ分析部 603は、 LPC予測残差信号とモノラル駆動音源信号とから、モノラル信号に対する第 lch音声信号の予測パラメータ (チャネル間予測パラメータ）を求めて量子化し、第 lch駆動音源信号予測部 604に出力する。また、チャネル間予測パラメータ分析部 603は、チャネル間予測パラメータを量子化および符号ィ匕したチャネル間予測パラメータ量子化符号を第 lch符号ィ匕データとして出力する。

[0061] 第 lch駆動音源信号予測部 604は、モノラル駆動音源信号および量子化されたチャネル間予測パラメータを用いて、第 lch音声信号に対応する予測駆動音源信号を合成する。この予測駆動音源信号は、乗算器 612— 1でゲインを乗じられて加算器 6 14に出力される。

[0062] ここで、チャネル間予測パラメータ分析部 603は、実施の形態 1 (図 1)におけるチヤネル間予測パラメータ分析部 301に対応し、それらの動作は同様になる。また、第 lc h駆動音源信号予測部 604は、実施の形態 1 (図 1)におけるチャネル間予測部 302 に対応し、それらの動作は同様になる。但し、本実施の形態では、モノラル復号信号に対する予測を行って第 lch予測信号を合成するのではなぐモノラル駆動音源信号に対する予測を行って第 lchの予測駆動音源信号を合成する点において実施の形態 1と異なる。そして、本実施の形態では、その予測駆動音源信号に対する残差成分 (予測しきれない誤差成分)の音源信号を、 CELP符号ィ匕における音源探索により符号化する。

[0063] 相関度比較部 605は、第 lch音声信号力も第 lchのチャネル内相関を算出するとともに、第 2ch音声信号力も第 2chのチャネル内相関を算出する。そして、相関度比較部 605は、第 lchのチャネル内相関と第 2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部 6 13に出力される。また、この選択情報は、第 lch符号ィ匕データとして出力される。

[0064] 第 2chLPC予測残差信号生成部 606は、第 lch量子化 LPCパラメータおよび第 2 ch復号信号から第 2ch復号信号に対する LPC予測残差信号を生成し、前サブフレーム (第 n— 1サブフレーム)までの第 2chLPC予測残差信号で構成される第 2ch適応符号帳 607を生成する。

[0065] モノラル LPC予測残差信号生成部 609は、第 lch量子化 LPCパラメータおよびモノラル復号信号カゝらモノラル復号信号に対する LPC予測残差信号 (モノラル LPC予測残差信号)を生成して、第 lch信号生成部 608に出力する。

[0066] 第 lch信号生成部 608は、歪最小化部 618から指示されたインデタスに対応する適応符号帳ラグに基づいて第 2ch適応符号帳 607から出力される第 2chの符号べクトル Vacb_ch2(n) (但し、 n=0〜NSUB- 1； NSUBはサブフレーム長（CELP音源探索時の区間長単位) )と、符号ィ匕対象の現サブフレーム（第 nサブフレーム）のモノラル LP C予測残差信号 Vres_mono(n)とを用いて、上式（1)の関係に基づき、式 (6)に従って、第 lchの適応音源に対応する符号ベクトル Vacb__Chl(_n)を算出して適応符号帳べクトルとして出力する。この符号ベクトル Vacb__Chl(_n)は、乗算器 612— 2で適応符号帳ゲインを乗じられて選択部 613に出力される。

[数 6]

Vacb chl (n) = 2 · Vres_raono (n) - Vacb_ch2 (n) … ( 6 ) [0067] 第 lch適応符号帳 610は、歪最小化部 618から指示されたインデタスに対応する適応符号帳ラグに基づ、て、 1サブフレーム分の第 lchの符号ベクトルを適応符号帳ベクトルとして乗算器 612— 3へ出力する。この適応符号帳ベクトルは、乗算器 61 2 3で適応符号帳ゲインを乗じられて選択部 613に出力される。

[0068] 選択部 613は、相関度比較部 605での選択結果に従って、乗算器 612— 2から出力される適応符号帳ベクトル、または、乗算器 612— 3から出力される適応符号帳べタトルのいずれかを選択して、乗算器 612— 4に出力する。選択部 613は、相関度比較部 605により第 lchが選択された場合 (つまり、第 lchのチャネル内相関が第 2ch のチャネル内相関より大き!/、場合）、乗算器 612 3から出力される適応符号帳べクトルを選択し、相関度比較部 605により第 2chが選択された場合 (つまり、第 lchのチャネル内相関が第 2chのチャネル内相関以下の場合）、乗算器 612— 2から出力される適応符号帳ベクトルを選択する。

[0069] 乗算器 612— 4は、選択部 613から出力された適応符号帳ベクトルに別のゲインを乗じ、加算器 614に出力する。

[0070] 第 lch固定符号帳 611は、歪最小化部 618から指示されたインデタスに対応する符号ベクトルを固定符号帳ベクトルとして乗算器 612— 5に出力する。

[0071] 乗算器 612— 5は、第 lch固定符号帳 611から出力された固定符号帳ベクトルに固定符号帳ゲインを乗じ、乗算器 612— 6に出力する。

[0072] 乗算器 612— 6は、固定符号帳ベクトルに別のゲインを乗じ、加算器 614に出力する。

[0073] 加算器 614は、乗算器 612— 1から出力された予測駆動音源信号と、乗算器 612

4から出力された適応符号帳ベクトルと、乗算器 612— 6から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ 615に出力する。

[0074] 合成フィルタ 615は、第 lch量子化 LPCパラメータを用いて、加算器 614から出力される音源ベクトルを駆動音源として LPC合成フィルタによる合成を行ヽ、この合成により得られる合成信号を減算器 616に出力する。なお、合成信号のうち第 lchの予測駆動音源信号に対応する成分は、実施の形態 1 (図 1)においてチャネル間予測部 302から出力される第 lch予測信号に相当する。

[0075] 減算器 616は、合成フィルタ 615から出力された合成信号を第 lch音声信号から減算することにより誤差信号を算出し、この誤差信号を聴覚重み付け部 617に出力する。この誤差信号が符号化歪みに相当する。

[0076] 聴覚重み付け部 617は、減算器 616から出力された符号ィ匕歪みに対して聴覚的な重み付けを行い、歪最小化部 618へ出力する。

[0077] 歪最小化部 618は、第 2ch適応符号帳 607、第 lch適応符号帳 610および第 lch 固定符号帳 611に対して、聴覚重み付け部 617から出力される符号ィ匕歪みを最小とするようなインデクスを決定し、第 2ch適応符号帳 607、第 lch適応符号帳 610および第 lch固定符号帳 611が使用するインデクスを指示する。また、歪最小化部 618 は、それらのインデタスに対応するゲイン (適応符号帳ゲインおよび固定符号帳ゲイン;)を生成し、それぞれ乗算器 612— 2、 612- 3, 612— 5へ出力する。

[0078] また、歪最小化部 618は、第 lch駆動音源信号予測部 604から出力される予測駆動音源信号、選択部 613から出力される適応符号帳ベクトル、および、乗算器 612 5から出力される固定符号帳ベクトル、の 3種類の信号間のゲインを調整する各ゲインを生成し、それぞれ乗算器 612— 1、 612— 4、 612— 6に出力する。それら 3種類の信号間のゲインを調整する 3種類のゲインは、好ましくはそれらのゲイン値間〖こ相互に関係性をもたせて生成することが望ましい。例えば、第 lch音声信号と第 2ch 音声信号とのチャネル間相関が大きい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に大きくなるように、逆に、チャネル間相関が小さい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に小さくなるようにする。

[0079] また、歪最小化部 618は、それらのインデタス、それらのインデタスに対応する各ゲインの符号、および、信号間調整用ゲインの符号を第 lch音源符号ィ匕データとして出力する。この第 lch音源符号ィ匕データは、第 lch符号ィ匕データとして出力される。

[0080] 次いで、図 8を用いて、第 IchCELP符号ィ匕部 523の動作について説明する。

[0081] まず、第 lchのチャネル内相関度 corlおよび第 2chのチャネル内相関度 cor2を算出する（ST41)。

[0082] 次いで、 corlと cor2とを比較して（ST42)、チャネル内相関度がより大きいチャネルの適応符号帳を用いた適応符号帳探索を行う。

[0083] すなわち、 corl >cor2の場合は（ST42 :YES)、第 lch適応符号帳を用いた適応符号帳探索を行って (ST43)、探索結果を出力する (ST48)。

[0084] 一方、 corl≤ cor2の場合は（ST42： NO)、モノラル LPC予測残差信号を生成し（S T44)、第 2chLPC予測残差信号を生成し (ST45)、第 2chLPC予測残差信号から第 2ch適応符号帳を生成し (ST46)、モノラル LPC予測残差信号と第 2ch適応符号帳とを用いた適応符号帳探索を行って (ST47)、探索結果を出力する（ST48)。

[0085] このように、本実施の形態によれば、音声符号ィ匕に適した CELP符号ィ匕を用いるため、実施の形態 1に比べ、さらに効率的な符号ィ匕を行うことができる。

[0086] なお、上記説明では、第 IchCELP符号ィ匕部 523に第 IchLPC予測残差信号生成部 602、チャネル間予測パラメータ分析部 603および第 lch駆動音源信号予測部 604を設ける構成について説明した力第 IchCELP符号ィ匕部 523はこれらの各部を有しない構成を採ることも可能である。この場合、第 IchCELP符号ィ匕部 523では、モノラル駆動音源信号保持部 521から出力されたモノラル駆動音源信号に直接ゲインが乗算されて加算器 614に出力される。

[0087] また、上記説明では、チャネル内相関の大きさに基づいて、第 lch適応符号帳 610 を用いた適応符号帳探索または第 2ch適応符号帳 607を用いた適応符号帳探索のいずれかを選択したが、これら双方の適応符号帳探索を行い、符号化対象チャネル (本実施形態では第 lch)の符号ィ匕歪みがより小さい方の探索結果を選択してもよい

[0088] 上記各実施の形態に係る音声符号化装置、音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。

[0089] また、上記各実施の形態では、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

[0090] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されてもよいし、一部または全てを含むように 1チップィ匕されてもよい。

[0091] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレ卜ラ LSIと呼称されることちある。

[0092] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Progra mmable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用してもよい。

[0093] さらには、半導体技術の進歩または派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行ってもよい。バイオ技術の適応等が可能性としてありえる。

[0094] 本明細書は、 2005年 4月 28日出願の特願 2005— 132365に基づくものである。

この内容はすべてここに含めておく。

産業上の利用可能性

[0095] 本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。

Claims

請求の範囲

[1] モノラル信号のためのコアレイヤの符号ィ匕を行う第 1符号ィ匕手段と、

ステレオ信号のための拡張レイヤの符号ィ匕を行う第 2符号ィ匕手段と、を具備し、前記第 1符号化手段は、ステレオ信号を構成する第 1チャネルの信号および第 2チャネルの信号からモノラル信号を生成し、

前記第 2符号化手段は、前記第 1チャネルおよび前記第 2チャネルのうち、チヤネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第 1チャネルに対する符号ィヒを行う、

音声符号化装置。

[2] 前記第 2符号化手段は、

前記第 2チャネルのチャネル相関がより大き、場合は、前記第 2チャネルのチヤネル内予測により生成した予測信号と、前記モノラル信号とから前記第 1チャネルの信号を予測する、

請求項 1記載の音声符号化装置。

[3] 請求項 1記載の音声符号化装置を具備する無線通信移動局装置。

[4] 請求項 1記載の音声符号化装置を具備する無線通信基地局装置。

[5] モノラル信号のためのコアレイヤの符号ィ匕とステレオ信号のための拡張レイヤの符号化とを行う音声符号化方法であって、

前記コアレイヤにおいて、ステレオ信号を構成する第 1チャネルの信号および第 2 チャネルの信号力モノラル信号を生成し、

前記拡張レイヤにおいて、前記第 1チャネルおよび前記第 2チャネルのうち、チヤネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第 1チャネルに対する符号ィヒを行う、

音声符号化方法。