JP4151028B2

JP4151028B2 - 音声符号化方法及び音声復号方法

Info

Publication number: JP4151028B2
Application number: JP2005374861A
Authority: JP
Inventors: 徳彦渕上; 昭治植野; 美昭田中
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 1998-10-13
Filing date: 2005-12-27
Publication date: 2008-09-17
Anticipated expiration: 2019-10-13
Also published as: JP2006171770A

Description

本発明は、音声信号を予測符号化して圧縮するための音声符号化方法及び音声復号方法に関する。

音声信号を予測符号化する方法として、本発明者は先の出願（特願平９−２８９１５９号）において１チャネル（チャンネル）の原デジタル音声信号に対して、特性が異なる複数の予測器により時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の予測残差を算出し、この複数の予測残差の最小値を選択する方法を提案している。

しかしながら、上記方法では原デジタル音声信号がサンプリング周波数＝９６ｋＨｚ、量子化ビット数＝２０ビット程度の場合に、ある程度の圧縮効果を得ることができるが、近年のＤＶＤオーディオディスクではこの２倍のサンプリング周波数（＝１９２ｋＨｚ）が使用され、また、量子化ビット数も２４ビットが使用される傾向があるので、圧縮率を改善する必要がある。また、近年のＤＶＤオーディオディスクでは、マルチチャネルが利用され、チャネル数が最大６となるので圧縮率を改善する必要がある。

そこで本発明は、音声信号を予測符号化する場合に圧縮率を改善することができる音声符号化方法及び音声復号方法を提供することを目的とする。

本発明は上記目的を達成するために、以下の１）及び２）手段よりなる。
すなわち、

１）３以上のマルチチャネルの音声信号中の少なくとも選択された第１及び第２の2つのチャネルの音声信号をマトリクス演算して互いに相関ある２つの相関チャネルに変換するステップと、
前記ステップにより変換された２つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮ＰＣＭアクセスユニット内に少なくとも前記サンプリング周波数を含む同期情報部を格納すると共に前記サブストリームにフレーム毎にリスタートヘッダを設けるステップと、
からなる音声符号化方法。
２）請求項１記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ユーザデータから圧縮ＰＣＭアクセスユニットを抽出するステップと、
前記リスタートヘッダを有する前記圧縮ＰＣＭアクセスユニットから前記先頭サンプル値を取り出すと共に、前記各圧縮ＰＣＭアクセスユニットから予測残差および線形予測方法を含むサブフレーム単位の予測符号化データを取り出すステップと、
前記予測残差をビット情報に基づいたビット数で復号し、この復号した予測残差と前記先頭サンプル値と線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から元の音声信号を復元するステップと、
前記復元された音声信号を前記同期情報部に含まれるサンプリング周波数及び量子化ビット数に基づいてアナログ音声信号に変換するステップと、
からなる音声復号方法。

以上説明したように本発明によれば、従来以上に圧縮率を改善した音声の符号化ができると共に、不都合なく音声信号を復号できる。

以下、図面を参照して本発明の実施の形態を説明する。図１は本発明が適用される音声符号化装置とそれに対応した音声復号装置の第１の実施形態を示すブロック図、図２は図１のエンコーダを詳しく示すブロック図、図３は図２のマルチプレクサにより多重化される１フレームのフォーマットを示す説明図、図４はＤＶＤのパックのフォーマットを示す説明図、図５はＤＶＤのオーディオパックのフォーマットを示す説明図、図６は図１のデコーダを詳しく示すブロック図である。

図１に示すチャネル相関回路Ａは加算回路１ａと減算回路１ｂを有する。加算回路１ａは各チャネル（以下、ch）が例えばサンプリング周波数＝１９２ｋＨｚ、量子化ビット数＝２４ビットのステレオ２ch信号Ｌ、Ｒの和信号（Ｌ＋Ｒ）を算出して和ch用１chロスレス・エンコーダ２Ｄ１に出力し、減算回路１ｂは差信号（Ｌ−Ｒ）を算出して差ch用１chロスレス・エンコーダ２Ｄ２に出力する。エンコーダ２Ｄ１、２Ｄ２は図２に詳しく示すように、それぞれ和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）の差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）を予測符号化して記録媒体や通信媒体を介して伝送する。

そして、復号側では、図６に詳しく示すようにデコーダ３Ｄ１、３Ｄ２がそれぞれ各chの予測符号化データを和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）に復号し、次いでチャネル相関回路Ｂがこの和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）をステレオ２ch信号Ｌ、Ｒに復元する。

図２を参照してエンコーダ２Ｄ１、２Ｄ２について詳しく説明する。和信号（Ｌ＋Ｒ）と差信号（Ｌ−Ｒ）は１フレーム毎に１フレームバッファ１０に格納される。そして、１フレームの各サンプル値（Ｌ＋Ｒ）、（Ｌ−Ｒ）がそれぞれ差分演算回路１１Ｄ１、１１Ｄ２に印加され、今回と前回の差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）、すなわち差分ＰＣＭ（ＤＰＣＭ）データが算出される。また、各フレームの先頭サンプル値（Ｌ＋Ｒ）、（Ｌ−Ｒ）がマルチプレクサ１９に印加される。

差分演算回路１１Ｄ１により算出された差分Δ（Ｌ＋Ｒ）は、予測係数が異なる複数の予測器１２ａ−１〜１２ａ−ｎと減算器１３ａ−１〜１３ａ−ｎに印加される。そして、予測器１２ａ−１〜１２ａ−ｎではそれぞれ各予測係数に基づいて差分Δ（Ｌ＋Ｒ）の各予測値が算出され、減算器１３ａ−１〜１３ｂ−ｎではそれぞれこの各予測値と差分Δ（Ｌ＋Ｒ）の各予測残差が算出される。バッファ・選択器１６Ｄ１はこの複数の予測残差を一時記憶して、選択信号生成器１７により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路１８に出力する。なお、このサブフレームはフレームの数十分の１程度のサンプル長であり、一例として１フレームを８０サブフレームとする。ここで、予測器１２ａ−１〜１２ａ−ｎと減算器１３ａ−１〜１３ａ−ｎは和信号chの予測回路１５Ｄ１を構成し、また、この予測回路１５Ｄ１とバッファ・選択器１６Ｄ１は和信号chの予測符号化回路を構成している。

同様に、差分演算回路１１Ｄ２により算出された差分Δ（Ｌ−Ｒ）は、予測係数が異なる複数の予測器１２ｂ−１〜１２ｂ−ｎと減算器１３ｂ−１〜１３ｂ−ｎに印加される。そして、予測器１２ｂ−１〜１２ｂ−ｎではそれぞれ各予測係数に基づいて差分Δ（Ｌ−Ｒ）の各予測値が算出され、減算器１３ｂ−１〜１３ｂ−ｎではそれぞれこの各予測値と差分Δ（Ｌ−Ｒ）の各予測残差が算出される。バッファ・選択器１６Ｄ２はこの複数の予測残差を一時記憶して、選択信号生成器１７により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路１８に出力する。予測器１２ｂ−１〜１２ｂ−ｎと減算器１３ｂ−１〜１３ｂ−ｎは差信号chの予測回路１５Ｄ２を構成し、また、この予測回路１５Ｄ２とバッファ・選択器１６Ｄ２は差信号chの予測符号化回路を構成している。

選択信号生成器１７は予測残差のビット数フラグ（５ビット）をパッキング回路１８とマルチプレクサ１９に対して印加し、また、予測残差が最小の予測器を示す予測器選択フラグ（その数ｎが２〜９個として３ビット）をマルチプレクサ１９に対して印加する。パッキング回路１８はバッファ・選択器１６Ｄ１、１６Ｄ２により選択された２ch分の予測残差を、選択信号生成器１７により指定されたビット数フラグに基づいて指定ビット数でパッキングする。

続くマルチプレクサ１９は図３に示すように１フレーム分に対して
・フレームヘッダ（４０ビット）と、
・和信号ｃｈ（Ｌ＋Ｒ）の１フレームの先頭サンプル値（２５ビット）と、
・差信号ｃｈ（Ｌ−Ｒ）の１フレームの先頭サンプル値（２５ビット）と、
・和信号ｃｈ（Ｌ＋Ｒ）のサブフレーム毎の予測器選択フラグ（３ビット×８０）と、
・差信号ｃｈ（Ｌ−Ｒ）のサブフレーム毎の予測器選択フラグ（３ビット×８０）と、
・和信号ｃｈ（Ｌ＋Ｒ）のサブフレーム毎のビット数フラグ（５ビット×８０）と、
・差信号ｃｈ（Ｌ−Ｒ）のサブフレーム毎のビット数フラグ（５ビット×８０）と、
・和信号ｃｈ（Ｌ＋Ｒ）の予測残差データ列（可変ビット数）と、
・差信号ｃｈ（Ｌ−Ｒ）の予測残差データ列（可変ビット数）とを
アクセスユニットとして多重化し、可変レートビットストリームとして出力する。上記予測残差データ列はサブパケットを構成する。このような予測符号化によれば、原信号が例えばサンプリング周波数＝１９２ｋＨｚ、量子化ビット数＝２４ビット、２チャネルの場合、５９％の圧縮率を実現することができる。

また、この可変レートビットストリームデータをＤＶＤオーディオディスクに記録する場合には、図４に示す圧縮ＰＣＭのオーディオ（Ａ）パックにパッキングされる。このパックは２０３４バイトのユーザデータ（Ａパケット、Ｖパケット）に対して４バイトのパックスタート情報と、６バイトのＳＣＲ（System Clock Reference：システム時刻基準参照値）情報と、３バイトのMux レート（rate）情報と１バイトのスタッフィングの合計１４バイトのパックヘッダが付加されて構成されている（１パック＝合計２０４８バイト）。この場合、タイムスタンプであるＳＣＲ情報を、ＡＣＢユニット内の先頭パックでは「１」として同一タイトル内で連続とすることにより同一タイトル内のＡパックの時間を管理することができる。

圧縮ＰＣＭのＡパケットは図５に詳しく示すように、１７、９又は１４バイトのパケットヘッダと、プライベートヘッダと、図３に示すフォーマットの１ないし２０１５バイトのオーディオ圧縮ＰＣＭデータにより構成されている。圧縮ＰＣＭのプライベートヘッダは、
・１バイトのサブストリームＩＤと、
・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Product Code/European Article Number-International Standard Recording Code）番号、及びＵＰＣ／ＥＡＮ−ＩＳＲＣデータと、
・１バイトのプライベートヘッダ長と、
・２バイトの第１アクセスユニットポインタと、
・４バイトのオーディオデータ情報（ＡＤＩ）と、
・０〜７バイトのスタッフィングバイトとに、
より構成されている。
このように圧縮ＰＣＭのＡパケットのＡＤＩは、４バイトに選定され、通常の非圧縮のＰＣＭのＡパケットのＡＤＩよりも４バイトだけ短くされている。したがってオーディオデータは４バイト分増加させることができる。

次に図６を参照してデコーダ３Ｄ１、３Ｄ２について説明する。図３に示したフォーマットの可変レートビットストリームデータは、デマルチプレクサ２１によりフレームヘッダに基づいて分離される。そして、和信号ｃｈ（Ｌ＋Ｒ）及び差信号ｃｈ（Ｌ−Ｒ）の１フレームの先頭サンプル値はそれぞれ累積演算回路２５ａ、２５ｂに印加され、和信号ｃｈ（Ｌ＋Ｒ）及び差信号ｃｈ（Ｌ−Ｒ）の予測器選択フラグはそれぞれ予測器（２４ａ−１〜２４ａ−ｎ）、（２４ｂ−１〜２４ｂ−ｎ）の各選択信号として印加され、和信号ｃｈ（Ｌ＋Ｒ）及び差信号ｃｈ（Ｌ−Ｒ）のビット数フラグと予測残差データ列はアンパッキング回路２２に印加される。ここで、予測器（２４ａ−１〜２４ａ−ｎ）、（２４ｂ−１〜２４ｂ−ｎ）はそれぞれ、符号化側の予測器（１２ａ−１〜１２ａ−ｎ）、（１２ｂ−１〜１２ｂ−ｎ）と同一の特性であり、予測器選択フラグにより同一特性のも
のが選択される。

アンパッキング回路２２は和信号ｃｈ（Ｌ＋Ｒ）及び差信号ｃｈ（Ｌ−Ｒ）の予測残差データ列をビット数フラグ毎に基づいて分離してそれぞれ加算回路２３ａ、２３ｂに出力する。加算回路２３ａ、２３ｂではそれぞれ、アンパッキング回路２２からの和信号ｃｈ（Ｌ＋Ｒ）及び差信号ｃｈ（Ｌ−Ｒ）の今回の予測残差データと、予測器（２４ａ−１〜２４ａ−ｎ）、（２４ｂ−１〜２４ｂ−ｎ）の内、予測器選択フラグにより選択された各１つにより予測された前回の予測値が加算されて今回の予測値が算出される。この今回の予測値は、図２に示す差分回路１１ａ、１１ｂによりそれぞれ算出された差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）すなわちＤＰＣＭデータであり、予測器（２４ａ−１〜２４ａ−ｎ）、（２４ｂ−１〜２４ｂ−ｎ）と累積演算回路２５ａ、２５ｂに印加される。

累積演算回路２５ａ、２５ｂはそれぞれ、１フレームの先頭サンプル値に対して差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）をサンプル毎に累積加算して和信号ｃｈ（Ｌ＋Ｒ）、差信号ｃｈ（Ｌ−Ｒ）の各ＰＣＭデータを出力する。この和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）は図１に示すように加算回路４ａにより２Ｌ信号が算出されるとともに、減算回路４ｂにより２Ｒ信号が算出される。そして、２Ｌ信号と２Ｒ信号がそれぞれ割り算器５ａ、５ｂにより１／２に割り算され、元のステレオ２チャネル信号Ｌ、Ｒが復元される。

次に図７、図８を参照して第２の実施形態について説明する。上記の実施形態では、和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）の各差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）、すなわちＤＰＣＭデータのみを予測符号化するように構成されているが、この第２の実施形態では和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）すなわちＰＣＭデータ、又はその各差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）すなわちＤＰＣＭデータを選択的に予測符号化するように構成されている。

このため図７に示す符号化装置では、図２に示す構成に対して和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）をそれぞれ予測符号化するための予測回路１５Ａ、１５Ｓとバッファ・選択器１６Ａ、１６Ｓが追加されている。また、選択信号生成器１７はバッファ・選択器１６Ａ、１６Ｓによりそれぞれ選択された和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）と、バッファ・選択器１６Ｄ１、１６Ｄ２によりそれぞれ選択された差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）の各予測残差の最小値に基づいて、
ＰＣＭデータとＤＰＣＭデータのどちらが圧縮率が高いか否かを判断し、高い方のデータを選択する。このとき、そのＰＣＭ／ＤＰＣＭの選択フラグ（予測回路選択フラグ）を追加して多重化する。

ここで、図７に示す和信号（Ｌ＋Ｒ）の予測回路１５Ａと差分Δ（Ｌ＋Ｒ）の予測回路１５Ｄ１が同一の構成であり、また、差信号（Ｌ−Ｒ）の予測回路１５Ｓと差分Δ（Ｌ−Ｒ）の予測回路１５Ｄ２が同一の構成である場合、復号装置では図８に示すようにＰＣＭデータとＤＰＣＭデータの両方の予測回路を設ける必要はなく、１つのデータ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいてセレクタ２６ａ、２６ｂにより、ＤＰＣＭデータの場合には累積演算回路２５ａ、２５ｂの出力を選択し、ＰＣＭデータの場合には加算回路２３ａ、２３ｂの出力を選択する。

第３の実施形態では図９に示すように、原信号Ｌ、Ｒ（ＰＣＭデータ）と、和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）（ＰＣＭデータ）と、その各差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）（ＤＰＣＭデータ）の３グループの１つを選択的に予測符号化するように構成されている。

このため図９に示す符号化装置では、図７に示す構成に対して原信号Ｌ、Ｒをそれぞれ予測符号化するための予測回路１５Ｌ、１５Ｒとバッファ・選択器１６Ｌ、１６Ｒが追加されている。また、選択信号生成器１７はバッファ・選択器１６Ｌ、１６Ｒにより選択された原信号Ｌ、Ｒと、バッファ・選択器１６Ａ、１６Ｓにより選択された和信号（Ｌ＋Ｒ）、差信号（Ｌ−Ｒ）と、バッファ・選択器１６Ｄ１、１６Ｄ２により選択された各差分Δ（Ｌ＋Ｒ）、Δ（Ｌ−Ｒ）の各予測残差の最小値に基づいて圧縮率が高いグループのデータを選択する。このとき、その選択フラグ（予測回路選択フラグ）を追加して多重化する。

また、図９に示す３グループの予測回路が同一の構成である場合、復号装置では図１０に示すように３グループ分の予測回路を設ける必要はなく、１つのグループ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいて、ＤＰＣＭデータの場合には累積演算回路２５ａ、２５ｂの出力を選択し、ＰＣＭデータの場合には加算回路２３ａ、２３ｂの出力を選択してチャネル相関回路Ｂにより原信号Ｌ、Ｒを復元する。そして、更にセレクタ２７ａ、２７ｂにより原信号Ｌ、Ｒのグループの場合には加算回路２３ａ、２３ｂの出力を選択し、他の場合にはチャネル相関回路Ｂの出力を選択する

また、符号化側により予測符号化された可変レートビットストリームデータをネットワークを介して伝送する場合には、符号化側では図１１に示すように伝送用にパケット化し（ステップＳ４１）、次いでパケットヘッダを付与し（ステップＳ４２）、次いでこのパケットをネットワーク上に送り出す（ステップＳ４３）。復号側では図１２に示すようにヘッダを除去し（ステップＳ５１）、次いでデータを復元し（ステップＳ５２）、次いでこのデータをメモリに格納して復号を待つ（ステップＳ５３）。

上記第１の実施の形態は２チャネルの場合について説明したが、２以上のマルチチャネルの場合の第２の実施の形態について以下説明する。図１３は、本発明の第２の実施の形態を示すブロック図である。図１３は、図１の２チャネル用の構成に対して後方の２チャネルＳL、ＳRを加えた４チャネル用として構成され、よって入力側にはチャネル相関回路Ａに加えて、同様な構成のチャネル相関回路Ａ２が設けられている。また、出力側にもチャネル相関回路Ｂに加えて、同様な構成のチャネル相関回路Ｂ２が設けられている。また、ロスレス・エンコーダ２Ｄとロスレス・デコーダ３Ｄはマルチチャネル対応型として構成されている。なお、チャネル相関回路Ａ、Ａ２、Ｂ、Ｂ２は、それぞれＬとＲ、ＳLとＳRを組み合わせの対象としている。なお、ロスレス・エンコーダ２Ｄとロスレス・デコーダ３Ｄにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第１の実施の形態と同様に行われる。

次に、第２の実施の形態の変形例としての第３の実施の形態について、そのブロック図を示す図１４に沿って説明する。図１４は、図１３の４チャネル用の構成に対して更にセンタチャネルＣ及び低音効果チャネルＬFEを加えた合計６チャネル用として構成されている。ただし、センタチャネルＣ、後方の２チャネルＳL、ＳR、及び低周波音効果チャネルＬFEはＬとＲのように相関をとることなく、直接ロスレス・エンコーダ２Ｄに入力され、また直接ロスレス・デコーダ３Ｄから出力される。

次に、第２の実施の形態及び第３の実施の形態の変形例としての第４の実施の形態について、そのブロック図を示す図１５に沿って説明する。図１５に示すチャネル相関回路Ａ−１は加算回路１ａと減算回路１ｂを有する。加算回路１ａはステレオ２ch信号Ｌ、Ｒの和信号（Ｌ＋Ｒ）を算出し、この和信号（Ｌ＋Ｒ）を割り算器５ａにより１／２に割り算してから、ロスレス・エンコーダ２Ｄに出力し、減算回路１ｂは差信号（Ｌ−Ｒ）を算出し、この差信号（Ｌ−Ｒ）を割り算器５ｂにより１／２に割り算してから、ロスレス・エンコーダ２Ｄに出力する。
ロスレス・エンコーダ２Ｄは、１／２（Ｌ＋Ｒ）と１／２（Ｌ−Ｒ）を用いてこれらを多重化して多重化信号２５０を作る。多重化信号２５０はロスレス・デコーダ３Ｄによりデコードされて、元の１／２（Ｌ＋Ｒ）と１／２（Ｌ−Ｒ）が得られ、これらが、チャネル相関回路Ｂ−１を構成する加算回路４ａと減算回路４ｂにそれぞれ与えられ、出力信号としてステレオ２chのＬ信号とＲ信号が得られる。なお、ロスレス・エンコーダ２Ｄとロスレス・デコーダ３Ｄにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第１の実施の形態と同様に行われる。第４の実施の形態からわかるように、第２、第３の実施の形態におけるチャネル相関回路Ａ、Ａ２はＬ＋Ｒ及びＬ−Ｒを演算するものに限らず、１／２（Ｌ＋Ｒ）、１／２（
Ｌ−Ｒ）を演算するものに置き換えることができる。この場合、ロスレス・デコーダ３Ｄ側のチャネル相関回路Ｂ−１では１／２の演算は不要である。

なお、先に図３で説明したフォーマットは１例であって、本発明における信号処理において記録あるいは伝送される信号のフォーマットは、これに限られるものでない。マルチチャネルの場合は、図１３に対応してＬ、Ｒ信号に加えて、後方２チャネルＳL、ＳRも和信号（ＳL＋ＳR）と差信号（ＳL−ＳR）の形で収納される（図１６のａ）。また、同様に図１４に対応してＬ、Ｒ信号は和信号と差信号の形で収納され、これに加えて、センターチャネルＣ、後方２チャネルＳL、ＳR、低周波効果チャネルＬFEは、そのまま、すなわち和信号や差信号の形をとることなく収納される（図１６のｂ）。

図１７は、図１６に示すようなマルチチャネルの信号を図４のＡパックのユーザデータのパケットとするときのフォーマットを示す図である。ビットストリームＢＳ０には、和信号（Ｌ＋Ｒ）と差信号（Ｌ−Ｒ）が収納され、また他のビットストリームＢＳ１には、図１６のａに対応する場合は、和信号（ＳL＋ＳR）と差信号の（ＳL−ＳR）が、一方図１６のｂに対応する場合は、センターチャネルＣ、後方２チャネルＳL、ＳR、低周波効果チャネルＬFEが、そのまま収納される。

図５に示す圧縮ＰＣＭ（ＰＰＣＭ）のオーディオ（Ａ）パケットの図３と異なる態様を図１８に示す。この異なる態様では、圧縮ＰＣＭ（ＰＰＣＭ）のオーディオ（Ａ）パケットにおけるオーディオデータエリアは、図１８に示すように複数のＰＰＣＭアクセスユニットにより構成され、ＰＰＣＭアクセスユニットはＰＰＣＭシンク情報とサブパケットにより構成されている。最初のＰＰＣＭアクセスユニット内のサブパケットは、ディレクトリと、ビットストリームＢＳ０と、ＣＲＣと、ビットストリームＢＳ１と、ＣＲＣとエクストラ情報により構成され、ビットストリームＢＳ０，ＢＳ１はＰＰＣＭブロックのみにより構成されている。２番目以降のＰＰＣＭアクセスユニット内のサブパケットは、ディレクトリを除いてビットストリームＢＳ０と、ＣＲＣと、ビットストリームＢＳ１、ＣＲＣとエクストラ情報により構成され、フレーム先頭のビットストリームＢＳ０及びＢＳ１はリスタートヘッダとＰＰＣＭブロックにより構成されている。フレーム先頭のＰＰＣＭブロックにフレーム先頭サンプル値を配する。

ＰＰＣＭシンク情報（以下、同期情報ともいう）は次の情報を含む。
・１パケット当たりのサンプル数：サンプリング周波数ｆｓに応じて４０、８０又は６０が選択される。
・データレート：ＶＢＲの場合には「０」（サブパケット内のデータが圧縮データであることを示す識別子）
・サンプリング周波数ｆｓ及び量子化ビット数Ｑｂ
・チャネル割り当て情報
ここで、リスタートヘッダはフレーム毎にチャネル相関回路Ａが加算回路と減算回路で構成されることを明記した情報を有している。これらのオーディオデータは図１３と図１４においてデマルチプレクサ２１以下の構成からなるロスレス・デコーダ３Ｄ（図８）により元のマルチチャネルオーディオ信号に復号される。図１８に示したフォーマットの可変レートビットストリームデータは、図１のチャネル相関回路を用いたか、図１５のチャネル相関回路を用いたかを、例えばＰＰＣＭアクセスユニットのリスタートヘッダに格納した識別子（図示せず）で識別するようにしているので、いずれであってもデコーダは確実にデコードできる。なお、フレーム毎のロスレス圧縮を例に説明したが、固定の長さに限らず区間は可変の長さであってもよい。

本発明が適用される音声符号化装置とそれに対応した音声復号装置の第１の実施形態を示すブロック図である。図１のエンコーダを詳しく示すブロック図である。図２のマルチプレクサにより多重化される１フレームのフォーマットを示す説明図である。ＤＶＤのパックのフォーマットを示す説明図である。ＤＶＤのオーディオパックのフォーマットを示す説明図である。図１のデコーダを詳しく示すブロック図である。第２の実施形態のエンコーダを示すブロック図である。第２の実施形態のデコーダを示すブロック図である。第３の実施形態のエンコーダを示すブロック図である。第３の実施形態のデコーダを示すブロック図である。音声伝送方法を示すフローチャートである。音声伝送方法を示すフローチャートである。本発明が適用される音声符号化装置とそれに対応した音声復号装置の第２の実施形態を示すブロック図である。本発明が適用される音声符号化装置とそれに対応した音声復号装置の第３の実施形態を示すブロック図である。本発明が適用される音声符号化装置とそれに対応した音声復号装置の第４の実施形態を示すブロック図である。本発明における信号処理において記録あるいは伝送されるマルチチャネル信号のフォーマットの例を示す図である。マルチチャネルの信号を図４のＡパックのユーザデータのパケットとするときのフォーマットを示す図である。図５に示す圧縮ＰＣＭ（ＰＰＣＭ）のオーディオ（Ａ）パケットの図３と異なる態様を示すフォーマット説明図である。

符号の説明

１ａ、４ａ加算回路（加算手段）
１ｂ、４ｂ減算回路（減算手段）
５ａ、５ｂ割り算器
１１Ｄ１差分演算回路（第１の差分演算手段）
１１Ｄ２差分演算回路（第２の差分演算手段）
１２ａ−１〜１２ａ−ｎ予測器（減算器１３ａ−１〜１３ａ−ｎ、バッファ
・選択器１６Ｄ１と共に第１の予測符号化手段を構成する。）
１２ｂ−１〜１２ｂ−ｎ予測器（減算器１３ｂ−１〜１３ｂ−ｎ、バッファ
・選択器１６Ｄ２と共に第２の予測符号化手段を構成する。）
１３ａ−１〜１３ａ−ｎ，１３ｂ−１〜１３ｂ−ｎ減算器
１６Ｄ１，１６Ｄ２，１６Ａ，１６Ｓ，１６Ｌ，１６Ｒバッファ・選択器
１５Ａ予測回路（バッファ・選択器１６Ａと共に第３の予測符号化手段を構
成する。）
１５Ｓ予測回路（バッファ・選択器１６Ｓと共に第４の予測符号化手段を構
成する。）
１５Ｌ予測回路（バッファ・選択器１６Ｌと共に第５の予測符号化手段を構
成する。）
１５Ｒ予測回路
路（バッファ・選択器１６Ｒと共に第６の予測符号化手段を構成する。）

Claims

３以上のマルチチャネルの音声信号中の少なくとも選択された第１及び第２の2つのチャネルの音声信号をマトリクス演算して互いに相関ある２つの相関チャネルに変換するステップと、
前記ステップにより変換された２つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮ＰＣＭアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮ＰＣＭアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮ＰＣＭアクセスユニット内に少なくとも前記サンプリング周波数を含む同期情報部を格納すると共に前記サブストリームにフレーム毎にリスタートヘッダを設けるステップと、
からなる音声符号化方法。
請求項１記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記ユーザデータから圧縮ＰＣＭアクセスユニットを抽出するステップと、
前記リスタートヘッダを有する前記圧縮ＰＣＭアクセスユニットから前記先頭サンプル値を取り出すと共に、前記各圧縮ＰＣＭアクセスユニットから予測残差および線形予測方法を含むサブフレーム単位の予測符号化データを取り出すステップと、
前記予測残差をビット情報に基づいたビット数で復号し、この復号した予測残差と前記先頭サンプル値と線形予測方法とに基づいて予測値を算出するステップと、
この算出された予測値から元の音声信号を復元するステップと、
前記復元された音声信号を前記同期情報部に含まれるサンプリング周波数及び量子化ビット数に基づいてアナログ音声信号に変換するステップと、
からなる音声復号方法。