WO2002060069A1

WO2002060069A1 - Data processing apparatus

Info

Publication number: WO2002060069A1
Application number: PCT/JP2002/000490
Authority: WO
Inventors: Tetsujiro Kondo; Tsutomu Watanabe
Original assignee: Sony Corporation
Priority date: 2001-01-25
Filing date: 2002-01-24
Publication date: 2002-08-01
Also published as: DE60211854D1; JP2002223167A; EP1355428A4; KR20030062230A; DE60211854T2; KR100847179B1; CN1269314C; JP4507046B2; EP1355428B1; EP1355428A1; CN1457552A

Description

明細書

データ処理装置技術分野

本発明は、データ処理装置に関し、特に、例えば、画質の良い画像や、音質の良い音声等を復号することができるようにするデータ処理装置に関する。

背景技術

本件出願人は、画像の画質や音声の音質を向上させる方法として、クラス分類適応処理を、先に提案している。

クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データを、その性質に基づいてクラス分けし、各クラスごとに適応処理を施すものであり、適応処理は、以下のような手法のものである。

即ち、例えば、いま、画像を対象とすると、適応処理では、例えば、低画質の画像の画素値と、所定のタップ係数との線形結合により、高画質の画像の画素値の予測値を求めることで、低画質の画像が、高画質の画像に変換される。

具体的には、例えば、いま、ある高画質の画像を教師データとするとともに、その高画質の画像を、例えば、 JPEG (Joint Photographic Experts Group)方式や MPEG (Moving Picture Experts Group)方式等によって符号化し、さらに、その符号化データを復号して得られる、画質の低下した復号画像を生徒データとして、教師データである高画質の画素値 yの予測値 E [ y ] を、生徒データである低画質の画素値の幾つか x ₂, ■ · ' の集合と、所定のタップ係数 w w₂, ■ - ■の線形結合により規定される線形 1次結合モデルにより求めることを考える _c この場合、予測値 E [ y ] は、次式で表すことができる。

E L y ] = W ! !+ w₂ 2 + · ■ "

• · · ( 1 ) 式（1 ) を一般化するために、タップ係数 W jの集合でなる行列 W、生徒データ _Xijの集合でなる行列 X、および予測値 E [y の集合でなる行列 Y，を.

1】

で定義すると、次のような観測方程式が成立する,

XW= Y'

(2) ここで、行列 Xの成分 _Xijは、 i件目の生徒データの集合（ i件目の教師データ yiの予測に用いる生徒データの集合）の中の j番目の生徒データを意味し、行列 Wの成分 Wjは、生徒データの集合の中の j番目の生徒データとの積が演算されるタップ係数を表す。また、 yiは、 i件目の教師データを表し、従って、 E

[y _;] は、 i件目の教師データの予測値を表す。なお、式（1) の左辺における yは、行列 Yの成分 yiのサフィックス iを省略したものであり、また、式

(1) の右辺における _{X l}, x , ■ ■ ■ も、行列 Xの成分 _{X ij}のサフィックス i を省略したものである。

式（2) の観測方程式に最小自乗法を適用して、画質の良い画素値 yに近い予測値 E [y ] を求めることを考える。この場合、教師データとなる画素値 yの集合でなる行列 Y、および画素値 yに対する予測値 E [y] の残差 eの集合でなる行列 Eを、

【数 2】

ei yi

E= ， Υ=

Υτ J で.ド∑定義すると、式（2) から、次のような残差方程式が成立する。

Θ XW= Y+E

(3) この場合、元の画素値 yに近い予測値 E [y] を求めるためのタップ係数 _Wj は、自乗誤差

【数 3】

2 を最小にすることで求めることができる。

従って、上述の自乗誤差をタップ係数で微分したものが 0になる場合、即ち、次式を満たすタップ係数 Wjが、画素値 yに近い予測値 E [ y ] を求めるため最適値ということになる。

【数 4】

1.2, .-,J )

(4) そこで、まず、式 (3) を、タップ係数 Wjで微分することにより、次式が成立する。

【数 5】

^9ei =Xii, ^-=Xi ■ 9^ei =XiJ,

3wi 2, (i=1,2,-..，I)

aw2 ， 8wj

(5) 式（4) および（5) より、式（6) が得られる,

【数 6】

(6)

差替え用紙 "(規さらに、式（3) の残差方程式における生徒データ _{X ij}、タップ係数 Wj、教師データ _yi、および残差の関係を考慮すると、式（6) から、次のような正規方程式を得ることができる。

【数 7】

I I T I

(∑ ilXil)Wi+(2XiiXj2)W2+--.+(∑XiiXij)Wj=(∑ i y_i)

i=1 i=1 i=1 i=1 ί I 1 ]

(∑Xi2Xi1)Wi + ( Xi₂Xi2)W2+'''+(∑Xi2XiJ)Wj = (∑Xi₂yi)

i=1 i=1 i=1 i=1 ijyi)

■ · · (7) なお、式（7) に示した正規方程式は、行列（共分散行列) Aおよびべクトル

Vを、

【数 8】

I I

∑XilXi1 ∑XilXi2 i iJ

i=1 i=1

I I

∑Xi2Xi1 ' ∑Xi2Xi2 ∑Xi2XiJ

i=1 i=1

I

∑XiJXi1 ∑XiJXi2 ∑XiJX iJ

i=1 i=1

I

∑XilYi

i=1

X

I

V = ∑Xi2Yi

i=1

I

∑XiJYi

i=1

で定義するとともに、ベクトル Wを、数 1で示したように定義すると、式

AW= V

• · · (8) で表すことができる。

式（7) における各正規方程式は、生徒データおよび教師データ _yiのセットを、ある程度の数だけ用意することで、求めるべきタップ係数 Wjの数 Jと同じ数だけたてることができ、従って、式（8) を、ベタトル Wについて解くことで（但し、式（8) を解くには、式（8) における行列 Aが正則である必要がある）、統計的な予測誤差を最小にするタップ係数（ここでは、自乗誤差を最小にするタップ係数） Wjを求めることができる。なお、式（8) を解くにあたつては、例えば、掃き出し法（Gauss - Jordanの消去法）などを用いることが可能である。

差替え用紙（規則 26) 以上のようにして、統計的な予測誤差を最小にするタップ係数 W jを求めておき、さらに、そのタップ係数 W jを用い、式（1 ) により、高画質の画素値 yに近い予測値 E [ y ] を求めるのが適応処理である。

なお、例えば、教師データとして、符号化する画像と同一画質の画像を用いるとともに、生徒データとして、その教師データを符号化し、さらに復号して得られる復号画像を用いた場合、タップ係数としては、符号化された画像データを、元の画像データに復号するのに、予測誤差が統計的に最小となるものが得られることになる。

また、例えば、教師データとして、符号化する画像よりも高解像度の画像を用いるとともに、生徒データとして、その教師データの解像度を、符号化する画像と同一画質に劣化させ、それを符号化して復号することにより得られる復号画像を用いた場合、タップ係数としては、符号化された画像データを、高解像度の画像データに復号するのに、予測誤差が統計的に最小となるものが得られることになる。

従って、この場合、適応処理によれば、教師データまたは生徒データとなる画像の選択のしたかによつて、復号画像の画質を任意に調整することの可能なタツプ係数を得ることができる。

なお、適応処理は、学習によって、予測誤差が統計的に最小になるタップ係数が用いられる点、およびそのようなタップ係数を用いることにより、符号化される画像には含まれていない高周波数成分が再現されることがある点等において、フィルタによる単なるフィルタリングとは大きく異なる。

以上から、符号化データを復号した復号画像を対象に、クラス分類適応処理を行った場合には、画質を向上させた復号画像を得ることができる。

しかしながら、符号化データを復号した復号画像の画質が、例えば、符号化データを伝送する伝送路の状態や、画像データの符号化時における圧縮率等に起因して大きく劣化している場合には、復号画像だけを用いてクラス分類適応処理を行っても、その画質を十分に改善することが困難なことがあった。発明の開示

本発明は、このような状況に鑑みてなされたものであり、品質が十分に改善されたデータを得ることができるようにするものである。

本発明の第 1のデータ処理装置は、符号化データを復号し、復号データを出力する復号手段と、復号データを符号化し、再符号化データを出力する再符号化手段と、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、復号データと、再符号化データから得られる情報とから生成する予測タップ生成手段と、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値を求める予測手段とを備えることを特徴とする。

本発明の第 1のデータ処理方法は、符号化データを復号し、復号データを出力する復号ステップと、復号データを符号化し、再符号化データを出力する再符号化ステップと、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、復号データと、再符号化データから得られる情報とから生成する予測タップ生成ステップと、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値を求める予測ステップとを備えることを特徴とする。

本発明の第 1のプログラムは、符号化データを復号し、復号データを出力する復号ステップと、復号デタを符号化し、再符号化データを出力する再符号化ステツプと、学習を行うことにより求められたタツプ係数との所定の予測演算を行う予測タップを、復号データと、再符号化データから得られる情報とから生成する予測タップ生成ステップと、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値を求める予測ステップとを備えることを特徴とする。

本発明の第 1の記録媒体は、符号化データを復号し、復号データを出力する復号ステップと、復号データを符号化し、再符号化データを出力する再符号化ステップと、学習を行うことにより求められたタツプ係数との所定の予測演算を行う予測タップを、復号データと、再符号化データから得られる情報とから生成する予測タップ生成ステップと、予測タップとタツプ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値を求める予測ステップとを備えるプログラムが記録されていることを特徴とする。

本発明の第 2のデータ処理装置は、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成手段と、教師データを予測するのに用いる予測タップを、生徒データから生成する予測タップ生成手段と、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習手段とを備えることを特徴とする。

本発明の第 2のデータ処理方法は、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号デ一タを符号化した再符号化デ —タから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成ステップと、教師データを予測するのに用いる予測タップを、生徒データから生成する予測タップ生成ステップと、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習ステップとを備えることを特徴とする。

本発明の第 2のプログラムは、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成ステツプと、教師データを予測するのに用いる予測タップを、生徒データから生成する予測タップ生成ステップと、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習ステップとを備えることを特徴とする。

本発明の第 2の記録媒体は、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成ステップと、教師データを予測するのに用いる予測タップを、生徒データから生成する予測タップ生成ステップと、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、タップ係数を求める学習ステップとを備えるプロダラムが記録されていることを特徴とする。

本発明の第 3のデータ処理装置は、データを符号化した符号化データを復号し、復号データを出力する復号手段と、復号データを符号化し、再符号化データを出力する再符号化手段と、クラス分類に用いるクラスタップを、復号データと、再符号化データから得られる情報とから生成するクラスタップ生成手段と、クラスタップに基づいて、クラス分類を行うクラス分類手段とを備えることを特徴とする。

本発明の第 3のデータ処理方法は、データを符号化した符号化データを復号し、復号データを出力する復号ステップと、復号データを符号化し、再符号化データを出力する再符号化ステップと、クラス分類に用いるクラスタップを、復号デ一タと、再符号化データから得られる情報とから生成するクラスタップ生成ステツプと、クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えることを特徴とする。

本発明の第 3のプログラムは、データを符号化した符号化データを復号し、復号データを出力する復号ステップと、復号データを符号化し、再符号化データを出力する再符号化ステップと、クラス分類に用いるクラスタップを、復号データと、再符号化データから得られる情報とから生成するクラスタツプ生成ステップと、クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えることを特徴とする。

本発明の第 3の記録媒体は、データを符号化した符号化データを復号し、復号データを出力する復号ステップと、復号データを符号化し、再符号化データを出力する再符号化ステップと、クラス分類に用いるクラスタップを、復号データと、再符号化データから得られる情報とから生成するクラスタツプ生成ステップと、クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えるプログラムが記録されていることを特徴とする。

本発明の第 1のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体においては、符号化データが復号され、その結果得られる復号データが符号化されて、再符号化データが出力される。そして、学習を行うことにより求められたタツプ係数との所定の予測演算を行う予測タップが、復号データと、再符号化データから得られる情報とから生成され、予測タップとタツプ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値が求められる。

本発明の第 2のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体においては、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とが、生徒となる生徒データとして生成される。そして、教師データを予測するのに用いる予測タップが、生徒データから生成され、予測タップとタツプ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習が行われ、タップ係数が求められる。

本発明の第 3のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体においては、データを符号化した符号化データが復号され、その結果得られる復号データが符号化されて、再符号化データが出力される。そして、クラス分類に用いるクラスタップが、復号データと、再符号化データから得られる情報とから生成され、そのクラスタップに基づいて、クラス分類が行われる, 図面の簡単な説明

図 1は、本発明を適用したデータ伝送システムの一実施の形態の構成例を示す図である。 .

図 2は、デコーダ 2の構成例を示すプロック図である。

図 3は、クラス分類適応処理回路 2 4の構成例を示すブロック図である。図 4 A〜図 4 Dは、クラス分類部 3 3および 5 9の構成例を示すプロック図である。 ―

図 5は、デコーダ 2の処理を説明するフローチャートである。

図 6は、本発明を適用した学習装置の一実施の形態の構成例を示すプロック図である。

図 7は、学習装置の処理を説明するフローチャートである。

図 8は、エンコーダ 1、符号化部 2 2 , 5 2、および 5 5の第 1の構成例を示すプロック図である。

図 9は、復号部 2 1， 2 3 , 5 4、および 5 6の第 1の構成例を示すプロック図である。

図 1 0は、エンコーダ 1、符号化部 2 2 , 5 2、および 5 5の第 2の構成例を示すブロック図である。

図 1 1は、復号部 2 1 , 2 3 , 5 4、および 5 6の第 2の構成例を示すブロック図である。

図 1 2は、エンコーダ 1、符号化部 2 2 , 5 2、および 5 5の第 3の構成例を示すブロック図である。

図 1 3は、復号部 2 1， 2 3 , 5 4、および 5 6の第 3の構成例を示すブロック図である。

図 1 4は、本発明を適用したコンピュータの一実施の形態の構成例を示すプロック図である。発明を実施するための最良の形態

図 1は、本発明を適用したデータ伝送システムの一実施の形態の構成例を示している。

伝送すべき'データは、エンコーダ 1に供給されるようになっており、ェンコ一ダ 1は、そこに供給されるデータを、例えば、所定の符号化方式にしたがって符号化し、符号化データとする。この符号化データは、例えば、半導体メモリ、光磁気ディスク、磁気ディスク、光ディスク、磁気テープ、相変化ディスクなどでなる記録媒体 3に記録され、あるいは、また、例えば、地上波、衛星回線、 C A T V (Cabl e Te levi sion) 網、インターネット、公衆回線などでなる伝送媒体 4 を介して伝送される。

デコーダ 2は、記録媒体 3または伝送媒体 4を介して提供される符号化データを受信して復号し、その結果得られる復号データを出力する。復号データが、例えば、画像データである場合には、その画像データは、例えば、図示せぬデイスプレイに供給されて表示される。また、符号化データが、例えば、音声データである場合には、その音声データは、例えば、図示せぬスピーカに供給されて出力される。

次に、図 2は、図 1のデコーダ 2の構成例を示している。

符号化データは、復号部 2 1に供給されるようになっており、復号部 2 1は、例えば、エンコーダ 1における符号化方式に対応する復号方式にしたがって、符号化データを復号し、その結果得られる復号データを、符号化部 2 2とクラス分類適応処理回路 2 4に供給する。さらに、復号部 2 1は、符号化データを復号する過程において得られる情報を、付加情報として、クラス分類適応処理回路 2 4 に供給する。

符号化部 2 2は、復号部 2 1から供給される復号データを、例えば、図 1のェンコーダ 1におけるのと同一の符号化方式にしたがって符号化（再符号化）し、再符号化データを得る。この再符号化データは、符号化部 2 2から復号部 2 3に供給される。

復号部 2 3は、例えば、復号部 2 1 と同様にして、符号化部 2 2からの再符号化データを復号し、その結果得られる復号データを、クラス分類適応処理回路 2 4に供給する。さらに、復号部 2 3は、再符号化データを復号する過程において得られる情報を、付加情報として、クラス分類適応処理回路 2 4に供給する。ここで、以下、適宜、最初の復号を行う復号部 2 1が出力する復号データを第 1復号データと、 2番目の復号を行う復号部 2 3が出力する復号データを第 2復号データと、それぞれ記述する。同様に、以下、適宜、最初の復号を行う復号部 2 1が出力する付加情報を第 1付加情報と、 2番目復号を行う復号部 2 3が出力する付加情報を第 2付加情報と、それぞれ記述する。また、以下、適宜、第 1 復号データと第 2復号データをまとめて、単に、復号データとも記述する。同様に、以下、適宜、第 1付加情報と第 2付加情報をまとめて、単に、付加情報とも記述する。

クラス分類適応処理回路 2 4は、復号部 2 1から供給される第 1復号データと第 1付加情報、さらには、復号部 2 3から供給される第 2復号データと第 2付加情報を用いて、クラス分類適応処理を行い、符号化データの最終的な復号結果としての復号データ（以下、，適宜、最終的な復号データという）を出力する。従って、クラス分類適応処理回路 2 4では、符号化データを復号して得られる第 1復号データの他、その復号過程で得られる第 1付加情報、さらには、第 1復号データを再符号化し、その再符号化データを復号した第 2復号データ、および再符号化データを復号する過程で得られる第 2付加情報を用いて、クラス分類適応処理が行われるので、第 1復号データの品質が大きく劣化している場合であつても、最終的な復号データとして、十分に品質が改善されたものを得ることが可能となる。

なお、復号部 2 3の後段には、符号化部 2 2と復号部 2 3のセットと同様のセットを、 1以上設けることができ、これにより、クラス分類適応処理回路 2 4には、第 2復号データを符号化し、その結果得られる符号化データを復号した第 3 復号データや、その復号過程で得られる第 3付加情報を供給して、クラス分類適応処理を行わせることが可能である。

次に、図 3は、図 2のクラス分類適応処理回路 2 4の構成例を示している。第 1復号データ、第 1付加情報、第 2復号データ、および第 2付加情報は、タップ生成部 3 1 と 3 2に供給される。

タップ生成部 3 1は、第 1復号データ、第 1付加情報、第 2復号データ、および第 2付加情報から、後述する予測部 3 5における予測演算に用いられる予測タップとなるものを生成する。即ち、タップ生成部 3 1は、例えば、品質を改善しようとして注目している注目データに対して、時間的または空間的に近い位置にある第 1復号データと第 2復号データを抽出するととともに、その第 1復号デ一タと第 2復号デ一タの復号にそれぞれ用いられた第 1付加情報と第 2付加情報を抽出し、その抽出したデータ（情報）を、予測タップとして、予測部 3 5に供給する。

タップ生成部 3 2は、第 1復号データ、第 1付加情報、第 2復号データ、および第 2付加情報から、後述するクラス分類部 3 3におけるクラス分類に用いられるクラスタップとなるものを生成する。即ち、タップ生成部 3 2は、例えば、注目データについて、タップ生成部 3 1で生成される予測タップと同一構成のクラスタップを生成し、クラス分類部 3 5に供給する。

なお、ここでは、説明を簡単にするために、同一のクラスタップおよび予測タップを構成するようにしたが、クラスタップと予測タップとは、異なる構成とすること、即ち、第 1復号データ、第 1付加情報、第 2復号データ、および第 2付加情報から、異なるデータを抽出して生成することが可能である。

クラス分類部 3 3は、タップ生成部 3 2からのクラスタップに基づき、注目データについてクラス分類を行い、その結果得られるクラスに対応するクラスコードを、係数メモリ 3 4に出力する。

係数メモリ 3 4は、後述する図 6の学習装置において学習処理が行われることにより得られる、クラスごとのタップ係数を記憶しており、クラス分類部 3 3が出力するクラスコードに対応するァドレスに記憶されているタップ係数を、予測部 3 5に出力する。

予測部 3 5は、タップ生成部 3 1が出力する予測タップと、係数メモリ 3 4が出力するタップ係数とを取得し、その予測タップとタップ係数とを用いて、式 ( 1 ) に示した線形予測演算（積和演算）を行い、注目データについて品質を改善したデータ、即ち、注目データを高品質にしたものの予測値を求めて出力する。次に、図 4は、図 3のクラス分類部 3 3の構成例を示している。

クラス分類部 3 3は、例えば、図 4 Aに示すように、 ADRC (Adaptive Dynamic Range Coding)回路 4 1 Aおよび 4 1 B、並びに合成回路 4 1 Cで構成することができる。

この場合、 ADRC回路 4 1 Aと 4 1 Bは、クラスタップを構成する復号データと付加情報をそれぞれ Kビット ADRC処理し、その結果得られる ADRC コードを、合成回路 4 1 Cに出力する。

ここで、 Kビット ADRC処理においては、例えば、クラスタップを構成する情報の最大値 MAXと最小値 MINが検出され、 DR=MAX- MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジ DRに基づいて、クラスタップを構成する情報が Kビットに再量子化される。即ち、クラスタップを構成する各情報から、最小値 MINが減算され、その減算値が DR/2^Kで除算（量子化）される。そして、以上のようにして得られる、クラスタップを構成する各情報の Kビットの値を、所定の順番で並べたビット列が、 ADRCコードとして出力される。

合成回路 4 1 Cは、 ADRC回路 4 1 Aが出力する復号データの ADRC コードと、 ADRC回路 4 1 Bが出力する付加情報の ADRC コードとを、 1つのコードに合成し、クラスコードとして出力する。

ここで、後述するように、クラスタップを構成する付加情報は、 1種類とは限らないが、付加情報が複数種類存在する場合には、 ADRC回路 4 1 Bでは、その複数種類の付加情報それぞれについて、 ADRC処理が行われ、複数の ADRCコードが出力される。そして、合成回路 4 1 Cでは、その複数の ADRCコードから、 1 つのコードが生成される。後述する図 4 B乃至図 4 Dそれぞれに示すクラス分類部 3 3においても同様である。

次に、クラス分類部 3 3は、例えば、図 4 Bに示すように、演算器 42 Aおよび 42 Bと、図 4八に示した 01«：回路4 1 Aおよび 4 1 B、並びに合成回路 4 1 Cとから構成することもできる。

即ち、この場合、演算器 4 2Aは、クラスタップを構成する第 1復号データと、その第 1復号データに対応する第 2復号データとの差分を演算し、その差分値を、 ADRC回路 4 1 Aに供給する。演算器 4 2 Bは、クラスタップを構成する第 1付加情報と、その第 1付加情報に対応する第.2付加情報との差分を演算し、その差分値を、 ADRC回路 4 1 Bに出力する。

ここで、第 1復号データに対応する第 2復号データとは、例えば、復号データが画像である場合には、第 1復号データとして得られた復号画素と同一の、第 2 復号データとして得られた復号画素を意味する。即ち、あるフレーム f における位置（X , y) における第 i m号データと第 2復号データとしての復号画素を、それぞれ、 p i ( f , x， y ) と p 2 ( f ， x, y) と表すこととすると、第 1 復号データ p i ( f , χ , _y ) に対応する第 2復号データとは、 p 2 ( f , x , y) を意味する。

また、第 1付加情報に対応する第 2付加情報とは、例えば、復号データが後述する CELP(Code Excited Liner Prediction coding)方式で復号された音声データであり、かつ、付加情報が、その復号の過程で得られる線形予測係数である場合には、第 1付加情報として得られた線形予測係数と同一次数の、第 2付加情報として得られた線形予測係数を意味する。即ち、あるフレーム（またはサブフレーム） f における第 1復号データと第 2復号データとしての音声の復号に用いられる第 p次の線形予測係数を、それぞれ、 a l ( f , p) とひ 2 ( f , ρ) と表すこととすると、第 1付加情報 a l ( f , p) に対応する第 2付加情報とは、 2 ( f , p) を意味する。さらに、例えば、復号データが、後述する JPEG方式で復号された画像データであり、かつ付加情報が、その復号の過程で得られる D CT係数である場合には、第 1付加情報に対応する第 2付加情報とは、第 1付加情報として得られた DCT係数と同一空間周波数成分の、第 2付加情報として得られた DCT係数を意味する。即ち、あるフレーム f の、ある 8 X 8のブロックにおける位置（X , y ) の第 1付加情報と第 2付加情報としての DCT係数を、それぞれ、 d l ( f ， b, x, y ) と d 2 ( f , b， x， y) と表すこととすると、第 1付加情報 d l ( f ， b, x, y) に対応する第 2付加情報とは、 d 2 ( f , b, x, y ) を意味する。

以下、第 1復号データと第 2復号データの差分値、および第 1付加情報と第 2 付加情報との差分値について、図 4 Aにおける場合と同様の処理が行われ、クラスコードが求められる。

さらに、クラス分類回路 3 3は、例えば、図 4 Cに示すように構成することも可能である。

この場合も、図 4 Bにおける場合と同様に、演算器 42 Aにおいて、第 1復号データと第 2復号データとの差分値が求められるとともに、演算器 42 Bにおいて、第 1付加情報と第 2付加情報との差分値が求められる。

第 1復号データと第 2復号データとの差分値は、演算器 42 Aから極性判別回路 43 Cに供給され、極性判別回路 43 Cは、第 1復号データと第 2復号データとの差分値の極性（符号）を判別し、その極性に応じて、 0または 1を、合成回路 43 Eに出力する。

また、第 1付加情報と第 2付加情報との差分値は、演算器 42Bから極性判別回路 4 3Dに供給され、極性判別回路 43 Dは、第 1付加情報と第 2付加情報との差分値の極性を判別し、やはり、その極性に応じて、 0または 1を、合成回路 43 Eに出力する。

合成回路 43 Eは、極性判別回路 43 Cと 44 Cそれぞれからの、極性に対応する 0または 1の系列を、 1つのコードに合成し、クラスコードとして出力する。さらに、クラス分類部 3 3は、図 4Dに示すように、遅延回路 44Aおよび 4 4 B、並びに演算器 44 Cおよび 44 Dと、図 4 Aに示した ADRC回路 4 1 Aおよび 4 1 B、並びに合成回路 4 1 Cとから構成することも可能である。

この場合、遅延回路 4 4 Aは、クラスタップを構成する復号データを、例えば、

1サンプル分（1クラスタップ分）の時間だけ遅延して、演算器 4 4 Cに供給する。演算器 4 4 Cは、クラスタップを構成する復号データと、遅延回路 4 4 Aからの、その復号データを遅延したものとの差分を演算し、その差分値を、 ADRC 回路 4 1 Aに供給する。

一方、遅延回路 4 4 Bは、クラスタップを構成する付加情報を、例えば、 1サンプル分の時間だけ遅延して、演算器 4 4 Dに供給する。演算器 4 4 Dは、クラスタップを構成する付加情報と、遅延回路 4 4 Bからの、その付加情報を遅延したものとの差分を演算し、その差分値を、 ADRC回路 4 1 Bに供給する。

以下、 ADRC回路 4 1 Aおよび 4 1 B、並びに合成回路 4 1 Cでは、上述の差分値を対象に、図 4 Aにおける場合と同様の処理が行われ、クラスコードが出力される。

なお、クラス分類部 3 3は、その他、例えば、図 4 A乃至図 4 Dに示した回路のうちの任意の 2以上の出力を 1つのコードに合成して出力する回路によって構成することも可能である。

さらに、クラス分類部 3 3は、図 4に示した回路以外の回路によって構成することも可能である。即ち、例えぱ、符号化データが、 JPEGや MPEG符号化されたもののような、その復号過程において、直交変換係数の 1つである DCT (Discret e Cosine Transform)係数が得られるものであり、クラスタップを構成する付加情報に、そのような DCT係数が含まれる場合には、クラス分類部 3 3は、 8 X 8 のブロックの DCT係数から得られる画像のァクティビティに基づくクラスコードを出力したり、注目している画素のプロック内の位置に基づくクラスコードを出力したりするように構成することが可能である。また、クラス分類部 3 3は、例えば、クラスタップを構成する復号データや付加情報のベクトル量子化結果を、クラスコードとして出力するように構成すること等も可能である。

次に、図 5のフローチャートを参照して、図 2のデコーダ 2の処理（復号処理）について説明する。

復号部 2 1は、エンコーダ 1における符号化方式に対応する復号方式にしたがつて、符号化データを復号し、その結果得られる第 1復号データを、符号化部 2 2とクラス分類適応処理回路 2 4に供給する。さらに、復号部 2 1は、符号化デ一タを復号する過程において得られる情報を、第 1付加情報として、クラス分類適応処理回路 2 4に供給する。符号化部 2 2は、復号部 2 1から供給される符号化データを再符号化し、その結果得られる再符号化データを、復号部 2 3に供給する。復号部 2 3は、復号部 2 1と同様にして、符号化部 2 2からの再符号化デ一タを復号し、その結果得られる第 2復号データを、クラス分類適応処理回路 2 4に供給する。さらに、復号部 2 3は、再符号化データを復号する過程において得られる情報を、第 2付加情報として、クラス分類適応処理回路 2 4に供給する。クラス分類適応処理回路 2 4 (図 3 ) では、ステップ S 1において、タップ生成部 3 1が、そこに供給される第 1復号データを、順次、注目データとし、例えば、その注目データに対して、時間的または空間的に近い位置にある第 1復号データ、注目データに対応する第 2復号データに対して、時間的または空間的に近い位置にある第 2復号データ、注目データの復号過程で得られた第 1付加情報、注目デーダに対応する第 2復号データの復号過程で得られた第 2付加情報から、注目データについての予測タップを生成し、予測部 3 5に出力する。さらに、ステツプ S 1では、タップ生成部 3 2が、例えば、タップ生成部 3 1 と同様にして、注目データについてのクラスタップを生成し、クラス分類部 3 3に出力する。そして、ステップ S 2に進み、クラス分類部 3 3は、タップ生成部 3 2から供給されるクラスタップに基づいて、クラス分類を行い、その結果得られるクラスコードを、係数メモリ 3 4に供給して、ステップ S 3に進む。

ステップ S 3では、係数メモリ 3 4は、クラス分類部 3 3から供給されるクラスコードに対応するアドレスから、タップ係数を読み出し、予測部 3 5に供給する。

そして、ステップ S 4に進み、予測部 3 5は、係数メモリ 3 4が出力するタツプ係数を取得し、そのタップ係数と、タップ生成部 3 1からの予測タップとを用いて、式（1 ) に示した積和演算を行い、注目データを高品質にしたデータ（の予測値）を得て、ステップ S 5に進む。

ステップ S 5では、まだ、注目データとして処理すべき第 1復号データがあるかどうかが判定され、あると判定された場合、ステップ S 1に戻り、次に注目データとすべき第 1復号データを、新たに注目データとして、以下、同様の処理を繰り返す。また、ステップ S 5において、注目データとして処理すべきデータがないと判定された場合、処理を終了する。

次に、図 6は、図 3の係数メモリ 3 4に記憶させるタップ係数の学習処理を行う学習装置の一実施の形態の構成例を示している。

学習装置には、図 1のエンコーダ 1において符号化の対象とされるデータの、例えば、高品質のものが、学習用データとして供給される。この学習用データは、学習の教師となる教師データとして、生徒データ生成部 5 1と正規方程式加算回路 6 0に供給される。

生徒データ生成部 5 1は、そこに供給される教師データから、学習の生徒となる生徒データを生成する。

即ち、生徒データ生成部 5 1は、符号化部 5 2、媒体特性反映部 5 3、復号部 5 4、符号化部 5 5、および復号部 5 6から構成される。

符号化部 5 2は、教師データを、図 1のエンコーダ 1と同様にして符号化し、その結果得られる符号化データを、媒体特性反映部 5 3に供給する。媒体特性反映部 5 3は、図 1の記録媒体 3または伝送媒体 4を介することによって信号に付加される雑音等を、符号化部 5 2からの符号化データに付加し（反映し）、復号部 5 4に供給する。

復号部 5 4、符号化部 5 5、復号部 5 6は、図 2に示したデコーダ 2の復号部 2 1、符号化部 2 2、復号部 2 3とそれぞれ同様に構成される。従って、復号部 5 4、符号化部 5 5、復号部 5 6では、媒体特性反映部 5 3が出力する符号化データが、図 2の復号部 2 1、符号化部 2 2、復号部 2 3それぞれにおける場合と 2レ同様に処理され、その結果、復号部 5 4は、第 1復号データおよび第 1付加情報を、復号部 5 6は、第 2復号データおよび第 2付加情報を、それぞれ、生徒データとして出力する。この生徒データとしての第 1復号データおよび第 1付加情報、並びに第 2復号デ一タおよび第 2付加情報は、タップ生成部 5 7および 5 8に供給される。

なお、図 2のデコダ 2は、上述したように、復号部 2 3の後段に、符号化部 2 2と復号部 2 3のセットと同様のセットを、 1以上設けて構成することができるが、この場合、図 6の学習装置の生徒データ生成部 5 1は、デコーダ 2と同様に、復号部 5 4の後段に、符号化部 5 5と復号部 5 6のセットと同様のセットを、 1以上設けて構成する必要がある。

タップ生成部 5 7は、図 3のクラス分類適応処理回路 2 4のタップ生成部 3 1 と同様に構成され、そこに供給される生徒データとしての第 1復号データおよび第 1付加情報、並びに第 2復号データおよび第 2付加情報から、タップ生成部 3 1における場合と同様にして、予測タップを生成し、正規方程式加算回路 6 0に供給する。

タップ生成部 5 8は、図 3のクラス分類適応処理回路 2 4のタップ生成部 3 2 と同様に構成され、そこに供給される生徒データとしての第 1復号データおよび第 1付加情報、並びに第 2復号データおよび第 2付加情報から、タップ生成部 3 2における場合と同様にして、クラスタップを生成し、クラス分類部 5 9に供給する。

クラス分類部 5 9は、タップ生成部 5 8から供給されるクラスタップに基づいて、図 3のクラス分類適応処理回路 2 4のクラス分類部 3 3における場合と同様のクラス分類を行い、その結果得られるクラスコードを、正規方程式加算回路 6 0に供給する。

正規方程式加算回路 6 0は、そこに供給される教師データを、順次、注目教師データとして、タップ生成部 5 7から供給される、注目教師データについて生成された予測タップと、注目教師データを対象とした足し込みを、クラス分類部 5 9から供給されるクラスコードが表すクラスごとに行う。

即ち、正規方程式加算回路 6 0は、クラス分類部 5 9から供給されるクラスコードに対応するクラスごとに、予測タップ（生徒データ）を用い、式（8 ) の行列 Aにおける各コンポーネントとなっている、生徒データどうしの乗算（x _in X i J と、サメーシヨン（∑) に相当する演算を行う。

さらに、正規方程式加算回路 6 0は、やはり、クラス分類部 5 9から供給されるクラスコードに対応するクラスごとに、予測タップ（生徒データ）および注目教師データを用い、式（8 ) のベクトル Vにおける各コンポーネントとなっている、生徒データと注目教師データの乗算（x _in y i) と、サメーシヨン（∑) に相当する演算を行う。

正規方程式加算回路 6 0は、以上の足し込みを、そこに供給される教師データすべてを注目教師データとして行い、これにより、各クラスについて、式（8 ) に示した正規方程式をたてる。

タップ係数決定回路 6 1は、正規方程式加算回路 6 0においてクラスごとに生成された正規方程式を解くことにより、クラスごとに、タップ係数を求め、係数メモリ 6 2の、各クラスに対応するァドレスに供給する。

なお、学習用データの量や内容等によっては、正規方程式加算回路 6 0において、タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じる場合があり得るが、タップ係数決定回路 6 1は、そのようなクラスについては、例えば、デフォルトのタップ係数を出力する。

係数メモリ 6 2は、タップ係数決定回路 6 1から供給されるクラスごとのタップ係数を記憶する。

次に、図 7のフローチャートを参照して、図 6の学習装置の処理（学習処理）について説明する。

学習装置には、学習用データが供給され、この学習用データは、教師データとして、生徒データ生成部 5 1と正規方程式加算回路 6 0に供給される。そして、ステップ S 1 1において、生徒データ生成部 5 1は、教師データから、生徒データを生成する。

即ち、ステップ S 1 1では、符号化部 5 2が、教師データを、図 1のェンコ一ダ 1と同様に符号化し、その結果得られる符号化データを、媒体特性反映部 5 3 を介して、復号部 5 4に供給する。復号部 5 4は、そこに供給される符号化データを復号し、その結果得られる第 1復号データを、符号化部 5 5に供給するとともに、生徒データとして、タップ生成部 5 7および 5 8に供給する。また、復号部 5 4は、符号化データを第 1復号データに復号する過程において得られる第 1 付加情報も、生徒データとして、タップ生成部 5 7および 5 8に供給する。

さらに、ステップ S 1 1では、符号化部 5 5が、復号部 5 4からの第 1復号デ一タを再符号化し、その結果得られる再符号化データを、復号部 5 6に供給する。復号部 5 6は、符号化部 5 5からの再符号化データを復号し、その結果得られる第 2復号データと、再符号化データを第 2復号データに復号する過程において得られる第 2付加情報を、生徒データとして、タップ生成部 5 7および 5 8に供給する。

その後、正規方程式加算回路 6 0において、そこに供給される教師データが注目教師データとされ、ステップ S 1 2に進み、タップ生成部 5 7と 5 8力そこに供給される生徒データから、注目教師データについて、予測タップとクラスタップを、それぞれ生成する。タップ生成部 5 7で生成された予測タップは、正規方程式加算回路 6 1に供給され、タップ生成部 5 8で生成されたクラスタップは、クラス分類部 5 9に供給される。

そして、ステップ S 1 3に進み、クラス分類部 5 9が、タップ生成部 5 8からのクラスタップに基づいて、クラス分類を行い、その結果得られるクラスコードを、正規方程式加算回路 6 0に供給して、ステップ S 1 4に進む。

ステップ S 1 4では、正規方程式加算回路 6 0は、クラス分類部 5 9から供給されるクラスコードが表すクラスについて、そこに供給される注目教師データと、タップ生成部 5 7から供給される予測タップを構成する生徒データを対象とした- 式（8 ) の行列 Aとベクトル Vの、上述したような足し込みを行い、ステップ S 1 5に進む。

ステップ S 1 5では、まだ、注目教師データとして処理すべき教師データがあるかどうかが判定され、あると判定された場合、ステップ S 1 1に戻り、例えば、次に供給される教師データを新たに注目教師データとして、以下、同様の処理が繰り返される。

また、ステップ S 1 5において、注目教師データとして処理すべき教師データがないと判定された場合、即ち、例えば、正規方程式加算回路 6 0において、各クラスについて、正規方程式が得られた場合、ステップ S 1 6に進み、タップ係数決定回路 6 1は、各クラスごとに生成された正規方程式を解くことにより、各クラスごとのタップ係数を求め、係数メモリ 6 2の、各クラスに対応するァドレスに供給して記憶させ、処理を終了する。

以上のようにして、係数メモリ 6 2に記憶された各クラスごとのタップ係数が、図 3の係数メモリ 3 4に記憶されている。

従って、図 3の係数メモリ 3 4に記憶されたタップ係数は、線形予測演算を行うことにより得られる、学習用データと同様の品質のデータの予測値について、その予測誤差（ここでは、自乗誤差）力統計的に最小になるように学習を行うことにより求められたものであるから、図 3の予測部 3 5が出力する最終的な復号データは、学習用データと同様の品質のものとなる。

次に、図 8は、図 1のデータ伝送システムが、音声信号（音声データ）を CEL P (例えば、 VSELP (Vector Sum Excited Liner Prediction) , PSI-CELP (Pitch Sy nchronous Innovation CELP) , CS-ACELP (Conjugate Structure Algebraic CELP) 等の各種の CELPを含む）方式で符号化して伝送する場合の、図 1のエンコーダ 1の構成例を示している。なお、上述したことから、図 1のエンコーダ 1が図 8 に示すように構成される場合は、図 2の符号化部 2 2並びに図 6の符号化部 5 2 および 5 5も、図 8に示したのと同様に構成される。

符号化の対象となる音声信号（人の発話の他、曲等の信号も含む）は、例えば、アナログの音声信号を、 8 k H z等のサンプリング周波数でサンプリングすることにより、ディジタルの音声信号に A/D変換し、さらに、所定のビット数で量子化を行って得られたもので、演算器 7 1 と L P C (Liner Prediction Coeffici ent)分析部 7 2に供給される。

？〇分析部7 2は、そこに供給される符号化対象の音声信号を、例えば、 1 6 0サンプル分の長さのフレームごとに L P C分析し、 P次の線形予測係数 0^，ひ ₂, · · · , ひ pを求める。そして、？〇分析部7 2は、この P次の線形予測係数ひ _p (p = 1 , 2, · · · ， P) を要素とするベクトルを、音声の特徴べクトルとして、べクトル量子化部 7 3に供給する。

べクトル量子化部 7 3は、線形予測係数を要素とするコードべクトルとコードとを対応付けたコードブックを記憶しており、そのコードブックに基づいて、 L P C分析部 7 2からの特徴べクトル αをべクトル量子化し、そのべクトル量子化の結果得られるコード（以下、適宜、 Αコード（A— code)という）を、コード決定部 8 3に供給する。

さらに、ベクトル量子化部 7 3は、 Aコードに対応するコードベクトル α ' を構成する要素となっている線形予測係数 α ，ひ ₂' ， . ■ · , α_Ρ ' を、音声合成フィルタ 7 4に供給する。

音声合成フィルタ 74は、例えば、 I I R(Infinite Impulse Response)型のディジタルフィルタで、ベクトル量子化部 7 3からの線形予測係数 α_ρ' (ρ = 1 , 2， ■ · · ， Ρ) を I I Rフィルタのタップ係数とするとともに、演算器 8 2から供給される残差信号 eを入力信号として、音声合成を行う。

即ち、 L P C分析部 7 2で行われる L P C分析は、現在時刻 nの音声信号（のサンプル値） s _n、およびこれに隣接する過去の P個のサンプル値 3 ^， s _n__2> . · · , s _n-Pに、式

a p s _n__P— e_n

· · · (9) で示す線形 1次結合が成立すると仮定し、現在時刻 nのサンプル値 s _nの予測値 (線形予測値） s_n' を、過去の P個の標本値 s_n—い s_n— ₂， · · · ， s_n-_pを用いて、式

s _η' =一 ( CK _χ s α 2 s _η_,+ · · · + α ρ s _Π__Ρ)

• · · ( 1 0) によって線形予測したときに、実際のサンプル値 s_nと線形予測値 s_n' との間の自乗誤差を最小にする線形予測係数ひ _pを求めるものである。

ここで、式（9) において、 {e„} ( · ■ ■ ， e_n e_n, e_n+1, ■ ■ · ) は、平均値が 0で、分散が所定値 σ ²の互いに無相関な確率変数である。

式（9) から、サンプル値 s _nは、式

s _n = e_n— o; _L s + « 2 s _n―。 + ■ · · + a p s _n__P)

· · · ( 1 1) で表すことができ、これを、 Z変換すると、次式が成立する。

S = E/ ( 1 + <¾! ζ^_1+ α₂ζ"^ζ+ - ■ · + α_Ρζ"^ρ)

• · · (1 2) 伹し、式（1 2) において、 Sと Εは、式（1 1 ) における s_nと 6„の2変換を. それぞれ表す。

ここで、式（9) および（1 0) から、 e_nは、式

e _n= s _n— s _n

• · · ( 1 3) で表すことができ、実際サンプル値 s_nと線形予測値 s_n' との間の残差信号と呼ばれる。

従って、式（1 2) から、線形予測係数 a_pを I I Rフィルタのタップ係数とするとともに、残差信号 e_nを I I Rフィルタの入力信号とすることにより、音声信号 s _nを求めることができる。

そこで、音声合成フィルタ 74は、上述したように、ベクトル量子化部 7 3からの線形予測係数 α _ρ' をタップ係数とするとともに、演算器 8 2から供給される残差信号 eを入力信号として、式（1 2) を演算し、音声信号（合成音信号） s sを求める。なお、音声合成フィルタ 7 4では、 L P C分析部 7 2による L P C分析の結果得られる線形予測係数ひ pではなく、そのべクトル量子化の結果得られるコードに対応するコードベクトルとしての線形予測係数 α _ρ ' が用いられるため、音声合成フィルタ 7 4が出力する合成音信号は、 LPC分析前の音声信号とは、基本的に同一にはならない。

音声合成フィルタ 7 4が出力する合成音信号 s sは、演算器 7 1に供給される。演算器 7 1は、音声合成フィルタ 7 4からの合成音信号 _S sから、元の音声信号 sを減算し（合成音信号 s sの各サンプルから、そのサンプルに対応する元の音声信号 sのサンプルを減算し）、その減算値を、自乗誤差演算部 7 5に供給する。自乗誤差演算部 7 5は、演算器 7 1からの減算値の自乗和（例えば、 L P C分析部 7 2が L P C分析を行うフレーム単位での自乗和）を演算し、その結果得られる自乗誤差を、自乗誤差最小判定部 7 6に供給する。

自乗誤差最小判定部 7 6は、自乗誤差演算部 7 5が出力する自乗誤差に対応付けて、ラグを表すコードとしての Lコード（L_code)、ゲインを表すコードとしての Gコード（G_code)、および符号語（励起コードブック）を表すコードとしての Iコード（I一 code)を記憶しており、自乗誤差演算部 7 5が出力する自乗誤差に対応する Lコード、 Gコード、および Lコードを出力する。 Lコードは、適応コードブック記憶部 7 7に、 Gコードは、ゲイン復号器 7 8に、 Iコードは、励起コードブック記憶部 7 9に、それぞれ供給される。さらに、 Lコード、 Gコード、および Iコードは、コード決定部 8 3にも供給される。

適応コードブック記憶部 7 7は、例えば 7ビットの Lコードと、所定の遅延時間（ラグ）とを対応付けた適応コードブックを記憶しており、演算器 8 2から供給される残差信号 eを、自乗誤差最小判定部 7 6から供給される Lコードに対応付けられた遅延時間だけ遅延して、演算器 8 0に出力する。

ここで、適応コードブック記憶部 7 7は、残差信号 eを、 Lコードに対応する時間だけ遅延して出力することから、その出力信号は、その遅延時間を周期とする周期信号に近い信号となる。この信号は、線形予測係数を用いた音声合成において、主として、有声音の合成音を生成するための駆動信号となる。

ゲイン復号器 7 8は、 Gコードと、所定のゲイン ]3および γとを対応付けたテ一プルを記憶しており、自乗誤差最小判定部 7 6から供給される Gコードに対応付けられたゲイン ]3および γを出力する。ゲインと yは、演算器 8 0と 8 1に、それぞれ供給される。ここで、ゲイン /3は、長期フィルタ状態出力ゲインと呼ばれるものであり、また、ゲイン γは、励起コードブックゲインと呼ばれるものである。

励起コードブック記憶部 7 9は、例えば 9ビットの I コードと、所定の励起信号とを対応付けた励起コードブックを記憶しており、自乗誤差最小判定部 7 6から供給される I コードに対応付けられた励起信号を、演算器 8 1に出力する。ここで、励起コードブックに記憶されている励起信号は、例えば、ホワイトノィズ等に近い信号であり、線形予測係数を用いた音声合成において、主として、無声音の合成音を生成するための駆動信号となる。

演算器 8 0は、適応コードブック記憶部 7 7の出力信号と、ゲイン復号器 7 8 が出力するゲイン /3とを乗算し、その乗算値 1 を、演算器 8 2に供給する。演算器 8 1は、励起コードブック記憶部 7 9の出力信号と、ゲイン復号器 7 8が出力するゲイン yとを乗算し、その乗算値 nを、演算器 8 2に供給する。演算器 8 2 は、演算器 8 0からの乗算値 1 と、演算器 8 1からの乗算値 nとを加算し、その加算値を、残差信号 eとして、音声合成フィルタ 7 4と適応コードプック記憶部 7 7に供給する。

音声合成フィルタ 7 4では、以上のようにして、演算器 8 2から供給される残差信号 eが、ベクトル量子化部 7 3から供給される線形予測係数 _{α ρ}' をタップ係数とする I I Rフィルタでフィルタリングされ、その結果得られる合成音信号 1) 演算器 7 1に供給される。そして、演算器 7 1および自乗誤差演算部 7 5において、上述の場合と同様の処理が行われ、その結果得られる自乗誤差が、自乗誤差最小判定部 7 6に供給される。

自乗誤差最小判定部 7 6は、自乗誤差演算部 7 5からの自乗誤差が最小（極小）になったかどうかを判定する。そして、自乗誤差最小判定部 7 6は、自乗誤差が最小になっていないと判定した場合、上述のように、その自乗誤差に対応する Lコード、 Gコード、および Lコードを出力し、以下、同様の処理が繰り返される。

一方、自乗誤差最小判定部 7 6は、自乗誤差が最小になったと判定した場合、確定信号を、コード決定部 8 3に出力する。コード決定部 8 3は、ベクトル量子化部 7 3から供給される Aコードをラツチするとともに、自乗誤差最小判定部 7 6から供給される Lコード、 Gコード、および I コードを順次ラッチするようになっており、自乗誤差最小判定部 7 6から確定信号を受信すると、そのときラッチしている Aコード、 Lコード、 Gコード、および I コードを、チャネルェンコーダ 8 4に供給する。チャネルエンコーダ 8 4は、コード決定部 8 3からの Aコード、 Lコード、 Gコード、および I コードを多重化し、その多重化結果であるコードデータを、符号化データとして出力する。

なお、以下では、説明を簡単にするため、 Aコード、 Lコード、 Gコード、および I コードは、フレームごとに求められるものとする。但し、例えば、 1フレームを、 4つのサブフレームに分割し、 Lコード、 Gコード、および I コードは、サブフレームごとに求めるようにすること等が可能である。

ここで、図 8 (後述する図 9においても同様）では、各変数に、 [k]が付され、配列変数とされている。この kは、フレーム数を表すが、明細書中では、その記述は、適宜省略する。

次に、図 9は、図 1のエンコーダ 1が図 8に示したように構成される場合の、図 2の復号部 2 1の構成例を示している。なお、上述したことから、図 2の復号部 2 1が図 9に示すように構成される場合は、図 2の復号部 2 3、並びに図 6の復号部 5 4および 5 6も、図 9に示したのと同様に構成される。

図 8のエンコーダ 1が出力する符号化データとしてのコードデータは、チヤネルデコーダ 9 1で受信される。チャネルデコーダ 9 1は、コードデータから、 L コード、 Gコード、 Iコード、 Aコードを分離し、それぞれを、適応コードブック記憶部 9 2、ゲイン復号器 9 3、励起コードブック記憶部 9 4、フィルタ係数復号器 9 5に供給する。

適応コードブック記憶部 9 2、ゲイン復号器 9 3、励起コードブック記憶部 9

4、演算器 9 6乃至 9 8は、図 8の適応コードブック記憶部 7 7、ゲイン復号器 7 8、励起コードブック記憶部 7 9、演算器 8 0乃至 8 2とそれぞれ同様に構成されるもので、図 8で説明した場合と同様の処理が行われることにより、 L コード、 Gコード、および I コードが、残差信号 eに復号される。この残差信号 eは、音声合成フィルタ 9 9に対して、入力信号として与えられるとともに、適応コードブック記憶部 9 2に供給される。

フィルタ係数復号器 9 5は、図 8のべクトル量子化部 7 3が記憶しているのと同一のコードプックを記憶しており、 Aコードを、線形予測係数ひ p ' に復号し、音声合成フィルタ 9 9に供給する。

音声合成フィルタ 9 9は、図 8の音声合成フィルタ 7 4と同様に構成されており、フィルタ係数復号器 9 5からの線形予測係数ひをタップ係数とするとともに、演算器 9 8から供給される残差信号 eを入力信号として、式（1 2 ) を演算し、これにより、図 8の自乗誤差最小判定部 7 6において自乗誤差が最小と判定されたときの合成音信号を生成する。この合成音信号は、符号化データの復号結果（復号データ）として出力される。

一方、付加情報出力部 1 0 0は、上述のように、符号化データを、復号データとしての合成音信号に復号する過程において得られる情報を取得し、その情報のうちの一部または全部を、付加情報として出力する。

即ち、付加情報出力部 1 0 0には、チャネルデコーダ 9 1が出力する Lコード、

Gコード、 Iコード、および Aコードや、ゲイン復号器 9 3が出力するゲイン |3 および" y、フィルタ係数復号器 9 5が出力する線形予測係数 _p、演算器 9 6が出力する演算結果 1、演算器 9 7が出力する演算結果 γ、演算器 9 8が出力する残差信号 e等が供給されるようになっており、付加情報出力部 1 0 0は、これらの情報のうちの一部または全部を、付加情報として出力する。次に、図 1 0は、図 1のデータ伝送システムが、静止画の画像データを JPEG 方式で符号化して伝送する場合の、図 1のエンコーダ 1の構成例を示している。なお、図 1のエンコーダ 1が図 1 0に示すように構成される場合は、図 2の符号化部 2 2並びに図 6の符号化部 5 2および 5 5も、図 1 0に示したのと同様に構成される。

符号化対象の画像データは、ブロック化回路 1 1 1に入力され、ブロック化回路 1 1 1は、そこに入力される画像データを、 8 X 8画素の 64画素でなるブロックに分割する。ブロック化回路 1 1 1で得られる各ブロックは、 DCT回路 1 1 2に供給される。 0〇丁回路1 1 2は、ブロック化回路 1 1 1からのブロックに対して、 DCT (離散コサイン変換）処理を施し、 1個の DC (Direct Curren t)成分と、水平方向および垂直方向についての 6 3個の周波数成分（AC(Alter nating Current)成分）の、合計 64個の D C T係数に変換する。各ブロックごとの 64個の DC T係数は、 0〇丁回路1 1 2から量子化回路 1 1 3に供給される。

量子化回路 1 1 3は、所定の量子化テーブルにしたがって、 DCT回路 1 1 2 からの DC T係数を量子化し、その量子化結果（以下、適宜、量子化 DC T係数という）を、量子化に用いた量子化テーブルとともに、エントロピー符号化回路 1 1 4に供給する。

ここで、量子化回路 1 1 3において用いられる量子化テーブルには、一般に、人間の視覚特性を考慮して、重要性の高い低周波数の DC T係数は細かく量子化し、重要性の低い高周波数の DC T係数は粗く量子化するような量子化ステップが設定されており、これにより、画像の画質の劣化を抑えて、効率の良い圧縮が行われるようになつている。

また、 J P EG符号化において、どのような量子化テーブルを用いるかは、例えば、ユーザが設定する圧縮率等に基づいて決定される。

エントロピー符号化回路 1 1 4は、量子化回路 1 1 3からの量子化 DC T係数に対して、例えば、ハフマン符号化等のエントロピー符号化処理を施して、量子化回路 1 1 3からの量子化テーブルを付加し、その結果得られる符号化データを出力する。

次に、図 1 1は、図 1のエンコーダ 1が図 10に示したように構成される場合の、図 2の復号部 2 1の構成例を示している。なお、図 2の復号部 2 1が図 1 1 に示すように構成される場合は、図 2の復号部 23、並びに図 6の復号部 54および 5 6も、図 1 1に示したのと同様に構成される。

符号化データは、エントロピー復号回路 1 2 1に入力され、エントロピー復号回路 1 21は、符号化データを、エントロピー符号化された量子化 DCT係数と、量子化テーブルとに分離する。さらに、エントロピー復号回路 12 1は、ェント口ピー符号化された量子化 D CT係数をエントロピー復号し、その結果得られる量子化 DCT係数を、量子化テーブルとともに、逆量子化回路 12 2に供給する。逆量子化回路 1 2 2は、エントロピー復号回路 1 21からの量子化 DC T係数を、同じくェントロピー復号回路 1 2 1からの量子化テーブルにしたがって逆量子化し、その結果得られる D CT係数を、逆 DCT回路 1 23に供給する。逆 DCT 回路 1 23は、逆量子化回路 1 2からの DC T係数に、逆 DC T処理を施し、その結果得られる 8 X 8画素の復号ブ口ックを、ブロック分解回路 1 24に供給する。プロック分解回路 1 24は、逆 DCT回路 1 23からの復号プロックのブロック化を解くことで、復号画像データを得て出力する。

一方、付加情報出力部 1 2 5は、上述のように、符号化データを、復号画像デ一タに復号する過程において得られる情報を取得し、その情報のうちの一部または全部を、付加情報として出力する。

即ち、付加情報出力部 1 25には、ェントロピー復号回路 1 21が出力する量子化テーブルおよび量子化 DCT係数や、逆量子化回路 1 22が出力する DCT 係数等が供給されるようになっており、付加情報出力部 1 25は、これらの情報のうちの一部または全部を、付加情報として出力する。

次に、図 1 2は、図 1のデータ伝送システムが、動画の画像データを MPEG2方式で符号化して伝送する場合の、図 1のエンコーダ 1の構成例を示している。なお、図 1のエンコーダ 1が図 1 2に示すように構成される場合は、図 2の符号化部 2 2並びに図 6の符号化部 5 2および 5 5も、図 1 2に示したのと同様に構成される。

M P E G符号化の対象である動画を構成するフレーム（またはフィールド）は、順次、動き検出回路 1 3 1と演算器 1 3 2に供給される。

動き検出回路 1 3 1は、そこに供給されるフレームについて、マクロプロック単位で、動きべクトルを検出し、エントロピー符号化回路 1 3 6および動き補償回路 1 4 0に供給する。

演算器 1 3 2は、そこに供給される画像が、 I (Intra)ピクチャであれば、そのままブロックィ匕回路 1 3 3に供給し、 P (Predictive)または B (Bidirectional ly predictive)ピクチャであれば、動き補償回路 1 4 0から供給される参照画像との差分を演算して、その差分値を、ブロック化回路 1 3 3に供給する。

ブロック化回路 1 3 3は、演算器 1 3 2の出力を、 8 X 8画素の画素ブロックにブロック化し、 D C T回路 1 3 4に供給する。 0じ丁回路1 3 4は、ブロック化回路 1 3 3からの画素ブロックを D C T処理し、その結果得られる D C T係数を、量子化回路 1 3 5に供給する。量子化回路 1 3 5は、 0〇丁回路1 3 3からのプロック単位の D C T係数を所定の量子化テーブルにしたがって量子化し、その結果得られる量子化 D C T係数を、用いた量子化テーブルとともに、ェントロピー符号化回路 1 3 6に供給する。エントロピー符号化回路 1 3 6は、量子化回路 1 3 5からの量子化 D C T係数をェント口ピー符号化し、動き検出回路 1 3 1 からの動きべクトルや、量子化回路 1 3 5からの量子化テーブル、その他の必要な情報（例えば、 MPEGストリームの各レイヤのヘッダとなる情報など）を付加して、その結果得られる符号化データを、 M P E G符号化結果として出力する。量子化回路 1 3 5が出力する量子化 D C T係数のうち、 I ピクチャおよび Pピクチャは、後で符号化される Pピクチャや Bピクチヤの参照画像として用いるのに口一カルデコードする必要があるため、ェントロピー符号化回路 1 3 6の他、逆量子化回路 1 3 7にも供給される。また、逆量子化回路 1 3 7には、量子化回路 1 3 5で用いられた量子化テーブルも供給される。

逆量子化回路 1 3 7は、量子化回路 1 3 5からの量子化 DC T係数を、同じく量子化回路 1 3 5からの量子化テーブルにしたがって逆量子化することにより、 DCT係数とし、逆 DC T回路 1 38に供給する。逆 DCT回路 1 38は、逆量子化回路 1 3 7からの DC T係数を逆 DC T処理し、演算器 1 39に出力する。演算器 1 3 9には、逆 DCT回路 1 3 8の出力の他、動き補償回路 140が出力する参照画像も供給されるようになっており、演算器 1 3 9は、逆 DCT回路 1

38の出力が、 Pピクチャのものである場合には、その出力と、動き補償回路 1

40の出力とを加算することで、元の画像を復号し、動き補償回路' 140に供給する。また、演算器 1 3 9は、逆 DCT回路 1 3 8の出力が、 Iピクチャのものである場合には、その出力は、 Iピクチャの復号画像となっているので、そのまま、動き補償回路 140に供給する。

動き補償回路 140は、演算器 1 3 9から供給される、ローカルデコードされた画像に対して、動き検出回路 1 3 1からの動きべクトルにしたがった動き補償を施し、その動き補償後の画像を、参照画像として、演算器 1 32および 1 39 に供給する。

次に、図 1 3は、図 1のエンコーダ 1が図 1 2に示したように構成される場合の、図 2の復号部 2 1の構成例を示している。なお、図 2の復号部 2 1が図 1 3 に示すように構成される場合は、図 2の復号部 2 3、並びに図 6の復号部 54おょぴ 5 6も、図 1 3に示したのと同様に構成される。

符号化データは、エントロピー復号回路 1 5 1に供給され、エントロピー復号回路 1 5 1は、符号化データをエントロピー復号し、量子化 DCT係数を得るとともに、その符号化データに含まれる動きベクトル、量子化テーブル、その他の必要な情報を分離する。そして、量子化 DC T係数および量子化テーブルは、逆量子化回路 1 5 2に供給され、動きべクトルは、動き補償回路 15 6に供給される。

逆量子化回路 1 5 2は、エントロピー復号回路 1 5 1からの量子化 DC T係数を、同じくエントロピー復号回路 1 1からの量子化テーブルにしたがって逆量子化することにより、 DCT係数とし、逆 DCT回路 1 5 3に供給する。逆 DCT 回路 1 53は、逆量子化回路 1 5 2からの DC T係数を逆 DC T処理し、演算器 1 54に出力する。演算器 1 54には、逆量子化回路 1 5 3の出力の他、動き補償回路 1 5 6が出力する、既に復号された Iピクチャまたは Pピクチャを、ェント口ピー復号回路 1 5 1からの動きべクトルにしたがって動き補償したものが参照画像として供給されるようになっており、演算器 1 54は、逆 DC T回路 1 5 3の出力が、 Pまたは Bピクチャのものである場合には、その出力と、動き補償回路 1 56の出力とを加算することで、元の画像を復号し、ブロック分解回路 1 5 5に供給する。また、演算器 1 54は、逆 DC T回路 1 5 3の出力が、 I ピクチヤのものである場合には、その出力は、 Iピクチャの復号画像となっているので、そのまま、ブロック分解回路 1 5 5に供給する。

プロック分解回路 1 5 5は、演算器 1 54から画素プロック単位で供給される復号画像のプロック化を解くことで、復号画像データを得て出力する。

また、動き補償回路 1 56は、演算器 1 54が出力する復号画像のうちの Iピクチャと Pピクチャを受信し、ェント口ピー復号回路 1 5 1からの動きべクトルにしたがった動き補償を施す。そして、動き補償回路 1 56は、その動き補償後の画像を、参照画像として、演算器 1 54に供給する。

一方、付加情報出力部 1 5 7は、上述のように、符号化データを、復号画像デ一タに復号する過程において得られる情報を取得し、その情報のうちの一部または全部を、付加情報として出力する。

即ち、付加情報出力部 1 5 7には、ェントロピー復号回路 1 5 1が出力する量子化テーブル、量子化 DCT係数、および動きべクトルや、逆量子化回路 1 22 が出力する DC T係数が供給されるようになっている。さらに、付加情報出力部 1 5 7には、エントロピー復号回路 1 5 1が符号化データをエントロピー復号することにより得られる MPEGストリームの各レイヤに配置された情報（例えば、ピクチャタイプや、ブロックの位置情報、フレーム D CTモード/フィールド D C Tモードの別など）も供給されるようになっている。付加情報出力部 1 5 7は、これらの情報のうちの一部または全部を、付加情報として出力する。

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウエアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストーノレされる。

そこで、図 1 4は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードデイスク 2 0 5や R O M 2 0 3に予め記録しておくことができる。

あるいはまた、プログラムは、フロッピーディスク、 CD- ROM (Compact Disc Re ad Onl y Memory) , M0 (Magneto optical)ディスク, DVD (Di gital Versati le Dis c)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体 2 1 1に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体 2 1 1は、いわゆるパッケージソフトウェアとして提供することができる。

なお、プログラムは、上述したようなリムーバブル記録媒体 2 1 1からコンビユータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、 LAN (Local Area Netwo rk)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部 2 0 8で受信し、内蔵するハードディスク 2 0 5にインストールすることができる。

コンピュータは、 CPU (Central Processing Unit) 2 0 2を内蔵している。 CPU 2 0 2には、バス 2 0 1を介して、入出力ィンタフェース 2 1 0が接続されており、 CPU 2 0 2は、入出力インタフェース 2 1 0を介して、ユーザによって、キ一ボードや、マウス、マイク等で構成される入力部 2 0 7が操作等されることにより指令が入力されると、それにしたがって、 R0M (Read Only Memory) 2 0 3に格納されているプログラムを実行する。あるいは、また、 CPU 2 0 2は、ハードディスク 2 0 5に格納されているプログラム、衛星若しくはネットワークから転送され、通信部 2 0 8で受信されてハードディスク 2 0 5にインストールされたプログラム、またはドライブ 2 0 9に装着されたリムーバブル記録媒体 2 1 1から読み出されてハードディスク 2 0 5にィンストールされたプログラムを、 RAM (Random Access Memory) 2 0 4にロードして実行する。これにより、 CPU 2 0 2 は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、 CPU 2 0 2は、その処理結果を、必要に応じて、例えば、入出力インタフェース 2 1 0を介して、 LCD (Liquid CryStal Display)やスピーカ等で構成される出力部 2 0 6から出力、あるいは、通信部 2 0 8から送信、さらには、ハードディスク 2 0 5に記録等させる。

ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステツプは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理 (例えば、並列処理あるいはオブジェクトによる処理）も含むものである。

また、プログラムは、 1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。なお、本発明は、特定の符号化 Z復号方式に限定されることなく適用可能である。即ち、本実施の形態においては、 CELP方式、 JPEG方式、 MPEG2方式について説明したが、本発明は、その他、例えば、 M-JPEG (Motion JPEG)方式や、 MPEG1, 4， P3 (MPEG-1 Audio Layer 3)方式、 ATRAC (Adaptive TRansform Acoustic Cod ing)方式等の種々の符号化ノ復号方式に適用可能である。

また、本実施の形態では、符号化データを、その符号化方式に対応した復号方式によって復号するようにしたが、符号化データの復号は、クラス分類適応処理によって行うことが可能である。クラス分類適応処理による符号化データの復号は、符号化の対象とするデータを教師データとするとともに、そのデータを符号化した符号化データを生徒データとして学習を行うことによって得られるタップ係数を用いることで行うことが可能である。

さらに、本実施の形態では、タップ係数を用いた線形 1次予測演算によって、高品質のデータの予測値を求めるようにしたが、この予測値は、その他、 2次以上の高次の予測演算によって求めることも可能である。

また、本実施の形態では、デコーダ 2のクラス分類適応処理回路 2 4において、品質を向上させるためのタップ係数を、あらかじめ記憶しておくようにしたが、タップ係数は、符号化データに含めて、デコーダ 2に提供するようにすることが可能である。 '

さらに、本実施の形態では、予測タップを、第 1復号データおよび第 2復号データの他、第 1付加情報および第 2付加情報から生成するようにしたが、予測タップは、その他、例えば、第 1復号データおよび第 2復号データだけから生成するようにすること等が可能である。クラスタップについても、同様である。産業上の利用可能性

本発明の第 1のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体によれば、符号化データが復号され、その結果得られる復号データが符号化されて、再符号化データが出力される。そして、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップが、復号データと、再符号化データから得られる情報とから生成され、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、学習において教師として用いられた教師データに対応する予測値が求められる。従って、例えば、品質が十分に改善されたデータを得ることが可能となる。

本発明の第 2のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体によれば、教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とが、生徒となる生徒データとして生成される。そして、教師データを予測するのに用いる予測タップが、生徒データから生成され、予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる教師データの予測値の予測誤差が、統計的に最小になるように学習が行われ、タップ係数が求められる。従って、そのタップ係数を用いて予測演算を行うことにより、例えば、品質が十分に改善されたデータを得ることが可能となる。

本発明の第 3のデータ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体によれば、データを符号化した符号化データが復号され、その結果得られる複号データが符号化されて、再符号化データが出力される。そして、クラス分類に用いるクラスタップが、復号データと、再符号化データから得られる情報とから生成され、そのクラスタップに基づいて、クラス分類が行われる。従つて、データの適切なクラス分けが可能となる。

Claims

請求の範囲

1 . データを符号化して得られる符号化データを処理するデータ処理装置であつて、

前記符号化データを復号し、復号データを出力する復号手段と、

前記復号データを符号化し、再符号化データを出力する再符号化手段と、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、前記復号データと、前記再符号化データから得られる情報とから生成する予測タップ生成手段と、

前記タップ係数を取得するタップ係数取得手段と、

前記予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、前記学習において教師として用いられた教師データに対応する予測値を求める予測手段と

を備えることを特徴とするデータ処理装置。

2 . 前記予測手段は、前記予測タップとタップ係数とを用いて、線形 1次予測演算を行うことにより、前記予測値を求める

ことを特徴とする請求の範囲第 1項に記載のデータ処理装置。

3 . 前記復号手段は、前記符号化データを復号する過程において得られる情報を、付加情報として出力し、

前記予測タップ生成手段は、前記付加情報からも、前記予測タップを生成することを特徴とする請求の範囲第 1項に記載のデータ処理装置。

4 . 前記再符号化データを復号し、再復号データを出力する再復号手段をさらに偷、

前記予測タップ生成手段は、前記復号データと再復号データとから、前記予測タップを生成する

5 . 前記再復号手段は、前記再符号化データを復号する過程において得られる情報を、付加情報として出力し、前記予測タップ生成手段は、前記付加情報からも、前記予測タップを生成することを特徴とする請求の範囲第 4項に記載のデータ処理装置。

6 . 情報をクラス分けするクラス分類を行うのに用いられるクラスタップを、前記復号デ一タと、前記再符号化データから得られる情報とから生成するクラスタップ生成手段と、

前記クラスタップに基づいて、クラス分類を行うクラス分類手段と

をさらに備え、

前記タップ係数取得手段は、前記クラス分類手段が出力するクラスに対応する前記タップ係数を取得し、

前記予測手段は、前記クラス分類手段が出力するクラスに対応する前記タップ係数を用いて、前記予測値を求める

7 . 前記復号手段は、前記符号化データを復号する過程において得られる情報を、付加情報として出力し、

前記クラスタップ生成手段は、前記付加情報からも、前記クラスタップを生成する '

ことを特徴とする請求の範囲第 6項に記載のデータ処理装置。

8 . 前記再符号化データを復号し、再復号データを出力する再復号手段をさらに備え、

前記クラスタップ生成手段は、前記復号データと再復号データとから、前記クラスタップを生成する

9 . 前記再復号手段は、前記再符号化データを復号する過程において得られる情報を、付加情報として出力し、

前記クラスタップ生成手段は、前記付加情報からも、前記クラスタップを生成する

ことを特徴とする請求の範囲第 8項に記載のデータ処理装置。

1 0 . 前記データは、画像データである

1 1 . 前記符号化データは、前記画像データを、少なくとも直交変換して得られるデータを含む

ことを特徴とする請求の範囲第 1 0項に記載のデータ処理装置。

1 2 . 前記データは、音声データである

1 3 . 前記符号化データは、少なくとも、線形予測係数と残差信号に対応するコードを含む

ことを特徴とする請求の範囲第 1 2項に記載のデータ処理装置。

1 4 . データを符号化して得られる符号化データを処理するデータ処理方法であって、

前記符号化データを復号し、復号データを出力する復号ステップと、前記復号デ一タを符号化し、再符号化データを出力する再符号化ステップと、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、前記復号データと、前記再符号化データから得られる情報とから生成する予測タップ生成ステツプと、

前記タップ係数を取得するタップ係数取得ステップと、

前記予測タップとタップ係数とを用いて、所定の予測演算を行うことにより、前記学習において教師として用いられた教師データに対応する予測値を求める予測ステップと

を備えることを特徴とするデータ処理方法。

1 5 . データを符号化して得られる符号化データを、コンピュータに処理させるプログラムであって、

前記符号化データを復号し、復号データを出力する復号ステップと、前記復号デ一タを符号化し、再符号化データを出力する再符号化ステップと、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、前記復号データと、前記再符号化データから得られる情報とから生成する予測タップ生成ステップと、

前記タップ係数を取得するタツプ係数取得ステツプと、

前記予測タップとタツプ係数とを用いて、所定の予測演算を行うことにより、前記学習において教師として用いられた教師データに対応する予測値を求める予測ステップと

を備えることを特徴とするプログラム。

1 6 . データを符号化して得られる符号化データを、コンピュータに処理させるプログラムが記録されている記録媒体であって、

前記符号化データを復号し、復号データを出力する復号ステップと、前記復号データを符号化し、再符号化データを出力する再符号化ステップと、学習を行うことにより求められたタップ係数との所定の予測演算を行う予測タップを、前記復号データと、前記再符号化データから得られる情報とから生成する予測タップ生成ステツプと、

前記タップ係数を取得するタップ係数取得ステツプと、

を備えるプログラムが記録されている

ことを特徴とする記録媒体。

1 7 . データを符号化して得ちれる符号化データを処理するのに用いる所定のタップ係数を学習するデータ処理装置であって、

教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成手段と、

前記教師データを予測するのに用いる予測タップを、前記生徒データから生成する予測タップ生成手段と、前記予測タップとタツプ係数とを用いて、所定の予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、前記タップ係数を求める学習手段と

を備えることを特徴とするデータ処理装置。

1 8 . 前記学習手段は、前記予測タップとタップ係数とを用いて線形 1次予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行う

ことを特徴とする請求の範囲第 1 7項に記載のデータ処理装置。

1 9 . 前記生徒データ生成手段は、前記教師データを符号化した符号化データを復号する過程において得られる情報も、前記生徒データとして出力する

2 0 . 前記生徒データ生成手段は、前記再符号化データを復号し、その結果得られる再復号データを、前記生徒データとして出力する

2 1 . 前記生徒データ生成手段は、前記再符号化データを復号する過程において得られる情報も、前記生徒データとして出力する

ことを特徴とする請求の範囲第 2 0項に記載のデータ処理装置。

2 2 . 情報をクラス分けするクラス分類を行うのに用いられるクラスタップを、前記生徒データから生成するクラスタツプ生成手段と、

をさらに備え、

前記学習手段は、前記クラス分類手段が出力するクラスごとに、前記タップ係数を求める

2 3 . 前記生徒データ生成手段は、前記教師データを符号化した符号化データを復号する過程において得られる情報も、前記生徒データとして出力する

ことを特徴とする請求の範囲第 2 2項に記載のデータ処理装置。

2 4 . 前記生徒データ生成手段は、前記再符号化データを復号し、その結果得られる再復号データを、前記生徒データとして出力する

2 5 . 前記生徒データ生成手段は、前記再符号化データを復号する過程において得られる情報も、前記生徒データとして出力する

ことを特徴とする請求の範囲第 2 4項に記載のデータ処理装置。

2 6 . 前記教師データは、画像データである

2 7 . 前記生徒データ生成手段は、前記画像データを、少なくとも直交変換することにより符号化する

ことを特徴とする請求の範囲第 2 6項に記載のデータ処理装置。

2 8 . 前記データは、音声データである

2 9 . 前記生徒データ生成手段は、前記音声データを、少なくとも、線形予測係数と残差信号に対応するコードに符号化する

ことを特徴とする請求の範囲第 2 8項に記載のデータ処理装置。

3 0 . データを符号化して得られる符号化データを処理するのに用いる所定のタップ係数を学習するデータ処理方法であって、

教師となる教師データから、その教師データを符号化して復号した復号データと、その復号データを符号化した再符号化データから得られる情報とを、生徒となる生徒データとして生成する生徒データ生成ステップと、

前記教師データを予測するのに用いる予測タップを、前記生徒データから生成する予測タップ生成ステップと、

前記予測タップとタップ係数とを用いて、所定の予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように学習を行い、前記タップ係数を求める学習ステップと

を備えることを特徴とするデータ処理方法。

3 1 . データを符号化して得られる符号化データを処理するのに用いる所定のタップ係数を学習するデータ処理を、コンピュータに行わせるプログラムであつて、

を備えることを特徴とするプログラム。

3 2 . データを符号化して得られる符号化データを処理するのに用いる所定のタップ係数を学習するデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、

を備えるプログラムが記録されている

ことを特徴とする記録媒体。

3 3 . 情報をクラス分けするクラス分類を行うデータ処理装置であって、データを符号化した符号化データを復号し、復号データを出力する復号手段と、前記復号データを符号化し、再符号化データを出力する再符号化手段と、前記クラス分類に用いるクラスタップを、前記復号データと、前記再符号化データから得られる情報とから生成するクラスタップ生成手段と、

前記クラスタツプに基づいて、クラス分類を行うクラス分類手段と

を備えることを特徴とするデータ処理装置。

3 4 . 前記復号手段は、前記符号化データを復号する過程において得られる情報を、付加情報として出力し、

ことを特徴とする請求の範囲第 3 3項に記載のデータ処理装置。

3 5 . 前記再符号化データを復号し、再復号データを出力する再復号手段をさらに備え、

3 6 . 前記再復号手段は、前記再符号化データを復号する過程において得られる情報を、付加情報として出力し、

前記予測タップ生成手段は、前記付加情報からも、前記予測タップを生成することを特徴とする請求の範囲第 3 5項に記載のデータ処理装置。

3 7 . 前記データは、画像データである

3 8 . 前記符号化データは、前記画像データを、少なくとも直交変換して得られるデータを含む

ことを特徴とする請求の範囲第 3 7項に記載のデータ処理装置。

3 9 . 前記データは、音声データである

4 0 . 前記符号化データは、少なくとも、線形予測係数と残差信号に対応するコードを含む

ことを特徴とする請求の範囲第 3 9項に記載のデータ処理装置。

4 1 . 情報をクラス分けするクラス分類を行うデータ処理方法であって、データを符号化した符号化データを復号し、復号データを出力する復号ステツプと、

前記復号データを符号化し、再符号化データを出力する再符号化ステップと、前記クラス分類に用いるクラスタップを、前記復号データと、前記再符号化データから得られる情報とから生成するクラスタップ生成ステップと、

前記クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えることを特徴とするデータ処理方法。

4 2 . 情報をクラス分けするクラス分類を行うデータ処理を、コンピュータに行わせるプログラムであって、

データを符号化した符号化データを復号し、復号データを出力する復号ステツプと、

前記クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えることを特徴とするプログラム。

4 3 . 情報をクラス分けするクラス分類を行うデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、

データを符号化した符号化データを復号し、復号データを出力する復号ステップと、

前記クラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えるプログラムが記録されていることを特徴とする記録媒体。