JP2002223167A

JP2002223167A - データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体

Info

Publication number: JP2002223167A
Application number: JP2001016869A
Authority: JP
Inventors: Tetsujiro Kondo; 哲二郎近藤; Tsutomu Watanabe; 勉渡辺
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2001-01-25
Filing date: 2001-01-25
Publication date: 2002-08-09
Anticipated expiration: 2021-01-25
Also published as: DE60211854D1; EP1355428A4; KR20030062230A; DE60211854T2; WO2002060069A1; KR100847179B1; CN1269314C; JP4507046B2; EP1355428B1; EP1355428A1; CN1457552A

Abstract

(57)【要約】【課題】画像や音声等の復号データの品質を、より向
上させる。【解決手段】復号部２１は、例えば、画像をJPEG符号
化した符号化データを復号し、符号化部２２は、その結
果得られる第１復号データを符号化して、再符号化デー
タを出力する。さらに、復号部２３は、再符号化データ
を復号して、第２復号データを得る。クラス分類適応処
理回路２４は、学習を行うことにより求められたタップ
係数との所定の予測演算を行う予測タップを、第１復号
データと第２復号データから生成し、予測タップとタッ
プ係数とを用いて、所定の予測演算を行うことにより、
学習において教師として用いられた教師データに対応す
る予測値を求める。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ処理装置お
よびデータ処理方法、並びにプログラムおよび記録媒体
に関し、特に、例えば、画質の良い画像や、音質の良い
音声等を復号することができるようにするデータ処理装
置およびデータ処理方法、並びにプログラムおよび記録
媒体に関する。

【０００２】

【従来の技術】本件出願人は、画像の画質や音声の音質
を向上させる方法として、クラス分類適応処理を、先に
提案している。

【０００３】クラス分類適応処理は、クラス分類処理と
適応処理とからなり、クラス分類処理によって、データ
を、その性質に基づいてクラス分けし、各クラスごとに
適応処理を施すものであり、適応処理は、以下のような
手法のものである。

【０００４】即ち、例えば、いま、画像を対象とする
と、適応処理では、例えば、低画質の画像の画素値と、
所定のタップ係数との線形結合により、高画質の画像の
画素値の予測値を求めることで、低画質の画像が、高画
質の画像に変換される。

【０００５】具体的には、例えば、いま、ある高画質の
画像を教師データとするとともに、その高画質の画像
を、例えば、JPEG(Joint Photographic Experts Group)
方式やMPEG(Moving Picture Experts Group)方式等によ
って符号化し、さらに、その符号化データを復号して得
られる、画質の低下した復号画像を生徒データとして、
教師データである高画質の画素値ｙの予測値Ｅ［ｙ］
を、生徒データである低画質の画素値の幾つかｘ₁，
ｘ₂，・・・の集合と、所定のタップ係数ｗ₁，ｗ₂，・
・・の線形結合により規定される線形１次結合モデルに
より求めることを考える。この場合、予測値Ｅ［ｙ］
は、次式で表すことができる。

【０００６】Ｅ［ｙ］＝ｗ₁ｘ₁＋ｗ₂ｘ₂＋・・・・・・（１）

【０００７】式（１）を一般化するために、タップ係数
ｗ_jの集合でなる行列Ｗ、生徒データｘ_ijの集合でなる
行列Ｘ、および予測値Ｅ［ｙ_j］の集合でなる行列Ｙ’
を、

【数１】で定義すると、次のような観測方程式が成立する。

【０００８】ＸＷ＝Ｙ’・・・（２）ここで、行列Ｘの成分ｘ_ijは、ｉ件目の生徒データの集
合（ｉ件目の教師データｙ_iの予測に用いる生徒データ
の集合）の中のｊ番目の生徒データを意味し、行列Ｗの
成分ｗ_jは、生徒データの集合の中のｊ番目の生徒デー
タとの積が演算されるタップ係数を表す。また、ｙ
_iは、ｉ件目の教師データを表し、従って、Ｅ［ｙ_i］
は、ｉ件目の教師データの予測値を表す。なお、式
（１）の左辺におけるｙは、行列Ｙの成分ｙ_iのサフィ
ックスｉを省略したものであり、また、式（１）の右辺
におけるｘ₁，ｘ₂，・・・も、行列Ｘの成分ｘ_ijのサフ
ィックスｉを省略したものである。

【０００９】式（２）の観測方程式に最小自乗法を適用
して、画質の良い画素値ｙに近い予測値Ｅ［ｙ］を求め
ることを考える。この場合、教師データとなる画素値ｙ
の集合でなる行列Ｙ、および画素値ｙに対する予測値Ｅ
［ｙ］の残差ｅの集合でなる行列Ｅを、

【数２】で定義すると、式（２）から、次のような残差方程式が
成立する。

【００１０】ＸＷ＝Ｙ＋Ｅ・・・（３）

【００１１】この場合、元の画素値ｙに近い予測値Ｅ
［ｙ］を求めるためのタップ係数ｗ_jは、自乗誤差

【数３】を最小にすることで求めることができる。

【００１２】従って、上述の自乗誤差をタップ係数ｗ_j
で微分したものが０になる場合、即ち、次式を満たすタ
ップ係数ｗ_jが、画素値ｙに近い予測値Ｅ［ｙ］を求め
るため最適値ということになる。

【００１３】

【数４】・・・（４）

【００１４】そこで、まず、式（３）を、タップ係数ｗ
_jで微分することにより、次式が成立する。

【００１５】

【数５】・・・（５）

【００１６】式（４）および（５）より、式（６）が得
られる。

【数６】・・・（６）

【００１７】さらに、式（３）の残差方程式における生
徒データｘ_ij、タップ係数ｗ_j、教師データｙ_i、および
残差ｅ_iの関係を考慮すると、式（６）から、次のよう
な正規方程式を得ることができる。

【００１８】

【数７】・・・（７）

【００１９】なお、式（７）に示した正規方程式は、行
列（共分散行列）Ａおよびベクトルｖを、

【数８】で定義するとともに、ベクトルＷを、数１で示したよう
に定義すると、式ＡＷ＝ｖ・・・（８）で表すことができる。

【００２０】式（７）における各正規方程式は、生徒デ
ータｘ_ijおよび教師データｙ_iのセットを、ある程度の
数だけ用意することで、求めるべきタップ係数ｗ_jの数
Ｊと同じ数だけたてることができ、従って、式（８）
を、ベクトルＷについて解くことで（但し、式（８）を
解くには、式（８）における行列Ａが正則である必要が
ある）、統計的な予測誤差を最小にするタップ係数（こ
こでは、自乗誤差を最小にするタップ係数）ｗ_jを求め
ることができる。なお、式（８）を解くにあたっては、
例えば、掃き出し法（Gauss-Jordanの消去法）などを用
いることが可能である。

【００２１】以上のようにして、統計的な予測誤差を最
小にするタップ係数ｗ_jを求めておき、さらに、そのタ
ップ係数ｗ_jを用い、式（１）により、高画質の画素値
ｙに近い予測値Ｅ［ｙ］を求めるのが適応処理である。

【００２２】なお、例えば、教師データとして、符号化
する画像と同一画質の画像を用いるとともに、生徒デー
タとして、その教師データを復号して得られる復号画像
を用いた場合、タップ係数としては、符号化された画像
データを、元の画像データに復号するのに、予測誤差が
統計的に最小となるものが得られることになる。

【００２３】また、例えば、教師データとして、符号化
する画像よりも高解像度の画像を用いるとともに、生徒
データとして、その教師データの解像度を、符号化する
画像と同一画質に劣化させ、それを符号化して復号する
ことにより得られる復号画像を用いた場合、タップ係数
としては、符号化された画像データを、高解像度の画像
データに復号するのに、予測誤差が統計的に最小となる
ものが得られることになる。

【００２４】従って、この場合、適応処理によれば、教
師データまたは生徒データとなる画像を変えることで、
復号画像の画質を任意に調整することの可能なタップ係
数を得ることができる。

【００２５】なお、適応処理は、学習によって、予測誤
差が統計的に最小になるタップ係数が用いられる点、お
よびそのようなタップ係数を用いることにより、符号化
される画像には含まれていない高周波数成分が再現され
ることがある点等において、フィルタによる単なるフィ
ルタリングとは大きく異なる。

【００２６】

【発明が解決しようとする課題】以上から、符号化デー
タを復号した復号画像を対象に、クラス分類適応処理を
行った場合には、画質を向上させた復号画像を得ること
ができる。

【００２７】しかしながら、符号化データを復号した復
号画像の画質が、例えば、符号化データを伝送する伝送
路の状態や、画像データの符号化時における圧縮率等に
起因して大きく劣化している場合には、復号画像だけを
用いてクラス分類適応処理を行っても、その画質を十分
に改善することが困難なことがあった。

【００２８】本発明は、このような状況に鑑みてなされ
たものであり、品質が十分に改善されたデータを得るこ
とができるようにするものである。

【００２９】

【課題を解決するための手段】本発明の第１のデータ処
理装置は、符号化データを復号し、復号データを出力す
る復号手段と、復号データを符号化し、再符号化データ
を出力する再符号化手段と、学習を行うことにより求め
られたタップ係数との所定の予測演算を行う予測タップ
を、復号データと、再符号化データから得られる情報と
から生成する予測タップ生成手段と、予測タップとタッ
プ係数とを用いて、所定の予測演算を行うことにより、
学習において教師として用いられた教師データに対応す
る予測値を求める予測手段とを備えることを特徴とす
る。

【００３０】本発明の第１のデータ処理方法は、符号化
データを復号し、復号データを出力する復号ステップ
と、復号データを符号化し、再符号化データを出力する
再符号化ステップと、学習を行うことにより求められた
タップ係数との所定の予測演算を行う予測タップを、復
号データと、再符号化データから得られる情報とから生
成する予測タップ生成ステップと、予測タップとタップ
係数とを用いて、所定の予測演算を行うことにより、学
習において教師として用いられた教師データに対応する
予測値を求める予測ステップとを備えることを特徴とす
る。

【００３１】本発明の第１のプログラムは、符号化デー
タを復号し、復号データを出力する復号ステップと、復
号データを符号化し、再符号化データを出力する再符号
化ステップと、学習を行うことにより求められたタップ
係数との所定の予測演算を行う予測タップを、復号デー
タと、再符号化データから得られる情報とから生成する
予測タップ生成ステップと、予測タップとタップ係数と
を用いて、所定の予測演算を行うことにより、学習にお
いて教師として用いられた教師データに対応する予測値
を求める予測ステップとを備えることを特徴とする。

【００３２】本発明の第１の記録媒体は、符号化データ
を復号し、復号データを出力する復号ステップと、復号
データを符号化し、再符号化データを出力する再符号化
ステップと、学習を行うことにより求められたタップ係
数との所定の予測演算を行う予測タップを、復号データ
と、再符号化データから得られる情報とから生成する予
測タップ生成ステップと、予測タップとタップ係数とを
用いて、所定の予測演算を行うことにより、学習におい
て教師として用いられた教師データに対応する予測値を
求める予測ステップとを備えるプログラムが記録されて
いることを特徴とする。

【００３３】本発明の第２のデータ処理装置は、教師と
なる教師データから、その教師データを符号化して復号
した復号データと、その復号データを符号化した再符号
化データから得られる情報とを、生徒となる生徒データ
として生成する生徒データ生成手段と、教師データを予
測するのに用いる予測タップを、生徒データから生成す
る予測タップ生成手段と、予測タップとタップ係数とを
用いて、所定の予測演算を行うことにより得られる教師
データの予測値の予測誤差が、統計的に最小になるよう
に学習を行い、タップ係数を求める学習手段とを備える
ことを特徴とする。

【００３４】本発明の第２のデータ処理方法は、教師と
なる教師データから、その教師データを符号化して復号
した復号データと、その復号データを符号化した再符号
化データから得られる情報とを、生徒となる生徒データ
として生成する生徒データ生成ステップと、教師データ
を予測するのに用いる予測タップを、生徒データから生
成する予測タップ生成ステップと、予測タップとタップ
係数とを用いて、所定の予測演算を行うことにより得ら
れる教師データの予測値の予測誤差が、統計的に最小に
なるように学習を行い、タップ係数を求める学習ステッ
プとを備えることを特徴とする。

【００３５】本発明の第２のプログラムは、教師となる
教師データから、その教師データを符号化して復号した
復号データと、その復号データを符号化した再符号化デ
ータから得られる情報とを、生徒となる生徒データとし
て生成する生徒データ生成ステップと、教師データを予
測するのに用いる予測タップを、生徒データから生成す
る予測タップ生成ステップと、予測タップとタップ係数
とを用いて、所定の予測演算を行うことにより得られる
教師データの予測値の予測誤差が、統計的に最小になる
ように学習を行い、タップ係数を求める学習ステップと
を備えることを特徴とする。

【００３６】本発明の第２の記録媒体は、教師となる教
師データから、その教師データを符号化して復号した復
号データと、その復号データを符号化した再符号化デー
タから得られる情報とを、生徒となる生徒データとして
生成する生徒データ生成ステップと、教師データを予測
するのに用いる予測タップを、生徒データから生成する
予測タップ生成ステップと、予測タップとタップ係数と
を用いて、所定の予測演算を行うことにより得られる教
師データの予測値の予測誤差が、統計的に最小になるよ
うに学習を行い、タップ係数を求める学習ステップとを
備えるプログラムが記録されていることを特徴とする。

【００３７】本発明の第３のデータ処理装置は、データ
を符号化した符号化データを復号し、復号データを出力
する復号手段と、復号データを符号化し、再符号化デー
タを出力する再符号化手段と、クラス分類に用いるクラ
スタップを、復号データと、再符号化データから得られ
る情報とから生成するクラスタップ生成手段と、クラス
タップに基づいて、クラス分類を行うクラス分類手段と
を備えることを特徴とする。

【００３８】本発明の第３のデータ処理方法は、データ
を符号化した符号化データを復号し、復号データを出力
する復号ステップと、復号データを符号化し、再符号化
データを出力する再符号化ステップと、クラス分類に用
いるクラスタップを、復号データと、再符号化データか
ら得られる情報とから生成するクラスタップ生成ステッ
プと、クラスタップに基づいて、クラス分類を行うクラ
ス分類ステップとを備えることを特徴とする。

【００３９】本発明の第３のプログラムは、データを符
号化した符号化データを復号し、復号データを出力する
復号ステップと、復号データを符号化し、再符号化デー
タを出力する再符号化ステップと、クラス分類に用いる
クラスタップを、復号データと、再符号化データから得
られる情報とから生成するクラスタップ生成ステップ
と、クラスタップに基づいて、クラス分類を行うクラス
分類ステップとを備えることを特徴とする。

【００４０】本発明の第３の記録媒体は、データを符号
化した符号化データを復号し、復号データを出力する復
号ステップと、復号データを符号化し、再符号化データ
を出力する再符号化ステップと、クラス分類に用いるク
ラスタップを、復号データと、再符号化データから得ら
れる情報とから生成するクラスタップ生成ステップと、
クラスタップに基づいて、クラス分類を行うクラス分類
ステップとを備えるプログラムが記録されていることを
特徴とする。

【００４１】本発明の第１のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体において
は、符号化データが復号され、その結果得られる復号デ
ータが符号化されて、再符号化データが出力される。そ
して、学習を行うことにより求められたタップ係数との
所定の予測演算を行う予測タップが、復号データと、再
符号化データから得られる情報とから生成され、予測タ
ップとタップ係数とを用いて、所定の予測演算を行うこ
とにより、学習において教師として用いられた教師デー
タに対応する予測値が求められる。

【００４２】本発明の第２のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体において
は、教師となる教師データから、その教師データを符号
化して復号した復号データと、その復号データを符号化
した再符号化データから得られる情報とが、生徒となる
生徒データとして生成される。そして、教師データを予
測するのに用いる予測タップが、生徒データから生成さ
れ、予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる教師データの予測値の予測
誤差が、統計的に最小になるように学習が行われ、タッ
プ係数が求められる。

【００４３】本発明の第３のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体において
は、データを符号化した符号化データが復号され、その
結果得られる復号データが符号化されて、再符号化デー
タが出力される。そして、クラス分類に用いるクラスタ
ップが、復号データと、再符号化データから得られる情
報とから生成され、そのクラスタップに基づいて、クラ
ス分類が行われる。

【００４４】

【発明の実施の形態】図１は、本発明を適用したデータ
伝送システムの一実施の形態の構成例を示している。

【００４５】伝送すべきデータは、エンコーダ１に供給
されるようになっており、エンコーダ１は、そこに供給
されるデータを、例えば、所定の符号化方式にしたがっ
て符号化し、符号化データとする。この符号化データ
は、例えば、半導体メモリ、光磁気ディスク、磁気ディ
スク、光ディスク、磁気テープ、相変化ディスクなどで
なる記録媒体３に記録され、あるいは、また、例えば、
地上波、衛星回線、ＣＡＴＶ（Cable Television）網、
インターネット、公衆回線などでなる伝送媒体４を介し
て伝送される。

【００４６】デコーダ２は、記録媒体３または伝送媒体
４を介して提供される符号化データを受信して復号し、
その結果得られる復号データを出力する。復号データ
が、例えば、画像データである場合には、その画像デー
タは、例えば、図示せぬディスプレイに供給されて表示
される。また、符号化データが、例えば、音声データで
ある場合には、その音声データは、例えば、図示せぬス
ピーカに供給されて出力される。

【００４７】次に、図２は、図１のデコーダ２の構成例
を示している。

【００４８】符号化データは、復号部２１に供給される
ようになっており、復号部２１は、例えば、エンコーダ
１における符号化方式に対応する復号方式にしたがっ
て、符号化データを復号し、その結果得られる復号デー
タを、符号化部２２とクラス分類適応処理回路２４に供
給する。さらに、復号部２１は、符号化データを復号す
る過程において得られる情報を、付加情報として、クラ
ス分類適応処理回路２４に供給する。

【００４９】符号化部２２は、復号部２１から供給され
る復号データを、例えば、図１のエンコーダ１における
のと同一の符号化方式にしたがって符号化（再符号化）
し、再符号化データを得る。この再符号化データは、符
号化部２２から復号部２３に供給される。

【００５０】復号部２３は、例えば、復号部２１と同様
にして、符号化部２２からの再符号化データを復号し、
その結果得られる復号データを、クラス分類適応処理回
路２４に供給する。さらに、復号部２３は、再符号化デ
ータを復号する過程において得られる情報を、付加情報
として、クラス分類適応処理回路２４に供給する。

【００５１】ここで、以下、適宜、最初の復号を行う復
号部２１が出力する復号データを第１復号データと、２
番目の復号を行う復号部２３が出力する復号データを第
２復号データと、それぞれ記述する。同様に、以下、適
宜、最初の復号を行う復号部２１が出力する付加情報を
第１付加情報と、２番目の復号を行う復号部２３が出力
する付加情報を第２付加情報と、それぞれ記述する。ま
た、以下、適宜、第１復号データと第２復号データをま
とめて、単に、復号データとも記述する。同様に、以
下、適宜、第１付加情報と第２付加情報をまとめて、単
に、付加情報とも記述する。

【００５２】クラス分類適応処理回路２４は、復号部２
１から供給される第１復号データと第１付加情報、さら
には、復号部２３から供給される第２復号データと第２
付加情報を用いて、クラス分類適応処理を行い、符号化
データの最終的な復号結果としての復号データ（以下、
適宜、最終的な復号データという）を出力する。

【００５３】従って、クラス分類適応処理回路２４で
は、符号化データを復号して得られる第１復号データの
他、その復号過程で得られる第１付加情報、さらには、
第１復号データを再符号化し、その再符号化データを復
号した第２復号データ、および再符号化データを復号す
る過程で得られる第２付加情報を用いて、クラス分類適
応処理が行われるので、第１符号化データの品質が大き
く劣化している場合であっても、最終的な復号データと
して、十分に品質が改善されたものを得ることが可能と
なる。

【００５４】なお、復号部２３の後段には、符号化部２
２と復号部２３のセットと同様のセットを、１以上設け
ることができ、これにより、クラス分類適応処理回路２
４には、第２符号化データを符号化し、その結果得られ
る符号化データを復号した第３復号データや、その復号
過程で得られる第３付加情報を供給して、クラス分類適
応処理を行わせることが可能である。

【００５５】次に、図３は、図２のクラス分類適応処理
回路２４の構成例を示している。

【００５６】第１復号データ、第１付加情報、第２復号
データ、および第２付加情報は、タップ生成部３１と３
２に供給される。

【００５７】タップ生成部３１は、第１復号データ、第
１付加情報、第２復号データ、および第２付加情報か
ら、後述する予測部３５における予測演算に用いられる
予測タップとなるものを生成する。即ち、タップ生成部
３１は、例えば、品質を改善しようとして注目している
注目データに対して、時間的または空間的に近い位置に
ある第１復号データと第２復号データを抽出するととと
もに、その第１復号データと第２復号データの復号にそ
れぞれ用いられた第１付加情報と第２付加情報を抽出
し、その抽出したデータ（情報）を、予測タップとし
て、予測部３５に供給する。

【００５８】タップ生成部３２は、第１復号データ、第
１付加情報、第２復号データ、および第２付加情報か
ら、後述するクラス分類部３３におけるクラス分類に用
いられるクラスタップとなるものを生成する。即ち、タ
ップ生成部３２は、例えば、注目データについて、タッ
プ生成部３１で生成される予測タップと同一構成のクラ
スタップを生成し、クラス分類部３５に供給する。

【００５９】なお、ここでは、説明を簡単にするため
に、同一のクラスタップおよび予測タップを構成するよ
うにしたが、クラスタップと予測タップとは、異なる構
成とすること、即ち、第１復号データ、第１付加情報、
第２復号データ、および第２付加情報から、異なるデー
タを抽出して生成することが可能である。

【００６０】クラス分類部３３は、タップ生成部３２か
らのクラスタップに基づき、注目データについてクラス
分類を行い、その結果得られるクラスに対応するクラス
コードを、係数メモリ３４に出力する。

【００６１】係数メモリ３４は、後述する図６の学習装
置において学習処理が行われることにより得られる、ク
ラスごとのタップ係数を記憶しており、クラス分類部３
３が出力するクラスコードに対応するアドレスに記憶さ
れているタップ係数を、予測部３５に出力する。

【００６２】予測部３５は、タップ生成部３１が出力す
る予測タップと、係数メモリ３４が出力するタップ係数
とを取得し、その予測タップとタップ係数とを用いて、
式（１）に示した線形予測演算（積和演算）を行い、注
目データについて品質を改善したデータ、即ち、注目デ
ータを高品質にしたものの予測値を求めて出力する。

【００６３】次に、図４は、図３のクラス分類部３３の
構成例を示している。

【００６４】クラス分類部３３は、例えば、図４（Ａ）
に示すように、ADRC(Adaptive Dynamic Range Coding)
回路４１Ａおよび４１Ｂ、並びに合成回路４１Ｃで構成
することができる。

【００６５】この場合、ADRC回路４１Ａと４１Ｂは、ク
ラスタップを構成する復号データと付加情報をそれぞれ
KビットADRC処理し、その結果得られるADRCコードを、
合成回路４１Ｃに出力する。

【００６６】ここで、KビットADRC処理においては、例
えば、クラスタップを構成する情報の最大値MAXと最小
値MINが検出され、DR=MAX-MINを、集合の局所的なダイ
ナミックレンジとし、このダイナミックレンジDRに基づ
いて、クラスタップを構成する情報がKビットに再量子
化される。即ち、クラスタップを構成する各情報から、
最小値MINが減算され、その減算値がDR/2^Kで除算（量子
化）される。そして、以上のようにして得られる、クラ
スタップを構成する各情報のKビットの値を、所定の順
番で並べたビット列が、ADRCコードとして出力される。

【００６７】合成回路４１Ｃは、ADRC回路４１Ａが出力
する復号データのADRCコードと、ADRC回路４１Ｂが出力
する付加情報のADRCコードとを、１つのコードに合成
し、クラスコードとして出力する。

【００６８】ここで、後述するように、クラスタップを
構成する付加情報は、１種類とは限らないが、付加情報
が複数種類存在する場合には、ADRC回路４１Ｂでは、そ
の複数種類の付加情報それぞれについて、ADRC処理が行
われ、複数のADRCコードが出力される。そして、合成回
路４１Ｃでは、その複数のADRCコードから、１つのコー
ドが生成される。後述する図４（Ｂ）乃至図４（Ｃ）そ
れぞれに示すクラス分類部３３においても同様である。

【００６９】次に、クラス分類部３３は、例えば、図４
（Ｂ）に示すように、演算器４２Ａおよび４２Ｂと、図
４（Ａ）に示したADRC回路４１Ａおよび４１Ｂ、並びに
合成回路４１Ｃとから構成することもできる。

【００７０】即ち、この場合、演算器４２Ａは、クラス
タップを構成する第１復号データと、その第１復号デー
タに対応する第２復号データとの差分を演算し、その差
分値を、ADRC回路４１Ａに供給する。演算器４２Ｂは、
クラスタップを構成する第１付加情報と、その第１付加
情報に対応する第２付加情報との差分を演算し、その差
分値を、ADRC回路４１Ｂに出力する。

【００７１】ここで、第１復号データに対応する第２復
号データとは、例えば、復号データが画像である場合に
は、第１復号データとして得られた復号画素と同一の、
第２復号データとして得られた復号画素を意味する。即
ち、あるフレームｆにおける位置（ｘ，ｙ）における第
１復号データと第２復号データとしての復号画素を、そ
れぞれ、ｐ１（ｆ，ｘ，ｙ）とｐ２（ｆ，ｘ，ｙ）と表
すこととすると、第１復号データｐ１（ｆ，ｘ，ｙ）に
対応する第２復号データとは、ｐ２（ｆ，ｘ，ｙ）を意
味する。

【００７２】また、第１付加情報に対応する第２付加情
報とは、例えば、復号データが後述するCELP(Code Exci
ted Liner Prediction coding)方式で復号された音声デ
ータであり、かつ、付加情報が、その復号の過程で得ら
れる線形予測係数である場合には、第１付加情報として
得られた線形予測係数と同一次数の、第２付加情報とし
て得られた線形予測係数を意味する。即ち、あるフレー
ム（またはサブフレーム）ｆにおける第１復号データと
第２復号データとしての音声の復号に用いられる第ｐ次
の線形予測係数を、それぞれ、α１（ｆ，ｐ）とα２
（ｆ，ｐ）と表すこととすると、第１付加情報α１
（ｆ，ｐ）に対応する第２付加情報とは、α２（ｆ，
ｐ）を意味する。さらに、例えば、復号データが、後述
するJPEG方式で復号された画像データであり、かつ付加
情報が、その復号の過程で得られるDCT係数である場合
には、第１付加情報に対応する第２付加情報とは、第１
付加情報として得られたDCT係数と同一空間周波数成分
の、第２付加情報として得られたDCT係数を意味する。
即ち、あるフレームｆの、ある８×８のブロックｂにお
ける位置（ｘ，ｙ）の第１付加情報と第２付加情報とし
てのDCT係数を、それぞれ、ｄ１（ｆ，ｂ，ｘ，ｙ）と
ｄ２（ｆ，ｂ，ｘ，ｙ）と表すこととすると、第１付加
情報ｄ１（ｆ，ｂ，ｘ，ｙ）に対応する第２付加情報と
は、ｄ２（ｆ，ｂ，ｘ，ｙ）を意味する。

【００７３】以下、第１復号データと第２復号データの
差分値、および第１付加情報と第２付加情報との差分値
について、図４（Ａ）における場合と同様の処理が行わ
れ、クラスコードが求められる。

【００７４】さらに、クラス分類回路３３は、例えば、
図４（Ｃ）に示すように構成することも可能である。

【００７５】この場合も、図４（Ｂ）における場合と同
様に、演算器４２Ａにおいて、第１復号データと第２復
号データとの差分値が求められるとともに、演算器４２
Ｂにおいて、第１付加情報と第２付加情報との差分値が
求められる。

【００７６】第１復号データと第２復号データとの差分
値は、演算器４２Ａから極性判別回路４３Ｃに供給さ
れ、極性判別回路４３Ｃは、第１復号データと第２復号
データとの差分値の極性（符号）を判別し、その極性に
応じて、０または１を、合成回路４３Ｅに出力する。

【００７７】また、第１付加情報と第２付加情報との差
分値は、演算器４２Ｂから極性判別回路４３Ｄに供給さ
れ、極性判別回路４３Ｄは、第１付加情報と第２付加情
報との差分値の極性を判別し、やはり、その極性に応じ
て、０または１を、合成回路４３Ｅに出力する。

【００７８】合成回路４３Ｅは、極性判別回路４３Ｃと
４４Ｃそれぞれからの、極性に対応する０または１の系
列を、１つのコードに合成し、クラスコードとして出力
する。

【００７９】さらに、クラス分類部３３は、図４（Ｄ）
に示すように、遅延回路４４Ａおよび４４Ｂ、並びに演
算器４４Ｃおよび４４Ｄと、図４（Ａ）に示したADRC回
路４１Ａおよび４１Ｂ、並びに合成回路４１Ｃとから構
成することも可能である。

【００８０】この場合、遅延回路４４Ａは、クラスタッ
プを構成する復号データを、例えば、１サンプル分の時
間だけ遅延して、演算器４４Ｃに供給する。演算器４４
Ｃは、クラスタップを構成する復号データと、遅延回路
４４Ａからの、その復号データを遅延したものとの差分
を演算し、その差分値を、ADRC回路４１Ａに供給する。

【００８１】一方、遅延回路４４Ｂは、クラスタップを
構成する付加情報を、例えば、１サンプル分の時間だけ
遅延して、演算器４４Ｄに供給する。演算器４４Ｄは、
クラスタップを構成する付加情報と、遅延回路４４Ｂか
らの、その付加情報を遅延したものとの差分を演算し、
その差分値を、ADRC回路４１Ｂに供給する。

【００８２】以下、ADRC回路４１Ａおよび４１Ｂ、並び
に合成回路４１Ｃでは、上述の差分値を対象に、図４
（Ａ）における場合と同様の処理が行われ、クラスコー
ドが出力される。

【００８３】なお、クラス分類部３３は、その他、例え
ば、図４（Ａ）乃至図４（Ｄ）に示した回路のうちの任
意の２以上の出力を１つのコードに合成して出力する回
路によって構成することも可能である。

【００８４】さらに、クラス分類部３３は、図４に示し
た回路以外の回路によって構成することも可能である。
即ち、例えば、符号化データが、JPEGやMPEG符号化され
たもののような、その復号過程において、直交変換係数
の１つであるDCT(Discrete Cosine Transform)係数が得
られるものであり、クラスタップを構成する付加情報
に、そのようなDCT係数が含まれる場合には、クラス分
類部３３は、８×８のブロックのDCT係数から得られる
画像のアクティビティに基づくクラスコードを出力した
り、注目している画素のブロック内の位置に基づくクラ
スコードを出力したりするように構成することが可能で
ある。また、クラス分類部３３は、例えば、クラスタッ
プを構成する復号データや付加情報のベクトル量子化結
果を、クラスコードとして出力するように構成すること
等も可能である。

【００８５】次に、図５のフローチャートを参照して、
図２のデコーダ２の処理（復号処理）について説明す
る。

【００８６】復号部２１は、エンコーダ１における符号
化方式に対応する復号方式にしたがって、符号化データ
を復号し、その結果得られる第１復号データを、符号化
部２２とクラス分類適応処理回路２４に供給する。さら
に、復号部２１は、符号化データを復号する過程におい
て得られる情報を、第１付加情報として、クラス分類適
応処理回路２４に供給する。符号化部２２は、復号部２
１から供給される符号化データを再符号化し、その結果
得られる再符号化データを、復号部２３に供給する。復
号部２３は、復号部２１と同様にして、符号化部２２か
らの再符号化データを復号し、その結果得られる第２復
号データを、クラス分類適応処理回路２４に供給する。
さらに、復号部２３は、再符号化データを復号する過程
において得られる情報を、第２付加情報として、クラス
分類適応処理回路２４に供給する。

【００８７】クラス分類適応処理回路２４（図３）で
は、ステップＳ１において、タップ生成部３１が、そこ
に供給される第１復号データを、順次、注目データと
し、例えば、その注目データに対して、時間的または空
間的に近い位置にある第１復号データ、注目データに対
応する第２復号データに対して、時間的または空間的に
近い位置にある第２復号データ、注目データの復号過程
で得られた第１付加情報、注目データに対応する第２復
号データの復号過程で得られた第２付加情報から、注目
データについての予測タップを生成し、予測部３５に出
力する。さらに、ステップＳ１では、タップ生成部３２
が、例えば、タップ生成部３１と同様にして、注目デー
タについてのクラスタップを生成し、クラス分類部３３
に出力する。

【００８８】そして、ステップＳ２に進み、クラス分類
部３３は、タップ生成部３２から供給されるクラスタッ
プに基づいて、クラス分類を行い、その結果得られるク
ラスコードを、係数メモリ３４に供給して、ステップＳ
３に進む。

【００８９】ステップＳ３では、係数メモリ３４は、ク
ラス分類部３３から供給されるクラスコードに対応する
アドレスから、タップ係数を読み出し、予測部３５に供
給する。

【００９０】そして、ステップＳ４に進み、予測部３５
は、係数メモリ３４が出力するタップ係数を取得し、そ
のタップ係数と、タップ生成部３１からの予測タップと
を用いて、式（１）に示した積和演算を行い、注目デー
タを高品質にしたデータ（の予測値）を得て、ステップ
Ｓ５に進む。

【００９１】ステップＳ５では、まだ、注目データとし
て処理すべき第１復号データがあるかどうかが判定さ
れ、あると判定された場合、ステップＳ１に戻り、次に
注目データとすべき第１復号データを、新たに注目デー
タとして、以下、同様の処理を繰り返す。また、ステッ
プＳ５において、注目データとして処理すべきデータが
ないと判定された場合、処理を終了する。

【００９２】次に、図６は、図３の係数メモリ３４に記
憶させるタップ係数の学習処理を行う学習装置の一実施
の形態の構成例を示している。

【００９３】学習装置には、図１のエンコーダ１におい
て符号化の対象とされるデータの、例えば、高品質のも
のが、学習用データとして供給される。この学習用デー
タは、学習の教師となる教師データとして、生徒データ
生成部５１と正規方程式加算回路６０に供給される。

【００９４】生徒データ生成部５１は、そこに供給され
る教師データから、学習の生徒となる生徒データを生成
する。

【００９５】即ち、生徒データ生成部５１は、符号化部
５２、媒体特性反映部５３、復号部５４、符号化部５
５、および復号部５６から構成される。

【００９６】符号化部５２は、教師データを、図１のエ
ンコーダ１と同様にして符号化し、その結果得られる符
号化データを、媒体特性反映部５３に供給する。媒体特
性反映部５３は、図１の記録媒体３または伝送媒体４を
介することによって信号に付加される雑音等を、符号化
部５２からの符号化データに付加し（反映し）、復号部
５４に供給する。

【００９７】復号部５４、符号化部５５、復号部５６
は、図２に示したデコーダ２の復号部２１、符号化部２
２、復号部２３とそれぞれ同様に構成される。従って、
復号部５４、符号化部５５、復号部５６では、媒体特性
反映部５３が出力する符号化データが、図２の復号部２
１、符号化部２２、復号部２３それぞれにおける場合と
同様に処理され、その結果、復号部５４は、第１復号デ
ータおよび第１付加情報を、復号部５６は、第２復号デ
ータおよび第２付加情報を、それぞれ、生徒データとし
て出力する。この生徒データとしての第１復号データお
よび第１付加情報、並びに第２復号データおよび第２付
加情報は、タップ生成部５７および５８に供給される。

【００９８】なお、図２のデコーダ２は、上述したよう
に、復号部２３の後段に、符号化部２２と復号部２３の
セットと同様のセットを、１以上設けて構成することが
できるが、この場合、図６の学習装置の生徒データ生成
部５１は、デコーダ２と同様に、復号部５４の後段に、
符号化部５５と復号部５６のセットと同様のセットを、
１以上設けて構成する必要がある。

【００９９】タップ生成部５７は、図３のクラス分類適
応処理回路２４のタップ生成部３１と同様に構成され、
そこに供給される生徒データとしての第１復号データお
よび第１付加情報、並びに第２復号データおよび第２付
加情報から、タップ生成部３１における場合と同様にし
て、予測タップを生成し、正規方程式加算回路６０に供
給する。

【０１００】タップ生成部５８は、図３のクラス分類適
応処理回路２４のタップ生成部３２と同様に構成され、
そこに供給される生徒データとしての第１復号データお
よび第１付加情報、並びに第２復号データおよび第２付
加情報から、タップ生成部３２における場合と同様にし
て、クラスタップを生成し、クラス分類部５９に供給す
る。

【０１０１】クラス分類部５９は、タップ生成部５８か
ら供給されるクラスタップに基づいて、図３のクラス分
類適応処理回路２４のクラス分類部３３における場合と
同様のクラス分類を行い、その結果得られるクラスコー
ドを、正規方程式加算回路６０に供給する。

【０１０２】正規方程式加算回路６０は、そこに供給さ
れる教師データを、順次、注目教師データとして、タッ
プ生成部５７から供給される、注目教師データについて
生成された予測タップと、注目教師データを対象とした
足し込みを、クラス分類部５９から供給されるクラスコ
ードが表すクラスごとに行う。

【０１０３】即ち、正規方程式加算回路６０は、クラス
分類部５９から供給されるクラスコードに対応するクラ
スごとに、予測タップ（生徒データ）を用い、式（８）
の行列Ａにおける各コンポーネントとなっている、生徒
データどうしの乗算（ｘ_inｘ _im）と、サメーション
（Σ）に相当する演算を行う。

【０１０４】さらに、正規方程式加算回路６０は、やは
り、クラス分類部５９から供給されるクラスコードに対
応するクラスごとに、予測タップ（生徒データ）および
注目教師データを用い、式（８）のベクトルｖにおける
各コンポーネントとなっている、生徒データと注目教師
データの乗算（ｘ_inｙ_i）と、サメーション（Σ）に相
当する演算を行う。

【０１０５】正規方程式加算回路６０は、以上の足し込
みを、そこに供給される教師データすべてを注目教師デ
ータとして行い、これにより、各クラスについて、式
（８）に示した正規方程式をたてる。

【０１０６】タップ係数決定回路６１は、正規方程式加
算回路６０においてクラスごとに生成された正規方程式
を解くことにより、クラスごとに、タップ係数を求め、
係数メモリ６２の、各クラスに対応するアドレスに供給
する。

【０１０７】なお、学習用データの量や内容等によって
は、正規方程式加算回路６０において、タップ係数を求
めるのに必要な数の正規方程式が得られないクラスが生
じる場合があり得るが、タップ係数決定回路６１は、そ
のようなクラスについては、例えば、デフォルトのタッ
プ係数を出力する。

【０１０８】係数メモリ６２は、タップ係数決定回路６
１から供給されるクラスごとのタップ係数を記憶する。

【０１０９】次に、図７のフローチャートを参照して、
図６の学習装置の処理（学習処理）について説明する。

【０１１０】学習装置には、学習用データが供給され、
この学習用データは、教師データとして、生徒データ生
成部５１と正規方程式加算回路６０に供給される。そし
て、ステップＳ１１において、生徒データ生成部５１
は、教師データから、生徒データを生成する。

【０１１１】即ち、ステップＳ１１では、符号化部５２
が、教師データを、図１のエンコーダ１と同様に符号化
し、その結果得られる符号化データを、媒体特性反映部
５３を介して、復号部５４に供給する。復号部５４は、
そこに供給される符号化データを復号し、その結果得ら
れる第１復号データを、符号化部５５に供給するととも
に、生徒データとして、タップ生成部５７および５８に
供給する。また、復号部５４は、符号化データを第１復
号データに復号する過程において得られる第１付加情報
も、生徒データとして、タップ生成部５７および５８に
供給する。

【０１１２】さらに、ステップＳ１１では、符号化部５
５が、復号部５４からの第１復号データを再符号化し、
その結果得られる再符号化データを、復号部５６に供給
する。復号部５６は、符号化部５５からの再符号化デー
タを復号し、その結果得られる第２復号データと、再符
号化データを第２復号データに復号する過程において得
られる第２付加情報を、生徒データとして、タップ生成
部５７および５８に供給する。

【０１１３】その後、正規方程式加算回路６０におい
て、そこに供給される教師データが注目教師データとさ
れ、ステップＳ１２に進み、タップ生成部５７と５８
が、そこに供給される生徒データから、注目教師データ
について、予測タップとクラスタップを、それぞれ生成
する。タップ生成部５７で生成された予測タップは、正
規方程式加算回路６１に供給され、タップ生成部５８で
生成されたクラスタップは、クラス分類部５９に供給さ
れる。

【０１１４】そして、ステップＳ１３に進み、クラス分
類部５９が、タップ生成部５８からのクラスタップに基
づいて、クラス分類を行い、その結果得られるクラスコ
ードを、正規方程式加算回路６０に供給して、ステップ
Ｓ１４に進む。

【０１１５】ステップＳ１４では、正規方程式加算回路
６０は、クラス分類部５９から供給されるクラスコード
が表すクラスについて、そこに供給される注目教師デー
タと、タップ生成部５７から供給される予測タップを構
成する生徒データを対象とした、式（８）の行列Ａとベ
クトルｖの、上述したような足し込みを行い、ステップ
Ｓ１５に進む。

【０１１６】ステップＳ１５では、まだ、注目教師デー
タとして処理すべき教師データがあるかどうかが判定さ
れ、あると判定された場合、ステップＳ１１に戻り、例
えば、次に供給される教師データを新たに注目教師デー
タとして、以下、同様の処理が繰り返される。

【０１１７】また、ステップＳ１５において、注目教師
データとして処理すべき教師データがないと判定された
場合、即ち、例えば、正規方程式加算回路６０におい
て、各クラスについて、正規方程式が得られた場合、ス
テップＳ１６に進み、タップ係数決定回路６１は、各ク
ラスごとに生成された正規方程式を解くことにより、各
クラスごとのタップ係数を求め、係数メモリ６２の、各
クラスに対応するアドレスに供給して記憶させ、処理を
終了する。

【０１１８】以上のようにして、係数メモリ６２に記憶
された各クラスごとのタップ係数が、図３の係数メモリ
３４に記憶されている。

【０１１９】従って、図３の係数メモリ３４に記憶され
たタップ係数は、線形予測演算を行うことにより得られ
る、学習用データと同様の品質のデータの予測値につい
て、その予測誤差（ここでは、自乗誤差）が、統計的に
最小になるように学習を行うことにより求められたもの
であるから、図３の予測部３５が出力する最終的な復号
データは、学習用データと同様の品質のものとなる。

【０１２０】次に、図８は、図１のデータ伝送システム
が、音声信号（音声データ）をCELP（例えば、VSELP(Ve
ctor Sum Excited Liner Prediction)，PSI-CELP(Pitch
Synchronous Innovation CELP)，CS-ACELP(Conjugate
Structure Algebraic CELP)等の各種のCELPを含む）方
式で符号化して伝送する場合の、図１のエンコーダ１の
構成例を示している。なお、上述したことから、図１の
エンコーダ１が図８に示すように構成される場合は、図
２の符号化部２２並びに図６の符号化部５２および５５
も、図８に示したのと同様に構成される。

【０１２１】符号化の対象となる音声信号（人の発話の
他、曲等の信号も含む）は、例えば、アナログの音声信
号を、８ｋＨｚ等のサンプリング周波数でサンプリング
することにより、ディジタルの音声信号にＡ／Ｄ変換
し、さらに、所定のビット数で量子化を行って得られた
もので、演算器７１とＬＰＣ(Liner Prediction Coeffi
cient)分析部７２に供給される。

【０１２２】ＬＰＣ分析部７２は、そこに供給される符
号化対象の音声信号を、例えば、１６０サンプル分の長
さのフレームごとにＬＰＣ分析し、Ｐ次の線形予測係数
α₁，α₂，・・・，α_Pを求める。そして、ＬＰＣ分析
部７２は、このＰ次の線形予測係数α_p（ｐ＝１，２，
・・・，Ｐ）を要素とするベクトルを、音声の特徴ベク
トルとして、ベクトル量子化部７３に供給する。

【０１２３】ベクトル量子化部７３は、線形予測係数を
要素とするコードベクトルとコードとを対応付けたコー
ドブックを記憶しており、そのコードブックに基づい
て、ＬＰＣ分析部７２からの特徴ベクトルαをベクトル
量子化し、そのベクトル量子化の結果得られるコード
（以下、適宜、Ａコード(A_code)という）を、コード決
定部８３に供給する。

【０１２４】さらに、ベクトル量子化部７３は、Ａコー
ドに対応するコードベクトルα’を構成する要素となっ
ている線形予測係数α₁’，α₂’，・・・，α_P’を、
音声合成フィルタ７４に供給する。

【０１２５】音声合成フィルタ７４は、例えば、ＩＩＲ
(Infinite Impulse Response)型のディジタルフィルタ
で、ベクトル量子化部７３からの線形予測係数α_p’
（ｐ＝１，２，・・・，Ｐ）をＩＩＲフィルタのタップ
係数とするとともに、演算器８２から供給される残差信
号ｅを入力信号として、音声合成を行う。

【０１２６】即ち、ＬＰＣ分析部７２で行われるＬＰＣ
分析は、現在時刻ｎの音声信号（のサンプル値）ｓ_n、
およびこれに隣接する過去のＰ個のサンプル値ｓ_n-1，
ｓ_n-2，・・・，ｓ_n-Pに、式ｓ_n＋α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P＝e_n ・・・（９）で示す線形１次結合が成立すると仮定し、現在時刻ｎの
サンプル値ｓ_nの予測値（線形予測値）ｓ_n’を、過去の
Ｐ個の標本値ｓ_n-1，ｓ_n-2，・・・，ｓ_n-Pを用いて、
式ｓ_n’＝−（α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P）・・・（１０）によって線形予測したときに、実際のサンプル値ｓ_nと
線形予測値ｓ_n’との間の自乗誤差を最小にする線形予
測係数α_pを求めるものである。

【０１２７】ここで、式（９）において、｛e_n｝（・・
・，e_n-1，e_n，e_n+1，・・・）は、平均値が０で、分散
が所定値σ²の互いに無相関な確率変数である。

【０１２８】式（９）から、サンプル値ｓ_nは、式ｓ_n＝e_n−（α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P）・・・（１１）で表すことができ、これを、Ｚ変換すると、次式が成立
する。

【０１２９】Ｓ＝Ｅ／（１＋α₁ｚ^-1＋α₂ｚ^-2＋・・・＋α_Pｚ^-P）・・・（１２）但し、式（１２）において、ＳとＥは、式（１１）にお
けるｓ_nとｅ_nのＺ変換を、それぞれ表す。

【０１３０】ここで、式（９）および（１０）から、ｅ
_nは、式ｅ_n＝ｓ_n−ｓ_n’・・・（１３）で表すことができ、実際のサンプル値ｓ_nと線形予測値
ｓ_n’との間の残差信号と呼ばれる。

【０１３１】従って、式（１２）から、線形予測係数α
_pをＩＩＲフィルタのタップ係数とするとともに、残差
信号ｅ_nをＩＩＲフィルタの入力信号とすることによ
り、音声信号ｓ_nを求めることができる。

【０１３２】そこで、音声合成フィルタ７４は、上述し
たように、ベクトル量子化部７３からの線形予測係数α
_p’をタップ係数とするとともに、演算器８２から供給
される残差信号ｅを入力信号として、式（１２）を演算
し、音声信号（合成音信号）ｓｓを求める。

【０１３３】なお、音声合成フィルタ７４では、ＬＰＣ
分析部７２によるＬＰＣ分析の結果得られる線形予測係
数α_pではなく、そのベクトル量子化の結果得られるコ
ードに対応するコードベクトルとしての線形予測係数α
_p’が用いられるため、音声合成フィルタ７４が出力す
る合成音信号は、LPC分析前の音声信号とは、基本的に
同一にはならない。

【０１３４】音声合成フィルタ７４が出力する合成音信
号ｓｓは、演算器７１に供給される。演算器７１は、音
声合成フィルタ７４からの合成音信号ｓｓから、元の音
声信号ｓを減算し、その減算値を、自乗誤差演算部７５
に供給する。自乗誤差演算部７５は、演算器７１からの
減算値の自乗和（第ｋフレームのサンプル値についての
自乗和）を演算し、その結果得られる自乗誤差を、自乗
誤差最小判定部７６に供給する。

【０１３５】自乗誤差最小判定部７６は、自乗誤差演算
部７５が出力する自乗誤差に対応付けて、ラグを表すコ
ードとしてのＬコード(L_code)、ゲインを表すコードと
してのＧコード(G_code)、および符号語（励起コードブ
ック）を表すコードとしてのＩコード(I_code)を記憶し
ており、自乗誤差演算部７５が出力する自乗誤差に対応
するＬコード、Ｇコード、およびＬコードを出力する。
Ｌコードは、適応コードブック記憶部７７に、Ｇコード
は、ゲイン復号器７８に、Ｉコードは、励起コードブッ
ク記憶部７９に、それぞれ供給される。さらに、Ｌコー
ド、Ｇコード、およびＩコードは、コード決定部８３に
も供給される。

【０１３６】適応コードブック記憶部７７は、例えば７
ビットのＬコードと、所定の遅延時間（ラグ）とを対応
付けた適応コードブックを記憶しており、演算器８２か
ら供給される残差信号ｅを、自乗誤差最小判定部７６か
ら供給されるＬコードに対応付けられた遅延時間だけ遅
延して、演算器８０に出力する。

【０１３７】ここで、適応コードブック記憶部７７は、
残差信号ｅを、Ｌコードに対応する時間だけ遅延して出
力することから、その出力信号は、その遅延時間を周期
とする周期信号に近い信号となる。この信号は、線形予
測係数を用いた音声合成において、主として、有声音の
合成音を生成するための駆動信号となる。

【０１３８】ゲイン復号器７８は、Ｇコードと、所定の
ゲインβおよびγとを対応付けたテーブルを記憶してお
り、自乗誤差最小判定部７６から供給されるＧコードに
対応付けられたゲインβおよびγを出力する。ゲインβ
とγは、演算器８０と８１に、それぞれ供給される。こ
こで、ゲインβは、長期フィルタ状態出力ゲインと呼ば
れるものであり、また、ゲインγは、励起コードブック
ゲインと呼ばれるものである。

【０１３９】励起コードブック記憶部７９は、例えば９
ビットのＩコードと、所定の励起信号とを対応付けた励
起コードブックを記憶しており、自乗誤差最小判定部７
６から供給されるＩコードに対応付けられた励起信号
を、演算器８１に出力する。

【０１４０】ここで、励起コードブックに記憶されてい
る励起信号は、例えば、ホワイトノイズ等に近い信号で
あり、線形予測係数を用いた音声合成において、主とし
て、無声音の合成音を生成するための駆動信号となる。

【０１４１】演算器８０は、適応コードブック記憶部７
７の出力信号と、ゲイン復号器７８が出力するゲインβ
とを乗算し、その乗算値ｌを、演算器８２に供給する。
演算器８１は、励起コードブック記憶部７９の出力信号
と、ゲイン復号器７８が出力するゲインγとを乗算し、
その乗算値ｎを、演算器８２に供給する。演算器８２
は、演算器８０からの乗算値ｌと、演算器８１からの乗
算値ｎとを加算し、その加算値を、残差信号ｅとして、
音声合成フィルタ７４と適応コードブック記憶部７７に
供給する。

【０１４２】音声合成フィルタ７４では、以上のように
して、演算器８２から供給される残差信号ｅを入力信号
が、ベクトル量子化部７３から供給される線形予測係数
α_p’をタップ係数とするＩＩＲフィルタでフィルタリ
ングされ、その結果得られる合成音信号が、演算器７１
に供給される。そして、演算器７１および自乗誤差演算
部７５において、上述の場合と同様の処理が行われ、そ
の結果得られる自乗誤差が、自乗誤差最小判定部７６に
供給される。

【０１４３】自乗誤差最小判定部７６は、自乗誤差演算
部７５からの自乗誤差が最小（極小）になったかどうか
を判定する。そして、自乗誤差最小判定部７６は、自乗
誤差が最小になっていないと判定した場合、上述のよう
に、その自乗誤差に対応するＬコード、Ｇコード、およ
びＬコードを出力し、以下、同様の処理が繰り返され
る。

【０１４４】一方、自乗誤差最小判定部７６は、自乗誤
差が最小になったと判定した場合、確定信号を、コード
決定部８３に出力する。コード決定部８３は、ベクトル
量子化部７３から供給されるＡコードをラッチするとと
もに、自乗誤差最小判定部７６から供給されるＬコー
ド、Ｇコード、およびＩコードを順次ラッチするように
なっており、自乗誤差最小判定部７６から確定信号を受
信すると、そのときラッチしているＡコード、Ｌコー
ド、Ｇコード、およびＩコードを、チャネルエンコーダ
８４に供給する。チャネルエンコーダ８４は、コード決
定部８３からのＡコード、Ｌコード、Ｇコード、および
Ｉコードを多重化し、その多重化結果であるコードデー
タを、符号化データとして出力する。

【０１４５】なお、以下では、説明を簡単にするため、
Ａコード、Ｌコード、Ｇコード、およびＩコードは、フ
レームごとに求められるものとする。但し、例えば、１
フレームを、４つのサブフレームに分割し、Ｌコード、
Ｇコード、およびＩコードは、サブフレームごとに求め
るようにすること等が可能である。

【０１４６】ここで、図８（後述する図９においても同
様）では、各変数に、[k]が付され、配列変数とされて
いる。このkは、フレーム数を表すが、明細書中では、
その記述は、適宜省略する。

【０１４７】次に、図９は、図１のエンコーダ１が図８
に示したように構成される場合の、図２の復号部２１の
構成例を示している。なお、上述したことから、図２の
復号部２１が図９に示すように構成される場合は、図２
の復号部２３、並びに図６の復号部５４および５６も、
図９に示したのと同様に構成される。

【０１４８】図８のエンコーダ１が出力する符号化デー
タとしてのコードデータは、チャネルデコーダ９１で受
信される。チャネルデコーダ９１は、コードデータか
ら、Ｌコード、Ｇコード、Ｉコード、Ａコードを分離
し、それぞれを、適応コードブック記憶部９２、ゲイン
復号器９３、励起コードブック記憶部９４、フィルタ係
数復号器９５に供給する。

【０１４９】適応コードブック記憶部９２、ゲイン復号
器９３、励起コードブック記憶部９４、演算器９６乃至
９８は、図８の適応コードブック記憶部７７、ゲイン復
号器７８、励起コードブック記憶部７９、演算器８０乃
至８２とそれぞれ同様に構成されるもので、図８で説明
した場合と同様の処理が行われることにより、Ｌコー
ド、Ｇコード、およびＩコードが、残差信号ｅに復号さ
れる。この残差信号ｅは、音声合成フィルタ９９に対し
て、入力信号として与えられるとともに、適応コードブ
ック記憶部９２に供給される。

【０１５０】フィルタ係数復号器９５は、図８のベクト
ル量子化部７３が記憶しているのと同一のコードブック
を記憶しており、Ａコードを、線形予測係数α_p’に復
号し、音声合成フィルタ９９に供給する。

【０１５１】音声合成フィルタ９９は、図８の音声合成
フィルタ７４と同様に構成されており、フィルタ係数復
号器９５からの線形予測係数α_p’をタップ係数とする
とともに、演算器９８から供給される残差信号ｅを入力
信号として、式（１２）を演算し、これにより、図８の
自乗誤差最小判定部７６において自乗誤差が最小と判定
されたときの合成音信号を生成する。この合成音信号
は、符号化データの復号結果（復号データ）として出力
される。

【０１５２】一方、付加情報出力部１００は、上述のよ
うに、符号化データを、復号データとしての合成音信号
に復号する過程において得られる情報を取得し、その情
報のうちの一部または全部を、付加情報として出力す
る。

【０１５３】即ち、付加情報出力部１００には、チャネ
ルデコーダ９１が出力するＬコード、Ｇコード、Ｉコー
ド、およびＡコードや、ゲイン復号器９３が出力するゲ
インβおよびγ、フィルタ係数復号器９５が出力する線
形予測係数α_p、演算器９６が出力する演算結果l、演算
器９７が出力する演算結果γ、演算器９８が出力する残
差信号e等が供給されるようになっており、付加情報出
力部１００は、これらの情報のうちの一部または全部
を、付加情報として出力する。

【０１５４】次に、図１０は、図１のデータ伝送システ
ムが、静止画の画像データをJPEG方式で符号化して伝送
する場合の、図１のエンコーダ１の構成例を示してい
る。なお、図１のエンコーダ１が図１０に示すように構
成される場合は、図２の符号化部２２並びに図６の符号
化部５２および５５も、図１０に示したのと同様に構成
される。

【０１５５】符号化対象の画像データは、ブロック化回
路１１１に入力され、ブロック化回路１１１は、そこに
入力される画像データを、８×８画素の６４画素でなる
ブロックに分割する。ブロック化回路１１１で得られる
各ブロックは、ＤＣＴ回路１１２に供給される。ＤＣＴ
回路１１２は、ブロック化回路１１１からのブロックに
対して、ＤＣＴ（離散コサイン変換）処理を施し、１個
のＤＣ(Direct Current)成分と、水平方向および垂直方
向についての６３個の周波数成分（ＡＣ(Alternating C
urrent)成分）の、合計６４個のＤＣＴ係数に変換す
る。各ブロックごとの６４個のＤＣＴ係数は、ＤＣＴ回
路１１２から量子化回路１１３に供給される。

【０１５６】量子化回路１１３は、所定の量子化テーブ
ルにしたがって、ＤＣＴ回路１１２からのＤＣＴ係数を
量子化し、その量子化結果（以下、適宜、量子化ＤＣＴ
係数という）を、量子化に用いた量子化テーブルととも
に、エントロピー符号化回路１１４に供給する。

【０１５７】ここで、量子化回路１１３において用いら
れる量子化テーブルには、一般に、人間の視覚特性を考
慮して、重要性の高い低周波数のＤＣＴ係数は細かく量
子化し、重要性の低い高周波数のＤＣＴ係数は粗く量子
化するような量子化ステップが設定されており、これに
より、画像の画質の劣化を抑えて、効率の良い圧縮が行
われるようになっている。

【０１５８】また、ＪＰＥＧ符号化において、どのよう
な量子化テーブルを用いるかは、例えば、ユーザが設定
する圧縮率等に基づいて決定される。

【０１５９】エントロピー符号化回路１１４は、量子化
回路１１３からの量子化ＤＣＴ係数に対して、例えば、
ハフマン符号化等のエントロピー符号化処理を施して、
量子化回路１１３からの量子化テーブルを付加し、その
結果得られる符号化データを出力する。

【０１６０】次に、図１１は、図１のエンコーダ１が図
１０に示したように構成される場合の、図２の復号部２
１の構成例を示している。なお、図２の復号部２１が図
１１に示すように構成される場合は、図２の復号部２
３、並びに図６の復号部５４および５６も、図１１に示
したのと同様に構成される。

【０１６１】符号化データは、エントロピー復号回路１
２１に入力され、エントロピー復号回路１２１は、符号
化データを、エントロピー符号化された量子化ＤＣＴ係
数と、量子化テーブルとに分離する。さらに、エントロ
ピー復号回路１２１は、エントロピー符号化された量子
化ＤＣＴ係数をエントロピー復号し、その結果得られる
量子化ＤＣＴ係数を、量子化テーブルとともに、逆量子
化回路１２２に供給する。逆量子化回路１２２は、エン
トロピー復号回路１２１からの量子化ＤＣＴ係数を、同
じくエントロピー復号回路１２１からの量子化テーブル
にしたがって逆量子化し、その結果得られるＤＣＴ係数
を、逆ＤＣＴ回路１２３に供給する。逆ＤＣＴ回路１２
３は、逆量子化回路１２からのＤＣＴ係数に、逆ＤＣＴ
処理を施し、その結果得られる８×８画素の復号ブロッ
クを、ブロック分解回路１２４に供給する。ブロック分
解回路１２４は、逆ＤＣＴ回路１２３からの復号ブロッ
クのブロック化を解くことで、復号画像データを得て出
力する。

【０１６２】一方、付加情報出力部１２５は、上述のよ
うに、符号化データを、復号画像データに復号する過程
において得られる情報を取得し、その情報のうちの一部
または全部を、付加情報として出力する。

【０１６３】即ち、付加情報出力部１２５には、エント
ロピー復号回路１２１が出力する量子化テーブルおよび
量子化ＤＣＴ係数や、逆量子化回路１２２が出力するＤ
ＣＴ係数等が供給されるようになっており、付加情報出
力部１２５は、これらの情報のうちの一部または全部
を、付加情報として出力する。

【０１６４】次に、図１２は、図１のデータ伝送システ
ムが、動画の画像データをMPEG2方式で符号化して伝送
する場合の、図１のエンコーダ１の構成例を示してい
る。なお、図１のエンコーダ１が図１２に示すように構
成される場合は、図２の符号化部２２並びに図６の符号
化部５２および５５も、図１２に示したのと同様に構成
される。

【０１６５】ＭＰＥＧ符号化の対象である動画を構成す
るフレーム（またはフィールド）は、順次、動き検出回
路１３１と演算器１３２に供給される。

【０１６６】動き検出回路１３１は、そこに供給される
フレームについて、マクロブロック単位で、動きベクト
ルを検出し、エントロピー符号化回路１３６および動き
補償回路１４０に供給する。

【０１６７】演算器１３２は、そこに供給される画像
が、Ｉ(Intra)ピクチャであれば、そのままブロック化
回路１３３に供給し、Ｐ(Predictive)またはＢ(Bidirec
tionally predictive)ピクチャであれば、動き補償回路
１４０から供給される参照画像との差分を演算して、そ
の差分値を、ブロック化回路１３３に供給する。

【０１６８】ブロック化回路１３３は、演算器１３２の
出力を、８×８画素の画素ブロックにブロック化し、Ｄ
ＣＴ回路１３４に供給する。ＤＣＴ回路１３４は、ブロ
ック化回路１３３からの画素ブロックをＤＣＴ処理し、
その結果得られるＤＣＴ係数を、量子化回路１３５に供
給する。量子化回路１３５は、ＤＣＴ回路１３３からの
ブロック単位のＤＣＴ係数を所定の量子化テーブルにし
たがって量子化し、その結果得られる量子化ＤＣＴ係数
を、用いた量子化テーブルとともに、エントロピー符号
化回路１３６に供給する。エントロピー符号化回路１３
６は、量子化回路１３５からの量子化ＤＣＴ係数をエン
トロピー符号化し、動き検出回路１３１からの動きベク
トルや、量子化回路１３５からの量子化テーブル、その
他の必要な情報（例えば、MPEGストリームの各レイヤの
ヘッダとなる情報など）を付加して、その結果得られる
符号化データを、ＭＰＥＧ符号化結果として出力する。

【０１６９】量子化回路１３５が出力する量子化ＤＣＴ
係数のうち、ＩピクチャおよびＰピクチャは、後で符号
化されるＰピクチャやＢピクチャの参照画像として用い
るのにローカルデコードする必要があるため、エントロ
ピー符号化回路１３６の他、逆量子化回路１３７にも供
給される。また、逆量子化回路１３７には、量子化回路
１３５で用いられた量子化テーブルも供給される。

【０１７０】逆量子化回路１３７は、量子化回路１３５
からの量子化ＤＣＴ係数を、同じく量子化回路１３５か
らの量子化テーブルにしたがって逆量子化することによ
り、ＤＣＴ係数とし、逆ＤＣＴ回路１３８に供給する。
逆ＤＣＴ回路１３８は、逆量子化回路１３７からのＤＣ
Ｔ係数を逆ＤＣＴ処理し、演算器１３９に出力する。演
算器１３９には、逆ＤＣＴ回路１３８の出力の他、動き
補償回路１４０が出力する参照画像も供給されるように
なっており、演算器１３９は、逆ＤＣＴ回路１３８の出
力が、Ｐピクチャのものである場合には、その出力と、
動き補償回路１４０の出力とを加算することで、元の画
像を復号し、動き補償回路１４０に供給する。また、演
算器１３９は、逆ＤＣＴ回路１３８の出力が、Ｉピクチ
ャのものである場合には、その出力は、Ｉピクチャの復
号画像となっているので、そのまま、動き補償回路１４
０に供給する。

【０１７１】動き補償回路１４０は、演算器１３９から
供給される、ローカルデコードされた画像に対して、動
き検出回路１３１からの動きベクトルにしたがった動き
補償を施し、その動き補償後の画像を、参照画像とし
て、演算器１３２および９９に供給する。

【０１７２】次に、図１３は、図１のエンコーダ１が図
１２に示したように構成される場合の、図２の復号部２
１の構成例を示している。なお、図２の復号部２１が図
１３に示すように構成される場合は、図２の復号部２
３、並びに図６の復号部５４および５６も、図１３に示
したのと同様に構成される。

【０１７３】符号化データは、エントロピー復号回路１
５１に供給され、エントロピー復号回路１５１は、符号
化データをエントロピー復号し、量子化ＤＣＴ係数を得
るとともに、その符号化データに含まれる動きベクト
ル、量子化テーブル、その他の必要な情報を分離する。
そして、量子化ＤＣＴ係数および量子化テーブルは、逆
量子化回路１５２に供給され、動きベクトルは、動き補
償回路１５６に供給される。

【０１７４】逆量子化回路１５２は、エントロピー復号
回路１５１からの量子化ＤＣＴ係数を、同じくエントロ
ピー復号回路１１からの量子化テーブルにしたがって逆
量子化することにより、ＤＣＴ係数とし、逆ＤＣＴ回路
１５３に供給する。逆ＤＣＴ回路１５３は、逆量子化回
路１５２からのＤＣＴ係数を逆ＤＣＴ処理し、演算器１
５４に出力する。演算器１５４には、逆量子化回路１５
３の出力の他、動き補償回路１５６が出力する、既に復
号されたＩピクチャまたはＰピクチャを、エントロピー
復号回路１５１からの動きベクトルにしたがって動き補
償したものが参照画像として供給されるようになってお
り、演算器１５４は、逆ＤＣＴ回路１５３の出力が、Ｐ
またはＢピクチャのものである場合には、その出力と、
動き補償回路１５６の出力とを加算することで、元の画
像を復号し、ブロック分解回路１５５に供給する。ま
た、演算器１５４は、逆ＤＣＴ回路１５３の出力が、Ｉ
ピクチャのものである場合には、その出力は、Ｉピクチ
ャの復号画像となっているので、そのまま、ブロック分
解回路１５５に供給する。

【０１７５】ブロック分解回路１５５は、演算器１５４
から画素ブロック単位で供給される復号画像のブロック
化を解くことで、復号画像データを得て出力する。

【０１７６】また、動き補償回路１５６は、演算器１５
４が出力する復号画像のうちのＩピクチャとＰピクチャ
を受信し、エントロピー復号回路１５１からの動きベク
トルにしたがった動き補償を施す。そして、動き補償回
路１５６は、その動き補償後の画像を、参照画像とし
て、演算器１５４に供給する。

【０１７７】一方、付加情報出力部１５７は、上述のよ
うに、符号化データを、復号画像データに復号する過程
において得られる情報を取得し、その情報のうちの一部
または全部を、付加情報として出力する。

【０１７８】即ち、付加情報出力部１５７には、エント
ロピー復号回路１５１が出力する量子化テーブル、量子
化ＤＣＴ係数、および動きベクトルや、逆量子化回路１
２２が出力するＤＣＴ係数が供給されるようになってい
る。さらに、付加情報出力部１５７には、エントロピー
復号回路１５１が符号化データをエントロピー復号する
ことにより得られるMPEGストリームの各レイヤに配置さ
れた情報（例えば、ピクチャタイプや、ブロックの位置
情報、フレームＤＣＴモード／フィールドＤＣＴモード
の別など）も供給されるようになっている。付加情報出
力部１５７は、これらの情報のうちの一部または全部
を、付加情報として出力する。

【０１７９】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。

【０１８０】そこで、図１４は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。

【０１８１】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク２０５やＲＯＭ２
０３に予め記録しておくことができる。

【０１８２】あるいはまた、プログラムは、フロッピー
（登録商標）ディスク、CD-ROM(Compact Disc Read Onl
y Memory)，MO(Magneto optical)ディスク，DVD(Digita
l Versatile Disc)、磁気ディスク、半導体メモリなど
のリムーバブル記録媒体２１１に、一時的あるいは永続
的に格納（記録）しておくことができる。このようなリ
ムーバブル記録媒体２１１は、いわゆるパッケージソフ
トウエアとして提供することができる。

【０１８３】なお、プログラムは、上述したようなリム
ーバブル記録媒体２１１からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部２０８で受信し、内蔵するハード
ディスク２０５にインストールすることができる。

【０１８４】コンピュータは、CPU(Central Processing
Unit)２０２を内蔵している。CPU２０２には、バス２
０１を介して、入出力インタフェース２１０が接続され
ており、CPU２０２は、入出力インタフェース２１０を
介して、ユーザによって、キーボードや、マウス、マイ
ク等で構成される入力部２０７が操作等されることによ
り指令が入力されると、それにしたがって、ROM(Read O
nly Memory)２０３に格納されているプログラムを実行
する。あるいは、また、CPU２０２は、ハードディスク
２０５に格納されているプログラム、衛星若しくはネッ
トワークから転送され、通信部２０８で受信されてハー
ドディスク２０５にインストールされたプログラム、ま
たはドライブ２０９に装着されたリムーバブル記録媒体
２１１から読み出されてハードディスク２０５にインス
トールされたプログラムを、RAM(Random Access Memor
y)２０４にロードして実行する。これにより、CPU２０
２は、上述したフローチャートにしたがった処理、ある
いは上述したブロック図の構成により行われる処理を行
う。そして、CPU２０２は、その処理結果を、必要に応
じて、例えば、入出力インタフェース２１０を介して、
LCD(Liquid CryStal Display)やスピーカ等で構成され
る出力部２０６から出力、あるいは、通信部２０８から
送信、さらには、ハードディスク２０５に記録等させ
る。

【０１８５】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理（例えば、並列処理あるい
はオブジェクトによる処理）も含むものである。

【０１８６】また、プログラムは、１のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。

【０１８７】なお、本発明は、特定の符号化／復号方式
に限定されることなく適用可能である。即ち、本実施の
形態においては、CELP方式、JPEG方式、MPEG2方式につ
いて説明したが、本発明は、その他、例えば、M-JPEG(M
otion JPEG)方式や、MPEG1,4，MP3(MPEG-1 Audio Layer
3)方式、ATRAC（Adaptive TRansform Acoustic Codin
g)方式等の種々の符号化／復号方式に適用可能である。

【０１８８】また、本実施の形態では、符号化データ
を、その符号化方式に対応した復号方式によって復号す
るようにしたが、符号化データの復号は、クラス分類適
応処理によって行うことが可能である。クラス分類適応
処理による符号化データの復号は、符号化の対象とする
データを教師データとするとともに、そのデータを符号
化した符号化データを生徒データとして学習を行うこと
によって得られるタップ係数を用いることで行うことが
可能である。

【０１８９】さらに、本実施の形態では、タップ係数を
用いた線形１次予測演算によって、高品質のデータの予
測値を求めるようにしたが、この予測値は、その他、２
次以上の高次の予測演算によって求めることも可能であ
る。

【０１９０】また、本実施の形態では、デコーダ２のク
ラス分類適応処理回路２４において、品質を向上させる
ためのタップ係数を、あらかじめ記憶しておくようにし
たが、タップ係数は、符号化データに含めて、デコーダ
２に提供するようにすることが可能である。

【０１９１】さらに、本実施の形態では、予測タップ
を、第１復号データおよび第２復号データの他、第１付
加情報および第２付加情報から生成するようにしたが、
予測タップは、その他、例えば、第１復号データおよび
第２復号データだけから生成するようにすること等が可
能である。クラスタップについても、同様である。

【０１９２】

【発明の効果】本発明の第１のデータ処理装置およびデ
ータ処理方法、並びにプログラムおよび記録媒体によれ
ば、符号化データが復号され、その結果得られる復号デ
ータが符号化されて、再符号化データが出力される。そ
して、学習を行うことにより求められたタップ係数との
所定の予測演算を行う予測タップが、復号データと、再
符号化データから得られる情報とから生成され、予測タ
ップとタップ係数とを用いて、所定の予測演算を行うこ
とにより、学習において教師として用いられた教師デー
タに対応する予測値が求められる。従って、例えば、品
質が十分に改善されたデータを得ることが可能となる。

【０１９３】本発明の第２のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体によれ
ば、教師となる教師データから、その教師データを符号
化して復号した復号データと、その復号データを符号化
した再符号化データから得られる情報とが、生徒となる
生徒データとして生成される。そして、教師データを予
測するのに用いる予測タップが、生徒データから生成さ
れ、予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる教師データの予測値の予測
誤差が、統計的に最小になるように学習が行われ、タッ
プ係数が求められる。従って、そのタップ係数を用いて
予測演算を行うことにより、例えば、品質が十分に改善
されたデータを得ることが可能となる。

【０１９４】本発明の第３のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体によれ
ば、データを符号化した符号化データが復号され、その
結果得られる復号データが符号化されて、再符号化デー
タが出力される。そして、クラス分類に用いるクラスタ
ップが、復号データと、再符号化データから得られる情
報とから生成され、そのクラスタップに基づいて、クラ
ス分類が行われる。従って、データの適切なクラス分け
が可能となる。

【図面の簡単な説明】

【図１】本発明を適用したデータ伝送システムの一実施
の形態の構成例を示す図である。

【図２】デコーダ２の構成例を示すブロック図である。

【図３】クラス分類適応処理回路２４の構成例を示すブ
ロック図である。

【図４】クラス分類部３３および５９の構成例を示すブ
ロック図である。

【図５】デコーダ２の処理を説明するフローチャートで
ある。

【図６】本発明を適用した学習装置の一実施の形態の構
成例を示すブロック図である。

【図７】学習装置の処理を説明するフローチャートであ
る。

【図８】エンコーダ１、符号化部２２，５２、および５
５の第１の構成例を示すブロック図である。

【図９】復号部２１，２３，５４、および５６の第１の
構成例を示すブロック図である。

【図１０】エンコーダ１、符号化部２２，５２、および
５５の第２の構成例を示すブロック図である。

【図１１】復号部２１，２３，５４、および５６の第２
の構成例を示すブロック図である。

【図１２】エンコーダ１、符号化部２２，５２、および
５５の第３の構成例を示すブロック図である。

【図１３】復号部２１，２３，５４、および５６の第３
の構成例を示すブロック図である。

【図１４】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。

【符号の説明】

１エンコーダ，２デコーダ，３記録媒体，
４伝送媒体，２１復号部，２２符号化部，２
３復号部，２４クラス分類適応処理回路，３
１，３２タップ生成部，３３クラス分類部，３
４係数メモリ，３５予測部，４１Ａ，４１Ｂ
ADRC回路，４１Ｃ合成回路，４２Ａ，４２Ｂ演
算器，４３Ｃ，４３Ｄ極性判別回路，４３Ｅ合
成回路，４４Ａ，４４Ｂ遅延回路，４４Ｃ，４４Ｄ
演算器，５１生徒データ生成部，５２符号化
部，５３媒体特性反映部，５４復号部，５５
符号化部，５６復号部，５７，５８タップ生成
部，５９クラス分類部，６０正規方程式加算回
路，６１タップ決定回路，６２係数メモリ，
７１演算器，７２ＬＰＣ分析部，７３ベクト
ル量子化部，７４音声合成フィルタ，７５自乗誤
差演算部，７６自乗誤差最小判定部，７７適応
コードブック記憶部，７８ゲイン復号器，７９
励起コードブック記憶部，８０乃至８２演算器，
８３コード決定部，８４チャネルエンコーダ，９
１チャンネルデコーダ，９２適応コードブック記
憶部，９３ゲイン復号器，９４励起コードブッ
ク記憶部，９５フィルタ係数復号器，９６乃至９
８演算器，９９音声合成フィルタ，１００付
加情報出力部，１１１ブロック化回路，１１２
ＤＣＴ回路，１１３量子化回路，１１４エントロ
ピー符号化部，１２１エントロピー復号回路，１
２２逆量子化回路，１２３逆ＤＣＴ回路，１２
４ブロック分解回路，１２５付加情報出力部，
１３１動き検出回路，１３２演算器，１３３
ブロック化回路，１３４ＤＣＴ回路，１３５量
子化回路，１３６エントロピー符号化回路，１３
７逆量子化回路，１３８逆ＤＣＴ回路，１３９
演算器，１４０動き補償回路，１５１エントロ
ピー復号回路，１５２逆量子化回路，１５３逆
ＤＣＴ回路，１５４演算器，１５５ブロック分解
回路，１５６動き補償回路，１５７付加情報出
力部，２０１バス，２０２ CPU，２０３ RO
M，２０４ RAM，２０５ハードディスク，２０
６出力部，２０７入力部，２０８通信部，
２０９ドライブ，２１０入出力インタフェース，
２１１リムーバブル記録媒体

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 7/32 Ｈ０４Ｎ 7/137 ＺＦターム(参考） 5C059 KK00 LA00 MA00 SS06 SS12 SS20 SS30 TA69 TB07 TC02 TC04 TD02 TD05 TD13 UA05 UA39 5C078 AA04 BA35 BA57 CA00 DA01 DA02 5D045 CC02 5J064 AA01 BB03 BC02 BC28 BD02 BD03

Claims

【特許請求の範囲】

【請求項１】データを符号化して得られる符号化デー
タを処理するデータ処理装置であって、前記符号化データを復号し、復号データを出力する復号
手段と、前記復号データを符号化し、再符号化データを出力する
再符号化手段と、学習を行うことにより求められたタップ係数との所定の
予測演算を行う予測タップを、前記復号データと、前記
再符号化データから得られる情報とから生成する予測タ
ップ生成手段と、前記タップ係数を取得するタップ係数取得手段と、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより、前記学習において教師として用い
られた教師データに対応する予測値を求める予測手段と
を備えることを特徴とするデータ処理装置。
【請求項２】前記予測手段は、前記予測タップとタッ
プ係数とを用いて、線形１次予測演算を行うことによ
り、前記予測値を求めることを特徴とする請求項１に記
載のデータ処理装置。
【請求項３】前記復号手段は、前記符号化データを復
号する過程において得られる情報を、付加情報として出
力し、前記予測タップ生成手段は、前記付加情報からも、前記
予測タップを生成することを特徴とする請求項１に記載
のデータ処理装置。
【請求項４】前記再符号化データを復号し、再復号デ
ータを出力する再復号手段をさらに備え、前記予測タップ生成手段は、前記復号データと再復号デ
ータとから、前記予測タップを生成することを特徴とす
る請求項１に記載のデータ処理装置。
【請求項５】前記再復号手段は、前記再符号化データ
を復号する過程において得られる情報を、付加情報とし
て出力し、前記予測タップ生成手段は、前記付加情報からも、前記
予測タップを生成することを特徴とする請求項４に記載
のデータ処理装置。
【請求項６】情報をクラス分けするクラス分類を行う
のに用いられるクラスタップを、前記復号データと、前
記再符号化データから得られる情報とから生成するクラ
スタップ生成手段と、前記クラスタップに基づいて、クラス分類を行うクラス
分類手段とをさらに備え、前記タップ係数取得手段は、前記クラス分類手段が出力
するクラスに対応する前記タップ係数を取得し、前記予測手段は、前記クラス分類手段が出力するクラス
に対応する前記タップ係数を用いて、前記予測値を求め
ることを特徴とする請求項１に記載のデータ処理装置。
【請求項７】前記復号手段は、前記符号化データを復
号する過程において得られる情報を、付加情報として出
力し、前記クラスタップ生成手段は、前記付加情報からも、前
記クラスタップを生成することを特徴とする請求項６に
記載のデータ処理装置。
【請求項８】前記再符号化データを復号し、再復号デ
ータを出力する再復号手段をさらに備え、前記クラスタップ生成手段は、前記復号データと再復号
データとから、前記クラスタップを生成することを特徴
とする請求項６に記載のデータ処理装置。
【請求項９】前記再復号手段は、前記再符号化データ
を復号する過程において得られる情報を、付加情報とし
て出力し、前記予測タップ生成手段は、前記付加情報からも、前記
予測タップを生成することを特徴とする請求項８に記載
のデータ処理装置。
【請求項１０】前記データは、画像データであること
を特徴とする請求項１に記載のデータ処理装置。
【請求項１１】前記符号化データは、前記画像データ
を、少なくとも直交変換して得られるデータを含むこと
を特徴とする請求項１０に記載のデータ処理装置。
【請求項１２】前記データは、音声データであること
を特徴とする請求項１に記載のデータ処理装置。
【請求項１３】前記符号化データは、少なくとも、線
形予測係数と残差信号に対応するコードを含むことを特
徴とする請求項１２に記載のデータ処理装置。
【請求項１４】データを符号化して得られる符号化デ
ータを処理するデータ処理方法であって、前記符号化データを復号し、復号データを出力する復号
ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、学習を行うことにより求められたタップ係数との所定の
予測演算を行う予測タップを、前記復号データと、前記
再符号化データから得られる情報とから生成する予測タ
ップ生成ステップと、前記タップ係数を取得するタップ係数取得ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより、前記学習において教師として用い
られた教師データに対応する予測値を求める予測ステッ
プとを備えることを特徴とするデータ処理方法。
【請求項１５】データを符号化して得られる符号化デ
ータを、コンピュータに処理させるプログラムであっ
て、前記符号化データを復号し、復号データを出力する復号
ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、学習を行うことにより求められたタップ係数との所定の
予測演算を行う予測タップを、前記復号データと、前記
再符号化データから得られる情報とから生成する予測タ
ップ生成ステップと、前記タップ係数を取得するタップ係数取得ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより、前記学習において教師として用い
られた教師データに対応する予測値を求める予測ステッ
プとを備えることを特徴とするプログラム。
【請求項１６】データを符号化して得られる符号化デ
ータを、コンピュータに処理させるプログラムが記録さ
れている記録媒体であって、前記符号化データを復号し、復号データを出力する復号
ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、学習を行うことにより求められたタップ係数との所定の
予測演算を行う予測タップを、前記復号データと、前記
再符号化データから得られる情報とから生成する予測タ
ップ生成ステップと、前記タップ係数を取得するタップ係数取得ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより、前記学習において教師として用いられた教師データに対
応する予測値を求める予測ステップとを備えるプログラ
ムが記録されていることを特徴とする記録媒体。
【請求項１７】データを符号化して得られる符号化デ
ータを処理するのに用いる所定のタップ係数を学習する
データ処理装置であって、教師となる教師データから、その教師データを符号化し
て復号した復号データと、その復号データを符号化した
再符号化データから得られる情報とを、生徒となる生徒
データとして生成する生徒データ生成手段と、前記教師データを予測するのに用いる予測タップを、前
記生徒データから生成する予測タップ生成手段と、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習手段とを備えることを特徴と
するデータ処理装置。
【請求項１８】前記学習手段は、前記予測タップとタ
ップ係数とを用いて線形１次予測演算を行うことにより
得られる前記教師データの予測値の予測誤差が、統計的
に最小になるように学習を行うことを特徴とする請求項
１７に記載のデータ処理装置。
【請求項１９】前記生徒データ生成手段は、前記教師
データを符号化した符号化データを復号する過程におい
て得られる情報も、前記生徒データとして出力すること
を特徴とする請求項１７に記載のデータ処理装置。
【請求項２０】前記生徒データ生成手段は、前記再符
号化データを復号し、その結果得られる再復号データ
を、前記生徒データとして出力することを特徴とする請
求項１７に記載のデータ処理装置。
【請求項２１】前記生徒データ生成手段は、前記再符
号化データを復号する過程において得られる情報も、前
記生徒データとして出力することを特徴とする請求項２
０に記載のデータ処理装置。
【請求項２２】情報をクラス分けするクラス分類を行
うのに用いられるクラスタップを、前記生徒データから
生成するクラスタップ生成手段と、前記クラスタップに基づいて、クラス分類を行うクラス
分類手段とをさらに備え、前記学習手段は、前記クラス分類手段が出力するクラス
ごとに、前記タップ係数を求めることを特徴とする請求
項１７に記載のデータ処理装置。
【請求項２３】前記生徒データ生成手段は、前記教師
データを符号化した符号化データを復号する過程におい
て得られる情報も、前記生徒データとして出力すること
を特徴とする請求項２２に記載のデータ処理装置。
【請求項２４】前記生徒データ生成手段は、前記再符
号化データを復号し、その結果得られる再復号データ
を、前記生徒データとして出力することを特徴とする請
求項２２に記載のデータ処理装置。
【請求項２５】前記生徒データ生成手段は、前記再符
号化データを復号する過程において得られる情報も、前
記生徒データとして出力することを特徴とする請求項２
４に記載のデータ処理装置。
【請求項２６】前記教師データは、画像データである
ことを特徴とする請求項１７に記載のデータ処理装置。
【請求項２７】前記生徒データ生成手段は、前記画像
データを、少なくとも直交変換することにより符号化す
ることを特徴とする請求項２６に記載のデータ処理装
置。
【請求項２８】前記データは、音声データであること
を特徴とする請求項１７に記載のデータ処理装置。
【請求項２９】前記生徒データ生成手段は、前記音声
データを、少なくとも、線形予測係数と残差信号に対応
するコードに符号化することを特徴とする請求項２８に
記載のデータ処理装置。
【請求項３０】データを符号化して得られる符号化デ
ータを処理するのに用いる所定のタップ係数を学習する
データ処理方法であって、教師となる教師データから、その教師データを符号化し
て復号した復号データと、その復号データを符号化した
再符号化データから得られる情報とを、生徒となる生徒
データとして生成する生徒データ生成ステップと、前記教師データを予測するのに用いる予測タップを、前
記生徒データから生成する予測タップ生成ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えることを特
徴とするデータ処理方法。
【請求項３１】データを符号化して得られる符号化デ
ータを処理するのに用いる所定のタップ係数を学習する
データ処理を、コンピュータに行わせるプログラムであ
って、教師となる教師データから、その教師データを符号化し
て復号した復号データと、その復号データを符号化した
再符号化データから得られる情報とを、生徒となる生徒
データとして生成する生徒データ生成ステップと、前記教師データを予測するのに用いる予測タップを、前
記生徒データから生成する予測タップ生成ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えることを特
徴とするプログラム。
【請求項３２】データを符号化して得られる符号化デ
ータを処理するのに用いる所定のタップ係数を学習する
データ処理を、コンピュータに行わせるプログラムが記
録されている記録媒体であって、教師となる教師データから、その教師データを符号化し
て復号した復号データと、その復号データを符号化した
再符号化データから得られる情報とを、生徒となる生徒
データとして生成する生徒データ生成ステップと、前記教師データを予測するのに用いる予測タップを、前
記生徒データから生成する予測タップ生成ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えるプログラ
ムが記録されていることを特徴とする記録媒体。
【請求項３３】情報をクラス分けするクラス分類を行
うデータ処理装置であって、データを符号化した符号化データを復号し、復号データ
を出力する復号手段と、前記復号データを符号化し、再符号化データを出力する
再符号化手段と、前記クラス分類に用いるクラスタップを、前記復号デー
タと、前記再符号化データから得られる情報とから生成
するクラスタップ生成手段と、前記クラスタップに基づいて、クラス分類を行うクラス
分類手段とを備えることを特徴とするデータ処理装置。
【請求項３４】前記復号手段は、前記符号化データを
復号する過程において得られる情報を、付加情報として
出力し、前記クラスタップ生成手段は、前記付加情報からも、前
記クラスタップを生成することを特徴とする請求項３３
に記載のデータ処理装置。
【請求項３５】前記再符号化データを復号し、再復号
データを出力する再復号手段をさらに備え、前記クラスタップ生成手段は、前記復号データと再復号
データとから、前記クラスタップを生成することを特徴
とする請求項３３に記載のデータ処理装置。
【請求項３６】前記再復号手段は、前記再符号化デー
タを復号する過程において得られる情報を、付加情報と
して出力し、前記予測タップ生成手段は、前記付加情報からも、前記
予測タップを生成することを特徴とする請求項３５に記
載のデータ処理装置。
【請求項３７】前記データは、画像データであること
を特徴とする請求項３３に記載のデータ処理装置。
【請求項３８】前記符号化データは、前記画像データ
を、少なくとも直交変換して得られるデータを含むこと
を特徴とする請求項３７に記載のデータ処理装置。
【請求項３９】前記データは、音声データであること
を特徴とする請求項３３に記載のデータ処理装置。
【請求項４０】前記符号化データは、少なくとも、線
形予測係数と残差信号に対応するコードを含むことを特
徴とする請求項３９に記載のデータ処理装置。
【請求項４１】情報をクラス分けするクラス分類を行
うデータ処理方法であって、データを符号化した符号化データを復号し、復号データ
を出力する復号ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、前記クラス分類に用いるクラスタップを、前記復号デー
タと、前記再符号化データから得られる情報とから生成
するクラスタップ生成ステップと、前記クラスタップに基づいて、クラス分類を行うクラス
分類ステップとを備えることを特徴とするデータ処理方
法。
【請求項４２】情報をクラス分けするクラス分類を行
うデータ処理を、コンピュータに行わせるプログラムで
あって、データを符号化した符号化データを復号し、復号データ
を出力する復号ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、前記クラス分類に用いるクラスタップを、前記復号デー
タと、前記再符号化データから得られる情報とから生成
するクラスタップ生成ステップと、前記クラスタップに基づいて、クラス分類を行うクラス
分類ステップとを備えることを特徴とするプログラム。
【請求項４３】情報をクラス分けするクラス分類を行
うデータ処理を、コンピュータに行わせるプログラムが
記録されている記録媒体であって、データを符号化した符号化データを復号し、復号データ
を出力する復号ステップと、前記復号データを符号化し、再符号化データを出力する
再符号化ステップと、前記クラス分類に用いるクラスタップを、前記復号デー
タと、前記再符号化データから得られる情報とから生成
するクラスタップ生成ステップと、前記クラスタップに基づいて、クラス分類を行うクラス
分類ステップとを備えるプログラムが記録されているこ
とを特徴とする記録媒体。