JP4225039B2 - データ処理装置および方法、記録媒体、並びにプログラム - Google Patents

データ処理装置および方法、記録媒体、並びにプログラム Download PDF

Info

Publication number
JP4225039B2
JP4225039B2 JP2002337891A JP2002337891A JP4225039B2 JP 4225039 B2 JP4225039 B2 JP 4225039B2 JP 2002337891 A JP2002337891 A JP 2002337891A JP 2002337891 A JP2002337891 A JP 2002337891A JP 4225039 B2 JP4225039 B2 JP 4225039B2
Authority
JP
Japan
Prior art keywords
data
prediction
input data
teacher
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002337891A
Other languages
English (en)
Other versions
JP2004171366A (ja
Inventor
昌紀 町村
哲二郎 近藤
岳歩 福士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002337891A priority Critical patent/JP4225039B2/ja
Publication of JP2004171366A publication Critical patent/JP2004171366A/ja
Application granted granted Critical
Publication of JP4225039B2 publication Critical patent/JP4225039B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Picture Signal Circuits (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データ処理装置および方法、記録媒体、並びにプログラムに関し、特に、入力データの迅速な予測に好適なデータ処理装置および方法、記録媒体、並びにプログラムに関する。
【0002】
【従来の技術】
本件出願人は、例えば、画像の解像度、S/N、その他の画像の画質を向上させるための処理として、クラス分類適応処理を、先に提案している(例えば、特許文献1)。
【0003】
クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データを、その性質に基づいてクラス分けし、クラスごとに適応処理を施すものであり、適応処理は、以下のような手法のものである。
【0004】
即ち、適応処理では、例えば、低S/Nの画像(低S/N画像)を構成する画素(以下、適宜、低S/N画素という)と、所定の予測係数との線形結合により、その低S/N画像のS/Nを向上させた高S/Nの画像(高S/N画像)の画素の予測値を求めることで、その低S/N画像のS/Nを向上させた画像が得られる。
【0005】
具体的には、例えば、いま、ある高S/N画像を教師データとするとともに、その高S/N画像のS/Nを劣化させた低S/N画像を生徒データとして、高S/N画像を構成する画素(以下、適宜、高S/N画素という)の画素値yの予測値E[y]を、幾つかの低S/N画素(低S/N画像を構成する画素)の画素値x1,x2,・・・の集合と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0006】
Figure 0004225039
【0007】
式(1)を一般化するために、予測係数wjの集合でなる行列W、生徒データxijの集合でなる行列X、および予測値E[yj]の集合でなる行列Y'を、
【数1】
Figure 0004225039
で定義すると、次のような観測方程式が成立する。
【0008】
Figure 0004225039
ここで、行列Xの成分xijは、i件目の生徒データの集合(i件目の教師データyiの予測に用いる生徒データの集合)の中のj番目の生徒データを意味し、行列Wの成分wjは、生徒データの集合の中のj番目の生徒データとの積が演算される予測係数を表す。また、yiは、i件目の教師データを表し、従って、E[yi]は、i件目の教師データの予測値を表す。なお、式(1)の左辺におけるyは、行列Yの成分yiのサフィックスiを省略したものであり、また、式(1)の右辺におけるx1,x2,・・・も、行列Xの成分xijのサフィックスiを省略したものである。
【0009】
そして、この観測方程式に最小自乗法を適用して、高S/N画素の画素値yに近い予測値E[y]を求めることを考える。この場合、教師データとなる高S/N画素の真の画素値yの集合でなる行列Y、および高S/N画素の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数2】
Figure 0004225039
で定義すると、式(2)から、次のような残差方程式が成立する。
【0010】
Figure 0004225039
【0011】
この場合、高S/N画素の画素値yに近い予測値E[y]を求めるための予測係数wjは、自乗誤差
【数3】
Figure 0004225039
を最小にすることで求めることができる。
【0012】
従って、上述の自乗誤差を予測係数wjで微分したものが0になる場合、即ち、次式を満たす予測係数wjが、高S/N画素の画素値yに近い予測値E[y]を求めるための最適値ということになる。
【0013】
【数4】
Figure 0004225039
【0014】
そこで、まず、式(3)を、予測係数wjで微分することにより、次式が成立する。
【0015】
【数5】
Figure 0004225039
【0016】
式(4)および(5)より、式(6)が得られる。
【0017】
【数6】
Figure 0004225039
【0018】
さらに、式(3)の残差方程式における生徒データxij、予測係数wj、教師データyi、および残差eiの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0019】
【数7】
Figure 0004225039
【0020】
なお、式(7)に示した正規方程式は、行列(共分散行列)Aおよびベクトルvを、
【数8】
Figure 0004225039
で定義するとともに、ベクトルWを、数1で示したように定義すると、式
Figure 0004225039
で表すことができる。
【0021】
式(7)における各正規方程式は、生徒データxijおよび教師データyiのセットを、ある程度の数だけ用意することで、求めるべき予測係数wjの数Jと同じ数だけたてることができ、従って、式(8)を、ベクトルWについて解くことで(但し、式(8)を解くには、式(8)における行列Aが正則である必要がある)、最適な予測係数wjを求めることができる。なお、式(8)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることが可能である。
【0022】
以上のようにして、最適な予測係数wjを求めておき、さらに、その予測係数wjを用い、式(1)により、高S/N画素の画素値yに近い予測値E[y]を求めるのが適応処理である。
【0023】
なお、適応処理は、低S/N画像には含まれていないが、高S/N画像に含まれる成分が再現される点で、例えば、単なる補間処理とは異なる。即ち、適応処理では、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、高S/N画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造(解像度創造)作用がある処理ということができる。
【0024】
また、ここでは、適応処理について、S/Nを向上させる場合を例にして説明したが、適応処理は、その他、例えば、画素数を増加させて解像度を向上させた画像の予測値を求めること等に用いることができ、この場合、解像度の向上を図ることが可能である。
【0025】
図1は、以上のようなクラス分類適応処理に用いる予測係数を学習する、従来の学習装置の一例の構成を示している。
【0026】
教師データとしての高S/N画像(以下、適宜、教師画像という)は、例えば、フレーム単位で、フレームメモリ21に供給され、フレームメモリ21は、そこに供給される教師画像を順次記憶する。
【0027】
ぼかしフィルタとしての前処理フィルタ22は、フレームメモリ21に記憶された教師画像を、例えば、フレーム単位で読み出し、LPF(Low Pass Filter)をかけること等によって、教師画像のS/Nを低下させ、これにより、生徒データとしての低S/N画像(以下、適宜、生徒画像という)を生成し、フレームメモリ23に供給する。
【0028】
即ち、前処理フィルタ22は、例えば、図2に示すように、図中、三角形のマークで示す教師画像を構成する教師画素のS/Nを低下させ、図中、円のマークで示す生徒画像を構成する生徒画素を生成する。従って、ここでは、教師画像と生徒画像とは、同一の画素数で構成される。
【0029】
フレームメモリ23は、前処理フィルタ22が出力する生徒画像を、例えば、フレーム単位で順次記憶する。
【0030】
クラスタップ生成回路24は、注目画素を、幾つかのクラスのうちのいずれかに分類するためのクラス分類に用いる生徒画素を、フレームメモリ23から読み出す。即ち、クラスタップ生成回路24は、注目画素の位置に対応する、生徒画像の位置から周辺にある(空間的または時間的に近い位置にある)幾つかの生徒画素を、フレームメモリ23から読み出し、クラス分類に用いるクラスタップとして、クラス分類回路26に供給する。
【0031】
具体的には、図3に示すように、図中、黒い三角形のマークで示す教師画素が注目画素とされた場合には、クラスタップ生成回路24は、例えば、注目画素の位置に対応する、生徒画素eと、その上、下、左、右、左上、左下、右上、右下にそれぞれ隣接する生徒画素b,h,d,f,a,g,c,iの等の正方形状の9画素を、予測タップとする。
【0032】
クラス分類回路26は、クラスタップ生成回路24からのクラスタップに基づき、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、予測タップメモリ28および教師データメモリ30に供給する。
【0033】
ここで、クラス分類を行う方法としては、例えば、ADRC(Adaptive Dynamic Range Coding)を用いる方法等がある。
【0034】
ADRCを用いる方法では、クラスタップを構成する生徒画素が、ADRC処理され、その結果得られるADRCコードにしたがって、注目画素のクラスが決定される。
【0035】
なお、KビットADRCにおいては、例えば、クラスタップを構成する生徒画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する生徒画素がKビットに再量子化される。即ち、クラスタップを構成する画素の画素値の中から、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。そして、以上のようにして得られる、クラスタップを構成する各画素についてのKビットの画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。従って、クラスタップが、例えば、1ビットADRC処理された場合には、そのクラスタップを構成する各生徒画素の画素値は、最小値MINが減算された後に、最大値MAXと最小値MINとの平均値で除算され、これにより、各画素値が1ビットとされる(2値化される)。そして、その1ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力される。
【0036】
ここで、ADRCによれば、クラスタップが、N個の画素で構成され、そのクラスタップのKビットADRC処理結果がクラスコードとされる場合には、注目画素は、(2NKクラスのうちのいずれかのクラスにクラス分類されることになる。
【0037】
予測タップ生成回路25は、フレームメモリ21に記憶された教師画像を構成する画素(以下、適宜、教師画素という)を、順次、注目画素とし、その注目画素の位置に対応する生徒画像の位置から空間的または時間的に近い位置にある幾つかの生徒画像の画素(以下、適宜、生徒画素という)を、フレームメモリ23から読み出し、予測係数との乗算に用いる予測タップを構成する。
【0038】
即ち、図3に示すように、図中、黒い三角形のマークで示す教師画素が注目画素とされた場合には、予測タップ生成回路25は、例えば、注目画素の位置に対応する、生徒画素eと、その上、下、左、右、左上、左下、右上、右下にそれぞれ隣接する生徒画素b,h,d,f,a,g,c,iのうちの、例えば、b,d,e,f,h等の十字形状の5画素を、予測タップとする。
【0039】
そして、予測タップ生成回路25で構成された予測タップは、加算回路27に供給される。
【0040】
加算回路27は、クラス分類回路26が出力するクラスコードに対応するアドレスの記憶値を、予測タップメモリ28から読み出し、その記憶値と、予測タップ生成回路25からの予測タップを構成する生徒画素とを加算することで、式(7)の正規方程式の左辺における、予測係数wの乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路27は、その演算結果を、予測タップメモリ28のクラス分類回路26が出力するクラスコードに対応するアドレスに、上書きする形で記憶させるようになっている。
【0041】
予測タップメモリ28は、クラス分類回路26が出力するクラスに対応するアドレスの記憶値を読み出し、加算回路27に供給するとともに、そのアドレスに、加算回路27の出力値を記憶するようになっている。
【0042】
加算回路29は、フレームメモリ21に記憶された教師画像を構成する教師画素のうちの、注目画素xに対するものを、教師データyとして読み出すとともに、クラス分類回路26が出力するクラスコードに対応するアドレスの記憶値を、教師データメモリ30から読み出し、その記憶値と、フレームメモリ21から読み出した教師データ(教師画素)yとを加算することで、式(7)の正規方程式の右辺におけるサメーション(Σ)に相当する演算を行う。そして、加算回路29は、その演算結果を、予測タップメモリ28のクラス分類回路26が出力するクラスコードに対応するアドレスに、上書きする形で記憶させるようになっている。
【0043】
なお、正確には、加算回路27および39では、式(7)における乗算も行われる。また、式(7)の右辺には、教師データyと、生徒画素xとの乗算が含まれ、従って、加算回路29で行われる乗算には、教師データyの他に、その教師データyに対する生徒画素xが必要となるが、これは、加算回路29において、フレームメモリ23から読み出される。
【0044】
教師データメモリ30は、クラス分類回路26が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路29に供給するとともに、そのアドレスに、加算回路29の出力値を記憶するようになっている。
【0045】
演算回路31は、予測タップメモリ28および教師データメモリ30それぞれから、各クラスコードに対応するアドレスに記憶されている記憶値を順次読み出し、クラスコードごとに、式(7)に示した正規方程式をたてて、これを解くことにより、クラスごとの予測係数を求めるようになっている。即ち、演算回路31は、予測タップメモリ28および教師データメモリ30それぞれの、各クラスコードに対応するアドレスに記憶されている記憶値から、式(7)の正規方程式をたて、これを解くことにより、クラスごとの予測係数を求めるようになっている。
【0046】
次に、図4のフローチャートを参照して、図1の学習装置11により行われる、予測係数の学習処理について説明する。
【0047】
ステップS21において、学習装置11のフレームメモリ21および23、予測タップメモリ28、並びに教師データメモリ30などの全てのメモリが初期化される。
【0048】
ステップS22において、教師画像から生徒画像を生成するために、予め決定された、例えば、LPF(Low Pass Filter)などの前処理フィルタの係数が前処理フィルタ22に読み込まれる。
【0049】
ステップS23において、予測係数の学習用にあらかじめ用意された分の教師画像がフレームメモリ21に記憶され、その中の1つのフレームが注目フレームとされる。
【0050】
ステップS24では、前処理フィルタ22において、フレームメモリ21に記憶された教師画像の注目フレームに対して、LPFがかけられ、これにより、教師画像のS/Nを低下させた生徒画像が生成され、フレームメモリ23に供給されて記憶される。
【0051】
そして、ステップS25に進み、フレームメモリ21に記憶された注目フレームの教師画素のうちの、まだ、注目画素とされていないものが、注目画素とされ、予測タップ生成回路25において、フレームメモリ23に記憶された生徒画素を用いて、注目画素についての予測タップが構成される。さらに、ステップS25では、クラスタップ生成回路24において、フレームメモリ23に記憶された生徒画素を用いて、注目画素についてのクラスタップが構成される。そして、予測タップは、加算回路27に供給され、クラスタップは、クラス分類回路26に供給される。ここで、図1の学習装置11では(後述する図5の予測装置41においても同様)、予測タップやクラスタップは、図3で説明したように、注目画素を基準として固定の位置にある生徒画素によって、常に構成される。
【0052】
クラス分類回路26は、ステップS26において、クラスタップ生成回路24からのクラスタップに基づき、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、予測タップメモリ28および教師データメモリ30に出力する。
【0053】
そして、ステップS27に進み、予測タップおよび教師データそれぞれの足し込みが行われる。
【0054】
即ち、ステップS27において、予測タップメモリ28は、クラス分類回路26が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路27に供給する。加算回路27は、予測タップメモリ28から供給される記憶値と、予測タップ生成回路25から供給される予測タップを構成する生徒画素とを用いて、式(7)の正規方程式の左辺における、予測係数の乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路27は、その演算結果を、クラス分類回路26が出力するクラスコードに対応する、予測タップメモリ28のアドレスに、上書きする形で記憶させる。
【0055】
さらに、ステップS27では、教師データメモリ30は、クラス分類回路26が出力するクラスコードに対応するアドレスの記憶値を読み出し、加算回路29に供給する。加算回路29は、フレームメモリ21に記憶された教師画像を構成する教師画素のうちの、注目画素に対応する教師画素を、教師データとして読み出すとともに、フレームメモリ23に記憶された生徒画像を構成する生徒画素のうちの、教師データに対応するものを読み出し、その読み出した画素と、教師データメモリ30から供給された記憶値とを用いて、式(7)の正規方程式の右辺におけるサメーション(Σ)に相当する演算を行う。そして、加算回路29は、その演算結果を、クラス分類回路26が出力するクラスコードに対応する、教師データメモリ30のアドレスに、上書きする形で記憶させる。
【0056】
そして、ステップS28に進み、フレームメモリ21に記憶された注目フレームを構成する教師画素すべてを注目画素として、足し込みを行ったかどうかが判定され、まだ、教師画素のすべてを注目画素として、足し込みを行っていないと判定された場合、処理はステップS25に戻る。この場合、まだ、注目画素とされていない教師画素のうちの1つが、新たに注目画素とされ、ステップS25乃至S28の処理が繰り返される。
【0057】
また、ステップS28において、教師画素すべてを注目画素として、足し込みを行ったと判定された場合、ステップS29に進み、次に処理すべき教師画像が、フレームメモリ21に記憶されているか否かが判定される。
【0058】
ステップS29において、次に処理すべき教師画像が、フレームメモリ21に記憶されていると判定された場合、ステップS24に戻り、その、次に処理すべき教師画像を対象に(注目フレームとして)、ステップS24以降の処理が繰り返される。
【0059】
一方、ステップS29において、次に処理すべき教師画像が、フレームメモリ21に記憶されていないと判定された場合、すなわち、予め学習用に用意しておいた全ての教師画像について処理を行った場合、ステップS30に進み、演算回路31は、予測タップメモリ28および教師データメモリ30それぞれから、各クラスコードに対応するアドレスに記憶されている記憶値を順次読み出し、式(7)に示した正規方程式をたてて、これを解くことにより、クラスごとの予測係数を求め、出力して処理を終了する。
【0060】
なお、以上のような予測係数の学習処理11において、予測係数を求めるのに必要な数の正規方程式が得られないクラスが生じる場合があり得るが、そのようなクラスについては、例えば、デフォルトの予測係数を出力するようにすること等が可能である。
【0061】
次に、図5は、図1の学習装置において得られた予測係数を用いて、低S/N画像のS/Nを向上させた画像としての、高S/N画像の予測値を求める、従来の予測装置41の一例の構成を示している。
【0062】
フレームメモリ51には、S/Nを向上させる対象としての低S/N画像が、例えば、1フレーム単位などで供給されるようになっており、フレームメモリ51は、その低S/N画像を、そのS/Nを向上させる予測処理が終了するまで記憶する。
【0063】
なお、フレームメモリ51に供給する低S/N画像としては、例えば、テレビジョン放送として放送されてくるテレビジョン放送番組を構成する画像や、DVDやビデオCD等の記録媒体から再生された画像等を用いることができる。
【0064】
予測タップ生成回路52は、図1の予測タップ生成回路25と同様の処理を行い、これにより、フレームメモリ51に記憶された低S/N画像を用いて、予測タップを構成し、予測演算回路56に供給する。
【0065】
クラスタップ生成回路53は、図1のクラスタップ生成回路24と同様の処理を行い、これにより、フレームメモリ51に記憶された低S/N画像を用いて、クラスタップを構成し、クラス分類回路54に供給する。
【0066】
クラス分類回路54は、図1のクラス分類回路26と同様の処理を行い、これにより、クラスタップ生成回路53からのクラスタップを用いたクラス分類結果としてのクラスコードを、アドレスとしてメモリ55に供給する。
【0067】
メモリ55は、上述した学習処理を行うことにより得られたクラスごとの予測係数を記憶しており、クラス分類回路54からのクラスコードに対応するアドレスに記憶されている予測係数を読み出して、予測演算回路56に供給する。
【0068】
予測演算回路56は、予測タップ生成回路52から供給される予測タップと、メモリ55から供給される予測係数とを用いて、式(1)に示した線形予測演算(積和演算)を行い、その結果得られる画素値を、低S/N画像の画質を向上させた高S/N画像の予測値として出力する。
【0069】
次に、図6のフローチャートを参照して、図5の予測装置41において行われる、低S/N画像の画質を向上させる予測処理(クラス分類適応処理)について説明する。
【0070】
ステップS41において、予測装置41のフレームメモリ51、およびメモリ55などの全てのメモリが初期化される。
【0071】
ステップS42において上述した学習装置11で求められたクラスごとの予測係数がメモリ55に読み込まれる。
【0072】
ステップS43において、フレームメモリ51には、高S/N画像にする対象としての入力画像(低S/N画像)が、フレーム単位で順次供給され、フレームメモリ51は、そのようにフレーム単位で供給される入力画像を順次記憶する。
【0073】
ステップS44では、フレームメモリ51に記憶された低S/N画像の画質を向上させた高S/N画像(予測装置41では、この高S/N画像は、実際には存在しないが、仮想的に想定される)(以下、注目フレーム)を構成する画素のうちの、まだ、注目画素とされていないものが、注目画素とされ、予測タップ生成回路52において、フレームメモリ51に記憶された低S/N画像の画素を用いて、注目画素についての予測タップが構成される。さらに、ステップS44では、クラスタップ生成回路53において、フレームメモリ51に記憶された低S/N画像(注目フレーム)の画素を用いて、注目画素についてのクラスタップが構成される。そして、予測タップは、予測演算回路56に供給され、クラスタップは、クラス分類回路54に供給される。
【0074】
クラス分類回路54は、ステップS45において、クラスタップ生成回路53からのクラスタップに基づき、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、メモリ55に対して、アドレスとして供給し、ステップS46に進む。
【0075】
ステップS47では、メモリ55において、そこに記憶されているクラスごとの予測係数のうち、クラス分類回路54からのクラスコードで表されるアドレスに記憶されているものが読み出され、予測演算回路56に供給される。
【0076】
ステップS47において、予測演算回路56は、予測タップ生成回路52から供給される予測タップと、メモリ55から供給される予測係数とを用いて、式(1)に示した線形予測演算を行い、その結果得られる画素値を、注目画素の予測値として、一時記憶する。
【0077】
そして、ステップS48に進み、フレームメモリ51に記憶された注目フレームに対応する高S/N画像のフレームを構成する高S/N画素すべてを注目画素として、その予測値を求めたかどうかが判定される。ステップS48において、注目フレームを構成する高S/N画素すべてを注目画素として、まだ、予測値を求めていないと判定された場合、ステップS44に戻り、注目フレームを構成する画素のうち、まだ注目画素とされていないものが、新たに注目画素とされ、以下、同様の処理が繰り返される。
【0078】
一方、ステップS48において、注目フレームを構成する高S/N画素すべてを注目画素として、その予測値を求めたと判定された場合、ステップS49に進み、予測演算回路56は、それまでに求めた予測値でなる高画質の1フレームの画像を出力する。
【0079】
ステップS50において、フレームメモリ51に、次に処理すべきフレーム(いま注目フレームとなっているフレームの次のフレーム)が記憶されているかどうかが判定される。ステップS50において、フレーム51に、次に処理すべきフレームが記憶されていると判定された場合、ステップS43に戻り、そのフレームを、新たに注目フレームとして、以下、同様の処理が繰り返される。
【0080】
一方、ステップS50において、フレームメモリ51に、次に処理すべきフレームが記憶されていないと判定された場合、予測処理を終了する。
【0081】
以上のように、クラス分類適応処理では、クラスごとの予測係数が、学習によって求められ、そのクラスごとの予測係数を用いて、画像の画質を向上させる。
【0082】
その他、特許文献2においては、上述の前処理フィルタとして、ぼかしフィルタの代わりに、ノイズを付加する前処理フィルタを用いて、画像信号の入力データから、ノイズを除去(低減)した画像信号を出力する処理として、クラス分類適応処理が用いられている。
【0083】
さらに、特許文献3においては、帯域を部分的に削るような前処理フィルタを用いて、高音質なオーディオ信号を出力する処理として、同様にクラス分類適応処理が用いられている。
【0084】
上述の例では、クラス分類処理によって、データをその性質に基づいてクラス分けし、クラスごとに適応処理を施したが、当然ながら、1つのクラスの場合についても同様の処理を行うことができ、その場合には、クラス分類処理は省略される。
【0085】
【特許文献1】
特開2001−222702号公報
【特許文献2】
特開2000−348020号公報
【特許文献3】
特開平10−313251号公報
【0086】
【発明が解決しようとする課題】
以上のように、学習装置では、教師データに前処理フィルタを施して生徒データを生成し、予測係数を求め、予測装置では、その予測係数を利用して低S/N画像から高S/N画像を予測して出力している。したがって、前処理フィルタをどのように設定するかによって、求められる予測係数、および、予測係数を利用する予測装置の高S/N画像の出力は変わってくる。
【0087】
しかしながら、設定した前処理フィルタが最適なものであるか否かは、学習装置で求めた予測係数を予測装置に入力し、出力データを確認するまでわからず、前処理フィルタの変更を行った場合には、学習装置で上述の2つの加算回路による足し込みの処理が行われるため、処理に時間がかかり、予測装置における前処理フィルタの変更の影響を見ながら前処理フィルタを細かく調整することができないという問題があった。
【0088】
本発明は、このような状況に鑑みてなされたものであり、前処理フィルタの変更が即座に予測係数に反映することができ、迅速な入力データの予測を可能とするようにするものである。
【0089】
【課題を解決するための手段】
本発明のデータ処理装置は、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成手段と、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データを生成する生成手段と、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と前処理フィルタ係数の入力を受け、前処理フィルタ係数と仮予測係数とから、予測係数を求める予測係数演算手段とを備えることを特徴とする。
【0090】
予測係数演算手段には、入力データを用いた線形一次予測によって、出力データが得られるようにするための予測係数を求めさせるようにすることができる。
【0091】
本発明のデータ処理方法は、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データを生成する生成ステップと、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と前処理フィルタ係数の入力を受け、前処理フィルタ係数と仮予測係数とから、予測係数を求める予測係数演算ステップとを含むことを特徴とする。
【0092】
本発明の記録媒体のプログラムは、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データを生成する生成ステップと、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と前処理フィルタ係数の入力を受け、前処理フィルタ係数と仮予測係数とから、予測係数を求める予測係数演算ステップとを含むことを特徴とする。
【0093】
本発明のプログラムは、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データを生成する生成ステップと、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と前処理フィルタ係数の入力を受け、前処理フィルタ係数と仮予測係数とから、予測係数を求める予測係数演算ステップとをコンピュータに実行させることを特徴とする。
【0094】
本発明のデータ処理装置は、入力データから、注目している注目入力データと、その周辺にある周辺データを予測タップとして構成する第1の予測タップ構成手段と、第1の予測タップ構成手段より構成された予測タップと、所定の予測係数を用いて、注目入力データに対する出力データを予測する予測手段と、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する第2の予測タップ構成手段と、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データを生成する生成手段と、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と前処理フィルタ係数の入力を受け、前処理フィルタ係数と仮予測係数とから、予測係数を求める予測係数演算手段とを備えることを特徴とする。
【0095】
本発明においては、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれが予測タップとして構成され、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データが生成され、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数が求められ、前処理フィルタ係数と仮予測係数とから、予測係数が求められる。
【0096】
また、本発明においては、第1の装置で、入力データから、注目している注目入力データと、その周辺にある周辺データが予測タップとして構成され、その予測タップと、所定の予測係数を用いて、注目入力データに対する出力データが予測される。また、第2の装置で、入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれが予測タップとして構成され、入力データの、注目している注目入力データと、その周辺にある周辺データとから、予測係数の学習のための教師となる教師データが生成され、入力データを構成するデータすべてを注目入力データとしたときの予測タップを用いた演算式および教師データを足し込んだ足し込み行列を演算することにより、教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数が求められ、前処理フィルタ係数と仮予測係数とから、予測係数が求められる。
【0097】
【発明の実施の形態】
初めに、図7を参照して、教師データに前処理フィルタをかけて生徒データを求める処理を、教師データの足し込みを行った後の行列に、前処理フィルタをかけるようにしても同じ結果が得られることについて説明する。
【0098】
図7は、生徒データ、前処理フィルタ、および教師データの関係を模式的に表した図である。
【0099】
図7において、生徒データを{sn}、および教師データを{tn}と表す。そして、生徒データ{sn}に前処理フィルタ{f}をかけたデータを{Sn}と表す。この前処理フィルタのタップ数は、一般的には2m+1(mは正の整数)個とされ、係数はf-m, ・・ ・ , f0, ・ ・ ・ fmと表される。ここでは、説明を簡単にするための例として、m=1とし、前処理フィルタ{f}の係数はf-1, f0, f1 の3つとする。このとき、前処理フィルタをかけた生徒データ{Sn}と教師データ{tn}との間の学習で得られる予測係数を{w}とする。一般的に、この係数の個数も2m+1(m は正の整数)と表すことができ、係数はw-m, ・ ・ ・ ,w0, ・ ・ ・ wmと表すことができるが、ここでは,m=1なので、予測係数はw-1,w0,w1の3つであるとする。
【0100】
tnの近似値tn'は
Figure 0004225039
と表すことができる。
【0101】
最小自乗法でtnを求める場合は、
Figure 0004225039
を各未定係数で偏微分した式= 0 という正規化方程式を解くことによって求めることができる。
【0102】
今、Snは、
Figure 0004225039
と表すことができるので、(tn−tn')は、式(9),(11) を用いて
Figure 0004225039
と表すことができる。
【0103】
従って、式(10)を予測係数w-1,w0,w1 で偏微分を行うと次式が成立する。
【数9】
Figure 0004225039
【0104】
式(13)を行列式で書くと
【数10】
Figure 0004225039
と表すことができる。
【0105】
式(14)を展開すると、
【数11】
Figure 0004225039
であるので、式(15)の右辺の(tn−tn')に式(12)を代入してwp(p=−1,0,1)で偏微分すると、
【数12】
Figure 0004225039
【0106】
さらに式(12)を代入して、係数の−2は、無視できるので、
【数13】
Figure 0004225039
と表すことができる。
【0107】
式(17)のtn の項を移して,wp をまとめると、
【数14】
Figure 0004225039
【0108】
ここで,S, T を1 行12 列の行列、F を12 行1 列の行列(ただしS は{sn} のみ、T は{sn}と{tn}、F は{f} のみを構成要素として)となるように、
【数15】
Figure 0004225039
と置き換えると、
【数16】
Figure 0004225039
【数17】
Figure 0004225039
となる。すべての入力データについて注目入力データ(画素)とするので、式(21)のサメーション(Σ)をとって、
【数18】
Figure 0004225039
【数19】
Figure 0004225039
と表すことができる。
【0109】
式(21)にコレスキー法を用いて、wpを求めると、
【数20】
Figure 0004225039
と表すことができる。
【0110】
【数21】
Figure 0004225039
は、生徒データ{sn}および教師データ{tn}を用いた足し込み行列であり、式(21)と同様にサメーション(Σ)をとると、
【数22】
Figure 0004225039
と表すことができる。
【0111】
式(25)から分かるように、予測係数{w}(式(25)の左辺)は、足し込み行列(式(25)の右辺の第1項)と前処理フィルタ(式(25)の右辺の第2項)が分離された形式で表すことができ、前処理フィルタとは別に、足し込みの処理が行えることが判る。すなわち、学習に使う行列は,あらかじめ足し込んでおいた行列に前処理フィルタ{f}を後から掛けたものを用いれば良い。よって、前処理フィルタ{f}を決定し、式(23)を解くことで予測係数を求めることができる。
【0112】
図8は、本発明を適用したデータ処理装置101の構成例を示すブロック図である。
【0113】
学習装置111は、教師画像としての高S/N画像と、予測係数を演算するときに使用される前処理フィルタ係数を入力し、予測係数を演算し、予測装置112に出力する。
【0114】
予測装置112には、低S/N画像と、学習装置111で算出された予測係数が入力される。予測装置112は、入力された低S/N画像から、予測タップに基づいた予測演算を行い、予測値としての高S/N画像を出力する。
【0115】
判定部113は、予測装置112が出力する高S/N画像に基づいて、前処理フィルタ係数を変更する必要があるか否かを判定し、前処理フィルタ係数を変更する必要があると判定した場合、変更した前処理フィルタ係数を学習装置111に出力する。
【0116】
なお、判定部113を省略して、作業者となるユーザが、予測装置112より出力される高S/N画像を見て判断し、学習装置111に前処理フィルタ係数を入力するようにしてもよい。
【0117】
図9のフローチャートを参照して、データ処理装置101が行う処理について説明する。
【0118】
ステップS101において、学習装置111は、入力された教師画像としての高S/N画像と、前処理フィルタ係数に基づいて、予測係数を求め、予測装置112に出力する。
【0119】
ステップS102において、予測装置112は、入力された低S/N画像と予測係数に基づいて、予測値としての高S/N画像を求め、出力する。
【0120】
ステップS103において、判定部113は、予測装置112が出力した高S/N画像に基づいて、学習装置111の前処理フィルタ係数を変更する必要があるか否かを判定する。変更する必要があると判定された場合、判定部113は、処理をステップS101に戻し、それ以降の処理が繰り返される。
【0121】
ステップS103で、変更する必要がないと判定された場合、判定部113は、処理を終了する。
【0122】
図10は、図8の学習装置111の構成例を示すブロック図である。
【0123】
教師データとしての高S/N画像(以下、適宜、教師画像という)は、例えば、フレーム単位で、フレームメモリ121に供給され、フレームメモリ121は、そこに供給される教師画像を順次記憶する。
【0124】
予測タップ生成回路122は、従来の図1の予測タップ生成回路25と同様に、フレームメモリ121に記憶された教師画像を構成する画素(以下、適宜、教師画素という)を、順次、注目画素とし、その注目画素の位置に対応する生徒画像の位置から周辺にある(空間的または時間的に近い位置にある)幾つかの生徒画像の画素(以下、適宜、生徒画素という)を、フレームメモリ121から読み出し、予測係数との乗算に用いる予測タップを構成する。従来の学習装置11とは異なり、前処理フィルタとなる係数を後で演算するため、従来の前処理フィルタ22(図1)に相当する回路が省かれている(その結果、教師画像と生徒画像は同一となる)ので、予測タップ生成回路122には、教師画像が生徒画像としてそのまま入力される。すなわち、教師画像の注目画素の位置に対応する教師画像の位置から周辺にある(空間的または時間的に近い位置にある)幾つかの教師画像の画素が、生徒画素としてフレームメモリ121から読み出され、予測タップが構成される。
【0125】
そして、予測タップ生成回路122で構成された予測タップは、加算回路124に供給される。
【0126】
加算回路124は、予測タップ生成回路122からの予測タップを構成する生徒画素を加算することで、式(23)の正規方程式の左辺における、予測係数{w}および前処理フィルタ{f}の乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路124は、その演算結果を、予測タップメモリ125に出力する。
【0127】
予測タップメモリ125は、加算回路124が出力する演算結果を記憶し、加算回路124が演算を行う際には、加算回路124にその記憶値を出力するようになっている。
【0128】
教師データ生成回路123は、フレームメモリ121に記憶された教師画像の注目画素と、それに対応する生徒画像(教師画像)の位置から周辺にある(空間的または時間的に近い位置にある)幾つかの生徒画素とから、新たな教師データを生成し、加算回路126に出力する。
【0129】
加算回路126は、教師データ生成回路123が出力した教師データを利用して、式(23)の正規方程式の右辺における前処理フィルタ{f}の乗数となっているサメーション(Σ)に相当する演算を行う。上述した例では、Ti,jは、式(19)のように表すことができるので、教師画像の注目画素tiに対してsj-1,sj,およびsj+1を乗じた値が教師データとして、教師データ生成回路123より入力される。そして、加算回路126は、その演算結果を、教師データメモリ127に出力する。
【0130】
教師データメモリ127は、加算回路126が出力する演算結果を記憶し、加算回路126が演算を行う際には、加算回路126にその記憶値を出力するようになっている。
【0131】
演算回路128は、予測タップメモリ125および教師データメモリ127それぞれに記憶されている記憶値を読み出し、式(25)に示した行列式の足し込み行列を演算することにより、前処理フィルタ{f}の係数を含んだ仮の予測係数(以下、仮予測係数と称する)を求め、仮予測係数メモリ129に出力する。
【0132】
仮予測係数メモリ129には、演算回路128から出力された仮予測係数の値が記憶され、記憶された値は、演算回路131に読み出されるようになっている。
【0133】
前処理フィルタ係数メモリ130には、上述した前処理フィルタ係数{f}が入力され、記憶される。
【0134】
演算回路131は、前処理フィルタ係数メモリ130に記憶された前処理フィルタ係数{f}と、仮予測係数メモリ129に記憶された仮予測係数を読み出し、式(25)を解くことにより、予測係数{w}を求める。
【0135】
次に、図11のフローチャートを参照して、図10の学習装置111により行われる、予測係数の学習処理について説明する。
【0136】
ステップS121において、学習装置111のフレームメモリ121、予測タップメモリ125、教師データメモリ127、仮予測係数メモリ129、および前処理フィルタ係数メモリ130などの全てのメモリが初期化される。
【0137】
ステップS122において、予測係数の学習用にあらかじめ用意された分の教師画像がフレームメモリ121に記憶され、その中の1つのフレームが注目フレームとされる。
【0138】
ステップS123において、教師データ生成回路123は、フレームメモリ121に記憶された教師画像の注目画素と、それに対応する生徒画像(教師画像)の位置から空間的または時間的に近い位置にある幾つかの生徒画素とから、新たな教師データを生成し、加算回路126に出力する。
【0139】
ステップS124において、フレームメモリ121に記憶された注目フレームの教師画素のうちの、まだ、注目画素とされていないものが、注目画素とされ、予測タップ生成回路122において、フレームメモリ121に記憶された(教師画像の)生徒画素を用いて、注目画素についての予測タップが構成される。そして、予測タップは、加算回路124に供給される。ここで、図10の学習装置111では(後述する図12の予測装置112においても同様)、予測タップは、図3で説明したのと同様に、注目画素を基準として固定の位置にある生徒画素によって、常に構成される。
【0140】
ステップS125において、予測タップおよび教師データそれぞれの足し込みが行われる。
【0141】
即ち、ステップS125において、予測タップメモリ125の記憶値が読み出され、加算回路124に供給される。加算回路124は、予測タップメモリ125から供給される記憶値と、予測タップ生成回路122から供給されるの予測タップを構成する生徒画素とを用いて、式(23)の正規方程式の左辺における、予測係数と前処理フィルタ係数の乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路124は、その演算結果を予測タップメモリ125に、上書きする形で記憶させる。
【0142】
さらに、ステップS125では、教師データメモリ127の記憶値が読み出され、加算回路126に供給される。加算回路126は、教師データ生成回路123から供給される教師データと、教師データメモリ127から供給された記憶値とを用いて、式(23)の正規方程式の右辺における前処理フィルタ係数の乗数となっているサメーション(Σ)に相当する演算を行う。そして、加算回路126は、その演算結果を教師データメモリ127に、上書きする形で記憶させる。
【0143】
ステップS126において、フレームメモリ121に記憶された注目フレームを構成する教師画素すべてを注目画素として、足し込みを行ったかどうかが判定され、まだ、教師画素のすべてを注目画素として、足し込みを行っていないと判定された場合、処理はステップS124に戻る。この場合、まだ、注目画素とされていない教師画素のうちの1つが、新たに注目画素とされ、ステップS124乃至S126の処理が繰り返される。
【0144】
ステップS126において、教師画素すべてを注目画素として、足し込みを行ったと判定された場合、ステップS127に進み、次に処理すべき教師画像が、フレームメモリ121に記憶されているか否かが判定される。
【0145】
ステップS127において、次に処理すべき教師画像が、フレームメモリ121に記憶されていると判定された場合、ステップS123に戻り、その、次に処理すべき教師画像を対象に(注目フレームとして)、ステップS123以降の処理が繰り返される。
【0146】
一方、ステップS127において、次に処理すべき教師画像が、フレーム121に記憶されていないと判定された場合、すなわち、予め学習用に用意しておいた全ての教師画像について処理を行った場合、ステップS128に進み、演算回路128は、予測タップメモリ125および教師データメモリ127それぞれに記憶されている記憶値を読み出し、式(24)の足し込み行列を演算し、前処理フィルタ係数を含んだ形の仮予測係数を求める。
【0147】
ステップS129において、前処理フィルタ係数が前処理フィルタ係数メモリ130に読み込まれ、記憶される。
【0148】
ステップS130において、演算回路131は、前処理フィルタ係数メモリ130に記憶された前処理フィルタ係数と、仮予測係数メモリ129に記憶された仮予測係数を読み出し、式(25)を解くことにより、予測係数を求め、出力する。
【0149】
図12は、図8の予測装置112の構成例を示している。
【0150】
フレームメモリ151には、S/Nを向上させる対象としての低S/N画像が、例えば、1フレーム単位などで供給されるようになっており、フレームメモリ151は、その低S/N画像を、そのS/Nを向上させる予測処理が終了するまで記憶する。
【0151】
なお、フレームメモリ151に供給する低S/N画像としては、従来と同様に、テレビジョン放送として放送されてくるテレビジョン放送番組を構成する画像や、DVDやビデオCD等の記録媒体から再生された画像等を用いることができる。
【0152】
予測タップ生成回路152は、図10の予測タップ生成回路122と同様の処理を行い、これにより、フレームメモリ151に記憶された低S/N画像を用いて、予測タップを構成し、予測演算回路153に供給する。
【0153】
メモリ154には、上述した学習処理を行うことにより得られた予測係数が入力され、記憶される。
【0154】
予測演算回路153は、予測タップ生成回路152から供給される予測タップと、メモリ154から供給される予測係数とを用いて、式(1)に示した線形予測演算(積和演算)を行い、その結果得られる画素値を、低S/N画像の画質を向上させた高S/N画像の予測値として出力する。
【0155】
次に、図13のフローチャートを参照して、図12の予測装置112において行われる、低S/N画像の画質を向上させる予測処理について説明する。
【0156】
ステップS151において、予測装置112のフレームメモリ151、およびメモリ154などの全てのメモリが初期化される。
【0157】
ステップS152において、上述した学習装置111で求められた予測係数がメモリ154に読み込まれる。
【0158】
ステップS153において、フレームメモリ151には、高S/N画像にする対象としての入力画像(低S/N画像)が、フレーム単位で順次供給され、記憶される。
【0159】
ステップS154では、フレームメモリ151に記憶された低S/N画像の画質を向上させた高S/N画像(予測装置では、この高S/N画像は、実際には存在しないが、仮想的に想定される)(以下、注目フレーム)を構成する画素のうちの、まだ、注目画素とされていないものが、注目画素とされ、予測タップ生成回路152において、フレームメモリ151に記憶された低S/N画像の画素を用いて、注目画素についての予測タップが構成される。そして、予測タップは、予測演算回路153に供給される。
【0160】
ステップS155では、メモリ154に記憶されている予測係数が読み出され、予測演算回路153に供給される。そして、予測演算回路153は、予測タップ生成回路152から供給される予測タップと、メモリ154から供給される予測係数とを用いて、式(1)に示した線形予測演算を行い、その結果得られる画素値を、注目画素の予測値として、一時記憶する。
【0161】
そして、ステップS156に進み、フレームメモリ151に記憶された注目フレームに対応する高S/N画像のフレームを構成する高S/N画素すべてを注目画素として、その予測値を求めたかどうかが判定される。ステップS156において、注目フレームを構成する高S/N画素すべてを注目画素として、まだ、予測値を求めていないと判定された場合、ステップS154に戻り、注目フレームを構成する画素のうち、まだ注目画素とされていないものが、新たに注目画素とされ、以下、同様の処理が繰り返される。
【0162】
一方、ステップS156において、注目フレームを構成する高S/N画素すべてを注目画素として、その予測値を求めたと判定された場合、ステップS157に進み、予測演算回路153は、それまでに求めた予測値でなる高画質の1フレームの画像を出力する。
【0163】
ステップS158において、フレームメモリ151に、次に処理すべきフレーム(いま注目フレームとなっているフレームの次のフレーム)が記憶されているかどうかが判定される。ステップS158において、フレーム151に、次に処理すべきフレームが記憶されていると判定された場合、ステップS153に戻り、そのフレームを、新たに注目フレームとして、以下、同様の処理が繰り返される。
【0164】
一方、ステップS158において、フレームメモリ151に、次に処理すべきフレームが記憶されていないと判定された場合、予測処理を終了する。
【0165】
以上のように、学習装置111において、足し込み行列を演算した後に、前処理フィルタ係数を掛けることにより、前処理フィルタの変更が即座に予測係数に反映されて、出力される。したがって、予測装置112において、前処理フィルタの変更の影響を見ながら前処理フィルタを細かく調整することができるので、迅速な入力データの予測が可能となる。
【0166】
なお、本実施の形態では、ぼかす前処理フィルタを用いて、低S/N画像から高S/N画像を予測する処理について説明したが、その他の画像や音声、または記録媒体から再生された信号(RF(Radio Frequency)信号)等を対象とすることも可能である。
【0167】
例えば、ノイズを付加する前処理フィルタを用いて、入力画像のノイズの程度に合せて、出力画像を見ながら前処理フィルタを調整できるので、高画質の画像を出力するための前処理フィルタの選定が容易になる。また、エッジ強調などの線形フィルタによる画像エフェクトを前処理フィルタとして用いると、エフェクトの結果を確認しながら調整が行える。
【0168】
入力信号を音声信号として、帯域を削るような前処理フィルタを用いた場合、出力される音声を実際に聞きながら、前処理フィルタの変更ができるので、ユーザの好みを反映した音声を出力することができる。
【0169】
圧縮レベルの調整を前処理フィルタとして用いると、復元後の処理画像、または、処理音声を確認しながら最適な圧縮レベルを選択することができる。
【0170】
さらに、本実施の形態では、適応処理(予測処理)において、線形一次式を用いるようにしたが、適応処理は、2次以上の次数の式を用いて行うことも可能である。
【0171】
次に、教師データに前処理フィルタを掛けて生徒データを生成してから予測係数を求める従来の学習装置11と、足しこみ行列の演算の後から前処理フィルタを掛ける本発明の学習装置111のそれぞれの演算回数について考察する。
【0172】
前処理フィルタタップ数をf、予測タップ数をn、および足し込みデータ数をNと表すとすると、従来の学習装置11においては、
前処理フィルタとの演算の回数は、
f×n (回)
加算回路における足し込みの回数は、
N×n×(n+1) (回)
正規方程式を解く演算の回数は、
3 (回)
と表すことができる。
【0173】
一方、本発明の学習装置112においては、
加算回路における足し込みの回数は、
N×n×(n+1)×f2 (回)
前処理フィルタとの演算の回数は、
f×n×f(f+1) (回)
正規方程式を解く演算の回数は、
3 (回)
と表すことができる。
【0174】
従って、前処理フィルタを変更した場合、従来の学習装置11において、予測係数を得るために必要な演算回数は、
f×n+N×n×(n+1)+n3 (回)
であるのに対して、本発明の学習装置112においては、足し込みの演算を行う必要がないので、
f×n×f(f+1)+n3 (回)
となる。
【0175】
ここで、入力データが音声データである場合、一般的な値を当てはめて、f=10,n=10とすると、従来の手法では、
110N+1100 (回)
本発明を用いると、
12,000 (回)
となる。
【0176】
足し込みデータ数Nは、サンプリング周波数44.1kHzのCD並の音声データを1分程度行う場合には、N=2,646,000となる。従って、従来の手法では、このNの値が代入され、
291,061,100 (回)
と膨大な数になる。
【0177】
さらに、予測精度を上げるため、音声データを1分より長くすれば、それに比例して足し込みデータ数Nの値は増えることとなる。
【0178】
また、例えば、画像データの場合、720×480ドットの画像1枚のあたり、N=345600となり、複数枚となると、同様に膨大な回数の演算を行わなければならない。
【0179】
それに対して、本発明では、前処理フィルタを変更した場合の必要な演算回数は、足し込みデータ数Nに拠らないため12,000回と変わることがないので、リアルタイムで学習を行わせ、予測係数を更新させるようにすることができる。
【0180】
上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0181】
そこで、図14は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0182】
図14において、CPU(Central Processing Unit)301は、ROM(Read Only Memory)302に記憶されているプログラム、または記憶部308からRAM(Random Access Memory)303にロードされたプログラムに従って各種の処理を実行する。RAM303にはまた、CPU301が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0183】
CPU301、ROM302、およびRAM303は、バス304を介して相互に接続されている。このバス304にはまた、入出力インタフェース305も接続されている。
【0184】
入出力インタフェース305には、キーボード、マウスなどよりなる入力部306、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部307、ハードディスクなどより構成される記憶部308、モデム、ターミナルアダプタなどより構成される通信部309が接続されている。通信部309は、インターネットを含むネットワークを介しての通信処理を行う。
【0185】
入出力インタフェース305にはまた、必要に応じてドライブ310が接続され、磁気ディスク321、光ディスク322、光磁気ディスク323、或いは半導体メモリ324などが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部308にインストールされる。
【0186】
なお、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
【0187】
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0188】
【発明の効果】
以上のごとく本発明のデータ処理装置および方法、記録媒体、並びにプログラムによれば、前処理フィルタの変更が即座に予測係数に反映され、迅速な入力データの予測が可能となる。
【図面の簡単な説明】
【図1】従来の学習装置の構成例を示すブロック図である。
【図2】教師画素と生徒画素を説明する図である。
【図3】予測タップとクラスタップを説明する図である。
【図4】図1の学習装置の学習処理を説明するフローチャートである。
【図5】従来の予測装置の構成例を示すブロック図である。
【図6】図5の予測装置の予測処理を説明するフローチャートである。
【図7】生徒データ、前処理フィルタ、および教師データを説明する図である。
【図8】本発明を適用したデータ処理装置の構成例を示すブロック図である。
【図9】図8のデータ処理装置の全体処理を説明するフローチャートである。
【図10】図8の学習装置の構成例を示すブロック図である。
【図11】図8の学習装置の学習処理を説明するフローチャートである。
【図12】図8の予測装置の構成例を示すブロック図である。
【図13】図8の予測装置の予測処理を説明するフローチャートである。
【図14】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【符号の説明】
101 データ処理装置, 111 学習装置, 112 予測装置, 113 判定部, 121 フレームメモリ, 122 予測タップ生成回路, 123 教師データ生成回路, 124 加算回路, 125 予測タップメモリ, 126 加算回路, 127 教師データメモリ, 128 演算回路, 129 仮予測係数メモリ, 130 前処理フィルタ係数メモリ, 131 演算回路, 151 フレームメモリ, 152 予測タップ生成回路, 153 予測演算回路, 154 メモリ

Claims (6)

  1. 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理装置であって、
    前記入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成手段と、
    前記入力データの、注目している前記注目入力データと、その周辺にある周辺データとから、前記予測係数の学習のための教師となる教師データを生成する生成手段と、
    前記入力データを構成するデータすべてを注目入力データとしたときの前記予測タップを用いた演算式および前記教師データを足し込んだ足し込み行列を演算することにより、前記教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と、
    前記前処理フィルタ係数の入力を受け、前記前処理フィルタ係数と前記仮予測係数とから、前記予測係数を求める予測係数演算手段と
    を備えることを特徴とするデータ処理装置。
  2. 前記予測係数演算手段は、前記入力データを用いた線形一次予測によって、前記出力データが得られるようにするための前記予測係数を求める
    ことを特徴とする請求項1に記載のデータ処理装置。
  3. 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理装置のデータ処理方法であって、
    前記入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、
    前記入力データの、注目している前記注目入力データと、その周辺にある周辺データとから、前記予測係数の学習のための教師となる教師データを生成する生成ステップと、
    前記入力データを構成するデータすべてを注目入力データとしたときの前記予測タップを用いた演算式および前記教師データを足し込んだ足し込み行列を演算することにより、前記教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算ステップと、
    前記前処理フィルタ係数の入力を受け、前記前処理フィルタ係数と前記仮予測係数とから、前記予測係数を求める予測係数演算ステップと
    を含むことを特徴とするデータ処理方法。
  4. 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理のプログラムであって、
    前記入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、
    前記入力データの、注目している前記注目入力データと、その周辺にある周辺データとから、前記予測係数の学習のための教師となる教師データを生成する生成ステップと、
    前記入力データを構成するデータすべてを注目入力データとしたときの前記予測タップを用いた演算式および前記教師データを足し込んだ足し込み行列を演算することにより、前記教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算ステップと、
    前記前処理フィルタ係数の入力を受け、前記前処理フィルタ係数と前記仮予測係数とから、前記予測係数を求める予測係数演算ステップと
    を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。
  5. 入力データを処理し、その入力データに対する出力データを予測するのに用いる予測係数を学習するデータ処理をコンピュータに行わせるプログラムにおいて、
    前記入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する予測タップ構成ステップと、
    前記入力データの、注目している前記注目入力データと、その周辺にある周辺データとから、前記予測係数の学習のための教師となる教師データを生成する生成ステップと、
    前記入力データを構成するデータすべてを注目入力データとしたときの前記予測タップを用いた演算式および前記教師データを足し込んだ足し込み行列を演算することにより、前記教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算ステップと、
    前記前処理フィルタ係数の入力を受け、前記前処理フィルタ係数と前記仮予測係数とから、前記予測係数を求める予測係数演算ステップと
    を含むことを特徴とするプログラム。
  6. 入力データを処理して、その入力データに対する出力データを予測する第1の装置と、
    前記出力データを予測するのに用いる予測係数を学習する第2の装置と
    を備えるデータ処理装置であって、
    前記第1の装置は、
    前記入力データから、注目している注目入力データの周辺にある周辺データを予測タップとして構成する第1の予測タップ構成手段と、
    前記第1の予測タップ構成手段より構成された前記予測タップと、所定の予測係数を用いて、前記注目入力データに対する出力データを予測する予測手段と
    を備え、
    前記第2の装置は、
    前記入力データを構成するデータのなかの注目している注目入力データと、その周辺にある周辺データそれぞれを予測タップとして構成する第2の予測タップ構成手段と、
    前記入力データの、注目している前記注目入力データと、その周辺にある周辺データとから、前記予測係数の学習のための教師となる教師データを生成する生成手段と、
    前記入力データを構成するデータすべてを注目入力データとしたときの前記予測タップを用いた演算式および前記教師データを足し込んだ足し込み行列を演算することにより、前記教師データから生徒データを求める前処理フィルタ係数を含む仮予測係数を求める仮予測係数演算手段と、
    前記前処理フィルタ係数の入力を受け、前記前処理フィルタ係数と前記仮予測係数とから、前記予測係数を求める予測係数演算手段と
    を備えることを特徴とするデータ処理装置。
JP2002337891A 2002-11-21 2002-11-21 データ処理装置および方法、記録媒体、並びにプログラム Expired - Fee Related JP4225039B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002337891A JP4225039B2 (ja) 2002-11-21 2002-11-21 データ処理装置および方法、記録媒体、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002337891A JP4225039B2 (ja) 2002-11-21 2002-11-21 データ処理装置および方法、記録媒体、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2004171366A JP2004171366A (ja) 2004-06-17
JP4225039B2 true JP4225039B2 (ja) 2009-02-18

Family

ID=32701269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002337891A Expired - Fee Related JP4225039B2 (ja) 2002-11-21 2002-11-21 データ処理装置および方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4225039B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008178A1 (en) * 2004-07-08 2006-01-12 Seeger Adam A Simulation of scanning beam images by combination of primitive features extracted from a surface model
JP4605468B2 (ja) * 2006-03-16 2011-01-05 ソニー株式会社 画像処理装置および画像処理方法、学習装置および学習方法、並びにプログラム
JP2008035001A (ja) * 2006-07-27 2008-02-14 Funai Electric Co Ltd 映像装置

Also Published As

Publication number Publication date
JP2004171366A (ja) 2004-06-17

Similar Documents

Publication Publication Date Title
US6678405B1 (en) Data processing apparatus, data processing method, learning apparatus, learning method, and medium
EP2352121A1 (en) Image processing apparatus and method
JP4362895B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP2013021635A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
WO2011061958A1 (ja) 復号化装置、復号化装置の制御方法、伝送システム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
US20120321214A1 (en) Image processing apparatus and method, program, and recording medium
JP5291804B2 (ja) 符号化装置、符号化装置の制御方法、伝送システム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4611535B2 (ja) 符号化された画像を評価するための処理、装置及び、使用
JP4517409B2 (ja) データ処理装置およびデータ処理方法
JP4324825B2 (ja) データ処理装置およびデータ処理方法、並びに媒体
US7679675B2 (en) Data converting apparatus, data converting method, learning apparatus, leaning method, program, and recording medium
JP4225039B2 (ja) データ処理装置および方法、記録媒体、並びにプログラム
JP3702464B2 (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP2007181186A (ja) 入力映像に適応的な解像度変換装置及び解像度変換方法
JP4135045B2 (ja) データ処理装置およびデータ処理方法、並びに媒体
JP2002199353A (ja) 情報信号処理装置、情報信号処理方法、画像信号処理装置およびそれを使用した画像表示装置、並びに情報提供媒体
JP4035895B2 (ja) 画像変換装置および方法、並びに記録媒体
JP4650683B2 (ja) 画像処理装置および方法、プログラム並びに記録媒体
JP2001222702A (ja) 画像処理装置および画像処理方法、並びに記録媒体
US8355603B2 (en) Data converting apparatus and data converting method, learning device and learning method, and recording medium
JP4096281B2 (ja) 画像処理装置および画像処理方法、並びに媒体
JP4442076B2 (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4505729B2 (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体
JP4650684B2 (ja) 画像処理装置および方法、プログラム並びに記録媒体
JP2000151723A (ja) データ処理装置およびデータ処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees