JP3915855B2 - 画像符号化装置および画像符号化方法、並びに学習装置および学習方法 - Google Patents

画像符号化装置および画像符号化方法、並びに学習装置および学習方法 Download PDF

Info

Publication number
JP3915855B2
JP3915855B2 JP35042597A JP35042597A JP3915855B2 JP 3915855 B2 JP3915855 B2 JP 3915855B2 JP 35042597 A JP35042597 A JP 35042597A JP 35042597 A JP35042597 A JP 35042597A JP 3915855 B2 JP3915855 B2 JP 3915855B2
Authority
JP
Japan
Prior art keywords
prediction
compressed data
error
value
original image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35042597A
Other languages
English (en)
Other versions
JPH11187407A (ja
Inventor
哲二郎 近藤
小林  直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP35042597A priority Critical patent/JP3915855B2/ja
Priority to US09/213,460 priority patent/US6438267B1/en
Publication of JPH11187407A publication Critical patent/JPH11187407A/ja
Application granted granted Critical
Publication of JP3915855B2 publication Critical patent/JP3915855B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像符号化装置および画像符号化方法並びに学習装置および学習方法に関し、特に、原画像とほぼ同一の復号画像が得られるように、画像を、例えば間引くことにより符号化する画像符号化装置および画像符号化方法並びに学習装置および学習方法に関する。
【0002】
【従来の技術】
従来より、画像の符号化方法については、種々の方法が提案されているが、そのうちの1つに、例えば、画像を、その画素を間引くこと(subsampling)により圧縮符号化する方法がある。
【0003】
【発明が解決しようとする課題】
しかしながら、このように間引いて圧縮した画像(上位階層の画像)を、単純な補間(例えば、周辺画素の予約値など)により伸張した場合、その結果得られる復号画像(下位階層の画像)の解像度が劣化する。
【0004】
ここで、このように復号画像の解像度が劣化する原因として、第1に、間引い画像には、元の画像に含まれる高周波数成分が含まれていないことと、第2に、間引き後の画像を構成する画素の画素値が、元の画像を復元するのに、必ずしも適当でないことが考えられる。
【0005】
本発明は、このような状況に鑑みてなされたものであり、原画像と同一(ほぼ同一)の復号画像が得られるように、画像を間引いて、迅速に圧縮符号化することができるようにするものである。
【0006】
【課題を解決するための手段】
請求項1に記載の画像符号化装置は、原画像を、その画素数を少なくすることにより圧縮し、圧縮データとする圧縮手段と、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、原画像を予測し、その予測値を求める予測手段と、原画像に対する、予測値の予測誤差を算出する予測誤差算出手段と、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求める誤差最小データ算出手段と、誤差最小データ算出手段が出力する圧縮データを、原画像の符号化結果として出力する出力手段とを備えることを特徴とする。
【0007】
請求項5に記載の画像符号化方法は、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、原画像を予測し、その予測値を求め、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、その圧縮データを、原画像の符号化結果として出力することを特徴とする。
【0009】
請求項6に記載の学習装置は、原画像を、その画素数を少なくすることにより圧縮し、圧縮データとする圧縮手段と、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力するクラス分類手段と、圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた圧縮データの画素値と原画像の画素値とを用いて、複数の値それぞれについて、予測値と原画像の画素値との予測誤差を最小にする予測係数を、クラスごとに求める予測係数演算手段と、圧縮データと予測係数との線形結合により、複数の値それぞれについての予測値を求める予測値演算手段と、複数の値それぞれについて、原画像に対する、予測値の予測誤差を算出する予測誤差算出手段と、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求める誤差最小データ算出手段と、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データと、原画像の画素値とを用いて、予測値と原画像の画素値との予測誤差を最小にする予測係数が予測係数演算手段によってさらに求められ、その求められ予測係数を出力する出力手段とを備えることを特徴とする。
【0010】
請求項8に記載の学習方法は、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力し、圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた圧縮データの画素値と原画像の画素値とを用いて、複数の値それぞれについて、予測値と原画像の画素値との予測誤差を最小にする予測係数を、クラスごとに求め、その予測係数と圧縮データとの線形結合により、複数の値それぞれについての予測値を求め、複数の値それぞれについて、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データと、原画像の画素値とを用いて、予測値と原画像の画素値との予測誤差を最小にする予測係数がさらに求められ、その求められ予測係数を出力することを特徴とする。
請求項9に記載の画像符号化装置は、原画像を、その画素数を少なくすることにより圧縮し、圧縮データとする圧縮手段と、圧縮データに基づいて、原画像を予測し、その予測値を求める予測手段と、原画像に対する、予測値の予測誤差を算出する予測誤差算出手段と、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求める誤差最小データ算出手段と、誤差最小データ算出手段が出力する圧縮データを、原画像の符号化結果として出力する出力手段とを備えることを特徴とする。
請求項10に記載の画像符号化方法は、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、原画像を予測して、その予測値を求め、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、その圧縮データを、原画像の符号化結果として出力することを特徴とする。
【0011】
請求項1に記載の画像符号化装置においては、圧縮手段は、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、予測手段は、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、原画像を予測し、その予測値を求めるようになされている。予測誤差算出手段は、原画像に対する、予測値の予測誤差を算出し、誤差曲線推定手段は、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定するようになされている。誤差最小データ算出手段は、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、出力手段は、誤差最小データ算出手段が出力する圧縮データを、原画像の符号化結果として出力するようになされている。
【0012】
請求項5に記載の画像符号化方法においては、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、原画像を予測し、その予測値を求め、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、その圧縮データを、原画像の符号化結果として出力するようになされている。
【0014】
請求項6に記載の学習装置においては、圧縮手段は、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとするようになされている。クラス分類手段は、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力し、予測係数演算手段は、圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた圧縮データの画素値と原画像の画素値とを用いて、複数の値それぞれについて、予測値と原画像の画素値との予測誤差を最小にする予測係数を、クラスごとに求めるようになされている。予測値演算手段は、圧縮データと予測係数との線形結合により、複数の値それぞれについての予測値を求め、予測誤差算出手段は、複数の値それぞれについて、原画像に対する、予測値の予測誤差を算出するようになされている。誤差曲線推定手段は、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差最小データ算出手段は、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求めるようになされている。出力手段は、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データと、原画像の画素値とを用いて、予測値と原画像の画素値との予測誤差を最小にする予測係数が予測係数演算手段によってさらに求められ、その求められ予測係数を出力するようになされている。
【0015】
請求項8に記載の学習方法においては、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力し、圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた圧縮データの画素値と原画像の画素値とを用いて、複数の値それぞれについて、予測値と原画像の画素値との予測誤差を最小にする予測係数を、クラスごとに求め、その予測係数と圧縮データとの線形結合により、複数の値それぞれについての予測値を求め、複数の値それぞれについて、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データと、原画像の画素値とを用いて、予測値と原画像の画素値との予測誤差を最小にする予測係数がさらに求められ、その求められ予測係数を出力するようになされている。
請求項9に記載の画像符号化装置においては、圧縮手段は、原画像、その画素数を少なくすることにより圧縮して、圧縮データとし、予測手段は、圧縮データに基づいて、原画像を予測し、その予測値を求める。予測誤差算出手段は、原画像に対する、予測値の予測誤差を算出し、誤差曲線推定手段は、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定する。誤差最小データ算出手段は、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、出力手段は、誤差最小データ算出手段が出力する圧縮データを、原画像の符号化結果として出力する。
請求項10に記載の画像符号化方法においては、原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、圧縮データに基づいて、原画像を予測して、その予測値を求め、原画像に対する、予測値の予測誤差を算出し、圧縮データの画素値を複数の値に変化させたときの予測誤差から、圧縮データの画素値と予測誤差との関係を表す誤差曲線を推定し、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを求め、その圧縮データを、原画像の符号化結果として出力するようになされている。
【0025】
【発明の実施の形態】
図1は、本発明を適用した画像処理装置の一実施の形態の構成を示している。
【0026】
送信装置1には、ディジタル化された画像データが供給されるようになされている。送信装置1は、入力された画像データを間引くこと(その画素数を少なくすること)により圧縮、符号化し、その結果得られる符号化データを、例えば、光ディスクや、光磁気ディスク、磁気テープ、相変化ディスクその他でなる記録媒体2に記録し、または、例えば、地上波や、衛星回線、電話回線、CATV網、インターネットその他の伝送路3を介して伝送する。
【0027】
受信装置4では、記録媒体2に記録された符号化データが再生され、または、伝送路3を介して伝送されてくる符号化データが受信され、その符号化データが伸張、復号化される。そして、その結果得られる復号画像が、図示せぬディスプレイに供給されて表示される。
【0028】
なお、以上のような画像処理装置は、例えば、光ディスク装置や、光磁気ディスク装置、磁気テープ装置その他の、画像の記録/再生を行う装置や、あるいはまた、例えば、テレビ電話装置や、テレビジョン放送システム、CATVシステムその他の、画像の伝送を行う装置などに適用される。また、送信装置1が出力する符号化データのデータ量は少ないため、図1の画像処理装置は、伝送レートの低い、例えば、携帯電話機その他の、移動に便利な携帯端末などにも適用可能である。
【0029】
図2は、図1の送信装置1の構成例を示している。
【0030】
I/F(InterFace)11は、外部から供給される画像データの受信処理と、送信機/記録装置16に対しての、符号化データの送信処理を行うようになされている。ROM(Read Only Memory)12は、IPL(Initial Program Loading)用のプログラムその他を記憶している。RAM(Random Access Memory)13は、外部記憶装置15に記録されているシステムプログラム(OS(Operating System))やアプリケーションプログラムを記憶したり、また、CPU(Central Processing Unit)14の動作上必要なデータを記憶するようになされている。CPU14は、ROM12に記憶されているIPLプログラムにしたがい、外部記憶装置15からシステムプログラムおよびアプリケーションプログラムを、RAM13に展開し、そのシステムプログラムの制御の下、アプリケーションプログラムを実行することで、I/F11から供給される画像データについての、後述するような符号化処理を行うようになされている。外部記憶装置15は、例えば、磁気ディスク装置などでなり、上述したように、CPU14が実行するシステムプログラムやアプリケーションプログラムを記憶している他、CPU14の動作上必要なデータも記憶している。送信機/記録装置16は、I/F11から供給される符号化データを、記録媒体2に記録し、または伝送路3を介して伝送するようになされている。
【0031】
なお、I/F11,ROM12,RAM13,CPU14、および外部記憶装置15は、相互にバスを介して接続されている。
【0032】
以上のように構成される送信装置1においては、I/F11に画像データが供給されると、その画像データは、CPU14に供給される。CPU14は、画像データを符号化し、その結果得られる符号化データを、I/F11に供給する。I/F11は、符号化データを受信すると、それを、送信機/記録装置16に供給する。送信機/記録装置16では、I/F11からの符号化データが、記録媒体2に記録され、または伝送路3を介して伝送される。
【0033】
図3は、図2の送信装置1の、送信機/記録装置16を除く部分の機能的な構成例を示している。
【0034】
符号化すべき画像データは、圧縮部21、ローカルデコード部22、および誤差算出部23に供給されるようになされている。圧縮部21は、画像データを、例えば、単純に間引くことにより圧縮し、その結果得られる圧縮データ(間引きが行われた後の画像データ)を、判定部24からの制御にしたがって補正するようになされている。圧縮部21における補正の結果得られる補正データは、ローカルデコード部22および判定部24に供給するようになされている。
【0035】
ローカルデコード部22は、圧縮部21からの補正データに基づいて、元の画像を予測し、その予測値を、誤差算出部23に供給するようになされている。なお、ローカルデコード部22は、後述するように、補正データと元の画像データとを用いて、その補正データとの線形結合により、予測値を算出するための、所定のクラスごとの予測係数を求める処理を行い、その予測係数に基づいて、予測値を求める適応処理を行うようになされている。そして、ローカルデコード部22は、上述したように、予測値を、誤差算出部23に供給する他、そのとき求めたクラスごとの予測係数を、判定部24に供給するようにもなされている。
【0036】
誤差算出部23は、そこに入力される、元の画像データ(原画像)に対する、ローカルデコード部22からの予測値の予測誤差を算出するようになされている。この予測誤差は、誤差情報として、判定部24に供給されるようになされている。
【0037】
判定部24は、誤差算出部23からの誤差情報に基づいて、圧縮部21が出力した補正データを、元の画像の符号化結果とすることの適正さを判定するようになされている。そして、判定部24は、圧縮部21が出力した補正データを、元の画像の符号化結果とすることが適正でないと判定した場合には、圧縮部21を制御し、さらに、圧縮データを補正させ、その結果得られる新たな補正データを出力させるようになされている。また、判定部24は、圧縮部21が出力した補正データを、元の画像の符号化結果とすることが適正であると判定した場合には、圧縮部21から供給された補正データを、最適な圧縮データ(以下、適宜、最適圧縮データという)として多重化部25に供給するとともに、ローカルデコード部22から供給されたクラスごとの予測係数を多重化部25に供給するようになされている。
【0038】
多重化部25は、判定部24からの最適圧縮データ(補正データ)と、クラスごとの予測係数とを多重化し、その多重化結果を、符号化データとして、送信機/記録装置16(図2)に供給するようになされている。
【0039】
次に、図4のフローチャートを参照して、その動作について説明する。圧縮部21に対して、画像データが供給されると、圧縮部21は、ステップS1において、その画像データを間引くことにより圧縮し、最初は、補正を行わずに、ローカルデコード部22および判定部24に出力する。
【0040】
ここで、圧縮部21は、入力された画像データを1/Nに間引くことにより圧縮データとするようになされている。即ち、圧縮部21は、ここでは、例えば、図5に示すように、画像データを、例えば、1/9に間引くようになされている。具体的には、圧縮部21は、3×3(横×縦)の9画素を1単位とし、各単位の中心の画素(同図において、●印で示す部分)についての画素値のみを抽出し、他の部分(同図において、○印で示す部分)を削除する。あるいは、3×3の9画素の平均値などを計算し、それを、3×3画素のうちの中心にある画素の画素値とする。従って、この場合、圧縮率は1/9である。
【0041】
なお、圧縮部21は、以上のような処理を、例えば、1フレーム(または1フィールド)単位で行うようになされている。
【0042】
図4に戻り、ローカルデコード部22では、ステップS2において、圧縮部21からの補正データ(ここでは、最初は、上述したように、画像データを、単純に間引いた圧縮データそのもの)がローカルデコードされる(画素数の少ない上位階層の画像が、画素数の多い下位階層の画像にマッピングされる)。
【0043】
即ち、ステップS2では、圧縮部21からの補正データと元の画像データとを用いて、その補正データとの線形結合により、元の画像の予測値を算出するための、クラスごとの予測係数を求める処理が行われ、その予測係数に基づいて、予測値が求められる。ローカルデコード部22において求められた予測値は誤差算出部23に、また、クラスごとの予測係数は、判定部24に供給される。
【0044】
ここで、ローカルデコード部22が出力する予測値で構成される画像は、受信装置4(図1)側において得られる復号画像と同一のものである。
【0045】
誤差算出部23は、ローカルデコード部22から、元の画像の予測値を受信すると、ステップS3において、元の画像データに対する、ローカルデコード部22からの予測値の予測誤差を算出し、誤差情報として、判定部24に供給する。即ち、誤差算出部23は、例えば、元の画像データから、予測値を減算することを、画素単位で行い、その2乗和を求め、これを、誤差情報として、判定部24に供給する。
【0046】
判定部24は、誤差算出部23から誤差情報を受信すると、ステップS4において、その誤差情報に基づいて、圧縮部21が出力した補正データを、元の画像の符号化結果とすることの適正さを判定する。
【0047】
即ち、ステップS4においては、誤差情報が所定の閾値ε以下であるかどうかが判定される。ステップS4において、誤差情報が所定の閾値ε以下でないと判定された場合、圧縮部21が出力した補正データを、元の画像の符号化データとするのは適正でないと認識され、ステップS5に進み、判定部24は、圧縮部21を制御し、これにより、圧縮データを補正させる。圧縮部21は、判定部24の制御にしたがって、圧縮データを補正(元の画像を間引いて得られる画像を構成する画素の画素値を補正)し、その結果得られる補正データを、ローカルデコード部22および判定部24に出力する。そして、ステップS2に戻り、以下、同様の処理が繰り返される。
【0048】
一方、ステップS4において、誤差情報が所定の閾値ε以下であると判定された場合、圧縮部21が出力した補正データを、元の画像の符号化結果とするのは適正であると認識され、判定部24は、所定の閾値ε以下の誤差情報が得られたときの補正データを、最適圧縮データとして、クラスごとの予測係数とともに、多重化部25に出力する。多重化部25では、ステップS6において、判定部24からの最適圧縮データとクラスごとの予測係数とが多重化され、その結果得られる符号化データが出力されて、処理を終了する。
【0049】
以上のように、誤差情報が所定の閾値ε以下となったときにおける、圧縮データを補正した補正データを、元の画像の符号化結果とするようにしたので、受信装置4側においては、その補正データに基づいて、元の画像(原画像)とほぼ同一の画像を得ることが可能となる。
【0050】
次に、図6は、図3のローカルデコード部22の構成例を示している。
【0051】
圧縮部21からの補正データは、クラス分類用ブロック化回路41および予測値計算用ブロック化回路42に供給されるようになされている。クラス分類用ブロック化回路41は、補正データを、その性質に応じて所定のクラスに分類するための単位である、例えば注目補正データを中心としたクラス分類用ブロックにブロック化するようになされている。
【0052】
即ち、いま、図5において、上からi番目で、左からj番目の補正データ(圧縮データ)(画素)(図中、●印で示す部分)をXijと表すとすると、クラス分類用ブロック化回路41は、注目補正データXijの左上、上、右上、左、右、左下、下、右下に隣接する8つの画素X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),Xi(j-1),Xi(j+1),X(i+1)(j-1),X(i+1)j,X(i+1)(j+1)に、自身を含め、合計9画素で構成されるクラス分類用ブロックを構成するようになされている。このクラス分類用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
【0053】
なお、この場合、クラス分類用ブロックは、3×3画素でなる正方形状のブロックで構成されることとなるが、クラス分類用ブロックの形状は、正方形である必要はなく、その他、例えば、長方形や、十文字形、その他の任意な形とすることが可能である。また、クラス分類用ブロックを構成する画素数も、3×3の9画素に限定されるものではない。
【0054】
予測値計算用ブロック化回路42は、補正データを、元の画像の予測値を計算するための単位である、例えば注目補正データを中心とした予測値計算用ブロックにブロック化するようになされている。即ち、いま、図5において、補正データXij(図中、●印で示す部分)を中心とする、元の画像(原画像)における3×3の9画素の画素値を、その最も左から右方向、かつ上から下方向に、Yij(1),Yij(2),Yij(3),Yij(4),Yij(5),Yij(6),Yij(7),Yij(8),Yij(9)と表すとすると、画素Yij(1)乃至Yij(9)の予測値の計算のために、予測値計算用ブロック化回路42は、例えば、注目補正データXijを中心とする5×5の25画素X(i-2)(j-2),X(i-2)(j-1),X(i-2)j,X(i-2)(j+1),X(i-2)(j+2),X(i-1)(j-2),X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),X(i-1)(j+2),Xi(j-2),Xi(j-1),Xij,Xi(j+1),Xi(j+2),X(i+1)(j-2),X(i+1)(j-1),X(i+1)j,X(i+1)(j+1),X(i+1)(j+2),X(i+2)(j-2),X(i+2)(j-1),X(i+2)j,X(i+2)(j+1),X(i+2)(j+2)で構成される正方形状の予測値計算用ブロックを構成するようになされている。
【0055】
具体的には、例えば、図5において四角形で囲む、元の画像における画素Y33(1)乃至Y33(9)の9画素の予測値の計算のためには、画素X11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55により、予測値計算用ブロックが構成される(この場合の注目補正データは、X33となる)。
【0056】
予測値計算用ブロック化回路42において得られた予測値計算用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
【0057】
なお、予測値計算用ブロックについても、クラス分類用ブロックにおける場合と同様に、その画素数および形状は、上述したものに限定されるものではない。但し、予測値計算用ブロックを構成する画素数は、クラス分類用ブロックを構成する画素数よりも多くするのが望ましい。
【0058】
また、上述のようなブロック化を行う場合において(ブロック化以外の処理についても同様)、画像の画枠付近では、対応する画素が存在しないことがあるが、この場合には、例えば、画枠部分を構成する画素と同一の画素が、その外側に存在するものとして処理を行う。
【0059】
クラス分類適応処理回路43は、ADRC(Adaptive Dynamic Range Coding)処理回路、クラス分類回路45、および適応処理回路46で構成され、クラス分類適応処理を行うようになされている。
【0060】
クラス分類適応処理とは、入力信号を、その特徴に基づいて幾つかのクラスに分類し、各クラスの入力信号に、そのクラスに適切な適応処理を施すもので、大きく、クラス分類処理と適応処理とに分かれている。
【0061】
ここで、クラス分類処理および適応処理について簡単に説明する。
【0062】
まず、クラス分類処理について説明する。
【0063】
いま、例えば、図7(A)に示すように、ある注目画素と、それに隣接する3つの画素により、2×2画素でなるブロック(クラス分類用ブロック)を構成し、また、各画素は、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとする。この場合、注目画素を含む2×2の4画素のブロックは、各画素のレベル分布により、図7(B)に示すように、16(=(214)パターンに分類することができる。従って、いまの場合、注目画素は、16のパターンに分類することができ、このようなパターン分けが、クラス分類処理であり、クラス分類回路45において行われる。
【0064】
なお、クラス分類処理は、画像(ブロック内の画像)のアクティビティ(画像の複雑さ)(変化の激しさ)などをも考慮して行うようにすることが可能である。
【0065】
ここで、通常、各画素には、例えば8ビット程度が割り当てられる。また、本実施の形態においては、上述したように、クラス分類用ブロックは、3×3の9画素で構成される。従って、このようなクラス分類用ブロックを対象にクラス分類処理を行ったのでは、(289という膨大な数のクラスに分類されることになる。
【0066】
そこで、ここでは、ADRC処理回路44において、クラス分類用ブロックに対して、ADRC処理が施されるようになされており、これにより、クラス分類用ブロックを構成する画素のビット数を小さくすることで、クラス数を削減するようになされている。
【0067】
即ち、例えば、いま、説明を簡単にするため、図8(A)に示すように、直線上に並んだ4画素で構成されるブロックを考えると、ADRC処理においては、そのブロック内における画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、ブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、ブロックを構成する画素の画素値がKビットに再量子化される。
【0068】
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算して、その結果得られる除算値に対応するコード(ADRCコード)に変換する。具体的には、例えば、K=2とした場合、図8(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。そして、復号側においては、ADRCコード00B,01B,10B、または11Bは、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換され、その値に、最小値MINが加算されることで復号が行われる。
【0069】
ここで、このようなADRC処理はノンエッジマッチングと呼ばれる。
【0070】
なお、ADRC処理については、本件出願人が先に出願した、例えば、特開平3−53778号公報などに、その詳細が開示されている。
【0071】
ブロックを構成する画素に割り当てられているビット数より少ないビット数で再量子化を行うADRC処理を施すことにより、上述したように、クラス数を削減することができ、このようなADRC処理が、ADRC処理回路44において行われるようになされている。
【0072】
なお、本実施の形態では、クラス分類回路45において、ADRC処理回路44から出力されるADRCコードに基づいて、クラス分類処理が行われるが、クラス分類処理は、その他、例えば、DPCM(予測符号化)や、BTC(Block Truncation Coding)、VQ(ベクトル量子化)、DCT(離散コサイン変換)、アダマール変換などを施したデータを対象に行うようにすることも可能である。
【0073】
次に、適応処理について説明する。
【0074】
例えば、いま、元の画像の画素値yの予測値E[y]を、その周辺の幾つかの画素の画素値(以下、適宜、学習データという)x1,x2,・・・と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0075】
Figure 0003915855
【0076】
式(1)を一般化するために、予測係数wの集合でなる行列W、学習データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、
【数1】
Figure 0003915855
で定義すると、次のような観測方程式が成立する。
【0077】
Figure 0003915855
【0078】
そして、この観測方程式に最小自乗法を適用して、元の画像の画素値yに近い予測値E[y]を求めることを考える。この場合、元の画像の画素値(以下、適宜、教師データという)yの集合でなる行列Y、および元の画像の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数2】
Figure 0003915855
で定義すると、式(2)から、次のような残差方程式が成立する。
【0079】
Figure 0003915855
【0080】
この場合、元の画像の画素値yに近い予測値E[y]を求めるための予測係数wiは、自乗誤差
【数3】
Figure 0003915855
を最小にすることで求めることができる。
【0081】
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、元の画像の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0082】
【数4】
Figure 0003915855
Figure 0003915855
【0083】
そこで、まず、式(3)を、予測係数wiで微分することにより、次式が成立する。
【0084】
【数5】
Figure 0003915855
Figure 0003915855
【0085】
式(4)および(5)より、式(6)が得られる。
【0086】
【数6】
Figure 0003915855
Figure 0003915855
【0087】
さらに、式(3)の残差方程式における学習データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0088】
【数7】
Figure 0003915855
Figure 0003915855
【0089】
式(7)の正規方程式は、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(7)を解くことで、最適な予測係数wを求めることができる。なお、式(7)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。
【0090】
以上のようにして、クラスごとに最適な予測係数wを求め、さらに、その予測係数wを用い、式(1)により、元の画像の画素値yに近い予測値E[y]を求めるのが適応処理であり、この適応処理が、適応処理回路46において行われるようになされている。
【0091】
なお、適応処理は、間引かれた画像には含まれていない、元の画像に含まれる成分が再現される点で、補間処理とは異なる。即ち、適応処理は、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、元の画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造作用がある処理ということができる。
【0092】
次に、図9のフローチャートを参照して、図6のローカルデコード部22の処理について説明する。
【0093】
ローカルデコード部22においては、まず最初に、ステップS21において、圧縮部21からの補正データがブロック化される。即ち、クラス分類用ブロック化回路41において、補正データが、注目補正データを中心とする3×3画素のクラス分類用ブロックにブロック化され、クラス分類適応処理回路43に供給されるとともに、予測値計算用ブロック化回路42において、補正データが、注目補正データを中心とする5×5画素の予測値計算用ブロックにブロック化され、クラス分類適応処理回路43に供給される。
【0094】
クラス分類適応処理回路43には、上述したように、クラス分類用ブロックおよび予測値計算用ブロックの他、元の画像データが供給されるようになされており、クラス分類用ブロックはADRC処理部44に、予測値計算用ブロックおよび元の画像データは適応処理回路46に供給される。
【0095】
ADRC処理回路44は、クラス分類用ブロックを受信すると、ステップS22において、そのクラス分類用ブロックに対して、例えば、1ビットのADRC(1ビットで再量子化を行うADRC)処理を施し、これにより、補正データを、1ビットに変換(符号化)して、クラス分類回路45に出力する。クラス分類回路45は、ステップS23において、ADRC処理が施されたクラス分類用ブロックから、クラス分類処理を施す。即ち、ADRC処理が施されたクラス分類用ブロックを構成する各画素のレベル分布の状態を検出し、そのクラス分類用ブロックが属するクラス(そのクラス分類用ブロックを構成する注目補正データ(中心に配置された補正データ)のクラス)を判定する。このクラスの判定結果は、クラス情報として、適応処理回路46に供給される。
【0096】
なお、1ビットのADRC処理が施された3×3の9画素で構成されるクラス分類用ブロック全体を対象に、クラス分類処理が施されるとした場合、各クラス分類用ブロックは、512(=(219)のクラスのうちのいずれかに分類されることになる。
【0097】
そして、ステップS24に進み、適応処理回路46において、クラス分類回路45からのクラス情報に基づいて、各クラスごとに適応処理が施され、これにより、クラスごとの予測係数および1フレームの元の画像データ(原画像データ)の予測値が算出される。
【0098】
即ち、本実施の形態においては、例えば、クラスごとに25×9個の予測係数が、1フレーム分の原画像データおよび補正データから算出される。さらに、ある1つの補正データに注目した場合に、その注目補正データに対応する元画像の画素と、その画素の周りに隣接する8個の元画像の画素の、合計9個の画素についての予測値が、注目補正データのクラス情報に対応する25×9個の予測係数と、その注目補正データを中心とする5×5画素でなる予測値計算用ブロックとを用いて、適応処理が行われることにより算出される。
【0099】
具体的には、例えば、いま、図5に示した補正データ(注目補正データ)X33を中心とする3×3の補正データX22,X23,X24,X32,X33,X34,X42,X43,X44でなるクラス分類用ブロックについてのクラス情報Cが、クラス分類回路45から出力され、また、そのクラス分類用ブロックに対応する予測値計算用ブロックとして、補正データX33を中心とする5×5画素の補正データX11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55でなる予測値計算用ブロックが、予測値計算用ブロック化回路42から出力されたものとすると、まず、その予測値計算用ブロックを構成する補正データを、学習データとするとともに、元の画像における、補正データX33を中心とする3×3画素(図5において四角形で囲んである部分)の画素値Y33(1)乃至Y33(9)を、教師データとして、式(7)に示した正規方程式がたてられる。
【0100】
さらに、所定期間としての、例えば、1フレームの中で、同一のクラス情報Cにクラス分類されるクラス分類用ブロックに対応する、他の予測値計算用ブロックについても同様にして、正規方程式がたてられ、画素値Y33(k)(ここでは、k=1,2,・・・,9)の予測値E[Y33(k)]を求めるための予測係数w1(k)乃至w25(k)(本実施の形態では、1つの予測値を求めるのに学習データが25個用いられるので、それに対応して、予測係数wも25個必要となる)を算出することができるだけの数の正規方程式が得られると(従って、そのような数の正規方程式が得られるまでは、ステップS24では、正規方程式をたてる処理までが行われる)、その正規方程式を解くことで、クラス情報Cについて、画素値Y33(k)の予測値E[Y33(k)]を求めるのに最適な予測係数w1(k)乃至w25(k)が算出される。この処理は、各クラスごとに行われ、これにより、各クラスごとに、25×9の予測係数が算出される(25個の補正データを用いて、9個の予測値を求めるため、各クラスについての予測係数の数は、25×9個となる)。
【0101】
そして、クラス情報Cについての予測係数と予測値計算用ブロックとを用い、式(1)に対応する次式にしたがって、予測値E[Y33(k)]が求められる。
【0102】
Figure 0003915855
【0103】
ステップS24では、以上のようにして、25×9の予測係数が、クラスごとに求められ、そのクラスごとの予測係数を用いて、注目補正データを中心とする3×3の原画像の画素の予測値が求められる。
【0104】
その後、ステップS25に進み、クラスごとの25×9の予測係数は判定部24に供給され、3×3の予測値は誤差算出部23に供給される。そして、ステップS21に戻り、以下同様の処理が、例えば、1フレーム(または1フィールド)単位で繰り返される。
【0105】
ところで、図4の実施の形態では、誤差情報が所定の閾値ε以下となったときにおける、圧縮データを補正した補正データを、元の画像の符号化結果とするようにしたが、この場合、一般には、所定の閾値εを大きくすれば、ステップS2乃至S5の繰り返し回数は少なくなり、処理速度は向上するが、受信装置4側において得られる復号画像の画質は劣化する。
【0106】
復号画像の画質の観点からは、閾値εは、元の画像から得られる誤差情報の最小値以上の値であって、その最小値に限りなく近い値であるのが最も好ましく、この場合、図3の送信装置1においては、実質的に、例えば、図10に示すフローチャートにしたがった処理を行う必要がある。
【0107】
即ち、この場合、まず最初に、ステップS31において、図4のステップS1における場合と同様にして、圧縮部21によって、圧縮データが生成され、ステップS32に進む。ステップS32では、圧縮部21において、圧縮データのうちの1つ(1画素)が、補正対象画素として選択され、ステップS33に進み、補正対象画素の画素値Xに、初期値としての、例えば、0が設定される。ここで、圧縮データは、例えば、0乃至XMAX(>0)の範囲の整数値をとるものとする。また、以下、適宜、圧縮データで構成される1フレーム(または1フィールド)の画像を、圧縮画像という。
【0108】
補正対象画素を含む圧縮画像は、補正データとして、圧縮部21から、ローカルデコード部22および判定部24に対して供給される。ローカルデコード部22では、圧縮部21から補正データを受信すると、ステップS34において、上述したようにして、その補正データと元の画像データを用いて、クラスごとの予測係数が求められ、さらに、その予測係数を用いて、補正データがローカルデコードされる。そして、ローカルデコードの結果得られる予測値は誤差算出部23に、また、クラスごとの予測係数は判定部24に供給される。
【0109】
誤差算出部23では、ステップS35において、図4のステップS3における場合と同様にして、元の画像データに対する、ローカルデコード部22からの予測値の予測誤差が算出され、誤差情報として、判定部24に供給される。判定部24は、ステップS36において、この誤差情報を記憶するとともに、圧縮部21から供給される補正データのうちの、補正対象画素だけを記憶し、さらに、補正対象画素の画素値Xを、1だけインクリメントするように、圧縮部21を制御する。
【0110】
圧縮部21は、ステップS37において、判定部24からの制御にしたがって、補正対象画素の画素値Xを1だけインクリメントし、その補正対象画素を含む圧縮画像を、補正データとして、ローカルデコード部22および判定部24に出力する。ローカルデコード部22は、ステップS38において、ステップS34における場合と同様に、圧縮部21からの補正データを用いて、クラスごとの予測係数と予測値とが求められる。そして、予測値または予測係数は、誤差算出部23または判定部24にそれぞれ供給される。
【0111】
誤差算出部23では、ステップS39において、ステップS35における場合と同様にして、予測誤差が算出され、誤差情報として、判定部24に供給される。判定部24は、ステップS40において、今回のステップS39で求められた誤差情報(以下、適宜、今回の誤差情報という)が、判定部24で記憶されている誤差情報(以下、適宜、記憶誤差情報という)よりも小さいかどうかを判定する。
【0112】
ステップS40において、今回の誤差情報が、記憶誤差情報よりも小さいと判定された場合、ステップS41に進み、判定部24は、今回の誤差情報を、いま記憶している記憶誤差情報に替えて、新たな記憶誤差情報として記憶する。さらに、判定部24は、圧縮部21から供給される補正データのうちの、補正対象画素の画素値Xを、いままで記憶していた、その補正対象画素の画素値に替えて記憶し、ステップS42に進む。
【0113】
一方、ステップS40において、今回の誤差情報が、記憶誤差情報よりも小さくないと判定された場合、ステップS41をスキップして、ステップS42に進み、圧縮部21において、補正対象画素の画素値Xが、最大値XMAXに等しいかどうかが判定される。ステップS42において、補正対象画素の画素値Xが、最大値XMAXに等しくないと判定された場合、即ち、画素値Xが最大値XMAX未満の場合、ステップS37に戻り、以下、ステップS37乃至S42の処理が繰り返される。
【0114】
従って、判定部24においては、補正対象画素以外の圧縮データを固定して、補正対象画素の画素値Xを変化させた場合に得られる最小の誤差情報と、その最小の誤差情報が得られる場合の補正対象画素の画素値Xが記憶される。なお、判定部24では、ある画素(圧縮データ)が補正対象画素とされた場合における記憶誤差情報は、その画素以外の画素が補正対象画素とされたときに削除されるが、画素値Xは、いま、符号化の対象となっているフレーム(またはフィールド)の処理が終了するまで保持される。そして、判定部24は、画素値Xを保持している画素が、圧縮部21において補正対象画素とされなくなった場合、その画素の画素値を、保持している画素値Xに固定するように、圧縮部21を制御する。これにより、圧縮部21が出力する補正データのうち、既に補正対象画素とされたものは、判定部24が保持している画素値に固定されるようになされている。
【0115】
一方、ステップS42において、補正対象画素の画素値Xが、最大値XMAXに等しいと判定された場合、ステップS43に進み、圧縮部21において、圧縮画像を構成するすべての画素(圧縮データ)を、補正対象画素として、ステップS32乃至S42の処理を行ったかどうかが判定される。ステップS43において、まだ、すべての圧縮データを、補正対象画素として処理を行っていないと判定された場合、ステップS32に戻り、まだ補正対象画素とされていない画素(圧縮データが)が、新たに補正対象画素として選択され、ステップS33以降の処理を繰り返す。
【0116】
また、ステップS43において、すべての圧縮データを、補正対象画素として処理を行ったと判定された場合、ステップS44に進み、判定部24は、自身が保持している1フレーム(または1フィールド)分の補正データ(画素値)を、最適圧縮データとして、最終的にローカルデコード部22から受信したクラスごとの予測係数とともに、多重化部25に出力する。ステップS44では、さらに、多重化部25において、判定部24からの最適圧縮データとクラスごとの予測係数とが多重化され、その結果得られる符号化データが出力されて、処理を終了する。
【0117】
以上のようにすることで、誤差情報が最小になる場合の補正データおよび予測係数を得ることができ、この場合、受信装置4側においては、より良い画質の復号画像を得ることが可能となる。
【0118】
しかしながら、図10の処理によれば、圧縮画像を構成する画素(圧縮データ)の画素値を、最小値である0から最大値XMAXまで変化させて、ローカルデコードおよび誤差情報の算出を行う必要がある。さらに、そのような処理を、圧縮画像を構成する画素数と同一の回数だけ繰り返す必要がある。即ち、図10の処理は、最小の誤差情報を探索するのに、圧縮画像を構成する画素がとり得る画素値をすべて調べる、いわゆる全探索処理であり、処理に時間を要する。具体的には、全探索処理では、例えば、画素値が8ビットで表され、圧縮画像が640×480で構成されるとすると、ローカルデコードおよび誤差情報の算出を、640×480×28回だけ行う必要がある。
【0119】
ところで、いま、圧縮データの1つを補正対象画素として、その画素値を変化させた場合、その画素値と誤差情報との関係は、例えば、図11に示すようになる。即ち、画素値と誤差情報との関係は、例えば、2次曲線で表される。
【0120】
従って、一般には、その2次曲線の最小値を求めれば、それが、誤差情報の最小値であり、そのときの画素値が、最も適切な値となる。一方、2次曲線は、3点が与えられれば求めることができるから、画素値と誤差情報との関係が、1つの2次曲線で表されれば、任意の3つの画素値と、それぞれに対応する誤差情報とから2次曲線を求め、さらに、その最小値を求めることで、補正対象画素の最適な画素値を得ることができる。
【0121】
しかしながら、図11に示すように、画素値と誤差情報との関係は、一般に、複数の2次曲線で表され、不連続となる点が存在する。即ち、補正対象画素の画素値を変化させることによって、補正対象画素を含んで構成されるクラス分類用ブロックのクラスが変化することがあり、画素値が、そのような点(以下、適宜、クラス変化点という)になる場合に、画素値と誤差情報との関係は、不連続になる。
【0122】
従って、任意の3点から、不連続な画素値と誤差情報との関係を求めることは困難であり、また、仮に、任意の3点から、不連続な画素値と誤差情報との関係を表す1つの2次曲線が得られ、その最小値が求められたとしても、その最小値が、不連続な画素値と誤差情報との関係からすれば、極小値である場合がある。
【0123】
そこで、ここでは、例えば、図12に示すように、不連続な画素値と誤差情報との関係を表す曲線の不連続な点であるクラス変化点を求め、ある連続な2次曲線を区切る2つのクラス変化点と、その2つのクラス変化点の中点である中間点(但し、2つのクラス変化点の間にある点であれば、特に中間点である必要はない)とから、その連続な2次曲線(以下、誤差曲線という)を求める。同様にして、他の誤差曲線も求め、これにより、不連続な画素値と誤差情報との関係を表す曲線を推定し、その最小値、ひいては、最適な画素値(誤差情報が最小になるときの画素値)を求めることとする(誤差情報の最小値は、例えば、複数の誤差曲線の極小値を求め、その中の最小のものを検出することで求めることができる)。
【0124】
この場合、まず、クラス変化点を算出する必要があるが、このクラス変化点の算出方法について説明する。
【0125】
なお、ここでは、図13に示すように、補正対象画素に注目した場合に、その補正対象画素を中心として、3×3画素のクラス分類用ブロックが構成されるものとする。さらに、図8で説明したADRCにおいては、クラス分類用ブロックを構成する9画素すべてを対象にして、ダイナミックレンジDRが計算され、1ビットADRCが行われるものとする。従って、ADRCコードとしては、例えば、0または1のいずれかが得られるが、ここでは、クラス分類用ブロックを構成する画素値から、その最小値を減算した値が、ダイナミックレンジDRの中間値(=DR/2)以上の場合に1が、DR/2未満の場合に0が出力されるものとする。
【0126】
さらに、図7で説明したクラス分類は、ADRC処理後のクラス分類用ブロックを構成する画素のうち、その中心に位置する画素と、その上下左右に隣接する画素との合計5画素(図13において、点線で囲んである部分)を対象に行われるものとする(クラス分類に、実際に用いられる画素を、以下、適宜、クラス分類対象画素という)。従って、この場合、クラス数は32(=25)である。
【0127】
但し、ADRCの対象とする画素や、クラス分類対象画素は、上述したものに限定されるものではない。また、ここでは、ADRCの対象とする画素と、クラス分類対象画素とを異なるものとしたが、これらは同一であっても良い。
【0128】
クラス分類用ブロックが3×3画素で構成される場合、補正対象画素の画素値が変化することによりクラスが変化することがあるのとしては、図14に実線で囲んで示すように、その補正対象画素が中心に位置するクラス分類用ブロックの他に、補正対象画素を含んで構成される8つのクラス分類用ブロックがある。即ち、まず、図14に点線で囲んで示すように、補正対象画素を、その左上に含むクラス分類用ブロックがあり、さらに、補正対象画素を、その上、右上、左、右、左下、下、右下にそれぞれ含むクラス分類用ブロックがある。従って、補正対象画素の画素値を変化させ、その補正対象画素に対するクラス変化点を算出するにあたっては、上述の合計9個のクラス分類用ブロックのクラスの変化を考慮する必要がある。即ち、1の補正対象画素に対して、9個のクラス分類用ブロックについてのクラス変化点を求める必要がある。
【0129】
次に、ある1つのクラス分類用ブロックに注目して、そのクラス分類用ブロックを構成する、ある画素(ここでは、補正対象画素とされた画素)の画素値が変化したときにおけるクラス変化点の算出方法について説明する。
【0130】
図13で説明したように、1ビットADRC処理を、クラス分類用ブロックを構成する画素すべてを対象に行い、クラス分類処理を、そのうちの一部を対象に行う場合において、クラス変化点の算出は、画素値が変化する画素が、クラス分類処理の対象となっている画素、即ち、クラス分類対象画素であるときと、クラス分類用ブロックを構成する画素のうちの、クラス分類対象画素以外の画素であるときとに場合分けをして考えることができる。
【0131】
即ち、図15(A)に示すように、クラス分類用ブロックの、例えば、中心に位置する画素の画素値が変化する場合と、同図(B)に示すように、例えば、その左上に位置する画素の画素値が変化する場合とに、場合分けをして考えることができる。
【0132】
そこで、まず、図15(A)に示す場合(画素値が変化する画素が、クラス分類対象画素のうちのいずれかである場合)を考える。なお、ここでは、同図(A)に示すように、例えば、クラス分類用ブロックの中心に位置する画素を画素#0と表すとともに、その上、左、右、下に隣接する画素を、それぞれ画素#1乃至#4と表す。また、画素#0乃至#4の画素値を、それぞれX0乃至X4と表し、ここでは、画素#0が補正対象画素とされ、画素値X0が変化するものとする。さらに、クラス分類用ブロックを構成する9画素のうち、画素#0を除く8画素の中の画素値の最大値または最小値を、それぞれmaxまたはminと表す。また、画素値は、例えば、8ビットで表され、従って、その最大値または最小値は、それぞれ255または0であるとする。
【0133】
まず、画素値X0が、0≦X0<minの範囲を変化する場合、画素値X0の変化は、ADRCを行うのに用いるダイナミックレンジDR、即ち、図16(A)に示す、画素#0乃至#4のADRC結果を1または0のうちのいずれにするかの閾値(X0+max)/2に影響を与える。
【0134】
いま、画素値X0が0からminまで増加していくとすると、この場合、図16(A)に示す閾値(X0+max)/2も増加するから、画素#0のADRC結果は、常に0のまま変化しない。また、画素#1乃至#4のうち、画素値X0が0のときに、ADRC結果が0となる画素についても、そのADRC結果は0のまま変化しない。
【0135】
即ち、この場合、画素#1乃至#4のうち、ADRC結果が、画素値X0の変化に伴って変化する可能性のあるものは、画素値X0が0のときに、ADRC結果が1となっている画素で、その画素値に、閾値(X0+max)/2が等しくなるときに、そのADRC処理結果が1から0に変化する。
【0136】
従って、画素#i(ここでは、i=1,2,3,4)の画素値をXiとすると、式Xi=(X0+max)/2が成立するとき、即ち、画素値X0が、式X0=2Xi−maxで表される値となるとき、画素#iのADRC結果は1から0に変化し、これにより、クラス分類用ブロックのクラスが変化する。なお、ここでは、画素値が、閾値(X0+max)/2以上のとき、そのADRC結果を1とするようにしたので、厳密には、式X0=2Xi−maxが成立するときのADRC結果は1のままであり、式X0=2Xi−max+1が成立するときのADRC結果が0となる。
【0137】
一方、ここでは、画素値X0が、0≦X0<minの範囲を変化する場合を考えているから、閾値(X0+max)/2は、max/2乃至(max+min)/2の範囲を変化する。従って、画素値X0が変化することにより、ADRC結果が1から0に変化するのは、画素値Xiが、式max/2≦Xi<(max+min)/2を満足する画素#iであり、例えば、図16(A)に示すように、画素値X1乃至X4が分布している場合には、画素値X0の変化によって、画素#2と#3のADRC結果が変化し、これにより、クラス分類用ブロックのクラスが変化する。即ち、この場合、クラス変化点X0は、X0が、式X0=2X2−maxと、式X0=2X3−maxをそれぞれ満足するときとなる。
【0138】
以上から、画素値X0が、0≦X0<minの範囲を変化する場合については、画素値Xiが、式max/2≦Xi<(max+min)/2を満足する画素#iを検出し、式X0=2Xi−maxを計算することで、クラス変化点X0(クラス変化点としての画素値X0)を求めることができる。
【0139】
次に、画素値X0が、min≦X0<maxの範囲を変化する場合、画素値X0の変化は、画素#0のみのADRC結果に影響を与える。即ち、画素値X0が、min≦X0<maxの範囲を変化する場合においては、画素#0乃至#4のADRC結果を1または0のうちのいずれにするかの閾値は、図16(B)に示すように、(min+max)/2のまま固定であり、従って、この場合、画素値X0が、閾値(min+max)/2以上か、または未満かで、そのADRC結果が変化するだけである。
【0140】
いま、画素値X0がminからmaxまで増加していくとすると、画素値X0がminに等しいときの画素#0のADRC結果は0となる。そして、画素値X0が増加し、式X0=[(min+max)/2]が成立するとき、画素#0のADRC結果は0から1に変化する([]は、切り上げを表す)。なお、ここでは、画素値が、閾値(min+max)/2以上のとき、そのADRC結果を1とするようにしたので、厳密には、式X0=[(min+max)/2]−1が成立するときのADRC結果は0のままであり、式X0=[(min+max)/2]が成立するときのADRC結果が1となる。
【0141】
以上から、画素値X0が、min≦X0<maxの範囲を変化する場合については、式X0=[(min+max)/2]を計算することで、クラス変化点X0を求めることができる。
【0142】
次に、画素値X0が、max≦X0≦255の範囲を変化する場合、画素値X0の変化は、ADRCを行うのに用いるダイナミックレンジDR、即ち、図16(C)に示す、画素#0乃至#4のADRC結果を1または0のうちのいずれにするかの閾値(min+X0)/2に影響を与える。
【0143】
いま、画素値X0がmaxから255まで増加していくとすると、この場合、図16(C)に示す閾値(min+X0)/2も増加するから、画素#0のADRC結果は、常に1のまま変化しない。また、画素#1乃至#4のうち、画素値X0がmaxのときに、ADRC結果が0となる画素についても、そのADRC結果は0のまま変化しない。
【0144】
即ち、この場合、画素#1乃至#4のうち、ADRC結果が、画素値X0の変化に伴って変化する可能性のあるものは、画素値X0がmaxのときに、ADRC結果が1となっている画素で、その画素値に、閾値(min+X0)/2が等しくなるときに、そのADRC処理結果が1から0に変化する。
【0145】
従って、画素#i(ここでは、i=1,2,3,4)の画素値をXiとすると、式Xi=(min+X0)/2が成立するとき、即ち、画素値X0が、式X0=2Xi−minで表される値となるとき、画素#iのADRC結果は1から0に変化し、これにより、クラス分類用ブロックのクラスが変化する。なお、ここでは、画素値が、閾値(min+X0)/2以上のとき、そのADRC結果を1とするようにしたので、厳密には、式X0=2Xi−minが成立するときのADRC結果は1のままであり、式X0=2Xi−min+1が成立するときのADRC結果が0となる。
【0146】
一方、ここでは、画素値X0が、max≦X0≦255の範囲を変化する場合を考えているから、閾値(min+X0)/2は、(min+max)/2乃至(min+255)/2の範囲を変化する。従って、画素値X0の変化によって、ADRC結果が1から0に変化するのは、画素値Xiが、式(min+max)/2≦Xi<(min+255)/2を満足する画素#iであり、例えば、図16(C)に示すように、画素値X1乃至X4が分布している場合には、画素値X0の変化によって、ADRC結果が変化する画素は存在せず、従って、クラス分類用ブロックのクラスは変化しない。
【0147】
以上から、画素値X0が、min≦X0≦255の範囲を変化する場合については、画素値Xiが、式(min+max)/2≦Xi<(min+255)/2を満足する画素#iを検出し、式X0=2Xi−minを計算することで、クラス変化点X0を求めることができる。
【0148】
次に、図15(B)に示した場合(クラス分類用ブロックを構成する画素のうち、クラス分類対象画素以外のいずれかの画素の画素値が変化する場合)を考える。なお、この場合、同図(B)に示すように、例えば、クラス分類用ブロックの左上に位置する画素を画素#0と表すとともに、その上、左、中心、右、下に位置する画素を、それぞれ画素#1乃至#5と表す。また、画素#0乃至#5の画素値を、それぞれX0乃至X5と表し、ここでは、画素値X0が変化するものとする。さらに、クラス分類用ブロックを構成する9画素のうち、画素#0を除く8画素の中の画素値の最大値または最小値を、それぞれmaxまたはminと表す。また、画素値は、例えば、8ビットで表され、従って、その最大値または最小値は、それぞれ255または0であるとする。
【0149】
まず、画素値X0が、0≦X0<minの範囲を変化する場合、画素値X0の変化は、図16(A)における場合と同様に、ADRCを行うのに用いるダイナミックレンジDRに影響を与える。即ち、この場合、画素値X0の変化は、図17(A)に示す、画素#1乃至#5のADRC結果を1または0のうちのいずれにするかの閾値(X0+max)/2に影響を与える。なお、画素#0は、ここでは、クラス分類対象画素ではないため、そのADRC処理結果を考える必要はない。
【0150】
従って、考慮する画素が、図15(A)に示した画素#0乃至#4から、同図(B)に示した画素#1乃至#5になるだけで、考え方は、図16(A)における場合と同様であり、よって、画素値Xiが、式max/2≦Xi<(max+min)/2を満足する画素#iを検出し、式X0=2Xi−maxを計算することで、クラス変化点X0を求めることができる(但し、ここでは、i=1,2,3,4,5)。
【0151】
なお、例えば、図17(A)に示すように、画素値X1乃至X5が分布している場合には、画素値X0の変化によって、画素#2と#3のADRC結果が変化し、これにより、クラス分類用ブロックのクラスが変化する。即ち、この場合、クラス変化点X0は、X0が、式X0=2X2−maxと、式X0=2X3−maxをそれぞれ満足するときとなる。
【0152】
次に、画素値X0が、min≦X0<maxの範囲を変化する場合、画素#1乃至#5のADRC結果を1または0のうちのいずれにするかの閾値は、図17(B)に示すように、(min+max)/2のまま固定であり、さらに、画素#0はクラス分類対象画素でないから、その画素値X0の変化は、クラス分類用ブロックのクラスに影響を与えない。即ち、この場合、クラス変化点は存在しない。
【0153】
次に、画素値X0が、max≦X0≦255の範囲を変化する場合、画素値X0の変化は、図16(C)における場合と同様に、ADRCを行うのに用いるダイナミックレンジDRに影響を与える。即ち、この場合、画素値X0の変化は、図17(C)に示す、画素#1乃至#5のADRC結果を1または0のうちのいずれにするかの閾値(min+X0)/2に影響を与える。なお、画素#0は、ここでは、クラス分類対象画素ではないため、そのADRC処理結果を考える必要はない。
【0154】
従って、考慮する画素が、図15(A)に示した画素#0乃至#4から、同図(B)に示した画素#1乃至#5になるだけで、考え方は、図16(C)における場合と同様であり、よって、画素値Xiが、式(min+max)/2≦Xi<(min+255)/2を満足する画素#iを検出し、式X0=2Xi−minを計算することで、クラス変化点X0を求めることができる(但し、ここでは、i=1,2,3,4,5)。
【0155】
なお、例えば、図17(C)に示すように、画素値X1乃至X5が分布している場合には、画素値X0の変化によって、ADRC結果が変化する画素は存在せず、従って、クラス分類用ブロックのクラスは変化しない。即ち、クラス変化点は存在しない。
【0156】
なお、クラス変化点の算出は、上述のような場合分けによって行うのではなく、補正対象画素を0から255まで変化させて、その補正対象画素を含んで構成されるクラス分類用ブロックのクラス分類を行うことによっても可能である。但し、処理ステップ数は、場合分けを用いる方が、一般に少なくて済む。
【0157】
次に、以上のように、クラス変化点を算出して、誤差曲線を推定し、補正対象画素の最適な画素値を求める場合の、図3の送信装置1の動作について、図18のフローチャートを参照して説明する。
【0158】
即ち、この場合、まず最初に、ステップS51において、図10のステップS31における場合と同様にして、圧縮部21によって、圧縮データが生成され、ステップS52に進む。ステップS52では、圧縮部21において、圧縮データのうちの1つ(1画素)が、補正対象画素として選択され、ステップS53に進み、補正対象画素を含んで構成されるクラス分類用ブロック(図13で説明したようにクラス分類用ブロックが構成される場合においては、9個のクラス分類用ブロック)について、そのクラスが変化するときの補正対象画素の画素値X、即ち、クラス変化点が算出される。
【0159】
そして、ステップS54に進み、圧縮部21において、隣接するクラス変化点どうしの間の中間点が求められる。即ち、圧縮部21は、ステップS53で得られた9個のクラス分類用ブロックについてのすべてのクラス変化点の他に、画素がとり得る画素値の最小値と最大値(画素値が、例えば、上述したように8ビットで表現される場合は、0と255)も、クラス変化点とみなして、それらのクラス変化点を、例えば、昇順(または降順)に並べる。さらに、圧縮部21は、ある、隣接する2つのクラス変化点を、1の誤差曲線の両端の不連続点として、その2つのクラス変化点の中点である中間点を求める。そして、圧縮部21は、1の誤差曲線の両端の不連続点である2つのクラス変化点と、それから求めた中間点を組合せ、他の圧縮データとともに、ローカルデコード部22に出力する。
【0160】
ローカルデコード部22では、ステップS55において、圧縮部21から供給される2つのクラス変化点それぞれと、それらと組になっている中間点とを、補正対象画素の画素値として、圧縮部21から供給される他の圧縮データも用いて、ローカルデコードが行われ、予測値が求められる。即ち、補正対象画素の画素値を、2つのクラス変化点それぞれと、中間点とした場合の3通りの予測値が求められる。この3通りの予測値は、誤差算出部23に供給され、誤差算出部23では、ステップS57において、3通りの予測値に対する誤差情報が算出される。
【0161】
この3つの誤差情報は、判定部24を介して、制御信号として、圧縮部21に与えられる。圧縮部21は、補正対象画素の画素値を、2つのクラス変化点それぞれと、中間点とした場合の3通りの誤差情報を受信すると、ステップS57に進み、2つのクラス変化点および中間点と、それぞれについての誤差情報とから、図12で説明したようにして、それらに対応する3点を通る2次曲線である誤差曲線を算出する。
【0162】
なお、ステップS54乃至S57の処理は、すべての隣接する2つのクラス変化点について行われ、これにより、不連続な画素値と誤差情報との関係を表す曲線を構成するすべての誤差曲線が求められる。
【0163】
その後、ステップS58に進み、圧縮部21において、各誤差曲線の極小値が求められ、ステップS59に進む。ステップS59では、圧縮部21において、各誤差曲線の極小値のうちの最小のもの、即ち、補正対象画素の画素値を、最小値から最大値まで変化させた場合に得られる最小の誤差情報が求められる。さらに、ステップS59では、その最小の誤差情報が得られるときの補正対象画素の画素値(以下、適宜、最適画素値という)が、誤差曲線から求められ、その最適画素値が、補正対象画素の画素値として設定される。以後は、いま符号化対象となっている1フレーム(またはフィールド)画像の符号化が終了するまで、ステップS59で設定された最適画素値が、そのとき補正対象画素とされていた画素の画素値として用いられる。
【0164】
ある画素を、補正対象画素として、その画素の最適画素値を求めた後は、ステップS60に進み、圧縮部21において、圧縮画像を構成するすべての画素(圧縮データ)を、補正対象画素として、ステップS52乃至S59の処理を行ったかどうかが判定される。ステップS60において、まだ、すべての圧縮データを、補正対象画素として処理を行っていないと判定された場合、ステップS52に戻り、まだ補正対象画素とされていない画素(圧縮データ)が、補正対象画素として選択され、ステップS53以降の処理を繰り返す。
【0165】
また、ステップS60において、すべての圧縮データを、補正対象画素として処理を行ったと判定された場合、即ち、すべての圧縮データについて、最適画素値が求められた場合、圧縮部21は、そのすべての最適画素値(これも、圧縮データを補正したものと考えられるから、補正データということができる)を、判定部24に出力するとともに、ローカルデコード部22に供給する。ローカルデコード部22では、圧縮部21からの最適画素値を用いて、ローカルデコードが行われ、それにより得られるクラスごとの予測係数を、判定部24に出力する。判定部24は、以上のようにして圧縮部21から供給される最適画素値を、最適圧縮データとして、ローカルデコード部22から供給されるクラスごとの予測係数とともに、多重化部25に出力する。そして、多重化部25では、ステップS61において、判定部24からの最適圧縮データとクラスごとの予測係数とが多重化され、その結果得られる符号化データが出力されて、処理を終了する。
【0166】
以上のように、クラス変化点を求め、誤差曲線を推定することで、誤差情報を最小にする画素値を、全探索処理を行う場合に比較して、高速かつ効率的に求めることができ、さらに、受信装置4側においては、より良い画質の復号画像を得ることが可能となる。
【0167】
なお、この場合、図3の送信装置1は、最適圧縮データを得ることを主と考えれば、そのような最適圧縮データを得るための画像の符号化を行う符号化装置と見ることができるし、また、その最適圧縮データから復号画像を求めるための最適な予測係数を得ることを主と考えれば、そのような最適な予測係数を得るための学習を行う学習装置と見ることができる。
【0168】
次に、図19は、図3の送信装置1が、図18で説明した処理を行う場合の圧縮部21の構成例を示している。
【0169】
符号化対象の画像は、間引き回路31に供給され、そこで、図5で説明したようにして、圧縮データ(圧縮画像)とされる。この圧縮データは、フレームメモリ32に供給されて記憶される。なお、フレームメモリ32では、間引き回路31からの1フレーム(またはフィールド)分の圧縮データが、その符号化が終了するまで記憶される。
【0170】
フレームメモリ32において、間引き回路31からの圧縮データが記憶されると、クラス変化点算出回路33は、そのうちの1つを、補正対象画素として選択し、上述したようにして、クラス変化点を算出する。さらに、クラス変化点算出回路33は、クラス変化点の算出後、中間点も算出し、対応する2つのクラス変化点と中間点とを組み合わせて、フレームメモリ32に記憶されている他の画素の画素値とともに、ローカルデコード部22に供給する。
【0171】
ローカルデコード部22では、図18で説明したように、圧縮部21(クラス変化点算出回路33)から供給される2つのクラス変化点それぞれと、それらと組になっている中間点とを、補正対象画素の画素値として、圧縮部21(クラス変化点算出回路33)から供給される他の画素の画素値も用いて、ローカルデコードが行われ、これにより、補正対象画素の画素値を、2つのクラス変化点それぞれと、中間点とした場合の3通りの予測値が求められる。この3通りの予測値は、誤差算出部23に供給され、誤差算出部23では、3通りの予測値に対する誤差情報が算出される。この3つの誤差情報は、判定部24を介して、制御信号として、誤差曲線算出回路34に与えられる。
【0172】
さらに、誤差曲線算出回路34には、クラス変化点算出回路33からローカルデコード部22に供給された2つのクラス変化点と中間点も供給されるようになされている。そして、誤差曲線算出回路34では、クラス変化点算出回路33からの2つのクラス変化点および中間点、並びにそれぞれに対応する、判定部24からの誤差情報を用い、それらに対応する3点を通る2次曲線である誤差曲線が算出される。
【0173】
クラス変化点算出回路33および誤差曲線算出回路34では、補正対象画素について得られるクラス変化点すべてについて同様の処理が行われ、これにより、補正対象画素の画素値と誤差情報との関係を表す曲線を構成するすべての誤差曲線が求められる。
【0174】
このすべての誤差曲線は、誤差曲線算出回路34から最小値算出回路35に供給される。最小値算出回路35では、補正対象画素についてのすべての誤差曲線それぞれの極小値が求められ、さらに、その極小値のうちの最小ものが選択されることで、補正対象画素の画素値を、最小値から最大値まで変化させた場合に得られる最小の誤差情報が求められる。そして、最小値算出回路35では、その最小の誤差情報が得られるときの補正対象画素の画素値、つまり、最適画素値が求められ、その最適画素値が、補正対象画素の画素値として、いままで記憶されていた画素値に替えて、フレームメモリ32に書き込まれる。
【0175】
以下、同様の処理が、フレームメモリ32に記憶されている画素のうち、まだ、補正対象画素とされていないものを、新たに補正対象画素として繰り返される。
【0176】
そして、フレームメモリ32に記憶されている画素すべてを、補正対象画素として処理を行い、これにより、フレームメモリ32に、最適画素値のみが記憶された状態となると、クラス変化点算出回路33は、フレームメモリ32に記憶されたすべての最適画素値(1フレーム(または1フィールド)分の画素値)をローカルデコード部22に供給して、予測係数を求めさせるとともに、そのすべての最適画素値を、最適圧縮データとして、判定部24に供給する。その後、圧縮部21では、次のフレーム(またはフィールド)の画像を対象に、同様の処理が繰り返される。
【0177】
次に、図20は、図1の受信装置4の構成例を示している。
【0178】
受信機/再生装置71においては、記録媒体2に記録された符号化データが再生され、または伝送路3を介して伝送されてくる符号化データが受信され、分離部72に供給される。分離部72では、符号化データから、補正データ(最適圧縮データ)とクラスごとの予測係数とが抽出される。補正データは、クラス分類用ブロック化回路73および予測値計算用ブロック化回路77に供給され、クラスごとの予測係数は、予測回路76に供給されて、その内蔵するメモリ76Aに記憶される。
【0179】
クラス分類用ブロック化回路73、ADRC処理回路74、クラス分類回路75、または予測値計算用ブロック化回路77は、図6におけるクラス分類用ブロック化回路41、ADRC処理回路44、クラス分類回路45、または予測値計算用ブロック化回路42それぞれと同様に構成されており、従って、これらのブロックにおいては、図6における場合と同様の処理が行われ、これにより、予測値計算用ブロック化回路77からは予測値計算用ブロックが出力され、また、クラス分類回路75からはクラス情報が出力される。これらの予測値計算用ブロックおよびクラス情報は、予測回路76に供給される。
【0180】
予測回路76は、クラス分類回路75から供給されるクラス情報に対応した25×9の予測係数を、メモリ76Aから読み出し、その25×9の予測係数と、予測値計算用ブロック化回路77から供給される5×5画素の予測値計算用ブロックを構成する補正データとを用い、式(1)にしたがって、原画像の3×3画素の予測値が算出され、そのような予測値で構成される画像が、復号画像として、例えば、1フレーム(または1フィールド)単位で出力される。この復号画像は、上述したように、元の画像とほぼ同一の画像となる。
【0181】
なお、受信側においては、図20に示すような受信装置4でなくても、間引きされた画像を単純な補間により復号する装置により、予測係数を用いずに、通常の補間を行うことで復号画像を得ることができる。但し、この場合に得られる復号画像は、画質(解像度)の劣化したものとなる。
【0182】
ところで、上述の場合おいては、図3のローカルデコード部22において予測係数を求め、これを用いて、予測値を算出するようにしたが、ローカルデコード部22では、予測係数を求めずに(あらかじめ学習により求めておいた予測係数を用いて)、予測値を算出するようにすることが可能である。
【0183】
即ち、図21は、図1の送信装置1の第2の機能的構成例を示している。なお、図中、図3における場合と対応する部分については、同一の符号を付してある。即ち、この送信装置1は、ローカルデコード部22に代えて、ローカルデコード部122が設けられている他は、図3における場合と基本的に同様に構成されている。
【0184】
但し、図3においては、ローカルデコード部22に原画像データが供給されるようになされていたが、図21においては、ローカルデコード部122には、原画像データが供給されないようになっている。
【0185】
図22は、図21のローカルデコード部122の構成例を示している。なお、図中、図6における場合と対応する部分については、同一の符号を付してある。即ち、ローカルデコード部122は、適応処理回路46に代えて、予測係数ROM81および予測回路82が設けられている他は、図6におけるローカルデコード部22と同様に構成されている。
【0186】
予測係数ROM81は、あらかじめ学習(後述する)を行うことにより求められたクラスごとの予測係数を記憶しており、クラス分類回路44が出力するクラス情報を受信し、そのクラス情報に対応するアドレスに記憶されている予測係数を読み出して、予測回路82に供給する。
【0187】
予測回路82では、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックと、予測係数ROM81からの25×9の予測係数とを用いて、式(1)(具体的には、例えば、式(8))に示した線形1次式が計算され、これにより、元の画像の3×3画素の予測値が算出される。
【0188】
従って、図22のクラス分類適応処理回路43によれば、元の画像(原画像)を用いずに、その予測値が算出される。このため、上述したように、ローカルデコード部122には、原画像が供給されないようになっている。
【0189】
次に、その動作について説明する。
【0190】
ローカルデコード部122では、クラス分類用ブロック化回路41、予測値計算用ブロック化回路42、ADRC処理回路44、クラス分類回路45において、図6における場合とそれぞれ同様の処理が行われ、これにより、クラス分類回路45からは、クラス情報が出力される。このクラス情報は、予測係数ROM81に供給される。
【0191】
予測係数ROM81は、クラス情報を受信すると、そのクラス情報に対応する25×9の予測係数を、記憶しているクラスごとの予測係数の中から読み出し、予測回路82に供給する。
【0192】
予測回路82には、予測係数ROM81から25×9の予測係数が供給される他、予測値計算用ブロック化回路42から5×5画素の予測値計算用ブロックも供給されるようになされている。そして、予測回路82では、予測係数ROM81からの25×9の予測係数と、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックとを用いて適応処理が行われることにより、即ち、具体的には、式(1)(または式(8))にしたがった演算が行われることにより、注目補正データ(ここでは、予測値計算用ブロックの中心にある画素)を中心とする3×3の原画像の画素の予測値が求められる。
【0193】
その後、例えば、1フレーム(またはフィールド)分の予測値が求められると、その予測値は、誤差算出部23に供給される。
【0194】
従って、図21の実施の形態では、ローカルデコード部122から判定部24に対して、予測係数は供給されず、その結果、最適圧縮データが、符号化データとして、送信機/記録装置16(図1)に出力される。
【0195】
次に、図23は、図22の予測係数ROM81に記憶されている予測係数を得るための学習を行う画像処理装置の構成例を示している。
【0196】
学習用ブロック化回路91および教師用ブロック化回路92には、あらゆる画像に適用可能な予測係数を得るための学習用の画像データ(学習用画像)が供給されるようになされている。
【0197】
学習用ブロック化回路91は、入力される画像データから、例えば、図5に●印で示した位置関係の25画素(5×5画素)を抽出し、この25画素で構成されるブロックを、学習用ブロックとして、ADRC処理93および学習データメモリ96に供給する。
【0198】
また、教師用ブロック化回路92では、入力される画像データから、例えば、3×3の9画素で構成されるブロックが生成され、この9画素で構成されるブロックが、教師用ブロックとして、教師データメモリ98に供給される。
【0199】
なお、学習用ブロック化回路91において、例えば、図5に●印で示した位置関係の25画素で構成される学習用ブロックが生成されるとき、教師用ブロック化回路92では、同図に四角形で囲んで示す3×3画素の教師用ブロックが生成されるようになされている。
【0200】
ADRC処理回路93は、学習用ブロックを構成する25画素から、例えば、その中心の9画素(3×3画素)を抽出し、この9画素でなるブロックに対して、図22のADRC処理回路44における場合と同様に、1ビットのADRC処理を施す。ADRC処理の施された3×3画素のブロックは、クラス分類回路94に供給される。クラス分類回路94では、図22のクラス分類回路45における場合と同様に、ADRC処理回路93からのブロックがクラス分類処理され、それにより得られるクラス情報が、スイッチ95の端子aを介して、学習データメモリ96および教師データメモリ98に供給される。
【0201】
学習データメモリ96または教師データメモリ98では、そこに供給されるクラス情報に対応するアドレスに、学習用ブロック化回路91からの学習用ブロックまたは教師用ブロック化回路92からの教師用ブロックが、それぞれ記憶される。
【0202】
従って、学習データメモリ96において、例えば、図5に●印で示した5×5画素でなるブロックが学習用ブロックとして、あるアドレスに記憶されたとすると、教師データメモリ98においては、そのアドレスと同一のアドレスに、同図において、四角形で囲んで示す3×3画素のブロックが、教師用ブロックとして記憶される。
【0203】
以下、同様の処理が、あらかじめ用意されたすべての学習用の画像について繰り返され、これにより、学習用ブロックと、図22のローカルデコード部122において、その学習用ブロックを構成する25画素と同一の位置関係を有する25の補正データで構成される予測値計算用ブロックを用いて予測値が求められる9画素で構成される教師用ブロックとが、学習用データメモリ96と、教師用データメモリ98とにおいて、同一のアドレスに記憶される。
【0204】
なお、学習用データメモリ96と教師用データメモリ98においては、同一アドレスに複数の情報を記憶することができるようになされており、これにより、同一アドレスには、複数の学習用ブロックと教師用ブロックを記憶することができるようになされている。
【0205】
学習用画像すべてについての学習用ブロックと教師用ブロックとが、学習データメモリ96と教師データメモリ98に記憶されると、端子aを選択していたスイッチ95が、端子bに切り替わり、これにより、カウンタ97の出力が、アドレスとして、学習データメモリ96および教師データメモリ98に供給される。カウンタ97は、所定のクロックをカウントし、そのカウント値を出力しており、学習データメモリ96または教師データメモリ98では、そのカウント値に対応するアドレスに記憶された学習用ブロックまたは教師用ブロックが読み出され、演算回路99に供給される。
【0206】
従って、演算回路99には、カウンタ97のカウント値に対応するクラスの学習用ブロックのセットと、教師用ブロックのセットとが供給される。
【0207】
演算回路99は、あるクラスについての学習用ブロックのセットと、教師用ブロックのセットとを受信すると、それらを用いて、最小自乗法により、誤差を最小とする予測係数を算出する。
【0208】
即ち、例えば、いま、学習用ブロックを構成する画素の画素値を、x1,x2,x3,・・・とし、求めるべき予測係数をw1,w2,w3,・・・とするとき、これらの線形1次結合により、教師用ブロックを構成する、ある画素の画素値yを求めるには、予測係数w1,w2,w3,・・・は、次式を満たす必要がある。
【0209】
y=w11+w22+w33+・・・
【0210】
そこで、演算回路99では、同一クラスの学習用ブロックと、対応する教師用ブロックとから、真値yに対する、予測値w11+w22+w33+・・・の自乗誤差を最小とする予測係数w1,w2,w3,・・・が、上述した式(7)に示す正規方程式をたてて解くことにより求められる。従って、この処理をクラスごとに行うことにより、各クラスごとに、25×9個の予測係数が生成される。
【0211】
演算回路99において求められた、クラスごとの予測係数は、メモリ100に供給される。メモリ100には、演算回路99からの予測係数の他、カウンタ97からカウント値が供給されており、これにより、メモリ100においては、演算回路99からの予測係数が、カウンタ97からのカウント値に対応するアドレスに記憶される。
【0212】
以上のようにして、メモリ100には、各クラスに対応するアドレスに、そのクラスのブロックの3×3画素を予測するのに最適な25×9個の予測係数が記憶される。
【0213】
図22の予測係数ROM81には、以上のようにしてメモリ100に記憶されたクラスごとの予測係数が記憶されている。
【0214】
なお、図22の予測係数ROM81には(後述する図24の予測係数ROM101についても同様)、その他、例えば、図18で説明した処理により、ローカルデコード部22から判定部24に供給されるクラスごとの予測係数を記憶させておくようにすることなども可能である。
【0215】
次に、図24は、送信装置1が図21に示したように構成される場合の受信装置4の構成例を示している。なお、図中、図20における場合と対応する部分については、同一の符号を付してある。即ち、図24の受信装置4は、クラス分類回路75と予測回路76との間に予測係数ROM101が新たに設けられているとともに、予測回路76がメモリ76Aを内蔵していない他は、図20における場合と基本的に同様に構成されている。
【0216】
送信装置1が図21に示したように構成される場合、上述したことから、受信機/再生装置71が出力する符号化データには、クラスごとの予測係数は含まれておらず、このため、分離部72では、符号化データから、補正データ(最適圧縮データ)だけが抽出され、クラス分類用ブロック化回路73および予測値計算用ブロック化回路77に供給される。
【0217】
クラス分類用ブロック化回路73、ADRC処理回路74、クラス分類回路75、または予測値計算用ブロック化回路77では、図22におけるクラス分類用ブロック化回路41、ADRC処理回路44、クラス分類回路45、または予測値計算用ブロック化回路42それぞれと同様の処理が行われ、これにより、予測値計算用ブロック化回路77からは5×5画素の予測値計算用ブロックが出力され、また、クラス分類回路75からはクラス情報が出力される。予測値計算用ブロックは予測回路76に供給され、クラス情報は予測係数ROM101に供給される。
【0218】
予測係数ROM101には、図22の予測係数ROM81に記憶されているクラスごとの予測係数と同一のものが記憶されており、クラス分類回路75からクラス情報が供給されると、そのクラス情報に対応した25×9の予測係数が読み出され、予測回路76に供給される。
【0219】
予測回路76は、予測係数ROM101からの25×9の予測係数と、予測値計算用ブロック化回路77から供給される5×5画素の予測値計算用ブロックを構成する補正データとを用い、式(1)にしたがって、原画像の3×3画素の予測値を算出し、そのような予測値で構成される1フレーム(またはフィールド)の画像を、復号画像として出力する。
【0220】
送信装置1が図21に示したように構成されるとともに、受信装置4が図24に示したように構成される場合、クラスごとの25×9の予測係数を送受信せずに済むので、その分だけ、伝送容量または記録容量を低減することができる。
【0221】
なお、予測係数ROM81や101には、クラスごとの予測係数を記憶させるのではなく、教師用ブロックを構成する画素値の平均値などを、クラスごとに記憶させるようにすることが可能である。この場合、クラス情報が与えられると、そのクラスに対応する画素値が出力されることになり、図22のローカルデコード部122において、予測値計算用ブロック化回路42および予測回路82を設けずに済むようになる。また、図24の受信装置4においても同様に、予測値計算用ブロック化回路77および予測回路76を設けずに済むようになる。
【0222】
以上、本発明を適用した画像処理装置について説明したが、このような画像処理装置は、例えば、NTSC方式などの標準方式のテレビジョン信号を符号化する場合の他、データ量の多い、いわゆるハイビジョン方式のテレビジョン信号などを符号化する場合に、特に有効である。
【0223】
なお、本実施の形態においては、誤差情報として、誤差の自乗和を用いるようにしたが、誤差情報としては、その他、例えば、誤差の絶対値和や、その3乗以上したものの和などを用いるようにすることが可能である。
【0224】
また、本実施の形態では、画素値と誤差情報との関係が、2次曲線で表されるものとしたが、本発明は、画素値と誤差情報との関係が、2次曲線以外で表される場合にも適用可能である。
【0225】
さらに、本実施の形態においては、1フレーム(またはフィールド)の画像から、例えば、クラス分類用ブロックや予測値計算用ブロックなどのブロックを構成するようにしたが、ブロックは、その他、例えば、時系列に連続する複数フレームにおける、同一位置の画素(異なるフレームの画素)などをも用いて構成するようにすることも可能である。
【0226】
また、本実施の形態では、例えば、1フレーム(またはフィールド)単位で、正規方程式をたてて、クラスごとの予測係数を求めるようにしたが、予測係数の算出処理は、その他、例えば、複数フレーム(またはフィールド)単位で正規方程式をたてて行うようにすることも可能である。他の処理についても同様である。
【0227】
さらに、本実施の形態では、図2の送信装置1を構成するCPU14が、同じく送信装置1を構成する外部記憶装置15に記憶されたアプリケーションプログラムを実行することで、各種の符号化処理が行われるようにしたが、これらの符号化処理は、ハードウェアによって行うことも可能である。同様に受信装置4における処理も、そのような処理を行うためのプログラムをコンピュータに実行させることによっても、またハードウェアによっても、実現可能である。
【0228】
また、本実施の形態では、クラス分類を行うことを前提として、クラス変化点を求め、さらに、誤差曲線を求めるようにしたが、クラス分類を行わない場合は、クラス変化点は存在しないから、即ち、画素値と誤差情報との関係は不連続にならないから、上述したように、任意の3点を用いて、画素値と誤差情報との関係を表す曲線を求めることが可能である。
【0229】
【発明の効果】
本発明の画像符号化装置および画像符号化方法によれば、圧縮データの画素値と予測誤差との関係を表す誤差曲線が推定されるので、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データを、効率良く求めることが可能となる。
【0231】
本発明の学習装置および学習方法においては、圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた圧縮データの画素値と原画像の画素値とを用いて、複数の値それぞれについて、予測値と原画像の画素値との予測誤差を最小にする予測係数が、クラスごとに求められ、その予測係数と圧縮データとの線形結合により、複数の値それぞれについての予測値が求められる。さらに、複数の値それぞれについて、原画像に対する、予測値の予測誤差が算出され、圧縮データの画素値と予測誤差との関係を表す誤差曲線が推定される。そして、誤差曲線において予測誤差を最小にする画素値で構成される圧縮データと、原画像の画素値とを用いて、予測値と原画像の画素値との予測誤差を最小にする予測係数がさらに求められ、その求められ予測係数が出力される。従って、圧縮データを高画質の復号画像に復号することのできる予測係数を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した画像処理装置の一実施の形態の構成を示すブロック図である。
【図2】図1の送信装置1の構成例を示すブロック図である。
【図3】図1の送信装置1の第1の機能的構成例を示すブロック図である。
【図4】図3の送信装置1の動作を説明するためのフローチャートである。
【図5】図4のステップS1の処理を説明するための図である。
【図6】図3のローカルデコード部22の構成例を示すブロック図である。
【図7】クラス分類処理を説明するための図である。
【図8】ADRC処理を説明するための図である。
【図9】図6のローカルデコード部22の動作を説明するためのフローチャートである。
【図10】全探索処理を行う場合の、図3の送信装置1の動作を説明するためのフローチャートである。
【図11】画素値と誤差情報との関係を示す図である。
【図12】最小の誤差情報を求める方法を説明するための図である。
【図13】クラス変化点を算出する方法を説明するための図である。
【図14】クラス変化点を算出する方法を説明するための図である。
【図15】クラス変化点を算出する方法を説明するための図である。
【図16】クラス変化点を算出する方法を説明するための図である。
【図17】クラス変化点を算出する方法を説明するための図である。
【図18】クラス変化点から、誤差曲線を推定して、最小の誤差情報を求める場合の、図3の送信装置1の動作を説明するためのフローチャートである。
【図19】図18の処理を行う場合の、図3における圧縮部21の構成例を示すブロック図である。
【図20】図1の受信装置4の第1の構成例を示すブロック図である。
【図21】図1の送信装置1の第2の機能的構成例を示すブロック図である。
【図22】図21のローカルデコード部122の構成例を示すブロック図である。
【図23】図22の予測係数ROM81に記憶されている予測係数を算出する画像処理装置の一実施の形態の構成を示すブロック図である。
【図24】図1の受信装置4の第2の構成例を示すブロック図である。
【符号の説明】
1 送信装置, 2 記録媒体, 3 伝送路, 4 受信装置, 11 I/F, 12 ROM, 13 RAM, 14 CPU, 15 外部記憶装置, 16 送信機/記録装置, 21 圧縮部, 22 ローカルデコード部, 23 誤差算出部, 24 判定部, 25 多重化部, 31 間引き回路, 32 フレームメモリ, 33 クラス変化点算出回路, 34 誤差曲線算出回路, 35 最小値算出回路, 41 クラス分類用ブロック化回路,42 予測値計算用ブロック化回路, 43 クラス分類適応処理回路, 44 ADRC処理回路, 45 クラス分類回路, 46 適応処理回路, 71 受信機/再生装置, 72 分離部, 73 クラス分類用ブロック化回路, 74 ADRC処理回路, 75 クラス分類回路, 76 予測回路, 76A メモリ, 77 予測値計算用ブロック化回路, 81 予測係数ROM, 82 予測回路, 91 学習用ブロック化回路, 92 教師用ブロック化回路, 93 ADRC処理回路, 94 クラス分類回路, 95 スイッチ, 96 学習データメモリ, 97 カウンタ, 98 教師データメモリ, 99 演算回路, 100 メモリ, 101 予測係数ROM, 122 ローカルデコード部

Claims (10)

  1. 画像を符号化する画像符号化装置であって、
    原画像を、その画素数を少なくすることにより圧縮し、圧縮データとする圧縮手段と、
    前記圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、前記原画像を予測し、その予測値を求める予測手段と、
    前記原画像に対する、前記予測値の予測誤差を算出する予測誤差算出手段と、
    前記圧縮データの画素値を複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データを求める誤差最小データ算出手段と、
    前記誤差最小データ算出手段が出力する前記圧縮データを、前記原画像の符号化結果として出力する出力手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記圧縮データの画素値を変化させたときに前記クラスが変化する画素値であるクラス変化点を算出するクラス変化点算出手段をさらに備え、
    前記誤差曲線推定手段は、複数の前記クラス変化点それぞれにおける前記予測誤差から、前記誤差曲線を推定する
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記予測手段は、
    前記圧縮データとの線形結合により前記予測値を算出するための予測係数を、前記クラスごとに求める予測係数演算手段と、
    前記圧縮データの前記クラスについて得られた前記予測係数と、その圧縮データとから、前記予測値を求める予測値演算手段と
    を有する
    ことを特徴とする請求項1に記載の画像符号化装置。
  4. 前記予測手段は、
    前記圧縮データとの線形結合により前記予測値を算出するための予測係数を、前記クラスごとに記憶している記憶手段と、
    前記圧縮データの前記クラスについての前記予測係数と、その圧縮データとから、前記予測値を求める予測値演算手段と
    を有する
    ことを特徴とする請求項1に記載の画像符号化装置。
  5. 画像を符号化する画像符号化方法であって、
    原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、
    前記圧縮データに基づいて、クラス分類を行い、その結果得られるクラスに対応して、前記原画像を予測し、その予測値を求め、
    前記原画像に対する、前記予測値の予測誤差を算出し、
    前記圧縮データの画素値を複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定し、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データを求め、その圧縮データを、前記原画像の符号化結果として出力する
    ことを特徴とする画像符号化方法。
  6. 原画像の画素数を少なくすることにより圧縮した圧縮データとの線形結合により、前記原画像の予測値を算出するための予測係数を求める学習装置であって、
    原画像を、その画素数を少なくすることにより圧縮し、前記圧縮データとする圧縮手段と、
    前記圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力するクラス分類手段と、
    前記圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた前記圧縮データの画素値と前記原画像の画素値とを用いて、前記複数の値それぞれについて、前記予 測値と前記原画像の画素値との予測誤差を最小にする前記予測係数を、前記クラスごとに求める予測係数演算手段と、
    前記圧縮データと予測係数との線形結合により、前記複数の値それぞれについての前記予測値を求める予測値演算手段と、
    前記複数の値それぞれについて、前記原画像に対する、前記予測値の前記予測誤差を算出する予測誤差算出手段と、
    前記圧縮データの画素値を前記複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データを求める誤差最小データ算出手段と、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データと、前記原画像の画素値とを用いて、前記予測値と前記原画像の画素値との予測誤差を最小にする前記予測係数が前記予測係数演算手段によってさらに求められ、その求められ前記予測係数を出力する出力手段と
    を備えることを特徴とする学習装置。
  7. 前記圧縮データの画素値を変化させたときに前記クラスが変化する画素値であるクラス変化点を算出するクラス変化点算出手段をさらに備え、
    前記誤差曲線推定手段は、複数の前記クラス変化点それぞれにおける前記予測誤差から、前記誤差曲線を推定する
    ことを特徴とする請求項6に記載の学習装置。
  8. 原画像の画素数を少なくすることにより圧縮した圧縮データとの線形結合により、前記原画像の予測値を算出するための予測係数を求める学習方法であって、
    原画像を、その画素数を少なくすることにより圧縮して、前記圧縮データとし、
    前記圧縮データに基づいて、クラス分類を行い、その結果得られるクラスを出力し、
    前記圧縮データの画素値を複数の値に変化させ、その複数の値に変化させた前記圧縮データの画素値と前記原画像の画素値とを用いて、前記複数の値それぞれについて、前記予測値と前記原画像の画素値との予測誤差を最小にする前記予測係数を、前記クラスごとに求め、その予測係数と前記圧縮データとの線形結合により、前記複数の値それぞれについての前記予測値を求め、
    前記複数の値それぞれについて、前記原画像に対する、前記予測値の前記予測誤差を算出し、
    前記圧縮データの画素値を前記複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定し、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データと、前記原画像の画素値とを用いて、前記予測値と前記原画像の画素値との予測誤差を最小にする前記予測係数がさらに求められ、その求められ前記予測係数を出力する
    ことを特徴とする学習方法。
  9. 画像を符号化する画像符号化装置であって、
    原画像を、その画素数を少なくすることにより圧縮し、圧縮データとする圧縮手段と、
    前記圧縮データに基づいて、前記原画像を予測し、その予測値を求める予測手段と、
    前記原画像に対する、前記予測値の予測誤差を算出する予測誤差算出手段と、
    前記圧縮データの画素値を複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定する誤差曲線推定手段と、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データを求める誤差最小データ算出手段と、
    前記誤差最小データ算出手段が出力する前記圧縮データを、前記原画像の符号化結果として出力する出力手段と
    を備えることを特徴とする画像符号化装置。
  10. 画像を符号化する画像符号化方法であって、
    原画像を、その画素数を少なくすることにより圧縮して、圧縮データとし、
    前記圧縮データに基づいて、前記原画像を予測して、その予測値を求め、
    前記原画像に対する、前記予測値の予測誤差を算出し、
    前記圧縮データの画素値を複数の値に変化させたときの前記予測誤差から、前記圧縮データの画素値と前記予測誤差との関係を表す誤差曲線を推定し、
    前記誤差曲線において前記予測誤差を最小にする画素値で構成される前記圧縮データを求め、その圧縮データを、前記原画像の符号化結果として出力する
    ことを特徴とする画像符号化方法。
JP35042597A 1997-12-19 1997-12-19 画像符号化装置および画像符号化方法、並びに学習装置および学習方法 Expired - Fee Related JP3915855B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP35042597A JP3915855B2 (ja) 1997-12-19 1997-12-19 画像符号化装置および画像符号化方法、並びに学習装置および学習方法
US09/213,460 US6438267B1 (en) 1997-12-19 1998-12-17 Image compression method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35042597A JP3915855B2 (ja) 1997-12-19 1997-12-19 画像符号化装置および画像符号化方法、並びに学習装置および学習方法

Publications (2)

Publication Number Publication Date
JPH11187407A JPH11187407A (ja) 1999-07-09
JP3915855B2 true JP3915855B2 (ja) 2007-05-16

Family

ID=18410414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35042597A Expired - Fee Related JP3915855B2 (ja) 1997-12-19 1997-12-19 画像符号化装置および画像符号化方法、並びに学習装置および学習方法

Country Status (2)

Country Link
US (1) US6438267B1 (ja)
JP (1) JP3915855B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658155B1 (en) * 1999-03-25 2003-12-02 Sony Corporation Encoding apparatus
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
KR20010113047A (ko) * 2000-02-29 2001-12-24 이데이 노부유끼 데이터 처리장치 및 방법과 기록매체 및 프로그램
JP2001320682A (ja) * 2000-02-29 2001-11-16 Sony Corp データ処理装置およびデータ処理方法、並びに記録媒体およびプログラム
JP4560897B2 (ja) 2000-06-02 2010-10-13 ソニー株式会社 通信装置、通信方法及び媒体
US6665443B1 (en) * 2000-11-28 2003-12-16 Sony Corporation Robust encoded domain pixel decoding
US7453936B2 (en) * 2001-11-09 2008-11-18 Sony Corporation Transmitting apparatus and method, receiving apparatus and method, program and recording medium, and transmitting/receiving system
JP4055203B2 (ja) 2002-09-12 2008-03-05 ソニー株式会社 データ処理装置およびデータ処理方法、記録媒体、並びにプログラム
JP4281453B2 (ja) * 2003-07-31 2009-06-17 ソニー株式会社 信号処理装置および信号処理方法
US8059909B2 (en) * 2008-04-29 2011-11-15 Sony Corporation Adaptive generation of irregular spatial sub-sampling for images
US8055087B2 (en) * 2008-04-29 2011-11-08 Sony Corporation Sample level variation for spatial sub-sampled images
CN105989352B (zh) * 2015-03-06 2019-08-20 华为技术有限公司 图像识别加速器、终端设备及图像识别方法
JP2022174948A (ja) * 2021-05-12 2022-11-25 横河電機株式会社 装置、監視システム、方法およびプログラム

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3582314D1 (de) 1984-12-19 1991-05-02 Sony Corp Hochleistungsfaehige technik zur kodierung eines digitalen videosignals.
NL8701261A (nl) 1987-05-27 1988-12-16 Philips Nv Televisie-overdrachtsysteem met pyramidale kodeer/dekodeerschakeling.
US5122873A (en) 1987-10-05 1992-06-16 Intel Corporation Method and apparatus for selectively encoding and decoding a digital motion video signal at multiple resolution levels
US5200962A (en) 1988-11-03 1993-04-06 Racal-Datacom, Inc. Data compression with error correction
JP2840678B2 (ja) 1989-07-21 1998-12-24 ソニー株式会社 高能率符合化装置
US5193003A (en) 1989-08-15 1993-03-09 Sony Corporation Apparatus for decoding digital video data with small memory requirement
GB9013217D0 (en) 1990-06-13 1990-08-01 Indep Broadcasting Authority Evaluation of detail in video images,and applications thereof
GB9022326D0 (en) 1990-10-15 1990-11-28 British Telecomm Signal coding
US5680225A (en) 1991-02-14 1997-10-21 Canon Kabushiki Kaisha Image reduction with fine-line protection
US5331414A (en) 1991-12-23 1994-07-19 Intel Corporation Method and apparatus for encoding a digital motion video signal using pyramid specific filtering
GB2262854B (en) 1991-12-24 1995-05-24 Sony Broadcast & Communication Image processing apparatus
US5291281A (en) 1992-06-18 1994-03-01 General Instrument Corporation Adaptive coding level control for video compression systems
US5349385A (en) 1992-08-06 1994-09-20 Florida Atlantic University Adaptive scan converter
JPH06125533A (ja) 1992-10-13 1994-05-06 Sony Corp エラー訂正コード付加装置及びエラー訂正装置
JP3104439B2 (ja) 1992-11-13 2000-10-30 ソニー株式会社 高能率符号化及び/又は復号化装置
KR100360206B1 (ko) 1992-12-10 2003-02-11 소니 가부시끼 가이샤 화상신호변환장치
JP3572632B2 (ja) 1993-06-29 2004-10-06 ソニー株式会社 異常検出装置
JP3503166B2 (ja) 1993-07-29 2004-03-02 ソニー株式会社 信号変換装置および方法
CN1075321C (zh) 1993-08-30 2001-11-21 索尼公司 图像编码装置及方法
JP3590996B2 (ja) 1993-09-30 2004-11-17 ソニー株式会社 ディジタル画像信号の階層符号化および復号装置
US5663764A (en) 1993-09-30 1997-09-02 Sony Corporation Hierarchical encoding and decoding apparatus for a digital image signal
JP3373008B2 (ja) 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
JP3271108B2 (ja) 1993-12-03 2002-04-02 ソニー株式会社 ディジタル画像信号の処理装置および方法
JPH07184138A (ja) 1993-12-24 1995-07-21 Toshiba Corp 2画面映像処理回路
JP3846642B2 (ja) 1994-01-31 2006-11-15 ソニー株式会社 動き量検出方法及び動き量検出装置
US5555465A (en) 1994-05-28 1996-09-10 Sony Corporation Digital signal processing apparatus and method for processing impulse and flat components separately
US5553160A (en) 1994-09-01 1996-09-03 Intel Corporation Method and apparatus for dynamically selecting an image compression process based on image size and color resolution
US5796442A (en) 1994-11-02 1998-08-18 Texas Instruments Incorporated Multi-format television reciever
JP3781203B2 (ja) 1994-11-28 2006-05-31 ソニー株式会社 画像信号補間装置及び画像信号補間方法
US5754702A (en) 1994-12-02 1998-05-19 Allied Signal Inc. Scale oriented interband prediction method for image data compression and reconstruction
US5625712A (en) 1994-12-14 1997-04-29 Management Graphics, Inc. Iterative compression of digital images
EP0720376B1 (en) 1994-12-29 2001-10-31 Sony Corporation Quantizing apparatus and quantizing method
US5734433A (en) 1995-06-21 1998-03-31 Sony Corporation Picture encoding apparatus, picture encoding method, picture encoding and transmitting method, and picture record medium
US5703652A (en) 1995-07-28 1997-12-30 Sony Corporation Information signal encoding system and method for adaptively encoding an information signal
US5825313A (en) 1995-08-01 1998-10-20 Sony Corporation Information signal encoding apparatus, encoding method thereof, information signal decoding method, and information signal record medium thereof
US5960116A (en) 1995-11-02 1999-09-28 Canon Kabushiki Kaisha Image processing apparatus and method for performing prediction data encoding
US5812699A (en) 1995-12-07 1998-09-22 Intel Corporation Counter-based controller for video compression
US5912708A (en) 1996-12-26 1999-06-15 Sony Corporation Picture signal encoding device, picture signal encoding method, picture signal decoding device, picture signal decoding method, and recording medium
US5969764A (en) 1997-02-14 1999-10-19 Mitsubishi Electric Information Technology Center America, Inc. Adaptive video coding method
US5880784A (en) 1997-06-17 1999-03-09 Intel Corporation Method and apparatus for adaptively switching on and off advanced prediction mode in an H.263 video coder
US6233358B1 (en) * 1998-07-13 2001-05-15 Intel Corporation Image compression using directional predictive coding of the wavelet coefficients

Also Published As

Publication number Publication date
US6438267B1 (en) 2002-08-20
JPH11187407A (ja) 1999-07-09

Similar Documents

Publication Publication Date Title
JP3912627B2 (ja) 画像符号化装置および画像符号化方法、並びに伝送方法
JP3748088B2 (ja) 画像処理装置および方法、並びに学習装置および方法
JP4126709B2 (ja) 画像処理装置および画像処理方法
JP3915855B2 (ja) 画像符号化装置および画像符号化方法、並びに学習装置および学習方法
JP2002315004A (ja) 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
EP0825776B1 (en) Image coding using sub-sampling, classification of pixel blocks and association of mapping coefficients
EP0820198B1 (en) Apparatus and method for image coding and decoding
KR100504415B1 (ko) 화상부호화장치,화상부호화방법,화상복호장치,화상복호방법및기록매체
US6160845A (en) Picture encoding device, picture encoding method, picture decoding device, picture decoding method, and recording medium
JP3747970B2 (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
JP3912558B2 (ja) 画像符号化装置および画像符号化方法、並びに記録媒体
JP3844031B2 (ja) 画像符号化装置および画像符号化方法、並びに、画像復号装置および画像復号方法
JP3912628B2 (ja) 画像符号化装置、画像符号化方法、画像符号化および復号化システム、画像符号化および復号化方法、並びに記録媒体
JP4534951B2 (ja) 画像符号化装置および画像符号化方法、画像処理システムおよび画像処理方法、伝送方法、並びに記録媒体
JP4582416B2 (ja) 画像符号化装置および画像符号化方法
JP3912629B2 (ja) 画像処理システム、画像符号化装置および画像符号化方法、伝送方法、並びに記録媒体
JP4496494B2 (ja) 画像符号化装置および画像符号化方法
JP3952326B2 (ja) 画像符号化装置および画像符号化方法、画像処理システムおよび画像処理方法、伝送方法、並びに記録媒体
JP4487900B2 (ja) 画像処理システム
JP4168299B2 (ja) 画像データ変換装置及び画像データ変換方法
JP3907623B2 (ja) 映像信号符号化・復号化装置及び符号化・復号化方法
KR100598754B1 (ko) 원 화상 데이타 부호화 장치, 부호화 화상 데이타 복호화 장치, 원 화상 데이타 부호화 방법, 부호화 화상 데이타 복호화 방법, 화상 데이타 송신 방법, 컴퓨터로 판독 가능한 기록 매체
EP1298934A1 (en) Apparatus and method for image coding and decoding
JP4123452B2 (ja) 画像処理装置および画像処理方法
JP2001339724A (ja) 画像符号化装置および方法、並びに記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130216

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140216

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees