JP2004200760A - 画像処理方法および装置 - Google Patents
画像処理方法および装置 Download PDFInfo
- Publication number
- JP2004200760A JP2004200760A JP2002363575A JP2002363575A JP2004200760A JP 2004200760 A JP2004200760 A JP 2004200760A JP 2002363575 A JP2002363575 A JP 2002363575A JP 2002363575 A JP2002363575 A JP 2002363575A JP 2004200760 A JP2004200760 A JP 2004200760A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- data
- image
- resolution
- compressed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】高解像度の画像を含む動画像圧縮データを生成でき、またこれを再生できるようにする。
【解決手段】情報源符号化器1では、差分画像圧縮部20で、高解像度の画像データ1Aとその画像データ1Aから再生された低解像度の画像データとの差分画像データ23Aを圧縮して差分圧縮データ1Cを生成し、多重化符号化器2で、その差分圧縮データ1Cを対応する圧縮データ1Bへ付加し動画像圧縮データ2Aとして出力する。情報源復号器の静止画像再生部では、動画像圧縮データから分離された差分圧縮データを再生し、得られた差分画像データと動画像圧縮データから再生された低解像度の画像データとを合成して、高解像度の静止画像データを生成する。
【選択図】 図1
【解決手段】情報源符号化器1では、差分画像圧縮部20で、高解像度の画像データ1Aとその画像データ1Aから再生された低解像度の画像データとの差分画像データ23Aを圧縮して差分圧縮データ1Cを生成し、多重化符号化器2で、その差分圧縮データ1Cを対応する圧縮データ1Bへ付加し動画像圧縮データ2Aとして出力する。情報源復号器の静止画像再生部では、動画像圧縮データから分離された差分圧縮データを再生し、得られた差分画像データと動画像圧縮データから再生された低解像度の画像データとを合成して、高解像度の静止画像データを生成する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、画像処理方法および装置に関し、特に高解像度の画像を含む動画像圧縮データを生成し、また動画像圧縮データから高解像度の画像を再生する際に用いられる画像処理方法および装置に関するものである。
【0002】
【従来の技術】
一般に、多数の静止画像からなる動画像をデジタル化して記録媒体に格納したり伝送する場合、そのデータ量が膨大となることから、デジタル化した動画像を圧縮処理してそのデータ量を削減する画像処理技術が広く利用されている。
このような画像処理技術の代表的なものとしてMPEG(Motion Picture Coding Experts Group)規格がある。図4にMPEGでの動画像圧縮/再生処理の手順を示す。
【0003】
動画像を圧縮する圧縮処理100では、まず、入力された動画像120に対して情報源符号化器111で、DCT(Discrete Cosine Transfer:離散コサイン変換)、量子化、フレーム間予測および動き補償、可変長符号化などの情報圧縮処理を行う。
続いて、多重化符号器112で、階層構造符号化処理を行い、MPEG階層構造のデータフォーマットに変換して動画像圧縮データを生成する。ここでは、圧縮された動画像データに音声やその他種々のデータが組み込まれる。そして、送信バッファ113でバッファリングして出力レートを制御し、通信媒体や記録媒体へ動画像圧縮データ121を出力する。
【0004】
一方、圧縮データを再生する再生処理101では、後段の復号処理時間を保証するため、入力された動画像圧縮データ122を受信バッファ114で一時的に保持する。
次に、多重化復号器115で、受信バッファ114に保持されている動画像圧縮データに対して階層構造復号処理を行い、MPEG階層構造のデータフォーマットから各圧縮データを切出す。そして、情報源復号器116で、逆DCT、逆量子化、フレーム間予測および動き補償、可変長符号復号処理などの情報再生処理を行い、動画像123を出力する。
【0005】
MPEGでは、動画像を圧縮する際、空間情報圧縮、時間情報圧縮および可変長符号化圧縮の3つの情報圧縮処理を用いている。
空間情報圧縮処理では、静止画像の空間領域における冗長性を除去することにより画像を圧縮している。自然画像は、領域を狭く限ると画素のレベル値が互いに近いことが多く、ある領域(空間)内における画素値の変化の度合い(空間周波数)が比較的小さい。
【0006】
したがって、画像を空間周波数領域のデータに変換すると、そのデータは空間周波数の低い低周波側に偏ることから、高周波側のデータより少ないビット数を低周波側のデータに割り当てることにより、全体として変換前よりデータ量で画像を符号化できる。
MPEGでは、この空間周波数変換にDCT処理を用いており、例えば16×16画素のブロックごとに入力画像がDCT処理される。
【0007】
時間情報圧縮処理では、動画像の時間領域における冗長性を除去することにより動画像を圧縮している。動画像はフレームと呼ばれる多数の静止画像から構成されており、これらフレームのほとんどは1/30秒以下の間隔で撮像された連続する静止画像であることから、前後の画像は似た内容となる。
したがって、直前フレームを元に、現フレームとの差のみを抽出して符号化する(フレーム間予測)ことによりデータ量を削減できる。また、画像内で動く物体を検出し、その動きを予測して現フレームとの差を抽出すれば(動き補償)、予測の精度が向上してデータ量をさらに削減できる。
【0008】
可変長符号化圧縮処理では、前述した空間情報圧縮および時間情報圧縮の各処理が行われた画像データを構成する各ビット列について発生頻度を調べ、発生頻度の高いビット列に短い符号を割り当てるとともに、発生頻度の低いビット列に長い符号を割り当てることにより、画像データを圧縮している。この際、ハフマン(Huffmann)符号化器などが広く用いられる。
【0009】
次に、図5および図6を参照して、MPEGの時間情報圧縮処理について説明する。図5はMPEGのフレーム間予測処理例である。図6はMPEGのデータ階層構造を示す説明図である。
MPEGでは、例えば0.5秒(15枚)程度のフレームをグループ化したGOP(Group of Picture)を時間情報圧縮処理の処理単位としている。これにより、このGOP単位で動画像に対するランダムアクセスが可能となり、途中からの再生、早送り、巻き戻し、逆転再生などのトリックモードが実現される。
【0010】
1つのGOPには、Iピクチャ(Intra Picture)と呼ばれるフレーム内符号化画像、Pピクチャ(Predictive Picture)と呼ばれるフレーム間符号化画像、およびBピクチャ(Bidirectionally Picture)と呼ばれる双方向予測符号化画像の3種類の圧縮データが存在する。
Iピクチャは、当該GOPでの時間情報圧縮処理の基準となる元のフレームと等しい完結した圧縮データであり、1GOP内には最低1つ必要となる。Pピクチャは、対応するフレームより前(過去)のIピクチャやPピクチャのフレームとの差分(単方向フレーム間予測)が記録された圧縮データである。
【0011】
一方、Bピクチャは、対応するフレームの前過去)および後(未来)に位置するIピクチャやPピクチャの2つのフレームとの差分(双方向フレーム間予測)が記録された圧縮データである。
このとき、Bピクチャは、自フレームより未来のフレームをフレーム間予測に用いるため、符号化処理では、元のフレーム順の並び替えが行われ、Bピクチャの双方向フレーム間予測に用いられた2つのフレームのピクチャに後続する順序となる。
【0012】
例えば、図5のフレームF1からIピクチャI1が生成され、このフレームF1(I1)とフレームF4との差分からPピクチャP4が生成されている場合、フレームF1の直後のフレームF2のBピクチャB2、およびそのフレームF2の直後のフレームF3のBピクチャB3は、フレームF1(I1)とフレームF4(P4)とからそれぞれ生成される。
このとき、圧縮データでは、処理順序を考慮して、IピクチャI1の直後にPピクチャP4が配置され、その後にBピクチャB2,B3が配置される。
【0013】
このようにして生成された各ピクチャは、図6のデータ階層構造に従って出力される。
各GOPには、それぞれの管理情報が格納されたシーケンスヘッダSHがその先頭に付加され、再生順に並べられる。
各GOPは、時間情報圧縮処理で生成された各ピクチャに、その管理情報が格納されたGOPヘッダHDR1が付加されて構成されている。
また、各ピクチャは、そのピクチャの管理情報が格納されたピクチャヘッダHDR2が付加されるとともに、必要に応じてユーザデータが付加されて構成されている。
【0014】
また、MPEG2の規格では、スケーラビリティと呼ばれる機能で、2種類の解像度の動画を並列的に伝送する方法が規定されている。これは、前述したMPEGの画像圧縮技術で生成した、例えば360×240画素からなる低解像度の動画の各画像ごとに、この低解像度の動画より高解像度の、例えば720×480画素からなる動画の各画像との差分画像からなる差分動画像を生成し、その低解像度動画と差分動画像とを並列的に伝送することにより、受信側で低解像度動画と差分動画像とを用いて、高解像度の動画を再生するようにしている。
【0015】
なお、出願人は、本明細書に記載した先行技術文献情報で特定される先行技術文献以外には、本発明に関連する先行技術文献を出願時までに発見するには至らなかった。
【非特許文献1】
藤原 洋 監修、「画像&音声圧縮技術のすべて」、CQ出版株式会社、2002年5月15日、第5版発行、p22〜33、p34〜60。
【0016】
【発明が解決しようとする課題】
このような画像処理技術を用いて生成された低解像度の動画像から、その動画像に含まれる任意の被写体をより高解像度の画像として抽出したいという要求がある。
例えば、撮影した動画像の任意のフレームを印刷して保存しておきたい場合も、印刷に耐えうるような動画像より高解像度の画像が必要となる。また、監視カメラで撮影された動画像の内容を詳細に確認したい場合、動画像の低解像度より高解像度の画像が必要となる。
【0017】
しかしながら、前述したMPEGなどの従来の画像処理技術では、予め設定された低解像度、例えば標準テレビジョン画像である720×480画素の解像度にしたがってすべてのフレームを処理するため、得られた動画像から当初の低解像度より高解像度(例えば、1920×1080画素)の画像を生成できないという問題点があった。
また、前述したスケーラビリティを用いて高解像度の動画を伝送する方式では、低解像度動画の各画像、すなわちIピクチャ、PピクチャおよびBピクチャごとに生成したこれら各ピクチャと同数(1:1)の差分画像を差分動画像として伝送するため、ある程度の解像度の画像を伝送できるものの、通常の伝送帯域では、1つの差分画像のデータサイズが制限されてしまい、前述した要求を満足しうる高解像度の画像を伝送できないという問題点があった。また高解像度の画像を伝送するためには広い帯域の伝送路を必要とするため、高解像度の画像を伝送する効率が悪いという問題点があった
【0018】
また、従来の画像処理装置を大幅に改良したり、MPEG規格を変更すれば、高解像度の画像を動画像に挿入することも可能である。しかし、そのような仕様の大幅変更は、現行の画像再生装置と互換性がなくなるため、高解像度の画像が挿入された動画像は、専用の装置でのみ再生でき、現行の装置では再生できなくなる。
本発明は、高解像度の画像を含む動画像圧縮データを生成でき、またこれを再生でき、さらには従来の動画像圧縮データとの互換性を保つことができる画像処理方法および装置を提供することを目的としている。
【0019】
【課題を解決するための手段】
このような目的を達成するために、本発明にかかる画像処理方法は、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理方法であって、各フレームのうちIピクチャの元となるフレームについてのみ、当該フレームを構成する高解像度の画像データとその画像データに基づき生成されたその高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する第1のステップと、Iピクチャに対応する圧縮データに差分圧縮データを付加して出力する第2のステップとを備えるものである。
【0020】
このとき、第1のステップとして、DCT処理および量子化で得られた画像データから復元画像データを生成するステップを実行してもよい。
また、第1のステップとして、復元画像データの画素数を調整することにより高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、高解像度の画像データと調整画像データとの差分画像データを生成するステップと、この差分画像データをDCT処理および量子化した後に可変長符号化することにより差分圧縮データを生成するステップとを実行してもよい。
【0021】
また、本発明にかかる他の画像処理方法は、入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより復元画像データを生成する画像処理方法であって、動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを分離して出力する第1のステップと、差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応するIピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる、低解像度より高い高解像度の静止画像データを生成する第2のステップとを備えるものである。
【0022】
このとき、第2のステップとして、差分圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより元の差分画像データを生成するステップと、差分圧縮データに対応する復元画像データの画素数を調整することにより、その復元画像データの元となる高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、差分画像データと調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成するステップとを実行するようにしてもよい。
【0023】
また、本発明にかかる画像処理装置は、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理装置であって、各フレームのうちIピクチャの元となるフレームについてのみ、当該フレームを構成する高解像度の画像データとその画像データに基づき生成されたその高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する差分画像圧縮部と、Iピクチャに対応する圧縮データに差分圧縮データを付加して出力する多重化符号化部とを備えるものである。
【0024】
このとき、DCT処理および量子化で得られた画像データから復元画像データを生成する動画像圧縮部をさらに設けてもよい。
また、差分画像圧縮部に、復元画像データの画素数を調整することにより高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラ手段と、高解像度の画像データと調整画像データとの差分画像データを生成する減算手段と、この減算器で生成された差分画像データに対してDCT処理を行うDCT変換手段と、このDCT処理手段でDCT変換された差分画像データに対して量子化を行う量子化手段と、この量子化手段で量子化された差分画像データを可変長符号化することにより差分圧縮データを生成する可変長符号化手段を設けてもよい。
【0025】
また、本発明にかかる他の画像処理装置は、入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより復元画像データを生成する画像処理装置であって、動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを分離して出力する多重化復号部と、差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応するIピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成する静止画像再生部とを備えるものである。
【0026】
このとき、静止画像再生部に、差分圧縮データを可変長符号で復号する可変長符号復号手段と、この可変長符号復号手段で復号された差分圧縮データを逆量子化する逆量子化手段と、この逆量子化手段で逆量子化された差分圧縮データを逆DCT処理することにより元の差分画像データを生成する逆DCT変換手段と、差分圧縮データに対応する復元画像データの画素数を調整することにより、その復元画像データの元となる、その低解像度より高い高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラと、差分画像データと調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成する加算手段とを設けてもよい。
【0027】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の第1の実施の形態にかかる画像処理装置の構成を示すブロック図である。
本実施の形態にかかる画像処理装置は、動画像の圧縮処理に用いられる装置であり、入力された高解像度の画像データより低い低解像度の動画像データをMPEG規格に基づき生成する際、その動画像データを構成する低解像度の画像データと、元の高解像度の画像データとの差分画像データを求め、その差分画像データを動画像データへ付加することにより、動画像データの再生時に、動画像データを構成する低解像度の画像データと、その動画像データに付加されている差分画像データとから高解像度の画像データを再生できるようにしたものである。
【0028】
この画像処理装置は、前述した画像処理装置(図4参照)の圧縮処理100で用いる構成と同様に、情報源符号化器、多重符号化器、および送信バッファを有している。
特に、前述した図4の情報源符号化器111に相当する構成として、入力された高解像度の画像データ1Aを低解像度の画像データへ変換して圧縮処理することにより圧縮データ1Bを生成する動画像圧縮部10と、画像データ1Aと低解像度の画像データとの差分画像データを圧縮して差分圧縮データ1Cを生成する差分画像圧縮部20とを有する情報源符号化器1を備えている。
【0029】
また、前述した図4の多重化符号化器112に相当する構成として、差分圧縮データ1Cを、これに対応する圧縮データ1Bへ付加し、動画像圧縮データ2Aとして出力する多重化符号化器2を備えている。
この画像処理装置に入力される高解像度の画像データ1Aは、情報源符号化器1の動画像圧縮部10および差分画像圧縮部20で行われる画像圧縮処理において、1フレーム分の画像を複数に分割した所定画素数の画素ブロックを単位として実行される。
【0030】
これらブロックの元のフレームには、前段の処理(図示せず)で、当該フレームをMPEG規格のどのピクチャ種別(Iピクチャ、PピクチャおよびBピクチャ)で圧縮処理するか予め割り当てられているものとする。
動画像圧縮部10では、当該フレームのピクチャ種別に応じて各部を制御し、画素ブロックごとに当該ピクチャ種別の圧縮データ1Bを順次生成し、差分画像圧縮部20では、Iピクチャが対応付けられたフレームでのみ各部を制御して、そのブロックの差分圧縮データ1Cを順次生成する。なお、Iピクチャについてのみ差分画像データ1Cを生成する理由は、他のピクチャに比較して元の高解像度画像の情報を最も多く含んでおり、このIピクチャを対象とすることにより高い精度で高解像度の画像を再生できるからである。
【0031】
情報源符号化器1の動画像圧縮部10には、ダウンサンプラ11、減算器12、DCT変換器13、量子化器14、可変長符号化器15、逆量子化器16、逆DCT変換器17、加算器18、および動き予測器19が設けられている。
ダウンサンプラ11は、入力された高解像度、例えば、1920×1080画素の画像データ1A(HDI)をそれより低い低解像度、例えば標準テレビジョン画像である720×480画素の解像度の画像データに変換する。
減算器12は、ダウンサンプラ11から出力された低解像度の画像データのうち、所定ピクチャ種別(PピクチャおよびBピクチャ)の画像データ1Aについてのみ動き予測器19からの予測分画像データとの差分を算出する。
【0032】
DCT変換器13は、減算器12からの低解像度の画像データをDCT処理して出力する。量子化器14は、DCT処理された画像データを所定の量子化テーブルに基づき量子化して出力する。
可変長符号化器15は、量子化器14からの画像データ14Aを可変長で符号化し圧縮データ1Bとして出力する。
逆量子化器16は、量子化器14からの画像データ14Aを逆量子化して出力する。逆DCT変換器17は逆量子化器16からのデータを逆DCT処理し、元の低解像度の復元画像データ17A(SDI)を出力する。
【0033】
加算器18は、所定ピクチャ種別(PピクチャおよびBピクチャ)に応じて逆DCT変換器17からの復元画像データ17Aと、動き予測器19で予測された予測分画像データとを加算して出力する。
動き予測器19は、加算器18から出力された画像データを元にして、その画像データに含まれる被写体の動きを予測し、元の画像データに対する予測分画像データを生成する。
なお、動画像圧縮部10の構成については、一般的な画像圧縮処理に用いる構成と同様である。また、DCT処理および量子化、逆DCT処理および逆量子化、可変長符号化器についても、一般的な処理と同様であり、ここでの詳細な説明は省略する。
【0034】
情報源符号化器1の差分画像圧縮部20には、メモリ21、アップサンプラ22、減算器23、DCT変換器24、量子化器25、および可変長符号化器26が設けられている。
メモリ21は、動画動圧縮部10に入力されたものと同じ高解像度の画像データ1Aを一時的に保持する。アップサンプラ22は、動画像圧縮部10の逆DCT変換器17で得られた低解像度の復元画像データ17Aを、高解像度の画像データ1Aと同じ画素数の調整画像データ22A(SDI’)へ変換して出力する。
【0035】
減算器23は、メモリ21内の画像データ(HDI)とアップサンプラ22からの調整画像データ22Aとの差分からなる差分画像データ23A(ΔHDI)を生成する。
DCT変換器24は、減算器23からの差分画像データ23AをDCT処理して出力する。量子化器25はDCT処理された差分画像データを量子化して出力する。可変長符号化器26は量子化された差分画像データを可変長で符号化し差分圧縮データ1C(Q)として出力する。
【0036】
このようにして、情報源符号化器1の動画像圧縮部10では、当該フレームに予め対応付けられているピクチャ種別に応じて各部を制御することにより、圧縮処理した低解像度の画像データからなる圧縮データ1Bを生成する。
また、差分画像圧縮部20でも、当該フレームに予め対応付けられているピクチャ種別がIピクチャの場合に各部を制御することにより、そのフレームの画像データに関する差分画像データからなる差分圧縮データ1Cを生成する。
【0037】
多重化符号化器2は、動画像圧縮部10で生成された低解像度の画像データからなる圧縮データ1Bと、差分画像圧縮部20で生成された差分画像データからなる差分圧縮データ1Cとから、前述の図6で説明したMPEG規格のデータ階層構造に基づき、高解像度の画像を含む所望の動画像圧縮データ2Aを生成する。
ここでは、各フレームの圧縮データ1Bをピクチャデータとし、そのフレームのピクチャ種別に応じて、Iピクチャ、PピクチャおよびBピクチャのピクチャレイヤを構成する。また、Iピクチャについては、差分圧縮データ1Cをユーザデータとして上記Iピクチャデータに付加する。
【0038】
次に、図1を参照して、第1の実施の形態にかかる画像圧縮装置の動作について説明する。
入力された高解像度(例えば、1920×1080画素)の画像データ1Aは、ダウンサンプラ11で低解像度(例えば、720×480画素)の画像データへ変換され、減算器12へ出力される。このとき、Iピクチャの画像データの場合には、ダウンサンプラ11からの画像データがそのままDCT変換器13へ渡される。また、PピクチャおよびBピクチャについては、減算器12および動き予測器19が制御されて、ダウンサンプラ11からの画像データにフレーム間予測および動き補償が適用されてDCT変換器13へ渡される。
【0039】
そして、DCT変換器13および量子化器14で、画像データの圧縮処理が行われる。
一般に、圧縮処理対象となる画像について、隣の画素の色との相関関係によって空間周波数を定義することができる。すなわち、絵柄が粗くてゆっくりと色合いが変化する画像は、隣の画素との相関関係が高く隣の画素の色を類推しやすいので、空間周波数が低いと定義される。逆に、絵柄が細かく色合いが急に変化する画像は、隣の画素との相関関係が低く隣の画素の色を類推しにくいので、空間周波数が高いと定義される。なお、空間周波数は、量子化による画素値の丸めに関係する。
【0040】
低解像度へ変換された画像データは、DCT変換器13でDCT処理され、得られた係数行列(画像データ)が量子化器14で所定の除数(量子化ステップ)で割り算されて、余りが丸められることにより量子化され、そのデータ量が圧縮される。この際、DCT処理された係数行列は、行列の左上側の低周波項だけに値が残り、右下側の高周波項はゼロとなる。
本実施の形態は、この高周波項に相当する周波数成分を含む差分画像データを、フレーム内符号化画像すなわちIピクチャの元となる高解像度の画像データから生成し、これをユーザデータとしてIピクチャデータに付加して動画像圧縮データを生成することにより、Iピクチャの再生時に、そのIピクチャに含まれている低周波成分と差分画像データに含まれている高周波成分とを合成して、より高解像度の静止画像データを生成できるようにしたものである。
【0041】
すなわち、入力された高解像度の画像データHDI(1A)を、DCT処理および量子化して圧縮した際に得られた画像データ14Aを、逆量子化器16で逆量子化するとともに逆DCT変換器17で逆DCT処理して、低解像度の復元画像データSDI(17A)に戻す。
さらに、この復元画像データSDIをアップサンプラ9で画素数を調整して、高解像度の画像データHDIと同じ画素数を有する調整画像データSDI’(22A)へ戻す。このとき、SDI’は既にダウンサンプラ11および量子化器14を通しているので、元の高解像度の画像データHDIよりもぼけた画像になる。
【0042】
図2は、ダウンサンプラで用いるフィルタと画像データの空間周波数に関する周波数特性例であり、横軸は空間周波数を規格化した周波数、縦軸は減衰度を示している。
ダウンサンプラ11では、画素数を減らすために元の画像データに対して低域通過フィルタを適用し、画素数削減の比率に応じて余分な画素を抜き出している。図2に示したフィルタの周波数特性は、画素数を1/2にダウンサンプルする例であり、この特性曲線60は単純な3角形フィルタ(Z変換式=0.25+0.5Z(-1)+0.25Z(-2))の特性である。
【0043】
高解像度の元の画像データから、このような特性のフィルタを適用して得られた低解像度の画像データを、元の画像データの画素数に合わせて減算すると、元の画像データからボケ画像データを引算することになる。
これにより、フィルタで削減された高周波成分の画像データが得られ、その画像データの周波数特性は特性曲線61のようになる。特性曲線60,61が交差する周波数62は遮断周波数であり、元の画像データのナイキスト周波数(0.5)の半分(0.25)に相当する。
【0044】
減算器23では、アップサンプラ22で生成されたSDI’とメモリ21からのHDIとの差分画像データΔHDIを生成する。
したがって、差分画像圧縮部20で、ΔHDI=HDI−SDI’により差分画像データを求めることは、前述のように元画像データからボケ画像データを引算することになり、ΔHDIは高域成分のみの画像となる。
ここで、HDIをSDIの画素数に変換するときに使用した低域フィルタの遮断周波数をf1、元の画像データの最高周波数をfhとすると、このΔHDIはf1〜fhの間の周波数成分を含み、逆に直流〜f1の低域成分は含まないことが判る。
【0045】
差分画像圧縮部20では、この差分画像データΔHDIをDCT変換器24、量子化器25および可変長符号化器26で圧縮し、差分圧縮データQを生成する。
この差分圧縮データQは、多重化符号化器2で、I,P,Bの各ピクチャデータとは別のユーザ定義領域に格納される。このユーザ定義領域は、MPEG規格において拡張領域として規定化されており、ユーザが定義する任意のユーザデータを格納することができる。
【0046】
このように、本実施の形態にかかる画像処理方法および装置では、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを生成し、これら圧縮データを動画像圧縮データとして出力する場合、各フレームのうちIピクチャの元となるフレームについてのみ、その圧縮データの生成過程で得られる低解像度の画像データとその元となる高解像度の画像データとの差分を圧縮処理することにより差分圧縮データを生成し、Iピクチャに対応する圧縮データにその差分圧縮データを付加し、動画像圧縮データとして出力するようにしたので、高解像度の画像を含む動画像圧縮データを生成できる。
したがって、動画像圧縮データの各圧縮データを再生する際、その圧縮データから再生された復元画像データと、差分圧縮データから再生された差分画像データとを合成することにより、元の画像データとほぼ等しい高解像度の画像データを得ることができる。
【0047】
このとき、Iピクチャの元となるフレームについてのみ、高解像度の画像データとの差分画像データを生成して出力するようにしたので、MPEG2のスケーラビリティ機能のように、すべてのピクチャに対して差分画像を生成して伝送する場合と比較して、Iピクチャに対する差分画像データに対してより多くの伝送帯域を割り当てることが可能となる。
したがって、Iピクチャに対する差分画像データとしてより大きなデータサイズの差分画像データを伝送することができ、広い帯域の伝送路を必要とすることなく、より高解像度の画像を伝送することが可能となる。
【0048】
また、復元画像データについては、圧縮データの生成過程で得られる低解像度の画像データであればよく、例えばDCT変換器13へ入力される画像データでもよい。
これについて、本実施の形態では、圧縮データの生成過程でDCT処理および量子化された画像データから、その画像データの元の低解像度の復元画像データを生成するようにした。
したがって、圧縮データを再生した際に得られる復元画像データと等しい復元画像データとの差分画像データを得ることができ、DCT処理および量子化による圧縮処理で生じる誤差が低減されて、元の高解像度の画像データにさらに近い画像データを生成できる。
【0049】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加するようにしたので、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0050】
次に、図3を参照して、本発明の第2の実施の形態にかかる画像処理装置について説明する。
本実施の形態にかかる画像処理装置は、動画像圧縮データの再生処理に用いられる装置であり、入力された動画像圧縮データに含まれる各圧縮データから低解像度の動画像データをMPEG規格に基づき再生して出力する際、動画像データを構成する低解像度の画像データと、その動画像データの圧縮データに付加されている差分画像データとから高解像度の画像データを再生するようにしたものである。
【0051】
この画像処理装置は、前述した画像処理装置(図4参照)の再生処理101で用いる構成と同様に、受信バッファ、多重化復号器、および情報源復号器を有している。
特に、前述した画像処理装置(図4参照)の多重化復号器115に相当する構成として、第1の実施の形態にかかる画像処理装置1で生成された動画像圧縮データ2Aと等しい動画像圧縮データ5Aから、MPEGの各ピクチャに対応する圧縮データ5Bと、その圧縮データ5BのうちIピクチャのものに付加されている差分圧縮データ5C(Q”)とを分離して出力する多重化復号器5を備えている。
【0052】
また、情報源復号器116に相当する構成として、多重化復号器5からの圧縮データ5Bを再生して低解像度の画像データ6Aからなる動画像を生成する動画像再生部40と、多重化復号器5からの差分圧縮データ5Cを再生して得られた差分画像データと動画像再生部40で圧縮データ5Bから得られた低解像度の復元画像データとを合成して、高解像度の静止画像データ6Bを生成する静止画像再生部50とを有する情報源復号器6を備えている。
【0053】
多重化符号化器2は、入力された動画像圧縮データ5Aから、前述の図6に示したMPEG規格の階層構造に基づき、各ピクチャのピクチャデータを圧縮データ5Bとして抽出するとともに、Iピクチャのユーザ定義領域に付加されているユーザデータを差分圧縮データとして分離する。
【0054】
情報源復号器6の動画像再生部40には、可変長符号復号器41、逆量子化器42、逆DCT変換器43、加算器44、および動き補償器45が設けられている。
可変長符号復号器41は、入力された圧縮データ5Bを可変長符号で復号して出力する。逆量子化器42は、可変長符号復号器41で復号された圧縮データを所定の量子化テーブルに基づき逆量子化して出力する。
逆DCT変換器43は、逆量子化器42で逆量子化された圧縮データを逆DCT処理し、低解像度の復元画像データ43Aを出力する。
【0055】
加算器44は、ピクチャ種別に応じて逆DCT変換器43からの復元画像データ43Aと動き補償器45からの画像データとを加算し、所望の動画像を構成する低解像度の画像データ6Aとして出力する。
なお、動画像再生部40の構成については、一般的な画像再生処理に用いる構成と同様である。また、DCT処理および量子化、逆DCT処理および逆量子化および可変長符号復号部は、一般的な処理と同様であり、ここでの詳細な説明は省略する。
【0056】
情報源復号器6の静止画像再生部50には、メモリ51、可変長符号復号器52、逆量子化器53、逆DCT変換器54、アップサンプラ55、および加算器56が設けられている。
メモリ51は、多重化復号器5からの差分圧縮データ5C(Q”)を一時保存する。可変長符号復号器52は、メモリ51からの差分圧縮データ5Cを可変長符号で復号して出力する。
逆量子化器53は、可変長符号復号器52で復号された差分圧縮データを所定の量子化テーブルに基づき逆量子化して出力する。逆DCT変換器54は、逆量子化器53で逆量子化された差分圧縮データを逆DCT処理し、差分画像データ54A(ΔHDI”)を出力する。
【0057】
アップサンプラ55は、動画像再生部40の逆DCT変換器43で生成された低解像度の復元画像データ43Aを、所定の高解像度の画像データと同じ画素数の調整画像データ55A(SDI”)へ変換して出力する。
加算器56は、逆DCT変換器54からの差分画像データ54A(ΔHDI”)と、アップサンプラ55からの調整画像データ55A(SDI”)とを合成することにより、高解像度の静止画像データ6Bを生成する。
【0058】
次に、図3を参照して、第2の実施の形態にかかる画像処理装置の動作について説明する。
動画像再生部40では、各圧縮データ5Bが、可変長符号復号器41、逆量子化器42および逆DCT変換器43で処理されて低解像度(例えば、720×480画素)の復元画像データ43Aが生成される。
【0059】
そして、Iピクチャの画像データについては、その復元画像データ43Aがそのまま画像データ6Aとして出力され、PピクチャおよびBピクチャについては、加算器44および動き補償器45が制御されて、フレーム間予測および動き補償により画像データ6Aが生成されて出力される。
また、静止画像再生部50では、差分圧縮データ5C(Q”)に対応するIピクチャの復元画像データ43Aを動画像再生部40から取り込み、所望する高解像度(例えば、1920×1080画素)の静止画像データ6Bを生成している。
【0060】
前述の第1の実施の形態では、入力された高解像度の画像データ(HDI)と動画像データを構成する低解像度の画像データ(SDI’)との差分から差分画像データ(ΔHDI’)を生成する処理が行われる。
本実施の形態では、上記処理とは全く逆の処理、すなわち、入力された動画像圧縮データから再生された低解像度の画像データSDI”と差分画像データΔHDI”とを合成して高解像度の画像データHDI”を生成する、HDI”=SDI”+ΔHDI”という処理を行って、高解像度の静止画像データを生成している。
【0061】
実際には、動画像再生部40で得られた低解像度の復元画像データ43Aを、アップサンプラ55で高解像度の画素数に変換し、得られた調整画像データをSDI”として用いている。この調整画像データSDI”は、情報源符号化器1(図1参照)のアップサンプラ22で生成される調整画像データSDI’(22A)に相当する。また、差分画像データΔHDI”は、減算器23で得られる差分画像データΔHDI’に相当する。
したがって、加算器56では、減算器23での差分画像生成処理と全く逆の処理が行われ、減算器23に入力されている高解像度の画像データHDI(21A)に相当する高解像度の画像データHDI”が生成される。
【0062】
このように、本実施の形態にかかる画像処理方法および装置では、MPEG規格に基づき生成された動画像圧縮データから、各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを多重化復号器で分離するようにしたものである。
そして、その差分圧縮データから元の差分画像データを生成して、その差分画像データと圧縮データから得られた復元画像データのうち対応するIピクチャから得られた復元画像データとを静止画像再生部で合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成するようにしたので、差分画像データを含む動画像圧縮データから高解像度の静止画像を生成できる。
【0063】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加されているため、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0064】
以上の各実施の形態では、MPEG規格のIピクチャに同期して差分画像データを生成する場合を例として説明した。一般的な720×480画素の標準テレビジョン画像をMPEGで圧縮する場合では、0.5秒(15枚)程度のフレームをグループ化したGOP(Group of Picture)を時間情報圧縮処理の処理単位としている。これにより、少なくとも1GOPに1つのIピクチャが存在することから、15枚程度に1枚の割合で高解像度の静止画像を再生することが可能となる。
【0065】
したがって、動画像再生時の制御として、動画再生中に利用者から一時停止が指示された場合、再生停止した動画像の画像データに最も近い時間位置にある、高解像度の静止画像データを画面出力するようにしてもよい。
これにより、所望の画面とほぼ等しい高解像度の画像を容易に表示することができ、例えば、撮影した動画像の任意のフレームを印刷して保存しておきたい場合には、その画面表示された高解像度の画像を印刷すればよく、低解像度の動画像を印刷する場合と比較して美しい印刷結果が得られる。
【0066】
また、監視カメラなどで撮影された動画像の内容を詳細に確認したい場合には、画面表示された高解像度の画像を拡大して、その内容を詳細に確認することもでき、低解像度の動画像で確認する場合と比較して、より詳細に内容を確認できる。
なお、各Iピクチャごとに差分画像データを付加する必要はなく、任意のIピクチャにのみ差分画像データを付加して動画像圧縮データを生成してもよい。これにより、不要な差分画像データが削減され、差分画像データにより動画像圧縮データのデータ量の増加を抑制できる。
【0067】
【発明の効果】
以上説明したように、本発明は、入力された高解像度の画像データを圧縮して得られた圧縮データを動画像圧縮データとして出力する場合、各フレームのうちIピクチャの元となるフレームについてのみ、その圧縮データの生成過程で得られる、その高解像度より低い低解像度の復元画像データとその元となる高解像度の画像データとの差分を圧縮処理することにより差分圧縮データを生成し、Iピクチャに対応する圧縮データにその差分圧縮データを付加し、動画像圧縮データとして出力するようにしたので、高解像度の画像を含む動画像圧縮データを生成できる。
したがって、動画像圧縮データの各圧縮データを再生する際、その圧縮データから再生された復元画像データと、差分圧縮データから再生された差分画像データとを合成することにより、元の画像データとほぼ等しい高解像度の画像データを得ることができる。
【0068】
このとき、所望の画像の全画素が圧縮されるIピクチャの元となるフレームについてのみ、高解像度の画像データとの差分画像データを生成して出力するようにしたので、MPEG2のスケーラビリティ機能のように、すべてのピクチャに対して差分画像を生成して伝送する場合と比較して、Iピクチャに対する差分画像データに対してより多くの伝送帯域を割り当てることが可能となる。
したがって、Iピクチャに対する差分画像データとしてより大きなデータサイズの差分画像データを伝送することができ、広い帯域の伝送路を必要とすることなく、より高解像度の画像を伝送することが可能となる。
【0069】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加するようにしたので、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0070】
また、MPEG規格に基づき生成された動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのいずれかに付加されている差分圧縮データとを多重化復号器で分離し、その差分圧縮データから元の差分画像データを生成して、その差分画像データとこれに対応する復元画像データとを静止画像再生部で合成することにより、当該復元画像データの元となる、その低解像度より高い高解像度の静止画像データを生成するようにしたので、差分画像データを含む動画像圧縮データから高解像度の静止画像を生成できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態にかかる画像処理(動画像圧縮)装置の構成を示すブロック図である。
【図2】ダウンサンプラで用いるフィルタと画像データの空間周波数に関する周波数特性例である。
【図3】本発明の第2の実施の形態にかかる画像処理(動画像再生)装置の構成を示すブロック図である。
【図4】一般的な動画像圧縮/再生処理を示す説明図である。
【図5】MPEGのフレーム間予測処理例である。
【図6】はMPEGのデータ階層構造を示す説明図である。
【符号の説明】
1…情報源符号化器、1A…画像データ(高解像度)、1B…圧縮データ(低解像度)、1C…差分圧縮データ、10…動画像圧縮部、11…ダウンサンプラ、12…減算器、13…DCT変換器、14…量子化器、14A…画像データ、15…可変長符号化器、16…逆量子化器、17…逆DCT変換器、17A…復元画像データ(低解像度)、18…加算器、19…動き予測器、20…差分画像圧縮部、21…メモリ、21A…画像データ(高解像度)、22…アップサンプラ、22A…調整画像データ、23…減算器、23A…差分画像データ、24…DCT変換器、25…量子化器、26…可変長符号化器、2…多重化符号化器、2A…動画像圧縮データ、5…多重化復号器、5A…動画像圧縮データ、5B…圧縮データ、5C…差分圧縮データ、6…情報源復号器、6A…画像データ(低解像度)、6B…静止画像データ(高解像度)、40…動画像再生部、41…可変長符号復号器、42…逆量子化器、43…逆DCT変換器、43A…復元画像データ(低解像度)、44…加算器、45…動き補償器、50…静止画像再生部、51…メモリ、52…可変長符号復号器、53…逆量子化器、54…逆DCT変換器、55…アップサンプラ、55A…調整画像データ、56…加算器。
【発明の属する技術分野】
本発明は、画像処理方法および装置に関し、特に高解像度の画像を含む動画像圧縮データを生成し、また動画像圧縮データから高解像度の画像を再生する際に用いられる画像処理方法および装置に関するものである。
【0002】
【従来の技術】
一般に、多数の静止画像からなる動画像をデジタル化して記録媒体に格納したり伝送する場合、そのデータ量が膨大となることから、デジタル化した動画像を圧縮処理してそのデータ量を削減する画像処理技術が広く利用されている。
このような画像処理技術の代表的なものとしてMPEG(Motion Picture Coding Experts Group)規格がある。図4にMPEGでの動画像圧縮/再生処理の手順を示す。
【0003】
動画像を圧縮する圧縮処理100では、まず、入力された動画像120に対して情報源符号化器111で、DCT(Discrete Cosine Transfer:離散コサイン変換)、量子化、フレーム間予測および動き補償、可変長符号化などの情報圧縮処理を行う。
続いて、多重化符号器112で、階層構造符号化処理を行い、MPEG階層構造のデータフォーマットに変換して動画像圧縮データを生成する。ここでは、圧縮された動画像データに音声やその他種々のデータが組み込まれる。そして、送信バッファ113でバッファリングして出力レートを制御し、通信媒体や記録媒体へ動画像圧縮データ121を出力する。
【0004】
一方、圧縮データを再生する再生処理101では、後段の復号処理時間を保証するため、入力された動画像圧縮データ122を受信バッファ114で一時的に保持する。
次に、多重化復号器115で、受信バッファ114に保持されている動画像圧縮データに対して階層構造復号処理を行い、MPEG階層構造のデータフォーマットから各圧縮データを切出す。そして、情報源復号器116で、逆DCT、逆量子化、フレーム間予測および動き補償、可変長符号復号処理などの情報再生処理を行い、動画像123を出力する。
【0005】
MPEGでは、動画像を圧縮する際、空間情報圧縮、時間情報圧縮および可変長符号化圧縮の3つの情報圧縮処理を用いている。
空間情報圧縮処理では、静止画像の空間領域における冗長性を除去することにより画像を圧縮している。自然画像は、領域を狭く限ると画素のレベル値が互いに近いことが多く、ある領域(空間)内における画素値の変化の度合い(空間周波数)が比較的小さい。
【0006】
したがって、画像を空間周波数領域のデータに変換すると、そのデータは空間周波数の低い低周波側に偏ることから、高周波側のデータより少ないビット数を低周波側のデータに割り当てることにより、全体として変換前よりデータ量で画像を符号化できる。
MPEGでは、この空間周波数変換にDCT処理を用いており、例えば16×16画素のブロックごとに入力画像がDCT処理される。
【0007】
時間情報圧縮処理では、動画像の時間領域における冗長性を除去することにより動画像を圧縮している。動画像はフレームと呼ばれる多数の静止画像から構成されており、これらフレームのほとんどは1/30秒以下の間隔で撮像された連続する静止画像であることから、前後の画像は似た内容となる。
したがって、直前フレームを元に、現フレームとの差のみを抽出して符号化する(フレーム間予測)ことによりデータ量を削減できる。また、画像内で動く物体を検出し、その動きを予測して現フレームとの差を抽出すれば(動き補償)、予測の精度が向上してデータ量をさらに削減できる。
【0008】
可変長符号化圧縮処理では、前述した空間情報圧縮および時間情報圧縮の各処理が行われた画像データを構成する各ビット列について発生頻度を調べ、発生頻度の高いビット列に短い符号を割り当てるとともに、発生頻度の低いビット列に長い符号を割り当てることにより、画像データを圧縮している。この際、ハフマン(Huffmann)符号化器などが広く用いられる。
【0009】
次に、図5および図6を参照して、MPEGの時間情報圧縮処理について説明する。図5はMPEGのフレーム間予測処理例である。図6はMPEGのデータ階層構造を示す説明図である。
MPEGでは、例えば0.5秒(15枚)程度のフレームをグループ化したGOP(Group of Picture)を時間情報圧縮処理の処理単位としている。これにより、このGOP単位で動画像に対するランダムアクセスが可能となり、途中からの再生、早送り、巻き戻し、逆転再生などのトリックモードが実現される。
【0010】
1つのGOPには、Iピクチャ(Intra Picture)と呼ばれるフレーム内符号化画像、Pピクチャ(Predictive Picture)と呼ばれるフレーム間符号化画像、およびBピクチャ(Bidirectionally Picture)と呼ばれる双方向予測符号化画像の3種類の圧縮データが存在する。
Iピクチャは、当該GOPでの時間情報圧縮処理の基準となる元のフレームと等しい完結した圧縮データであり、1GOP内には最低1つ必要となる。Pピクチャは、対応するフレームより前(過去)のIピクチャやPピクチャのフレームとの差分(単方向フレーム間予測)が記録された圧縮データである。
【0011】
一方、Bピクチャは、対応するフレームの前過去)および後(未来)に位置するIピクチャやPピクチャの2つのフレームとの差分(双方向フレーム間予測)が記録された圧縮データである。
このとき、Bピクチャは、自フレームより未来のフレームをフレーム間予測に用いるため、符号化処理では、元のフレーム順の並び替えが行われ、Bピクチャの双方向フレーム間予測に用いられた2つのフレームのピクチャに後続する順序となる。
【0012】
例えば、図5のフレームF1からIピクチャI1が生成され、このフレームF1(I1)とフレームF4との差分からPピクチャP4が生成されている場合、フレームF1の直後のフレームF2のBピクチャB2、およびそのフレームF2の直後のフレームF3のBピクチャB3は、フレームF1(I1)とフレームF4(P4)とからそれぞれ生成される。
このとき、圧縮データでは、処理順序を考慮して、IピクチャI1の直後にPピクチャP4が配置され、その後にBピクチャB2,B3が配置される。
【0013】
このようにして生成された各ピクチャは、図6のデータ階層構造に従って出力される。
各GOPには、それぞれの管理情報が格納されたシーケンスヘッダSHがその先頭に付加され、再生順に並べられる。
各GOPは、時間情報圧縮処理で生成された各ピクチャに、その管理情報が格納されたGOPヘッダHDR1が付加されて構成されている。
また、各ピクチャは、そのピクチャの管理情報が格納されたピクチャヘッダHDR2が付加されるとともに、必要に応じてユーザデータが付加されて構成されている。
【0014】
また、MPEG2の規格では、スケーラビリティと呼ばれる機能で、2種類の解像度の動画を並列的に伝送する方法が規定されている。これは、前述したMPEGの画像圧縮技術で生成した、例えば360×240画素からなる低解像度の動画の各画像ごとに、この低解像度の動画より高解像度の、例えば720×480画素からなる動画の各画像との差分画像からなる差分動画像を生成し、その低解像度動画と差分動画像とを並列的に伝送することにより、受信側で低解像度動画と差分動画像とを用いて、高解像度の動画を再生するようにしている。
【0015】
なお、出願人は、本明細書に記載した先行技術文献情報で特定される先行技術文献以外には、本発明に関連する先行技術文献を出願時までに発見するには至らなかった。
【非特許文献1】
藤原 洋 監修、「画像&音声圧縮技術のすべて」、CQ出版株式会社、2002年5月15日、第5版発行、p22〜33、p34〜60。
【0016】
【発明が解決しようとする課題】
このような画像処理技術を用いて生成された低解像度の動画像から、その動画像に含まれる任意の被写体をより高解像度の画像として抽出したいという要求がある。
例えば、撮影した動画像の任意のフレームを印刷して保存しておきたい場合も、印刷に耐えうるような動画像より高解像度の画像が必要となる。また、監視カメラで撮影された動画像の内容を詳細に確認したい場合、動画像の低解像度より高解像度の画像が必要となる。
【0017】
しかしながら、前述したMPEGなどの従来の画像処理技術では、予め設定された低解像度、例えば標準テレビジョン画像である720×480画素の解像度にしたがってすべてのフレームを処理するため、得られた動画像から当初の低解像度より高解像度(例えば、1920×1080画素)の画像を生成できないという問題点があった。
また、前述したスケーラビリティを用いて高解像度の動画を伝送する方式では、低解像度動画の各画像、すなわちIピクチャ、PピクチャおよびBピクチャごとに生成したこれら各ピクチャと同数(1:1)の差分画像を差分動画像として伝送するため、ある程度の解像度の画像を伝送できるものの、通常の伝送帯域では、1つの差分画像のデータサイズが制限されてしまい、前述した要求を満足しうる高解像度の画像を伝送できないという問題点があった。また高解像度の画像を伝送するためには広い帯域の伝送路を必要とするため、高解像度の画像を伝送する効率が悪いという問題点があった
【0018】
また、従来の画像処理装置を大幅に改良したり、MPEG規格を変更すれば、高解像度の画像を動画像に挿入することも可能である。しかし、そのような仕様の大幅変更は、現行の画像再生装置と互換性がなくなるため、高解像度の画像が挿入された動画像は、専用の装置でのみ再生でき、現行の装置では再生できなくなる。
本発明は、高解像度の画像を含む動画像圧縮データを生成でき、またこれを再生でき、さらには従来の動画像圧縮データとの互換性を保つことができる画像処理方法および装置を提供することを目的としている。
【0019】
【課題を解決するための手段】
このような目的を達成するために、本発明にかかる画像処理方法は、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理方法であって、各フレームのうちIピクチャの元となるフレームについてのみ、当該フレームを構成する高解像度の画像データとその画像データに基づき生成されたその高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する第1のステップと、Iピクチャに対応する圧縮データに差分圧縮データを付加して出力する第2のステップとを備えるものである。
【0020】
このとき、第1のステップとして、DCT処理および量子化で得られた画像データから復元画像データを生成するステップを実行してもよい。
また、第1のステップとして、復元画像データの画素数を調整することにより高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、高解像度の画像データと調整画像データとの差分画像データを生成するステップと、この差分画像データをDCT処理および量子化した後に可変長符号化することにより差分圧縮データを生成するステップとを実行してもよい。
【0021】
また、本発明にかかる他の画像処理方法は、入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより復元画像データを生成する画像処理方法であって、動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを分離して出力する第1のステップと、差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応するIピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる、低解像度より高い高解像度の静止画像データを生成する第2のステップとを備えるものである。
【0022】
このとき、第2のステップとして、差分圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより元の差分画像データを生成するステップと、差分圧縮データに対応する復元画像データの画素数を調整することにより、その復元画像データの元となる高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、差分画像データと調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成するステップとを実行するようにしてもよい。
【0023】
また、本発明にかかる画像処理装置は、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理装置であって、各フレームのうちIピクチャの元となるフレームについてのみ、当該フレームを構成する高解像度の画像データとその画像データに基づき生成されたその高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する差分画像圧縮部と、Iピクチャに対応する圧縮データに差分圧縮データを付加して出力する多重化符号化部とを備えるものである。
【0024】
このとき、DCT処理および量子化で得られた画像データから復元画像データを生成する動画像圧縮部をさらに設けてもよい。
また、差分画像圧縮部に、復元画像データの画素数を調整することにより高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラ手段と、高解像度の画像データと調整画像データとの差分画像データを生成する減算手段と、この減算器で生成された差分画像データに対してDCT処理を行うDCT変換手段と、このDCT処理手段でDCT変換された差分画像データに対して量子化を行う量子化手段と、この量子化手段で量子化された差分画像データを可変長符号化することにより差分圧縮データを生成する可変長符号化手段を設けてもよい。
【0025】
また、本発明にかかる他の画像処理装置は、入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより復元画像データを生成する画像処理装置であって、動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを分離して出力する多重化復号部と、差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応するIピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成する静止画像再生部とを備えるものである。
【0026】
このとき、静止画像再生部に、差分圧縮データを可変長符号で復号する可変長符号復号手段と、この可変長符号復号手段で復号された差分圧縮データを逆量子化する逆量子化手段と、この逆量子化手段で逆量子化された差分圧縮データを逆DCT処理することにより元の差分画像データを生成する逆DCT変換手段と、差分圧縮データに対応する復元画像データの画素数を調整することにより、その復元画像データの元となる、その低解像度より高い高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラと、差分画像データと調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成する加算手段とを設けてもよい。
【0027】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の第1の実施の形態にかかる画像処理装置の構成を示すブロック図である。
本実施の形態にかかる画像処理装置は、動画像の圧縮処理に用いられる装置であり、入力された高解像度の画像データより低い低解像度の動画像データをMPEG規格に基づき生成する際、その動画像データを構成する低解像度の画像データと、元の高解像度の画像データとの差分画像データを求め、その差分画像データを動画像データへ付加することにより、動画像データの再生時に、動画像データを構成する低解像度の画像データと、その動画像データに付加されている差分画像データとから高解像度の画像データを再生できるようにしたものである。
【0028】
この画像処理装置は、前述した画像処理装置(図4参照)の圧縮処理100で用いる構成と同様に、情報源符号化器、多重符号化器、および送信バッファを有している。
特に、前述した図4の情報源符号化器111に相当する構成として、入力された高解像度の画像データ1Aを低解像度の画像データへ変換して圧縮処理することにより圧縮データ1Bを生成する動画像圧縮部10と、画像データ1Aと低解像度の画像データとの差分画像データを圧縮して差分圧縮データ1Cを生成する差分画像圧縮部20とを有する情報源符号化器1を備えている。
【0029】
また、前述した図4の多重化符号化器112に相当する構成として、差分圧縮データ1Cを、これに対応する圧縮データ1Bへ付加し、動画像圧縮データ2Aとして出力する多重化符号化器2を備えている。
この画像処理装置に入力される高解像度の画像データ1Aは、情報源符号化器1の動画像圧縮部10および差分画像圧縮部20で行われる画像圧縮処理において、1フレーム分の画像を複数に分割した所定画素数の画素ブロックを単位として実行される。
【0030】
これらブロックの元のフレームには、前段の処理(図示せず)で、当該フレームをMPEG規格のどのピクチャ種別(Iピクチャ、PピクチャおよびBピクチャ)で圧縮処理するか予め割り当てられているものとする。
動画像圧縮部10では、当該フレームのピクチャ種別に応じて各部を制御し、画素ブロックごとに当該ピクチャ種別の圧縮データ1Bを順次生成し、差分画像圧縮部20では、Iピクチャが対応付けられたフレームでのみ各部を制御して、そのブロックの差分圧縮データ1Cを順次生成する。なお、Iピクチャについてのみ差分画像データ1Cを生成する理由は、他のピクチャに比較して元の高解像度画像の情報を最も多く含んでおり、このIピクチャを対象とすることにより高い精度で高解像度の画像を再生できるからである。
【0031】
情報源符号化器1の動画像圧縮部10には、ダウンサンプラ11、減算器12、DCT変換器13、量子化器14、可変長符号化器15、逆量子化器16、逆DCT変換器17、加算器18、および動き予測器19が設けられている。
ダウンサンプラ11は、入力された高解像度、例えば、1920×1080画素の画像データ1A(HDI)をそれより低い低解像度、例えば標準テレビジョン画像である720×480画素の解像度の画像データに変換する。
減算器12は、ダウンサンプラ11から出力された低解像度の画像データのうち、所定ピクチャ種別(PピクチャおよびBピクチャ)の画像データ1Aについてのみ動き予測器19からの予測分画像データとの差分を算出する。
【0032】
DCT変換器13は、減算器12からの低解像度の画像データをDCT処理して出力する。量子化器14は、DCT処理された画像データを所定の量子化テーブルに基づき量子化して出力する。
可変長符号化器15は、量子化器14からの画像データ14Aを可変長で符号化し圧縮データ1Bとして出力する。
逆量子化器16は、量子化器14からの画像データ14Aを逆量子化して出力する。逆DCT変換器17は逆量子化器16からのデータを逆DCT処理し、元の低解像度の復元画像データ17A(SDI)を出力する。
【0033】
加算器18は、所定ピクチャ種別(PピクチャおよびBピクチャ)に応じて逆DCT変換器17からの復元画像データ17Aと、動き予測器19で予測された予測分画像データとを加算して出力する。
動き予測器19は、加算器18から出力された画像データを元にして、その画像データに含まれる被写体の動きを予測し、元の画像データに対する予測分画像データを生成する。
なお、動画像圧縮部10の構成については、一般的な画像圧縮処理に用いる構成と同様である。また、DCT処理および量子化、逆DCT処理および逆量子化、可変長符号化器についても、一般的な処理と同様であり、ここでの詳細な説明は省略する。
【0034】
情報源符号化器1の差分画像圧縮部20には、メモリ21、アップサンプラ22、減算器23、DCT変換器24、量子化器25、および可変長符号化器26が設けられている。
メモリ21は、動画動圧縮部10に入力されたものと同じ高解像度の画像データ1Aを一時的に保持する。アップサンプラ22は、動画像圧縮部10の逆DCT変換器17で得られた低解像度の復元画像データ17Aを、高解像度の画像データ1Aと同じ画素数の調整画像データ22A(SDI’)へ変換して出力する。
【0035】
減算器23は、メモリ21内の画像データ(HDI)とアップサンプラ22からの調整画像データ22Aとの差分からなる差分画像データ23A(ΔHDI)を生成する。
DCT変換器24は、減算器23からの差分画像データ23AをDCT処理して出力する。量子化器25はDCT処理された差分画像データを量子化して出力する。可変長符号化器26は量子化された差分画像データを可変長で符号化し差分圧縮データ1C(Q)として出力する。
【0036】
このようにして、情報源符号化器1の動画像圧縮部10では、当該フレームに予め対応付けられているピクチャ種別に応じて各部を制御することにより、圧縮処理した低解像度の画像データからなる圧縮データ1Bを生成する。
また、差分画像圧縮部20でも、当該フレームに予め対応付けられているピクチャ種別がIピクチャの場合に各部を制御することにより、そのフレームの画像データに関する差分画像データからなる差分圧縮データ1Cを生成する。
【0037】
多重化符号化器2は、動画像圧縮部10で生成された低解像度の画像データからなる圧縮データ1Bと、差分画像圧縮部20で生成された差分画像データからなる差分圧縮データ1Cとから、前述の図6で説明したMPEG規格のデータ階層構造に基づき、高解像度の画像を含む所望の動画像圧縮データ2Aを生成する。
ここでは、各フレームの圧縮データ1Bをピクチャデータとし、そのフレームのピクチャ種別に応じて、Iピクチャ、PピクチャおよびBピクチャのピクチャレイヤを構成する。また、Iピクチャについては、差分圧縮データ1Cをユーザデータとして上記Iピクチャデータに付加する。
【0038】
次に、図1を参照して、第1の実施の形態にかかる画像圧縮装置の動作について説明する。
入力された高解像度(例えば、1920×1080画素)の画像データ1Aは、ダウンサンプラ11で低解像度(例えば、720×480画素)の画像データへ変換され、減算器12へ出力される。このとき、Iピクチャの画像データの場合には、ダウンサンプラ11からの画像データがそのままDCT変換器13へ渡される。また、PピクチャおよびBピクチャについては、減算器12および動き予測器19が制御されて、ダウンサンプラ11からの画像データにフレーム間予測および動き補償が適用されてDCT変換器13へ渡される。
【0039】
そして、DCT変換器13および量子化器14で、画像データの圧縮処理が行われる。
一般に、圧縮処理対象となる画像について、隣の画素の色との相関関係によって空間周波数を定義することができる。すなわち、絵柄が粗くてゆっくりと色合いが変化する画像は、隣の画素との相関関係が高く隣の画素の色を類推しやすいので、空間周波数が低いと定義される。逆に、絵柄が細かく色合いが急に変化する画像は、隣の画素との相関関係が低く隣の画素の色を類推しにくいので、空間周波数が高いと定義される。なお、空間周波数は、量子化による画素値の丸めに関係する。
【0040】
低解像度へ変換された画像データは、DCT変換器13でDCT処理され、得られた係数行列(画像データ)が量子化器14で所定の除数(量子化ステップ)で割り算されて、余りが丸められることにより量子化され、そのデータ量が圧縮される。この際、DCT処理された係数行列は、行列の左上側の低周波項だけに値が残り、右下側の高周波項はゼロとなる。
本実施の形態は、この高周波項に相当する周波数成分を含む差分画像データを、フレーム内符号化画像すなわちIピクチャの元となる高解像度の画像データから生成し、これをユーザデータとしてIピクチャデータに付加して動画像圧縮データを生成することにより、Iピクチャの再生時に、そのIピクチャに含まれている低周波成分と差分画像データに含まれている高周波成分とを合成して、より高解像度の静止画像データを生成できるようにしたものである。
【0041】
すなわち、入力された高解像度の画像データHDI(1A)を、DCT処理および量子化して圧縮した際に得られた画像データ14Aを、逆量子化器16で逆量子化するとともに逆DCT変換器17で逆DCT処理して、低解像度の復元画像データSDI(17A)に戻す。
さらに、この復元画像データSDIをアップサンプラ9で画素数を調整して、高解像度の画像データHDIと同じ画素数を有する調整画像データSDI’(22A)へ戻す。このとき、SDI’は既にダウンサンプラ11および量子化器14を通しているので、元の高解像度の画像データHDIよりもぼけた画像になる。
【0042】
図2は、ダウンサンプラで用いるフィルタと画像データの空間周波数に関する周波数特性例であり、横軸は空間周波数を規格化した周波数、縦軸は減衰度を示している。
ダウンサンプラ11では、画素数を減らすために元の画像データに対して低域通過フィルタを適用し、画素数削減の比率に応じて余分な画素を抜き出している。図2に示したフィルタの周波数特性は、画素数を1/2にダウンサンプルする例であり、この特性曲線60は単純な3角形フィルタ(Z変換式=0.25+0.5Z(-1)+0.25Z(-2))の特性である。
【0043】
高解像度の元の画像データから、このような特性のフィルタを適用して得られた低解像度の画像データを、元の画像データの画素数に合わせて減算すると、元の画像データからボケ画像データを引算することになる。
これにより、フィルタで削減された高周波成分の画像データが得られ、その画像データの周波数特性は特性曲線61のようになる。特性曲線60,61が交差する周波数62は遮断周波数であり、元の画像データのナイキスト周波数(0.5)の半分(0.25)に相当する。
【0044】
減算器23では、アップサンプラ22で生成されたSDI’とメモリ21からのHDIとの差分画像データΔHDIを生成する。
したがって、差分画像圧縮部20で、ΔHDI=HDI−SDI’により差分画像データを求めることは、前述のように元画像データからボケ画像データを引算することになり、ΔHDIは高域成分のみの画像となる。
ここで、HDIをSDIの画素数に変換するときに使用した低域フィルタの遮断周波数をf1、元の画像データの最高周波数をfhとすると、このΔHDIはf1〜fhの間の周波数成分を含み、逆に直流〜f1の低域成分は含まないことが判る。
【0045】
差分画像圧縮部20では、この差分画像データΔHDIをDCT変換器24、量子化器25および可変長符号化器26で圧縮し、差分圧縮データQを生成する。
この差分圧縮データQは、多重化符号化器2で、I,P,Bの各ピクチャデータとは別のユーザ定義領域に格納される。このユーザ定義領域は、MPEG規格において拡張領域として規定化されており、ユーザが定義する任意のユーザデータを格納することができる。
【0046】
このように、本実施の形態にかかる画像処理方法および装置では、入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを生成し、これら圧縮データを動画像圧縮データとして出力する場合、各フレームのうちIピクチャの元となるフレームについてのみ、その圧縮データの生成過程で得られる低解像度の画像データとその元となる高解像度の画像データとの差分を圧縮処理することにより差分圧縮データを生成し、Iピクチャに対応する圧縮データにその差分圧縮データを付加し、動画像圧縮データとして出力するようにしたので、高解像度の画像を含む動画像圧縮データを生成できる。
したがって、動画像圧縮データの各圧縮データを再生する際、その圧縮データから再生された復元画像データと、差分圧縮データから再生された差分画像データとを合成することにより、元の画像データとほぼ等しい高解像度の画像データを得ることができる。
【0047】
このとき、Iピクチャの元となるフレームについてのみ、高解像度の画像データとの差分画像データを生成して出力するようにしたので、MPEG2のスケーラビリティ機能のように、すべてのピクチャに対して差分画像を生成して伝送する場合と比較して、Iピクチャに対する差分画像データに対してより多くの伝送帯域を割り当てることが可能となる。
したがって、Iピクチャに対する差分画像データとしてより大きなデータサイズの差分画像データを伝送することができ、広い帯域の伝送路を必要とすることなく、より高解像度の画像を伝送することが可能となる。
【0048】
また、復元画像データについては、圧縮データの生成過程で得られる低解像度の画像データであればよく、例えばDCT変換器13へ入力される画像データでもよい。
これについて、本実施の形態では、圧縮データの生成過程でDCT処理および量子化された画像データから、その画像データの元の低解像度の復元画像データを生成するようにした。
したがって、圧縮データを再生した際に得られる復元画像データと等しい復元画像データとの差分画像データを得ることができ、DCT処理および量子化による圧縮処理で生じる誤差が低減されて、元の高解像度の画像データにさらに近い画像データを生成できる。
【0049】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加するようにしたので、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0050】
次に、図3を参照して、本発明の第2の実施の形態にかかる画像処理装置について説明する。
本実施の形態にかかる画像処理装置は、動画像圧縮データの再生処理に用いられる装置であり、入力された動画像圧縮データに含まれる各圧縮データから低解像度の動画像データをMPEG規格に基づき再生して出力する際、動画像データを構成する低解像度の画像データと、その動画像データの圧縮データに付加されている差分画像データとから高解像度の画像データを再生するようにしたものである。
【0051】
この画像処理装置は、前述した画像処理装置(図4参照)の再生処理101で用いる構成と同様に、受信バッファ、多重化復号器、および情報源復号器を有している。
特に、前述した画像処理装置(図4参照)の多重化復号器115に相当する構成として、第1の実施の形態にかかる画像処理装置1で生成された動画像圧縮データ2Aと等しい動画像圧縮データ5Aから、MPEGの各ピクチャに対応する圧縮データ5Bと、その圧縮データ5BのうちIピクチャのものに付加されている差分圧縮データ5C(Q”)とを分離して出力する多重化復号器5を備えている。
【0052】
また、情報源復号器116に相当する構成として、多重化復号器5からの圧縮データ5Bを再生して低解像度の画像データ6Aからなる動画像を生成する動画像再生部40と、多重化復号器5からの差分圧縮データ5Cを再生して得られた差分画像データと動画像再生部40で圧縮データ5Bから得られた低解像度の復元画像データとを合成して、高解像度の静止画像データ6Bを生成する静止画像再生部50とを有する情報源復号器6を備えている。
【0053】
多重化符号化器2は、入力された動画像圧縮データ5Aから、前述の図6に示したMPEG規格の階層構造に基づき、各ピクチャのピクチャデータを圧縮データ5Bとして抽出するとともに、Iピクチャのユーザ定義領域に付加されているユーザデータを差分圧縮データとして分離する。
【0054】
情報源復号器6の動画像再生部40には、可変長符号復号器41、逆量子化器42、逆DCT変換器43、加算器44、および動き補償器45が設けられている。
可変長符号復号器41は、入力された圧縮データ5Bを可変長符号で復号して出力する。逆量子化器42は、可変長符号復号器41で復号された圧縮データを所定の量子化テーブルに基づき逆量子化して出力する。
逆DCT変換器43は、逆量子化器42で逆量子化された圧縮データを逆DCT処理し、低解像度の復元画像データ43Aを出力する。
【0055】
加算器44は、ピクチャ種別に応じて逆DCT変換器43からの復元画像データ43Aと動き補償器45からの画像データとを加算し、所望の動画像を構成する低解像度の画像データ6Aとして出力する。
なお、動画像再生部40の構成については、一般的な画像再生処理に用いる構成と同様である。また、DCT処理および量子化、逆DCT処理および逆量子化および可変長符号復号部は、一般的な処理と同様であり、ここでの詳細な説明は省略する。
【0056】
情報源復号器6の静止画像再生部50には、メモリ51、可変長符号復号器52、逆量子化器53、逆DCT変換器54、アップサンプラ55、および加算器56が設けられている。
メモリ51は、多重化復号器5からの差分圧縮データ5C(Q”)を一時保存する。可変長符号復号器52は、メモリ51からの差分圧縮データ5Cを可変長符号で復号して出力する。
逆量子化器53は、可変長符号復号器52で復号された差分圧縮データを所定の量子化テーブルに基づき逆量子化して出力する。逆DCT変換器54は、逆量子化器53で逆量子化された差分圧縮データを逆DCT処理し、差分画像データ54A(ΔHDI”)を出力する。
【0057】
アップサンプラ55は、動画像再生部40の逆DCT変換器43で生成された低解像度の復元画像データ43Aを、所定の高解像度の画像データと同じ画素数の調整画像データ55A(SDI”)へ変換して出力する。
加算器56は、逆DCT変換器54からの差分画像データ54A(ΔHDI”)と、アップサンプラ55からの調整画像データ55A(SDI”)とを合成することにより、高解像度の静止画像データ6Bを生成する。
【0058】
次に、図3を参照して、第2の実施の形態にかかる画像処理装置の動作について説明する。
動画像再生部40では、各圧縮データ5Bが、可変長符号復号器41、逆量子化器42および逆DCT変換器43で処理されて低解像度(例えば、720×480画素)の復元画像データ43Aが生成される。
【0059】
そして、Iピクチャの画像データについては、その復元画像データ43Aがそのまま画像データ6Aとして出力され、PピクチャおよびBピクチャについては、加算器44および動き補償器45が制御されて、フレーム間予測および動き補償により画像データ6Aが生成されて出力される。
また、静止画像再生部50では、差分圧縮データ5C(Q”)に対応するIピクチャの復元画像データ43Aを動画像再生部40から取り込み、所望する高解像度(例えば、1920×1080画素)の静止画像データ6Bを生成している。
【0060】
前述の第1の実施の形態では、入力された高解像度の画像データ(HDI)と動画像データを構成する低解像度の画像データ(SDI’)との差分から差分画像データ(ΔHDI’)を生成する処理が行われる。
本実施の形態では、上記処理とは全く逆の処理、すなわち、入力された動画像圧縮データから再生された低解像度の画像データSDI”と差分画像データΔHDI”とを合成して高解像度の画像データHDI”を生成する、HDI”=SDI”+ΔHDI”という処理を行って、高解像度の静止画像データを生成している。
【0061】
実際には、動画像再生部40で得られた低解像度の復元画像データ43Aを、アップサンプラ55で高解像度の画素数に変換し、得られた調整画像データをSDI”として用いている。この調整画像データSDI”は、情報源符号化器1(図1参照)のアップサンプラ22で生成される調整画像データSDI’(22A)に相当する。また、差分画像データΔHDI”は、減算器23で得られる差分画像データΔHDI’に相当する。
したがって、加算器56では、減算器23での差分画像生成処理と全く逆の処理が行われ、減算器23に入力されている高解像度の画像データHDI(21A)に相当する高解像度の画像データHDI”が生成される。
【0062】
このように、本実施の形態にかかる画像処理方法および装置では、MPEG規格に基づき生成された動画像圧縮データから、各ピクチャに対応する圧縮データと、その圧縮データのうちIピクチャに付加されている差分圧縮データとを多重化復号器で分離するようにしたものである。
そして、その差分圧縮データから元の差分画像データを生成して、その差分画像データと圧縮データから得られた復元画像データのうち対応するIピクチャから得られた復元画像データとを静止画像再生部で合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成するようにしたので、差分画像データを含む動画像圧縮データから高解像度の静止画像を生成できる。
【0063】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加されているため、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0064】
以上の各実施の形態では、MPEG規格のIピクチャに同期して差分画像データを生成する場合を例として説明した。一般的な720×480画素の標準テレビジョン画像をMPEGで圧縮する場合では、0.5秒(15枚)程度のフレームをグループ化したGOP(Group of Picture)を時間情報圧縮処理の処理単位としている。これにより、少なくとも1GOPに1つのIピクチャが存在することから、15枚程度に1枚の割合で高解像度の静止画像を再生することが可能となる。
【0065】
したがって、動画像再生時の制御として、動画再生中に利用者から一時停止が指示された場合、再生停止した動画像の画像データに最も近い時間位置にある、高解像度の静止画像データを画面出力するようにしてもよい。
これにより、所望の画面とほぼ等しい高解像度の画像を容易に表示することができ、例えば、撮影した動画像の任意のフレームを印刷して保存しておきたい場合には、その画面表示された高解像度の画像を印刷すればよく、低解像度の動画像を印刷する場合と比較して美しい印刷結果が得られる。
【0066】
また、監視カメラなどで撮影された動画像の内容を詳細に確認したい場合には、画面表示された高解像度の画像を拡大して、その内容を詳細に確認することもでき、低解像度の動画像で確認する場合と比較して、より詳細に内容を確認できる。
なお、各Iピクチャごとに差分画像データを付加する必要はなく、任意のIピクチャにのみ差分画像データを付加して動画像圧縮データを生成してもよい。これにより、不要な差分画像データが削減され、差分画像データにより動画像圧縮データのデータ量の増加を抑制できる。
【0067】
【発明の効果】
以上説明したように、本発明は、入力された高解像度の画像データを圧縮して得られた圧縮データを動画像圧縮データとして出力する場合、各フレームのうちIピクチャの元となるフレームについてのみ、その圧縮データの生成過程で得られる、その高解像度より低い低解像度の復元画像データとその元となる高解像度の画像データとの差分を圧縮処理することにより差分圧縮データを生成し、Iピクチャに対応する圧縮データにその差分圧縮データを付加し、動画像圧縮データとして出力するようにしたので、高解像度の画像を含む動画像圧縮データを生成できる。
したがって、動画像圧縮データの各圧縮データを再生する際、その圧縮データから再生された復元画像データと、差分圧縮データから再生された差分画像データとを合成することにより、元の画像データとほぼ等しい高解像度の画像データを得ることができる。
【0068】
このとき、所望の画像の全画素が圧縮されるIピクチャの元となるフレームについてのみ、高解像度の画像データとの差分画像データを生成して出力するようにしたので、MPEG2のスケーラビリティ機能のように、すべてのピクチャに対して差分画像を生成して伝送する場合と比較して、Iピクチャに対する差分画像データに対してより多くの伝送帯域を割り当てることが可能となる。
したがって、Iピクチャに対する差分画像データとしてより大きなデータサイズの差分画像データを伝送することができ、広い帯域の伝送路を必要とすることなく、より高解像度の画像を伝送することが可能となる。
【0069】
また、MPEG規格に基づき定義されているIピクチャのユーザ定義領域を利用して、圧縮データのユーザデータとして差分圧縮データを付加するようにしたので、本実施の形態の画像処理方法に対応した画像処理装置であれば、上記のようにして高解像度の静止画像データを再生でき、未対応であれば、ユーザデータが無視されて支障なく動画像が再生される。したがって、従来の動画像圧縮データとの互換性を保つことができる。
【0070】
また、MPEG規格に基づき生成された動画像圧縮データから各ピクチャに対応する圧縮データと、その圧縮データのいずれかに付加されている差分圧縮データとを多重化復号器で分離し、その差分圧縮データから元の差分画像データを生成して、その差分画像データとこれに対応する復元画像データとを静止画像再生部で合成することにより、当該復元画像データの元となる、その低解像度より高い高解像度の静止画像データを生成するようにしたので、差分画像データを含む動画像圧縮データから高解像度の静止画像を生成できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態にかかる画像処理(動画像圧縮)装置の構成を示すブロック図である。
【図2】ダウンサンプラで用いるフィルタと画像データの空間周波数に関する周波数特性例である。
【図3】本発明の第2の実施の形態にかかる画像処理(動画像再生)装置の構成を示すブロック図である。
【図4】一般的な動画像圧縮/再生処理を示す説明図である。
【図5】MPEGのフレーム間予測処理例である。
【図6】はMPEGのデータ階層構造を示す説明図である。
【符号の説明】
1…情報源符号化器、1A…画像データ(高解像度)、1B…圧縮データ(低解像度)、1C…差分圧縮データ、10…動画像圧縮部、11…ダウンサンプラ、12…減算器、13…DCT変換器、14…量子化器、14A…画像データ、15…可変長符号化器、16…逆量子化器、17…逆DCT変換器、17A…復元画像データ(低解像度)、18…加算器、19…動き予測器、20…差分画像圧縮部、21…メモリ、21A…画像データ(高解像度)、22…アップサンプラ、22A…調整画像データ、23…減算器、23A…差分画像データ、24…DCT変換器、25…量子化器、26…可変長符号化器、2…多重化符号化器、2A…動画像圧縮データ、5…多重化復号器、5A…動画像圧縮データ、5B…圧縮データ、5C…差分圧縮データ、6…情報源復号器、6A…画像データ(低解像度)、6B…静止画像データ(高解像度)、40…動画像再生部、41…可変長符号復号器、42…逆量子化器、43…逆DCT変換器、43A…復元画像データ(低解像度)、44…加算器、45…動き補償器、50…静止画像再生部、51…メモリ、52…可変長符号復号器、53…逆量子化器、54…逆DCT変換器、55…アップサンプラ、55A…調整画像データ、56…加算器。
Claims (10)
- 入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、前記各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理方法であって、
前記各フレームのうち前記Iピクチャの元となるフレームについてのみ、当該フレームを構成する高解像度の画像データとその画像データに基づき生成された前記高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する第1のステップと、
前記Iピクチャに対応する圧縮データに前記差分圧縮データを付加して出力する第2のステップとを備えることを特徴とする画像処理方法。 - 請求項1に記載の画像処理方法において、
前記第1のステップは、
前記DCT処理および量子化で得られた画像データから前記復元画像データを生成するステップを有することを特徴とする画像処理方法。 - 請求項1に記載の画像処理方法において、
前記第1のステップは、
前記復元画像データの画素数を調整することにより前記高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、
前記高解像度の画像データと前記調整画像データとの差分画像データを生成するステップと、
この差分画像データをDCT処理および量子化した後に可変長符号化することにより差分圧縮データを生成するステップとを有することを特徴とする画像処理方法。 - 入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、前記各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより前記復元画像データを生成する画像処理方法であって、
前記動画像圧縮データから前記各ピクチャに対応する圧縮データと、その圧縮データのうち前記Iピクチャに付加されている差分圧縮データとを分離して出力する第1のステップと、
前記差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応する前記Iピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる、前記低解像度より高い高解像度の静止画像データを生成する第2のステップとを備えることを特徴とする画像処理方法。 - 請求項4に記載の画像処理方法において、
前記第2のステップは、
前記差分圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより元の差分画像データを生成するステップと、
前記差分圧縮データに対応する前記復元画像データの画素数を調整することにより、その復元画像データの元となる高解像度の画像データと等しい画素数を有する調整画像データを生成するステップと、
前記差分画像データと前記調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成するステップとを有することを特徴とする画像処理方法。 - 入力された動画像の各フレームからMPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する圧縮データを順次生成し、これら圧縮データを動画像圧縮データとして出力する際、前記各フレームを構成する高解像度の画像データを、その高解像度より低い低解像度の画像データに変換し、その画像データをDCT処理および量子化した後に可変長符号化することにより、元のフレームよりデータ量の少ない圧縮データを生成する画像処理装置であって、
前記各フレームのうち前記Iピクチャの元となるフレームを構成する前記高解像度の画像データとその画像データに基づき生成された前記高解像度より低い低解像度の復元画像データとの差分を圧縮処理することにより差分圧縮データを生成する差分画像圧縮部と、
前記Iピクチャに対応する圧縮データに前記差分圧縮データを付加して出力する多重化符号化部とを備えることを特徴とする画像処理装置。 - 請求項6に記載の画像処理装置において、
前記DCT処理および量子化で得られた画像データから前記復元画像データを生成する動画像圧縮部をさらに備えることを特徴とする画像処理装置。 - 請求項6に記載の画像処理装置において、
前記差分画像圧縮部は、
前記復元画像データの画素数を調整することにより前記高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラ手段と、
前記高解像度の画像データと前記調整画像データとの差分画像データを生成する減算手段と、
この減算器で生成された差分画像データに対してDCT処理を行うDCT変換手段と、
このDCT処理手段でDCT変換された差分画像データに対して量子化を行う量子化手段と、
この量子化手段で量子化された差分画像データを可変長符号化することにより前記差分圧縮データを生成する可変長符号化手段を有することを特徴とする画像処理装置。 - 入力された動画像圧縮データに含まれる、MPEG規格で定義されたIピクチャ、PピクチャおよびBピクチャに対応する個々の圧縮データから、元の動画像の各フレームを構成する低解像度の復元画像データを順次生成して出力する際、前記各圧縮データを可変長符号復号した後に逆量子化および逆DCT処理することにより前記復元画像データを生成する画像処理装置であって、
前記動画像圧縮データから前記各ピクチャに対応する圧縮データと、その圧縮データのうち前記Iピクチャに付加されている差分圧縮データとを分離して出力する多重化復号部と、
前記差分圧縮データから元の差分画像データを生成し、この差分画像データとこれに対応する前記Iピクチャから得られた復元画像データとを合成することにより、当該復元画像データの元となる、前記低解像度より高い高解像度の静止画像データを生成する静止画像再生部とを備えることを特徴とする画像処理装置。 - 請求項9に記載の画像処理装置において、
前記静止画像再生部は、
前記差分圧縮データを可変長符号で復号する可変長符号復号手段と、
この可変長符号復号手段で復号された差分圧縮データを逆量子化する逆量子化手段と、
この逆量子化手段で逆量子化された差分圧縮データを逆DCT処理することにより元の差分画像データを生成する逆DCT変換手段と、
前記差分圧縮データに対応する前記復元画像データの画素数を調整することにより、その復元画像データの元となる高解像度の画像データと等しい画素数を有する調整画像データを生成するアップサンプラと、
前記差分画像データと前記調整画像データとを合成することにより、当該復元画像データの元となる高解像度の静止画像データを生成する加算手段とを有することを特徴とする画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002363575A JP2004200760A (ja) | 2002-12-16 | 2002-12-16 | 画像処理方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002363575A JP2004200760A (ja) | 2002-12-16 | 2002-12-16 | 画像処理方法および装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004200760A true JP2004200760A (ja) | 2004-07-15 |
Family
ID=32761684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002363575A Pending JP2004200760A (ja) | 2002-12-16 | 2002-12-16 | 画像処理方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004200760A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007274505A (ja) * | 2006-03-31 | 2007-10-18 | Eastman Kodak Co | 撮像装置 |
JP2008136124A (ja) * | 2006-11-29 | 2008-06-12 | Akuseru:Kk | 動画復号化装置、動画復号化方法、圧縮動画データ構造および動画符号化方法 |
US8045611B2 (en) | 2005-03-14 | 2011-10-25 | Qisda Corporation | Video processing and recording apparatuses and methods |
JP2016058994A (ja) * | 2014-09-12 | 2016-04-21 | 株式会社 日立産業制御ソリューションズ | 監視カメラ装置および監視カメラシステム |
CN106162180A (zh) * | 2016-06-30 | 2016-11-23 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
JP2016213612A (ja) * | 2015-05-01 | 2016-12-15 | 日本テレビ放送網株式会社 | 映像信号伝送システム及び映像信号伝送方法 |
CN108076301A (zh) * | 2016-11-11 | 2018-05-25 | 联芯科技有限公司 | VoLTE视频多方电话的视频处理方法和*** |
-
2002
- 2002-12-16 JP JP2002363575A patent/JP2004200760A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8045611B2 (en) | 2005-03-14 | 2011-10-25 | Qisda Corporation | Video processing and recording apparatuses and methods |
JP2007274505A (ja) * | 2006-03-31 | 2007-10-18 | Eastman Kodak Co | 撮像装置 |
JP2008136124A (ja) * | 2006-11-29 | 2008-06-12 | Akuseru:Kk | 動画復号化装置、動画復号化方法、圧縮動画データ構造および動画符号化方法 |
JP2016058994A (ja) * | 2014-09-12 | 2016-04-21 | 株式会社 日立産業制御ソリューションズ | 監視カメラ装置および監視カメラシステム |
JP2016213612A (ja) * | 2015-05-01 | 2016-12-15 | 日本テレビ放送網株式会社 | 映像信号伝送システム及び映像信号伝送方法 |
CN106162180A (zh) * | 2016-06-30 | 2016-11-23 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
US10819994B2 (en) | 2016-06-30 | 2020-10-27 | Beijing Century Technology., Ltd | Image encoding and decoding methods and devices thereof |
CN108076301A (zh) * | 2016-11-11 | 2018-05-25 | 联芯科技有限公司 | VoLTE视频多方电话的视频处理方法和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100714696B1 (ko) | 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치 | |
KR100252108B1 (ko) | Mpeg 압축부호화 및 복호화기를 채용한 디지털 기록 재생장치 및 그 방법 | |
JP3888597B2 (ja) | 動き補償符号化装置、及び動き補償符号化復号化方法 | |
JP4571489B2 (ja) | ビデオ符号化システムにおける量子化器パラメータを表示するための方法および装置 | |
JP4234607B2 (ja) | 画像/ビデオエンコーダおよび/またはデコーダにおける符号化変換係数 | |
JP5257447B2 (ja) | シャッター時間補償 | |
JP3856262B2 (ja) | 動き補償符号化装置、動き補償符号化方法、及び動き補償符号記録媒体 | |
JPH10136386A (ja) | 符号化ビデオ信号処理方式 | |
KR20060135992A (ko) | 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치 | |
KR19990072968A (ko) | 화상신호처리시스템,디코더,화상신호처리방법,및디코딩방법 | |
KR20020026198A (ko) | 비디오 압축 | |
JP4382284B2 (ja) | サブバンドの符号化/復号 | |
JP2007266749A (ja) | 符号化方法 | |
JP2005160084A (ja) | SNR(signaltonoiseratio)スケーラビリティを実現するための動映像処理装置及びその方法 | |
JPH08336142A (ja) | 画像信号圧縮符号化装置および伸長再生装置 | |
JP2000511722A (ja) | 信号のビットレートの変更に関する改良 | |
JP2004200760A (ja) | 画像処理方法および装置 | |
JP3703088B2 (ja) | 拡張画像符号化装置及び拡張画像復号化装置 | |
JP3166501B2 (ja) | 画像再圧縮方法及び画像再圧縮装置 | |
KR100533025B1 (ko) | 동영상 데이터의 분할장치 및 방법 | |
JP4422629B2 (ja) | 動画像符号化装置、復号化装置、動画像記録装置および動画像再生装置 | |
JP3687458B2 (ja) | 圧縮復号化方法及び圧縮復号化装置 | |
JP2007235299A (ja) | 画像符号化方法 | |
JP4193252B2 (ja) | 信号処理装置及び方法、信号復号装置、並びに信号符号化装置 | |
KR0160621B1 (ko) | 영상 압축 및 신장방법과 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081014 |