JP5238891B2 - ディジタル画像を処理するための方法および画像表現形式 - Google Patents

ディジタル画像を処理するための方法および画像表現形式 Download PDF

Info

Publication number
JP5238891B2
JP5238891B2 JP2012007115A JP2012007115A JP5238891B2 JP 5238891 B2 JP5238891 B2 JP 5238891B2 JP 2012007115 A JP2012007115 A JP 2012007115A JP 2012007115 A JP2012007115 A JP 2012007115A JP 5238891 B2 JP5238891 B2 JP 5238891B2
Authority
JP
Japan
Prior art keywords
image
coefficients
bitstream
bits
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012007115A
Other languages
English (en)
Other versions
JP2012110016A (ja
Inventor
ヨハン、ステン
サミ、ニエミ
カール‐アンダース、ヨハンソン
Original Assignee
モービル イメージング イン スウェーデン アー・ベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303085A external-priority patent/SE0303085D0/xx
Priority claimed from SE0303204A external-priority patent/SE0303204D0/xx
Application filed by モービル イメージング イン スウェーデン アー・ベー filed Critical モービル イメージング イン スウェーデン アー・ベー
Publication of JP2012110016A publication Critical patent/JP2012110016A/ja
Application granted granted Critical
Publication of JP5238891B2 publication Critical patent/JP5238891B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

本発明は、ディジタル画像を処理する方法に関し、また、ディジタル画像を表示するための画像表現形式に関する。本発明は、さらに、生画像データを圧縮ディジタル画像表現に符号化するための方法、および、JPEG圧縮ディジタル画像を解析する方法に関する。
今日の社会においては、膨大な量の情報が、毎日、生成されている。多くの情報は、画像の形で提供されている。さらに、大部分の情報は、例えばインターネット上で電子的に記憶および提供される。一方、インターネットへの無線接続の利用が、増加しており、この場合、データ転送速度は、比較的に低い。したがって、情報をきわめて小さくまとめた形で提供することが必要である。これは、画像の場合、とりわけ重要なことである。なぜなら、画素のアレイとして記憶された通常のディジタル画像は、きわめて大きなデータセットとして表現されるからである。
さらに、カメラを内蔵した携帯電話は、益々、普及しつつある。したがって、携帯電話は、ディジタル画像を処理することができなければならない。画像を処理する携帯電話またはその他のハンドヘルド装置は、限られたメモリ空間および限られた処理能力しか持たない。したがって、画像処理が、そのような装置上で実行されなければならない場合、メモリ空間および処理能力をあまり必要としないように、ディジタル画像は、効率的かつ理知的に記憶されなければならない。
これらの理由から、画像を圧縮することに大きな関心が持たれている。画像を圧縮する一般的な方法は、JPEG(Joint Photographic Experts Group)標準である。JPEG標準は、CCITT勧告T.81に定義されている。
しかしながら、明確にしておくために、JPEG標準に基づいた画像ファイル形式について、以下に簡単に説明する。
JPEG標準は、非可逆ベースライン符号化方式を定義しており、その非可逆ベースライン符号化方式は、DCT変換、および、より少ない量のデータに変換された画像を提供するための拡張符号化方式に基づくものである。ディジタル画像をJPEGファイル形式に変換する場合、画像のDCT変換および量子化がなされ、画像の色空間モデルのそれぞれの成分は、個々にDCT変換される。すべての色成分は、ブロックとして表現され、それらのブロックは、順々に処理される。DCT変換されたブロックは、画像の認識にあまり影響を及ぼすことのない情報の基底関数を廃棄するために、しきい値処理され、かつ、量子化される。各ブロックに含まれる各成分の0次係数(DC係数)は、ハフマン符号化を用いて、先行するDC係数との差分として記憶される。より高い高次係数(AC係数)が、連続的に配列され、そのシーケンスは、ジグザグ順序によってアレイから得られる。
AC係数は、ゼロランレングス符号化され、さらに、ハフマン符号化によって符号化される。
JPEGファイル形式は、ディジタル画像の記憶容量を相当に減少させる標準的な圧縮を生成するために開発されたものである。したがって、JPEGファイル形式は、画像の操作に適したものではない。ディジタル画像を処理したい場合、ディジタル画像を空間領域表現に逆変換することが最も都合が良い。しかしながら、携帯電話のような小さな記憶空間しか有していない装置で画像を処理する場合、空間領域において表現された大きな記憶容量を必要とするディジタル画像は、処理することができないことがある。
欧州特許第1037165号は、JPEG形式で記憶されたディジタル画像を操作するための方法を説明している。JPEG画像のビットストリームは、ビットストリーム内における画像領域の位置を識別するために、プレスキャンされる。これらの位置の中で指定されたものは、容易にアクセスするために、プレスキャンテーブルに記憶され、それによって、画像の一部分を操作しなければならないとき、全ビットストリームを復号化することを必要とせずに、選択された画像領域にアクセスすることができる。しかしながら、それにもかかわらず、メモリをあまり必要とせずに、画像処理の速度をさらに増加させる必要がある。
発明が解決するための手段
本発明の目的は、容易に解析および/または操作することのできる圧縮画像を提供することである。本発明のさらなる目的は、いくつかのディジタル画像をつなぎ合わせて(stitch)容易に圧縮画像表現形式にすることを可能にすることである。
本発明のこれらのおよびその他の目的は、本発明の第1の形態によれば、ディジタル画像を処理する方法によって達成される。この方法は、
ディジタル画像を圧縮された形式で提供するステップを具備し、
ディジタル画像は連続的な画像ブロックを表現するビットストリームとして表現され、それぞれのブロックは1つかまたはそれ以上の成分を備え、それぞれの成分は1つかまたはそれ以上のデータユニットを備え、それぞれのデータユニットは基底関数の係数のハフマン符号化ストリームとして表現され、0次係数は対応する成分の以前の0次係数との差分として表現され、
ブロック情報テーブルは、
ビットストリーム内のそれぞれの画像ブロックに含まれる1つの0次係数または1次係数へのインジケータと、
画像ブロックの隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数を指示する情報と、
それぞれの成分の少なくとも1つのデータユニットの0次係数であって、非差分形式で表現された前記0次係数とを備える。
この方法は、さらに、少なくとも1つの画像ブロックのそれぞれのデータユニットごとに、
データユニットの0次係数にアクセスし、かつ、データユニットの係数を1つもハフマン符号化しないかあるいは予め定められた数だけハフマン符号化し、ビットストリーム内で隣接するデータユニットにおける係数間のビット数に関するブロック情報テーブル内の情報を用いて、ビットストリーム内における次の0次係数または1次係数へジャンプすることによって、残りの係数をスキップし、それによって、低減された一組のハフマン符号化係数が復号化されるステップを備える。
本出願の内容においては、「画像ブロック」という用語は、画像の空間的な部分を表現するものと解釈されるべきであり、前記ブロックは、様々な色モデル成分からの情報を有してもよい。それぞれの画像ブロックは、色モデル成分ごとに、1つかまたはそれ以上の組の係数として表現されてもよい。
本発明の第2の形態によれば、これらの目的は、ディジタル画像を表現するための画像表現形式によって達成される。この画像表現形式は、
連続的な画像ブロックを表現するビットストリームとして記憶された画像情報であって、それぞれのブロックは1つかまたはそれ以上の成分を備え、それぞれの成分は1つかまたはそれ以上のデータユニットを備え、それぞれのデータユニットは基底関数の係数のハフマン符号化ストリームとして表現され、0次係数は対応する成分の以前の0次係数との差分として表現される画像情報と、
ブロック情報テーブルとを備え、
前記ブロック情報テーブルは、
前記ビットストリーム内のそれぞれの画像ブロックに含まれる1つの0次係数または1次係数へのインジケータと、
画像ブロックの隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数を指示する情報と、
それぞれの成分の少なくとも1つのデータユニットの0次係数であって、前記0次係数が非差分形式で表現された0次係数とを備える。
本発明の第3の形態によれば、生画像データを圧縮ディジタル画像表現に符号化するための方法が提供される。この方法は、
生画像データの特定のサイズの画像ブロックを任意の順序で読み出すステップを備え、 また、画像ブロックごとに、
画像ブロックを1つかまたはそれ以上の成分の1つかまたはそれ以上のデータユニットに変換するステップであり、前記変換するステップが、それぞれのデータユニットの表現を基底関数の係数として生成する、前記変換するステップと、
前記係数の量子化された近似値を計算するステップと、
少なくともいくつかの量子化された係数を連続的な画像ブロックの係数のストリームとして表現するステップと、
係数の前記ストリームをハフマン符号化するステップであって、0次係数が、対応する成分の以前の0次係数との差分として表現されるハフマン符号化ステップと、
係数の前記ハフマン符号化ストリームをビットストリームに記憶するステップと、
ビットストリーム内のそれぞれの画像ブロックの1つの0次係数または1次係数へのインジケータをブロック情報テーブルに記憶するステップと、
画像ブロックの隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数を指示する情報をブロック情報テーブルに記憶するステップと、
それぞれの成分の少なくとも1つのデータユニットの0次係数をブロック情報テーブルに記憶するステップであって、前記0次係数が非差分形式で表現された記憶ステップと、を備える。
本発明の第4の形態によれば、JPEG圧縮ディジタル画像を解析する方法が提供される。JPEG圧縮ディジタル画像は、ビットストリームとして表現され、前記ビットストリームは連続的な画像ブロックを表現し、それぞれのブロックは1つかまたはそれ以上の成分を備え、それぞれの成分は1つかまたはそれ以上のデータユニットを備え、それぞれのデータユニットは基底関数の係数のハフマン符号化ストリームとして表現され、0次係数は対応する成分の以前の0次係数との差分として表現される。この方法は、
ビットストリームを連続的に進むステップを備え、
ビットストリームをステッピングするときに、
それぞれの画像ブロックの1つの0次係数または1次係数へのインジケータをブロック情報テーブルに記憶するステップと、
0次係数を復号化し、それぞれの成分の少なくとも1つのデータユニットの0次係数をブロック情報テーブルに記憶するステップであって、前記0次係数が非差分形式で表現されているステップと、
画像ブロックの隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数を指示する情報をブロック情報テーブルに記憶するステップと、を備える。非0次係数が、一連のビットストリームエントリーによって表現される、ビットストリーム内のデータユニットの前記非0次係数をステッピングするステップは、 ビットストリーム内の予め定められた数のそれに続くビットのビットシーケンスを参照するステップと、
ビットシーケンスにおける少なくとも第1のビットストリームエントリーのカテゴリーおよびゼロランレングスを決定するために、並びに、第1のビットストリームエントリーのビット長を決定するために、テーブルを検索するステップと、
決定されたビット長に対応するビットストリーム内のビット数をスキップするステップと、
隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数に関する情報を収集するために、スキップされたビット数の数を合計するステップと、
データユニットのすべての係数をステップするまでにあるいはブロックシンボルの終点に到達するまでにステップされた係数の数を合計するステップと、を備える。
本発明の第5の形態によれば、2つのディジタル画像をつなぎ合わせるための方法が提供される。この方法は、
2つのディジタル画像間の空間的関係を決定するステップと、
2つのディジタル画像間の空間的関係に基づいて、2つのディジタル画像内に存在するディジタル画像情報の画像ブロックにインデックスを割り当てるステップと、
割り当てられたインデックスに基づいて、連続的な画像ブロックを表現するビットストリームを形成するステップであって、それぞれのブロックは1つかまたはそれ以上の成分を備え、それぞれの成分は1つかまたはそれ以上のデータユニットを備え、それぞれのデータユニットは基底関数の係数のハフマン符号化ストリームとして表現されるステップと、
画像ブロックの位置に基づいて、画像ブロックごとの画像ブロック情報をブロック情報テーブルに記憶するステップとを備え、
前記画像ブロック情報は、
前記ビットストリーム内のそれぞれの画像ブロックに含まれる1つの0次係数または1次係数へのインジケータと、
画像ブロックの隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に存在するビット数を指示する情報と、
それぞれの成分の少なくとも1つのデータユニットの0次係数であって、非差分形式で表現された0次係数とを備える。
本発明の少なくともいくつかの形態によって、ディジタル画像は、小さな記憶空間しか必要としない画像表現形式で表現され、それにもかかわらず、圧縮された表現形式によるディジタル画像は、容易に処理されることが可能である。これは、携帯電話のような小さな記憶空間および小さな処理能力しか備えていない用途においてとりわけ有益である。本発明は、ディジタル画像を圧縮された形式で記憶するのを可能にするが、依然として、リアルタイムに処理および操作され、そして、画面上に表示される。本発明による画像表現形式および画像を処理するための方法により、画像は、小さなスケーリングで、あるいは、低い解像度で、きわめて迅速に提供される。画像ブロックの0次係数を記憶することは、以前の0次係数に関する情報を用いて0次係数を計算しなくてもよいことを意味する。
さらに、所望のどのような数の非0次係数が、復号化されてもよい。ビットストリーム内の残りの非0次係数は、迅速にスキップすることができる。なぜなら、ブロック情報テーブルが、隣接するデータユニットの係数間のビット長に関する情報を提供し、次のデータユニットへの迅速なアクセスを可能にするからである。これは、低減されたスケーリングで画像を迅速に復号化できることを意味する。なぜなら、画像ブロック内の次のデータユニットの開始点または次の画像ブロックの開始点を見つけるために、ビットストリーム内の非0次係数を復号化しなくてもよいからである。したがって、画像表現形式は、ディジタル画像への迅速なアクセスを可能にする。
それぞれの画像ブロックの1つの0次係数または1次係数へのインジケータを記憶することは、係数のハフマン符号化ストリームをストリームの開始点から復号化することを必要とせずに、画像の或る部分への迅速なアクセスを提供する。それに代え、画像ブロックは、インジケータを用いて、直接にアクセスされてもよい。さらに、それぞれの成分の少なくとも1つのデータユニットの0次係数は、ブロック情報テーブルにおいて、非差分形式で表現される。したがって、係数のハフマン符号化ストリームからの値を計算しなくてもよい。これは、ディジタル画像の一部分を提供および操作するのを可能にし、そして、それは、圧縮画像表現形式によるものである。なぜなら、画像の一部分は、無作為にアクセスおよび解析されてもよいからである。
本発明による画像表現形式によれば、ディジタル画像を最小のサイズに圧縮しようとする目的は、幾分妨げられる。したがって、ディジタル画像のサイズは、最適に圧縮はされないが、その代わりに、画像の或る部分を迅速に検索するのを可能にするために、係数のハフマン符号化ストリームに関する何らかのさらなる情報が、個々に記憶される。とりわけ、非0次係数の部分だけをハフマン復号化することによって、また、より小さなサイズのブロックを計算するために、4×4のようなより小さなブロックに適合させられた逆離散コサイン変換を用いて、画像または画像部分を別のスケーリングできわめて迅速に復号化することが可能である。画像表現形式は、JPEG画像に容易に変換することができる。なぜなら、この画像表現形式は、JPEG画像形式にきわめて類似しているからである。したがって、画像がさらなる操作を必要としなければ、JPEG画像への変換を実行し、かつ、インジケータおよび係数の記憶された値を除去することが可能である。
係数のハフマン符号化ストリームは、ブロック情報テーブルに個々に記憶された0次係数を備えなくてもよい。しかしながら、係数のハフマン符号化ストリームは、いずれにせよ、すべての係数を備えてもよい。画像表現形式が、別の画像形式に変換されなければならない場合、これは都合が良いことかもしれない。なぜなら、ビットストリーム自身が、その後に、別の画像形式で直接に使用される場合があるからである。
「ブロック情報テーブル」という用語は、厳密にテーブルと解釈されるべきではなく、ただ単に、記憶された情報が制御された形で記憶されることであり、記憶された情報のテーブル内における位置は情報が表現する画像内における空間的な位置に関係づけられると解釈されるべきである。したがって、ブロック情報テーブルは、例えば、いくつかのリストまたはテーブルに分割されてもよい。さらに、「係数のハフマン符号化ストリーム」は、ストリーム全体がハフマン符号化されることを必ずしも意味するとは限らない。ストリームは、係数の生データと混合されたハフマン符号を備えてもよい。例えば、JPEG圧縮ファイルにおいては、係数のゼロランレングスおよびカテゴリーは、ハフマン符号化され、カテゴリー内の係数の値は、非圧縮ビットによって記述される。
インジケータおよび係数をブロック情報テーブルに記憶することによって、画像情報を記憶する明確な構造が、得られる。
画像ブロックは、例えば、3つの色モデル成分、すなわち、1つの輝度成分および2つの色成分を備えてもよい。ディジタル画像を1つの輝度成分および2つの色成分で表現することは、色成分が、目で認識のできる情報がほとんど失われることなく、より低い解像度で表現されてもよいことを意味する。したがって、ディジタル画像内の情報の初期圧縮は、3つの色成分のようなディジタル画像の表現に関連して達成されてもよい。そのような圧縮を用いて、それぞれの画像ブロックは、例えば、輝度成分のための4つのデータユニットと、それぞれの色成分ごとに1つのデータユニットとを備えてもよい。データユニットは、係数のハフマン符号化ストリーム内に順々に並べられる。
本発明の第6の形態によれば、ディジタル画像を表現するための画像表現形式が提供される。この画像表現形式は、
連続的な画像ブロックを表現するビットストリームとして記憶された画像情報であって、それぞれのブロックは1つかまたはそれ以上の成分を備え、それぞれの成分は1つかまたはそれ以上のデータユニットを備え、それぞれのデータユニットは基底関数の係数のハフマン符号化ストリームとして表現され、0次係数は対応する成分の以前の0次係数との差分として表現される画像情報と、
ビットストリームに関連して記憶されたビットストリーム情報であって、前記ビットストリーム情報は画像ブロック内に存在するそれぞれのデータユニットのビット数を示す情報を備えたビットストリーム情報と、を備える。
この画像表現形式は、比較的に小さな記憶空間しか必要としない。画像表現形式は、本発明の第2の形態の画像表現形式に基づいてブロック情報テーブルを迅速に生成するのを可能にするビットストリーム情報しか保持しない。したがって、本発明の第6の形態によるこの画像表現形式は、長時間にわたり画像を記憶するのに適したものである。画像がアクセスされる場合、ビットストリーム情報は、ビットストリームを迅速に解析してブロック情報テーブルを生成するのに使用されてもよい。画像ブロック内のそれぞれのデータユニットのビット数を示す情報が、データユニットに迅速にアクセスするのに使用されてもよい。データユニットにアクセスしているとき、インジケータが生成されてもよく、隣接するデータユニットの0次または1次の係数間のビット数を示す情報が収集されてもよく、それぞれの成分の少なくとも1つの0次係数を非差分形式で記憶するために、0次係数が復号化されてもよい。
ビットストリーム情報は圧縮されてもよい。これは、第6の形態の画像表現形式をきわめて効率的に記憶することができることを意味する。
ブロック情報テーブル内のインジケータは、静的位置から前記特定の次数の係数までのビットオフセットを示してもよい。静的位置は、例えば、ビットストリームの開始点であってもよい。したがって、インジケータは、それぞれの画像ブロック内の特定のビット位置へのポインタとして実現される。これは、それぞれの画像ブロックを迅速に検索することができることを意味し、それによって、係数のハフマン符号化ストリームの特定の部分へのアクセスを迅速化することができる。
あるいは、ブロック情報テーブル内のインジケータは、ビットストリームランドマークから係数までのビットオフセットを示してもよい。そして、画像表現形式は、それぞれのビットストリームランドマークがどの画像ブロック内に配置されているかという情報を提供するリストを備えてもよい。このようにして、インジケータのビットオフセットをより少ないビット数によって記憶することができる。なぜなら、ビットストリームランドマークからのビットオフセットは、ほとんどの場合、静的位置からのビットオフセットよりも小さいからである。これは、より少ないメモリを用いてインジケータを記憶することができることを意味する。その代わりに、リストは、それぞれのランドマークがどの画像ブロック内に配置されているかという情報を提供する必要がある。したがって、特定の画像ブロックが、アクセスされる場合、その特定の画像ブロックの前に存在する最後のビットストリームランドマークを探し出すために、まず最初に、検査がリストにおいてなされる。
そして、関連するビットストリームランドマークおよびそのランドマークからのビットオフセットに関する情報が、ビットストリーム内の所望の画像ブロックを探し出すのに使用される。
インジケータは、画像ブロックの0次または1次の係数をポイントしてもよい。インジケータが、0次係数をポイントしている場合、データユニットの開始点は、容易にアクセスされる。そして、0次係数が、非差分形式でブロック情報テーブルにすでに記憶されていても、非0次係数にアクセスするためには、0次係数が、復号化される必要がある。インジケータが、1次係数をポイントしている場合には、非0次係数は、直接にアクセスされてもよい。
さらに、隣接するデータユニットの係数間のビットストリーム内に存在するビット数を示す情報は、どのような組み合わせの0次係数と1次係数との間のビット数を示してもよい。この情報は、ビットストリーム内においてデータユニットから隣接するデータユニットへ迅速にジャンプするのに使用されてもよい。上述したように、データユニットに関する情報は、0次係数にアクセスすることによってか、あるいは、0次係数がブロック情報テーブルからわかる場合には、1次係数に直接にアクセスすることによって、容易にアクセスされる。したがって、ビット数を指示する情報は、0次係数へのビット数を指示するか、あるいは、1次係数へのビット数を示してもよい。同様に、画像表現形式は、それが0次係数かまたは1次係数からのビット数を示すのに都合が良いように構造化される。
また、インジケータは、画像ブロック内に存在するどのようなデータユニット内の係数をポイントしてもよい。そして、隣接するデータユニット間のビット数に関する情報は、画像ブロック内のいずれかのデータユニットにアクセスするのに使用されてもよい。さらに、インジケータが示すデータユニットの0次係数は、好ましくは、ブロック情報テーブルに記憶される。成分のその他のデータユニットの0次係数は、ビットストリーム内に記憶された0次係数間の差分に関する情報を用いて計算されてもよい。インジケータが画像ブロックの第1のデータユニット内の0次係数または1次係数を示すことは、都合の良いことである。したがって、画像ブロックの開始点が、インジケータによって直接にアクセスされる。
ブロック情報テーブルは、ビットストリーム内において以前の画像ブロックの0次係数との差分として表現された0次係数ごとに非差分形式で表現された0次係数を備えてもよい。これは、それぞれの画像ブロックが独立してアクセスされてもよいことを意味する。
なぜなら、ブロック情報テーブルは、以前の画像ブロックに依存するものとしてビットストリーム内に提供されたすべての情報を提供するからである。特定の実施形態によれば、ブロック情報テーブルは、ビットストリームランドマークから係数までのビットオフセットを示すインジケータ、および、ビットストリーム内において以前の画像ブロックの0次係数との差分として表現された係数ごとの非差分形式による0次係数だけを備える。この実施形態は、小さなサイズのブロック情報テーブルを提供し、それは、記憶容量が限られている場合に有益である。
あるいは、ブロック情報テーブルは、非差分形式で表現されたそれぞれの0次係数を備える。これは、ビットストリーム内において0次係数が画像ブロック内のデータユニットの0次係数との差分として表現されたデータユニットごとに0次係数を計算しなくてもよいことを意味する。したがって、画像ブロックに関する情報により迅速にアクセスすることができる。しかしながら、より多くの情報が、ブロック情報テーブル内に必要とされる。
さらに、ビットストリームは、ディジタル画像をJPEG形式で表現してもよい。したがって、通常のJPEG圧縮画像またはすでに圧縮されたJPEG画像は、画像の特定の部分に迅速にアクセスし、その部分を操作し、および/または、解析するための付加的な情報に関連づけられてもよい。
本発明の第1の形態の方法の実施形態によれば、方法は、さらに、復号化された画像ブロックをデータ処理装置またはデータ表示装置に提供するステップを備え、それによって、画像または画像部分は、低減されたスケーリングで表示される。データ処理装置またはデータ表示装置は、例えば、画面、プリンタ、または、画像処理を実行するためのハードウェアユニットであってもよい。画像または画像部分は、例えば画面上に迅速に提供されてもよい。なぜなら、この方法は、画面上に表示するために、ディジタル画像の関連する部分をきわめて迅速に復号化するからである。これは、いらいらさせる待ち時間をユーザが経験することなく、画像をユーザに提供することができることを意味する。
この方法は、さらに、復号化された画像ブロックに画像処理を施すための計算を実行するステップを備えてもよい。このように、画像は、低減された一組のハフマン符号化係数しか復号化されないので、少ない計算しか必要としない。したがって、画像処理は、比較的に迅速に実行されることが可能である。
この方法は、さらに、計算が実行されたときに、実行された計算の結果を画面上に表示するステップを備えてもよい。この方法は、画像が選択されたときに、圧縮形式で記憶された画像をリアルタイムに表示するステップ、および、画像をリアルタイムに操作するステップを提供する。なぜなら、この方法は、画像の関連する部分にきわめて迅速にアクセスし、かつ、それらをわずかな量のデータに復号化することを提供し、それによって、操作を迅速に実行および提供することができるからである。さらに、この方法は、携帯電話のような小さなメモリ空間しか持たない装置上における画像の操作を定義および実行するのを可能にする。
本発明の第1の形態に従った方法の実施例によれば、ハフマン復号化されたデータユニットの係数の数は、より大きな数の係数に対応する復号化された画像ブロックを近似するのに使用される。近似は、ハフマン復号化係数がより多くの係数を表現するのを可能にし、それによって、より低い品質の画像が、生成されてもよく、あるいは、より少ない画像ブロック当たりの画素を有するより小さい画像が、生成されてもよい。近似は、画像の最も細かな部分を失うが、画像の品質は、それにもかかわらず、満足できるものである。なぜなら、画像が粗いという特徴は、それぞれのデータユニット内の最初の係数によって表現されるからである。
ハフマン復号化される係数の予め定められた数は、例えば、4、9、13、18、または、24であってもよい。4または24の係数が、それぞれ、復号化される場合、復号化された係数は、それぞれ、8×8画素から2×2画素および4×4画素までのそれぞれの画像ブロックのスケーリングを表現する。9、13、または、18の係数が、ハフマン復号化される場合、復号化された係数は、4×4画素の画像ブロックの表現を近似するのに使用されてもよい。復号化される係数のこれらの数は、とりわけ都合が良い。なぜなら、9、13、および、18の係数の直後に続く係数は、4×4画素の画像ブロックに関する情報として使用されなくてもよいからである。
本発明の第2の形態の画像表現形式の実施形態によれば、インジケータ、隣接するデータユニットの係数間のビット数を指示する情報、および、非差分形式で表現された0次係数は、ブロック情報テーブル内の1つのストリーム内に記憶される。別の実施形態においては、インジケータ、係数の値、および、画像情報が、別個のメモリ領域に記憶される。
本発明の第4の形態に従った方法の実施例によれば、参照されるそれぞれのビットシーケンスは、16ビットを備える。これは、とりわけ、ビットストリームエントリーの形式に都合が良い。非0係数を符号化するビットストリームエントリーは、2つの部分からなる。第1の部分は、ハフマン符号化され、かつ、ゼロランレングスおよび現在の係数の値のカテゴリーを符号化する。第2の部分は、現在の係数の値を表現するデータである。したがって、ビットストリームエントリーの第1の部分は、エントリー(ゼロランレングス+1つの係数)によってどれだけの係数が符号化されたか、および、ビットストリームエントリーがどれだけのビットからなるかという情報を保持する。ビットストリームエントリーの第1の部分は、多くても16ビット長であるので、16ビットを参照するのに都合が良い。したがって、16ビットを同時に参照するとき、それぞれのビットシーケンスは、常に、1つのビットストリームエントリーの少なくとも第1の部分を備え、したがって、16ビットは、ビットストリームエントリーによって符号化される係数の数およびビットストリームエントリーの長さに関する情報を保持する。
テーブルを検索するステップは、ビットシーケンスの最初の8ビットからなる第1のテーブルを検索するステップを備えてもよい。テーブル検索が、16ビットに対して同時になされる場合、65,536エントリーを備えたテーブルが必要とされ、きわめて多くのメモリを使用する。さらに、最も一般的なビットストリームエントリーの第1の部分は、8ビットかまたはそれよりも短い。したがって、最初の8ビットをテーブル検索するステップは、ほとんどの場合、ビットストリームエントリーに関する必要な情報を与える。
第1のテーブル検索は、第1のビットストリームエントリーのビット長およびステップされる係数の数に関する情報をもたらしてもよく、あるいは、第2のテーブル検索のための情報をもたらしてもよい。このように、第1のテーブル検索は、ビットストリームエントリーに関する必要な情報をもたらし、あるいは、ビットシーケンスの最後の8ビットを用いてビットストリームエントリーの第1の部分を解析するための情報をもたらす。
テーブルを検索するステップは、さらに、第1のビットストリームエントリーのビット長および辿られる係数の数を決定するために、ビットシーケンスの最後の8ビットからなる第2のテーブルを検索するステップを備えてもよい。第2のテーブル検索が必要とされる場合、第1のテーブル検索は、最初の8ビットに応じて第2の検索において使用されるべきテーブルへのポインターをもたらしてもよい。第2のテーブル検索には、少数の異なるテーブルしか必要としない。なぜなら、ビットストリームエントリーの第1の部分が、8ビットよりも長い場合、最初の8ビットの組み合わせは、わずかしか存在しないからである。したがって、2つのステップによってテーブルを検索する場合、それぞれのビットシーケンスの第1のビットストリームエントリーを解析するのに必要とされるような多くのテーブルエントリーは、必要ではない。
本発明の第5の形態の方法の実施形態によれば、1つのディジタル画像のいくつかの画像ブロックは、その他のディジタル画像からの情報によって操作される。画像ブロック内の内容が、両方のディジタル画像において描画される場合、この操作は、2つのディジタル画像からの画像ブロックの結果を混合するステップを構成してもよい。これは、2つのディジタル画像をお互いにより滑らかにつなぎ合わせることができることを意味する。
さらなる実施形態によれば、第1のディジタル画像の一部分の画像ブロックは、まず最初に処理され、残りの画像の画像ブロックは、非圧縮形式で一時的に記憶される。そして、これらの後者の画像ブロックは、第2のディジタル画像の画像ブロックが処理される前に、第2のディジタル画像の操作を計算するのに使用されてもよい。
さらに、つなぎ合わせられた画像は、画像表現形式のインジケータを用いてつなぎ合わせられた画像の画像ブロックに順次にアクセスすることによって、そして、対応する以前の0次係数との差分として表現された0次係数を備えた連続的な画像ブロックを得るためにハフマン符号化係数のストリームを記憶することによって、JPEG形式のような別の画像圧縮形式に変換されてもよい。したがって、小さなメモリ容量しか必要とせずに、ディジタル画像をつなぎ合わせ、かつ、操作することができ、つなぎ合わせが、完了すれば、その画像は、きわめて良好に圧縮された表現形式に変換されてもよい。
ここで、添付の図面を参照して、例としての本発明をさらに詳細に説明する。
以下の説明においては、JPEG圧縮に基づいて画像の圧縮を説明するが、その他の変換を用いたその他の圧縮が、試みられてもよい。本発明の保護範囲は、JPEG圧縮に決して限定されないことに注意されたい。
ここで、図1を参照して、ディジタル画像を圧縮するための方法を説明する。まず最初に、ステップ10において、ディジタル画像は、YUV色モデルによって表現され、画像に含まれるそれぞれの画素は、3つの成分、すなわち、輝度Yおよび2つの色成分UおよびVを有する。2つの色成分UおよびVは、色特徴を表現し、それらの最も細かな部分は、人間の目が認識するのは難しい。したがって、これらの成分は、輝度成分よりも低い解像度で表現されてもよい。ここで定義される画像ブロックの一例である16×16画素ブロックの画像は、それぞれが8×8画素からなる4つのYデータユニット、8×8画素からなる1つのUデータユニット、および、8×8画素からなる1つのVデータユニットによって表現されてもよい。これは、ディジタル画像のRGB表現と比較して、データセットを50%だけ圧縮したことに相当する。しかしながら、4つのUデータユニットおよび4つのVデータユニットが、使用されてもよく、この場合には、RGB表現と比較して、圧縮は得られない。
画像は、個々の16×16画像ブロックとして、何らかの順序で処理される。それぞれの成分のそれぞれのデータユニットは、ステップ12において、離散コサイン変換(DCT)を用いて変換される。それぞれの成分のそれぞれのデータユニットは、64画素を備えるので、DCTは、DCTの基底関数ごとに64個の係数を生成する。これらの係数は、1つの0次係数(DC係数)および63個のより高い次数の係数(AC係数)を備える。
次に、ステップ14において、それぞれのデータユニットの係数のしきい値処理されかつ量子化された近似値が、生成される。しきい値処理されかつ量子化された近似値は、正規化マトリックスに基づいた値で係数を除算することによってそれぞれの係数をスケーリングおよびトランケーションすることによって、達成される。これは、認識する重要性があまりないと決定された基底関数ごとの係数が小さな重みを与えられ、そして、多くの係数が値0(ゼロ)を得ることを意味する。
そして、係数は、ジグザグ順序を用いて、係数のストリーム内に並べ替えられる。標準JPEG圧縮によれば、DC係数は、同じ色成分の先行するデータユニットに含まれる先行するDC係数との差分として表現され、その差分が、ハフマン符号化される。AC係数は、符号化されたゼロランレングスであり、さらに、ハフマン符号化によって符号化され、ハフマン符号化されたDC係数の直後に記憶される。データユニットに残されたゼロ値を有するAC係数だけしか存在しない場合、エンドオブブロックコードが、係数のストリーム内に挿入される。したがって、連続的なデータユニットおよび画像ブロックのハフマン符号化された係数からなるビットストリームが得られる。本発明の実施形態によれば、ステップ16において、ハフマン符号化された係数は、標準JPEG圧縮の場合と同様にして計算される。ビットストリームは、ディジタル画像の圧縮された表現を構成する。
しかしながら、ゼロランレングス符号化およびハフマン符号化が、使用されるので、それぞれのデータユニットの長さは、未知である。したがって、ビットストリームが、ビットストリームの開始点からデータユニットの開始点まで復号化されるまで、データユニットの開始点は、未知である。さらに、DC係数の表現は、先行するDC係数に依存するので、先行するDC係数が、以前の係数のハフマン符号化されたストリームを復号化することによって決定されていなければ、データユニットのDC係数は、未知である。
画像に含まれる特定のブロックを迅速に検索するのを可能にするために、かつ、それによって、特定のブロックの操作および/または解析を可能にするために、ステップ18において、ブロック情報テーブルが、生成され、それぞれの画像ブロックへのインジケータ、特定の次数の隣接する係数間のビットストリーム内に含まれるビット数を指示する情報、および、それぞれの画像ブロックに含まれるそれぞれの色成分のDC係数を備え、DC係数は、非差分形式で表現される。
本発明の別の実施形態によれば、ハフマン符号化された係数のビットストリームは、異なる内容を有してもよく、あるいは、異なる形で記憶されてもよい。例えば、以前の画像ブロックに依存するDC係数は、ブロック情報テーブルにすでに記憶されているので、それらは、ビットストリーム内に存在しなくてもよい。
さらに、画像ブロックに関するすべての情報は、ブロック情報テーブルからわかり、そのブロック情報テーブルは、その他の画像ブロックに依存するDC係数およびビットストリーム内に存在する画像ブロックへのインジケータを含む。したがって、ビットストリームは、特定のシーケンスの画像ブロックとして表現されなくてもよく、あるいは、それどころか、1つのストリーム内に記憶されなくてもよい。
したがって、本発明の一実施形態によれば、情報は、テーブル内におけるブロック情報の位置が画像のどの部分をそれが表現するかを特定するような形で、ブロック情報テーブルに記憶される。また、ブロック情報は、それが表現する位置がその他のブロック情報とともに記憶されるような形で、記憶されてもよい。それどころか、画像ブロックごとの係数のハフマン符号化されたストリームは、ブロック情報に結合された状態で記憶されてもよい。また、記憶されたブロック情報は、ブロックが符号化されているかどうかを決定するための機構を有してもよく、それによって、例えば、非符号化ブロックを黒ブロックとして処理するのを可能にする。
したがって、係数のハフマン符号化されたストリームのパッケージおよびブロック情報テーブルは、小さな記憶容量しか必要としないディジタル画像の表現を構成し、それと同時に、全画像を復号化することを必要とせずに、画像の特定の部分を解析および操作するのを可能にする。また、これは、画像を非線形に圧縮するのを可能にし、この場合には、ブロックが圧縮される順序は、重要なことではない。
ここで、図2aを参照すると、圧縮画像表現形式の構造が示される。画像ブロックを読み込みあるいは書き込むためのランダムアクセスが、装置によって必要とされるのであれば、ブロック情報テーブルは、装置のRAMに記憶されてもよい。図2bに示されるように、ブロック情報テーブル30およびハフマン符号化された係数のビットストリーム36は、別個のメモリ空間に記憶されてもよい。ブロック情報テーブル30は、インジケータ31、隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に含まれるビット数を指示する情報32、および、非差分形式で記憶されたDC係数33を備える。そして、ブロック情報テーブル30のインジケータ31は、ビットストリーム36内に存在する特定の次数の画像ブロックの最初の係数への指示を備える。
図2cに示される変形のように、ブロック情報テーブル30′は、ビットストリーム36′へのヘッダーまたは特別のマーカーとして、記憶されてもよく、そのビットストリーム36′は、標準JPEG形式を構成してもよい。
また、情報が、ビットストリームのヘッダーに記憶されている場合、そのヘッダーは、ブロック情報テーブルに必要とされるすべての情報を備えなくてもよいことがわかる。その代わりに、ヘッダーは、ブロック情報テーブルをきわめて迅速に生成するのを可能にする情報を備えてもよい。したがって、ビットストリーム36′のヘッダーは、それぞれのデータユニットの長さに関する情報だけを保持してもよい。そして、画像にアクセスするとき、ブロック情報テーブルが、迅速に生成され、RAMに書き込まれてもよい。データユニットの長さを用いて、ブロック情報テーブルに必要とされる情報が、迅速にアクセスされてもよい。それぞれの画像ブロックの開始点へのインジケータを生成し、DC係数を復号化および記憶し、そして、隣接するデータユニットにおける0次または1次の係数間のビットストリーム内に含まれるビット数を指示する情報を更新しながら、データユニットが、辿られる。
それどころか、このヘッダーは、記憶空間を節減するために、圧縮されてもよく、例えば、ハフマン符号化されてもよい。長さ情報は、わずかしか変化しない値を有する。したがって、DC係数の符号化に対応するような形で長さをハフマン符号化することは、情報を相当に圧縮する。ファイルの相当な圧縮は、ファイルが空間的に効率的な形式で記憶されてもよいことを意味し、それと同時に、ブロック情報テーブルが迅速に生成されるのを可能にする。そして、画像が、アクセスされたとき、ヘッダーが、復号化される。
しかしながら、本発明は、画像を表現するこれらの説明されたやり方に決して限定されないことに注意されたい。
インジケータ31は、画像ブロックの最初の0次係数をポイントしてもよい。しかしながら、0次係数は、ブロック情報テーブル内に提供されるので、0次係数にアクセスする必要はない。したがって、その代わりに、インジケータ31は、画像ブロックの最初の1次係数をポイントしてもよい。インジケータは、ビットストリーム内における静的位置から画像ブロック内における特定の次数の係数までのビットオフセットとして実施されてもよい。好ましくは、インジケータは、ビットストリームの開始点から係数までのビットオフセットに関する情報を提供する。
あるいは、インジケータ31は、ビットストリームランドマークから係数までのビットオフセットを指示してもよい。インジケータ31が、ビットストリームの開始点からのビットオフセットを指示する場合、2Mバイトよりも大きなサイズを有するビットストリームは、4バイトによって表現されるインジケータを必要とする。ビットストリームランドマークは、インジケータ31が2バイトによって表現されてもよいように、ビットストリーム内に配置されてもよい。オフセットが、例えば、65,536ビット(2バイトによって表現される最も大きな数)よりも大きくなれば、ビットストリームランドマークが、配置される。ビットストリームランドマークは、順に番号が付される。ビットストリームランドマークのリストが生成され、それぞれのビットストリームランドマークがどの画像ブロックに存在するかについての情報を提供する。画像ブロックが、インジケータを用いてアクセスされる場合、そのアクセスは、2つのステップによってなされる。まず最初に、アクセスされるべき画像ブロックの前に存在する、ビットストリーム内の最も近くに配置されたビットストリームランドマークの数を探し出すために、ビットストリームランドマークのリストにおいて、比較がなされる。そして、ビットストリームの開始点からの画像ブロックのビットオフセットが、(ビットストリームランドマークの数)×65,536+インジケータによって提供されるビットオフセットとして計算されてもよい。当然ながら、ビットストリームランドマーク間には、どのようなビット数でも使用されてよい。
特定の次数の隣接する係数間のビット数を指示する情報は、画像ブロック内の特定のデータユニットに迅速にアクセスするのに使用されてもよい。データユニットがどこから開始するかを知るために、以前のデータユニットを復号化しなくてもよい。有利には、これは、以下でより詳細に説明するように、少ない一組の復号化された係数として画像ブロックを迅速に復号化するのに使用されてもよい。
ブロック情報テーブルは、データユニットごとに非差分形式で表現されたDC係数を備えてもよい。これは、いずれかのデータユニットのDC係数を計算しなくてもよいことをもたらす。しかしながら、その代わりに、ブロック情報テーブルは、以前の画像ブロックのDC係数との差分としてビットストリーム内において表現されたDC係数だけを備えてもよい。画像ブロックが、成分ごとにいくつかのデータユニットを備える場合、それぞれの成分の第1のデータユニットのDC係数を記憶すればよいだけである。これは、ブロック情報テーブルが記憶空間をあまり必要としないことを意味する。
また、圧縮画像表現形式の構造は、すでに圧縮されたJPEGファイルから開始することによって、得られてもよい。そして、それぞれの画像ブロックへのインジケータ、特定の次数の隣接する係数間のビット数を指示する情報、および、それぞれの画像ブロックのそれぞれの成分ごとの非差分形式によるDC係数を決定するために、JPEGファイルが、復号化される。したがって、インデックスおよびDC係数が、ブロック情報テーブルに記憶され、係数のハフマン符号化ストリームが、そのまま保持される。その代わりに、そのようなJPEG画像のAC係数は、新しいメモリ空間にコピーされてもよく、それによって、JPEG画像のすべての情報は、装置に記憶された元々のJPEG画像を保持しなくても、アクセス可能なものとなる。
このようにして生成された画像表現形式は、JPEGファイルに画像処理を直接に施すのを可能にする。
ここで、画像表現形式を生成するためにJPEG画像を解析するための特定の方法を説明する。この方法は、必要な情報を収集するために、ビットストリームを順次に通過させる(step through)ことを備える。ビットストリームを通過させるとき、それぞれの画像ブロックへのインジケータ、特定の次数の隣接する係数間のビットストリーム内に含まれるビット数を指示する情報、および、それぞれの成分の少なくとも第1のデータユニットのDC係数は、ブロック情報テーブルに記憶される。
ビットストリームを通過させるとき、成分ごとのDC係数が、復号化され、次のDC係数を決定するのを可能にするために、最後の係数が、一時的に記憶される。
図3を参照して、ビットストリーム内に含まれるデータユニットのAC係数を通過させることを説明する。解析は、次のデータユニットがどこから開始するか、および、DC係数間のビット数、または、隣接するデータユニットの最初のAC係数をただ単に決定したいにすぎない。したがって、AC係数を復号化することは必要ではない。
AC係数のビットストリームエントリーは、2つの部分からなる。第1の部分は、いくつのゼロ係数が現在の係数に先行するか、および、現在の係数の値がどのカテゴリーに入るかを符号化するハフマン符号である。カテゴリーは、ビットストリームエントリーの第2の部分のビット数を決定し、その第2の部分は、係数の実際の値を符号化する。したがって、ビットストリームエントリーの第1の部分を解析することによって、ビットストリームエントリーによって符号化された係数の数およびビットストリームエントリーによって使用されたビット数が、決定されてもよい。
ステップ20において、AC係数を通過させることは、ビットストリーム内に存在する予め定められた数のビットからなるビットシーケンスを参照することを備える。好ましくは、ビットシーケンスは、16個のビットからなる長さを有し、いずれかのビットストリームエントリーの最も長い第1の部分に対応する。したがって、1回に16ビットを参照することによって、必要とされる情報は、常に、少なくとも1つのビットストリームエントリーごとに収集されてもよい。情報は、ステップ22において、テーブルを検索することによって収集される。したがって、テーブル検索は、ビットシーケンス内に存在する少なくとも第1のビットストリームエントリーのビット長と、ハフマン符号によって符号化される係数の数とをもたらす。そして、ステップ24において、決定されたビット長に対応するビット数が、スキップされる。ステップ26において、スキップされたビットの総数が、計算され、ステップ28において、スキップされた係数の総数が、計算される。エンドオブブロックシンボルに到達し、また、データユニットの最大数の係数が、スキップされたならば、処理は、ステップ20に戻り、新しいビットシーケンスが、参照される。
ステップ22におけるテーブル検索は、2つのステップにおいて実行されてもよい。まず最初に、テーブル検索は、ビットシーケンス内の最初の8ビットに対してなされる。この検索は、通常のJPEG画像のほとんどの検索においてハフマン符号の第1の部分を決定するのに十分なものである。第1のテーブル検索が、第1のハフマン符号の第1の部分を決定するのに十分なものであれば、この時点において、最後の8ビットは、さらには解析されない。ハフマン符号の第1の部分が、8ビットよりも長ければ、さらなるテーブル検索が、必要である。そして、第1のテーブル検索は、新しいテーブルへのポインターをもたらし、最後の8ビットの検索がなされなければならない。ポインターは、ビットシーケンスの最初の8ビットに依存する。そして、第2のテーブル検索が、ハフマン符号のビット数とスキップされる係数の数とを決定する。第2のテーブル検索は、異なるテーブルにおいて、あるいは、同じテーブルの異なる部分において、なされてもよい。8ビットよりも長いハフマン符号の最初の8ビットは、ほんの少数の変形しか存在しない。したがって、第2のテーブルにおけるエントリーの数は、限られ、65,536(すなわち、16ビットシーケンスの最大総数)よりもかなり少ない。
あるいは、ステップ22におけるテーブル検索は、1つのステップにおいて実行される。そして、テーブル検索は、16ビット符号に対して実行される。このテーブル検索は、場合によっては、2つかまたはそれ以上のハフマン符号に関する情報をもたらしてもよい。したがって、ビットシーケンスが、いくつかのハフマン符号の第1の部分を備える場合、これらのハフマン符号は、同時にスキップされてもよい。また、8ビットを検索しているとき、いくつかのハフマン符号を同時にスキップすることも可能である。しかしながら、必要な情報を8ビットで提供するほど十分に短いハフマン符号は、ほんの少数しか存在しない。
ここで、図4を参照して、この画像表現形式によって記憶されたディジタル画像の特定の部分を読み込む方法を説明する。
まず最初に、ステップ40において、画像における対象の位置または領域が、定められる。そして、ステップ42において、定められた位置または領域に対応する適切な1つの画像ブロックまたは複数の画像ブロックが、左上角からそれぞれ右および下へのずれを一連の画像ブロックにただ単に相関させることによって決定される。その後に、ステップ44において、ビットストリーム内の適切な1つの画像ブロックまたは複数の画像ブロックが、ブロック情報テーブルを検索することによって、決定される。さらに、ステップ46において、適切な1つの画像ブロックまたは複数の画像ブロックのDC係数が、ブロック情報テーブルから検索される。次に、ステップ48において、ビットストリーム内の位置が、アクセスされ、ステップ50において、この位置に存在する画像ブロックが、検索されたDC係数を用いて、復号化される。
ここで、図5を参照して、画像表現形式で記憶されたディジタル画像を処理および操作するための方法を説明する。ディジタル画像の処理および操作は、それを携帯電話において実行してユーザにリアルタイムに表示することができるほど迅速なものである。したがって、ユーザは、実行されるべき操作を定義し、そして、それらが数秒以内に実行されるのを見ることができる。
まず最初に、ユーザは、表示されるべき画像または画像部分を定義してもよい。画面上に表示するために画像を迅速に復号化するのを可能にするために、少ない一組のハフマン符号化係数だけが、データユニットごとに復号化される。少ない一組の係数は、低い解像度で画像を近似するのに使用されてもよく、あるいは、より少ない画素で画像を表示するのに使用されてもよい。復号化されるAC係数の数は、適切には、一つもなくてもよく、8×8画素の画像ブロックを1画素または4画素に減少させ、画像ブロックを2×2画素または24画素に減少させ、画像ブロックを4×4画素に減少させる。画像ブロックを4×4画素に減少させる場合、4×4画素の画像ブロックを近似するために、より少ない数のAC係数が、復号化されてもよい。したがって、例えば、9個、13個、または、18個の係数が、復号化されてもよい。それぞれの画像ブロックの主要な情報は、最初の係数に配置されるので、非復号化係数において失われた情報は、それほど意義のあるものではない。
この画像表現形式のおかげで、少ない一組のハフマン符号化係数は、画像または画像部分を表示するために、きわめて迅速に検索され、復号化されることが可能である。まず最初に、ステップ60において、復号化されるべき画像ブロックが、決定される。ステップ62において、それぞれの画像ブロックが、ブロック情報テーブル内のインジケータを用いて、アクセスされる。また、ステップ64において、それぞれの成分の第1のデータユニットのDC係数が、ブロック情報テーブルによって提供される。そして、ステップ66において、所望の数のAC係数が、復号化される。その後に、ステップ68において、画像ブロックの次のデータユニットが、例えば、隣接するデータユニット内に存在する最初のAC係数間のビット数を指示する情報を使用して、残りのAC係数をスキップすることによって、迅速に検索される。ここで、次のデータユニットが、復号化されてもよい。このように、画像は、画面上に表示するために、きわめて迅速に復号化され、ユーザをいらいらさせる待ち時間を減少させる。これは、携帯電話のような小さな処理能力および小さな記憶空間を備えた装置を使用する場合にとりわけ有益である。
そして、ユーザは、画面上に表示される画像に施されるべき操作を定義してもよい。ここで、操作に必要とされる計算が、少ない一組のハフマン復号化係数に施されてもよい。
したがって、計算をより迅速に実行することができ、ユーザが長い待ち時間を経験することなく、結果を画面上にリアルタイムに表示することができる。
ここで、図6〜図9を参照して、2つのディジタル画像を圧縮された画像ファイル形式につなぎ合わせるための方法を説明する。図6には、この方法の概略を説明するフローチャートが、示される。図7には、画像をつなぎ合わせる概略図が示され、図8〜図9は、カメラを内蔵した携帯電話のような画像を取り込むための装置でこの方法が実施される場合の様々なステップからなる方法を示す。
まず最初に、ステップ100において、第1のディジタル画像200が、取り込まれ、ディジタル画像の内容は、図8のカメラのファインダー内に示される。そして、取り込まれた画像は、レンズ補正をなすために、また、補正された画像をシリンダ上に投影するために、変換される。このように、取り込まれた画像は、パノラマ画像を生成するために、別の画像とつなぎ合わせられるように適合させられる。そして、ステップ102において、このディジタル画像200の部分Bは、図1を参照して説明したような圧縮画像表現形式に圧縮され、画像ブロックは、画像内におけるそれらの現在の空間的な位置に基づいて、画像内における位置のインデックスを割り当てられる。ステップ104において、画像の他方の部分Aが、後に実行されるべき混合処理のために、記憶される。ユーザが、パノラマ画像を生成したいのであれば、パノラマの方向が、画像を取り込むための装置において定義されてもよい。そして、取り込まれた第1のディジタル画像200の中のパノラマの方向に最も近い部分が、混合のために記憶された部分として、記憶される。
第2の画像が、取り込まれるとき、ステップ106において、第1の画像のこの部分Aが、カメラのファインダー内に表示されてもよい。第1のディジタル画像200の部分は、ファインダー上の第1のレイヤに表示されてもよく、第2の画素のすべては、透明であり、そのために、カメラによって観察されかつファインダー上の第2のレイヤに表示される物体空間は、図9に示されるように、第1のディジタル画像部分の背後にあるように感じられるかもしれない。パノラマが、右側方向に作成される場合、第1のディジタル画像の最も右側の部分は、ファインダーの最も左側の部分に表示される。カメラ自身が、上述したように、レンズ補正および円筒投影をリアルタイムに実行するのであれば、第1の画像の記憶された部分Aは、ファインダー内に簡単に表示されてもよい。しかしながら、カメラによって補正がリアルタイムに実行されない場合、ファインダー内に表示される物体空間をより良好に収容するために、部分Aは、ファインダー内の最も左側の位置に配置されるように逆変換される。したがって、ステップ108において、ユーザは、第1および第2のディジタル画像における対応する物体をファインダー内の重なり合った領域に配置する第2の画像202を取り込むように案内される。そして、取り込まれた画像は、レンズ補正をなすために、また、補正された画像をシリンダ上に投影するために、変換される。
ここで、第2のディジタル画像は、第1のディジタル画像の部分Aに本質的に対応する部分Cを備える。したがって、ステップ110において、カメラは、2つのディジタル画像をお互いに容易に相関させることができ、それによって、2つの画像をお互いに正しくつなぎ合わせることができる。当然ながら、2つのディジタル画像間の相関は、どのような形で得られてもよい。例えば、コンピュータユニットが、計算して2つの画像間の相関を探し出してもよく、あるいは、相関は、例えば、重なり合った領域が存在しない場合、ユーザによって定義されてもよい。相関は、お互いに対しての画像のずれを決定する。
次に、ステップ112において、混合のために記憶された部分Aが、相関に基づいて、第2の画像に混合される。そして、ステップ114において、第2の画像の部分Dが、決定されたずれに基づいて、画像ブロックの正しいインデックスによって、図1を参照して説明したような圧縮画像表現形式に圧縮される。さらに、ステップ116において、さらなる画像がパノラマに取り込まれるときに実行される混合処理のために、第2の画像のもう1つの部分Eが、非圧縮形式で記憶される。図7からわかるように、取り込まれた2つの画像のお互いに対してのずれのために、部分Eは、画像情報をまったく保持しない部分を備えるかもしれない。したがって、画像部分Eの記憶は、記憶された画素がずれのために画像データまたは未知の情報を表現するかどうかを決定するためのメカニズムを有する。この情報は、後に、混合によって使用され、また、相関処理において使用されてもよい。
そして、ステップ118において、さらなる画像をすでにつなぎ合わせた画像につなぎ合わせるために、ステップ106〜116が、必要であれば、反復される。最後に付加される画像は、それの全体が、図1を参照して説明したような画像表現形式に圧縮される。
次に、2つかまたはそれ以上のディジタル画像から形成することのできる最も大きな長方形の画像が、決定され、左上角の長方形の中に完全に収容された第1の画像ブロックが、決定される。そして、ステップ120において、画像表現形式が、連続的なブロックの係数のハフマン符号化ストリームを入力し、決定されたブロックから開始し、決定された最も大きな長方形の画像全体を左から右へかつ上から下へ移動することによって、つなぎ合わせられた画像のJPEG画像ファイルに変換される。このようにして、つなぎ合わせられた大きな画像が、JPEG画像ファイル形式で表現される。ここで、つなぎ合わせられたディジタル画像は、カメラを含む携帯電話の画面上に表示されてもよい。
つなぎ合わせるための方法が、一連のものとして説明され、この方法においては、第1のディジタル画像が、まず最初に、圧縮画像ファイル形式に圧縮され、その後に、第2のディジタル画像が、この圧縮画像表現形式に付加されたが、圧縮画像表現形式が2つの画像を圧縮画像表現形式に直接に取り込むことによって生成されてもよいこと、あるいは、2つのディジタル画像がそれぞれ圧縮画像ファイル表現形式で表現されかつ圧縮画像表現形式による表現を介して1つの大きな画像につなぎ合わせられてもよいことを考えることもできる。
ここで、画像のつなぎ合わせとは対照的に、JPEGベースライン符号化画像をクロッピングする方法を説明する。まず最初に、JPEG画像が、ハフマン符号化データを復号化することによって解析される。この復号化中に、それぞれの画像ブロックへのインジケータおよびデータユニット間に含まれるビット数を指示する情報が、ブロック情報テーブルに記憶される。さらに、それぞれの画像ブロック内に存在するそれぞれの色成分の第1のデータユニットのDC係数が、計算され、ブロック情報テーブルに記憶される。ここで、JPEG画像をクロッピングして、新しいJPEGベースライン符号化表現の画像部分にすることが、まず最初に、クロッピングするのを阻止すべき領域を決定することによって、実行される。この領域のそれぞれの行における最も左側の画像ブロックの場合、DC係数の新しい差分が、ブロック情報テーブル内のDC係数情報を用いて計算されなければならない。その後に、残りの行の表現は、コピーされるべきビット長を決定するためにブロック情報テーブル内のインデックスを用いて、元々のJPEG画像のハフマン符号化データから新しいJPEG画像へビットごとにただ単にコピーされてもよい。したがって、コピーされた新しいJPEG画像をきわめて容易に生成することができる。
JPEG画像のクロッピングが、その代わりに、画像の非圧縮表現に実行されなければならない場合、領域内の画像ブロックが、ブロック情報テーブル内のインデックスを用いて、判定され、かつ、画像の非圧縮表現における正しいに位置に復号化される。復号化は、ブロック情報テーブル内のDC係数を用いて実行され、それによって、ハフマン符号化データ全体は、この場合、復号化されなくてもよい。
さらに、JPEG画像は、画像を処理することによって、操作されてもよく、そして、画像情報は、DCT係数として表現される。JPEG画像を、ここで説明された画像表現形式に変換することによって、操作が、画像ブロックに施されてもよく、そして、それらの画像ブロックは、DCT係数として表現される。したがって、マトリックス処理を用いて、画像は、例えば、回転させられてもよく、あるいは、スケーリングされてもよい。
ここで説明された好ましい実施形態は決して限定するものではないこと、また、添付の特許請求の範囲に定義される保護範囲内において、多くの別の実施形態が可能であることが強調されるべきである。
本発明の実施形態によるディジタル画像を圧縮するための方法のフローチャートである。 本発明の実施形態による画像表現形式の概略図である。 本発明の実施形態による画像表現形式の概略図である。 本発明の実施形態による画像表現形式の概略図である。 ビットストリーム内のデータユニットを解析する方法のフローチャートである。 圧縮画像ファイル形式で記憶されたディジタル画像の特定の部分を読み込むための方法のフローチャートである。 本発明の実施形態による圧縮画像ファイル形式で記憶されたディジタル画像を操作するためにデータユニットを復号化するための方法のフローチャートである。 本発明の実施形態による圧縮画像ファイル形式として2つのディジタル画像をつなぎ合わせるための方法のフローチャートである。 2つのディジタル画像をつなぎ合わせる概略図である。 ディジタル画像を取り込み、そして、圧縮画像ファイル形式としてディジタル画像をつなぎ合わせるための装置のスクリーンショットである。 ディジタル画像を取り込み、そして、圧縮画像ファイル形式としてディジタル画像をつなぎ合わせるための装置のスクリーンショットである。

Claims (10)

  1. 画像のビットストリームのデータユニットに含まれているビットストリームエントリーの第1の部分を解析すること
    前記ビットストリームエントリーの前記第1の部分の前記解析から、前記ビットストリームエントリーで使用されているビット数を決定すること
    前記ビットストリームエントリーで使用されていると決定されたビット数を、スキップすること
    前記データユニットに対してスキップした総ビット数を計算すると共に、前記データユニットに対してスキップした係数の総数を計算する段階と;
    エンドオブブロックシンボルに到達したか否か、および、データユニットの最大数の係数がスキップされた否かを判定し、エンドオブブロックシンボルに到達しておらず、前記最大数の係数もスキップされていない場合には、前記ビットストリームエントリーの次の新しいビットストリームエントリーを解析すること
    特定の次数の隣接する係数間のビット数を示す情報を格納することと;
    含む、方法。
  2. 前記、特定の次数の隣接する係数間のビット数を示す情報は、前記ビットストリームに関連するブロック情報テーブルに格納される、請求項1に記載の方法。
  3. 前記ビットストリームエントリーの前記第1の部分は、ハフマン符号を含んでおり、前記ハフマン符号は、いくつのゼロ係数が現在の係数に先行するか、および、現在の係数の値がどのカテゴリーに入るのかを、表しており
    前記カテゴリーは、前記ビットストリームエントリーの第2の部分のビット数を決定する請求項1または2に記載の方法。
  4. 前記ビットストリームエントリーにおけるビット数が、テーブルを検索することにより決定される請求項に記載の方法。
  5. 前記ビットストリームの開始点から特定の次数の係数までのビットオフセットを示す情報を格納することを、さらに備える、請求項1から4のいずれかに記載の方法。
  6. 前記画像はJPEG標準に基づいて符号化される、請求項1から5のいずれかに記載の方法。
  7. 前記ビットストリームにおける所定数のビットのビットシーケンスを参照することを、さらに備えており
    前記解析は、参照したビットシーケンスのテーブルを検索させることを含んでいる、請求項に記載の方法。
  8. テーブルの検索は、前記ビットシーケンスの最初の8ビットに対してなされ、この最初のテーブルの検索が、ハフマン符号の第1の部分を決定するのに十分でない場合には、更なるテーブルの検索がなされる、請求項に記載の方法。
  9. 前記テーブルの検索は、少なくとも2つのハフマン符号の情報をもたらし、前記スキップは、前記少なくとも2つのビットストリームエントリーのビット数をスキップすることを含む、請求項に記載の方法。
  10. 請求項1から9のいずれかに記載の方法を実行するように構成される、装置。
JP2012007115A 2003-11-18 2012-01-17 ディジタル画像を処理するための方法および画像表現形式 Active JP5238891B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE0303085-5 2003-11-18
SE0303085A SE0303085D0 (sv) 2003-11-18 2003-11-18 Method for creating a compressed digital image representation and image representation format
SE0303204A SE0303204D0 (sv) 2003-11-26 2003-11-27 S method and device for image processing
SE0303204-2 2003-11-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006541087A Division JP4949037B2 (ja) 2003-11-18 2004-11-16 ディジタル画像を処理するための方法および画像表現形式

Publications (2)

Publication Number Publication Date
JP2012110016A JP2012110016A (ja) 2012-06-07
JP5238891B2 true JP5238891B2 (ja) 2013-07-17

Family

ID=34622339

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006541087A Expired - Fee Related JP4949037B2 (ja) 2003-11-18 2004-11-16 ディジタル画像を処理するための方法および画像表現形式
JP2012007115A Active JP5238891B2 (ja) 2003-11-18 2012-01-17 ディジタル画像を処理するための方法および画像表現形式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006541087A Expired - Fee Related JP4949037B2 (ja) 2003-11-18 2004-11-16 ディジタル画像を処理するための方法および画像表現形式

Country Status (6)

Country Link
US (8) US7480418B2 (ja)
EP (2) EP2713619A3 (ja)
JP (2) JP4949037B2 (ja)
KR (3) KR101142584B1 (ja)
RU (1) RU2368005C2 (ja)
WO (1) WO2005050567A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082450B2 (en) 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
WO2005050567A1 (en) 2003-11-18 2005-06-02 Scalado Ab Method for processing a digital image and image representation format
US20080039120A1 (en) * 2006-02-24 2008-02-14 Telmap Ltd. Visual inputs for navigation
US8599841B1 (en) * 2006-03-28 2013-12-03 Nvidia Corporation Multi-format bitstream decoding engine
US8593469B2 (en) * 2006-03-29 2013-11-26 Nvidia Corporation Method and circuit for efficient caching of reference video data
US7884742B2 (en) * 2006-06-08 2011-02-08 Nvidia Corporation System and method for efficient compression of digital data
FI20065754L (fi) * 2006-11-28 2008-05-29 Liquid Air Lab Gmbh Kuvankäsittelymenetelmä
SE531398C2 (sv) * 2007-02-16 2009-03-24 Scalado Ab Generering av en dataström och identifiering av positioner inuti en dataström
SE533185C2 (sv) * 2007-02-16 2010-07-13 Scalado Ab Metod för behandling av en digital bild samt bildrepresentationsformat
WO2008122913A2 (en) * 2007-04-04 2008-10-16 Nxp B.V. Decoder for selectively decoding predetermined data units from a coded bit stream
US8068693B2 (en) 2007-07-18 2011-11-29 Samsung Electronics Co., Ltd. Method for constructing a composite image
US8041147B2 (en) * 2007-07-18 2011-10-18 3DHISTECH Kft; Method for realistic stitching image blocks of an electronically recorded multipart image
US8107754B2 (en) 2007-12-07 2012-01-31 Mediatek Inc. Systems and methods for randomly accessing compressed images
US8977064B2 (en) * 2008-02-13 2015-03-10 Qualcomm Incorporated Rotational transcoding for JPEG or other coding standards
US20090214134A1 (en) * 2008-02-27 2009-08-27 Motorola, Inc. System and method for image data extraction and assembly in digital cameras
WO2010027324A1 (en) * 2008-09-08 2010-03-11 Scalado Ab Method for indexing images and for reading an index of an image
TWI384862B (zh) * 2008-09-19 2013-02-01 Silicon Motion Inc 影像解碼裝置及方法
US8194991B2 (en) 2008-10-20 2012-06-05 Motorola Mobililty, Inc. Out-of-order coding
SE0802657A1 (sv) * 2008-12-23 2010-06-24 Scalado Ab Extrahering av digital information
US20100254617A1 (en) * 2009-04-01 2010-10-07 Qualcomm Incorporated Apparatus and method to rotate an image
EP2483767B1 (en) 2009-10-01 2019-04-03 Nokia Technologies Oy Method relating to digital images
KR101457894B1 (ko) 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
US20110158310A1 (en) * 2009-12-30 2011-06-30 Nvidia Corporation Decoding data using lookup tables
SE534551C2 (sv) 2010-02-15 2011-10-04 Scalado Ab Digital bildmanipulation innefattande identifiering av ett målområde i en målbild och sömlös ersättning av bildinformation utifrån en källbild
TWI401964B (zh) * 2010-04-16 2013-07-11 Altek Corp Image file processing method
CN103189796B (zh) 2010-09-20 2015-11-25 瑞典移动影像股份公司 用于形成图像的方法
JP5247793B2 (ja) * 2010-12-21 2013-07-24 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US9137443B2 (en) 2011-04-26 2015-09-15 Blackberry Limited Fast estimation of binary data length using memory corruption
TWI454150B (zh) 2011-05-06 2014-09-21 Altek Corp 影像檔案的處理方法
EP2716033B1 (en) * 2011-05-27 2019-06-26 Nokia Technologies Oy Image stitching
SE1150505A1 (sv) 2011-05-31 2012-12-01 Mobile Imaging In Sweden Ab Metod och anordning för tagning av bilder
CA2841910A1 (en) 2011-07-15 2013-01-24 Mobile Imaging In Sweden Ab Method of providing an adjusted digital image representation of a view, and an apparatus
US9083977B2 (en) 2012-11-27 2015-07-14 Omnivision Technologies, Inc. System and method for randomly accessing compressed data from memory
RU2606310C2 (ru) * 2015-01-23 2017-01-10 Общество С Ограниченной Ответственностью "Яндекс" Электронное устройство и способ для отрисовки панорамного изображения
KR102430173B1 (ko) 2015-11-24 2022-08-05 삼성전자주식회사 디스플레이 장치
US9930354B2 (en) * 2015-12-11 2018-03-27 Google Llc Skip scanlines on JPEG image decodes
EP4395317A2 (en) 2017-07-28 2024-07-03 Panasonic Intellectual Property Corporation of America Encoding device and encoding method
JP6430086B1 (ja) * 2017-10-05 2018-11-28 三菱電機株式会社 画像提供装置、画像提供方法および画像提供プログラム
GB2567427B (en) 2017-10-06 2020-10-07 Imagination Tech Ltd Data compression
CN111968031B (zh) * 2020-07-14 2024-07-16 浙江大华技术股份有限公司 一种图像拼接方法、装置、存储介质及电子装置

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2005A (en) * 1841-03-16 Improvement in the manner of constructing molds for casting butt-hinges
US2009A (en) * 1841-03-18 Improvement in machines for boring war-rockets
US2010A (en) * 1841-03-18 Machine foe
US4698672A (en) 1986-10-27 1987-10-06 Compression Labs, Inc. Coding system for reducing redundancy
JP2563450B2 (ja) * 1988-03-10 1996-12-11 松下電器産業株式会社 ファイル用画像処理装置
JPH02122767A (ja) * 1988-10-31 1990-05-10 Nec Corp 画像信号の符号化復号化方式
US5001559A (en) 1989-10-12 1991-03-19 International Business Machines Corporation Transform coding using coefficient prediction techniques
JPH0468772A (ja) * 1990-07-04 1992-03-04 Matsushita Electric Ind Co Ltd 画像データ復号装置
US5253053A (en) * 1990-12-31 1993-10-12 Apple Computer, Inc. Variable length decoding using lookup tables
GB9104119D0 (en) * 1991-02-27 1991-04-17 Shaw Richard D Improvements in the manufacture of shaped refractory objects
JP2923700B2 (ja) * 1991-03-27 1999-07-26 株式会社半導体エネルギー研究所 半導体装置およびその作製方法
JPH04358486A (ja) 1991-06-04 1992-12-11 Toshiba Corp 高能率符号化信号処理装置
US5408328A (en) * 1992-03-23 1995-04-18 Ricoh Corporation, California Research Center Compressed image virtual editing system
FR2699122A1 (fr) * 1992-12-11 1994-06-17 Michelin & Cie Procédé d'ajustement de la pression des pneumatiques d'un véhicule.
JPH07336676A (ja) * 1994-06-08 1995-12-22 Oki Electric Ind Co Ltd 画像送信装置、画像受信装置、分散型画像通信システム及び集中型画像通信システム
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
US5802213A (en) * 1994-10-18 1998-09-01 Intel Corporation Encoding video signals using local quantization levels
US5835033A (en) * 1994-11-08 1998-11-10 Canon Kabushiki Kaisha Decoding apparatus and method for coded data
JP3651941B2 (ja) * 1994-11-28 2005-05-25 キヤノン株式会社 画像再生装置
US5809200A (en) * 1995-08-07 1998-09-15 Victor Company Of Japan, Ltd. Video signal recording apparatus
US5682441A (en) 1995-11-08 1997-10-28 Storm Technology, Inc. Method and format for storing and selectively retrieving image data
US5710835A (en) 1995-11-14 1998-01-20 The Regents Of The University Of California, Office Of Technology Transfer Storage and retrieval of large digital images
US5675332A (en) * 1996-02-01 1997-10-07 Samsung Electronics Co., Ltd. Plural-step chunk-at-a-time decoder for variable-length codes of Huffman type
US5854857A (en) 1996-09-26 1998-12-29 Xerox Corporation Using encoding cost data for segmentation and background suppression in JPEG-compressed images
US5838831A (en) * 1996-09-26 1998-11-17 Xerox Corporation Compression of image data with retaining cost data for each compressed image block
US5821886A (en) * 1996-10-18 1998-10-13 Samsung Electronics Company, Ltd. Variable length code detection in a signal processing system
KR100211840B1 (ko) 1997-01-15 1999-08-02 윤종용 디지털 스틸 카메라에서 엄지손톱(thumbnail) 이미지 생성 방법
JPH10215366A (ja) * 1997-01-30 1998-08-11 Dainippon Screen Mfg Co Ltd 圧縮画像データの抽出方法およびその装置
US5963260A (en) * 1997-03-18 1999-10-05 U.S. Philips Electronics North America Corporation Macroblock-level partitioned HDTV video decoder and related method
JPH1118087A (ja) * 1997-06-20 1999-01-22 Olympus Optical Co Ltd 画像データの変換装置および変換方法
CA2310652C (en) * 1997-12-23 2008-07-22 Sarnoff Corporation Partial decoding of compressed video sequences
US6008745A (en) * 1998-02-17 1999-12-28 Sun Microsystems, Inc. Variable length decoding using lookup tables
US6219067B1 (en) * 1998-04-03 2001-04-17 Sarnoff Corporation Measures for characterizing compressed bitstreams
US6219457B1 (en) * 1998-05-26 2001-04-17 Silicon Graphics, Inc. Method and system for decoding data encoded in a variable length code word
US6353682B2 (en) * 1998-09-17 2002-03-05 Xerox Corporation Rotated read-out of JPEG compressed images
US6442302B2 (en) 1998-09-17 2002-08-27 Xerox Corporation Rotated read-out of JPEG compressed images
JP3328211B2 (ja) 1999-02-24 2002-09-24 エヌイーシーマイクロシステム株式会社 データ列制御装置
US6381371B1 (en) 1999-03-17 2002-04-30 Hewlett-Packard Company Method and apparatus for processing image files
US6374278B1 (en) * 1999-03-25 2002-04-16 Intel Corporation Method and apparatus for the generation of statistically random numbers
US6941019B1 (en) * 2000-05-10 2005-09-06 International Business Machines Corporation Reentry into compressed data
US6934417B2 (en) * 2000-12-22 2005-08-23 Texas Instruments Incorporated Transcoding scheme for assistance in image transformations
GB2370741A (en) 2000-12-29 2002-07-03 Nokia Mobile Phones Ltd Display of selected part of compressed image
US6895122B2 (en) 2001-06-25 2005-05-17 Eastman Kodak Company Method and system for determining DCT block boundaries
FR2826823B1 (fr) * 2001-06-27 2003-10-10 Canon Kk Procede et dispositif de traitement d'un signal numerique code
US7483581B2 (en) * 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
JP4856848B2 (ja) * 2001-10-11 2012-01-18 アルテラ コーポレイション プログラマブルロジックリソース上のエラー検出
US6563440B1 (en) * 2001-10-19 2003-05-13 Nokia Corporation Apparatus and method for decoding Huffman codes using leading one/zero string length detection
US6948127B1 (en) * 2001-12-10 2005-09-20 Cisco Technology, Inc. Interface for compressed video data analysis
US6912646B1 (en) * 2003-01-06 2005-06-28 Xilinx, Inc. Storing and selecting multiple data streams in distributed memory devices
WO2005050567A1 (en) 2003-11-18 2005-06-02 Scalado Ab Method for processing a digital image and image representation format
US6956511B2 (en) * 2004-01-06 2005-10-18 Sharp Laboratories Of America, Inc. Multi-symbol/coefficient decode operation for Huffman codes

Also Published As

Publication number Publication date
WO2005050567A1 (en) 2005-06-02
US20090103824A1 (en) 2009-04-23
KR20110115153A (ko) 2011-10-20
EP1685537B1 (en) 2015-04-01
JP2012110016A (ja) 2012-06-07
KR20060124652A (ko) 2006-12-05
US7711195B2 (en) 2010-05-04
US7711205B2 (en) 2010-05-04
US8396306B2 (en) 2013-03-12
JP4949037B2 (ja) 2012-06-06
US20090103823A1 (en) 2009-04-23
US20050152608A1 (en) 2005-07-14
RU2368005C2 (ru) 2009-09-20
US20090097762A1 (en) 2009-04-16
EP2713619A2 (en) 2014-04-02
US20090097761A1 (en) 2009-04-16
US20090097767A1 (en) 2009-04-16
KR101142584B1 (ko) 2012-05-10
RU2006121481A (ru) 2007-12-27
US7831101B2 (en) 2010-11-09
JP2007514345A (ja) 2007-05-31
US7480418B2 (en) 2009-01-20
EP2713619A3 (en) 2015-01-07
KR101089489B1 (ko) 2011-12-02
KR20120031073A (ko) 2012-03-29
EP1685537A1 (en) 2006-08-02
US7720298B2 (en) 2010-05-18
US20100172592A1 (en) 2010-07-08
US7853090B2 (en) 2010-12-14
US7965897B2 (en) 2011-06-21
US20110194781A1 (en) 2011-08-11

Similar Documents

Publication Publication Date Title
JP5238891B2 (ja) ディジタル画像を処理するための方法および画像表現形式
US8121428B2 (en) Accelerated image rendering
CN111510643B (zh) 全景图和特写图的拼接***及方法
US8306346B2 (en) Static image compression method and non-transitory computer readable medium having a file with a data structure
EP0833518A2 (en) Compression of image data with associated cost data
JP2008166895A (ja) 映像表示装置及びその制御方法、プログラム、記録媒体
CN101635853B (zh) 处理数字图像的方法
WO2008065249A1 (en) Image processing method
US20090317007A1 (en) Method and apparatus for processing a digital image
KR100487330B1 (ko) 디지털 비디오의 썸네일 영상 생성 장치
JP2006333299A (ja) 符号化装置および符号化方法並びに画像形成装置
SE528172C2 (sv) Metod för behandling av en digital bild och bildrepresentationsformat
US20110286663A1 (en) Method And Apparatus Of Color Image Rotation For Display And Recording Using JPEG
KR100777286B1 (ko) 다수개의 정지영상 빠른 검색 장치 및 방법
JP2001238086A (ja) 画像処理装置およびその方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120706

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120828

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20121003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20121003

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20121003

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121024

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20121119

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20121120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250