JP6613720B2 - 画像処理装置、プログラム及び方法 - Google Patents

画像処理装置、プログラム及び方法 Download PDF

Info

Publication number
JP6613720B2
JP6613720B2 JP2015166836A JP2015166836A JP6613720B2 JP 6613720 B2 JP6613720 B2 JP 6613720B2 JP 2015166836 A JP2015166836 A JP 2015166836A JP 2015166836 A JP2015166836 A JP 2015166836A JP 6613720 B2 JP6613720 B2 JP 6613720B2
Authority
JP
Japan
Prior art keywords
unit
block
information
conversion
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015166836A
Other languages
English (en)
Other versions
JP2017046164A (ja
Inventor
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015166836A priority Critical patent/JP6613720B2/ja
Priority to US15/178,204 priority patent/US10356424B2/en
Publication of JP2017046164A publication Critical patent/JP2017046164A/ja
Application granted granted Critical
Publication of JP6613720B2 publication Critical patent/JP6613720B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)

Description

この発明は、画像処理装置、プログラム及び方法に関し、例えば、動画像を構成する画像の符号化処理(圧縮処理)に適用し得る。
近年、監視カメラシステムの普及は進み、さらなる高フレームレート化、高解像度化、多視点化も望まれている。しかし、監視カメラシステムにおいて、高フレームレート化、高解像度化、多視点化が進むと、動画像のデータ量増大を引き起こし、通信コストやストレージコストの増加を招く。この問題を緩和するため、たとえば、従来、特許文献1では、人物画像の動画像より顔領域を検出し、顔領域の圧縮に多くのビット数を配分する方式が提案されている。
従来、特許文献1、2により、注目領域以外の領域に低域通過フィルタによるフィルタリングをおこない、高周波成分を除くことで情報量を削減することが提案されている。
特許文献1に記載された装置では、入力画像と注目領域を示す注目領域情報とに基づいて、注目領域以外の領域に、低域通過フィルタによるフィルタリングをおこない、高周波成分を除いた画像をさらに圧縮(例えば、JPEGやH.264、H.265などの方式で圧縮)することで、動画像のストリームを出力する。
特許文献2に記載された装置では、画像圧縮を行う圧縮部に与えるパラメータを制御することで、非注目領域の情報量を削減する構成が採用されている。
特開平04−219089号公報 特開2009−49979号公報
特許文献1に記載された装置では、低域通過フィルタを用いることで、情報量を削減しつつ、ブロック境界に発生するアーティファクトの発生を抑制するという効果を生み出している。特許文献1に記載された低域通過フィルタによる高周波成分の削減は、画像全体を周波数領域に変換した上で高周波成分の振幅を小さくする処理に相当する。しかしながら、従来の多くの画像圧縮方式(動画像圧縮方式)では、ブロックごとに周波数領域に変換して圧縮するため、仮に画像全体に対して低域通過フィルタを用いて高周波成分の振幅をゼロにしたとしても、ブロック単位の周波数領域では確実に高周波成分の振幅がゼロになるわけではない。それ故に、従来の画像圧縮方式ではアーティファクトの発生を抑制できているわけである。しかしながら、例えば、監視カメラ画像の場合、エンターテイメント映像のように映像全体の品質が重要視される場合と異なる。すなわち、監視カメラ画像のように、アーティファクトが大きな問題にならない用途の場合、効率よく確実にデータ量を削減することの方が重要視される傾向にある。
また、特許文献2に記載された装置のように、圧縮部が提供する機能を用いて情報量を削減すれば、効率よく確実にデータ量を削減することが可能であるが、圧縮部が当該機能を実装していることが前提となる。従来の動画像圧縮処理の規格に基づく装置では、領域ごとに品質を制御する機能を備えていても、実際には当該機能が実装されていないケースもある。特に、圧縮部がハードウェアとして提供されている場合、当該機能を追加することは困難である。
以上のような問題に鑑みて、動画像を構成する各画像の前処理を行う際に、後段の圧縮処理の処理内容に依存せずに効率的に情報量を削減することができる画像処理装置、プログラム及び方法が望まれている。
第1の本発明の画像処理装置は、(1)入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給する前処理部を備え、(2)前記前処理部は、(2−1)前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成する変換部と、(2−2)前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定する注目ブロック判定部と、(2−3)前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力する情報量削減部とを有し、(3)前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減することを特徴とする。
第2の本発明の画像処理プログラムは、コンピュータを、(1)入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給する前処理部として機能させ、(2)前記前処理部は、(2−1)前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成する変換部と、(2−2)前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定する注目ブロック判定部と、(2−3)前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力する情報量削減部とを有し、(3)前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減することを特徴とする。
第3の本発明は、画像処理方法において、(1)前処理部を備え、(2)前記前処理部は、入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給し、(3)前記前処理部は、変換部、注目ブロック判定部、及び情報量削減部を備え、(3−1)前記変換部は、前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成し、(3−2)前記注目ブロック判定部は、前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定し、(3−3)前記情報量削減部は、前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力し、(4)前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減することを特徴とする。
本発明によれば、動画像を構成する各画像の前処理を行う際に、後段の圧縮処理の処理内容に依存せずに効率的に情報量を削減する画像処理装置を提供することができる。
第1の実施形態に係る画像符号化システムの機能的構成について示したブロック図である。 第1の実施形態に係る画像符号化システムの動作について示したフローチャート(その1)である。 第1の実施形態に係る画像符号化システムの動作について示したフローチャート(その2)である。 第1の実施形態に係る注目ブロック判定部の判定方法の例について示した説明図である。 第2の実施形態に係る画像符号化システムの機能的構成について示したブロック図である。 第2の実施形態に係る画像符号化システムの動作について示したフローチャート(その1)である。 第2の実施形態に係る画像符号化システムの動作について示したフローチャート(その2)である。 第2の実施形態に係る画像符号化システムの動作について示したフローチャート(その3)である。
(A)第1の実施形態
以下、本発明による画像処理装置、プロラム及び方法の第1の実施形態を、図面を参照しながら詳述する。以下では、本発明の画像処理装置、プログラム及び方法を画像符号化システムに適用する例について説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る画像符号化システム10の機能的構成について示したブロック図である。
画像符号化システム10は、入力画像(入力画像のデータ)が入力される毎に当該入力画像について圧縮処理(符号化処理)を行い、ストリームデータとして出力する処理を行う。また、画像符号化システム10は、入力画像の圧縮処理にあたって、付加情報として、注目度合(重要度合)の高い領域が記述された注目領域情報と、後段で圧縮処理(符号化処理)を行う際の圧縮方式(符号化方式)が記述されたコーデック種別を含む情報を利用する。すなわち、画像符号化システム10は、入力画像とともに付加情報の入力を受け、付加情報を利用して入力画像の圧縮処理を行う。
注目領域情報とは、例えば、入力画像が監視カメラ画像である場合には、人間の顔の部分の領域等、重要な領域を示す情報である。注目領域情報の記述形式は限定されないが、例えば、画素単位で注目領域であるか否かを示すデータを適用するようにしてもよい。注目領域情報の供給元については限定されないものであるが、例えば、画像符号化システム10を含む監視カメラシステム内で生成される人間の顔領域の認識結果を適用するようにしてもよい。
コーデック種別(符号化種別情報)の記述形式についても限定されないものであるが、例えば、「JPEG」や「H.264/AVC」等、所定の複数のコーデック(符号化方式)のいずれかを示す情報(具体的なデータ形式については限定されない)であるものとする。コーデック種別の供給元の構成については限定されないものであるが、例えば、予め設定された内容が供給されるようにしてもよいし、ユーザの設定に応じた情報が供給されるようにしてもよいし、後述する圧縮部30から供給されるようにしてもよい。
画像符号化システム10は、大別すると、前処理部としてのプレフィルタ部20と、符号化処理部としての圧縮部30とを有している。
画像符号化システム10は、例えば、プロセッサ及びメモリを有するコンピュータ(プログラムの実施構成)にプログラム(実施形態に係る画像処理プログラム)をインストールすることにより実現してもよい。また、画像符号化システム10は、一部又は全部の構成要素についてハードウェア(例えば、専用の半導体チップや電気回路)を用いて構成するようにしてもよい。
プレフィルタ部20は、入力画像と注目領域情報とコーデック種別に基づいて、入力情報に対して情報量を削減する前処理を行い、情報量削減画像を生成する。
圧縮部30は、情報量削減画像を所定の圧縮方式(符号化方式)で圧縮(例えば、JPEG、H.264、H.265等の圧縮方式(符号化方式)で圧縮(符号化))してストリームデータ(ビットストリーム)として出力する処理を行う。
プレフィルタ部20は、変換方法選択部21、注目ブロック判定部22、及び情報量削減部23を有している。
変換方法選択部21は、コーデック種別に基づいて、変換方法やブロックサイズを求め、変換情報として出力するものである。
注目ブロック判定部22は、注目領域情報と変換方法とから、変換ブロックが注目ブロックか否かを判定し、注目ブロック判定結果を出力するものである。
情報量削減部23は、変換情報と注目ブロック判定結果と入力画像とに基づいて、注目領域が含まれない非注目ブロックの情報量を削減し、情報量削減画像を出力する。
情報量削減部23は、変換部231、帯域選択部232、逆変換部233、及び帯域削減部234を有している。
変換部231は、入力画像と変換情報とから、変換情報に基づくブロックサイズで入力画像を分割し、変換情報に基づく変換を施し、変換ブロックを出力する。
帯域選択部232は、変換情報と注目ブロック判定結果と変換ブロックとから、変換情報に基づくブロックサイズ内で、情報量を削減する帯域を選択し、選択結果として出力するものである。
逆変換部233は、変換情報と情報量削減ブロックとから、変換情報に基づく逆変換を施し、情報量削減画像を出力する。
帯域削減部234は、注目ブロック判定結果と変換ブロックと選択結果とから、注目ブロック判定結果が非注目ブロックであることを指しているときに、変換情報に基づくブロックサイズ内で、選択結果に基づき変換ブロックの情報量を削減し、情報量削減変換ブロックを出力する。なお、この実施形態では、変換ブロックのブロックサイズを帯域削減部234に通知するために、変換情報を入力情報として加えているが、ブロックサイズに関する情報を変換ブロックのデータに挿入して帯域削減部234に通知する構成としてもよい。
帯域削減部234は、量子化部234a及び逆量子化部234bを有している。
量子化部234aは、変換情報と注目ブロック判定結果と変換ブロックと選択帯域とから、注目ブロック判定結果が非注目ブロックであることを指しているときに、当該変換情報に基づくブロックサイズ内で、選択結果に基づき、変換ブロックを量子化することで情報量を削減し、量子化ブロックを出力する。
逆量子化部234bは、変換情報と注目ブロック判定結果と選択帯域と量子化ブロックとから、注目ブロック判定結果が非注目ブロックであることを指しているときに、当該変換情報に基づくブロックサイズ内で、選択結果に基づき、量子化ブロックを逆量子化することで情報量削減変換ブロックを出力する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の画像符号化システム10の動作(実施形態に係る画像処理方法)について、図2、図3を用いて説明する。
まず、変換方法選択部21が、入力されたコーデック種別より、変換方法を決定し、変換情報として出力する(S101)。
変換方法選択部21は、例えば、コーデック種別が「JPEG」の場合、変換情報として、DCT(Discrete Cosine Transform)と所定のブロックサイズ(例えば、8×8のブロックサイズ)という変換方法を出力する。また、変換方法選択部21は、例えば、コーデック種別が、H.264/AVCである場合、変換情報として、整数変換と所定のブロックサイズ(例えば、4x4のブロックサイズ)という変換方法を出力する。変換方法選択部21では、例えば、予めコーデック種別に対応する変換情報(変換方法)を登録しておくようにしてもよい。
次に、注目ブロック判定部22が、与えられた変換情報と注目領域情報に基づき、入力画面を構成する各変換ブロック(変換情報で指定されたブロックサイズの各ブロック)が注目ブロック(注目画素を含む変換ブロック)か否かを判定し、注目ブロック判定結果を出力する(S102)。
次に、注目ブロック判定部22が、入力画像を構成する変換ブロックごとの判定方法(注目ブロックか非注目ブロックかを判定する方法)の例について、図4を用いて説明する。
以下では、各変換ブロックにおいて、注目領域に含まれる画素を「注目領域画素」と呼ぶものとする。
注目ブロック判定部22が、各変換ブロックが注目ブロックとなるか非注目ブロックとなるか(注目ブロックとなるか否か)を判定する方法については限定されないものであるが、例えば、1画素でも注目領域画素が含まれる変換ブロックを注目ブロックと判定したり、半数以上の画素が注目領域画素で構成された変換ブロックのみを注目ブロックと判定したり、全ての画素が注目領域画素で構成されている変換ブロックについてのみ注目ブロック判定するようにしてもよい。
図4では、4×4(計16画素)のブロックサイズの3つの変換ブロックB1〜B3を図示している。図4に示すように、変換ブロックB1には注目領域に属する画素は一つも含まれていない。変換ブロックB2には注目領域に属する画素が6個含まれている。変換ブロックB3には注目領域に属する画素が13個含まれている。
例えば、ここで、「半数以上の画素が注目領域画素で構成された変換ブロックのみを注目ブロックと判定」というルールが適用される場合、注目ブロック判定部22は、変換ブロックB3のみを注目ブロックに該当すると判定することになる。
次に、変換部231が、変換情報に基づき入力画像をブロックに分け、変換情報に基づいてブロックごとに変換処理を行い、変換ブロックを出力する(S103)。
たとえば、変換情報として8x8のDCTが指定されている場合、変換部231は入力画像を8x8のブロックに分割し、ブロックごとにDCTを施す。また、例えば、変換情報として4x4の整数変換が指定されている場合、変換部231は入力画像を4x4のブロックに分割し、ブロックごとに整数変換を施す。
次に、帯域削減部234が、与えられた変換情報と変換ブロックに基づき、帯域ごとに当該帯域を削減するか否かの判断を行う。そして、帯域削減部234は帯域ごとに削減するか否かの選択結果を出力する(S104)。
なお、帯域削減部234は、非注目ブロックに限定して、帯域ごとに削減するか否かの判断を行うようにしても良い。
帯域削減部234が削減する帯域を選択するポリシー(ルール)は限定されないものである。帯域削減部234は、例えば、所定の周波数以上の高周波成分にあたる情報を削減する帯域として選択するというポリシーを採用するようにしてもよい。また、帯域削減部234は、例えば、予め定めた闘値よりも小さな振幅を持つ帯域を削減する帯域として選択するというポリシーを採用するようにしてもよい。さらに、帯域削減部234は、例えば、上述の「所定の周波数以上の高周波成分にあたる情報を削減する帯域として選択する」というポリシーと、「予め定めた闘値よりも小さな振幅を持つ帯域を削減する帯域として選択する」というポリシーの両方を採用するようにしてもよい。
次に、量子化部234aが、与えられた変換情報と選択結果に基づき、各変換ブロックを量子化することで情報量を削減し、量子化ブロックとして出力する(S105)。量子化部234aは、非注目ブロックについてのみ、与えられた変換情報と選択結果に基づき、各変換ブロックを量子化することで情報量を削減する処理を行うようにしてもよい。
量子化部234aが量子化を行う具体的手順については限定されないものである。量子化部234aは、例えば、「指定された帯域を予め定められた量子化ステップ幅で量子化する方法」や、「指定された帯域を高周波成分ほど広い量子化ステップ幅で量子化する方法」等を採用するようにしてもよい。
次に、逆量子化部234bが、変換情報と選択結果に基づき、量子化ブロックを逆量子化することで、情報量削減変換ブロックを出力する(S106)。当該逆量子化は、注目ブロック判定結果に基づき、非注目ブロックに属するブロックに対してのみおこなうようにしてもよい。
次に、逆変換部233が、与えられた変換情報に基づき、情報量削減変換ブロックを逆変換し、情報量削減画像を出力する(S107)。
次に、圧縮部30が、情報量削減画像を圧縮し、ストリームを出力する(S108)。
次に、画像符号化システム10(プレフィルタ部20、圧縮部30)が、システム終了か否か(例えば、次の入力画像の有無)を判定し(S108)システム終了でない場合(例えば、次の入力画像が存在する場合)のみ上述のステップS101に戻って次のフレームの処理を行う。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態の画像符号化システム10(プレフィルタ部20)では、入力されたコーデック種別に基づき、入力画像に適切なプレフィルタリング(情報削減処理;前処理)を行う。これにより、第1の実施形態の画像符号化システム10(プレフィルタ部20)では、圧縮部30の圧縮方式(符号化方式)に応じて(圧縮方式に依存せず)適切なプレフィルタリングすることで、非注目領域の情報量を効率よく、かつ確実に削減することができる。
(B)第2の実施形態
以下、本発明による画像処理装置、プロラム及び方法の第2の実施形態を、図面を参照しながら詳述する。以下では、本発明の画像処理装置、プログラム及び方法を画像符号化システムに適用する例について説明する。
(B−1)第2の実施形態の構成
図5は、第2の実施形態に係る画像符号化システム10Aの機能的構成について示したブロック図であり、上述の図1と同一部分又は対応部分には同一符号又は対応符号を付している。
以下では、第2の実施形態の画像符号化システム10Aについて、第1の実施形態との差異を説明する。
画像符号化システム10Aでは、プレフィルタ部20がプレフィルタ部20Aに置き換わり、さらに、符号量計算部40が追加されている。また、プレフィルタ部20Aでは、コーデック種別最適化部25が追加されている。
符号量計算部40は、圧縮部30が出力するストリームから符号量を計算するものである。
コーデック種別最適化部25は、最適なコーデック種別を求め、求めたコーデック種別を変換方法選択部21に供給する。
すなわち、第1の実施形態の画像符号化システム10(プレフィルタ部20)では、外部からコーデック種別の情報が供給されることが前提となっているが、第2の実施形態の画像符号化システム10A(プレフィルタ部20A)では、コーデック種別の情報供給を外部から受けずに、内部(コーデック種別最適化部25)で最適なコーデック種別を決定する。
コーデック種別最適化部25は、符号量計算部40で計算された符号量のフィードバック(供給)を受けて、供給された符号量に基づき最適なコーデック種別を求める。例えば、コーデック種別最適化部25は、複数のコーデック種別の選択肢(例えば、JPEGやH.264/AVC)から、最も符号量(1フレームあたりの符号量)が小さくなるコーデック種別を最適なコーデック種別として決定する。コーデック種別最適化部25は、変換方法選択部21に供給するコーデック種別を切替えながら、フィードバックされる符号量の変化を監視し、最適なコーデック種別(最も符号量が小さくなるコーデック種別)を決定するようにしてもよい。
例えば、コーデック種別最適化部25は、対応する複数のコーデック種別のそれぞれについて、所定のフレーム数分の符号量(それぞれのフレームのデータ量)を取得し、もっとも1フレームあたりの符号量(符号量の平均値)が少ない結果となったコーデック種別を、最適なコーデック種別として決定するようにしてもよい。具体的には、コーデック種別最適化部25は、例えば、コーデック種別としてJPEGを出力して所定のフレーム数分の符号量を取得した後、出力するコーデック種別をH.264/AVCに切替えて、同様に所定のフレーム数分の符号量を取得し、最も符号量の少なかったコーデック種別を最適なコーデック種別として決定するようにしてもよい。
そして、コーデック種別最適化部25は、一旦最適なコーデック種別を決定した後も定期タイミング又は不定期タイミング(例えば、圧縮部30や配信先が変更される等のイベントが発生したタイミング)で、最適なコーデック種別を決定(当初と同様の処理により決定)しなおすようにしてもよい。コーデック種別最適化部25は、例えば、符号量の変化を監視し、符号量が増大した場合等は、再度最適なコーデック種別を決定(当初と同様の処理により決定)しなおすようにしてもよい。
コーデック種別最適化部25が、最適なコーデック種別を決定する際のコーデック種別を切替える順序については、予め設定された順序としてもよいし、ユーザ(例えば、システム管理者等)の設定等に基づいた順序としてもよい。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第1の実施形態の画像符号化システム10の動作例について、図6〜図8を用いて説明する。図6〜図8では、第1の実施形態(上述の図2、図3)と同様の処理については同一のステップ番号(符号)を付している。以下では、第2の実施形態の画像符号化システム10Aについて、第1の実施形態との差異を中心に説明する。
まず、コーデック種別最適化部25により、コーデック種別の初期値が決定され、変換方法選択部21に供給される(S201)。コーデック種別最適化部25におけるコーデック種別の初期値は、例えば、ユーザ(例えば、システム管理者等)により設定された任意の値としてもよい。変換方法選択部21では、コーデック種別最適化部25から供給されたコーデック種別に基づいた動作が行われる。
その後、プレフィルタ部20Aに入力画像及び注目領域情報が供給され、第1の実施形態と同様に前処理(情報量削減処理)及び圧縮処理(符号化処理)が実行される(ステップS101〜S108)。
次に、画像符号化システム10A(プレフィルタ部20A、圧縮部30)が、システム終了か否かを判定し(S202)システム終了でない場合のみ後述するステップS203に移行する。
システム終了でない場合、符号量計算部40は、圧縮部30から出力されるストリームデータから符号量(1フレーム分の符号量)を計算して、コーデック種別最適化部25に供給する(S203)。符号量計算部40が行う符号量の計算方法は限定されないものである。符号量計算部40は、例えば、圧縮部30から出力される1フレーム分のデータ量をカウント(例えば、バイト数やビット数をカウンタにより計数)してもよいし、ストリームデータに埋め込まれている符号量を示す情報そのものから1フレーム分のデータ量を把握するようにしてもよい。
次に、コーデック種別最適化部25は、符号量計算部40から符号量の情報の供給を受け、次のフレーム(入力画像)に適用するコーデック種別を判断し、判断結果に応じたコーデック種別の情報を、変換方法選択部21に供給する(S204)。コーデック種別最適化部25の判断処理の具体例については、上述の「(B−1)第2の実施形態の構成」で説明したとおりである。
そして、画像符号化システム10Aは、上述のステップ101の処理に戻って、次のフレーム(入力画像)の処理に移行する。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
第2の実施形態の画像符号化システム10A(プレフィルタ部20A)では、コーデック種別最適化部25が、符号量計算部40から供給される符号量に基づいて、最適なコーデック種別を判別する。これにより、第2の実施形態では、プレフィルタ部20Aで、圧縮部30の対応するコーデックが不明であったり、圧縮部30で用いられるコーデックが動的に変更するような場合でも、適切なプレフィルタリング(情報量削減処理)を行うことができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)第2の実施例においては、コーデック種別最適化部へ入力する符号量を、圧縮部の出力するストリームから画像符号化システム内部の符号量計算部で計算していたが、例えば、「圧縮機能が遠隔地にあり、遠隔地の圧縮機能からストリームの符号量を得るような構成」や、「圧縮部のストリームを遠隔地で異なる圧縮方式で圧縮しなおし、圧縮しなおした後のストリームの符号量を得るような構成」であっても本発明の効果は得られる。
(C−2)上記の各実施形態において、プレフィルタ部に注目領域情報を入力する構成で説明しているが、非注目領域の情報を入力する構成としてもよい。
(C−3)上記の各実施形態において、情報量削減部、変換部及び逆変換部は、全てのブロックに対して情報削減や変換の処理をおこなうものとして説明しているが、非注目領域に対してのみ、当該処理をおこなうようにしてもよい。この場合、注目領域の処理がおこなわれないことで、演算量の削減効果や変換による画質の劣化を防ぐ効果などが得られる。
(C−4)上記の各実施形態において、本発明の画像処理装置を、圧縮部及びプレフィルタ部を備える画像符号化システムに適用する例について示したが、本発明の画像処理装置では、プレフィルタ部のみ備える装置として実現するようにしてもよい。本発明の画像処理装置において、プレフィルタ部のみ備える構成であったとしても注目領域を際立たせる等の効果は得られる。
(C−5)上記の各実施形態では、帯域削減部で、注目ブロック判定結果に基づき、非注目ブロックであった場合にのみ、帯域削減部に注目ブロック判定結果を入力しているが、注目ブロック判定結果を入力せず、全ブロックで削減する帯域か否かの判定処理をおこなうようにしてもよい。
(C−6)上記の各実施形態の帯域削減部において、選択結果により指定された帯域をゼロを含む一定値にすることで、情報を削減するようにしてもよい。
(C−7)上記の各実施形態において、変換ブロックのブロックサイズを量子化部と逆量子化部に通知するために、変換情報を入力情報として加えているが、ブロックサイズに関する情報を変換ブロックのデータに挿入して量子化部と逆量子化部に通知するようにしてもよい。
(C−8)上記の各実施形態では、変換方法選択部により変換情報を生成するものとして説明したが、予め定められた変換情報に基づき、注目ブロック判定部、情報量削減部及び情報量削減部が動作するようにしてもよい。
(C−9)上記の各実施形態において、情報量削減部23は、たとえば、注目ブロック判定結果が非注目ブロックを指している場合に、ブロック内の平均値やモード値などの代表値を求め、代表値でブロック内を塗りつぶすことで、情報量削減画像を生成してもよい。
10…画像符号化システム、20…プレフィルタ部、21…変換方法選択部、22…注目ブロック判定部、23…情報量削減部、231…変換部、232…帯域選択部、233…逆変換部、234…帯域削減部、234a…量子化部、234b…逆量子化部、30…圧縮部。

Claims (9)

  1. 入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給する前処理部を備え、
    前記前処理部は、
    前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成する変換部と、
    前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定する注目ブロック判定部と、
    前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力する情報量削減部とを有し、
    前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減する
    ことを特徴とする画像処理装置。
  2. 前記注目ブロック判定部は、変換ブロックごとに、注目領域に属する画素の量に応じて注目ブロックであるか非注目ブロックであるかを判定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記符号化処理部が対応する符号化方式に関する符号化種別情報に基づいて、前記変換部の変換方法を決定する変換方法選択部をさらに有し、
    前記変換部は、前記変換方法選択部の選択結果に基づいたブロックサイズで変換処理を行って変換ブロックを生成する
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 最適な符号化種別情報を求め、求めた符号化種別情報を前記変換方法選択部に供給する符号化種別最適化部をさらに備え、
    前記変換方法選択部は、前記符号化種別最適化部から供給された符号化種別情報に基づいて、前記変換部の変換方法を決定する
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記符号化種別最適化部は、前記符号化処理部が出力する符号量を収集し、収集した符号量に基づき、最適な符号化種別情報を求めることを特徴とする請求項に記載の画像処理装置。
  6. 前記符号化種別最適化部は、前記変換方法選択部に供給する符号化種別情報ごとの符号量を収集し、最適な符号化種別情報を求めることを特徴とする請求項に記載の画像処理装置。
  7. 前記符号化種別最適化部は、前記変換方法選択部に供給する符号化種別情報ごとの符号量を収集し、最も符号量の少なくなる符号化種別情報を、最適な符号化種別情報と判断することを特徴とする請求項に記載の画像処理装置。
  8. コンピュータを、
    入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給する前処理部として機能させ、
    前記前処理部は、
    前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成する変換部と、
    前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定する注目ブロック判定部と、
    前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力する情報量削減部とを有し、
    前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減する
    ことを特徴とする画像処理プログラム。
  9. 画像処理方法において、
    前処理部を備え、
    前記前処理部は、入力画像の情報量を削減する前処理を行って前処理後画像を生成し、前処理後画像を符号化して出力する符号化処理部に供給し、
    前記前処理部は、変換部、注目ブロック判定部、及び情報量削減部を備え、
    前記変換部は、前記入力画像を所定のブロック単位に分割して所定の方式で変換処理を行って変換ブロックを生成し、
    前記注目ブロック判定部は、前記入力画像の注目領域又は非注目領域を示す領域情報を保持し、領域情報に基づいて、変換ブロックごとに注目ブロックに該当するか否かを判定し、
    前記情報量削減部は、前記入力画像のうち、注目ブロックと判定されなかった非注目ブロックの情報量を削減し、情報量削減画像として出力し、
    前記情報量削減部は、量子化部と逆量子化部を備え、前記量子化部を用いて非注目ブロックについて量子化し、前記逆量子化部を用いて量子化された非注目ブロックについて逆量子化を行うことで非注目ブロックの情報量を削減する
    ことを特徴とする画像処理方法。
JP2015166836A 2015-08-26 2015-08-26 画像処理装置、プログラム及び方法 Active JP6613720B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015166836A JP6613720B2 (ja) 2015-08-26 2015-08-26 画像処理装置、プログラム及び方法
US15/178,204 US10356424B2 (en) 2015-08-26 2016-06-09 Image processing device, recording medium, and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015166836A JP6613720B2 (ja) 2015-08-26 2015-08-26 画像処理装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2017046164A JP2017046164A (ja) 2017-03-02
JP6613720B2 true JP6613720B2 (ja) 2019-12-04

Family

ID=58096376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015166836A Active JP6613720B2 (ja) 2015-08-26 2015-08-26 画像処理装置、プログラム及び方法

Country Status (2)

Country Link
US (1) US10356424B2 (ja)
JP (1) JP6613720B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240056624A (ko) * 2018-06-03 2024-04-30 엘지전자 주식회사 축소된 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3046379B2 (ja) 1990-03-26 2000-05-29 株式会社東芝 画像符号化装置
JP4107544B2 (ja) 2000-10-23 2008-06-25 三菱電機株式会社 画像信号の再符号化装置
JP2009049979A (ja) 2007-07-20 2009-03-05 Fujifilm Corp 画像処理装置、画像処理方法、画像処理システム、及びプログラム
JP5109697B2 (ja) * 2008-02-07 2012-12-26 ソニー株式会社 画像送信装置、画像受信装置、画像送受信システム、画像送信プログラムおよび画像受信プログラム
US8594467B2 (en) * 2008-12-19 2013-11-26 Microsoft Corporation Interactive virtual display system for ubiquitous devices
JP5302256B2 (ja) * 2010-03-05 2013-10-02 日本放送協会 符号化装置、復号装置及びプログラム
EP2429192A1 (en) * 2010-08-17 2012-03-14 Streamworks International S.A. Video signal processing
US8863222B2 (en) * 2011-05-23 2014-10-14 Broadcom Corporation Multiplexing, synchronizing, and assembling multiple audio/video (A/V) streams in a media gateway
US9426476B2 (en) * 2012-07-09 2016-08-23 Hewlett-Packard Development Company, L.P. Video stream
JP2014216831A (ja) * 2013-04-25 2014-11-17 株式会社東芝 符号化装置および遠隔監視システム
JP6132700B2 (ja) * 2013-08-05 2017-05-24 株式会社日立製作所 画像処理システム、及び、画像処理方法
US9258566B1 (en) * 2014-07-17 2016-02-09 Yahoo! Inc. System and method of spherical image compression
US10021411B2 (en) * 2014-11-05 2018-07-10 Apple Inc. Techniques in backwards compatible multi-layer compression of HDR video
US9769500B1 (en) * 2014-12-11 2017-09-19 Harmonic, Inc. Smart small form-factor (SFP) pluggable transceiver

Also Published As

Publication number Publication date
US20170064337A1 (en) 2017-03-02
JP2017046164A (ja) 2017-03-02
US10356424B2 (en) 2019-07-16

Similar Documents

Publication Publication Date Title
KR20140034149A (ko) 장면에 기초한 적응적 비트 레이트 제어
KR102497153B1 (ko) 안정성 정보 및 트랜션트/확률적 정보의 구별되는 인코딩 및 디코딩
US20130188698A1 (en) Coefficient level coding
US20140016703A1 (en) Methods and devices for controlling spatial access granularity in compressed video streams
US20180367800A1 (en) Adaptive bit rate ratio control
JP2018032921A (ja) 画像処理システム及び画像復号装置
US9325989B2 (en) Automatic temporal layer bit allocation
US10812832B2 (en) Efficient still image coding with video compression techniques
CN112385216A (zh) 用于多行帧内预测的帧内插值滤波器
CN116508091A (zh) 使用后处理控制的视频解码
US8798140B2 (en) Encoding video frames in a video encoder
US9930352B2 (en) Reducing noise in an intraframe appearance cycle
JP6613720B2 (ja) 画像処理装置、プログラム及び方法
JP6806466B2 (ja) 画像符号化装置及びその制御方法
JP7393366B2 (ja) 画像の符号化方法、復号化方法、エンコーダおよびデコーダ
US20170201759A1 (en) Method and device for image encoding and image decoding
WO2020023167A1 (en) Spatial layer rate allocation
KR101347871B1 (ko) 보안 영상 표시 처리 시스템 및 그 제어방법
JP6577426B2 (ja) トランスコードシステム、トランスコード方法、コンピュータ可読記録媒体、復号装置および符号化装置
CN112449185B (zh) 视频解码方法、编码方法、装置、介质及电子设备
US11546401B2 (en) Fast multi-rate encoding for adaptive HTTP streaming
WO2021054437A1 (ja) 画像処理装置および画像処理方法
JP5873290B2 (ja) 符号化装置
CN110636296B (zh) 视频解码方法、装置、计算机设备以及存储介质
Cassidy An Analysis of VP8, a new video codec for the web

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191021

R150 Certificate of patent or registration of utility model

Ref document number: 6613720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150