JP7404640B2 - 符号化装置、復号装置及び画像処理方法 - Google Patents

符号化装置、復号装置及び画像処理方法 Download PDF

Info

Publication number
JP7404640B2
JP7404640B2 JP2019071514A JP2019071514A JP7404640B2 JP 7404640 B2 JP7404640 B2 JP 7404640B2 JP 2019071514 A JP2019071514 A JP 2019071514A JP 2019071514 A JP2019071514 A JP 2019071514A JP 7404640 B2 JP7404640 B2 JP 7404640B2
Authority
JP
Japan
Prior art keywords
image
attention area
area information
information
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019071514A
Other languages
English (en)
Other versions
JP2020170948A (ja
Inventor
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2019071514A priority Critical patent/JP7404640B2/ja
Priority to US16/675,719 priority patent/US11025920B2/en
Publication of JP2020170948A publication Critical patent/JP2020170948A/ja
Application granted granted Critical
Publication of JP7404640B2 publication Critical patent/JP7404640B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号化装置、復号装置及び画像処理方法に関し、例えば、画像又は映像を圧縮符号化し、その符号化された画像又は映像を復号する画像処理システムに適用し得るものである。
近年、監視カメラの普及が進み、さらなる高解像度化、高フレームレート化、多視点化も望まれている。しかし、高解像度化、高フレームレート化、多視点化は、動画像の符号量の著しい増加を引き起こし、通信コストやストレージコストの増加を招く。この問題を緩和するため、動画像より注目領域を検出し、注目領域に多くのビット数を配分する方式が提案されている。なお、ここでは、注目領域が、例えば顔領域等の領域を意図している。以降では、注目領域のことをRegion of Interestの略である「ROI」と呼ぶ。また、注目領域に多くのビット数を配分する方式を「ROI符号化」と呼ぶ。
特許文献1では、符号量と映像品質を制御するパラメータをブロックごとに与えられるというエンコーダの機能を利用して、エンコーダに与えるパラメータをブロックごとに制御することで、ROI以外の領域である非ROIの情報量をROIの情報量よりも削減するシステム構成を提案している。
このようにエンコーダが提供する機能を用いて情報量を削減すれば、効率よく確実に符号量を削減することが可能である。H.264/MPEG-4 AVCやH.265/MPEG-H HEVCのようなメジャーな規格が、領域ごとに映像品質を制御する機能を備えているため、この機能を利用することは、ROIに多くのビット数を配分する代表的な方式と言える。
一方、例えばコストや互換性などの事情により、映像品質制御パラメータをブロックごとに与える機能を有していないエンコーダの利用が不可避の場合、上述の方式を採用することはできない。このような場合でも、エンコーダに依存せず、領域ごとに映像品質を制御可能な技術として特許文献2、非特許文献1が提案されている。
特許文献2は、エンコーダに依存せずに非ROIの情報量を削減するために、非ROIに低域通過フィルタによる前処理を行ない、高周波成分の情報を取り除くことで非ROIの情報量を抑圧することを提案するものである。
非特許文献1は、エンコーダに依存せずに非ROIの情報量を削減するために、非ROIの画素信号のダイナミックレンジを限定するフィルタリングを行なうことで非ROIの情報量を抑圧することを提案するものである。
図13は、非特許文献1に代表される画像処理システムの構成例を図示したものである。
図13において、画像処理システムZは、入力画像を入力とし、入力画像のうちの非ROIに属する画素をROIの情報よりも少ないビット数で圧縮し、ビットストリームとして出力する画像符号化システムX1と、ビットストリームを入力とし、ビットストリームを復号し、出力画像を出力する画像復号システムX2とを有する。
画像符号化システムX1は、入力画像のROI情報を決定し、入力画像にROI情報を紐づけたデータをROI設定画像として出力しつつ、通信路などを介して、画像復号システムX2にROI情報を出力するROI情報設定部U1と、ROI設定画像をROI符号化し、ビットストリームを出力するエンコーダ部U3とを有する。ここで、ROI情報とは、例えば、ROIの数や各ROIの座標情報を含む情報である。
エンコーダ部U3は、例えば、ROI情報に基づき非ROIに属する画素を特定し、入力画像のうちの非ROIに属する画素にダイナミックレンジを限定(抑圧)するためのフィルタリングを施し、プレフィルタ画像として出力するプレフィルタ部405と、H.264/MPEG-4AVC等の画像符号化方式を用いてプレフィルタ画像を圧縮し、ビットストリームを出力するエンコーダコア部406とを有する。
ここで、画素信号のダイナミックレンジを限定する処理には、画素信号を128などの固定値に限定してしまう場合も含む。画素信号を固定値にするとは、ダイナミックレンジを1にすることと等価である。
ROI情報設定部U1は、入力画像に対応するROIを設定する機能であるが、ROIの特定手段に関しては特に限定されない。
例えば、入力画像に対して、顔検出アルゴリズムや人物検出アルゴリズム、ナンバープレート検出アルゴリズム、車体検出アルゴリズム等を適用することで、入力画像の中からROIの位置と大きさを検出することで特定するという方法が考えられる。また例えば、予め手動で入力されたROIの位置と大きさによって特定するという方法も適用するようにしてもよいし、ユーザインタフェースを通して入力されたROIの位置と大きさによって特定する方法を適用するようにしてもよい。さらに例えば、入力画像に対応する赤外線カメラ画像や深度センサ画像などを利用して、ROIを特定するという方法でも良い。
画像復号システムX2は、ビットストリームをエンコーダコア部406に対応する方式で復号し、復号画像を出力するデコーダ部407と、通信路等を介して画像符号化システムX1からROI情報を受け取ることで復号画像のROI情報を読み出し、復号画像にROI情報を紐づけたデータをROI読取画像として出力するROI情報読取部408と、ROI読取画像に基づきポストフィルタを当てて、ポストフィルタ画像を出力するポストフィルタ部409とを有する。
ポストフィルタ部409は、例えば、ROI情報に基づき非ROIに属する画素を特定し、復号画像のうちの非ROIに属する画素にダイナミックレンジを回復するフィルタリング(信号の振幅の増幅に相当)を施すことで、ポストフィルタ画像として出力する。
なお、本例は、画像符号化システムX1が、プレフィルタ部405によって非ROIの情報量をROIの情報量よりも削減する例であるが、画像符号化システムX1のエンコーダ部U3をエンコーダが備える領域ごとに映像品質を制御する機能を利用してROIに多くのビット数を配分するものに換えることで、特許文献1に代表されるROI符号化可能な映像符号化エンジンを組み込んだ構成例となる。
このようにROI符号化可能な映像符号化エンジンを組み込んだ構成例であっても、ポストフィルタ部409は有用である。ROI符号化可能な映像符号化エンジンを使用した場合、例えば、非ROIの量子化ステップ幅が広くなるため、非ROIで多くのブロック歪が発生することになる。この問題への対処として、例えば、非ROIにのみ低域通過フィルタを適用するという方法がある。高品質に符号化されているROIに低域通過フィルタを適用すると、むしろ画質劣化を招くため、雑音の多い非ROIにのみ低域通過フィルタを適用することは有用である。
特開2009-49979号公報 特開平4-219089号公報(特許第3046379号) 特開2009-188792号公報(特許第5109697号)
Filtering Scheme for ROI Cnding by Dynamic Range Compression and Updating Source Picture Filter, Proceedings of the 4th IIAE International Conference on Intelligent Systems and Image Processing 2016
以上のように、エンコーダ部U3を利用し、非ROIとROIとで映像品質を変えることで、ROIに多くのビット数を配分することは可能である。また、ポストフィルタ部409を使用することで非ROIの映像品質を回復することも可能である。
非ROIにポストフィルタをかけることが不可欠または望ましいシステムにおいては、復号画像とROI情報とを同期してポストフィルタ部409に入力することが必要である。ROI情報をビットストリームに多重化可能な環境であれば、同期を取る手段も種々考えられるが、例えば、ブラウザ組み込みの映像通信システムであるWebRTC(Web Real-Time Communication)のように、映像を符号化し通信するシステムや規格が既に固定で与えられており、ビットストリームに変更を加えられないシステムでは、同期を取ることが困難になる。
ROI情報をビットストリームとは別経路で伝送し、画像復号システムX2で復号画像とROI情報の同期を取るという解決手段も考えられるが、異なる経路から来る情報を同期するためには復号画像やROI情報のバッファリングが必要となるため、遅延等の問題が避けられない。
また、片方の経路において、データのロスが起きた場合、復号画像とROI情報の対応関係を整合することも困難になる。
そのため、本発明は、上述した課題に鑑み、ROI情報と復号画像とを同期することなく、当該画像のROI情報を読み取ることができ、通信路等でデータロスが起きた場合でも復号画像とROI情報との対応関係を整合させることができる符号化装置、復号装置及び画像処理方法を提供しようとするものである。
かかる課題を解決するために、第1の本発明に係る符号化装置は、入力画像を符号化する符号化装置において、(1)入力画像に対応する注目領域を設定し、当該入力画像に注目領域情報を紐づけたデータを中間画像として出力する注目領域情報設定実行部と、(2)中間画像における注目領域情報の埋込位置を指定する埋込位置指定部と、(3)埋込位置に従って、中間画像に当該注目領域情報を画素値の形態で埋め込み、注目領域情報を紐づけたデータを、注目領域設定画像として出力する注目領域情報埋込部と、(4)所定の画像符号化方式を用いて、前記注目領域設定画像を符号化して出力する符号化部とを有し、注目領域情報埋込部が、中間画像に注目領域情報が埋め込まれる全ての画素を包含する領域を、埋込位置に従って求めて、当該領域を追加注目領域として注目領域情報に追加し、中間画像に当該注目領域情報を紐づけたデータを、注目領域追加画像として出力する注目領域情報追加部と、埋込位置に従って、注目領域追加画像に、当該注目領域情報を画素値の形態で埋め込み、注目領域情報を紐づけたデータを、注目領域設定画像として出力する注目領域情報埋込実行部とを有することを特徴とする。
第2の本発明に係る復号装置は、画像の注目領域情報を画素値の形態で埋め込まれた上で、当該注目領域画像を紐づけたデータを、所定の画像符号化方式で符号化された符号化画像を復号する復号装置において、(1)符号化画像を復号して復号画像を出力する復号部と、(2)復号画像を解析して、注目領域情報を読み取り、当該復号画像に注目領域情報を紐づけたデータを注目領域情報読取画像として出力する注目領域情報読取部と、(3)注目領域情報読取画像に基づいてポストフィルタを当てて、ポストフィルタ画像を出力するポストフィルタ部とを有し、注目領域情報に、当該注目領域情報の埋込位置を特定する目印が含まれる場合、注目領域情報読取部は、復号画像から目印を探索することで、注目領域情報の埋込位置を特定し、当該埋込位置を解析することで注目領域情報の読み取りを行なうことを特徴とする。
の本発明に係る画像処理方法は、符号化装置と復号装置とを備える画像処理システムの画像処理方法において、(1)符号化装置は、(1-1)注目領域情報設定実行部が、入力画像に対応する注目領域を設定し、当該入力画像に注目領域情報を紐づけたデータを中間画像として出力し、(1-2)埋込位置指定部が、中間画像における注目領域情報の埋込位置を指定し、(1-3)注目領域情報埋込部が、埋込位置に従って、中間画像に当該注目領域情報を画素値の形態で埋め込み、注目領域情報を紐づけたデータを、注目領域設定画像として出力し、(1-4)符号化部が、所定の画像符号化方式を用いて、注目領域設定画像を符号化して出力し、注目領域情報埋込部が、中間画像に注目領域情報が埋め込まれる全ての画素を包含する領域を、埋込位置に従って求めて、当該領域を追加注目領域として注目領域情報に追加し、中間画像に当該注目領域情報を紐づけたデータを、注目領域追加画像として出力し、埋込位置に従って、注目領域追加画像に、当該注目領域情報を画素値の形態で埋め込み、注目領域情報を紐づけたデータを、注目領域設定画像として出力し、(2)復号装置は、(2-1)復号部は、符号化装置からの符号化画像を復号して復号画像を出力し、(2-2)注目領域情報読取部が、復号画像を解析して、注目領域情報を読み取り、当該復号画像に注目領域情報を紐づけたデータを注目領域情報読取画像として出力し、(2-3)ポストフィルタ部が、注目領域情報読取画像に基づいてポストフィルタを当てて、ポストフィルタ画像を出力し、注目領域情報に、当該注目領域情報の埋込位置を特定する目印が含まれる場合、注目領域情報読取部は、復号画像から目印を探索することで、注目領域情報の埋込位置を特定し、当該埋込位置を解析することで注目領域情報の読み取りを行なうことを特徴とする。
本発明によれば、ROI情報と復号画像とを同期することなく、当該画像のROI情報を読み取ることができ、通信路等でデータロスが起きた場合でも復号画像とROI情報との対応関係を整合させることができる。
第1の実施形態に係る画像処理システムの構成を示す構成図である。 第1の実施形態に係る画像符号化装置における画像処理を示すフローチャートである。 第1の実施形態に係る画像復号装置における画像処理を示すフローチャートである。 第1の実施形態に係るROI情報の埋め込み方法を説明する説明図である。 第1の実施形態において統計値の一例を説明する説明図である。 第1の実施形態においてパディングデータの埋め込みの一例を説明する説明図である。 第2の実施形態に係る画像処理システムの構成を示す構成図である。 第2の実施形態に係る画像処理システムにおける画像処理の動作を示すフローチャートである。 第3の実施形態に係る画像処理システムの構成を示す構成図である。 第3の実施形態に係る画像処理システムにおける画像処理の動作を示すフローチャートである。 第3の実施形態における埋込隠蔽処理の一例を説明する説明図である(その1)。 第3の実施形態における埋込隠蔽処理の一例を説明する説明図である(その2)。 従来の画像処理システムの構成を示す構成図である。
(A)第1の実施形態
以下では、本発明に係る符号化装置、復号装置及び画像処理方法の第1の実施形態を、図面を参照しながら説明する。
(A-1)第1の実施形態の構成
[画像処理システム]
図1は、第1の実施形態に係る画像処理システムの構成を示す構成図である。
図1において、第1の実施形態に係る画像処理システム1は、入力画像を符号化してストリーム(ビットストリーム)を出力する画像符号化装置2と、画像符号化装置2で符号化されたストリーム(ビットストリーム)を復号して復号画像を出力する画像復号装置3とを有する。
画像処理システム1において、画像符号化装置2から出力されたストリームを画像復号装置3に入力する媒体は限定されない。例えば、画像符号化装置2から出力されたストリームを、通信回線(例えば、インターネットなどに代表される通信回線など)により画像復号装置3に伝送するようにしても良いし、画像符号化装置2から出力されたストリームのデータをデータ記録媒体(例えば、DVDやHDD等の記録媒体)に記録してオフラインで画像復号装置3に入力するようにしても良い。
この実施形態では、画像符号化装置2は、入力画像毎の符号化を行なうものとして説明するが、画像符号化装置2に、連続して複数の入力画像を処理させることで動画像の符号化処理に適用するようにしても良い。また、画像復号装置3についても同様に、連続して複数の符号化データのストリームを復号処理させることにより、動画像の復号処理に適用するようにしてもよい。
次に、画像符号化装置2の内部構成を説明する。画像符号化装置2は、ハードウェア(例えば、専用の半導体チップ等)で構成するようにしても良いし、一部又は全部を、ソフトウェア的に構成するようにしてもよい。
画像符号化装置2は、大別して、ROI情報設定部U1と、エンコーダ部U3とを有し、前記ROI情報設定部U1は、ROI情報設定コア部(「ROI情報設定実行部」とも呼ぶ。)101と、埋込位置指定部102と、ROI情報埋込部U2とを有し、前記エンコーダ部U3は、プレフィルタ部405と、エンコーダコア部(「エンコーダ実行部」とも呼ぶ。)を有する。
ROI情報設定コア部101は、入力画像のROI情報を決定し、入力画像にROI情報を紐づけたデータを中間画像としてROI情報埋込部U2に出力する。
ROI情報設定部U1は、入力画像に対応するROIを設定する機能であるが、ROIの特定手段に関しては特に限定されない。例えば、入力画像に対して、顔検出アルゴリズムや人物検出アルゴリズム、ナンバープレート検出アルゴリズム、車体検出アルゴリズム等を適用することで、入力画像の中からROIの位置と大きさを検出することで特定するという方法が考えられる。また例えば、予め手動で入力されたROIの位置と大きさによって特定するという方法も適用するようにしてもよいし、ユーザインタフェースを通して入力されたROIの位置と大きさによって特定する方法を適用するようにしてもよい。さらに例えば、入力画像に対応する赤外線カメラ画像や深度センサ画像などを利用して、ROIを特定するという方法でも良い。
埋込位置指定部102は、中間画像に埋め込むROI情報の埋込位置を、ROI情報埋込部U2に指定する。
ROI情報埋込部U2は、埋込位置指定部102により指定された埋込位置に従って、ROI情報を画素値の形態で中間画像に埋め込んだ上で、さらにROI情報を紐づけたデータをROI設定画像としてエンコーダ部U3に出力する。
なお、ROI情報の埋込位置や、ROI情報の埋込方法等については、動作の項で詳細に説明する。
プレフィルタ部405は、ROI情報設定部U1からROI設定画像を取得し、ROI情報に基づき非ROIに属する画素を特定し、入力画像のうちの非ROIに属する画素にダイナミックレンジを限定(抑圧)するためのフィルタリングを施し、プレフィルタ画像として出力する。ここで、画素信号のダイナミックレンジを限定する処理には、画素信号を128などの固定値に限定してしまう場合も含む。画素信号を固定値にするとは、ダイナミックレンジを1にすることと等価である。
エンコーダコア部406は、例えばH.264/MPEG-4AVC等の画像符号化方式を用いて、プレフィルタ部405からのプレフィルタ画像を圧縮し、ビットストリームを出力する。
次に、画像復号装置3の構成を説明する。画像復号装置3も、ハードウェア(例えば、専用の半導体チップ等)で構成するようにしても良いし、一部又は全部を、ソフトウェア的に構成するようにしてもよい。
画像復号装置3は、デコーダ部407と、ROI情報読取部408と、ポストフィルタ部409とを有する。
デコーダ部407は、エンコーダコア部406に対応する方式で、入力されたストリームを復号し、復号画像をROI情報読取部408に出力する。
ROI情報読取部408は、デコーダ部407からの復号画像を解析して、ROI情報を読み取り、復号画像にROI情報を紐づけたデータをROI読取画像としてポストフィルタ部409に出力する。なお、ROI情報の読み取り方法の詳細な説明は、動作の項で行なう。
ポストフィルタ部409は、ROI読取画像に基づきポストフィルタを当てて、ポストフィルタ画像を出力する。
(A-2)第1の実施形態の動作
次に、第1の実施形態に係る画像処理システム1における画像処理方法の動作を説明する。以下では、画像符号化装置2と画像復号装置3における画像処理の動作を各々分けて説明する。
(A-2-1)画像符号化装置の動作
図2は、画像符号化装置2における画像処理動作を示すフローチャートである。
[ステップS101]
ROI情報設定コア部101は、入力画像のROI情報を決定し、入力画像にROI情報を紐づけたデータを中間画像として出力する。
ここで、ROI情報とは、ROI数や各ROI座標情報やフレームタイプ等を含む情報である。ROI座標情報とは、例えば、各ROIの場所を表す情報であり、例えば、画像における座標位置や範囲、大きさ等を表す情報である。
フレームタイプとは、例えば、1枚以上で構成される画像群のうち、それぞれの画像が、「画像全体がROIで構成されるキーフレームと呼ばれる画像」と「それ以外の非キーフレームと呼ばれる画像」とに分類されるような場合に、フレームタイプは、キーフレームと非キーフレームを区別する情報とすることができる。ただし、フレームタイプは、後述するように本発明の効果をさらに促進するためのものであり、フレームタイプがROI情報の一部でない場合も、本発明の効果はある。
[ステップS102]
埋込位置指定部102は、ROI情報埋込部U2に対して埋込位置の起点座標を指定する。
例えば、最も単純には、埋込位置指定部102が、画像座標系における原点を、埋込位置の起点座標として指定する。画像座標系の原点が、画像の左上隅の画素に設定されている場合、画像の左上隅の画素を、ROI情報埋め込みの起点に指定することになる。
埋込位置については、画像中の任意の場所であっても本発明の効果はあるが、特に画像の右下隅が最も望ましく、次いで左下隅や右上隅が好ましい。この理由については後述する。
なお、ステップS101とS102の処理の順序を逆にした場合でも本発明の効果はある。
[ステップS103]
ROI情報埋込部U2は、ROI情報に基づいて、フレームタイプが非キーフレームであるか否かを判定する。そして、フレームタイプが非キーフレームである場合、ROI情報埋込部U2は、指定された埋込位置に、目印とROI情報を画素値の形態で埋め込み、ROI設定画像として出力する。目印とROI情報の中間画像への埋め込み方法の詳細については後述する。
なお、上述した通り、フレームタイプを使用しない場合も本発明の1つの構成である。この場合は、全画像が非キーフレームに相当し、全画像に対して埋込処理を行なう。つまり、全画像が非キーフレームであるとみなして、その全画像において指定された位置に、少なくともROI情報を埋め込むようにしてもよい。
また、目印に関しては、画像復号装置3のROI情報読取部408において、ROI情報の埋込位置を特定したり、フレームタイプを判定したりすることを目的に埋め込む。そのため、前述したフレームタイプという概念を使用しない場合でも、ROI情報の埋込位置をROI情報読取部408に伝える目的で目印を埋め込んでも良い。
また、もし、フレームタイプという概念を使用せず、なおかつ、画像符号化装置2と画像復号装置3との間で、ROI情報の埋込位置を所定の位置にするなどによって、埋込位置が共有できているならば、目印を埋め込む必要はなく、ROI情報のみを所定の位置に埋め込めば良い。
[ステップS104]
プレフィルタ部405は、ROI情報に従って、非ROIに属する画素を特定し、例えば非ROIに属する画素にダイナミックレンジを限定するフィルタリングを施し、プレフィルタ画像として出力する。
ダイナミックレンジを限定するフィルタリングの一例は、非特許文献1に記載のものである。
なお、フレームタイプが存在する場合、本処理は、フレームタイプが非キーフレームであった場合に限定しても良い。
[ステップS105]
エンコーダコア部406は、例えばH.264/MPEG-4 AVC等の画像符号化方式を用いて、プレフィルタ画像を圧縮し、ビットストリームを出力する。
なお、ステップS104、S105は、前述の特許文献1に代表されるエンコーダが備える領域ごとに映像品質を制御する機能を利用してROIに多くのビット数を配分するものを使用する処理に変更しても本発明の効果はある。
(A-2-2)画像復号装置3の動作
次に、画像復号装置3の動作について説明する。図3は、画像復号装置3における画像処理を示すフローチャートである。
[ステップS201]
デコーダ部407は、画像符号化装置2から出力されたビットストリームを受け取り、例えばH.264/MPEG-4 AVC等の画像符号化方式を用いて復号し、復号画像を出力する。
[ステップS202]
ROI情報読取部408は、デコーダ部407からの復号画像を解析することで、復号画像に目印が存在するかどうかを判定し、目印が存在する場合、非キーフレームであると判定するとともに、ROI情報を読み取り、復号画像にROI情報を紐づけたデータを、ROI読取画像として出力する。復号画像に埋め込まれているROI情報の読み取り方法の詳細については後述する。
なお、先に説明したとおり、フレームタイプを使用しない場合も本発明の1つの構成であるが、この場合はフレームタイプの判定は実施せず、全画像に対してROI情報の読取処理を行なう。
前述のとおり、目印は、ROI情報読取部408において、ROI情報の埋込位置を特定できるようにすることも目的の1つである。そのため、ROI情報読取部408は、目印を画像中から探索することで、ROI情報の埋込位置を特定しても良いし、前述のとおり、フレームタイプという概念を使用せず、なおかつ、画像符号化装置2と画像復号装置3との間で、ROI情報の埋込位置を所定の位置にするなどによって埋込位置が共有できているならば、当該所定の位置を利用することで埋込位置を特定しても良い。
以上の方法のいずれかを用いて、ROI情報読取部408は、ROI情報の埋込位置を特定し、当該位置を解析することでROI情報の読み取りをおこなう。
[ステップS203]
ポストフィルタ部409は、ROI情報読取部408により読み取られたROI情報に従って、非ROIに属する画素を特定し、非ROIに属する画素に、例えばダイナミックレンジを回復するフィルタリングを施し、ポストフィルタ画像として出力する。
ダイナミックレンジを回復するフィルタリングの一例は、プレフィルタ部405と同様に非特許文献1に記載されている。
ポストフィルタの例としては、他にも前述した低域通過フィルタや、特許文献3に記載の高解像度化処理を施すステップなど、様々なものが考えられる。
なお、フレームタイプが存在する場合、本処理は、フレームタイプが非キーフレームであった場合に限定しても良い。
(A-2-3)目印及びROI情報の埋め込み方法と読み取り方法
次に、ROI情報埋込部U2による目印やROI情報の埋め込み方法と、ROI情報読取部408による目印やROI情報の読み取り方法を説明する。
ROI情報埋込部U2は、目印やROI情報を、画素値の形態で、中間画像に埋め込む。画素値の形態でのROI情報の埋め込みにおいては、埋め込まれる情報を表現する画素値を、大きさを持った複数の画素群の全てに埋め込む。ただし、複数の画素群は互いに重ならない領域とする。各画素群は、例えば矩形等の領域とすることができる。これにより、後段のエンコード処理による劣化によって埋め込んだ値が劣化することを防止できる。
ただし、エンコード処理に起因する劣化予防効果は得られないが、画素1個によって画素群を構成することも本発明の動作に含む。
目印やROI情報の埋め込みに対応して、画像解析による読み取りにおいては、当該画素群に含まれる1個以上の画素の画素値の統計値から、当該埋め込まれる情報を読み取ることとする。統計値の詳細な説明は後述する。
[目印やROI情報の埋め込み位置]
図4は、第1の実施形態に係るROI情報の埋め込み方法を説明する説明図である。
図4において、「P」は画像全体を示している。この例では、画像Pの右下隅の位置を埋込位置の起点としており、その基点から左方向に向かって、目印やROI情報を順に埋め込んでいく場合を例示している。
例えば、図4において、「50」は、目印やROI情報を含む領域(以下、「情報ROI」とも呼ぶ。)を示している。「51」は、例えばフレームタイプを判定するための目印を埋め込む領域(画素群)、「52」は画素、「53」はROI数を埋め込む画素群、「54」はROI情報のX座標の値を埋め込む領域(画素群)、「55」はROI情報のY座標の値を埋め込む領域(画素群)、「56」はROI情報の大きさに関する横幅を示す値を埋め込む領域(画素群)、「57」はROI情報の大きさに関する高さ(縦幅)を示す値を埋め込む領域(画素群)を例示している。
1画素群に埋め込めるデータ量の理論的な最大量は、画素値のビット数となるため、例えば8ビットで画素値が表現されている場合は、最大で8ビットしか埋め込むことができない。さらに実用的には、後段のエンコード処理で発生する劣化によってROI情報が劣化することを避けるため、8ビットよりも少ないデータ量を埋め込むことになる。
ROI情報を構成する各々のデータが1画素群に埋め込めるデータ量よりも多い場合、1つのデータを1画素群以上に分散して埋め込むことになる。図4の例では、図4中の上方向に向かって1個以上の画素群を用意し、各々のデータを埋め込んでいる。
目印についても同様で、目印はROI情報読取部408が一意に特定できる、画像中で自然には発生する可能性の低いパターンであれば任意のもので良い。図4の例では、濃色と淡色のそれぞれの画素群の一定のパターンの例を示しているが、本例のようなパターンを作るために複数の画素群を使用するにあたっても、上方向に向かって1個以上の画素群を用意している。
また、図4の例では、画像の右下隅に埋め込む場合、画像の右下隅を起点に左方向に向かって各種データや目印を順に埋め込み、上方向に向かって1つのデータを埋め込むための1個以上の画素群を確保することを前提にした例を示しているが、埋込位置によって指定された起点座標から、どの方向に向かって、データを埋め込むかについては種々考えられる。図4に例示したように、どの埋込位置に埋め込むかに応じて、どの方向に向かってデータを埋め込むかを画像処理システム1として予め定めておいても良いし、例えば、目印のパターンを2種類以上用意して、目印のパターンに従って、どの方向に埋め込まれているかを画像処理システム1内で共有することにしても良い。
さらに図4の例では、ROI数や各種座標値をそれぞれ独立したデータとして埋め込んでいるが、ROI情報を、たとえばJSONフォーマットのような文字列フォーマットを使用することで、1つの統合されたデータにして、当該文字列を共有された方向に向かって埋め込んでも良い。
[統計値]
前述の統計値には、例えば、当該画素群を構成する画素の画素値の平均値や、当該画素群を構成する画素の画素値の中央値、当該画素群を構成する画素のうち図5に示すように中央に位置する1個以上の画素の統計値(平均値や中央値)などが考えられる。
前述のとおり、エンコード処理に起因する劣化によって、埋め込まれた画素値が劣化することが想定されるが、統計値を用いて読み取りを行なうことで、この劣化がROI情報を棄損する可能性を下げる。
とりわけ統計値として、中央に位置する1個以上の画素の統計値を使用することで、当該劣化に対して頑健な読み取りをおこなえるようになる。
なぜならば、画像の圧縮過程においては、一般的に、復号画像の品質を高めるために存在する変換量子化やデブロッキングフィルタ等インループフィルタの影響で、ある画素の画素値が近隣画素の画素値に影響を与えるフィルタ効果があり、このフィルタ効果は画素値の形態で表現されたROI情報を棄損する原因の1つになるが、前述の画素群は同じ画素値を持ち、当該フィルタ効果は近隣画素間で発生するため、画素群のうち外郭に位置する画素は周辺画素の影響によって変化するが、画素群のうち中央に位置する画素は外郭に位置する画素に守られ影響を受けにくくなるためである。
[ROI情報の画素値の形態での埋め込み]
次に、ROI情報を画素値の形態で埋め込む及び読み取るに関して、ROI情報埋込部U2がどのような画素値を生成し、ROI情報読取部408がどのように読み取るかを説明する。
どのような画素値を生成し、どのように読み取るかについては種々の方法が考えられるが、例えば、以下の方法が挙げられる。
[方法例1]
画素値のビット数が整数値Nで、埋め込まれる情報がXで、Xのビット数がN以下の整数値nである場合、Nビットのうち上位nビットをXとし、上位から数えて(n+1)ビット目を「1」とし、それ以下のビットを「0」にすることで、埋め込まれる情報を表現する画素値とする。
この場合、画素値または前述のとおり画素群の統計値の上位からnビットを抜き出すことで、埋め込まれた情報Xを読み取ることができる。
上位から数えて(n+1)ビット目を「1」としていることで、前述のフィルタ効果によってROI情報が棄損する可能性を低減している。
具体的には、画素値に対して、2^(N-n-1)より大きな雑音が減算されたり、2^(N-n-1)以上の雑音が加算されたりしない限り、ROI情報は棄損しない。
たとえば、N=8,n=3の場合、埋め込むビット列をxxxとすると、埋め込まれる情報を表現する画素値は、xxx10000という8ビットのデータになる。
この場合、10000より大きな雑音が減算されたり、10000以上の雑音が加算されたりすると、xxxが棄損されるが、それ以外の場合は、xxxは棄損せず保存される。
なお、方法例1の特別なケースとして、n=1の場合は、画素値または前述のとおり画素群の統計値が所定の数(たとえば、0111111や10000000)との比較演算によって、情報Xを読み取ることもできる。
例えば、所定の数値以上の場合X=1と判定し、所定の数値よりも小さい場合X=0と判定する。この場合、プレフィルタ部405で非特許文献1で提案されているダイナミックレンジを限定するフィルタで、0111111または10000000を中心にダイナミックレンジを限定している場合でも、ROI情報が棄損せず伝送できるうえ、ダイナミックレンジを回復する処理を経なくても、ROI情報を読み取ることができる。
[方法例2]
画素値のビット数が整数値Nで、埋め込まれる情報がXで、Xのビット数がN以下の整数値nである場合、中間画像のうち埋め込みをおこなう画素の画素値を「Y」とすると、Yのうち下位nビットを「X」として、上位(N-n)ビットはYの値のまま残すことで、埋め込まれる情報を表現する画素値とする。
この場合、画素値または前述のとおり画素群の統計値の下位からnビットを抜き出すことで、埋め込まれた情報Xを読み取ることができる。
たとえば、N=8,n=3の場合、埋め込むビット列をxxx、中間画像のうち埋め込みをおこなう画素の画素値のビット列をyyyyyyyyとすると、埋め込まれる情報を表現する画素値は、yyyyyxxxという8ビットのデータになる。
方法例2は、下位ビットにROI情報を埋め込むことになるため、方法1に比べると符号化歪や前述のフィルタ効果等の影響を受けやすいという欠点があるが、上位ビットは元の画像の画素値の値になっているため、人の目には識別しづらいというメリットがある。
[方法例3]
画素値のビット数が整数値Nで、埋め込まれる情報がXで、Xのビット数がN以下の整数値nである場合、中間画像のうち埋め込みをおこなう画素の画素値を「Y」、所定の整数値をmとすると、Yのうち下位(n+m)ビットのうち上位nビットを「X」として、上位(N-(n+m))ビットはYの値のまま残し、下位mビットのうちの最上位ビットを1とし、残りのビットを0とすることで、埋め込まれる情報を表現する画素値とする。
この場合、画素値または前述のとおり画素群の統計値の下位から(n+m)ビットのうち上位nビットを抜き出すことで、埋め込まれた情報Xを読み取ることができる。
例えば、N=8,n=3,m=2の場合、埋め込むビット列をxxx、中間画像のうち埋め込みをおこなう画素の画素値のビット列をyyyyyyyyとすると、埋め込まれる情報を表現する画素値は、yyyxxx10という8ビットのデータになる。
方法例3は、方法例1と方法例2の間に位置する方法で、画素値を構成するNビットのうちの中間ビットにXを埋め込む。したがって、特徴も方法例1と方法例2の間となり、画素値の劣化に対しては方法例2より頑健で、人の目には方法例1よりも意味のある画像になるという特徴がある。
他にも周波数空間に変換して、周波数空間上で埋め込むなど種々の派生が考えられるが、画素値に情報を埋め込むという観点では共通であるため、これらを代表して前述の方法例とする。
[埋込位置]
最後に、ROI情報を埋め込む埋込位置は、右下隅がもっとも望ましく、次いで、左下隅や右上隅が好ましい理由を説明する。
後段のエンコーダ部U3において、例えばH.264/MPEG-4 AVCやその類似方式に沿って圧縮を行なう場合、これらの方式は入力画像のサイズを所定の数の倍数、たとえば16の倍数に限定している。そのため、所定の数の倍数ではないサイズの画像を入力した場合、所定の数の倍数にするために、画像の下端や右端にパディングデータを追加する。パディングデータは本質的には意味のないデータであるため、パディングデータに多くの符号量を割くことは避けたい。画像の符号化では、画素間の差分が小さいほどデータ量が少なくなることが一般的であるため、図6に示す例のようにパディングデータは最寄りの画素値のコピーとすることが多い。図6の例では、画像Pにおいて、画像下端に並んでいる各画素値を、下方に3画素分コピーすることで、画像下端に3画素分の画素をパディングデータとして追加している。
今、画像の右下隅に何らかの情報を埋め込んだとすると、入力画像のサイズが所定の数の倍数でない場合、情報を埋め込んだ画素の画素値がパディングデータとしてコピーされることになる。情報を埋め込んだ画素の画素値がパディングデータとしてコピーすることは、情報を埋め込んだ画素の周辺で、情報を埋め込んだ画素と同じ画素が増えることになるため、前述のフィルタ効果によって、埋め込んだ情報が棄損してしまうリスクを低減することができる。
なお、ROI情報埋込部U2は、予め画像のサイズを拡張することで画像中に所定のサイズの埋込領域を設けても良い。本領域には、視聴者にとって意味のある画像情報はなく、たとえば128など、任意の画素値で埋める。たとえば画像の下部に任意画素分の画素を、たとえば画素値128で追加することで、埋込領域を設ける。そのうえで、埋込位置指定部102が、本領域を埋込位置に指定するようにしても良い。
(A-3)第1の実施形態の効果
以上のように、第1の実施形態によれば、ROI情報埋込部U2が画像にROI情報を埋め込み、ROI情報読取部408が、画像解析によって埋め込んだ画素から情報を抽出することによりROI情報を読み取っていることで、ポストフィルタ部409に、同期したROI情報と画像を、バッファリングによる同期なしに入力することができる。その結果、画像復号装置側に画像が届いている限り、画像復号装置側は当該画像のROI情報を読み取れるので、画像とROI情報のいずれか一方のみがデータロスしてしまい、対応関係の整合が取れないという問題も回避することができる。
(B)第2の実施形態
次に、本発明に係る符号化装置、復号装置及び画像処理方法の第2の実施形態を、図面を参照しながら説明する。
(B-1)第2の実施形態の構成
図7は、第2の実施形態に係る画像処理システムの構成を示す構成図である。
第2の実施形態では、図7の画像符号化装置2Aの構成が、図1の第1の実施形態の画像符号化装置2の構成と異なるので、以下では、図1の画像符号化装置2と異なる構成を中心に説明する。
図7において、第2の実施形態に係る画像符号化装置2Aは、ROI情報埋込部U2が、ROI情報追加部203と、ROI情報埋込コア部(「ROI情報埋込実行部」とも呼ぶ。)204とを有する。
ROI情報追加部203は、埋込位置指定部102からROI情報の埋込位置を取得し、その埋込位置に基づいて、ROI情報埋込コア部204により埋め込まれる画素を全て包含する領域を求める。さらに、ROI情報追加部203は、当該領域を情報ROIとしてROI情報に追加し、中間画像にROI情報を紐づけたデータをROI追加画像として出力する。
ROI情報埋込コア部204は、基本的には、第1の実施形態のROI情報埋込部U2と同じ機能を行なうものであり、目印やROI情報を画素値の形態で中間画像に埋め込む。ここで、ROI情報を画素値の形態で埋め込む処理では、ROI情報追加部203からのROI追加画像に対してROI情報を画素値の形態で埋め込んだ上で、さらにROI情報を紐づけたデータをROI設定画像としてエンコーダ部U3に出力する。
(B-2)第2の実施形態の動作
次に、第2の実施形態に係る画像処理システム1Aにおける画像処理方法の動作を、図8を用いて説明する。以下では、第2の実施形態の画像符号化装置2Aにおける動作を中心に説明する。
[ステップS101、S102]
図8に示すように、第1の実施形態と同様に、ROI情報設定コア部101は、入力画像のROI情報を決定し、入力画像にROI情報を紐づけたデータを中間画像として出力し、埋込位置指定部102は、ROI情報埋込部U2のROI情報追加部203及びROI情報埋込コア部204に、埋込位置の起点座標を指定する。
[ステップS111]
ROI情報追加部203は、フレームタイプが非キーフレームであった場合、目印やROI情報が埋め込まれる画素を全て包含する領域を、情報ROIとしてROI情報に追加する。
ROI情報が埋め込まれている画素を全て包含する領域は、ROI情報のデータ量や埋め込み方法などによって変わる。例えば、ROI情報のデータ量や埋め込み方法などを仮定したときの包含する領域の一例を図4に例示している。図4に例示するように、例えば、目印51、画素52、ROI数53、X座標54、Y座標55、横幅56、高さ57の全てを包含する最小サイズの矩形領域を情報ROI50としている。
ここで、フレームタイプがキーフレームであった場合、ROI情報追加部203は、情報ROIをROI情報に追加しても良いし又は追加しなくても良い。いずれの場合でも、本発明の効果はある。この場合は、全画像において情報ROIをROI情報に追加するようにしてもよい。
[ステップS112]
ROI情報埋込コア部204は、フレームタイプが非キーフレームであった場合、埋込位置に、目印とROI情報を画素値の形態で埋め込み、ROI設定画像として出力する。
なお、先に説明したとおり、フレームタイプを使用しない場合も本発明の1つの構成であるが、この場合は第1の実施形態におけるステップS103にて説明したとおり、全画像に対して埋込処理をおこなう。
[ステップS104、S105]
第1の実施形態と同様に、プレフィルタ部405は、ROI情報に従って、非ROIに属する画素を特定し、例えば非ROIに属する画素にダイナミックレンジを限定するフィルタリングを施し、プレフィルタ画像として出力する。また、エンコーダコア部406は、例えばH.264/MPEG-4 AVC等の画像符号化方式を用いて、プレフィルタ画像を圧縮し、ビットストリームを出力する。
なお、この実施形態においては、エンコーダ部U3は、ROIについてはロスレス圧縮を行なうようにすれば、画素値の形態で埋め込んだROI情報を劣化なく、画像を伝送することが可能になるため、本発明の効果は更に確実に得られるようになる。
特に、第1の実施形態の動作の項にて説明した、どのような画素値を生成し、どのように読み取るかについての方法で、方法例2や方法例3を使用する場合においては、ROIについてはロスレス圧縮をおこなう構成とすることで、ROI情報の棄損が避けられるため、有用な構成となる。
(B-3)第2の実施形態の効果
以上のように、第2の実施形態によれば、ROI情報が埋め込まれる画素をROIに設定して画素値の劣化を防止することで、ROI情報が壊れ、異常な動作を引き起こしてしまうことを防止でき、ROI情報と画像の周期を確実に行なうことができる。
特に、特許文献1に代表されるエンコーダが備える領域ごとに映像品質を制御する機能を利用してROIに多くのビット数を配分する場合や、プレフィルタ部405においてダイナミックレンジを限定することでROI符号化を行なうシステムにおいては、画素値の形態で埋め込まれた情報が符号化歪やダイナミックレンジの限定によって大きく劣化することが予想されるため、前述の効果は重要となる。
(C)第3の実施形態
次に、本発明に係る符号化装置、復号装置及び画像処理方法の第3の実施形態を、図面を参照しながら説明する。
(C-1)第3の実施形態の構成
図9は、第3の実施形態に係る画像処理システムの構成を示す構成図である。
第3の実施形態では、図9の画像復号装置3Bの構成が、第1及び第2の実施形態の画像復号装置3の構成と異なるので、以下では、第1及び第2の実施形態の画像復号装置3と異なる構成を中心に説明する。
なお、図9では、画像符号化装置2Aが、図7の第2の実施形態の画像符号化装置である場合を示しているが、図1の第1の実施形態の画像符号化装置とする場合にも適用でき、本発明の効果を得ることができる。
画像復号装置3Bは、第1及び第2の実施形態と同様に、デコーダ部407、ROI情報読取部408、ポストフィルタ部409を備え、これに加えて埋込隠蔽部U4を有する。
埋込隠蔽部U4は、ポストフィルタ部409からのポストフィルタ画像のうち、前記画素値の形態でROI情報が埋め込まれる領域を、画面上から隠蔽する処理を行ない、埋込隠蔽画像として出力する。埋込隠蔽部U4が出力する埋込隠蔽画像は出力画像として出力される。
埋込隠蔽部U4は、例えば、キーフレームを蓄積するキーフレームメモリ311と、キーフレームメモリ311に蓄えられているキーフレームを用いて隠蔽処理を行なう埋込隠蔽コア部(「埋込隠蔽実行部」とも呼ぶ。)310とを有する。
(C-2)第3の実施形態の動作
次に、第3の実施形態に係る画像処理システム1Bにおける画像処理方法の動作を、図10を用いて説明する。以下では、第3の実施形態の画像復号装置3Bにおける動作を中心に説明する。
[ステップS201~S203]
図10に示すように、デコーダ部407は、例えばH.264/MPEG-4 AVC等の画像符号化方式を用いて復号し、復号画像を出力する。
ROI情報読取部408は、デコーダ部407からの復号画像を解析することで、復号画像に目印が存在するかどうかを判定し、目印が存在する場合、非キーフレームであると判定するとともに、ROI情報を読み取り、復号画像にROI情報を紐づけたデータを、ROI読取画像として出力する。
ポストフィルタ部409は、ROI情報読取部408により読み取られたROI情報に従って、非ROIに属する画素を特定し、非ROIに属する画素に、例えばダイナミックレンジを回復するフィルタリングを施し、ポストフィルタ画像として出力する。
[ステップS210]
埋込隠蔽コア部310は、画素値の形態で埋め込まれる領域を画面上から隠蔽する処理を行ない、埋込隠蔽画像として出力する。
[隠蔽処理]
隠蔽する処理とは、フレームタイプという概念を使用する場合、たとえば、図11に示すように、フレームタイプがキーフレームであった場合、キーフレームメモリ311で画像のコピーを記憶し、フレームタイプが非キーフレームであった場合、情報ROIの画素値にキーフレームの対応画素値をコピーすることで、情報ROIを隠蔽し、埋込隠蔽画像として出力する。
なお、本処理をおこなう際は、前記ポストフィルタ部409が、ROI読取画像408で求めたROI情報を、ポストフィルタ画像にも紐づけて出力する。
なお、隠蔽に使用するキーフレームは、非キーフレームに類似の画像であれば任意のものであっても効果を発揮するが、たとえば、これから隠蔽をおこなう非キーフレームに時刻上最も近いキーフレームを用いたり、これから隠蔽をおこなう非キーフレームの前時刻に取得されたキーフレームのうち最も直前に取得されたものを用いたりする方法がある。
なお、第1の実施形態に記載のとおり、本発明では、フレームタイプという概念を使用する場合、キーフレームには目印やROI情報の埋め込みはおこなわず、目印の有無によってフレームタイプを判定しているために、埋込隠蔽部U4は前述の効果を発揮できる。
また、隠蔽する処理とは、たとえば、図12に示すように、ポストフィルタ画像のうち、画素値の形態で埋め込まれる領域を画面上から切り取る処理をおこなうことで埋込隠蔽画像を生成しても良い。
切り取りをおこなう領域は、ROI情報の一つとして伝送するようにしても良い。特に、ROI情報埋込部U2において、第1の実施形態で説明した、画像のサイズを拡張することで画像中に所定のサイズの埋込領域を設け、埋込位置指定部102において本領域を埋込位置に指定した場合、前述の切り取る処理をおこなうことで、本領域を視聴者から隠蔽することができる。
(C-3)第3の実施形態の効果
以上のように、第3の実施形態によれば、埋め込まれた画素値を隠蔽する埋込隠蔽部U4が加わっていることで、視聴者にとって本来不要な画素値の表示を避けることができ、視聴品質を向上することができる。
(D)他の実施形態
上述した第1~第3の実施形態においても種々の変形実施形態を言及したが、本発明は、以下の変形実施形態も適用できる。
(D-1)システムの動作環境において、ROI情報となりうるデータの種類が有限である場合、画像処理システム内にてROI情報とインデックスとを紐づける形でテーブルで管理し、ROI情報埋込部U2が、ROI情報を中間画像に画素値の形態で埋め込む代わりに、インデックスを中間画像に画素値の形態で埋め込んでも良く、この場合、ROI情報読取部408は、復号画像を解析することでインデックスを読み取り、インデックスとテーブルを用いてROI情報を読み取ることになる。
本動作を採用することで、ROI情報のデータ量を削減できるため、埋め込みによる画像の劣化を抑えられるという効果がある。
(D-2)上述したすべての実施形態では、本発明の説明を簡単にするために、画像全体がROIと非ROIの2種類に区別される例を示しているが、非ROIにも重要度の段階があっても良い。たとえば、ROIの設定に歩行者検出アルゴリズムと顔検出アルゴリズムを使用し、顔検出アルゴリズムによって検出されたROIは顔領域として、歩行者検出アルゴリズムによって検出された歩行者領域は相対的に重要な非ROIとし、顔でも歩行者でもない領域は相対的に重要ではない非ROIとしても良い。この場合、非ROI情報のデータ量削減方法として、たとえば、非ROIの重要度に応じて異なるダイナミックレンジに圧縮する動作として良く、たとえば、相対的に重要な非ROIには広いダイナミックレンジで圧縮をおこない、相対的に重要ではない非ROIには狭いダイナミックレンジで圧縮をおこなうという構成でも良い。どの非ROIを、どのダイナミックレンジで圧縮するかは、たとえば予め設定あるいは作成しておいた非ROIの重要度とフィルタ強度のルックアップテーブルに基づいておこなえば良い。また、同じように、本提案書では説明を簡単にするためにROIにはフィルタリングを適用しない例を示しているが、ROIに非ROIよりも弱いフィルタリングをかける構成であっても良い。
(D-3)上述したすべての実施形態において、たとえば顔領域をROIとしたときの非ROIを劣化させデータ量を削減する例を示しているが、顔領域のようにROIとして選ばれる領域を劣化させても良い。この場合、本提案書における言葉の定義上は、非顔領域がROIであり、顔領域が非ROIである。非顔領域をROIとすることで、たとえばプライバシーを守ることができるなどの効果も得られる。
(D-4)上述したすべての実施形態において、機能ブロック間のデータの受け渡しを画像単位でおこなっているように記述しているが、画素値信号のデータの意味を明らかにするためであり、実装等では画素単位にデータを受け渡ししても良い。
(D-5)上述したすべての実施形態において、ROIとは主に画像空間の一部の限定された領域のように記載しているが、画像全体がROIであったり画像全体が非ROIであったりする画像が存在しても良い。
(D-6)上述したすべての実施形態において、画像符号化システムX1内の各機能や画像復号システムX2内の各機能は単一の装置のなかに実装されているように記述しているが、これらは実装例の1つであり、各機能が別の装置で実装されていたとしても、各信号が本提案書の構成図のように入出力がなされていれば本発明の効果はある。つまり、画像符号化システムX1や画像復号システムX2が1個以上の装置から構成され、それぞれの機能が分散して実装されていたとしても本発明の効果はある。
(D-7)上述したすべての実施形態において、色成分ごとの処理の違いについては特別に触れていないが、すべての実施例において色成分ごとに同じダイナミックレンジを使用してもいいし、異なるダイナミックレンジを使用しても良い。
1…画像処理システム、
2及び2A…画像符号化装置、U1…ROI情報設定部、101…ROI情報設定コア部、102…埋込位置指定部、U2…ROI情報埋込部、203…ROI情報追加部、204…ROI情報埋込コア部、U3…エンコーダ部、405…プレフィルタ部、406…エンコーダコア部、
3及び3B…画像復号装置、407…デコーダ部、408…ROI情報読取部、409…ポストフィルタ部、U4…埋込隠蔽部、310…埋込隠蔽コア部、311…キーフレームメモリ。

Claims (17)

  1. 入力画像を符号化する符号化装置において、
    前記入力画像に対応する注目領域を設定し、当該入力画像に注目領域情報を紐づけたデータを中間画像として出力する注目領域情報設定実行部と、
    前記中間画像における前記注目領域情報の埋込位置を指定する埋込位置指定部と、
    前記埋込位置に従って、前記中間画像に当該注目領域情報を画素値の形態で埋め込み、前記注目領域情報を紐づけたデータを、注目領域設定画像として出力する注目領域情報埋込部と、
    所定の画像符号化方式を用いて、前記注目領域設定画像を符号化して出力する符号化部と
    を有し、
    前記注目領域情報埋込部が、
    前記中間画像に前記注目領域情報が埋め込まれる全ての画素を包含する領域を、前記埋込位置に従って求めて、当該領域を追加注目領域として前記注目領域情報に追加し、前記中間画像に当該注目領域情報を紐づけたデータを、注目領域追加画像として出力する注目領域情報追加部と、
    前記埋込位置に従って、前記注目領域追加画像に、当該注目領域情報を画素値の形態で埋め込み、前記注目領域情報を紐づけたデータを、注目領域設定画像として出力する注目領域情報埋込実行部と
    を有することを特徴とする符号化装置。
  2. 前記注目領域情報埋込部は、当該埋込位置を特定する目印を含む前記注目領域情報を、前記中間画像若しくは前記注目領域追加画像に、画素値の形態で埋め込むことを特徴とする請求項1に記載の符号化装置。
  3. 前記注目領域情報設定実行部が、前記入力画像がキーフレームであるか否かを判定させるためのフレームタイプ情報と、前記注目領域の位置を示す座標情報とを含む前記注目領域情報を設定し、
    前記注目領域情報埋込部は、前記入力画像が非キーフレームの場合に、前記埋込位置に従って、前記中間画像若しくは前記注目領域追加画像に、前記注目領域情報を画素値の形態で埋め込む
    ことを特徴とする請求項2に記載の符号化装置。
  4. 当該符号化装置と対向する復号装置との間で、前記注目領域情報となり得る1個以上の実データをインデックスと対応付けたテーブルで管理し、
    前記注目領域情報埋込部は、前記テーブルを用いて、前記注目領域情報に対応するインデックスを、前記中間画像若しくは前記注目領域追加画像に、画素値の形態で埋め込む
    ことを特徴とする請求項1~3のいずれかに記載の符号化装置。
  5. 前記注目領域情報埋込部は、前記中間画像若しくは前記注目領域追加画像に埋め込まれる情報を表現する画素値を、大きさを持った画素群であって、互いに重ならない複数の画素群に埋め込むことを特徴とする請求項1~4のいずれかに記載の符号化装置。
  6. 前記画素値のビット数が整数値Nで、埋め込まれる情報がXであり、Xのビット数がN以下の整数値nである場合に、
    前記注目領域情報埋込部は、Nビットのうち上位nビットをXとし、上位から数えて(n+1)ビット目を1とし、それ以下のビットを0にすることで、埋め込まれる情報を表現する画素値とすることを特徴とする請求項1~5のいずれかに記載の符号化装置。
  7. 前記画素値のビット数が整数値Nで、埋め込まれる情報がXであり、Xのビット数が1である場合に、
    前記注目領域情報埋込部は、Nビットのうち最上位ビットXとし、上位から数えて2ビット目を1とし、それ以下のビットを0にすることで、埋め込まれる情報を表現する画素値とすることを特徴とする請求項6に記載の符号化装置。
  8. 前記画素値のビット数が整数値Nで、埋め込まれる情報がXであり、Xのビット数がN以下の整数値nである場合に、
    前記注目領域情報埋込部は、前記中間画像若しくは前記注目領域追加画像のうち、埋め込みを行なう画素の画素値をYとすると、Yのうち下位nビットをXとして、上位(N-n)ビットはYの値のまま残すことで、埋め込まれる情報を表現する画素値とすることを特徴とする請求項1~5のいずれかに記載の符号化装置。
  9. 前記画素値のビット数が整数値Nで、埋め込まれる情報がXであり、Xのビット数がN以下の整数値nである場合に、
    前記注目領域情報埋込部は、前記中間画像若しくは前記注目領域追加画像のうち、埋め込みを行なう画素の画素値をY、所定の整数値をmとすると、Yの下位(n+m)ビットのうち上位nビットをXとして、上位(N-(n+m))ビットはYの値のまま残し、下位mビットのうちの最上位ビットを1とし、残りのビットを0とすることで、埋め込まれる情報を表現する画素値とすることを特徴とする請求項1~5のいずれかに記載の符号化装置。
  10. 前記埋込位置指定部が、画像の右下隅、左下隅、又は、右上隅のいずれかを、前記埋込位置として指定することを特徴とする請求項1~9のいずれかに記載の符号化装置。
  11. 前記埋込位置指定部が、任意の画素値を追加して、予め画像サイズを拡張した画像中に所定サイズの埋め込み領域を設けることを特徴とする請求項1~9のいずれかに記載の符号化装置。
  12. 画像の注目領域情報を画素値の形態で埋め込まれた上で、当該画像に注目領域情報を紐づけたデータを、所定の画像符号化方式で符号化された符号化画像を復号する復号装置において、
    前記符号化画像を復号して復号画像を出力する復号部と、
    前記復号画像を解析して、前記注目領域情報を読み取り、当該復号画像に前記注目領域情報を紐づけたデータを注目領域情報読取画像として出力する注目領域情報読取部と、
    前記注目領域情報読取画像に基づいてポストフィルタを当てて、ポストフィルタ画像を出力するポストフィルタ部と
    を有し、
    前記注目領域情報に、当該注目領域情報の埋込位置を特定する目印が含まれる場合、
    前記注目領域情報読取部は、前記復号画像から前記目印を探索することで、前記注目領域情報の前記埋込位置を特定し、当該埋込位置を解析することで前記注目領域情報の読み取りを行なうことを特徴とする復号装置。
  13. 前記注目領域情報に、フレームタイプ情報が含まれる場合、
    前記注目領域情報読取部は、前記復号画像に前記目印が含まれているか否かを判定し、前記目印が存在しない場合、当該復号画像がキーフレームであると判定し、前記目印が存在する場合、当該復号画像が非キーフレームであると判定して前記注目領域情報を読み取ることを特徴とする請求項12に記載の復号装置。
  14. 当該復号装置と対向する符号化装置との間で、前記注目領域情報となり得る1個以上の実データをインデックスと対応付けたテーブルで管理し、
    前記注目領域情報読取部が、前記テーブルを用いて、前記復号画像を解析して得たインデックスに対応する前記注目領域情報を読み取ることを特徴とする請求項12又は13に記載の復号装置。
  15. 前記ポストフィルタ画像のうち、画素値の形態で埋め込まれている領域を画面上から隠蔽して得た埋込隠蔽画像を出力画像として出力する埋込隠蔽部を有することを特徴とする請求項12~14のいずれかに記載の復号装置。
  16. 前記埋込隠蔽部が、前記ポストフィルタ画像のうち、前記画素値の形態で埋め込まれる領域を画面上から切り取る処理を行なうことで前記埋込隠蔽画像を生成することを特徴とする請求項15に記載の復号装置。
  17. 符号化装置と復号装置とを備える画像処理システムの画像処理方法において、
    前記符号化装置は、
    注目領域情報設定実行部が、入力画像に対応する注目領域を設定し、当該入力画像に注目領域情報を紐づけたデータを中間画像として出力し、
    埋込位置指定部が、前記中間画像における前記注目領域情報の埋込位置を指定し、
    注目領域情報埋込部が、前記埋込位置に従って、前記中間画像に当該注目領域情報を画素値の形態で埋め込み、前記注目領域情報を紐づけたデータを、注目領域設定画像として出力し、
    符号化部が、所定の画像符号化方式を用いて、前記注目領域設定画像を符号化して出力し、
    前記注目領域情報埋込部が、
    前記中間画像に前記注目領域情報が埋め込まれる全ての画素を包含する領域を、前記埋込位置に従って求めて、当該領域を追加注目領域として前記注目領域情報に追加し、前記中間画像に当該注目領域情報を紐づけたデータを、注目領域追加画像として出力し、
    前記埋込位置に従って、前記注目領域追加画像に、当該注目領域情報を画素値の形態で埋め込み、前記注目領域情報を紐づけたデータを、注目領域設定画像として出力し、
    前記復号装置は、
    復号部は、前記符号化装置からの符号化画像を復号して復号画像を出力し、
    注目領域情報読取部が、前記復号画像を解析して、前記注目領域情報を読み取り、当該復号画像に前記注目領域情報を紐づけたデータを注目領域情報読取画像として出力し、
    ポストフィルタ部が、前記注目領域情報読取画像に基づいてポストフィルタを当てて、ポストフィルタ画像を出力し、
    前記注目領域情報に、当該注目領域情報の埋込位置を特定する目印が含まれる場合、
    前記注目領域情報読取部は、前記復号画像から前記目印を探索することで、前記注目領域情報の前記埋込位置を特定し、当該埋込位置を解析することで前記注目領域情報の読み取りを行なう
    ことを特徴とする画像処理方法。
JP2019071514A 2019-04-03 2019-04-03 符号化装置、復号装置及び画像処理方法 Active JP7404640B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019071514A JP7404640B2 (ja) 2019-04-03 2019-04-03 符号化装置、復号装置及び画像処理方法
US16/675,719 US11025920B2 (en) 2019-04-03 2019-11-06 Encoding device, decoding device, and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019071514A JP7404640B2 (ja) 2019-04-03 2019-04-03 符号化装置、復号装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2020170948A JP2020170948A (ja) 2020-10-15
JP7404640B2 true JP7404640B2 (ja) 2023-12-26

Family

ID=72661965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019071514A Active JP7404640B2 (ja) 2019-04-03 2019-04-03 符号化装置、復号装置及び画像処理方法

Country Status (2)

Country Link
US (1) US11025920B2 (ja)
JP (1) JP7404640B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2578769B (en) 2018-11-07 2022-07-20 Advanced Risc Mach Ltd Data processing systems
EP3893485A4 (en) * 2018-12-06 2021-12-29 Sony Semiconductor Solutions Corporation Reception device and transmission device
GB2583061B (en) * 2019-02-12 2023-03-15 Advanced Risc Mach Ltd Data processing systems
CN113453012B (zh) * 2021-06-25 2023-02-28 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及电子设备
CN113473138B (zh) * 2021-06-30 2024-04-05 杭州海康威视数字技术股份有限公司 视频帧编码方法、装置、电子设备及存储介质
CN114302177B (zh) * 2021-11-18 2024-02-06 中国船舶重工集团公司第七0九研究所 一种面向流媒体存储***的数据安全管理方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002190945A (ja) 2000-10-12 2002-07-05 Canon Inc 情報処理装置及びその制御方法及び記憶媒体
WO2003041405A1 (en) 2001-11-07 2003-05-15 Sharp Kabushiki Kaisha Data reception apparatus
JP2006129447A (ja) 2004-09-29 2006-05-18 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2018032921A (ja) 2016-08-23 2018-03-01 沖電気工業株式会社 画像処理システム及び画像復号装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3046379B2 (ja) 1990-03-26 2000-05-29 株式会社東芝 画像符号化装置
US20070113242A1 (en) * 2005-11-16 2007-05-17 Fetkovich John E Selective post-processing of compressed digital video
US20080008378A1 (en) * 2006-07-07 2008-01-10 Lockheed Martin Corporation Arbitration system for determining the orientation of an envelope from a plurality of classifiers
JP2009049979A (ja) 2007-07-20 2009-03-05 Fujifilm Corp 画像処理装置、画像処理方法、画像処理システム、及びプログラム
JP5109697B2 (ja) 2008-02-07 2012-12-26 ソニー株式会社 画像送信装置、画像受信装置、画像送受信システム、画像送信プログラムおよび画像受信プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002190945A (ja) 2000-10-12 2002-07-05 Canon Inc 情報処理装置及びその制御方法及び記憶媒体
WO2003041405A1 (en) 2001-11-07 2003-05-15 Sharp Kabushiki Kaisha Data reception apparatus
JP2006129447A (ja) 2004-09-29 2006-05-18 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2018032921A (ja) 2016-08-23 2018-03-01 沖電気工業株式会社 画像処理システム及び画像復号装置

Also Published As

Publication number Publication date
US11025920B2 (en) 2021-06-01
JP2020170948A (ja) 2020-10-15
US20200322616A1 (en) 2020-10-08

Similar Documents

Publication Publication Date Title
JP7404640B2 (ja) 符号化装置、復号装置及び画像処理方法
JP6356286B2 (ja) 多視点信号コーデック
US11509913B2 (en) Method and apparatus for video decoding of area of interest in a bitstream
KR102274319B1 (ko) 영상을 부호화하는 방법, 장치, 프로그램 및 영상을 복호화하는 방법, 장치, 프로그램 및 영상 처리 시스템
TWI669939B (zh) 用於立方體面圖框的選擇性濾波的方法和裝置
RU2497196C2 (ru) Способ и устройство для обработки карты глубины
JP7085009B2 (ja) マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置
JP5389172B2 (ja) 深度画像を再構成する方法および深度画像を再構成する復号器
KR20210133193A (ko) 영상 부호화 또는 복호화하기 위한 장치 및 방법
KR20070097366A (ko) 영상 부호화 및 복호화 방법과 장치
KR102468596B1 (ko) 360 영상을 부호화 또는 복호화하기 위한 방법 및 장치
WO2014157386A1 (ja) 動画像符号化装置及び動画像復号装置
US20200304773A1 (en) Depth codec for 3d-video recording and streaming applications
JP7392144B2 (ja) ループフィルタリングを制御するための画像コーディング装置および方法
KR20180101123A (ko) 영상 부호화 또는 복호화하기 위한 장치 및 방법
US11973981B2 (en) Coding and decoding of an omnidirectional video
US11991372B2 (en) Method and apparatus for video decoding of area of interest in a bitstream
JP7043797B2 (ja) 符号化装置及びプログラム、並びに、画像処理システム
KR102648652B1 (ko) 고해상도 영상의 처리 방법 및 그 장치
RU2803187C1 (ru) Способ и устройство кодирования изображения на основе подкартинки
US20240236339A9 (en) Method for decoding immersive video and method for encoding immersive video
JPH04192695A (ja) 動画像復号化装置
Wu et al. Low-Complexity Watermarking into SAO Offsets for HEVC Videos
JP2008099033A (ja) 画像通信装置及び画像通信方法
WO2007069350A1 (ja) 画像符号化および復号の方法と装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231003

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20231016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231127

R150 Certificate of patent or registration of utility model

Ref document number: 7404640

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150