JP6916618B2 - 画像符号化装置及びその制御方法及びプログラム - Google Patents

画像符号化装置及びその制御方法及びプログラム Download PDF

Info

Publication number
JP6916618B2
JP6916618B2 JP2016247009A JP2016247009A JP6916618B2 JP 6916618 B2 JP6916618 B2 JP 6916618B2 JP 2016247009 A JP2016247009 A JP 2016247009A JP 2016247009 A JP2016247009 A JP 2016247009A JP 6916618 B2 JP6916618 B2 JP 6916618B2
Authority
JP
Japan
Prior art keywords
code amount
block
image
interest
target code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016247009A
Other languages
English (en)
Other versions
JP2018101907A (ja
Inventor
大 宮内
大 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016247009A priority Critical patent/JP6916618B2/ja
Publication of JP2018101907A publication Critical patent/JP2018101907A/ja
Application granted granted Critical
Publication of JP6916618B2 publication Critical patent/JP6916618B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は動画像データの符号化技術に関するものである。
現在、デジタルビデオカメラ等、動画像を記録するデジタル機器が普及している。このようなデジタル機器では、所定の記録媒体に一定時間の動画像が記録できるよう、動画像データの圧縮符号化を行っている。
従来の代表的な圧縮符号化方式として、H.264(H.264/ MPEG-4 Part10 : Advanced Video Coding)が知られている。このような圧縮符号化方式は、1フレーム内にて、所定画素数で構成されるブロック毎に、その動画像が有する時間冗長性と空間冗長性を利用してデータ量を圧縮するものである。
上記のH.264では、時間冗長性に対する動き検出及び動き補償、空間冗長性に対する周波数変換として離散コサイン変換(Descrete Cosine Transform;DCT) 、更に量子化やエントロピー符号化といった技術を組み合わせることで圧縮符号化を実現している。
ただし、ある程度以上にまで圧縮率を上げると、DCT変換特有のブロック歪みが顕著になり画像劣化が目立つようになる。そこで、JPEG2000方式等では、周波数変換として、水平方向と垂直方向に低域フィルタリングと高域フィルタリングをそれぞれ適用することで、複数のサブバンドと呼ばれる周波数帯に分解する離散ウェーブレット変換(Discrete Wavelet Transform; DWT)を採用している。DWTを用いたサブバンド符号化は、DCTを用いた符号化技術に比べ、ブロック歪みが生じにくく、高圧縮時の圧縮特性が良いといった特徴を有する。
一般的な符号量制御は、符号化が完了しているフレームの発生符号量を元に、次に符号化するフレームの目標符号量を決定する。そして、1フレームあたりの目標符号量へ発生符号量を収束させるために、量子化に利用する量子化パラメータQpを画像の所定の領域毎に変更する量子化制御を行うことで符号量の制御を行う。なお、Qpは、その値が大きい程符号量を削減することができるパラメータである一方、画質劣化の原因になるため、出来るだけ小さく、かつ画面内で一定であることが望ましい。量子化制御により、所望の符号量へ画像データを圧縮することが可能である。
上述のように、Qpは画質の観点から画面内で一定であることが望ましい。実現するためには、画像の所定の領域毎にQpが画面内で一定になるような目標符号量を設定する必要がある。Qpが大きいほど発生符号量が小さくなる関係から、画像の中でも難しく発生符号量が出る領域の目標符号量は大きく、易しく発生符号量が出ない領域の目標符号量は小さく割り当てることで、画面内でQpを一定にすることが可能である。ただし、動画の圧縮符号化にリアルタイム性が求められるため、画像内の難易度は、1フレーム前の画像からフィードバックする必要がある。
しかし、動画の圧縮符号化は、リアルタイムに行う必要がある。このため、例えば動画記録中にフラッシュが炊かれるようなシーンチェンジが起きると、シーンが変わっていない前提の設定値で符号量制御を行うことになるので、1フレーム当たりの目標符号量を大きく超えた発生符号量が出てしまう可能性がある。それ故、場合によっては記録メディアに書き込めなくなってしまう。
そこで、所定の領域毎に発生符号量を積算し、発生符号量が上限値よりも大きい場合、符号量を抑制するように次の領域の量子化パラメータを変更することで、符号量制御性を向上する技術が特許文献1に記載されている。
特許文献1によれば、発生符号量を所定の値以上にしないことが可能であるため、記録メディアに書き込めないような破たんを回避することができる。
特許第5451487号公報
しかしながら、特許文献1に記載された技術は、発生符号量の上限値を画像によらず一意に定めていることで、発生符号量を抑制しなくても良い画像でも、量子化パラメータを変更してしまう場合がある。
例えば、画像の上部は極端に難しく符号量が発生し、下部は極端に易しく符号量が発生しない画像の場合を考察する。通常、符号化は画像の上部から下部に向かうラスタースキャン順に圧縮符号化を行う際ので、上記のような画像の場合、発生符号量の上限値を一意に定める場合、量子化パラメータが画像中盤から変化してしまい、画質劣化を引き起こす可能性がある。
本発明は上記の問題点に鑑み、量子化パラメータの変動を抑えて画質を保ちつつ、符号量の制御を行う技術を提供するものである。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
撮像手段で撮像した動画像データを符号化する画像符号化装置であって、
前記動画像データにおける着目フレームの画像データを、予め設定されたブロック単位に、目標符号量に応じて決定される量子化パラメータに従って量子化する量子化手段と、
該量子化手段で得られた量子化後のデータを、前記ブロック単位に符号化する符号化手段と、
前記符号化手段により発生する符号量が、設定されたブロック目標符号量になるように前記量子化手段を制御する符号量制御手段とを有し、
前記符号量制御手段は、
記着目フレームの画像と直前のフレームの画像の相関度を取得する取得手段と、
1フレームにおける先頭のブロックから最後のブロックに至る軸を水平軸、符号化データの積算量を表す軸を垂直軸とする座標空間において、予め設定されたフレーム目標符号量が示す位置が表す座標を通る符号量上限値を表す線分の傾きを、前記相関度に基づいて決定する第1の決定手段であって、前記相関度が大きければ前記線分の傾きが小さく、前記相関度が小さければ前記線分の傾きが大きくなるように前記線分の傾きを決定する第1の決定手段と、
予め設定された基準目標符号量と、着目ブロックの直前の符号化済みのブロックの複雑度とに基づき、前記着目ブロックの前記ブロック目標符号量を決定する第2の決定手段であって、前記着目ブロックの直前の符号化済みのブロックの複雑度が大きいときには前記着目ブロックの前記ブロック目標符号量が大きくなり、前記着目ブロックの直前の符号化済みのブロックの複雑度が小さいときには前記着目ブロックの前記ブロック目標符号量が小さくなるように前記着目ブロックの前記ブロック目標符号量を決定する第2の決定手段と、
前記着目フレームの先頭のブロックから前記直前のブロックまでの合計の符号量が、前記第1の決定手段で決定した前記線分が示す符号量を超えた場合、前記着目ブロックの前記ブロック目標符号量を、前記線分に沿うように変更する変更手段と、を有することを特徴とする。
本発明によれば、量子化パラメータの変動を抑えて画質を保ちつつ、符号量の制御を行うことが可能となる。
第1の実施形態に係る画像符号化装置のブロック構成図。 第1の実施形態に係る画素データの入力順を示す図。 第1の実施形態に係るシーンチェンジの動画像パターンA,Bを示す図。 第1の実施形態に係るシーンチェンジ前後のライン単位目標符号量の推移の説明するための図。 第1の実施形態に係る符号量上限値を設定した場合のパターンAにおけるライン単位の目標符号量の推移及びQpの推移の説明するための図。 第1の実施形態に係るパターンBにおける、符号量上限値を設定しない場合のライン単位の目標符号量の推移及びQpの推移の説明するための図。 第1の実施形態に係るパターンBにおける、符号量上限値を設定した場合のライン単位の目標符号量の推移及びQpの推移の説明するための図。 第1の実施形態に係るブロック目標符号量変更部の処理フローチャート。 第1の実施形態に係る画像相関度に応じた符号量上限値の傾きの違いを説明するための図。 第1の実施形態に係る効果を説明する動画パターンを示す図。 第1の実施形態に係る図10の動画パターンにおけるフレーム毎のライン単位の目標符号量の推移及びQpの推移の説明するための図。 第2の実施形態に係る画像符号化装置のブロック構成図。 第2の実施形態に係る離散ウェーブレット変換を水平、垂直それぞれ三回施したサブバンド形成の説明するための図。 第3の実施形態に係る画像符号化装置のブロック構成図。 第5の実施形態に係る画像符号化装置のブロック構成図。 離散ウェーブレット変換を3回施した場合の各サブバンドの離散ウェーブレット変換前の画像に対する同一画素位置の関係を示す図。
以下図面を参照しながら本発明の好適な実施の形態を説明する。なお、実施形態で説明する画像符号化装置は、デジタルビデオカメラに代表される撮像装置に搭載されるものとして説明する。従って、符号化対象は、撮像部が所定のフレームレートで撮像して得た画像データとなる。
[第1の実施形態]
図1は、第1の実施形態に係る画像符号化装置のブロック構成図である。図2は、図1の画像符号化部100に入力される画像データがラスタースキャン順であることを示す図である。図2のように、画像データは画素ライン単位で、ラスタ順に画像符号化部100へ供給され、圧縮符号化される。本実施形態では、1画素ライン単位で量子化パラメータを変更(更新)し、符号量制御を行う例を説明する。なお、画像データは撮像装置へ入力される画素値そのものでも、その画素値に何らかの処理を施したデータでも良い。
以下、図1を参照して本実施形態に係る画像符号化装置における符号化処理の概要について説明する。
画像符号化部100は、符号量制御部101により符号量制御を行う。符号量制御部101は、量子化設定部102で設定される画像の基準となる量子化パラメータ、目標符号量設定部103で設定される当該画像の画像目標符号量、及び、複雑度設定部111で設定される画像複雑度に従って画像データを圧縮符号化する。なお、量子化設定部102が設定する、画像の基準となる量子化パラメータを単に基準量子化パラメータと言う。
量子化部104は、量子化制御部105で出力される量子化パラメータQpを利用し、入力される画像データを1画素毎に量子化する。Qpは、その値が大きいほど符号量を削減できる一方、その値が大きいほど画質劣化が顕著になる。故に、Qpは画像劣化度を表す指標値とも言うことができる。
符号化部106は、量子化部104で量子化された画像データを符号化し、生成された符号化データを出力する。この際、生成された符号化データの量(符号量)が発生符号量保持部107に保持される。
量子化パラメータ保持部108は、基準量子化パラメータQpbase及び量子化制御部105で決定した、次に符号化するラインに用いる量子化パラメータQp[i]を保持する。なお、以降、変数iは当該符号化対象ライン番号を示し、Qp[i]は、当該フレームの第iラインのQpを意味する。
複雑度算出部109は、次に符号化する第iラインに対し、1ライン前のラインの複雑度X[i-1]を算出する(詳細後述)。
目標符号量算出部110は、目標符号量設定部103で設定される画像の基準目標符号量Tn、複雑度設定部111で設定される画像複雑度Xn-1、及び、複雑度X[i-1]に従って、次に符号化する第iラインの目標符号量T[i]を算出する。ここで示すnは、符号化対象画像番号を示し、例えばTnは、第nフレームの画像目標符号量を表し、画像複雑度Xn-1は符号化対象の着目画像の1つ前の画像の複雑度を表す。
目標符号量変更部112は、符号化が完了したラインまでの発生符号量と、相関度判定部115の画像相関度からある一定条件を満たした場合、目標符号量算出部110で算出した目標符号量を変更する(詳細後述)。
差分算出部113は、画素ライン毎に、発生符号量保持部107で保持されたライン発生符号量S[i-1]と、目標符号量変更部113から出力される目標符号量T’[i]の差分E[i-1]を算出し、算出結果を差分保持部114に出力する。差分保持部114は、画像の先頭ラインからの積算差分値ΣE[i-1]を保持する。
量子化制御部105は、差分保持部114で保持された積算差分値ΣE[i-1]と、量子化パラメータ保持部108で保持された基準量子化パラメータQpbaseを用いて、次のラインの量子化パラメータQp[i]を決定する。量子化パラメータは、当該画像の当該ラインまでの発生符号量積算量が、同目標符号量積算量へ近付くように制御される。
量子化制御部105は、積算差分値ΣE[i-1]の絶対値が小さくなるように、次に符号化するラインの量子化パラメータQp[i]を算出する。その詳細な算出方法は後述する。
以上により符号量を制御する。
<複雑度の算出>
複雑度は、難易度を示す指標であり、画像が複雑であるほど大きく、平坦であるほど小さくなる値である。
複雑度算出部109は、着目ラインの目標符号量を算出するために、1つ前に符号化したラインの複雑度を算出する。
1ライン前の符号化に利用した量子化パラメータQp[i-1]と、その際の発生符号量S[i-1]を用いて、1ライン前の複雑度X[i-1]を次式(1)により算出する。
X[i-1] = Qp[i-1] × S[i-1] … (1)
<目標符号量の算出>
画像の難しいラインほど目標符号量を多く割り当て、易しいラインほど目標符号量を小さく割り当てることで、画質劣化度を意味するQpの変動を画面内で極力小さくすることができる。そこで、実施形態における目標符号量算出部110は、目標符号量設定部103で設定される画像の基準目標符号量Tn、複雑度設定部111で設定される画像複雑度Xn-1[i]及び、複雑度X[i-1]に従い、次に符号化する着目ラインの目標符号量T[i]を算出する。目標符号量の算出式は次式(2)の通りである。
T[i] = Tn × X[i-1] / Xn-1[i] …(2)
式(1)のように、複雑度は符号化しなければ算出できないフィードバック量であるため、次に符号化するラインの目標符号量は、1ライン前の複雑度、1フレーム前の第iラインの複雑度をフィードバック算出する。
<量子化制御>
量子化パラメータ算出方法の一つに、MPEG2 Test Model 5に示された公知技術がある。このTest Model 5を参照し、実施形態では、差分保持部114で保持された積算差分値ΣE[i-1]と量子化パラメータ保持部108で保持された基準量子化パラメータQpbaseを用いて、次のラインの量子化パラメータQp[i]を次式(3)として算出する。
Qp[i]=Qpbase + r ×ΣE[i-1] …(3)
なお、式中、rは制御感度を示し、大きいほど積算差分値に応じて急峻にQp[i]を変動させて符号量の制御性が良くなるパラメータである。
Test Model5を利用することで、目標符号量に対して発生符号量が大きければ量子化パラメータを大きく、小さければ量子化パラメータを小さく設定し、符号量を制御することが可能である。
<シーンチェンジ時の動作>
本実施形態におけるシーンチェンジは、1フレーム前の画像に対して着目フレームの画像難易度が乖離しているフレーム間の関係を指す。例えば、暗闇の中で動画像を撮影してN番目のフレームでフラッシュが炊かれた場合である。直前のN−1フレームでは暗闇で物体が視認できないような画像であったのに対し、Nフレームではフラッシュにより物体が視認できる画像になり、Nフレームの画像難易度はN−1フレームに対して十分に高くなる。
以上のような動画像におけるシーンチェンジは通常の撮影時に頻繁に起こる。このため、シーンチェンジ時における実施形態の符号量制御部101の動作を以下に説明する。
符号量制御部101は、上述のように量子化設定部102、目標符号量設定部103、複雑度設定部111の設定値に従い符号量制御を行う。動画像の圧縮符号化においては、一般的に、上記の設定値はリアルタイム処理のためフィードバック量を利用する。また、符号量制御部101内部でも、式(2)に示すように、符号化対象の着目ラインの目標符号量の算出には、フィードバック量を利用する。以上から、シーンチェンジが発生した場合、符号量制御性が悪くなる問題がある。
ここで、シーンチェンジ時の問題を説明する。図3(a),(b)は、シーンチェンジ時の動作説明に用いる2種の動画像パターンA,Bを示している。図4は動画像パターンAにおけるシーンチェンジ前後のライン単位の目標符号量の推移を示している。
図4を見てわかるように、図3(a)のパターンAのように突然映像に物体が入った場合、式(2)に示すXn-1は、シーンチェンジ前の画像の値を設定されているため、目標符号量積算量は画面目標符号量以上になり、上記目標符号量に追従して発生符号量は大きく発生してしまう。なお、簡単のためライン発生符号量はライン目標符号量と一致しているものとする。そこで、符号量を収束させるためには、符号量の上限値を設定しておくことが有効である。
図5(a)は、符号量上限値を設定した場合の図3(a)のパターンAにおけるライン単位の目標符号量の推移を、同図(b)はQpの推移を示している。図5(a),(b)に示すように、符号量上限値に到達した以降のライン単位の目標符号量を、符号量上限値になるように設定することで、発生符号量は画面目標符号量に収束させることができる。ただし、Qpは発生符号量を抑えるために増加する。
次に、符号量上限値を設定することによる問題を説明する。図6(a),(b)、図7(a,(b)に、図3(b)のパターンBにおけるライン単位の目標符号量の推移及びQpの推移を示す。図6(a),(b)は、符号量上限値を設定しない場合、図7(a)、(b)は符号量上限値を設定する場合の推移をそれぞれ示している。
図6(a),(b)に示すように、符号量上限値を設定しなければ、パターンBはシーンチェンジが起きておらず符号量制御に利用するフィードバック量が正しいため、画面目標符号量に収束する。
一方、パターンAのときと同様に符号量上限値を設定する場合、図7(a),(b)に示すように、シーンチェンジが起きていないにも関わらず、Qpが変動する可能性がある。
図3(b)のパターンBを見ると、画面の上部に物体が集中しているため、図6(a)、(b)に示すように、ライン目標符号量は、前半のラインで大きく設定することが望ましい。しかし、前半のラインに目標符号量を多く割り当てるが故、発生符号量が符号量上限値を超えてしまい、以降のラインでQpを余計に増加させてしまうことで、Qpの増加により画質劣化を引き起こす。以上から画像に依らず固定的に符号量上限値を設定することは好ましくないのは理解できよう。
<目標符号量変更部>
上記の理由で、実施形態における目標符号量変更部112は、符号量上限値を画像相関度に応じて適応的に変更することで、符号量制御性と画質劣化の抑制を両立させる。具体的には、目標符号量変更部112は、シーンチェンジの度合いに応じて、先に示した式(2)における1ライン当たりの基準となる目標符号量Tnを変更する。
相関度判定部115は、符号化対象の着目フレームの輝度成分の合計値を求める。そして、相関度判定部115は、着目フレームの輝度合計値と、直前のフレームの輝度合計値とを、着目フレームの符号化前に比較し、画像相関度を決定する。実施形態における画像相関度は、着目フレームと直前のフレームの輝度合計値の差が小さいほど1に近づき、差が大きいほど0に近づく値とする。このため、画像符号化部100は、符号化対象の動画像を1フレーム分だけ遅延させるためのバッファ116を有し、相関度判定部115は撮像部からのフレームを遅延無しで入力し、着目フレームの符号化に先立って、その着目フレームの輝度合計値を算出する。なお、上記説明から、相関度判定部115は、直前のフレームの輝度合計値を保持する記憶部(メモリ又はレジスタ)を有する。
図8に、目標符号量変更部112の1フレーム当たりの処理フローを示す。以下、同図を参照して、実施形態の目標符号量変更部112の処理を説明する。
S801にて、目標符号量変更部112は、符号化しようとする着目フレームと符号化が完了した直前のフレームとの画像相関度を相関度判定部115から取得する。
S802で、目標符号量変更部112は、先に説明した符号量上限値を表す線分の傾きを、画像相関度が大きければ小さく、画像相関度が小さければ大きくなるように、着目フレームに対して設定する。
符号量上限値は、符号化終了間際のラインほど符号量制御可能なライン数が減っていくため、先頭ラインほど小さく、最終ラインに近づくほど大きくする。なお、本実施形態では最終ラインの符号量上限値を画像目標符号量と一致させているが、画質の観点から、画像目標符号量よりも大きい値に設定してもよい。
S803にて、目標符号量変更部112は、最終ラインでなければS804に分岐する。S804で、目標符号量変更部112は、発生符号量積算量が符号量上限値よりも大きければS805に、そうでなければS803に分岐する。S805で、目標符号量変更部112は、目標符号量積算量が符号量上限値になるように着目ラインの目標符号量を変更する。以上の処理により、シーンチェンジ等でフィードバック量が適切でない場合も、発生符号量を画面目標符号量に近付けることができる。
<効果>
図9に画像相関度に応じた符号量上限値の傾きの違いを示す。図9に示す座標空間において水平軸はラインの位置を示し、垂直軸は総符号量を示している。図9のように画像相関度が小さいほどライン単位の目標符号量を速い段階から変更し易く、画像相関度が大きいほど変更されづらいように符号量上限値を設定する。
図示において、符号量上限値が表す各線分は、最後のライン位置でのフレームの目標符号量と一致するものであり、異なるのはその傾きである。なお、最後のライン位置との目標符号量が、各線分毎に異なるようにしても構わない。この場合、傾きと切片を、予め設定できるようにしても構わない。
目標符号量変更部112は、着目フレームと直前のフレームの輝度合計値の差が小さいほど(シーンチェンジの度合いが小さいほど)“1”に近づき、その差が大きいほど(シーンチェンジの度合いが大きいほど)“0”に近づく相関度を求めるとして説明した。目標符号量変更部112は、この相関度を図9の符号量上限値の傾きとして用いるものである。
そして実施形態における目標符号量変更部112は、先に説明した式(2)に従って次に符号化する第iラインの目標符号量を決定していくが、先頭から直前の第i−1ラインまでの実際の符号量の合計が、そのシーンに対して設定した符号量上限値の線分を超えた場合には、T[i]を、設定された符号量上限値に沿うように変更する。
図10に、本実施形態を実施することによる効果を説明する動画パターンCを示す。図11に、動画像パターンCにおけるフレーム毎のライン単位の目標符号量の推移及びQpの推移を示す。
Nフレーム、N+1フレームでは、シーンチェンジ等が起こっておらず、安定しているため、符号量上限値を高く設定し、発生符号量が画像目標符号量に収束し、かつQpも一定で推移する。
N+2フレームでは、それ以前のN+1フレームには存在しなかった物体が画像上部に出現するため、符号量上限値を設定しない場合、発生符号量積算量が画像目標符号量より多く発生する。
一方で、符号量上限値を、N+1フレームに対して相関が小さいため、N+1フレームより小さく設定した場合、発生符号量積算量が符号量上限値を超える時点で目標符号量積算量を符号量上限値に変更するため、画像目標符号量に発生符号量積算量は収束する。
N+3フレームでは、N+2フレーム目に対して下部の物体が消失し、画像相関度が更に低くなる。このため、符号量上限値をN+2フレーム目よりに小さく設定する。N+3フレームでは上部が複雑な画像のため、前半ラインで発生符号量が多く発生し、符号量上限値に達することで、目標符号量積算量が符号用上限値に変更され、画像目標符号量に発生符号量は収束するものの、発生符号量を抑え込もうとQpが増加する。
N+4フレームでは、N+3フレームと画像相関度が非常に高い画像のため、符号量上限値は高く設定する。符号量上限値が高いため、N+3フレームのように目標符号量積算量は変更されず、Qpが一定のまま画像目標符号量に発生符号量積算量は収束する。
符号量上限値が画像に依らず一定の場合、N+4フレームは画像が変化していないにも関わらずQpが増加し画像劣化の原因になる一方で、符号量上限値を画像相関度に応じて変更することで、シーンチェンジ直後のフレームを除いて、Qpの変化を小さく、画質劣化を抑制することができる。
以上のようにすることで、Qpの変化を小さくして画質劣化を抑制し、かつ符号量制御性の高い画像符号化装置を提供することができる。
なお、相関度判定部は、当該フレームと1つ前のフレームの画像相関度を他のパラメータを利用し判定してもよい。例えば、画像の特徴を示すパラメータであるヒストグラムを比較することで、画像相関度を判定することも、本発明の範疇である。
また、上記実施例では、ライン単位に量子化、符号化を行うものとして説明した。しかし、量子化、符号化単位は、m×n画素で構成されるブロック単位として良い。この場合、目標符号量算出部110は、符号化対象の着目ブロックのブロック目標符号量算出し、目標符号量変更部112は着目ブロックに対するブロック目標符号量を変更することになる。例えば、8×8画素等のブロック単位に量子化し、その量子化後のブロックに符号化しても良い。上記実施形態での符号化単位のラインは、高さが1画素、水平方向が画像の水平方向の画素数とするブロックであると言える。かかる点は、以下に説明する各実施形態でも同じである。
[第2の実施形態]
図12は、第2の実施形態に係る画像符号化装置のブロック構成図である。本第2の実施形態は、符号量制御部で制御する対象が、画像データに対する離散ウェーブレット変換して得られた変換係数データであり、符号量制御部101は離散ウェーブレット変換により生成されるサブバンド毎に符号量制御を行う場合を想定したものである。なお、参照符号100〜115は、第1の実施形態における構成と同じとし、その説明は省略する。
図12において、離散ウェーブレット変換部1216は、画像データを周波数領域の信号へ変換し、その変換係数をサブバンド毎に符号量制御部101の量子化部104へ出力する。
<離散ウェーブレット変換>
図13は、離散ウェーブレット変換(DWT)に係る垂直、水平フィルタリングをそれぞれ3回実行した場合に得られるサブバンドを示している。
離散ウェーブレット変換は、垂直、水平にそれぞれフィルタをかけることで画像データの周波数帯域を複数のサブバンドに分解する。そして、この変換により生成された低域サブバンドLLに対して再帰的にDWTを施すことで分解レベルを増加させ、図3に示すように、周波数分解の粒度を細かくすることができる。なお、図3における“L”,“H”はそれぞれ低域、高域を示し、その順序は、前側が水平フィルタリングを行った結果の帯域、後側が垂直フィルタリングを行った結果の帯域を示し、“Lv”の後の数字はDWTの分解レベルを示す。なお、図示のサブバンドLLに“Lv”が付かないのは、DWTを複数回行う場合には直前のDWTで得たサブバンドLLが変換対象となって、サブバンドLLは常に1つとなり、分解レベルで区別する必要がないためである。
符号量制御部101では、高域のサブバンドほど量子化パラメータを大きく、低域のサブバンドほど量子化パラメータを小さく設定し符号量制御を行うことで、人間の視覚特性上視認しづらい画像データの高域ほど発生符号量を圧縮し、符号化効率を向上させることが一般的である。
<符号量制御部の動作>
本第2の実施形態における符号量制御部101は、上記離散ウェーブレット変換により生成されるサブバンド毎に、符号量制御を行う。つまり、量子化設定部102は各サブバンドの基準量子化パラメータを設定する。また、目標符号量設定部103ではサブバンド目標符号量を設定する。そして、複雑度設定部111ではサブバンド毎に画像複雑度を設定する。そして、符号量制御部101はサブバンド毎に上記設定値に基づき、ライン(又はブロック)ごとの符号量制御を行う。
以上のようにすることで、各サブバンドの符号量制御を独立して行うことができ、Qpの変化を小さくして画質劣化を抑制し、かつ符号量制御性の高い画像符号化装置を提供することができる。
[第3の実施形態]
図14は、第3の実施形態に係る画像符号化装置のブロック構成図である。同図における参照符号100〜115は、第1の実施形態における構成と同じとし、その説明は省略する。
本第3の実施形態は、着目フレームの着目サブバンドの符号化処理を以下のように行う。
着目サブバンドの第iラインを符号化する際、その先頭ラインから第i−1ラインまでの符号量と、1つ前のフレーム(符号化済み)の同じ分解レベル、同じ種類のサブバンドの先頭ラインから第i−1ラインまでの符号量との差を求める。そして、その差が符号量差分閾値を超えた場合、符号化する着目ライン(第iライン)の目標符号量を変更する。更に、符号量差分閾値を超えたサブバンド数に応じて、他のサブバンドの閾値を小さくすることで、画像相関度に応じた目標符号量の修正を行う。
<目標符号量変更部>
発生符号量保持部107は、直前のフレームのサブバンド毎の発生符号量積算量を保持する。或る1つのサブバンドに着目したとき、そのサブバンドの発生符号量積算量は所定のライン間隔で積算符号量を意味する。例えば、ライン間隔(ブロック数)を“8”とし、先頭ラインを第1ラインと定義する。この場合、発生符号量保持部107は、着目サブバンドの第1乃至8ラインの符号化データの合計量である積算符号量、第1乃至16ラインの積算符号量、第1乃至24ラインの積算符号量、…を保持する。以降、積算符号量として保持されるラインを符号量比較ラインと言う。
以下は、1つのサブバンドに着目した場合のものであり、単にラインと表現した場合には、そのラインは着目サブバンド内のラインを意味することに注意されたい。
目標符号量変更部112は、符号化対象の着目ラインが符号量比較ライン+1(=1、9、17…のいずれか)となるとき、先頭から直前ラインまでに発生した符号量(以下、単に現符号量という)と直前フレームの該当サブバンド内の対応するラインまでの符号量積算量(以下、単に前符号量という)とを比較する。そして、現符号量が前符号量より大きい場合、目標符号量変更部112は、着目ライン以降のラインの目標符号量T’[i]を、サブバンドの目標符号量Tnに対する発生符号量積算量ΣS[i]の差に対して、まだ符号化が完了していない残りのライン数で除した値に変更する。変更後のライン目標符号量は次式(4)で与えられる。
T’ [i] = (Tn-ΣS[i]) / (itotal-icheck) …(4)
ここで、icheckは、ライン目標符号量を変更し始めるラインまでのライン数である。
<画像相関度変更部>
画像相関度変更部1417は、相関度判定部115で設定された画像相関度を、目標符号量が変更されたサブバンドの数に応じて変更する。本第3の実施形態では、画像相関度は符号量差分閾値を示す。
符号量制御部101は、サブバンド毎に独立に符号量制御を行うため、他のサブバンドの目標符号量が変更されて、着目サブバンドの目標符号量は変更されない可能性がある。符号化終了間際のラインで目標符号量を変更しようとするほど、発生符号量を抑え込むためにQpを大きくする変化量は増加する。
そこで、他のサブバンドで1フレーム前と着目フレームの発生符号量積算量が異なるのであれば、画像相関度は高くないと判断できるため、画像相関度変更部1417は、目標符号量が変更されたサブバンドの数に応じて各サブバンドの符号量差分閾値を小さく設定する。これにより符号化開始後早い段階で、ライン単位の目標符号量を変更することで符号量制御性を向上させる。
以上のように、サブバンド毎の符号量制御において、各サブバンドの画像の相関度に応じて符号量差分閾値を変更することで、Qpの変化を小さくして画質劣化を抑制し、かつ符号量制御性の高い画像符号化装置を提供することができる。
なお、本実施形態ではサブバンドを8等分してサブバンド発生符号量積算量を比較したが、その限りではなく、保持する容量に制限がなければ更に細かく分割することも、本実施形態の範疇である。
また、等分割するだけでなく、符号化開始直後のラインのみ細かく比較するような構成も、本実施形態の範疇である。
更に、符号量制御部が複数コア構成の画像符号化装置も本実施形態の範疇であり、他コアのサブバンドが目標符号量を変更した数も含めて当該コアの相関度を変更することも可能である。
[第4の実施形態]
本第4の実施形態は、フィードバックパラメータである複雑度を変更することでラインの目標符号量の変更を行う。本第4の実施形態における装置構成は、第1の実施形態(図1)と同じである。
式(2)に示すように、複雑度は符号化が完了しなければ取得できないパラメータであることから、目標符号量算出部110では、1つ前のフレームの複雑度Xn-1を利用してライン目標符号量を算出するため、符号量制御対象の目標符号量に目標符号量積算量が収束しない場合がある。
<目標符号量変更部>
そこで、目標符号量変更部112では、着目ラインの目標符号量を変更する場合には、Xn-1に重みづけをすることでその目標符号量を変更する。変更後の目標符号量T’[i]を、次式(5)に示す。なお、α(≧1)は上記重み付けを行うための重み付け係数である。
T’[i] = Tn × X[i-1] / (Xn-1×α) … (5)
上記の式(5)を用いることにより、画面目標符号量に必ずしも収束はしないものの、ラインの目標符号量を変更することで発生符号量積算量は、変更しない場合よりも抑制され、かつ、複雑度は、式(1)で示されることから、αの値に応じて、Qpの大きさを調整可能である。Qpの大きさを調整できるため、より画質優先の符号量制御を行うことができる。
以上のようにすることで、Qpの調整を任意に行い、画質劣化を抑制しつつ、かつ符号量制御性の高い画像符号化装置を提供することができる。
[第5の実施形態]
図15は、第5の実施形態に係る画像符号化装置のブロック構成図である。図示において、参照符号100〜115,1216は、第2の実施形態と同じであるので、その説明は省略する。
サブバンド発生符号量積算部1518は、各サブバンドの発生符号量を同一画素位置に相当するライン毎に積算する。本実施形態は、ラインごとの目標符号量の変更を、全サブバンド同時に行い、全サブバンドの符号化が並列に行われるものとする。
<サブバンドの同一画素位置>
図16は、離散ウェーブレット変換(DWT)の垂直、水平フィルタリングをそれぞれ3回施した場合の各サブバンドの離散ウェーブレット変換前の画像が表す空間での同一画素位置の関係を示している。
DWTは、変換前の画像の2画素ラインに対して1画素ライン分の変換係数が生成される。また、DWTはサブバンドLLに対して再帰的に行われるため、分解レベル2の1ライン分の変換係数は、分解レベル1の2画素ラインの変換係数から生成される。以降分解レベルを増やしても同様の関係である。
上記の関係から、最高域であるLv1のNラインに対して、Lv2のN/2ライン、Lv3のN/4ラインが同一画素位置に相当する。DWTを3回実行する場合、図16のように、同一画素位置と見なせるラインは、Lv1の4ラインに対して、Lv2の2ライン、Lv3の1ラインである。
<目標符号量変更部>
目標符号量変更部112は、符号量上限値を、サブバンド合計符号量上限値として全サブバンドの発生符号量積算量に対して設定し、サブバンド発生符号量積算部1518で積算したサブバンド発生符号量積算量と比較する。サブバンド発生符号量積算量がサブバンド合計符号量上限値よりも大きければ各サブバンドの着目ラインの目標符号量T’[i]を、式(5)を用いて変更する。
このように、全サブバンド一斉に目標符号量を変更することで、Qpも同様に全サブバンド一斉に変更される。Qpは一般に画像データの高域成分ほど大きく、低域成分ほど小さく設定するが、サブバンド独立で目標符号量を変更すると、上記の関係が崩れる場合がある。例えば、サブバンドHLのQpがサブバンドLHのQpより非常に大きい値であった場合、画像の縦エッジのみ極端に劣化し、主観画質の劣化が目立つ。
一方で、本実施形態を適応すれば、一斉に式(5)のαを所定の値に変更できるため、画質の極端な劣化を抑制することができる。
以上のようにすることで、各サブバンドの目標符号量の変更を同一画素位置から行うことで、Qpの変更も同様に同一画素位置から行い、画質劣化を抑制しつつ、かつ符号量制御性の高い画像符号化装置を提供することができる。
なお、必ずしも全サブバンドで目標符号量を変更する必要は無く、例えば最も低域成分であるサブバンドLLは画質を優先し、目標符号量を変更しない構成も、本発明の範疇である。
以上、各実施形態について詳述したが、特定の実施形態に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施形態の構成要素を全部又は複数を組み合わせることも可能である。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100…画像符号化部、101…符号量制御部、102…量子化設定部、103…目標符号量設定部、104…量子化部、105…量子化制御部、106…符号化部、107…発生符号量保持部、108…量子化パラメータ保持部、109…複雑度算出部、110…目標符号量算出部、111…複雑度設定部、112…目標符号量変更部、113…差分算出部、114…差分保持部、115…相関度判定部、116…バッファ、1216…離散ウェーブレット変換部、1417…画像相関度変更部、1518…サブバンド発生符号量積算部

Claims (10)

  1. 撮像手段で撮像した動画像データを符号化する画像符号化装置であって、
    前記動画像データにおける着目フレームの画像データを、予め設定されたブロック単位に、目標符号量に応じて決定される量子化パラメータに従って量子化する量子化手段と、
    該量子化手段で得られた量子化後のデータを、前記ブロック単位に符号化する符号化手段と、
    前記符号化手段により発生する符号量が、設定されたブロック目標符号量になるように前記量子化手段を制御する符号量制御手段とを有し、
    前記符号量制御手段は、
    記着目フレームの画像と直前のフレームの画像の相関度を取得する取得手段と、
    1フレームにおける先頭のブロックから最後のブロックに至る軸を水平軸、符号化データの積算量を表す軸を垂直軸とする座標空間において、予め設定されたフレーム目標符号量が示す位置が表す座標を通る符号量上限値を表す線分の傾きを、前記相関度に基づいて決定する第1の決定手段であって、前記相関度が大きければ前記線分の傾きが小さく、前記相関度が小さければ前記線分の傾きが大きくなるように前記線分の傾きを決定する第1の決定手段と、
    予め設定された基準目標符号量と、着目ブロックの直前の符号化済みのブロックの複雑度とに基づき、前記着目ブロックの前記ブロック目標符号量を決定する第2の決定手段であって、前記着目ブロックの直前の符号化済みのブロックの複雑度が大きいときには前記着目ブロックの前記ブロック目標符号量が大きくなり、前記着目ブロックの直前の符号化済みのブロックの複雑度が小さいときには前記着目ブロックの前記ブロック目標符号量が小さくなるように前記着目ブロックの前記ブロック目標符号量を決定する第2の決定手段と、
    前記着目フレームの先頭のブロックから前記直前のブロックまでの合計の符号量が、前記第1の決定手段で決定した前記線分が示す符号量を超えた場合、前記着目ブロックの前記ブロック目標符号量を、前記線分に沿うように変更する変更手段と、
    を有することを特徴とする画像符号化装置。
  2. 前記第1の決定手段は、
    前記着目フレームと直前のフレームの輝度合計値との差、ヒストグラムの差、或いは、着目ブロックまでの符号量の差のいずれかに基づき、前記傾きを決定し、前記差が小さいときは前記傾きが大きくなり、前記差が大きいときは前記傾きが小さくなるように前記傾きを決定する、
    ことを特徴とする請求項に記載の画像符号化装置。
  3. 前記第2の決定手段は、
    前記着目ブロックを第iのブロックとし、直前の第i−1のブロックの符号化データの符号量をS[i-1]、前記第iのブロックを符号化する際に用いた量子化パラメータをQp[i-1]と定義したとき、前記複雑度を表すX[i-1]を次式により求める
    X[i-1]=Qp[i-1]×S[i-1]
    ことを特徴とする請求項又はに記載の画像符号化装置。
  4. 前記第2の決定手段は、
    前記着目ブロックまでの発生符号量の積算量が、当該着目ブロックの位置の符号量上限値に達したら、複雑度を小さなるように修正することで、前記ブロック目標符号量を決定する
    ことを特徴とする請求項又はに記載の画像符号化装置。
  5. 更に、前記動画像データにおける着目フレームの画像データを離散ウェーブレット変換する変換手段を有し、
    前記量子化手段は、前記変換手段で得られた各サブバンドに対して量子化する
    ことを特徴とする請求項に記載の画像符号化装置。
  6. 前記符号量制御手段は画像相関度変更手段を有し、
    当該画像相関度変更手段は、複数のサブバンドの内、符号量差分閾値を超えたサブバンドの数が多いほど画像相関度を小さく、少ないほど大きく変更する
    ことを特徴とする請求項に記載の画像符号化装置。
  7. 前記第2の決定手段は、予め設定されたブロック数の符号化を終えるたびに、前記ブロック目標符号量を決定する
    ことを特徴とする請求項に記載の画像符号化装置。
  8. 前記符号化手段は、全てのサブバンドにおける、画像が表す空間の同じ位置のブロックを並列に符号化し、
    前記符号量制御手段は、1以上のサブバンドに対して量子化制御を行い、前記1以上のサブバンドごとにブロック目標符号量を決定すると共に、前記1以上のサブバンドにおける着目ブロックまでに発生した符号量の合計符号量に基づいて、各サブバンドにおける前記ブロック目標符号量を決定する
    ことを特徴とする請求項に記載の画像符号化装置。
  9. 撮像手段で撮像した動画像データを符号化する画像符号化装置の制御方法であって、
    前記動画像データにおける着目フレームの画像データを、予め設定されたブロック単位に、目標符号量に応じて決定される量子化パラメータに従って量子化する量子化工程と、
    該量子化工程で得られた量子化後のデータを、前記ブロック単位に符号化する符号化工程と、
    前記符号化工程により発生する符号量が、設定されたブロック目標符号量になるように前記量子化工程を制御する符号量制御工程とを有し、
    前記符号量制御工程は、
    記着目フレームの画像と直前のフレームの画像の相関度を取得する取得工程と、
    1フレームにおける先頭のブロックから最後のブロックに至る軸を水平軸、符号化データの積算量を表す軸を垂直軸とする座標空間において、予め設定されたフレーム目標符号量が示す位置が表す座標を通る符号量上限値を表す線分の傾きを、前記相関度に基づいて決定する第1の決定工程であって、前記相関度が大きければ前記線分の傾きが小さく、前記相関度が小さければ前記線分の傾きが大きくなるように前記線分の傾きを決定する第1の決定工程と、
    予め設定された基準目標符号量と、着目ブロックの直前の符号化済みのブロックの複雑度とに基づき、前記着目ブロックの前記ブロック目標符号量を決定する第2の決定工程であって、前記着目ブロックの直前の符号化済みのブロックの複雑度が大きいときには前記着目ブロックの前記ブロック目標符号量が大きくなり、前記着目ブロックの直前の符号化済みのブロックの複雑度が小さいときには前記着目ブロックの前記ブロック目標符号量が小さくなるように前記着目ブロックの前記ブロック目標符号量を決定する第2の決定工程と、
    前記着目フレームの先頭のブロックから前記直前のブロックまでの合計の符号量が、前記第1の決定工程で決定した前記線分が示す符号量を超えた場合、前記着目ブロックの前記ブロック目標符号量を、前記線分に沿うように変更する変更工程と、
    を有することを特徴とする画像符号化装置の制御方法。
  10. コンピュータが読み込み実行することで、前記コンピュータに請求項に記載の方法の各工程を実行させるためのプログラム。
JP2016247009A 2016-12-20 2016-12-20 画像符号化装置及びその制御方法及びプログラム Active JP6916618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016247009A JP6916618B2 (ja) 2016-12-20 2016-12-20 画像符号化装置及びその制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016247009A JP6916618B2 (ja) 2016-12-20 2016-12-20 画像符号化装置及びその制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018101907A JP2018101907A (ja) 2018-06-28
JP6916618B2 true JP6916618B2 (ja) 2021-08-11

Family

ID=62714508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016247009A Active JP6916618B2 (ja) 2016-12-20 2016-12-20 画像符号化装置及びその制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6916618B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235576B (zh) * 2020-11-16 2024-04-30 北京世纪好未来教育科技有限公司 编码方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008187571A (ja) * 2007-01-31 2008-08-14 Sony Corp 情報処理装置および方法、並びにプログラム
KR101172430B1 (ko) * 2007-08-17 2012-08-08 삼성전자주식회사 비트율 제어 방법 및 그 장치

Also Published As

Publication number Publication date
JP2018101907A (ja) 2018-06-28

Similar Documents

Publication Publication Date Title
JP5173837B2 (ja) ビデオ符号器性能を向上させる適応フィルタリング
US8218082B2 (en) Content adaptive noise reduction filtering for image signals
JP4794987B2 (ja) 映像信号処理装置
US11082707B2 (en) Encoding method and apparatus, image processing system, and computer-readable storage medium
US11012698B2 (en) Image encoding apparatus and method for controlling the same
EP1821548B1 (en) Method for pre-suppressing image noise.
US10776956B2 (en) Image coding apparatus, image decoding apparatus, image coding method, image decoding method, and non-transitory computer-readable storage medium
JP6857973B2 (ja) 画像符号化装置及びその制御方法
JP6857970B2 (ja) 画像符号化装置及びその制御方法
US11082698B2 (en) Image capturing apparatus having a function for encoding raw image control method therof, and non-transitory computer-readable storage medium
US11140392B2 (en) Image encoding apparatus, image decoding apparatus, control methods thereof, and non- transitory computer-readable storage medium
JP7001383B2 (ja) 符号化装置、符号化方法、及び、プログラム
JP6806466B2 (ja) 画像符号化装置及びその制御方法
JP6916618B2 (ja) 画像符号化装置及びその制御方法及びプログラム
US10142604B2 (en) Imaging apparatus and control method thereof
US20170155902A1 (en) Image encoding apparatus and method of controlling the same
US20230133895A1 (en) Image encoding apparatus and method for controlling the same and non-transitory computer-readable storage medium
JP6593417B2 (ja) 画像圧縮装置、及びプログラム
JP6966936B2 (ja) 画像符号化装置及びその制御方法及びプログラム
JP7016660B2 (ja) 符号化装置、その制御方法、および制御プログラム、並びに撮像装置
JP2018011120A (ja) 撮像装置、撮像装置の制御方法、及びプログラム
JP7321237B2 (ja) 画像符号化装置、画像符号化方法、プログラム
JP7469865B2 (ja) 画像処理装置および画像処理方法
JP2020109923A (ja) 画像符号化装置及びその制御方法及びプログラム
JP2022077438A (ja) 符号化装置及び方法、撮像装置、プログラム、記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210716

R151 Written notification of patent or utility model registration

Ref document number: 6916618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151