JP5267655B2 - 画像符号化装置、画像符号化制御方法および画像符号化プログラム - Google Patents

画像符号化装置、画像符号化制御方法および画像符号化プログラム Download PDF

Info

Publication number
JP5267655B2
JP5267655B2 JP2011504684A JP2011504684A JP5267655B2 JP 5267655 B2 JP5267655 B2 JP 5267655B2 JP 2011504684 A JP2011504684 A JP 2011504684A JP 2011504684 A JP2011504684 A JP 2011504684A JP 5267655 B2 JP5267655 B2 JP 5267655B2
Authority
JP
Japan
Prior art keywords
encoding
encoded
unit
frame
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011504684A
Other languages
English (en)
Other versions
JPWO2010106670A1 (ja
Inventor
君彦 数井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2010106670A1 publication Critical patent/JPWO2010106670A1/ja
Application granted granted Critical
Publication of JP5267655B2 publication Critical patent/JP5267655B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像データを圧縮符号化処理する画像符号化装置、このような圧縮符号化処理を制御するための画像符号化制御方法、および画像符号化プログラムに関する。
一般に、動画像データはデータ量が大きいため、送信装置から受信装置へ伝送される際、あるいは記憶装置に格納される際には、圧縮符号化処理が施されることが多い。代表的な動画像の圧縮符号化方式として、MPEG(Moving Picture Experts Group)により標準化されたMPEG−1,MPEG−2,MPEG−4,MPEG−4 AVC/H.264(以下、単にH.264と呼ぶ)などが知られている。
これらの圧縮符号化方式では、フレーム間動き予測符号化方式が採用されている。フレーム間動き予測符号化方式は、フレーム間で相関度が高い部分を探索し、両者の位置差分(動きベクトル)および両者の画素値差分(予測誤差)を符号化するものである。一般に動画像では、フレーム間の相関度が高いため、画素差分値が元の画素値と比較して大幅に小さくなることが多い。このため、フレーム間動き予測符号化方式により高い圧縮効率が実現できる。
上記の圧縮符号化方式では、フレーム間動き予測符号化方式を実現するために、Iピクチャ、Pピクチャ、Bピクチャの3種類のピクチャが規定されている。Iピクチャはイントラピクチャと呼ばれ、フレーム間予測符号化を行わず、フレーム内予測符号化を行うピクチャである。Pピクチャは前方向予測ピクチャと呼ばれ、一般的に過去のピクチャを予測ピクチャとするピクチャである。Bピクチャは双方向予測ピクチャと呼ばれ、一般的に過去のピクチャおよび未来のピクチャの両方を予測ピクチャとするピクチャである。
さらに、上記の圧縮符号化方式では、ランダムアクセスを容易にするための複数のピクチャ群であるGOP(Group Of Pictures)が定義されている。なお、H.264では、GOPは特に規格化されていないものの、これと同様の構造が利用されている。GOPにおいては、符号化順で先頭となるピクチャはIピクチャとされ、残りの領域にPピクチャおよびBピクチャが現れる。通常、2つのPピクチャの間には1〜4程度のBピクチャが挿入されることが多い。また、I,P,Bのピクチャタイプは固定的に割り当てられる場合が多いが、例えば、画質改善などを目的として任意のフレームをIフレームとするといった符号化方法も考えられている(例えば、特許文献1参照)。
さらに、GOPには、オープンGOP(Open GOP)とクローズドGOP(Closed GOP)の2種類が存在する。ここで、図15は、オープンGOPの構造について説明するための図である。また、図16は、クローズドGOPの構造について説明するための図である。
図15および図16のそれぞれの上側には、入力動画像におけるピクチャの順序を示しており、これらのピクチャに付された番号は、ピクチャの再生順を示している。一方、図15および図16のそれぞれの下側には、符号化動画像データにおけるピクチャの順序を示しており、これらのピクチャには、ピクチャタイプと、符号化対象とされた入力動画像データ内のピクチャの番号とが付されている。例えば、図15の符号化画像におけるピクチャ“I2”は、入力動画像データにおけるピクチャ“2”を符号化したIピクチャであることを示している。
図15の例では、入力動画像データにおけるピクチャ“0”からピクチャ“11”までの12のピクチャが1つのGOPを構成している。オープンGOP方式で符号化された符号化画像では、1つのGOP内のピクチャの参照先は、同一のGOPのみならず他のGOP(通常は直前のGOP)となる場合がある。図15の例では、符号化画像におけるピクチャ“B0”およびピクチャ“B1”は、直前のGOPに存在するピクチャ“P−1”をともに参照している。このように、オープンGOPでは、複数のGOPを跨いだピクチャ参照が許容される。
一方、図16の例では、入力動画像データにおけるピクチャ“2”からピクチャ“11”までの10のピクチャが1つのGOPを構成している。クローズドGOP方式で符号化された符号化画像では、1つのGOP内のピクチャの参照先は、同一のGOP内のピクチャに限定される。例えば、図16において、GOPに最初に出現するBピクチャであるピクチャ“B3”は、同一のGOP内のピクチャ“I2”を参照している。
オープンGOPとクローズドGOPとを比較すると、オープンGOPの方が符号化効率が高いと言える。例えば、オープンGOP方式で符号化した符号化画像よりもクローズドGOP方式で符号化した符号化画像の方が、符号化効率の高いBピクチャの数が少なくなる。
一方、クローズドGOPでは、GOPの復号処理が他のGOPに依存しないことから、GOP単位で符号化画像をつなぎ合わせて編集しても、復号処理を正常に実行できるという利点がある。オープンGOPの場合、単純にGOP単位で符号化画像をつなぎ合わせると、他のGOPを参照するピクチャを復号する際に参照ピクチャが存在しないことになり、正常に復号できない。
ところで、上記の圧縮符号化方式では、GOPに含まれる各フレームをどのように符号化するかという点において、多くの自由度が存在する。例えば、符号化処理の際に、Pピクチャが出現する間隔M、フレーム構造/フィールド構造、動きダイレクトモード(時間ダイレクト/空間ダイレクト)などのパラメータを設定可能である。これらのパラメータについての最適な値は、シーンによって変動する。これらのパラメータの最適値をより高精度に求めるには、異なるパラメータを用いて実際に符号化処理を行い、それらの符号化結果を検証して最適値を判定することが望ましい。
そこで、それぞれ異なる符号化パラメータを設定した複数の符号化部を用意し、各符号化部によって同一の動画像を並列に符号化して、得られた符号化動画像の中からシーンに応じて最適なものを選択的に出力することが考えられている。この技術では、得られた複数の動画像の中から最適なものを、GOP単位で切り替えて出力することが考えられている(例えば、特許文献2〜4参照)。
特開平8−60956号公報 特開2000−341690号公報 特開2000−23154号公報 特開2006−295492号公報
前述のように、クローズドGOPよりオープンGOPの方が、符号化効率を向上させ、同じデータ量であればより高画質の圧縮処理を行うことができる。
その一方、上記のように複数の符号化部により得られた符号化動画像データをGOP単位で選択して出力する技術は、クローズドGOP方式で符号化した場合には容易に実現可能である。これは、前述のように、クローズドGOPでは、GOPの復号処理が他のGOPに依存しないためである。しかしながら、オープンGOP方式で符号化する場合には、上記のように符号化動画像データをGOP単位で選択して出力すると、復号処理を正常に実行できない。
本発明はこのような点に鑑みてなされたものであり、符号化効率が高く、なおかつ高画質な符号化動画像データを生成可能な画像符号化装置、画像符号化制御方法および画像符号化プログラムを提供することを目的とする。
上記目的を達成するために、画像符号化装置が提供される。この画像符号化装置は、同一の動画像データが入力されて、それぞれ異なる符号化パラメータを用いて圧縮符号化処理を行う複数の符号化部と、前記各符号化部による符号化結果に基づき、フレーム内符号化画像を少なくとも1つ含む一定数の連続する画像を有する画像群ごとに、前記各符号化部によって符号化された符号化動画像データのうち1つを、選択すべきデータとして判定する選択判定部と、前記選択判定部による判定結果に応じて、前記各符号化部からの符号化動画像データのうち1つを選択的に出力する選択部と、前記各符号化部に、再生時刻が同一であって前記画像群内で最初に符号化されるフレーム内符号化画像に基づく局所復号画像がすべての前記符号化部で同一になるように、圧縮符号化処理を実行させる制御部と、を有する。また、前記選択部は、1つの前記符号化部からの前記符号化動画像データから他の前記符号化部からの前記符号化動画像データへ出力を切り替える際の出力切り替え位置を、前記各符号化部から出力される符号化動画像データ内の前記画像群に最初に現れる順方向フレーム間予測符号化画像の直前とする。
このような画像符号化装置では、複数の符号化部に対して同一の動画像データが入力される。これらの符号化部は、それぞれ異なる符号化パラメータを用いて、入力された動画像データを圧縮符号化処理する。また、各符号化部の圧縮符号化処理は、制御部により、再生時刻が同一であって画像群内で最初に符号化されるフレーム内符号化画像に基づく局所復号画像がすべての符号化部で同一になるように制御される。選択判定部は、各符号化部による符号化結果に基づき、各符号化部によって符号化された符号化動画像データのうち1つを、選択すべきデータとして判定する。このような判定処理は、フレーム内符号化画像を少なくとも1つ含む一定数の連続する画像を有する画像群ごとに、実行される。選択部は、選択判定部による判定結果に応じて、各符号化部からの符号化動画像データのうち1つを選択的に出力する。このとき、出力切り替え位置は、各符号化部から出力される符号化動画像データ内の画像群に最初に現れる順方向フレーム間予測符号化画像の直前とされる。
上記の画像符号化装置によれば、符号化効率が高く、なおかつ高画質な符号化動画像データを生成することができる。
本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
第1の実施の形態に係る画像符号化装置の構成例を示す図である。 画像符号化装置における符号化動画像データの出力選択動作を説明するための図である。 符号化部の内部構成例を示す図である。 符号化動画像データに付加されたフレームナンバの例を示す図である。 制御部および符号化制御部が備える機能を示すブロック図である。 GOPの圧縮符号化処理終了時における符号化パラメータの受け渡しについて説明するための図である。 符号化動画像データの出力選択動作を説明するための図である。 符号化部の処理手順を示すフローチャートである。 制御部の処理手順を示すフローチャートである。 選択部の内部構成例を示す図である。 バッファ部の内部構成例を示す図である。 選択部における出力切り替え動作の第1の例を示す図である。 選択部における出力切り替え動作の第2の例を示す図である。 画像符号化装置の機能を実現するコンピュータのハードウェア構成例を示す図である。 オープンGOPの構造について説明するための図である。 クローズドGOPの構造について説明するための図である。
以下、実施の形態を図面を参照して詳細に説明する。
なお、以下の説明では、動画像を構成する個々の静止画像を“フレーム”と表現する。ただし、以下で説明する処理は、動画像データをフレーム単位で圧縮符号化する場合だけでなく、フィールド単位で圧縮符号化する場合にも適用可能である。フィールド単位で圧縮符号化が行われる場合には、以下の説明において、1フレームを単位として行われる処理が、対応するトップ/ボトムの2つのフィールドを単位として行われると考えればよい。
[第1の実施の形態]
図1は、第1の実施の形態に係る画像符号化装置の構成例を示す図である。
図1に示す画像符号化装置100は、動画像データを所定の符号化方式に従って圧縮符号化し、符号化動画像データを出力する装置である。この画像符号化装置100は、複数の符号化部200_1,200_2,200_3,……と、制御部300と、選択部400とを備えている。
符号化部200_1,200_2,200_3,……は、同一の動画像データの入力を受けて、それぞれ異なる符号化パラメータを用いて圧縮符号化処理を行う。この符号化パラメータとしては、例えば、符号化動画像データにおいて順方向フレーム間予測符号化画像の間に配置される双方向フレーム間予測符号化画像の数を示すパラメータを適用可能である。また、この他に例えば、フレーム単位またはフィールド単位のどちらで符号化するかを示すパラメータを適用することも可能である。あるいは、動きベクトルを符号化済みの他のフレームまたは同一フレーム内の符号化済みの画像領域のどちらから求めるかを示すパラメータを適用することも可能である。また、これらのパラメータのうちの2つ以上が、符号化部200_1,200_2,200_3,……ごとに異なるようにしてもよい。
制御部300は、符号化部200_1,200_2,200_3,……および選択部400の動作を制御する。本実施の形態では、制御部300は、選択判定部301およびパラメータ設定部302の機能を備えている。ただし、これらの機能は、例えば、それぞれ個別のハードウェアによって実現されてもよい。
選択判定部301は、符号化部200_1,200_2,200_3,……による符号化結果に基づいて、これらの符号化部200_1,200_2,200_3,……から出力される符号化動画像データのうち1つを、選択すべきデータとして判定する。選択判定部301は、例えば、符号化部200_1,200_2,200_3,……から出力される符号化動画像データのうち最も符号化効率が高いデータを、選択すべきデータとして判定する。
また、選択判定部301は、上記の判定処理を、符号化部200_1,200_2,200_3,……で符号化される連続した一定数の画像を有する画像群ごとに実行する。この画像群は、フレーム内符号化画像を少なくとも1つ含むものであり、さらに、順方向フレーム間予測画像や双方向フレーム間予測画像を、所定の間隔で含むこともできる。選択判定部301は、例えば、ある画像群に対する符号化部200_1,200_2,200_3,……の符号化結果を基に、次の画像群としてどの符号化部200_1,200_2,200_3,……からのデータを選択出力するべきかを判定する。
パラメータ設定部302は、符号化部200_1,200_2,200_3,……に対して、処理のための各種のパラメータを設定する。パラメータ設定部302は、後述するように、例えば、次の画像群内で最初に符号化されるフレーム内符号化画像の圧縮符号化処理に用いられるパラメータを、すべての符号化部200_1,200_2,200_3,……に対して共通に設定する。この共通のパラメータは、各符号化部200_1,200_2,200_3,……において画像群の圧縮符号化処理が完了したとき、選択判定部301により選択されていた符号化動画像データに対応する符号化部での符号化処理結果に基づいて、決定される。
選択部400は、制御部300の選択判定部301による判定結果に基づき、符号化部200_1,200_2,200_3,……から出力される符号化動画像データのうち1つを、選択的に出力する。
ここで、圧縮符号化方式としてMPEG−1/−2/−4を例に挙げて、上記の画像符号化装置100の処理をより詳細に説明する。なお、これらの圧縮符号化方式では、前述の画像群は“GOP”、フレーム内符号化画像は“Iフレーム”、順方向フレーム間予測符号化画像は“Pフレーム”、双方向フレーム間予測符号化画像は“Bフレーム”に対応する。
図2は、画像符号化装置における符号化動画像データの出力選択動作を説明するための図である。なお、この図2では、2つの符号化部200_1,200_2のいずれかからの出力データを、選択部400によって選択的に出力するものとする。
図2の上側には、符号化部200_1,200_2のそれぞれから出力される符号化動画像データにおけるフレームの並び順を示している。また、その下には、制御部300の選択判定部301による判定結果を示している。この判定結果は、符号化部200_1,200_2のどちらからの出力データを、選択部400において選択すべきかを表している。さらに、その下には、選択部400から出力される符号化動画像データのフレームの並び順を示している。
なお、フレームの並び順を示す図においては、図15および図16の場合と同様に、各フレームに、ピクチャタイプと、符号化対象とされた入力動画像データ内のフレームの番号とが付されている。例えば、フレーム“I3”は、入力動画像データにおけるフレーム“3”を符号化したIフレームであることを示している。
また、選択部400から出力される符号化動画像データは、実際には、選択部400に設けられたバッファ(図示せず)などの作用により、符号化部200_1,200_2から出力される符号化動画像データよりも遅れて出力される。しかし、図2では、説明をわかりやすくするために、このような遅延を無視している。
図2において、符号化部200_1によって符号化された符号化動画像データでは、フレーム“I3”からフレーム“B11”までの12フレームが、1つのGOPを構成している。一方、符号化部200_2によって符号化された符号化動画像データでは、フレーム“I3”からフレーム“B10”までの12フレームが、1つのGOPを構成している。
ここで、符号化部200_1,200_2のそれぞれの圧縮符号化処理では、GOPの先頭に位置するIフレームの再生(表示)時刻が同一となるように、GOPが形成されている。例えば、符号化部200_1,200_2のそれぞれからの符号化動画像データでは、フレーム“I3”はともに入力動画像データのフレーム“3”を圧縮符号化したものである。また、フレーム“I15”はともに入力動画像データのフレーム“15”を圧縮符号化したものである。
さらに、この図2においては、符号化部200_1,200_2は、オープンGOP方式で圧縮符号化処理を行っている。例えば、符号化部200_1からの符号化動画像データにおいて、フレーム“B1”の参照先は、同じGOPに含まれるフレーム“I3”と、直前のGOPに含まれるフレーム“P0”となる。また、符号化部200_2からの符号化動画像データにおいて、フレーム“B0”の参照先は、同じGOPに含まれるフレーム“I3”と、直前のGOPに含まれるフレーム“P−1”となる。
また、符号化部200_1,200_2のそれぞれでの圧縮符号化処理では、符号化パラメータとして、Pフレームが現れる間隔Mが異なっている。すなわち、符号化部200_1ではM=3とされ、符号化部200_2ではM=4とされている。
ところで、前述のように、オープンGOP方式で圧縮符号化処理を行った場合、符号化部200_1,200_2のそれぞれから出力される符号化動画像データを、単にGOP単位で切り替えて出力することはできない。これは、予測符号化の際の参照画像が他のGOPに存在する画像となる場合があることから、復号の際に正しい参照画像を生成できなくなるためである。
これに対して、本実施の形態の画像符号化装置100では、符号化部200_1,200_2のそれぞれからの符号化動画像データを選択部400によって切り替える位置を、GOPに最初に現れるPフレームの直前としている。GOPに最初に現れるPフレームは、そのGOPの先頭のIフレームを参照する。図2の例では、フレーム“I3”を先頭とするGOPの圧縮符号化時において、選択判定部301が、符号化部200_1による符号化動画像データから符号化部200_2による符号化動画像データに切り替えるように判定している。このとき、選択部400は、符号化部200_1からの動画像データのうち、GOPにおいて最初に現れるPフレームであるフレーム“P6”の直前のフレーム“B2”までを出力する。その次に、符号化部200_2からのGOPにおいて最初に現れるPフレームであるフレーム“P7”を先頭として、出力データを符号化部200_2からの符号化動画像データに切り替える。
さらに、符号化部200_1,200_2のすべてにおいて、GOPの先頭に位置するIフレームに基づく局所復号画像のデータが全く同じになるように、圧縮符号化処理が実行される。これにより、GOPに最初に現れるPフレームが参照する画像のデータがどの符号化部でも同一になる。このため、GOPに最初に現れるPフレームの直前で符号化動画像データを切り替えても、選択部400から出力された符号化動画像データを完全に正常に復号することができ、高品質な復号画像が得られる。
このような処理により、符号化効率の高いオープンGOP方式を用いながらも、複数の符号化部から出力された符号化動画像データのうち、画質などの品質が高いものを選択して出力できるようになる。従って、符号化効率が高く、なおかつ高画質な符号化動画像データを生成することが可能になる。
画像符号化装置100では、例えば、制御部300のパラメータ設定部302により、すべての符号化部200_1,200_2に対して、GOPの先頭に位置するIフレームに基づく局所復号画像が同一となるように共通の符号化パラメータが設定される。
パラメータ設定部302は、例えば、このIフレームの圧縮符号化処理に用いられる符号化レート制御用のパラメータを、すべての符号化部200_1,200_2に対して共通に設定する。この符号化レート制御用パラメータは、直前のGOPに対する圧縮符号化処理が完了したとき、その時点で選択判定部301により選択されていた符号化動画像データを出力した符号化部での符号化結果に基づいて決定される。これにより、選択部400から出力される符号化動画像データの復号時に、入力バッファのオーバフロー/アンダフローが防止されるなど、出力レートが適正に制御されるようになる。
[第2の実施の形態]
次に、圧縮符号化方式としてH.264を用いた場合の例について説明する。ただし、以下の第2の実施の形態での処理は、圧縮符号化処理時にフレームナンバが用いられることを除けば、MPEG−1/−2/−4を用いた場合でも適用可能である。
本実施の形態の画像符号化装置100の基本的な構成は、図1に示した構成と同じであり、本実施の形態の画像符号化装置100は、複数の符号化部200_1,200_2,200_3,……、制御部300および選択部400を備える。
図3は、符号化部の内部構成例を示す図である。なお、複数の符号化部200_1,200_2,200_3,……のそれぞれは同じ構成を有するため、図3では、これらを“符号化部200”としてまとめて説明する。
符号化部200は、マクロブロック(MB)生成部201、予測誤差信号生成部202、直交変換部203、量子化部204、エントロピー符号化部205、逆量子化部206、逆直交変換部207、参照画像生成部208、参照画像記憶部209、フレーム内予測部210、フレーム間予測部211、動きベクトル演算部212、予測画像選択部213および符号化制御部220を備えている。
マクロブロック生成部201は、入力画像を16画素×16画素のブロックであるマクロブロックに分割し、予測誤差信号生成部202および動きベクトル演算部212に出力する。以下、マクロブロック単位の画像データを“ブロックデータ”と呼ぶ。
予測誤差信号生成部202は、マクロブロック生成部201からのブロックデータと、予測画像選択部213からの予測画像のデータとの差分を演算することにより、予測誤差信号を生成する。直交変換部203は、予測誤差信号生成部202からの予測誤差信号を直交変換し、水平方向および垂直方向の周波数成分に分離された信号を出力する。量子化部204は、直交変換部203からの出力信号を量子化する。これにより、予測誤差信号の符号量が低減される。
エントロピー符号化部205は、量子化部204からの量子化データをエントロピー符号化し、符号化動画像データを出力する。ここで、エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる符号化方式を指す。
逆量子化部206は、量子化部204からの量子化データを逆量子化する。逆直交変換部207は、逆量子化部206からの出力データに逆直交変換処理を施す。これにより、符号化前の予測誤差信号と同程度の信号が得られる。
参照画像生成部208は、インター予測画像生成部121により動き補償されたブロックデータと、逆量子化部206および逆直交変換部207によって復号された予測誤差信号とを加算する。これにより、動き補償された参照画像のブロックデータ、すなわち局所復号画像のデータが生成され、参照画像記憶部209に格納される。
フレーム内予測部210は、同じピクチャにおけるすでに符号化された周辺画素から、予測画像のブロックデータを生成する。一方、フレーム間予測部211は、参照画像記憶部209から読み込んだ参照画像のデータを、動きベクトル演算部212から出力される動きベクトルによって動き補償することにより、動き補償された予測画像のブロックデータを生成する。
動きベクトル演算部212は、マクロブロック生成部201から出力された現画像のブロックデータと、参照画像記憶部209から読み込んだ参照画像のデータとを基に、動きベクトルを算出する。
予測画像選択部213は、フレーム内予測部210またはフレーム間予測部211のどちらか一方から出力される予測画像を選択し、予測誤差信号生成部202および参照画像生成部208に出力する。
符号化制御部220は、符号化部200全体の処理を統括的に制御する。符号化制御部220は、例えば、エントロピー符号化部205での符号化結果を基に、量子化部204での量子化ステップを決定するなど、その後の圧縮符号化処理における符号化レートを制御する機能を備える。また、符号化制御部220は、符号化結果を制御部300に通知する機能や、制御部300から符号化パラメータを受信し、この符合化パラメータに応じて符号化部200内の各部を制御する機能も備える。なお、この符号化制御部220が備える機能については、後により詳しく説明する。
ところで、H.264では、符号化動画像データ内のスライスヘッダに、フレームナンバ(frame_num)と呼ばれるデータが書き込まれる。フレームナンバは、基本的に、符号化順にシーケンシャルに増加する値であり、例えば、各符号化部200_1,200_2,200_3,……においてカウントされて、符号化動画像データに付加される。
図4は、符号化動画像データに付加されたフレームナンバの例を示す図である。
フレームナンバは、フレーム間予測符号化画像によって参照されるフレームが新たに出現したときに、その次のフレームにおいて“1”だけ増加する。すなわち、フレームナンバは、符号化動画像データの先頭から、現在のフレームの1つ前のフレームまでに含まれる参照フレームの個数を表す。例えば、図4において、フレーム“I3”は、フレーム“B1”やフレーム“B2”によって新たに参照されるフレームであるので、その次のフレーム“B1”では、フレームナンバに“1”が加算される。
このようなフレームナンバは、H.264方式の復号器では、どのフレームが参照フレームかを特定するために利用される。このため、符号化器ではフレームナンバを正確に付加することが求められる。しかしながら、図2に示した処理により、複数の符号化部200_1,200_2,200_3,……からの符号化動画像データを切り替えて出力する場合には、出力の切り替えの際にフレームナンバが不連続になることがある。このような事態は、例えば、符号化部200_1,200_2,200_3,……ごとに、Pフレームが現れる間隔Mが異なっている場合に発生し得る。このような事態が発生した場合には、生成された符号化動画像データを正しく復号することができなくなる。
そこで、本実施の形態の画像符号化装置100では、図2に示したような処理により符号化動画像データの切り替え出力が行われるとともに、フレームナンバを正しく付加できるようにする。
図5は、制御部および符号化制御部が備える機能を示すブロック図である。
図5に示すように、制御部300は、パラメータ設定部311、選択判定部312およびフレームナンバ制御部313を備えている。一方、符号化部200の符号化制御部220は、符号化レート制御部221、内部制御用カウンタ222および出力用カウンタ223を備えている。
符号化制御部220において、符号化レート制御部221は、符号化部200での圧縮符号化処理における符号化レートを制御する。例えば、符号化制御部220は、復号器側の仮想的なバッファであるVBV(Video Buffer Verifier)バッファの蓄積量を管理する。そして、VBVバッファがオーバフローもアンダフローもしないように、フレームごとに割り当てる目標情報量や、量子化処理時の量子化ステップなどを演算する。
また、符号化レート制御部221は、必要に応じて、制御部300のパラメータ設定部311から符号化パラメータを受信し、受信した符号化パラメータを基に符号化レートを制御する。さらに、符号化レート制御部221は、1つのGOPの圧縮符号化処理が完了するたびに、その処理に応じて算出された符号化パラメータを、パラメータ設定部311に対して送信する。
内部制御用カウンタ222は、符号化部200での圧縮符号化処理において使用されるフレームナンバをカウントする。この内部制御用カウンタ222は、フレーム間予測符号化画像によって参照されるフレームが新たに出現した場合に、その次のフレームに対する処理開始時に“1”だけカウントアップする。
出力用カウンタ223は、符号化部200から出力される符号化動画像データに付加されるフレームナンバをカウントする。この出力用カウンタ223は、内部制御用カウンタ222が“1”だけカウントアップすると、これに同期して“1”だけカウントアップする。また、出力用カウンタ223のカウント値は、制御部300のフレームナンバ制御部313から出力される値によって設定できるようになっている。
なお、内部制御用カウンタ222は、H.264用の既存の符号化器において、内部制御のためでなく、出力される符号化動画像データに付加するフレームナンバを生成するためにも用いられていたものに対応する。本実施の形態では、これらのうち後者の機能が、出力用カウンタ223によって実現される。また、符号化器としては、内部制御のためにフレームナンバを用いない構成も考えられ、そのような場合には、内部制御用カウンタ222を設けなくてもよい。この場合、内部制御用カウンタ222をカウントアップするためのタイミング信号(図示せず)が、出力用カウンタ223に対して直接供給されればよい。また、出力用カウンタ223の機能が、制御部300に設けられてもよい。
一方、制御部300において、パラメータ設定部311は、符号化部200との間で各種の符号化パラメータを送受信する。例えば、パラメータ設定部311は、GOPの圧縮符号化処理が完了すると、その時点で符号化動画像データの出力元として選択されている符号化部200の符号化レート制御部221から、処理の結果得られた各種の符号化パラメータを受信する。その後、次のGOPの圧縮符号化処理が開始される際に、受信した符号化パラメータを基に、そのGOPの先頭のIフレームに対する符号化レート制御のためのパラメータを決定する。そして、そのパラメータを、複数の符号化部200_1,200_2,200_3,……に対して共通に出力する。
選択判定部312は、パラメータ設定部311が符号化レート制御部221から受信した符号化パラメータの一部を基に、得られたGOP単位の符号化動画像データを評価するための数値であるコストを算出する。そして、最もコストが低い符号化動画像データを出力している符号化部200_1,200_2,200_3,……を判定し、その符号化部を選択したことを示す選択信号SELを、選択部400に対して出力する。また、この選択信号SELは、パラメータ設定部311およびフレームナンバ制御部313に対しても通知される。
フレームナンバ制御部313は、符号化部200から出力される符号化動画像データに付加されるフレームナンバを制御する。具体的には、フレームナンバ制御部313は、GOPの圧縮符号化処理が完了すると、選択判定部312によって選択されている符号化部200の出力用カウンタ223から、その時点でのカウント値を取得する。そして、選択判定部312により次に選択された符号化部200の出力用カウンタ223に対して、取得したカウント値を設定する。
ところで、図5には、制御部300と符号化部200との間で受け渡される符号化パラメータとして、符号化制御情報A1〜A3、レート制御情報B1〜B6および符号化統計情報C1〜C6を示している。以下、これらの符号化パラメータについて説明する。
符号化制御情報A1は、生成される符号化動画像データにおいてPフレームが現れる間隔Mを指定するためのパラメータである。この符号化制御情報A1は、例えば、圧縮符号化処理の開始時など、符号化部200が初期化されたときに、パラメータ設定部311から符号化部200に対して設定される。本実施の形態では、符号化部200_1,200_2,200_3,……ごとに、符号化制御情報A1として異なる値が設定されるものとする。なお、例えば、この符号化制御情報A1を用いずに、Pフレームが現れる間隔Mが、あらかじめ各符号化部200_1,200_2,200_3,……に設定されていてもよい。
符号化制御情報A2は、選択部400から出力される符号化動画像データ内のGOPの最終フレームに付加されるフレームナンバを示す。GOPの圧縮符号化処理が完了したとき、その時点で選択判定部312により選択されている符号化部200の出力用カウンタ223のカウント値が、符号化制御情報A2として制御部300のフレームナンバ制御部313に出力される。
符号化制御情報A3は、次のGOPの先頭に位置するIフレームに付加されるフレームナンバを示す。この符号化制御情報A3は、制御部300のフレームナンバ制御部313から、すべての符号化部200_1,200_2,200_3,……に対して共通に出力される。そして、各符号化部200_1,200_2,200_3,……の出力用カウンタ223に対して設定される。
次に、レート制御情報B1〜B6は、符号化部200の符号化レート制御部221での符号化レート制御のために、制御部300のパラメータ設定部311から出力されるパラメータである。なお、これらのレート制御情報B1〜B6については、複数の符号化部200_1,200_2,200_3,……に対してそれぞれ共通の値が設定される。
レート制御情報B1は、その符号化部200から出力される符号化動画像データのビットレートを示す。
レート制御情報B2は、レート制御時におけるVBVバッファの容量を示す。
なお、以上のレート制御情報B1,B2は、符号化部200が初期化されたときに、パラメータ設定部311から符号化レート制御部221に対して設定される。
レート制御情報B3は、GOPの先頭に位置するIフレームの圧縮符号化処理を開始する時点でのVBVバッファの位置を示す。
レート制御情報B4は、GOPの先頭に位置するIフレームの目標情報量を示す。
レート制御情報B5は、GOPの先頭に位置するIフレームの圧縮符号化処理を開始する際の初期量子化ステップを示す。
レート制御情報B6は、GOPの先頭に位置するIフレームの圧縮符号化処理を開始する時点での初期量子化バッファの位置を示す。
なお、以上のレート制御情報B3〜B6は、GOPに対する圧縮符号化処理が開始されるごとに、パラメータ設定部311から符号化レート制御部221に対して設定される。
次に、符号化統計情報C1〜C6は、符号化部200での符号化結果として得られるパラメータである。これらの符号化統計情報C1〜C6は、GOPに対する圧縮符号化処理が完了したときに、符号化レート制御部221から、制御部300のパラメータ設定部311に対して出力される。
符号化統計情報C1は、GOPの最後のフレームについての圧縮符号化処理の終了時におけるVBVバッファの位置を示す。
符号化統計情報C2は、GOP内の各フレームの発生情報量を示す。
符号化統計情報C3は、各フレーム内のマクロブロックに割り当てられた量子化ステップの平均値を示す。
符号化統計情報C4は、GOP内の各フレームの符号化歪みを示す。
符号化統計情報C5は、GOPの先頭に位置するIフレームの圧縮符号化処理が終了したときの量子化バッファの位置を示す。
符号化統計情報C6は、次のGOPの先頭に位置するIフレームの目標情報量を示す。
ここで、図6は、GOPの圧縮符号化処理終了時における符号化パラメータの受け渡しについて説明するための図である。
前述のように、GOPの圧縮符号化処理が終了すると、各符号化部200_1,200_2,200_3,……から制御部300に対して、符号化制御情報A2と、符号化統計情報C1,C3,C5,C6とが出力される。このとき、制御部300は、このGOPの処理において選択判定部312によって選択されていた符号化部からの符号化制御情報A2および符号化統計情報C1,C3,C5,C6を取得する。図6の例では、符号化部200_1が選択されていたものとする。
なお、符号化制御情報A2と、符号化統計情報C1,C3,C5,C6は、選択判定部312によって選択されていた符号化部のみから、制御部300に対して出力されるようにしてもよい。一方、制御部300は、符号化統計情報C2,C4についてはすべての符号化部200_1,200_2,200_3,……から取得し、後述するように、これらの情報をコストの演算に利用する。
制御部300のフレームナンバ制御部313は、選択判定部312によって選択されていた符号化部からの符号化制御情報A2を、符号化制御情報A3として、すべての符号化部200_1,200_2,200_3,……に出力する。さらに、制御部300のパラメータ設定部311は、選択されていた符号化部からの符号化統計情報C1,C6,C3,C5を、それぞれレート制御情報B3,B4,B5,B6として、すべての符号化部200_1,200_2,200_3,……に出力する。
すべての符号化部200_1,200_2,200_3,……では、出力用カウンタ223のカウント値が、制御部300からの符号化制御情報A3の値に設定される。これにより、次のGOPの処理においてどの符号化部200_1,200_2,200_3,……からの符号化動画像データが選択された場合でも、出力される符号化動画像データに対してフレームナンバが連続して付加されるようになる。
さらに、すべての符号化部200_1,200_2,200_3,……では、符号化レート制御部221に対して、制御部300からのレート制御情報B3〜B6が設定される。これにより、すべての符号化部200_1,200_2,200_3,……において、次のGOPの先頭に位置するIフレームの圧縮符号化処理が、同じ符号化パラメータを用いて実行されるようになる。従って、すべての符号化部200_1,200_2,200_3,……から出力される符号化動画像データでは、GOPの先頭のIフレームに基づく局所復号画像が同一になる。
図7は、符号化動画像データの出力選択動作を説明するための図である。なお、この図7では、前述の図2と同様に、2つの符号化部200_1,200_2のいずれかからの出力データを、選択部400によって選択的に出力するものとする。また、図2と同様に、符号化部200_1,200_2のそれぞれでの圧縮符号化処理では、Pフレームが現れる間隔Mがそれぞれ“3”、“4”とされている。
図7では、基本的に、図2の場合と同様の出力選択動作が行われている。すなわち、フレーム“I3”を先頭とするGOPの直前において、選択判定部312による選択対象が符号化部200_1から符号化部200_2に切り替えられている。選択部400では、GOPの先頭から最初に現れるPフレームの直前において、出力する符号化動画像データが切り替えられる。図7の例では、符号化部200_1からの符号化動画像データについては、GOPの先頭から最初に現れるPフレームであるフレーム“P6”の直前フレームまでが、選択部400から出力される。そしてその後、符号化部200_2からの符号化動画像データについては、GOPの先頭から最初に現れるPフレームであるフレーム“P7”を先頭として、選択部400から出力される。
ここで、図6で説明したように、符号化部200_1,200_2では、GOPの先頭のIフレームに基づく局所復号画像が同一になるように圧縮符号化処理が行われている。このため、選択部400から出力される符号化動画像データにおいては、GOPの先頭から最初に現れるPフレームの参照画像が、出力切り替えの有無に関係なく同一の画像となる。従って、オープンGOP方式で圧縮符号化処理が行われた場合でも、選択部400から出力される符号化動画像データは、正しく復号可能なデータとなる。
また、図7では、各フレームに対応するフレームナンバについても記載している。ここでは、内部制御用カウンタ222によるカウント値を“内部フレームナンバ”、出力用カウンタ223によるカウント値を“出力フレームナンバ”と呼ぶことにする。
図7において、フレーム“I3”を先頭とするGOPの圧縮符号化処理が開始される直前のタイミングでは、選択判定部312により選択されていた符号化部200_1から、前のGOPの最終フレームに付加された出力フレームナンバが制御部300に出力される。図7の例では、この出力フレームナンバは“10”となっている。そして、この出力フレームナンバが、符号化部200_2の出力用カウンタ223のカウント値として設定される。
符号化部200_2の出力用カウンタ223は、設定された出力フレームナンバを初期値として、以後、内部制御用カウンタ222と同期してカウントアップ動作を行う。そして、この出力用カウンタ223のカウント値が、出力される符号化動画像データに対してフレームナンバとして付加される。このような処理により、選択部400から出力される符号化動画像データに対してフレームナンバが連続して付加され、その符号化動画像データを復号器で正常に復号できるようになる。
次に、符号化統計情報の演算方法について説明する。なお、ここでは、MPEG−2 TM5で規定された符号化レート制御方法を基本として説明する。
符号化部200の符号化レート制御部221は、符号化レート制御のための機能の例として、フレーム単位で目標情報量を決定する機能と、マクロブロック単位で量子化ステップを決定する機能とを備えている。符号化レート制御部221は、圧縮符号化処理の実行時に、VBVバッファがオーバフローもアンダフローもしないように、目標情報量や量子化ステップなどを決定する。
符号化レート制御部221は、圧縮符号化処理の実行中に、次のフレームを符号化する際の目標情報量を、ピクチャタイプごとに演算している。Iフレーム、Pフレーム、Bフレームの目標情報量は、それぞれ次の式(1)〜式(3)に従って算出される。
Figure 0005267655
なお、上記の式(1)〜式(3)において、変数bit_rateは、符号化動画像データのビットレート(bits/sec)を示し、圧縮符号化処理の開始時に、レート制御情報B1として制御部300から与えられた値である。変数picture_rateは、フレームレート(frames/sec)を示す。変数Rは、GOP全体に対して割り当てられた情報量を示し、各フレームの圧縮符号化処理後に、そのフレームの実発生情報量分だけ減算されるものである。
変数Np,Nbは、それぞれGOP内のPフレーム、Bフレームの数を示す。変数Xi,Xp,Xbは、それぞれのIフレーム、Pフレーム、Bフレームの符号化複雑度を示す。この符号化複雑度は、発生情報量と量子化ステップとの積により求められる。変数Kp,Kbは、それぞれPフレーム、Bフレームに対する重みであり、これらはあらかじめ決められた固定値とされる。
符号化レート制御部221は、GOPの圧縮符号化処理が完了すると、次のIフレームについての目標情報量を、符号化統計情報C6として制御部300のパラメータ設定部311に出力する。さらに、符号化レート制御部221は、そのGOPの最後のフレームに対する圧縮符号化処理の終了時におけるVBVバッファの位置を、符号化統計情報C1としてパラメータ設定部311に出力する。
パラメータ設定部311は、図6で説明したように、そのGOPにおいて選択判定部312によって選択されている符号化部200から出力された符号化統計情報C1,C6を取得する。そして、取得した符号化統計情報C1,C6を、それぞれレート制御情報B3,B4として、すべての符号化部200_1,200_2,200_3,……に対して通知する。これにより、すべての符号化部200_1,200_2,200_3,……において、次のGOPの先頭に位置するIフレームについての目標情報量が共通に設定される。一方、PフレームおよびBフレームについての目標情報量は、それぞれの符号化部200_1,200_2,200_3,……において個別に算出された値が利用される。
また、符号化レート制御部221は、マクロブロックごとの量子化ステップQを、次の式(4)に従って算出する。
Figure 0005267655
なお、上記の式(4)において、変数dXは、量子化バッファの位置を示す。ただし、Xはi,p,bのいずれかであり、変数di,dp,dbは、それぞれIフレーム、Pフレーム、Bフレームに関する量子化バッファの位置を示す。変数dXは、マクロブロックごとに、次の式(5)に従って演算されて、更新される。
Figure 0005267655
なお、上記の式(5)において、変数d’Xは、フレームの先頭マクロブロックの処理開始時における量子化バッファの初期位置を示す。変数jは、処理中のマクロブロックの番号を示す。変数Bj-1は、そのフレーム中の(j−1)番目のマクロブロックまでの発生情報量の総和を示す。変数MB_cntは、フレーム内のマクロブロックの総数を示す。
符号化レート制御部221は、GOPの圧縮符号化処理が完了すると、直前のIフレームの量子化時に用いられた量子化ステップQを基に、Iフレーム内の各マクロブロックの量子化ステップの平均値を算出する。そして、算出された値を、符号化統計情報C3として制御部300のパラメータ設定部311に出力する。さらに、符号化レート制御部221は、Iフレームの圧縮符号化処理終了時における量子化バッファの位置を、符号化統計情報C5としてパラメータ設定部311に出力する。この符号化統計情報C5は、式(5)により、j=MB_cntのときの変数diとして求められる。
パラメータ設定部311は、図6で説明したように、そのGOPにおいて選択判定部312によって選択されている符号化部200から出力された符号化統計情報C3,C5を取得する。そして、取得した符号化統計情報C3,C5を、それぞれレート制御情報B5,B6として、すべての符号化部200_1,200_2,200_3,……に対して通知する。すべての符号化部200_1,200_2,200_3,……は、このようにして通知された同一のレート制御情報B5,B6を、次のIフレームにおける先頭マクロブロックの量子化処理時に、それぞれ式(5)の量子化ステップQおよび変数d’Xとして設定する。
以上の処理により、符号化部200_1,200_2,200_3,……では、次のGOPの先頭のIフレームを圧縮符号化するために用いる目標情報量と先頭マクロブロックの量子化ステップとが、同じ値に設定される。これとともに、次のGOPの圧縮符号化処理におけるVBVバッファの初期位置および量子化バッファの初期位置が、同じ値に設定される。そしてそれ以後、符号化部200_1,200_2,200_3,……のそれぞれにおいて、VBVバッファがオーバフローもアンダフローもしないように符号化レートが制御される。これにより、次にどの符号化部200_1,200_2,200_3,……からの符号化動画像データが切り替えて出力された場合でも、出力された符号化動画像データは、復号器において正しく復号できるようになる。
次に、符号化部200および制御部300での処理全体について、フローチャートを用いて説明する。
図8は、符号化部の処理手順を示すフローチャートである。この図8の処理は、フレームごとの圧縮符号化処理時に実行されるものである。
[ステップS11]処理対象のフレームが、符号化動画像データ全体における先頭フレームである場合には、ステップS12の処理に進む。また、それ以外の場合には、ステップS13の処理に進む。
[ステップS12]符号化制御部220は、制御部300のパラメータ設定部311から出力された符号化制御情報A1を受信し、符号化動画像データにおいてPフレームが現れる間隔Mを設定する。本実施の形態では、この間隔Mとして、符号化部200_1,200_2,200_3,……ごとに異なる値が設定される。
なお、この間隔Mは、符号化部200_1,200_2,200_3,……のそれぞれにおいてあらかじめ設定されていてもよい。また、符号化部200_1,200_2,200_3,……ごとに異なる値が設定されるパラメータとしては、他に例えば、フレーム構造/フィールド構造の種別や、動きダイレクトモード(時間ダイレクト/空間ダイレクト)の種別などが適用されてもよい。
また、符号化レート制御部221は、制御部300のパラメータ設定部311から、レート制御情報B1,B2を取得し、符号化レート制御のためのパラメータの初期値として設定する。なお、レート制御情報B1,B2としては、すべての符号化部200_1,200_2,200_3,……に対して同じ値が設定される。また、なお、先頭のIフレームの目標情報量としては、例えば、ビットレートに応じて決定される初期値が適用される。
以上の処理が実行された後、ステップS16の処理に進む
[ステップS13]処理対象のフレームが、GOPの先頭のIフレームである場合には、ステップS15の処理に進む。また、それ以外の場合には、ステップS14の処理に進む。
[ステップS14]符号化レート制御部221は、符号化レート制御のためのパラメータを更新する。例えば、符号化レート制御部221は、処理対象のフレームの目標情報量を算出する。処理対象がPフレーム、Bフレームの場合には、それぞれ上記の式(2)、式(3)に従って目標情報量が演算される。また、GOP内に複数のIフレームが存在していて、このステップでの処理対象のフレームがIフレームである場合には、式(1)に従って目標情報量が演算される。この後、ステップS16の処理に進む。
[ステップS15]出力用カウンタ223は、制御部300のフレームナンバ制御部313から符号化制御情報A3を取得し、その値をカウント初期値として設定する。また、符号化レート制御部221は、制御部300のパラメータ設定部311から、レート制御情報B3〜B6を取得し、符号化レート制御のためのパラメータとして設定する。
すなわち、符号化レート制御部221は、レート制御情報B3を、対象フレーム(Iフレーム)の圧縮符号化開始時におけるVBVバッファの位置として設定する。また、レート制御情報B4を、このフレームの目標情報量として設定する。また、レート制御情報B5,B6を、マクロブロックの量子化ステップを導出するための値として設定する。また、レート制御情報B6を、このフレームの量子化開始時における量子化バッファの位置として設定する。
さらに、符号化レート制御部221は、このフレームを含むGOP全体の目標情報量を、次の式(6)に従って算出し、設定する。
Figure 0005267655
なお、上記の式(6)において、変数Nは、GOP中の総フレーム数を示す。変数Vcurrentは、Iフレームの圧縮符号化開始時におけるVBVバッファの位置を示し、レート制御情報B3が設定される。変数Vfullは、VBVバッファのサイズを示し、ステップS12ですでに取得されたレート制御情報B2が設定される。
この後、ステップS16の処理に進む。
[ステップS16]符号化部200は、対象フレームの圧縮符号化処理を実行する。このとき、符号化レート制御部221は、ステップS12,S14,S15のいずれかにおいて設定されたレート制御情報を用いて、符号化レートの制御を行う。
[ステップS17]処理対象のフレームが、GOPの最終フレームであった場合には、ステップS18の処理に進む。また、それ以外の場合には、このフレームの処理が終了される。
[ステップS18]出力用カウンタ223は、現在のカウント値を、制御部300のフレームナンバ制御部313に出力する。また、符号化レート制御部221は、符号化統計情報C1〜C6を、制御部300のパラメータ設定部311に出力する。なお、GOP内の各フレームの符号化歪みを示す符号化統計情報C4は、入力画像データと局所復号画像のデータとの間の差分絶対値和として求められる。
次に、図9は、制御部の処理手順を示すフローチャートである。この図9の処理は、フレームごとの圧縮符号化処理時に実行されるものである。
[ステップS21]処理対象のフレームが、符号化動画像データ全体における先頭フレームである場合には、ステップS22の処理に進む。また、それ以外の場合には、ステップS23の処理に進む。
[ステップS22]パラメータ設定部311は、符号化部200_1,200_2,200_3,……に対して、それぞれ異なる符号化制御情報A1を出力する。また、パラメータ設定部311,はレート制御情報B1,B2を、すべての符号化部200_1,200_2,200_3,……の符号化レート制御部221に対して共通に出力する。以上の処理が終了すると、このフレームの処理が終了される。
[ステップS23]処理対象のフレームが、GOPの先頭のIフレームである場合には、ステップS28の処理に進む。また、それ以外の場合には、ステップS24の処理に進む。
[ステップS24]処理対象のフレームが、GOPの最終フレームであった場合には、ステップS25の処理に進む。また、それ以外の場合には、このフレームの処理が終了される。
[ステップS25]パラメータ設定部311およびフレームナンバ制御部313は、選択判定部312からの選択信号SELに基づき、現在選択されている符号化部を判定する。そして、パラメータ設定部311は、判定された符号化部から、図8のステップS18の処理によって出力された符号化統計情報C1,C3,C5,C6を取得する。また、フレームナンバ制御部313は、判定された符号化部から、ステップS18の処理によって出力された符号化制御情報A2を取得する。
[ステップS26]パラメータ設定部311は、すべての符号化部200_1,200_2,200_3,……から、ステップS18の処理によって出力された符号化統計情報C2,C4を取得する。
[ステップS27]選択判定部312は、ステップS26においてパラメータ設定部311が取得した符号化統計情報C2,C4を基に、コストを算出する。そして、コストが最小となる符号化動画像データを生成した制御部を判定し、その制御部を指定するように選択信号SELを更新して、選択部400、パラメータ設定部311およびフレームナンバ制御部313に出力する。
コストは、次の式(7)に従って算出される。
Figure 0005267655
なお、上記の式(7)において、変数Nは、GOP中の総フレーム数を示す。変数dskは、GOP内のk番目のフレームの符号化歪みを示し、符号化統計情報C4により与えられる。変数λは、発生情報量への重みを示す。変数Rkは、GOP内のk番目のフレームの発生情報量を示し、符号化統計情報C2により与えられる。
以上の処理が実行されると、このフレームの処理が終了される。
[ステップS28]フレームナンバ制御部313は、直前に実行されたステップS25において取得した符号化制御情報A2を、符号化制御情報A3として、すべての符号化部200_1,200_2,200_3,……に出力する。また、パラメータ設定部311は、直前に実行されたステップS25において取得した符号化統計情報C1,C6,C3,C5を、それぞれレート制御情報B3,B4,B5,B6として、すべての符号化部200_1,200_2,200_3,……に出力する。以上の処理が実行されると、このフレームの処理が終了される。
以上の図8および図9に示した処理により、すべての符号化部200_1,200_2,200_3,……から出力される符号化動画像データにおいて、GOPの先頭のIフレームに基づく局所復号画像が同じになる。そして、符号化部200_1,200_2,200_3,……からの符号化動画像データが選択部400により切り替えて出力された場合でも、出力される符号化動画像データを、復号器において正しく復号できるようになる。すなわち、出力される符号化動画像データの復号時において、入力バッファのオーバフローもアンダフローも発生せず、レート制御が正しく実行される。これとともに、符号化動画像データに付加されたフレームナンバに基づき、正しく復号処理を実行できる。
従って、上記の処理により、符号化効率の高いオープンGOP方式を用いながらも、複数の符号化部から出力された符号化動画像データのうち、コストが低いもの、すなわち品質が高いものを選択して出力できるようになる。従って、符号化効率が高く、なおかつ高画質な符号化動画像データを生成することが可能になる。
次に、選択部400による出力切り替え動作の例について説明する。まず、図10は、選択部の内部構成例を示す図である。
選択部400は、複数のバッファ部410_1,410_2,410_3,……と、バッファ選択部420とを備える。バッファ部410_1,410_2,410_3,……は、符号化部200_1,200_2,200_3,……からそれぞれ出力される符号化動画像データを一時的に保持する機能を備える。バッファ選択部420は、制御部300から選択信号SELの入力を受ける。そして、選択信号SELによって選択される符号化部に対応するバッファ部に対して、符号化動画像データの出力を指示するための出力指示信号を送出する。
図11は、バッファ部の内部構成例を示す図である。なお、バッファ部410_1,410_2,410_3,……はそれぞれ同じ構成を有するので、図11ではこれらを“バッファ410”としてまとめて説明する。
バッファ部410は、境界判定部411、バッファ制御部412および動画像バッファ413を備える。
境界判定部411は、対応する符号化部200から符号化動画像データの入力を受け、出力の切り替え単位となる画像群の境界を判定する。この画像群とは、GOP内に最初に現れるPフレームから、その次のGOP内に最初に現れるPフレームの直前のフレームまでの複数の連続したフレームを指す。例えば、図7において、符号化部200_1からの符号化動画像データのうち、フレーム“P6”からフレーム“B14”までが1つの画像群を構成する。
従って、境界判定部411は、GOP内の最初のPフレームが入力されたとき、境界を検出する。境界判定部411は、画像群の境界を検出したとき、境界検出信号をバッファ制御部412に出力する。また、境界判定部411に入力された符号化動画像データは、動画像バッファ413に一時的に格納される。
なお、GOPの先頭は、例えば、MPEG−2の場合にはGOPヘッダから、H.264の場合にはSPS(Sequence Parameter Set)から判定できる。また、Pフレームは、ピクチャヘッダに記述されたピクチャ種別などから判定できる。また、この他に例えば、符号化部200_1,200_2,200_3,……のそれぞれが、出力する符号化動画像データに対して、上記の画像群の境界を示す特定の情報を付加してもよい。この場合、境界判定部411は、符号化動画像データからこの特定の情報を検出することで、画像群の境界を容易に検出できる。ただし、この場合には、バッファ部410から符号化動画像データを出力するまでの間に、この特定の情報は削除される。
バッファ制御部412は、境界判定部411からの境界検出信号の入力タイミングに基づき、動画像バッファ413における画像群の先頭アドレスおよび終端アドレスを認識する。そして、バッファ制御部412は、バッファ選択部420からの出力指示信号に応じて、符号化動画像データを出力させるか、あるいは削除するかを、バッファ制御部412に対して画像群単位で指示する。
図12は、選択部における出力切り替え動作の第1の例を示す図である。
図12において、“#n[m]”は、符号化部200_nから出力されたm番目のGOPを表す。また、“#n”は、選択信号SELにより符号化部200_nからの出力が選択されたことを表す。また、“##n[m]”は、GOP#n[m]に対応する切り替え単位の画像群を表す。すなわち、画像群##n[m]は、GOP#n[m]に最初に現れるPフレームを先頭とし、次のGOP#n[m+1]に最初に現れるPフレームの直前フレームを終端とする。なお、これらの表記については、後の図13においても同様である。
この図12では、例えば、タイミングT31において、GOP#1[0],GOP#2[0],GOP#3[0]のそれぞれから算出されたコストに基づき、選択信号SELが符号化部200_2からの出力を選択するように更新されている。このとき、選択部400に対しては、すでに次のGOPの入力が開始されている。選択部400は、選択信号SELが更新されると、符号化部200_2からの次のGOP#2[1]に対応する画像群##2[1]を選択して出力する。
このような処理によれば、選択部400の各バッファ部410_1,410_2,410_3,……が備える動画像バッファ413の容量を、GOPの容量未満に抑制でき、バッファの回路規模や製造コストが抑制される。また、選択部400からの符号化動画像データの出力の遅延量も抑制される。
図13は、選択部における出力切り替え動作の第2の例を示す図である。
図13に示す例では、選択部400の各バッファ部410_1,410_2,410_3,……が備える動画像バッファ413が、GOPより大きい容量を備えるものとする。従って、選択部400への入力に対して、出力される符号化動画像データはGOPの期間以上遅延される。
図13において、例えば、タイミングT41において、GOP#1[0],GOP#2[0],GOP#3[0]のそれぞれから算出されたコストに基づき、選択信号SELが符号化部200_2からの出力を選択するように更新されている。このとき、選択部400は、バッファ部410_2に格納されている画像群##2[0]を選択して、出力を開始する。
このような処理によれば、出力遅延が大きくなるものの、コストの算出対象とされたGOPに対応する画像群が選択されて出力されるので、出力される符号化動画像データのデータ量をより抑制しつつ、その画質をより向上させることができる。
ところで、上記の各実施の形態で示した画像符号化装置の機能のすべて、あるいはその一部の機能は、例えば、次の図に示すコンピュータのような情報処理装置において、ソフトウェア処理によって実現することもできる。
図14は、画像符号化装置の機能を実現するコンピュータのハードウェア構成例を示す図である。
図14に示すコンピュータ500は、CPU(Central Processing Unit)501、RAM(Random Access Memory)502、HDD(Hard Disk Drive)503、グラフィック処理部504,入力I/F505、読み取り部506および通信I/F507を備えており、これらの各部はバス508によって相互に接続されている。
CPU501は、HDD503に記憶された各種プログラムを実行することにより、このコンピュータ500全体を統括的に制御する。RAM502は、CPU501に実行させるプログラムの少なくとも一部や、このプログラムによる処理に必要な各種データを一時的に記憶する。HDD503は、CPU501により実行されるプログラムやその実行に必要な各種のデータなどを記憶する。
グラフィック処理部504には、モニタ504aが接続されている。このグラフィック処理部504は、CPU501からの命令に従って、モニタ504aの画面上に画像を表示させる。入力I/F505には、キーボード505aやマウス505bが接続されている。この入力I/F505は、キーボード505aやマウス505bからの信号を、バス508を介してCPU501に送信する。
読み取り部506は、可搬型の記録媒体506aからデータを読み取り、バス508を介してCPU501に送信する。記録媒体506aとしては、例えば光ディスクなどを適用可能である。通信I/F507は、図示しないコネクタを介して外部装置と接続し、外部装置との間でデータの送受信を行う。
ここで、上記の各実施の形態で示した機能のすべて、あるいはそれらの一部がソフトウェア処理によって実現される場合には、それらの機能の処理内容を記述したプログラムが、例えばHDD503に記憶される。そして、そのプログラムがCPU501に実行されることによって、それらの機能が実現される。
また、例えば、上記の各実施の形態で示した機能のうち、符号化部200_1,200_2,200_3,……についてはハードウェア回路として設けられてもよい。このようなハードウェア回路は、例えば、グラフィック処理部504と一体に設けられてもよい。このような場合、制御部300および選択部400の機能のみ、ソフトウェア処理によって実現してもよい。
このように、上記の画像符号化装置が有する機能の少なくとも一部は、コンピュータによって実現することができる。その場合には、上記機能の処理内容を記述したプログラムが提供される。そして、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、そのプログラムを、サーバコンピュータからネットワークを介して他のコンピュータに転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、そのプログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。
符号の説明
100 画像符号化装置
200,200_1,200_2,200_3 符号化部
300 制御部
301 選択判定部
302 パラメータ設定部
400 選択部

Claims (10)

  1. 同一の動画像データが入力されて、それぞれ異なる符号化パラメータを用いて圧縮符号化処理を行う複数の符号化部と、
    前記各符号化部による符号化結果に基づき、フレーム内符号化画像を少なくとも1つ含む一定数の連続する画像を有する画像群ごとに、前記各符号化部によって符号化された符号化動画像データのうち1つを、選択すべきデータとして判定する選択判定部と、
    前記選択判定部による判定結果に応じて、前記各符号化部からの符号化動画像データのうち1つを選択的に出力する選択部と、
    前記各符号化部に、再生時刻が同一であって前記画像群内で最初に符号化されるフレーム内符号化画像に基づく局所復号画像がすべての前記符号化部で同一になるように、圧縮符号化処理を実行させる制御部と、
    を有し、
    前記選択部は、1つの前記符号化部からの前記符号化動画像データから他の前記符号化部からの前記符号化動画像データへ出力を切り替える際の出力切り替え位置を、前記各符号化部から出力される符号化動画像データ内の前記画像群に最初に現れる順方向フレーム間予測符号化画像の直前とすることを特徴とする画像符号化装置。
  2. 前記制御部は、前記各符号化部によって前記画像群に対する圧縮符号化処理が完了したとき、前記選択判定部によって選択された符号化動画像データに対応する前記符号化部での符号化処理結果に基づくパラメータであって、次の前記画像群内で最初に符号化されるフレーム内符号化画像の圧縮符号化処理に用いられる符号化レート制御用のパラメータを、すべての前記符号化部に対して共通に設定することで、当該フレーム内符号化画像に基づく局所復号画像を同一にすることを特徴とする請求の範囲第1項記載の画像符号化装置。
  3. 前記制御部は、前記各符号化部によって前記画像群に対する圧縮符号化処理が完了したとき、前記選択判定部によって選択された符号化動画像データに対応する前記符号化部において演算された、次の画像群内で最初に符号化されるフレーム内符号化画像の目標情報量を、当該符号化部から前記符号化レート制御用のパラメータとして取得し、取得した前記目標情報量を、次の前記画像群で最初に符号化されるフレーム内符号化画像の目標情報量としてすべての前記符号化部に設定することを特徴とする請求の範囲第2項記載の画像符号化装置。
  4. 前記制御部は、前記各符号化部によって前記画像群に対する圧縮符号化処理が完了したとき、前記選択判定部によって選択された符号化動画像データに対応する前記符号化部が管理している復号器側の仮想的な入力バッファのデータ量を、当該符号化部から前記符号化レート制御用のパラメータとして取得し、取得したデータ量を、次の前記画像群の圧縮符号化処理開始時における前記入力バッファのデータ量としてすべての前記符号化部に設定することを特徴とする請求の範囲第2項記載の画像符号化装置。
  5. 前記制御部は、前記各符号化部によって前記画像群に対する圧縮符号化処理が完了したとき、前記符号化レート制御用のパラメータとして、前記選択判定部によって選択された符号化動画像データに基づく量子化ステップを、次の画像群の圧縮符号化処理開始時における量子化ステップの初期値としてすべての前記符号化部に設定することを特徴とする請求の範囲第2項記載の画像符号化装置。
  6. 前記各符号化部での圧縮符号化処理で用いられる前記異なる符号化パラメータには、符号化動画像データにおいて順方向フレーム間予測符号化画像が現れる間隔を示すパラメータが含まれることを特徴とする請求の範囲第1項記載の画像符号化装置。
  7. 前記各符号化部では、1つの前記画像群内の画像をフレーム間予測符号化方式で圧縮符号化処理する際に、他の前記画像群内の画像を参照することが可能とされていることを特徴とする請求の範囲第1項記載の画像符号化装置。
  8. 前記各符号化部は、
    圧縮符号化処理中において、フレーム間予測符号化画像によって参照されるフレームが新たに出現するとカウントアップするカウント部と、
    前記カウント部によるカウント値をフレームごとに符号化動画像データに付加するデータ付加部と、
    を備え、
    前記制御部は、前記各符号化部によって前記画像群に対する圧縮符号化処理が完了したとき、前記選択判定部によって選択された符号化動画像データに対応する前記符号化部の前記カウント部からカウント値を取得し、当該カウント値によりすべての前記符号化部の前記カウント部のカウント値を置き換えるカウント値設定部を備えたことを特徴とする請求の範囲第1項記載の画像符号化装置。
  9. 画像符号化装置が、
    同一の動画像データの入力を受けて、それぞれ異なる符号化パラメータを用いて複数系統の圧縮符号化処理を行い、
    前記複数系統の圧縮符号化処理による符号化結果に基づき、フレーム内符号化画像を少なくとも1つ含む一定数の連続する画像を有する画像群ごとに、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データのうち1つを、選択すべきデータとして判定し、
    前記判定の結果に応じて、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データのうち1つを選択的に出力する、
    処理を含み、
    前記複数系統の圧縮符号化処理は、再生時刻が同一であって前記画像群内で最初に符号化されるフレーム内符号化画像に基づく局所復号画像が同一になるように実行され、
    前記判定の結果に応じて1つの系統の圧縮符号化処理によって符号化された符号化動画像データから他の系統の圧縮符号化処理によって符号化された符号化動画像データへ出力が切り替えられる際には、その出力切り替え位置を、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データ内の前記画像群に最初に現れる順方向フレーム間予測符号化画像の直前とする、
    ことを特徴とする画像符号化制御方法。
  10. コンピュータに、
    同一の動画像データの入力を受けて、それぞれ異なる符号化パラメータを用いて複数系統の圧縮符号化処理を行い、
    前記複数系統の圧縮符号化処理による符号化結果に基づき、フレーム内符号化画像を少なくとも1つ含む一定数の連続する画像を有する画像群ごとに、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データのうち1つを、選択すべきデータとして判定し、
    前記判定の結果に応じて、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データのうち1つを選択的に出力する、
    処理を実行させ、
    前記複数系統の圧縮符号化処理は、再生時刻が同一であって前記画像群内で最初に符号化されるフレーム内符号化画像に基づく局所復号画像が同一になるように実行され、
    前記判定の結果に応じて1つの系統の圧縮符号化処理によって符号化された符号化動画像データから他の系統の圧縮符号化処理によって符号化された符号化動画像データへ出力が切り替えられる際には、その出力切り替え位置を、前記複数系統の圧縮符号化処理によって符号化された符号化動画像データ内の前記画像群に最初に現れる順方向フレーム間予測符号化画像の直前とする、
    ことを特徴とする画像符号化プログラム。
JP2011504684A 2009-03-19 2009-03-19 画像符号化装置、画像符号化制御方法および画像符号化プログラム Expired - Fee Related JP5267655B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/055487 WO2010106670A1 (ja) 2009-03-19 2009-03-19 画像符号化装置、画像符号化制御方法および画像符号化プログラム

Publications (2)

Publication Number Publication Date
JPWO2010106670A1 JPWO2010106670A1 (ja) 2012-09-20
JP5267655B2 true JP5267655B2 (ja) 2013-08-21

Family

ID=42739339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011504684A Expired - Fee Related JP5267655B2 (ja) 2009-03-19 2009-03-19 画像符号化装置、画像符号化制御方法および画像符号化プログラム

Country Status (4)

Country Link
US (1) US8681864B2 (ja)
EP (1) EP2410752B1 (ja)
JP (1) JP5267655B2 (ja)
WO (1) WO2010106670A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4908943B2 (ja) * 2006-06-23 2012-04-04 キヤノン株式会社 画像符号化装置及び画像符号化方法
RU2012140740A (ru) 2010-04-01 2014-05-10 Сони Корпорейшн Устройство и способ обработки изображения
EP2407803A1 (en) * 2010-07-15 2012-01-18 The European Atomic Energy Community (EURATOM), represented by the European Commission Method for safely identifying moving objects
US20150117712A1 (en) * 2011-05-31 2015-04-30 Pointgrab Ltd. Computer vision based control of a device using machine learning
CN104641638B (zh) 2012-06-28 2018-08-03 阿克西斯股份公司 使用虚拟帧内帧对视频内容进行编码的***和方法
US9338461B2 (en) * 2013-02-04 2016-05-10 Mitsubishi Electric Research Laboratories, Inc Method and system for encoding collections of images and videos
CN104768011B (zh) 2015-03-31 2018-03-06 浙江大学 图像编解码方法和相关装置
TWI554083B (zh) * 2015-11-16 2016-10-11 晶睿通訊股份有限公司 影像處理方法及其攝影機
US10623744B2 (en) * 2017-10-04 2020-04-14 Apple Inc. Scene based rate control for video compression and video streaming
JP2023527966A (ja) * 2020-05-26 2023-07-03 ドルビー ラボラトリーズ ライセンシング コーポレイション 可変フレームレートビデオのためのピクチャメタデータ

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH114448A (ja) * 1997-06-13 1999-01-06 Sony Corp 画像信号送出装置及び画像信号送出方法
JP2000023154A (ja) * 1998-06-30 2000-01-21 Toshiba Corp 動画像符号化装置
JP2000341690A (ja) * 1999-05-31 2000-12-08 Mitsubishi Electric Corp データ送信装置
JP2003299095A (ja) * 2002-04-02 2003-10-17 Hitachi Ltd 動画像処理装置、動画処理方法及び動画記録装置
JP2006295492A (ja) * 2005-04-08 2006-10-26 Canon Inc 画像処理装置
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP2008236120A (ja) * 2007-03-19 2008-10-02 Matsushita Electric Ind Co Ltd 復号化装置及び符号化装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0860956A (ja) 1994-08-16 1996-03-05 Matsushita Electric Ind Co Ltd 調光装置
JPH08242452A (ja) 1995-03-02 1996-09-17 Matsushita Electric Ind Co Ltd 映像信号圧縮符号化装置
US7885340B2 (en) * 1999-04-27 2011-02-08 Realnetworks, Inc. System and method for generating multiple synchronized encoded representations of media data
US7599434B2 (en) * 2001-09-26 2009-10-06 Reynolds Jodie L System and method for compressing portions of a media signal using different codecs
GB2395387B (en) * 2002-11-13 2005-02-16 Motorola Inc Video streaming device and method of control for switchable video streams
US20050243922A1 (en) * 2004-04-16 2005-11-03 Modulus Video, Inc. High definition scalable array encoding system and method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH114448A (ja) * 1997-06-13 1999-01-06 Sony Corp 画像信号送出装置及び画像信号送出方法
JP2000023154A (ja) * 1998-06-30 2000-01-21 Toshiba Corp 動画像符号化装置
JP2000341690A (ja) * 1999-05-31 2000-12-08 Mitsubishi Electric Corp データ送信装置
JP2003299095A (ja) * 2002-04-02 2003-10-17 Hitachi Ltd 動画像処理装置、動画処理方法及び動画記録装置
JP2006295492A (ja) * 2005-04-08 2006-10-26 Canon Inc 画像処理装置
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP2008236120A (ja) * 2007-03-19 2008-10-02 Matsushita Electric Ind Co Ltd 復号化装置及び符号化装置

Also Published As

Publication number Publication date
US20120002725A1 (en) 2012-01-05
EP2410752A4 (en) 2013-02-27
US8681864B2 (en) 2014-03-25
JPWO2010106670A1 (ja) 2012-09-20
EP2410752B1 (en) 2017-01-25
EP2410752A1 (en) 2012-01-25
WO2010106670A1 (ja) 2010-09-23

Similar Documents

Publication Publication Date Title
JP5267655B2 (ja) 画像符号化装置、画像符号化制御方法および画像符号化プログラム
JP4927207B2 (ja) 符号化方法、復号化方法及び装置
JP4908180B2 (ja) 動画像符号化装置
KR101362590B1 (ko) 화상 처리 장치 및 방법
KR101689997B1 (ko) 영상 복호 장치, 및 영상 복호 방법
JP2002511669A (ja) 映像データストリームの適応的符号化方法と装置
TW201112771A (en) Image encoding apparatus, image encoding method, and computer program
JP5128389B2 (ja) 動画像符号化装置及び動画像符号化方法
JP5947641B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP4795223B2 (ja) 画像処理装置
JP2008154060A (ja) 動画像符号化装置
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
JP5649296B2 (ja) 画像符号化装置
WO2011155376A1 (ja) 符号化装置および符号化方法
JP2009027693A (ja) 動画像圧縮符号化装置
JP2007325119A (ja) 画像処理装置及び画像処理方法
JP2012253722A (ja) 画像符号化装置と画像復号装置およびその方法とプログラム
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP5937926B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
WO2008079330A1 (en) Video compression with complexity throttling
WO2011122659A1 (ja) 符号化装置および復号装置
KR101841352B1 (ko) 참조 프레임 선택 방법 및 그 장치
JP2008289105A (ja) 画像処理装置およびそれを搭載した撮像装置
JP4847423B2 (ja) 動画像符号化装置、および、コンピュータプログラム
US20220345715A1 (en) Ai prediction for video compression

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130422

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees