JP2009296300A - Image encoding device and method - Google Patents
Image encoding device and method Download PDFInfo
- Publication number
- JP2009296300A JP2009296300A JP2008147757A JP2008147757A JP2009296300A JP 2009296300 A JP2009296300 A JP 2009296300A JP 2008147757 A JP2008147757 A JP 2008147757A JP 2008147757 A JP2008147757 A JP 2008147757A JP 2009296300 A JP2009296300 A JP 2009296300A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- image
- information
- unit
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、ハイビジョン画像をH.264規格に従って符号化する画像符号化装置および方法に関するものである。 The present invention converts a high-definition image into H.264. The present invention relates to an image encoding apparatus and method for encoding according to the H.264 standard.
近年、テレビ放送がスタンダードディフィニション(SDTV)放送からハイデフィニション(HDTV)放送への移行が進むと共に、デジタル放送対応テレビ、デジタルビデオレコーダやカムコーダなどの商品のハイビジョン化が進んでいる。 In recent years, television broadcasts have shifted from standard definition (SDTV) broadcasts to high definition (HDTV) broadcasts, and products such as digital broadcast compatible televisions, digital video recorders and camcorders have become high definition.
また、デジタルシネマでは更に高解像度の画像フォーマット(4K×2K画像)が用いられており、放送、撮像、録画機器もデジタルシネマと同様に、さらに高解像度化が進むことが予想される。 Digital cinema uses a higher-resolution image format (4K × 2K images), and it is expected that higher resolution will be achieved for broadcasting, imaging, and recording devices as well as digital cinema.
現状のHDTV放送では、通常の画像圧縮(例えばMPEG−2)を行い、1つのストリームに1つの解像度の画像が格納されている。4K×2K画像はHDTV放送の4倍の画素数を持つため、符号化ストリームの符号量が3〜4倍程度必要となる。そのため、4K×2K画像を伝送するためには、HDTV放送の複数チャネル分の伝送路を必要とする。 In the current HDTV broadcast, normal image compression (for example, MPEG-2) is performed, and one resolution image is stored in one stream. Since 4K × 2K images have four times as many pixels as HDTV broadcasts, the code amount of the encoded stream is required to be about 3 to 4 times. Therefore, in order to transmit 4K × 2K images, a transmission path for a plurality of HDTV broadcast channels is required.
従来のテレビ等での再生互換を保証してHDTV放送と同時に4K×2K画像を伝送するためには、解像度スケーラビリティ等の技術を使用したストリームを伝送することが必要となる。この場合、低解像度の画像ストリームとしてHDTV画像を、高解像度の画像ストリームとして4K×2K画像を格納したストリームとなる。さらに、解像度スケーラビリティ技術は、低解像度画像の情報を利用して高解像度画像を生成することにより、圧縮効率を高めることも行っている。 In order to guarantee playback compatibility on a conventional television or the like and transmit 4K × 2K images simultaneously with HDTV broadcasting, it is necessary to transmit a stream using a technique such as resolution scalability. In this case, an HDTV image is stored as a low-resolution image stream, and a 4K × 2K image is stored as a high-resolution image stream. Furthermore, the resolution scalability technique also improves compression efficiency by generating a high-resolution image using information of a low-resolution image.
放送規格で用いられているMPEG−2規格や、BD規格、AVCHD規格、MPEG−4 AVC規格では、それぞれスケーラビリティ方式が規定されている。また、これ以外にも例えば、(特許文献1)の「画像符号伝送システム」には、動画像を時間方向、または空間方向に分割して符号化する方法が記載されている。具体的には空間方向に4分割した画像を符号化する際、空間的に同じ位置にある4つのマクロブロックを合成して32×32画素ブロック単位で動き検出を行い、検出した動きベクトルを4つのマクロブロックの動きベクトルとすることで処理の簡易化を図っている。
従来の解像度スケーラビリティ方式を用いる従来のテレビでは、低解像度のストリームのみを復号することで再生互換を確保することが可能となる。しかし、4K×2K画像として復号する場合には、低解像度画像のストリームを復号した後に、高解像度画像のストリームも復号する必要があり、復号器の構成が複雑化する。また、スケーラビリティ技術を用いた符号化装置も低解像度画像と高解像度画像の相関を利用した符号化を行う必要があるため、二つの解像度を同期して符号化する必要があり、符号化器の構成が複雑化するという課題がある。さらに、二つの解像度の画像を符号化するため、4K×2K画像に対してのみ通常の符号化を行う場合よりも、符号化の処理量が増加するという課題がある。 In a conventional television using a conventional resolution scalability method, it is possible to ensure reproduction compatibility by decoding only a low-resolution stream. However, when decoding as a 4K × 2K image, it is necessary to decode the stream of the high resolution image after decoding the stream of the low resolution image, which complicates the configuration of the decoder. In addition, since an encoding device using scalability technology needs to perform encoding using the correlation between a low resolution image and a high resolution image, it is necessary to encode the two resolutions in synchronization. There is a problem that the configuration becomes complicated. Furthermore, since an image having two resolutions is encoded, there is a problem that the amount of encoding processing is increased as compared with a case where normal encoding is performed only on a 4K × 2K image.
さらに、従来技術では32×32画素単位で動きベクトル検出を行う。このとき、水平、垂直とも1/2間引きした画像を参照画像としているため、間引き無しの動きベクトル検出に対しては処理量を1/4に削減できる。しかし、16×16画素ブロックでの動き検出で参照画像を水平、垂直とも1/2間引きした場合と処理量が同じとなるため、処理量削減の優位性がない。むしろ、4マクロブロックをまとめた動きベクトル検出を行うため、マクロブロック毎に行う動きベクトル検出よりも動きベクトル検出の精度が落ちる可能性がある。 Furthermore, in the prior art, motion vector detection is performed in units of 32 × 32 pixels. At this time, since an image that has been thinned by 1/2 in both horizontal and vertical directions is used as a reference image, the processing amount can be reduced to 1/4 for motion vector detection without thinning. However, since the processing amount is the same as when the reference image is decimated in both horizontal and vertical directions by motion detection in a 16 × 16 pixel block, there is no advantage in reducing the processing amount. Rather, since motion vector detection is performed on four macroblocks, motion vector detection may be less accurate than motion vector detection performed for each macroblock.
そこで、本発明は上記の事情に鑑みてなされたものであり、再生互換を保証可能な解像度スケーラビリティを実現しつつ、処理量を削減して動画像を符号化することができる画像符号化装置および方法を提供することを目的とする。 Therefore, the present invention has been made in view of the above circumstances, and an image encoding device capable of encoding a moving image with a reduced processing amount while realizing resolution scalability capable of guaranteeing reproduction compatibility and It aims to provide a method.
上記の課題を解決するために、本発明に係る画像符号化装置は、入力された動画像データに対して、水平方向と垂直方向に各々1/2に間引きし、かつ位相が1画素ずれた4つの分割画像を第1から第4の分割画像として出力する画像分割部と、前記第1の分割画像をブロック単位で符号化して第1のストリームを出力する第1の符号化部と、前記第1の符号化部で符号化したときに得られる第1の符号化情報を抽出し、第2の符号化情報として出力する符号化情報処理部と、前記第2の符号化情報を利用して前記第2の分割画像をブロック単位で符号化し、第2のストリームを出力する第2の符号化部と、前記第2の符号化情報を利用して前記第3の分割画像をブロック単位で符号化し、第3のストリームを出力する第3の符号化部と、前記第2の符号化情報を利用して前記第4の分割画像をブロック単位で符号化し、第4のストリームを出力する第4の符号化部と、前記第1から第4のストリームを多重化し、出力ストリームを生成する多重化部とを備える。 In order to solve the above-described problem, the image coding apparatus according to the present invention thins the input moving image data by 1/2 in the horizontal direction and the vertical direction, and the phase is shifted by one pixel. An image dividing unit that outputs four divided images as first to fourth divided images, a first encoding unit that encodes the first divided image in units of blocks and outputs a first stream, and Extracting the first encoded information obtained when encoded by the first encoding unit, and outputting the second encoded information as the second encoded information, and using the second encoded information A second encoding unit that encodes the second divided image in block units and outputs a second stream; and the third divided image in block units using the second encoding information. A third encoding unit for encoding and outputting a third stream; A fourth encoding unit that encodes the fourth divided image in units of blocks using second encoding information, outputs a fourth stream, and multiplexes the first to fourth streams; A multiplexing unit for generating an output stream.
これにより、再生互換を保証可能な解像度スケーラビリティを実現しつつ、処理量を削減して動画像を符号化することが可能となる。 Thus, it is possible to encode a moving image with a reduced processing amount while realizing resolution scalability that can guarantee reproduction compatibility.
以上のように本発明によれば、空間方向に4分割した画像のうち、一つの画像の符号化情報を利用することで処理量を削減することが可能となる。また、4つの分割画像全てを復号する、もしくは任意の1画像を復号することで解像度スケーラビリティを実現できる。また、空間的に同じ位置にあるブロックの量子化値、符号化タイプ等を揃えることで4つの分割画像の画質差を減らし、良好な画質を得ることが可能となる。 As described above, according to the present invention, it is possible to reduce the processing amount by using the encoding information of one image among the images divided into four in the spatial direction. Also, resolution scalability can be realized by decoding all four divided images or decoding one arbitrary image. Further, by aligning the quantization values, coding types, and the like of blocks located at the same spatial position, it is possible to reduce the difference in image quality between the four divided images and to obtain good image quality.
以下、本発明の実施の形態について、図面を用いて説明する。なお、本発明について説明する、以下の実施の形態および添付の図面は、本発明の例示を目的としており、本発明がこれらに限定されることを意図しない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following embodiments and the accompanying drawings for explaining the present invention are intended to illustrate the present invention and are not intended to limit the present invention.
(実施の形態1)
図1は、本実施の形態1に係る画像符号化装置の構成を示すブロック図である。本発明の画像符号化装置は、画像分割部102、第1の符号化部103、符号化情報処理部104、第2の符号化部105、第3の符号化部106、第4の符号化部107、多重化部108で構成されており、動画像データ101は画像分割部102に入力され、多重化部108からは出力ストリーム109が出力される。
(Embodiment 1)
FIG. 1 is a block diagram showing the configuration of the image coding apparatus according to the first embodiment. The image encoding device of the present invention includes an
本発明の実施の形態1においては、動画像データ101として、1秒間に60フィールドのピクチャ(以下「60i」と記す)で解像度が水平3840画素、垂直1080ライン(フレームでは2160ライン)で、分割画像の解像度は水平1920画素、垂直540ラインであることを前提とする。また、第1の符号化部103、第2の符号化部105、第3の符号化部106、第4の符号化部107では、H.264規格に従って符号化処理が実行され、MPEG−2規格と同じ参照関係で動き補償することを前提とする。また、マクロブロック単位の動きベクトルの検出は、1つの参照画像に対して1つの矩形領域を探索することを前提とする。
In the first embodiment of the present invention, the moving
画像分割部102は、図2に示すように、動画像データ101の各ピクチャを画面内で水平、垂直それぞれ1/2に間引きし、かつ位相が1画素ずれた4画像を生成する。図2において、○、△、□、×はそれぞれ画素の位置を表している。元の画像において、○の画素位置にある画素のみを取り出して分割画像1を生成する。また、○の画素位置から水平方向に1画素ずらした位置にある△の画素位置にある画素を取り出して分割画像2を生成する。同様に○の画素位置から垂直方向に1ラインずらした位置の□の画素、水平方向に1画素、垂直方向に1ラインずらした位置の×の画素をそれぞれ分割画像3、分割画像4として生成する。
As shown in FIG. 2, the
第1の符号化部103は、分割画像1を入力としてH.264規格に基づいて符号化し、符号化ストリームを出力する。また、符号化時の符号化情報として、シーケンス或いはピクチャ単位で、量子化マトリクス、デブロックフィルタの強度等のシンタックスに関する情報、ピクチャあたりの割り当て符号量、ターゲットの量子化幅といった符号化制御に関する情報を出力する。さらに、マクロブロック単位で、量子化幅、マクロブロックタイプ、動きベクトル、参照画像といった符号化情報を出力する。第1の符号化部103の一般的な構成を図3に示し、簡単に説明する。ここでは第1の符号化部103を例示するが、第2の符号化部105、第3の符号化部106、第4の符号化部107も同様の構成であり、それぞれ分割画像2、分割画像3、分割画像4を入力とする。
The
符号化部103は、画像分割部102の出力である分割画像1を入力画像とし、符号化単位ブロックであるマクロブロックごとにストリームに符号化する。符号化部103は、この符号化を、イントラ予測及びインター予測のいずれかの予測方法を用いて行う。予測方法の選択方法は一般的に各予測を行ったときの評価値を生成し、評価値の小さい方を選択する。
The
加算器301は、分割画像1の画素値と予測に用いられる参照画素値との誤差を算出し、直交変換部302は、その誤差を例えば離散コサイン係数に変換し、量子化部303は、その離散コサイン係数を量子化する。
The
逆量子化部304及び逆直交変換部305は、前記量子化部303の結果をデコードすることで、再生機器において算出される誤差と同等の誤差を局所的に求める。
The
加算器306は、この誤差と参照画素値とを加算することで、局所的な復号結果である画素値を得る。この画素値は、引き続き行われるイントラ予測及びインター予測において新たな参照画素値となるべき値であり、イントラ予測部307へ出力され、デブロックフィルタ部308を介してフレームメモリ309に記憶される。
The
符号化にイントラ予測が用いられる場合、イントラ予測部307は、加算器306から与えられる前記画素値に基づいて、H.264規格によって隣接するマクロブロックとの対比に用いるように定められた所定の参照画素値を生成する。
When intra prediction is used for encoding, the
そして、スイッチ312は、イントラ予測部307からの参照画素値を選択し、加算器301は、入力画像に含まれる隣接するマクロブロックの画素値と選択された参照画素値との誤差を算出することで、後続する符号化が実行される。
The
符号化にインター予測が用いられる場合、動き検出部310は、先行するフレーム又はフィールド(つまり参照画像)について算出されてフレームメモリ309に記憶されている参照画素値に基づいて、後続するフレーム又はフィールドを表す入力画像におけるマクロブロックの動きベクトルを算出する。動き補償部311は、参照画像における算出された動きベクトルで表される範囲の画素値を参照画素値として出力する。
When inter prediction is used for encoding, the
そして、スイッチ312は、動き補償部311からの参照画素値を選択し、加算器301は、後続するフレーム又はフィールドにおけるマクロブロックの画素値と選択された参照画素値との誤差を算出することで、後続する符号化が実行される。
Then, the
符号化情報処理部104は、第1の符号化部103の出力である符号化情報を入力とし、シーケンス或いはピクチャ単位の符号化情報を出力する。また、第2の符号化部105、第3の符号化部106、第4の符号化部107のマクロブロック処理に同期してマクロブロック単位の符号化制御に関する情報を出力する。具体的には図4に示すように、マクロブロック処理単位でパイプラインを構成し、第1の符号化部103が時刻t(n)で、画面の左上に位置するマクロブロックを先頭として、ラスタスキャン順にn番目のマクロブロックMB1(n)を符号化する。符号化情報処理部104は、時刻t(n+1)でMB1(n)のマクロブロックタイプ、動きベクトル等の符号化情報を一旦保持し、時刻t(n+2)で出力する。第2の符号化部105、第3の符号化部106、第4の符号化部107は、符号化情報処理部104の出力である符号化情報を利用して、時刻t(n+2)でMB1(n)と空間的に同じ位置にあるマクロブロックMB2(n)、MB3(n)、MB4(n)を、それぞれ符号化する。具体的な利用方法は後述する。
The encoded
多重化部108は、第1の符号化部103、第2の符号化部105、第3の符号化部106、第4の符号化部107の出力ストリームを多重化し、出力ストリーム109を生成する。このとき、各ストリームの位相情報をストリームに埋め込むことが可能である。
The
次に、第2の符号化部105、第3の符号化部106、第4の符号化部107による、符号化情報処理部104の出力である符号化情報の利用方法を説明する。
Next, a method of using encoded information, which is an output of the encoded
シーケンス、ピクチャ単位での情報の利用方法は、第1の符号化部103から第4の符号化部107の出力である4つのストリーム間で画質差が現れにくくするように、同じピクチャタイプ、量子化マトリクス、デブロックフィルタ強度等を設定する。
The method of using information in units of sequences and pictures uses the same picture type and quantum so that image quality differences are less likely to appear between the four streams output from the
マクロブロックタイプの利用方法は、MB2(n)、MB3(n)、MB4(n)のマクロブロックタイプを決定するときに、MB1(n)のマクロブロックタイプと同じにする方法がある。或いは、MB1(n)で選択されたマクロブロックタイプの評価値に重み付けをして選択されやすくする方法がある。 The macroblock type is used in the same manner as the macroblock type of MB1 (n) when determining the macroblock types of MB2 (n), MB3 (n), and MB4 (n). Alternatively, there is a method for facilitating selection by weighting the evaluation value of the macroblock type selected in MB1 (n).
直交変換サイズやイントラ予測の利用方法は、マクロブロックタイプと同様にMB1(n)で選択された直交変換サイズと選択された予測方向と同じ予測方向と同じにする方法がある。或いは、評価値に重み付けをしてMB1(n)で選択された直交変換サイズとイントラ予測方向が選択されやすくする方法がある。 As a method of using the orthogonal transform size and intra prediction, there is a method in which the orthogonal transform size selected in MB1 (n) and the same prediction direction as the selected prediction direction are the same as in the macroblock type. Alternatively, there is a method in which the evaluation value is weighted so that the orthogonal transform size selected in MB1 (n) and the intra prediction direction are easily selected.
動きベクトル情報の利用方法は、MB1(n)で検出した動きベクトル、動き補償のブロックサイズ、参照画像と同じにする方法がある。分割画像は位相が1画素ずれた画像なので、それを考慮した方法を以下に示す。図5の(a)に示すとおり、符号化対象画像がB(n)である時、参照画像はP(n−2)、P(n−1)、P(n+4)、P(n+5)の4フィールドとなる。一般的には、すべての動き補償サイズで、それぞれの参照画像に対しブロックマッチングを行い、評価値が最も小さくなるモードを選択する。例えば、図5の(b)に示すように、第1の符号化部103では、MB1(n)の動きベクトルMV1(n)を検出するために一点鎖線で囲まれた範囲をすべてブロックマッチングを行う。これをH.264規格で規定される動き補償サイズすべてに対して行い、評価値が最も小さいモードを選択する。このとき、動きベクトル、動き補償サイズ、参照画像が決定される。この情報に基づき、例えば第2の符号化部105のMB2(n)では、MB1(n)の動きベクトル情報を用いて、図5の(c)に示すようにMV1(n)が指し示す位置を中心に狭い探索範囲でブロックマッチングを行うことで動きベクトルMV2(n)を検出する。この場合、参照画像と動き補償サイズはMB1(n)と同じになる。第3の符号化部106、第4の符号化部107でも同様に動きベクトルを求めることができる。
The motion vector information may be used in the same manner as the motion vector detected in MB1 (n), the motion compensation block size, and the reference image. Since the divided image is an image whose phase is shifted by one pixel, a method that takes this into consideration is described below. As shown in FIG. 5A, when the encoding target image is B (n), the reference images are P (n−2), P (n−1), P (n + 4), and P (n + 5). There are 4 fields. In general, block matching is performed on each reference image at all motion compensation sizes, and a mode with the smallest evaluation value is selected. For example, as shown in FIG. 5B, the
量子化値の利用方法は、MB2(n)、MB3(n)、MB4(n)の量子化値を決定するときに、MB1(n)の量子化値と同じにする方法がある。或いは、MB1(n)で選択された量子化値をベースとして変調をかける方法がある。具体的には、マクロブロックの特徴、バッファ制御の状態に基づいて変調をかける事が考えられる。 As a method of using the quantized value, there is a method of determining the quantized value of MB2 (n), MB3 (n), and MB4 (n) to be the same as the quantized value of MB1 (n). Alternatively, there is a method of performing modulation based on the quantized value selected by MB1 (n). Specifically, it may be possible to apply modulation based on the characteristics of the macroblock and the buffer control status.
(実施の形態2)
本発明の実施の形態2に係る画像符号化装置の構成を図6を用いて説明する。本発明の実施の形態2に係る画像符号化装置は、上述の本発明の実施の形態1にかかる画像符号化装置とは、画像分割部102、第1の符号化部103、多重化部108はその構成が同じであるのでその説明を省略する。符号化情報処理部604、第2の符号化部605、第3の符号化部606、第4の符号化部607は、本発明の実施の形態1にかかる画像符号化装置とは、動作が異なる。また、前提については上述の本発明の実施の形態1と同じである。
(Embodiment 2)
The configuration of the image coding apparatus according to
符号化情報処理部604は、第1の符号化部103の出力であるマクロブロック単位の符号化情報を入力とし、1フィールド分の情報を蓄積する。蓄積した符号化情報の統計情報を算出して、加工符号化情報として出力する。統計を算出する単位は1フィールド全体、或いは1フィールドを複数領域に分割して領域ごと等が考えられる。統計情報は具体的に、各マクロブロックタイプの選択率、直交変換サイズの選択率、平均量子化値、イントラ予測方向の選択率、参照画像ごとの平均動きベクトルと分散、参照画像の選択率、動き補償サイズの選択率、実際の発生符号量の総和等である。
The encoded
図7に各符号化部と符号化情報処理部の処理の時間的関係を示す。このようにピクチャ単位でパイプラインを構成し、第1の符号化部103が時刻t(n)で先頭からn番目のフィールドPic1(n)を符号化する。符号化情報処理部604はPic1(n)の符号化情報を取得し、時刻t(n+1)になる前に統計情報を算出し、加工符号化情報を出力する。第2の符号化部605、第3の符号化部606、第4の符号化部607は符号化情報処理部604の出力である加工符号化情報を利用して時刻t(n+1)で先頭からn番目のフィールドPic2(n)、Pic3(n)、Pic4(n)をそれぞれ符号化する。
FIG. 7 shows the temporal relationship between the processing of each encoding unit and the encoded information processing unit. In this way, a pipeline is configured in units of pictures, and the
第2の符号化部605、第3の符号化部606、第4の符号化部607では、通常の符号化を行うが、加工符号化情報に基づき、符号化パラメータを設定、或いは評価値の重み付け等を行う。例えば、レート制御では、過去に発生した符号量をフィードバックして符号化対象ピクチャのターゲット符号量、ターゲット量子化値を決定するが、これに加工符号化情報のひとつである実際の発生符号量の総和を加味する。一般的に量子化値と符号量は反比例の関係にあるため、ターゲット量子化値=ターゲット符号量×(平均量子化値/実際の発生符号量)といった式に基づき、ターゲット量子化値を決定する。
The
マクロブロックタイプに関しては、選択率に応じて評価値の重み付けを行うが、画面の中で選択されるマクロブロックタイプの偏りが出る場合があるため、画像を空間方向に複数領域に分割して領域ごとに選択率に応じた重み付けを行う。 For macroblock types, the evaluation value is weighted according to the selection rate. However, since the macroblock type selected in the screen may be biased, the image is divided into multiple regions in the spatial direction. Each is weighted according to the selectivity.
直交変換サイズの選択に関しては、マクロブロックタイプと同様に選択率に応じて重み付けを行う。また、前述と同様に領域ごとに重み付けを行う。 Regarding the selection of the orthogonal transform size, weighting is performed according to the selection rate as in the macroblock type. Similarly to the above, weighting is performed for each region.
イントラ予測方向の決定では、加工符号化情報のマクロブロックタイプとイントラ予測方向の選択率を利用することが可能である。マクロブロックタイプの選択率が低い場合、予測方向にバラつきが生じる可能性が高いため、ある程度高い場合のみ、イントラ予測方向の重み付けを行う。また、前述と同様に領域ごとに重み付けを行う。 In determining the intra prediction direction, it is possible to use the macroblock type of the processed coding information and the selectivity of the intra prediction direction. When the macroblock type selection rate is low, there is a high possibility that the prediction direction will vary. Therefore, weighting of the intra prediction direction is performed only when the macroblock type selection rate is high to some extent. Similarly to the above, weighting is performed for each region.
動きベクトル検出では、参照画像の絞込み、探索窓の設定、動き補償サイズの決定に加工符号化情報を利用する方法がある。参照画像の絞込みは、加工符号化情報の参照画像の選択率がある閾値以上の参照画像のみを用いる。探索窓の設定は、加工符号化情報の平均動きベクトルを用いて、参照画像ごとに探索窓のずらし量を設定する。このとき、動きベクトルの分散値に応じてずらし量を調整する。具体的には、分散値が小さい場合は動きベクトルの大きさがそろっていることが想定されるため、平均動きベクトルの大きさをずらし量とする。分散値が大きくなると、ベクトルがばらつく傾向にあるため、その大きさに応じてずらし量を0に近づけていく。動き補償サイズの決定に関しては、選択率が低い動き補償サイズの動き検出を行わないようにする。或いは、通常通り動きベクトル検出を行い、動き補償サイズを選択する時に選択率の高いサイズに重み付けを行う。これも前述と同様に領域ごとに重み付けを行う。 In motion vector detection, there is a method of using processing coding information for narrowing down a reference image, setting a search window, and determining a motion compensation size. For narrowing down the reference images, only reference images having a selection rate of the reference image of the processed coding information that is equal to or higher than a threshold value are used. The search window is set by setting the shift amount of the search window for each reference image using the average motion vector of the processed coding information. At this time, the shift amount is adjusted according to the variance value of the motion vector. Specifically, when the variance value is small, it is assumed that the motion vectors have the same size. Therefore, the size of the average motion vector is used as the shift amount. As the variance value increases, the vector tends to vary, and the shift amount is made close to 0 according to the size. Regarding the determination of the motion compensation size, motion detection with a motion compensation size having a low selection rate is not performed. Alternatively, motion vector detection is performed as usual, and when a motion compensation size is selected, a size with a high selection rate is weighted. Similarly to the above, weighting is performed for each region.
上記の内容では領域単位で重み付けを行うことを説明したが、フィールド単位で行うことも可能である。或いは、1つの領域をマクロブロックと同じ画素数とすることも可能である。 In the above description, weighting is performed in units of areas, but it is also possible to perform weighting in units of fields. Alternatively, one area can have the same number of pixels as the macroblock.
本発明の画像符号化装置およびその方法は、4K×2K等の高解像度な画像をスケーラビリティを実現しつつ、処理量を削減してH.264規格で符号化し、放送、録画を行う用途として有用である。 The image coding apparatus and method according to the present invention reduce the processing amount while realizing scalability of a high-resolution image of 4K × 2K or the like. It is useful as an application for encoding and broadcasting and recording according to the H.264 standard.
101 動画像データ
102 画像分割部
103 第1の符号化部
104、604 符号化情報処理部
105、605 第2の符号化部
106、606 第3の符号化部
107、607 第4の符号化部
108 多重化部
109 出力ストリーム
301 加算器
302 直交変換部
303 量子化部
304 逆量子化部
305 逆直交変換部
306 加算器
307 イントラ予測部
308 デブロックフィルタ部
309 フレームメモリ
310 動き検出部
311 動き補償部
312 スイッチ
DESCRIPTION OF
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008147757A JP2009296300A (en) | 2008-06-05 | 2008-06-05 | Image encoding device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008147757A JP2009296300A (en) | 2008-06-05 | 2008-06-05 | Image encoding device and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009296300A true JP2009296300A (en) | 2009-12-17 |
Family
ID=41544072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008147757A Pending JP2009296300A (en) | 2008-06-05 | 2008-06-05 | Image encoding device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009296300A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012043166A1 (en) * | 2010-10-01 | 2012-04-05 | ソニー株式会社 | Image processing device and image processing method |
WO2013018806A1 (en) * | 2011-08-01 | 2013-02-07 | 日本電信電話株式会社 | Image coding method, image decoding method, image coding device, image decoding device, image coding program, and image decoding program |
JP2013090330A (en) * | 2011-10-19 | 2013-05-13 | Korea Electronics Telecommun | Image processing method and device, using image division |
JP2013531401A (en) * | 2010-07-16 | 2013-08-01 | シャープ株式会社 | Video decoder that uses low resolution data to reduce power at low resolution |
JP2013232724A (en) * | 2012-04-27 | 2013-11-14 | Fujitsu Ltd | Moving image processing device, moving image processing method, and moving image processing program |
JP2015139057A (en) * | 2014-01-21 | 2015-07-30 | 日本放送協会 | Parallel encoding device, parallel decoding device and programs therefor |
CN111264060A (en) * | 2017-10-20 | 2020-06-09 | 富士通株式会社 | Moving image encoding device, moving image encoding method, computer program for moving image encoding, moving image decoding device, moving image decoding method, and computer program for moving image decoding |
-
2008
- 2008-06-05 JP JP2008147757A patent/JP2009296300A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013531401A (en) * | 2010-07-16 | 2013-08-01 | シャープ株式会社 | Video decoder that uses low resolution data to reduce power at low resolution |
WO2012043166A1 (en) * | 2010-10-01 | 2012-04-05 | ソニー株式会社 | Image processing device and image processing method |
CN103125118A (en) * | 2010-10-01 | 2013-05-29 | 索尼公司 | Image processing device and image processing method |
WO2013018806A1 (en) * | 2011-08-01 | 2013-02-07 | 日本電信電話株式会社 | Image coding method, image decoding method, image coding device, image decoding device, image coding program, and image decoding program |
JP2013034042A (en) * | 2011-08-01 | 2013-02-14 | Nippon Telegr & Teleph Corp <Ntt> | Image encoding method, image decoding method, image encoding device, image decoding device, image encoding program, and image decoding program |
US9491455B2 (en) | 2011-08-01 | 2016-11-08 | Nippon Telegraph And Telephone Corporation | Picture encoding method, picture decoding method, picture encoding apparatus, picture decoding apparatus, picture encoding program, and picture decoding program |
JP2013090330A (en) * | 2011-10-19 | 2013-05-13 | Korea Electronics Telecommun | Image processing method and device, using image division |
JP2013232724A (en) * | 2012-04-27 | 2013-11-14 | Fujitsu Ltd | Moving image processing device, moving image processing method, and moving image processing program |
JP2015139057A (en) * | 2014-01-21 | 2015-07-30 | 日本放送協会 | Parallel encoding device, parallel decoding device and programs therefor |
CN111264060A (en) * | 2017-10-20 | 2020-06-09 | 富士通株式会社 | Moving image encoding device, moving image encoding method, computer program for moving image encoding, moving image decoding device, moving image decoding method, and computer program for moving image decoding |
CN111264060B (en) * | 2017-10-20 | 2023-10-17 | 富士通株式会社 | Video encoding device, video encoding method, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7146056B2 (en) | Efficient spatial scalable compression schemes | |
RU2409005C2 (en) | Method of scalable coding and decoding of video signal | |
JP5918328B2 (en) | Image encoding method and image decoding method | |
US8971400B2 (en) | Method for performing hybrid multihypothesis prediction during video coding of a coding unit, and associated apparatus | |
US20060133475A1 (en) | Video coding | |
US20090110075A1 (en) | Method and System for Motion Compensated Picture Rate Up-Conversion of Digital Video Using Picture Boundary Processing | |
KR20010070539A (en) | A method for computational graceful degradation in an audiovisual compression system | |
JP2006352181A (en) | Image encoding/decoding device, encoding/decoding program and encoding/decoding method | |
JP2009296300A (en) | Image encoding device and method | |
US20150365698A1 (en) | Method and Apparatus for Prediction Value Derivation in Intra Coding | |
US8098946B2 (en) | Apparatus and method for image encoding and decoding using prediction | |
US20110096151A1 (en) | Method and system for noise reduction for 3d video content | |
US9036918B2 (en) | Image processing apparatus and image processing method | |
US20120195381A1 (en) | Image processing apparatus and method for processing image | |
US9001892B2 (en) | Moving image encoder and moving image decoder | |
JP2002044669A (en) | Apparatus and method for conversion of image information | |
JP2000059779A (en) | Dynamic image encoding device and dynamic image encoding method | |
JP4779207B2 (en) | Motion vector conversion apparatus and motion vector conversion method | |
KR102459813B1 (en) | video processing method of periodic quality compensation by image switching | |
KR102127212B1 (en) | Method and apparatus for decoding multi-view video information | |
JP6523495B2 (en) | Decryption method | |
JP5911982B2 (en) | Image decoding method | |
US8396124B2 (en) | Method of predicting motion and texture data | |
JP2019092188A (en) | Decoding method | |
JP2019080348A (en) | Decoding method |