JP2006262075A - Image encoder, method for encoding image and program for encoding image - Google Patents
Image encoder, method for encoding image and program for encoding image Download PDFInfo
- Publication number
- JP2006262075A JP2006262075A JP2005076646A JP2005076646A JP2006262075A JP 2006262075 A JP2006262075 A JP 2006262075A JP 2005076646 A JP2005076646 A JP 2005076646A JP 2005076646 A JP2005076646 A JP 2005076646A JP 2006262075 A JP2006262075 A JP 2006262075A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- image information
- image
- encoding
- orthogonal transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、画像符号化装置、画像符号化方法、および画像符号化用プログラムに関し、詳細には、画像情報をブロック単位でイントラ予測符号化を行う画像符号化装置、画像符号化方法、および画像符号化用プログラムに関する。 The present invention relates to an image encoding device, an image encoding method, and an image encoding program. More specifically, the present invention relates to an image encoding device, an image encoding method, and an image that perform intra prediction encoding of image information in units of blocks. The present invention relates to an encoding program.
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き予測・補償とにより圧縮するMPEGなどの方式に準拠した装置が普及している。 In recent years, image information has been handled as digital data. At that time, for the purpose of efficient transmission and storage of information, compression is performed by orthogonal transform such as discrete cosine transform and motion prediction / compensation using redundancy unique to image information. An apparatus conforming to a system such as MPEG is widely used.
特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。 In particular, MPEG2 (ISO / IEC 13818-2) is defined as a general-purpose image coding system, and is a standard that covers both interlaced and progressively scanned images, standard resolution images, and high-definition images. And widely used in a wide range of applications for consumer use. By using the MPEG2 compression method, for example, a standard resolution interlaced scanning image having 720 × 480 pixels is 4 to 8 Mbps, and a high resolution interlaced scanning image having 1920 × 1088 pixels is 18 to 22 Mbps. (Bit rate) can be assigned to achieve a high compression rate and good image quality.
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。 MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but did not support encoding methods with a lower code amount (bit rate) than MPEG1, that is, a higher compression rate. With the widespread use of mobile terminals, the need for such an encoding system is expected to increase in the future, and the MPEG4 encoding system has been standardized accordingly.
さらに、近年、テレビ会議用の画像符号化を当初の目的として、H.264(ITU-T Q6/16 VCEG)符号化方式の標準化が行われた。H.264は、MPEG2やMPEG4といった従来の符号化方式に比して、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。 Furthermore, in recent years, standardization of the H.264 (ITU-T Q6 / 16 VCEG) encoding method has been performed with the initial purpose of image encoding for video conferencing. H. H.264 is known to achieve higher encoding efficiency than a conventional encoding method such as MPEG2 or MPEG4, although a larger amount of calculation is required for encoding and decoding.
H.264では、ブロックの周辺の画素から予測画像を生成してその差分を符号化するというイントラ予測符号化が採用されている。H.264のイントラ予測符号化では、4×4画素ブロック単位に予測を行うイントラ4×4予測モードと、16×16画素ブロック(マクロブロック)単位で予測を行うイントラ16×16予測モードとの2つの予測方式が用いられている。 H. In H.264, intra prediction encoding is used in which a prediction image is generated from pixels around a block and the difference is encoded. H. In the H.264 intra prediction encoding, there are two types of intra 4 × 4 prediction mode in which prediction is performed in units of 4 × 4 pixel blocks and intra 16 × 16 prediction mode in which prediction is performed in units of 16 × 16 pixel blocks (macroblocks). A prediction scheme is used.
1.イントラ4×4予測モードは、以下の9つの予測モードがある。図4は、イントラ予測の処理対象となる4×4画素ブロックに属する画素データa〜pと、当該ブロックの周囲に位置するブロックの画素データA〜Qとの位置関係を説明するための図である。図5は、9つの予測モードの予測方向を説明するための図である。
(1)Mode0(Vertical prediction)
(2)Mode1(Horizontal prediction)
(3)Mode2(DC prediction)
(4)Mode3(Diagonal down/left prediction)
(5)Mode4(Diagonal down/right prediction)
(6)Mode5(Vertical−left prediction)
(7)Mode6(Horizontal−down prediction)
(8)Mode7(Vertical−right prediction)
(9)Mode8(Horizontal−up prediction)
1. The intra 4 × 4 prediction mode has the following nine prediction modes. FIG. 4 is a diagram for explaining the positional relationship between the pixel data a to p belonging to a 4 × 4 pixel block to be processed for intra prediction and the pixel data A to Q of blocks located around the block. is there. FIG. 5 is a diagram for explaining the prediction directions of the nine prediction modes.
(1) Mode 0 (Vertical prediction)
(2) Mode 1 (Horizontal prediction)
(3) Mode2 (DC prediction)
(4) Mode3 (Diagonal down / left prediction)
(5) Mode4 (Diagonal down / right prediction)
(6) Mode 5 (Vertical-left prediction)
(7) Mode 6 (Horizontal-down prediction)
(8) Mode7 (Vertical-right prediction)
(9) Mode 8 (Horizontal-up prediction)
ここでは一例として、Mode1とMode2を簡単に説明する。図6は、Mode1を説明するための図である。図6において、画素a,b,c,dには、左辺隣接画素Iが、画素a,b,c,dには、左辺隣接画素Iを、画素e,f,g,hには、左辺隣接画素Jを、画素i,j,k,lには、左辺隣接画素Kを、画素m,n,o,pには、左辺隣接画素Lを予測値として適用する。
Here,
Mode2は、基本は、上辺と左辺に隣接する計8個の画素値の平均値を適用するが、上辺の画素が利用不可の場合は、左辺の画素の平均値を、左辺の画素が利用不可の場合は、上辺の画素の平均値を適用する。また、上辺の画素、左辺の画素、共に利用不可の場合は、下式(1)により求めた値を適用する。 In Mode 2, the average value of a total of eight pixel values adjacent to the upper side and the left side is basically applied, but when the upper side pixel is unavailable, the left side pixel cannot be used as the average value of the left side pixel. In this case, the average value of the pixels on the upper side is applied. In addition, when neither the upper side pixel nor the left side pixel can be used, the value obtained by the following equation (1) is applied.
2.イントラ16×16予測モードは、以下の4つの予測モードがある。
(1)Mode0:Vertical prediction
(2)Mode1:Horizontal prediction
(3)Mode2:DC prediction
(4)Mode3:Plane prediction
2. The intra 16 × 16 prediction mode has the following four prediction modes.
(1) Mode 0: Vertical prediction
(2) Mode 1: Horizontal prediction
(3) Mode2: DC prediction
(4) Mode3: Plane prediction
Mode0〜Mode2は、4×4イントラ予測モードと同様であり、Mode0は上辺に隣接する画素値を適用し、Mode1は左辺に隣接する画素値を適用する。
Mode2は、基本は、上辺と左辺に隣接する計32個の画素値の平均値を適用するが、上辺の画素が利用不可の場合は、左辺の画素の平均値を、左辺の画素が利用不可の場合は、上辺の画素の平均値を適用し、上辺の画素、左辺の画素、共に利用不可の場合は、下式(2)より求めた値を適用する。 In Mode 2, the average value of a total of 32 pixel values adjacent to the upper side and the left side is applied, but when the upper side pixel is unavailable, the left side pixel cannot be used as the average value of the left side pixel. In this case, the average value of the pixels on the upper side is applied, and when neither the upper side pixel nor the left side pixel is usable, the value obtained from the following equation (2) is applied.
Mode3は、下式(3)で予測値を算出する。図7は、1MB(16×16)の画素構成を説明するための図である。P[x,y](x、y=0,...,15)は画素値を示している。
図8は、4×4イントラ予測モードのMode選択の制限を説明するための図である。図8において、ピクチャを4×4画素ブロックに分割した場合、フレームの枠にあたるMBの4×4画素ブロックのうち、斜線の4×4画素ブロックはフレーム外のブロックを参照するモードを選択することができない。ここで、例えば、Aの4×4画素ブロックに着目すると、上辺に4×4画素ブロックが存在しないため、予測に、上辺に隣接する画素値を使用するMode0,3,4,5,6,7を使用することができない。すなわち、使用可能なModeは、Mode1、2、8のみとなる。また、Bの4×4画素ブロックに着目すると、左辺に4×4画素ブロックが存在しないため、予測に、左辺に隣接する画素値を使用するMode1,4,5,6,8を使用できない。すなわち、使用可能なModeは、Mode0,2,3,7のみとなる。
FIG. 8 is a diagram for explaining restrictions on Mode selection in the 4 × 4 intra prediction mode. In FIG. 8, when a picture is divided into 4 × 4 pixel blocks, among the 4 × 4 pixel blocks of MB corresponding to the frame of the frame, a shaded 4 × 4 pixel block selects a mode that refers to a block outside the frame. I can't. Here, for example, when focusing on the 4 × 4 pixel block of A, since there is no 4 × 4 pixel block on the upper side,
図9は、16×16イントラ予測モードのMode選択の制限を説明するための図である。図9において、ピクチャを16×16画素ブロック(MB)に分割した場合、フレームの枠にあたるMBのうち斜線のMBは、フレーム外のブロックを参照するモードを選択することができない。ここで、例えば、AのMBに着目すると、上部にMBが存在しないため、予測に上辺に隣接する画素値を使用するMode0、3を選択することができない。すなわち、使用可能なModeは、Mode1、2のみとなる。
FIG. 9 is a diagram for explaining restrictions on Mode selection in the 16 × 16 intra prediction mode. In FIG. 9, when a picture is divided into 16 × 16 pixel blocks (MB), a shaded MB among MBs corresponding to a frame of a frame cannot select a mode for referring to a block outside the frame. Here, for example, when focusing on the MB of A, since MB does not exist in the upper part,
このように、H.264のイントラ予測符号化では、フレームの枠に相当するブロックにおいては、選択可能な予測モードが制限されるため、画質劣化が生じるという問題がある。なお、イントラ符号化で画質劣化を防止する技術として、例えば、特許文献1が公知である。
In this way, H.C. In the intra prediction encoding of H.264, there is a problem that image quality deterioration occurs in a block corresponding to a frame of a frame because selectable prediction modes are limited. For example,
本発明は、上記に鑑みてなされたものであり、イントラ予測符号化を行う場合に、選択可能な予測モードが制限される画像情報のブロックの画質低下を防止することが可能な画像符号化装置、符号化方法、および符号化用プログラムを提供することを目的とする。 The present invention has been made in view of the above, and an image encoding device capable of preventing deterioration in image quality of a block of image information in which selectable prediction modes are limited when performing intra prediction encoding. An object is to provide an encoding method and an encoding program.
上述した課題を解決し、目的を達成するために、本発明は、画像情報をブロック単位でイントラ予測符号化を行う画像符号化装置において、前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化手段と、前記差分値を直交変換して直交変換係数を生成する直交変換手段と、前記直交変換係数を量子化する量子化手段と、前記量子化手段で量子化された直交変換係数を符号化して符号化情報を生成する符号化手段と、を備え、前記量子化手段は、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化することを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides an image encoding apparatus that performs intra prediction encoding of image information in units of blocks, and includes a plurality of prediction modes for each block of the image information. An intra prediction encoding unit that selects one prediction mode, generates the predicted image information by executing the selected prediction mode, and outputs a difference value between the generated predicted image information and the original image information; Orthogonal transformation means for orthogonal transformation of difference values to generate orthogonal transformation coefficients, quantization means for quantizing the orthogonal transformation coefficients, and coding information obtained by encoding the orthogonal transformation coefficients quantized by the quantization means Encoding means for generating the orthogonal transform, the quantization means for the block of image information for which the selection of the prediction mode is restricted, the orthogonal transform with a quantization parameter in which image quality degradation is not conspicuous The number and wherein the quantizing.
また、本発明は、画像情報をブロック単位でイントラ予測符号化を行う画像符号化方法において、前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化工程と、前記差分値を直交変換して直交変換係数を生成する直交変換工程と、前記直交変換係数を量子化する量子化工程と、前記量子化工程で量子化された直交変換係数を符号化して符号化情報を生成する符号化工程と、を含み、前記量子化工程では、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化することを特徴とする。 In the image coding method for performing intra prediction coding of image information in units of blocks, the present invention selects one prediction mode from a plurality of prediction modes for each block of the image information, and selects the selected one. An intra prediction encoding process for generating prediction image information by executing a prediction mode and outputting a difference value between the generated prediction image information and original image information, and generating an orthogonal transform coefficient by orthogonally transforming the difference value An orthogonal transform step, a quantization step for quantizing the orthogonal transform coefficient, and an encoding step for encoding the orthogonal transform coefficient quantized in the quantization step to generate encoded information, In the quantization step, the orthogonal transform coefficient is quantized with a quantization parameter in which image quality deterioration is not conspicuous for a block of image information for which selection of the prediction mode is limited.
また、本発明は、コンピュータに、画像情報をブロック単位でイントラ予測符号化を行わせる画像符号化用プログラムにおいて、前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化工程と、前記差分値を直交変換して直交変換係数を生成する直交変換工程と、前記直交変換係数を量子化し、その際、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化する量子化工程と、前記量子化工程で量子化された直交変換係数を符号化して符号化情報を生成する符号化工程と、をコンピュータに実行させることを特徴とする。 According to another aspect of the present invention, there is provided an image coding program that causes a computer to perform intra prediction coding of image information in units of blocks, and selects one prediction mode from a plurality of prediction modes for each block of the image information. And executing the selected prediction mode to generate prediction image information, and outputting the difference value between the generated prediction image information and the original image information, and orthogonally transforming the difference value. An orthogonal transform step for generating an orthogonal transform coefficient, and the orthogonal transform coefficient is quantized, and the orthogonal transform coefficient is quantized with a quantization parameter that is less noticeable in image quality degradation for a block of image information in which selection of the prediction mode is restricted. A quantization process for quantizing the transform coefficient, and an encoding process for generating encoded information by encoding the orthogonal transform coefficient quantized in the quantization process. Characterized in that to execute the.
以下に添付図面を参照して、この発明にかかる画像符号化装置、画像符号化方法、および画像符号化用プログラムの最良な実施の形態を詳細に説明する。この実施例によりこの発明が限定されるものではない。また、下記実施例における構成要素には、当業者が容易に想定できるものまたは実質的に同一のものが含まれる。 Exemplary embodiments of an image encoding device, an image encoding method, and an image encoding program according to the present invention are explained in detail below with reference to the accompanying drawings. The present invention is not limited to the embodiments. In addition, constituent elements in the following embodiments include those that can be easily assumed by those skilled in the art or those that are substantially the same.
図1は、本発明の一実施例に係る画像符号化装置100の概略の構成例を示す図である。同図に示す画像符号化装置100では、一例として、H.264形式の符号化情報を生成する場合について説明する。画像符号化装置100は、MBモード判定部101と、イントラ予測部102と、インター予測部103と、DCT部104と、量子化パラメータ判定部105と、量子化部106と、可変長符号化部107とを備えている。
FIG. 1 is a diagram illustrating a schematic configuration example of an image encoding device 100 according to an embodiment of the present invention. In the image encoding apparatus 100 shown in FIG. A case where H.264 format encoded information is generated will be described. The image coding apparatus 100 includes an MB
MBモード判定部101は、入力される画像情報のフレームのマクロブロックMBのMBモードを判定し、イントラ(画像内)符号化が行われるマクロブロックMBに関しては、イントラ予測部102および量子化パラメータ判定部105に出力し、インター(画像間)符号化が行われるマクロブロックMBに関しては、インター予測部103に出力する。
The MB
イントラ予測部102は、イントラ符号化する画像情報の場合は、符号化するマクロブロックの近傍の既に符号化が終了した画素値から予測画像情報を生成し、その予測画像情報と原画像情報との差分値をDCT部104に出力する。イントラ予測部102は、予測画像情報を生成する場合に、イントラ4×4予測モードの場合は、Mode0(Vertical prediction)、Mode1(Horizontal prediction)、Mode2(DC prediction)、Mode3(Diagonal down/left prediction)、Mode4(Diagonal down/right prediction)、Mode5(Vertical−left prediction)、Mode6(Horizontal−down prediction)、Mode7(Vertical−right prediction)、Mode8(Horizontal−up prediction)の中から最適なモードを選択し、また、イントラ16×16予測モードの場合は、Mode0(Vertical prediction)、Mode1(Horizontal prediction)、Mode2(DC prediction)、Mode3(Plane prediction)の中から最適なモードを選択する。
In the case of image information to be intra-encoded, the
インター予測部103は、インター符号化する画像情報の場合は、符号化するマクロブロックMBに対して、動き予測・補償処理を施して予測画像情報を生成し、その予測画像情報と原画像情報との差分値をDCT部104に出力する。
In the case of image information to be inter-coded, the inter prediction unit 103 performs motion prediction / compensation processing on the macroblock MB to be encoded to generate predicted image information, and the predicted image information, the original image information, Are output to the
DCT部104は、イントラ予測部102またはインター予測部103の演算部207から入力される差分値に対してDCT処理を施し、その結果得られるDCT係数を量子化部106に出力する。
The
量子化パラメータ判定部105は、画像情報が入力され、処理対象マクロブロックMBがイントラ予測でフレームの上辺または左辺である場合に画質劣化が生じるか否かを判定し、画質劣化が生じると判定した場合には、処理対象マクロブロックMBに対して画質劣化が目立ち難くなるような量子化パラメータQ(例えば、量子化ステップ)を設定させるための量子化パラメータ制御信号を量子化部106に出力する。すなわち、量子化パラメータ判定部105は、イントラ予測を使用した場合、処理対象マクロブロックMBがイントラ予測でフレームの上辺または左辺である場合には、予測モードが制限されるため、この予測モードの制限に起因する画質劣化を防止するために、画質劣化が目立ち難くなるような量子化パラメータQで、量子化部106に量子化を行わせる。量子化パラメータ判定部105の詳細な処理内容は後述する(図2参照)。
The quantization
量子化部106は、入力されるDCT係数を所定の量子化パラメータで量子化し、量子化されたDCT係数を可変長符号化部107およびインター予測部103の逆量子化部201に出力する。また、量子化部106は、量子化パラメータ判定部105から入力される量子化パラメータ制御信号に基づいて、処理対象マクロブロックMBがイントラ予測でフレームの上辺または左辺である場合において画質劣化が生じると判定された場合には、画質劣化を改善するような量子化を行う。
The
可変長符号化部107は、量子化されたDCT係数を可変長符号化し、符号化情報(H.264ビットストリーム)として出力する。
The variable
インター予測部103は、逆量子化部201と、逆DCT部202と、演算部203と、フレームメモリ204と、動き検出部205と、動き補償部206と、演算部207とを備えている。
The inter prediction unit 103 includes an
演算部207は、MBモード判定部101から入力される原画像情報と、動き補償部206から入力される予測画像情報との差分値を演算して、DCT部104に出力する。
The
逆量子化部201は、量子化部106から入力される量子化されたDCT係数を逆量子化し、得られたDCT係数を逆DCT部202に出力する。逆DCT部202は、DCT係数を逆DCT処理して、演算部203に出力する。
The
演算部203は、逆DCT部202からの出力情報と動き補償部206からの予測画像情報とを加算し、元の画像情報を局所復号する。この局所復号された画像情報は、フレームメモリ204に出力されて記憶され、予測画像情報を作成する際に利用される。
The
動き検出部205は、MBモード判定部101から入力される画像情報の処理対象マクロブロックMBの動きベクトルMVの検出を行う。動き検出部205は、フレームメモリ204に格納されている過去の符号化済みフレーム画像(以降、「参照フレーム」と称する)の所定の探索範囲において、現ブロックに類似する部分(以降、「動き予測データ」と称する)を探索し、現ブロックから動き予測データへの二次元の空間的移動量を動きベクトルMVとして検出する。動き検出部205は、検出した動きベクトルMVを、動き補償部206及び可変長符号化部107に出力する。
The
動き補償部206は、動き検出部205から入力される動きベクトルMVとフレームメモリ204に格納されている参照フレームとを用いて、予測画像情報を生成して、演算部207に出力する。
The
図2は、量子化パラメータ判定部105の量子化パラメータQの判定処理を説明するためのフローチャートである。図2において、Picture_Wはピクチャ幅(Pixel)、MB_sizeはマクロブロックサイズ(Pixel)、MB_Noはマクロブロック番号、MB_ComplexityはマクロブロックMBの複雑度(Activityなど)、MB_lumaはマクロブロックMBの輝度値を示している。
FIG. 2 is a flowchart for explaining the quantization parameter Q determination processing of the quantization
量子化パラメータ判定部105は、まず、処理対象のマクロブロックMBが、MB_No<Picture_W/MB_sizeまたはPicture_W%MB_No==0であるか否か、すなわち、フレームの上辺または左辺であるか否かを判定する(ステップS1)。ここで、処理対象のマクロブロックがフレームの上辺または左辺であるか否かを判定しているのは、予測モードの選択が制限されるブロックを検出するためである。上述したように、フレームの上辺または左辺のブロックは予測モードが制限される。
First, the quantization
量子化パラメータ判定部105は、処理対象のマクロブロックMBが、MB_No<Picture_W/MB_sizeまたはPicture_W%MB_No==0である場合、すなわち、フレームの上辺または左辺である場合には(ステップS1の「Yes」)、イントラ予測であるか否かを判定する(ステップS2)。 When the macroblock MB to be processed is MB_No <Picture_W / MB_size or Picture_W% MB_No == 0, that is, the upper side or the left side of the frame (“Yes” in step S1). ]), It is determined whether or not the intra prediction (step S2).
量子化パラメータ判定部105は、イントラ予測である場合には(ステップS2の「Yes」)、設定されている量子化パラメータQ>閾値N1であるかを判定し(ステップS3)、量子化パラメータQ>閾値N1である場合には(ステップS3の「Yes」)、MB Complexity<閾値N2、かつ、MB_luma>閾値N3であるか否かを判定する(ステップS4)。ここで、MB_Complexity<閾値N2、かつ、MB_luma>閾値N3であるか否かを判定しているのは、マクロブロックMBのActivityなどが低く複雑度が低い画像で、かつ、輝度値が高い場合には、画質劣化が目立ちやすいためである。人間の視覚特性として、例えば、空などのような平坦な部分においては、視覚的に劣化を感じやすいことは周知の事実であるが、その部分の輝度が低い場合には劣化は感じにくい。すなわち、人間の視覚は、平坦かつ輝度が高い場合に画質劣化を感じやすい。
In the case of intra prediction (“Yes” in step S2), the quantization
量子化パラメータ判定部105は、MB_Complexity<閾値N2、かつ、MB_luma>閾値N3である場合(ステップS4の「Yes」)、すなわち、処理対象のマクロブロックMBの画質劣化が目立ちやすい場合には、量子化パラメータQを下げ(ステップS5)、処理対象マクロブロックMBに対して画質劣化が目立ち難くなるような、すなわち、低い量子化パラメータQ(例えば、細かい量子化ステップ)を設定させるための量子化パラメータ制御信号を量子化部106に出力する。
When MB_Complexity <threshold N2 and MB_luma> threshold N3 (“Yes” in step S4), that is, when the image quality degradation of the macroblock MB to be processed is conspicuous, the quantization
これに応じて、量子化部106では、量子化パラメータ判定部105から入力される量子化パラメータ制御信号に基づいて、処理対象マクロブロックMBに対して、低い量子化パラメータQで量子化を行う。このようにして、量子化部106では、処理対象マクロブロックMBがイントラ予測でフレームの上辺または左辺である場合において画質劣化が目立ち易い画像である場合に、画質劣化を改善するような量子化が行われる。また、本実施例では、PピクチャのイントラMBについても画質劣化が目立ち難くなるような量子化が行われ、PピクチャのイントラMBについても有効である。
In response to this, the
なお、上記実施例では、フレームの上辺または左辺のブロックで、かつ、その画像の複雑度が閾値より小さく、かつ、その輝度値が閾値より大きい場合に、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することとしたが、上記ステップS4における画像の複雑度および輝度値の判定は、本発明の必須の構成要件ではなく、上記ステップS4の処理を省略して、フレームの上辺または左辺のブロックに該当する場合、すなわち、予測モードの選択が制限される場合に、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することにしてもよい。 In the above-described embodiment, the DCT is a quantization parameter in which the image quality deterioration is not noticeable when the block is the upper side or the left side of the frame, the complexity of the image is smaller than the threshold value, and the luminance value is larger than the threshold value. Although the coefficients are quantized, the determination of the image complexity and the luminance value in step S4 is not an essential component of the present invention, and the processing in step S4 is omitted, and the upper side or left side of the frame When the block corresponds to this block, that is, when the selection of the prediction mode is restricted, the DCT coefficient may be quantized with a quantization parameter in which image quality deterioration is not noticeable.
また、上記実施例では、予測モードの選択が制限される場合として、フレームの上辺または左辺のブロックに該当する場合を一例として説明したが、本発明はこれに限られるものではなく、例えば、フレームをスライスした場合において、スライス内のブロックで予測モードの選択が制限される場合についても適用可能である。 Further, in the above embodiment, the case where the selection of the prediction mode is limited has been described as an example of the case corresponding to the block on the upper side or the left side of the frame. However, the present invention is not limited to this. This is also applicable to the case where the selection of the prediction mode is limited by the blocks in the slice.
また、処理対象マクロブロックMBと隣接するマクロブロックMBとの間で、量子化パラメータに差がある場合も違和感を感じやすいので、量子化パラメータ判定部105は、隣接マクロブロックMBとの関係を考慮して、量子化パラメータを制御することにしてもよい。
In addition, since there is a sense of incongruity even when there is a difference in the quantization parameter between the processing target macroblock MB and the adjacent macroblock MB, the quantization
以上説明したように、本実施例によれば、イントラ予測部102は、画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力し、DCT部104は、イントラ予測部102から入力される差分値をDCT変換してDCT係数を生成し、量子化部106は、DCT係数を量子化し、可変長符号化部107は、量子化部106で量子化されたDCT係数を可変長符号化して符号化情報を生成し、かつ、上記量子化部106は、予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することとしたので、イントラ予測符号化で選択できる予測モードが制限されるブロックに対して、予測モードの選択が制限されることに起因する画質劣化を防止するために、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することができ、イントラ予測符号化を行う場合に、選択可能な予測モードが制限される画像情報のブロックの画質低下を防止することが可能となる。
As described above, according to the present embodiment, the
また、上記実施例によれば、予測モードが制限される、フレームの上辺または左辺のブロックに対して、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することとしたので、フレームの上辺または左辺のブロックの画質劣化を防止することが可能となる。 Also, according to the above embodiment, since the DCT coefficient is quantized with the quantization parameter in which the image quality degradation is not conspicuous with respect to the block on the upper side or the left side of the frame where the prediction mode is limited, the upper side of the frame Alternatively, it is possible to prevent image quality deterioration of the block on the left side.
また、上記実施例によれば、画像情報のフレームの上辺または左辺のブロックで、かつ、その画像の複雑度が閾値より小さく、かつ、その輝度値が閾値より大きい場合に、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することとしたので、実際に画像劣化が生じやすい場合である、画像の複雑度が閾値より小さく、かつ、その輝度値が閾値より大きい場合にのみ、画質劣化が目立ち難い量子化パラメータでDCT係数を量子化することができ、符号化情報の符号量が余分に発生することを防止することが可能となる。 Further, according to the above-described embodiment, when the upper or left block of the frame of the image information is used, and the complexity of the image is smaller than the threshold value and the luminance value is larger than the threshold value, the image quality deterioration is not noticeable. Since the DCT coefficient is quantized with the quantization parameter, the image quality is deteriorated only when the image complexity is smaller than the threshold value and the luminance value is larger than the threshold value. Therefore, it is possible to quantize the DCT coefficient with a quantization parameter that is not conspicuous, and it is possible to prevent an excessive amount of encoded information from being generated.
なお、本発明に係る画像符号化装置100の構成例は上記図1の構成に限られるものではなく、上記画像符号化装置100の機能を実現するためのプログラムを図3に示したコンピュータ読み取り可能な記録媒体400に記録して、この記録媒体400に記録されたプログラムを同図に示したコンピュータ300に読み込ませ、実行することにより各機能を実現してもよい。
Note that the configuration example of the image encoding device 100 according to the present invention is not limited to the configuration of FIG. 1 described above, and the computer-readable program shown in FIG. 3 can realize a program for realizing the functions of the image encoding device 100. Each function may be realized by recording in a
同図に示したコンピュータ300は、上記プログラムを実行するCPU(Central Proc
essing Unit)301と、キーボード、マウス等の入力装置302と、各種データを記憶するROM(Read Only Memory)303と、演算パラメータ等を記憶するRAM(Random Access Memory)304と、記録媒体400からプログラムを読み取る読取装置305と、ディスプレイ、プリンタ等の出力装置306とから構成されている。
A
essing unit) 301, an
CPU301は、読取装置305を経由して記録媒体400に記録されているプログラムを読み込んだ後、プログラムを実行することにより、前述した機能を実現する。なお、記録媒体400としては、光ディスク、フレキシブルディスク、ハードディスク等が挙げられる。
The
以上のように、本発明に係る画像符号化装置、画像符号化方法、および画像符号化用プログラムは、画像符号化機能を搭載した各種装置に有用であり、例えば、DVD/HDDレコーダー等に利用可能である。 As described above, the image encoding apparatus, the image encoding method, and the image encoding program according to the present invention are useful for various apparatuses equipped with an image encoding function, and are used for, for example, a DVD / HDD recorder. Is possible.
100 画像符号化装置
101 MBモード判定部
102 イントラ予測部
103 インター予測部
104 DCT部
105 量子化パラメータ判定部
106 量子化部
107 可変長符号化部
201 逆量子化部
202 逆DCT部
203 演算部
204 フレームメモリ
205 動き検出部
206 動き補償部
207 演算部
300 コンピュータ
301 CPU
302 入力装置
303 ROM
304 RAM
305 読取装置
306 出力装置
400 記録媒体
DESCRIPTION OF SYMBOLS 100
302
304 RAM
305
Claims (6)
前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化手段と、
前記差分値を直交変換して直交変換係数を生成する直交変換手段と、
前記直交変換係数を量子化する量子化手段と、
前記量子化手段で量子化された直交変換係数を符号化して符号化情報を生成する符号化手段と、
を備え、
前記量子化手段は、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化することを特徴とする画像符号化装置。 In an image coding apparatus that performs intra prediction coding of image information in units of blocks,
For each block of the image information, one prediction mode is selected from a plurality of prediction modes, the selected prediction mode is executed to generate prediction image information, and the generated prediction image information, original image information, Intra prediction encoding means for outputting the difference value of
Orthogonal transform means for orthogonally transforming the difference value to generate an orthogonal transform coefficient;
Quantization means for quantizing the orthogonal transform coefficient;
Encoding means for encoding orthogonal transform coefficients quantized by the quantization means to generate encoded information;
With
The image encoding apparatus characterized in that the quantization means quantizes the orthogonal transform coefficient with a quantization parameter in which image quality deterioration is not conspicuous for a block of image information for which selection of the prediction mode is restricted.
前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化工程と、
前記差分値を直交変換して直交変換係数を生成する直交変換工程と、
前記直交変換係数を量子化する量子化工程と、
前記量子化工程で量子化された直交変換係数を符号化して符号化情報を生成する符号化工程と、
を含み、
前記量子化工程では、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化することを特徴とする画像符号化方法。 In an image encoding method for performing intra prediction encoding of image information in units of blocks,
For each block of the image information, one prediction mode is selected from a plurality of prediction modes, the selected prediction mode is executed to generate prediction image information, and the generated prediction image information, original image information, An intra-prediction encoding step for outputting a difference value of
An orthogonal transform step of orthogonally transforming the difference value to generate an orthogonal transform coefficient;
A quantization step of quantizing the orthogonal transform coefficient;
An encoding step of generating encoded information by encoding the orthogonal transform coefficient quantized in the quantization step;
Including
In the quantization step, the orthogonal transform coefficient is quantized with a quantization parameter in which image quality deterioration is not conspicuous for a block of image information for which selection of the prediction mode is restricted.
前記画像情報のブロック毎に、複数の予測モードの中から1つの予測モードを選択し、当該選択した予測モードを実行して予測画像情報を生成し、当該生成した予測画像情報と原画像情報との差分値を出力するイントラ予測符号化工程と、
前記差分値を直交変換して直交変換係数を生成する直交変換工程と、
前記直交変換係数を量子化し、その際、前記予測モードの選択が制限される画像情報のブロックに対して、画質劣化が目立ち難い量子化パラメータで前記直交変換係数を量子化する量子化工程と、
前記量子化工程で量子化された直交変換係数を符号化して符号化情報を生成する符号化工程と、
をコンピュータに実行させることを特徴とする画像符号化用プログラム。
In an image encoding program for causing a computer to perform intra prediction encoding of image information in units of blocks,
For each block of the image information, one prediction mode is selected from a plurality of prediction modes, the selected prediction mode is executed to generate prediction image information, and the generated prediction image information, original image information, An intra-prediction encoding step for outputting a difference value of
An orthogonal transform step of orthogonally transforming the difference value to generate an orthogonal transform coefficient;
A quantization step for quantizing the orthogonal transform coefficient, and quantizing the orthogonal transform coefficient with a quantization parameter in which image quality degradation is not conspicuous for a block of image information in which selection of the prediction mode is limited.
An encoding step of generating encoded information by encoding the orthogonal transform coefficient quantized in the quantization step;
An image encoding program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005076646A JP2006262075A (en) | 2005-03-17 | 2005-03-17 | Image encoder, method for encoding image and program for encoding image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005076646A JP2006262075A (en) | 2005-03-17 | 2005-03-17 | Image encoder, method for encoding image and program for encoding image |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006262075A true JP2006262075A (en) | 2006-09-28 |
Family
ID=37100819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005076646A Pending JP2006262075A (en) | 2005-03-17 | 2005-03-17 | Image encoder, method for encoding image and program for encoding image |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006262075A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101426135B (en) * | 2007-10-29 | 2011-07-20 | 佳能株式会社 | Encoding apparatus, method of controlling thereof |
WO2018014301A1 (en) * | 2016-07-21 | 2018-01-25 | 华为技术有限公司 | Video coding method and device |
-
2005
- 2005-03-17 JP JP2005076646A patent/JP2006262075A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101426135B (en) * | 2007-10-29 | 2011-07-20 | 佳能株式会社 | Encoding apparatus, method of controlling thereof |
WO2018014301A1 (en) * | 2016-07-21 | 2018-01-25 | 华为技术有限公司 | Video coding method and device |
CN108028938A (en) * | 2016-07-21 | 2018-05-11 | 华为技术有限公司 | Method for video coding and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6660074B2 (en) | Video decoding method and apparatus | |
JP6047614B2 (en) | Video decoding device | |
JP5846675B2 (en) | Intra prediction mode decoding method and apparatus | |
KR101246294B1 (en) | Method of and apparatus for video intraprediction encoding/decoding | |
KR100785589B1 (en) | Image encoding apparatus and image decoding apparatus | |
US20150010244A1 (en) | Method for encoding/decoding high-resolution image and device for performing same | |
JP5989841B2 (en) | Video decoding device | |
US20130089265A1 (en) | Method for encoding/decoding high-resolution image and device for performing same | |
KR20140064972A (en) | Method, device, and program for encoding and decoding image | |
KR101615643B1 (en) | Compression of pictures | |
JP4774315B2 (en) | Image decoding apparatus and image decoding method | |
JP4884703B2 (en) | Image spatial prediction encoding method, encoding device, decoding method, and decoding device | |
JP2014075652A (en) | Image encoder, and image encoding method | |
JP2008004984A (en) | Image processor and method, program, and recording medium | |
JP4775132B2 (en) | Image processing apparatus and method, program, and recording medium | |
JP2006246277A (en) | Re-encoding apparatus, re-encoding method, and re-encoding program | |
JP2006262075A (en) | Image encoder, method for encoding image and program for encoding image | |
JP4971817B2 (en) | Image encoding device | |
JP2006295503A (en) | Reencoding apparatus and method, and program for reencoding | |
JP2006295734A (en) | Re-encoding apparatus, re-encoding method, and re-encoding program | |
KR20230098729A (en) | Encoding device, decoding device, and program | |
JP2010104026A (en) | Decoding device and method | |
JP4406887B2 (en) | Moving picture coding apparatus and moving picture coding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100302 |