JP2006236063A - Device for extracting moving body - Google Patents

Device for extracting moving body Download PDF

Info

Publication number
JP2006236063A
JP2006236063A JP2005050734A JP2005050734A JP2006236063A JP 2006236063 A JP2006236063 A JP 2006236063A JP 2005050734 A JP2005050734 A JP 2005050734A JP 2005050734 A JP2005050734 A JP 2005050734A JP 2006236063 A JP2006236063 A JP 2006236063A
Authority
JP
Japan
Prior art keywords
moving object
block
frame
divided
estimation means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005050734A
Other languages
Japanese (ja)
Other versions
JP4573297B2 (en
Inventor
Satoyuki Shimizu
智行 清水
Akio Yoneyama
暁夫 米山
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2005050734A priority Critical patent/JP4573297B2/en
Publication of JP2006236063A publication Critical patent/JP2006236063A/en
Application granted granted Critical
Publication of JP4573297B2 publication Critical patent/JP4573297B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a moving body extracting device which is suitably applicable to a moving picture which is encoded by using prediction encoding with a division block. <P>SOLUTION: An encoding mode extractor 30 connects switching means 45, 55 to a second moving body estimating unit 50 when an extracted encoding mode is an inter-frame prediction encoding system, and connects them to a position shown in the figure when the encoding mode is an in-frame prediction encoding system. A first moving body estimating unit 40 estimates whether the block is the one included in a moving body area or not based on the prediction encoding mode and a division block size. The second moving body estimating unit 50 estimates whether the moving body area or not based on a movement vector concerning each division block among the blocks of the inter-frame prediction encoding mode which are estimated as the block included in the moving body area by the first moving body estimating means. A final moving body determining apparatus 60 determines the final moving body. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は移動物体抽出装置に関し、特に一定の大きさのブロックを複数の分割ブロックサイズに分割してフレーム間予測符号化およびフレーム内予測符号化モードによって符号化を行われた動画像から移動物体を抽出する移動物体抽出装置に関する。    The present invention relates to a moving object extraction apparatus, and more particularly, to a moving object from a moving image obtained by dividing a block having a certain size into a plurality of divided block sizes and performing encoding by inter-frame prediction encoding and intra-frame prediction encoding mode. The present invention relates to a moving object extraction apparatus that extracts a signal.

従来の符号化データを用いた移動物体検出装置の一つとして、例えば下記の特許文献1に記されているものがある。該特許文献1に記されている技術を簡単に説明すると、下記のようになる。   As one of the moving object detection devices using the conventional encoded data, for example, there is one described in Patent Document 1 below. The technique described in Patent Document 1 will be briefly described as follows.

ITU−T H.261、H.263、あるいはISO/IEC MPEG−4などにより符号化された動画像データを可変長復号化部で可変長復号する。該可変長復号化部は、16×16画素のマクロブロック単位でフレーム内予測符号化モード(以下、INTRAモードと呼ぶ)とフレーム間予測符号化モード(以下、INTERモードと呼ぶ)の判定を行う。   ITU-TH. 261, H.H. The variable-length decoding unit performs variable-length decoding on moving image data encoded by H.263 or ISO / IEC MPEG-4. The variable length decoding unit determines an intra-frame prediction encoding mode (hereinafter referred to as an INTRA mode) and an inter-frame prediction encoding mode (hereinafter referred to as an INTER mode) in units of 16 × 16 pixel macroblocks. .

次に、INTRAモードと判定されたマクロブロックに対しては、当該マクロブロックの再生画像信号と1フレーム前の対応するマクロブロックの再生画像信号との差分絶対値和(SAD)を計算し、該差分絶対値和がある閾値より大きければ当該マクロブロックを動マクロブロックと判定し、該閾値より小さければ静止マクロブロックと判定する。一方、INTERモードと判定されたマクロブロックに対しては、前記可変長復号化部から得られた動きベクトル情報およびDCT係数情報から、当該マクロブロックの動ベクトルの絶対値和およびDCT係数の絶対値和を計算し、該動ベクトルの絶対値和とDCT係数の絶対値和が共にそれぞれのある閾値より小さければ当該マクロブロックは静止マクロブロックと判定し、そうでない場合は動マクロブロックであると判定する。
特開2002−334337号公報
Next, for a macroblock determined to be in the INTRA mode, a sum of absolute differences (SAD) between the reproduced image signal of the macroblock and the reproduced image signal of the corresponding macroblock one frame before is calculated, If the sum of absolute differences is larger than a certain threshold, the macro block is determined as a moving macro block, and if it is smaller than the threshold, it is determined as a static macro block. On the other hand, for a macroblock determined to be in the INTER mode, from the motion vector information and DCT coefficient information obtained from the variable length decoding unit, the absolute value sum of the motion vector of the macroblock and the absolute value of the DCT coefficient are obtained. When the sum of absolute values of the motion vectors and the sum of absolute values of the DCT coefficients is smaller than a certain threshold value, the macro block is determined to be a static macro block. Otherwise, it is determined to be a dynamic macro block. To do.
JP 2002-334337 A

しかしながら、前記した従来技術には、次のような課題があった。すなわち、移動物体の判定が、前記したように、16×16画素のマクロブロック単位での判定であるため、粗い移動物体判定になる。また、移動物体判定の対象となる符号化画像データがH.263やMPEG−4等で符号化されていることを前提としているので、H.264/MPEG−4 AVC(Advanced Video Coding)のように、マクロブロックをさらに小さなブロックに分割して符号化する符号化方式で符号化された画像データには、予測符号化モード判定などの傾向が異なるため、適用が困難である。   However, the prior art described above has the following problems. In other words, as described above, since the determination of the moving object is performed in units of 16 × 16 pixel macroblocks, the moving object determination is rough. Also, the encoded image data that is the object of moving object determination is H.264. H.263, MPEG-4, etc. are presupposed. As in H.264 / MPEG-4 AVC (Advanced Video Coding), image data encoded by an encoding method in which a macro block is divided into smaller blocks and encoded has a tendency such as predictive encoding mode determination. Difficult to apply because of differences.

本発明は、前記した従来技術の課題に鑑みてなされたものであり、その目的は、H.264/MPEG−4 AVCのように、分割ブロックを伴う予測符号化を用いて符号化された動画像に用いて好適な移動物体抽出装置を提供することにある。   The present invention has been made in view of the above-described problems of the prior art. An object of the present invention is to provide a moving object extraction apparatus suitable for a moving image encoded using predictive encoding with divided blocks, such as H.264 / MPEG-4 AVC.

前記目的を達成するために、本発明は、分割ブロックサイズが可変のフレーム間予測符号化と、分割ブロックサイズが可変のフレーム内予測符号化を用いて符号化された動画像を入力として、動画像内の移動物体を抽出する移動物体抽出装置において、予測符号化モードおよび分割ブロックサイズに基づいて移動物体領域に含まれるブロックかどうかを推定する第1の移動物体推定手段と、該第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム間予測符号化モードのブロックに対して、各分割ブロックについて動きベクトルに基づいて移動物体領域かどうかを推定する第2の移動物体推定手段とを具備し、前記第2の移動物体推定手段における判定結果に基づいて動画像内の移動物体を分割ブロック単位で抽出するようにした点に第1の特徴がある。   In order to achieve the above object, the present invention inputs a moving image encoded using inter-frame predictive coding with a variable divided block size and intra-frame predictive coding with a variable divided block size as input. In a moving object extraction apparatus for extracting a moving object in an image, first moving object estimation means for estimating whether a block is included in a moving object region based on a predictive coding mode and a divided block size; A second moving object that estimates whether or not each divided block is a moving object region based on a motion vector with respect to a block in an inter-frame prediction encoding mode estimated as a block included in the moving object region by the moving object estimation unit And a block that divides the moving object in the moving image based on the determination result in the second moving object estimation means. There is first characterized in that so as to extract at positions.

また、前記第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム内予測符号化モードのブロックに対して、前フレームにおける判定結果に基づいて移動物体領域かどうかを推定する第3の移動物体推定手段を具備した点に第2の特徴がある。   In addition, the intra-frame prediction coding mode block estimated as a block included in the moving object region by the first moving object estimation means is estimated based on the determination result in the previous frame. The second feature is that the third moving object estimation means is provided.

さらに、前記第1及び第2の移動物体推定手段、あるいは前記第1、第2及び第3の移動物体推定手段において移動物体と推定された分割ブロックと、該分割ブロックによって囲まれている分割ブロックを移動物体として最終的に判定する最終移動物体判定手段を具備した点に第3の特徴がある。   Further, the first and second moving object estimation means, or the divided blocks estimated as moving objects in the first, second and third moving object estimation means, and the divided blocks surrounded by the divided blocks There is a third feature in that a final moving object determination unit that finally determines as a moving object is provided.

本発明によれば、分割ブロックを考慮した移動物体判定を行うので、動画像から移動物体を精度良く抽出することができるようになる。また、小さいブロックを単位として移動物体を抽出することができるようになる。   According to the present invention, since the moving object determination is performed in consideration of the divided blocks, the moving object can be accurately extracted from the moving image. In addition, a moving object can be extracted in units of small blocks.

以下に、図面を参照して、本発明を詳細に説明する。以下では、入力動画像の圧縮符号化方式として、H.264/MPEG−4 AVCを用いた場合について説明するが、本発明はこれに限定されるものではない。   Hereinafter, the present invention will be described in detail with reference to the drawings. In the following, as a compression encoding method for input moving images, H.264 is used. Although the case where H.264 / MPEG-4 AVC is used will be described, the present invention is not limited to this.

周知のように、H.264/MPEG−4 AVCでは、フレーム間予測符号化方式として図3に示すブロック分割方式を用い、フレーム内予測符号化方式として図4に示すブロック分割方式を用いている。   As is well known, H.M. In H.264 / MPEG-4 AVC, the block division method shown in FIG. 3 is used as the inter-frame prediction encoding method, and the block division method shown in FIG. 4 is used as the intra-frame prediction encoding method.

すなわち、図3のフレーム間予測符号化方式の符号化モードには、同図(d)の16×16画素モード、同図(c)の16×8画素モード、同図(b)の8×16画素モードおよび同図(a)の8×8画素モードがあり、それぞれの分割ブロックサイズをブロック単位として符号化を行う。また、前記8×8画素モードは、さらに、同図(f)の8×4画素モード、同図(g)の4×8画素モード、および同図(h)の4×4画素モードがあり、それぞれの分割ブロックサイズをブロック単位とする符号化を行う。   That is, the encoding mode of the inter-frame predictive encoding method in FIG. 3 includes the 16 × 16 pixel mode in FIG. 4D, the 16 × 8 pixel mode in FIG. 3C, and the 8 × in FIG. There are a 16-pixel mode and an 8 × 8-pixel mode shown in FIG. 8A, and encoding is performed with each divided block size as a block unit. Further, the 8 × 8 pixel mode further includes an 8 × 4 pixel mode shown in FIG. 5F, a 4 × 8 pixel mode shown in FIG. 5G, and a 4 × 4 pixel mode shown in FIG. Then, encoding is performed with each divided block size as a block unit.

一方、図4のフレーム内予測符号化方式の符号化モードには、同図(a-1)〜(a-9)の4×4画素モードと、同図(b-1)〜(b-4)の16×16画素モードとがある。   On the other hand, the encoding modes of the intra-frame prediction encoding method of FIG. 4 include the 4 × 4 pixel mode of (a-1) to (a-9) and (b-1) to (b−) of FIG. 4) 16 × 16 pixel mode.

本発明は、H.264/MPEG−4 AVC等の符号化装置では、圧縮符号化効率を高めるために、移動物体画像と非移動物体画像(例えば、背景画像)の境界(以下、エッジと呼ぶ)では、移動物体と背景の動きの違いを反映して、より小さなブロックサイズによる予測符号化が行われることが多いこと、また、エッジが存在することによって、画像特徴が複雑になるため、フレーム内符号化が用いられる場合においても、より小さなブロックサイズが選択されることが多いことに着目し、以上のことから、当該ブロックが移動物体か非移動物体を表す画像であるかを推定するようにした点に発明の原理がある。   The present invention relates to H.264. In an encoding apparatus such as H.264 / MPEG-4 AVC, in order to increase compression encoding efficiency, a moving object image and a non-moving object image (for example, a background image) boundary (hereinafter referred to as an edge) Reflecting differences in background motion, predictive coding is often performed with a smaller block size, and the presence of edges complicates image features, so intraframe coding is used. Even in this case, paying attention to the fact that a smaller block size is often selected. From the above, the present invention is based on the point that it is estimated whether the block is an image representing a moving object or a non-moving object. There is a principle.

図1は、本発明の第1の実施形態に係わる移動物体抽出装置の構成を示すブロック図である。   FIG. 1 is a block diagram showing a configuration of a moving object extraction apparatus according to the first embodiment of the present invention.

H.264/MPEG−4 AVC等で圧縮符号化された動画像データである入力画像信号は、可変長動画像復号器10に入力され、ブロックの符号化モード、動き補償モード、動きベクトル量、DCT係数等が復号される。動きベクトル抽出器20は可変長動画像復号器10で復号されたブロックの動きベクトル量を抽出し、第2移動物体推定器50に送る。また、符号化モード抽出器30はブロックの符号化モード(図3、図4参照)を抽出し、第1の移動物体推定器40に送る。この符号化モードから、前記図3および図4に示した符号化モードのいずれが用いられているかが分かる。   H. An input image signal, which is moving image data compressed and encoded by H.264 / MPEG-4 AVC or the like, is input to the variable-length moving image decoder 10, and a block encoding mode, motion compensation mode, motion vector amount, DCT coefficient Etc. are decoded. The motion vector extractor 20 extracts the motion vector amount of the block decoded by the variable length video decoder 10 and sends it to the second moving object estimator 50. Also, the coding mode extractor 30 extracts the block coding mode (see FIGS. 3 and 4) and sends it to the first moving object estimator 40. From this encoding mode, it can be seen which of the encoding modes shown in FIGS. 3 and 4 is used.

該符号化モード抽出器30で抽出された符号化モードがフレーム間予測符号化方式であった場合にはスイッチング手段45と55が第2移動物体推定器50に接続され、一方フレーム内予測符号化方式であった場合には、スイッチング手段45と55は図示の位置に接続される。   When the coding mode extracted by the coding mode extractor 30 is an inter-frame predictive coding method, switching means 45 and 55 are connected to the second moving object estimator 50, while intra-frame predictive coding. In the case of the system, the switching means 45 and 55 are connected to the illustrated positions.

第1の移動物体推定器40は、予測符号化モードおよび分割ブロックサイズに基づいて移動物体領域に含まれるブロックかどうかを推定する。また、第2移動物体推定器50は、該第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム間予測符号化モードのブロックに対して、各分割ブロックについて動きベクトルに基づいて移動物体領域かどうかを推定する。なお、該第1、第2の移動物体推定器40、50の動作の詳細は後述する。   The first moving object estimator 40 estimates whether the block is included in the moving object region based on the prediction encoding mode and the divided block size. Further, the second moving object estimator 50 uses the motion vector for each divided block for the block in the inter-frame prediction encoding mode estimated as a block included in the moving object region by the first moving object estimation means. Based on this, it is estimated whether it is a moving object region. Details of the operations of the first and second moving object estimators 40 and 50 will be described later.

最終移動物体判定器60は前記第1移動物体推定器40および第2移動物体推定器50の判定結果に基づいて、最終的な移動物体を判定する。該最終移動物体判定器60で判定された各分割ブロック毎の結果は、判定結果格納バッファ80に格納される。該判定結果格納バッファ80に格納されたデータは、前記第2移動物体推定器50における後続マイクロブロックおよび後続フレームの移動物体推定に利用される。また、該最終移動物体判定器60からは、移動物体の抽出結果が出力される。   The final moving object determination unit 60 determines the final moving object based on the determination results of the first moving object estimator 40 and the second moving object estimator 50. The result of each divided block determined by the final moving object determination unit 60 is stored in the determination result storage buffer 80. Data stored in the determination result storage buffer 80 is used for moving object estimation of subsequent micro blocks and subsequent frames in the second moving object estimator 50. The final moving object determination unit 60 outputs a moving object extraction result.

次に、本実施形態の前記符号化モード抽出器30、第1移動物体推定器40、第2移動物体推定器50の動作を、図5のフローチャートを参照して説明する。   Next, operations of the coding mode extractor 30, the first moving object estimator 40, and the second moving object estimator 50 of the present embodiment will be described with reference to the flowchart of FIG.

ステップS1では、符号化モード抽出器30で当該ブロックがフレーム内予測符号化(INTRA)モードであるか、フレーム間予測符号化(INTER)モードであるかの判断がなされる。フレーム内予測符号化モードであれば、制御信号70により、スイッチング手段45,55は図示の位置に、フレーム間予測符号化モードであれば、スイッチング手段45,55は第2移動物体推定器50に接続される。   In step S1, the coding mode extractor 30 determines whether the block is in the intra-frame predictive coding (INTER) mode or the inter-frame predictive coding (INTER) mode. In the case of the intra-frame predictive coding mode, the switching means 45 and 55 are moved to the position shown in the figure by the control signal 70. Connected.

ステップS1で当該ブロックの予測符号化モードがフレーム間予測符号化モードであると判定されると、ステップS2に進んで、第1移動物体推定器40により、当該ブロックのブロックサイズ≦Thr(INTER)であるかどうか判断される。この判断が肯定であればステップS4に進んでf=1と置かれ、否定であればステップS5に進んでf=0と置かれる。ここに、Thr(INTER)は予め定められている閾値、f=1は当該ブロックが移動物体であることを表し、f=0は非移動物体であることを表す。f=1、f=0の意味は、以下でも同様とする。   If it is determined in step S1 that the predictive coding mode of the block is the inter-frame predictive coding mode, the process proceeds to step S2 where the first moving object estimator 40 determines the block size of the block ≦ Thr (INTER). It is judged whether or not. If this determination is affirmative, the process proceeds to step S4 and f = 1 is set. If the determination is negative, the process proceeds to step S5 and f = 0 is set. Here, Thr (INTER) is a predetermined threshold value, f = 1 represents that the block is a moving object, and f = 0 represents a non-moving object. The meanings of f = 1 and f = 0 are the same in the following.

一方、ステップS1でフレーム内予測符号化モードであると判定されると、ステップS3に進んで、第1移動物体推定器40により、当該ブロックサイズ≦Thr(INTRA)であるかどうか判断される。この判断が肯定であればステップS6に進んでf=1と置かれ、否定であればステップS7に進んでf=0と置かれる。ここに、Thr(INTRA)は予め定められている閾値である。前記Thr(INTER)、Thr(INTRA)としては、例えば16×8画素モードあるいは8×16画素モードとすることができる。   On the other hand, if it is determined in step S1 that the mode is the intraframe prediction encoding mode, the process proceeds to step S3, and the first moving object estimator 40 determines whether or not the block size ≦ Thr (INTRA). If this determination is affirmative, the process proceeds to step S6 and f = 1 is set. If the determination is negative, the process proceeds to step S7 and f = 0 is set. Here, Thr (INTRA) is a predetermined threshold value. The Thr (INTER) and Thr (INTRA) can be, for example, a 16 × 8 pixel mode or an 8 × 16 pixel mode.

前記ステップS4でf=1と判定されたブロックは、ステップS8に進む。なお、該ステップS8以下の処理は、前記第2移動物体推定器50によって行われる。ステップS8では、当該ブロックが属するフレーム(現在フレーム)と参照フレームとの間に、別の動きフレームが存在するか否かの判断がなされる。すなわち、現在フレームがBピクチャフレーム(以下、単にBフレームと呼ぶ)であればこの判断は必ず否定になるが、現在フレームがPピクチャフレーム(以下、単にPフレームと呼ぶ)の場合には、Pピクチャフレームの前に非参照フレームであるBフレームが入る場合があるので、ケースバイケースで肯定になったり、否定になったりする。   The block determined as f = 1 in step S4 proceeds to step S8. Note that the processing after step S8 is performed by the second moving object estimator 50. In step S8, it is determined whether another motion frame exists between the frame to which the block belongs (current frame) and the reference frame. That is, if the current frame is a B picture frame (hereinafter simply referred to as a B frame), this determination is always negative, but if the current frame is a P picture frame (hereinafter simply referred to as a P frame), P Since a B frame, which is a non-reference frame, may be inserted before a picture frame, the result may be affirmative or negative on a case-by-case basis.

ステップS8の判断が肯定になると、ステップS9に進んで、直前のフレームの同一分割ブロックは移動物体であるか否かの判断がなされ、この判断が否定であればステップS10に進んでf=0と置かれ、肯定であればステップS11に進んでf=1と置かれる。   If the determination in step S8 is affirmative, the process proceeds to step S9 to determine whether or not the same divided block of the immediately preceding frame is a moving object. If this determination is negative, the process proceeds to step S10 and f = 0. If YES, the process proceeds to step S11 where f = 1 is set.

前記ステップS8、S9の処理をする理由は、次のためである。Pフレームのように、参照フレームとの間に1枚ないし複数枚のBフレームが存在する場合には、参照フレームとの時間的距離が長いため、フレーム間予測の予測精度が下がりやすくなるため、これを補うためにより小さなブロックサイズが選択されやすい。これにより、画面の背景領域においても、複雑な画像特徴がある箇所については、小さなブロックサイズが選択されることがある。そこで、直前のフレーム(一般には、Bフレーム)での同一分割ブロックにおける判定結果が非移動物体となっている場合は、該分割ブロックを非移動物体として推定する。   The reason why the processes of steps S8 and S9 are performed is as follows. When one or more B frames are present between the reference frame as in the P frame, the temporal distance from the reference frame is long, and therefore the prediction accuracy of inter-frame prediction is likely to decrease. To compensate for this, a smaller block size is likely to be selected. As a result, even in the background area of the screen, a small block size may be selected for a portion having a complicated image feature. Therefore, when the determination result in the same divided block in the immediately preceding frame (generally, B frame) is a non-moving object, the divided block is estimated as a non-moving object.

次に、前記ステップS8の判断が否定の場合またはステップS11でf=1と置かれた後には、ステップS12の処理に進む。ステップS12では、当該分割ブロックの動きベクトルと、その周囲の隣接分割ブロックX(例えば、上左、上、上右、右の4ブロック)との動きベクトル間角度θ(X)を計算する。ステップS13では、該角度θ(X)<Thrθなる隣接分割ブロックXが存在するかどうかの判断がなされる。ここに、Thrθは、隣接分割ブロックが別の動きをしているか否かを判断する境界となる閾値である。   Next, if the determination in step S8 is negative or after f = 1 is set in step S11, the process proceeds to step S12. In step S12, the motion vector angle θ (X) between the motion vector of the divided block and adjacent neighboring divided blocks X (for example, upper left, upper, upper right, and right four blocks) is calculated. In step S13, it is determined whether or not there is an adjacent divided block X satisfying the angle θ (X) <Thrθ. Here, Thrθ is a threshold value that serves as a boundary for determining whether or not the adjacent divided blocks are moving differently.

ステップS13で、前記角度θ(X)<Thrθなる条件を満足する隣接分割ブロックXが一つでも存在すれば、ステップS14に進んで、その隣接ブロックと同じ推定結果を出力する。すなわち、その隣接分割ブロックXが動物体であればf=1、非動物体であればf=0とする。一方、ステップS13で、前記角度θ(X)<Thrθなる条件を満足する隣接分割ブロックXが一つも存在しなければ、ステップS15に進んで、その隣接分割ブロックXとは異なる移動物体であると推定して出力する。すなわち、該隣接分割ブロックXが動物体であればf=0、非移動物体であればf=1とする。   If at least one adjacent divided block X satisfying the condition of the angle θ (X) <Thrθ exists in step S13, the process proceeds to step S14, and the same estimation result as that adjacent block is output. That is, if the adjacent divided block X is an animal body, f = 1, and if it is a non-animal body, f = 0. On the other hand, if there is no adjacent divided block X satisfying the condition of the angle θ (X) <Thrθ in step S13, the process proceeds to step S15, and the moving object is different from the adjacent divided block X. Estimate and output. That is, if the adjacent divided block X is a moving object, f = 0, and if it is a non-moving object, f = 1.

前記ステップS12〜S15の判断をする理由は、前記のように、小さなブロックサイズへの分割が発生する場合はエッジである可能性が高いため、非移動物体(背景)側の分割ブロックと移動物体側の分割ブロックの動きベクトルを比較すると、方向が大きく異なる場合が多い。したがって、分割ブロック単位で、動きベクトル間の角度が大きい場合、どちらかが移動物体他方が非移動物体であると考えられるからである。   The reason for the determination in steps S12 to S15 is that, as described above, when division into small block sizes occurs, there is a high possibility that it is an edge. Therefore, the divided blocks on the non-moving object (background) side and moving objects When the motion vectors of the divided blocks on the side are compared, the directions are often greatly different. Therefore, when the angle between motion vectors is large in divided block units, one of the moving objects is considered to be the other non-moving object.

次に、前記最終移動物体判定器60の動作を、図6のフローチャートを参照して説明する。ステップS20では、図5により得られた結果が、f=1であるか否かの判断をする。この判断が肯定の場合にはステップS22に進んで、最終的に当該ブロックが移動ブロックであると判断する。すなわち、F=1と置く。一方、ステップS20の判断が否定の時には、ステップS21に進んで、当該ブロックが移動物体に囲まれているか否かの判断をする。そして、移動物体に囲まれていれば、ステップS22に進んで、最終的に移動物体であると判断し、F=1とする。ステップS21の判断が否定の時には、最終的に非移動物体と判定し、F=0と置く。これらの結果は、前記判定結果格納バッファ80に格納されると共に、検出結果出力として出力される。   Next, the operation of the final moving object determination unit 60 will be described with reference to the flowchart of FIG. In step S20, it is determined whether or not the result obtained from FIG. 5 is f = 1. If this determination is affirmative, the process proceeds to step S22 to finally determine that the block is a moving block. That is, F = 1. On the other hand, when the determination in step S20 is negative, the process proceeds to step S21 to determine whether or not the block is surrounded by a moving object. If the object is surrounded by a moving object, the process proceeds to step S22, where it is finally determined that the object is a moving object, and F = 1 is set. When the determination in step S21 is negative, the object is finally determined as a non-moving object, and F = 0 is set. These results are stored in the determination result storage buffer 80 and output as detection result outputs.

次に、本発明の第2実施形態を、図2のブロック図を参照して説明する。この実施形態は、前記第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム内予測符号化モードのブロックに対して、前フレームにおける判定結果に基づいて移動物体領域かどうかを推定する第3移動物体推定器90を設けた点に特徴がある。他の符号は、図1の同一符号と同一または同等物を示す。また、これらは図1のものと同一または同等の動作をするので、該動作の説明は省略する。   Next, a second embodiment of the present invention will be described with reference to the block diagram of FIG. In this embodiment, whether or not the block in the intra-frame predictive coding mode estimated as a block included in the moving object region by the first moving object estimation means is a moving object region based on the determination result in the previous frame. This is characterized in that a third moving object estimator 90 is provided for estimating. Other reference numerals are the same as or equivalent to the same reference numerals in FIG. Also, since these operate the same or equivalent to those of FIG. 1, description of the operation is omitted.

小さいブロックサイズのフレーム内予測符号化が用いられている場合は、該分割ブロックが移動物体のエッジであり、かつその領域から移動物体が消失、もしくはその領域に向かって移動物体が移動しようとする動きを示していることが多い。そこで、前フレームからの動きを逆算した結果、移動物体が移動によってそのマクロブロックから消失したものと考えられる場合は、そのマクロブロックを非移動物体領域として推定する。   When intra-frame predictive coding with a small block size is used, the divided block is an edge of a moving object, and the moving object disappears from the area, or the moving object tries to move toward the area. Often shows movement. Therefore, when it is considered that the moving object has disappeared from the macroblock due to the movement as a result of the backward calculation of the motion from the previous frame, the macroblock is estimated as a non-moving object region.

すなわち、図7に示すフローチャートにおいて、前記ステップS6でf=1と置かれたブロックに対して、前記第3移動物体推定器90はステップS16以下の処理をする。なお、他のステップは、図5と同等または同一の処理を行うので、説明を省略する。   That is, in the flowchart shown in FIG. 7, the third moving object estimator 90 performs the processing from step S16 onward for the block in which f = 1 is set in step S6. The other steps are the same as or the same as those in FIG.

ステップS16では、前フレームでの動きを逆算する。ステップS17では、該逆算により、移動物体が移動によってそのブロックから消失したと考えられる場合には、そのブロックを非移動物体領域と推定し、ステップS19において、f=0と置く。一方、ステップS17の判断が否定の時には、ステップS18に進んでf=1とされる。   In step S16, the motion in the previous frame is calculated backward. In step S17, if it is considered that the moving object has disappeared from the block due to the movement, the block is estimated as a non-moving object region, and f = 0 is set in step S19. On the other hand, when the determination in step S17 is negative, the process proceeds to step S18 where f = 1.

また、前記ステップS16〜S19の処理に代えて、フレーム内予測符号化モードで符号化されているブロックに対して、前フレームの同一位置において移動物体として判定された分割ブロックを移動物体と推定するようにしても良い。   Further, instead of the processing in steps S16 to S19, a divided block determined as a moving object at the same position in the previous frame is estimated as a moving object with respect to a block encoded in the intraframe prediction encoding mode. You may do it.

次に、本発明による処理の具体例を、図8〜図10を参照して説明する。図8の100は1フレームの画像を示し、101,102,・・・,10Nは、マクロブロックを示す。図8の例は、左方向へ動いている自動車の例であり、自動車の輪郭の分割ブロックが図5のステップS2およびS3の判断により、動物体と判定され、背景は非動物体と判定さている例を示す。   Next, specific examples of processing according to the present invention will be described with reference to FIGS. In FIG. 8, 100 indicates an image of one frame, and 101, 102,..., 10N indicate macroblocks. The example of FIG. 8 is an example of an automobile moving in the left direction, and the divided block of the outline of the automobile is determined to be an animal body by the determination in steps S2 and S3 of FIG. 5, and the background is determined to be a non-animal body. An example is shown.

図9の例は、フレーム画像110の左側に家が存在し、家の庇や窓枠部分の分割ブロックが図5のステップS2またはS3の判断でf=1、すなわち移動物体であると判定されても、ステップS12〜S15の処理により非移動物体(f=0)と修正される例を示す。   In the example of FIG. 9, a house exists on the left side of the frame image 110, and it is determined that the divided block of the house fence and the window frame portion is f = 1, that is, a moving object in the determination of step S2 or S3 of FIG. However, an example in which the non-moving object (f = 0) is corrected by the processing of steps S12 to S15 is shown.

また、図10の例は、フレーム画像120が現在の画像フレームであり、図8のフレーム画像100がその1フレーム前の画像であった場合に、自動車が移動した後のマクロブロック121及び122は分割ブロックで表現され、図5のステップS3の判定ではf=1となるが、図7のステップS16〜S19の処理により、f=0に修正される場合を示す。なお、ブロック123の分割ブロックにはエッジが存在するので、該分割ブロックに関するステップS17の判断は否定となり、f=1は保持される。   In the example of FIG. 10, when the frame image 120 is the current image frame and the frame image 100 of FIG. 8 is an image one frame before, the macroblocks 121 and 122 after the automobile has moved are This is expressed as a divided block, and f = 1 in the determination in step S3 in FIG. 5, but is corrected to f = 0 by the processing in steps S16 to S19 in FIG. Since an edge exists in the divided block of the block 123, the determination in step S17 regarding the divided block is negative, and f = 1 is held.

本発明の第1実施形態の概略の構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a first embodiment of the present invention. 本発明の第2実施形態の概略の構成を示すブロック図である。It is a block diagram which shows the structure of the outline of 2nd Embodiment of this invention. H.264/MPEG−4 AVCにおけるフレーム間予測符号化で用いられるブロックサイズの説明図である。H. 2 is an explanatory diagram of a block size used in inter-frame predictive coding in H.264 / MPEG-4 AVC. H.264/MPEG−4 AVCにおけるフレーム内予測符号化で用いられるブロックサイズの説明図である。H. 2 is an explanatory diagram of a block size used in intra-frame predictive coding in H.264 / MPEG-4 AVC. 本発明の第1実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of 1st Embodiment of this invention. 最終移動物体判定器の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the last moving object determination device. 本発明の第2実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of 2nd Embodiment of this invention. 本発明による移動物体抽出の第1の具体処理例を示す説明図である。It is explanatory drawing which shows the 1st specific process example of the moving object extraction by this invention. 本発明による移動物体抽出の第2の具体処理例を示す説明図である。It is explanatory drawing which shows the 2nd specific process example of the moving object extraction by this invention. 本発明による移動物体抽出の第3の具体処理例を示す説明図である。It is explanatory drawing which shows the 3rd specific process example of the moving object extraction by this invention.

符号の説明Explanation of symbols

10・・・可変長動画像復号器、20・・・動きベクトル抽出器、30・・・符号化モード抽出器、40・・・第1移動物体推定器、50・・・第2移動物体推定器、60・・・最終移動物体推定器、80・・・判定結果格納バッファ、90・・・第3移動物体推定器。
DESCRIPTION OF SYMBOLS 10 ... Variable length moving image decoder, 20 ... Motion vector extractor, 30 ... Coding mode extractor, 40 ... 1st moving object estimator, 50 ... 2nd moving object estimation , 60 ... final moving object estimator, 80 ... determination result storage buffer, 90 ... third moving object estimator.

Claims (11)

分割ブロックサイズが可変のフレーム間予測符号化と、分割ブロックサイズが可変のフレーム内予測符号化を用いて符号化された動画像を入力として、動画像内の移動物体を抽出する移動物体抽出装置において、
予測符号化モードおよび分割ブロックサイズに基づいて移動物体領域に含まれるブロックかどうかを推定する第1の移動物体推定手段と、
該第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム間予測符号化モードのブロックに対して、各分割ブロックについて動きベクトルに基づいて移動物体領域かどうかを推定する第2の移動物体推定手段とを具備し、
前記第2の移動物体推定手段における判定結果に基づいて動画像内の移動物体を分割ブロック単位で抽出するようにしたことを特徴とする移動物体抽出装置。
Moving object extraction device for extracting moving object in moving picture by using moving picture encoded using inter-frame predictive coding with variable divided block size and intra-frame predictive coding with variable divided block size In
First moving object estimation means for estimating whether the block is included in the moving object region based on the predictive coding mode and the divided block size;
For the block in the inter-frame predictive coding mode estimated as a block included in the moving object region by the first moving object estimation means, the first moving object estimation unit estimates whether each divided block is a moving object region based on a motion vector. Two moving object estimation means,
A moving object extraction apparatus characterized in that a moving object in a moving image is extracted in units of divided blocks based on a determination result in the second moving object estimation means.
前記第1及び第2の移動物体推定手段において移動物体と推定された分割ブロックと、該分割ブロックによって囲まれている分割ブロックを移動物体として最終的に判定する最終移動物体判定手段をさらに具備したことを特徴とする請求項1に記載の移動物体抽出装置。 The apparatus further comprises a divided block estimated as a moving object in the first and second moving object estimation means, and a final moving object determination means for finally determining a divided block surrounded by the divided blocks as a moving object. The moving object extraction apparatus according to claim 1, wherein 分割ブロックサイズが可変のフレーム間予測符号化と、分割ブロックサイズが可変のフレーム内予測符号化を用いて符号化された動画像を入力として、動画像内の移動物体を抽出する移動物体抽出装置において、
予測符号化モードおよび分割ブロックサイズに基づいて移動物体領域に含まれるブロックかどうかを推定する第1の移動物体推定手段と、
該第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム間予測符号化モードのブロックに対して、各分割ブロックについて動きベクトルに基づいて移動物体領域かどうかを推定する第2の移動物体推定手段と、
前記第1の移動物体推定手段において移動物体領域に含まれるブロックとして推定されたフレーム内予測符号化モードのブロックに対して、前フレームにおける判定結果に基づいて移動物体領域かどうかを推定する第3の移動物体推定手段と、
前記第2及び第3の移動物体推定手段における判定結果に基づいて動画像内の移動物体を分割ブロック単位で抽出するようにしたことを特徴とする移動物体抽出装置。
Moving object extraction device for extracting moving object in moving picture by using moving picture encoded using inter-frame predictive coding with variable divided block size and intra-frame predictive coding with variable divided block size In
First moving object estimation means for estimating whether the block is included in the moving object region based on the predictive coding mode and the divided block size;
For the block in the inter-frame predictive coding mode estimated as a block included in the moving object region by the first moving object estimation means, the first moving object estimation unit estimates whether each divided block is a moving object region based on a motion vector. Two moving object estimation means;
A third moving object estimation unit estimates whether the block is in a moving object region based on a determination result in a previous frame with respect to a block in an intra-frame predictive coding mode estimated as a block included in the moving object region. A moving object estimation means,
A moving object extraction apparatus characterized in that a moving object in a moving image is extracted in units of divided blocks based on the determination results in the second and third moving object estimation means.
前記第1、第2及び第3の移動物体推定手段において移動物体と推定された分割ブロックと、該分割ブロックによって囲まれている分割ブロックを移動物体として最終的に判定する最終移動物体判定手段をさらに具備したことを特徴とする請求項3に記載の移動物体抽出装置。 A divided block estimated as a moving object in the first, second and third moving object estimating means, and a final moving object determining means for finally determining a divided block surrounded by the divided blocks as a moving object; The moving object extraction apparatus according to claim 3, further comprising: 前記第1の移動物体推定手段は、フレーム間予測符号化モードで符号化されたブロックに対して、分割ブロックサイズが一定のサイズ以下の場合に該ブロックを移動物体と推定することを特徴とする請求項1ないし4のいずれかに記載の記載の移動物体抽出装置。 The first moving object estimation means estimates a block as a moving object when a divided block size is equal to or smaller than a certain size with respect to a block encoded in an inter-frame prediction encoding mode. The moving object extraction device according to any one of claims 1 to 4. 前記第1の移動物体推定手段は、フレーム内予測符号化モードで符号化されたブロックに対して、分割ブロックサイズが一定のサイズ以下の場合に該ブロックを移動物体と推定することを特徴とする請求項1ないし4のいずれかに記載の移動物体抽出装置。 The first moving object estimation means estimates a block as a moving object when a divided block size is equal to or smaller than a certain size with respect to a block encoded in an intra-frame prediction encoding mode. The moving object extraction device according to claim 1. 前記第2の移動物体推定手段は、各分割ブロックに対して、全ての隣接分割ブロックとの動きベクトル間の角度が一定値以上である時に該分割ブロックについて隣接分割ブロックと異なる移動物体として推定することを特徴とする請求項5に記載の移動物体抽出装置。 The second moving object estimation means estimates each divided block as a moving object different from the adjacent divided block when the angle between motion vectors with all adjacent divided blocks is equal to or greater than a certain value. The moving object extraction apparatus according to claim 5, wherein 前記第2の移動物体推定手段は、フレーム間予測符号化モードで符号化されたブロックの各分割ブロックに対して、その隣接分割ブロックのうちのいずれかとの動きベクトル間の角度が一定値より小さい時に該ブロックを該隣接分割ブロックの推定結果と同じものとして推定することを特徴とする請求項5に記載の移動物体抽出装置。 In the second moving object estimation means, for each divided block of the block encoded in the inter-frame predictive encoding mode, the angle between the motion vectors with any of the adjacent divided blocks is smaller than a certain value. 6. The moving object extraction apparatus according to claim 5, wherein the block is sometimes estimated to be the same as the estimation result of the adjacent divided block. 前記第2の移動物体推定手段は、再生フレーム順序においてフレーム間予測符号化の参照フレームと該フレームの間に1つ以上のフレームが存在する場合、直前フレームの同一位置の分割ブロックが移動物体として判定された時に該分割ブロックを移動物体と推定することを特徴とする請求項5に記載の移動物体抽出装置。 The second moving object estimation means, when there is one or more frames between the reference frame of inter-frame predictive coding and the frame in the playback frame order, the divided block at the same position of the immediately preceding frame as the moving object 6. The moving object extracting apparatus according to claim 5, wherein when the determination is made, the divided block is estimated as a moving object. 前記第3の移動物体推定手段は、フレーム内予測符号化モードで符号化されているブロックに対して、前フレームの同一位置において移動物体として判定された分割ブロックを移動物体と推定することを特徴とする請求項6に記載の移動物体抽出装置。 The third moving object estimation means estimates a divided block determined as a moving object at the same position in the previous frame as a moving object with respect to a block encoded in the intra-frame prediction encoding mode. The moving object extraction device according to claim 6. 前記第3の移動物体推定手段は、フレーム内予測符号化モードで符号化されているブロックに対して、直前フレームの同一位置において移動物体として判定され、かつその動きベクトルから動きを逆算することによって移動物体が該分割ブロックから消失するものと推定可能な分割ブロックを非移動物体として推定することを特徴とする請求項6に記載の移動物体抽出装置。
The third moving object estimation means is determined as a moving object at the same position of the immediately preceding frame with respect to the block encoded in the intra-frame prediction encoding mode, and calculates the motion back from the motion vector. 7. The moving object extraction apparatus according to claim 6, wherein a divided block that can be estimated as a moving object disappearing from the divided block is estimated as a non-moving object.
JP2005050734A 2005-02-25 2005-02-25 Moving object extraction device Expired - Fee Related JP4573297B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005050734A JP4573297B2 (en) 2005-02-25 2005-02-25 Moving object extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005050734A JP4573297B2 (en) 2005-02-25 2005-02-25 Moving object extraction device

Publications (2)

Publication Number Publication Date
JP2006236063A true JP2006236063A (en) 2006-09-07
JP4573297B2 JP4573297B2 (en) 2010-11-04

Family

ID=37043635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005050734A Expired - Fee Related JP4573297B2 (en) 2005-02-25 2005-02-25 Moving object extraction device

Country Status (1)

Country Link
JP (1) JP4573297B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043222A (en) * 2010-08-19 2012-03-01 Univ Of Electro-Communications Moving object detection device, moving object detection method, and program
JP2014158164A (en) * 2013-02-15 2014-08-28 Mitsubishi Electric Corp Image encoder
JP2015507796A (en) * 2011-12-30 2015-03-12 インテル コーポレイション Object detection using motion estimation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043222A (en) * 2010-08-19 2012-03-01 Univ Of Electro-Communications Moving object detection device, moving object detection method, and program
JP2015507796A (en) * 2011-12-30 2015-03-12 インテル コーポレイション Object detection using motion estimation
US9525803B2 (en) 2011-12-30 2016-12-20 Intel Corporation Object detection using motion estimation
JP2014158164A (en) * 2013-02-15 2014-08-28 Mitsubishi Electric Corp Image encoder

Also Published As

Publication number Publication date
JP4573297B2 (en) 2010-11-04

Similar Documents

Publication Publication Date Title
EP1993292B1 (en) Dynamic image encoding method and device and program using the same
US8000393B2 (en) Video encoding apparatus and video encoding method
WO2006073116A1 (en) Video encoding method and device, video decoding method and device, program thereof, and recording medium containing the program
JP5248632B2 (en) Techniques for motion estimation
JP5426655B2 (en) Compressed video encoding device, compressed video decoding device, compressed video encoding method, and compressed video decoding method
JPWO2009037828A1 (en) Image coding apparatus and image decoding apparatus
KR20120139552A (en) Method and a digital video encoder system for encoding digital video data
TWI511531B (en) Video coding apparatus, video coding method, and video coding program
JP2012034225A (en) Motion vector detection device, motion vector detection method and computer program
JP4328000B2 (en) Moving picture coding apparatus and moving picture special effect scene detecting apparatus
JP2007096679A (en) Method of encoding and decoding moving picture
JP5748225B2 (en) Moving picture coding method, moving picture coding apparatus, and moving picture coding program
CN113613020A (en) Encoding and decoding method, device and equipment
JP4573297B2 (en) Moving object extraction device
US20090086821A1 (en) Image processing apparatus and method thereof
JP2009260421A (en) Moving image processing system, encoding device, encoding method, encoding program, decoding device, decoding method and decoding program
JP4677351B2 (en) Motion compensator, motion compensation processing method, computer program, and storage medium
JP3732760B2 (en) Object recognition apparatus and object recognition method
JP2008028707A (en) Picture quality evaluating device, encoding device, and picture quality evaluating method
JP4624308B2 (en) Moving picture decoding apparatus and moving picture decoding method
JP5727398B2 (en) Moving picture coding method, moving picture coding apparatus, and moving picture coding program
KR20070090494A (en) Inter frame error concealment method and apparatus using the average motion vector
JP2012124851A (en) Motion compensation encoder, motion compensation encoding method and program
KR101021538B1 (en) Fast Intra Mode Decision Method in H.264 Encoding
JP5693628B2 (en) Image decoding device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100602

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100811

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100812

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees