JP2009259244A - ビデオ・フレーム・シーケンスにおける関心領域の追跡方法 - Google Patents

ビデオ・フレーム・シーケンスにおける関心領域の追跡方法 Download PDF

Info

Publication number
JP2009259244A
JP2009259244A JP2009095237A JP2009095237A JP2009259244A JP 2009259244 A JP2009259244 A JP 2009259244A JP 2009095237 A JP2009095237 A JP 2009095237A JP 2009095237 A JP2009095237 A JP 2009095237A JP 2009259244 A JP2009259244 A JP 2009259244A
Authority
JP
Japan
Prior art keywords
frame
interest
region
search
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009095237A
Other languages
English (en)
Inventor
Premkumar Elangovan
プレムクマー・イランゴバン
Oliver Barton
オリバー・バートン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tektronix International Sales GmbH
Original Assignee
Tektronix International Sales GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tektronix International Sales GmbH filed Critical Tektronix International Sales GmbH
Publication of JP2009259244A publication Critical patent/JP2009259244A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • G06T7/238Analysis of motion using block-matching using non-full search, e.g. three-step search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

【課題】ビデオ・フレームのシーケンスにおける関心領域を短時間の処理時間で識別する。
【解決手段】ビデオ・フレームのシーケンスの第1フレームにおける関心領域を探す検索を実行し、シーケンスの次のフレームにおいて対応する関心領域を探す検索を実行する。次のフレームにおける検索は、第1フレームの検索が識別した関心領域のある第1フレーム内の範囲に関連する次のフレームの範囲にて開始することを特徴とする。
【選択図】図2

Description

本発明は、ビデオ・フレームのシーケンスにおける関心領域の追跡方法に関する。
ビデオ処理の分野において、ビデオ・フレーム自体又はビデオ・フレームのシーケンスの特性を判断又は評価する処理のために、ビデオ・フレーム自体又はビデオ・フレームのシーケンスを必要とする多くのアプリケーションがある。例えば、ビデオ・フレームは、処理動作に基づいて、インターレース(飛び越し走査)又はプログレッシブ(非飛び越し走査)に分類できる。多くのかかる動作において、関連情報を含んだフレームの一部のみを処理することにより、その結果(例えば、インターレース/プログレッシブの分類)を得ることができるので、フレーム全体を処理する必要がない。これは、関心領域(ROI:Region of Interested)処理として知られており、これを用いて、フレーム処理の結果を得るのに必要な処理時間を短縮する。関心領域は、ビデオ・フレームの内容に関係するか、又は、フィールド間の動き(inter-field motion)の如きフレームのアーティファクトに関係する。
典型的には、フレームのピクセルのブロックの1つ以上が、関心領域又はその一部を有することを示すいくつかの条件を満たすとみなせるまで、フレームのピクセルのブロックを順に処理することにより、関心領域を識別する。これらブロックは、例えば、4096個のピクセル(即ち、64ピクセル×64ピクセル)を含む矩形ブロックでもよい。図1に示すように、螺旋検索(追跡)方法をしばしば用いて、関心領域を識別するので、フレームの中心内又は中心に向かうブロックを初めの処理し、次に、広がる螺旋に沿ってブロックを処理する。
特開2007−148685号公報
ビデオ・フレームのシーケンス内の続くフレームにて関心領域を追跡(トラック)する際、典型的には螺旋検索方法を用いるが、これは、関心領域を識別するのに不必要に長い処理時間を要する。
本発明の第1の観点によれば、ビデオ・フレームのシーケンスにおける関心領域を追跡(検索)する方法を提供する。この方法は、シーケンスの第1フレームにおける関心領域を探す検索を実行するステップと、シーケンスの次のフレームにおいて対応する関心領域を探す検索を実行するステップとを具えている。そして、次のフレームにおける検索は、第1フレームの検索が識別した関心領域のある第1フレーム内の範囲(エリア)に関連する次のフレームの範囲にて開始することを特徴とする。
第1フレームの検索で識別された関心領域のある位置に対応する位置で、次のフレームの検索を開始してもよい。
関心領域が識別されると、第1フレームの検索を終了してもよい。
第1フレームの検索及び次のフレームの検索は、螺旋検索でもよい。
第1フレームの検索が終了したとき、第1フレームの検索の方向に対応する方向で、次のフレームの検索を開始してもよい。
好ましくは、第1フレーム及び次のフレームの各々のピクセルのブロックに関連して、これら第1フレーム及び次のフレームの検索を実行する。
本発明の第2の観点によれば、第1の観点による方法を実行するコンピュータ・プログラムを提供する。
よって、本発明は、ビデオ・フレームのシーケンスにおける関心領域を短時間の処理時間で識別できる。
以下、添付図を参照して、単なる例として、本発明の実施例を説明する。
既知の螺旋検索方法を示す図である。 ビデオ・シーケンスの第1ビデオ・フレームにおける関心領域を探すのに用いる螺旋検索を示す図である。 本発明の方法の実施例を用いて、次のフレームにおける図2の関心領域を探すのに用いる螺旋検索を示す図である。 本発明の方法の別の実施例を用いて、次のフレームにおける図2の関心領域を探すのに用いる螺旋検索を示す図である。
まず、既知の螺旋検索(追跡)方法を示す図1を参照する。この検索方法を用いて、ビデオ・フレームにおける相互フィールドの動きなどの関心領域を識別する。図1において、ビデオ・フレームを参照符号10で示す。このビデオ・フレームは、複数のブロック12で構成されていると考えられ、ブロックの各々は、多くのピクセルを有する。既知の螺旋検索方法においては、この検索は、ビデオ・フレームの中心内又は中心に向かうブロック14にて典型的には開始する。これは、関心領域がビデオ・フレーム10の外側部分よりも中心部分に配置されている可能性が高いためである。よって、適切なアルゴリズムを用いてピクセルの中心ブロック14を処理して、中心ブロックが関心領域を含んでいるか否かを判断する。関心領域が中心ブロック内に見つからないと、隣接ブロック16に進んで、隣接ブロックが関心領域を含んでいるか否かを判断する。図1に示す例において、ブロック16は、中心ブロック14の右に配置されているが、任意の隣接ブロックを処理のために選択してもよいことが明らかである。
関心領域がブロック16内に見つからないと、検索は方向を変え、実施例においてはブロック16の上にある別のブロック18に進む。関心領域がブロック18内に見つからないと、検索は、隣接ブロック20に移動して、そのブロック20を処理し、そこが関心領域を含んでいるか否かの判断を行う。ビデオ・フレーム10のブロックを順次処理し、関心領域が識別されるまで、検索方法が多くのブロックを介して外側に広がる螺旋に従い、関心領域が識別されたポイントで検索が停止する。代わりに、ビデオ・フレーム10内の更なる関心領域を識別するために検索が再開する前に、関心領域の位置を記録してもよい。
ブロック22、24、26、28で生じる如く、検索を行う螺旋経路がビデオ・フレーム10の端に達した場合、図1で点線40、42、44にて示す如く、螺旋経路が壊れていないように、検索は次の日検索ブロック内にて再開する。よって、ブロック22が処理されると、検索はブロック30に移動する。一方、ブロック24の処理の後に、ブロック36の処理が続く。
この螺旋検索方法は、1つ以上の関心領域を識別するために、単一のビデオ・フレームを処理する有効な方法である。しかし、第1フレーム内に関心領域を識別し、1つ以上の次のフレーム内にてその関心領域を追跡するために、ビデオ・フレームのシーケンスを処理しなければならない場合、関心領域を識別するために続くフレーム又はその各々の中心ブロックにて開始する螺旋検索を実行するには、不必要に長い時間がかかる。
関心領域がビデオ・フレームのシーケンス内で生じるほとんどの場合、複数のフレームの間の関心領域は、空間的に相関されている。すなわち、次のフレーム内の関心領域は、第1フレーム内の関心領域と同じ又は類似の範囲(エリア)内にある。ビデオ・フレームのシーケンスにおける連続するフレームは、一般的には、大きくは異ならない。シーケンスにおける連続フレームの間の関心領域の変動は、通常は小さい。本発明は、このような特性を用いて、ビデオ・シーケンスの次のフレームにおける関心領域を識別するのに要する時間を短縮する。よって、シーケンスを処理するのに必要な処理リソースと、この方法が動作する装置の電力消費を減らす。
本発明の方法において、関心領域を識別した前のフレームにおけるエリアに関連した次のフレームのエリア内の位置にて、次のフレームの検索(追跡)が開始する。この点を、図2及び図3を参照して説明する。
図2において、シーケンスにおける第1ビデオ・フレーム50で実行した螺旋検索は、ビデオ・フレーム50のブロック54における関心領域52を識別する。シーケンスの次のフレームの検索(追跡)を開始する位置を決定するのに用いるために、関心領域52の位置が記録される。
図3は、かかる次のフレーム60を示す。ここで、関心領域52がブロック62に移動している。第1フレーム50における関心領域52の位置に対応するポイント64にて、次のフレーム60の螺旋検索が開始する。
第1フレーム50における関心領域52を識別したときの螺旋検索の経路が上方向なので、次のフレーム60の螺旋検索が上方向に開始する。これは、関心領域52の移動方向に類似している。第1フレーム50における関心領域52が識別されたときの螺旋検索の経路が異なる方向ならば、次のフレーム60の螺旋検索は、好ましくは、その異なる方向で開始する。関心領域52がブロック62にて識別され、その位置が、シーケンスの次のフレームの検索を開始する位置を決定するのに用いるために、記録される。
代わりに、関心領域52が識別されたときに第1フレーム50の螺旋検索が続く方向にて、次のフレーム60の螺旋検索を必然的に開始する必要がない。例えば、この方法の実行を簡略化するために、次のフレーム60の螺旋検索は、同じ方向に、例えば、上方向に、常に開始してもよい。
図4は、本発明の方法の別の実施例を示す。ここで、関心領域52が第1フレーム50にて識別された正確な位置に対応する次のフレーム60の位置にて、次のフレーム60の螺旋検索が開始しないが、関心領域52が識別された第1フレーム50におけるエリアに関係する次のフレーム60のエリアにおいて開始する。この例において、関心領域52が識別された第1フレーム50の螺旋検索経路で更にわずかに後方の位置に対応するポイントを、次のフレーム60の検索が開始するポイント66として選択する。次のフレーム60の検索を開始するポイントとしてポイント66を選択する理由は、次の通りである。すなわち、第1フレーム50の検索により関心領域として不正確に識別された第1フレーム内に生じるアーティファクトが第2フレーム60の検索を「誤誘導」する可能性を低くするためである。次のフレームの検索は、図3の実施例よりも長い螺旋経路を追わなくてはならず、次のフレーム60でより多くのブロックを処理しなければならない。よって、第1フレーム50で不正確に識別されたアーティファクトを識別する前に、関心領域を正確に識別する可能性が高くなる。もちろん、わずかに延びた処理時間によって、次のフレーム60における関心領域を正確に識別する可能性が改善される。しかし、このわずかに延びた処理時間は、次のフレーム60の中心ブロックで開始する次のフレーム60の新たな螺旋検索を実行するのに必要な処理時間に比較すれば、依然として短縮している。
次のフレーム60の螺旋検索が開始する際のポイントとして選択されたポイント66は、関心領域52が識別された第1フレーム50のエリアに関連する次のフレーム60のエリア内の次のフレーム60内に任意のポイントでもよいことが理解できよう。例えば、第1フレーム50の螺旋検索が開始する位置を除いて、関心領域が識別された第1フレーム50の螺旋検索経路での任意の位置にポイント66が対応してもよい。
本発明のいずれの実施例においても、第1フレーム50の検索により識別された関心領域52が、第1フレーム50の検索が開始する位置よりも高い第1フレームの位置にあると、即ち、第1フレーム50内の関心領域52が第1フレーム50の中心ブロック14の上にあると、関心領域52は、次のフレーム60にて上方向に移動する。よって、次のフレーム60の検索は、第1フレーム50における関心領域52の位置に対応するポイントのわずかに上のポイントにて開始できるので、処理すべき次のフレーム60のブロックの数を減らすことができ、次のフレーム60での関心領域52を識別するのに要する時間を短縮できる。同様に、第1フレーム50の検索により識別された関心領域52が、第1フレーム50の検索が開始する位置よりも低い第1フレームの位置にあると、即ち、第1フレーム50内の関心領域が第1フレーム50の中心ブロック14の下にあると、関心領域52は、次のフレーム60にて下方向に移動する。よって、次のフレーム60の検索は、第1フレーム50における関心領域52の位置に対応するポイントのわずかに下のポイントにて開始できるので、処理すべき次のフレーム60のブロックの数を減らすことができる。
本発明により第1フレーム50及び次のフレーム60のブロックを処理するのに用いるアルゴリズム又は方法は、当業者に理解できるように、識別すべき関心領域の形式に応じて決まる。例えば、フィールド間の動きを識別するとき、フレームのトップ・フィールド及びボトム・フィールドの間の相関がとられる。
本発明の方法を螺旋検索に関連して説明したが、他の検索方法と連動して、ビデオ・フレームのシーケンスにおける関心領域を識別又は追跡するのに必要な処理時間を短縮できることが理解できよう。
10、50、60 ビデオ・フレーム
12、14、22、24、26、28、30、32 ブロック
52 関心領域
66 ポイント

Claims (1)

  1. ビデオ・フレームのシーケンスにおける関心領域を追跡する方法であって、
    上記シーケンスの第1フレームにおける関心領域を探す検索を実行するステップと、
    上記シーケンスの次のフレームにおいて対応する関心領域を探す検索を実行するステップとを具え、
    上記次のフレームにおける上記検索は、上記第1フレームの上記検索が識別した関心領域のある上記第1フレーム内の範囲に関連する上記次のフレームの範囲にて開始することを特徴とするビデオ・フレーム・シーケンスにおける関心領域の追跡方法。
JP2009095237A 2008-04-11 2009-04-09 ビデオ・フレーム・シーケンスにおける関心領域の追跡方法 Pending JP2009259244A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP08251407A EP2109081A1 (en) 2008-04-11 2008-04-11 A method of tracking a region of interest in a sequence of video frames

Publications (1)

Publication Number Publication Date
JP2009259244A true JP2009259244A (ja) 2009-11-05

Family

ID=39760725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009095237A Pending JP2009259244A (ja) 2008-04-11 2009-04-09 ビデオ・フレーム・シーケンスにおける関心領域の追跡方法

Country Status (2)

Country Link
EP (1) EP2109081A1 (ja)
JP (1) JP2009259244A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI420906B (zh) * 2010-10-13 2013-12-21 Ind Tech Res Inst 興趣區域之追蹤系統與方法及電腦程式產品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097632A (ja) * 1996-09-20 1998-04-14 Fujitsu General Ltd 物体の移動追跡方法
JP2006228061A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 顔追跡プログラムおよび顔追跡方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097632A (ja) * 1996-09-20 1998-04-14 Fujitsu General Ltd 物体の移動追跡方法
JP2006228061A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 顔追跡プログラムおよび顔追跡方法

Also Published As

Publication number Publication date
EP2109081A1 (en) 2009-10-14

Similar Documents

Publication Publication Date Title
Liu et al. Adaptive nms: Refining pedestrian detection in a crowd
JP2010191955A (ja) 画像のシーケンスを処理する方法および装置、記憶媒体ならびに信号
JP2001285712A (ja) Mpeg圧縮ビデオ環境でのディゾルブ/フェード検出方法
US20130113999A1 (en) Methods, systems, and computer-readable media for detecting scene changes in a video
CN112929755B (zh) 进度拖动过程中的视频文件播放方法及装置
CN105898538A (zh) 用于安卓平台的播放方法、装置及移动终端设备
US20100150462A1 (en) Image processing apparatus, method, and program
CN106210908A (zh) 一种广告推送方法及装置
JP2009259244A (ja) ビデオ・フレーム・シーケンスにおける関心領域の追跡方法
JP2009093250A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US20060110057A1 (en) Method and system for detecting black frames in a sequence of frames
US10536713B2 (en) Method and apparatus for determining motion vector in video
JP2012023734A (ja) ファイル位置高速検索方法
CN104834728B (zh) 一种订阅视频的推送方法及装置
JP2003530028A (ja) テキスト検出
Nguyen et al. Hig: Hierarchical interlacement graph approach to scene graph generation in video understanding
CN101924933A (zh) 跟踪视频帧序列中感兴趣区域的方法
JP5176487B2 (ja) 映像文字検出装置、映像文字検出方法、および映像文字検出プログラム
JP2023539273A (ja) 対象の追加方式を決定するための方法、装置、電子機器及び媒体
JP4250598B2 (ja) 動き補償型ip変換処理装置及び動き補償型ip変換処理方法
JP4895315B2 (ja) 動画像のカット点検出装置
JP4930364B2 (ja) 映像文字検出方法、装置、およびプログラム
US8732137B2 (en) Separating content from noisy context in template-based documents for search indexing
JP2005004770A (ja) グループ化による映画映像検出方法及び装置
CN110969157B (zh) 识别感兴趣的区域

Legal Events

Date Code Title Description
A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20110218

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120417

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120731