JP4408330B2 - 動画像内のロールテロップ検出装置および記録媒体 - Google Patents

動画像内のロールテロップ検出装置および記録媒体 Download PDF

Info

Publication number
JP4408330B2
JP4408330B2 JP2000396818A JP2000396818A JP4408330B2 JP 4408330 B2 JP4408330 B2 JP 4408330B2 JP 2000396818 A JP2000396818 A JP 2000396818A JP 2000396818 A JP2000396818 A JP 2000396818A JP 4408330 B2 JP4408330 B2 JP 4408330B2
Authority
JP
Japan
Prior art keywords
information
roll telop
roll
motion prediction
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000396818A
Other languages
English (en)
Other versions
JP2002199407A (ja
Inventor
晴久 加藤
康之 中島
広昌 柳原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2000396818A priority Critical patent/JP4408330B2/ja
Publication of JP2002199407A publication Critical patent/JP2002199407A/ja
Application granted granted Critical
Publication of JP4408330B2 publication Critical patent/JP4408330B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は動画像内のロールテロップ検出装置および記録媒体に関し、特に、圧縮符号化データそのもの又はその一部だけを復号した情報から、高速かつ高精度にロールテロップ領域を抽出できる動画像内のロールテロップ検出装置および記録媒体に関する。
【0002】
【従来の技術】
従来のテロップ検出方式としては、テロップ文字列のエッジ部を特徴量に利用した方式(以下、第1の検出方式)が報告されている。
【0003】
この第1の検出方式は、フレーム毎にエッジ部を検出し、テロップ出現位置の局所性や規則的な配置などの幾何的な特徴量からテロップを求める。個々のフレームから検出されたテロップ領域に対し、時間的に隣接する領域を対応付けることで連続したテロップとする。
【0004】
その他の検出方式としては、テロップと背景との境界部位に注目して、エッジ部の集中度を利用する方式、文字領域の色の均一性を背景部との分離に利用する方式などがある。さらに、これらの特徴量を組み合わせて総合的に判断する方法として、ニューラルネットワークや遺伝アルゴリズムを採用した検出方式が提案されている。
【0005】
以上のテロップ検出方式は映像の各画素から直接特徴量を求め、解析することでテロップを検出する方式である。
【0006】
一方で、圧縮符号化された動画像の符号化データそのものを利用する方式が提案されている。この方式は、圧縮の際に求められる各種のパラメータや符号化データを直接操作することでテロップ領域の検出処理を達成する。
【0007】
動き予測誤差の係数に注目した方式(以下、第2の検出方式)は、イントラフレームの符号単位ブロックについて文字領域の空間的特徴を観測し、静止テロップを検出する。ロールテロップに関してはハフ変換を利用し、連続するイントラフレーム間で静止テロップのパターンベクトルを計算し、相関が最も高い領域を抽出する。
【0008】
【発明が解決しようとする課題】
第1の検出方式を圧縮符号化された動画像データに適用するには、符号化データを一旦復号する必要がある。圧縮符号化データを画素領域の情報に戻さねばテロップ検出処理を適用できず、処理負荷の重い復号処理の後、初めて画素領域でのテロップ領域検出処理が施されることになる。
【0009】
動画像は非常に広い信号帯域を持ち膨大なデータ量を必要とするので、一般的に動画像は圧縮された形で記録や伝送に広く利用されている。そのため第1の検出方式では、本来の検出処理に加えて、圧縮データの復号処理に大きな計算コストがかかるという問題がある。
【0010】
一方、第2の検出方式は圧縮符号化データそのものを利用するので、復号処理過程が省略でき検出処理も高速に実行できる。しかし、実際の動画像ではパン、チルトなどのカメラワークやワイプ、ディゾルブなどの撮影後に編集された映像効果などの要因によって動き予測誤差情報の変化が激しく、テロップの出現との判別が難しい。特にシーンチェンジにおいてはこの影響が大きく、シーンチェンジ後のフレームをテロップ領域と誤認識するなど検出精度に問題がある。さらに、イントラフレーム情報のみによる検出方式であるため、検出領域の時間的解像度が低いという問題がある。
【0011】
また、前記第1、第2の検出方式はフレーム毎に文字領域を抽出し、該領域のフレーム間での対応付けから、結果として移動したテロップを認識する。移動するテロップの特徴量の一つである動き情報が一切利用されておらず、個々のフレームにおいては、あくまで静止したテロップという認識である。そのため、異なるテロップ同士を連結する恐れがあり、ロールテロップの検出という点からは検出精度に疑問が残る。
【0012】
本発明の目的は、前述した従来技術の問題点を解消し、圧縮された符号化データそのものまたはその一部だけを復号した情報から、ロールテロップの出現を高速かつ高精度に検出でき、またフレーム内でのロールテロップ位置を抽出できる動画像内のロールテロップ領域検出装置および記録媒体を提供することにある。
【0013】
【課題を解決するための手段】
前記した目的を達成するために、本発明は、圧縮された動画像データを入力とし、該動画像データにロールテロップ領域情報を付加して出力する動画像内のロールテロップ検出装置において、前記圧縮された動画像データを部分的に復号して符号化情報を出力する可変長復号部と、前記符号化情報及び予測位置情報の少なくとも一つをもとにロールテロップの位置情報と動き情報を抽出するロールテロップ検出処理部と、検出結果の前記位置情報と動き情報から将来の位置を推定し、予測位置情報を前記ロールテロップ検出処理部に戻すロールテロップ動き予測部とを具備し、前記ロールテロップ検出処理部は、前記符号化情報が動き予測情報を含む場合、該動き予測情報をもとに形成した部分領域をロールテロップの検出単位とするようにした点に特徴がある。
【0014】
この特徴によれば、ロールテロップの出現を高速かつ高精度に検出でき、またフレーム内でのロールテロップ位置を抽出できるようになる。
【0015】
また、本発明は、圧縮された動画像のデータを可変長復号することにより得られた符号化情報と予測位置情報をもとにロールテロップの位置情報と動き情報を抽出し、前記符号化情報が動き予測情報を含む場合、該動き予測情報をもとに形成した部分領域をロールテロップの検出単位とする第1の工程と、前記位置情報と動き情報から将来の位置を推定して予測位置情報を決定し、該予測位置情報を前記第1の工程に戻す第2の工程とを、コンピュータ読み取り可能な記録媒体に記録した点に特徴がある。
【0016】
【発明の実施の形態】
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明の動画像内のロールテロップ領域検出装置の一実施形態の構成を示すブロック図である。なお、「ロールテロップ」は、本発明では、移動するあるいはスクロールするテロップを意味する。また、この実施形態は入力動画像の符号化方式に国際標準であるMPEG-1ビデオ(ISO/IEC11172-2)を使用しているが、本発明はこれに限定されるものではない。
【0017】
システム全体の入力として圧縮符号化された動画像の符号化データaが与えられる。符号化データaは、可変長復号部1により必要な情報だけが部分的に復号され、符号化情報b、すなわち動き予測情報、動き予測誤差情報、および符号化モード情報が検出判定処理部2に送られる。検出処理判定部2は検出対象画像の符号化情報bと過去の検出結果からの予測位置情報dをもとに、圧縮符号化上のフレームの種類により最適なロールテロップ判定処理を行う。
【0018】
その検出結果情報cは外部へ出力されると同時に、次フレーム以降の検出処理判定に利用するため、ロールテロップ動き予測部3へ入力される。ロールテロップ動き予測部3では、検出判定処理部2からの確定済みのロールテロップ位置情報と動き情報をもとに、次フレーム以降での出現位置を予測する。予測位置情報dは前記符号化情報bと併せて前記ロールテロップ検出処理部2に入力される。
【0019】
次に、ロールテロップ検出処理部2の具体的構成を、図2を参照して説明する。ロールテロップ検出処理部2は、領域対象設定部21、時間的相関判定部22、領域形成部23、および形状判定部24から構成される。
【0020】
領域対象設定部21はロールテロップとしての必要最小限の特徴を備えるブロックだけを選別する。これは、最終的な検出対象となる部分領域を形成する処理負荷を抑える働きをする。時間的相関判定部22は過去及び未来の符号化情報を保持し、領域対象設定部21で選択されたブロックの時間的相関性を判断する。
【0021】
領域形成部23は領域対象設定部21で選別されたブロックに対し、動き予測情報をもとにクラスタリングを行い、ロールテロップの判定単位となる部分領域を形成する。領域形状判定部24は領域形成部23からの情報をもとに部分領域の幾何的形状からロールテロップとしての最終判断を下す。
【0022】
次に、前記領域対象設定部21の動作の詳細を、図3のフローチャートを参照して説明する。入力される情報は、現フレームの全ブロックの符号化情報bと過去の検出結果領域を現フレームに対応付けた予測位置情報dである。一方、出力情報は各ブロックを領域形成対象と非領域形成対象に選別した情報である。
【0023】
初めに、フレーム全体を動き予測情報が付加される最小単位のブロックに分割する。ステップS1では、ロールテロップ動き予測部3からの予測位置dに対応するブロックを領域形成対象に設定する。ステップS2では、前記符号化情報b中の符号化モード情報から、対象ブロックがフレーム内符号化ブロックか否か判定する。対象ブロックの符号化モードに対応した判定を用い、ロールテロップの一部に相応しいブロックを領域形成の対象として抽出する。
【0024】
フレーム内符号化ブロックであれば、ステップS3へ進み、フレーム内符号化情報の判定をする。フレーム内符号化ブロックでなければ、ステップS4に進み、対象ブロックが動き予測情報を持つか否か判定する。動き予測情報があれば、ステップS5に進んで、動き予測情報判定を行う。該動き予測情報がなければ、ステップS6に進んで非領域対象と設定する。
【0025】
前記ステップS2,S3における判定は、個々のブロックの符号化モード情報を参照することで高速に処理される。フレーム内符号化情報判定(ステップS3)と動き予測情報判定(ステップS5)は、それぞれフレーム内符号化情報と動き予測情報をもとにブロックが領域対象か否かを判定する。
【0026】
ステップS7で、フレーム内の全てのブロックに対し領域対象の判断が下されていなければ、ステップS2へ戻り判定処理を繰り返す。全ての予測領域に判断が下された後(ステップS7の判断が肯定)、領域対象の位置情報を出力すると共に領域対象設定部21の処理を終了する。
【0027】
図3の領域対象設定処理を簡略化するため、前記ステップS1における領域対象判定をロールテロップの移動方向の前後に位置するブロックのみに適用するのが好適である。すなわち、移動方向の前方と後方に位置するブロックに対して、ロールテロップ候補領域に属するか判断する。移動方向と垂直な方向に関しては判定は行わないようにする。
【0028】
前後ブロックがロールテロップ候補領域に属するには、該ブロックの動き予測情報の方向成分と長さ成分が、共に元となる候補領域のそれらと一致することを条件とする。ただし、動き予測情報はフレームの時間的相対位置によって長さが異なるため、フレーム間距離によって補正した値を利用する。条件を満たさないブロックは領域形成対象から外す。
【0029】
ロールテロップ領域の進行方向に対して後方に位置するブロックが対象領域に属さないと判断された場合、進行方向に隣接するブロックに対して同判定を行う。
この判定は、隣接ブロックまでの距離が動き予測情報の長さを超えるか、または領域に属するブロックが現れるまで繰り返す。
【0030】
逆に、進行方向に対して前方に位置するブロックが対象領域に属すると判断された場合は、進行方向に隣接するブロックに対して同判定を行う。隣接ブロックまでの距離が動き予測情報の長さを超えるか、または領域に属するブロックが現れるまで繰り返す。その他のブロックについては予測領域の情報をそのまま維持することで領域対象設定を完了する。
【0031】
次に、前記ステップS2におけるフレーム内符号化情報判定は、フレーム内符号化情報による判定を行う。フレーム内符号化情報が大きく存在する場合は領域対象に含め、一方、フレーム内符号化情報が小さく見積もられている場合は非領域対象とする。
【0032】
フレーム内符号化情報判定の一例を図4に示す。MPEG符号化方式ではフレーム内符号化情報に、DCT係数のDC成分、AC成分等を利用することができる。ステップS21では、例えば8×8画素からなる4組のブロック(1マクロブロック)のDCT係数の中から4つのDC成分を利用する。ブロック内の4つDC成分の最大値と最小値の差分値を求め、ダイナミックレンジとする。
【0033】
該DC成分のダイナミックレンジを予め定めた閾値thr1と比較し、該閾値以上の値を持つブロックをステップS22にて領域対象とする。そうでなければ、ステップS23へ進む。ステップS23では、AC成分の低周波成分寄りn個の部分和を計算し、該部分和を予め定めた閾値thr2と比較する。該部分和が閾値thr2以上であれば、ステップS22へ、そうでなければ、ステップS24へ進む。ステップS22,S24では該ブロックに対し、それぞれ領域対象、非領域対象と設定し、フレーム内符号化情報判定を終了する。
【0034】
次に、ステップS4における動き予測情報判定の詳細を説明する。該動き予測情報判定処理は、領域対象を有意な動き予測情報を持つブロックに限定する。動き予測情報を持たないブロックや、動き予測情報の長さ成分が閾値より小さなブロックは非領域対象とする。
【0035】
さらに、ロールテロップの動きはフレームに対して上下左右の4方向と仮定し、動き予測情報の方向成分が該上下左右のいずれか一つの方向だけを指すブロックを選択する。対角方向を指すブロックは非領域対象とする。
【0036】
また、両方向予測を用いるブロックについては、両方向とも前記の長さ判定と方向判定を満たすことを要件とする。その上で順方向予測と逆方向予測が相異なる方向を向くブロックを領域対象とし、そうでなければ、非領域対象とする。
【0037】
該ステップS4の動き予測情報判定の詳細を図5に示す。ステップS41は動き予測情報の長さ成分判定と方向性判定を一度に処理する。すなわち、動き予測情報の正確な長さは求めずに動き予測情報の水平若しくは垂直方向の長さの絶対値を求める。何れか一方が閾値thr3より大きな値を持つと同時にもう一方が0に十分近似できる場合、ステップS42へ進む。両成分が共に大きい又は共に小さい場合はステップS45へ進む。
【0038】
ステップS42では、符号化モード情報から両方向予測ブロックであるか否かを判断する。両方向予測ブロックであれば、ステップS44へ進み、片方向予測であれば、ステップS43へ進む。
【0039】
ステップS44では、順方向予測と逆方向予測が指す相対的方向を調べる。予測位置が同軸上に存在し且つ異符号からなる場合はステップS43へ、同軸上に存在しない又は同符号からなる場合はステップS45へ進む。ステップS43,S45では、該ブロックに対し、それぞれ領域形成対象、非領域形成対象と設定した後、動き予測情報判定を終了する。
【0040】
次に、図2の時間的相関判定部22の処理について説明する。時間的相関判定部22は、検出処理フレームの過去及び未来の複数フレームの符号化情報を入力し、ブロックの領域対象判定を行う。
【0041】
該時間的相関判定部22の詳細を図6に示す。該時間的相関判定部22は、前記領域対象設定部21で設定されたブロックについて、過去及び未来のフレームとの時間的相関を調査するため、ステップS51は領域対象ブロックか否かを調べる。領域対象ブロックであれば、ステップS52へ進み、非領域対象ブロックであれば、次のブロックを新たな対象としてステップS51に戻る。
【0042】
ステップS52は注目ブロックの動き予測情報から、過去及び未来のフレームでの参照位置を求める。参照位置は、動き予測情報をフレーム間距離で補正する。ステップS53は参照位置を占めるブロックの動き予測情報が対象ブロックの動き予測情報の方向と一致し、且つフレーム間距離で補正した長さと近似可能であるときステップS54へ、そうでなければステップS57へ進む。
【0043】
ステップS54は時間的相関判定の対象となる参照フレーム全てに対して判定処理が完了していれば、ステップS55へ進む。そうでなければ次の参照フレームを新たな対象としてステップS52へ戻る。処理ステップS55では、改めて該ブロックを領域対象と設定し、ステップS57はロールテロップ候補を無効にし非領域対象とする。
【0044】
フレーム内符号化フレーム間の時間相関判定は、過去の検出結果領域のDCT係数DC成分の配列を該フレーム中に一致する領域に求める。テロップ文字列とブロックとの相対的位置関係から生じるDC成分自体の変化を抑えるため、DC成分の値を異なる系列に変換してマッチングする。別空間へのマッピングは文字列の位置関係の不変性を利用し、DC成分の相対的変化に注目する。
【0045】
DCT成分を含む縦横それぞれ一列ずつのブロックを走査し、連続する2つのDC成分を比較する。走査順に差分値を粗く量子化した値に写像する。過去の検出結果の領域からも同様に写像を行い、進行方向の各ラインとブロック毎に積和演算を行い、総和を計算する。総和が最大となる領域を相関が最も高い領域と判断し、ロールテロップの候補とする。
【0046】
以上で、領域形成処理にかかる負荷を軽減するため、ロールテロップの一部となり得ないブロックを予め候補から外す時間相関判定部を終了する。
【0047】
次に、図2の領域形成部23の処理について説明する。該領域形成部23は、領域対象設定部で選別されたブロックを類似した動き予測情報を持つブロックから構成される領域に形成する。該領域形成部23の詳細を図7を参照して説明する。
【0048】
ステップS61は対象ブロックと非対象ブロックを選り分け、対象ブロックであれば、ステップS62へ進める。そうでなければ、次のブロックを新たな処理ブロックとしてステップS61に戻る。ステップS62は、領域対象となるブロックに注目したとき、近傍に領域形成対象ブロックが存在し、かつその動き予測情報の方向と長さ成分が十分に近似可能であるならばステップS63へ進む。
【0049】
ステップS63はブロックを同一領域と見なし結合する。近傍に領域形成対象が存在しない場合や、動き予測情報の方向成分若しくは長さ成分の何れか一つでも相違が見られるときは、異なる領域と判断し結合しない。
【0050】
ステップS64は、近傍の領域対象全てに対して再帰的に処理を行う。結合したブロックに対して、近傍に処理対象が存在すれば、ステップS62へ戻る。そうでなければ、ステップS65へ進む。
【0051】
ステップS65は全ての領域対象に対し、何れかの領域に属しているかを確認し、未だどの領域にも属していない領域対象があれば、ステップS61に戻る。全ての領域対象が領域を形成し終えた後、領域形成部は処理を終了する。
【0052】
次に、図2の領域形状判定部24について詳細に説明する。領域形状判定部24は、前記領域形成部23で形成された領域に注目して、幾何的形状からロールテロップの可能性を判断する。
【0053】
ステップS71の整形処理は、前記領域形成部23で作られた領域に対し、近傍に存在する複数のロールテロップ同士が連結した領域を分離する。領域が複数ラインから形成されている場合、領域の長辺方向に平行なラインに沿って領域内の動き予測誤差情報による部分和を求める。このとき動き予測誤差情報を持つ単位ブロックが空間解像度となる。複数の部分和の中で極端に値がかけ離れているラインについては連結ラインとして領域からラインごと排除し、1つの領域を複数領域に分割する。
【0054】
ステップS72は、構成要素数がある閾値thr4以下である小領域はノイズによる誤認識と判断し、ロールテロップ候補から除去する。また、構成要素数が閾値thr5以上の大領域は、パンやチルト等のカメラワークによるフレーム全体の見かけ上の移動と判断し、ロールテロップ候補から除外する。
【0055】
ステップS73は、ロールテロップの形状を長方矩形に限定し、最終的なロールテロップ領域を決定する。ロールテロップ判定は2つの判定から構成される。1つ目の矩形判定は外接矩形と領域の面積を比較し、十分1に近似できれば、矩形領域と判断し判定を続ける。面積に開きがあれば、ステップS76に進んで、ロールテロップと判定しないようにする。
【0056】
2つ目の長方矩形判定は領域の水平、垂直方向のフェレ径をそれぞれ求め、両者の比がある閾値thr6より大きければ長方矩形と判断しステップS74へ進む。そうでなければ、ステップS76へ進む。
【0057】
ステップS74は対象領域全体をロールテロップ領域と判定する。ステップS74はロールテロップ候補から除外する。ステップS75は全ての部分領域についてロールテロップ判定が下されていなければ、未判定領域についてステップS72から判定処理を実行させる。
【0058】
入力された部分領域について全て判定が下された後、確定したロールテロップ位置情報、動き情報を出力し、領域形状判定を終了する。
【0059】
次に、図1の前記ロールテロップ動き予測部3の動作を説明する。図9は、ロールテロップ動き予測部3の動作の詳細を示す。入力情報は過去のロールテロップ検出の結果と未来のフレーム符号化情報である。出力情報は次フレームでのロールテロップ位置と動き情報であり、領域対象設定部21(図2参照)で利用される。
【0060】
過去の参照フレームにおいて、確定済みのロールテロップ領域から現フレームでの位置を動き予測部3で推定し、該フレームでのロールテロップ候補領域とする。ロールテロップの動きを過去の確定したロールテロップ領域に属す動き予測情報を用い、ロールテロップの進行方向を推察する。
【0061】
ステップS81では、ロールテロップに該当するブロックの動き予測情報を水平と垂直方向に分解し、より大きな成分のみを抽出する。重み付け平均値を求め、上下左右の4方向のいずれかに決定する。ここでは、重み係数にDCT係数のAC部分和を利用する。
【0062】
ステップS81で求めた動き情報はフレームの時間的相対位置によって長さが変化するため、ステップS82において動き情報をフレーム間距離によって補正する。最後に予測位置情報と動き情報を出力し、ロールテロップ動き予測部を終了する。
[リアルタイム検出]
【0063】
未来のフレーム情報を未来の参照フレームひとつだけに限れば、完全な復号処理と同じ回路構成にできる。フレーム内符号化フレーム(Iピクチャ)が入力された場合は、フレーム内符号化情報を使って該フレームの領域対象を得る。
【0064】
順方向予測フレーム(Pピクチャ)が入力された場合は、動き予測情報若しくはフレーム内符号化情報を使って該フレームの領域対象を得る。両フレームは双方向予測フレームの未来参照フレームであるため、新たなフレーム内符号化フレーム又は順方向予測フレームが入力されるまで出力表示されない。よって、双方向予測フレーム(Bピクチャ)が入力されたとき、該フレーム自身の判定処理だけでなく、その符号化情報で未来参照フレームの時間相関判定を行う。逆に、未来参照フレームの符号化情報から未来方向の時間相関判定を行う。
【0065】
未来参照フレームから見れば、過去の双方向予測フレームによる時間相関判定が検出処理のための特別なメモリを用意することなく行うことが可能となる。双方向予測フレームにとっても未来参照フレームから復号すると同時に時間相関判定を行うことが可能である。
【0066】
よって、完全な復号処理と併用する場合においても、フレームの表示順序を乱すことなく、また、余分なフレーム情報を保持するメモリや機構を用意することなく、リアルタイムにロールテロップを検出し検出結果を復号映像へ投影することができる。
【0067】
次に、前記した各実施形態の動画像内のロールテロップ領域検出装置の機能は、ソフトウェア(プログラム)で実現することができる。該ソフトウェアは、光ディスク、フロッピーディスク、ハードディスク等の記録媒体に記録することができる。
【0068】
図10は、該記録媒体100に記録されるプログラムの一例を示すものであり、該記録媒体100には、ロールテロップの位置情報および動き情報の抽出機能111と、該位置情報および動き情報を基に予測位置情報を決定する機能112を含ませることができる。なお、前記記録媒100には、ネットワークのように、データを一時的に記録保持するような伝送媒体も含まれる。
【0069】
【発明の効果】
以上の説明から明らかなように、本発明によれば、圧縮符号化された動画像データを部分的に復号することで、従来の画素領域の検出方式(前記第1の検出方式)と比較して処理コストを抑えることができる。
【0070】
また、フレーム毎に対する判定は、検出対象の選別と過去の検出結果からの予測情報から必要最小限の領域に限定されるため、符号データ領域での検出方式(前記第2の検出方式)と同程度に処理コストを抑えることが可能である。
【0071】
また、フレーム内符号化フレームの情報だけでなく、全フレームの情報を検出過程に利用することで、前記第2の検出方式と比較して、時間解像度の向上は無論のこと、遥かに優れた検出精度の向上を達成することが可能となる。
【0072】
また、映像を再生する復号処理と完全に同期する方法では、未来との時間相関を利用しながら再生フレームとの遅延を一切省き、且つメモリの使用を最小限に抑えることが可能になる。
【図面の簡単な説明】
【図1】 本発明の一実施形態のロールテロップ検出装置の全体構成を示すブロック図である。
【図2】 図1のロールテロップ検出処理部の詳細な構成を示すブロック図である。
【図3】 図2の領域対象設定部の動作を示すフローチャートである。
【図4】 図3のフレーム内符号化情報判定の処理を示すフローチャートである。
【図5】 図3の動き予測情報判定の処理を示すフローチャートである。
【図6】 図2の時間的相関判定部の動作を示すフローチャートである。
【図7】 図2の領域形成部の動作を示すフローチャートである。
【図8】 図2の領域形状判定部の動作を示すフローチャートである。
【図9】 図1のロールテロップ動き予測部の動作を示すフローチャートである。
【図10】 記録媒体に記録されるプログラムの概要を示す図である。
【符号の説明】
1・・・可変長復号部、2・・・ロールテロップ検出処理部、3・・・ロールテロップ動き予測部、21・・・領域対象設定部、22・・・時間的相関判定部、23・・・領域形成部、24・・・領域形状判定部、100・・・記録媒体

Claims (11)

  1. 圧縮された動画像データを入力とし、該動画像データにロールテロップ領域情報を付加して出力する動画像内のロールテロップ検出装置において、
    前記圧縮された動画像データを部分的に復号して符号化情報を出力する可変長復号部と、
    前記符号化情報及び予測位置情報の少なくとも一つをもとにロールテロップの位置情報と動き情報を抽出するロールテロップ検出処理部と、
    検出結果の前記位置情報と動き情報から将来の位置を推定し、予測位置情報を前記ロールテロップ検出処理部に戻すロールテロップ動き予測部とを具備し、
    前記ロールテロップ検出処理部は、前記符号化情報が動き予測情報を含む場合、該動き予測情報をもとに形成した部分領域をロールテロップの検出単位とすることを特徴とする動画像内のロールテロップ検出装置。
  2. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記将来の位置との時間相関に基づき、予め部分領域の形成に不必要な要素を排除することを特徴とする動画像内のロールテロップ検出装置。
  3. 請求項1または2に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記部分領域が領域対象であるか否かの選別を、前記動き予測情報の方向成分がフレームに対して水平若しくは垂直方向を指すことを判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  4. 請求項1または2に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記部分領域が領域対象であるか否かの選別を、前記動き予測情報の水平成分、垂直成分の一方が0近似可能、かつ他方が十分な大きさを持つことを判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  5. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記動き予測情報が存在しない場合、前記部分領域が領域対象であるか否かの選別を、フレーム内符号化情報の複数のDCT係数DC成分のダイナミックレンジを判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  6. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記部分領域が領域対象であるか否かの選別を前記動き予測情報が近傍フレームの参照位置の動き予測情報と相関があることを判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  7. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記部分領域の結合を、構成要素の動き予測情報が同フレームの近傍構成要素の動き予測情報と相関があることを判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  8. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ検出処理部は、前記ロールテロップの検出を、部分領域の構成要素数と領域形状を判定基準に用いてすることを特徴とする動画像内のロールテロップ検出装置。
  9. 請求項1に記載の動画像内のロールテロップ検出装置において、
    前記ロールテロップ動き予測部は、動き予測誤差情報を信頼性情報とした動き予測情報とフレーム間距離とを基準に、ロールテロップの動きを推定することを特徴とする動画像内のロールテロップ検出装置。
  10. 圧縮された動画像のデータを可変長復号することにより得られた符号化情報及び予測位置情報の少なくとも一つをもとにロールテロップの位置情報と動き情報を抽出し、前記符号化情報が動き予測情報を含む場合、該動き予測情報をもとに形成した部分領域をロールテロップの検出単位とする第1の工程と、
    前記位置情報と動き情報から将来の位置を推定して予測位置情報を決定し、該予測位置情報を前記第1の工程に戻す第2の工程とからなる、
    コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  11. 請求項10に記載の記録媒体において、
    前記符号化情報が、動き予測情報、動き予測誤差情報、および符号化モード情報を含むことを特徴とする記録媒体。
JP2000396818A 2000-12-27 2000-12-27 動画像内のロールテロップ検出装置および記録媒体 Expired - Fee Related JP4408330B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000396818A JP4408330B2 (ja) 2000-12-27 2000-12-27 動画像内のロールテロップ検出装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000396818A JP4408330B2 (ja) 2000-12-27 2000-12-27 動画像内のロールテロップ検出装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2002199407A JP2002199407A (ja) 2002-07-12
JP4408330B2 true JP4408330B2 (ja) 2010-02-03

Family

ID=18862050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000396818A Expired - Fee Related JP4408330B2 (ja) 2000-12-27 2000-12-27 動画像内のロールテロップ検出装置および記録媒体

Country Status (1)

Country Link
JP (1) JP4408330B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4606802B2 (ja) * 2004-07-29 2011-01-05 日本電信電話株式会社 テロップ文字画像処理方法、装置及びプログラム並びに該プログラムを記録した記録媒体
WO2008050718A1 (fr) * 2006-10-26 2008-05-02 Nec Corporation Dispositif d'extraction d'informations de droit, procédé d'extraction d'informations de droit et programme
JP5397372B2 (ja) * 2008-04-22 2014-01-22 日本電気株式会社 テロップ移動ベクトル算出方法、装置及びプログラム

Also Published As

Publication number Publication date
JP2002199407A (ja) 2002-07-12

Similar Documents

Publication Publication Date Title
Sitara et al. Digital video tampering detection: An overview of passive techniques
KR100901904B1 (ko) 카메라 움직임 추정 방법 및 비디오 움직임 식별 장치
US7046731B2 (en) Extracting key frames from a video sequence
US7469010B2 (en) Extracting key frames from a video sequence
US7027509B2 (en) Hierarchical hybrid shot change detection method for MPEG-compressed video
Babu et al. A survey on compressed domain video analysis techniques
JP3363039B2 (ja) 動画像内の移動物体検出装置
US20060285596A1 (en) Motion-vector detecting device, motion-vector detecting method, and computer program
US20080043848A1 (en) Video/audio signal processing method and video/audio signal processing apparatus
JPH11252509A (ja) 動画像のカット点検出装置
US6823011B2 (en) Unusual event detection using motion activity descriptors
US20030123541A1 (en) Shot transition detecting method for video stream
EP1514242A2 (en) Unit for and method of estimating a motion vector
US7050115B2 (en) Wipe and special effect detection method for MPEG-compressed video using spatio-temporal distribution of macro blocks
JP4408330B2 (ja) 動画像内のロールテロップ検出装置および記録媒体
JP3948596B2 (ja) 動画像内の移動物体検出追跡装置
JP4537136B2 (ja) 動き推定方法及び動き推定装置、並びにプログラム
JP4349542B2 (ja) 動画像内のテロップ領域検出装置
JP3711022B2 (ja) 動画像内の特定物体認識方法及び装置
JP3332202B2 (ja) カメラワーク算出方法及び装置
JPH10112863A (ja) 動き被写体情報抽出方法及び装置
KR20020010847A (ko) 압축 비디오의 압축 영역에서의 카메라 움직임 검출 및분할방법
KR100671871B1 (ko) 압축영역에서의 움직임 벡터 해석방법
Chen et al. Rapid object tracking on compressed video
JPH10304371A (ja) 動きベクトル検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091109

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees