JP2008527525A

JP2008527525A - グラフィカルなオブジェクトを検出するための方法及び電子装置

Info

Publication number: JP2008527525A
Application number: JP2007549987A
Authority: JP
Inventors: アフメトエキン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2005-01-07
Filing date: 2006-01-02
Publication date: 2008-07-24
Also published as: KR20070112130A; CN101103376A; WO2006072896A2; WO2006072896A3; EP1839122A2; US20080044102A1

Abstract

画像中のグラフィカルなオブジェクトを検出する方法は、前記グラフィカルなオブジェクトを含み得る前記画像のオブジェクト領域３１、３３、３７及び３９における特徴の第１の値を決定するステップと、前記グラフィカルなオブジェクトを含み見込みの低い前記画像の基準領域３２及び３８における特徴の第２の値を決定するステップと、前記第１の値と第２の値との差が特定の閾値を超えるか否かに依存して、オブジェクト領域３１、３３、３７及び３９が前記グラフィカルなオブジェクトを含むか否かを決定するステップと、を有する。電子装置は、本発明の方法を実行するように動作可能な電子回路を有する。

Description

本発明は、例えばビデオシーケンス中のチャネルのロゴのような、画像中のグラフィカルなオブジェクトを検出する方法に関する。

本発明は更に、プログラム可能な装置が、画像中のグラフィカルなオブジェクトを検出する方法を実行するように動作可能とするソフトウェアに関する。

本発明はまた、画像中のグラフィカルなオブジェクトを検出するための電子装置に関する。

本発明は更に、画像中のグラフィカルなオブジェクトを検出するための電子装置における使用のための電子回路に関する。

斯かる方法の例は、米国特許ＵＳ６１００９４１に記載されている。米国特許ＵＳ６１００９４１に記載された方法は、ビデオシーケンス中の静的なロゴを検出する。該方法は、ビデオのフレームの四隅におけるフレーム差分絶対値を利用する。四隅が変化のない多くの画素を示す（ゼロの差分値を持つものとして測定される）場合、アルゴリズムはこれらセグメントがロゴに対応すると推定する。本既知の方法の欠点は、場面に動きがあるまで、ロゴが検出されることができないという点である。

本発明の第一の目的は、動きのない場面における、例えばロゴのようなグラフィカルなオブジェクトを検出することができる、最初のパラグラフにおいて記載された種類の方法を提供することにある。

本発明の第２の目的は、動きのない場面における、例えばロゴのようなグラフィカルなオブジェクトを検出することができる、最初のパラグラフにおいて記載された種類の電子装置を提供することにある。

第１の目的は、本発明により、前記方法が、前記グラフィカルなオブジェクトを含み得る前記画像のオブジェクト領域における特徴の第１の値を決定するステップと、前記グラフィカルなオブジェクトを含み見込みの低い前記画像の基準領域における特徴の第２の値を決定するステップと、前記第１の値と第２の値との差が特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むか否かを決定するステップと、を有することにより達成される。例えばＴＶロゴ又は他の重畳されたグラフィカルなオブジェクトのようなグラフィカルなオブジェクトを、場面からの（色のような何らかの特徴空間における）逸脱としてモデル化することにより、時間的な（静止画／動画）推定は為されることがなく、それ故グラフィカルなオブジェクトが動きのない場面において検出されることができる。ロゴを迅速に見つけ出すことは、幾つかのコマーシャル検出器において重要である。ユーザが新しいチャネルに同調した場合、堅固なコマーシャル検出性能を提供することを可能とするため、ロゴの迅速な検出が必要である。利用可能である場合には、時間的な情報が、付加的にロゴ検出器に組み込まれても良い。

更なる利点として、本発明の方法は、透明なロゴ及び動画のロゴを検出するために利用されることができる。幾つかのタイプのロゴがある。動きの特徴の点では、ロゴは静的であり得るし、又は動画（ロゴが移動するか、又はロゴの色／強度特性が変化する）でもあり得る。不透明さの点で言えば、ロゴは不透明であり得るし、又は透明でもあり得る。既存のロゴ検出器の圧倒的多数は、ロゴが静的且つ不透明であること、又はせいぜい少し透明であることを仮定している。本発明の方法は、そう仮定しない。更なる利点として、本発明の方法は、１６：９フォーマットから４：３フォーマットへの変換に利用される垂直／水平方向の黒いバーのような、完全に静的なセグメントに挿入されたロゴや、強度／色の特性が周期的に変化するロゴを検出する。

本発明の方法は、米国特許ＵＳ６１００９４１に記載されたコマーシャル検出、及び／又は米国特許出願公開ＵＳ２００３／００９１２３７に記載されたコマーシャル識別のために利用されることができる。米国特許ＵＳ６１００９４１及び米国特許出願公開ＵＳ２００３／００９１２３７は、ここで参照により本明細書に組み込まれたものとする。ＴＶロゴの検出は、内容理解及び表示保護のために必須である。前者のためには、ＴＶロゴの寿命が、コマーシャルセグメントを識別するための貴重な手掛かりである。なぜなら、コマーシャルは通常、チャネルのロゴが消えることに帰着するからである。後者は、主として非ＣＲＴディスプレイを焼き付けから防ぐことを目的とする。焼き付け問題は、ディスプレイがスイッチオフされた後でさえも、ディスプレイ上に長時間の静的な場面がゴースト的に出現することである。このことは、ディスプレイの化学的な特性における永続的な変形により引き起こされ、当該ディスプレイを新しくすることを必要とする。チャネルのロゴの幾つかの又は全ての画素は同じ位置に留まるため、ロゴ検出は、焼き付け保護アルゴリズムの動作領域を特定することを支援することができる。

本発明の方法の実施例においては、前記第１の値は、前記オブジェクト領域における複数の画素の値を表し、少なくとも一定量の前記複数の画素の値と前記第２の値との差が前記特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むと決定される。画素の群（例えばヒストグラム値）ではなく個々の画素について、該画素の値と第２の値との間の差が特定の閾値を超えているか否かを決定することによって、より正確なロゴ検出が達成される。第２の値との間の差が特定の閾値を超えている個々の画素は、異常値（outliers）とも呼ばれる。

本方法は、値が前記特定の閾値を超える画素の空間的な分布がグラフィカルなオブジェクトの典型的な分布と一致するか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むと決定しても良い。グラフィカルなオブジェクトについて場面からの他の逸脱を誤認することを防ぐため、異常値の空間的な分布が、グラフィカルなオブジェクトの典型的な分布と照合される。

前記特徴は色であっても良い。このことは、殆どのロゴはカラーで出現し、コンテンツから容易に区別されるという事実のため、有利である。

前記第２の値は、前記基準領域の確率密度関数を表すものであっても良い。確率分布関数（ｐｄｆ）は、例えば色又はテクスチャのような、幾つかの選択された特徴空間において、エンティティをモデル化するために有用であることが分かっている。

前記第２の値は、前記基準領域のノンパラメトリック確率密度関数を表すものであっても良い。パラメトリックモデルは強力な密度推定法であるが、推定されたｐｄｆについて、「通常の分布」のような仮定を為す。ロゴの特徴及びｐｄｆはチャネル毎に変化するため、このことは不利である。それ故、ｐｄｆの形状について仮定を行わず、いずれのタイプのｐｄｆをもモデル化することができる、ノンパラメトリック密度推定が利用される。

前記基準領域の確率密度関数を推定するため、ヒストグラムが利用されても良い。ヒストグラムは、強力なノンパラメトリック推定法であることが分かっている。

前記画像は少なくとも９個の領域を有しても良く、前記９個の領域のうち４個が隅領域であり、前記オブジェクト領域は前記４個の隅領域のうち少なくとも１つを有しても良い。黄金分割律（Golden Section Rule（ＧＳＲ）、G. Millersonによる「The technique of television production」（第１２版、Focal、New York、1990年３月）を参照のこと）は、専門家に広く利用されている映画の手法であり、３：５：３の割合でのフレームの水平及び垂直の分割と、ＧＳＲ線の交点に主要なオブジェクトを配置することとを推奨している。本発明者は、フレームが黄金分割律を利用して分割された場合、ロゴはしばしばフレームの隅領域に配置されることを認識した。

本方法は、前記第２の値は前記基準領域のサブ領域について決定しても良く、ここで前記オブジェクト領域及び前記サブ領域は比較的互いに近い。オブジェクト領域及び基準領域は、好ましくは互いに対して比較的近い。基準領域が大きい場合、オブジェクト領域に比較的近い、より小さなサブ領域を利用することが有利である。このことは、オブジェクト領域と基準領域との、より正確な比較を可能とする。個々の画素の値が第２の値と比較される場合、異なる個々の画素については、サブ領域が異なっても良い。サブ領域は、オブジェクト領域に近い基準領域における画素の値により高い値を付与し、オブジェクト領域に近くない基準領域における画素の値を除去することにより、生成されても良い。

第２の目的は、本発明により、電子装置が、前記グラフィカルなオブジェクトを含み得る前記画像のオブジェクト領域における特徴の第１の値を決定し、前記グラフィカルなオブジェクトを含み見込みの低い前記画像の基準領域における特徴の第２の値を決定し、前記第１の値と第２の値との差が特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むか否かを決定するように動作可能な電子回路を有することにより達成される。

本発明の装置のこれら及び他の態様は、図面を参照しながら更に説明され明らかとなるであろう。

図面内の対応する要素は、同一の参照番号により識別される。

本発明の、画像における（重畳された）グラフィカルなオブジェクトを検出する方法（図１を参照）は、ステップ１、３及び５を有する。ステップ１は、画像のオブジェクト領域における特徴の第１の値を決定するステップを有し、オブジェクト領域は（重畳された）グラフィカルなオブジェクトを含み得る。ステップ３は、画像の基準領域における特徴の第２の値を決定するステップを有し、基準領域は（重畳された）グラフィカルなオブジェクトを含む見込みが低い領域である。ステップ５は、オブジェクト領域が（重畳された）グラフィカルなオブジェクトを含むか否かを、第１の値と第２の値との差が特定の閾値を超えているか否かに依存して決定するステップを有する。第１及び／又は第２の値は、画像を分析することにより、又は画像を分析した電子装置から受信されたデータ（第１及び／又は第２の値を含むデータ）を処理することにより決定されても良い。

本方法の実施例においては、チャネルロゴがフレームの隅に配置されていることを仮定する。それぞれの隅について、それぞれの隅の近隣の画素を利用することにより、１つの場面モデルが推定される。黄金分割律（ＧＳＲ）が隅及びその近隣を定義するために利用される。なぜならＧＳＲは、専門家により広く適用されている映画の手法であるからである。ＧＳＲは、３：５：３の割合でのフレームの水平及び垂直の分割と、ＧＳＲ線の交点（又は場面中の単一のオブジェクトについては中央の領域）に主要なオブジェクトを配置することとを推奨している。ＣＮＮからキャプチャされたコンテンツ（図３に示される）は、２つのオブジェクトの頭部が交点にあるため、完全にＧＳＲに従っている。

図４に示されるように、左上から右下へのラスタ走査により、領域は１から９まで番号を付与されることができる。殆どの場合において、ロゴは領域１、３、７及び９（図３の領域３１、３３、３７及び３９）にのみ出現する見込みが高い。本実施例において、領域１及び３（図３の領域３１及び３３）の場面モデルは領域２（図３の領域３２）における画素から計算され、領域７及び９（図３の領域３７及び３９）の場面モデルは領域８（図３の領域３８）における画素から計算される。中央の水平方向の領域４、５及び６からの画素は本実施例においては利用されないが、代替の実施例においては利用されても良い。例えば、領域３、６及び９をカバーする、起立している人間のような垂直方向のオブジェクトは、領域６からの画素が基準として利用される場合にのみ、ロゴから区別され得る。水平方向及び垂直方向の中央の領域が、例えばそれぞれの隅領域についての２つの基準ヒストグラム（一方が例えば２及び８のような水平方向の領域から、他方が例えば４及び６のような垂直方向の領域からのもの）のように、共に利用されても良い。

しかしながら、本実施例においては、四隅のそれぞれについて、１つの場面ヒストグラムが定義される（領域１、３、７及び９について、それぞれＨ_１、Ｈ_３、Ｈ_７及びＨ_９の合わせて４つのヒストグラム）。４つの異なるヒストグラムを定義する理由は、色の特性が、上下又は左右で著しく変化することである。各ヒストグラムは、同じ行の中央のエリアにおける画素を利用することにより構築される。例えば、それぞれ領域１及び３のヒストグラムであるＨ_１及びＨ_３は領域２からの画素のみを利用し、それぞれ領域７及び９のヒストグラムであるＨ_７及びＨ_９は領域８からの画素から構築される。ロゴ領域からの水平方向の距離に基づいて画素を重み付けするため、ガウス核が水平方向に適用される。１次元ガウス核が垂直方向のＧＳＲ線においてセンタリングされ、領域２及び８の水平方向の中央位置と一致するように３σ値が計算される。中央の領域において全ての画素について１つの代わりに、画素の重みが色ヒストグラムに加算される。結果として、各ヒストグラムは、それぞれの隅からの水平方向の距離を増大させることにより、減少させる寄与を得る。最後に、ヒストグラムが正規化される。本実施例においては、領域２及び８における全ての線が利用される。

代替の実施例においては、ヒストグラムは現在の画素の近隣の線のみを利用して構築されても良い。このことは、ハードウェア実装のために好適である。更に、このことはロゴと同じ色を持つ遠くの画素を無視するための堅固な方法となり得る。

個々のロゴ画素を識別するため、場面モデルからの逸脱が決定される。サンプルにおける異常値を識別する方法の１つは、Ｎ番目のパーセンタイル値を超える値を異常値と定義することである。本実施例においては、サンプル空間は、対応するロゴエリアの色場面モデルに対する、ロゴエリア中の画素の色距離である。図５の式５１において、ｄ_ｉ（ｘ，ｙ）は、輝度Ｙ_ｘｙ並びに色差Ｃ_Ｂｘｙ及びＣ_Ｒｘｙを持つ画素（ｘ，ｙ）の、ｉ番目の場面モデルＨ_ｉに対する色距離である。関数Ｑ_ｉ（）は、入力輝度−色差値のｉ番目のヒストグラムインデクスを計算し、Ｈ_ｉ（ｋ）は以前に計算されたｉ番目のヒストグラム（場面モデル）のヒストグラムエントリである。原則として、距離値はＮ番目のパーセンタイル値を計算するために保存されるべきであり、ロゴ画素の候補がＮ番目のパーセンタイル値（閾値）を超えるものとして定義される。しかしながら、このことは、例えばハードウェアの制約により修正されても良い。距離値の全てを保存するためのメモリのコストを回避するため、距離値は量子化されても良く、距離ヒストグラムが利用されても良い。同様に重要な理由は、ロゴはＮ番目のパーセンタイル値を超える画素の数よりも多い画素を持ち得るという点である。量子化された距離のＮ番目のパーセンタイル値が最初に計算されるが、最も大きな量子化された距離がヒストグラムのエントリ数の（１００−Ｎ）％よりも多い画素を持つためにＮ番目のパーセンタイル値が正確に見出され得ない場合には、最も大きな量子化された距離を持つ全ての画素が異常値として定義される。

代替の実施例においては、領域１、３、７及び９における各画素について、画素の色を利用して、それぞれのヒストグラム即ちＨ_１、Ｈ_３、Ｈ_７及びＨ_９におけるエントリをそれぞれ考慮することにより、ヒストグラムのビン値が計算される。ヒストグラム中のエントリが所定のパラメータ（閾値）Ｔ＿ＭｉｎＳｃｅｎｅＥｎｔｒｙよりも低い場合に、該画素が異常値（グラフィック又は場面からの逸脱）として定義される。大きい場合には、該画素は場面の画素（黒）として識別される。実験において、Ｔ＿ＭｉｎＳｃｅｎｅＥｎｔｒｙとして値０．０１が堅固な性能に帰着した。該処理の結果はバイナリの画像であり、場面からの逸脱は白に割り当てられ、場面の画素は黒に割り当てられる。図７は、場面（図６を参照）からの逸脱が白に割り当てられ、場面の画素が黒に割り当てられた画像の例を示す。図７において示される画像の殆どが黒であるが、チャネルロゴは明らかに識別可能である。

提案されるロゴ検出アルゴリズムの最終段階は、異常値の空間的な分布の、典型的なロゴ画素の分布との照合である。チャネルのロゴのテキスト内容に依存して、ロゴ画素の空間的な分布は変化を示す。図３におけるＣＮＮのロゴのような文字から成るロゴは、分離した繋がっていない異常値画素に帰着するが、絵入りのロゴは通常、他の異常値の塊よりもかなり大きな単一の塊に帰着する。前者のタイプのロゴは、２段階の垂直／水平投射を利用することにより検出されることができ、後者のタイプのロゴは、他の塊よりもかなり大きなサイズを持つ塊を識別することにより検出されることができる。両方の場合において、候補となる領域は、特定の形態的な制約を従うようにされる。

ロゴを識別するため、幾つかのノイズ除去手法とともに、モルフォロジー演算が適用される。最初に、非常に大きい数の白の画素を持つ全てのノイズの多い線が除去される。なぜなら、これら線は、場面において明確に識別可能なロゴが存在する場合には、予期されないからである。更に、フレーム境界において出現し得る、全ての黒の境界が除去される。第１の又は第２のタイプのロゴが存在するか否かを決定するために、大きなパーセンテージの白の画素（例えば８０％）を囲む長方形であるＲＯＩが計算される。ＲＯＩにおいて、最も大きいサイズの繋がった構成要素の、他の全てのセグメントの平均サイズに対する比率が計算される。該比率はピーク比率と呼ばれ、ピークの強度の指標となる。該比率が大きければ、第１のタイプのロゴが存在する。そうでなければ、第２のタイプのロゴが存在する。次いで、密集度（充填比）、アスペクト比、境界に対する接近度及びサイズのような幾つかの特徴が計算され、フレーム中の１以上のロゴを見出す。

垂直／水平方向の投射を利用することによりロゴを検出するため、垂直方向における画素クラスタの先頭及び末尾セグメントが最初に識別される。この段階は、ヒストグラムのピークを繰り返し見出し、次いでピーク値を含むクラスタの垂直方向の先頭及び末尾座標を計算することを含む。垂直方向のクラスタが識別された後、割り当てられていない垂直方向の投射のピークが見出され、該処理は全ての垂直方向のクラスタが識別されるまで繰り返される。該最初のステップの後、各セグメントの水平方向の投射が計算され、クラスタの水平方向の先頭及び末尾点が見出される。最後の段階において、クラスタについての境界箱（bounding box）の、アスペクト比、充填比、高さ及び幅が照合され、ロゴを検出する。ロゴは通常、１よりも大きなアスペクト比、ビデオの高さ（黒のバーを除く）の２％よりも大きな高さ、及び０．５よりも大きな充填比を持つ境界箱を形成する。見逃しの割合を犠牲にして、誤った検出の割合を低減するため、境界箱Ｂ_ｉの周囲の領域が滑らか（clean）であることも確認される。このことは、Ｂ_ｉと、Ｂ_ｉと同じ中心を持ち幅及び高さがＢ_ｉの幅及び高さの１．２５倍である拡大された箱との間のエリアにおける、異常値の数を計数することにより達成される。当該エリアにおける許容可能な異常値の最大の数は、非常に低い値に設定される。

ロゴが純粋に絵のものである場合には、他の全てのものよりもかなり大きなサイズを持つ塊の検出が試みられる。この目的のため、繋がった領域を見出すため、接続構成要素ラベリングアルゴリズムが最初に実行される。その後、高さ交差比（ｐは図５の式５３において高さにより置き換えられる）又は幅交差比（ｐは図５の式５３における箱の幅である）が所定の閾値よりも大きい近隣の塊が接続される。境界箱の特徴を利用することにより、オブジェクトベースの拡張が、画素ベースの拡張の代わりに適用される。なぜなら、後者は通常、同一のオブジェクトに属するものではない画素を接続し、性能を劣化させるからである。最後に、最も大きな塊のサイズを全ての他の塊の平均サイズに分割することにより、ピーク突出比（peak saliency ratio、ＰＳＲ）が計算される。特定の閾値（本発明者による実験において７が好適な値であることが分かっている）よりも大きいＰＳＲ値は、ロゴの候補となる塊を示す。最後に、該塊のアスペクト比、充填比、幅及び高さのパラメータが照合され、ロゴ決定を完成させる。テキストのロゴとは異なり、絵入りのロゴについてはアスペクト比閾値として０．５が利用される。

提案されるアルゴリズムは空間的な情報のみを利用するため、動画のロゴは静的なロゴと異ならない。検出精度は、通常ヒストグラムのビンのサイズにより影響を受ける。幾つかの実験の結果、８ｘ８ｘ８のＹＣ_ＢＣ_Ｒが堅固な性能に帰着することが決定された。より大きな量子化値は非常に粗く、十分に識別可能ではない。距離値は１０００の間隔で場面モデルに量子化され、Ｎは９０番目のパーセンタイル値と定義された。距離値は、０．９より大きい場合にのみ許容された。８ｘ８ｘ８はＲＧＢに対して堅固な性能に帰着し、４ｘ４ｘ４は非常に粗く十分に識別可能でないことが観測された。一方で、８ｘ８ｘ８よりも大きなビン数は、より遅い処理に帰着し、より大きなメモリ要件に帰着する。本発明の方法によっても幾つかのロゴは見逃され得るが、見逃されるロゴの幾つかは場面特性が好適となった場合に検出されることができる。同様に、幾つかのフレームにわたる統合の決定は、背景とは異なる色の小さなオブジェクトに通常起因する、誤った検出を排除することができる。

本発明の、画像中の（重畳された）グラフィカルなオブジェクトを検出するための電子装置２１（図２を参照されたい）は、電子回路２３を有する。電子回路２３は、画像のオブジェクト領域における特徴の第１の値を決定するように動作可能であり、オブジェクト領域は（重畳された）グラフィカルなオブジェクトを含み得る。電子回路２３はまた、画像の基準領域における特徴の第２の値を決定するように動作可能であり、基準領域は（重畳された）グラフィカルなオブジェクトを含む見込みが低い領域である。電子回路２３は更に、オブジェクト領域が（重畳された）グラフィカルなオブジェクトを含むことを、第１の値と第２の値との差が特定の閾値を超えているか否かに依存して決定するように動作可能である。電子装置２１は例えば、ＰＣ、ＴＶ、ビデオプレイヤ及び／又はレコーダ又は携帯電話であっても良い。電子回路２３は、例えばIntel社のPentium（登録商標）やAMD社のAthlonといったＣＰＵのような汎用プロセッサであっても良いし、又はPhilips社のTrimediaメディアプロセッサのような特殊用途向けプロセッサであっても良い。電子装置２１は、例えばロゴが除去されている画像のような、処理された画像を保存するための、及び／又は処理されていない画像を保存するための、記憶手段２５を有しても良い。該記憶手段は例えば、ハードディスク、固体メモリ又は光ディスク読み取り器及び／又は書き込み器であっても良い。電子装置２１は、例えばアナログ又はディジタル無線受信器、コンポジット・シンチ入力、ＳＶＨＳ入力、ＳＣＡＲＴ入力、ＤＶＩ／ＨＤＭＩ入力又はコンポーネント入力のような入力部２７を有しても良い。電子装置２１は、例えば無線送信器、コンポジット・シンチ出力、ＳＶＨＳ出力、ＳＣＡＲＴ出力、ＤＶＩ／ＨＤＭＩ出力又はコンポーネント出力のような出力部２９を有しても良い。出力部２９は、処理された画像を出力するために利用されても良い。代替として、又は加えて、電子装置２１は、処理された及び／又は処理されていない画像を出力するためのディスプレイを有しても良い。電子装置２１は、消費者向け電子装置であっても良いし、又は例えばサーバＰＣのような専門家向け電子装置であっても良い。

本発明は好適な実施例に関連して説明されたが、以上に説明された原理内の変更は当業者に明らかであり、従って本発明は好適な実施例に限定されるものではなく、斯かる変更を包含することを意図されたものであることは理解されるであろう。本発明は、それぞれの及び全ての新規な特徴並びに特徴のそれぞれの及び全ての組み合わせに存する。請求項における参照番号は、保護範囲を限定するものではない。動詞「有する」及びその活用の使用は、請求項に記載されたもの以外の要素の存在を除外するものではない。要素に先行する冠詞「１つの（a又はan）」は、複数の斯かる要素の存在を除外するものではない。

当業者には明らかであるように、「手段（means）」は、単独で又は他の機能と共に、分離して又は他の要素と協働して、動作時に特定の機能を実行する、又は実行するように構成された、いずれのハードウェア（別個の若しくは集積された回路又は電子素子のような）又はソフトウェア（プログラム又はプログラムの一部のような）をも含むことを意図されている。本発明は、幾つかの別個の要素を有するハードウェアによって、及び適切にプログラムされたコンピュータによって実装されても良い。「ソフトウェア」は、フロッピー（登録商標）ディスクのようなコンピュータ読み取り可能な媒体に保存された、インターネットのようなネットワークを介してダウンロード可能な、又は他のいずれかの態様で取引可能な、いずれのソフトウェアをも意味するものと理解されるべきである。

本発明の方法のフロー図である。本発明の電子装置のブロック図である。領域に分割された画像の例である。図３の画像を分割するために利用される領域を示す。本発明の方法の実施例において利用される式を示す。場面に重畳されるチャネルロゴの例である。図６の場面から逸脱した画素を示す。

Claims

画像中のグラフィカルなオブジェクトを検出する方法であって、
前記グラフィカルなオブジェクトを含み得る前記画像のオブジェクト領域における特徴の第１の値を決定するステップと、
前記グラフィカルなオブジェクトを含み見込みの低い前記画像の基準領域における特徴の第２の値を決定するステップと、
前記第１の値と第２の値との差が特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むか否かを決定するステップと、
を有する方法。
前記第１の値は、前記オブジェクト領域における複数の画素の値を表し、少なくとも一定量の前記複数の画素の値と前記第２の値との差が前記特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むと決定される、請求項１に記載の方法。
異常値の空間的な分布がグラフィカルなオブジェクトの典型的な分布と一致するか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むと決定され、前記異常値は、値が前記特定の閾値を超える画素である、請求項２に記載の方法。
前記特徴は色である、請求項１に記載の方法。
前記第２の値は、前記基準領域の確率密度関数を表す、請求項１に記載の方法。
前記第２の値は、前記基準領域のノンパラメトリック確率密度関数を表す、請求項５に記載の方法。
前記基準領域の確率密度関数を推定するためヒストグラムが利用される、請求項６に記載の方法。
前記画像は少なくとも９個の領域を有し、前記９個の領域のうち４個が隅領域であり、前記オブジェクト領域は前記４個の隅領域のうち少なくとも１つを有する、請求項１に記載の方法。
前記第２の値は前記基準領域のサブ領域について決定され、前記オブジェクト領域及び前記サブ領域は比較的互いに近い、請求項１に記載の方法。
プログラム可能な装置を請求項１に記載の方法を実行するように動作可能とするソフトウェア。
画像中のグラフィカルなオブジェクトを検出するための電子装置であって、前記グラフィカルなオブジェクトを含み得る前記画像のオブジェクト領域における特徴の第１の値を決定し、前記グラフィカルなオブジェクトを含み見込みの低い前記画像の基準領域における特徴の第２の値を決定し、前記第１の値と第２の値との差が特定の閾値を超えるか否かに依存して、前記オブジェクト領域が前記グラフィカルなオブジェクトを含むか否かを決定するように動作可能な電子回路を有する電子装置。
請求項１１に記載の電子回路。