JP2007503656A - エッジ方向の推定 - Google Patents

エッジ方向の推定 Download PDF

Info

Publication number
JP2007503656A
JP2007503656A JP2006530833A JP2006530833A JP2007503656A JP 2007503656 A JP2007503656 A JP 2007503656A JP 2006530833 A JP2006530833 A JP 2006530833A JP 2006530833 A JP2006530833 A JP 2006530833A JP 2007503656 A JP2007503656 A JP 2007503656A
Authority
JP
Japan
Prior art keywords
pixel
candidate edge
edge direction
candidate
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006530833A
Other languages
English (en)
Inventor
ハーン,ヘラルト デ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2007503656A publication Critical patent/JP2007503656A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

画像中のある特定のピクセル(100)の近傍に位置するエッジの向きを推定する方法が開示される。該方法は、候補エッジ方向の集合を生成し、前記候補エッジ方向のそれぞれについて対応するピクセル群(104、106)の対について前記対応するピクセル群の対の2つの群(104、106)のピクセル値の間の差に基づいて一致誤差を計算することによって前記候補エッジ方向を評価し、前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向のある第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセル(100)に割り当てる、ことを有する。この方法の利点は、必要とされる計算が比較的少ないことである。これは前記候補エッジ方向の集合の生成が以前の計算に基づいていることによって実現されている。

Description

本発明は、画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定する方法に関するものであり、該方法は、
・候補エッジ方向の集合を生成し、
・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しており、
・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる、
ことを有する。
本発明はさらに、画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定するエッジ方向推定ユニットに関するものであり、該エッジ方向推定ユニットは、
・候補エッジ方向の集合を生成する生成手段と、
・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しているような評価手段と、
・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる選択手段とを有する。
本発明はさらに、
・入力画像のシーケンスに対応する信号を受信する受信手段と、
・前記入力画像のシーケンスに基づいて出力画像のシーケンスを計算する、前記したエッジ方向推定ユニットによって制御される画像処理ユニットとを有する、画像処理装置にも関する。
本発明はさらに、画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定するための命令を有し、処理手段およびメモリを有するコンピュータ設備によって読み込まれるべきコンピュータプログラムプロダクトにも関する。該コンピュータプログラムプロダクトは、読み込まれたのち、前記処理手段に、
・候補エッジ方向の集合を生成し、
・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しており、
・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる、
ことを実行する能力を与えるものである。
冒頭で述べたたぐいの画像処理装置の一つの実施形態は米国特許US5,019,903から知られている。この特許明細書は、デジタルビデオ信号の行の間を空間的に補間して補間された行を生成する装置を開示している。その装置は、当該信号の標本値の間を水平方向に補間して元来の標本値とそれらの間に位置する補間された標本値とからなるスーパーサンプリング信号を生成するよう構成されたスーパーサンプラーを有している。そのスーパーサンプリング信号の各標本値について、ブロック一致回路がそれぞれ、N×M標本値の2つのブロックの間の一致の度合いを決定する(Nは行数、Mは標本値の数)。前記2つのブロックは垂直方向には補間すべき行に関して反対向きにオフセットされており、水平方向には所定の標本値の位置に関して反対向きにオフセットされている。各ブロック一致回路はそれぞれの異なる水平オフセットについて一致誤差を生成する。この一致誤差に反応して、補間すべき行の各標本値について、選択手段が、前記異なるオフセットに対応する勾配ベクトルの組から前記ブロック間の最良一致を与えるオフセットに対応する勾配ベクトルを選択する。この勾配ベクトルがエッジの方向に対応すると想定されている。方向可変の空間補間手段が当該ビデオ信号を空間的に補間する。その補間方向は、それが生成する標本値ごとに、その生成される標本値に対応する所定の標本値の位置について選択された前記勾配ベクトルに従って制御される。
前記の既知の画像処理装置の不都合な点は、当該ビデオ信号によって表現されている画像中のエッジの方向を決定するために比較的多数の計算が必要とされることである。各標本値について一致誤差を、評価すべき異なる勾配ベクトルに対応してあらゆるオフセットについて計算しなければならないのである。
必要とされる計算が比較的少数ですむような冒頭において述べたたぐいの方法を提供することが本発明の目的の一つである。
本発明のこの目的は、前記候補エッジ方向の集合の生成が以前の計算に基づいていることによって実現される。以前の計算を利用することにより、個々のピクセルに対する候補エッジ方向の評価の数が大幅に減少する。必要とされる候補エッジ方向が少なくなるからである。以前の計算にはいくつかの種類がある。それら複数のものについて従属請求項で説明される。
本発明に基づく方法のある実施形態では、前記候補エッジ方向の集合はさらなるエッジ方向の集合から候補エッジ方向を選択することによって生成され、該さらなるエッジ方向の集合は以前のエッジ方向推定ののちに当該画像の別のピクセルに割り当てられたさらなるエッジ方向からなる。本発明に基づくこの実施形態では、特定のピクセルの空間的な環境中において推定されているエッジ方向が再利用され、諸ピクセルに割り当てられる。画像中のエッジは複数のピクセルと重なる、すなわち複数のピクセルに広がると想定しているのである。もしある特定のエッジ方向が近くのピクセルに割り当てられていれば、この特定のエッジ方向が考察中の特定のピクセルについてのよい候補エッジ方向になるというのである。よって、この実施形態の利点は、候補エッジ方向の集合が限定されており、その結果として計算の数が少なくなるという点である。もう一つの利点は、推定エッジ方向の一貫性が改善されるという点である。
好ましくは、前記さらなるエッジ方向の集合からの前記候補エッジ方向の第2のものの選択が、
・前記候補エッジ方向の該第2のものと、
・前記候補エッジ方向の該第2のものが割り当てられた前記別のピクセルの第1のものの当該特定ピクセルに対する位置、
とに基づいて行われる。これは、もし前記候補エッジ方向の第2のものが前記別のピクセルの第1のものから当該特定ピクセルへの線分と実質一致すれば、前記候補エッジ方向の該第2のものが選択されるということを意味する。逆もまた真である。もし前記候補エッジ方向のある第3のものが前記候補エッジ方向の該第3のものが割り当てられた前記別のピクセルのある第2のものから当該特定ピクセルへの線分に実質等しくなければ、前記候補エッジ方向の該第3のものは選択されない。換言すれば、候補エッジ方向の集合は主として当該特定ピクセルについて適切である確率が比較的高い候補エッジ方向からなっているのである。
本発明に基づく方法のある実施形態によれば、前記候補エッジ方向の集合はさらなるエッジ方向の集合から候補エッジ方向を選択することによって生成され、該さらなるエッジ方向の集合はある以前のエッジ方向推定ののちにある別の画像の別のピクセルに割り当てられたさらなるエッジ方向からなる。ここで、当該画像と前記別の画像とはともに一つのビデオ画像シーケンスに属するものである。本発明に基づくこの実施形態では、当該特定ピクセルの時間的な環境中において推定されているエッジ方向が再利用され、時間的に近隣のピクセル群に割り当てられる。ビデオ画像のシーケンスの一連の画像は互いに比較的よく一致すると想定しているのである。もしある特定のエッジ方向が以前の画像における対応するピクセルに割り当てられていれば、この特定のエッジ方向が考察中の当該特定ピクセルについてのよい候補エッジ方向になるというのである。よって、この実施形態の利点は、候補エッジ方向の集合が限定されており、その結果として計算の数が少なくなるという点である。もう一つの利点は、推定エッジ方向の一貫性が改善されるという点である。
本発明に基づく方法のある別の実施形態では、前記候補エッジ方向の集合の生成は、
・エッジ方向の初期推定値を計算し、
・前記エッジ方向の初期推定値と所定の閾値とに基づいて候補エッジ方向を生成する、
ことを有する。本発明に基づくこの実施形態では、まずエッジ方向の初期推定値が計算され、その計算に基づいて最終的な候補エッジ方向が生成される。それはすなわち、最終的な候補エッジ方向が初期推定値のまわりの限られた範囲内にあるということである。
好ましくは、前記エッジ方向の初期推定値の計算は、
・当該特定ピクセルに関して反対向きの水平オフセットをもつ2つのピクセルブロックのピクセル値の間の差の第1の和を計算し、
・当該特定ピクセルに関して反対向きの垂直オフセットをもつ2つのピクセルブロックのピクセル値の間の差の第2の和を計算し、
・前記差の第1の和と前記差の第2の和との商を計算することによってエッジ方向の初期推定値を決定する、
ことを有する。本発明に基づくこの実施形態の利点は、前記初期推定値の計算が比較的堅牢になるということである。この事実はいくつかの方法で適用できる。第一に、実際のエッジ方向の計算が限られた候補エッジ方向の集合を用いて実行できる。代替的に、比較的正確なエッジ方向、すなわち良好な一致が、いくつかの「サブピクセル」精度の候補エッジ方向を適用することによってみつけることができる。任意的に、前記差の第1の和および前記差の第2の和はそれぞれ差の重み付きの和である。
本発明に基づく方法のある実施形態では、前記候補エッジ方向の第1のものは当該特定ピクセルを含んでいるあるピクセルブロックに割り当てられる。本発明に基づくこの実施形態の利点は、候補エッジ方向の集合の評価の回数が比較的少なくなることである。典型的なピクセルブロックが8×8ピクセルからなるとすると、評価回数は64倍も減少する。前記推定エッジ方向が個々のピクセルにではなく、64個のピクセルに割り当てられるからである。この方策、すなわち推定エッジ方向をピクセルブロックの複数のピクセルに割り当てることは、以前の計算に基づいて候補エッジ方向の集合を生成する方策とは独立しても適応可能であることを注意しておく。この方策だけで本発明の前記目的を達成することもできる。
本発明に基づく方法のある実施形態では、当該画像中の他のピクセルブロックに、該他のピクセルブロックについての他のエッジ方向推定に基づいて他のエッジ方向が割り当てられる。ならびに、最終的なエッジ方向はブロック侵食(block erosion)によって当該画像の個々のピクセルについて計算される。ブロック侵食は、ある個別のブロックのピクセル内でのさまざまな異なる値を、当該ピクセルブロックの値および隣接するピクセルブロックの値に基づいて計算するための既知の方法である。ブロック侵食は、たとえば米国特許明細書US5,148,269において開示されている。本発明に基づくこの方法の利点は、比較的少ない計算で当該画像の個々のピクセルについてエッジ方向が計算されることである。
本発明に基づく方法のある実施形態では、前記一致誤差は、2つのピクセル群のそれぞれのピクセルの間の差の絶対値の和に基づいている。この一致誤差は画像の諸部分の間の一致を確立するための大がかりな計算を必要としない比較的良好な尺度である。任意的に、前記2つのピクセル群は部分的に重なり合っていてもよい。そのほかにそのほかにサブサンプリングを適用してもよい。
本発明に基づく方法のある実施形態では、前記ピクセル群はそれぞれ長方形のピクセルブロックである。典型的なピクセルブロックは8×8または4×4ピクセルからなる。一般に、ブロックベースの画像処理はメモリアクセスと相性がよい。よって、メモリ帯域幅の使用が比較的少なくなる。
本発明に基づく方法のある別の実施形態では、前記ピクセル群はそれぞれ平行四辺形のピクセルブロックであり、その実際の形は考察している候補エッジ方向に依存する。
比較的少ない計算でエッジ方向を推定するよう構成された、冒頭において述べたたぐいのエッジ方向推定ユニットを提供することが本発明のさらなる目的である。
本発明のこの目的は、前記生成手段が以前の計算に基づいて候補エッジ方向の集合を生成するよう構成される形で達成される。
比較的少ない計算でエッジ方向を推定するよう構成された、冒頭において述べたたぐいの画像処理装置を提供することが本発明のさらなる目的である。
本発明のこの目的は、前記エッジ方向推定ユニットの前記生成手段が以前の計算に基づいて候補エッジ方向の集合を生成するよう構成される形で達成される。
前記画像処理装置は、出力画像を表示するための表示装置など追加的な構成要素を有していてもよい。該画像処理ユニットは以下の種類の画像処理の一つまたは複数をサポートしていてもよい。
・インターレース除去:インターレースは奇数番目と偶数番目の画像走査線を交互に送信する映像放送で一般的な手続きである。インターレース除去は、完全な垂直解像度を復元する、すなわち各画像ごとに奇数番目と偶数番目の両方の走査線が得られるようにする。
・映像周波数変換:(インターレースされた)オリジナル入力画像の系列から(インターレースされた)出力画像のより大きな系列が計算される。出力のうち補間された画像は時間的にオリジナル入力画像2枚の間に位置する。
・空間的画像スケーリング:オリジナル入力画像の系列から、該入力画像よりも空間解像度の高い出力画像の系列が計算される。
・ノイズ削減:エッジ方向の情報は前記補間を制御するために重要である。これはまた、時間的処理にも関わり、空間−時間的ノイズ削減につながることもありうる。
・ビデオ圧縮、すなわちエンコードまたはデコード。たとえばMPEG規格によるもの。
前記画像処理装置は、たとえばテレビ、セットトップボックス、ビデオデッキ、衛星チューナー、DVD(Digital Versatile Disk[デジタル多目的ディスク])プレーヤーもしくはレコーダーでありうる。
必要とされる計算が比較的少ない、冒頭において述べたたぐいのコンピュータプログラムプロダクトを提供することが本発明のさらなる目的である。
本発明のこの目的は、候補エッジ方向の集合の生成が以前の計算に基づいて行われることで達成される。
前記方法の修正およびその変形は、前記エッジ方向推定ユニット、前記画像処理装置および前記コンピュータプログラムプロダクトの修正およびその変形に対応するものでありうる。
本発明に基づく前記方法の、前記エッジ方向推定ユニットの、前記画像処理装置の、そして前記コンピュータプログラムプロダクトのこれらのことを含むさまざまな側面は、以下に付属の図面を参照しつつ記載される実装および実施形態によって明快に説明されることであろう。
図面を通じて、同じ参照符号は同様の部分を示すのに使われている。
図1は、位置X〔本訳稿では便宜上下線でベクトルを表す〕のピクセルからなるあるブロックB(X)102中のある特定のピクセル100の候補エッジ方向を評価するために使われる2つのピクセルブロック104、106を示す概略図である。候補エッジ方向の評価は差分絶対値和(SAD: Summed Absolute Difference)を一致基準とすることに基づいている。これに代わる、同じくらい好適な一致基準としてはたとえば、平均平方誤差(Mean Square Error)、規格化相互相関(Normalized Cross Correlation)、大差ピクセル数(Number of Significantly Different Pixels)などがある。ある特定の候補(candidate)エッジ方向tngtcについての一致誤差の計算は、たとえば式(1)で規定される。
SAD(tngtc,X,n)=Σ|F(x−tngtc,y+1,n)−F(x+tngtc,y−1,n)| (1)
〔和はx∈B(X)で行う〕
ここで、x=(x,y)であり、F(x,n)は輝度信号、nは画像番号またはフィールド番号である。試験対象の候補エッジ方向は候補の集合(candidate set)CSから取ってきたもので、整数値のほかピクセル間値をとることもできる。結果として出力されるエッジ方向は、SADの値が最小になる候補エッジ方向である。その候補エッジ方向は、当該特定ピクセルを含んでいるピクセルブロック102の諸ピクセルに割り当てられる。
前記候補の集合が式(2)
CS={tngtc|−8<tngtc<8} (2)
で規定され、たいていの応用ではピクセルの半分の精度で十分であるとすると、30ほどの候補エッジ方向を評価する必要がある。しかし、本発明によれば、候補エッジ方向の数は予測または再帰を使って一桁減らすことができる。候補の集合を式(3)
CS(X,n)={tngtc(n)|tngt(X,n−1)−1, tngt(X,n−1), tngt(X,n−1)+1} (3)
のように規定して良好な結果が実現された。ここで、tngt(X,n−1)は前回の画像n−1において位置Xに対して得られたエッジ方向の結果である。(簡単のため、整数点までの精度を前提としている。)実験によると、これは計算量の観点から魅力的であるばかりでなく、エッジ方向の一貫性向上にもつながる。任意的に、予測tngt(X,n−1)に対して該予測自身の次に(擬似ノイズの)アップデートが加えられる。
図2は、前記特定ピクセル100の空間的環境において以前に推定されているエッジ方向230〜254に基づくいくつかの候補エッジ方向の選択を示す概略図である。これらの以前に推定された方向230〜254はそれぞれブロック202〜226に割り当てられたものである。特に時間的な予測が正しいエッジ方向に収束しない可能性のある動きの速いシーケンスについては、空間的な予測――たとえば同じ画像の他の部分にすでに割り当てられているエッジ方向――が有益であろう。ある好ましい実施形態では、有望な予測をその値と位置とに基づいて識別することができる。換言すれば、同じ画像の他の部分にすでに割り当てられているエッジ方向の集合から候補エッジ方向を選択することは、その候補エッジ方向の値とその候補エッジ方向が割り当てられているピクセルの当該特定ピクセル100に対する位置とに基づく。たとえば、斜め隣のピクセルブロック212に対して45°(tngtc=1)のエッジ方向が割り当てられていたとすると、これは現在のピクセルブロック228についての有望な予測となる。エッジが画像の大きな部分にわたって広がっていると想定しているのである。このことを明らかにするには、斜め隣のピクセルブロック212に割り当てられているエッジ方向240が、当該特定ピクセル100から前記斜め隣のピクセルブロック212の中心ピクセル262への線分264と比較される。同様に、ブロック配列の位置(−2,1)にあるピクセルブロック206に割り当てられている値がtngtc=−2だったとすると、これは現在のピクセルブロック228についての有望な候補エッジ方向である。さらなる有望な候補はピクセルブロック210、218、222に割り当てられているそれぞれエッジ方向238、246、250である。より正式な形では、
Figure 2007503656
となる。式(4)の上側は二つ以上のiの値について成り立つ可能性がある。その場合、好ましくはtngtcは絶対値が最小のiが割り当てられる。これを実現するのが次の擬似コードである。
Figure 2007503656
候補の集合CSが時間的候補および空間的候補、すなわち同じ画像シーケンスの他の画像に対して推定されたエッジ方向および同じ画像の他のブロックに対してのエッジ方向を含んでいることは明らかであろう。
任意的に、異なるエッジ方向候補に対してペナルティが加えられる。こうしたペナルティは時間的か空間的かといった候補の種類に依存してもよいが、候補の値そのものに依存してもよい。たとえば、水平軸に比べて比較的小さな角度の候補エッジ方向は比較的大きなペナルティでアップデートされるようにするなどである。
図3は、ある特定のピクセル100についてのエッジ方向の初期推定値を計算するのに使われる2対のピクセルブロックを示す概略図である。ピクセルブロックの第1の対は、特定ピクセル100を含んでいる、位置Xのピクセルからなる特定のブロックB(X)300に関して水平方向左にシフトさせた第1のピクセルブロック302および、前記特定のピクセルブロック300に関して水平方向右にシフトさせた第2のクセルブロック304からなる。ピクセルブロックの第2の対は、前記特定のピクセルブロック300に関して垂直方向上にシフトさせた第3のピクセルブロック306および、前記特定のピクセルブロック300に関して垂直方向下にシフトさせた第4のピクセルブロック308からなる。適用されるシフトは典型的には1ピクセルである。エッジ方向の初期推定値の計算は、
・前記特定のピクセルブロック300に関して反対向きの水平オフセットをもつ2つのピクセルブロック302、304のそれぞれのピクセル値の間の差の第1の和SH(B(X))を式(5)で規定されるように計算し、
・前記特定のピクセルブロック300に関して反対向きの垂直オフセットをもつ2つのピクセルブロック306、308のそれぞれのピクセル値の間の差の第2の和SV(B(X))を式(6)で規定されるように計算し、
・前記第1の差の和と前記第2の差の和との商を計算することによってエッジ方向の初期推定値E(B(X))を式(7)で規定されるように決定する、ことを有する。
SH(B(X))=Σ{F(x−(1,0))−F(x+(1,0))} (5)
〔和はx∈B(X)で行う〕
SV(B(X))=Σ{F(x−(0,1))−F(x+(0,1))} (6)
〔和はx∈B(X)で行う〕
E(B(X))=αSH(B(X))/SV(B(X)) (7)
ここで、αは前記特定のピクセルブロックB(X)300に関するシフトの量に依存する定数である。SV(B(X))=0で分母が0となるためにE(B(X))が計算できなくなるのを避けるため、特別の用心が払われる。たとえば、商を計算する前にSV(B(X))に非常に小さな値が加えられる。あるいはまた、SV(B(X))は所定の閾値と比較される。SV(B(X))が該所定の閾値を超えた場合にのみ前記の商が計算され、そうでない場合にはE(B(X))にはデフォルト値が設定される。
前記初期推定値に基づいて、前記特定のピクセルブロックB(X)300についての候補の集合は
CS(X,n)={tngtc(n)|E(B(X))−T≦tngtc(n)≦E(B(X))+T} (8)
で定義される。ここで、Tは所定の閾値(threshold)である。
図4は、それぞれの候補エッジ方向の一致誤差を計算するのに使われる平行四辺形のピクセルブロック402〜412の対を示す概略図である。ピクセルブロックの第1の対は特定のピクセル100に関して垂直方向上にシフトさせた第1のピクセルブロック402および、前記特定ピクセルに関して垂直方向下にシフトさせた第2のピクセルブロック404からなる。第1ピクセルブロック402および第2ピクセルブロック404は、前記特定ピクセル100に対する相対位置が垂直成分のみを含み、水平成分を含まないので、長方形である。ピクセルブロックの第2の対は特定のピクセル100に関して垂直方向上にシフトさせ、水平方向左にシフトさせた第3のピクセルブロック406および、前記特定ピクセル100に関して垂直方向下にシフトさせ、水平方向右にシフトさせた第4のピクセルブロック408からなる。第3ピクセルブロック406および第4ピクセルブロック408は、前記特定ピクセル100に対する相対位置が垂直成分、水平成分の両方を含んでいるので、平行四辺形様になる。ピクセルブロックの第3の対は特定のピクセル100に関して垂直方向上にシフトさせ、水平方向右にシフトさせた第5のピクセルブロック410および、前記特定ピクセル100に関して垂直方向下にシフトさせ、水平方向左にシフトさせた第6のピクセルブロック412からなる。さまざまなピクセルブロック402〜412の形は、対応するエッジ方向に関係している。たとえば、第1のピクセルブロックの対を用いては、垂直方向のエッジ方向が評価される。
図5は、本発明に基づくエッジ方向推定ユニット500の実施形態を示す概略図である。該ユニットは、
・候補エッジ方向の集合を生成する候補生成ユニット502と、
・候補エッジ方向のそれぞれについて対応するピクセル群の対についての一致誤差を計算することによって該候補エッジ方向を評価する評価ユニット504と、
・前記それぞれの一致誤差に基づいて前記候補エッジ方向の集合から前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる選択ユニット506、
とを有する。評価ユニット504は前記一致誤差を、前記対応するピクセル群の対をなす2つの群のピクセル値の間の差に基づいて計算するよう構成されている。ここで、前記2つのピクセル群の前記特定ピクセルに関する位置は考察中の候補エッジ方向に依存する。前記ピクセル値は入力端子512によって与えられる。好ましくは、ピクセル群はピクセルブロックである。これらのピクセルブロックの形は長方形であることもあるし、図4との関連で述べたような平行四辺形であることもある。
前記候補生成ユニット502は候補エッジ方向の集合を以前の計算に基づいて生成するよう構成されている。好ましくは、当該エッジ方向推定ユニット500は、前記選択ユニット506と前記候補生成ユニット502との間の任意的な接続を有しており、前記候補生成ユニット502に図1、図2との関連で述べたように選択されたエッジ方向に関連するデータを提供できるようになっている。任意的に、当該エッジ方向推定ユニット500は、図3との関連で述べたように初期推定値を計算するよう構成された初期推定ユニット510を有している。
候補エッジ方向の評価は個々のピクセルについて実行することもできる。しかし、好ましくはこれらの評価はピクセル群について実行される。結果として、選択ユニット506によって割り当てられる一つのエッジ方向は、その群のすべてのピクセルに割り当てられる。個々のピクセルによって、あるいはピクセル部分群によって異なるエッジ方向の値を実現するためには、当該エッジ方向推定ユニット500はブロック侵食ユニット508を有することができる。このブロック侵食ユニット508の作用は図7A〜図7Cとの関連で説明される。
当該エッジ方向推定ユニット500はその出力端子にエッジ方向の二次元配列を与える。
候補生成ユニット502、評価ユニット504、選択ユニット506、初期推定ユニット510およびブロック侵食ユニット508は一つのプロセッサを使って実装できる。通常、これらの機能はソフトウェアプログラムプロダクトの制御のもとに実行される。実行の間、通常は前記ソフトウェアプログラムプロダクトはRAMのようなメモリに読み込まれており、そこから実行される。該プログラムはROM、ハードディスクまたは磁気および/または光学記憶装置のような補助記憶装置から読み込まれてもよいし、インターネットのようなネットワークを通じて読み込まれてもよい。任意的に、カスタムチップ(application specific integrated circuit)によって前記開示された機能を提供してもよい。
図6は本発明に基づく画像処理装置の実施形態を示す概略図である。該画像処理装置は、
・入力画像を表す信号を受信する受信手段602と、
・画像処理ユニット604と、
・該画像処理ユニットを制御する、図5との関連で述べたようなエッジ方向推定ユニット500と、
・前記画像処理ユニット604の出力画像を表示する表示装置606、
とを有する。前記画像処理ユニット604は以下の機能の一つまたは複数を実行するよう構成されていてもよい:インターレース除去、映像周波数変換、空間的画像スケーリング、ノイズ削減、ビデオ圧縮。前記インターレース除去は好ましくはT・ドイレ(Doyle)およびM・ローイマンス(Looymans)によって論文「エッジ情報を使った順次走査変換(Progressive scan conversion using edge information)」(L・キアリリオーネ(Chiariglione)(編)『HDTVの信号処理(Signal Processing of HDTV)II』、エルセヴィエ・サイエンス・パブリッシャーズ、1990年、pp.711〜721)によって記載されているようなものである。
前記信号はアンテナまたはケーブルを通じて受信された放送信号でもよいが、ビデオデッキ(VCR)またはデジタル多用途ディスク(DVD)のような記憶装置からの信号でもよい。該信号は入力端子610で与えられる。当該画像処理装置600は、たとえばテレビでありうる。あるいはまた、当該画像処理装置600は任意的な表示装置を有しておらず、前記出力画像を表示装置606を有する装置に提供するのでもよい。その場合、当該画像処理装置600はたとえばセットトップボックス、衛星チューナー、ビデオデッキ、DVDプレーヤーもしくはレコーダーなどでありうる。任意的に、当該画像処理装置600は、ハードディスクまたは、光ディスクなどリムーバブルメディア上の記憶手段のような保存手段を有している。当該画像処理装置600はまた映画スタジオまたは放送局によって利用されるシステムであってもよい。
図7A、図7B、図7Cはブロック侵食、すなわち前記ブロック侵食ユニット508の作用を概略的に示している。図7Aでは4つのピクセルブロックA、B、C、Dが描かれている。これらのピクセルブロックのそれぞれはたとえば8×8ピクセルからなる。これらのピクセルブロックのそれぞれに選択ユニット506によってエッジ方向が割り当てられている。それはすなわち、たとえばブロックAの64ピクセル全部にエッジ方向として同じ値V(A)が割り当てられており、ブロックBの64ピクセル全部にはエッジ方向として値V(B)が割り当てられているという意味である。
ブロック侵食は、ピクセルのサブブロックによって異なるエッジ方向の値を実現するために実行される。図7Bでは、ピクセルブロックAが4つのサブブロックA1、A2、A3、A4に分割されているところが描かれている。これらの(たとえば4×4の)ピクセルのサブブロックのそれぞれについて、エッジ方向の値は、親のピクセルブロックAのエッジ方向の値V(A)に基づいて、かつ親のピクセルブロックAの隣接ピクセルブロックのエッジ方向の値に基づいて計算される。たとえば、サブブロックA4のエッジ方向の値V(A4)は、親のピクセルブロックAのエッジ方向の値V(A)ならびに、親のピクセルブロックAの隣接ピクセルブロックBおよびCのエッジ方向の値V(B)およびV(C)に基づいて計算される。この計算は式(9)で表されるようなものでよい。
V(A4)=median(V(A),V(B),V(C)) (9)
好ましくは、ブロック侵食は階層的に実行される。図7Cでは、図7BのピクセルのサブブロックA1が4つのサブブロックA11、A12、A13、A14に分割されているところが描かれている。これらの(たとえば2×2の)ピクセルのサブブロックのそれぞれについて、エッジ方向の値は、親のピクセルサブブロックA1のエッジ方向の値V(A1)に基づいて、かつ親のピクセルサブブロックA1の隣接ピクセルブロックのエッジ方向の値に基づいて計算される。たとえば、サブブロックA14のエッジ方向の値V(A14)は、親のピクセルサブブロックA1のエッジ方向の値V(A1)ならびに、親のピクセルサブブロックA1の隣接ピクセルサブブロックA2およびA3のエッジ方向の値V(A2)およびV(A3)に基づいて計算される。この計算は式(10)で表されるようなものでよい。
V(A14)=median(V(A1),V(A2),V(A3)) (10)
さらなるサブブロックへの分割を適用することもできることは明らかであろう。
上記の実施形態は本発明を解説するものであって限定するものでないこと、そして当業者は付属の特許請求の範囲から離れることなく代替的な実施形態を考案することができるであろうことを注意しておく必要がある。請求項において、括弧内に参照符号があったとしてもそれを請求項を限定するものと解釈してはならない。「有する」の語は請求項に挙げられていない要素またはステップの存在を排除するものではない。要素の単数形の表現はそのような要素の複数の存在を排除するものではない。本発明は、いくつかの区別できる要素を有するハードウェアによっても、好適にプログラムされたコンピュータによっても実装できる。いくつかの手段を列挙する装置請求項において、そうした手段のいくつかは単一のハードウェア項目によって具現されることもできる。
本発明のある実施形態に基づき、ある特定のピクセルの候補エッジ方向を評価するために使われる2つのピクセルブロックを示す概略図である。 当該特定ピクセルの空間的な環境中で以前に推定されたエッジ方向に基づいていくつかの候補エッジ方向の選択を示す概略図である。 エッジ方向の初期推定値を計算するのに使われる2対のピクセルブロックを示す概略図である。 それぞれの候補エッジ方向の一致誤差を計算するのに使われる平行四辺形のピクセルブロックの対を示す概略図である。 本発明に基づくエッジ方向推定ユニットのある実施形態を示す概略図である。 本発明に基づく画像処理装置のある実施形態を示す概略図である。 ブロック侵食を示すための概略図である。 ブロック侵食を示すための概略図である。 ブロック侵食を示すための概略図である。

Claims (17)

  1. 画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定する方法であって、
    ・候補エッジ方向の集合を生成し、
    ・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しており、
    ・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てることを有しており、前記候補エッジ方向の集合の生成が以前の計算に基づいていることを特徴とする方法。
  2. 前記候補エッジ方向の集合がさらなるエッジ方向の集合から候補エッジ方向を選択することによって生成され、該さらなるエッジ方向の集合が以前のエッジ方向推定ののちに当該画像の別のピクセルに割り当てられたさらなるエッジ方向からなることを特徴とする、請求項1記載の方法。
  3. 前記さらなるエッジ方向の集合からの前記候補エッジ方向の第2のものの選択が、
    ・前記候補エッジ方向の該第2のものと、
    ・前記候補エッジ方向の該第2のものが割り当てられた前記別のピクセルの第1のものの当該特定ピクセルに対する位置、
    とに基づいて行われることを特徴とする、請求項2記載の方法。
  4. 前記候補エッジ方向の集合がさらなるエッジ方向の集合から候補エッジ方向を選択することによって生成され、該さらなるエッジ方向の集合がある以前のエッジ方向推定ののちにある別の画像の別のピクセルに割り当てられたさらなるエッジ方向からなるもので、当該画像と前記別の画像とがともに一つのビデオ画像シーケンスに属するものであることを特徴とする、請求項1記載の方法。
  5. 前記候補エッジ方向の集合の生成が、
    ・エッジ方向の初期推定値を計算し、
    ・前記エッジ方向の初期推定値と所定の閾値とに基づいて候補エッジ方向を生成する、
    ことを有することを特徴とする、請求項1記載の方法。
  6. 前記エッジ方向の初期推定値の計算が、
    ・当該特定ピクセルに関して反対向きの水平オフセットをもつ2つのピクセルブロックのピクセル値の間の差の第1の和を計算し、
    ・当該特定ピクセルに関して反対向きの垂直オフセットをもつ2つのピクセルブロックのピクセル値の間の差の第2の和を計算し、
    ・前記差の第1の和と前記差の第2の和との商を計算することによってエッジ方向の初期推定値を決定する、
    ことを有することを特徴とする、請求項5記載の方法。
  7. 前記候補エッジ方向の前記第1のものが当該特定ピクセルを含んでいるピクセルブロックに割り当てられることを特徴とする、請求項1記載の方法。
  8. 当該画像中の他のピクセルブロックに、該他のピクセルブロックについての他のエッジ方向推定に基づいて他のエッジ方向が割り当てられること、ならびに、最終的なエッジ方向がブロック侵食によって当該画像のピクセルのサブブロックについて計算される、ことを特徴とする、請求項7記載の方法。
  9. 前記一致誤差が、前記2つのピクセル群のそれぞれのピクセルの間の差の絶対値の和に基づいていることを特徴とする、請求項1記載の方法。
  10. 前記ピクセル群がそれぞれ長方形のピクセルブロックであることを特徴とする、請求項1記載の方法。
  11. 前記ピクセル群がそれぞれ台形のピクセルブロックであり、その実際の形は考察している候補エッジ方向に依存することを特徴とする、請求項1記載の方法。
  12. 画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定するエッジ方向推定ユニットであって、
    ・候補エッジ方向の集合を生成する生成手段と、
    ・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しているような評価手段と、
    ・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる選択手段とを有しており、前記生成手段が前記候補エッジ方向の集合を以前の計算に基づいて生成するよう構成されていることを特徴とする、エッジ方向推定ユニット。
  13. ・入力画像のシーケンスに対応する信号を受信する受信手段と、
    ・前記入力画像のシーケンスに基づいて出力画像のシーケンスを計算する、請求項12記載のエッジ方向推定ユニットによって制御される画像処理ユニット、
    とを有することを特徴とする、画像処理装置。
  14. 前記画像処理ユニットが請求項12記載のエッジ方向推定ユニットによって制御される補間手段を有するインターレース除去ユニットであることを特徴とする、請求項13記載の画像処理装置。
  15. さらに前記出力画像を表示するための表示装置を有することを特徴とする、請求項13記載の画像処理装置。
  16. テレビであることを特徴とする、請求項15記載の画像処理装置。
  17. 画像中で、該画像のある特定のピクセルの近傍に位置するエッジの方向を推定するための命令を有し、処理手段およびメモリを有するコンピュータ設備によって読み込まれるべきコンピュータプログラムであって、読み込まれたのち、前記処理手段に、
    ・候補エッジ方向の集合を生成し、
    ・前記候補エッジ方向のそれぞれについてピクセル群の対応する対について一致誤差を計算することによって前記候補エッジ方向を評価し、該一致誤差はピクセル群の前記対応する対をなす2つの群のピクセル値の間の差に基づいており、前記2つのピクセル群の当該特定ピクセルに対する位置は考察中の前記候補エッジ方向に関係しており、
    ・前記候補エッジ方向の集合からそれぞれの一致誤差に基づいて前記候補エッジ方向の第1のものを選択し、前記候補エッジ方向の該第1のものを当該特定ピクセルに割り当てる,
    ことを実行する能力を与えるものであって、前記候補エッジ方向の集合の生成が以前の計算に基づいていることを特徴とするコンピュータプログラム。
JP2006530833A 2003-05-20 2004-05-13 エッジ方向の推定 Withdrawn JP2007503656A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03101427 2003-05-20
PCT/IB2004/050670 WO2004104928A1 (en) 2003-05-20 2004-05-13 Estimating an edge orientation

Publications (1)

Publication Number Publication Date
JP2007503656A true JP2007503656A (ja) 2007-02-22

Family

ID=33462179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006530833A Withdrawn JP2007503656A (ja) 2003-05-20 2004-05-13 エッジ方向の推定

Country Status (6)

Country Link
US (1) US20070036466A1 (ja)
EP (1) EP1629435A1 (ja)
JP (1) JP2007503656A (ja)
KR (1) KR20060012629A (ja)
CN (1) CN1791890A (ja)
WO (1) WO2004104928A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012243048A (ja) * 2011-05-19 2012-12-10 Fuji Heavy Ind Ltd 環境認識装置および環境認識方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100772390B1 (ko) * 2006-01-23 2007-11-01 삼성전자주식회사 방향 보간 방법 및 그 장치와, 그 보간 방법이 적용된부호화 및 복호화 방법과 그 장치 및 복호화 장치
US8189107B1 (en) * 2007-03-12 2012-05-29 Nvidia Corporation System and method for performing visual data post-processing based on information related to frequency response pre-processing
FR2954986B1 (fr) * 2010-01-05 2012-02-10 St Microelectronics Grenoble 2 Procede de detection d'orientation de contours.
US8358830B2 (en) * 2010-03-26 2013-01-22 The Boeing Company Method for detecting optical defects in transparencies

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2231460B (en) * 1989-05-04 1993-06-30 Sony Corp Spatial interpolation of digital video signals
DE69029999T2 (de) * 1990-07-20 1997-08-14 Philips Electronics Nv Vorrichtung zur Verarbeitung von Bewegungsvektoren
US5586199A (en) * 1991-10-02 1996-12-17 Fujitsu Limited Method for determining orientation of contour line segment in local area and for determining straight line and corner
JP3073599B2 (ja) * 1992-04-22 2000-08-07 本田技研工業株式会社 画像のエッジ検出装置
US6408109B1 (en) * 1996-10-07 2002-06-18 Cognex Corporation Apparatus and method for detecting and sub-pixel location of edges in a digital image
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US5974199A (en) * 1997-03-31 1999-10-26 Eastman Kodak Company Method for scanning and detecting multiple photographs and removing edge artifacts
US6192162B1 (en) * 1998-08-17 2001-02-20 Eastman Kodak Company Edge enhancing colored digital images
US6636633B2 (en) * 1999-05-03 2003-10-21 Intel Corporation Rendering of photorealistic computer graphics images
JP4596224B2 (ja) * 2001-06-27 2010-12-08 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
US7054367B2 (en) * 2001-12-31 2006-05-30 Emc Corporation Edge detection based on variable-length codes of block coded video
US7133572B2 (en) * 2002-10-02 2006-11-07 Siemens Corporate Research, Inc. Fast two dimensional object localization based on oriented edges

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012243048A (ja) * 2011-05-19 2012-12-10 Fuji Heavy Ind Ltd 環境認識装置および環境認識方法

Also Published As

Publication number Publication date
US20070036466A1 (en) 2007-02-15
EP1629435A1 (en) 2006-03-01
KR20060012629A (ko) 2006-02-08
CN1791890A (zh) 2006-06-21
WO2004104928A1 (en) 2004-12-02

Similar Documents

Publication Publication Date Title
KR101135454B1 (ko) 특정 이미지의 특정 픽셀 값 결정 방법, 픽셀 값 결정 유닛, 이미지 처리 장치 및 컴퓨터 판독 가능한 저장 매체
US6240211B1 (en) Method for motion estimated and compensated field rate up-conversion (FRU) for video applications and device for actuating such method
US20060098737A1 (en) Segment-based motion estimation
KR100973429B1 (ko) 배경 움직임 벡터 선택기, 업-변환 유닛, 이미지 처리 장치, 배경 움직임 벡터 선택 방법 및 컴퓨터 판독 가능한 기록 매체
US20050249284A1 (en) Method and apparatus for generating motion vector in hierarchical motion estimation
KR101217627B1 (ko) 블록 기반의 움직임 추정 방법 및 장치
JP2000134585A (ja) 動きベクトル決定方法、画像信号のフレーム数変換方法および回路
US20060045365A1 (en) Image processing unit with fall-back
US20050180506A1 (en) Unit for and method of estimating a current motion vector
US20030081682A1 (en) Unit for and method of motion estimation and image processing apparatus provided with such estimation unit
US20050195324A1 (en) Method of converting frame rate of video signal based on motion compensation
US20050226462A1 (en) Unit for and method of estimating a motion vector
KR20040047963A (ko) 움직임 예측 유닛 및 방법 및 이러한 움직임 예측 유닛을구비하는 이미지 처리 장치
US20050163355A1 (en) Method and unit for estimating a motion vector of a group of pixels
WO2003073757A1 (en) Method and apparatus for field rate up-conversion
JP2008504786A (ja) ビデオモード検出による動き補償
JP2007503656A (ja) エッジ方向の推定
JP2006215655A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP2006215657A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
US8200032B2 (en) Image processing method and related apparatus for performing image processing operation according to image blocks in horizontal direction
CN101027691A (zh) 图像内插
KR20060029283A (ko) 모션-보상된 영상 신호 보간
JP2006529039A (ja) エッジ方向の推定
JP4274430B2 (ja) 動きベクトル検出装置
JPH11146401A (ja) 動画像信号の動きベクトル検出方法および動きベクトル検出回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070510

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070608