JP5214240B2 - テクスチャーベースの符号化のための方法および装置 - Google Patents

テクスチャーベースの符号化のための方法および装置 Download PDF

Info

Publication number
JP5214240B2
JP5214240B2 JP2007518577A JP2007518577A JP5214240B2 JP 5214240 B2 JP5214240 B2 JP 5214240B2 JP 2007518577 A JP2007518577 A JP 2007518577A JP 2007518577 A JP2007518577 A JP 2007518577A JP 5214240 B2 JP5214240 B2 JP 5214240B2
Authority
JP
Japan
Prior art keywords
video
image
levels
level
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007518577A
Other languages
English (en)
Other versions
JP2008504581A (ja
Inventor
ヴァイトブルフ,セバスティアン
コレア,カルロス
コタ,デニス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008504581A publication Critical patent/JP2008504581A/ja
Application granted granted Critical
Publication of JP5214240B2 publication Critical patent/JP5214240B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • G09G3/22Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources
    • G09G3/28Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels
    • G09G3/288Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels using AC panels
    • G09G3/291Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels using AC panels controlling the gas discharge to control a cell condition, e.g. by means of specific pulse shapes
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • G09G3/2007Display of intermediate tones
    • G09G3/2018Display of intermediate tones by time modulation using two or more time intervals
    • G09G3/2022Display of intermediate tones by time modulation using two or more time intervals using sub-frames
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • G09G3/22Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources
    • G09G3/28Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels
    • G09G3/288Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels using AC panels
    • G09G3/296Driving circuits for producing the waveforms applied to the driving electrodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/12Picture reproducers
    • H04N9/30Picture reproducers using solid-state colour display devices
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/02Improving the quality of display appearance
    • G09G2320/0266Reduction of sub-frame artefacts
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G3/00Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
    • G09G3/20Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
    • G09G3/22Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources
    • G09G3/28Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters using controlled light sources using luminous gas-discharge panels, e.g. plasma panels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Power Engineering (AREA)
  • Plasma & Fusion (AREA)
  • Control Of Gas Discharge Display Tubes (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transforming Electric Information Into Light Information (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)
  • Image Processing (AREA)

Description

本発明は、画像のピクセルに対応する複数の発光素子を有する表示装置上での表示のためのビデオデータを処理する方法であって、ビデオフレームまたはフィールドの時間が複数のサブフィールドに分割され、サブフィールドの間に発光素子はピクセルを点灯させるp通りの可能なビデオレベルをエンコードするために使われるnビットのサブフィールド符号語に対応する小さなパルスにおいて発光のために活性化されることができ、当該方法は第一のエンコード方法を使って画像の第一の部分をエンコードし、ここで、ピクセルを点灯させるための所定の可能なビデオレベルの集合のうち、n<m<pとして光生成に使われるm通りのビデオレベルの部分集合が選択され、該m通りの値の選択は、対応するサブフィールド符号語の光生成のための時間的な重心がビデオレベルとともに連続的に増大するという規則に従ってなされるような方法に関する。さらに、本発明はビデオデータを処理するための対応する装置に関する。
まず第一に、偽輪郭効果(false contour effect)について説明する必要がある。一般に、プラズマディスプレイパネル(PDP)は放電セルのマトリクス配列を利用するが、セルはONまたはOFFのどちらかでしかありえない。したがって、発光のアナログ制御によって中間レベルが表現されるCRTやLCDとは異なり、PDPは中間レベルを各セルのパルス幅変調(PWM)によって制御する。この時間変調は、目によって、目の時間応答に対応する期間にわたって積分される。所与の時間中にセルがオンにされる頻度が高いほど、そのルミナンス(輝度)は高くなる。たとえば、8ビットのルミナンスレベル(1色あたり256レベル、よって1670万色)を処理する際、各レベルは次の8つのビットの組み合わせによって表現できる。
1‐2‐4‐8‐16‐32‐64‐128
そのような符号化を実現するため、フレーム周期は、それぞれが1つのビットまたは輝度レベルに対応する8つの点灯部分周期(サブフィールドと呼ばれる)に分割されることができる。ビット「2」のための光パルスの数はビット「1」の場合の2倍であるなどである。これらの8つの部分周期を用いることで、組み合わせにより256通りの中間レベルを構築することが可能である。観察者の目は1フレーム周期にわたってこれらの部分周期を積分することで、正しい中間レベルの印象をとらえることになる。図1はこの分解を示している。
前記の発光パターンは、中間レベルおよび色の擾乱に対応する新たな範疇の画質劣化を導入する。これらは、プラズマパネル上の観察点が動くときに画像中の色のついたエッジの出現という形の中間レベルおよび色の擾乱に対応することから、「動的偽輪郭効果」として定義することにする。そのような画像に対する失敗は、均一な領域上に現れる強い輪郭の印象につながる。劣化は、画像がなめらかな階調をもつとき(肌のように)、および発光周期が数ミリ秒を超えるときに上昇する。
PDP画面上の観察点(目の焦点領域)が動くとき、目はこの動きを追う。結果として、目はもはや同じセルを1フレームにわたって積分すること(静的積分)はせず、動きの軌跡上に位置する種々のセルからくる情報を積分することになり、目はこれらすべての光パルスを混合することになる。これは誤りのある信号情報につながる。
基本的に、偽輪郭効果は、あるレベルから全く異なる符号をもつ別のレベルへの遷移があるときに生じる。よって、第一のポイントは符号に関してである。符号(n個のサブフィールドを用いている)はp通りの中間レベルを達成し(典型的にはp=256)、2n通りの可能なサブフィールド構成(エンコードにおいて作業しているとき)のうちから、あるいはp通りの中間レベルのうちから(ビデオレベルで作業しているとき)m通りの中間レベルを選択することを許容し、近いレベルは近いサブフィールド構成をもつようなものとする。
第二のポイントは、良好なビデオ品質を保つためには最大限のレベル数を保持することである。このために、選ばれるレベルの最小値は、サブフィールド数の二倍に等しくするべきである。
すべてのさらなる例について、次のように定義される11サブフィールドモードを使う:
1 2 3 5 8 12 18 27 41 58 80
これらの問題のために、重心符号化(GCC: Gravity Centre Coding)が文書EP1256924において導入された。この文書の内容は、ここに参照によって明示的に組み込まれる。
上で見たように、人間の目は、パルス幅変調によって放出される光を積分する。よって、図2に示されるように、基本符号でエンコードされたあらゆるビデオレベルを考える場合、これらのビデオレベルの時間位置(光の重心)はビデオレベルとともに連続的に増大しない。
ビデオレベル2についての重心CG2はビデオレベル1の重心CG1より大きいが、ビデオレベル3の重心CG3はビデオレベル2の重心よりも小さい。
これが偽輪郭を導入する。重心は、持続重みによって重み付けされた「オン」のサブフィールドの重心として定義される。
Figure 0005214240
ここで、sfWiはi番目のサブフィールドのサブフィールド重みである。δiは選ばれた符号(code)についてi番目のサブフィールドが「オン」であれば1に等しく、そうでなければ0に等しい。sfCG iはi番目のサブフィールドの重心、すなわちその時間位置である。これは図3において最初の7つのサブフィールドについて示されている。
ここで選ばれている11サブフィールド符号についての256通りのビデオレベルの時間的重心は図4に示すように表現できる。
曲線は単調ではなく、多くのジャンプを呈する。これらのジャンプが偽輪郭に対応する。GCCによれば、重心がビデオレベルとともに増大するような一部のレベルのみを選択することによってこれらのジャンプが抑制される。ただし、ある第一の所定の限界値までの低ビデオレベル範囲および/またはある第二の所定の制限値から先の高ビデオレベル範囲は例外とする。このことは、図5に示すように、先のグラフ上でジャンプのない単調な曲線を描き、最も近い点を選択することによってできる。このように、GCCを用いる際には、すべての可能なビデオレベルが使われるわけではない。
低ビデオレベル領域では、重心が増大するレベルのみを選択することは避けるべきである。というのも、可能なレベル数が少なく、暗いレベルでは人の目は非常に敏感なので、重心が増大するレベルしか選択しないと、暗いレベルにおける良好なビデオ品質を有するのに十分なレベル数がなくなってしまうからである。さらに、暗い領域では偽輪郭は無視できる。
高レベル領域では、重心が下がるので、選ばれるレベルも下がる。しかし、人間の目は高レベルでは敏感でないので、これは重要ではない。これらの領域では、目は異なるレベルを区別できず、ビデオレベルに関して偽輪郭レベルは無視できる(ウェーバー・フェヒナーの法則を考慮する場合、目は比の振幅に対してしか敏感でない)。これらの理由のため、曲線の単調性は最大ビデオレベルの10%から80%までの間のビデオレベルについてしか必要とならない。
この場合、今の例については、可能な256通りのレベルのうちから40のレベルが選択される(m=40)。これら40のレベルは良好なビデオ品質(中間レベル描写)を保つことを許容する。
この選択は、ビデオレベルで作業する際には、少数のレベル(典型的には256)しか利用可能でないので、可能である。しかし、この選択がエンコードにおいてなされるときには、2n(nはサブフィールド数)通りの異なるサブフィールド構成があるので、より多くのレベルが選択できる。これは図6に示されているが、図の各点が一つのサブフィールド構成に対応している(同じビデオレベルを与える異なる複数のサブフィールド構成がある)。
さらに、この方法は、変化なく、たとえば100Hzなど異なる複数の符号化に適用し、やはり良好な結果を与えることができる。
GCC概念は、一方では偽輪郭効果の目に見える軽減を可能にする。他方、GCCでは、利用可能なレベルが要求されるよりも少ないために必要とされるディザリングの形で画像中にノイズを導入する。その際、欠けているレベルは利用可能なGCCレベルの空間的および時間的混合によって表現される。偽輪郭効果は特定のシーケンスでしか現れない画像乱れであるが(たいていは大きな肌の領域において見える)、他方、導入されるノイズは常時見え、ノイズの多い表示であるとの印象を与えうる。その理由のため、GCC法を使うのは偽輪郭乱れの危険がある場合にのみとすることが重要である。
文書EP1376521は、映像に多くの動きがあるか否かに依存してGCCをオンにしたりオフにしたりする切り換えを可能にする動き検出に基づく、このことに対する解決策を導入している。
上記のことに鑑み、軽減偽輪郭効果擾乱でのGCCの使用を可能にする方法および装置を提供することが本発明の目的である。
本発明によれば、この目的は、画像のピクセルに対応する複数の発光素子を有する表示装置上での表示のためのビデオデータを処理する方法であって、ビデオフレームまたはフィールドの時間が複数のサブフィールドに分割され、サブフィールドの間に発光素子はピクセルを点灯させるp通りの可能なビデオレベルをエンコードするために使われるnビットのサブフィールド符号語に対応する小さなパルスにおいて発光のために活性化されることができ、当該方法は第一のエンコード方法を使って画像の第一の部分をエンコードし、ここで、ピクセルを点灯させるための可能なビデオレベルの集合のうち、n<m<pとして光生成に使われるm通りのビデオレベルの部分集合が選択され、該m通りの値の選択は、対応するサブフィールド符号語の光生成のための時間的な重心がビデオレベルとともに連続的に増大するという規則に従ってなされるようなステップと、
画像の前記第一の部分の選択を所定の基準に基づいて行うステップと、画像の前記第一の部分とは異なる少なくとも一つの第二の部分を、前記第一のエンコード方法とは異なる第二のエンコード方法を使ってエンコードするステップとを有するような方法によって解決される。
さらに、本発明は、画像のピクセルに対応する複数の発光素子を有する表示装置上での表示のためのビデオデータを処理する装置であって、ビデオフレームまたはフィールドの時間が複数のサブフィールドに分割され、サブフィールドの間に発光素子はピクセルを点灯させるp通りの可能なビデオレベルをエンコードするために使われるnビットのサブフィールド符号語に対応する小さなパルスにおいて発光のために活性化されることができ、当該装置は第一のエンコード方法を使って画像の第一の部分をエンコードするエンコード手段であって、ここで、ピクセルを点灯させるための可能なビデオレベルの所定の集合のうち、n<m<pとして光生成に使われるm通りのビデオレベルの部分集合が選択され、該m通りの値の選択は、対応するサブフィールド符号語の光生成のための時間的な重心がビデオレベルとともに連続的に増大するという規則に従ってなされるような手段と、画像の前記第一の部分の選択を所定の基準に基づいて行うための前記エンコード手段に接続された選択手段とを有しており、前記エンコード手段が、画像の前記第一の部分とは異なる少なくとも一つの第二の部分を、前記第一のエンコード方法とは異なるある第二のエンコード方法を使ってエンコードするよう適応されているような装置に関する。
本発明の発想によれば、GCCは、偽輪郭乱れの危険のある特定の画像領域に限定される。他の領域はGCC符号化されないか、あるいは一口で言って目に見える偽輪郭乱れが軽減されるほど多くの選択されたレベルをもつ別のGCCで符号化される。
好ましくは、画像のうちGCC符号化が実装される前記第一の部分の選択基準は:
所定の最小サイズよりも大きなサイズをもつ均一な領域、というものである。ここで、偽輪郭効果に敏感な均一な領域があり、GCCは乱れを軽減するためにこの領域に個別的に適用される。
前記均一領域は所定のテクスチャーを有しうる。その場合、画像はそのようなテクスチャーについて解析される。さらに、前記均一領域は肌色のような所定の色を有しうる。そのような肌の領域は前記のように偽輪郭効果に非常に敏感である。
肌色は色空間図の位相角および振幅によって決定されうる。その決定は実装が簡単である。振幅も位相角もある範囲内にしかないからである。
上記の諸特徴とは独立に、前記第一のエンコード方法(GCC)は、ある領域で、その領域の歪度がある最小歪度より大きい場合、およびその領域の尖度がある最小尖度より大きい場合には使用されてはならない。このように、画像領域のヒストグラムの構造を解析することにより、高い確度で均一領域を見出すことができる。
本発明の例示的な実施形態は、図面に、そしてより詳細に以下の記述において示される。
本発明の概念によれば、GCCは画像のすべての領域で使われるのではない。しかしながら、GCC概念のさらなる利点は、GCCの選択されたレベルが存在しているレベルの部分集合であるという事実に基づいている。したがって、画像の一部分がGCCを使う一方、残りはすべてのレベルを用いて符号化される場合、視聴者にとって、ノイズがより多いか少ないかし、目に見える偽輪郭がより多いか少ないかする領域があるという事実のほかは、何らの相違も見ることはできないであろう。一般に、GCCで符号化される領域と標準的な領域との間の境界は目に見えないのである!GCC概念のこの属性はテクスチャーベースの概念を定義することを可能にする。
この新たな概念は画像の2つの種類の領域へのセグメンテーションに基づいている:
・偽輪郭効果が視聴者にとって真にわずらわしくない領域(景色、草、木、建物、水…)
・偽輪郭効果が不自然であるために真にわずらわしい領域(大きくて均一な肌領域)
さて、本発想は、これら2つの種類の領域について2種類のモードを定義することである:
・偽輪郭重要モード:偽輪郭のために実際に最適化されたGCC(より多くのノイズ)
・標準モード:GCCなしまたは多くの選択されたレベルをもつGCC(ほとんどノイズなし)
そのような2つの例を以下に挙げる。
主たる問題は、前記のノイズは、多くの場合に目に見える乱れを引き起こし、よって最低限に減らすべきであるということである。他方、偽輪郭効果は特定のシーケンスでしか見えず、それらのシーケンスでのみ、特にそのようなシーケンスの決定的な部分でのみ取り対処すべきである。本発明のねらいは、偽輪郭効果に対処する特定の領域内の画像のセグメンテーションである。
第一の重要なセグメンテーションパラメータは色そのものである。2つの状況が起こり得る:
(a)白黒映像:これはYUV情報を使って試験できる(UおよびVが画像全体についてほとんど無視できる)
・偽輪郭重要モードは画像全体について有効にされる。実際、白黒映画にカラーのエッジ(偽輪郭の線)を見るのは非常にわずらわしいものである。
(b)通常のカラー映像
・現在ピクセルがほとんど灰色(赤、緑、青の成分が非常に似通っている)である場合、その領域は偽輪郭に敏感である。実際、偽輪郭はカラーのエッジを導入するが、それは人間の目にとって灰色の領域では予期していないものである!その場合、現在ピクセルについて偽輪郭重要モードが有効にされる。
・現在ピクセルが肌色である場合(下記の肌色検出の記述を参照)、その領域は偽輪郭に敏感である。実際、偽輪郭はカラーのエッジ(黒、赤…)を導入するが、それは人間の目にとって肌の領域では予期していないものである!その場合、現在ピクセルについて偽輪郭重要モードが有効にされる。
・他のすべての場合には、標準モードが有効にされる。
肌色相の検出は、多数の人について、肌色は通常、CbCr色差ベクトル空間における位相角約115°から135°までの間に位置しているという事実に基づいている。さらに、CbCrベクトル振幅は通例、最大彩度の10%から50%までの間のどこかに位置している。肌色軸近くに位置している彩度がこれより低いか高いオブジェクトは人の肌ではないと考えられ、検出プロセスでは無視できる。
図7は、被写体の顔の上のカーソルのところにおける肌色のCbCr色空間の位相(phase)および振幅(amplitude)(黄色のマーカー)のベクトルスコープ表示を示している。124°の位相角および23%の振幅は、十分に所望の肌色検出の領域内に位置している。
さらに、さらなる肌色検出基準として、ルミナンス成分も用いることができる。たとえばRGB色成分が使われるときがそうである(図8参照)。偽輪郭補正のための肌色検出は、誤った検出でもたいていの場合何ら重大な劣化効果を生じないという事実のため、他の用途の場合ほど決定的ではない。肌色検出座標内にあるかもしれない色の小さな領域によって偽輪郭補正が引き起こされるのを防止するため、検出プロセスの前に低域通過フィルタおよびレベル閾値を実装するべきである。
提案される肌検出のブロック図が図8に示されている。まず、RGB信号が低域通過フィルタおよびレベル閾値にかけられる。結果として得られる信号の位相Phおよび振幅Amが抽出され、決定ブロックに与えられる。位相Phおよび振幅AmがPhmin, Phmax, Ammin, Ammaxの座標内にあれば、「肌ON」信号が出力される。そうでなければ、決定ブロックからは「肌OFF」信号が出力される。
Phmin, Phmax, Ammin, Ammaxの値は、外部レジスタからくる所定の値である。上の例で使用された値は次のとおりである:
Phmin=115°
Phmax=135°
Ammin= 10%
Ammax= 50%
偽輪郭の見えやすさは肌のような均一領域では非常に高いが、その見えやすさはテクスチャーの多いオブジェクトでは低下する。前段落では肌色を検出する一つの方法が呈示された。この検出の精度をさらに高めるために、肌の均一性を検査することによって肌テクスチャーの検証を追加することが提案される。換言すれば、肌色領域において真のテクスチャーがほとんど存在しないということを確認して初めて該領域で「偽輪郭重要モード」を有効にするのである。実際、その領域に含まれるテクスチャーが多すぎる場合、それは非肌領域、あるいはテクスチャーそのもののため偽輪郭がわずらわしくない(テクスチャーが偽輪郭効果を隠蔽する)領域の指標である。
ここに呈示した検出は任意的な検出である。若干複雑さを増すが、これにより偽輪郭効果によって真に汚染されはしない領域上で「偽輪郭重要モード」の使用をさらに減らすことを可能にするはずである。
検出のためには、現在ピクセルP(x;y)のまわりでNおよびMを奇数としてN×Mのブロックが定義される。現在ピクセルはそのブロックのちょうど中心(x0;y0)に位置している。
各色成分のため、選択されたブロックのヒストグラムに関係して以下のパラメータがある。
中間レベルの平均(Mean of Grey Level)
Figure 0005214240
このパラメータは、ヒストグラムの平均値(中間階調スケールにおける位置)を表す。
中間レベルの分散(Variance of Grey Level):
Figure 0005214240
このパラメータは、中間レベルの前記平均値のまわりの分散を表す。
歪度(skewness):
Figure 0005214240
このパラメータは、ヒストグラムの不均整(平均値の左右でバランスがとれているか否か)の尺度である。
Figure 0005214240
尖度(kurtosis):
このパラメータは、ヒストグラムの一般的な形(尖っている、すらりとした、あるいはやや平坦)についての情報を与える。
これらすべてのパラメータのうち、たいていはSKEWおよびKURTの両パラメータがテクスチャーを評価するために使用される。
それと並んで、ブロック中に位置する高周波を解析する必要がある。実際、均一ブロックは低周波しかもたないのに対し、強いテクスチャーをもつブロックは高周波にずっと多くのエネルギーが位置している。周波数はブロックのフーリエ変換を使って解析される。
Figure 0005214240
関数F(u;v)はフーリエ領域でのブロックの空間周波数の分布を表す(u:水平周波数;v:垂直周波数)。フーリエ領域は図9に示されている。
[−L;L]かつ[−K;K]の間に位置する領域は低周波領域を表す。残りは領域H(高周波[high frequencies]から)として定義される。したがって、どのくらいのエネルギーが低周波数に位置しているかを決定するためには、以下の計算を使うことになる。
Figure 0005214240
最後に、個別的な偽輪郭重要モードを有効にするか否かの決定は、次のように与えられる:
if Enhigh≧EnergyMin 標準モードを有効に
else if Enhigh<EnergyMin
if |SKEW|≧SKEW_Min and KURT≧KURT_Min 標準モードを有効に
else 個別的な偽輪郭モードを使用
ここで上記の概念を例によって解説する。その目的のため、木や花の前に位置する女性の写真を撮り、テクスチャー解析のための3つの領域が定義される:ブロック1(頬)、ブロック2(あご)およびブロック3(花)である。この写真のテクスチャー解析は図10ないし図16との関連で解説される。
図10に示されるように、第一の選択された領域(ブロック1)は純粋な均一肌領域の上にある。緑、青、赤の信号に関するヒストグラムが図10の右側に描かれている。各ヒストグラムの右側には、統計値MGL、VGL、SKEWおよびKURTが呈示されている。ヒストグラムでは、ビデオレベルに対してピクセル数が描かれている。
ヒストグラムは非常に尖っており、歪度および尖度のパラメータはごく小さい。このことは均一領域を示している。
ブロック1のスペクトル解析の結果が図11に示されている(三色それぞれについてスペクトル空間の一象限)。これらの図では、各色のエネルギーは低周波のところ(左隅)に位置している。これは、解析されたブロックが主として均一領域であって、ほとんどテクスチャーがないということを意味する。高周波のところに位置するエネルギーは無視でき、この領域は均一領域として扱われることになる。
図12は、ほくろ(ビューティースポット)を除いて純粋な均一な肌領域の上での選択された領域(ブロック2)のヒストグラム解析を示す。ヒストグラムはブロック1の場合よりも大きくなっており、歪度および尖度のパラメータは大きくなっているが、強すぎるほどではない。これは相変わらず均一領域を示しうる。
ブロック2のスペクトル解析の結果が図13に示されている。エネルギーは低周波のところ(左隅)に位置している。若干の高周波があるが(左下隅)、無視できる。これは、解析されたブロックが主として均一領域であって、一つの遷移を除いてほとんどテクスチャーがないということを意味する。この遷移は肌とほくろの間のエッジに対応するものである。いずれにせよ、高周波のところに位置するエネルギーは無視でき、この領域は均一領域として扱われることになる。
図14は、多くのテクスチャーを含む花の上での選択された領域(ブロック3)のヒストグラム解析を示す。ヒストグラムはブロック1の場合よりも大きくなっており、歪度および尖度のパラメータは先の2つの場合に比べて非常に強い。これは非均一領域を示す。
ブロック3のスペクトル解析の結果が図15に示されている。エネルギーは高周波のほう(中ほどの領域)により多く位置している。低周波にはわずかなエネルギーしかなく、無視できる。これは、解析されたブロックが主として多くのテクスチャーをもつブロックであって、その色に対して独立に個別的な偽輪郭処置を必要としないということを意味している(たとえその色調が肌色と似ていても)。
図16は、前記の女性と花の写真の解析から得られたセグメンテーションの結果を示している。灰色の領域は個別的な偽輪郭符号化が使われる領域に対応し、残りが標準的な手法で符号化される。ヒストグラムおよびエネルギーの解析に基づくセグメンテーションが女性の肌領域を明瞭に導いている。
図17は、個別的領域において使用されるべき符号化についての判断のための本発明のアルゴリズムを示している。フレームTからの入力R、G、B信号は白黒試験ユニット1において白黒試験によって解析され、当該ピクセルが白黒でなければ肌色試験ユニット2において肌色試験によって解析される。次いで、現在ピクセルが白黒であるか、肌色を有するかしれいる場合には、そのテクスチャーが解析される。
・テクスチャーが、計算ユニット3における計算および試験の結果ほとんど高周波をもたず、小さな歪度および尖度パラメータをもつ(VGL、SKEW、KURT計算ユニット4において計算され、試験される)場合には、個別的偽輪郭モード5が有効にされる。
・現在領域がテクスチャーが多すぎ(高周波または高い尖度もしくは歪度)、標準モード6が使われる。
図17に呈示された例は、エネルギーおよび/またはヒストグラム解析などによる任意的なテクスチャー検出を使った完全機能の例であり、これはより堅牢な概念である。白黒検出1および肌色検出2のみに基づく、堅牢さは下がるがより簡単な簡略板が図18に示されている。この場合、当該ピクセルが白黒であるか、あるいはその色が肌色である場合に偽輪郭モード5が有効にされる。他のすべての状況では、標準モード6が適用されることになる。
次の段落では、セグメンテーション部分が全体的なPDP構造においていかにして実装されるかが示される。
本発明に基づく全体的な概念の実装は図19に呈示されている。入力のR、G、Bビデオデータ(3×12ビット)は逆ガンマブロック11に転送される前に直接に肌セグメンテーション部である図17の10または図18の10′に転送される。逆ガンマブロック11は(出力)=4095×(入力/MAX)γの形の二次関数を実行する。ここで、γはだいたい2.2に等しく、MAXは入力の可能な最大値を表す。逆ガンマユニット11の出力は、低レベルを正しく表現できるために12ビットよりも多くを有する。
肌セグメンテーション部10、10′は、個別的な偽輪郭符号化かむしろ標準的な符号化のどちらを使うべきかを決定するために、ピクセルごとにセグメンテーションを実行する。出力される偽輪郭レベルは符号化選択ブロック12に送られ、ここでGCC符号化または標準的な符号化のうち使うべき適切なものが選択される。この選択されたモードに基づき、再スケール化ユニットのLUTおよび符号化ブロック15のLUTが更新される。再スケール化ユニット13はGCCを実行し、符号化ユニット15は通常のサブフィールド符号化を実行する。両者の間では、ビデオ信号を正しく表現するためにディザリングユニット14によって4ビットより多くが追加される。再スケール化ユニット13の出力が、使用されるGCC符号語の総数をpとして(今の例では255のうちの40)p×16の異なる出力レベルを有していることに留意しておくべきである。4つの追加的ビットは、出力において十分な離散的ビデオレベルを有するようディザリングの目的で使用される。ディザリング後には、各信号RGBのp個のレベルが残る。ユニット15におけるサブフィールド符号化は、各色信号RGBについて16ビットをもつサブフィールドデータを生成する。結果として得られるサブフィールドデータはPDP16に送られる。
上記に記述した実施形態は、PDPに向けられているが、ピクセルを点灯させるためにPWMを使う他のいかなる種類のディスプレイでも本発明から裨益することができる。
二進符号のためのフレーム期間の構成を示す図である。 3つのビデオレベルの重心を示す図である。 サブフィールドの重心を示す図である。 ビデオレベルに依存する時間的重心を示す図である。 GCCのための選ばれたビデオレベルを示す図である。 ビデオレベルのための異なるサブフィールド構成についての重心を示す図である。 色差ベクトル空間を示す図である。 色解析のためのデータ処理を示す図である。 空間周波数を解析するための図である。 第一の肌の部分のヒストグラム解析を示す図である。 第一の肌の部分のスペクトル解析を示す図である。 第二の肌の部分のヒストグラム解析を示す図である。 第二の肌の部分のスペクトル解析を示す図である。 背景テクスチャーのヒストグラム解析を示す図である。 背景テクスチャーのスペクトル解析を示す図である。 肌の領域をもつ画像のセグメンテーションを示す図である。 符号切り換えのための信号流れ図である。 簡単化された符号切り換えの信号流れ図を示す図である。 本発明の概念を実装するためのブロック図である。

Claims (5)

  1. 画像のピクセルに対応する複数の発光素子を有する表示装置上での表示のためのビデオ
    データを処理する方法であって、ビデオフレームまたはフィールドの時間が複数のサブフ
    ィールドに分割され、サブフィールドの間に発光素子はピクセルを点灯させるp通りの可
    能なビデオレベルをエンコードするために使われるnビットのサブフィールド符号語に対
    応する小さなパルスにおいて発光のために活性化されることができ、当該方法は:
    ・画像の第一の部分のエンコードを、ピクセルを点灯させるためのp通りの可能なビデオ
    レベルの集合のうち、n<m<pとしてm通りのビデオレベルの第一の部分集合を使って行い
    、該m通りの値の選択は、偽輪郭効果を低減するよう対応するサブフィールド符号語の光
    生成のための時間的な重心がビデオレベルとともに連続的に増大するという規則に従って
    なされるようなステップを有しており、
    当該方法は:
    ・画像の前記第一の部分を、偽輪郭乱れの危険に基づいて
    (i)前記第一の部分が、所定のテクスチャーレベルよりも低いテクスチャーレベルを有
    するという点でビデオレベルが均一である均一な領域であり、前記均一な領域が所定の最
    小サイズよりも大きなサイズをもつよう、または
    (ii)ある領域の歪度(SKEW)がある最小歪度より大きい場合、およびその領域の尖度
    (KURT)がある最小尖度より大きい場合には、その領域は前記画像の前記第一の部分には
    含まれないよう、
    選択するステップと
    ・画像の前記第一の部分以外の少なくとも一つの第二の部分を、n<m′≦p、m′>mとし
    前記p通りの可能なビデオレベルのうちのm′通りのビデオレベルの第二の部分集合を使
    ってエンコードするステップとを含む
    ことを特徴とする方法。
  2. 前記均一な領域が所定の色を有することを特徴とする、請求項記載の方法。
  3. 前記所定の色が、色空間図の位相角(Ph)および振幅(Am)によって決定される(2)
    肌色であるか、あるいは前記所定の色が灰色であることを特徴とする、請求項記載の方
    法。
  4. 画像のピクセルに対応する複数の発光素子を有する表示装置上での表示のためのビデオ
    データを処理する装置であって、ビデオフレームまたはフィールドの時間が複数のサブフ
    ィールドに分割され、サブフィールドの間に発光素子はピクセルを点灯させるp通りの可
    能なビデオレベルをエンコードするために使われるnビットのサブフィールド符号語に対
    応する小さなパルスにおいて発光のために活性化されることができ、当該装置は:
    ・画像の第一の部分のエンコードを、ピクセルを点灯させるためのp通りの可能なビデオ
    レベルの所定の集合のうち、n<m<pとしてm通りのビデオレベルの第一の部分集合を使っ
    て行うエンコード手段であって、該m通りの値の選択は、偽輪郭効果を低減するよう対応
    するサブフィールド符号語の光生成のための時間的な重心がビデオレベルとともに連続的
    に増大するという規則に従ってなされるような手段と、
    画像の前記第一の部分を、偽輪郭乱れの危険に基づいて
    (i)前記第一の部分が、所定のテクスチャーレベルよりも低いテクスチャーレベルを有
    するという点でビデオレベルが均一である均一な領域であり、前記均一な領域が所定の最
    小サイズよりも大きなサイズをもつよう、または
    (ii)ある領域の歪度(SKEW)がある最小歪度より大きい場合、およびその領域の尖度
    (KURT)がある最小尖度より大きい場合には、その領域は前記画像の前記第一の部分には
    含まれないよう、
    選択するための前記エンコード手段に接続された選択手段を有しており、
    ・前記エンコード手段が、画像の前記第一の部分以外の、画像の少なくとも一つの第二の
    部分を、n<m′≦pとして少なくともビデオレベルの数が増えている点で前記第一の部分
    集合とは異なる、m′通りのビデオレベルの第二の部分集合を使ってエンコードするよう
    適応されている、
    ことを特徴とする装置。
  5. 前記均一な領域が所定の色を有することを特徴とする、請求項記載の装置。
JP2007518577A 2004-07-01 2005-06-10 テクスチャーベースの符号化のための方法および装置 Expired - Fee Related JP5214240B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04291674A EP1613098A1 (en) 2004-07-01 2004-07-01 Method and device for texture based coding
EP04291674.2 2004-07-01
PCT/EP2005/052700 WO2006003075A1 (en) 2004-07-01 2005-06-10 Method and device for texture based coding

Publications (2)

Publication Number Publication Date
JP2008504581A JP2008504581A (ja) 2008-02-14
JP5214240B2 true JP5214240B2 (ja) 2013-06-19

Family

ID=34931214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007518577A Expired - Fee Related JP5214240B2 (ja) 2004-07-01 2005-06-10 テクスチャーベースの符号化のための方法および装置

Country Status (6)

Country Link
US (1) US8254466B2 (ja)
EP (2) EP1613098A1 (ja)
JP (1) JP5214240B2 (ja)
KR (1) KR101132769B1 (ja)
CN (1) CN100571403C (ja)
WO (1) WO2006003075A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101416229B (zh) * 2006-04-03 2010-10-20 汤姆森特许公司 等离子显示面板中对视频级进行编码的方法和设备
EP1845509A1 (en) * 2006-04-11 2007-10-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for motion dependent coding
US7831104B2 (en) * 2007-04-27 2010-11-09 General Electric Company Using geometric wavelets based on active contours for signal processing
US7760912B2 (en) * 2007-08-01 2010-07-20 Tandent Vision Science, Inc. Image segregation system with method for handling textures
US8155434B2 (en) * 2007-10-30 2012-04-10 Sharp Laboratories Of America, Inc. Methods and systems for image enhancement
US8391601B2 (en) 2009-04-30 2013-03-05 Tandent Vision Science, Inc. Method for image modification

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3609204B2 (ja) * 1996-06-10 2005-01-12 三菱電機株式会社 ガス放電表示パネルの階調表示方法
JP3365229B2 (ja) * 1996-11-22 2003-01-08 松下電器産業株式会社 画像表示装置
JP3425083B2 (ja) * 1997-07-24 2003-07-07 松下電器産業株式会社 画像表示装置及び画像評価装置
JP4107520B2 (ja) * 1997-09-12 2008-06-25 株式会社日立プラズマパテントライセンシング ディスプレイ駆動装置の画像処理回路
JP3414265B2 (ja) * 1997-11-18 2003-06-09 松下電器産業株式会社 多階調画像表示装置
EP0978816B1 (en) * 1998-08-07 2002-02-13 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing video pictures, especially for false contour effect compensation
EP0978817A1 (en) * 1998-08-07 2000-02-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing video pictures, especially for false contour effect compensation
JP3457251B2 (ja) * 1999-04-12 2003-10-14 松下電器産業株式会社 画像表示装置
US6665429B1 (en) * 2000-09-22 2003-12-16 Giles Scientific, Inc. Method and apparatus for microbiological disk recognition
EP1256924B1 (en) * 2001-05-08 2013-09-25 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing video pictures
JP2003015587A (ja) * 2001-06-28 2003-01-17 Mitsubishi Electric Corp ディスプレイ装置
JP4851663B2 (ja) * 2001-07-19 2012-01-11 パナソニック株式会社 表示パネルの輝度制御方法
JP2003066896A (ja) * 2001-08-30 2003-03-05 Matsushita Electric Ind Co Ltd サブフィールド画像表示装置

Also Published As

Publication number Publication date
EP1613098A1 (en) 2006-01-04
KR20070038981A (ko) 2007-04-11
WO2006003075A1 (en) 2006-01-12
CN100571403C (zh) 2009-12-16
JP2008504581A (ja) 2008-02-14
US20080130759A1 (en) 2008-06-05
KR101132769B1 (ko) 2012-04-06
EP1767000A1 (en) 2007-03-28
CN1985522A (zh) 2007-06-20
US8254466B2 (en) 2012-08-28

Similar Documents

Publication Publication Date Title
EP1532607B1 (en) Method and apparatus for processing video pictures improving dynamic false contour effect compensation
JP5595516B2 (ja) 画像データ・ブロックの統計的属性を使ったバックライト制御のための方法およびシステム
JP5085792B1 (ja) 映像表示装置およびテレビ受信装置
KR100707270B1 (ko) Rgb값을 이용한 영상 콘트라스트 개선 방법 및 장치
JP5214240B2 (ja) テクスチャーベースの符号化のための方法および装置
JPH11212517A (ja) 多階調画像表示装置
JP5197858B1 (ja) 映像表示装置およびテレビ受信装置
US20140009513A1 (en) Video display device and a television receiver
KR100657339B1 (ko) 휘도 보존 양자화 및 하프톤닝을 결합하는 방법 및 시스템
WO2013069332A1 (ja) 映像表示装置およびテレビ受信装置
CN102187657A (zh) 图像的对比度增强
JP5165076B2 (ja) 映像表示装置
KR20060053933A (ko) 에러 확산과 또 다른 디더딩을 결합함으로써 비디오데이터를 처리하는 방법 및 장치
JP4991066B2 (ja) ビデオ画像を処理する方法及び装置
KR101077251B1 (ko) 허위 윤곽선 및 디더링 잡음 보상을 위한 비디오 화상 처리 방법
KR101429130B1 (ko) 비디오 화상을 처리하기 위한 방법 및 장치
JP2007279745A (ja) 動きに依存した符号化方法及び装置
JP5174982B1 (ja) 映像表示装置およびテレビ受信装置
WO2006040311A2 (en) Method for detecting skin tone pixels
EP1522964A1 (en) Method for processing video pictures for false contours and dithering noise compensation
JP2010288040A (ja) 輪郭補正方法及び輪郭補正装置
JP6532103B2 (ja) 映像表示装置およびテレビ受信装置
JP2003223132A (ja) 多階調画像表示装置
JP2013167876A (ja) 映像表示装置およびテレビ受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees