JP6930099B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP6930099B2
JP6930099B2 JP2016238464A JP2016238464A JP6930099B2 JP 6930099 B2 JP6930099 B2 JP 6930099B2 JP 2016238464 A JP2016238464 A JP 2016238464A JP 2016238464 A JP2016238464 A JP 2016238464A JP 6930099 B2 JP6930099 B2 JP 6930099B2
Authority
JP
Japan
Prior art keywords
pixel
area
image
pixels
designated area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016238464A
Other languages
English (en)
Other versions
JP2018097414A (ja
Inventor
佐々木 信
信 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016238464A priority Critical patent/JP6930099B2/ja
Publication of JP2018097414A publication Critical patent/JP2018097414A/ja
Application granted granted Critical
Publication of JP6930099B2 publication Critical patent/JP6930099B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、画像処理方法、画像処理システム、プログラムに関する。
画像から特定領域を切り出す処理は、特定領域の特性を解析、または特定領域をデザインするなど、画像編集や加工の分野では欠かせないものの1つである。特定領域を切り出す方法としては、様々なアプローチが考えられるが、例えば、グラフカット(GraphCut)法が公知の代表手法として挙げられる。
特許文献1には、画像の中からユーザが特定の画像領域として指定した指定領域の代表位置を表す位置情報を取得するユーザ指示受付部と、画像を構成する画素を頂点とみなすとともに、隣り合う画素を結ぶ辺および隣り合う画素同士の色度の近さに応じて決定される重みからなるグラフを設定するグラフ設定部と、設定されたグラフの頂点を予め定められた規則に従い縮約する縮約部と、縮約した頂点に対応する画素の位置を基に指定領域を検出する領域検出部と、を備えることを特徴とする画像処理装置が開示されている。
また特許文献2には、画像中の指定領域に含まれる画素を基準画素として一つ選択すると共に基準画素周辺の特定の範囲を第1の範囲として設定し、選択した一の基準画素のみを対象として第1の範囲に含まれる対象画素の各々について指定領域への属否の判定を行った後、新たに基準画素を一つ選択し、第1の範囲の設定および判定を再度行って、指定領域の検出を行う領域判定装置が開示されている。
特開2016−4309号公報 特開2016−6647号公報
ユーザが画像処理を行なう際には、ユーザが画像処理を行なう領域として指定する指定領域を切り出す処理が必要となる。この際、指定領域に対し指定領域の代表位置としてシードを入力し、そのシードを基に領域を拡張する領域拡張方法により指定領域を切り出すことがある。
しかしながら領域を拡張する際に、指定領域外の領域であっても類似色を有する領域について指定領域であるとする場合がある。
本発明は、指定領域の切り出しを行なう際に、指定領域をより精度よく切り出すことができる画像処理装置等を提供することを目的とする。
請求項1に記載の発明は、画像中の指定領域の代表位置を表す位置情報を取得する位置情報取得部と、位置情報から指定領域を検出する領域検出部と、を備え、前記領域検出部は、前記指定領域に属する画素の周囲のテクスチャと当該指定領域に含まれるか否かを判断する対象である画素の周囲のテクスチャとの類似度を基に当該指定領域を検出し、前記代表位置が設定された前記画像をブロック毎に分割する画像分割部と、当該ブロックを単位としテクスチャを算出するための範囲として、第1の局所領域および第2の局所領域を設定する局所領域設定部と、当該第1の局所領域内のテクスチャと当該第2の局所領域内のテクスチャとの類似度を算出する類似度算出部と、を備えることを特徴とする画像処理装置である。
請求項に記載の発明は、前記類似度により前記第2の局所領域内の画素が前記指定領域に含まれると検出したときに、前記第2の局所領域内の何れの画素が当該指定領域に含まれるかを設定する画素設定部をさらに備えることを特徴とする請求項に記載の画像処理装置である。
請求項に記載の発明は、前記類似度算出部は、前記類似度を基に前記第2の局所領域が前記指定領域に属する強さをさらに算出し、前記強さを使用して前記第2の局所領域中の画素が前記指定領域に属するか否かを判断することにより、前記指定領域を検出することを特徴とする請求項またはに記載の画像処理装置である。
請求項に記載の発明は、前記領域検出部は、前記ブロックを単位とした指定領域を検出した後に、当該ブロックを単位とした指定領域の境界の領域において指定領域の設定を解除し、指定領域の設定を解除されなかった画素の中から選択された基準画素を基に当該指定領域の境界の領域において指定領域を再度検出することを特徴とする請求項に記載の画像処理装置である
請求項1の発明によれば、処理速度がさらに高速になる。
請求項の発明によれば、指定領域を拡張するための画素を設定することができる。
請求項の発明によれば、処理速度がさらに高速になる。
請求項の発明によれば、さらに精度の高い指定領域の切り出しを行なうことができる
本実施の形態における画像処理システムの構成例を示す図である。 本実施の形態における画像処理装置の機能構成例を表すブロック図である。 指定領域を指定する作業をユーザインタラクティブに行う方法の例を示した図である。 (a)〜(c)は、図3で示した画像について、領域拡張方法により指定領域が切り出される様子を示している。 (a)〜(b)は、ユーザが指定領域の選択を行なうときに、表示装置の表示画面に表示される画面の例を示している。 画像処理を行なう際に、表示装置の表示画面に表示される画面の例を示している。 (a)〜(c)は、従来の領域拡張方法について説明した図である。 (a)〜(e)は、従来の領域拡張方法を使用し、2つのシードが与えられた場合に、画像が2つの指定領域に分けられる様子を示した図である。 第1の範囲について説明した図である。 (a)〜(b)は、影響力を決定する方法について示した図である。 図8−2で示す第1の範囲内の対象画素について、強さを基にした方法で判断を行なった結果を示した図である。 (a)〜(h)は、図8−3〜図8−4で説明した領域拡張方法で順次ラベル付けがされていく過程の例を示した図である。 第1の実施形態における領域検出部の機能構成例を表すブロック図である。 第1の局所領域および第2の局所領域について説明した図である。 第1の局所領域のテクスチャと第2の局所領域のテクスチャとは類似し(類似度が小さく)、周辺画素が、基準画素と同じ指定領域に属すると判断される場合を示した図である。 第1の局所領域のテクスチャと第2の局所領域のテクスチャとは類似し(類似度が小さく)、周辺画素が、基準画素と同じ指定領域に属すると判断される場合を示した図である。 第1の実施形態における領域検出部の動作について説明したフローチャートである。 第2の実施形態における領域検出部の機能構成例を表すブロック図である。 シードが設定された画像を表す。 (a)は、シードが設定された画像を分割した例を示している。(b)は、シードが設定された画像は、3画素×3画素からなるブロック毎に分割されていることを示す。 (a)〜(b)は、シード反映部の動作について説明した図である。 (a)は、シード反映画像において、第1の局所領域と第2の局所領域とを設定した例を示している。(b)は、第1の局所領域が、3画素×3画素=9画素からなることを示す。(c)は、第2の局所領域が、3画素×3画素=9画素からなることを示す。 (a)は、従来手法における、基準画素とその周辺に関する影響力を示した図である。また(b)は、基準ブロックとその周辺のブロックとの影響力の関係を示した図である。 図18(a)のシード反映画像において、第2の局所領域中の画素が指定領域に含まれるとした例を示している。 画素設定部が画像において画素中の中心の一画素が指定領域に含まれるとしたときを示している。 第2の実施形態における領域検出部の動作について説明したフローチャートである。 (a)は、領域分離を行なった際に、領域の境界が、粗くなった場合を示した図である。(b)は、境界領域付近のラベルや強さをリセットした未知領域を設定した場合を示した図である。(c)は、領域の境界が滑らかになる領域分離結果を得た場合を示した図である。 前景として写る床と、床以外の後景とからなる写真の画像において、シード1およびシード2を設定した場合を示している。 過剰な検出や検出不足が伴う切り抜き結果について示した図である。 指定領域をより精度よく切り出すことができた切り抜き結果について示した図である。 画像処理装置のハードウェア構成を示した図である。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<画像処理システム全体の説明>
図1は、本実施の形態における画像処理システム1の構成例を示す図である。
図示するように本実施の形態の画像処理システム1は、表示装置20に表示される画像の画像情報に対し画像処理を行なう画像処理装置10と、画像処理装置10により作成された画像情報が入力され、この画像情報に基づき画像を表示する表示装置20と、画像処理装置10に対しユーザが種々の情報を入力するための入力装置30とを備える。
画像処理装置10は、例えば、所謂汎用のパーソナルコンピュータ(PC)である。そして、画像処理装置10は、OS(Operating System)による管理下において、各種アプリケーションソフトウェアを動作させることで、画像情報の作成等が行われるようになっている。
表示装置20は、表示画面21に画像を表示する。表示装置20は、例えばPC用の液晶ディスプレイ、液晶テレビあるいはプロジェクタなど、加法混色にて画像を表示する機能を備えたもので構成される。したがって、表示装置20における表示方式は、液晶方式に限定されるものではない。なお、図1に示す例では、表示装置20内に表示画面21が設けられているが、表示装置20として例えばプロジェクタを用いる場合、表示画面21は、表示装置20の外部に設けられたスクリーン等となる。
入力装置30は、キーボードやマウス等で構成される。入力装置30は、画像処理を行なうためのアプリケーションソフトウェアの起動、終了や、詳しくは後述するが、画像処理を行なう際に、ユーザが画像処理装置10に対し画像処理を行なうための指示を入力するのに使用する。
画像処理装置10および表示装置20は、DVI(Digital Visual Interface)を介して接続されている。なお、DVIに代えて、HDMI(登録商標)(High-Definition Multimedia Interface)やDisplayPort等を介して接続するようにしてもかまわない。
また画像処理装置10と入力装置30とは、例えば、USB(Universal Serial Bus)を介して接続されている。なお、USBに代えて、IEEE1394やRS−232C等を介して接続されていてもよい。
このような画像処理システム1において、表示装置20には、まず最初に画像処理を行なう前の画像である原画像が表示される。そしてユーザが入力装置30を使用して、画像処理装置10に対し画像処理を行なうための指示を入力すると、画像処理装置10により原画像の画像情報に対し画像処理がなされる。この画像処理の結果は、表示装置20に表示される画像に反映され、画像処理後の画像が再描画されて表示装置20に表示されることになる。この場合、ユーザは、表示装置20を見ながらインタラクティブに画像処理を行なうことができ、より直感的に、またより容易に画像処理の作業を行える。
なお本実施の形態における画像処理システム1は、図1の形態に限られるものではない。例えば、画像処理システム1としてタブレット端末を例示することができる。この場合、タブレット端末は、タッチパネルを備え、このタッチパネルにより画像の表示を行なうとともにユーザの指示が入力される。即ち、タッチパネルが、表示装置20および入力装置30として機能する。また同様に表示装置20および入力装置30を統合した装置として、タッチモニタを用いることもできる。これは、上記表示装置20の表示画面21としてタッチパネルを使用したものである。この場合、画像処理装置10により画像情報が作成され、この画像情報に基づきタッチモニタに画像が表示される。そしてユーザは、このタッチモニタをタッチ等することで画像処理を行なうための指示を入力する。
<画像処理装置の説明>
図2は、本実施の形態における画像処理装置10の機能構成例を表すブロック図である。なお図2では、画像処理装置10が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
図示するように本実施の形態の画像処理装置10は、画像情報取得部11と、ユーザ指示受付部12と、領域検出部13と、領域切替部14と、画像処理部15と、画像情報出力部16とを備える。
画像情報取得部11は、画像処理を行なう画像の画像情報を取得する。即ち、画像情報取得部11は、画像処理を行なう前の原画像の画像情報を取得する。この画像情報は、表示装置20で表示を行なうための、例えば、RGB(Red、Green、Blue)のビデオデータ(RGBデータ)である。
ユーザ指示受付部12は、位置情報取得部の一例であり、入力装置30により入力された画像処理に関するユーザによる指示を受け付ける。
具体的には、ユーザ指示受付部12は、表示装置20で表示している画像の中から、ユーザが特定の画像領域として指定した指定領域を指定する指示をユーザ指示情報として受け付ける。この特定の画像領域は、この場合、ユーザが画像処理を行なう画像領域である。実際には、本実施の形態では、ユーザ指示受付部12は、ユーザ指示情報として、ユーザが入力した指定領域の代表位置を表す位置情報を取得する。
また詳しくは後述するが、ユーザ指示受付部12は、ユーザが、この指定領域の中から実際に画像処理を行なうものを選択する指示をユーザ指示情報として受け付ける。さらにユーザ指示受付部12は、選択された指定領域に対し、ユーザが画像処理を行う処理項目や処理量等に関する指示をユーザ指示情報として受け付ける。これらの内容に関するさらに詳しい説明については後述する。
本実施の形態では、指定領域を指定する作業を下記に説明するユーザインタラクティブに行う方法を採用する。
図3は、指定領域を指定する作業をユーザインタラクティブに行う方法の例を示した図である。
図3では、表示装置20の表示画面21で表示している画像が、人物と、人物の背後に写る背景とからなる写真の画像Gである場合を示している。そしてユーザが、前景として人物の顔の部分、および後景として顔以外の部分をそれぞれ指定領域として選択する場合を示している。即ち、この場合指定領域は2つある。以後、顔の部分の指定領域を「第1の指定領域」、顔以外の部分の指定領域を「第2の指定領域」と言うことがある。
そしてユーザは、指定領域のそれぞれに対し代表となる軌跡をそれぞれ与える。この軌跡は、入力装置30により入力することができる。具体的には、入力装置30がマウスであった場合は、マウスを操作して表示装置20の表示画面21で表示している画像Gをドラッグし軌跡を描く。また入力装置30がタッチパネルであった場合は、ユーザの指やタッチペン等により画像Gをなぞりスワイプすることで同様に軌跡を描く。なお軌跡ではなく、点として与えてもよい。即ち、ユーザは、頭髪の部分などのそれぞれの指定領域に対し代表となる位置を示す情報を与えればよい。これは指定領域の代表位置を表す位置情報をユーザが入力する、と言い換えることもできる。なお以後、この軌跡や点等を「シード」と言うことがある。
図3の例では、顔の部分と顔以外の部分にそれぞれシードが描かれている。なお以後、前景である顔の部分に描かれたシードを「シード1」、後景である顔以外の部分に描かれたシードを「シード2」ということがある。
領域検出部13は、シードの位置情報に基づき、表示装置20で表示されている画像の中から指定領域を検出する。詳しくは後述するが、領域検出部13は、指定領域に属する画素の周囲のテクスチャと指定領域に含まれるか否かを判断する対象である画素の周囲のテクスチャとの類似度を基に指定領域を検出する。
領域検出部13が、シードの位置情報を基にして指定領域を切り出すには、まずシードが描かれた箇所の画素に対しラベルを付加する。図3の例では、顔の部分に描かれたシード1に対応する画素に「ラベル1」を、顔以外の部分に描かれたシード2に対応する画素に「ラベル2」を付加する。本実施の形態では、このようにラベルを付与することを「ラベル付け」と言う。
図4(a)〜(c)は、図3で示した画像Gについて、領域拡張方法により指定領域が切り出される様子を示している。
このうち図4(a)は、図3と同様の図であり、画像Gにシードとしてシード1およびシード2が描かれた状態を示している。
そして図4(b)で示すように、シードが描かれた箇所から指定領域内に領域が拡張していき、図4(c)で示すように最後に指定領域として2つの指定領域である第1の指定領域S1、第2の指定領域S2が切り出される。
以上のような方法を採用することで、指定領域が複雑な形状であっても、ユーザは、より直感的に、またより容易に指定領域が切り出せる。
領域切替部14は、複数の指定領域を切り替える。即ち、指定領域が複数存在した場合、ユーザが画像調整を行ないたい指定領域の選択を行ない、これに従い、領域切替部14が指定領域を切り替える。
図5(a)〜(b)は、ユーザが指定領域の選択を行なうときに、表示装置20の表示画面21に表示される画面の例を示している。
図5(a)〜(b)に示した例では、表示画面21の左側に指定領域が選択された状態の画像Gが表示され、表示画面21の右側に領域1または領域2の何れかを選択するラジオボタン212a、212bが表示される。この場合、領域1は、第1の指定領域S1に、領域2は、第2の指定領域S2に対応する。そしてユーザが入力装置30を使用して、このラジオボタン212a、212bを選択すると、指定領域が切り替わる。
図5(a)は、ラジオボタン212aが選択されている状態であり、指定領域として、顔の部分の画像領域である第1の指定領域S1が選択されている。そしてユーザがラジオボタン212bを選択すると、図5(b)に示すように指定領域として、顔の部分以外の画像領域である第2の指定領域S2に切り替わる。
実際には、図5で説明を行なった操作の結果は、ユーザ指示情報としてユーザ指示受付部12により取得され、さらに領域切替部14により指定領域の切り替えが行なわれる。
画像処理部15は、選択された指定領域に対し実際に画像処理を行なう。
図6は、画像処理を行なう際に、表示装置20の表示画面21に表示される画面の例を示している。
ここでは、選択された指定領域に対し、色相、彩度、輝度の調整を行なう例を示している。この例では、表示画面21の左上側に指定領域が選択された状態の画像Gが表示され、表示画面21の右上側に領域1および領域2の何れかを選択するラジオボタン212a、212bが表示される。ここでは、ラジオボタンのうち212aが選択されており、指定領域として、顔の部分の画像領域である第1の指定領域S1が選択されている。なおラジオボタン212a、212bを操作することで、指定領域の切り替えが可能であることは、図5の場合と同様である。
また表示画面21の下側には、色相、彩度、輝度の調整を行なうためのスライドバー213aと、スライダ213bが表示される。スライダ213bは、入力装置30の操作によりスライドバー213a上において図中左右に移動し、スライドが可能である。スライダ213bは、初期状態ではスライドバー213aの中央に位置し、この位置において色相、彩度、輝度の調整前の状態を表す。
そしてユーザが、入力装置30を使用して、色相、彩度、輝度の何れかのスライダ213bをスライドバー213a上で図中左右にスライドさせると、選択された指定領域に対し画像処理がなされ、表示画面21で表示される画像Gもそれに対応して変化する。この場合、図中右方向にスライダ213bをスライドさせると、対応する色相、彩度、輝度の何れかを増加させる画像処理がなされる。対して図中左方向にスライダ213bをスライドさせると、対応する色相、彩度、輝度の何れかを減少させる画像処理がなされる。
図2に戻り、画像情報出力部16は、以上のように画像処理がなされた後の画像情報を出力する。画像処理がなされた後の画像情報は、表示装置20に送られる。そして表示装置20にてこの画像情報に基づき画像が表示される。
<領域検出部の説明>
次に領域検出部13が領域拡張方法により指定領域を切り出す方法についてさらに詳しく説明を行なう。
ここではまず従来の領域拡張方法についての説明を行なう。
図7(a)〜(c)は、従来の領域拡張方法について説明した図である。
このうち図7(a)は、原画像であり、縦3画素、横3画素の3×3=9画素の領域からなる。この原画像は、2つの画像領域から構成される。図7(a)では、それぞれの画素の色の濃さの違いによりこの2つの画像領域を表している。それぞれの画像領域に含まれる画素値は互いに近い値を示すものとする。
そして図7(b)に示すように、2行1列に位置する画素にシード1を、1行3列に位置する画素にシード2を与える。
このとき中央の画素である2行2列に位置する画素が、シード1が含まれる指定領域に属するか、シード2が含まれる指定領域に属するか否かを判定する場合を考える。ここでは、この中央の画素について、中央の画素の画素値と、中央の画素に接する周辺8画素の中に存在するシードの画素値を比較する。そして画素値が近ければ、中央の画素は、そのシードが含まれる指定領域に含まれると判定する。この場合、周辺8画素の中には、シード1とシード2の2つのシードが含まれるが、中央の画素の画素値は、シード1の画素値よりシード2の画素値とより近いため、シード1が含まれる指定領域に属すると判定される。
そして図7(c)に示すように、中央の画素は、シード1の領域に属するようになる。そして中央の画素は、今度は、新たなシードとして扱われる。そしてこの場合、中央の画素は、シード1と同じ、「ラベル1」にラベル付けされる。
従来の領域拡張方法では、シードの画素に接する画素を指定領域に含まれるか否かの判定の対象となる対象画素として選択し(上述した例では、中央の画素)、この対象画素の画素値と、対象画素の周辺8画素の画素に含まれるシードの画素値とを比較する。そして対象画素は、画素値が近いシードに含まれる領域に属すると考え、ラベル付けをする。さらにこれを繰り返すことで領域を拡張していくのが基本的な考え方となる。
図8−1(a)〜(e)は、従来の領域拡張方法を使用し、2つのシードが与えられた場合に、画像が2つの指定領域に分けられる様子を示した図である。
ここでは図8−1(a)の原画像に対し、図8−1(b)で示すように、シードとしてシード1とシード2の2つを与える。そして各々のシードを基点に領域を拡張していく。この場合、上述したように原画像における周辺画素の画素値との近さ等に応じて領域を拡張していくことができる。このとき図8−1(c)に示すように領域同士のせめぎ合いがある場合は、再判定の対象画素となり、再判定の対象画素の画素値と近傍の画素値との関係でどちらの領域に属するかを決めればよい。このとき、下記文献に記載されている方法を使うことができる。
V.Vezhnevets and V.Konouchine: "Grow-Cut" -Interactive Multi-label N-D Image Segmentation", Proc.Graphicon.pp 150-156(2005)
図8−1(d)の例では、再判定の対象画素は、最終的にはシード2の領域として判定され、図8−1(e)に示すように2つのシードを基に、2つの領域に切り分けられて収束する。なおこの例では、2つの領域に切り分ける場合を示したが、3つ以上のシードを与え、3つ以上の領域に切り分けることもできる。
このように従来の領域拡張方法では、対象画素に着目し、対象画素の画素値に対して周辺8画素にあるシードの画素の画素値を比較して対象画素が属する指定領域を決定する。
しかしながら従来の領域拡張方法では、画素を対象画素として1つずつ選択し、ラベル付けを行なっていく必要があり、処理速度が遅くなりやすい問題がある。また領域が入り組んでいる箇所などでは、切り分けの際の精度が低くなりやすい。この問題を解決するため、例えば、以下に説明するような領域拡張方法も存在する。
この領域拡張方法では、シード1やシード2の画素である基準画素を中心としてそれぞれ予め定められた第1の範囲を設定する。そしてこの第1の範囲内において、基準画素を除く画素を対象画素とし、この対象画素について、画素の「強さ」を利用してシード1が含まれる指定領域やシード2が含まれる指定領域に属するとの判断を行なう。
図8−2は、第1の範囲について説明した図である。
図示するように、2つの画像領域のそれぞれに基準画素であるシード1およびシード2が選択されている。そしてさらにこのシード1とシード2を中心に位置するようにして縦5画素×横5画素の範囲を第1の範囲とする。図では、この範囲を太線の枠内の範囲として表示している。
「強さ」は、ラベルに対応する指定領域に属する強さであり、ある画素がラベルに対応する指定領域に属する可能性の大きさを表す。強さが大きいほどその画素がラベルに対応する指定領域に属する可能性が高く、強さが小さいほどその画素がラベルに対応する指定領域に属する可能性が低い。強さは、次のようにして定まる。
まずユーザが最初に指定した代表位置に含まれる画素の強さは、初期値として1となる。つまり領域を拡張する前のシード1やシード2の画素は、強さが1である。またまだラベル付けがされていない画素については、強さは0である。
そして強さが与えられた画素が周辺の画素に及ぼす影響力を考える。
図8−3(a)〜(b)は、影響力を決定する方法について示した図である。図8−3(a)〜(b)において、横軸は、ユークリッド距離dを表し、縦軸は、影響力を表す。
このユークリッド距離dは、強さを与えられた画素とその画素の周辺に位置する画素との間で決まる画素値のユークリッド距離dである。画素値がRGB値で表される場合、ユークリッド距離dは、以下の数1式のように表すことができる。数1式では、強さを与えられた画素の画素値を(R、G、B)とし、周辺に位置する画素の画素値を(R、G、B)とした場合のユークリッド距離dを示している。
Figure 0006930099
そして例えば、図8−3(a)に図示するように非線形の単調減少関数を定め、ユークリッド距離dに対し、この単調減少関数により決まる値を影響力とする。
つまりユークリッド距離dが小さいほど、影響力はより大きくなり、ユークリッド距離dが大きいほど、影響力はより小さくなる。
なお単調減少関数は、図8−3(a)のような形状のものに限られるものではなく、単調減少関数であれば特に限られるものではない。よって図8−3(b)のような線形の単調減少関数であってもよい。またユークリッド距離dの特定の範囲で線形であり、他の範囲で非線形であるような区分線形の単調減少関数であってもよい。
そして指定領域に属すると判断された画素の強さは、基準画素の強さに影響力を乗じたものとなる。例えば、基準画素の強さが1で、その左側に隣接する対象画素に与える影響力が0.9だった場合、この左側に隣接する対象画素が指定領域に属すると判断されたときに与えられる強さは、1×0.9=0.9となる。また例えば、基準画素の強さが1で、その2つ左側に隣接する対象画素に与える影響力が0.8だった場合、この対象画素が指定領域に属すると判断されたときに与えられる強さは、1×0.8=0.8となる。
以上の計算方法を利用し、第1の範囲内の対象画素に与えられている強さにより判断を行なうこともできる。このとき対象画素が、ラベルを有しない場合は、基準画素が属する指定領域に含まれると判断し、対象画素が他の指定領域についてのラベルを既に有する場合は、強さが大きい方の指定領域に含まれると判断する。そして前者の場合は、全て基準画素と同じラベル付けを行なう。また後者の場合は、特性のうち強さが強い方のラベル付けを行う。
図8−4は、図8−2で示す第1の範囲内の対象画素について、強さを基にした方法で判断を行なった結果を示している。
図8−2に示す第1の範囲は、シード1とシード2とで一部重なる。そして第1の範囲が、重ならない箇所、即ち、シード1とシード2とで競合しない箇所では、この場合、ラベル付けされていないもので、全て基準画素であるシード1またはシード2と同じラベル付けを行なう。一方、第1の範囲が、シード1とシード2とで重なる箇所、即ち、競合する箇所では、強さが強い方のラベル付けをする。その結果、図8−4に示すようにラベル付けがなされる。
図8−5(a)〜(h)は、図8−3〜図8−4で説明した領域拡張方法で順次ラベル付けがされていく過程の例を示した図である。
図8−5(a)は、このときシードの画素に対し設定される第1の範囲を示している。つまり基準画素であるシード1およびシード2が選択されている。そしてさらにこのシード1とシード2を中心に位置するようにして縦3画素×横3画素の範囲を第1の範囲としている。図では、この第1の範囲を太線の枠内の範囲として表示している。
本実施の形態では、図8−5(b)に示すように2行2列の位置に設定されるシード2を起点とし、まず第1の範囲内の対象画素が何れの指定領域に属するか否かを判断する。そして図8−5(c)〜(d)に示すように基準画素を図中右側に一画素ずつ移動させつつ、第1の範囲内の対象画素が何れの指定領域に属するか否かを判断していく。この判断は、上述した強さによりなされる。
そして図中右端までを対象画素として判断した後は、次に基準画素を第3列に移し、同様に基準画素を図中右側に一画素ずつ移動させつつ、第1の範囲内の対象画素が何れの指定領域に属するか否かを判断していく。そして図中右端までを対象画素として判断した後は、さらに次の列に移る。これは図8−5(e)〜(g)に示すように繰り返され、図中右下端部に基準画素が移動するまで行なわれる。つまり基準画素を一画素毎に走査するように移動させつつ判断を行なう。
さらに右下端部に基準画素が達し、画素の移動がこれ以上できなくなった後は、上述した場合と逆向きに基準画素を移動させ、基準画素が左上端部に移動するまで同様の処理を行なう。これで基準画素が1回往復移動したことになる。さらに以後、収束するまでこの基準画素の往復移動を繰り返す。
そして最終的には、図8−5(h)に示すように、第1の指定領域と第2の指定領域に切り分けが行なわれる。
以上の方法で領域拡張を行うことで、速度の向上や切り抜き境界の精度を高めることができる。しかしこの方法でも、画素間の色の距離を基に領域を拡張している。そのため指定領域外の領域であっても類似色を有する領域について誤ったラベル付けがなされ、同じ指定領域であるとする場合がある。
そこで本実施の形態では、領域検出部13を以下の構成とし、類似色を有する画素間であっても、誤ったラベル付けが行われることを抑制し、切り抜き境界の精度の向上を図る。
[第1の実施形態]
まず領域検出部13の第1の実施形態について説明を行なう。
図9は、第1の実施形態における領域検出部13の機能構成例を表すブロック図である。
図示するように本実施の形態の領域検出部13は、画素選択部131と、局所領域設定部132と、類似度算出部133と、判断部134と、特性変更部135と、収束判定部136とを備える。
第1の実施形態において、画素選択部131は、指定領域に属する画素の中から基準画素を選択する。ここで「指定領域に属する画素」は、例えば、ユーザが指定した代表位置に含まれる画素、即ち、上述したシードの画素である。またこれには、領域拡張により新たにラベル付けされた画素も含まれる。ここでは画素選択部131は、基準画素として指定領域に属する画素の中から1つの画素を選択する。
また画素選択部131は、基準画素に対し設定され、指定領域に含まれるか否かを判断する対象である周辺画素を選択する。ここでは画素選択部131は、周辺画素として基準画素の周辺にある画素の中から1つの画素を選択する。周辺画素は、シードが付与されていない画素から選択する。
局所領域設定部132は、基準画素の周囲のテクスチャを算出するための範囲として第1の局所領域を設定する。また局所領域設定部132は、周辺画素の周囲のテクスチャを算出するための範囲として第2の局所領域を設定する。
図10は、第1の局所領域および第2の局所領域について説明した図である。
図示する例では、基準画素をPとし、周辺画素をPとしている。そして基準画素Pを中心に位置するようにして、縦5画素×横5画素の範囲を第1の局所領域Rとしている。同様に周辺画素Pを中心に位置するようにして、縦5画素×横5画素の範囲を第2の局所領域Rとしている。図では、これらの範囲を太線の枠内の範囲として表示している。
類似度算出部133は、基準画素Pの周囲である第1の局所領域R内のテクスチャと周辺画素Pの周囲である第2の局所領域R内のテクスチャとの類似度を算出する。ここでテクスチャが類似するとは、それぞれの局所領域全体が作り出す印象が類似することである。例えば、木材からなる床と同様に木材からなる椅子を含む画像があった場合、色彩としては同じ茶色である。しかしこれらの表面の質感は異なり、その結果、人が受ける印象は異なる。本実施の形態では、この印象の類似度をテクスチャの類似度として算出する。さらに具体的には、テクスチャの類似度は、それぞれの局所領域内の全画素の特徴量の類似度として抽出できる。この特徴量は、例えば、局所領域内に含まれる画素の画素値、画素値の平均値、画素値の分散、画像の周波数スペクトル、繰り返しパターンなどである。以上のように、局所領域R内および局所領域R内において、輝度の高低差、輝度の頻度、輝度発生の規則、さらには色度等において同様のパターンが見られるような場合、テクスチャ類似度が大きいとし、ここでは、例えば、以下のようにして類似度を算出する。
第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとの類似度をsとすると、類似度sは、例えば、下記数2式で算出できる。数2式では、第1の局所領域R内や第2の局所領域R内の画素位置の座標を(x、y)で表わしている。そして第1の局所領域R内の画素位置(x、y)における画素値をI(x、y)とし、第2の局所領域R内の画素位置(x、y)における画素値をI(x、y)とした場合の類似度sを求めている。なおここでは画素値として、輝度成分Iのみを使用している。
Figure 0006930099
なお数2式では、画素値の差の2乗を利用して類似度sを算出しているが、下記数3式のように画素値の差の絶対値を利用して類似度sを算出してもよい。また他にもテクスチャの類似度を表すものであれば、いかなる指標でもよい。
Figure 0006930099
つまり局所領域を画素数分の次元(この場合、5×5=25次元)を有する多次元ベクトルを考え、類似度sは、第1の局所領域Rおよび第2の局所領域Rの画素値から求まる2つの多次元ベクトル間の距離に基づく量であると考えることもできる。また数2式および数3式における類似度sは、値が小さいほど第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとが類似していることを意味する。また値が大きいほど第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとが類似していないことを意味する。
ここで各画素の色データがRGBデータである場合は、例えばLデータやYCbCrデータなどの輝度色差空間に変換し、輝度成分のLやYなどをI(x、y)やI(x、y)にしてもよい。また、輝度成分としてHSVデータのVなどでもよい。また輝度成分に限らず、色度や彩度を表す値でもよい。例えば、HSVデータであればSやHを用いてもよい。またLデータでは、下記数4式により算出される値を用いてもよく、YCbCrデータでは、下記数5式により算出される値を用いてもよい。即ち、輝度、色度、彩度の程度を表すものであればどのような基準でもよく、これをI(x、y)やI(x、y)の画素値とすればよい。
Figure 0006930099
Figure 0006930099
判断部134は、類似度算出部133が算出したテクスチャの類似度により、周辺画素Pが指定領域に含まれるか否かを判断する。
判断部134は、例えば、閾値θを設け、数6式に示すように類似度sが閾値θより小さい場合は、周辺画素Pが、基準画素Pと同じ指定領域に属すると判断する。また類似度sが閾値θ以上である場合は、周辺画素Pが、基準画素Pと同じ指定領域に属さないと判断する。
Figure 0006930099
また閾値θは、固定値に限られるものではなく、画像に応じて変化させてもよい。また閾値θは、基準画素Pや周辺画素Pの画像中における位置に応じて変化させてもよい。
または、判断部134は、上述した強さを基にした方法で判断を行なってもよい。例えば、基準画素Pは、前述のように、シードまたは更新によってラベル付けがされた画素であるので強さを1としておき、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとの類似度sから、図8−3で説明した方法で影響力を算出する(ただしこの場合、横軸はユークリッド距離dではなく、類似度sとなる)。そして基準画素Pの強さと影響力によって、周辺画素Pに強さが伝搬されるようにしてもよい。仮に、基準画素Pが持つ強さをuとし、基準画素Pから周辺画素Pへの影響力をw12とすると、u12が周辺画素Pに伝搬される強さとなる。
下記数7式の条件を満たすかどうかで、ラベル付けをするか否かの判断をおこなってもよい。数6式では、類似度が小さいほど指定領域に属すことになるが、数7式の場合は、強さを基に判断しているので、強さu12が、閾値θを超えることが、判断部134が、周辺画素Pが、基準画素Pと同じ指定領域に属する(ラベル付けする)と判断する基準となる。なお強さu12が、閾値θ以下である場合は、判断部134は、周辺画素Pが、基準画素Pと同じ指定領域に属さないと判断し、ラベル付けは行なわない。また閾値θは、前述と同様、固定値に限らず、基準画素Pや周辺画素Pの画像中における位置に応じて変化させてもよい。
Figure 0006930099
なお図10の場合は、閾値θの値にもよるが、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとは類似せず(類似度sが大きく、伝搬される強さは小さい)、周辺画素Pが、基準画素Pと同じ指定領域に属しないと判断される場合である。
図11および図12は、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとは類似し(類似度sが小さく)、周辺画素Pが、基準画素Pと同じ指定領域に属すると判断される場合を示した図である。
例えば、図12では、基準画素Pと周辺画素Pの画素値(この場合、輝度値)は大きく異なるが、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとが類似するため、周辺画素Pが、基準画素Pと同じ指定領域に属すると判断される。
判断部134を以上のように動作させることで、与えたシードに対して、自動でシードを拡散する効果がある。
特性変更部135は、周辺画素Pに対し付与される特性を変更する。
ここで特性とは、その画素に付与されるラベルや強さのことを言い、前述のように、シードとなっている基準画素Pの強さは1で、周辺画素Pの強さは伝搬されたu12となる(ここでは例えば、これをuとする)。
ラベルは、上述したようにその画素が何れの指定領域に属するかを表すものであり、指定領域1に属する画素は、ラベル1、指定領域2に属する画素は、ラベル2が付与される。ここではシード1のラベルはラベル1、シード2のラベルはラベル2となるので、判断部134で指定領域1に属する画素と判断された場合は、周辺画素Pは、ラベル1にラベル付けされる。また判断部134で指定領域2に属する画素と判断された場合は、周辺画素Pは、ラベル2にラベル付けされる。ここで、数7式の場合は、閾値θによってラベルを決定していたが、もし周辺画素Pにラベル付けがされていなければ、そのまま基準画素Pのラベルとし、u12を周辺画素Pの強さuとしてもよい。またこの後で、他から伝搬されてきた強さがuより大きかった場合は、強い方の強さとラベルに変えていき、これを繰り返して収束させてもよい。
なお周辺画素Pは、画像中における基準画素P以外の全ての画素について順次選択され、選択された周辺画素Pについて基準画素Pと同じ指定領域に属するか否かが判断される。さらに基準画素Pについてもシードが付与される画素について同様に順次選択されていく。この処理は、基準画素Pや周辺画素Pの選択は、画素選択部131が順次行なっていく。
そしてこの一連の処理は収束するまで繰り返し行なわれる。即ち、新たに指定領域1や指定領域2に属すると判断された画素は、新たに基準画素Pとして選択され、さらに周辺画素Pが選択されて周辺画素Pについて、指定領域1や指定領域2に属するかの判断が行なわれることになる。この処理を繰り返し、更新していくことで、ラベル付けの特性変更がされる領域は順次拡張されていき、指定領域1および指定領域2の切り出しが行なえる。なおこの方法によれば、上述したように、いったんあるラベルにラベル付けされた画素についても、他のラベルに変更されることがあり得る。
収束判定部136は、上記一連の処理が収束したか否かを判定する。
収束判定部136は、例えば、ラベルが変更される画素がなくなった、または、強さが変わらなくなったときに収束したと判定する。また予め最大更新回数を定めておき、最大更新回数に達したときに収束したものとみなすこともできる。
次に第1の実施形態における領域検出部13の動作について説明を行なう。
図13は、第1の実施形態における領域検出部13の動作について説明したフローチャートである。
まず画素選択部131が、指定領域に属する画素の中から基準画素Pを選択する(ステップ101)。さらに画素選択部131は、基準画素Pに対し設定され、指定領域に含まれるか否かを判断する対象である周辺画素Pを選択する(ステップ102)。
次に局所領域設定部132が、基準画素Pの周囲のテクスチャを算出するための範囲として第1の局所領域Rを設定する(ステップ103)。さらに局所領域設定部132は、周辺画素Pの周囲のテクスチャを算出するための範囲として第2の局所領域Rを設定する(ステップ104)。
そして類似度算出部133が、基準画素Pの周囲である第1の局所領域R内のテクスチャと周辺画素Pの周囲である第2の局所領域R内のテクスチャとの類似度を算出する(ステップ105)。これは例えば、上述した数1式や数2式により算出することができる。また判断部134が強さを基に判断を行なう場合は、さらに基準画素Pの強さと影響力を基に周辺画素Pに伝搬される強さを算出する。
次に判断部134は、類似度算出部133が算出したテクスチャの類似度あるいは強さにより、周辺画素Pが指定領域に含まれるか否かを判断する(ステップ106)。
その結果、周辺画素Pが指定領域に含まれると判断された場合(ステップ106でYes)、特性変更部135が、周辺画素Pに対し付与される特性としてラベルを変更する(ステップ107)。また判断部134が強さを基に判断を行なった場合は、特性変更部135は、周辺画素Pに対し付与される特性としてさらに強さを変更する。
ステップ107の後、および周辺画素Pが指定領域に含まれないと判断された場合(ステップ106でNo)、収束判定部136が、上記一連の処理が収束したか否かを判定する(ステップ108)。
その結果、処理が収束した場合(ステップ108でYes)、全ての処理を終了する。
対して処理が収束していない場合(ステップ108でNo)、ステップ101に戻り、新たに基準画素Pや周辺画素Pを選択し、収束するまで周辺画素Pが指定領域に含まれるか否かが判断されていく。
[第2の実施形態]
次に領域検出部13の第2の実施形態について説明を行なう。
図14は、第2の実施形態における領域検出部13の機能構成例を表すブロック図である。
図示するように本実施の形態の領域検出部13は、画像分割部137と、シード反映部138と、局所領域設定部132と、類似度算出部133と、判断部134と、画素設定部139と、特性変更部135と、収束判定部136とを備える。
図14に示した領域検出部13は、図9に示した領域検出部13と比較して、画素選択部131が存在しない。一方、画像分割部137、シード反映部138および画素設定部139が加わっている。
画像分割部137は、シードが設定された画像をブロック毎に分割する。
図15は、シードが設定された画像Gを表す。ここでは、画像Gに、シード1、シード2、シード3が設定されている。
また図16(a)は、シードが設定された画像Gを分割した例を示している。
ここではシードが設定された画像Gは、図16(b)に示す3画素×3画素からなるブロックB毎に分割されている。なおここでは3画素×3画素=9画素からなるブロックBを設定したが、これに限られるものではない。例えば、n画素×n画素、n画素×m画素(n、mは1以上の整数、ただしn、mは少なくとも一方が2以上である)であってもよい。
シード反映部138は、代表位置反映部の一例であり、ブロックBを一画素とした画像に対し、シードを反映させる。
図17(a)〜(b)は、シード反映部138の動作について説明した図である。
ここで図17(a)は、図16(a)と同様の図であり、シードが設定された画像GをブロックB毎に分割した例を示している。また図17(b)は、ブロックBを一画素とし、画像Gでシードが設定された画素を含むブロックBには、シードを付与することで、シードを反映させたシード反映画像Gを示している。この場合、画像Gに、シード1、シード2、シード3を反映した場合を示している。その結果、このシード反映画像Gには、図17(a)と同様にシード1、シード2、シード3が設定される。この場合、図17(b)で示したシード反映画像Gは、図17(a)で示した画像Gを縮小したものであると見ることができる。
局所領域設定部132は、ブロックBを単位としテクスチャを算出するための範囲として第1の局所領域Rを設定する。ここではシード反映画像Gのシードが反映された画素の中から一画素を選択し、これを第1の局所領域Rとする。シード反映画像Gの一画素は、画像Gでは、3画素×3画素=9画素の画素からなるブロックBであるため、これを画像Gにおける局所領域とみなすことができる。同様に、局所領域設定部132は、ブロックBを単位としテクスチャを算出するための範囲として第2の局所領域Rを設定する。即ち、シード反映画像Gにおいて第1の局所領域Rとして選択された一画素の周囲の一画素をさらに選択する。これはシード反映画像Gにおいてシードが反映されなかった画素の中から選択される。そしてこれを第2の局所領域Rとする。なおここではブロックBを1つ選択したが、複数選択して第1の局所領域Rや第2の局所領域Rとしてもよい。
図18(a)は、シード反映画像Gにおいて、第1の局所領域Rと第2の局所領域Rとを設定した例を示している。第1の局所領域Rは、シード反映画像Gでは、一画素となるが、第1の局所領域Rは、図18(b)に示すように画像Gでは、3画素×3画素=9画素からなる。同様に第2の局所領域Rは、図18(c)に示すように画像Gでは、3画素×3画素=9画素からなる。
類似度算出部133は、画像Gの画素値を用い、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとの類似度を算出する。
判断部134は、類似度算出部133が算出したテクスチャの類似度により、第2の局所領域R中の画素が指定領域に含まれるか否かを判断する。そして指定領域に含まれれば、その指定領域に含まれるシードが表す指定領域のラベルが付与される。この判断は、第1の実施形態の場合と同様の考えでよく、類似度sを基に行なうことができる。また類似度sから強さを算出しこの強さにより判断してもよい、または、ラベル付けに関しても、第1の実施形態と同様に行うことができる。
第2の実施形態では、画素をブロック化し、ブロックB単位の関係性を利用する、つまりは、基準となるブロックBとその周辺ブロックBとの関係(近さ)を利用することがポイントとなる。
図19(a)は、従来手法における、基準画素Pとその周辺画素Pに関する影響力を示したものであり、太い線ほど画素の色が近く影響力が大きいことを表す。この影響力は、前述の図8−3で説明したものである。そして図19(a)と同様にして、本実施の形態では、これをブロックBの場合に拡張することができ、例えば、図19(a)の1画素を3×3の1ブロックに置き換えると、基準のブロックBとその周辺のブロックBとの影響力の関係は、図19(b)に示すようになる。ここでは、太い線ほどブロックBとブロックBとの間の影響力が大きいことを表す。
第1の実施形態では、ブロックB同士のつながりではなくてもよかったが、第2の実施形態は、図19(b)に示すように1つのブロックBを1画素のように捉え、影響力を導入した例である。図19(b)からわかるように、中央の基準のブロックBの輝度発生特徴に対して、周辺のブロックBとの関係をみると、中央の基準のブロックBの右の列に位置する3つのブロックBと、真下の1つのブロックBとは、テクスチャが近いので太線で示されている(影響力が大きいことに相当)。また、それ以外のブロックBは、類似していないので細い線で示されている(影響力が小さいことに相当)。またここでは第1の局所領域Rや第2の局所領域Rを、1つのブロックBで構成した例を説明したが、第1の局所領域Rや第2の局所領域Rを、複数のブロックBで構成する場合は、複数のブロックB同士での関係となる。即ち、第1の局所領域Rと第2の局所領域Rとの関係となる。
ブロックBにシードの画素が含まれている場合のブロックBの強さを1とすれば、シードの拡散方法や、強さの更新方法は第1の実施形態の場合と同様に行うことができ、また、ブロックBを画素と見立てれば、図8−5と同じ考えでラベル付けや、特定の領域の切り抜きを行うことができる。この場合、1画素が持つ色の近さだけではない影響力を基にした強さを伝搬するので、人が領域を判断するのに近いラベル付けを行うことができる。
なお図17で示すようにブロック化した後、図19(b)で示す影響力の計算を最初に全ブロックBで行っておけば、この影響力は変化することがないので、全体の処理を高速に行うこともできる。
図20は、図18(a)のシード反映画像Gにおいて、第2の局所領域R中の画素が指定領域に含まれるとした例を示している。この場合、第2の局所領域Rは、シード2が属する指定領域に含まれるようになったことを示している。
画素設定部139は、類似度により第2の局所領域R内の画素が指定領域に含まれると検出したときに、第2の局所領域R内の何れの画素が指定領域に含まれるかを設定する。
つまり判断部134が、第2の局所領域R中の画素が指定領域に含まれると判断したとき、第2の局所領域R中の画素は、3画素×3画素=9画素ある。そのためこの中の何れの画素が指定領域に含まれるようにするかが問題となる。この場合、9画素中の何れか1画素を選択してもよく、複数の画素を選択してもよい。例えば、9画素中の中心の1画素としてもよく、9画素中の中から1画素以上をランダムに選択してもよい。また9画素全てが指定領域に含まれるとしてもよい。
図21は、画素設定部139が画像Gにおいて第2の局所領域R中の中心の一画素が指定領域に含まれるとしたときを示している。またこの場合、3つの画素が、シード2に含まれるようになったことを示している。
なお以後の特性変更部135、収束判定部136の動作は、第1の実施形態と同様である。第1の実施形態と同様、シードとして拡散させることもできれば、または、図17(b)のように、1つのブロックBを1画素とした画像と捉えれば、図8−5のように従来の伝搬方法で実施すれば、より精度の高い切り抜きや領域分離を行うことができる。
次に第2の実施形態における領域検出部13の動作について説明を行なう。
図22は、第2の実施形態における領域検出部13の動作について説明したフローチャートである。
まず画像分割部137は、シードが設定された画像をブロックB毎に分割する(ステップ201)。
次にシード反映部138が、ブロックBを一画素とした画像に対し、シードを反映させる(ステップ202)。これは図17で説明した方法により行うことができる。
そして局所領域設定部132が、ブロックBを単位としテクスチャを算出するための範囲として第1の局所領域Rを、シード反映画像Gのシードが反映された画素の中から設定する(ステップ203)。さらに局所領域設定部132は、ブロックBを単位としテクスチャを算出するための範囲として第2の局所領域Rをシード反映画像Gのシードが反映されなかった画素の中から設定する(ステップ204)。
次に類似度算出部133が、画像Gの画素値を用い、第1の局所領域Rのテクスチャと第2の局所領域Rのテクスチャとの類似度を算出する(ステップ205)。また判断部134が強さを基に判断を行なう場合は、さらに基準のブロックBの強さと影響力を基に周辺のブロックBに伝搬される強さを算出する。
また判断部134は、類似度算出部133が算出したテクスチャの類似度あるいは強さにより、第2の局所領域R中の画素が指定領域に含まれるか否かを判断する(ステップ206)。
その結果、第2の局所領域R中の画素が指定領域に含まれると判断された場合(ステップ206でYes)、画素設定部139が、第2の局所領域R内の何れの画素が指定領域に含まれるかを設定する(ステップ207)。そして特性変更部135が、画素設定部139が設定した画素に対し付与される特性としてラベルを変更する(ステップ208)。また判断部134が強さを基に判断を行なった場合は、特性変更部135は、画素設定部139が設定した画素に対し付与される特性としてさらに強さを変更する。
ステップ208の後、および第2の局所領域R中の画素が指定領域に含まれないと判断された場合(ステップ206でNo)、収束判定部136が、上記一連の処理が収束したか否かを判定する(ステップ209)。
その結果、処理が収束した場合(ステップ209でYes)、全ての処理を終了する。
対して処理が収束していない場合(ステップ209でNo)、ステップ202に戻り、新たに第1の局所領域Rや第2の局所領域Rを設定し、収束するまで第2の局所領域R中の画素が指定領域に含まれるか否かが判断されていく。
第2の実施形態の利用方法としては、例えば、2通りある。1つ目は、図21のようにシードを拡散させる目的で使用することであり、拡散した状態を収束とみなして一旦終了する。その後、ブロックBを解除して、今度は元のとおりの画素を有する画像Gとして考え、図8−2〜8−5に示すような強さの伝搬によって、領域を分離する方法である。
また、2つ目としては、図17(b)のようにブロック化した後、ブロックBを画素とみなし、この場合は、閾値による判断のみに依存するシードの拡散というよりは、強さ比較の更新ルールで収束させる伝搬を行って、収束した結果を領域分離の結果とする方法である。画像Gが大きいときはこれでもよい。
[第3の実施形態]
第2の実施形態で、シードの拡散のみならず、強さの更新に基づく収束方法で領域分離までを行った場合、画像Gの大きさやブロックBの大きさによっては、図23(a)に示すように、領域の境界が、粗くなることがある。
この場合は、図23(b)に示すように、境界領域付近のラベルや強さをリセットした未知領域Mを設定する。そしてブロックBを解除して、画素単位の構造に戻し、未知領域M以外のラベルを付した画素はシードとして利用する。さらに図19(a)で示した画素単位の影響力を用いて、これまでと同様に、図8−5で示した領域拡張方法で強さの伝搬を行えば、図23(c)のような領域の境界が滑らかになる領域分離の結果を得ることができる。
これは領域検出部13は、ブロックBを単位とした指定領域を検出した後に、ブロックBを単位とした指定領域の境界の領域において指定領域の設定を解除し、指定領域の設定を解除されなかった画素の中から選択された基準画素を基に指定領域の境界の領域において指定領域を再度検出する、と言うこともできる。
このような方法を使用する利点は、画像Gに対し、縮小画像を使用して処理することと等価になるので、より高速になる。また単に色の近さを比較する場合に比較してテクスチャの類似度を比較することで、影響力を計算する際の情報量が増えるので、従来よりも精度の高い領域分離が行えることにある。
以上説明した第1の実施形態〜第3の実施形態により、指定領域の切り出しを行なうことができる。
図24は、前景として写る床と、床以外の後景とからなる写真の画像Gにおいて、シード1およびシード2を設定した場合を示している。
本実施の形態では、図25のような切り抜き結果(過剰な検出や、検出不足が伴う結果)が生じにくく、図26のように、第1の指定領域S1、第2の指定領域S2をより精度よく切り出すことができる。
なおシードの拡散は、前景だけで行なってもよく、後景だけで行なってもよい。また、前景および後景の両方で行ってもよい。前景および後景の両方で行なう場合は、類似度sがどちらも閾値θ以下である場合は、より小さい方を選択するなどの判断を行えばよい。
また上述した例では、第1の局所領域Rおよび第2の局所領域Rに含まれる画素は、同数であったが、異なっていてもよい。
なお以上説明した領域検出部13で行われる処理は、画像中の指定領域の代表位置(シード)を表す位置情報を取得する位置情報取得工程と、位置情報から指定領域を検出する領域検出工程と、を備え、領域検出工程は、指定領域に属する画素の周囲のテクスチャと指定領域に含まれるか否かを判断する対象である画素の周囲のテクスチャとの類似度を基に指定領域を検出することを特徴とする画像処理方法として捉えることもできる。
<画像処理装置のハードウェア構成例>
次に、画像処理装置10のハードウェア構成について説明する。
図27は、画像処理装置10のハードウェア構成を示した図である。
画像処理装置10は、上述したようにパーソナルコンピュータ等により実現される。そして図示するように、画像処理装置10は、演算手段であるCPU(Central Processing Unit)91と、記憶手段であるメインメモリ92、およびHDD(Hard Disk Drive)93とを備える。ここで、CPU91は、OS(Operating System)やアプリケーションソフトウェア等の各種プログラムを実行する。また、メインメモリ92は、各種プログラムやその実行に用いるデータ等を記憶する記憶領域であり、HDD93は、各種プログラムに対する入力データや各種プログラムからの出力データ等を記憶する記憶領域である。
さらに、画像処理装置10は、外部との通信を行うための通信インターフェース(以下、「通信I/F」と表記する)94を備える。
<プログラムの説明>
ここで以上説明を行った本実施の形態における画像処理装置10が行なう処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。
よって本実施の形態で、画像処理装置10が行なう処理は、コンピュータに、画像中の指定領域の代表位置(シード)を表す位置情報を取得する位置情報取得機能と、位置情報から指定領域を検出する領域検出機能と、を実現させ、領域検出機能は、指定領域に属する画素の周囲のテクスチャと指定領域に含まれるか否かを判断する対象である画素の周囲のテクスチャとの類似度を基に指定領域を検出するプログラムとして捉えることもできる。
なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。
以上、本実施の形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
1…画像処理システム、10…画像処理装置、11…画像情報取得部、12…ユーザ指示受付部、13…領域検出部、14…領域切替部、15…画像処理部、16…画像情報出力部、20…表示装置、30…入力装置、131…画素選択部、132…局所領域設定部、133…類似度算出部、134…判断部、135…特性変更部、136…収束判定部、137…画像分割部、138…シード反映部

Claims (4)

  1. 画像中の指定領域の代表位置を表す位置情報を取得する位置情報取得部と、
    位置情報から指定領域を検出する領域検出部と、
    を備え、
    前記領域検出部は、
    前記指定領域に属する画素の周囲のテクスチャと当該指定領域に含まれるか否かを判断する対象である画素の周囲のテクスチャとの類似度を基に当該指定領域を検出し、
    前記代表位置が設定された前記画像をブロック毎に分割する画像分割部と、当該ブロックを単位としテクスチャを算出するための範囲として、第1の局所領域および第2の局所領域を設定する局所領域設定部と、当該第1の局所領域内のテクスチャと当該第2の局所領域内のテクスチャとの類似度を算出する類似度算出部と、を備える
    ことを特徴とする画像処理装置。
  2. 前記類似度により前記第2の局所領域内の画素が前記指定領域に含まれると検出したときに、前記第2の局所領域内の何れの画素が当該指定領域に含まれるかを設定する画素設定部をさらに備えることを特徴とする請求項に記載の画像処理装置。
  3. 前記類似度算出部は、前記類似度を基に前記第2の局所領域が前記指定領域に属する強さをさらに算出し、
    前記強さを使用して前記第2の局所領域中の画素が前記指定領域に属するか否かを判断することにより、前記指定領域を検出することを特徴とする請求項またはに記載の画像処理装置。
  4. 前記領域検出部は、前記ブロックを単位とした指定領域を検出した後に、当該ブロックを単位とした指定領域の境界の領域において指定領域の設定を解除し、指定領域の設定を解除されなかった画素の中から選択された基準画素を基に当該指定領域の境界の領域において指定領域を再度検出することを特徴とする請求項に記載の画像処理装置。
JP2016238464A 2016-12-08 2016-12-08 画像処理装置 Active JP6930099B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016238464A JP6930099B2 (ja) 2016-12-08 2016-12-08 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016238464A JP6930099B2 (ja) 2016-12-08 2016-12-08 画像処理装置

Publications (2)

Publication Number Publication Date
JP2018097414A JP2018097414A (ja) 2018-06-21
JP6930099B2 true JP6930099B2 (ja) 2021-09-01

Family

ID=62632973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016238464A Active JP6930099B2 (ja) 2016-12-08 2016-12-08 画像処理装置

Country Status (1)

Country Link
JP (1) JP6930099B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000216979A (ja) * 1999-01-22 2000-08-04 Canon Inc 画像抽出方法及び装置並びに記憶媒体
US20150347862A1 (en) * 2014-05-30 2015-12-03 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, image processing system, and non-transitory computer readable medium storing program

Also Published As

Publication number Publication date
JP2018097414A (ja) 2018-06-21

Similar Documents

Publication Publication Date Title
KR101719088B1 (ko) 영역 분할 방법 및 검사 장치
US9792695B2 (en) Image processing apparatus, image processing method, image processing system, and non-transitory computer readable medium
JP5880767B2 (ja) 領域判定装置、領域判定方法およびプログラム
US20090304280A1 (en) Interactive Segmentation of Images With Single Scribbles
US20150043820A1 (en) Area designating method and area designating device
JP2017126304A (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
JP6287337B2 (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
AU2020201976B2 (en) Two dimensional touch interaction screens with content-aware sensors
JP5907196B2 (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
CN106033334B (zh) 绘制界面元素的方法和装置
JP6241320B2 (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
AU2014280985B2 (en) Image processing apparatus, image processing method, image processing system, and program
US9875555B2 (en) Partitioning an image
JP6550819B2 (ja) 選択支援装置及びプログラム
JP6930099B2 (ja) 画像処理装置
US20210072884A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2018097415A (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
US20230215050A1 (en) Information processing apparatus, method, and storage medium to generate a color-difference map
JP2019101844A (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
JP2016004309A (ja) 画像処理装置、画像処理方法、画像処理システムおよびプログラム
JP2024000678A (ja) データ比較装置、該方法および該プログラム
CN117475053A (zh) 草地渲染方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6930099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150