JP5075182B2 - 画像処理装置、画像処理方法、および、画像処理プログラム - Google Patents

画像処理装置、画像処理方法、および、画像処理プログラム Download PDF

Info

Publication number
JP5075182B2
JP5075182B2 JP2009241233A JP2009241233A JP5075182B2 JP 5075182 B2 JP5075182 B2 JP 5075182B2 JP 2009241233 A JP2009241233 A JP 2009241233A JP 2009241233 A JP2009241233 A JP 2009241233A JP 5075182 B2 JP5075182 B2 JP 5075182B2
Authority
JP
Japan
Prior art keywords
image
image processing
ellipse
processing apparatus
polygon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009241233A
Other languages
English (en)
Other versions
JP2011090374A (ja
JP2011090374A5 (ja
Inventor
理紀夫 尾内
智大 佐藤
正弥 森
正裕 三條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2009241233A priority Critical patent/JP5075182B2/ja
Application filed by Rakuten Inc filed Critical Rakuten Inc
Priority to CA2776881A priority patent/CA2776881C/en
Priority to PCT/JP2010/068281 priority patent/WO2011049046A1/ja
Priority to CN201080053867.3A priority patent/CN102656605B/zh
Priority to KR1020127012887A priority patent/KR101379066B1/ko
Priority to EP10824895.6A priority patent/EP2477152B1/en
Priority to ES10824895.6T priority patent/ES2694762T3/es
Priority to US13/502,972 priority patent/US8660309B2/en
Priority to TW099135750A priority patent/TWI434567B/zh
Publication of JP2011090374A publication Critical patent/JP2011090374A/ja
Publication of JP2011090374A5 publication Critical patent/JP2011090374A5/ja
Application granted granted Critical
Publication of JP5075182B2 publication Critical patent/JP5075182B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像データに対して画像の変換を行う画像処理装置、画像処理方法、および、画像処理プログラムの技術分野に関する。
近年、デジタルカメラが小型化し、携帯端末にもデジタルカメラが備え付けられている。ユーザは外出先等でも手軽にカメラ付き携帯端末等により、風景や書類や白板等に表示されたものを撮影できる。しかし、外出先等で気軽に撮影できる一方、ハイキングで山等に出かけ、撮影したい対象を見つけた場合、足場により撮影場所が限られたり、撮影者の席の位置により正面から黒板等を撮影することが難しかったり、撮影対象を照らす光の角度との関係等により撮影角度が限られたりしてしまうことが多い。
書類や白板等に板書された文字等の撮影対象物の画像を補正してあたかも正面から撮影したような画像を取得するため、例えば、特許文献1には、撮影対象物として白板を撮影した画像から、Robertsフィルタを用いて輪郭を取得し、取得した輪郭から白板の画像を形成する候補となる直線を検出し、白板の四角形の形状を取得し、四角形の頂点位置から白板の画像と実際の白板との関係を示す射影パラメータを求めて白板の画像を射影変換する画像処理装置が開示されている。
特開2005−122320号公報
しかしながら、上記従来技術においては書類等の直線を手がかりに、撮影対象を補正しているため、直線部がほとんど無い花等のような撮影対象を撮影した場合、撮影対象を補正して、正面から撮影したような画像を得るのは難しい。
本発明は、このような問題に鑑みてなされたものであり、その課題の一例は、直線部分の輪郭が無い対象画像であっても所望の向きに表示された画像に変換する、画像処理装置、画像処理方法、および、画像処理プログラムを提供することを目的とする。
上記課題を解決するために、請求項1に記載の発明は、対象画像に対して画像処理を行う画像処理装置であって、前記対象画像を近似する楕円を算出する楕円算出手段と、前記対象画像の中心候補を決定する中心候補決定手段と、前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出手段と、前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出手段と、記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得手段と、を備えたことを特徴とする。
請求項2に記載の発明は、請求項1に記載の画像処理装置において、射影変換行列算出手段が、中心候補が射影変換される点を中心とする楕円が内接または外接する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出することを特徴とする。
請求項3に記載の発明は、射影変換行列算出手段における中心候補が射影変換される点を中心とする楕円は真円であることを特徴とする画像処理装置である。
請求項4に記載の発明は、請求項1から請求項3のいずれか1項に記載の画像処理装置において、前記多角形算出手段が、前記中心候補を通る直線と前記楕円との交点を接点とする前記第1多角形を算出することを特徴とする。
請求項5に記載の発明は、請求項4に記載の画像処理装置において、前記多角形算出手段が、前記中心候補を通る直線を前記楕円の長軸に平行な直線から求めることを特徴とする。
請求項6に記載の発明は、請求項4に記載の画像処理装置において、前記多角形算出手段が、前記対象画像を取り囲む画像枠のいずれかの辺に平行な直線と前記楕円とが接する点を前記接点とすることを特徴とする。
請求項7に記載の発明は、請求項1から請求項6のいずれか1項に記載の画像処理装置において、前記多角形算出手段が、前記楕円および前記中心候補に関連した四角形を算出し、前記射影変換行列算出手段が、前記中心候補が射影変換される点を中心とする楕円に関連する正方形へ前記四角形を射影変換する射影変換行列を算出することを特徴とする。
請求項8に記載の発明は、請求項1から請求項7のいずれか1項に記載の画像処理装置において、前記中心候補決定手段が、前記対象画像の中から前記中心候補を含む中心候補画像を抽出し、抽出した前記中心候補画像を楕円近似した楕円の長軸と短軸との交点から前記中心候補を決定することを特徴とする。
請求項9に記載の発明は、請求項1から請求項8のいずれか1項に記載の画像処理装置において、前記対象画像が花画像であって、前記楕円算出手段が、前記花画像を近似する前記楕円を算出し、前記中心候補決定手段が、前記花画像の花芯部分から前記花画像の前記中心候補を決定することを特徴とする。
請求項10に記載の発明は、請求項1から請求項9のいずれか1項に記載の画像処理装置において、前記対象画像を含む画像を取得する画像取得手段を更に備えたことを特徴とする。
請求項11に記載の発明は、請求項10に記載の画像処理装置において、前記取得された画像から、前記対象画像を抽出する対象画像抽出手段を更に備えたことを特徴とする。
請求項12に記載の発明は、請求項1から請求項11のいずれか1項に記載の画像処理装置において、前記変換画像に基づき、前記対象画像を特定する情報を検索する検索手段を更に備えたことを特徴とする。
請求項13に記載の発明は、請求項12に記載の画像処理装置において、前記検索手段が、前記変換画像より画像の特徴量を抽出し、前記特徴量に基づき、前記対象画像を特定する情報を検索することを特徴とする。
請求項14に記載の発明は、請求項1から13のいずれか1項に記載の画像処理装置において、前記第2多角形が正多角形であることを特徴とする。請求項15に記載の発明は、請求項1から14のいずれか1項に記載の画像処理装置において、前記対象画像を記憶する記憶手段を更に備えたことを特徴とする。
請求項1に記載の発明は、対象画像に対して画像処理を行う画像処理装置の画像処理方法であって、前記画像処理装置が、前記対象画像を近似する楕円を算出する楕円算出ステップと、前記画像処理装置が、前記画像処理後における前記対象画像の中心候補を決定する中心候補決定ステップと、前記画像処理装置が、前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出ステップと、前記画像処理装置が、前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出ステップと、前記画像処理装置が、前記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得ステップと、を有することを特徴とする。
請求項1に記載の発明は、コンピュータを、画像処理の対象画像を近似する楕円を算出する楕円算出手段、前記画像処理後における前記対象画像の中心候補を決定する中心候補決定手段、前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出手段、前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出手段、および、記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得手段として機能させることを特徴とする。
本発明によれば、画像処理を行う対象画像を記憶し、対象画像を近似する楕円を算出し、対象画像の中心候補を決定し、楕円および中心候補に関連した第1多角形を算出し、中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ第1多角形を射影変換する射影変換行列を算出し、記憶された対象画像を射影変換行列に基づき射影変換して、対象画像の変換画像を取得することにより、直線部分の輪郭が無い対象画像であっても所望の向きの画像に変換できる。
本発明に係る実施形態の画像検索システムの概要構成例を示す模式図である。 図1の携帯端末の概要構成の一例を示すブロック図である。 観察点から被写体を撮影した場合、被写体が写真に射影される様子の概念を示す概念図である。 図1の携帯端末による画像処理の一例を示すフローチャートである。 (A)は対象画像を含む画像の一例を示す模式図であり、(B)は画像から抽出された対象画像の様子を示す模式図であり、(C)は対象画像から中心候補を含む中心候補画像を抽出した様子を示す模式図である。 射影変換された対象画像の一例を示す模式図である。 図1の検索サーバにおける検索処理の一例を示すフローチャートである。 図4のフローチャートにおける標準画像への変換のサブルーチンの一例を示すフローチャートである。 (A)は、図5の対象画像の輪郭および対象画像を近似する楕円の一例を示す模式図であり、(B)は、対象画像から抽出された中心候補を含む中心候補画像および中心候補画像を近似する楕円の一例を示す模式図である。 図9(A)の楕円と、図9(B)の楕円との関連を示す模式図である。 図5の対象画像と、楕円に接する四角形との関連を示す模式図である。 楕円から真円への射影変換の様子を示す模式図であって、(A)は楕円に接する四角形を示す模式図であり、(B)は射影変換後の様子を示す模式図である。 (A)は、射影変換行列を説明するための平面を示す模式図であり、(B)は2次曲線の射影変換を説明するための平面を示す模式図である。 図8のフローチャートにおける四角形算出のサブルーチンの一例を示すフローチャートである。 楕円に接する四角形を求める第1・2変形例における四角形算出のサブルーチンの一例を示すフローチャートである。 楕円に接する四角形を求める第1変形例を示す模式図である。 楕円に接する四角形を求める第2変形例を示す模式図である。 楕円に接する四角形を求める第3変形例であって、(A)は、楕円に内接する四角形の一例を示す模式図であり、(B)は射影変換後の様子を示す模式図である。 楕円に接する四角形を求める第4変形例であって、(A)は、楕円に接する四角形の一例を示す模式図であり、(B)は射影変換後の様子を示す模式図である。
以下、図面を参照して本発明を実施するための形態について説明する。
まず、本発明の実施形態に係る画像検索システムの概略構成および機能について、図に基づき説明する。
図1は、本発明に係る実施形態の画像検索システムの概要構成例を示す模式図である。図2は、図1の携帯端末の概要構成の一例を示すブロック図である。
図1に示すように、画像処理装置の一例の画像検索システム1は、携帯型無線電話機のように撮影対象を撮影する携帯端末10と、携帯端末10からの画像データにもとづき検索を行う画像検索サーバ20と、を備える。
画像処理装置の一例として機能する携帯端末10は、図2に示すように、撮影対象を撮影する撮像部11と、撮像した画像等を表示する表示部12と、無線基地局と送受信を行う無線通信部13と、数字や文字等を入力する操作部14と、撮像した画像を記憶する記憶部15と、携帯端末10の各種制御を行う制御部16と、を有し、これらはバス17により接続されている。
撮像部11は、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサやCCD(charge-coupled device)イメージセンサ等からなるデジタルカメラを有する。
表示部12は、液晶表示素子またはEL(Electro Luminescence)素子等によって構成されている。
無線通信部13は、移動体通信網2やインターネット等のネットワーク3を通して画像検索サーバ20と通信を行う。
操作部14は、各種キーにより構成されている。ユーザは、操作部14により、表示部12に表示されたポインタを移動させたり、画像の部分を選択して確定させたりする。
記憶部15は、RAM(Random Access Memory)やROM(Read Only Memory)やフラッシュメモリ(flash memory)のような不揮発メモリ等を有し、画像処理のプログラムがロードされたり、画像データを保持するメモリ空間が形成されたりする。
制御部16は、CPU(Central Processing Unit)を有し、コンピュータとして画像処理のプログラムを実行等する。
次に、コンピュータとして機能する画像検索サーバ20は、画像検索サーバ20全体を制御したり画像処理の演算を行ったりする制御部21と、画像検索用のデータベースが構築されたデータベース22と、を有する。
図1に示すように、制御部21は、コンピュータのプログラムを実行するCPU21aと、実行するプログラム等を記憶するRAMやROMやフラッシュメモリのような不揮発メモリ等のメモリ21b等を有する。
制御部21のCPU21aは、携帯端末10から送信された検索要求に対してデータベース22から情報を検索したり、受信した画像データから情報を検索するための画像処理を行ったり、データベース22の管理を行ったりする。
メモリ21bには、画像検索を実行するのためのプログラムが展開されたり、受信した画像データを記憶したり、一時的に演算結果が記憶されたりする。
データベース22は、ハードディスクドライブやシリコンディスク等を有し、画像の特徴量に関連づけられた情報等を記憶する。例えば、花に関するデータベースの場合、データベース22には、花を同定するために必要な特徴量として、花の色、花びらの数、花全体の形状の情報、花びらの切れ目等の花びら情報等に紐付けられて、花の名前や学名等の花に関する情報と、花や葉や実等の花に関する画像等が記憶されている。
携帯端末10は、移動体通信網2に接続され、画像検索サーバ20は、インターネット等のネットワーク3に接続され、移動体通信網2とネットワーク3とはプロトコル変換やコンテンツを記述する言語の変換等を行うためのゲートウエイ等により接続されている。
次に、本実施形態の原理の概略について図に基づき説明する。
図3は、観測点V1から被写体を撮影した場合、被写体が写真に射影される様子の概念を示す概念図である。
図3に示すように、観測点V1から斜めから撮影された花画像が擬似的に正面からの見た目になるように、画像変形を行う。ここで、被写体の花が楕円E1により近似され、四角形P1’の平面上にあるとする。
先ず、撮影画像から花全体と花芯とを抽出し、手法を単純化するため、それぞれの輪郭線を楕円に近似する。なお、花全体を近似した楕円が、楕円E1に相当し、その中心が点Oである。また花芯を近似した楕円の中心が点Oに相当する。
次に、花の正面からの見た目の標準画像(変換画像)を得るため射影変換を行う。射影変換は写真に例えると、3次元空間の物体を2次元平面のフィルム上に写し込むことに相当する。この逆方向、つまり2次元から3次元への射影は一般的に不可能であるが、いくつかの条件を限定することで可能となる。本実施形態における手法では、3次元空間内にある平面(四角形P1を含む平面)上に、平面的な花が存在すると仮定することで、2次元平面から2次元平面への射影変換とした。さらに、手法を単純化するため、実際の花の形状が真円E1’に近似できると仮定する。入力画像で切り抜かれた花は楕円E1に近似されており、その楕円E1に外接する四角形P1を求め、これを変形対象領域とする。変形対象領域を正方形である四角形P1’に射影変換すると、楕円E1は先ほど仮定した真円E1’に射影される。このように、傾いた角度で撮影された花の写真から、射影変換を行うことで、正面から撮影した花の写真の標準画像を擬似的に得ることができる。なお、手法の詳細についてはフローチャートと共に後述する。
ここで、標準画像(変換画像)とは、所望の向きに表示されるように変換された画像である。標準画像(変換画像)は、例えば、花芯が花全体の中心付近にあるような角度で花が表示された画像であり、花等の対象画像を特定しやすい角度から見た画像であればよい。
次に、本実施形態の動作について図に基づき説明する。
図4は、図1の携帯端末による画像処理の一例を示すフローチャートである。図5の(A)は対象画像を含む画像の一例を示す模式図であり、(B)は画像から抽出された対象画像の様子を示す模式図であり、(C)は対象画像から中心候補を含む中心候補画像を抽出した様子を示す模式図である。図6は、射影変換された対象画像の一例を示す模式図である。
まず、図4に示すように、携帯端末10は、撮像部11により、撮影対象の画像を取得する(ステップS1)。具体的には、携帯端末10の制御部16は、撮像部11から、図5(A)に示すような対象画像(花の画像)を含む画像を取得し、その画像の画像データを記憶部15に記憶する。このように携帯端末10は、対象画像を含む画像を取得する画像取得手段の一例として機能し、また、画像処理を行う対象画像を記憶する記憶手段の一例として機能する。ここで、図5(A)の画像では、被写体の花が、正面から撮影されていない。
次に、携帯端末10は、取得された画像から対象画像の抽出を行う(ステップS2)。具体的には、制御部16は、図5(B)に示すように、花全体の輪郭を求め、花の画像を抽出する。なお、図5(B)では、花びらで特徴付けられる花全体を輪郭線により描き、背景の部分を暗くしてある。ここで、図5(B)に示すように、ユーザが、花の部分と、背景の部分とを操作部14により表示部12に表示されたポインタ等により指定し、その色の情報に基づき、制御部16が対象画像の抽出を行ってもよい。このように、携帯端末10は、取得された画像から、対象画像を抽出する対象画像抽出手段の一例として機能する。
具体的には、例えば、対象画像抽出手段は、取得された画像に含まれる花の部分(前景領域)上における少なくとも一つの前景ピクセル、及び当該取得された画像に含まれる背景の部分(背景領域)上における少なくとも一つの背景ピクセルの指定をユーザから受け付ける受付手段、指定された前景ピクセル及び指定された背景ピクセルを夫々基準ピクセルとして、3次元の色空間が複数に分割された分割色空間のうちから、各基準ピクセルが属する分割色空間を基準分割色空間として特定する分割色空間特定処理を行う分割色空間特定手段、各基準ピクセルとこれに隣接する隣接ピクセルとの色空間における色の距離を算出する色距離算出処理を行う色距離算出手段、各隣接ピクセルが各基準分割色空間に属するか否かを判別する属否判別処理を行う属否判別手段、各隣接ピクセルについて算出された色の距離と、各隣接ピクセルについて判別された基準分割色空間への属否に基づく重み付けと、に基づいて各隣接ピクセルについてのコストを算出するコスト算出処理を行うコスト算出手段、及び、算出されたコストが最も小さい隣接ピクセルを前景ピクセル又は背景ピクセルとして確定する確定処理を行う確定手段、とを備え、確定された隣接ピクセルを基準ピクセルとして、色距離算出処理、属否判別処理、コスト算出処理、及び確定処理をコンピュータに繰り返し行わせることにより、取得された画像から前景領域を抽出して、対象画像の抽出を行ってもよい。
次に、携帯端末10は、対象画像から中心候補画像の抽出を行う(ステップS3)。具体的には、制御部16は、図5(C)に示すように、花全体の輪郭にある、中心候補画像の一例である花芯部分の輪郭を抽出する。ここで、図5(C)に示すように、ユーザが、花びらの部分と、花芯の部分とを操作部14により表示部12に表示されたポインタ等により指定し、その色の情報に基づき、制御部16が対象画像の抽出を行ってもよい。このように、携帯端末10は、対象画像の中から中心候補を含む所定領域の画像である中心候補画像を抽出する中心候補決定手段の一例として機能する。中心候補画像は、例えば、中心候補を含み且つ奥行きまたは色情報等が周囲とは不連続に異なる対象画像中の領域の画像である。
次に、携帯端末10は、対象画像を標準画像に変換する(ステップS4)。具体的には、後述する射影変換の手法を用い、制御部16は、記憶部15に記憶された対象画像を、図6に示すように、花を正面から撮影したような標準画像に変換する。このように、携帯端末10は、記憶手段に記憶された対象画像を射影変換行列に基づき射影変換して、標準画像を取得する標準画像取得手段(変換画像取得手段)の一例として機能する。なお、ここでは、対象画像を含む近傍の画像データを、標準画像に変換している。
次に、携帯端末10は、検索のため標準画像を画像検索サーバ20に送信する(ステップS5)。具体的には、撮影した花が何の花であるかを検索するために、制御部16は、無線通信部13から移動体通信網2とネットワーク3とを通して、図6に示すような標準画像を画像検索サーバ20に送信する。
次に、携帯端末10は、画像検索サーバ20から検索結果を受信して表示する(ステップS6)。具体的には、制御部16は、検索された花の名前や花の情報を、無線通信部13により画像検索サーバ20から受信し、表示部12に表示する。
次に、画像検索サーバ20における検索処理について説明する。
図7は、画像検索サーバ20における検索処理の一例を示すフローチャートである。
まず、図7に示すように、画像検索サーバ20は、携帯端末10から標準画像を受信する(ステップS7)。具体的には、画像検索サーバ20の制御部21は、携帯端末10から移動体通信網2とネットワーク3とを通して標準画像を受信する。
次に、画像検索サーバ20は、受信した標準画像から特徴量を抽出する(ステップS8)。具体的には、制御部21は、対象画像が花の画像である場合、標準画像の特徴量として、花びらの数、花の色、花全体の形状の情報、花びらの切れ目等の花びら情報等を抽出する。
次に、画像検索サーバ20は、抽出した標準画像の特徴量に基づき、データベース22から標準画像を特定する情報を検索する(ステップS9)。具体的には、制御部21は、花の標準画像の特徴量に基づき、データベース22から類似している花を検索し、類似度等の上位の花に関する情報や花に関する画像を求める。このように、画像検索サーバ20は、標準画像に基づき、対象画像を特定する情報を検索する検索手段の一例として機能する。また、画像検索サーバ20は、標準画像より画像の特徴量を抽出し、特徴量に基づき、対象画像を特定する情報を検索する検索手段の一例として機能する。
次に、画像検索サーバ20は、検索上位結果を携帯端末10に送信する(ステップS10)。具体的には、制御部21は、花に関する情報や、花に関する画像を送信する。
これらのように、画像検索サーバ20は、標準画像に基づき、対象画像を特定する情報を検索する検索手段の一例として機能する。また、画像検索サーバ20は、標準画像より画像の特徴量を抽出し、特徴量に基づき、対象画像を特定する情報を検索する検索手段の一例として機能する。
なお、携帯端末10が、画像検索サーバ20のデータベース22のようなデータベースを備え、標準画像から画像の情報を検索してもよい。
次に、ステップS4の対象画像を標準画像へ変換するサブルーチンについて図に基づき詳細に説明する。
図8は、図4のフローチャートにおける標準画像への変換のサブルーチンの一例を示すフローチャートである。図9(A)は、図5の対象画像の輪郭および対象画像を近似する楕円の一例を示す模式図であり、(B)は、対象画像から抽出された中心候補を含む中心候補画像および中心候補画像を近似する楕円の一例を示す模式図である。図10は、図9(A)の楕円と、図9(B)の楕円との関連を示す模式図である。図11は、図5の対象画像と、楕円に接する四角形との関連を示す模式図である。図12は、楕円から真円への射影変換の様子を示す模式図であって、(A)は楕円に接する四角形を示す模式図であり、(B)は射影変換後の様子を示す模式図である。
まず、携帯端末10は、対象画像および中心候補画像の楕円近似を行う(ステップS20)。具体的には、制御部16は、図9(A)に示すように、ステップS2で抽出した花全体の輪郭F1を最小二乗法により楕円E1に近似し、図9(b)に示すように、ステップS3で抽出した花芯部分の輪郭F2を最小二乗法により楕円E2に近似する。このように、携帯端末10は、対象画像を近似する楕円を算出する楕円算出手段の一例として機能する。楕円近似については後述する。
次に、携帯端末10は、中心候補を決定する(ステップS21)。具体的には、制御部16は、図9(B)に示すように、花芯を近似した楕円E2の長軸E2と短軸E2との交点より、中心候補Oを決定する。この中心候補Oは奥行きの情報となる。花全体の楕円E1と、花芯の楕円E2との関連は図10に示すようになる。このように、携帯端末10は、対象画像の中心候補を決定する中心候補決定手段の一例として機能する。また、携帯端末10は、抽出した中心候補画像を楕円近似した楕円の長軸と短軸との交点から中心候補を決定する中心候補決定手段の一例として機能する。また、携帯端末10は、対象画像が花画像であって、花画像を近似する楕円を算出する楕円算出手段の一例として機能する。また、携帯端末10は、対象画像が花画像であって、花画像の花芯部分から花画像の中心候補を決定する中心候補決定手段の一例として機能する。
次に、携帯端末10は、楕円および中心候補に関連した四角形を求める(ステップS22)。具体的には、図11に示すように、制御部16は、花全体の楕円E1と花芯の楕円E2の中心候補Oとにより、楕円E1に接する第1多角形の一例として四角形P1を求める。このように、携帯端末10は、楕円および中心候補に関連した第1多角形を算出する多角形算出手段の一例として機能する。また、携帯端末10は、楕円および中心候補に関連した四角形を算出する多角形算出手段の一例として機能する。
次に、携帯端末10は、第1多角形の一例である四角形と第2多角形の一例である正方形とに基づき射影変換行列を算出する(ステップS23)。具体的には、図12(A)(B)に示すように、制御部16は、第1多角形である四角形P1の頂点x1、x2、x3、x4と、第2多角形の一例である正方形P1’の頂点x1’、x2’、x3’、x4’とに基づき射影変換行列を算出する。このように、携帯端末10は、中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ第1多角形を射影変換する射影変換行列を算出する射影変換行列算出手段の一例として機能する。また、携帯端末10は、中心候補が射影変換される点を中心とする楕円に関連する正方形へ四角形を射影変換する射影変換行列を算出する射影変換行列算出手段として機能する。第2多角形は、例えば正多角形である。第2多角形の中心とは、例えば正多角形である第2多角形の重心、内心、または外心である。本実施形態では、第2多角形として正方形を用いている。また、本実施形態では、第2多角形である正方形P1’は、中心候補が射影変換される点を中心とする楕円(本実施形態では真円)E1’に外接する。なお、楕円の中心とは、楕円の長軸と短軸との交点をいう。楕円とは、長軸の長さと短軸の長さとが一致する真円も含む。射影変換行列については後述する。
次に、携帯端末10は、射影変換行列に基づき、対象画像を標準画像に変換する(ステップS24)。具体的には、制御部16は、四角形P1(x1、x2、x3、x4)から正方形P1’(x1’、x2’、x3’、x4’)に変換する射影変換行列に基づき、記憶部に記憶しておいた対象画像の画像データの各ピクセルに対して変換を行う。
次に、携帯端末10は、標準画像の修正が必要か否かを判定する(ステップS25)。具体的には、制御部16は、楕円近似と花全体の輪郭との誤差や、標準画像の歪や、標準画像の花芯部分の歪み等に基づき、標準画像の修正が必要か否かを判定する。または、人間が標準画像を見て、修正が必要な場合、制御部16は、操作部14から入力を受け付け、標準画像の修正が必要か否かを判定する。そして、修正が必要な場合(ステップS25;YES)、制御部16は、ステップS20に戻り、楕円形状や中心候補の位置を調整する。一方、修正が不要の場合(ステップS25;NO)、制御部16は、サブルーチンを終了する。
ここで、楕円近似について説明する。なお、楕円を一般化した円錐曲線(2次曲線)により説明する。
2次曲線は係数A〜Fを用いて以下の式で表すことができる。
Ax+ 2Bxy + Cy + 2Dx + 2Ey + F = 0 ・・・(1)
特に、AC−B > 0 を満たすときに楕円を表す。さらにベクトルv、cを用いて置換すると、以下の式で書き換えられる。
c = 1 ・・・(2)
c=−1/F[A,2B,C,2D,2E] ・・・(3)
c=[x,xy,y,x,y] ・・・(4)
平面上にN(=5)個の点列(x,y)(i=1・・・N)が与えられたとき、それらを近似する2次曲線は,ベクトルvをN本束ねた行列V = [v,・・・,vを用いて,以下の5元連立方程式に帰着できる。
Vc=1 ・・・(5)
N>5のとき,過剰決定系の連立方程式となり解が一意に求まらないため、最小二乗法による近似を行う。与えられた点列からなるVcと,右辺の1との残差を最小にするために、以下の式(6)を解くことにより、式(7)に示すように近似解c~が得られる。
∂/∂c‖Vc−1‖=0 ・・・(6)
c~=(VV)−1=V1 ・・・(7)
は擬似逆行列と呼ばれる。
次に、射影変換行列および2次曲線の射影変換について図に基づき説明する。
図13において、(A)は、射影変換行列を説明するための平面を示す模式図であり、(B)は2次曲線の射影変換を説明するための平面を示す模式図である。
図13(A)に示すように、空間に任意の2つの平面を取り、原点を観測点として平面π上の点x=(x、y)を、平面π’上の点x’=(x’、y’)に射影することを考える。
係数aij(i,j=1,2,3)を用いると、同一点に対応する座標xとx’は、以下の式が成り立つ。
この式はそれぞれの方程式が任意定数で通分でき、独立した8係数からなる方程式である。よって、任意の1係数を固定することができ、ここではa33=1とする。8係数aijは、同一点に対応する4組の座標x,x’(k=1,2,3,4) から一意に求められる。これは、平面π上のxからなる四角形の領域を、平面π’上のx’からなる四角形の領域に射影変換することを意味する。これら8点の座標を式(8)に代入して解き、その係数から射影変換行列Pを以下で定義する。
次に、2次曲線の射影変換について説明する。
3個の数字の組{X,X,X}と{kX,kX,kX}(k≠0)とが同じ座標を表すとき、これを同次座標と呼ぶ。図13(B)において、平面σの上のxy座標から平面σ’上のXY座標への射影に相当する。点xとそれに対応する同次座標系の点Xは以下の関係を満たす。
X=[X,X,X ・・・(10)
x = [X/X, X/X ・・・(11)
同次座標を利用すると、式(1)の2次曲線は以下の式で書き換えられる。
AX +2BX+CX +2DX+2EX+FX =0 ・・・(12)
ここでA〜Fの係数より行列Qを以下で定義する。
これと式(10)により,式(12)は、さらに以下の式に置き換えることができる。
QX = 0 ・・・(14)
また,射影変換行列の逆行列をP’=P−1と置いたとき、同次座標形の点XからX’への射影変換と逆射影変換は、式(8)(9)(10)より以下の式で表される。
X’ = PX ・・・(15)
X = P’X’ ・・・(16)
式(16)を式(14)に代入することで得られる方程式X’(P’QP’)X’=0についてQ’=P’QP’と置換すると、式(14)と対称な方程式X’Q’X’=0が得られる。このときの置換に用いた式は、Q’がQの射影変換だということを表している。よって、2次曲線QのPによる射影変換と逆射影変換は、それぞれ射影変換行列を用いて以下の式で表すことができる。
Q=PQ’P ・・・(17)
Q’=P’QP’ ・・・(18)
従って、2次曲線は射影変換を適用しても2次曲線の性質を保つことが示された。
次に、四角形算出のサブルーチンについて図に基づき詳細に説明する。
図14は、図8のフローチャートにおける四角形算出のサブルーチンの一例を示すフローチャートである。ここで、このサブルーチンでは、射影変換の対象を、2次曲線のうち楕円に限定し、楕円E1から求められる仮想の四角形(変形対象領域)P1から、真円E1’が内接する正方形P1’へと射影変換することを考える。すなわち、楕円E1から真円E1’への射影変換と考える。
このサブルーチンは、変形対象領域の四角形P1を以下の方法で求める。
図14に示すように、まず、携帯端末10は、中心候補を通る第1基準直線を決定する(ステップS30)。具体的には、携帯端末10の制御部16は、図12(A)に示すように、1つの楕円E1とその内側の点(中心候補)Oに対して、中心候補Oを通る任意の直線、例えば、楕円E1の長軸E1に平行な第1基準直線lを決定する。このように、携帯端末10は、中心候補を通る直線(第1基準直線l)を、楕円の長軸に平行な直線から求める多角形算出手段の一例として機能する。
次に、携帯端末10は、第1基準直線と楕円との交点から第1接点および第2接点を算出する(ステップS31)。具体的には、制御部16は、第1基準直線lと楕円E1と交点から第1接点qおよび第2接点qを算出する。
次に、携帯端末10は、第1接点を接点とする第1接線と、第2接点を接点とする第2接線とを算出する(ステップS32)。具体的には、制御部16は、第1接点qでの楕円E1の第1接線mと、第2接点qでの楕円E1の第2接線mとを算出する。
次に、携帯端末10は、第1接線と第2接線との交点より第1消失点を算出する(ステップS33)。具体的には、制御部16は、第1接線mと第2接線mとの交点より第1消失点qを算出する。ここで、第1消失点qは極、基準直線lは極線と呼ばれ、一方が定まればもう一方も定まる双対の関係にある。
次に、携帯端末10は、第1消失点と中心候補とを通る第2基準直線を算出する(ステップS34)。具体的には、制御部16は、第1消失点qと中心候補Oとを共に通る極線として、第2基準直線mを算出する。
次に、携帯端末10は、第2基準直線と楕円と交点より第3・第4接点を算出する(ステップS35)。具体的には、制御部16は、第2基準直線mと楕円E1と交点より第3接点pおよび第4接点pを算出する。
次に、携帯端末10は、第3接点を接点とする第3接線と、第4接点を接点とする第4接線とを算出する(ステップS36)。具体的には、制御部16は、第3接点pでの楕円E1の第3接線lと、第4接点pでの楕円E1の第4接線lとを算出する。
次に、携帯端末10は、第3接線と第4接線との交点より第2消失点を算出する(ステップS37)。具体的には、制御部16は、第3接線lと第4接線lとの交点より極の第2消失点pを算出する。
次に、携帯端末10は、第1〜第4接線の交点より四角形の頂点を算出する(ステップS38)。具体的には、制御部16は、第1接線mと第4接線lとから交点x、第4接線lと第2接線mとから交点x、第2接線mと第3接線lとから交点x、および、第3接線lと第2接線mとから交点xを算出し、四角形P1の頂点とする。ここで、第1〜第4接線によって囲まれた四角形P1が、変形対象領域であり、中心候補を通る直線と楕円との交点を接点とする第1多角形の一例である。このように、携帯端末10は、中心候補を通る直線と楕円との交点を接点とする第1多角形の一例の四角形を算出する多角形算出手段の一例として機能する。
そして、制御部16は、サブルーチンを終了後、ステップS23として、図12(A)に示す四角形P1の頂点x1〜x4の座標と、図12(B)に示す正方形P1’の頂点x1’〜x4’の座標から、射影変換行列Pを算出する。そして、射影変換行列Pによって、楕円E1は、標準画像の一例の真円E1’に射影変換され、同時に中心候補Oは真円の中心O’に射影される。
ここで、花の中央に位置している花芯の座標を用いれば、中心候補Oを適切に取ることができる。よって、花全体から近似された楕円E1と、花芯から近似された楕円の中心座標(中心候補Oの座標)から、変形対象領域の四角形P1を求められ、これを正方形P1’に射影変換することで正面の見た目が得られる。
このように本実施形態によれば、携帯端末10は、画像処理を行う対象画像を記憶部15に記憶し、対象画像(例えば、花の全体の輪郭F1)を近似する楕円E1を算出し、対象画像の中心候補Oを決定し、楕円および中心候補に関連した第1多角形(例えば、四角形P1)を算出し、中心候補が射影変換される点を中心とする楕円に関連する第2多角形(例えば、正方形P1’)へ第1多角形を射影変換する射影変換行列Pを算出し、記憶部15に記憶された対象画像を射影変換行列に基づき射影変換して、対象画像の変換画像を取得することにより、花等のように直線部分の輪郭が無い対象画像でも所望の向きに表示された画像に変換できる。
また、携帯端末10は、被写体を正面から撮影したような標準画像、すなわち所望の向きに表示された画像に変換できるため、ユーザが撮影のアングルを気にしない等、ユーザの負担を軽減させることができる。例えば、従来は、被写体が花の場合は、花の向きや形状を揃えるためや不要な背景を自動で除去するため、ユーザが、花を黒い背景の上に置いたり、花の真正面から画面全体に撮影したりしていた。そのため、撮影時にアングルを調整する等、ユーザの負担が大きかった。また、山では簡単に撮影できない所に生息している花も多く、従来技術では、既に撮影された写真を後から所望の向きに表示された画像に直すことができなかった。しかし、本実施形態によれば、直線部分がない被写体でも、正面から撮影したような画像に変換できる。
また、携帯端末10は、撮影後に画像に表示される向きを変換できるため、照明の反射を気にせず被写体を撮影でき、ユーザの利便性を向上させることができる。
また、野外で撮影したものが何であるかその場で検索する場合、キーワードによる検索と異なり、撮影対象の撮影角度により、様々な対象画像になり検索が難しくなる場合がある。これに対し、本実施形態によれば、対象画像に基づき対象画像に関する情報を検索する場合、対象画像を正面から撮影されたような画像に変換して、当該変換画像に基づき検索するため、標準化された特徴量により検索しやすく、検索速度や検索の精度を向上させることができる。
また、本実施形態によれば、例えば正面画像のように表示の向きが特定された画像のみに関連づけて検索のためのデータベースの構築でき、被写体の様々なアングルから撮影した画像データを予め用意する必要がないため、データベースを構築しやすく、また簡素化できる。そのため、携帯端末10がデータベースを備え、検索を行うことも可能である。
また、携帯端末10が、多角形算出手段として、中心候補Oを通る直線l、mと楕円E1との交点q、q、p、pに接する第1多角形(例えば、四角形P1)を算出する場合、楕円および中心候補に関連した第1多角形を容易に一意的に求めることができ、第1多角形の頂点の座標等から射影変換行列を決定できる。
携帯端末10が、多角形算出手段として、中心候補Oを通る直線lを楕円の長軸E1に平行な直線から求める場合、歪の少ない標準画像が求まり、変換後の画像が見やすくなる。また、歪の少ない標準画像のため、検索精度も向上する。
また、携帯端末10が、多角形算出手段として、楕円E1および中心候補Oに関連した四角形P1を算出し、射影変換行列算出手段として、中心候補Oに対応した中心候補O’を中心とする真円E1’に関連する正方形P1’へ四角形を射影変換する射影変換行列を算出する場合、射影変換行列を求めるための4つの座標を、四角形P1の頂点等から容易に算出することができる。
また、携帯端末10が、中心候補決定手段として、花の全体画像等の対象画像の中から中心候補(花芯)を含む中心候補画像を抽出し、抽出した中心候補画像を楕円近似した楕円E2の長軸E2と短軸E2との交点(点O)から中心候補を決定する場合、客観的に奥行きの情報が中心候補から得られ、正面から撮影された画像により近い標準画像を求めることができる。
また、対象画像が花画像(花の輪郭F1)であって、携帯端末10が、楕円算出手段として、花画像を近似する楕円E1を算出し、中心候補決定手段として、花画像の花芯(花芯の輪郭F2)部分から花画像の中心候補Oを決定する場合、撮影場所やアングルが限られた画像でも、花を雌しべの方から見た正面画像のような花の標準画像を求めることできる。また、携帯端末10は、花の標準画像により、花の種類等が特定できる。
また、携帯端末10が、対象画像を含む画像を取得する画像取得手段の一例として撮像部11を備えた場合、山など外出先で、花等の対象画像を撮影して、その場で、花の正面画像等の所望の向きに表示された標準画像を得ることができ、花の種類を特定する等、対象画像を特定しやすくなる。
また、携帯端末10が、ステップS2のように、取得された画像から、対象画像を抽出する対象画像抽出手段を備えた場合、背景画像と対象画像とを切り離し、背景画像の影響を除去できるため、精度が良い標準画像が得られたり、標準画像に基づく検索精度が向上したりする。また、花の部分および背景の部分の色の情報に基づき、対象画像の抽出をすると、ユーザは、コントラストを気にせず対象画像の撮影ができ、携帯端末10が、撮影時のユーザの負担を軽減させることができる。
また、画像検索サーバ20が、携帯端末10から送信された標準画像に基づき対象画像を特定する情報を検索する場合、携帯端末10が検索結果を受信することにより、山の中でも画像の情報検索が可能となり、例えば、山中で撮影した花の写真から、その花の情報を簡単に検索するシステムを構築することができる。また、例えば正面から撮影されたような標準画像に基づき対象画像を特定するため、標準化された特徴量によって検索することができ、検索速度や検索の精度を向上させたり、データベースを簡素化したりできる。
また、画像検索サーバ20が、検索手段として、標準画像より画像の特徴量を抽出し、特徴量に基づき、対象画像を特定する情報を検索する場合、検索の精度を向上させることができる。
次に、変形対象領域の四角形を求める第1変形例について図に基づき説明する。
図15は、楕円に接する四角形を求める第1・2変形例における四角形算出のサブルーチンの一例を示すフローチャートである。図16は、楕円に接する四角形を求める第1変形例を示す模式図である。図17は、楕円に接する四角形を求める第2変形例を示す模式図である。
図15に示すように、まず、携帯端末10は、画像枠に水平で楕円に接する第1接点および第1接線を決定する(ステップS40)。具体的には、携帯端末10の制御部16は、図16に示すように、画像枠30の上辺30aまたは下辺に水平で楕円E1に接する第1接点q2および第1接線mを決定する。ここで画像枠30は、例えば、撮像された2次元の画像全体を囲う長方形の枠である。
次に、携帯端末10は、第1接点と中心候補とを通る第1基準直線を算出する(ステップS41)。具体的には、制御部16は、第1接点qと中心候補Oとを通る第1基準直線lを算出する。
次に、携帯端末10は、第1基準直線と楕円とにより第2接点および第2接線を算出する(ステップS42)。具体的には、制御部16は、第1基準直線lと楕円E1との交点より第2接点qを求め、第2接点qで楕円E1に接する第2接線mを算出する。
次に、携帯端末10は、第1接線と第2接線との交点より第1消失点を算出する(ステップS43)。具体的には、制御部16は、第1接線mと第2接線mとの交点より第1消失点qを算出する。なお、ステップS44〜ステップS48は、ステップS34〜ステップS38と同じであり、最終的に、図16に示すような四角形P2を得ることができる。
このように、携帯端末10は、中心候補Oを通る直線と楕円E1との交点を接点qとする第1多角形の一例の四角形を算出する多角形算出手段の一例として機能する。また、携帯端末10は、対象画像を取り囲む画像枠30のいずれかの辺30aに平行な直線mと楕円E1とが接する点を接点qとする多角形算出手段の一例として機能する。
本変形例によれば、四角形P2から正方形P1’への射影変換により、対象画像が射影変換された際、対象画像に対して、円周方向の画像回転が少ない標準画像を得ることができる。そのため、ユーザが対象画像と変換されて得た標準画像とを見比べやすくなり、画像の編集がしやすくなる。
なお、図17に示すように、変形対象領域の四角形を求める第2変形例として、ステップS40で、画像枠30の上辺30aまたは下辺に水平で楕円E1に接する第1接点qおよび第1接線mを決定してもよい。最終的に、四角形P3の形状は異なるが、第1変形例と同様の効果が得られる。このように、携帯端末10は、中心候補Oを通る直線と楕円E1との交点を接点qとする第1多角形の一例の四角形を算出する多角形算出手段の一例として機能する。また、携帯端末10は、対象画像を取り囲む画像枠30のいずれかの辺30aに平行な直線mと楕円E1とが接する点を接点qとする多角形算出手段の一例として機能する。なお、基準直線l、mは、中心候補Oを通る任意の直線で、かつ、お互いに中心候補Oで交差する直線であればよく、様々なバリエーションが考えられる。
次に、変形対象領域の四角形を求める第3変形例について図に基づき説明する。
図18は、楕円に接する四角形を求める第3変形例であって、(A)は、楕円に内接する四角形の一例を示す模式図であり、(B)は射影変換後の様子を示す模式図である。
図18(A)に示すように、射影変換行列Pを求めるための四角形は、接点p、q、p、qを頂点とする四角形P4になる。この四角形P4は、楕円E1に内接する。この場合、射影変換行列Pを求めるための第2多角形は、図18(B)に示すように、接点p’、q’、p’、q’を頂点とし、真円E1’に内接する正方形P4’になる。この場合、射影変換行列算出手段は、中心候補Oが射影変換される点O’を中心とする楕円(本変形例では真円E1’)が内接する正方形P4’へ四角形P4を射影変換する射影変換行列を算出する。
本変形例の場合、ステップS35までやステップS45までにおいて、第1接点、第2接点、第3接点、第4接点が求まれば、四角形P4の頂点が算出されたことになる。
このように、携帯端末10は、楕円および中心候補に関連した第1多角形を算出する多角形算出手段の一例として機能する。また、携帯端末10は、中心候補を通る直線と楕円との交点を接点とする第1多角形の一例の四角形を算出する多角形算出手段の一例として機能する。
本変形例の場合、射影変換行列Pを求めるための四角形P4の頂点が、第1接点、第2接点、第3接点、第4接点として容易に求まる。
次に、変形対象領域の四角形を求める第4変形例について図に基づき説明する。
図19は、楕円に接する四角形を求める第4変形例であって、(A)は、楕円に接する四角形の一例を示す模式図であり、(B)は射影変換後の様子を示す模式図である。
本変形例は、図19(A)に示すように、中心候補Oが楕円E1の縁の近傍にある場合である。本変形例の場合、楕円E1に外接する四角形は、四角形P5となり、楕円E1に内接する四角形は、四角形P6となる。なお、第1基準直線lや第2基準直線mは、中心候補Oを通る任意の直線で、かつ、お互いに中心候補Oで交差する直線として求めた。
本変形例の場合、楕円E1に接点p、q、p、qで外接する四角形P5が、楕円E1を囲まない。このため、射影変換行列Pを求めるための第2多角形は、頂点xに対応するx’の座標が(−∞、−∞)となり、概念的には、図19(B)において、点線で示した第2多角形P5’となる。このように、四角形P5が、楕円E1を囲まない場合でも、射影変換行列Pを算出できる。この場合、射影変換行列算出手段は、中心候補Oが射影変換される点O’を中心とする楕円(本変形例では真円E1’)に関連する多角形P5’へ四角形P5を射影変換する射影変換行列を算出する。
一方、楕円E1に接点p、q、p、qで内接する四角形P6の場合、射影変換行列Pを求めるための第2多角形は、図19(B)に示すように、接点p’、q’、p’、q’を頂点とし、真円E1’に内接する正方形P6’になる。このように、内接の四角形P6の場合、中心候補が、楕円の縁に近い場合でも、直感的に第2多角形が観念しやすい。この場合、射影変換行列算出手段は、中心候補Oが射影変換される点O’を中心とする楕円(本変形例では真円E1’)が外接する正方形P6’へ四角形P6を射影変換する射影変換行列を算出する。
なお、多角形の一例として、三角形や五角形でもよい。射影変換行列Pが算出できるように、変換前の対象画像において、楕円E1および中心候補Oに関連して少なくとも4点の座標が決まればよい。三角形の場合、射影変換行列Pを求めるため、3つの頂点以外に、ある辺上の点や、三角形の内部の重心、内心、外心等の点を第4の座標とすればよい。また、第2多角形は、例えば、正三角形、正方形、長方形、正五角形等の等角の多角形や、正多角形であり、射影変換後の真円E1’と関連づく図形で、射影変換行列Pが算出できればよい。また、第2多角形は、正多角形に限られない。中心候補が射影変換される点を中心とする、第2多角形に内接または外接する楕円は、真円に限られない。
また、画像検索サーバ20側が、画像処理装置として、対象画像から所望の向きに表示された変換画像である標準画像を求めてもよい。例えば、携帯端末10が撮像した対象画像を含む画像データを検索要求画像として、ネットワーク3を通して、画像検索サーバ20側に送信する。そして、画像検索サーバ20側の受信部が、画像取得手段として機能し、画像検索サーバ20側で、標準画像に変換し、画像検索サーバ20が、標準画像に基づき検索する。そして画像検索サーバ20が、検索結果を携帯端末10に送信する。
また、携帯型無線電話機のような携帯端末10に限らず、デジタルカメラで撮影した対象画像を、本実施形態の方法が機能するプログラムがインストールされたパーソナルコンピュータに取り込み、所望の向きに表示された変換画像である標準画像を求める形態でもよい。また、画像検索システム1の画像検索サーバ20の処理は、1台のサーバで行ってもよいし、複数のサーバに分散させてもよい。また、検索サーバを備えず、例えば単に標準画像を求めてもよく、あるいは、得られた標準画像を利用して検索とは異なる処理をしてもよい。
また、対象画像は花画像に限らず、例えば他の円形形状のものであってもよく、皿、カップ、CD、DVD、時計の文字盤、道路標識などであってもよい。あるいは、対象画像は、花画像に限らず、例えば楕円形かつ平面的な物体であってもよい。
さらに、本発明は、上記各実施形態に限定されるものではない。上記各実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
10:携帯端末
15:記憶部
14:撮像部
16:制御部
20:画像検索サーバ
21:制御部
21b:記憶部
22:データベース
30:画像枠
E1:楕円
F1:花の輪郭
F2:花芯の輪郭
:中心候補
P1:四角形(第1多角形)
P1’:正方形(第2多角形)

Claims (17)

  1. 対象画像に対して画像処理を行う画像処理装置であって、
    前記対象画像を近似する楕円を算出する楕円算出手段と、
    前記対象画像の中心候補を決定する中心候補決定手段と、
    前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出手段と、
    前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出手段と、
    記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得手段と、
    を備えたことを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において、
    前記射影変換行列算出手段が、前記中心候補が射影変換される点を中心とする楕円が内接または外接する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出することを特徴とする画像処理装置。
  3. 前記射影変換行列算出手段における前記中心候補が射影変換される点を中心とする楕円は真円であることを特徴とする請求項1又は2に記載の画像処理装置。
  4. 請求項1から3のいずれか1項に記載の画像処理装置において、
    前記多角形算出手段が、
    前記中心候補を通る直線と前記楕円との交点を接点とする前記第1多角形を算出することを特徴とする画像処理装置。
  5. 請求項4に記載の画像処理装置において、
    前記多角形算出手段が、
    前記中心候補を通る直線を前記楕円の長軸に平行な直線から求めることを特徴とする画像処理装置。
  6. 請求項4に記載の画像処理装置において、
    前記多角形算出手段が、
    前記対象画像を取り囲む画像枠のいずれかの辺に平行な直線と前記楕円とが接する点を前記接点とすることを特徴とする画像処理装置。
  7. 請求項1から請求項6のいずれか1項に記載の画像処理装置において、
    前記多角形算出手段が、前記楕円および前記中心候補に関連した四角形を算出し、
    前記射影変換行列算出手段が、前記中心候補が射影変換される点を中心とする楕円に関連する正方形へ前記四角形を射影変換する射影変換行列を算出することを特徴とする画像処理装置。
  8. 請求項1から請求項7のいずれか1項に記載の画像処理装置において、
    前記中心候補決定手段が、
    前記対象画像の中から前記中心候補を含む中心候補画像を抽出し、
    抽出した前記中心候補画像を楕円近似した楕円の長軸と短軸との交点から前記中心候補を決定することを特徴とする画像処理装置。
  9. 請求項1から請求項8のいずれか1項に記載の画像処理装置において、
    前記対象画像が花画像であって、
    前記楕円算出手段が、前記花画像を近似する前記楕円を算出し、
    前記中心候補決定手段が、前記花画像の花芯部分から前記花画像の前記中心候補を決定することを特徴とする画像処理装置。
  10. 請求項1から請求項9のいずれか1項に記載の画像処理装置において、
    前記対象画像を含む画像を取得する画像取得手段を更に備えたことを特徴とする画像処理装置。
  11. 請求項10に記載の画像処理装置において、
    前記取得された画像から、前記対象画像を抽出する対象画像抽出手段を更に備えたことを特徴とする画像処理装置。
  12. 請求項1から請求項11のいずれか1項に記載の画像処理装置において、
    前記変換画像に基づき、前記対象画像を特定する情報を検索する検索手段を更に備えたことを特徴とする画像処理装置。
  13. 請求項12に記載の画像処理装置において、
    前記検索手段が、
    前記変換画像より画像の特徴量を抽出し、
    前記特徴量に基づき、前記対象画像を特定する情報を検索することを特徴とする画像処理装置。
  14. 請求項1から13のいずれか1項に記載の画像処理装置において、
    前記第2多角形が正多角形であることを特徴とする画像処理装置。
  15. 請求項1から14のいずれか1項に記載の画像処理装置において、
    前記対象画像を記憶する記憶手段を更に備えたことを特徴とする画像処理装置。
  16. 対象画像に対して画像処理を行う画像処理装置の画像処理方法であって、
    前記画像処理装置が、前記対象画像を近似する楕円を算出する楕円算出ステップと、
    前記画像処理装置が、前記画像処理後における前記対象画像の中心候補を決定する中心候補決定ステップと、
    前記画像処理装置が、前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出ステップと、
    前記画像処理装置が、前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出ステップと、
    前記画像処理装置が、前記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得ステップと、
    を有することを特徴とする画像処理方法。
  17. コンピュータを、
    画像処理の対象画像を近似する楕円を算出する楕円算出手段、
    前記画像処理後における前記対象画像の中心候補を決定する中心候補決定手段、
    前記楕円および前記中心候補に関連した第1多角形を算出する多角形算出手段、
    前記中心候補が射影変換される点を中心とする楕円に関連する第2多角形へ前記第1多角形を射影変換する射影変換行列を算出する射影変換行列算出手段、および、
    記対象画像を前記射影変換行列に基づき射影変換して、変換画像を取得する変換画像取得手段として機能させることを特徴とする画像処理プログラム。
JP2009241233A 2009-10-20 2009-10-20 画像処理装置、画像処理方法、および、画像処理プログラム Active JP5075182B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP2009241233A JP5075182B2 (ja) 2009-10-20 2009-10-20 画像処理装置、画像処理方法、および、画像処理プログラム
US13/502,972 US8660309B2 (en) 2009-10-20 2010-10-18 Image processing apparatus, image processing method, image processing program and recording medium
CN201080053867.3A CN102656605B (zh) 2009-10-20 2010-10-18 图像处理装置、图像处理方法
KR1020127012887A KR101379066B1 (ko) 2009-10-20 2010-10-18 화상 처리 장치, 화상 처리 방법, 및, 기록 매체
EP10824895.6A EP2477152B1 (en) 2009-10-20 2010-10-18 Image processing device, image processing method, image processing program, and recording medium
ES10824895.6T ES2694762T3 (es) 2009-10-20 2010-10-18 Dispositivo de procesamiento de imágenes, procedimiento de procesamiento de imágenes, programa de procesamiento de imágenes y medio de grabación
CA2776881A CA2776881C (en) 2009-10-20 2010-10-18 Image processing device, image processing method, image processing program, and recording medium
PCT/JP2010/068281 WO2011049046A1 (ja) 2009-10-20 2010-10-18 画像処理装置、画像処理方法、画像処理プログラム、および、記録媒体
TW099135750A TWI434567B (zh) 2009-10-20 2010-10-20 An image processing apparatus, an image processing method, an image processing program, and a recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009241233A JP5075182B2 (ja) 2009-10-20 2009-10-20 画像処理装置、画像処理方法、および、画像処理プログラム

Publications (3)

Publication Number Publication Date
JP2011090374A JP2011090374A (ja) 2011-05-06
JP2011090374A5 JP2011090374A5 (ja) 2012-08-09
JP5075182B2 true JP5075182B2 (ja) 2012-11-14

Family

ID=43900272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009241233A Active JP5075182B2 (ja) 2009-10-20 2009-10-20 画像処理装置、画像処理方法、および、画像処理プログラム

Country Status (9)

Country Link
US (1) US8660309B2 (ja)
EP (1) EP2477152B1 (ja)
JP (1) JP5075182B2 (ja)
KR (1) KR101379066B1 (ja)
CN (1) CN102656605B (ja)
CA (1) CA2776881C (ja)
ES (1) ES2694762T3 (ja)
TW (1) TWI434567B (ja)
WO (1) WO2011049046A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI476730B (zh) * 2012-10-31 2015-03-11 Vivotek Inc 數位影像的反扭曲處理方法
CN106296578B (zh) * 2015-05-29 2020-04-28 阿里巴巴集团控股有限公司 一种图像处理方法及装置
US11568627B2 (en) 2015-11-18 2023-01-31 Adobe Inc. Utilizing interactive deep learning to select objects in digital visual media
US10192129B2 (en) * 2015-11-18 2019-01-29 Adobe Systems Incorporated Utilizing interactive deep learning to select objects in digital visual media
CN107767326B (zh) * 2017-09-28 2021-11-02 北京奇虎科技有限公司 图像中对象变换处理方法、装置及计算设备
CN108038880B (zh) * 2017-12-20 2019-12-13 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
RU2680765C1 (ru) * 2017-12-22 2019-02-26 Общество с ограниченной ответственностью "Аби Продакшн" Автоматизированное определение и обрезка неоднозначного контура документа на изображении
JP6730379B2 (ja) * 2018-03-23 2020-07-29 株式会社東芝 読取システム、読取方法、プログラム、及び記憶媒体
CN110650239B (zh) * 2018-06-26 2021-03-16 百度在线网络技术(北京)有限公司 图像处理方法、装置、计算机设备及存储介质
CN109003327B (zh) * 2018-06-29 2022-09-30 平安科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
JP6818002B2 (ja) 2018-12-12 2021-01-20 株式会社東芝 読取支援システム、移動体、読取支援方法、プログラム、及び記憶媒体
US11282208B2 (en) 2018-12-24 2022-03-22 Adobe Inc. Identifying target objects using scale-diverse segmentation neural networks
JP6763060B1 (ja) 2019-05-27 2020-09-30 株式会社東芝 読取システム、移動体、読取方法、プログラム、及び記憶媒体
CN110659370B (zh) * 2019-08-12 2024-04-02 深圳市华付信息技术有限公司 一种高效数据标注方法
CN113327863B (zh) * 2020-02-28 2022-06-21 芯恩(青岛)集成电路有限公司 半导体工艺方法
CN113469872B (zh) * 2020-03-31 2024-01-19 广东博智林机器人有限公司 一种区域显示方法、装置、设备及存储介质
US11335004B2 (en) 2020-08-07 2022-05-17 Adobe Inc. Generating refined segmentation masks based on uncertain pixels
JP2022036839A (ja) * 2020-08-24 2022-03-08 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム
US11676279B2 (en) 2020-12-18 2023-06-13 Adobe Inc. Utilizing a segmentation neural network to process initial object segmentations and object user indicators within a digital image to generate improved object segmentations
US11875510B2 (en) 2021-03-12 2024-01-16 Adobe Inc. Generating refined segmentations masks via meticulous object segmentation
US12020400B2 (en) 2021-10-23 2024-06-25 Adobe Inc. Upsampling and refining segmentation masks
WO2024089763A1 (ja) * 2022-10-25 2024-05-02 日本電信電話株式会社 矩形領域推定装置、矩形領域推定方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668765B2 (ja) * 1988-09-28 1994-08-31 工業技術院長 円の3次元計測方法
JP3918143B2 (ja) * 2000-12-28 2007-05-23 独立行政法人科学技術振興機構 植物認識システム
GB2397423B (en) * 2001-09-17 2005-06-01 Ca Minister Agriculture & Food A method and apparatus for identifying and quantifying characteristics of seeds and other small objects
JP4363151B2 (ja) 2003-10-14 2009-11-11 カシオ計算機株式会社 撮影装置、その画像処理方法及びプログラム
JP4033198B2 (ja) * 2004-02-27 2008-01-16 カシオ計算機株式会社 画像処理装置、画像投影装置、画像処理方法及びプログラム
JP4456029B2 (ja) * 2005-03-29 2010-04-28 大日本印刷株式会社 回転体の三次元情報復元装置
EP1917639A4 (en) * 2005-08-25 2017-11-08 Ricoh Company, Ltd. Image processing method and apparatus, digital camera, and recording medium recording image processing program
JP4831314B2 (ja) * 2006-01-26 2011-12-07 株式会社ニコン 対象物認識システム
JP2007251720A (ja) * 2006-03-17 2007-09-27 Nikon Corp 対象物認識システム
JP4631760B2 (ja) 2006-03-17 2011-02-16 カシオ計算機株式会社 デジタルカメラ、画像処理方法及びプログラム

Also Published As

Publication number Publication date
WO2011049046A1 (ja) 2011-04-28
EP2477152A4 (en) 2014-01-15
KR101379066B1 (ko) 2014-03-28
CN102656605B (zh) 2015-12-16
US20120201423A1 (en) 2012-08-09
JP2011090374A (ja) 2011-05-06
ES2694762T3 (es) 2018-12-27
TW201143352A (en) 2011-12-01
EP2477152A1 (en) 2012-07-18
CA2776881C (en) 2016-01-05
EP2477152B1 (en) 2018-10-17
TWI434567B (zh) 2014-04-11
CA2776881A1 (en) 2011-04-28
CN102656605A (zh) 2012-09-05
US8660309B2 (en) 2014-02-25
KR20120083486A (ko) 2012-07-25

Similar Documents

Publication Publication Date Title
JP5075182B2 (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
CN110568447B (zh) 视觉定位的方法、装置及计算机可读介质
EP2328125B1 (en) Image splicing method and device
JPWO2018235163A1 (ja) キャリブレーション装置、キャリブレーション用チャート、チャートパターン生成装置、およびキャリブレーション方法
JP6452360B2 (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
JP2014071850A (ja) 画像処理装置、端末装置、画像処理方法、およびプログラム
JP2011239361A (ja) 繰り返し撮影用arナビゲーション及び差異抽出のシステム、方法及びプログラム
US10482571B2 (en) Dual fisheye, hemispherical image projection and stitching method, device and computer-readable medium
CN115641401A (zh) 一种三维实景模型的构建方法及相关装置
JP2019045991A (ja) 生成装置、生成方法、及びプログラム
CN112270702A (zh) 体积测量方法及装置、计算机可读介质和电子设备
KR101574636B1 (ko) 면형방식 디지털 항공카메라로 촬영한 시계열 항공사진을 입체시하여 좌표를 연동하고 변화지역을 판독하는 시스템
JP6017343B2 (ja) データベース生成装置、カメラ姿勢推定装置、データベース生成方法、カメラ姿勢推定方法、およびプログラム
US20090059018A1 (en) Navigation assisted mosaic photography
TW201342303A (zh) 三維空間圖像的獲取系統及方法
KR101598399B1 (ko) 로드뷰 사진이미지의 좌표정보를 이용한 자동 이미지 합성 시스템
JP5739239B2 (ja) 撮影支援システム及び撮像装置
JP5216703B2 (ja) 映像表示システム、及び、映像表示方法
JP6625654B2 (ja) 投影装置、投影方法、および、プログラム
CN114066731A (zh) 生成全景图的方法、装置、电子设备及存储介质
KR100953737B1 (ko) 이미지 매칭을 이용한 맨홀 도화 시스템
CN108781251A (zh) 图像处理装置、图像处理方法和图像处理***
CN112615993A (zh) 深度信息获取方法、双目摄像模组、存储介质及电子设备
JP2002135807A (ja) 3次元入力のためのキャリブレーション方法および装置
CN113680059B (zh) 一种户外场景ar游戏定位装置和方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120621

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120621

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20120803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120824

R150 Certificate of patent or registration of utility model

Ref document number: 5075182

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250