JP6390248B2 - 情報処理装置、ぼけ具合計算方法、及びプログラム - Google Patents

情報処理装置、ぼけ具合計算方法、及びプログラム Download PDF

Info

Publication number
JP6390248B2
JP6390248B2 JP2014158391A JP2014158391A JP6390248B2 JP 6390248 B2 JP6390248 B2 JP 6390248B2 JP 2014158391 A JP2014158391 A JP 2014158391A JP 2014158391 A JP2014158391 A JP 2014158391A JP 6390248 B2 JP6390248 B2 JP 6390248B2
Authority
JP
Japan
Prior art keywords
blur
image
index
line width
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014158391A
Other languages
English (en)
Other versions
JP2016035670A (ja
Inventor
悠介 野中
悠介 野中
亜希子 楠本
亜希子 楠本
馬場 孝之
孝之 馬場
上原 祐介
祐介 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014158391A priority Critical patent/JP6390248B2/ja
Publication of JP2016035670A publication Critical patent/JP2016035670A/ja
Application granted granted Critical
Publication of JP6390248B2 publication Critical patent/JP6390248B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、ぼけ具合計算方法、及びプログラムに関する。
近年、様々な場面で入力画像から文字を自動認識する文字認識技術が利用されている。例えば、カメラで撮像したランドマークの画像から文字を認識し、認識した文字に応じて情報を提供する情報提供システムなどに文字認識技術が利用されている。文字認識の方法としては、例えば、設定した文字を表す辞書画像と入力画像とを画素単位で比較して類似度を計算し、最も類似度が高い辞書画像を認識結果とする方法がある。
上記の方法を適用する場合、入力画像がぼけていると、辞書画像と入力画像との差分が大きくなり文字認識の精度が低下する。例えば、サイズが小さい文字や、漢字などの複雑な形状を有する文字は入力画像のぼけによる影響を受けやすい。こうした事情を受け、同じ文字についてぼけ具合の異なる複数の辞書画像を用意し、入力画像と各辞書画像とを比較して類似度の高い辞書画像を抽出する方法が提案されている。この方法を適用すれば、同じようにぼけた画像同士が比較されるため、文字認識の精度が向上する可能性がある。
但し、文字毎に用意した複数の辞書画像の全てと入力画像とをそれぞれ比較すると比較処理にかかる演算量が増し、文字認識にかかる処理時間が増大する。逆に、入力画像とぼけ具合が近い辞書画像を対象に比較処理を実行すれば処理時間の短縮が期待できる。
なお、認識対象となる文字の劣化度合いを特定し、特定した劣化度合いに応じて文字認識の方式を選択する方法が提案されている。この方法は、入力パターンから劣化指数を求め、劣化指数に合わせた辞書を選択するものである。また、劣化度合いが大きい場合に濃度特徴を利用して文字認識を行い、劣化度合いが小さい場合には方向特徴を利用して文字認識を行う方法が提案されている。
特開2007−304899号公報 特開平11−175662号公報 特開2007−026027号公報
入力画像のぼけ具合に近い辞書画像を利用して上記の比較処理を実行する場合、入力画像と辞書画像とのぼけ具合にずれが生じると文字認識の精度が低下する。ぼけ具合は、例えば、文字のエッジ部分における輝度勾配やエッジ幅に基づいて計算される。ぼけた画像に含まれる文字の細部には潰れなどが生じることがある。潰れなどが生じると、輝度勾配やエッジ幅の検出に誤りが生じる可能性がある。輝度勾配やエッジ幅の検出に誤りが生じると、ぼけ具合の判断精度が低下し、文字認識の精度が低下する要因となりうる。
そこで、1つの側面によれば、本発明の目的は、ぼけ具合の判断精度を高めることが可能な情報処理装置、ぼけ具合計算方法、及びプログラムを提供することにある。
本開示の1つの側面によれば、画像に含まれる文字の線幅に応じた、画像のぼけ具合の指標となるぼけ指標とぼけ具合との関係を示す関係情報を記憶する記憶部と、撮像画像から線幅及びぼけ指標を算出し、記憶部により記憶されている関係情報を参照して、線幅及びぼけ指標に対応するぼけ具合を特定する演算部とを備え関係情報は、複数の線幅に対応する複数の関数曲線をぼけ指標とぼけ具合との座標上で表現可能な情報であって、演算部は、算出した線幅に対応する関数曲線を、複数の関数曲線の中から選択し、選択した関数曲線上でぼけ指標に対するぼけ具合を特定する情報処理装置が提供される。
また、本開示の他の1つの側面によれば、コンピュータが、画像に含まれる文字の線幅に応じた、画像のぼけ具合の指標となるぼけ指標とぼけ具合との関係を示す関係情報を記憶する記憶部から関係情報を取得し、撮像画像から、線幅及びぼけ指標を算出し、記憶部により記憶されている関係情報を参照して、線幅及びぼけ指標に対応するぼけ具合を特定する場合、関係情報は、複数の線幅に対応する複数の関数曲線をぼけ指標とぼけ具合との座標上で表現可能な情報であって、算出した線幅に対応する関数曲線を、複数の関数曲線の中から選択し、選択した関数曲線上でぼけ指標に対するぼけ具合を特定するぼけ具合計算方法が提供される。
また、本開示の他の1つの側面によれば、コンピュータに、画像に含まれる文字の線幅に応じた、画像のぼけ具合の指標となるぼけ指標とぼけ具合との関係を示す関係情報を記憶する記憶部から関係情報を取得し、撮像画像から、線幅及びぼけ指標を算出し、記憶部により記憶されている関係情報を参照して、線幅及びぼけ指標に対応するぼけ具合を特定する場合、関係情報は、複数の線幅に対応する複数の関数曲線をぼけ指標とぼけ具合との座標上で表現可能な情報であって、算出した線幅に対応する関数曲線を、複数の関数曲線の中から選択し、選択した関数曲線上でぼけ指標に対するぼけ具合を特定する処理を実行させる、プログラムが提供される。
本発明によれば、ぼけ具合の判断精度を高めることが可能になる。
第1実施形態に係る情報処理装置の一例を示した図である。 第2実施形態に係る文字認識システムの一例を示した図である。 第2実施形態に係る文字認識システムについて説明するための第1の図である。 第2実施形態に係る文字認識システムについて説明するための第2の図である。 ぼけ具合、エッジ勾配、エッジ幅の関係について説明するための図である。 エッジ部分の輝度を示す図である。 エッジ幅を示す図である。 正規化を説明するための図である。 線の潰れた画像に対する正規化を説明するための図である。 エッジ勾配と錯乱円との関係を示す図である。 線の幅、エッジ勾配及び錯乱円の関係を示す図である。 線幅の算出に使用される領域の一例を示す図である。 線幅の算出を説明するための図である。 第2実施形態に係る画像処理装置が有する機能の一例を示したブロック図である。 第2実施形態に係る錯乱円特定情報の一例を示した図である。 第2実施形態に係る辞書情報の一例を示した図である。 錯乱円特定情報選択部の動作を示すフローチャートである。 第2実施形態に係る画像処理装置の機能を実現することが可能なハードウェアの一例を示した図である。 第2実施形態に係る画像処理装置の動作を示したフローチャートである。
以下に添付図面を参照しながら、本発明の実施形態について説明する。なお、本明細書及び図面において実質的に同一の機能を有する要素については、同一の符号を付することにより重複説明を省略する場合がある。
<1.第1実施形態>
図1を参照しながら、第1実施形態について説明する。なお、図1は、第1実施形態に係る情報処理装置の一例を示した図である。また、図1に示した情報処理装置10は、第1実施形態に係る情報処理装置の一例である。
情報処理装置10は、記憶部11及び演算部12を有する。
なお、記憶部11は、RAM(Random Access Memory)などの揮発性記憶装置、或いは、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置である。演算部12は、CPU(Central Processing Unit)やDSP(Digital Signal Processor)などのプロセッサである。但し、演算部12は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの電子回路であってもよい。演算部12は、例えば、記憶部11又は他のメモリに格納されたプログラムを実行する。
記憶部11は、画像に含まれる文字の線幅に応じた、画像のぼけ具合の指標となるぼけ指標とぼけ具合との関係を示す関係情報を記憶する。演算部12は、撮像画像から線幅及びぼけ指標を算出し、記憶部11により記憶されている関係情報を参照して、線幅及びぼけ指標に対応するぼけ具合を特定する。
図1には、一例として、複数の線幅Wa、Wb、Wcにそれぞれ対応する関数曲線F1、F2、F3を示した。関数曲線F1、F2、F3は、それぞれ関係情報の一例である。但し、図1の例では連続的な曲線の関数で関係情報を表現しているが、ぼけ具合と、ぼけ指標とを対応付けるテーブル形式の情報として関係情報を表現することもできる。なお、ぼけ指標は、例えば、エッジ部分の勾配やエッジ部分の幅などである。
例えば、演算部12が撮像画像から算出した文字の線幅がWbであったとする。また、演算部12が算出したぼけ指標がyであったとする。この場合、演算部12は、関数曲線F1、F2、F3の中から線幅Wbに対応する関数曲線F2を選択する。そして、演算部12は、関数曲線F2を利用して、ぼけ指標yに対応するぼけ具合xを特定する。
上記のように、ぼけ指標とぼけ具合との関係を示す関係情報を予め用意し、その関係情報を利用してぼけ具合を特定することで、文字の線が潰れるなどの状況が生じても、高い精度でぼけ具合を判断することが可能になる。
以上、第1実施形態について説明した。
<2.第2実施形態>
次に、第2実施形態について説明する。
[2−1.システム]
第2実施形態に係る技術を適用可能なシステムの例について説明する。第2実施形態に係る技術は、デジタルカメラなどの撮像装置により対象物を撮影し、画像認識技術を用いて対象物に記載された文字や記号を自動認識するシステムに適用可能である。
(文字認識システム)
一例として、撮像した画像から文字を認識する文字認識システムについて説明する。地上に設置されている撮像装置から文字を認識する文字認識システムの例を図2に示した。以下では、図2の例を想定して説明を進める。なお、図2は、第2実施形態に係る文字認識システムの一例を示した図である。また、図2に示した文字認識システム100は、第2実施形態に係る文字認識システムの一例である。
図2に示すように、文字認識システム100は、撮像装置101及び画像処理装置102を含む。撮像装置101は、例えば、地面から高い位置に設置され、周辺に位置する標識等の対象物に記載されている文字を撮影する。図2の例において、撮像装置101による撮像範囲は2本の破線で表現された角度θの範囲である。また、撮像装置101は、撮像範囲にピントが合うようにフォーカスが設定されている。但し、被写界深度は範囲Fであり、撮像範囲内であっても、範囲F内に位置する対象物の画像は鮮明であるが、範囲F外に位置する対象物の画像はぼける。
例えば、範囲F外の地点Aで撮像された対象物の撮像画像PAは、図2に示すように大きくぼけた画像となる。一方、範囲F内の地点Bで撮像された対象物の撮像画像PBは、地点Aで撮像された撮像画像PAよりも鮮明な画像となる。なお、範囲F内の対象物を撮影した場合でも、被写体ブレや温度変化などに起因して撮像画像にぼけが生じる可能性はある。また、撮像装置101の経年劣化によりフォーカス位置がずれて撮像画像にぼけが生じる可能性もある。
撮像画像にぼけが生じると、対象物の撮像画像から文字を認識することが難しくなる。そこで、画像処理装置102は、撮像装置101から入力された撮像画像(以下、入力画像PIN)のぼけ具合を検出し、検出したぼけ具合に応じた文字認識の処理を実行する。以下、図3及び図4を参照しながら、画像処理装置102が実行する処理の内容について、さらに説明する。なお、図3は、第2実施形態に係る文字認識システムについて説明するための第1の図である。また、図4は、第2実施形態に係る文字認識システムについて説明するための第2の図である。
図3及び図4の例は、撮像装置101から画像処理装置102へと撮像画像PAが入力された場合に関する。つまり、この例は、入力画像PINが撮像画像PAの場合に関する。以下では、画像が有するぼけの大きさをぼけ具合Lv1、Lv2、Lv3と表現する。また、Lv1<Lv2<Lv3とする。ここでは説明の都合上、3種類のぼけ具合を例示したが、後述する技術は、2種類又は4種類以上のぼけ具合にも適用可能である。
画像処理装置102は、複数のぼけ具合Lv1、Lv2、Lv3にそれぞれ対応する複数の辞書画像を保持している。辞書画像とは、文字認識の際に、入力画像PINの文字部分と比較するために予め用意された文字の画像である。例えば、入力画像PINのぼけ具合がLv3である場合、画像処理装置102は、ぼけ具合Lv3の辞書画像と入力画像PINとを比較して入力画像PINに含まれる文字を認識する。
入力画像PINのぼけ具合がLv3である場合、図3に示すように、入力画像PINとぼけ具合Lv1の画像(A)との類似度SAは、入力画像PINとぼけ具合Lv2の画像(B)との類似度SBよりも小さくなる。さらに、入力画像PINとぼけ具合Lv2の画像(B)との類似度SBは、入力画像PINとぼけ具合Lv3の画像(C)との類似度SCよりも小さくなる。つまり、ぼけ具合Lv3の辞書画像と入力画像PINとを比較して入力画像PINに含まれる文字を認識することで、文字認識の精度が向上する。
但し、複数の辞書画像のそれぞれに対して入力画像PINとの比較を行うと比較処理にかかる負荷が高くなるため、画像処理装置102は、図4に示すように、入力画像PINから検出したぼけ具合に適合する辞書画像を選択して両画像を照合する。
上記のように、入力画像PINのぼけ具合に応じた辞書画像を利用することで文字認識の精度が向上する。さらに、ぼけ具合の判断結果に応じて1つの辞書画像を選択することにより、入力画像PINと辞書画像とを照合して類似度を計算する処理の負荷が低減される。
(その他のシステム)
第2実施形態に係る技術は、上記の文字認識システム100の他、例えば、ランドマーク認識システムやOCR(Optical Character Recognition)システムなどに適用することができる。
ランドマーク認識システムは、街中や観光地にある看板などをスマートフォンのカメラ機能などで撮像し、撮像画像から認識した文字列に基づいて地域や施設などのランドマークに関する情報を提供するシステムである。第2実施形態に係る技術をランドマーク認識システムに適用すると、撮影状況などに起因して撮像画像がぼけてしまっても文字認識が精度良く行われ、正しい情報を提供できる可能性が高まる。
OCRシステムは、スキャナなどの光学機器で読み取った文字列の画像から個々の文字を認識してテキストデータに変換するシステムである。第2実施形態に係る技術をOCRシステムに適用すると、読み取り原稿の文字がぼけて不鮮明である場合や、原稿表面に対向配置される透光板(ガラス面や透明プラスチック面など)の汚れなどがある場合でも文字認識を精度良く行うことができるようになる。
以上、第2実施形態に係る技術を適用可能なシステムの例について説明した。以下では、上記の文字認識システム100を例に説明を進めるが、第2実施形態に係る技術の適用範囲はこれに限定されない。画像から文字認識を行う任意のシステムに対して第2実施形態に係る技術を適用することが可能である。
[2−2.ぼけ具合の特定]
ぼけ具合の特定について説明する。
(ぼけ具合とぼけ指標)
画像処理装置102では、上記のような辞書選択を行って文字を認識するが、この場合にぼけ具合の特定を行う。以降、画像処理装置102によるぼけ具合特定動作について説明する。最初に、ぼけ具合とぼけ指標について説明する。
図5は、ぼけ具合、エッジ勾配、エッジ幅の関係について説明するための図である。ぼけ具合の大きさを表す尺度となるぼけ指標には、例えば、エッジ勾配やエッジ幅などが利用される。図5に示すように、エッジ部分の輝度をグラフ化すると、ぼけ具合が大きい画像(A)は、エッジ勾配(角度η1)が小さく、エッジ幅(最小輝度から最大輝度までの距離W1)が大きい。一方、ぼけ具合が小さい画像(B)は、エッジ勾配(角度η2)が大きく、エッジ幅(最小輝度から最大輝度までの距離W2)が小さい。このような特性を利用すると、エッジ勾配やエッジ幅に基づいてぼけ具合を評価することができる。
但し、撮影エリアが広い場合や、入力画像に含まれる文字の解像度が低いような場合、入力画像のぼけにより細部が潰れてしまうため、エッジ勾配やエッジ幅からぼけ具合の大きさが正しく評価されないことがある。
図6は、エッジ部分の輝度を示す図である。(A)は、画像p1におけるエッジ部分の輝度のグラフg1を示している。画像p1は、画像ぼけによって潰れない程度に十分な太さの文字の線L1の撮像画像である。
(B)は、画像p2におけるエッジ部分の輝度のグラフg2を示している。画像p2は、画像ぼけによって潰れてしまう程度の細さである文字の線L2の撮像画像である。
(A)の画像p1のエッジ部分における最小輝度はb1である。これに対し、(B)の画像p2のエッジ部分における最小輝度はb2(>b1)になっており、画像p1、p2との間で、輝度に差Δが生じている。
このように、撮影エリアが広角、又は解像度が低いなどの理由で、文字の線が細い場合、入力画像のぼけによって線が潰れて、本来の線の輝度に差Δが生じてしまう可能性がある。すると、ぼけ具合の指標としての正しいエッジ勾配やエッジ幅の値が得られなくなる。
(線の潰れた画像から正しいエッジ幅が算出できない理由)
図7はエッジ幅を示す図である。線の潰れが生じた図6の画像p2におけるエッジ部分の輝度のグラフg2を示している。画像p2のエッジ部分における輝度はb2であり、エッジ幅はW11になっている。なお、輝度b1は本来の文字の輝度である。
画像p2からエッジ幅を算出すれば、図7に示すように、エッジ幅=W11が算出されることになるが、画像p2は線の潰れが生じた画像であるため、線の潰れがなければ最小輝度はb2よりも小さくなる可能性が高い。その場合は、エッジ幅もW11とは異なる値になる。従って、線の潰れが生じた画像p2から算出されたエッジ幅は正しい値ではなく、ぼけ具合の判断基準として使用しないことが望ましい。
これまで線の潰れた画像から得られるエッジ幅について説明したが、線の潰れた画像から得られるエッジ勾配についても、ぼけ具合の指標としての適用について説明する。まず、画像の明るさを補正するための正規化について説明する。
図8は正規化を説明するための図である。(A)は、画像p3におけるエッジ部分の輝度のグラフgaと、その正規化グラフga1とを示している。(B)は、画像p4におけるエッジ部分の輝度のグラフgbと、その正規化グラフgb1とを示している。
なお、画像p3、p4のエッジ幅は同一であるが、画像の明るさは互いに異なり、画像p3の方が画像p4よりも明るいとする。
(A)のグラフgaにおいて、画像p3のエッジ部分におけるエッジ幅はW12であり、エッジ勾配はSL1になっている。これに対し、(B)のグラフgbにおいて、画像p4のエッジ部分におけるエッジ幅はW12であり、エッジ勾配はSL2になっている。
このように、画像p3、p4のエッジ幅は同じであっても、画像の明るさが異なるとエッジ勾配に差異が生じ、この例では、画像p3のエッジ勾配SL1の方が画像p4のエッジ勾配SL2よりも大きくなっている。
上記のように、互いに観測できるエッジ幅は同一であるが、画像の明るさが異なっているような場合、互いに異なる文字輝度及び背景輝度をそれぞれ、基準文字輝度及び基準背景輝度に補正する正規化が行われる。
(A)のグラフga1、(B)のグラフgb1では、共に基準文字輝度をbr1にし、基準背景輝度をbr2に補正している。この補正により、互いのエッジ勾配はSL0と等しくなっている。このような正規化を行うことにより、グラフga1、gb1に示すように、明るさが異なってもエッジ幅が同じ画像に対しては、エッジ勾配を同じ値にすることができる。
図9は線の潰れた画像に対する正規化を説明するための図である。(A)は、線の潰れのない画像p5におけるエッジ部分の輝度のグラフg11を示している。(A)の画像p5のエッジ部分における輝度はb11であり、本来の文字輝度(つまり、潰れが生じていない場合と同じ文字輝度)である。
(B)は、線の潰れた画像p6におけるエッジ部分の輝度のグラフg12を示している。(B)の画像p6のエッジ部分における輝度はb11aであり、観測される文字輝度(つまり、潰れが生じた場合の文字輝度)である。なお、画像p5、p6は同じ明るさの画像とする。
(B)の画像p6のように、線の潰れた画像に対して正規化を行うと、本来の文字輝度でなく、観測できる文字輝度を基準に正規化が行われる。この場合、本来の文字輝度が認識されず、正規化に失敗し、線の潰れが生じた画像p6から正しいエッジ勾配が算出されない。こうした理由から、線の潰れが生じて線の幅が正しく認識されない画像については、エッジ勾配やエッジ幅などのぼけ指標を正しく算出することができない可能性があり、精度の高いぼけ指標を算出するには、正確な線幅を求めることが望まれる。
(錯乱円)
ここで、ぼけ具合を表す錯乱円について説明する。ある点光源から出た光が結像面で広がる円を錯乱円と呼ぶ。焦点が合っている位置から被写体が離れる程、錯乱円は大きくなる。
また、認識対象の文字と背景との境界部分において、この境界部分の明暗が変化するエッジ周辺の画素には、文字部分からの反射光と、背景部分からの反射光とが足し合わされて入射する。このため、文字と背景との境界部分の錯乱円内の画素は、明暗の中間の輝度をもつ画素となるので、錯乱円の大きさ(例えば、錯乱円の直径)は、ぼけ具合の程度を表す。
(エッジ勾配と錯乱円との関係)
以降、ぼけ指標としてエッジ勾配を使用する例を示すが、ぼけ指標にエッジ幅を使用することも可能である。図10はエッジ勾配と錯乱円との関係を示す図である。縦軸はエッジ勾配、横軸は錯乱円(の大きさ)である。エッジ勾配と錯乱円との間には、エッジ勾配の減少に伴って、錯乱円が増加する関係が存在する。この関係は、関数(以下、ぼけ具合関数)の形で表現することができる。もちろん、エッジ勾配と錯乱円の大きさとを対応付けるテーブルを利用して上記関係を表現することもできる。
上記のぼけ具合関数又はテーブルは、エッジ勾配と錯乱円の大きさとを予め実験又はシミュレーションにより計算し、計算結果から解析的手法又は統計的手法などにより関数又はテーブルの形で求めることができる。例えば、最小二乗法や多変量解析などにより関数を特定する手法や、上記計算の結果をテーブルとして保持する手法などを適用可能である。
上記のぼけ具合関数を利用すれば、あるステップエッジを持つ被写体に対して計算されたエッジ勾配から、その被写体の錯乱円の大きさを特定することが可能である。
但し、線が細い場合には線に潰れが生じるので、ステップエッジを前提に算出したぼけ具合関数を適用すると、正確なエッジ勾配と錯乱円との関係が成り立たないことがある。この場合、エッジ勾配から錯乱円の大きさを正しく特定できない可能性がある。
そこで、第2実施形態においては、錯乱円の大きさの変数に加えて、線幅も変数として加え、錯乱円、線幅及びエッジ勾配の関係を表す線幅毎のぼけ具合関数が適用される。もちろん、当該関係をテーブル形式で表現することもできる。
上記のぼけ具合関数又はテーブルは、線幅毎に錯乱円の大きさとエッジ勾配との関係を予め実験又はシミュレーションにより計算し、計算結果から解析的手法又は統計的手法などにより関数又はテーブルの形で求めることができる。例えば、最小二乗法や多変量解析などにより関数を特定する手法や、上記計算の結果をテーブルとして保持する手法などを適用可能である。
図11は線幅、エッジ勾配及び錯乱円の関係を示す図である。ぼけ具合関数f1は、線幅W1aにおけるエッジ勾配と錯乱円との対応関係を表し、ぼけ具合関数f2は、線幅W2aにおけるエッジ勾配と錯乱円との対応関係を表す。ぼけ具合関数f3は、線幅W3aにおけるエッジ勾配と錯乱円との対応関係を表している。なお、線幅W1a、W2a、W3aの中で、線幅W1aが最も細く、線幅W3aが最も太い(W1a<W2a<W3a)。
このように、異なる線幅毎に、エッジ勾配と錯乱円の大きさとの関係を求めてデータベース化しておく。そして、入力画像から錯乱円を特定する際には、入力画像の文字がぼけていない状態での線幅がわかれば、データベース内のどの対応関係を使用すればよいかわかるため、エッジ勾配から錯乱円の大きさが特定可能となる。
(線幅の算出について)
入力画像のぼけている線から、ぼけていない状態での線幅の算出方法について以下説明する。ある領域Rに文字Lが記されているとする。この場合、文字Lの線幅に対して、領域Rのサイズの比率が決まっており、そのサイズが計測可能であって線幅よりも十分大きな場合には、領域Rに書かれている文字Lに対する線幅の算出を行うことが可能である。
図12は線幅の算出に使用される領域の一例を示す図である。ある領域に文字が記載されており、領域の大きさに対して文字の線の幅が決まっている場合、そのような領域(以下、標識とも呼ぶ)の撮像画像P11の幅から、書かれている文字の線幅の特定を行うことができる。
このように、線幅とのサイズの比率が決まっている対象物又は対象領域があり、そのサイズが計測可能でかつ線幅よりも十分大きいものがあることを前提条件とし、そのサイズを計測することで相対的に線幅を算出することができる。
図13は線幅の算出を説明するための図である。(A)は画像から直接観測した文字の線幅の算出値X1、(B)は標識の大きさの算出値X2を示している。
(A)において、様式が決まっている標識上の文字を認識しようとした場合、文字がぼけない状態で写ったときの線の太さをA1[pixel]、ぼけによる線幅の変化をB1[pixel]、ノイズによる文字幅の観測誤差をC1[pixel]とした場合、画像から直接観測した線幅の計測値X1は、以下の式(1)で算出される。
X1=A1+B1+C1・・・(1)
(B)において、標識の大きさ(横幅)をA2[pixel]、ボケによる標識の大きさの測定誤差をB2[pixel]、ノイズによる標識の大きさの測定誤差をC2[pixel]とすると、標識の大きさの計測値X2は、以下の式(2)で算出される。
X2=A2+B2+C2・・・(2)
なお、ぼけの量は同一平面内にあるのでほぼ等しく、また、ノイズによる観測誤差もほぼ等しいとみなせるので、B2≒B1、C2≒C1としてよい。また、標識の横幅と文字の線幅との比は決まっているため、比例定数をMとすると、A1とA2の関係は、以下の式(3)となる。
A2=M×A1・・・(3)
ここで、ぼけていない状態での線幅A1を算出する方法について述べる。上記の式(1)からA1=X1−(B1+C1)であるから、X1を観測して線幅A1の算出値として使用する場合、B1+C1が誤差となる。
また、上記の式(2)、式(3)から、以下の式(4)が得られる。
A1=A2/M=(X2/M)−(B2+C2)/M・・・(4)
そして、B2≒B1、C2≒C1から、式(4a)となる。
A1≒(X2/M)−(B1+C1)/M・・・(4a)
X2を観測して線幅A1の算出値として使用する場合、式(4a)に示すように、(B1+C1)/Mが誤差となる。
ここで、(B1+C1)は高々数ピクセルであることが多い。そのため、(B1+C1)の値よりも比例定数Mの値の方が大きく、(B1+C1)/M≪B1+C1となる。従って、線幅を算出する際には、X1を計測するよりも、X2を計測して比例定数Mで換算して求めた方が誤差は小さくなり、より正確に元の線幅を算出することができる。
以上、ぼけ具合の特定について説明した。
[2−3.画像処理装置の機能]
次に、図14〜図16を参照しながら、画像処理装置102の機能について、さらに説明する。
なお、図14は、第2実施形態に係る画像処理装置が有する機能の一例を示したブロック図である。図15は、第2実施形態に係る錯乱円特定情報の一例を示した図である。図16は、第2実施形態に係る辞書情報の一例を示した図である。
図14に示すように、画像処理装置102は、画像取得部111、認識対象検出部112、ぼけ指標算出部113、記憶部114、錯乱円特定情報選択部115、錯乱円特定部116、辞書選択部117及び文字認識部118を備える。
画像取得部111は、撮像装置から監視対象として予め設定された範囲に対応する監視範囲画像を取得する。認識対象検出部112は、画像処理技術を用いて画像内から標識を検出し、検出した標識を基準とする領域(以下、標識画像)を切り出す。切り出しには、例えば、特開2008−276291号公報などに記載の技術を適用可能である。ぼけ指標算出部113は、切り出した標識画像からぼけ指標を算出する。例えば、文字部分と背景部分の境界のエッジ幅やエッジ勾配をぼけ指標として使用することができる。
記憶部114は、錯乱円特定情報114aと辞書情報114bとを記憶している。錯乱円特定情報114aは、図11を参照しながら説明した各線幅に応じた錯乱円とぼけ指標との関係(ぼけ具合関数)を示す情報を格納している。当該情報は、関数形式の情報(つまり、関数形と係数との組み合わせ)として格納されていてもよいし、テーブル形式の情報として格納されていてもよい。後者の場合、例えば、図15のような変換テーブルT1−1〜T1−3が用意される。変換テーブルT1−1〜T1−3はそれぞれ、線幅W1a、W2a、W3aにおけるエッジ勾配と錯乱円との大きさとの対応関係を表すテーブル情報である。
また、辞書情報114bは、図16に示すように、文字と辞書画像とを対応付ける情報である。辞書画像は、予め設定された複数のぼけ具合のそれぞれについて用意される。図16の例では、文字「4」に対応する辞書画像として、ぼけ具合Lv1に対応する辞書画像PD1、ぼけ具合Lv2に対応する辞書画像PD2、ぼけ具合Lv3に対応する辞書画像PD3が用意されている。また、ぼけ具合毎に用意された辞書画像の集合を辞書と呼ぶことにする。図16の例において、辞書D1は、文字「4」、「6」、「9」、…に対応する辞書画像PD1の集合である。
再び図14を参照する。
錯乱円特定情報選択部115は、線幅の算出を行い、錯乱円特定情報114aを参照して、線幅とぼけ指標とから錯乱円を特定する際にどの情報(変換テーブル)を利用するかを選択する。
錯乱円特定部116は、錯乱円特定情報選択部115が選択した変換テーブルを利用し、ぼけ指標算出部113で求めたぼけ指標から錯乱円(撮像のぼけ具合)を特定する。例えば、図15において、錯乱円特定情報選択部115が算出した線幅が線幅W3aであり、ぼけ指標算出部113で算出したエッジ勾配が60であった場合、変換テーブルT1−3により、錯乱円の大きさは4だと特定される。
辞書選択部117では、錯乱円特定部116が特定した錯乱円から、文字認識に適した辞書を選択し、選択した辞書を文字認識部118に通知する。例えば、錯乱円が2画素であれば、文字部分と背景部分が2値に分かれている辞書に対して2画素分ぼかした辞書を選択する。
上記の辞書は予めぼかしたものを用意しておいて選択してもよいし、ぼけていない辞書のみを用意しておいて、都度生成してもよい。前者であれば処理時間はかからないが利用するメモリサイズが大きくなる。後者であればぼけていない辞書をメモリに格納しておけばよいため、メモリサイズを小さく抑えることができる一方、辞書を生成する処理を実行する分だけ処理に時間がかかる。なお、ぼかした辞書は、例えば、ぼけていない辞書にガウシアンフィルタをかけることによって生成することができる。
文字認識部118は、辞書選択部117で選択した辞書と、入力画像の文字の類似度を算出し、最も類似度が高い辞書を認識結果として出力する。
(錯乱円特定情報選択部115の動作)
ここで、錯乱円特定情報選択部115の動作について説明する。
図17は、錯乱円特定情報選択部の動作を示すフローチャートである。
〔S1〕錯乱円特定情報選択部115は、認識対象検出部112で検出された標識の位置情報から、標識全体の幅(画素数)を測定する。
〔S2〕錯乱円特定情報選択部115は、標識にかかれている文字の、ぼけていない状態での線幅の算出を行う。例えば、認識対象の標識の様式が、標識の横幅がR2[mm]、文字の線幅R1[mm](R2>R1)と定められていたとし、測定した標識の横幅の画素数がX2[pixel]であったとき、標識にかかれている文字のぼけていない状態での線幅X1[pixel]を、(R1/R2)・X2と算出する。
〔S3〕錯乱円特定情報選択部115は、錯乱円特定情報114aである変換テーブルの選択を行う。記憶部114の錯乱円特定情報114aには予め各線幅に応じた錯乱円とぼけ指標との関係(例えば、図15に示したテーブル情報など)が記録されている。S2の処理で、ぼけていない状態での線幅X1を算出したので、線幅X1に対応した錯乱円とぼけ指標との関係の変換テーブルを利用する。
以上、画像処理装置102の機能について説明した。
[2−4.画像処理装置のハードウェア]
ここで、図18を参照しながら、画像処理装置102の機能を実現することが可能なハードウェアの例について説明する。なお、図18は、第2実施形態に係る画像処理装置の機能を実現することが可能なハードウェアの一例を示した図である。
画像処理装置102が有する機能は、例えば、図18に示す情報処理装置のハードウェア資源を用いて実現することが可能である。つまり、画像処理装置102が有する機能は、コンピュータプログラムを用いて図18に示すハードウェアを制御することにより実現される。なお、実施の態様に応じて、図18に例示したハードウェアの一部要素を省略したり、他の要素を新たに追加したりする変形も許容される。
図18に示すように、このハードウェアは、主に、CPU902と、ROM(Read Only Memory)904と、RAM906と、ホストバス908と、ブリッジ910とを有する。さらに、このハードウェアは、外部バス912と、インターフェース914と、入力部916と、出力部918と、記憶部920と、ドライブ922と、接続ポート924と、通信部926とを有する。
CPU902は、例えば、演算処理装置又は制御装置として機能し、ROM904、RAM906、記憶部920、又はリムーバブル記録媒体928に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。ROM904は、CPU902に読み込まれるプログラムや演算に用いるデータなどを格納する記憶装置の一例である。RAM906には、例えば、CPU902に読み込まれるプログラムや、そのプログラムを実行する際に変化する各種パラメータなどが一時的又は永続的に格納される。
これらの要素は、例えば、高速なデータ伝送が可能なホストバス908を介して相互に接続される。一方、ホストバス908は、例えば、ブリッジ910を介して比較的データ伝送速度が低速な外部バス912に接続される。また、入力部916としては、例えば、マウス、キーボード、タッチパネル、タッチパッド、ボタン、スイッチ、及びレバーなどが用いられる。さらに、入力部916としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラが用いられることもある。
出力部918としては、例えば、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、又はELD(Electro-Luminescence Display)などのディスプレイ装置が用いられる。また、出力部918として、スピーカやヘッドホンなどのオーディオ出力装置、又はプリンタなどが用いられることもある。つまり、出力部918は、情報を視覚的又は聴覚的に出力することが可能な装置である。
記憶部920は、各種のデータを格納するための装置である。記憶部920としては、例えば、HDDなどの磁気記憶デバイスが用いられる。また、記憶部920として、SSD(Solid State Drive)やRAMディスクなどの半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイスなどが用いられてもよい。
ドライブ922は、着脱可能な記録媒体であるリムーバブル記録媒体928に記録された情報を読み出し、又はリムーバブル記録媒体928に情報を書き込む装置である。リムーバブル記録媒体928としては、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどが用いられる。
接続ポート924は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS−232Cポート、又は光オーディオ端子など、外部接続機器930を接続するためのポートである。外部接続機器930としては、例えば、デジタルカメラやプリンタなどが用いられる。
通信部926は、ネットワーク932に接続するための通信デバイスである。通信部926としては、例えば、有線又は無線LAN(Local Area Network)用の通信回路、WUSB(Wireless USB)用の通信回路、光通信用の通信回路やルータ、ADSL(Asymmetric Digital Subscriber Line)用の通信回路やルータ、携帯電話ネットワーク用の通信回路などが用いられる。通信部926に接続されるネットワーク932は、有線又は無線により接続されたネットワークであり、例えば、インターネット、LAN、放送網、衛星通信回線などを含む。
以上のようなハードウェア構成によって、本実施形態の処理機能を実現することができる。また、コンピュータで本実施形態の処理機能を実現する場合、画像処理装置102が有する機能の処理内容を記述したプログラムが提供される。
そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto Optical disk)などがある。なお、プログラムを記録する記録媒体には、一時的な伝搬信号自体は含まれない。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
[2−5.処理の流れ]
ここで、図19を参照しながら、画像処理装置102の動作について、さらに説明する。図19は、第2実施形態に係る画像処理装置の動作を示したフローチャートである。なお、説明の都合上、錯乱円特定情報114aとして、記憶部114に変換テーブルT1−1、T1−2、T1−3(図15を参照)が格納されているとする。
〔S101〕画像取得部111は、撮像装置から監視対象として予め設定された範囲に対応する監視範囲画像を取得する。認識対象検出部112は、画像処理技術を用いて画像内から標識を検出し、検出した標識を基準とする領域(標識画像)を切り出す。
〔S102〕ぼけ指標算出部113は、S101で切り出された標識画像からぼけ指標を算出する。ぼけ指標としては、例えば、文字部分と背景部分の境界のエッジ幅やエッジ勾配を適用することができる。
〔S103〕錯乱円特定情報選択部115は、文字の線幅を計算する。
例えば、標識画像の大きさの測定値をX2[pixel]、文字がぼけない状態で写ったときの線の太さをA1[pixel]、ぼけによる線幅の変化をB1[pixel]、ノイズによる文字幅の観測誤差をC1[pixel]と表記する。また、標識画像から直接観測した線幅の計測値をX1、標識画像の大きさをA2[pixel]、標識画像の大きさの測定誤差をB2[pixel]、標識画像の大きさの測定誤差をC2[pixel]と表記する。この場合、錯乱円特定情報選択部115は、上記の式(4a)により、線幅としてA1を求めることができる。
〔S104〕錯乱円特定情報選択部115は、S103で計算した線幅がW1a、W2a、W3aのどれであるかを判定する。線幅がW1aの場合、処理はS105へと進む。線幅がW2aの場合、処理はS106へと進む。線幅がW3aの場合、処理はS107へと進む。なお、錯乱円特定情報114aとして他の線幅に対応する変換テーブルが用意されている場合には、その変換テーブルに対応する線幅についても同様に判定処理が実行される。
〔S105〕錯乱円特定情報選択部115は、変換テーブルT1−1を選択する。そして、錯乱円特定部116は、錯乱円特定情報選択部115が選択した変換テーブルを利用し、S102で算出されたぼけ指標に対応する錯乱円の大きさを特定する。S105の処理が完了すると、処理はS108へと進む。
〔S106〕錯乱円特定情報選択部115は、変換テーブルT1−2を選択する。そして、錯乱円特定部116は、錯乱円特定情報選択部115が選択した変換テーブルを利用し、S102で算出されたぼけ指標に対応する錯乱円の大きさを特定する。S106の処理が完了すると、処理はS108へと進む。
〔S107〕錯乱円特定情報選択部115は、変換テーブルT1−3を選択する。そして、錯乱円特定部116は、錯乱円特定情報選択部115が選択した変換テーブルを利用し、S102で算出されたぼけ指標に対応する錯乱円の大きさを特定する。S107の処理が完了すると、処理はS108へと進む。
〔S108〕辞書選択部117は、辞書情報114b(図16を参照)を参照し、S105、S106、又はS107で特定された錯乱円の大きさに対応する辞書を選択する。例えば、錯乱円が2画素であれば、辞書選択部117は、文字部分と背景部分とが2値に分かれている辞書に対して2画素分ぼかした辞書を選択する。
〔S109〕文字認識部118は、S108で選択された辞書と、標識画像に含まれる文字の類似度を算出し、最も類似度が高い辞書画像に対応する文字を認識結果として出力する。S109の処理が完了すると、図19に示した一連の処理は終了する。
以上、画像処理装置102の動作に係る処理フローについて説明した。
以上説明したように、本技術によれば、ぼけ具合の特定精度が向上し、その結果、ぼけ具合の特定結果を利用した画像処理方式の精度を向上させることが可能になる。また、ぼけ具合に応じた辞書の選択をした場合、認識精度が向上し、さらに、ぼけ具合が小さくなるようにフォーカスの調整を行った場合、フォーカス調整精度の向上を図ることが可能になる。
以上、実施形態を例示したが、実施形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。
10 情報処理装置
11 記憶部
12 演算部
F1、F2、F3 関数曲線
Wa、Wb、Wc 線幅
y ぼけ指標
x ぼけ具合

Claims (6)

  1. 画像に含まれる文字の線幅に応じた、前記画像のぼけ具合の指標となるぼけ指標と前記ぼけ具合との関係を示す関係情報を記憶する記憶部と、
    撮像画像から前記線幅及び前記ぼけ指標を算出し、前記記憶部により記憶されている前記関係情報を参照して、前記線幅及び前記ぼけ指標に対応する前記ぼけ具合を特定する演算部と、
    を備え、
    前記関係情報は、複数の前記線幅に対応する複数の関数曲線を前記ぼけ指標と前記ぼけ具合との座標上で表現可能な情報であって、前記演算部は、算出した前記線幅に対応する前記関数曲線を、複数の前記関数曲線の中から選択し、選択した前記関数曲線上で前記ぼけ指標に対する前記ぼけ具合を特定する
    報処理装置。
  2. 画像に含まれる文字の線幅に応じた、前記画像のぼけ具合の指標となるぼけ指標と前記ぼけ具合との関係を示す関係情報を記憶する記憶部と、
    撮像画像から前記線幅及び前記ぼけ指標を算出し、前記記憶部により記憶されている前記関係情報を参照して、前記線幅及び前記ぼけ指標に対応する前記ぼけ具合を特定する演算部と、
    を備え、
    前記演算部は、前記線幅とサイズとの比率が決まっている前記画像内の対象物の大きさを測定し、測定した前記比率からぼけていない状態での前記線幅を算出する
    報処理装置。
  3. 画像に含まれる文字の線幅に応じた、前記画像のぼけ具合の指標となるぼけ指標と前記ぼけ具合との関係を示す関係情報を記憶する記憶部と、
    撮像画像から前記線幅及び前記ぼけ指標を算出し、前記記憶部により記憶されている前記関係情報を参照して、前記線幅及び前記ぼけ指標に対応する前記ぼけ具合を特定する演算部と、
    を備え、
    前記演算部は、前記文字のエッジ部分を検出し、前記エッジ部分の勾配又は前記エッジ部分の幅を前記ぼけ指標とする
    報処理装置。
  4. 前記記憶部は、前記文字の認識に用いる画像である辞書画像を複数記憶し、
    前記演算部は、特定した前記ぼけ具合に応じて前記辞書画像を選択し、選択した前記辞書画像を用いて前記文字を認識する
    請求項1に記載の情報処理装置。
  5. コンピュータが、
    画像に含まれる文字の線幅に応じた、前記画像のぼけ具合の指標となるぼけ指標と前記ぼけ具合との関係を示す関係情報を記憶する記憶部から前記関係情報を取得し、
    撮像画像から、前記線幅及び前記ぼけ指標を算出し、前記記憶部により記憶されている前記関係情報を参照して、前記線幅及び前記ぼけ指標に対応する前記ぼけ具合を特定する場合、前記関係情報は、複数の前記線幅に対応する複数の関数曲線を前記ぼけ指標と前記ぼけ具合との座標上で表現可能な情報であって、算出した前記線幅に対応する前記関数曲線を、複数の前記関数曲線の中から選択し、選択した前記関数曲線上で前記ぼけ指標に対する前記ぼけ具合を特定する
    ぼけ具合計算方法。
  6. コンピュータに、
    画像に含まれる文字の線幅に応じた、前記画像のぼけ具合の指標となるぼけ指標と前記ぼけ具合との関係を示す関係情報を記憶する記憶部から前記関係情報を取得し、
    撮像画像から、前記線幅及び前記ぼけ指標を算出し、前記記憶部により記憶されている前記関係情報を参照して、前記線幅及び前記ぼけ指標に対応する前記ぼけ具合を特定する場合、前記関係情報は、複数の前記線幅に対応する複数の関数曲線を前記ぼけ指標と前記ぼけ具合との座標上で表現可能な情報であって、算出した前記線幅に対応する前記関数曲線を、複数の前記関数曲線の中から選択し、選択した前記関数曲線上で前記ぼけ指標に対する前記ぼけ具合を特定する
    処理を実行させる、プログラム。
JP2014158391A 2014-08-04 2014-08-04 情報処理装置、ぼけ具合計算方法、及びプログラム Active JP6390248B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014158391A JP6390248B2 (ja) 2014-08-04 2014-08-04 情報処理装置、ぼけ具合計算方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014158391A JP6390248B2 (ja) 2014-08-04 2014-08-04 情報処理装置、ぼけ具合計算方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016035670A JP2016035670A (ja) 2016-03-17
JP6390248B2 true JP6390248B2 (ja) 2018-09-19

Family

ID=55523488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014158391A Active JP6390248B2 (ja) 2014-08-04 2014-08-04 情報処理装置、ぼけ具合計算方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6390248B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10861148B2 (en) * 2018-04-30 2020-12-08 General Electric Company Systems and methods for improved component inspection
JP2023032857A (ja) * 2021-08-27 2023-03-09 パナソニックIpマネジメント株式会社 画像判定方法、画像判定装置および文字認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466449B2 (ja) * 1997-12-12 2003-11-10 日本電信電話株式会社 パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体
JP2000030052A (ja) * 1998-07-13 2000-01-28 Oki Electric Ind Co Ltd 画像処理装置

Also Published As

Publication number Publication date
JP2016035670A (ja) 2016-03-17

Similar Documents

Publication Publication Date Title
CN110322500B (zh) 即时定位与地图构建的优化方法及装置、介质和电子设备
US9697416B2 (en) Object detection using cascaded convolutional neural networks
US8121400B2 (en) Method of comparing similarity of 3D visual objects
US20200074646A1 (en) Method for obtaining image tracking points and device and storage medium thereof
CN110793544B (zh) 路侧感知传感器参数标定方法、装置、设备及存储介质
KR101417696B1 (ko) 패턴 측정 방법, 패턴 측정 장치 및 기록 매체
WO2020063124A1 (en) Method and apparatus for acquiring depth image, and electronic device
KR20150043145A (ko) 피사체 추적 기법을 이용한 카메라와 피사체 사이의 거리 변화 측정방법 상기 방법을 기록한 컴퓨터 판독 가능 저장매체 및 거리 변화 측정 장치.
JP6311354B2 (ja) 情報処理装置、二値化用閾値の決定方法、及びプログラム
JP6390248B2 (ja) 情報処理装置、ぼけ具合計算方法、及びプログラム
CN115937324B (zh) 一种装配质量评价方法、装置、设备及存储介质
US20180313650A1 (en) Fixing magnetometer based azimuth according to sun positioning
JP6354186B2 (ja) 情報処理装置、ぼけ具合計算方法、及びプログラム
WO2020095549A1 (ja) 撮像装置
JP5983033B2 (ja) 位置関係判定プログラム、位置関係判定方法および位置関係判定装置
JP2019153235A (ja) 物体領域識別装置、物体領域識別方法およびプログラム
US20150098644A1 (en) Methods and apparatus for determining field of view dependent depth map correction values
CN113470103A (zh) 车路协同中相机作用距离确定方法、装置和路侧设备
KR101981773B1 (ko) 그래디언트의 적응적 가중에 기반한 에지 위치 결정 장치 및 방법
US20180350089A1 (en) Site measuring device and ascertaining a geometric measurement value
WO2018061430A1 (ja) 計測装置、計測方法、計測プログラム、及び記録媒体
US20240029288A1 (en) Image processing apparatus, image processing method, and storage medium
CN117115488B (zh) 一种基于图像处理的水表检测方法
US20230394620A1 (en) Method for generating distorted images, and electronic device
JP5760827B2 (ja) 物体認識装置、物体認識方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R150 Certificate of patent or registration of utility model

Ref document number: 6390248

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150