JP6600090B2 - 画像処理装置、画像処理方法、および、プログラム - Google Patents

画像処理装置、画像処理方法、および、プログラム Download PDF

Info

Publication number
JP6600090B2
JP6600090B2 JP2018520260A JP2018520260A JP6600090B2 JP 6600090 B2 JP6600090 B2 JP 6600090B2 JP 2018520260 A JP2018520260 A JP 2018520260A JP 2018520260 A JP2018520260 A JP 2018520260A JP 6600090 B2 JP6600090 B2 JP 6600090B2
Authority
JP
Japan
Prior art keywords
background
edge
captured image
document
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018520260A
Other languages
English (en)
Other versions
JPWO2017208368A1 (ja
Inventor
正義 林
清人 小坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of JPWO2017208368A1 publication Critical patent/JPWO2017208368A1/ja
Application granted granted Critical
Publication of JP6600090B2 publication Critical patent/JP6600090B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置、画像処理方法、および、プログラムに関する。
従来から、撮影画像中の背景を識別する技術が開示されている。
ここで、二つの領域の色を確認することで、指定範囲内に撮影対象物が収まっているかを判定する技術が開示されている(特許文献1を参照)。
また、背景の色と原稿の色との類似度を確認し、その結果に応じた抽出パラメータを用いることで原稿を精度良く検出する技術が開示されている(特許文献2を参照)。
また、デジタル画像の背景の輝度値、色チャネル値、コントラスト値、テクスチャ値、色合い値、鮮明度値等の背景統計を計算する技術が開示されている(特許文献3を参照)。
特開2012−205089号公報 特開2014−17673号公報 特表2015−503813号公報
しかしながら、従来の情報処理装置(特許文献1等)においては、背景領域の色またはノイズ量によっては、効率的な背景識別ができないという問題点を有していた。
本発明は、上記問題点に鑑みてなされたもので、原稿領域を含む撮影画像の背景領域において検出される色成分から背景色を識別し、背景領域において検出されるエッジの成分から背景模様の複雑さを識別することで、原稿領域の輪郭を的確に検出可能な背景領域かどうかを識別できる画像処理装置、画像処理方法、および、プログラムを提供することを目的とする。
このような目的を達成するため、本発明に係る画像処理装置は、原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得手段と、前記撮影画像の所定領域における色成分値を検出する色成分検出手段と、前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出手段と、前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別手段と、を備えたことを特徴とする。
また、本発明に係る画像処理方法は、原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得ステップと、前記撮影画像の所定領域における色成分値を検出する色成分検出ステップと、前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出ステップと、前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別ステップと、を含むことを特徴とする。
また、本発明に係るプログラムは、原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得ステップと、前記撮影画像の所定領域における色成分値を検出する色成分検出ステップと、前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出ステップと、前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別ステップと、をコンピュータに実行させることを特徴とする。
この発明によれば、原稿領域検出処理の前提となる背景識別を効率よく行うことができる。
図1は、本実施形態に係る画像処理装置の構成の一例を示すブロック図である。 図2は、本実施形態の画像処理装置における処理の一例を示すフローチャートである。 図3は、本実施形態における外縁領域の一例を示す図である。 図4は、本実施形態におけるエッジ画像の一例を示す図である。 図5は、本実施形態におけるエッジ画像の一例を示す図である。 図6は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。 図7は、本実施形態における撮影画像の一例を示す図である。 図8は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。 図9は、本実施形態における撮影画像の一例を示す図である。 図10は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。 図11は、本実施形態における撮影画像の一例を示す図である。 図12は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。 図13は、本実施形態における模式的な撮影画像の一例を示す図である。 図14は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。 図15は、本実施形態における模式的な撮影画像の一例を示す図である。 図16は、本実施形態の画像処理装置における処理の一例を示すフローチャートである。 図17は、本実施形態における選定候補直線の一例を示す図である。
以下に、本発明に係る画像処理装置、画像処理方法、および、プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本発明が限定されるものではない。
[本実施形態の構成]
以下、本発明の実施形態に係る画像処理装置100の構成の一例について図1を参照して説明し、その後、本実施形態の処理等について詳細に説明する。図1は、本実施形態に係る画像処理装置100の構成の一例を示すブロック図である。
但し、以下に示す実施形態は、本発明の技術思想を具体化するための画像処理装置100を例示するものであって、本発明をこの画像処理装置100に特定することを意図するものではなく、請求の範囲に含まれるその他の実施形態の画像処理装置100にも等しく適用し得るものである。
また、本実施形態で例示する画像処理装置100における機能分散の形態は以下に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。
ここで、画像処理装置100は、例えば、タブレット端末、携帯電話、スマートフォン、PHS、PDA、ノート型のパーソナルコンピュータ、または、メガネ型もしくは時計型などのウェアラブルコンピュータ等の可搬性を有する携帯型の情報処理装置(モバイル端末)であってもよい。
まず、図1に示すように、画像処理装置100は、概略的に、制御部102と記憶部106と撮影部110と入出力部112とセンサ部114と通信部116とを備えて構成される。
なお、図1において、画像処理装置100は、筐体内に撮影部110を備えたモバイル端末として示しているが、筐体内に撮影部110を備えておらず、外部の撮影装置から撮影画像データを受信する構成(例えば、デスクトップ型のパーソナルコンピュータ等)であってもよい。
ここで、図1では省略しているが、本実施形態において、更に、入出力部112と制御部102とを接続する入出力インターフェース部(図示せず)を備えていてもよい。これら画像処理装置100の各部は任意の通信路を介して通信可能に接続されている。
ここで、通信部116は、有線通信および/または無線通信(WiFi等)によりIPデータを送受信するためのネットワークインターフェース(NIC(Network Interface Controller)等)、Bluetooth(登録商標)、または、赤外線通信等によって無線通信を行うインターフェースであってもよい。
ここで、画像処理装置100は、通信部116を用いて、ネットワークを介して外部装置と通信可能に接続されていてもよい。
また、センサ部114は、物理量を検出して別媒体の信号(デジタル信号)に変換する。ここで、センサ部114は、近接センサ、方角センサ、磁場センサ、直線加速センサ、輝度センサ、ジャイロセンサ、圧力センサ、重力センサ、加速度センサ、気圧センサ、および/または、温度センサ等を含んでいてもよい。
また、入出力部112は、データの入出力(I/O)を行う。ここで、入出力部112は、例えば、キー入力部、タッチパネル、コントロールパッド(例えば、タッチパッド、および、ゲームパッド等)、マウス、キーボード、および/または、マイク等であってもよい。
また、入出力部112は、アプリケーション等の表示画面を表示する表示部(例えば、液晶または有機EL等から構成されるディスプレイ、モニタ、または、タッチパネル等)であってもよい。
また、入出力部112は、音声情報を音声として出力する音声出力部(例えば、スピーカ等)であってもよい。また、入出力部(タッチパネル)112は、物理的接触を検出し、信号(デジタル信号)に変換するセンサ部114を含んでいてもよい。
また、撮影部110は、被写体(例えば、帳票等)を静止画撮影することで、静止画の画像データを取得する。例えば、撮影部110は、撮影画像データを取得してもよい。
また、撮影部110は、被写体を連続画像撮影(動画撮影)することで、連続(動画)の画像データ(フレーム)を取得してもよい。例えば、撮影部110は、映像データを取得してもよい。また、撮影部110は、アンシラリデータを取得してもよい。
ここで、フレームは、非圧縮の画像データであってもよい。また、フレームは、高解像度の画像データであってもよい。ここで、高解像度とは、フルハイビジョン、4K解像度、または、スーパーハイビジョン(8K解像度)等であってもよい。
また、撮影部110は、24fpsまたは30fps等で動画撮影してもよい。ここで、撮影部110は、CCD(Charge Coupled Device)、および/または、CMOS(Complementary Metal Oxide Semiconductor)等の撮像素子を備えたカメラ等であってもよい。
記憶部106は、ストレージ手段であり、例えばRAM・ROM等のメモリ、ハードディスクのような固定ディスク装置、SSD(Solid State Drive)、および/または、光ディスク等を用いることができる。
また、記憶部106は、各種のデータベース、テーブル、バッファ、および/または、ファイル(レイアウトデータファイル106a、および、画像データファイル106b等)を格納する。ここで、記憶部106には、CPU(Central Processing Unit)に命令を与え各種処理を行うためのコンピュータプログラム等が記録されていてもよい。
これら記憶部106の各構成要素のうち、レイアウトデータファイル106aは、原稿(帳票)のレイアウトのレイアウトデータを記憶する。ここで、レイアウトデータは、原稿(帳票)中の罫線、文字、写真および/または図形等の配置に関する位置データ等であってもよい。
ここで、帳票は、運転免許証を含む各種免許証、各種身分証明書、または、健康保険証等の規定帳票であってもよい。また、レイアウトデータは、原稿の色成分値およびエッジ量を含んでいてもよい。
また、画像データファイル106bは、画像データ(フレーム等)を記憶する。ここで、画像データファイル106bは、撮影画像データ、および/または、原稿画像データを記憶していてもよい。
また、制御部102は、画像処理装置100を統括的に制御するCPU、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、および/または、FPGA(Field−Programming Gate Array)等を含む有形のコントローラ、または、制御回路から構成されてもよい。
また、制御部102は、制御プログラムと各種の処理手順等を規定したプログラムと所要データとを格納するための内部メモリを有し、これらプログラムに基づいて種々の処理を実行するための情報処理を行う。
ここで、制御部102は、機能概念的に、撮影画像取得部102a、色成分検出部102b、エッジ検出部102c、背景識別部102d、原稿領域検出制御部102e、直線取得部102f、矩形検出部102g、補正量算出部102h、基準直線取得部102i、原稿特定部102j、および、原稿画像取得部102kを備える。
撮影画像取得部102aは、撮影画像の撮影画像データを取得する。ここで、撮影画像取得部102aは、原稿領域を含む撮影画像の撮影画像データを取得してもよい。ここで、原稿領域は、射影変換前の領域であってもよい。
また、撮影画像取得部102aは、撮影部110または外部の撮影装置の撮影による撮影画像データを取得してもよい。また、撮影画像取得部102aは、撮影部110による静止画撮影を制御して、撮影画像データを取得してもよい。
また、撮影画像取得部102aは、撮影部110による連続画像撮影または動画撮影を制御して、1コマに相当する撮影画像データ(フレーム)を取得してもよい。
色成分検出部102bは、撮影画像の色成分値を検出する。ここで、色成分検出部102bは、撮影画像の所定領域における色成分値を検出する。ここで、所定領域は、撮影画像の外縁領域であってもよい。
ここで、外縁領域は、撮影画像の外縁から所定の幅をなす帯状の領域であってもよい。また、所定領域は、撮影画像の中心領域であってもよい。
エッジ検出部102cは、撮影画像に含まれるエッジを検出する。ここで、エッジ検出部102cは、撮影画像の所定領域におけるエッジを検出し、エッジの密度、および/または、エッジ強度を示すエッジ量を取得してもよい。
また、エッジ検出部102cは、キャニー法を用いて撮影画像に含まれるエッジを検出してもよい。
例えば、エッジ検出部102cは、撮影画像をガウシアンフィルタで平滑化し、エッジ強度と勾配方向(4方向に量子化)とを計算し、細線化処理を行い、ヒステリシス閾処理によるエッジ抽出を行うことで、エッジを検出してもよい。
また、エッジ検出部102cは、撮影画像のピラミッド構造化を行い、隣接階調差によるエッジ抽出を行い、ノイズ除去(ラベリングおよび/または背景除去等)を行い、エッジ補正(欠けの結合等)を行うことで、エッジを検出してもよい。
背景識別部102dは、撮影画像の原稿領域と、撮影画像から原稿領域を除く背景領域と、の背景の差異を識別する。ここで、背景識別部102dは、色成分値、および、エッジ量に基づいて、原稿領域と背景領域との背景の差異を識別してもよい。
また、背景識別部102dは、所定領域における色成分値が指定範囲内であり、且つ、所定領域におけるエッジ量が閾値を満たす場合、原稿領域と背景領域とが同一背景であると識別してもよい。
ここで、指定範囲は、レイアウトデータファイル106aに記憶されたレイアウトデータおよび/または所定領域(原稿領域)の色成分値に基づく範囲であってもよい。ここで、所定領域は、撮影画像の中心領域であってもよい。
また、閾値は、レイアウトデータファイル106aに記憶されたレイアウトデータおよび/または所定領域(原稿領域)のエッジ量に基づく値であってもよい。
原稿領域検出制御部102eは、背景識別部102dによる識別結果に基づいて、撮影画像における原稿領域検出処理を切替制御する。
ここで、原稿領域検出制御部102eは、背景識別部102dにより原稿領域と背景領域とが同一背景であると識別された場合、同一背景における原稿領域検出処理に移行させてもよい。
直線取得部102fは、エッジに基づくエッジ直線を取得する。ここで、直線取得部102fは、エッジ直線により構成される矩形である読取矩形の辺と平行な、エッジ直線を平行直線として取得してもよい。
また、直線取得部102fは、背景識別部102dにより原稿領域と背景領域とが同一背景であると識別された場合、エッジに基づくエッジ直線を取得してもよい。
また、直線取得部102fは、エッジに対するハフ変換により直線候補を算出し、最小二乗法による直線候補の補正によりエッジ直線を取得してもよい。
例えば、直線取得部102fは、エッジに対するハフ変換による直線候補を算出し、最小二乗法による直線候補の補正を行い、エッジ直線の情報(例えば、始点、終点、および、ハフ変換における投票数)を取得してもよい。
矩形検出部102gは、エッジ直線により構成される矩形である読取矩形を検出する。
例えば、矩形検出部102gは、取得されたエッジ直線群(水平方向、および、垂直方向)が構成する矩形候補を算出し、矩形候補を大きさでソートして、読取矩形を検出してもよい。
補正量算出部102hは、エッジに基づいて、原稿(帳票)のレイアウトを基準とした原稿領域の補正量を算出する。ここで、補正量算出部102hは、エッジの長さの比率に基づいて、原稿(帳票)のレイアウトを基準とした原稿領域の補正量を算出してもよい。
基準直線取得部102iは、原稿領域において最も外側にあるエッジ直線を選定直線として選定し、補正量および選定直線に基づいて、原稿領域の輪郭を構成する基準直線を取得する。
ここで、基準直線取得部102iは、レイアウトデータファイル106aに記憶されたレイアウトデータおよび読取矩形に基づく閾値を満たす、最も外側にある平行直線を選定直線として選定し、撮影画像において選定直線の内側に他のエッジ直線である内側直線があり、且つ、選定直線と内側直線との間が補正量に基づく距離となる場合、補正量に従って選定直線の外側にある基準直線を取得してもよい。
また、基準直線取得部102iは、レイアウトデータファイル106aに記憶されたレイアウトデータおよび読取矩形に基づく閾値を満たす、最も外側にある平行直線を選定直線として選定し、撮影画像において選定直線の内側に他のエッジ直線である内側直線が無い場合、または、内側直線があるが、選定直線と内側直線との間が補正量に基づく距離とならない場合、撮影画像において当該選定直線の対辺をなす選定直線の内側に他のエッジ直線である対辺内側直線があり、且つ、対辺をなす選定直線と対辺内側直線との間が補正量に基づく距離となる場合、補正量に従って選定直線の外側にある基準直線を取得してもよい。
原稿特定部102jは、原稿領域の原稿座標を特定する。ここで、原稿特定部102jは、基準直線に基づいて、原稿領域の原稿座標を特定する。また、原稿特定部102jは、基準直線の交点座標を算出することにより、原稿領域の原稿座標を特定してもよい。
また、原稿特定部102jは、背景識別部102dにより原稿領域と背景領域とが同一背景であると識別された場合、エッジ検出法、および/または、特徴点マッチング法を用いて、原稿領域の原稿座標を特定してもよい。
原稿画像取得部102kは、原稿座標に基づいて、撮影画像から原稿領域をクロップ処理することで、原稿画像データを取得する。ここで、原稿画像取得部102kは、更に、取得した原稿画像データを画像データファイル106bに格納してもよい。
[本実施形態の処理]
上述した構成の画像処理装置100(モバイル端末)で実行される処理の一例について、図2から図17を参照して、本実施形態におけるクロップ処理の一例について説明する。図2は、本実施形態の画像処理装置100における処理の一例を示すフローチャートである。
図2に示すように、まず、撮影画像取得部102aは、撮影部110により撮影された原稿領域を含む、一律の余白を持つ撮影画像の撮影画像データを取得する(ステップSA−1)。
そして、色成分検出部102bは、撮影画像の外縁から所定の幅をなす帯状の領域における色成分値を検出する(ステップSA−2)。ここで、色成分値は、色相、明度、彩度、および/または、輝度の値であってもよい。
ここで、図3を参照して、本実施形態における外縁領域の一例について説明する。図3は、本実施形態における外縁領域の一例を示す図である。
図3に示すように、本実施形態においては、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域であってもよい。
図2に戻り、エッジ検出部102cは、撮影画像の外縁から所定の幅をなす帯状の領域におけるエッジを検出し、エッジの密度、および/または、エッジ強度を示すエッジ量を取得する(ステップSA−3)。
ここで、図4および図5を参照して、本実施形態におけるエッジ画像の一例について説明する。図4および図5は、本実施形態におけるエッジ画像の一例を示す図である。
図4は、原稿領域が白無地であり、背景領域が木目であるため、原稿領域と背景領域とのエッジ量が異なるエッジ画像となる。
一方、図5は、原稿領域が白無地であり、背景領域が白無地であるため、原稿領域と背景領域とが同一背景のエッジ量に差異が無いエッジ画像となる。
図2に戻り、背景識別部102dは、撮影画像の外縁から所定の幅をなす帯状の領域における色成分値が指定範囲内であり、且つ、当該帯状の領域におけるエッジ量が閾値を満たすか否かを判定することで(ステップSA−4)、原稿領域と背景領域とが同一背景であるか否かを識別する(ステップSA−5)。
ここで、背景識別部102dは、色成分値を判定することで、同一色の背景か否かを判別している。また、背景識別部102dは、エッジ量を判定することで、複雑な背景か否かを判別している。
例えば、背景識別部102dは、原稿が白無地の運転免許証の場合、輝度(0−255の範囲の場合)が128以上であり、且つ、エッジの密度が5%以下であれば同一背景と判断してもよい。
また、背景識別部102dは、原稿が白無地の運転免許証の場合、色成分値について、明度(0−1の範囲の場合)が0.7以上、および/または、彩度(0−1の範囲の場合)が0.1以下であれば同一背景と判断してもよい。
また、背景識別部102dは、原稿が白無地の運転免許証の場合、エッジ量について、エッジ強度(0−255の範囲の場合)が10以下であれば同一背景と判断してもよい。
ここで、図6から図15を参照して、本実施形態における様々な背景における色成分値およびエッジ量の一例を説明する。
図6、図8、図10、図12および図14は、本実施形態における色成分値およびエッジ量の一例を示す模式図である。図7、図9および図11は、本実施形態における撮影画像の一例を示す図である。図13および図15は、本実施形態における模式的な撮影画像の一例を示す図である。
図7に示すように、原稿が上質紙であり背景が花崗岩の撮影画像の場合、図6に示すように、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域において、色成分値である平均輝度は、102となり、エッジの密度は、92.8%となる。
また、図9に示すように、原稿が上質紙であり背景が大理石の撮影画像の場合、図8に示すように、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域において、色成分値である平均輝度は、226となり、エッジの密度は、56.7%となる。
また、図11に示すように、原稿が上質紙であり背景が大理石の撮影画像の場合、図10に示すように、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域において、色成分値である平均輝度は、205となり、エッジの密度は、30.3%となる。
また、図13に示すように、原稿が運転免許証であり背景が木目の撮影画像の場合、図12に示すように、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域において、色成分値である平均輝度は、167となり、エッジの密度は、0.9%となる。
また、図15に示すように、原稿が名刺であり背景が木目の撮影画像の場合、図14に示すように、撮影画像の外縁から、撮影画像の幅の5%となる帯状の領域において、色成分値である平均輝度は、99となり、エッジの密度は、50.9%となる。
図2に戻り、原稿領域検出制御部102eは、背景識別部102dにより原稿領域と背景領域とが同一背景ではないと識別された場合(ステップSA−5:No)、処理をステップSA−6に移行させる。
そして、原稿特定部102jは、エッジ検出部102cにより検出されたエッジ、および/または、レイアウトデータファイル106aに記憶された原稿(帳票)のレイアウトデータを用いた特徴点マッチング法を用いて、原稿領域の原稿座標を特定し(ステップSA−6)、処理をステップSA−10に移行させる。
一方、原稿領域検出制御部102eは、背景識別部102dにより原稿領域と背景領域とが同一背景であると識別された場合(ステップSA−5:Yes)、処理をステップSA−7に移行させる。
そして、直線取得部102fは、エッジ検出部102cにより検出されたエッジに対するハフ変換により直線候補を算出し、最小二乗法による直線候補の補正によりエッジ直線を取得する(ステップSA−7)。
そして、矩形検出部102gは、直線取得部102fにより取得されたエッジ直線により構成される矩形である読取矩形を検出する(ステップSA−8)。
そして、制御部102は、矩形補正処理を行う(ステップSA−9)。
[矩形補正処理]
ここで、図16および図17を参照して、本実施形態における矩形補正処理の一例について説明する。図16は、本実施形態の画像処理装置100における処理の一例を示すフローチャートである。
図16に示すように、まず、補正量算出部102hは、エッジ検出部102cにより検出されたエッジの長さの比率、および、レイアウトデータファイル106aに記憶されたレイアウトデータに基づいて、原稿(帳票)のレイアウトを基準とした原稿領域の補正量を算出する(ステップSB−1)。
そして、直線取得部102fは、矩形検出部102gにより検出された読取矩形の辺と平行な、エッジ直線を平行直線として取得(選定)する(ステップSB−2)。ここで、平行直線は、読取矩形の辺との角度が±1度以内の角度となるエッジ直線を含んでいてもよい。
そして、基準直線取得部102iは、レイアウトデータファイル106aに記憶されたレイアウトデータおよび読取矩形に基づく閾値を満たす、最も外側にある平行直線を選定直線として選定し、補正量に従って選定直線の外側にある、原稿領域の輪郭を構成する基準直線を取得する(ステップSB−3)。
ここで、図17を参照して、本実施形態におけるレイアウト判定処理の一例について説明する。図17は、本実施形態における選定候補直線の一例を示す図である。
図17に示すように、本実施形態においては、まず、読取矩形を構成する四つの平行直線を選定直線の初期値(長辺を構成する選定候補直線L’(L’1およびL’2)、ならびに、短辺を構成する選定候補直線S’(S’1およびS’2))として取得する。
そして、本実施形態においては、選定候補直線L’1および選定候補直線L’2に対して、閾値(例えば、レイアウトデータに基づく帳票の短辺の1/4の長さ等)以内の外側に平行直線があれば、値を更新(選定候補直線L’とする平行直線を変更)することで、選定直線L1および選定直線L2を選定する。
そして、本実施形態においては、選定直線L1に対し、内側に他のエッジ直線である内側直線があり、且つ、選定直線L1と内側直線との間が補正量に基づく距離(例えば、実距離の1/2以上3/2以下の長さ等)となるか否かを判定することで、選定直線の関係性からレイアウトを判定する。
そして、本実施形態においては、選定直線L1が判定を満たす場合に、後段処理に移行させる。
一方で、本実施形態においては、選定直線L1が判定を満たさない場合、対辺である選定直線L2に対し、内側に他のエッジ直線である対辺内側直線があり、且つ、選定直線L2と対辺内側直線との間が補正量に基づく距離となるか否かを判定する。
そして、本実施形態においては、選定直線L2が判定を満たす場合、選定直線L1について判定を満たすものとして、後段処理に移行させてもよい。
そして、本実施形態においては、選定直線S(S1およびS2)に対し、内側に他のエッジ直線である内側直線があり、且つ、選定直線Sと内側直線との間が補正量に基づく距離となるか否かを判定する。
そして、本実施形態においては、選定直線Sが判定を満たす場合、補正量に従って選定直線Lおよび選定直線Sの外側にある基準直線を取得する。このように、本実施形態においては、補正量を基にレイアウトを判定してもよい。
図16に戻り、原稿特定部102jは、基準直線取得部102iにより取得された基準直線の交点座標を算出することにより、原稿領域の原稿座標を特定し(ステップSB−4)、処理を終了する。
図2に戻り、原稿画像取得部102kは、原稿特定部102jにより特定された原稿座標に基づいて、撮影画像から原稿領域をクロップ処理することで、原稿画像データを取得し、原稿画像データを画像データファイル106bに格納し(ステップSA−10)、処理を終了する。
このように、本実施形態においては、背景領域の特徴を色成分値とエッジ量で捉えることで背景の状態を検出し、色成分値およびエッジ量の背景情報から後段の処理を切り替える制御をすることで、従来検出することができなかった同一色の背景下においても対象物を精度良く切り出すことが可能となる。
例えば、本実施形態においては、窓口業務において、顧客から借用する白無地背景の身分証明証に対して、モバイル端末でその場で撮影することで、顧客へ安心感を与えることができる。その際、身分証明証が置かれるテーブルは多様であり、身分証明証と同一色である場合もある。
そこで、本実施形態においては、色成分値の範囲を輝度128以上、エッジ量をエッジ密度5%以下とすることで、同一背景(白背景)か否か、複雑な背景か否かを判別し、その結果から後段の処理を切り替えてもよい。
すなわち、本実施形態においては、後段の処理の切り替えとして、エッジのノイズ取りレベルの変更、および、レイアウトによる切り出しへの変更等をすることで、対象物を精度良く切り出すことができる。
また、本実施形態においては、白無地背景のドキュメントに印刷された内容をモバイル端末でその場で撮影することで、リマインダとして利用することができる。その際、ドキュメントが置かれるテーブルは多様であり、ドキュメントと同一色である場合もある。
そこで、本実施形態においては、色成分値の範囲を輝度128以上、エッジ量をエッジ密度5%以下とすることで、同一背景(白背景)か否か、複雑な背景か否かを判別し、その結果から後段の処理を切り替えてもよい。
すなわち、本実施形態においては、後段の処理の切り替えとして、エッジのノイズ取りレベルの変更、および、コンテンツによる切り出しへの変更等をすることで、対象物を精度良く切り出すことができる。
このように、本実施形態においては、レイアウトを用いた切り出し、または、コンテンツを用いた切り出しに繋げることで、多様な条件においても対象物(原稿)を精度良く切り出すことができる。
従来から、背景のエッジ強度を見ることで複雑な背景のノイズを除去し、木目や大理石といった複雑な背景下でも精度良く対象物を切り出す手法はあった。
しかしながら、従来手法では、同一色背景においては対象物と背景との間に階調差が少ないため、対象物を切り出すことができなかった。
また、従来手法としては、レイアウトを用いた切り出し手法とコンテンツを用いた切り出し手法とがあるが、前者は特定の帳票しか切り出すことができず、後者は複雑な背景では切り出すことができなかった為、処理を切り替える必要があった。
そこで、本実施形態においては、画像の指定領域(例えば、周辺領域等)から、指定の色成分値とエッジ量とを算出し、この色成分値からは同一色か否かを判別し、エッジ量からは複雑な背景か否かを判別してもよい。
そして、本実施形態においては、この判別結果から、後段の原稿切出処理を切り替えることで、同一色背景においても精度良く原稿を切り出すことができる。
[他の実施形態]
さて、これまで本発明の実施形態について説明したが、本発明は、上述した実施形態以外にも、請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
例えば、画像処理装置100は、スタンドアローンの形態で処理を行ってもよく、クライアント端末(画像処理装置100とは別筐体である)からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するようにしてもよい。
また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
このほか、明細書中および図面中で示した処理手順、制御手順、具体的名称、各処理の登録データもしくは検索条件等のパラメータを含む情報、画面例、または、データベース構成については、特記する場合を除いて任意に変更することができる。
また、画像処理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、画像処理装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPUおよび当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。
なお、プログラムは、後述する、コンピュータに本発明に係る方法を実行させるためのプログラム化された命令を含む、一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて画像処理装置100に機械的に読み取られる。すなわち、ROMまたはHDDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
また、このコンピュータプログラムは、画像処理装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明に係るプログラムを、コンピュータに読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD、および、Blu−ray(登録商標)Disc等の任意の「可搬用の物理媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OSに代表される別個のプログラムと協働してその機能を達成するものも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶部106に格納される各種のデータベース等は、RAMもしくはROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および/または、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および/または、ウェブページ用ファイル等を格納してもよい。
また、画像処理装置100は、既知のパーソナルコンピュータ等の情報処理装置として構成してもよく、また、該情報処理装置に任意の周辺装置を接続して構成してもよい。また、画像処理装置100は、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
以上のように、画像処理装置、画像処理方法、および、プログラムは、産業上の多くの分野、特にカメラで読み込んだ画像を扱う画像処理分野で実施することができ、極めて有用である。
100 画像処理装置
102 制御部
102a 撮影画像取得部
102b 色成分検出部
102c エッジ検出部
102d 背景識別部
102e 原稿領域検出制御部
102f 直線取得部
102g 矩形検出部
102h 補正量算出部
102i 基準直線取得部
102j 原稿特定部
102k 原稿画像取得部
106 記憶部
106a レイアウトデータファイル
106b 画像データファイル
110 撮影部
112 入出力部
114 センサ部
116 通信部

Claims (15)

  1. 原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得手段と、
    前記撮影画像の所定領域における色成分値を検出する色成分検出手段と、
    前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出手段と、
    前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別手段と、
    を備えたことを特徴とする、画像処理装置。
  2. 前記背景識別手段は、
    前記色成分値が指定範囲内であり、且つ、前記エッジ量が閾値を満たす場合、前記原稿領域と前記背景領域とが同一背景であると識別する、請求項1に記載の画像処理装置。
  3. 前記所定領域は、
    前記撮影画像の外縁領域である、請求項1または2に記載の画像処理装置。
  4. 前記外縁領域は、
    前記撮影画像の外縁から所定の幅をなす帯状の領域である、請求項3に記載の画像処理装置。
  5. 前記背景識別手段による識別結果に基づいて、前記撮影画像における原稿領域検出処理を切替制御する原稿領域検出制御手段、
    を更に備えた、請求項1から4のいずれか一つに記載の画像処理装置。
  6. 原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得ステップと、
    前記撮影画像の所定領域における色成分値を検出する色成分検出ステップと、
    前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出ステップと、
    前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別ステップと、
    を含むことを特徴とする、画像処理方法。
  7. 前記背景識別ステップにて、
    前記色成分値が指定範囲内であり、且つ、前記エッジ量が閾値を満たす場合、前記原稿領域と前記背景領域とが同一背景であると識別する、請求項6に記載の画像処理方法。
  8. 前記所定領域は、
    前記撮影画像の外縁領域である、請求項6または7に記載の画像処理方法。
  9. 前記外縁領域は、
    前記撮影画像の外縁から所定の幅をなす帯状の領域である、請求項8に記載の画像処理方法。
  10. 前記背景識別ステップにおける識別結果に基づいて、前記撮影画像における原稿領域検出処理を切替制御する原稿領域検出制御ステップ、
    を更に含む、請求項6から9のいずれか一つに記載の画像処理方法。
  11. 原稿領域を含む撮影画像の撮影画像データを取得する撮影画像取得ステップと、
    前記撮影画像の所定領域における色成分値を検出する色成分検出ステップと、
    前記所定領域におけるエッジを検出し、前記エッジの密度、および/または、エッジ強度を示すエッジ量を取得するエッジ検出ステップと、
    前記色成分値、および、前記エッジ量に基づいて、前記原稿領域と、前記撮影画像から前記原稿領域を除く背景領域と、の背景の差異を識別する背景識別ステップと、
    をコンピュータに実行させるためのプログラム。
  12. 前記背景識別ステップにて、
    前記色成分値が指定範囲内であり、且つ、前記エッジ量が閾値を満たす場合、前記原稿領域と前記背景領域とが同一背景であると識別する、請求項11に記載のプログラム。
  13. 前記所定領域は、
    前記撮影画像の外縁領域である、請求項11または12に記載のプログラム。
  14. 前記外縁領域は、
    前記撮影画像の外縁から所定の幅をなす帯状の領域である、請求項13に記載のプログラム。
  15. 前記背景識別ステップにおける識別結果に基づいて、前記撮影画像における原稿領域検出処理を切替制御する原稿領域検出制御ステップ、
    を更にコンピュータに実行させるための、請求項11から14のいずれか一つに記載のプログラム。
JP2018520260A 2016-05-31 2016-05-31 画像処理装置、画像処理方法、および、プログラム Active JP6600090B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/066069 WO2017208368A1 (ja) 2016-05-31 2016-05-31 画像処理装置、画像処理方法、および、プログラム

Publications (2)

Publication Number Publication Date
JPWO2017208368A1 JPWO2017208368A1 (ja) 2018-08-30
JP6600090B2 true JP6600090B2 (ja) 2019-10-30

Family

ID=60479405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018520260A Active JP6600090B2 (ja) 2016-05-31 2016-05-31 画像処理装置、画像処理方法、および、プログラム

Country Status (3)

Country Link
US (1) US10706315B2 (ja)
JP (1) JP6600090B2 (ja)
WO (1) WO2017208368A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020646B (zh) * 2019-04-16 2021-07-27 恒生电子股份有限公司 文件归档方法、装置、电子设备、及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839466B2 (en) * 1999-10-04 2005-01-04 Xerox Corporation Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
JP4067957B2 (ja) * 2002-12-20 2008-03-26 富士通株式会社 境界検出方法、プログラム、及び画像処理装置
JP4598426B2 (ja) * 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
US20060274376A1 (en) * 2005-06-06 2006-12-07 Lexmark International, Inc. Method for image background detection and removal
JP2012205089A (ja) 2011-03-25 2012-10-22 Toshiba Corp 情報処理装置、情報処理方法、及び情報処理プログラム
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
JP6122260B2 (ja) 2012-07-09 2017-04-26 キヤノン株式会社 画像処理装置及びその方法とプログラム
US9355312B2 (en) * 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
JP5981876B2 (ja) * 2013-04-24 2016-08-31 株式会社Pfu 情報処理装置、方法およびプログラム
US9122921B2 (en) * 2013-06-12 2015-09-01 Kodak Alaris Inc. Method for detecting a document boundary
RU2595557C2 (ru) * 2014-09-17 2016-08-27 Общество с ограниченной ответственностью "Аби Девелопмент" Выявление снимков экрана на изображениях документов

Also Published As

Publication number Publication date
WO2017208368A1 (ja) 2017-12-07
JPWO2017208368A1 (ja) 2018-08-30
US10706315B2 (en) 2020-07-07
US20190057278A1 (en) 2019-02-21

Similar Documents

Publication Publication Date Title
US10810743B2 (en) Image processing device, image processing method, and computer program product
US8942478B2 (en) Information processing apparatus, processing method therefor, and non-transitory computer-readable storage medium
JP6581288B2 (ja) モバイル端末、画像処理方法、および、プログラム
JP4182937B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP6600090B2 (ja) 画像処理装置、画像処理方法、および、プログラム
US20210281742A1 (en) Document detections from video images
JP6777507B2 (ja) 画像処理装置および画像処理方法
JP4222013B2 (ja) 画像修正装置、文字認識方法及び画像修正プログラム
JP6503478B2 (ja) モバイル端末、画像処理方法、および、プログラム
JP2018092507A (ja) 画像処理装置、画像処理方法及びプログラム
JP6598402B1 (ja) レシート等帳票画像自動取得・読取方法、プログラム、及び携帯端末装置
JP6677209B2 (ja) 画像処理装置、処理方法、プログラム
JP6613378B2 (ja) モバイル端末、画像処理方法、および、プログラム
JP2017158065A (ja) 情報処理装置、情報処理方法、及びプログラム
JP6697829B2 (ja) モバイル端末、画像処理方法、および、プログラム
JP6785930B2 (ja) モバイル端末、画像処理方法、および、プログラム
US10628713B2 (en) Mobile terminal, image processing method, and computer-readable recording medium
JP4315025B2 (ja) 撮影装置、画像取得方法及びプログラム
JP6326316B2 (ja) 画像処理装置、撮影装置、プログラム、記録媒体
WO2017158814A1 (ja) モバイル端末、画像処理方法、および、プログラム
JP2017054381A (ja) 画像解析装置、画像解析方法および画像解析プログラム
JP2014143630A (ja) 画像処理システム
KR20150144840A (ko) 모바일 기기의 카메라와 스캔용지를 이용한 실물크기 스캔 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191003

R150 Certificate of patent or registration of utility model

Ref document number: 6600090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150