JP2018128825A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2018128825A
JP2018128825A JP2017021136A JP2017021136A JP2018128825A JP 2018128825 A JP2018128825 A JP 2018128825A JP 2017021136 A JP2017021136 A JP 2017021136A JP 2017021136 A JP2017021136 A JP 2017021136A JP 2018128825 A JP2018128825 A JP 2018128825A
Authority
JP
Japan
Prior art keywords
image
paper piece
small paper
circumscribed rectangle
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017021136A
Other languages
English (en)
Other versions
JP6957889B2 (ja
Inventor
邦彦 小林
Kunihiko Kobayashi
邦彦 小林
和宏 大谷
Kazuhiro Otani
和宏 大谷
岡田 茂
Shigeru Okada
茂 岡田
真太郎 安達
Shintaro Adachi
真太郎 安達
紘幸 岸本
Hiroyuki Kishimoto
紘幸 岸本
茜 阿部
Akane Abe
茜 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017021136A priority Critical patent/JP6957889B2/ja
Priority to US15/689,365 priority patent/US10643097B2/en
Publication of JP2018128825A publication Critical patent/JP2018128825A/ja
Application granted granted Critical
Publication of JP6957889B2 publication Critical patent/JP6957889B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • H04N1/3875Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming combined with enlarging or reducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3876Recombination of partial images to recreate the original image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる画像処理装置を提供する。
【解決手段】画像処理装置の生成手段は、画像内の小紙片画像の抽出に失敗した場合、複数の該小紙片画像を結合した画像を生成する。
【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、原稿台に無作為に置かれたサイズや種類が異なる複数の帳票を一度にスキャンした画像から各帳票の画像部分を抽出して該帳票を特定・認識することができる画像処理装置を提供することを課題とし、画像処理装置は、スキャン画像上の直線を抽出し、抽出された直線のうちの任意の直線に対して平行又は直角になる直線を抽出し、抽出された直線よりなる抽出直線画像から所定の矩形領域を抽出し、当該所定の矩形領域と予め登録された複数の帳票パターンと比較して一致するものがあるか否かを判断し、帳票パターンと一致するものがあったときは、所定の矩形領域を画像から抽出して格納すると共に、当該矩形領域を画像から除外することが開示されている。
特許文献2には、スキャン画像から矩形画像を抽出する際の雑音耐性を強化することを課題とし、画像抽出装置は、スキャン画像を取得し、取得したスキャン画像の二値画像を生成するとともに、当該生成された二値画像から連結画素を検出し、検出した連結画素に対して設定した外接矩形の各辺において、連結画素との接点から当該接点の属する辺の一方の頂点へと至る線分上の複数の点から、その辺に対して垂直方向に走査してエッジ画素を検出し、画像抽出装置は、検出されたエッジ画素がスキャン画像に写し出された対象物の輪郭部に位置する画素であるか否かを判断し、対象物の輪郭部に位置する画素であると判断されたエッジ画素に基づいて矩形領域を設定し、設定された矩形領域から画像を抽出することが開示されている。
特許文献3には、スキャンデータから複数の原稿それぞれに対応する複数の画像データをより精度よく抜き出すことを課題とし、複数の画像データを抜き出す際の基準領域サイズを設定する設定手段と、スキャンデータから複数の原稿に対応する領域を検出する際に用いる検出パラメータの中から1つを選択し、複数の原稿に対応する複数の画像領域を検出する検出手段と、検出した各画像領域のサイズと基準領域サイズとの差を算出する算出手段と、差が予め設定された閾値以下であるとき、当該画像領域を原稿に対する画像領域として決定する第1の決定手段と、差が前記閾値を超えるとき、当該画像領域を検出する際に使用した検出パラメータを変更し、検出手段、算出手段を行い、差が前記閾値以下となったとき、当該画像領域を原稿に対する画像領域として決定する第2の決定手段とを備えることが開示されている。
特開2008−167009号公報 特開2009−252115号公報 特開2008−113075号公報
複数の名刺等の小紙片を読み込んで作成された画像から、それぞれの小紙片画像を抽出することが行われている。しかし、正確に小紙片画像を抽出できるとは限らない。したがって、利用者が確認する必要がある。例えば、1枚の小紙片画像を複数に分けて抽出してしまう場合がある。このような場合、誤って抽出した小紙片画像と実物の小紙片の対応がとりにくいため、利用者が確認するにあたって、どの小紙片に誤りが発生しているかを判断することが困難になっている。
本発明は、画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像内の小紙片画像の抽出に失敗した場合、複数の該小紙片画像を結合した画像を生成する生成手段を有する画像処理装置である。
請求項2の発明は、前記生成手段は、前記小紙片画像間の距離が閾値未満又は以下である場合に、該小紙片画像を結合する、請求項1に記載の画像処理装置である。
請求項3の発明は、前記閾値は、予め定められた値、小紙片の種類に合わせた値、抽出に成功した小紙片画像の大きさに応じた値のいずれかである、請求項2に記載の画像処理装置である。
請求項4の発明は、画像内の小紙片画像の抽出に失敗した場合、該画像から抽出に成功した小紙片画像を消去した画像を生成する生成手段を有する画像処理装置である。
請求項5の発明は、前記画像内の外接矩形が小紙片画像を示していない場合、該画像内の小紙片画像の抽出に失敗した場合とする、請求項1又は4に記載の画像処理装置である。
請求項6の発明は、前記外接矩形の大きさ又は該外接矩形内の検出できた小紙片画像の辺の数にしたがって、該外接矩形が小紙片画像を示しているか否かを判定する判定手段をさらに具備し、前記生成手段は、前記判定手段の判定結果を用いる、請求項5に記載の画像処理装置である。
請求項7の発明は、前記判定手段は、外接矩形の大きさが予め定められた範囲内にある場合、又は、小紙片画像の辺の数が予め定められた数より多い若しくは以上である場合に、外接矩形が小紙片画像を示していると判定する、請求項6に記載の画像処理装置である。
請求項8の発明は、コンピュータを、画像内の小紙片画像の抽出に失敗した場合、複数の該小紙片画像を結合した画像を生成する生成手段として機能させるための画像処理プログラムである。
請求項9の発明は、コンピュータを、画像内の小紙片画像の抽出に失敗した場合、該画像から抽出に成功した小紙片画像を消去した画像を生成する生成手段として機能させるための画像処理プログラムである。
請求項1の画像処理装置によれば、画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる。
請求項2の画像処理装置によれば、近い小紙片画像同士を結合することができる。
請求項3の画像処理装置によれば、閾値として、予め定められた値、小紙片の種類に合わせた値、抽出に成功した小紙片画像の大きさに応じた値のいずれかを用いることができる。
請求項4の画像処理装置によれば、画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる。
請求項5の画像処理装置によれば、小紙片画像の抽出に失敗した場合として、外接矩形が小紙片画像を示していない場合を用いることができる。
請求項6の画像処理装置によれば、外接矩形が小紙片画像を示しているか否かを判定するのに、外接矩形の大きさ又は小紙片画像の辺の数を用いることができる。
請求項7の画像処理装置によれば、外接矩形が小紙片画像を示している場合として、外接矩形の大きさが予め定められた範囲内にあること、又は、小紙片画像の辺の数が予め定められた数より多い若しくは以上であることを用いることができる。
請求項8の画像処理プログラムによれば、画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる。
請求項9の画像処理プログラムによれば、画像内の小紙片画像の抽出が失敗した場合に、複数に分かれた小紙片画像をそのまま表示する場合よりも、見やすい画像を生成することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 画像分離処理モジュールの構成例についての概念的なモジュール構成図である。 二値画像に含まれる各連結画素に設定された外接矩形の一例を示す図である。 小紙片画像が傾いているか否かの判断基準の一例を説明する図である。 連結画素と外接矩形の一例を示す図である。 小紙片画像の領域を特定する際のノイズ耐性の強化について説明する図である。 拡張された抽出画像領域の設定処理を説明する図である。 画像分離処理モジュールによる処理例を示すフローチャートである。 本実施の形態を利用したシステム構成例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態を用いずに行った処理例を示す説明図である。 第1の実施の形態による処理例を示すフローチャートである。 リストZのデータ構造例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態である画像処理装置100は、画像内から小紙片画像を抽出するものであって、図1の例に示すように、画像取得モジュール105、画像分離処理モジュール110、判定モジュール115、画像生成モジュール120を有している。
小紙片とは、1回のスキャンで複数枚を読み取ることができる程度の大きさの文書をいう。例えば、名刺、クレジットカード等のカード、レシート(領収書)、レター等の文書が該当する。以下、名刺を例示して説明する。
「画像内の小紙片画像を抽出する」における画像とは、例えば、スキャナの原稿置き台(プラテンともいわれる)の上に、小紙片を置き、1回のスキャンで読み取られた画像をいう。つまり、複数の小紙片を置いた場合は、1回のスキャンで1枚の小紙片を読み取るよりも、スキャン回数を減らすことができる。ただし、本実施の形態(第1の実施の形態又は第2の実施の形態)では、複数の小紙片ではなく、画像内に1つの小紙片であっても対応可能である。また、スキャナを例示したが、デジタルカメラ等を用いて撮影した画像であってもよい。
画像取得モジュール105は、画像分離処理モジュール110と接続されている。画像取得モジュール105は、画像を取得して、その画像を画像分離処理モジュール110へ渡す。画像を取得するとは、例えば、スキャナ、デジタルカメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、1枚又は複数枚の小紙片画像が含まれている。
画像分離処理モジュール110は、画像取得モジュール105、判定モジュール115と接続されている。画像分離処理モジュール110は、画像取得モジュール105が取得した画像から小紙片画像を分離する。処理内容については、図2から図8の例を用いて後述する。
判定モジュール115は、画像分離処理モジュール110、画像生成モジュール120と接続されている。判定モジュール115は、画像取得モジュール105が取得した画像内の外接矩形が小紙片画像を示していない場合、その画像内の小紙片画像の抽出に失敗した場合とする。「外接矩形が小紙片画像を示していない場合」とは、具体的には、「外接矩形が小紙片画像の全体を含んでいない場合」をいい、必ずしも外接矩形の4辺が小紙片画像の4辺に対応している必要はない。小紙片画像が傾いている場合があるからである。
また、判定モジュール115は、外接矩形の大きさ又はその外接矩形内の検出できた小紙片画像の辺の数にしたがって、その外接矩形が小紙片画像を示しているか否かを判定する。具体的には、判定モジュール115は、外接矩形の大きさが予め定められた範囲内にある場合、又は、小紙片画像の辺の数が予め定められた数より多い若しくは以上である場合に、外接矩形が小紙片画像を示していると判定するようにしてもよい。もちろんのことながら、2つの条件((1)外接矩形の大きさが予め定められた範囲内にあること、(2)小紙片画像の辺の数が予め定められた数より多い若しくは以上であること)を満たした場合に、外接矩形が小紙片画像を示していると判定するようにしてもよい。
画像生成モジュール120は、判定モジュール115と接続されている。画像生成モジュール120は、画像内の小紙片画像の抽出に失敗した場合、複数のその小紙片画像を結合した画像を生成する。ここで「画像内の小紙片画像の抽出に失敗した場合」として、例えば、判定モジュール115による判定結果を用いればよい。
例えば、画像生成モジュール120は、小紙片画像間の距離が閾値未満又は以下である場合に、その小紙片画像を結合するようにしてもよい。ここで「小紙片画像間の距離」として、例えば、小紙片画像の予め定められた位置(例えば、中心、重心、左上角等)間の距離であってもよいし、小紙片画像間の最短距離(又は最長距離)等であってもよい。
また、ここでの閾値は、(1)予め定められた値、(2)小紙片の種類に合わせた値、(3)抽出に成功した小紙片画像の大きさに応じた値のいずれかとしてもよい。「小紙片の種類」とは、例えば、前述したように、名刺、カード、レシート等がある。この種類は、予め定められた種類であってもよいし、操作者の操作によって指定された種類であってもよい。(2)は、種類毎に予め定められた閾値を用いる。また、「抽出に成功した小紙片画像」は、一般的には画像内に複数の小紙片画像があるので、抽出に成功した小紙片画像もあり得る。そこで、抽出に成功した小紙片画像の大きさに応じた閾値を採用する。一般的に、小紙片の大きさが大きいほど、閾値も大きくする。
図2は、画像分離処理モジュール110の構成例についての概念的なモジュール構成図である。以下、画像分離処理モジュール110が備える各機能についての詳細を説明する。
画像分離処理モジュール110は、図2の例に示すように、二値化処理モジュール16、外接矩形設定モジュール18、原稿傾き判断モジュール20、エッジ画素検出モジュール22、有効エッジ判断モジュール24、辺傾き算出モジュール26、抽出画像領域設定モジュール28、画像抽出モジュール30を有している。
二値化処理モジュール16は、画像取得モジュール105により取得されたスキャン画像に二値化処理を施して、対象としている画像の二値画像を生成する。例えば、二値化処理モジュール16は、画像のエッジを強調した二値化処理を行うことにより、画像に含まれる小紙片の輪郭部を抽出しやすくしている。もちろんのことながら、画像取得モジュール105が取得した画像が二値画像である場合は、二値化処理モジュール16は何もせずに画像を外接矩形設定モジュール18に渡す。
外接矩形設定モジュール18は、二値化処理モジュール16により生成された二値画像に含まれる黒画素の連結画素毎にラベルを付与し(ラベリング処理)、ラベルが付与された各連結画素に外接矩形を設定する。以下、図3を参照しながら外接矩形設定モジュール18の処理を具体的に説明する。
図3は、外接矩形設定モジュール18の処理により、二値画像に含まれる各連結画素に設定された外接矩形の一例を示す。図3に示した例では、二値画像40内に3つの小紙片画像が含まれている。ここで、外接矩形設定モジュール18は、二値画像40の中に含まれる各小紙片画像の輪郭エッジを表す連結画素42、44、46のそれぞれについて外接矩形52、54、56を設定する。なお、連結画素とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含めてもよい。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域が近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの(予め定められた距離未満又は以下にあるもの)である。
原稿傾き判断モジュール20は、外接矩形設定モジュール18により各連結画素について設定された外接矩形の領域内に含まれている連結画素(小紙片画像)が、設定された外接矩形に対して傾いているか否かを判断する。原稿傾き判断モジュール20により外接矩形に対して傾いていないと判断された小紙片画像については、そのままその外接矩形の領域を小紙片画像が含まれる画像領域として設定することとしてよい。一方で、外接矩形に対して傾いていると判断された小紙片画像については、以下に説明するように外接矩形の中から小紙片画像の輪郭部を検出して小紙片画像の輪郭に沿った領域を小紙片画像の抽出画像領域として設定する。この傾いた小紙片画像の抽出画像領域の設定処理の詳細については後述する。
ここで、図4を参照しつつ、原稿傾き判断モジュール20において用いられる、小紙片画像が傾いているか否かの判断基準の一例を説明する。図4に示されるように、原稿傾き判断モジュール20は、外接矩形52の各辺において、外接矩形52の1辺から、当該辺に近接する連結画素42により構成される1辺が所定の距離(Th)内に収まっている場合に、外接矩形に含まれる小紙片画像が傾いていないと判断する。上記の条件に合致しないものは小紙片画像が傾いて画像に含まれているものと判断される。上記Thの値は辺の長さ毎に予め定めておくこととしてもよい。
エッジ画素検出モジュール22は、外接矩形設定モジュール18により設定された各外接矩形内の画像領域から、以下説明する規則にしたがって小紙片画像のエッジ画素を検出する。具体的には、エッジ画素検出モジュール22は、まず外接矩形の1つの辺を処理対象として選択し、当該辺において連結画素と接する点から、当該辺の遠い方の頂点へと至る線分上の複数の各点から、当該辺に対して垂直方向に走査して最初に検出される画素をエッジ画素として検出する。上記複数の各点は、例えば線分上の1画素毎に取ることとしてもよいし、所定の間隔毎に取ることとしてもよい。
図5は、連結画素と外接矩形の一例を示す図である。図5の例を参照しつつ、エッジ画素検出モジュール22による処理を具体的に説明する。まずエッジ画素検出モジュール22は、外接矩形54の上辺54−1に対して、連結画素44との接点44−Aを起点とし、44−Aから遠い方の頂点、すなわち54−Bに至るまで以下の処理を行う。まずエッジ画素検出モジュール22は、起点とした接点44−Aとの接点の位置座標を記録し、次に54−Bの方向に所定の画素数(例えば1画素)移動して、その点から上辺54−1に対して垂直方向に走査して黒画素を検出し、検出した黒画素の位置座標を記録する。こうして検出された黒画素をエッジ画素とする。エッジ画素検出モジュール22は、上記の処理を接点44−Aから頂点54−Bに至るまで繰り返し行う。そして、同様の処理を各辺54−2,3,4についても行い、各辺においてエッジ画素の位置座標を得る。なお、スキャン画像にはノイズが含まれることがあるため、上記検出されたエッジ画素は必ずしも小紙片画像の輪郭部を構成するとはいえない。そこで、以下説明する機能を設け、エッジ画素のうち輪郭部を構成する蓋然性が高いものを選別するようにしてもよい。これによって、小紙片画像の抽出精度を向上させることとしている。
有効エッジ判断モジュール24は、エッジ画素検出モジュール22により検出されたエッジ画素が小紙片画像の輪郭部に位置する画素であるか否かを判断する。有効エッジ判断モジュール24により小紙片画像の輪郭部に位置すると判断されたエッジ画素を有効エッジ画素とする。有効エッジ判断モジュール24は、以下の3つの判断基準のいずれかに合致するエッジ画素は小紙片画像の輪郭部に位置しない、すなわち有効エッジ画素でないと判断し、いずれの判断基準にも合致しないエッジ画素を有効エッジ画素であると判断する。
第1の判断基準は、走査の開始点たる外接矩形の辺から外接矩形の対角線を超えて検出されたエッジ画素は有効エッジ画素としないとするものである。これは、矩形の小紙片画像の4辺がスキャン画像中に正しく写し出されているのであれば、対角線を超えて小紙片画像の辺が検出されることはないことによる。
第2の判断基準は、隣り合ったエッジ画素との位置の差が所定正値よりも大きいエッジ画素は有効エッジ画素としないとするものである。これは、外接矩形と小紙片画像とのそれぞれの辺とがなだらかな傾斜対の関係にあるため、急激な位置の差があるような場合にはノイズである可能性が高いと判断されることによる。
第3の判断基準は、エッジ画素が接点側に隣接するエッジ画素よりも外接矩形の辺に近づく場合には、そのエッジ画素は有効エッジ画素としないとするものである。これは、外接矩形の辺における接点から頂点へと至るにつれて検出されるエッジ画素は外接矩形の辺から遠くなるはずであるため、逆に外接矩形の辺に近づくエッジ画素はノイズである可能性が高いと判断されることによる。
ここで図6に示した例を参照しつつ、上記の各判断基準により、スキャン画像に各種のノイズが含まれていた場合に、小紙片画像の領域を特定する際のノイズ耐性が強化されることについて説明する。
図6は、小紙片画像の領域を特定する際のノイズ耐性の強化について説明する図である。
図6(A)に示された例では、小紙片画像の上部のエッジが欠けているとする。このとき、外接矩形の上辺に対応して検出されるエッジ画素は、60−A及び60−Bとなる。ただし、60−Aのエッジ画素は、対角線61を超えて検出されたため第1の判断基準により、そして60−Bのエッジ画素は頂点56−Aに近づくにつれて上辺に近づくため第3の判断基準により有効エッジ画素とは判断されない。
図6(B)に示された例では、小紙片画像の辺の一部に突起48−A,Bがノイズとして付加されているとする。このとき、突起48−A,Bはそれぞれエッジ画素として検出されるが、突起48−A,Bはそれぞれ隣り合うエッジ画素との位置の差が大きく、また、頂点56−B側で検出されたエッジ画素に比べて上辺に近いため、第2又は第3の判断基準により有効エッジ画素とは判断されない。
図6(C)に示された例では、二値化処理の際に小紙片画像の内部がエッジとされてしまったとする。このとき、小紙片画像の内部に入り込んだエッジ画素の一部は、大きく位置が変動し、また頂点56−Aに向かうにつれて上辺に近づくものであるため、第2及び第3の判断基準により有効エッジ画素とは判断されない。
以上説明したように、第1の判断基準から第3の判断基準に基づいて、エッジ画素として検出されたもののうち、小紙片画像の輪郭部には位置しないエッジ画素を排除して、小紙片画像の輪郭部に位置するエッジ画素を有効エッジ画素として選別することができる。
辺傾き算出モジュール26は、有効エッジ判断モジュール24により有効エッジ画素であると判断された黒画素の位置座標に基づいて、これらの有効エッジ画素により構成される各辺の傾きを算出する。具体的には、辺傾き算出モジュール26は、外接矩形の辺に対応して取得された有効エッジ画素を1つのグループとして、各グループについて例えば最小二乗法により線分を特定し、特定した各線分と対応する外接矩形の辺との傾きを算出する。
抽出画像領域設定モジュール28は、有効エッジ画素により構成される辺の座標と、辺傾き算出モジュール26で算出された有効エッジ画素により構成される各辺の傾きの整合性とに基づいて、小紙片画像が写し出されている矩形領域たる抽出画像領域を設定する。ここで、抽出画像領域は外接矩形設定モジュール18により設定された外接矩形の内部に限定されるものではなく、外接矩形の外部にまで拡張してもよい。ここで図7を参照しつつ上記の拡張された抽出画像領域の設定処理を説明する。
図7は、拡張された抽出画像領域の設定処理を説明する図である。
図7(A)の例には、一部の輪郭が欠けた二値画像(頂点70−A、B、C、D、Eの各点を連結してなる連結画素)について外接矩形(頂点72−A、B、C、Dにより表される矩形)が設定された様子が描かれている。ここで、外接矩形の画像に対して上述した処理を行い有効エッジ画素を取得する。ここで、各辺の傾きの整合性が確認されると、図7(B)の例に示されるように、対向する辺について長い方の辺の長さに合うように連結画素を拡張して、抽出画像領域(頂点70−A、B、F、Dを結んでなる矩形領域)を設定する。
画像抽出モジュール30は、抽出画像領域設定モジュール28により設定された矩形の抽出画像領域から画像を抽出する。
次に、図8に示されたフローチャートを参照しながら、画像分離処理モジュール110により行われる小紙片画像抽出処理の流れを説明する。
図8に示されるように、画像取得モジュール105は、画像読み取り部にセットされた1又は複数枚の小紙片を読み取り、スキャン画像を生成して取得する(S101)。画像分離処理モジュール110は、取得したスキャン画像に対してエッジを強調した二値化処理を施して、二値画像を生成する(S102)。画像分離処理モジュール110は、生成した二値画像に含まれる連結画素毎にラベルを付与して(S103)、ラベルが付与された連結画素毎に外接矩形を設定する(S104)。
画像分離処理モジュール110は、設定された外接矩形に対して、その外接矩形に含まれる連結画素が外接矩形に対して傾いているか否かを判断する(S105)。ここで、傾いていないと判断された外接矩形についてはその外接矩形を抽出画像領域として設定する(S109)。一方で、傾いていると判断された外接矩形については以下の処理を行う。
画像分離処理モジュール110は、外接矩形の各辺において、連結画素との接点から当該接点から遠い方の頂点へと至る線上の各点から、当該辺に対して垂直方向に走査してエッジ画素を検出する(S106)。画像分離処理モジュール110は、検出されたエッジ画素の中から小紙片画像の輪郭部を構成する有効エッジ画素を選択する(S107)。
画像分離処理モジュール110は、外接矩形の各辺において上記の有効エッジ画素の検出処理を行い、得られた有効エッジ画素により形成される各辺の傾きを算出する(S108)。そして、画像分離処理モジュール110は、有効エッジ画素により形成される辺と、各辺について算出された傾きとの整合性に基づいて矩形の抽出画像領域を設定する(S109)。画像分離処理モジュール110は、外接矩形のそれぞれについて上記の各処理を行い、設定された矩形領域について画像を抽出する(S110)。こうして、スキャン画像に写し出された各小紙片画像を抽出するものである。
以上説明したように、画像分離処理モジュール110によれば、対象としている画像から矩形原稿等(小紙片)の矩形画像を抽出する際の雑音耐性を強化することができる。
図9は、本実施の形態を利用したシステム構成例を示す説明図である。
図9(a)に示す例は、スタンドアロン型として構築したものであり、画像入出力装置900は、画像処理装置100を有している。画像入出力装置900に備え付けられたスキャナを用いて、対象とする画像を取得し、抽出に成功した小紙片画像をUSBメモリ等に出力する。そして、小紙片画像の抽出に失敗した場合、複数のその小紙片画像を結合した画像を、画像入出力装置900に備え付けられたパネル等の表示装置に表示してもよい。
図9(b)に示す例は、ネットワーク型として構築したものであり、画像入出力装置900A、画像入出力装置900B、原稿管理装置910A、原稿管理装置910B、ユーザー端末920A、ユーザー端末920Bは、通信回線990を介してそれぞれ接続されている。通信回線990は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、原稿管理装置910による機能は、クラウドサービスとして実現してもよい。例えば、名刺を小紙片として扱う場合として、原稿管理装置910は、名刺データベースであり、名刺画像の認識、組織図の作成、自社担当者との交流関係の解析等を行う。また、レシートを小紙片として扱う場合として、原稿管理装置910は、会計処理サーバーであり、レシート画像の認識、経費精算、確定申告処理等を行う。
画像入出力装置900Aは、画像処理装置100を有している。例えば、画像入出力装置900Aは、画像処理装置100による処理結果(抽出に成功した小紙片画像と、抽出に失敗した小紙片画像を結合した画像)を原稿管理装置910Aに送信し、ユーザーはユーザー端末920によってそれらの処理結果を確認する。
原稿管理装置910Bは、画像処理装置100を有している。例えば、画像入出力装置900Bは、読み込んだ画像(小紙片画像が含まれている画像)を原稿管理装置910Bに送信する。原稿管理装置910Bの画像処理装置100による処理結果(抽出に成功した小紙片画像と、抽出に失敗した小紙片画像を結合した画像)をユーザー端末920に送信し、ユーザーはユーザー端末920によってそれらの処理結果を確認する。
図10は、第1の実施の形態による処理例(抽出に成功した例)を示す説明図である。例えば、画像処理装置100は、プラテン上に名刺やレシート等の小紙片を複数枚配置して、プラテン全体のスキャン画像から各々の小紙片画像に分離する。
図10(a)の例に示す画像1000は、名刺を6枚読み込んで生成された画像である。
図10(b)の例に示す画像1010は、エッジ強調、2値化処理の結果の画像である。
図10(c)の例に示す画像1020は、ラベリング、外接矩形分離処理の結果の画像である。例えば、図10(c1)に示すように、外接矩形1022内には、エッジ画像1024がある。ここで、外接矩形1022aは、「富」を囲む外接矩形である。外接矩形1022bは、「士」を囲む外接矩形である。外接矩形1022cは、「太」を囲む外接矩形である。外接矩形1022dは、「郎」を囲む外接矩形である。ここで、外接矩形間で内包されるものは対象外とする。具体的には、図10(c2)の例に示すように、外接矩形1022に内包されている外接矩形1022a、1022b、1022c、1022dを、削除する。また、この場合、閾値を用いて、ある程度(例えば、名刺の大きさ)以上の大きさは内包関係を調査しないようにしてもよい。
図10(d)の例に示す外接矩形1022は、傾き推定、角度算出処理を示しており、前述した通りの処理である。例えば、外接矩形1022内のエッジ画像1024の3つ以上の辺を検出した場合、回転角度を算出する。
図10(e)の例に示す名刺画像1030は、抽出に成功した名刺画像であり、元画像である画像1000からの切り出し処理、回転補正処理を施したものである。
図11は、第1の実施の形態を用いずに行った処理例(抽出に失敗した例)を示す説明図である。例えば、濃度が薄い等の条件下で、名刺の枠線が連結して検出されず、1枚の名刺画像が複数の画像として認識される場合がある。ユーザーは、どの名刺が抽出に失敗したのかわかりづらく、後段の訂正処理が面倒になる。
図11(a)の例に示す画像1100は、名刺画像を読み取って、エッジ強調、2値化処理を行った後の一部の画像である(前述の画像1010の一部に該当)。ここでは、エッジ検出において、下側の紙片境界が検出されない例を示している。
図11(b)の例に示すグループ結果1110、グループ結果1120は、ラベリング(グループ化)結果の例を示すものである。つまり、1枚の名刺画像が2つのグループ結果1110、グループ結果1120に分かれている。
これらも名刺画像として抽出してしまうと、図11(c)の例に示すように、グループ結果1110に対応する名刺画像(失敗)1112、グループ結果1120に対応する名刺画像(失敗)1122を抽出してしまうことになる。つまり、最終出力として、1つの名刺画像が2つの画像として出力されることとなる。
図11(d)の例は、図9(b)の例に示す構成での処理結果を示すものである。ユーザー1180は、画像入出力装置900で複数の名刺を読み込ませ、原稿管理装置910に送信する。そして、ユーザー1182は、ユーザー端末920を用いて、原稿管理装置910内の名刺画像の抽出結果を確認する。
ユーザー端末920では、名刺画像の抽出結果を画面1130に提示する。画面1130には、名刺画像欄1132、会社名・氏名認識結果欄1134、電話番号認識結果欄1136を表示する。本来は1枚の名刺画像である名刺画像(失敗)1112、名刺画像(失敗)1122は、それぞれ1枚の名刺画像として扱われてしまい、ユーザー1182にとって、どの名刺が抽出に失敗したものであるかがわかりにくくなっており、訂正対象も複数となってしまい煩雑である。
第1の実施の形態によると、抽出に失敗した画像は、1枚の名刺に対応することになる。これによって、ユーザー1182にとって、どの名刺が抽出に失敗したものであるかの特定が容易にでき、訂正対象の枚数も少なくなる。
図12は、第1の実施の形態(主に、判定モジュール115、画像生成モジュール120)による処理例を示すフローチャートである。
ステップS1200では、画像処理装置100は、失敗画像の結合処理を開始する。
ステップS1202では、画像分離処理モジュール110は、画像分離処理を行う。例えば、図8に示したフローチャートによる処理を行う。
ステップS1204では、判定モジュール115は、分離結果を判定する。つまり、小紙片画像の抽出に成功(又は失敗)したか否かを判定する。前述したように、判定モジュール115による判定処理を行えばよい。
例えば、図8に示したステップS104、S105で、外接矩形の大きさが予め定められた大きさの範囲内に収まらない場合は、小紙片画像の抽出に失敗したと判定してもよい。ここで、「予め定められた大きさの範囲」として、例えば、名刺の大きさ(外接矩形が最小)以上であって、名刺を回転させて外接矩形が最大となるときの大きさまでとすればよい。「外接矩形が最大となるとき」とは、名刺の対角線を水平(又は垂直)としたときの外接矩形であり、具体的には、外接矩形の1辺は対角線の長さとなり、もう1辺は対角線を水平(又は垂直)としたときの名刺の上端と下端(左端と右端)間の長さとなる。
また、例えば、図8に示したステップS107、S108で、有効エッジ画素によって構成される辺が3辺以上でない場合は、小紙片画像の抽出に失敗したと判定してもよい。有効エッジとして検出された辺の数が2辺等の場合、図11(b)の例で示したように、1つの名詞画像を複数の画像に分割して抽出してしまうことになるからである。
ステップS1206では、判定モジュール115は、判定結果を各画像に付与する。
ステップS1208では、判定モジュール115は、対象としている画像内の分離結果の全てについて判定が完了したか否かを判断し、完了した場合はステップS1210へ進み、それ以外の場合はステップS1204へ戻る。
ステップS1210では、判定モジュール115は、分離処理失敗だけをリストZに登録する。リストZとして、例えば、リストZ1300がある。図13は、リストZ1300のデータ構造例を示す説明図である。リストZ1300は、ID欄1310、x欄1320、y欄1330、w欄1340、h欄1350を有している。ID欄1310は、分離結果の画像を一意に特定する識別子(ID:IDentification)を記憶している。x欄1320は、その分離結果の画像の左上角のx座標を記憶している。y欄1330は、その分離結果の画像の左上角のy座標を記憶している。w欄1340は、その分離結果の画像の幅(w)を記憶している。h欄1350は、その分離結果の画像の高さ(h)を記憶している。リストZ1300以外のデータ構造であってもよい。例えば、分離結果の画像(ファイル)をリストZとして登録するようにしてもよい。
ステップS1212では、画像生成モジュール120は、変数X=1とする。変数Xは、分離結果の画像の1つを示すものである。
ステップS1214では、画像生成モジュール120は、リストZからX番目の画像を選択する。
ステップS1216では、画像生成モジュール120は、変数Y=X+1とする。変数Yは、分離結果の画像の1つを示すものであり、変数Xで示される画像と結合対象となるか否かが判定される。
ステップS1218では、画像生成モジュール120は、リストZからY番目の画像を選択する。
ステップS1220では、画像生成モジュール120は、XとYで画像間の距離を測定する。
ステップS1222では、画像生成モジュール120は、距離が閾値以内であるか否かを判断し、閾値以内の場合はステップS1224へ進み、それ以外の場合はステップS1228へ進む。なお、変数Yに対応する画像がない場合も、ステップS1228へ進む。
ステップS1224では、画像生成モジュール120は、XとYの結合処理を行う。例えば、変数Xで示される分離結果の画像と変数Yで示される分離結果の画像の両方を囲む外接矩形を生成する。
ステップS1226では、画像生成モジュール120は、XとYをリストZから削除し、結合画像をリストZに登録し、ステップS1212へ戻る。
ステップS1228では、画像生成モジュール120は、Yはリスト要素数であるか否かを判断し、リスト要素数の場合はステップS1230へ進み、それ以外の場合はステップS1216へ戻る。つまり、変数Xで示される分離結果の画像と他の分離結果の画像との組み合わせを全て判定したか否かを判断している。
ステップS1230では、画像生成モジュール120は、X=X+1(変数Xの値をインクリメント)とする。
ステップS1232では、画像生成モジュール120は、全検査が完了したか否かを判断し、完了した場合は失敗画像結合処理を完了し(ステップS1299)、それ以外の場合はステップS1214へ戻る。つまり、分離結果の画像間の組み合わせを全て判定したか否かを判断している。
図14は、第1の実施の形態による処理例を示す説明図である。つまり、図12に示すフローチャートによる具体例を用いた処理例を示す。
図14(A)の例に示す画像1400は、対象となる画像であって、1回のスキャンで生成された画像である。例えば、画像1400内には、名刺1402、名刺1406、名刺1406が撮影されている。
図14(B)の例に示す画像分離結果1410は、画像分離処理モジュール110による画像1400の処理結果を示している。ここで、名刺1402の外接矩形1412は成功と判定され、名刺1404の外接矩形1414、外接矩形1416、外接矩形1418は失敗と判定され、名刺1406の外接矩形1420、外接矩形1422は失敗と判定される。大きさ又は辺の数が成功の条件を満たさないと判定されたからである。
図14(C)の例は、各々の失敗画像を結合する処理を示している。
図14(C1)の例は、失敗した画像をリストZに格納する。ここでは、外接矩形1414、外接矩形1416、外接矩形1418、外接矩形1420、外接矩形1422がリストZに格納される。なお、図14(C1)の(a)は外接矩形1414に該当し、(b)は外接矩形1416に該当し、(c)は外接矩形1420に該当し、(d)は外接矩形1418に該当し、(e)は外接矩形1422に該当する。
図14(C2)の例では、2つの画像間の距離を計測して、近いものを結合し、元の画像(結合対象となった画像)を削除して、結合した画像を新規の画像として登録する。ここでは(a)と(b)を結合して(f)を追加する。
同様の処理を繰り返す。つまり、図14(C3)の例では、(c)と(e)を結合して(g)を追加する。図14(C4)の例では、(d)と(f)を結合して(h)を追加する。最終的には2つの画像となる。
図14(D)の例は、抽出結果として3つの画像を出力することを示している。図14(D1)の画像は名刺画像の抽出に成功した画像であり、図14(D2)、(D3)の画像は名刺画像の抽出に失敗した画像である。例えば、図11に示した画面1130内の名刺画像欄1132に表示する画像である。
第1の実施の形態を用いずに表示した場合は、図14(D2)の画像は図14(C1)内の(a)、(b)、(d)(外接矩形1414、外接矩形1416、外接矩形1418)の3つに分かれて表示され、図14(D3)の画像は図14(C1)内の(c)、(e)(外接矩形1420、外接矩形1422)の2つに分かれて表示されてしまい、元の名刺との対応がとりにくかったが、図14(D)のように表示されるので、元の名刺のどれが抽出に失敗したのかがわかりやすくなっている。
<第2の実施の形態>
図15は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
画像処理装置1500は、画像取得モジュール105、画像分離処理モジュール110、判定モジュール115、画像生成モジュール1520を有している。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
画像生成モジュール1520は、判定モジュール115と接続されている。画像生成モジュール1520は、画像取得モジュール105が取得した画像内の小紙片画像の抽出に失敗した場合、その画像から抽出に成功した小紙片画像を消去した画像を生成する。ここで「画像内の小紙片画像の抽出に失敗した場合」として、例えば、判定モジュール115による判定結果を用いればよい。画像生成モジュール1520の処理によって、抽出に失敗した画像だけが残ることになるので、どの小紙片が抽出に失敗したのかがわかりやすくなる。
図16は、第2の実施の形態による処理例を示すフローチャートである。なお、ステップS1602からS1608までの処理は、図12の例に示したフローチャート内のステップS1202からS1208までの処理と同等である。
ステップS1600では、失敗画像生成処理を開始する。
ステップS1602では、画像分離処理を行う。
ステップS1604では、分離結果を判定する。
ステップS1606では、判定結果を各画像に付与する。
ステップS1608では、全て判定が完了したか否かを判断し、完了した場合はステップS1610へ進み、それ以外の場合はステップS1604へ戻る。
ステップS1610では、元画像から成功画像を削除する。つまり、画像取得モジュール105が取得した画像から、小紙片画像として抽出に成功した画像を消去する。したがって、小紙片画像として抽出に失敗した画像だけが残ることになる。
ステップS1612では、削除した領域を周囲の色で補正する。具体的には、周囲の色で消去した領域を塗りつぶす。周囲の色は、削除した領域の周囲の色の統計的値(平均値、中央値、最頻値等)であってもよい。なお、ステップS1612の処理は省略してもよい。
ステップS1699では、失敗画像生成処理を完了する。
図17は、第2の実施の形態による処理例を示す説明図である。つまり、図16に示すフローチャートによる具体例を用いた処理例を示す。
図17(A)の例に示す画像1700は、対象となる画像であって、1回のスキャンで生成された画像である。例えば、画像1700内には、名刺1702、名刺1704、名刺1706が撮影されている。図14(A)の例に示す画像1400と同等である。
図17(B)の例に示す画像分離結果1710は、画像分離処理モジュール110による画像1700の処理結果を示している。なお、画像分離結果1710は、図14(B)の例に示す画像分離結果1410と同等である。名刺1702の外接矩形1712は成功と判定され、名刺1704の外接矩形1714、外接矩形1716、外接矩形1718は失敗と判定され、名刺1706の外接矩形1720、外接矩形1722は失敗と判定される。大きさ又は辺の数が成功の条件を満たさないと判定されたからである。
図17(C)の例に示す画像1730は、抽出に成功した小紙片画像(名刺1702の画像)を削除したものである。つまり、失敗画像が含まれる場合、成功画像を消去して、抽出成功領域1732内を周囲の色で穴埋めした合成画像(画像1730)を生成する。したがって、抽出に失敗した名刺1704、名刺1706は、画像1730内に残ることになる。
図17(D)の例は、抽出結果として2つの画像を出力することを示している。つまり、成功画像群の名刺画像1740と失敗画像の画像1730である。なお、成功画像群は、図17(D)の例では、1つの名刺画像1740であるが、抽出に成功した名刺画像が複数あれば、複数の名刺画像となる。
第2の実施の形態を用いずに表示した場合は、図17(A)の名刺1704の画像は外接矩形1714、外接矩形1716、外接矩形1718の3つに分かれて表示され、名刺1706の画像は外接矩形1720、外接矩形1722の2つに分かれて表示されてしまい、元の名刺との対応がとりにくかったが、図17(D)のように表示されるので、元の名刺のどれが抽出に失敗したのかがわかりやすくなっている。
図18を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図18に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1817と、プリンタ等のデータ出力部1818を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1801は、前述の実施の形態において説明した各種のモジュール、すなわち、画像取得モジュール105、画像分離処理モジュール110、判定モジュール115、画像生成モジュール120、画像生成モジュール1520等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1802は、CPU1801が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1803は、CPU1801の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1804により相互に接続されている。
ホストバス1804は、ブリッジ1805を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1806に接続されている。
キーボード1808、マウス等のポインティングデバイス1809は、操作者により操作されるデバイスである。ディスプレイ1810は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス1809とディスプレイ1810の両方の機能を備えているタッチスクリーン等であってもよい。その場合、キーボードの機能の実現について、キーボード1808のように物理的に接続しなくても、画面(タッチスクリーン)上にソフトウエアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
HDD(Hard Disk Drive)1811は、ハードディスク(フラッシュ・メモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU1801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象となる画像、処理結果の画像、リストZ1300等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
ドライブ1812は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1807、外部バス1806、ブリッジ1805、及びホストバス1804を介して接続されているRAM1803に供給する。なお、リムーバブル記録媒体1813も、データ記録領域として利用可能である。
接続ポート1814は、外部接続機器1815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1814は、インタフェース1807、及び外部バス1806、ブリッジ1805、ホストバス1804等を介してCPU1801等に接続されている。通信部1816は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1817は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1818は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図18に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図18に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図18に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
前述の実施の形態(特に、画像分離処理モジュール110)は以下のように把握してもよい。
[A1]小紙片である対象物をスキャンしたスキャン画像を取得する手段と、
前記取得したスキャン画像の二値画像を生成するとともに、当該生成された二値画像から連結画素を検出する検出手段と、
前記検出手段により検出した連結画素に対して設定した外接矩形の各辺において、前記連結画素との接点から当該接点の属する辺の一方の頂点へと至る線分上の複数の点から、前記接点の属する辺に対して垂直方向に走査してエッジ画素を検出するエッジ画素検出手段と、
前記エッジ画素検出手段により検出されたエッジ画素のうち前記外接矩形の対角線を超えて検出されるか、又は前記検出されたエッジ画素と前記辺との距離が前記連結画素との接点から前記一方の頂点に向かうに連れて小さくなるものを排除して、前記スキャン画像に写し出された前記対象物の輪郭部に位置する有効エッジ画素を選別する選別手段と、
前記有効エッジ画素に基づいて矩形領域を設定する矩形領域設定手段と、
前記矩形領域設定手段により設定された矩形領域から画像を抽出する手段と、
を含むことを特徴とする画像抽出装置。
[A2]前記選別手段は、前記検出されたエッジ画素のうち、隣り合うエッジ画素との距離が閾値より大きいものをさらに排除して前記有効エッジ画素を選別する、
ことを特徴とする[A1]に記載の画像抽出装置。
[A3]前記一方の頂点は、前記連結画素との接点が属する辺の頂点のうち、前記接点から遠い方の頂点とする、
ことを特徴とする[A1]又は[A2]に記載の画像抽出装置。
[A4]前記有効エッジ画素の位置座標に基づいて、前記有効エッジ画素が構成する少なくとも3以上の線分の傾きを算出する手段をさらに含み、
前記矩形領域設定手段は、前記算出された線分の傾きの整合性に基づいて前記矩形領域を設定する、
ことを特徴とする[A1]乃至[A3]のいずれかに記載の画像抽出装置。
[A5]前記検出された連結画素と前記外接矩形との傾きを検出する手段をさらに含み、
前記検出された傾きが所定の値よりも大きい場合に、前記エッジ画素検出手段、前記選別手段、及び前記矩形領域設定手段による各処理を実行する、
ことを特徴とする[A1]乃至[A4]のいずれかに記載の画像抽出装置。
[A6]前記対象物は、矩形の小紙片画像である、
ことを特徴とする[A1]乃至[A5]のいずれかに記載の画像抽出装置。
[A7]コンピュータを、
小紙片である対象物をスキャンしたスキャン画像を取得する手段と、
前記取得したスキャン画像の二値画像を生成するとともに、当該生成された二値画像から連結画素を検出する検出手段と、
前記検出手段により検出した連結画素に対して設定した外接矩形の各辺において、前記連結画素との接点から当該接点の属する辺の一方の頂点へと至る線分上の複数の点から、前記接点の属する辺に対して垂直方向に走査してエッジ画素を検出するエッジ画素検出手段と、
前記エッジ画素検出手段により検出されたエッジ画素のうち前記外接矩形の対角線を超えて検出されるか、又は前記検出されたエッジ画素と前記辺との距離が前記連結画素との接点から前記一方の頂点に向かうに連れて小さくなるものを排除して、前記スキャン画像に写し出された前記対象物の輪郭部に位置する有効エッジ画素を選別する選別手段と、
前記有効エッジ画素に基づいて矩形領域を設定する矩形領域設定手段と、
前記矩形領域設定手段により設定された矩形領域から画像を抽出する手段として機能させるための画像抽出プログラム。
そして、前述の発明は、以下の効果を有する。
[A1]に記載の発明によれば、スキャン画像に写し出された対象物の画像を抽出する際の雑音耐性を強化することができる。また、対象物画像の輪郭部のエッジでない画素を排除することによりスキャン画像に写し出された対象物の画像を抽出する際の雑音耐性を強化することができる。
[A2]に記載の発明によれば、対象物画像の輪郭部のエッジでない画素を排除することによりスキャン画像に写し出された対象物の画像を抽出する際の雑音耐性を強化することができる。
[A3]に記載の発明によれば、検出するエッジ画素の数が増加するため、スキャン画像にノイズが含まれていても画像抽出に与える悪影響を軽減させることができる。
[A4]に記載の発明によれば、エッジ画素により構成される各辺の傾きに基づいて対象物が写し出されていると推定される部分に矩形領域を設定することで、スキャン画像の中から対象物画像を抽出する精度を向上させることができる。
[A5]に記載の発明によれば、スキャン画像に対して傾いている対象物についてのみ処理対象とすることで、不要な処理を省略することができる。
[A6]に記載の発明によれば、スキャン画像に写し出された矩形の小紙片画像を精度よく抽出することができる。
[A7]に記載の発明によれば、スキャン画像に写し出された対象物の画像を抽出する際の雑音耐性を強化するようにコンピュータを機能させることができる。また、対象物画像の輪郭部のエッジでない画素を排除することによりスキャン画像に写し出された対象物の画像を抽出する際の雑音耐性を強化するようにコンピュータを機能させることができる。
100…画像処理装置
105…画像取得モジュール
110…画像分離処理モジュール
115…判定モジュール
120…画像生成モジュール
16…二値化処理モジュール
18…外接矩形設定モジュール
20…原稿傾き判断モジュール
22…エッジ画素検出モジュール
24…有効エッジ判断モジュール
26…辺傾き算出モジュール
28…抽出画像領域設定モジュール
30…画像抽出モジュール
900…画像入出力装置
910…原稿管理装置
920…ユーザー端末
990…通信回線
1500…画像処理装置
1520…画像生成モジュール

Claims (9)

  1. 画像内の小紙片画像の抽出に失敗した場合、複数の該小紙片画像を結合した画像を生成する生成手段
    を有する画像処理装置。
  2. 前記生成手段は、前記小紙片画像間の距離が閾値未満又は以下である場合に、該小紙片画像を結合する、
    請求項1に記載の画像処理装置。
  3. 前記閾値は、予め定められた値、小紙片の種類に合わせた値、抽出に成功した小紙片画像の大きさに応じた値のいずれかである、
    請求項2に記載の画像処理装置。
  4. 画像内の小紙片画像の抽出に失敗した場合、該画像から抽出に成功した小紙片画像を消去した画像を生成する生成手段
    を有する画像処理装置。
  5. 前記画像内の外接矩形が小紙片画像を示していない場合、該画像内の小紙片画像の抽出に失敗した場合とする、
    請求項1又は4に記載の画像処理装置。
  6. 前記外接矩形の大きさ又は該外接矩形内の検出できた小紙片画像の辺の数にしたがって、該外接矩形が小紙片画像を示しているか否かを判定する判定手段
    をさらに具備し、
    前記生成手段は、前記判定手段の判定結果を用いる、
    請求項5に記載の画像処理装置。
  7. 前記判定手段は、外接矩形の大きさが予め定められた範囲内にある場合、又は、小紙片画像の辺の数が予め定められた数より多い若しくは以上である場合に、外接矩形が小紙片画像を示していると判定する、
    請求項6に記載の画像処理装置。
  8. コンピュータを、
    画像内の小紙片画像の抽出に失敗した場合、複数の該小紙片画像を結合した画像を生成する生成手段
    として機能させるための画像処理プログラム。
  9. コンピュータを、
    画像内の小紙片画像の抽出に失敗した場合、該画像から抽出に成功した小紙片画像を消去した画像を生成する生成手段
    として機能させるための画像処理プログラム。
JP2017021136A 2017-02-08 2017-02-08 画像処理装置及び画像処理プログラム Active JP6957889B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017021136A JP6957889B2 (ja) 2017-02-08 2017-02-08 画像処理装置及び画像処理プログラム
US15/689,365 US10643097B2 (en) 2017-02-08 2017-08-29 Image processing apparatuses and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017021136A JP6957889B2 (ja) 2017-02-08 2017-02-08 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2018128825A true JP2018128825A (ja) 2018-08-16
JP6957889B2 JP6957889B2 (ja) 2021-11-02

Family

ID=63037824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017021136A Active JP6957889B2 (ja) 2017-02-08 2017-02-08 画像処理装置及び画像処理プログラム

Country Status (2)

Country Link
US (1) US10643097B2 (ja)
JP (1) JP6957889B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021096800A (ja) * 2019-12-19 2021-06-24 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020031320A (ja) * 2018-08-22 2020-02-27 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像表示方法
JP2021136523A (ja) * 2020-02-26 2021-09-13 京セラドキュメントソリューションズ株式会社 画像読取装置、画像形成装置、原稿領域検出方法
US11394851B1 (en) * 2021-03-05 2022-07-19 Toshiba Tec Kabushiki Kaisha Information processing apparatus and display method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008167009A (ja) * 2006-12-27 2008-07-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP2009252115A (ja) * 2008-04-09 2009-10-29 Fuji Xerox Co Ltd 画像抽出装置、及び画像抽出プログラム
JP2015170968A (ja) * 2014-03-06 2015-09-28 株式会社Pfu 画像読取装置、画像処理方法、および、プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373590B1 (en) * 1999-02-04 2002-04-16 Seiko Epson Corporation Method and apparatus for slant adjustment and photo layout
US6898316B2 (en) * 2001-11-09 2005-05-24 Arcsoft, Inc. Multiple image area detection in a digital image
US7305129B2 (en) * 2003-01-29 2007-12-04 Microsoft Corporation Methods and apparatus for populating electronic forms from scanned documents
US7805003B1 (en) * 2003-11-18 2010-09-28 Adobe Systems Incorporated Identifying one or more objects within an image
US7623734B2 (en) * 2004-09-30 2009-11-24 Microsoft Corporation Method and system for automatically inscribing noisy objects in scanned image data within a minimum area rectangle
JP2008016700A (ja) 2006-07-07 2008-01-24 Matsushita Electric Ind Co Ltd 半導体集積装置
JP2008113075A (ja) 2006-10-27 2008-05-15 Canon Inc 画像処理装置およびその制御方法
US9129340B1 (en) * 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
EP2549735A3 (en) * 2011-07-19 2014-08-27 Samsung Electronics Co., Ltd. Method of editing static digital combined images comprising images of multiple objects

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008167009A (ja) * 2006-12-27 2008-07-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP2009252115A (ja) * 2008-04-09 2009-10-29 Fuji Xerox Co Ltd 画像抽出装置、及び画像抽出プログラム
JP2015170968A (ja) * 2014-03-06 2015-09-28 株式会社Pfu 画像読取装置、画像処理方法、および、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021096800A (ja) * 2019-12-19 2021-06-24 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム
JP7447472B2 (ja) 2019-12-19 2024-03-12 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
US20180225541A1 (en) 2018-08-09
JP6957889B2 (ja) 2021-11-02
US10643097B2 (en) 2020-05-05

Similar Documents

Publication Publication Date Title
JP4525787B2 (ja) 画像抽出装置、及び画像抽出プログラム
US6970600B2 (en) Apparatus and method for image processing of hand-written characters using coded structured light and time series frame capture
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP6957889B2 (ja) 画像処理装置及び画像処理プログラム
JP2014092899A (ja) 画像処理装置及び画像処理プログラム
JP7017060B2 (ja) 画像処理装置及び画像処理プログラム
US8019113B2 (en) Image processing apparatus, control method therefore, program, and storage medium
US10075614B2 (en) Image processing apparatus and non-transitory computer readable medium
US10834281B2 (en) Document size detecting by matching between image of entire document and read size image
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
JP6191500B2 (ja) 画像処理装置、画像処理システム及び画像処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5742367B2 (ja) 画像処理装置及び画像処理プログラム
US10318801B2 (en) Image processing apparatus and non-transitory computer readable medium
JP2005316550A (ja) 画像処理装置、画像読取装置、画像検査装置、およびプログラム
US8494272B2 (en) Image processing device, image processing method, and computer readable medium for judging if images are matched
JP2014120832A (ja) 画像処理装置及び画像処理プログラム
JP6876917B2 (ja) 原稿サイズ検出装置、原稿サイズ検出プログラム及び画像処理システム
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JP6922421B2 (ja) 読取方法案内装置、読取方法案内プログラム及び画像処理システム
JPH10336428A (ja) 画像処理装置
JP5434273B2 (ja) 画像処理装置及び画像処理プログラム
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム
JP6676955B2 (ja) 画像処理装置及び画像処理プログラム
JP2021175051A (ja) 折れ曲がり検出装置、画像処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210920

R150 Certificate of patent or registration of utility model

Ref document number: 6957889

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150