JP5636691B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5636691B2
JP5636691B2 JP2010041912A JP2010041912A JP5636691B2 JP 5636691 B2 JP5636691 B2 JP 5636691B2 JP 2010041912 A JP2010041912 A JP 2010041912A JP 2010041912 A JP2010041912 A JP 2010041912A JP 5636691 B2 JP5636691 B2 JP 5636691B2
Authority
JP
Japan
Prior art keywords
route
image
path
route information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010041912A
Other languages
English (en)
Other versions
JP2011180666A (ja
Inventor
瑛一 田中
瑛一 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010041912A priority Critical patent/JP5636691B2/ja
Priority to US12/878,110 priority patent/US8923635B2/en
Publication of JP2011180666A publication Critical patent/JP2011180666A/ja
Application granted granted Critical
Publication of JP5636691B2 publication Critical patent/JP5636691B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
画像内から対象とする領域を分離する技術がある。例えば、文書画像内から1文字毎の文字画像領域を切り出す技術である。
これに関連する技術として、例えば、特許文献1には、斜め方向に接触した接触文字あるいは二ヶ所以上で接触した接触文字から個々の文字パタンを切り出す文字切り出し装置を提供することを目的とし、文字行切り出し部は画像入力部より入力される白黒2値に量子化された帳票の画像データから1文字の文字行画像を切り出し、文字切り出し部の文字塊切り出し部は文字行画像から連結した黒画素の塊を切り出し、くびれ検出部は黒画素の塊における文字線のくびれ部分を検出し、文字パタン切り出し部はくびれ部分において黒画素の塊を分離することにより斜め方向に接触した接触文字あるいは二ヶ所以上で接触した接触文字から個々の文字パタンを切り出すことが開示されている。
また、例えば、特許文献2には、文字列方向に対して垂直方向に文字列画像を走査して周辺分布データを作成し、該周辺分布データに基づき文字部分パタンからなるブロック領域を検出するブロック検出部を備え、前記ブロック領域に基づき前記文字列画像中の文字パタンの切り出し処理を行う文字切り出し装置において、前記ブロック領域に対応する前記周辺分布データに基づき、隣接する前記文字部分パタン間に境界線を設定するための候補領域を設定する探索候補設定部と、前記候補領域により前記境界線の探索始点及び探索終点を選択し、該探索始点と探索終点とを結ぶ線分を軸とした探索領域を設定する探索領域設定部と、前記探索始点から前記探索終点へ向かう前記探索領域中の経路のうち、該経路上の各座標の画素濃度値に対して所定の係数で重み付けし、その重み付け結果の累積値が最小となる経路を検出する経路検出部と、前記経路検出部により検出された経路の位置データ及び該経路の近傍領域の画素濃度値に基づき、該経路における前記境界線としての有効性を判定する経路有効性判定部と、前記経路有効性判定部により有効と判定されたとき、前記経路検出部により検出された経路を前記境界線として決定する境界線決定部と、前記境界線の位置データ及び前記ブロック領域の位置データに基づき、前記文字パタンの切り出しを行う文字パタン切り出し部とを備えた文字切り出し装置が開示されている。
また、例えば、特許文献3には、入力媒体上の文字列より得られる文字列画像データを入力し、該文字列画像データ中の隣接する部分パタン間に境界線を設定するための探索始点と探索終点と該探索始点及び探索終点間を結ぶ線分を軸とした探索領域とを設定する探索領域設定部と、前記探索始点から探索終点へ向かう探索領域内の経路において、該経路上の各座標の画素濃度値を該座標での経路の向きに応じて定めた所定の係数で重み付けし、その累積値が最小となるよう該経路を検出する経路検出部と、前記経路検出部で検出された経路とその経路の近傍領域の画素濃度値とに基づいて該経路の有効性を判定し、有効であると認められる場合に該経路を隣接する部分パタン間の境界線であると判定する境界線検出部と、前記隣接する部分パタン間の境界線の位置に基づいて前記文字列画像データから文字パタンの切り出しを行う文字パタン切り出し部とを備え、前記探索領域設定部は、前記経路検出部より得られた経路と前記境界線検出部より得られた該経路の有効性とに基づいて前記探索始点及び探索終点を更新する構成にした文字切り出し装置が開示されている。
また、例えば、特許文献4には、入力文字行画像から1文字ずつ文字パタンを切り出す文字切り出し装置において、文字パタン間境界を探索するための探索始点、探索終点及びこれら2点を含む探索領域を設定する探索領域設定部と、前記探索領域内の各画素の濃度値を、各画素を通過する前記探索始点から前記探索終点に向かう経路の各画素における向きに応じて予め定めた係数でそれぞれ重み付けし、該重み付けした濃度値の累積値が最小になる経路を決定する経路決定部と、該決定された経路を前記文字パタン境界として前記文字行画像から文字パタンを切り出す切り出し部とを備えたことを特徴とする文字切り出し装置が開示されている。
また、例えば、特許文献5には、入力記号表現の解釈の生成方法及びシステムを提供することを課題とし、システムは入力記号表現を示す取得入力データセットを処理し、一連のセグメントを生成し、このセグメントを用いて一連のコンセグメンテーションを指定し、入力記号表現に関する各コンセグメンテーションと可能解釈はデータ構造内に示され、データ構造は、行と列に配列され有向弧により選択的に連結されたノードの二次元アレーからなるグラフにより図示され、ノードを通り有向弧に沿って延びる各パスは入力記号表現に関する1つのコンセグメンテーションと1つの可能解釈を示し、グラフ内のノードの各行について、最適に学習されたニューラル情報処理ネットワークの複合体を用いて既知記号セットに関する一連のスコアが生成され、記号シーケンス解釈に関する帰納的確率を計算し、取得入力データセットの分析により各帰納的確率を導出することにより高信頼性確率が入力記号表現の競合解釈について生成されることが開示されている。
また、例えば、非特許文献1、非特許文献2には、階調画像内の文字分割、最短経路を利用する文字分割に関する技術が開示されている。
特開平05−114047号公報 特開平04−100189号公報 特開平04−92992号公報 特開平04−68481号公報 特開平09−54814号公報
Seong−Whan Lee, Dong−June Lee, Hee−Seon Park, "A New Methodology for Gray−Scale Character Segmentation and Recognition,", IEEE, 1996. Jia Tse, Dean Curtis, Christopher Jones, "An OCR−Independent Character Segmentation Using Shortest−Path in Grayscale Document Images,", IEEE, 2007.
本発明は、画像内において接触している又は投影した場合に重なっている領域を分離するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像内から領域を分離するための第1の経路を示す情報である第1の経路情報を算出する第1の経路情報算出手段と、前記第1の経路とは逆方向の経路であって、前記画像内から前記領域を分離するための第2の経路を示す情報である第2の経路情報を算出する第2の経路情報算出手段と、前記第1の経路情報算出手段によって算出された第1の経路情報、前記第2の経路情報算出手段によって算出された第2の経路情報のいずれかを選択する経路選択手段を具備し、前記第1の経路情報と前記第2の経路情報は、経路の始点と終点の組を保持した始点終点表であって、前記経路選択手段は、前記始点終点表を用いて始点と終点の組を選択し、該選択した始点と終点の組から、前記画像内から領域を分離する経路を生成することを特徴とする画像処理装置である。
請求項2の発明は、前記第1の経路及び前記第2の経路は、該経路上の画素の輝度値の累積値が予め定めた条件を満たす場合の経路であることを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記第2の経路情報算出手段は、前記第1の経路情報算出手段によって算出された第1の経路情報に基づいて、前記第2の経路情報を算出し、前記第1の経路情報算出手段は、2回目以降の処理においては、前記第2の経路情報算出手段によって算出された第2の経路情報に基づいて、前記第1の経路情報を算出することを特徴とする請求項1又は2に記載の画像処理装置である。
請求項4の発明は、前記第1の経路情報算出手段による処理と前記第2の経路情報算出手段による処理は、該処理が予め定められた回数行われること、又は、前記第1の経路情報算出手段によって算出された第1の経路情報と前記第2の経路情報算出手段によって算出された第2の経路情報が合致すること、を終了の条件とすることを特徴とする請求項3に記載の画像処理装置である。
請求項5の発明は、コンピュータを、画像内から領域を分離するための第1の経路を示す情報である第1の経路情報を算出する第1の経路情報算出手段と、前記第1の経路とは逆方向の経路であって、前記画像内から前記領域を分離するための第2の経路を示す情報である第2の経路情報を算出する第2の経路情報算出手段と、前記第1の経路情報算出手段によって算出された第1の経路情報、前記第2の経路情報算出手段によって算出された第2の経路情報のいずれかを選択する経路選択手段として機能させ、前記第1の経路情報と前記第2の経路情報は、経路の始点と終点の組を保持した始点終点表であって、前記経路選択手段は、前記始点終点表を用いて始点と終点の組を選択し、該選択した始点と終点の組から、前記画像内から領域を分離する経路を生成することを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、画像内において接触している又は投影した場合に重なっている領域を分離することができる。
請求項2の画像処理装置によれば、2値画像を含めた多値画像を対象として、領域を分離することができる。
請求項3の画像処理装置によれば、本構成を有していない場合に比較して、領域を分離するための経路を絞り込むことができる。
請求項4の画像処理装置によれば、本構成を有していない場合に比較して、処理の負荷を軽減することができる。
請求項5の画像処理プログラムによれば、画像内において接触している又は投影した場合に重なっている領域を分離することができる。
画像を領域に分離する経路の例を示す説明図である。 異なる始点をもつ複数の経路が、同じ終点をもつ例を示す説明図である。 対象とする画像の例を示す説明図である。 上方向への最短経路の例を示す説明図である。 下方向への最短経路の例を示す説明図である。 1回の往復によって得られる最短経路の例を示す説明図である。 2回の往復によって得られる最短経路の例を示す説明図である。 3回の往復によって得られる最短経路の例を示す説明図である。 収束した場合の最短経路の例を示す説明図である。 最短経路によって画像を領域に分離した例を示す説明図である。 本実施の形態の基本構成例についての概念的なモジュール構成図である。 第1の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第5の実施の形態の構成例についての概念的なモジュール構成図である。 経路抽出モジュールを組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。 経路抽出モジュールを組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。 経路抽出モジュールを組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。 経路抽出モジュールを組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。 経路情報の算出例を示す説明図である。 経路情報の算出例を示す説明図である。 経路情報を算出するために必要となる情報の例を示す説明図である。 対象とする画像の例を示す説明図である。 対象とする画像を分離した例を示す説明図である。 対象とする画像の投影情報の例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、本実施の形態の概略を説明する。
本実施の形態は、画像内から領域を分離する(切り出す、抽出等ともいわれる)画像処理装置に関するものである。領域を分離するためには、その領域を囲む外郭を決定する必要がある。そこで、領域を囲む外郭として最短経路を採用する。この最短経路によって画像内から領域を分離しようとするものである。
ここで、最短経路とは、対象とする画像上のピクセル(の位置)の1次元配列である線パタンであり、経路上のピクセルの輝度値の累積値をコストとして、ある範囲においてコスト最小又はコスト最大の経路を指す。特に本実施の形態において最短経路とは、図1に例示するように、画像100に対して領域を分割するための外郭にあたり、画像100の下端のあるピクセルを始点111として、画像100の上端にあるピクセルであって、終点候補のセットとしての予め定められた終点候補120内において、経路上のピクセルの輝度値の累積値が最小又は最大となるように定めたピクセルを終点121とした経路である。また、始点111と終点候補120が定まると、移動範囲130が定まることになる。
なお、コスト最小又はコスト最大の用語を用いるが、必ずしも最小、最大である必要はない。ここでのコスト最小又はコスト最大とは、その経路を抽出するための判断条件であり、その経路のコスト(経路上のピクセルの輝度値の累積値)が他の経路のコストよりも小さい又は大きいことであればよい。したがって、最短経路という場合は、特に明記する場合以外は、比較した範囲内で経路のコストが最小又は最大である経路であることの他に、画像を分割する経路を抽出するという目的を達成するための判断条件としてであれば、コストが最小又は最大から2番目等を選択した場合の経路であってもよいし、コストが最小又は最大から1番目、2番目等の複数を選択した場合の経路であってもよい。
次に、最短経路の収束を利用した分離経路の決定について説明する。
本実施の形態は、前述の最短経路について、始点の異なる複数の経路が同一の終点をもつ(以下、経路の収束、とよぶ)ことを利用する。この様子を図2の例に模式的に示す。図2は、異なる始点をもつ複数の経路が、同じ終点をもつ例を示す説明図である。つまり、画像200を対象として、始点211〜213の3つの始点から出発した最短経路が1つの終点221に到達していることを示しており、始点214〜218の5つの始点から出発した最短経路が1つの終点222に到達していることを示している。
以下、複数の単文字を含む文字列画像を受け付けて、単文字どうしを分離することを主に例示して説明する。
本実施の形態は、最短経路の情報に基づいて、文字列画像について、単文字どうしを分離する経路を算出する。なお、前述の先行技術文献に記載されている技術において、この処理の役割をもつ処理は、投影情報又は連結成分に基づく分離領域候補の抽出処理にあたる。
以下、図3〜図10に示す例を用いて、経路の収束を利用した分離経路の決定について説明する。
図3は、対象とする画像の例を示す説明図である。画像300内には、「S」の文字画像310、「T」の文字画像320、「U」の文字画像330を含んでおり、これらは写像をとると互いに重なっているパタンである。セルはピクセルを表し、セルの値はピクセルの輝度値を表す。さらに、図3の例について、最短経路を算出したものを図4、図5の例に示す。セルの数値について、1は経路があることを、0は経路がないことを表している。図4の例は、下端のすべてのピクセルを始点として上端にあるピクセルを終点とする、上方向の最短経路を表す。図5の例は、上端のすべてのピクセルを始点として下端にあるピクセルを終点とする、下方向の最短経路を表す。それぞれ、経路が収束していることが分かる。つまり、始点の数よりも終点の数が少ないのであるから、始点の異なる複数の経路が同一の終点をもっている。
ここで、図4の例のすべての終点を始点とした場合に、下方向への最短経路を算出する処理を行う。この処理結果を図6の例に示す。このように、片方の方向のすべての経路の終点を、もう片方の方向の始点として経路を算出する作業(以下、往復、とする)により、さらに経路が収束する。つまり、図6は、1回の往復(上方向から下方向)によって得られる最短経路の例を示す説明図である。
以下、上方向を開始の方向として、2回の往復により得られた最短経路の例を図7に、3回の往復により得られた最短経路の例を図8に、往復により経路の始点終点に変化がなくなった状態で得られる最短経路の例を図9に示す。ここで、経路の始点終点に変化がなくなった状態とは、上方向の経路と下方向の経路が合致することをいい、合致とは、経路が一致することをいい、その方向は問わない。つまり、一方の始点は他方の終点となり、一方の終点は他方の始点となることである。
また、図9に例示する最短経路を分離経路として、図3に例示する画像を分離する様子を図10の例に模式的に表す。つまり、画像300は、分離経路1010、分離経路1020、分離経路1030、分離経路1040によって、文字画像310(文字「S」)と文字画像320(文字「T」)と文字画像330(文字「U」)との領域に分離されていることが分かる。
本実施の形態は、このように、経路の収束に基づき、分離経路の絞り込みを行うものである。
なお、本実施の形態において、往復の処理は、経路の始点と終点のペアのセットを利用することで、経路の始点と終点の中間のピクセルの位置等を記憶する必要がなくなり、処理対象とするデータ量も少なくなる。また、図9の例に示すような、完全に収束した経路は、経路の始点と終点のペアのセットだけを利用して、中間のピクセルの位置等がなくても算出され得るものである。
往復回数を指定する経路の算出(つまり、必ずしも完全な収束とはならない算出)は、往復回数に対して、分離経路数は単調減少であることを利用して、本実施の形態全体が要求に合わせて分離の度合いを調節するようにしてもよい。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<本実施の形態の基本構成例>
まず、図11に、本実施の形態(画像処理装置である経路抽出装置)の基本構成例についての概念的なモジュール構成図を示す。この基本構成例は、以下の処理を行う。
(1)経路情報算出処理:経路要求を受け取ると、対象画像を解析し、経路情報を算出する処理である。この処理は、次の2種類がある。
(ア)順方向の経路情報算出(順方向経路情報算出モジュール1110による処理)
(イ)逆方向の経路情報算出(逆方向経路情報算出モジュール1130による処理)
(2)経路選択(経路選択モジュール1120による処理):経路情報を参照し、経路の収束に基づいて経路を選択する処理である。
(1)経路情報算出処理は、順方向経路情報算出モジュール1110、逆方向経路情報算出モジュール1130によって行われる。順方向経路情報算出モジュール1110、逆方向経路情報算出モジュール1130は、経路選択モジュール1120と接続されており、画像1101を解析し、前述した最短経路の情報(経路情報1111、1131)を算出する処理を行う。ここで、順方向とは出力する経路の方向であり、逆方向とは順方向と逆の方向である。例えば、図9の例に示す経路は、上方向が順方向、下方向が逆方向となる。
(2)経路選択は、経路選択モジュール1120によって行われる。経路選択モジュール1120は、順方向経路情報算出モジュール1110、逆方向経路情報算出モジュール1130と接続されており、順方向経路情報算出モジュール1110、逆方向経路情報算出モジュール1130が出力する順方向、逆方向の経路情報(経路情報1111、1131)を得る。さらに、得られた経路情報について、経路の収束を利用した経路の選択を行い、分離経路1199を出力する。
図11の例において、破線で示す情報(開始要求1102、経路要求1121、経路要求1122)は必ずしも存在しない処理を表す。具体的に、開始要求は、経路選択の往復回数、初期方向、初期始点を指定する情報である。また、経路要求は、順方向経路情報算出モジュール1110、逆方向経路情報算出モジュール1130が経路情報を算出するための経路の始点を指定する情報である。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
また、対象とする画像として、1行の横書きの複数文字の画像とした例を主に説明する。
<実施の形態の分類>
以降、実施の形態の例は、以下の項目によって分類している。
(1)往復回数
(2)経路情報の算出のタイミング
(3)絞り込む情報
(4)絞り込みの調節
つまり、表1の例に示すように分類している。
Figure 0005636691
(1)往復回数は、前述した、往復を行う回数による分類である。往復を行う回数に対して、分離経路の数は単調減少である。第1の実施の形態は、往復回数が1回(順方向、逆方向ともに1回)のものであり、他の実施の形態は、往復回数が複数の回数のものである。
(2)経路情報の算出のタイミングは、経路情報の算出について、予めすべての経路情報を算出するか(以下、予め一括して算出という)、又は、逐次必要な経路情報を算出する(以下、逐次算出という)か、による分類である。ワークメモリと、処理時間のトレードオフに関係する。第2の実施の形態、第3の実施の形態は、予め一括して算出するものであり、第4の実施の形態、第5の実施の形態は、逐次算出するものである。
(3)絞り込む情報は、最短経路の収束を利用した経路の絞り込みを行う際に、経路そのもの(始点、終点の位置の他にその中間にある経路上のピクセルの位置)を参照するか、又は、始点(若しくは、始点と終点のペア)を参照するか、による分類である。実装においては、ワークメモリ、処理時間の観から、主に後者が選択される。第2の実施の形態、第4の実施の形態は、経路そのものを参照するものであり、第3の実施の形態、第5の実施の形態は、始点を参照するものである。
(4)絞り込みの調節は、予め定められた往復回数による絞り込みの結果を分離経路とするか、又は、完全な収束の結果を分離経路とするか、による分類である。両者では、処理が異なる。また、予め一括して経路情報を算出する場合(第2の実施の形態、第3の実施の形態)において、完全な収束の結果を分離経路とする例を示す。なお、逐次算出によって、完全な収束の結果を得る実施の形態の例もあるが、これは、往復回数を無限大として、終了条件を付けるものであり、往復回数を指定するものと同等であるため、実施の形態を示さない。
<第1の実施の形態>
図12は、第1の実施の形態の構成例についての概念的なモジュール構成図である。第1の実施の形態の例は、1回の往復により、経路を絞り込むものであり、順方向経路算出モジュール1210、逆方向経路終点算出モジュール1220を有しており、順方向経路算出モジュール1210と逆方向経路終点算出モジュール1220は、接続されている。
第1の実施の形態は、以下の処理を行う。
<<step1.>>
逆方向経路算出モジュール1220は、画像1201と初期始点1202を受け付け、画像1201を解析することによって、初期始点1202に対応する最短経路の終点1221を算出し、順方向経路算出モジュール1210へ出力する。
<<step2.>>
順方向経路算出モジュール1210は、画像1201を解析することによって、受け取った終点1221を始点として、その始点に対応する分離経路1299を算出し、出力し、終了する。
なお、順方向経路算出モジュール1210は、図11の例に示した経路選択モジュール1120の役割も有していることになる。
<第2の実施の形態>
第2の実施の形態以降は、複数回の往復により、経路を絞り込む構成である。
図13は、第2の実施の形態の構成例についての概念的なモジュール構成図である。第2の実施の形態の例は、予め一括して経路情報を算出し、これを絞り込むものであり、順方向経路算出モジュール1310、経路選択モジュール1320、逆方向経路始点終点表算出モジュール1330を有している。特に、予め一括してすべての経路情報を算出し、これを絞り込む場合について説明する。なお、すべての経路とは、対象とする画像の上端又は下端のすべてのピクセルを始点とする場合のすべての経路である。
また、第2の実施の形態、第3の実施の形態は、始めの1回のみ経路情報を算出するため、処理時間の削減を図る場合に用いられるものである。
第2の実施の形態は、以下の処理を行う。
<<step1.>>
逆方向経路始点終点表算出モジュール1330は、経路選択モジュール1320と接続されており、画像1301を解析することによって、始点終点表1331を算出し、経路選択モジュール1320へ出力する。
そして、順方向経路算出モジュール1310は、経路選択モジュール1320と接続されており、画像1301を解析することによって、すべての始点の経路1311を算出し、経路選択モジュール1320へ出力する。
<<step2.>>
経路選択モジュール1320は、順方向経路算出モジュール1310、逆方向経路始点終点表算出モジュール1330と接続されており、順方向の経路1311と逆方向の始点終点表1331に基づいて、経路を絞り込み、分離経路1399として出力し、終了する。
なお、始点終点表については後述する。
<第3の実施の形態>
図14は、第3の実施の形態の構成例についての概念的なモジュール構成図である。第3の実施の形態の例は、始点終点表と経路作成情報のみを算出し、始点を絞り込んだのち、経路を算出するものであり、順方向経路始点終点表算出モジュール1410、始点選択モジュール1420、逆方向経路始点終点表算出モジュール1430、順方向経路作成モジュール1440を有している。
第3の実施の形態は、以下の処理を行う。
<<step1.>>
逆方向経路始点終点表算出モジュール1430は、始点選択モジュール1420と接続されており、画像1401を解析することによって、始点終点表1431を算出し、始点選択モジュール1420へ出力する。
そして、順方向経路始点終点表算出モジュール1410は、始点選択モジュール1420、順方向経路作成モジュール1440と接続されており、画像1401を解析することによって、始点終点表1411を算出し、始点選択モジュール1420へ出力する。さらに、経路作成情報1412を算出し、順方向経路作成モジュール1440へ出力する。
<<step2.>>
始点選択モジュール1420は、順方向経路始点終点表算出モジュール1410、逆方向経路始点終点表算出モジュール1430、順方向経路作成モジュール1440と接続されており、順方向の経路の始点終点表1411と、逆方向の経路の始点終点表1431に基づいて、経路の始点1421の絞り込みを行い、順方向経路作成モジュール1440へ出力する。
<<step3.>>
順方向経路作成モジュール1440は、順方向経路始点終点表算出モジュール1410、始点選択モジュール1420と接続されており、順方向経路始点終点表算出モジュール1410から受け取った経路作成情報1412に基づいて、始点選択モジュール1420から受け取った始点1421の経路を作成し、分離経路1499として出力する。
ここで、始点終点表について説明する。
始点終点表とは、経路の始点と終点のペアを保持した情報である。第2の実施の形態(図13)、第3の実施の形態(図14)における経路の絞り込み処理においては、経路の始点と終点のペアの情報を利用する。以下、この処理を説明する。
いま、順方向の始点終点表を数1とする。
Figure 0005636691
また、逆方向の始点終点表をT’とする。数2は、位置xを始点とする経路の終点位置を表す。
Figure 0005636691
始点終点表は、すべての始点の経路の始点と終点のペアの配列であり、wは対象とする画像の横幅(文字列方向の幅)である。
なお、第2の実施の形態(図13)の経路選択モジュール1320は、受け取った経路1311からTを算出し、以下同様の処理を行うものとする。
ある経路を数3とする。
Figure 0005636691
高さyにおける経路の位置を数4とする。
Figure 0005636691
例えば、上方向の経路の始点は数5であり、終点は数6である。
Figure 0005636691
Figure 0005636691
なお、hは対象とする画像の縦幅(文字列方向と垂直な方向の幅)である。順方向が上方向のとき、経路選択モジュール1320が受け付けた経路1311のセットを数7として、すべての数8について、数9とすることで、受け付けた経路からTを算出する。また、順方向が下方向であれば、数10とする。
Figure 0005636691
Figure 0005636691
Figure 0005636691
Figure 0005636691
また、出力する経路の方向である順方向と、往復回数によって、初めに参照する始点終点表の方向(初期方向とする)が定まる。具体的には、往復回数が奇数であれば、初期方向は逆方向であり、往復回数が偶数であれば、初期方向は順方向である。
経路の絞り込み処理は、往復回数を指定する経路の絞り込みと、完全な収束による経路の絞り込みで、処理が異なる。以下、それぞれについて説明する。
まず、往復回数を指定する経路(始点)の絞り込み処理は、数11に従う。
Figure 0005636691
次に、完全な収束による経路(始点)の絞り込み処理は、数12に従う。
Figure 0005636691
以上のようにして、始点のセットSを得る。なお、第2の実施の形態(図13)の経路選択モジュール1320は、数12の処理の後に、数13としてP’を出力する。
Figure 0005636691
なお、順方向が上方向であればy=0であり、下方向であればy=h−1である。
数12内の3行目の式は、ある方向の始点(A)に対する終点(B)を、逆方向の始点(B)とした場合に、その結果である経路の終点が(A)となることを示している。
<第4の実施の形態>
複数回の往復により、経路を絞り込む構成のうち、逐次、必要な経路情報を算出する構成を第4の実施の形態(図15)、第5の実施の形態(図16)に示す。第4の実施の形態は逐次経路を算出する構成であり、第5の実施の形態は逐次始点を算出し、最後に経路を算出する構成である。
第4の実施の形態、第5の実施の形態に示す構成は、逐次、必要な経路情報を算出するため、ワークメモリの削減を図る場合に用いられるものである。
第4の実施の形態は、順方向経路算出モジュール1510、逐次経路選択モジュール1520、逆方向経路終点算出モジュール1530を有している。
なお、開始要求(図15の例に示す1502、図16の例に示す1602)とは、初期の始点のセットである。
第4の実施の形態は、以下の処理を行う。
<<step1.>>
往復回数をRとする。
逐次経路選択モジュール1520は、順方向経路算出モジュール1510、逆方向経路終点算出モジュール1530と接続されており、以下の処理を行う。
Rが偶数ならば、順方向経路算出モジュール1510に始点1521を出力し、step2.へ進む。
そうでなければ、R←R−1として、逆方向経路終点算出モジュール1530に始点1522を出力し、step4.へ進む。
<<step2.>>
順方向経路算出モジュール1510は、逐次経路選択モジュール1520と接続されており、画像1501を解析することによって、受け付けたすべての始点1521の経路1511を算出し、逐次経路選択モジュール1520へ出力する。
<<step3.>>
逐次経路選択モジュール1520は、R=0であれば、受け付けた経路1511を分離経路1599として出力し、終了する。
そうでなければ、R←R−2として、受け付けた経路1511の始点を終点として、逆方向経路終点算出モジュール1530に始点1522を出力する。
<<step4.>>
逆方向経路終点算出モジュール1530は、逐次経路選択モジュール1520と接続されており、画像1501を解析することによって、受け付けたすべての始点1522の経路の終点1531を算出し、逐次経路選択モジュール1520へ出力する。
<<step5.>>
逐次経路選択モジュール1520は、受け付けた終点1531を始点として、順方向経路算出モジュール1510に出力し、step2.へ進む。
<第5の実施の形態>
図16は、第5の実施の形態の構成例についての概念的なモジュール構成図である。第5の実施の形態は、順方向経路終点算出モジュール1610、逐次始点選択モジュール1620、逆方向経路終点算出モジュール1630、順方向経路算出モジュール1640を有している。
第5の実施の形態は、以下の処理を行う。
<<step1.>>
往復回数をRとする。
逐次始点選択モジュール1620は順方向経路終点算出モジュール1610、逆方向経路終点算出モジュール1630、順方向経路算出モジュール1640と接続されており、以下の処理を行う。
Rが偶数ならば、順方向経路終点算出モジュール1610に始点1621を出力し、step2.へ進む。
そうでなければ、R←R−1として、逆方向経路終点算出モジュール1630に始点1622を出力し、step4.へ進む。
<<step2.>>
順方向経路終点算出モジュール1610は、逐次始点選択モジュール1620と接続されており、画像1601を解析することによって、受け付けたすべての始点1621の経路の終点1611を算出し、逐次始点選択モジュール1620へ出力する。
<<step3.>>
逐次始点選択モジュール1620は、R=0であれば、受け付けた終点1611を始点1623として順方向経路算出モジュール1640へ出力し、step6.へ進む。
そうでなければ、R←R−2として、受け付けた経路の終点1611を始点として、逆方向経路終点算出モジュール1630に始点1622を出力する。
<<step4.>>
逆方向経路終点算出モジュール1630は、逐次始点選択モジュール1620と接続されており、画像1601を解析することによって、受け付けたすべての始点1622の経路の終点1631を算出し、逐次始点選択モジュール1620へ出力する。
<<step5.>>
逐次始点選択モジュール1620は、受け付けた終点1631を始点1621として、順方向経路終点算出モジュール1610に出力し、step2.へ進む。
<<step6.>>
順方向経路算出モジュール1640は、逐次始点選択モジュール1620と接続されており、受け付けたすべての始点1623の経路を作成し、分離経路1699として出力し、終了する。
<部分画像を出力する実施の形態>
前述の実施の形態により算出した分離経路により、画像分離を行う構成を図17、図18、図19、図20の例に示す。これらの構成は、文字列画像から単文字どうしを分離し、単文字画像として出力しようとする構成である。図17、図18、図19、図20において、経路抽出モジュールとは、第1の実施の形態(図12)、第2の実施の形態(図13)、第3の実施の形態(図14)、第4の実施の形態(図15)、第5の実施の形態(図16)の構成である。そして、この出力した単文字画像を、例えば文字画像認識装置等によって処理させる。
図17は、経路抽出モジュール1720を組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。この実施の形態は、分離経路によって、画像を分離し、部分画像を出力するものであり、画像分離モジュール1710、経路抽出モジュール1720を有している。
画像分離モジュール1710は、経路抽出モジュール1720と接続されており、文字列画像である画像1701を受け付け、その画像1701を経路抽出モジュール1720から受け取った分離経路1721に従って、単文字画像の領域に分離して、部分画像1799として出力する。
図18は、経路抽出モジュール1830を組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。この実施の形態は、画像分離モジュール1810、画像分離モジュール1820、経路抽出モジュール1830を有している。
画像分離モジュール1810は、画像分離モジュール1820、経路抽出モジュール1830と接続されており、経路抽出モジュール1830の前処理として、分離候補領域抽出を行うものである。例えば、画像1801から文字画像だけを部分画像1811として取り出すものである。また、投影情報等を利用する従来技術で分離可能な単文字画像の分離を行い、分離できなかったもの(部分画像1811)を経路抽出モジュール1830に渡す。
画像分離モジュール1820は、画像分離モジュール1810、経路抽出モジュール1830と接続されており、画像分離モジュール1810から受け取った部分画像1811を経路抽出モジュール1830から受け取った分離経路1831に従って、単文字画像の領域に分離して、部分画像1899として出力する。なお、画像分離モジュール1810も単文字画像を分離する場合は、画像分離モジュール1810から画像分離モジュール1820へ渡す部分画像1811には、画像分離モジュール1810が分離した領域の単文字画像(経路抽出モジュール1830による処理の対象外の画像)も含まれ、それはそのまま部分画像1899として出力する。
図19は、経路抽出モジュール1930を組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。この実施の形態は、画像分離モジュール1910、経路判定モジュール1920、経路抽出モジュール1930を有している。
経路判定モジュール1920は、画像分離モジュール1910、経路抽出モジュール1930と接続されており、経路抽出モジュール1930の出力する分離経路1931について、その経路によって正しい分離ができるか否かを判別する処理を行う。複数の分離経路間の出現間隔が他の分離経路間の出現間隔と比べて狭い場合(例えば、漢字構成としての偏、旁等)など、意味のない分離経路を棄却するものである。その判別の際に、画像1901を利用してもよい。
画像分離モジュール1910は、経路判定モジュール1920と接続されており、画像1901を経路判定モジュール1920から受け取った分離経路1921に従って、単文字画像の領域に分離して、部分画像1999として出力する。
図20は、経路抽出モジュール2040を組み込んだ画像処理装置の構成例についての概念的なモジュール構成図である。この実施の形態は、画像分離モジュール2010、画像分離モジュール2020、経路判定モジュール2030、経路抽出モジュール2040を有している。これは、図18、図19の両者の例を組み合わせた構成である。
画像分離モジュール2010は、画像分離モジュール2020、経路判定モジュール2030、経路抽出モジュール2040と接続されており、図18の例に示した画像分離モジュール1810と同等の処理を行う。
経路判定モジュール2030は、画像分離モジュール2010、画像分離モジュール2020、経路抽出モジュール2040と接続されており、図19の例に示した経路判定モジュール1920と同等の処理を行う。
画像分離モジュール2020は、画像分離モジュール2010、経路判定モジュール2030と接続されており、図19の例に示した画像分離モジュール1910と同等の処理を行う。ただし、対象とする画像は画像分離モジュール2010から受け取った部分画像2011である。
前述の実施の形態内で経路を算出する処理(例えば、第1の実施の形態(図12)内の順方向経路算出モジュール1210、逆方向経路終点算出モジュール1220等が行う処理)について、具体的に示した実施例を以下に説明する。
図1の例に示す最短経路について、図21の例に示す最短経路を用いて、始点の異なる複数の最短経路情報を同時に算出する実施例を示す。なお、最短経路の算出法は、Dijkstra法など、いくつか選択肢がある。
図21の例に示す最短経路について説明する。
あるピクセルを親として、終点方向(図21では上方向)に隣り合うピクセル、及び、終点方向とは斜め45度に存在するピクセルの3つのピクセルを子とする木構造を対象とする。この構造を繰り返し、図21の例に示すように、画像2100の端部のあるピクセル(始点2111)を根として、もう片方の端部(終点2121等)を葉として、画像高さが木の高さとなるような木を抽出する。
本実施の形態における最短経路とは、前述の木について、根から葉へ向かうすべての経路のうち経路上のピクセル(すなわち、節)の輝度値の累積値であるコストが最小又は最大である経路をさす。根が始点であり、また、葉が終点である。
まず、基本的な最短経路の算出処理例を数14のアルゴリズムに示す。また、参考のため、図22の例に処理対象の位置関係を示す。
この実施例は後方帰納的な処理であり、図21の例に示す木の最短経路の探索法である。ただし、経路のコストは辺でなく節にある。<step2.画像解析>と、<step3.経路作成>とは、画像上の位置について処理を行う順序が逆であることに注意が必要である。この処理は、上方向の最短経路を算出する処理であるが、下方向はもちろんのこと、あらゆる方向に適用できることは明らかである。
なお、本処理は、「順方向経路算出」に相当する。また、step3.以降が、「順方向経路作成」に相当する。
Figure 0005636691
また、経路の終点のみを出力する場合、p(h−1)を参照してもよいが、ワークメモリを省略するために、step3.以降を数15のアルゴリズムのようにしてもよい。なお、本処理は、「順方向経路終点算出」、「逆方向経路終点算出」に相当する。
Figure 0005636691
また、経路の始点終点表を算出する場合も、同様に数16のアルゴリズムのようにしてもよい。なお、本処理は、「順方向経路始点終点表算出」、「逆方向経路始点終点表算出」に相当する。
Figure 0005636691
ただし、各符号等の意味は、数17に示す通りである。
Figure 0005636691
また、前述の処理において、数18、数19の保持の方法に注意が必要である。
Figure 0005636691
Figure 0005636691
すなわち、数18、数19が保持する数値の個数は、画像サイズよりも小さな個数でよい。
具体的には、数18は経路のコストに関する情報であり、ラインバッファである。処理においては、直前のラインのみ参照できればよく、数18の保持部は2つのラインバッファでよい。また、数19は経路の移動に関する情報であるが、処理において、経路が存在しない領域が逐次判明する。この領域分、保持する領域を逐次削減してもよい。
さらに、始点が指定された場合、図23の例に示すように、前述の木構造を構成することから、最短経路を算出するために必要な情報は、画像サイズよりも小さいことがあり、数18、数19を保持する領域をさらに削減してもよい。なお、図23の例は、画像2300において、始点2311、始点2312とした場合、色付のピクセルは、解析において参照する必要があるピクセルであり、白色のピクセルは、解析において必ずしも参照する必要がないピクセルであることを示している。
<実験結果>
前述の実施の形態による実験結果を図24、図25、図26を用いて説明する。
図24は、対象とする画像(「Character」の文字画像)の例を示す説明図である。図25は、本実施の形態が対象とする画像を分離した例を示す説明図である。図26は、対象とする画像の投影情報の例を示す説明図である。
これらについて、次の3つの観点から説明する。
(1)投影情報では分離できない文字画像間の間隙である領域であっても分離している。
対象画像内の“ter”の文字画像部分(図24の例参照)については、図26の例に示すように投影情報2600では分離困難な文字画像間の間隙である。つまり、従来技術で投影情報を利用して分離しようとしても、図26の例に示すように投影情報2600には明確な谷がないため分離することは困難である。
このような画像に対して、本実施の形態は、図25の例に示すように文字画像の周囲を通るような形状の分離経路を算出している。
(2)連結成分を分離している。
対象画像内の“har”、“act”及び“er”の文字画像部分(図24の例参照)について、隣り合う文字画像と連結している部分がある。
図25の例に示すように、本実施の形態により、連結する文字画像をも分離している。前述したように最短経路による画像分離の仕組みにより、最短経路が移動可能な範囲内でコスト最小又はコスト最大の分離経路を算出しているからである。
(3)多値画像に対応している。
図24の例に示す画像2400は多値画像である。前述の実施の形態による処理は、2値画像を含む、多値画像に対応するものである。これにより、例えば、2値化に伴う、受け付けた画像毎の閾値設定を行う必要がなくなる。
図27を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図27に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2717と、プリンタなどのデータ出力部2718を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)2701は、前述の実施の形態において説明した各種のモジュール、すなわち、順方向経路情報算出モジュール1110、経路選択モジュール1120、逆方向経路情報算出モジュール1130、画像分離モジュール1710等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)2702は、CPU2701が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2703は、CPU2701の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2704により相互に接続されている。
ホストバス2704は、ブリッジ2705を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2706に接続されている。
キーボード2708、マウス等のポインティングデバイス2709は、操作者により操作される入力デバイスである。ディスプレイ2710は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)2711は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2701によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象とする画像、経路情報などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ2712は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2713に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2707、外部バス2706、ブリッジ2705、及びホストバス2704を介して接続されているRAM2703に供給する。リムーバブル記録媒体2713も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート2714は、外部接続機器2715を接続するポートであり、USB、IEEE1394等の接続部をもつ。接続ポート2714は、インタフェース2707、及び外部バス2706、ブリッジ2705、ホストバス2704等を介してCPU2701等に接続されている。通信部2716は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2717は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2718は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図27に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図27に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図27に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前述の実施の形態においては、対象とする画像として、1行の横書きの複数文字の画像とした例を用いて説明したが、もちろん縦書きの文字画像であってもよい。その場合、上方向、下方向とあるのは、右方向、左方向となる。また、文字画像の領域を分離する以外に、その他のオブジェクトの画像(例えば、写真内の人物画像、顔画像等)の領域を分離するのに用いてもよい。
前述の実施の形態においては、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。
なお、前述の各種の実施の形態を組み合わせてもよく(例えば、ある実施の形態内のモジュールを他の実施の形態内に適用する、入れ替えする等も含む)、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
1110…順方向経路情報算出モジュール
1120…経路選択モジュール
1130…逆方向経路情報算出モジュール
1210…順方向経路算出モジュール
1220…逆方向経路終点算出モジュール
1310…順方向経路算出モジュール
1320…経路選択モジュール
1330…逆方向経路始点終点表算出モジュール
1410…順方向経路始点終点表算出モジュール
1420…始点選択モジュール
1430…逆方向経路始点終点表算出モジュール
1440…順方向経路作成モジュール
1510…順方向経路算出モジュール
1520…逐次経路選択モジュール
1530…逆方向経路終点算出モジュール
1610…順方向経路終点算出モジュール
1620…逐次始点選択モジュール
1630…逆方向経路終点算出モジュール
1640…順方向経路算出モジュール
1710…画像分離モジュール
1720…経路抽出モジュール
1810…画像分離モジュール
1820…画像分離モジュール
1830…経路抽出モジュール
1910…画像分離モジュール
1920…経路判定モジュール
1930…経路抽出モジュール
2010…画像分離モジュール
2020…画像分離モジュール
2030…経路判定モジュール
2040…経路抽出モジュール

Claims (5)

  1. 画像内から領域を分離するための第1の経路を示す情報である第1の経路情報を算出する第1の経路情報算出手段と、
    前記第1の経路とは逆方向の経路であって、前記画像内から前記領域を分離するための第2の経路を示す情報である第2の経路情報を算出する第2の経路情報算出手段と、
    前記第1の経路情報算出手段によって算出された第1の経路情報、前記第2の経路情報算出手段によって算出された第2の経路情報のいずれかを選択する経路選択手段
    を具備し、
    前記第1の経路情報と前記第2の経路情報は、経路の始点と終点の組を保持した始点終点表であって、
    前記経路選択手段は、前記始点終点表を用いて始点と終点の組を選択し、該選択した始点と終点の組から、前記画像内から領域を分離する経路を生成する
    ことを特徴とする画像処理装置。
  2. 前記第1の経路及び前記第2の経路は、該経路上の画素の輝度値の累積値が予め定めた条件を満たす場合の経路である
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第2の経路情報算出手段は、前記第1の経路情報算出手段によって算出された第1の経路情報に基づいて、前記第2の経路情報を算出し、
    前記第1の経路情報算出手段は、2回目以降の処理においては、前記第2の経路情報算出手段によって算出された第2の経路情報に基づいて、前記第1の経路情報を算出する
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記第1の経路情報算出手段による処理と前記第2の経路情報算出手段による処理は、該処理が予め定められた回数行われること、又は、前記第1の経路情報算出手段によって算出された第1の経路情報と前記第2の経路情報算出手段によって算出された第2の経路情報が合致すること、を終了の条件とする
    ことを特徴とする請求項3に記載の画像処理装置。
  5. コンピュータを、
    画像内から領域を分離するための第1の経路を示す情報である第1の経路情報を算出する第1の経路情報算出手段と、
    前記第1の経路とは逆方向の経路であって、前記画像内から前記領域を分離するための第2の経路を示す情報である第2の経路情報を算出する第2の経路情報算出手段と、
    前記第1の経路情報算出手段によって算出された第1の経路情報、前記第2の経路情報算出手段によって算出された第2の経路情報のいずれかを選択する経路選択手段
    として機能させ
    前記第1の経路情報と前記第2の経路情報は、経路の始点と終点の組を保持した始点終点表であって、
    前記経路選択手段は、前記始点終点表を用いて始点と終点の組を選択し、該選択した始点と終点の組から、前記画像内から領域を分離する経路を生成する
    ことを特徴とする画像処理プログラム。
JP2010041912A 2010-02-26 2010-02-26 画像処理装置及び画像処理プログラム Active JP5636691B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010041912A JP5636691B2 (ja) 2010-02-26 2010-02-26 画像処理装置及び画像処理プログラム
US12/878,110 US8923635B2 (en) 2010-02-26 2010-09-09 Image processing apparatus and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010041912A JP5636691B2 (ja) 2010-02-26 2010-02-26 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2011180666A JP2011180666A (ja) 2011-09-15
JP5636691B2 true JP5636691B2 (ja) 2014-12-10

Family

ID=44505294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010041912A Active JP5636691B2 (ja) 2010-02-26 2010-02-26 画像処理装置及び画像処理プログラム

Country Status (2)

Country Link
US (1) US8923635B2 (ja)
JP (1) JP5636691B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052524B (zh) * 2017-11-07 2020-05-22 清华大学 面向电镜数据存储***的文件元数据获取方法与***

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3732401A (en) * 1971-12-07 1973-05-08 Ncr Code reading apparatus
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
JP2872768B2 (ja) * 1990-07-10 1999-03-24 沖電気工業株式会社 文字切出し装置
JP2963508B2 (ja) 1990-08-20 1999-10-18 沖電気工業株式会社 文字切出し装置
JPH05114047A (ja) 1991-10-23 1993-05-07 Oki Electric Ind Co Ltd 文字切り出し装置
JPH068481A (ja) 1992-06-29 1994-01-18 Kyocera Corp 記録装置
AU681421B2 (en) * 1993-09-14 1997-08-28 Symbol Technologies, Inc. Bar code scan stitching
US5677776A (en) * 1994-09-29 1997-10-14 Minolta Co., Ltd. Image reader for processing an image of a document
US5696284A (en) 1995-06-21 1997-12-09 Bp Chemicals Limited Process for the carbonylation of alkyl alcohols and/or reactive derivatives thereof
JPH0954814A (ja) 1995-08-04 1997-02-25 At & T Corp 入力記号表現の分析及び入力記号表現の可能解釈のスコアリングシステム
JPH09204531A (ja) * 1996-01-24 1997-08-05 Matsushita Electric Ind Co Ltd 輪郭抽出装置
US6000614A (en) * 1996-12-20 1999-12-14 Denso Corporation Two-dimensional code reading apparatus
JP4053188B2 (ja) 1999-07-06 2008-02-27 富士通株式会社 パターン切り出し装置及びパターン認識装置
US6628837B1 (en) * 2000-05-19 2003-09-30 Xerox Corporation Assist channel coding with convolution coding
JP3542971B2 (ja) * 2001-03-02 2004-07-14 Necインフロンティア株式会社 バーコード読み取り方法及びバーコード読み取り装置並びにプログラム
JP2004107998A (ja) 2002-09-18 2004-04-08 Yamaki:Kk 治水用石詰め木枠構造体及びその設置工法
JP2004187998A (ja) * 2002-12-12 2004-07-08 Fuji Photo Film Co Ltd 異常陰影形状抽出装置
US8036465B2 (en) * 2003-09-26 2011-10-11 Khomo Malome T Method of text interaction using chirographic techniques
JP3892838B2 (ja) * 2003-10-16 2007-03-14 ファナック株式会社 3次元測定装置
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
JP4277768B2 (ja) * 2004-05-14 2009-06-10 セイコーエプソン株式会社 写真イメージ領域抽出装置およびコピー装置
JP2006155126A (ja) * 2004-11-29 2006-06-15 Mitsubishi Heavy Ind Ltd 車両番号認識装置
KR101517360B1 (ko) * 2008-12-05 2015-05-04 삼성전자주식회사 픽셀의 휘도 정보에 기초한 영상 향상 장치 및 방법
JP2011201294A (ja) * 2010-03-01 2011-10-13 Ricoh Co Ltd 連続紙用画像形成装置の制御装置、連続紙用画像形成装置、制御方法及び制御プログラム
JP5577824B2 (ja) * 2010-04-27 2014-08-27 ブラザー工業株式会社 画像形成装置
JP5672828B2 (ja) * 2010-08-03 2015-02-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5577948B2 (ja) * 2010-08-24 2014-08-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
US8923635B2 (en) 2014-12-30
JP2011180666A (ja) 2011-09-15
US20110211769A1 (en) 2011-09-01

Similar Documents

Publication Publication Date Title
JP6972756B2 (ja) 制御プログラム、制御方法、及び情報処理装置
JP6972757B2 (ja) 制御プログラム、制御方法、及び情報処理装置
JP5699570B2 (ja) 画像処理装置及び画像処理プログラム
KR101685472B1 (ko) 정보 처리 장치, 정보 처리 방법, 및 기억 매체
JP2008269471A (ja) 類似画像判定装置と類似画像判定方法およびプログラムと記録媒体
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
CN102870399A (zh) 在ocr过程中将词语位图分割为单个字符或字形
KR102655789B1 (ko) 얼굴 검출 방법 및 장치
JP5672828B2 (ja) 画像処理装置及び画像処理プログラム
JP5942361B2 (ja) 画像処理装置及び画像処理プログラム
JP5577948B2 (ja) 画像処理装置及び画像処理プログラム
JP5636691B2 (ja) 画像処理装置及び画像処理プログラム
JP6303671B2 (ja) 画像処理装置及び画像処理プログラム
JP4882929B2 (ja) 画像処理装置及び画像処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
JP5039449B2 (ja) 画像処理装置及び画像処理プログラム
JP6229254B2 (ja) 情報処理装置及び情報処理プログラム
JP5935324B2 (ja) 情報処理装置及び情報処理プログラム
JP6423206B2 (ja) 画像判定装置及びそのプログラム
JP5991076B2 (ja) 画像処理装置及び画像処理プログラム
JP2016053797A (ja) 画像処理装置及び画像処理プログラム
JP6281309B2 (ja) 画像処理装置及び画像処理プログラム
JP2013149014A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141007

R150 Certificate of patent or registration of utility model

Ref document number: 5636691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350