JP5357612B2 - 下線除去装置 - Google Patents

下線除去装置 Download PDF

Info

Publication number
JP5357612B2
JP5357612B2 JP2009096965A JP2009096965A JP5357612B2 JP 5357612 B2 JP5357612 B2 JP 5357612B2 JP 2009096965 A JP2009096965 A JP 2009096965A JP 2009096965 A JP2009096965 A JP 2009096965A JP 5357612 B2 JP5357612 B2 JP 5357612B2
Authority
JP
Japan
Prior art keywords
underline
pixels
processing unit
line template
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009096965A
Other languages
English (en)
Other versions
JP2010250425A (ja
Inventor
光晴 大峡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2009096965A priority Critical patent/JP5357612B2/ja
Priority to US12/659,293 priority patent/US8452133B2/en
Priority to EP10155446.7A priority patent/EP2241999B1/en
Priority to CN201010136232.1A priority patent/CN101859379B/zh
Publication of JP2010250425A publication Critical patent/JP2010250425A/ja
Application granted granted Critical
Publication of JP5357612B2 publication Critical patent/JP5357612B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

本発明は、業務文書処理装置に関し、例えば、業務文書中の文字列に接触した下線を除去するための技術に関するものである。
近年、組織内に蓄積された膨大な紙の業務文書に対して、スキャン及びOCRによる文字認識を行い、文書データを文書管理システムで管理することで、検索性向上、紙文書の安全な保管、知識の共有を図ろうとする動きがある。
現状のOCRは、ノイズのない文書に対する文字列の認識精度は高いが、下線が文字列と接触するように引かれている場合、その部分の文字を正しく認識できないことが多いという問題がある。OCRは、文字の認識をする際に、文字一つ一つを切り出して、切り出した文字がどの文字に相当するかを判定する処理を行っているが、文字に下線が付着している場合、文字の切り出しが失敗したり、下線を文字の一部と認識して誤った判定を行うことが多い。誤認識すると、その部分の文字情報を取得できないだけでなく無意味な文字情報がノイズとして残ってしまい検索時の障害となってしまう。また、業務文書に存在する文字列の中で、下線が引かれている文字列は、文書のタイトル、取引先名、各種管理番号など、その文書を特定する上で不可欠な情報であることが多い。したがって、これらの情報を正しく認識できないと、検索時にその文書を絞り込むことができず、その場合、登録されている文書データをすべてチェックする負担が生じる。そのため、OCRを適用する際には、下線が文字列と接触した場合であってもその文字列を高精度で文字認識する必要がある。
文字列に下線が引かれている場合に、OCRの認識精度を向上させる手段として、文書中の下線が引かれている文字列から、下線を抽出・除去する手法が提案されている。例えば、非特許文献1では、帳票画像上に存在する文字列に引かれた下線を除去する技術を提案している。また、非特許文献2では、文字列と接触した下線も除去対象とする技術を提案している。
特開2002−358482号公報
嶋好博、他3名,"帳票画像からの下線抽出の一手法",FIT2002(科学技術フォーラム),I-85,pp.169-170,2002.09 Zhen-Long Bai, Qiang Huo, "Underline Detection and Removal in a Document Image Using Multiple Strategies", icpr,pp.578-581, 17th International Conference on Pattern Recognition (ICPR'04) - Volume 2, 2004
しかしながら、非特許文献1の技術は、文字列と下線が接触していない場合を想定している技術である。そのため、文字列と下線が接触している場合、下線を除去することができない。また、非特許文献2の技術は、文字と下線のみを含む文書を想定している。そのため、業務文書のような、表が含まれることが多い文書に適用した場合、表を構成する罫線が除去されてしまうという弊害が発生する可能性がある。
本発明はこのような状況に鑑みてなされたものであり、業務文書内に表が含まれていたり、文字列に下線が接触していたりした場合においても、下線を除去することが可能となる技術を提供するものである。
上記課題を解決するために、本発明による下線除去装置は、大きく分けて次の二つの処理を実行する。
第一の処理では、二値画像データから下線領域の下線位置座標を抽出する。この下線位置座標は、ある幅と長さを持つ下線領域に含まれる座標を所定の長さごとに抽出したものであり、下線領域の骨格を決定するものである。具体的には、二値画像データ上に一定面積を有する長方形状のラインテンプレートを設置し、ラインテンプレート内で所定値を満たす画素をトレースすることで、ラインテンプレートごとに下線位置座標を抽出する。
第二の処理では、下線領域と背景ならびに下線領域と文字列の境界座標を求めることで特定した下線領域を除去する。具体的には、抽出した下線位置座標を結んだポリラインに沿って、ポリラインに対して垂直方向に画素探索を行うことで、境界座標を求める。詳細には、所定画素数を満たす画素が所定範囲に存在しない場合は下線領域と背景との境界であると判定し、境界座標を求める。一方、所定画素数を満たす画素が所定範囲を超えて存在する場合は下線領域に文字列が接触していると判定し、境界座標を補間する。求めた境界座標により特定される下線領域を二値画像データから除去する。具体的には、求めた境界座標で囲まれた下線領域を背景画素で置き換える。
すなわち、本発明による下線除去装置は、文字列に接触した下線領域が含まれる二値画像データから前記下線領域を除去する下線除去装置であって、前記二値画像データ上の一点を始点として長方形状のラインテンプレートを設置し、該ラインテンプレートに含まれる画素をトレースすることで、下線位置座標を表すポリラインを抽出するラインテンプレートマッチング処理を行う、下線探索処理部と、前記ポリラインをもとに、前記下線領域と背景領域との背景境界座標と、前記下線領域のうち前記文字列と接触した部分について補間処理して得られた前記下線領域と前記文字列との文字境界座標と、を求める処理を行い、前記背景境界座標および文字境界座標によって囲まれる領域を前記背景領域の画素の色で置き換える処理を行う、下線除去処理部と、を備えることを特徴とする。
さらなる本発明の特徴は、以下本発明を実施するための最良の形態および添付図面によって明らかになるものである。
本発明によれば、文字列に接触した下線領域が含まれる二値画像データから当該下線を除去することが可能となる。これにより、文書内の文字に対するOCR精度が向上し、業務文書の検索性が向上する。
本発明の実施形態による業務文書処理装置の構成を概略的に示す機能ブロック図である。 図1に示す記憶装置内に記憶されているスキャン画像データの例を示す図である。 図1に示すデータメモリ内に記憶されている二値画像データの例を示す図である。 図3に示す二値画像データに対してOCRを適用した結果の例を示す図である。 図3に示す二値画像データに対して、本発明を適用した結果の例を示す図である。 下線除去プログラムにおける前処理部の説明をするためのフローチャートである。 下線除去プログラムにおける下線探索処理部を説明するためのフローチャートである。 下線探索処理部におけるラインテンプレートマッチング処理を説明するためのフローチャートである。 下線除去プログラムにおける下線除去処理部を説明するためのフローチャートである。 下線探索処理部における下線推定処理の説明図である。 下線探索処理部における下線推定処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部におけるラインテンプレートマッチング処理の説明図である。 下線探索処理部における探索開始点のスキップ処理の説明図である。 下線除去処理部における処理の説明図である。 下線除去処理の結果を示す確認画面の例を示す図である。
以下、添付図面を参照しながら、本発明の下線除去装置を実施するための最良の形態を詳細に説明する。図1〜図15は、本発明の実施形態を例示する図である。これらの図において、同一の符号を付した部分は同一物を表し、基本的な構成及び動作は同様であるものとする。尚、本実施形態は本発明を実現するための一例にすぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。
<下線除去装置の構成>
図1は、本発明の実施形態による下線除去装置の概略構成を示す機能ブロック図である。この下線除去装置は、必要な演算処理及び制御処理等を行う中央処理装置10と、中央処理装置10での処理に必要なデータを格納するデータメモリ20と、データの入出力を行うための入出力装置30と、中央処理装置10での処理に必要なプログラムを格納するプログラムメモリ40と、中央処理装置10での処理対象となるデータまたは処理後のデータを格納する記憶装置50と、を備えている。
データメモリ20は、スキャン画像データから二値化によって得られる二値画像データ21と、二値画像データから下線を探索し得られた下線位置を格納する下線位置データ22と、を備えている。
入出力装置30は、データを表示するための表示装置32やプリンタ(図示せず)等で構成される出力部と、表示されたデータに対してメニューを選択するなどの操作を行うためのキーボード31、マウスなどのポインティングデバイス33や文書を取り込むためのスキャナ34等で構成される入力部と、を備えている。
プログラムメモリ40は、画面表示やユーザの入力操作を受け付けるインターフェースである画面表示処理部41と、スキャン画像に対する前処理(カラーから白黒画像への変換、ノイズ除去など)を行う前処理部42と、文書内から下線を探索し、下線の位置を取得する下線探索処理部43と、抽出した下線を除去する下線除去処理部44と、を備えている。なお、各処理部は、プログラムコードとしてプログラムメモリ40に格納されており、中央処理装置10が各プログラムコードを実行することによって各処理部が実現される。
記憶装置50は、スキャナなどから取り込まれた業務文書のスキャン画像であるスキャン画像データ51と、そのスキャン画像をもとに各種処理を施し、文字列上の下線を除去した画像である下線除去画像データ52と、を備えている。
図2は、記憶装置50に含まれるスキャン画像データ51の例を示す図である。文書内に、文字と接触した下線、物件名・数量等が記載された表、表内に受領印等が含まれている。
図3は、データメモリ20に含まれる二値画像データ21の例を示す図である。これはスキャン画像データ51に対して、印影の除去、及び輝度の二値化を行った後に得られる画像データである。画像上部の点線で囲まれた領域に、下線が付された文字列が存在する。
図4は、図3の二値画像データ21に対して直接OCRを適用し、文字認識を行った結果を表す画像である。図3の二値画像データ21で画像上部の下線のない文字列や画像下部の表罫線及び表内部は、適切に認識されている。一方、図3の点線で囲まれた領域に存在する下線付の文字列は、誤認識されている。
図5は、図3の二値画像データ21に対して本願発明の下線除去装置を適用した結果、文字列と接触した下線が除去された下線除去画像データ52の例を示す図である。当画像データは記憶装置50に格納される。
<下線除去装置における処理>
次に、上述の構成を有する下線除去装置において行われる処理について説明する。まず、中央処理装置10は、画面表示処理部41により、スキャナ34によって入力されたスキャン画像データ51を表示する。次に処理実行の命令を受け付けると、前処理部42、下線探索処理部43、下線除去処理部44が順に実行される。前処理部42では、画像上に存在する印影などのノイズの除去や、二値画像への変換処理が行われる。その際に生成される二値画像は、二値画像データ21としてデータメモリ20に格納される。下線探索処理部43では、二値画像データ21上から文字列に対して付与された下線を探索し、下線の座標データを下線位置データ22としてデータメモリ20に格納する。下線除去処理部44では、下線位置データ22をもとに、二値画像データ21から下線を除去する。そして下線除去後の画像データを下線除去画像データ52として記憶装置50に格納する。それぞれの処理について、以下詳細に説明する。
<前処理>
図6は、前処理の概要を示すフローチャートである。前処理では、下線探索処理の前処理として、図2に示すようなスキャン画像に二値化処理を行う。ここでの動作主体は、前処理部42である。
ステップS601では、業務文書をスキャンし得られたスキャン画像データを読み込む。
ステップS602では、文書中に存在する社印や職印などの印影を除去するため、カラードロップアウト処理を行う。カラードロップアウト処理とは、帳票などの文書をスキャナなどで読み取った画像から、色情報の特徴を利用して、記入文字、印影、マークなどの特定対象を除去する技術である(例えば、特許文献1を参照。)。この技術により、文書内からOCRの読取の際にノイズとなる対象を除去することができる。
ステップS603では、二値化処理を行い、カラードロップアウト後の画像を白黒二値のデータに変換する。二値化の閾値決定の際には、種々の周知技術を適用可能である。例えば判別分析法は、ある値ftにて画像全体の輝度のヒストグラムを二つのクラス(級)に分けた場合、級間分散÷(クラス1の級内分散+クラス2の級内分散)の算出結果が最大になるときのftを閾値として決定する手法である。一般的な業務文書は、白色の背景に黒の文字で記述されているため二値化時の閾値を容易に決定することができる。二値化処理後に生成される画像データは二値画像データ21としてデータメモリ20に格納される。
<下線探索処理>
図7は、下線探索処理の概要を示すフローチャートである。下線探索処理では、図3に示すような二値画像データ21から、下線を探索し、下線の位置座標を出力する。ここでの動作主体は下線探索処理部43である。
ステップS701では、データメモリ20から二値画像データ21を読み取り、下線位置推定を行う。図10AおよびBは、下線位置推定処理の説明図である。
まず、対象とする文書に応じて、探索対象領域を決定する。探索対象領域とは、後述するラインテンプレートマッチング処理(ステップS702)において、処理の対象とする領域である。処理の対象を絞ることで、処理速度が向上する。例えば、営業証憑は、タイトル、顧客名、注文番号等、重要情報に下線が引かれていることが多く、また文書の上部に記載されていることが多い。そのため、図10Aに示す例では、文書の上部を探索対象領域としている。
次に、より詳細に下線位置を推定する。具体的には、図10Bに示すように、二値画像データ21上の探索対象領域内の各Y座標における黒画素(文字・罫線・下線を表す画素)の画素数を求め、画素数が閾値以上であるY座標上の領域を下線が存在する領域(詳細探索領域)と推定する。以降の処理では、詳細探索領域についてのみ、下線の位置を探索する。これにより処理の無駄を省くことができる。
ステップS702では、ラインテンプレートマッチング処理を行う。ここでは、二値画像データから下線領域の下線位置座標を抽出する。この下線位置座標は、ある幅と長さを持つ下線領域に含まれる座標を所定の長さごとに抽出したものであり、下線領域の骨格を決定するものである。具体的には、二値画像データ上に一定面積を有する長方形状のラインテンプレートを設置し、ラインテンプレート内で所定値を満たす画素をトレースすることで、ラインテンプレートごとに下線位置座標を表すポリラインを抽出する。これにより下線の位置座標が特定される。本処理の詳細については後述する(図8)。
ステップS703では、ラインテンプレートマッチング終了後、抽出したポリラインの長さをチェックする(図12G)。これは、抽出したポリラインが下線であるか否かを長さの観点から判定するためである。あらかじめ定めた閾値よりも短ければ、抽出したポリラインは下線ではなく、「土」や「上」などの文字の一部であると考えられる。その場合は、下線位置データから当該ポリラインを削除する。
ステップS704では、長さのチェック後、さらにポリラインが表の一部を構成する罫線であるか否かをチェックする(図12G)。これは、表の罫線を誤って除去することを防止するためである。表には、線分の両端あるいは一方に表を構成する縦に伸びた罫線が存在するが、文字に付いた下線はこのような縦線は存在しないため、この特徴を利用して表と下線を区別する。具体的には、ポリラインの両端点において、線分の方向に対して垂直方向の画素をチェックする。もし、表の一部を構成する罫線であれば、端点において縦方向に伸びる罫線が少なくとも1本は存在すると考えられる。よって、ポリラインの両端の垂直方向を一定画素チェックし、黒画素が一定以上存在する方向が少なくとも1つあれば、当該ポリラインは表を構成する罫線の一部であると判定し、下線位置データから当該ポリラインを削除する。
ステップS705では、長さチェック処理(ステップS703)、表チェック処理(ステップS704)のいずれの処理においても削除されずに残ったポリラインを最終的な下線位置データとして、データメモリ20に記録する。
(ラインテンプレートマッチング処理)
ステップS702で行われる、下線の位置座標を特定するためのラインテンプレートマッチング処理について説明する。図11〜図13は、ラインテンプレートマッチングの説明図である。また、図8は、下線探索処理におけるラインテンプレートマッチング処理のフローチャートである。以下、このフローチャートに従って詳細に説明する。
ステップS801では、ステップS701で決定した詳細探索領域において、探索開始点を設定する。具体的には、図11(a)のように、探索対象領域を格子状に区切り、その中で詳細探索領域内の格子点を探索開始点とする。この際、格子点は、X座標間隔は広くとり、Y座標間隔は狭くとる。これは、下線がX軸方向に伸びているためである。以下、各探索開始点を始点としてラインテンプレートマッチングを行う。
ステップS802では、探索開始点の中から選択した未処理の座標の一つを始点と設定する。以下、始点から下線を構成する黒画素をトレースし、下線位置を表すポリライン(連続した線分で構成されるオブジェクト)を求める。そしてこの一連の処理を各探索開始点について行う。
ステップS803では、まず、ステップS802で設定した始点からX軸の正又は負の方向にラインテンプレートを設置する。図11(b)はラインテンプレートを表している。ラインテンプレートはX軸方向に長い長方形状のオブジェクトである。次に、ラインテンプレート内の黒画素をトレースする。
ラインテンプレートの設置は、角度を変えながら行う。具体的には、探索開始点を回転中心とし、黒画素を最も多く含む方向を向くようにラインテンプレートを設置する。このように、角度を変えながらトレースすることにより、スキャン時に文書が傾いてしまった場合でも安定して下線部分をトレースすることが可能となる。
トレースは、ラインテンプレート内の黒画素が多いほどマッチ度が高いとみなし、最もマッチ度が高い方向へ行う。このように、ラインテンプレート内の黒画素数によってマッチ度を判定するため、下線に凹凸がある場合でもロバストに下線の位置を探索可能となる。
図12Bは、図12Aの下線付文字列に対してラインテンプレートマッチングを行っている様子を示している(説明のため便宜的に白抜きで示している)。図12Bでは、探索開始点からX軸の正の方向にラインテンプレートを設置している。また、ラインテンプレートの角度は、マッチ度が最も高い方向である右斜め上方向に設置されている。
ステップS804では、マッチ度が閾値以上となる方向が存在するか否かを判定する。つまり、下線領域が連続しているか否かを判定することと同義である。マッチ度が閾値以上となる方向が存在する場合は、ステップS805に進む。閾値以上の方向がない場合には、ステップS808に進む。なお、閾値はあらかじめ定めた定数である。図12Bのように、マッチ度が閾値以上となる右斜め上方向が存在している場合は、ステップS805へ進む。
ステップS805では、ステップS804の判定でマッチ度が閾値以上となる方向がある場合、つまり下線領域が連続している場合は、ラインテンプレートの終点を修正する必要があるか否かを判定する。終点を修正する必要がある場合とは、図12Cのように、下線領域が連続していながらも、ラインテンプレートが下線領域を通り越して背景領域にまで達してしまう場合である。
ステップS806では、ステップS805の判定で修正する必要がある場合は、最初のラインテンプレートの終点(暫定終点)から、下線領域と背景領域の境界に終点を修正する。この処理を行うことで、下線位置を表すポリラインが正しく抽出可能となる。図12Cでは、暫定終点となるラインテンプレートの最端部から、修正終点となる下線領域と背景領域の境界へ、ラインテンプレートの終点を修正している。一方、終点の位置を修正する必要がない場合は、終点の位置を変えずにステップS807に進む。
ステップS807では、終点の座標を新たな始点とし、探索時の始点を更新する。次に、再度ステップS803からのループを実行し、下線のトレースを継続する。トレースは、ステップS804でマッチ度が閾値以上となる方向がないと判定されるまで(下線の末端まで)継続する。図12Dでは、図12Cの修正終点を新たな始点としてラインテンプレートを再設置し、トレースを継続している。また、図12Eでは、マッチ度が閾値以上となる方向がなくなる下線領域の末端までトレースを継続している。
ステップS808では、ステップS804でマッチ度が閾値以上となる方向がないと判定された場合、つまり下線領域の末端までトレースが済んだ場合は、ステップS802で設定した探索開始点を始点としてX軸の正方向へのトレースと、負方向へのトレースの両方向を探索したか否かを判定する。
ステップS809では、ステップS808で片方向だけをトレースしていると判定された場合は、ステップS802で設定した始点から、ステップS803とは逆方向へトレースを行う。図12Fでは、探索開始点を始点としてラインテンプレートをX軸の負方向へ再設置し、負方向へトレースを継続している。
ステップS810では、ステップS808で両方向をトレース済と判定された場合は、抽出した下線位置を表すポリラインを構成する座標値を、下線位置データ22に記録する。
ステップS811では、新たな下線を抽出するための探索開始点を設定する前に、スキップする探索開始点(トレースする必要のない探索開始点)を設定する。図13は、この処理の説明図である。現時点の探索開始点Aから下線をトレースした結果、探索開始点B,C付近までトレースが完了している。図11(a)に示すように、探索開始点は、同じY座標上に、X軸方向に一定間隔を空けて存在するので、探索開始点Aから下線のトレースが終了した場合は、探索開始点B及びCから下線をトレースする必要は無い。このような場合には、現時点の探索開始点Aと同じY座標を持ち、トレースが重複する範囲に含まれる探索開始点を、スキップする探索開始点として設定する。これにより、処理の効率化と高速化を実現することができる。
ステップS812では、未処理の探索開始点があればステップS802に戻り、無ければラインテンプレートマッチング処理を終了する。
以上のラインテンプレートマッチング処理により、詳細探索領域内の各探索開始点に対して下線のトレースが行われた結果、抽出された下線位置を表すポリラインの座標がデータメモリ20へ記録される。
<下線除去処理>
図9は、下線除去処理の概要を示すフローチャートである。また、図14は、下線除去処理の説明図である。下線除去処理では、下線探索処理で抽出した下線位置データをもとに二値画像データから下線を除去する。ここでの動作主体は下線除去処理部44である。
ステップS901では、図14(a)に示すように、二値画像データにおいて、下線位置データにおけるポリライン上のY座標からY軸方向を探索し、下線(黒画素)と背景(白画素)との境界座標を求める。この際、一定以上黒画素がY軸方向に連続する場合には、その領域は文字との接触部分であると考えられるので、その部分のY座標は取得しない。この処理をポリライン上のすべてのX座標に対して行い、境界座標を取得する。
ステップS902では、下線と文字との接触部分において、下線と文字との境界座標を補間する処理を行う。具体的には、接触部分の両端点の座標の加重平均をとる。図14(b)はその説明図である。左側の端点をP(X,Y)、右側の端点をP(X,Y)、補間する点をP(X,Y)とした時、Yは式(1)で求められる。
={(X−X)Y+(X−X)Y}/(X−X) (1)
この処理により、文字と下線との接触部分を適切に分離可能となる。
ステップS903では、図14(c)に示すように、ステップS901、902で得られた境界座標により、各ポリラインの上下の下線境界が特定される。その下線境界に囲まれた領域を白画素で塗りつぶす。これにより、二値画像データから下線が除去される。
ステップS904では、図15に示すような確認画面を表示する。ユーザは、下線除去後の二値画像データ上で適切に下線が除去されているか否かを確認することができる。問題無ければ、確認画面で「はい」を押下することで了承を指示することができる。その際、下線除去後の二値画像データが下線除去画像データ52として記憶装置50に格納される。ユーザの了承が得られなかった場合は、確認画面で「いいえ」を押下することで処理をキャンセルすることができる。
<まとめ>
本発明の実施形態では、主として次の二つの処理に特徴を有する。1つは下線探索処理であり、もう一つは下線除去処理である。
下線探索処理では、二値画像データから下線領域の下線位置座標を抽出する。この下線位置座標は、ある幅と長さを持つ下線領域に含まれる座標を所定の長さごとに抽出したものであり、下線領域の骨格を決定するものである。具体的には、二値画像データ上に一定面積を有する長方形状のラインテンプレートを設置し、ラインテンプレート内で所定値を満たす画素をトレースすることで、ラインテンプレートごとに下線位置座標を抽出する。本処理で抽出した下線位置座標を結んだポリラインが下線領域の骨格となる。
本処理では、処理の効率化のため、予め二値画像データから下線領域を推定した詳細探索領域に絞って実行してもよい。また、抽出したポリラインが文字の一部でないか、表の一部でないかをチェックしてもよい。
下線除去処理では、下線領域と背景ならびに下線領域と文字列の境界座標を求めることで特定した下線領域を除去する。具体的には、ポリラインに沿って、ポリラインに対して垂直方向に画素探索を行うことで、境界座標を求める。詳細には、所定画素数を満たす画素が所定範囲に存在しない場合は下線領域と背景との境界であると判定し、境界座標を求める。一方、所定画素数を満たす画素が所定範囲を超えて存在する場合は下線領域に文字列が接触していると判定し、境界座標を補間する。求めた境界座標により特定される下線領域を二値画像データから除去する。具体的には、求めた境界座標で囲まれた下線領域を背景画素で置き換える。
以上の処理により、文字列に接触した下線領域が含まれる二値画像データから下線領域を除去することが可能である。また、スキャン時に文書が傾いてしまった場合や、下線に凹凸がある場合でも、下線領域を除去可能である。さらに、当該下線領域を、文字の一部や、表を構成する罫線と区別して、自動的に除去することができる。
その結果として、下線除去後の画像データに対してOCRで文字認識を施した場合に、高精度で文字を認識することが可能となる。
なお、本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
また、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
10・・・中央処理装置
20・・・データメモリ
21・・・二値画像データ
22・・・下線位置データ
30・・・入出力装置
31・・・キーボード
32・・・表示装置
33・・・ポインティングデバイス
34・・・スキャナ
40・・・下線除去処理プログラム
41・・・画面表示処理部
42・・・前処理部
43・・・下線探索処理部
44・・・下線除去処理部
50・・・記憶装置
51・・・スキャン画像データ
52・・・下線除去画像データ

Claims (8)

  1. 文字列に接触した下線領域が含まれる二値画像データから前記下線領域を除去する下線除去装置であって、
    前記二値画像データ上の一点を始点として長方形状のラインテンプレートを設置し、該ラインテンプレートに含まれる画素をトレースすることで、下線位置座標を表すポリラインを抽出するラインテンプレートマッチング処理を行う、下線探索処理部と、
    前記ポリラインをもとに、前記下線領域と背景領域との背景境界座標と、前記下線領域のうち前記文字列と接触した部分について補間処理して得られた前記下線領域と前記文字列との文字境界座標と、を求める処理を行い、前記背景境界座標および文字境界座標によって囲まれる領域を前記二値画像データから除去する処理を行う、下線除去処理部と、を備え
    前記下線探索処理部は、前記始点を回転中心として前記ラインテンプレートを回転させて角度を変えながらトレースすることにより、前記ラインテンプレートマッチング処理を行うことを特徴とする下線除去装置。
  2. 前記下線探索処理部は、前記始点に合わせられた前記ラインテンプレートの端部とは別のもう一方の端部をトレースの暫定終点とするとき、当該暫定終点の位置を修正する必要があるか否か判断しながら正規終点を求め、当該正規終点を次の始点として前記ラインテンプレートを設置することを特徴とする請求項1に記載の下線除去装置。
  3. 前記下線探索処理部は、前記文字列に含まれる各文字の並びに沿った第1の方向とそれとは逆の第2の方向の両方の方向について、前記始点から前記ラインテンプレートを設置し、当該ラインテンプレートに含まれる画素をトレースすることを特徴とする請求項1又は2に記載の下線除去装置。
  4. 前記下線探索処理部は、前記ラインテンプレート内の前記画素のうち、所定の画素数を満たす画素をトレースすることを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
  5. 前記下線探索処理部は、さらに、前記ポリラインから垂直方向に画素をトレースし、所定の画素数を満たす画素が所定範囲以上存在する場合に、前記ポリラインが表を構成する罫線であると判定する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
  6. 前記下線除去処理部は、さらに、前記ポリラインから垂直方向に画素をトレースし、所定の画素数を満たす画素が所定範囲以上存在する場合に、前記文字列は前記下線領域と接触していると判定する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
  7. 前記下線除去処理部は、前記背景境界座標および文字境界座標によって囲まれる領域を前記背景領域の画素の色で置き換えることで、前記下線領域を除去する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
  8. コンピュータを、請求項1〜のいずれか1項に記載の下線除去装置として機能させるためのプログラム。
JP2009096965A 2009-04-13 2009-04-13 下線除去装置 Expired - Fee Related JP5357612B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009096965A JP5357612B2 (ja) 2009-04-13 2009-04-13 下線除去装置
US12/659,293 US8452133B2 (en) 2009-04-13 2010-03-03 Underline removal apparatus
EP10155446.7A EP2241999B1 (en) 2009-04-13 2010-03-04 Underline removal apparatus
CN201010136232.1A CN101859379B (zh) 2009-04-13 2010-03-11 下划线删除装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009096965A JP5357612B2 (ja) 2009-04-13 2009-04-13 下線除去装置

Publications (2)

Publication Number Publication Date
JP2010250425A JP2010250425A (ja) 2010-11-04
JP5357612B2 true JP5357612B2 (ja) 2013-12-04

Family

ID=42314770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009096965A Expired - Fee Related JP5357612B2 (ja) 2009-04-13 2009-04-13 下線除去装置

Country Status (4)

Country Link
US (1) US8452133B2 (ja)
EP (1) EP2241999B1 (ja)
JP (1) JP5357612B2 (ja)
CN (1) CN101859379B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521215B (zh) * 2011-11-28 2017-03-22 上海量明科技发展有限公司 一种文档划线标记的方法及***
CN102629322B (zh) * 2012-03-12 2014-03-26 华中科技大学 一种基于边界点笔画形状的字符特征提取方法及应用
US9286541B1 (en) * 2014-09-12 2016-03-15 Amazon Technologies, Inc. Fast multipass underline removal for camera captured OCR
US9361536B1 (en) * 2014-12-16 2016-06-07 Xerox Corporation Identifying user marks using patterned lines on pre-printed forms
US10121072B1 (en) 2016-12-30 2018-11-06 Intuit Inc. Unsupervised removal of text from form images
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
US10586125B2 (en) 2017-09-28 2020-03-10 Konica Minolta Laboratory U.S.A, Inc. Line removal method, apparatus, and computer-readable medium
CN108334834B (zh) * 2018-01-29 2020-06-05 河海大学常州校区 一种基于主线段的手写签名下划线去除与修复方法
CN108304361B (zh) * 2018-02-12 2019-09-24 掌阅科技股份有限公司 电子书手写笔记的显示方法、计算设备及计算机存储介质
JP7326753B2 (ja) * 2019-01-24 2023-08-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110413964B (zh) * 2019-07-22 2023-04-18 广东中泰工业科技股份有限公司 一种使模具刻字符转成可编辑文本的方法及计算机可读存储介质
CN113449729A (zh) * 2020-03-26 2021-09-28 富士通株式会社 用于消除线的图像处理装置、图像处理方法及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4292622A (en) * 1980-02-21 1981-09-29 Hendrix Electronics, Inc. System and method for processing horizontal line characteristics in an image
NL183790C (nl) * 1980-11-21 1989-01-16 Nederlanden Staat Werkwijze voor karaktersegmentatie.
JPS6115284A (ja) * 1984-06-29 1986-01-23 Toshiba Corp 光学的文字読取装置
US4887301A (en) * 1985-06-05 1989-12-12 Dest Corporation Proportional spaced text recognition apparatus and method
JPH01119885A (ja) * 1987-11-04 1989-05-11 Fujitsu Ltd 文書読取装置
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
JP2902694B2 (ja) * 1989-11-22 1999-06-07 株式会社東芝 光学式文字読取装置
US5272764A (en) * 1989-12-08 1993-12-21 Xerox Corporation Detection of highlighted regions
US5220649A (en) * 1991-03-20 1993-06-15 Forcier Mitchell D Script/binary-encoded-character processing method and system with moving space insertion mode
JP2797848B2 (ja) * 1992-08-05 1998-09-17 日本電気株式会社 光学式文字読取装置
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
JP3425834B2 (ja) * 1995-09-06 2003-07-14 富士通株式会社 文書画像からのタイトル抽出装置および方法
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text
JP2995650B2 (ja) * 1995-12-28 1999-12-27 日本電気株式会社 罫線除去方式
US5841905A (en) * 1996-10-25 1998-11-24 Eastman Kodak Company Business form image identification using projected profiles of graphical lines and text string lines
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
JP4129902B2 (ja) * 2000-10-26 2008-08-06 株式会社リコー 罫線消去方法、罫線消去装置、及び、記録媒体
US6823081B2 (en) 2001-04-30 2004-11-23 Eastman Kodak Company Generation of a color dropout function for use in electronic color dropout
US7218783B2 (en) * 2003-06-13 2007-05-15 Microsoft Corporation Digital ink annotation process and system for recognizing, anchoring and reflowing digital ink annotations

Also Published As

Publication number Publication date
EP2241999A3 (en) 2012-07-04
CN101859379A (zh) 2010-10-13
US20100259558A1 (en) 2010-10-14
US8452133B2 (en) 2013-05-28
CN101859379B (zh) 2014-07-02
JP2010250425A (ja) 2010-11-04
EP2241999B1 (en) 2018-10-31
EP2241999A2 (en) 2010-10-20

Similar Documents

Publication Publication Date Title
JP5357612B2 (ja) 下線除去装置
US6356655B1 (en) Apparatus and method of bitmap image processing, storage medium storing an image processing program
US6711292B2 (en) Block selection of table features
JP2010157107A (ja) 業務文書処理装置
US20200134350A1 (en) Image processing apparatus, image processing method, and program for detecting defect from image
US7630572B2 (en) Image processing apparatus, image processing method, and computer program
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2010061471A (ja) 文字認識装置およびプログラム
JPH10171922A (ja) 罫線消去装置及び記録媒体
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2009182530A (ja) 業務処理遂行支援装置
JP2018142066A (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
JP2013061886A (ja) 化学構造図認識システム及び化学構造図認識システム用のコンピュータプログラム
JP2009140478A (ja) 画像処理装置及び画像処理方法
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2020047138A (ja) 情報処理装置
JP6255929B2 (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
US20220319218A1 (en) Image processing apparatus, image processing system, control method thereof, and storage medium
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130830

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees