JP4420440B2 - 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4420440B2
JP4420440B2 JP2004042389A JP2004042389A JP4420440B2 JP 4420440 B2 JP4420440 B2 JP 4420440B2 JP 2004042389 A JP2004042389 A JP 2004042389A JP 2004042389 A JP2004042389 A JP 2004042389A JP 4420440 B2 JP4420440 B2 JP 4420440B2
Authority
JP
Japan
Prior art keywords
image
cell
character
table area
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004042389A
Other languages
English (en)
Other versions
JP2005234845A (ja
Inventor
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004042389A priority Critical patent/JP4420440B2/ja
Publication of JP2005234845A publication Critical patent/JP2005234845A/ja
Application granted granted Critical
Publication of JP4420440B2 publication Critical patent/JP4420440B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体に関し、特に、画像データ中の表領域のセル分割とセル内の行方向の判定に関する。
従来、文書画像に書かれている文字情報をコンピュータで扱えるような文字コードに変換する文字認識装置が利用されている。
このような文字認識を行う場合、まず、文書画像を文字領域、写真や図形などのイメージ領域または表領域などに分割し、それぞれの領域に別の処理を行うことが多い。
表領域に関しては、表を構成する罫線の位置を認識し、罫線で囲まれた枠内(セル)を一つの文字領域とし、セル内の文字行が横書きであるか縦書きであるかを判別し、この判別結果に応じて各セル内の文字行の抽出方法を切り替えて文字認識を行っている。
特許文献1の判定方法は、文書画像の表領域より、主走査方向および副走査方向の線分で囲まれた枠を抽出し、各枠の主走査方向の長さおよび副走査方向の長さによって各枠内の文字行が横書きであるか縦書きであるかを判別し、この判別の結果に応じて各枠内の文字行の抽出方法を切り替えて文字認識するようにした。これにより、横書きの枠と縦書きの枠が混在した表においても、各枠内の文字行が正確に抽出され、各枠内の文字の切り出しおよび文字認識の精度が上がるという効果がある。
また、特許文献2の判定方法は、入力した表画像から罫線で四方を囲まれた全てのセルの連結黒画素の外接矩形を縦横2方向に投影してヒストグラムを抽出し、このヒストグラムから縦の行数、横の行数、縦、横の行ピッチなどを求め(図7参照)、それらの情報からセル内の文字が縦書きか横書きかを判定する。
特許第2931041号公報 特開平08−16715号公報 特開平09−167246号公報
しかしながら、特許文献1の判定方法では、文字列の方向を枠の主走査方向の長さおよび副走査方向の長さによって判別している。その結果、枠の長さが長い方向と文字列の方向とが異なる場合には、文字列の方向を誤って判別してしまうという問題点があった。例えば、縦長の枠中に横書きの文字行がある場合には、文字列の方向を縦書きと誤って判別してしまう。
これを解決するために、特許文献3の方法は、枠内の画像の属性を判定し、横罫線のありなしを判定し、表を構成する枠中の文字列の方向をより正確に判断するようにした。この枠内の画像の属性は、枠内の行数が3行以上あるか、または枠内の文字画像の高さaと文字画像の垂直方向の文字間隔bがb>3aの関係にある場合、横罫線なしの表画像であると判定する。さもなければ、横罫線ありの表画像と判定する。
この判定により、縦長の枠中に横書きの文字行がある場合でも、文字列の方向を縦書きと誤って判定することがない。
ここで、カラー原稿やグレースケール原稿の表がセルを色や濃淡によって区切っていた場合、表領域や文字認識を行うために2値化してしまうと、色情報や濃淡情報が失われてしまうため上下または左右の隣接するセルが結合されて縦長または横長のセルとなってしまう。このようなセルの場合には、特許文献3の方法でも正しく判定できない。例えば、色で区切られた1つのセルの内容が縦書きで、その下のセルが横書きのような場合、これらの隣接するセルが結合されたセルの内容では縦書きとも横書きとも判定することができない。
また、特許文献2のような主走査方向と副走査方向の2方向でのヒストグラムを用いた方法では、日本語のような「偏と旁」とから出来ていることの多い漢字の場合、セル内の文字がすべて「偏と旁」で出来ている漢字であると正しく幅を求めることができなくなり、縦書きか横書きかを正しく判断できなくなってしまう。
本発明は、上記の実情を考慮してなされたものであって、表の罫線が色や濃淡によって引かれているような場合であっても正しくセルの区切りを判断でき、また、該セル内の文字行の方向を正しく推定できる画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体を提供することを目的とする。
上記の課題を解決するために、請求項1に記載の発明は、原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段とを有する画像処理装置において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割し、前記画像処理装置は、前記セル分割手段で分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定する行方向推定手段を有することを特徴とする。
請求項2に記載の発明は、請求項1に記載の画像処理装置において、前記行方向推定手段は、前記推定された行方向がデフォルト値としてセットされている行方向と異なる場合、行方向を該推定された行方向に再設定することを特徴とする。
請求項3に記載の発明は、原稿画像の二値化画像を識別して表領域画像を抽出し、該表領域画像をセル画像に分割する画像処理方法において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成し、該重ね合わせて生成された表領域画像をセル画像に分割し、当該分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定するようにしたことを特徴とする。
請求項4に記載の発明は、原稿画像を入力する原稿画像入力手段と、前記原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段と、該セル画像を文字認識する文字認識手段とを有する文字認識装置において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割し、前記文字認識装置は、前記セル分割手段で分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定する行方向推定手段を有することを特徴とする。
請求項5に記載の発明は、コンピュータに、請求項1または2に記載の画像処理装置の機能、または、請求項4に記載の文字認識装置の機能を実行させるためのプログラムである。
請求項6に記載の発明は、請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によると、カラー原稿やグレースケール原稿で、表の罫線が色や濃淡によって引かれているような場合であっても正しくセルの区切りを判断できる。
また、二値化画像の場合や、色や濃淡によるセルの分割に失敗した場合であっても、セル内の情報を用いて、セル内の文字行の方向を推定することができる。これにより、文字認識処理の行切り出しの失敗を防ぐことができる。
以下、図面を参照して本発明の好適な実施形態について説明する。
図1は、本発明の画像処理装置を適用した文字認識装置の概略ブロック図である。ここに示す文字認識装置は、スキャナ装置のような画像入力装置と液晶ディスプレイ等の表示装置を接続して、画像入力装置から読み取った文字領域および表領域の画像にある文字を認識して文字コードに変換し、その認識結果を他のアプリケーションソフトウェアで使用できるようにする。その変換の際、認識途中における作業支援のために表示装置が使われる。
図1において、文字認識装置は、入力部10、二値化部20、前処理部30、領域識別部40、文字領域処理部50、表領域処理部60、出力部70を備えている。
入力部10は、カラー画像入力機器(例えば、デジタルカラー複写機、スキャナ、カメラ等)からカラー原稿やグレースケール原稿を入力してA/D変換処理を行い、原画像記憶部15へ記憶する。また、デジタルカメラのアプリケーションソフトウェアや文書画像解析・認識システムから画像データを受信したり、すでに画像データを格納しているファイルから入力するようにしてもよい。
二値化部20は、原画像記憶部15に記憶されたカラー画像データやグレースケール画像データを二値化して二値化画像記憶部25へ記憶する。
前処理部30は、二値化画像記憶部25に記憶された二値化画像のスキュー補正やノイズ除去を行って、二値化画像記憶部25を更新する。
領域識別部40は、二値化画像記憶部25に記憶された二値化画像を文字領域、表領域および写真領域等に識別し、この領域ごとに分割した画像を原画像での位置情報、サイズ情報および領域の区分(文字領域、表領域または写真領域等)と対応付けて領域分割結果記憶部45に記憶する。さらに、原稿の行方向判定もあわせて行い、判定結果を記憶しておく。
文字領域処理部50は、領域分割結果記憶部45に記憶された分割領域のうち、文字領域の画像から切り出した文字の特徴量を計算し、その特徴量と文字認識辞書の標準パターンの特徴量とを比較し、類似度の高いものを認識結果の候補とし、候補文字コードとその類似度と候補文字の文字種等を認識結果とし、その認識結果を分割領域と対応付けて領域分割結果記憶部45を更新する。また、文字領域処理部50は、表領域処理部60から呼び出される場合もある。
表領域処理部60は、領域分割結果記憶部45に記憶された分割領域のうち、表領域をセルに分割し、セル内の領域が文字領域または写真領域等であるかを識別し、セルの位置情報、サイズ情報およびセルの区分(文字領域または写真領域等)、および、これらのセルが文字領域の場合には文字認識結果を表領域に対応させて領域分割結果記憶部45を更新する。
出力部70は、領域分割結果記憶部45に得られた認識結果データと原画像記憶部15内の原画像とを対比させて表示装置に表示させ、所望の結果をユーザに選択または修正させて、最終的な認識結果をプリンタや記憶装置等の出力装置へ出力したり、また他のアプリケーションソフトウェアへ引き渡す。
このような文字認識装置の全体的な構成および基本的処理内容は、従来の文字認識装置と同様であるが、表領域処理部60は本発明の画像処理装置によるもので、その構成と処理内容は従来のものとは異なる。
なお、本実施形態では、文字認識装置へ本発明の画像処理装置を適用しているが、表領域内の画像を処理する、例えば、画像識別、画像編集、文書ファイリング、文書処理、文書管理あるいは文書配信等を行う装置やシステムにも容易に適用可能である。
次に、表領域処理部60(本発明の画像処理装置)について、詳細に説明する。
図2は、表領域処理部60の機能構成を示すブロック図であり、同図において、表領域処理部60は、罫線設定部61、セル分割部62および行方向推定部63を含んで構成されている。
罫線設定部61は、領域分割結果記憶部45に記憶された表領域に対して、この表領域に対応するカラー原画像またはグレースケール原画像の領域エッジ強度を求め、エッジ強度が所定の値より強く(=エッジがあり)、それが連続している(以下、仮想罫線という)場合、仮想罫線があると判断し、表領域の二値化画像にOR処理で罫線を書き加えて、領域分割結果記憶部45を更新する。
このとき、数画素程度の切れは、連続していると判断をし、所定の長さ以上続いている場合を罫線として判断する。従って、領域識別処理によって表領域として抽出されなかった表領域以外の画像には影響は及ぼさない。
仮想罫線処理を行うのは、カラー原稿やグレースケール原稿の表では、実罫線でセルを分けずに色や濃淡の違いのみによってセルを分けていることがあり、このため従来の処理ではセルの抽出が困難な場合がある。また、カラー原稿やグレースケール原稿(多値原稿)の罫線が細い実罫線であった場合には、二値化処理で罫線が消失してしまい、セルの抽出が困難である。
図3は、罫線設定部61の処理の流れを示すフローチャートである。
まず、主走査方向の仮想罫線や罫線を次のようにして設定する。
表領域のすべての画素に対して、主走査方向に2×3画素の窓(図4(1))を設け、この窓を主走査方向にずらしながら、窓内で副走査方向に対する画素の濃度差が所定の閾値を越えている画素連続を抽出する(図5(A),(B))。この画素連続の長さが所定の長さ以上続いている場合に、この画素連続を罫線或いは仮想罫線(図5(B))であると判断する(ステップS01)。
ここで、濃度差のない画素連続が1つの窓の幅以下であれば、画素連続であると判断する。
二値化された表領域の画像データの、抽出された画素連続に対応する位置に罫線或いは仮想罫線をOR処理で書き込む(ステップS02)。
上記ステップS01とS02とを表領域の画像のすべての画素について処理するまで繰り返す(ステップS03)。
次に、副走査方向に3×2の窓(図4(2))を設け、この窓を副走査方向にずらしながら上記ステップS01からS03の処理を繰り返して、副走査方向の罫線或いは仮想罫線を設定する。
または、上述のような処理手順ではなく、処理時間の短縮や掠れ画像への対応、或いはディザ画像(カラー)への対応のため、例えば、200dpiのカラー画像に対して、100dpiとなる細線保存縮小画像を作成し、この細線保存縮小画像を二値化して仮想罫線を抽出して、セルを抽出するようにしてもよい。
この細線保存縮小画像の作成は、例えば、2×2画素を1画素に縮小する場合、2×2の画素の中の最も暗い値を、作成される縮小画像の代表色とすることにより、白地に黒でかかれている原稿の場合などでも、細線が消えることなく縮小画像が作成できる(単純に間引き縮小をすると、細線が消えてしまうことがある)。
セル分割部62は、領域分割結果記憶部45に記憶された表領域(仮想罫線を書き加えた二値化画像)内をセルに分割し、セル内の領域が文字領域または写真領域等であるかを識別し、セルの位置情報、サイズ情報およびセルの区分(文字領域または写真領域等)を表領域に対応させて領域分割結果記憶部45を更新する。
行方向推定部63は、分割されたセルの画像を文字領域あるいは写真領域等に区分し、文字領域であれば文字行の方向を推定する。表領域処理部60は、この文字行の方向によって文字認識を行わせる。
まず最初、表領域中のセルの行方向は、ユーザが指定した原稿の行方向(ユーザが原稿の行方向は横と指定すればセル方向は横になる)、または、行方向を自動設定するモードが設定された場合は、領域識別部40で求められた行方向がデフォルト値としてセットされる。
次に、以下に示したような所定の条件(A)または(B)を満たしている場合、行方向を“縦”とし、デフォルトで設定されている行方向と異なる場合には、行方向を再設定(入れ替え)する。
(A)すべての下記条件(1)〜(4)を満たす場合、行方向“縦”をセットする。
(1)縦横比が所定値よりも大きい縦長のセルである。
(2)セル内の行数が1行または2行である。
(3)セルの縦の長さが表の縦の大きさの1/2より短い。
(4)表領域の左半分にセルが含まれている(図6)。
(B)下記(5)〜(7)の条件のすべてを満たす場合、行方向“縦”がセットされる。
(5)縦横比が所定よりも大きい縦長のセルである。
(6)セル内の行数が1行である。
(7)セルの縦の長さが表の縦の大きさの1/2より長い。
次に、以下に示したような所定の条件(C)または(D)を満たしている場合、行方向を“横”とし、デフォルトで設定されている行方向と異なる場合には、行方向を再設定(入れ替え)する。
(C)すべての下記条件(11)〜(14)を満たす場合、行方向“横”をセットする。
(11)縦横比が所定値よりも大きい横長のセルである。
(12)セル内の行数が1行または2行である。
(13)セルの横の長さが表の横の大きさの1/2より短い。
(14)表領域の上半分にセルが含まれている(図6)。
(D)下記(15)〜(17)の条件のすべてを満たす場合、行方向“横”がセットされる。
(15)縦横比が所定よりも大きい横長のセルである。
(16)セル内の行数が1行である。
(17)セルの横の長さが表の横の大きさの1/2より長い。
また、上記の条件(A)乃至(D)のいずれも満たさないときには、行方向はデフォルトのままとし、行方向の再設定は行わない。
ここで、セル内の行数の算定を行うために、セル内の黒画素連結成分の外接矩形を求める。次にこの外接矩形から3つの標準サイズ(セル内の正方形矩形の大きさの最大値、セル内の横長矩形の矩形幅の最大値、セル内の縦長矩形の高さの最大値)を求める。
ここで、表領域をセルに分割する罫線が掠れなどによって、セル内に存在することがあり、これによる悪影響を除外するために、横長矩形や縦長矩形の最大値を求める際には、その値が所定の値よりも小さな矩形のみを対象として最大値を求めるようにする。
セル内の行数が1行または2行であると判断できる3つの標準サイズの範囲値を予め定めておき、求められた3つの標準サイズが予め定めた範囲値であるかを調べることによって、セル内の行数を1行または2行であると判断する。
以上のように本実施形態を構成することにより、カラー原稿やグレースケール原稿で、表の罫線が色や濃淡によって引かれているような場合であっても正しくセルの区切りを判断できる。
また、二値化画像の場合や、色や濃淡によるセルの分割に失敗した場合であっても、セル内の情報を用いて、セル内の文字行の方向を推定することができる。これにより、文字認識処理の行切り出しの失敗を防ぐことができる。
本発明は、上述した実施形態のみに限定されたものではない。上述した実施形態の画像処理装置および文字認識装置の機能をそれぞれプログラム化し、あらかじめCD−ROM等の記録媒体に書き込んでおき、画像処理装置および文字認識装置に搭載したCD−ROMドライブ等の媒体駆動装置にこのCD−ROM等を装着して、これらのプログラムをコンピュータのメモリあるいは記憶装置に格納し、それを実行することによって、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
なお、プログラムを格納する記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)等のいずれであってもよい。
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することによって上述した実施形態の機能が実現される場合も含まれる。
上記プログラムを市場に流通させる場合には、可搬型の記録媒体に当該プログラムを格納して流通させたり、或いは、サーバコンピュータの記憶装置に当該プログラムを格納しておき、インターネットを介して他のコンピュータに転送することでも流通させることができる。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
なお、コンピュータでは、可搬型の記録媒体上のプログラム、または転送されてくるプログラムをインストールし、そのインストールされたプログラムを実行することによって上述した実施形態の機能が実現される。
また、上述のコンピュータは、単一のコンピュータとして適用することが可能であるが、複数のコンピュータネットワークとして適用することも可能であり、コンピュータで利用されるプログラムが他のコンピュータに記録され、リモートコンピュータとして分散的に処理または実行するようにしてもよい。
このように上述した実施形態の機能をプログラム化して流通させることによって、コスト、可搬性、汎用性を向上させることができる。
本発明の画像処理装置を適用した文字認識装置の概略ブロック図である。 表領域処理部の機能構成を示すブロック図である。 罫線設定部の処理の流れを示すフローチャートである。 仮想罫線を抽出するための主走査方向と副走査方向における窓の例である。 仮想罫線の判断例である。 表内のセルの位置を説明する図である。 表のセル内が縦書きか横書きかを判定する従来方法を説明する図である。
符号の説明
10…入力部、15…原画像記憶部、20…二値化部、25…二値化画像記憶部、30…前処理部、40…領域識別部、45…領域分割結果記憶部、50…文字領域処理部、60…表領域処理部、61…罫線設定部、62…セル分割部、63…行方向推定部、70…出力部。

Claims (6)

  1. 原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段とを有する画像処理装置において、
    前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、
    前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割し、
    前記画像処理装置は、前記セル分割手段で分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定する行方向推定手段を有することを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において、前記行方向推定手段は、前記推定された行方向がデフォルト値としてセットされている行方向と異なる場合、行方向を該推定された行方向に再設定することを特徴とする画像処理装置。
  3. 原稿画像の二値化画像を識別して表領域画像を抽出し、該表領域画像をセル画像に分割する画像処理方法において、
    前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成し、該重ね合わせて生成された表領域画像をセル画像に分割し、当該分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定するようにしたことを特徴とする画像処理方法。
  4. 原稿画像を入力する原稿画像入力手段と、前記原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段と、該セル画像を文字認識する文字認識手段とを有する文字認識装置において、
    前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、
    前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割し、
    前記文字認識装置は、前記セル分割手段で分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズが予め定められた範囲値であるか否かによりセル内の行数が1行または2行であるか否かを判断し、前記行数と、前記セル画像の縦または横の長さ、および縦横比と、前記セル画像の表中での位置とからセル内の文字行方向を推定する行方向推定手段を有することを特徴とする文字認識装置。
  5. コンピュータに、請求項1または2に記載の画像処理装置の機能、または、請求項4に記載の文字認識装置の機能を実行させるためのプログラム。
  6. 請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004042389A 2004-02-19 2004-02-19 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 Expired - Fee Related JP4420440B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004042389A JP4420440B2 (ja) 2004-02-19 2004-02-19 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004042389A JP4420440B2 (ja) 2004-02-19 2004-02-19 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2005234845A JP2005234845A (ja) 2005-09-02
JP4420440B2 true JP4420440B2 (ja) 2010-02-24

Family

ID=35017747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004042389A Expired - Fee Related JP4420440B2 (ja) 2004-02-19 2004-02-19 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4420440B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4835459B2 (ja) * 2007-02-16 2011-12-14 富士通株式会社 表認識プログラム、表認識方法および表認識装置
EP2157802A4 (en) * 2007-06-07 2015-04-01 Sony Corp SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
JP5386237B2 (ja) * 2009-06-02 2014-01-15 株式会社竹中工務店 部材情報管理システム
JP5426501B2 (ja) * 2010-08-25 2014-02-26 富士フイルム株式会社 ドキュメント閲覧システム及びドキュメント画像配信装置並びにドキュメント閲覧方法
JP6607490B2 (ja) * 2015-10-26 2019-11-20 シャープ株式会社 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
CN107016663B (zh) * 2016-11-30 2020-03-31 浙江理工大学 一种基于改进l0梯度的织物沾水区域分割方法
CN110263682A (zh) * 2019-06-04 2019-09-20 北京华宇信息技术有限公司 基于轮廓提取的表格识别方法和装置、设备及存储介质

Also Published As

Publication number Publication date
JP2005234845A (ja) 2005-09-02

Similar Documents

Publication Publication Date Title
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
JP4525787B2 (ja) 画像抽出装置、及び画像抽出プログラム
US7738734B2 (en) Image processing method
EP2270746B1 (en) Method for detecting alterations in printed document using image comparison analyses
US7567708B2 (en) Apparatus and method for image processing
US7321688B2 (en) Image processor for character recognition
US8326078B2 (en) System and method for removing artifacts from a digitized document
US7437002B2 (en) Image recognition system utilizing an edge image and a binary image
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP3615333B2 (ja) 罫線消去装置
JP4049560B2 (ja) 網点除去方法及びシステム
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
JP2001076095A (ja) 情報処理装置及びその方法
US11570331B2 (en) Image processing apparatus, image processing method, and storage medium
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP7406884B2 (ja) 情報処理装置、プログラム及び制御方法
US20090051978A1 (en) Image processing apparatus, image processing method and medium
JP2009217303A (ja) テロップ文字抽出方法およびテロップ文字認識装置
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots
JP2003317107A (ja) 罫線抽出方法及び装置
US20180013918A1 (en) Image processing apparatus and method with partition image processing function
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4420440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees